7. M´ etodos de an´ alisis propuestos 45
7.3. Evaluaci´ on de pruebas diagn´ osticas
7.3.1. Curvas Caracter´ısticas de Operaci´ on del Receptor (COR)
50 7.3. Evaluaci´on de pruebas diagn´osticas
7. M´etodos de an´alisis propuestos 51 eficacia global del sistema, sino que tambi´en permiten el c´alculo de un punto de corte para discriminar pacientes (el valor de un marcador por debajo de cierto umbral se considera como positivo y se identifica como ”paciente en riesgo” o ”paciente enfermo”, por ejemplo).
En resultados donde las pruebas se miden en escalas ordinales o continuas, se ana- lizan los conceptos contenidos en una tabla de doble entrada, en la que se compara el estado real y el estado predicho o diagnosticado (resultado de la prueba), tal como se muestra en la tabla 7.1.
Estado real
Enfermo (Positivo) Sano (Negativo) Estado Positivo Verdaderos Positivos (VP) Falsos Positivos (FP) diagnosticado Negativo Falsos Negativos (FN) Verdaderos Negativos (VN)
Tabla 7.1: Sensibilidad y especificidad.
La Tabla 7.1 describe el comportamiento de un sistema diagn´ostico con dos ´unicos posibles resultados (positivo o negativo). Hay dos (y no cuatro) entradas independientes en la matriz, puesto que cada columna debe sumar 1, con lo que se deben especificar dos cantidades para obtener una representaci´on completa del comportamiento diagn´ostico.
Estas dos medidas son lasensibilidad y la especificidad:
La sensibilidad mide de la probabilidad de obtener verdaderos positivos a partir del criterio o regla de decisi´on establecido. En la pr´actica se estima mediante la proporci´on de casos diagnosticados como afirmativos en los que se comprueba que efectivamente sucede el estado que se pretende detectar o diagnosticar:
Sensibilidad= V P
V P +F N (7.1)
La especificidad ser´ıa una medida de la probabilidad de obtener verdaderos ne- gativos, a partir de la regla de decisi´on establecida. En situaciones pr´acticas, se estima mediante la proporci´on de casos diagnosticados como negativos en los que se comprueba que efectivamente no sucede el estado que se pretende detectar o diagnosticar:
Especif icidad = V N
V N +F P (7.2)
Ambas medidas est´an relacionadas, y dependen a su vez del punto de corte o umbral que se establezca a partir del indicador cuantitativo. Si la regla de decisi´on impuesta establece un umbral muy bajo para la decisi´on, se tendr´a alta especificidad pero baja
52 7.3. Evaluaci´on de pruebas diagn´osticas sensibilidad, mientras que si se establece un umbral alto se tendr´a alta sensibilidad pero baja especificidad.
La curva COR se obtiene representando, para cada posible elecci´on del valor de corte o umbral, la sensibilidad en ordenadas y 1−especif icidad en abscisas. Mediante esta representaci´on de los pares obtenidos al considerar todos los posibles valores de corte de la prueba, queda representada la capacidad discriminatoria de todo un sistema.
La curva COR es necesariamente creciente, propiedad que refleja el compromiso existente entre sensibilidad y especificidad; si se modifica el valor de corte para obtener mayor sensibilidad, s´olo puede hacerse sabiendo que se va a disminuir al mismo tiempo la especificidad. Si la prueba no permitiera discriminar entre grupos, la curva COR ser´ıa la diagonal que une los v´ertices inferior izquierdo y superior derecho. La exactitud de la prueba aumenta a medida que la curva se desplaza desde la diagonal hacia el v´ertice superior izquierdo. Si la discriminaci´on fuera perfecta (100 % de sensibilidad y 100 % de especificidad) pasar´ıa por dicho punto [45].
An´alisis estad´ıstico de las curvas COR
Area bajo la curva.´ El ´area bajo la curva COR (AU C, Area Under the Curve) es el mejor indicador global de la precisi´on de una prueba diagn´ostica. Se define como la probabilidad de clasificar correctamente un par de individuos sano y enfermo, seleccio- nados al azar de la poblaci´on, mediante los resultados obtenidos al aplicarles la prueba diagn´ostica. Matem´aticamente se calcula como:
AU C= Z 1
0
COR(t)dt (7.3)
La mayor exactitud diagn´ostica de una prueba se traduce en un desplazamiento
“hacia arriba y a la izquierda” de la curva COR. Esto sugiere que el AU C se puede emplear como un ´ındice conveniente de la exactitud global de la prueba: la exactitud m´axima corresponder´ıa a un valor deAU C de 1 y la m´ınima a uno de 0,5 (si fuera menor de 0,5 deber´ıa invertirse el criterio de positividad de la prueba).
En t´erminos probabil´ısticos, si YE y YS son las dos variables aleatorias que re- presentan los valores de la prueba en las poblaciones enferma y sana, respectivamente, puede probarse que el AU C de la “verdadera” curva COR (intuitivamente, aquella que se obtendr´ıa si el tama˜no de la muestra fuera infinito y la escala de medida continua) es precisamente θ = P r(YE > YS) la probabilidad de que, si se eligen al azar un paciente enfermo y otro sano, sea mayor el valor de la prueba en aqu´el que en este [46].
7. M´etodos de an´alisis propuestos 53 Elecci´on del umbral ´optimo. El empleo en la pr´actica de una prueba diagn´ostica exige la elecci´on de un valor de corte o umbral. Para ello es imprescindible un conocimiento detallado de los riesgos y beneficios de las decisiones m´edicas derivadas del resultado de la prueba. De forma independiente al c´alculo del nivel de decisi´on, existen cuatro postulados que hacen referencia a la elecci´on pr´actica de las caracter´ısticas de una prueba diagn´ostica, considerando tanto la patolog´ıa estudiada como las condiciones reales de la comunidad [47]:
1. Se debe elegir la mayor sensibilidad posible cuando:
a) La enfermedad sea grave y no pueda pasar inadvertida.
b) La enfermedad sea tratable.
c) Los resultados falsos positivos no supongan un traumatismo psicol´ogico en los individuos examinados.
2. Por el contrario mayor especificidad se ha de desear cuando:
a) La enfermedad sea importante pero dif´ıcil o imposible de curar.
b) El hecho de conocer que no se padece la enfermedad tiene importancia psi- col´ogica y sanitaria.
3. Debe utilizarse una prueba con alto valor predictivo positivo cuando el tratamiento de los falsos positivos pueda tener consecuencias graves.
4. Se necesita un valor global elevado (AU C≈1) cuando:
a) La enfermedad sea importante pero curable.
b) Tanto los falsos positivos como los negativos supongan un traumatismo y con- lleven consecuencias graves
En este trabajo la aproximaci´on al umbral ´optimo utilizada consiste en el valor de corte que maximiza tanto la sensibilidad como la especificidad. De esta forma se consigue maximizar la precisi´on en la clasificaci´on de los pacientes. Visualmente en la curva este punto es el que se encuentra m´as cerca a la esquina superior izquierda.
Una medida de evaluaci´on global de la prueba para un determinado punto de corte es el llamado ´ındice deYouden. Se define comoSensibilidad+Especif icidad–1. Cuando
´este ´ındice vale 1, la prueba ha podido diferenciar absolutamente todos los casos de forma correcta.
54 7.3. Evaluaci´on de pruebas diagn´osticas