Curvas ROC. - TESIS DOCTORAL. Universidad de Extremadura

La teoría de la detección (McMillan y Creelman, 1992), cuyo máximo exponente son las curvas ROC (Receiving Operating Characteristics), ha sido ampliamente utilizada para medir la habilidad con la que un algoritmo computacional es capaz de llevar a cabo una tarea de reconocimiento de formas u objetos en imágenes digitales (Alsing y col., 2002). En particular, estas curvas han sido utilizadas para evaluar nuevos algoritmos de análisis hiperespectral (Bruce y col., 2001), fundamentalmente aquellos algoritmos orientados a identificar targets u objetos de interés (Chang y col., 1999).

Las curvas ROC pueden entenderse como un caso particular de la matriz de confusión cuando el problema de clasificación es binario, es decir, limitado a dos únicas clases (McMillan y Creelman, 1992). De este modo, para construir una curva ROC es necesario partir del supuesto de que la información verdad terreno viene expresada en forma de una imagen binaria, en la que cada pixel viene etiquetado como perteneciente una de dos clases: objeto, Vo, o fondo,

Vf, siendo estas clases mutuamente excluyentes entre si. Por su parte, el algoritmo de

clasificación da como resultado dos clases binarias mutuamente excluyentes: objeto, Co, y

fondo, Cf. Teniendo en cuenta estas definiciones, la tabla 2.3.3 describe la nomenclatura

utilizada en análisis ROC.

Vo Vf

TABLA 2.3.4. NOMENCLATURA UTILIZADA EN ANÁLISIS ROC.

 Verdaderos positivos (VPs): son los aciertos, es decir, el número de pixels etiquetados de forma correcta por el algoritmo de clasificación como pertenecientes al objeto a detectar.

 Falsos positivos (FPs): son las falsas alarmas, es decir, el número de pixels etiquetados incorrectamente por el algoritmo de clasificación como pertenecientes al objeto.

 Verdaderos negativos (TNs): son las desestimaciones correctas, es decir, el número de pixels que el algoritmo etiqueta de forma correcta como no pertenecientes al objeto.  Falsos negativos (FN): son las omisiones, o el número de pixels que el algoritmo

etiqueta de forma errónea como no pertenecientes al objeto.

Teniendo en cuenta esta nomenclatura, podemos expresar el porcentaje de acierto global o sensibilidad mediante la siguiente expresión:

VNs + VPs VPs = H (2.3.15)

De forma similar, podemos expresar el porcentaje de fallo o especificidad mediante la siguiente expresión: VNs + FPs FPs = F (2.3.16)

Las curvas ROC son representaciones gráficas de la sensibilidad con respecto a la especificidad. El rango de variación de H y F es el intervalo [0,1]. Así, la sensibilidad será perfecta si H=1 y F=0, mientras que la sensibilidad será nula si H=F. La construcción de una curva ROC se lleva a cabo mediante la obtención de diferentes pares de puntos (H,F) a través de la selección de diferentes valores para una variable de decisión. En el caso de aplicaciones de detección de targets en imágenes en ND’s, la variable de decisión consiste en un valor umbral, de forma que:

 Los pixels cuyo ND está por encima del umbral establecido se consideran como pertenecientes al objeto a detectar.

 Los pixels cuyo ND está por debajo de dicho umbral se consideran como pertenecientes al fondo.

La figura 2.3.14 muestra un sencillo ejemplo de la construcción de una curva ROC para una imagen de clasificación proporcionada por un algoritmo de detección de targets, en la que los

pixels con ND claro tienen mayor probabilidad de pertenecer a los objetos de interés (árboles),

(suelo). La construcción de la curva ROC se ha realizado mediante la selección de cinco ND’s umbrales equidistantes en el rango dinámico de la imagen resultante del algoritmo. La figura pone de manifiesto que la construcción de curvas ROC permite obtener una medida cualitativa de la bondad del algoritmo de detección, independientemente de la selección de valores umbrales específicos.

Árboles (Objeto de interés) Suelo (Fondo) Algoritmo Umbral 1 (H=0, F=0) Umbral 2 (H=0.3, F=0) Umbral 3 (H=0.9, F=0.1) Umbral 4 (H=1, F=0.4) Umbral 5 (H=1, F=1) Verdad terreno

Árboles (Objeto de interés) Suelo (Fondo) 0 0,2 0,4 0,6 0,8 1 0 0,2 0,4 0,6 0,8 1 Especificidad (F) Se n sib ilid ad ( H )

Área bajo la curva = 89%

Figura 2.3.14. Ejemplo de construcción de una curva ROC.

Según la teoría de la detección (McMillan y Creelman, 1992), una medida adecuada para cuantificar la precisión con la que algoritmo de detección identifica los objetos de interés es el área bajo la curva ROC. En el ejemplo mostrado en la figura 2.3.14, el área bajo la curva ROC se aproxima al 90% con respecto al área total en la cuadrícula, lo cual indica que la precisión del algoritmo de detección en este ejemplo se sitúa en torno al 90%.

2.3.2.2. Algoritmos de estimación de abundancias.

Los métodos de estimación de abundancias se basan en la interpretación adecuada del fenómeno de la mezcla espectral, descrito con anterioridad. En numerosos trabajos (Bell y col., 2002; Rand y Keenan, 2001) se ha demostrado que el espectro de un pixel mezcla puede ser descompuesto en una colección de espectros "puros" o "característicos" (denominados

endmembers en la terminología) y en un conjunto de valores denominados abundancias que

indican la proporción o contribución individual de cada uno de los espectros puros en el pixel mezcla (Boardman y col., 1995). Para realizar esta operación, basada en la resolución de un sistema de ecuaciones, es necesario que el número de bandas de la imagen original sea mucho mayor que el número de endmembers, suposición totalmente justificada en el caso de imágenes hiperespectrales (Keshava y Mustard, 2002). Los espectros puros normalmente vienen asociados a componentes macroscópicos claramente identificables en la imagen, como agua, suelo, vegetación, minerales, etc., de forma que, habitualmente, con unos cuantos endmembers se pueden interpretar todos los puntos de la imagen.

El modelo utilizado para describir la situación anteriormente comentada es el denominado “modelo de mezcla”, el cual considera que cualquier escena está constituida por un conjunto de

endmembers con propiedades espectrales características y diferentes entre sí, y que aparecen

mezclados en distintas proporciones (Kruse, 1998; Settle, 1996). Dentro del modelo de mezcla, se consideran dos posibilidades diferentes:

1.- Modelo lineal. Supone que cada haz de radiación solar incidente solamente interactúa con un único componente o endmember, de forma que la radiación total reflejada por un pixel mezcla se puede descomponer de forma proporcional a la abundancia de cada uno de los endmembers en el pixel (Petrou y Foschi, 1999; Hu y col., 1999). Este modelo aparece ilustrado en la figura 2.3.15.

2.- Modelo no lineal. Supone que los endmembers interactúan según un modelo no lineal. Borel y Gerstl, 1994, demostraron que los efectos no lineales que se producen en este caso se deben, fundamentalmente, a efectos de dispersión múltiple en la luz reflejada por los diferentes materiales (García-Haro y Sommer, 2002). El modelo no lineal aparece ilustrado mediante un ejemplo en la figura 2.3.16.

El modelo lineal proporciona resultados adecuados en gran cantidad de aplicaciones (Collins y col., 2001; Roberts y col., 1998), y se caracteriza por su simplicidad (Bateson y col., 2000). Por su parte, el modelo no lineal ha sido utilizado con gran éxito en determinadas aplicaciones de carácter específico, especialmente en aplicaciones orientadas a estudiar las propiedades de cubiertas vegetales (Zarco-Tejada y col., 2001).

Comportamiento

In document TESIS DOCTORAL. Universidad de Extremadura (página 69-73)