2_2_CLASIFICACIÓN

Texto completo

(1)Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. CURSO 2007 CLASIFICACIÓN Introducción Normalmente, en un proyecto que involucre el procesamiento de imágenes digitales, el objetivo final lo constituye la clasificación del espacio geográfico analizado a partir de los datos de teledetección. El proceso de clasificación conduce a la obtención de un mapa temático cuyas unidades sean de fácil interpretación. Las diversas zonas de una escena quedan determinadas por un agrupamiento de celdas cuyos valores iniciales (Nd registrados por el sensor) puedan clasificarse a partir de sus características diferenciales. La clasificación se torna entonces en un grupo de métodos automáticos que permite la traducción de los Nds de las bandas originales en clases cuyos valores tienen un significado temático. Para algunos métodos más sencillos la clasificación de la escena se realiza sobre una composición color, obtenida a partir de la combinación lineal de las bandas originales. Se genera una nueva imagen sumando tres bandas, seleccionadas por algún criterio, a cada una de las cuales se le asigna uno de los tres tonos primarios: azul, verde, rojo. Los métodos más complejos involucran una multi-dimensionalidad que supera a las tres dimensiones de la composición color tradicional; estos métodos más complejos consideran muchas variables (bandas) – número superior a tres – aprovechando la información contenida en los diferentes rangos espectrales para permitir una mayor capacidad de discriminación. Composiciones color Las composiciones color constituyen un caso particular de combinación lineal analógica en el periférico de visualización a partir de información multiespectral de la imagen suministrada por la mayor parte de los sensores. Considerando el espacio tridimensional, tres ejes ortogonales, correspondiendo a cada uno de ellos uno de los tres colores puros, la luminancia cromática de un píxel vendrá dada por:. z = az1 a + vz2 v + rz3 r donde: z es el color resultante para la visualización de un píxel, zi las luminancias de esa celda en las tres bandas consideradas y a , v y r los tres coeficientes para el ajuste del contraste, todo ello en el sistema de especificación de color RGB.. 1.

(2) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Coordenadas de color RGB. Tomado de Pinilla, 1995, Pág. 175.. Transformación IHS Cuando se utiliza el sistema RGB para una composición color, con frecuencia se tiende hacia los tonos grises o pasteles en la imagen, esto, como consecuencia del nivel similar de reflectancia que presentan muchas cubiertas en diferentes bandas. Para paliar la falta de contraste se utiliza la transformación Intensidad-Tono-Saturación IHS (Intensity, Hue, Saturation). El método es una transformación global consistente en extraer tres nuevas bandas basadas en el sistema de coordenadas de color IHS y realizar una nueva composición coloreada con ellas.. Coordenadas de color IHS. Tomado de Pinilla, 1995, pág. 176. 2.

(3) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. El procedimiento se inicia calculando para cada píxel la variable intensidad I en el conjunto de las tres bandas como el máximo valor de los tres ND que intervienen. La determinación de la saturación S del color se realiza de la siguiente manera: I–m S=. ∀I≠0. I. ∀I=0. 0. siendo m el mínimo de los tres Nd que intervienen en la transformación para cada píxel. La saturación adoptará valores de la gama comprendida entre 0 (gris, color sucio) y 1 (color puro). Para el cálculo de la variable tono H se calculan independientemente la separación que existe entre el Nd correspondiente a cada uno de los tonos primarios y el máximo Nd, referido al rango de variación de los tres Nd.. I − Nd r I − Nd v I − Nd a ; V = ; A= I −m I −m I −m A partir de ese momento pueden existir seis posibilidades, según I y m coincidan con cada uno de los colores que se indican, para cada una de las cuales H se define del modo indicado en la tabla que sigue: R=. Valor del parámetro tono H. I m H rojo verde H = 5 + A rojo azul H=1–V verde rojo H=3–A verde azul H=1+R azul rojo H=3+V azul verde H=5-R El valor de H corresponderá al predominante de cada píxel, y se le asignará un valor comprendido entre 0 (rojo) y 255 (violeta), resultante de dividir por 6 los resultados anteriores, multiplicarlos por 256 y restarles una unidad.. Asignación de tonos a los valores de H en la transformación HIS. Tomado de Pinilla, 1995, Pág. 177. 3.

(4) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Por último, a las tres imágenes así formadas se les atribuyen los tonos primarios rojo, verde, azul, respectivamente, y se forma una imagen compuesta. La transformación HIS se utiliza también para componer imágenes adquiridas por sensores de diferente resolución espacial, como, por ejemplo, los multiespectrales procedentes de LANDSAT TM y ETM+, con celdas de 30 m de lado en el terreno, y las pancromáticas del mismo LANDSAT (banda 8), 15 m y del SPOT HRV, de 10 m. Para mejorar la resolución espacial, entonces, se procede de la siguiente manera: se corrigen geométricamente las escenas para permitir la superposición exacta; se genera una composición color RGB con las bandas originales, se amplían las escenas de menor resolución hasta conseguir el mismo tamaño en píxeles que la de mayor resolución (ampliación por 2, para mejorar a 15 m banda 8 LANDSAT ETM+, y por 3, para mejorar a 10 m – pancromática SPOT HRV); se transforma la composición color RGB en el sistema HIS y se sustituye la imagen de intensidad I por la banda pancromática de mayor resolución espacial y sin perder la resolución espectral original, materializada en sus componentes tono H y saturación S; finalmente, se deshace la transformación aplicando su inversa y consiguiendo de nuevo una imagen multiespectral con tres bandas correspondientes a las coordenadas RGB. La distribución de los Nd dentro de cada una de las bandas de la imagen tiende a asemejarse a una distribución normal. Las probabilidades definidas para variables discretas tienen su equivalente en las funciones de densidad de las variables aleatorias. La función de densidad de la distribución normal es:. f ( z) =. 1 e σ 2π. 1  z −µ  −   2 σ . 2. Funciones de densidad de distintas distribuciones. En la figura de la derecha, f(x,y,z) viene representada por la densidad de la nube probabilística, simbolizada por elipsoides concéntricos. Tomado de Pinilla, 1995, pág. 220.. 4.

(5) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Un resumen de los métodos de clasificación. Tomado del Manual en Español de IDRISI KILIMANJARO. La clasificación de imágenes se refiere a la interpretación asistida por computadora de imágenes de sensores remotos. Aunque algunos procedimientos son capaces de incorporar información acerca de las características de las imágenes tales como la textura y el contexto, gran parte de la clasificación de imágenes sólo se basa en la detección de firmas espectrales (es decir, patrones de respuesta espectral) de las clases de cubierta terrestre. El éxito que esto puede adquirir depende de dos factores: 1) la presencia de firmas distintivas para las clases de cubierta terrestre de interés en el grupo de bandas en uso; 2) la habilidad para distinguir con precisión estas firmas de otros patrones de respuesta espectral que pueden presentarse. Existen dos enfoques generales en la clasificación de imágenes: supervisado y no supervisado. Se diferencian en la manera de realizar la clasificación. En el caso de la clasificación supervisada, el algoritmo del sistema - software - delinea tipos de cubierta terrestre específicos sobre datos estadísticos de caracterización extraídos de muestras en la imagen y validadas a campo (conocidos como sitios de entrenamiento). Con la clasificación no supervisada, en cambio, se utiliza un algoritmo de agrupamientos para descubrir los tipos de cubierta terrestre más comunes. Luego, en un paso posterior, el analista provee interpretaciones – descripciones - de esos tipos de cubierta. Clasificación Supervisada El primer paso en la clasificación supervisada es identificar ejemplos de las clases de información de interés (es decir, tipos de cubierta terrestre) en la imagen. Éstos se llaman sitios de entrenamiento (training sites). El software se usa por lo tanto para desarrollar una caracterización estadística de las reflexiones para cada clase de información. Este paso a menudo es llamado análisis de firmas (signature analisis) y puede incluir el desarrollo de una caracterización tan simple como el medio o el rango de las reflexiones sobre cada banda, o tan compleja como el análisis detallado del medio, desviaciones y co -desviaciones (covarianzas) sobre todas las bandas. Una vez lograda la caracterización estadística de cada clase de información, la imagen es clasificada a partir del examen de los valores en cada píxel y de la toma de decisión acerca de a cuál de las firmas se asemeja más. Hay varios algoritmos llamados clasificadores, para tomar estas decisiones. La mayoría de los software de Procesamiento de Imágenes ofrece muchas de estas técnicas, basadas en reglas de decisión variable. IDRISI ofrece una amplia gama de opciones que se dividen en tres grupos, dependiendo de los objetivos perseguidos y de la naturaleza de las bandas de entrada. Clasificadores Rígidos La característica distintiva de los clasificadores rígidos es que todos toman una decisión definitiva acerca de la clase de cubierta terrestre a la que todo píxel pertenece. IDRISI ofrece cinco clasificadores en este grupo: Paralelepípedos (PIPED), Distancia Mínima a la Media (MINDIST), y Máxima Verosimilitud (MAXLIKE), Análisis Discriminante Lineal (FISHER), y Red Neuronal Artificial (NEURALNET). Sólo se diferencian en la manera en que desarrollan y utilizan la caracterización estadística de los datos de los sitios de entrenamiento. De los cinco, el procedimiento de Máxima Verosimilitud es el clasificador, sin dudas, más usado en la clasificación de imágenes captadas por sensores remotos. 5.

(6) Instituto de Recursos Naturales y Ecodesarrollo ESCUELA DE RECURSOS NATURALES. UNIVERSIDAD NACIONAL DE SALTA FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Clasificadores Blandos Al contrario de los clasificadores rígidos, los clasificadores blandos no toman una decisión definitiva acerca de la clase de cubierta terrestre a la cual pertenece cada píxel. Éstos desarrollan declaraciones del grado en que cada píxel pertenece a cada una de las clases de cubierta terrestre en consideración. Entonces, por ejemplo, un clasificador blando puede indicar que un píxel tiene una probabilidad de 0,72 de representar bosque, una probabilidad de 0,24 de ser pastura y una probabilidad de 0,04 de ser suelo desnudo. Un clasificador rígido resuelve esta incertidumbre concluyendo que el píxel representa la clase bosque. Sin embargo, un clasificador blando pone esta incertidumbre explícitamente disponible, para cualquier tipo de propósitos. Por ejemplo, el analista puede concluir que la incertidumbre nace porque el píxel contiene más de un tipo de cubierta terrestre y puede usar las probabilidades como indicadores de la proporción relativa de cada uno. Esto se conoce como clasificación sub - píxel. Alternativamente, el analista puede concluir que la incertidumbre nace debido a datos de sitios de entrenamiento no son representativos y por lo tanto debe combinar estas probabilidades con otra evidencia antes de endurecer la decisión hacia una conclusión final. IDRISI ofrece cuatro clasificadores blandos (BAYCLASS, MAHALCLASS, BELCLASS y FUZCLASS). Los resultados de los cuatro pueden ser endurecidos usando el módulo HARDEN (Endurecer). La diferencia entre ellos está relacionada con la lógica por la cual se especifica la incertidumbre Bayesiana, Dempster-Shafer y Fuzzy Sets. Además, el sistema ofrece una variedad de herramientas adicionales específicamente diseñadas para el análisis de mezclas sub - píxel (Ej., UNMIX, FUZSIG, MIXCALC y MAXSET). Clasificadores Hiperespectrales Todos los clasificadores mencionados anteriormente operan sobre imágenes multiespectrales – imágenes en donde varias bandas espectrales han sido captadas simultáneamente como componentes de imágenes independientemente accesibles. Al extender esta lógica a muchas bandas, se produce lo que se ha conocido como imagen hiperespectral. Aunque esencialmente no haya ninguna diferencia entre las imágenes hiperespectrales y multiespectrales (es decir, sólo difieren en grado); el mayor volumen de datos, la alta resolución espectral y el menor rango registrado por cada banda de las imágenes hiperespectrales sí provoca diferencias en la forma en que son manejadas. IDRISI brinda utilidades especiales para crear firmas hiperespectrales de sitios de entrenamiento o bien de bibliotecas de patrones de respuesta espectral desarrollados bajo condiciones de laboratorio (HYPERSIG) y una rutina automática de extracción de firmas hiperespectrales (HYPERAUTOSIG). Estas firmas pueden ser aplicadas entonces en cualquiera de los varios clasificadores hiperespectrales: Ángulo Espectral Cartográfico (HYPERSAM), Distancia Mínima Hiperespectral (HYPERMIN), Eliminación de la Mezcla de las Líneas Espectrales (HYPERUNMIX), Proyección Ortogonal Subespacial (HYPEROSP), Análisis del Área de Absorción (HYPERABSORB). También se encuentra disponible un clasificador no supervisado (vea la próxima sección) para las imágenes hiperespectrales (HYPERUSP). 6.

(7) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Clasificación No Supervisada En contraste con la clasificación supervisada, en la que le indicamos al sistema el carácter (es decir, la firma) de las clases de información que estamos buscando, la clasificación no supervisada no requiere un avance de información acerca de las clases de interés. Ésta examina, en cambio, los datos y los divide en los grupos espectrales naturales más prevalecientes, o conglomerados, presentes en los datos. El analista identifica, entonces, estos grupos como clases de cubierta terrestre a través de una combinación de familiaridad con las visitas verdaderas a la región y el suelo. La lógica con la que trabaja la clasificación no supervisada se conoce como análisis cluster o de grupos, y en IDRISI es principalmente aplicado en el módulo CLUSTER. Este módulo realiza la clasificación basándose en un grupo de imágenes de entrada usando una técnica máxima de histograma multi-dimensional. Es importante reconocer, sin embargo, que los procedimientos de agrupamiento de clasificación no supervisada no son clases de información, sino clases espectrales (es decir, agrupan características, píxeles, con patrones de reflexión similares). Es por lo general el caso en el que el analista necesita reclasificar las clases espectrales en clases de información. Por ejemplo, el sistema puede identificar clases para asfalto y cemento que el analista luego puede agrupar y crear una clase de información llamada pavimento. Aunque resulte atractivo conceptualmente, la clasificación no supervisada ha sido tradicionalmente entorpecida por algoritmos muy lentos. Sin embargo, el procedimiento de agrupamiento brindado por IDRISI es extraordinariamente rápido (sin dudas el más rápido del mercado) y puede por lo tanto usarse interactivamente en conjunción con datos verdaderos de la cobertura del suelo para arribar a una clasificación muy precisa. Con los procedimientos correctos de la verdad de campo y de evaluación de la exactitud, esta herramienta puede proveer un medio marcadamente rápido para producir datos de calidad sobre la cubierta terrestre en una base continua. Además de las técnicas mencionadas anteriormente, hay dos módulos que unen ambas clasificaciones: supervisada y no supervisada. El ISOCLUST usa un procedimiento llamado Análisis de Cluster de Autoorganización para clasificar hasta 7 bandas puras en las que el usuario especifica el número de grupos a procesar. El procedimiento emplea el módulo CLUSTER para iniciar una cantidad de grupos que generan una aplicación iterativa del procedimiento MAXLIKE, en el cual cada paso usa los resultados del paso anterior como los sitios de entrenamiento para este procedimiento supervisado. El resultado es una clasificación no supervisada que converge en una etapa final de elementos estables usando un enfoque supervisado (por eso el concepto de “autoorganización”). El MAXSET es también, en su esencia, un procedimiento supervisado. No obstante, mientras el procedimiento comienza con sitios de entrenamiento que caracterizan clases individuales, éste resulta en una clasificación que no sólo incluye estas clases específicas sino también (aunque se desconozcan) mezclas que pueden llegar a existir. Entonces, el resultado final tiene en gran medida el perfil de aquel de un enfoque no supervisado.. 7.

(8) Instituto de Recursos Naturales y Ecodesarrollo ESCUELA DE RECURSOS NATURALES. UNIVERSIDAD NACIONAL DE SALTA FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Evaluación de la Exactitud Un paso vital en el proceso de clasificación, tanto supervisada como no supervisada, es la evaluación de la precisión de las imágenes finales. Esto implica identificar un grupo de lugares (con el módulo SAMPLE) que son visitados en el campo. La cubierta terrestre encontrada en el campo es luego comparada con aquella que fue confeccionada como mapa de clases en la imagen del mismo lugar. Las evaluaciones de precisión estadística pueden ser derivadas para toda el área de estudio, así como también para clases individuales (usando el ERRMAT). En un enfoque iterativo, la matriz de errores producida (a veces llamada matriz de confusión), puede ser usada para identificar tipos de cubierta particulares cuyos errores superan con creces a los deseados. La información presentada en la matriz de confusión nos indica cuales cubiertas están siendo incluidas por error en una clase en particular (errores de comisión) y aquellas que están siendo excluidas (errores de omisión) de una clase cuando en realidad son de esta; por lo tanto la matriz de error pueden usarse para afinar el enfoque de clasificación. Los métodos de clasificación se dividen en dos grupos: clasificación no supervisada y clasificación supervisada. MÉTODO NO SUPERVISADO Este método busca la agrupación automática de los Nds de la imagen en una serie de grupos homogéneos que respondan a similitudes espectrales de las cubiertas. En general, el procedimiento está basado en un proceso de tres pasos: 1. determinación de las características de las celdas, 2. medida de la similitud o distancia estadística entre grupos, y 3. la aplicación de algún criterio de agrupamiento entre clases. Para el caso del programa IDRISI 32, el módulo utilizado se denomina CLUSTER (agrupamiento o conglomerado).. Agrupamiento de puntos en una nube de probabilidad o cluster y vector de medias asociado. Tomado de Pinilla, 1995, Pág. 222. 8.

(9) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. 1. CLUSTER usa una técnica de "picos" del histograma para el análisis de conglomerados. En ésta, se buscan los picos en un histograma de una dimensión, definidos como valores de mayor frecuencia que sus dos vecinos. Una vez definidos los picos, todos los valores son asignados al pico más próximo y las divisiones entre clases se determinan en los puntos medios entre picos. En nuestro caso, se utilizan histogramas de tres dimensiones ya que la composición se derivó de tres bandas. Un pico es una clase donde la frecuencia es mayor que la de todos sus vecinos. Los resultados son mejores si no se consideran los vecinos diagonales debido a la correlación existente entre bandas.. Agrupamiento estadístico o clustering en el espacio de características formado por las bandas k y l. Tomado de Pinilla, 1995, Pág. 229. En la clasificación general, una clase debe poseer una frecuencia mayor que la de todas sus vecinas no-diagonales. En la clasificación detallada, una vecina no-diagonal puede tener una mayor frecuencia. Esto permite tener en cuenta los picos reales que de otro modo quedarían ocultos por un pico próximo de mayor frecuencia. 2. CLUSTER funciona mejor si la composición se generó usando la opción lineal con saturación, que asegura que los seis niveles por banda en la composición ocupan la zona en que se concentran la mayor parte de los datos. No obstante, los resultados serán óptimos con un ajuste que use menor saturación que la propuesta para el realce de la visualización. Generalmente, una saturación entre 1% y 2,5% ofrece los mejores resultados para el análisis de conglomerados. 3. CLUSTER sólo funciona con imágenes compuestas creadas con COMPOSIT. La composición está formada por índices de color, donde cada índice = azul + (verde * 6) + (rojo * 36), asumiendo un rango de 0-5 en cada una de las tres bandas. Por ejemplo un píxel con valores AVR de 3, 5, 1 tendría un índice de 3 + (5 * 6) + (1 * 36) = 69. CLUSTER descompone los valores de COMPOSIT para generar un histograma tridimensional. 9.

(10) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. 4. CLUSTER sólo funciona con composiciones de tres bandas. Esto puede suponer una fuerte limitación, dado el rango de bandas disponibles con imágenes como LANDSAT TM. No obstante, un Análisis de Componentes Principales revelaría rápidamente que si las tres bandas han sido elegidas acertadamente, contendrán la mayor parte de la información. Por ejemplo, en muchos casos la elección de las bandas TM 2, 3 y 4 (la composición en falso color más típica) o 3, 4 y 5 contendrán más del 95% de la información de la serie completa de bandas. No es recomendable crear una composición de imagen para CLUSTER a partir de los tres primeros componentes de un Análisis de Componentes Principales usando la opción de saturación. El resultado daría igual peso a todos los componentes, obteniendo un resultado pobre – tanto el segundo como el tercer componente (particularmente el tercero) no poseerán un gran peso -. 5. El algoritmo CLUSTER se ha modificado mediante una técnica de "picos" del histograma, descrita por John A. Richards, Remote Sensing Digital Image Analysis: An Introduction. Berlin: Springer, 1986.. Histograma de una imagen color compuesta. CLUSTER ofrece dos niveles de generalización. Con el nivel amplio de generalización, los grupos deben ocurrir como picos distintos en el histograma multidimensional según se indicó anteriormente. No obstante, con el nivel fino de generalización, CLUSTER también reconoce los escalones en la curva como picos de grupos. Los escalones ocurren cuando dos agrupamientos adyacentes se superponen en gran medida. Los picos y los escalones son identificados en el histograma que se muestra en la figura anterior. La experiencia en el uso de la rutina de CLUSTER ha demostrado que es rápida y capaz de producir excelentes resultados. Por otra parte, hemos aprendido que la siguiente secuencia de operaciones es particularmente útil. 1. Ejecute el CLUSTER usando las bandas más informativas disponibles (generalmente, estas incluyen la banda roja visible, la banda infrarroja cercana y la banda infrarroja media – Ej.: las bandas del LANDSAT TM 3, 4 y 5 respectivamente). Use el stretch (estiramiento) lineal con las opciones de: saturación en un 1%, "fine generalization level" (nivel fino de generalización) y "retain all clusters" (retener todos los grupos). 2. Despliegue un histograma de esta imagen. Este histograma muestra la frecuencia de pixeles asociados con cada uno de los grupos que pueden localizarse en la imagen. Muchos de estos grupos tienen frecuencias muy pequeñas, y por ello, son de alguna manera insignificantes. La Figura 16-8 presenta un ejemplo de dicho histograma. Como se puede observar, hay tres grupos que dominan la imagen. Luego hay una ruptura profunda con un segundo conjunto de grupos fuertes hasta el Grupo 12. Luego hay un tercer conjunto que sigue hasta el Grupo 25, seguido por un pequeño conjunto de grupos muy insignificantes. La experiencia sugiere entonces que una buena generalización de los. 10.

(11) Instituto de Recursos Naturales y Ecodesarrollo ESCUELA DE RECURSOS NATURALES. UNIVERSIDAD NACIONAL DE SALTA FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. datos sería extraer los primeros 12 grupos, con un análisis más detallado puntualizando los primeros 25. 3. Una vez que el número de grupos para examinar ha sido determinado, vuelva a ejecutar el CLUSTER, pero esta vez elija una "fine generalization" (generalización fina) y establezca un "maximum number of clusters" (número máximo de grupos) hasta el número que Ud. determinó (Ej.: 12).. 4. Despliegue la imagen resultante con una paleta de colores cualitativos y luego trate de identificar cada uno de los grupos por vez. Puede usar la opción interactiva de edición de leyenda (legend editing) para cambiar la leyenda y grabar su propia interpretación. También puede cambiar el color de esa categoría para que combine con un esquema lógico de colores. Además, recuerde que puede resaltar todos los píxeles pertenecientes a una categoría presionando el botón del mouse sobre un cuadro del color de categoría de la leyenda. 5. Al final del proceso de identificación, puede que necesite combinar varias categorías. Por ejemplo, el análisis de grupos pudo haber descubierto varias categorías de pavimento, como el asfalto y el concreto, que Ud. puede unir en una sola categoría. La manera más simple de realizar esto es usando el Edit para crear un archivo de valores que contenga las reasignaciones enteras. Este archivo tiene dos columnas. La columna izquierda registra el número original de grupos, mientras que la columna derecha debe contener el número de la nueva categoría a la cual debe ser reasignado. Luego de que este archivo ha sido creado, emplee el ASSIGN para asignar estos índices de categorías nuevas a los datos originales de grupo. El procedimiento CLUSTER en IDRISI es rápido y muy eficiente para descubrir la estructura básica de la cobertura terrestre de la imagen. Además puede usarse como un paso preliminar para un proceso híbrido no supervisado / supervisado donde los grupos se usan como los sitios de entrenamiento para un segundo paso de clasificación usando el clasificador MAXLIKE - Esto es posible debido a que MAKESIG puede crear firmas basadas en sitios de entrenamiento definidos por un archivo vectorial o por una imagen. En cualquiera de los casos, se usa la opción de la imagen - . Esto tiene la ventaja de permitir el uso de un número mayor de bandas de datos puros y también brinda un paso de clasificación más fuerte de píxeles para su grupo más similar. En realidad, esta lógica se halla en el procedimiento ISOCLUST descrito a continuación.. 6. El módulo ISOCLUST ofrece un análisis de conglomerados para un máximo de 7 bandas. Funcionamiento del algoritmo CLUSTER CLUSTER requiere el nombre de la imagen de composición de bandas a clasificar y el nombre de la imagen de salida. (Se debe ejecutar COMPOSIT para generar la imagen de composición a 11.

(12) Instituto de Recursos Naturales y Ecodesarrollo ESCUELA DE RECURSOS NATURALES. UNIVERSIDAD NACIONAL DE SALTA FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. utilizar en CLUSTER). A continuación, especificar si se realizará una clasificación "general" o "detallada". La primera proporciona una descripción general de las clases espectrales, mientras que la segunda proporciona información adicional. Se puede realizar una primera aproximación con la clasificación general. A continuación CLUSTER solicita las opciones de agrupamiento, que pueden ser utilizadas tanto en la clasificación "general" como en la "detallada". Estas opciones son: a) Eliminar los conglomerados menos significativos (< 1% de todos los conglomerados). Los conglomerados son organizados en función de su contenido en información y se mantienen aquellos que describen hasta el 99% de la imagen, los conglomerados restantes son eliminados. Las celdas que habían sido asignadas a los conglomerados eliminados son ahora asignadas al conglomerado más próximo de los que permanecen. Esta opción funciona correctamente como un clasificador "ciego". b) Número máximo de conglomerados: se debe introducir el máximo definido. Los conglomerados se ordenan en función de la cantidad de imagen que describen. Se retienen los primeros N conglomerados y los píxeles restantes se asignan al más similar de estos N conglomerados. c) Mantener todos los conglomerados. Esta opción es más frecuente en clasificaciones "detalladas". Los conglomerados se ordenarán, de mayor a menor, en función del área total que ocupan. Con HISTO, se debe visualizar en modo gráfico el histograma de la clasificación con una anchura de intervalo de 1. Buscar las rupturas más significativas en la pendiente del histograma, que son indicativas de niveles de agrupamiento natural. Por último, ejecutar CLUSTER con el número máximo de conglomerados sugerido por los puntos de ruptura del histograma. Ésta es, probablemente, la función óptima para esta técnica. ISOCLUST El módulo ISOCLUST es un clasificador no supervisado auto-organizado iterativo basado en un concepto similar a la reconocida rutina ISODATA de Ball y Hall (1965) y a las rutinas de grupo como los procedimientos media-H y media-K. La lógica típica es la siguiente: 1. El usuario decide el número de grupos para descubrir. Uno se encuentra verdaderamente ciego al tomar esta decisión. Como consecuencia, una estrategia común es pedir un número grande y luego agregar grupos después de la interpretación. Una estrategia más eficiente para este problema se ofrece más abajo, y está basada en la implementación específica en el IDRISI. 2. Un conjunto de grupos N luego es colocado arbitrariamente en el espacio de banda. En algunos sistemas, estas ubicaciones son asignadas al azar. Aunque en la mayoría, son colocadas sistemáticamente dentro de la región de reflectancias de frecuencia alta. 3. Luego los píxeles son asignados a su ubicación de grupo más cercano. 4. Después de que todos los píxeles han sido asignados, se computa una nueva ubicación media. 5. Los Pasos 3 y 4 se repiten interactivamente hasta que no se produzca ningún cambio significativo en la producción. La implementación de esta lógica general en IDRISI es diferente en varios aspectos. - Luego de ingresar las bandas de imágenes crudas para utilizar, se le presentará un histograma de grupos que 12.

(13) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. expresa la frecuencia con la cual éstos ocurren en la imagen. Debe examinar este gráfico y buscar rupturas significativas en la curva. Éstas representas cambios importantes en la generalidad de los grupos. Especifique el número de grupos a crearse sobre una de estas rupturas principales. - El proceso de generación de grupos en realidad se hace con el módulo CLUSTER del IDRISI. CLUSTER es verdaderamente un algoritmo de agrupamiento (en oposición a una operación de segmentación como la que se utiliza en muchas rutinas de agrupamiento así llamadas). Esto conduce a una colocación de grupos mucho más eficiente y exacta que la colocación sistemática o aleatoria. - El proceso iterativo utiliza un procedimiento de Máxima Verosimilitud completo. En realidad, Ud. notará que éste utiliza reiteradas veces los módulos MAKESIG y MAXLIKE. Esto provee un procedimiento de asignación de grupos muy fuerte. MÉTODO SUPERVISADO En este método, el analista define sobre la escena una serie de polígonos, conocidos como campos de entrenamiento (training fields), de los que se conocen su pertenencia a cada una de las clases preestablecidas. Normalmente, para la aplicación de alguno de los algoritmos de clasificación supervisada se requiere la utilización previa del método no supervisado y el reconocimiento de campo del significado de cada una de las clases; además, se requiere de fuentes de información secundaria – fotografías aéreas, mapas temáticos de: uso y cobertura del suelo, geológicos y geomorfológicos - y de un adecuado conocimiento de la zona por parte del intérprete. El vector de medias y la matriz de covarianzas de las celdas de los campos de entrenamiento definirán las características de cada clase, siendo utilizadas posteriormente en la fase de asignación del resto de los píxeles de la escena, suponiendo normalidad para la distribución de frecuencia de las clases. La selección de los campos de entrenamiento es una tarea delicada que requiere todo el rigor posible, por que de ella dependerá el resultado final de la clasificación. En primer lugar, es necesario que cada campo de entrenamiento sea definido sobre las celdas que representen una clase pura en particular, que no se encuentre contaminada con píxeles de otras clases. CREACIÓN DE LOS CAMPOS DE ENTRENAMIENTO Para generar los campos de entrenamiento en IDRISI 32, se debe utilizar el elemento digitalizador (término comúnmente utilizado para designar a un dispositivo que codifica datos gráficos vectoriales (localizaciones de puntos) en un plano de coordenadas (X,Y). No obstante, este término se aplica, también, a varios tipos de digitalizadores de barrido que codifican imágenes raster). Accionando el elemento digitalizador, se procede a seleccionar el tipo de layer (polígono en este caso), se coloca el nombre del archivo, tipo de dato entero y, finalmente, en el cuadro del identificador (ID) el valor correspondiente al número de la clase a la que se le realizará el muestreo. Para generar las signaturas (firmas espectrales) se utiliza el módulo MAKESIG. MAKESIG genera las signaturas espectrales de una serie de campos de entrenamiento (archivo de signaturas), a partir de la información contenida en las distintas bandas de una imagen de satélite. 13.

(14) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Estas signaturas se utilizan en los módulos PIPED, MINDIST, MAXLIKE, BAYCLASS, BELCLASS y FUZCLASS de clasificación de imágenes de satélite. Previamente, hay que definir los campos de entrenamiento como un archivo vectorial de polígonos o como una imagen raster. En el primer caso, MAKESIG realiza, en primer lugar, una conversión de este archivo vectorial a imagen raster. Este archivo vectorial se genera con las herramientas de digitalización en el sistema de visualización. En ambos casos, raster o vectorial, los campos de entrenamiento se identifican con números enteros. Puede haber tantos campos de entrenamiento para una sola clase como se desee, utilizando el mismo identificador para todos los campos de una misma clase. MAKESIG: Funcionamiento En primer lugar, indicar si el archivo que contiene los campos de entrenamiento es una imagen raster o un archivo vectorial. En el primer caso, MAKESIG utiliza una imagen raster ya existente que define los campos de entrenamiento. Introducir el nombre de este archivo. Si se selecciona el archivo vectorial, introducir el nombre del archivo que contiene la delimitación de los campos de entrenamiento. El módulo "rasteriza" estos campos de forma que coincidan con las dimensiones de la imagen de donde se extraerá la información (las bandas) y otorga a la imagen raster resultante el mismo nombre del archivo vectorial. Esta imagen raster puede modificarse posteriormente con UPDATE, o puede utilizarse para combinar información de varios archivos vectoriales que contengan campos de entrenamiento. Después, especificar el número y nombres de las bandas (cada una es una imagen raster) que se utilizarán para generar las signaturas espectrales. Deben incluirse todas las bandas que consideremos útiles, aunque posteriormente no utilicemos todas en la clasificación. Pulsar Continuar para introducir los parámetros restantes. Introducir el nombre de la signatura de cada uno de los campos de entrenamiento utilizados. Pulsar sobre las flechas orientadas hacia arriba y abajo para introducir/modificar todos los identificadores. MAKESIG extrae los píxeles en todas las bandas para cada clase informacional y calcula las estadísticas de la signatura. Los píxeles se almacenan en un archivo con extensión ".spf", y las estadísticas se almacenan en un archivo de signatura con extensión ".sig". MAKESIG: Notas 1. Los archivos de signaturas con extensión ".sig", generados por MAKESIG, poseen formato ASCII y pueden modificarse. La primera línea indica el número de bandas, los nombres de las bandas aparecen, sucesivamente, en las siguientes líneas. No cambiar el orden de estos nombres. Después de estos, hay tantas líneas de datos como bandas. Cada línea indica el mínimo, máximo, media y varianza para la signatura en esa banda, así como las covarianzas entre ésta y las otras bandas. Aparecen tantas covarianzas como bandas restantes. Así, una signatura generada para 4 bandas tendrá un total de 7 números, separados por uno o más espacios, por línea; el mínimo, máximo, media, varianza, y tres covarianzas.. 14.

(15) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Archivo de signaturas con extensión ".sig", generados por MAKESIG. 6 c:\sensores2\procesmiento 71 84 7.82060165405273E+0001 4.65583535745360E+0000 9.77604859389728E-0002 2.78708133564748E+0000 -7.39885780706206E+0000 -1.16073622559727E+0000 8.12429816650957E+0000 c:\sensores2\procesmiento 61 78 6.77175903320312E+0001 9.77604859389728E-0002 6.36088232761746E+0000 -1.57524445217336E-0001 2.44101245287123E+0001 4.71487547128770E+0000 -1.19833519884715E+0001 c:\sensores2\procesmiento 56 73 6.45254592895508E+0001 2.78708133564748E+0000 -1.57524445217336E-0001 8.54690955354553E+0000 -1.16708066723462E+0001 -4.31424028082403E-0001 1.34058568826131E+0001 c:\sensores2\procesmiento 53 116 7.49652786254883E+0001 -7.39885780706206E+0000 2.44101245287123E+0001 -1.16708066723462E+0001 1.46339907192575E+0002 2.66585611223898E+0001 -8.48220435759861E+0001 c:\sensores2\procesmiento 126 145 1.35722229003906E+0002 -1.16073622559727E+0000 4.71487547128770E+0000 -4.31424028082403E-0001 2.66585611223898E+0001 1.54957697397041E+0001 -1.03605316940980E+0001 c:\sensores2\procesmiento 73 120 8.57800903320313E+0001 8.12429816650957E+0000 -1.19833519884715E+0001 1.34058568826131E+0001 -8.48220435759861E+0001 -1 03605316940980E+0001. digital\práctica\prac_b10geo.rst. digital\práctica\prac_b20geo.rst. digital\práctica\prac_b30geo.rst. digital\práctica\prac_b40geo.rst. digital\práctica\prac_b50geo.rst. digital\práctica\prac_b70geo.rst. 2. El archivo con los píxeles de la signatura, con extensión ".spf", posee formato byte-binario y no puede ser modificado. Se utiliza con el módulo EDITSIG. Contiene todos los píxeles de los campos 15.

(16) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. de entrenamiento de una clase en todas las bandas, en el orden especificado en el archivo de signatura. El primer byte indica el número de píxeles, los bytes sucesivos son los valores de los píxeles para cada banda. Así, una signatura generada con 25 píxeles en 4 bandas, contendrá 101 bytes. 3. Todas las bandas (imágenes raster) utilizadas en MAKESIG deben tener formato byte-binario. Se pueden incorporar pseudo-bandas, como los datos procedentes de un Modelo Digital del Terreno, escalándolas a rango byte, utilizando STRETCH. Utilizar el mínimo y el máximo como límites superior e inferior y especificar 256 niveles. 4. Los códigos de clase de los campos de entrenamiento deben estar en el rango de 1-255. 5. En esta versión de IDRISI para Windows cada "signatura" se almacena en dos archivos, ".sig" y ".spf". Para eliminar una signatura de la unidad en uso, se deben eliminar ambos. Esto se hace automáticamente con el comando ELIMINAR, dentro del sub-menú Archivo. Los comandos de clasificación PIPED, MINDIST y MAXLIKE utilizan el archivo ".sig". El archivo ".spf" se utiliza para la edición de signaturas. 6. No es necesario definir todos los polígonos de campos de entrenamiento en el mismo archivo vectorial. De hecho, cada campo de entrenamiento podría aparecer en su propio archivo vectorial, ejecutando MAKESIG varias veces para crear la serie completa. ¡Sólo debemos asegurarnos que todas las signaturas se refieren a las mismas bandas en el mismo orden! 7. El número máximo de bandas es siete. 8. Como norma general, el número de píxeles en el conjunto de los campos de entrenamiento de una misma clase debería ser, al menos, diez veces el número de bandas utilizadas. Comparación de las firmas espectrales – SIGCOMP SIGCOMP compara signaturas creadas con MAKESIG. Representa gráficamente y de forma simultánea, hasta un máximo de 9 signaturas para todas las bandas mediante un diagrama de signaturas espectrales (con los niveles digitales medios) o mediante un diagrama de confusión espectral, que recoge el rango digital a partir de los valores mínimo y máximo.. 16.

(17) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Diagrama de confusión utilizada para la clasificación por el método de paralelepípedos. SIGCOMP permite detectar qué signaturas son similares. La opción de diagrama de confusión se utiliza para la clasificación de paralelepípedos y el diagrama de signaturas (niveles digitales medios) se utiliza para las clasificaciones de mínima distancia y máxima probabilidad. En una clasificación de paralelepípedos, al menos una de las bandas debería mostrar categorías completamente separables en el diagrama de confusión (mínimo/máximo). Si no es así, habrá confusiones en la clasificación. En las clasificaciones de mínima distancia y máxima probabilidad, las categorías con signaturas espectrales (medias) muy próximas serán difíciles de distinguir.. 17.

(18) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Diagrama de signaturas (niveles digitales medios) utilizado para las clasificaciones de mínima distancia y máxima probabilidad SIGCOMP: Funcionamiento En primer lugar, especificar el tipo de visualización: un diagrama de confusión espectral a partir del mínimo y máximo o un diagrama de signaturas espectrales a partir de la media, o ambos. A continuación, introducir el número de signaturas a comparar y sus nombres. Pueden compararse un máximo de 9 signaturas. Pulsar sobre las flechas, orientadas hacia arriba o hacia abajo, para añadir o eliminar signaturas. Edición de las firmas espectrales – EDITSIG EDITSIG edita un archivo de signaturas generado con MAKESIG. Permite visualizar el histograma de los valores de los píxeles utilizados para crear la signatura. También permite cambiar los valores mínimo y máximo de los píxeles utilizados para la caracterización estadística de una determinada banda. Cualquier cambio conlleva un nuevo cálculo de la media, varianza y covarianza para esa banda. EDITSIG muestra la nueva media y desviación típica. Este comando se utiliza, generalmente, en combinación con el proceso de clasificación de paralelepípedos, PIPED, que es muy sensitivo a los valores mínimo y máximo registrados en cada signatura. Visualizar los histogramas de cada banda para comprobar si la distribución presenta una curva "normal". Si la signatura es multimodal, o si existen valores extremos aislados, excluirlos cambiando el mínimo y el máximo. EDITSIG: Funcionamiento En primer lugar, introducir el nombre de la signatura a editar. Presenta una tabla que incluye el número de bandas utilizadas para crear la signatura y el número de píxeles en el campo de entrenamiento. También ofrece el mínimo, máximo, media y desviación típica de la signatura en la 18.

(19) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. primera banda. Pulsar sobre las flechas (orientadas hacia la derecha y hacia la izquierda) para cambiar entre bandas. Pueden cambiarse los límites de los datos incluidos en la signatura introduciendo nuevos valores para el mínimo y máximo a utilizar en los cálculos. A continuación pulsar sobre la opción "Actualizar". Por ejemplo, si elevamos el mínimo en una banda, todos los píxeles por debajo del mínimo serán eliminados para el cálculo de la media y la desviación típica. A continuación se presenta mayor información sobre el efecto de las modificaciones en las covarianzas: EDITSIG, utilizado conjuntamente con PIPED, está diseñado, principalmente, para modificar el mínimo y el máximo. En esta versión, al cambiar el mínimo o el máximo se eliminan solamente los píxeles de la banda en uso, no los de las otras bandas. Este procedimiento se encuentra en revisión, por lo que puede cambiar en fechas posteriores. Presionar la opción "Ver Histograma" para ver el histograma de los datos de los campos de entrenamiento para esa clase. Nota: el histograma incluye los valores mínimo y máximo para la visualización del histograma. También se puede volver a las estadísticas de la muestra original. Solamente presionar la opción apropiada. Cuando se abandona el comando, pregunta si se guardarán los cambios en el archivo actual o si se abrirá un nuevo archivo. MÉTODOS DE CLASIFICACIÓN SUPERVISADA En este curso se utilizarán tres métodos de clasificación supervisada: Paralelepípedo, Mínima distancia a la media y Máxima probabilidad (verosimilitud). Método del Paralelepípedo (PIPED) PIPED realiza clasificaciones supervisadas de imágenes de satélite mediante la técnica de paralelepípedos, a partir de la información contenida en una serie de archivos de signaturas. La clasificación de paralelepípedos se basa en una serie de umbrales bajos y altos de reflectividad para cada categoría en cada banda, determinadas por la signatura espectral. Para asignar un píxel a una clase determinada, éste debe poseer valores de reflectividad dentro del rango de la categoría en cuestión en cada banda considerada. El proceso de paralelepípedos es el más rápido de los clasificadores supervisados. También, potencialmente, el menos preciso.. Nd c (k ) − Rc (k ) < Nd (k ) < Nd c (k ) + Rc (k ). 19. ∀1≤k≤n.

(20) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Clasificador de paralelepípedos. Tomado de Pinilla, 1995, pág. 238. Funcionamiento PIPED clasifica una imagen basándose en la información contenida en una serie de archivos de signaturas. Estos archivos deben haber sido creados, previamente, con MAKESIG o FUZSIG. Puede indicar, entonces, si desea introducir cada signatura separadamente o va a utilizar un archivo de Grupo de Signaturas para especificar todo el grupo de una sola vez. Los archivos de Grupo de Signaturas se crean con el módulo EDIT. Independientemente de cómo se introduzcan las signaturas, deberá introducir en el cuadro de diálogo el número de signaturas, el modo en el que se establecerán los umbrales y el nombre de la imagen de salida. Para definir los umbrales, existen dos opciones: los valores mínimo y máximo de los campos de entrenamiento a utilizar o un número específico de desviaciones típicas desde la media (valores Z). Es preferible utilizar el último y, de hecho, es el utilizado por defecto. Un valor Z de 1,96 excluiría (p.e. deja sin clasificar) el 5% de los píxeles más alejados de cualquier signatura dada. Del mismo modo, un valor de 2,58 excluiría el 1% de los píxeles más alejados. Cuando se han introducido todos los datos, el cuadro de diálogo final mostrará un listado de las bandas a utilizar en la clasificación. Se puede desactivar cualquiera de las bandas que no desee utilizar en la clasificación. Notas 1. El problema de este método es la posible pertenencia de un píxel a dos o más categorías. En estos casos, el algoritmo de paralelepípedos lo asignaría a la última categoría. Por ello, cuando se introducen los nombres de las signaturas, deben especificarse en orden inverso de importancia o 20.

(21) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. probabilidad, comenzando con el menos importante o probable y finalizando con el mas importante o probable. 2. Los píxeles cuyo valor queda fuera del rango de todos los paralelepípedos definidos constituirán la categoría de no clasificados (categoría cero). Método de Mínima distancia a la media (MINDIST) MINDIST realiza una clasificación, por Mínima Distancia a las Medias, de imágenes de satélite, a partir de la información contenida en una serie de archivos de signaturas. La clasificación de Mínima Distancia a las Medias se basa en la reflectividad media en cada banda para una signatura. Los píxeles se asignan a la clase con la media más próxima a su valor. Para tener en cuenta las diferencias en la variabilidad de las signaturas, MINDIST permite normalizar las distancias espectrales. MINDIST es más lento que el clasificador de paralelepípedos, PIPED, y más rápido que el clasificador de máxima probabilidad, MAXLIKE. MINDIST se utiliza, generalmente, cuando el número de píxeles que define las signaturas es muy pequeño o cuando los campos de entrenamiento no están bien definidos.. dc =. n. ∑ ( Nd i =1. i. − Nd ci ) 2. donde: d c es la distancia desde la celda.. Clasificador de mínima distancia a la media. Tomado de Pinilla, 1995, pág. 236. Funcionamiento MINDIST clasifica una imagen a partir de la información contenida en una serie de archivos de signatura. Estos archivos han de crearse, previamente, con MAKESIG o FUZSIG. Seguidamente, puede introducir cada signatura individualmente o utilizar un Archivo de Grupo de Signaturas (para 21.

(22) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. introducir todo el grupo a la vez. Los Archivos de Grupo de Signaturas se crean con el módulo EDITAR. Independientemente de como se vayan a introducir las signaturas, es necesario especificar el número de signaturas, el tipo de distancia (unidades originales o unidades de desviación típica (dt)), el radio máximo de búsqueda y el nombre de la imagen de salida. Es recomendable utilizar la distancia normalizada (unidades de dt), ya que esta opción considera las diferencias en la variabilidad de las signaturas. El radio máximo de búsqueda determina la distancia a partir de la cual ningún píxel será clasificado. Para los ND originales, se debe introducir un número entero de 0 a 255. Para unidades de desviación típica, se introducirá el número deseado de desviaciones típicas. Estadísticamente, un valor de 1,96 unidades de desviación típica dejaría cerca del 5% de los píxeles sin clasificar, no obstante, este número varía considerablemente en función del tamaño de los campos de entrenamiento usados. Independientemente del tipo de distancia elegido, se puede especificar una distancia infinita. De este modo, todos los píxeles serán clasificados, independientemente de lo lejos que se encuentre de la clase más próxima. Cuando se haya introducido toda la información requerida, aparecerá un listado con las bandas a usar en la clasificación. Puede suprimirse cualquiera de las bandas que no se desee utilizar. Este módulo genera una imagen en la que a cada píxel se le asignó un código de clase igual al número de orden de la signatura correspondiente en el listado de signaturas, y una leyenda que lista las signaturas por su nombre. Notas 1. La normalización de la distancia para cada píxel se realiza restando la media a su valor original y dividiendo el resultado entre la desviación típica. 2. Se ha comprobado que este proceso suele ofrecer muy buenos resultados cuando se utiliza con distancias normalizadas. Es más rápido que la Máxima Probabilidad y tiene menos restricciones en la definición de los campos de entrenamiento. Método de Máxima probabilidad o verosimilitud (MAXLIKE) MAXLIKE realiza una clasificación de imágenes de satélite, por Máxima Probabilidad, a partir de la información contenida en una serie de archivos de signaturas. Se basa en la función de densidad de probabilidad asociada a la signatura de un determinado campo de entrenamiento. Los píxeles se asignan a la clase más probable, tras comparar la probabilidad de que cada píxel pertenezca a cada una de las signaturas consideradas. MAXLIKE es también conocido como un clasificador Bayesiano, ya que puede incorporar conocimiento a priori utilizando el Teorema de Bayes. El conocimiento a priori se expresa como la probabilidad a priori de que cada clase exista. Esto puede especificarse como un valor aplicable a todos los píxeles, o como una imagen representando diferentes probabilidades para cada píxel.. 22.

(23) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. Considerando la probabilidad a priori, el clasificador bayesiano asignará el vector z a la clase wi y no a cualquier otra wj si, y solo si:. P(z/wi) p(wi) ≥ P(z/wj) p(wj). ∀ j≠i; j = 1,...,n. Clasificador de máxima verosimilitud extendido a dos bandas. Tomado de Pinilla, 1995, pág. 242. Funcionamiento MAXLIKE clasifica una imagen basándose en la información contenida en una serie de archivos de signaturas, que deben crearse previamente con MAKESIG o FUZSIG. En primer lugar, debe especificar si desea introducir cada signatura por separado o utilizar un Archivo de Grupo de Signaturas (que contenga todas las signaturas a utilizar). Los Archivos de Grupo de Signaturas se generan con el módulo EDITAR. Si selecciona introducir cada signatura por separado, deberá especificar el número de signaturas a utilizar en la clasificación. Los tres siguientes parámetros son: definir el modo en que se considerarán las probabilidades a priori, la proporción de píxeles que quedarán sin clasificar y el nombre de la imagen de salida. Existen varias opciones de introducir probabilidades a priori. Cuando no exista un conocimiento de la probabilidad a priori de que aparezca cada clase, deberá utilizarse la opción "usar la misma probabilidad para todas las signaturas" (opción por defecto). Si existe un conocimiento razonable del área proporcional ocupada por cada clase en la imagen completa, podría utilizarse la segunda opción "especificar un valor de probabilidad a priori para cada signatura". Así, si se estima que el 42% del área estará ocupada por un tipo dado de cubierta, la probabilidad a priori de esa clase es 0,42. La tercera opción es introducir probabilidades a priori mediante una imagen raster de números reales (con valores entre 0 y 1) para cada signatura. Esto permite incorporar modelos espaciales de predicción en la determinación de las probabilidades a priori. Por ejemplo, podríamos pensar que la probabilidad a priori de que un área que en el pasado era forestal sea una zona 23.

(24) Instituto de Recursos Naturales y Ecodesarrollo ESCUELA DE RECURSOS NATURALES. UNIVERSIDAD NACIONAL DE SALTA FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. residencial en la actualidad es muy probable en los sectores próximos a carreteras y poco probable lejos de éstas. Esto puede expresarse fácilmente mediante esta opción ya que cada píxel posee su propia probabilidad a priori. La suma de probabilidades para cada píxel debe ser 1,0. La última opción es una combinación de las dos anteriores, permite especificar un valor o una imagen de probabilidades. En todos los casos, excepto en el de "usar la misma probabilidad", las probabilidades a priori se especifican en el segundo cuadro de diálogo. MAXLIKE permite excluir una proporción específica de los píxeles menos significativos de cualquier clasificación. Esto hace que los píxeles con menores probabilidades de pertenecer a cualquiera de las clases definidas por las signaturas, queden sin clasificar. Normalmente esta proporción se especifica con la ayuda de una tabla de Distribución de la Ji-Cuadrado. En este módulo, se ha creado una pequeña tabla para los casos de 0% (donde todos los píxeles son clasificados) 1% y 5%. También puede introducirse el valor de la Ji-Cuadrado directamente. Cuando se hayan completado todas estas opciones, el cuadro de diálogo final mostrará un listado con las bandas a utilizar en la clasificación. Puede suprimirse cualquiera de las bandas que no se desee utilizar en la clasificación. Este módulo genera una imagen en la que a cada píxel se le asignó un código de clase igual al número de orden de la signatura correspondiente en el listado de signaturas, y una leyenda que lista las signaturas con su nombre. Notas 1. El proceso utilizado en este módulo se basa en las ecuaciones publicadas en Richards, J.A., (1986) Remote Sensing Digital Image Analysis, (Berlin: Springer-Verlag). 2. Debemos asegurarnos que los datos son adecuados para utilizar este clasificador. En general, la muestra de píxeles debe ser al menos igual a diez veces el número de bandas. Esto se puede verificar usando EDITSIG. 3. El clasificador de Máxima Probabilidad ofrece buenos resultados cuando los campos de entrenamiento están bien definidos (p.e., son razonablemente homogéneos). No obstante, cuando no están bien definidos puede resultar poco adecuado. En estos casos es mejor utilizar el clasificador de Mínima Distancia a las Medias (MINDIST). 4. El número máximo de signaturas es 200 y el número máximo de bandas es siete. Análisis Discriminante Lineal (Clasificador Fisher) El último clasificador a ser discutido en esta sección es más difícil para describir gráficamente. El clasificador FISHER conduce un análisis discriminante lineal de los datos del sitio de entrenamiento para formar un grupo de funciones lineales que expresen el grado de apoyo por cada clase. La clase asignada a cada píxel es entonces esa clase que recibe el apoyo más alto luego de la evaluación de todas las funciones. Estas funciones tienen una forma similar a la de una ecuación de regresión lineal multivariada, donde las variables independientes son las bandas de la imagen, y la variable dependiente es la medida del apoyo. En realidad, las ecuaciones son calculadas de manera tal que maximizan la varianza entre clases y minimizan la varianza dentro de las clases. El número 24.

(25) Instituto de Recursos Naturales y Ecodesarrollo. UNIVERSIDAD NACIONAL DE SALTA. ESCUELA DE RECURSOS NATURALES. FACULTAD DE CIENCIAS NATURALES. SISTEMAS DE INFORMACIÓN GEOGRÁFICA Y ORDENACIÓN TERRITORIAL. de ecuaciones es igual al número de bandas, cada una describe un hiperplano de apoyo. Las intersecciones de estos planos luego forman los bordes entre clases en el espacio de banda. De los cuatro clasificadores supervisados rígidos, MAXLIKE y FISHER son los más poderosos. También son los más lentos para calcular. Sin embargo, con sitios de entrenamiento de alta calidad (es decir, homogéneos), ambos son capaces de producir excelentes resultados.. 25.

(26)