3. Técnicas de procesamiento
3.3. Métodos de post-procesado
Además de las etapas de pre-procesado y clasificación disponibles en cadenas clásicas de procesamiento de datos hiperespectrales, en el presente trabajo se ha empleado también una técnica de post-procesado utilizado en proyectos anteriores [75]. Se trata de un algoritmo llamado ARTMAP 3.01 que se basa en el algoritmo de clasificación Fuzzy
Artmap. La fase de post-procesado constituye el último bloque o paso considerado en la
cadena de procesamiento de los datos hiperespectrales, que servirá de algún modo para unificar las clases predominantes en una determinada zona o región de la imagen, produciendo un mapa temático mas claramente diferenciado. La lógica que emplea este programa es bastante simple: para cada pixel de la imagen clasificada, se crea una ventana considerando los pixels vecinos (Figura 3.10). A continuación se construye un vector donde cada elemento es el porcentaje de pixels de cada clase en dicha ventana, y finalmente asigna la clase con mayor porcentaje a dicho pixel.
Figura 3. 10: Representación gráfica del método de post-procesado considerado
En la figura 3.10 se muestra un ejemplo de post-procesamiento aplicando una ventana cuadrada de 3x3. En este caso el píxel correspondiente al centro de la ventana, cambiara su valor asociado por aquel que sea mayoritario dentro de su vecindad (pasará de la clase 3 a la clase 2). Para elegir el mejor tamaño de ventana se realizaron diversas pruebas variando este valor hasta conseguir aquel que producía mejores resultados en cuanto a porcentaje de acierto o precisión en comparación con la verdad-terreno.
Para concluir este apartado, es importante destacar que, cuando todas las cadenas de procesamiento han sido testeadas, hemos probado también un “método combinado”. Éste sencillo método toma como entrada los mapas temáticos finales obtenidos para cada una de las cadenas de procesamiento anteriormente realizadas, de las cuales hablaremos en el siguiente capítulo, y asigna una etiqueta para cada píxel de la imagen utilizando un proceso de la etiqueta mayoritaria o majority voting utilizado ampliamente en la literatura [75]. En este sentido, la etiqueta final asignada a cada píxel consiste en la etiqueta mayoritaria en cada caso tras comparar los resultados obtenidos para cada imagen final clasificada de cada cadena de procesamiento, para dicho píxel en concreto. Se pretende integrar o fusionar los resultados obtenidos por las diferentes cadenas probadas, tiene la ventaja de ser muy rápido y sencillo ya que únicamente trabaja con los mapas temáticos y no con la información contenida en la imagen original, la cual ya ha sido caracterizada de distintas formas mediante las diferentes cadenas de procesamiento aplicadas.
4. Cadenas de procesamiento
En los últimos años la tecnología de la teledetección hiperespectral ha avanzado velozmente proporcionando datos con muy alta fidelidad espectral en comparación con los sistemas multiespectrales. Mientras que estos sensores facilitan la identificación y clasificación, la alta dimensionalidad y volumen de los datos aumenta en ancho de banda de la transmisión y la complejidad computacional del análisis. Además, nos encontramos con una gran cantidad de redundancia en los datos hiperespectrales debido a la gran correlación entre las bandas adyacentes. Con el fin de hacer una clasificación óptima y minimizar el tiempo computacional, es necesario encontrar un método para reducir la dimensionalidad de los datos, y al mismo tiempo, mantener las características espectrales más claras y necesarias para clasificar los datos.
La cadena de procesamiento más general puede ser descrita con un pequeño grupo de macro-bloques elaborados. De hecho, después de la corrección del proveedor (calibración radiométrica, corrección geométrica, corrección atmosférica, etc.) la información relevante ya puede ser extraída de los datos hiperespectrales. Comenzando por los datos de entrada corregidos, tres pasos principales pueden ser descritos en el procesamiento: transformación y extracción de características, selección de características y clasificación. Ésta es la descripción mas general posible, pero cada bloque puede ser obtenido de diferentes maneras. Por ejemplo, extracción de características puede estar formado por un análisis espectral (la media, la varianza, áreas, picos, y valles en las firmas espectrales), transformación espectral (PCA, MNF, DBFE, DAFE, etc), elaboración espacial (texturas...) o análisis multi-escala (diferentes perfiles morfológicos). El bloque de selección de características proporciona las mejores combinaciones de bandas y/o características para un determinado problema. La combinación de éstas características es compleja, así, algoritmos rápidos y eficientes son necesarios para realizarlo. Por último, el paso de la clasificación produce un resultado de alto nivel listo para interpretación del usuario.
En éste trabajo, extracción de características viene implementado de dos formas distintas para reducir las dimensiones de los datos: PCA o análisis de componentes principales y MNF o fracción mínima de ruido. Además, la elaboración de texturas y contextos morfológicos han sido incluidos en alguna cadena para obtener buenos resultados a partir de información espacial también. El paso de selección de
característica aparece implementado mediante un análisis del índice de separación, el cuál, permite un procedimiento eficiente y selectivo para elegir los mejores subconjuntos, partiendo de los datos de grandes dimensiones. Cada cadena contiene un bloque de clasificación que es realizado por el algoritmo de reconocimiento de patrones supervisado llamado máquina de vectores de soporte o SVM.
En éste capítulo, presentamos todas las posibles combinaciones de cadenas seleccionadas para la experimentación. El motivo de la elección de las cadenas de procesamiento que veremos a continuación se fundamenta en estudios previos, tales como los desarrollados en el marco del proyecto HYPER-I-NET [1]. Dichas cadenas demostraron buen rendimiento a nivel de porcentaje de precisión en la clasificación con respecto a otras. Sin embargo, no deja de haber un mundo de posibilidades pudiendo sustituir, adicionar, o quitar un bloque de la cadena, o investigar sobre nuevas técnicas siempre con el fin de obtener buenos resultados a la hora de caracterizar la imagen. Basándonos en experimentos anteriores realizados con distintos tipos de imágenes o conjuntos de datos (urbanos, de vegetación) y utilizando distintos porcentajes de conjuntos de entrenamiento, se han considerado las cadenas que se describen a continuación.
4.1. Cadena de procesamiento #1
Esta primera cadena se caracteriza por contener en la parte de pre-procesado de la imagen solo el bloque de Selección de características a partir de la imagen original proporcionada. En términos de implementación, la cadena tiene como parámetros de entrada: la imagen hiperespectral original con todo el contenido de sus bandas y un archivo de bitmap que contiene el conjunto de entrenamiento (como puede verse en la figura 4.1). Otros parámetros a fijar serán, el tamaño final elegido para la imagen resultante después de la selección, es decir, el número de bandas final; y por otra parte, el criterio de selección o índice de separatibilidad elegido.
El bloque FS por tanto, partiendo de la imagen original formada por decenas o cientos de bandas espectrales, seleccionará un subconjunto de aquellas que proporcionen información de mayor utilidad en la tarea de distinguir o etiquetar los
pixels (clasificar), siguiendo un determinado criterio o índice de separabilidad de
identificar el conjunto mas adecuado. Ya que en experimentaciones previas se observó una buena actuación por parte de los índices de Distancia de Jeffries-Matsushita y el de Divergencia Transformada [56], fue éste último el elegido para todos los casos en los que se hace uso del algoritmo de selección de características. Una vez obtenido el subconjunto de características del bloque FS, se procede a la Clasificación de los pixels, mediante el algoritmo SVM, de reconocimiento de patrones a partir del archivo de imagen que contiene el conjunto de entrenamiento. Este paso producirá un mapa temático o imagen clasificada con cada píxel asignado a una determinada clase y etiquetado con el color correspondiente a ésta. Por último, utilizando un adecuado tamaño de ventana, se unifican los conjuntos de píxels cercanos en espacio formando regiones más o menos extensas donde todos los píxels pertenecen a una clase determinada. Éste último paso de post-procesado, posterior a la clasificación servirá para obtener una precisión de acierto en la clasificación más alta en comparación con el fichero de verdad-terreno. Los dos últimos pasos son coincidentes en todas las cadenas, así que en los próximos apartados donde se explican el resto de cadenas de procesamiento es posible que se obvie desarrollar estos dos bloques.
Imagen hiperespectral original
Selección de características Clasificador SVM Post-procesado ARTMAP Conjunto de entrenamiento Verdad- Terreno Resultados de precisión y Matriz Confusión (imagen clasificada) Resultados de precisión y Matriz Confusión (imagen post-procesada) Subconjunt o de bandas Mapa temático
4.2. Cadena de procesamiento #2
La elegida como cadena numero dos, tiene como paso previo a la clasificación una transformación PCA o de análisis de componentes principales a partir de los datos de entrada originales. Recordamos que PCA se trata de un proceso de transformación y/o reducción de la dimensionalidad de la imagen original. Los datos de entrada son sometidos un pre-procesado en el cual se busca obtener la información con menor correlación y redundancia de la imagen y agruparlo mediante combinaciones lineales en un subconjunto de bandas. De tal manera que al aplicar PCA sobre los datos, la primera banda resultante contendrá la mayor parte de la información relevante o mayor varianza, será la primera componente principal. La segunda banda, contendrá un porcentaje también alto de varianza, pero será mejor que la primera, y mayor que la siguiente o tercera, y así sucesivamente.
Imagen hiperespectral original
Clasificador SVM Post-procesado ARTMAP Conjunto de entrenamiento Verdad- Terreno Resultados de precisión y Matriz Confusión (imagen clasificada) Resultados de precisión y Matriz Confusión (imagen post-procesada) Bandas PCA Mapa temático PCA
Figura 4. 2: Esquema de los pasos realizados en la cadena de procesamiento #2
La función principal de este pre-procesado es eliminar la redundancia facilitando la clasificación de la imagen. El algoritmo de clasificación utilizado, siempre SVM, procederá a caracterizar la imagen, asignando una clase de terreno a cada uno de los
pixels de la nueva imagen PCA, para dar como resultado un mapa temático. SVM se
basará en un archivo de conjunto de entrenamiento con algunos pixels de ejemplo para realizarlo. Por último, el post-procesado de la imagen que ayudará a obtener un mayor
porcentaje de precisión en el proceso de clasificado, comparando con la verdad-terreno. Esta cadena de procesamiento aparece ilustrada de forma gráfica en la figura 4.2.
4.3. Cadena de procesamiento #3
La cadena numero 3 realiza un pre-procesado partiendo de los datos de entrada que consiste en aplicar la operación de reducción de dimensionalidad llamada Fracción Mínima de Ruido (siglas en inglés MNF). Esta operación es básicamente una transformación PCA, pero mejorada, ya que como su propio nombre indica obtenemos un subconjunto de bandas, con una mejor relación de señal ruido, por lo tanto, imágenes o bandas más nítidas y robustas. De ahí que los resultados proporcionados por este bloque sean mas precisos en cuanto a clasificación se refiere.
Imagen hiperespectral original
Clasificador SVM Post-procesado ARTMAP Conjunto de entrenamiento Verdad- Terreno Resultados de precisión y Matriz Confusión (imagen clasificada) Resultados de precisión y Matriz Confusión (imagen post-procesada) Bandas MNF Mapa temático MNF
Figura 4. 3: Esquema de los pasos realizados en la cadena de procesamiento #3
Se prueban entonces diferentes conjuntos de bandas MNF como entrada para la clasificación, y una vez obtenido el mapa temático en cada caso se aplica el post- procesado utilizando distintos tamaños de ventana hasta encontrar aquél que mejor se adapta produciendo los resultados mas precisos, comparando con la verdad terreno. La cadena de procesamiento 3 (ver figura 4.3) constituye por tanto un módulo similar al empleado en la cadena de procesamiento 2, puesto que dichas cadenas únicamente se diferencian en el módulo aplicado para llevar a cabo la reducción dimensional. Sin embargo, como observaremos a la hora de analizar los resultados experimentales, dicho
módulo de pre-procesado puede tener una influencia crucial en los resultados de clasificación proporcionados por el método SVM.
4.4. Cadena de procesamiento #4
La cadena 4 o cadena de procesamiento de análisis de texturas parte de los datos de entrada y produce un pequeño subconjunto de bandas mediante la transformación MNF, que como ya hemos visto, es una de las operaciones de reducción mas precisas. A partir de ese pequeños subconjunto de características extraeremos una serie de bandas de textura para cada banda MNF, mas concretamente, un total de 18 imágenes cada una con una operación de análisis de textura distinta, según las fórmulas vistas en el correspondiente capítulo y apartado. Dada la gran dimensionalidad de los datos resultantes, ya que si por ejemplo, decidimos obtener un total de 4 bandas MNF de los datos originales, el total de texturas obtenidas será de 4 x 18 = 72.
Imagen hiperespectral original
Clasificador SVM Post-procesado ARTMAP Conjunto de entrenamiento Verdad- Terreno Resultados de precisión y Matriz Confusión (imagen clasificada) Resultados de precisión y Matriz Confusión (imagen post-procesada) MNF
Selección de caracterís ticas Análisis de Texturas
Bandas de Textura Bandas MNF
Bandas Textura + MNF(externas)
Mapa temático
Por tanto, aplicados los dos bloques de procesamiento mencionados, volvemos a hacer uso del bloque de Selección de características para elegir aquellas que sean mas relevantes, en cuanto a características de texturas se refiere. Una vez seleccionadas un conjunto de bandas de texturas conveniente, se procede a realizar una operación que viene omitida como bloque en la cadena de procesamiento, ya que no es una operación que modifique los datos propiamente. Se realiza una adición de un determinado número de características MNF con el subconjunto de características de textura. De esta manera, la imagen que dará paso a la clasificación estará formada por datos tanto espectrales, como espaciales. Aplicando el algoritmo SVM de clasificación se obtendrá un mapa de clases que mas tarde se verá post-procesado mediante el algoritmo de ARTMAP. La cadena de procesamiento 4 aparece ilustrada de forma gráfica en la figura 4.4.