Universidad de Extremadura
Departamento de Informática
TESIS DOCTORAL
Proposición, Validación y Prueba de una
Metodología Morfológica para el Análisis de
Datos Hiperespectrales que Integra Información
Espacial y Espectral
Doctorando: ANTONIO PLAZA MIGUEL
A mis padres, Antonio y Mª Josefa,
y a mis hermanos, Javier y Carlos.
En los últimos años, la evolución en los sensores hiperespectrales ha supuesto un salto cualitativo en las aplicaciones orientadas a la observación remota de la tierra. Estos instrumentos se caracterizan por su capacidad para medir la radiación reflejada en una amplia gama de longitudes de onda, pudiendo registrar información en cientos de canales espectrales.
Las técnicas de desmezclado espectral o spectral unmixing son, en la actualidad, las más ampliamente aceptadas a la hora de llevar a cabo el análisis y clasificación de imágenes hiperespectrales. Estas técnicas suelen consistir en dos pasos claramente diferenciados: en primer lugar, se identifican firmas espectrales asociadas a componentes espectralmente puros en la imagen, denominados endmembers. A continuación, el resto de componentes de la imagen se expresan mediante combinaciones de endmembers, evitando así el habitual problema de la mezcla espectral y permitiendo un análisis sub-pixel de los datos.
A pesar de la fuerte interrelación entre la información espacial y espectral que reside en las imágenes hiperespectrales, la mayor parte de las técnicas de desmezclado tienden a considerar únicamente la información espectral, descartando la correlación espacial entre los pixels de la imagen. En la actualidad, la importancia de analizar de forma simultánea los patrones espaciales y espectrales de la información hiperespectral ha sido reconocida por gran cantidad de investigadores como un objetivo deseable, que puede mejorar los resultados obtenidos por las técnicas existentes de análisis hiperespectral.
En esta memoria, presentamos un nuevo método automático para el análisis y clasificación de imágenes hiperespectrales que considera la información espacial y espectral de forma combinada. El método se basa en conceptos de morfología matemática, una técnica clásica de análisis de imágenes que ha sido extendida al caso de imágenes multi-dimensionales.
La evaluación del método con imágenes hiperespectrales simuladas revela que las operaciones morfológicas extendidas pueden ser utilizadas para extraer endmembers a partir de los objetos presentes en la escena. El ajuste de las propiedades espaciales de las operaciones morfológicas permite adaptar el método a aplicaciones muy diversas, siendo su funcionamiento muy robusto en presencia de ruido. Por otra parte, los experimentos realizados con imágenes reales demuestran que el método proporciona resultados superiores a los obtenidos utilizando algunas técnicas estándar de análisis hiperespectral.
Con objeto de facilitar el análisis de imágenes hiperespectrales de gran dimensionalidad de forma rápida y precisa, en esta memoria se proponen dos arquitecturas VLSI, basadas en arrays de sistólicos, para soportar las operaciones morfológicas extendidas realizadas por el método propuesto.
Imaging spectroscopy, also known as hyperspectral remote sensing, allows a sensor on a moving platform to gather reflected radiation from a ground target so that a detector system can record a great deal (up to hundreds) of spectral channels simultaneously. With such detail, the ability to detect and identify individual materials or classes is greatly improved.
During the last several years, a great deal of new airborne and spaceborne sensors have been improved for hyperspectral remote sensing applications. Although the development of effective devices with new and improved technical capabilities stands out, the evolution in the design of algorithms for data processing has not been as positive.
Spectral unmixing is widely accepted as one of the most important approaches for the analysis and classification of hyperspectral datasets. This approach involves two steps: the first one is to find spectrally-unique signatures of pure ground components, usually referred to as endmembers, and the second stage is to express individual pixels as combinations of endmembers.
Despite the inherent spatial-spectral duality that resides in a multi-dimensional data cube, most available processing techniques tend to focus exclusively on the spectral domain, handling the data not as an image but as an unordered listing of spectral measurements. The importance of analyzing spatial and spectral patterns simultaneously has been identified as a desired goal by many scientists who are devoted to multi-dimensional data analysis.
In this work, we present a novel automated method for the analysis and classification of hyperspectral data that integrates both spatial and spectral responses in simultaneous manner. The method is based on mathematical morphology, a classic non-linear spatial processing technique that provides a remarkable framework to achieve the desired integration.
Results with simulated hyperspectral data reveal that the method can accurately model the spatial distribution of spectral patterns in the scene by extended morphological operations. The spatial properties (size and shape) of the kernel allow tuning of the method for different applications. Also, the method is robust in the presence of noise and non-linear mixture effects. On other hand, experiments with real hyperspectral data show that the proposed method produces results which can improve those found using other widely accepted hyperspectral methodologies.
Two different VLSI implementations, based on systolic arrays, are proposed to support the morphological operations performed by the proposed approach, allowing fast and accurate analysis of hyperspectral scenes with large dimensionality.
Capítulo
1.
Motivaciones
y
objetivos.
1 1.1. Motivaciones. 2 1.2. Objetivos. 3Capítulo
2.
Antecedentes.
7 2.1. Medida de la radiación. 8 2.2. Técnicas espaciales. 13
2.2.1. Convolución espacial y morfología matemática. 14
2.2.2. Umbralización. 26
2.2.3. Crecimiento de regiones. 29
2.3. Técnicas espectrales. 33
2.3.1. Sensores hiperespectrales. 34
2.3.2. Técnicas de análisis hiperespectral. 44 2.3.2.1. Algoritmos de clasificación de pixels. 52 2.3.2.2. Algoritmos de estimación de abundancias. 62 2.4. Técnicas que combinan información espacial y espectral. 93 2.4.1. Procesamiento espectral seguido de procesamiento espacial. 95 2.4.2. Procesamiento espacial seguido de procesamiento espectral. 97
Capítulo 3. Métodos.
993.1. Primeros intentos. 100
3.1.1. Técnicas que solamente consideran el dominio espectral. 102 3.1.2. Técnicas que utilizan información espacial y espectral. 108
3.2. Metodología propuesta. 114
3.2.2. Algoritmo AMEE. 124 3.2.2.1. Aplicación de operadores morfológicos extendidos. 126 3.2.2.2. Identificación automática de pixels puros. 145 3.2.2.3. Crecimiento de regiones adaptativo. 146 3.2.2.4. Eliminación de endmembers redundantes. 148 3.2.2.5. Identificación de endmembers y estimación de abundancias. 150
Capítulo 4. Análisis y discusión de resultados.
1534.1. Metodología de análisis y discusión de resultados. 154 4.1.1. Metodología de análisis de imágenes sintéticas. 156 4.1.2. Metodología de análisis de imágenes reales. 160
4.2. Análisis de imágenes sintéticas. 162
4.2.1. Proceso de generación de imágenes sintéticas. 156 4.2.1.1. Selección de firmas espectrales. 163
4.2.1.2. Asignación de abundancias. 164
4.2.1.3. Simulación de ruido. 166
4.2.2. Imágenes sintéticas utilizadas en el estudio. 168 4.2.3. Experimentos realizados con imágenes sintéticas. 172 4.2.3.1. Primer experimento: detección de pixels puros y mezcla. 163 4.2.3.2. Segundo experimento: identificación de endmembers. 182 4.2.3.3. Tercer experimento: estimación de abundancias. 194 4.2.3.4. Cuarto experimento: detección de objetos. 194
4.3. Análisis de imágenes reales. 212
4.3.1. Imágenes utilizadas y características. 212
4.3.1.1. AVCUP95. 213
4.3.1.2. AVIP92. 216
4.3.1.3. CASI01. 217
4.3.1.6. RSCA01. 223 4.3.2. Experimentos realizados con imágenes reales. 225
4.3.2.1. Primer experimento. Firmas espectrales verdad terreno. 227 4.3.2.2. Segundo experimento. Mapas temáticos verdad terreno. 235 4.3.2.3. Tercer experimento. Mapas de abundancia verdad terreno. 240 4.3.2.4. Cuarto experimento. Valores de abundancia verdad terreno. 248 4.3.2.5. Quinto experimento. Verdad terreno no disponible. 259 4.3.2.6. Sexto experimento. Vuelos a diferentes alturas. 259
Capítulo 5. Propuesta de arquitecturas.
2795.1. Metodología de diseño. 280
5.1.1. Del algoritmo secuencial al grafo de dependencias. 281 5.1.2. Del grafo de dependencias al algoritmo sistólico. 285
5.2. Primera arquitectura (A1). 286
5.3. Segunda arquitectura (A2). 293
5.4. Estudio comparativo. 299
Capítulo 6. Principales aportaciones y conclusiones.
303Capítulo 7. Líneas futuras.
307Capítulo 1
Motivaciones y Objetivos
1.1. Motivaciones
El trabajo objeto de la presente memoria consiste en la obtención de un método de análisis hiperespectral robusto que utiliza de forma conjunta los dominios espacial y espectral, permitiendo realizar el análisis de forma no supervisada y totalmente automática.
El trabajo desarrollado se enmarca dentro de las líneas de investigación actuales del Grupo de Redes Neuronales y Procesamiento de Señal (GRNPS) del Departamento de Informática de la Universidad de Extremadura. En sus inicios, la investigación realizada en el GRNPS estaba orientada al desarrollo de algoritmos de computación neuronal para la cuantificación de espectros. Esta línea de investigación fue pronto extendida al caso de imágenes hiperespectrales obtenidas de forma remota.
Las imágenes hiperespectrales suponen una extensión del concepto de imagen digital, en el sentido de que sus pixels no están formados por un único valor discreto, sino por un conjunto amplio de valores correspondientes a las diferentes mediciones espectrales realizadas por un sensor o instrumento de medida en diferentes longitudes de onda. Estas imágenes se caracterizan porque pueden ser analizadas desde dos puntos de vista diferentes: el espacial y el
espectral. Así, los datos hiperespectrales pueden ser entendidos al mismo tiempo como un conjunto de medidas espectroscópicas y como una colección de imágenes.
A pesar de esta dualidad presente en la información hiperespectral, las técnicas clásicas de análisis, incluyendo las anteriormente desarrolladas en nuestro grupo, se han basado, fundamentalmente, en propiedades espectrales, descartando por completo la información relacionada con la correlación espacial. De este modo, las técnicas mencionadas no procesan los datos hiperespectrales como imágenes, sino como colecciones de medidas espectrales cuya ordenación y/o disposición no resulta relevante en el proceso de análisis.
La comunidad científica dedicada al análisis de datos hiperespectrales ha identificado la necesidad de incorporar la representación pictórica de los datos a la hora de abordar su procesamiento. En la literatura, existen algunas aproximaciones al análisis hiperespectral basadas en la utilización de técnicas espaciales para refinar el resultado de un procesamiento en el dominio espectral, normalmente realizado de forma supervisada. De forma similar, existen algunas técnicas que refinan, mediante aproximaciones espectrales, los resultados obtenidos a partir de un procesamiento previo en el dominio espacial. El orden en que se realizan los dos tipos de procesamiento condiciona los resultados obtenidos.
La utilización conjunta de los dominios espacial y espectral de forma no supervisada supone una novedad en el marco de las tecnologías disponibles para el análisis de datos hiperespectrales. Este hecho nos ha llevado a considerar la posibilidad de utilizar, de forma conjunta, la información espacial y espectral en el proceso de análisis.
En este trabajo, intentamos solventar el vacío existente en cuanto a la aplicación de técnicas de análisis de imagen a datos hiperespectrales, mediante el desarrollo de un nexo de unión entre técnicas clásicas en el dominio espacial y técnicas de análisis espectral. De esta forma, la presente memoria puede entenderse como un compendio de varias discusiones sobre las ventajas obtenidas al incorporar información espacial en el análisis de datos de gran dimensionalidad espectral.
Por último, conviene destacar que uno de los aspectos que han condicionado en mayor medida las metodologías propuestas en esta memoria es la posibilidad de obtener técnicas de análisis computacionalmente eficientes. Las imágenes hiperespectrales se caracterizan por requerimientos extremos en cuanto a espacio de almacenamiento, ancho de banda de transmisión y velocidad de procesamiento. Estos requerimientos deben traducirse en algoritmos de análisis susceptibles de ser ejecutados en paralelo. Los algoritmos hiperespectrales son altamente susceptibles de ser paralelizados, debido a sus escasas restricciones secuenciales. En este sentido, una de las posibilidades más interesantes es la obtención de técnicas de procesamiento y compresión a bordo, implementadas mediante mecanismos hardware y
capaces de ofrecer una respuesta en tiempo real. En este trabajo realizamos un primer paso en dicha dirección, mediante la propuesta de arquitecturas sistólicas que soportan los desarrollos realizados.
1.2. Objetivos
Este trabajo pretende desarrollar técnicas de análisis de imágenes hiperespectrales que utilicen de forma simultánea la información espacial y espectral contenida en este tipo de datos. Por tanto, se plantea el siguiente objetivo global: diseñar, implementar y validar un nuevo
método automático, robusto, y eficiente en términos computacionales para el análisis de imágenes hiperespectrales, cuyo funcionamiento considera de forma simultánea la información espacial y espectral.
La consecución de este objetivo general se lleva a cabo abordando una serie de objetivos específicos, los cuales se enumeran a continuación:
Analizar las ventajas e inconvenientes planteados por la integración de información espacial y espectral en el procesamiento de datos hiperespectrales.
Diseñar una metodología cuyo funcionamiento sea automático, es decir:
La interacción entre el usuario y el método debe realizarse exclusivamente mediante un conjunto de parámetros de entrada.
Los resultados proporcionados por el algoritmo deben ser repetibles, es decir, para una misma imagen hiperespectral y para un mismo conjunto de parámetros de entrada, la respuesta de la metodología diseñada debe ser la misma.
Implementar la metodología mediante técnicas algorítmicas, de forma que pueda facilitarse la difusión de la misma a la comunidad científica dedicada al análisis de datos hiperespectrales.
Plantear posibles implementaciones de la metodología mediante técnicas hardware, evaluando las ventajas de esta implementación con respecto a las basadas en técnicas
software.
Estudiar, mediante datos sintéticos, la influencia de los siguientes elementos en el resultado final proporcionado por el método:
Características de los parámetros de entrada utilizados por el algoritmo y su relación con las características de las imágenes analizadas.
Presencia de ruido en los datos a analizar.
Influencia de la corrección atmosférica en los datos analizados. Situaciones de mezcla entre componentes.
Comprobar la viabilidad de aplicar la metodología diseñada en aplicaciones reales, utilizando para ello imágenes obtenidas por una variedad de sensores hiperespectrales. Comparar los resultados obtenidos por la metodología propuesta con los
proporcionados por técnicas estándar de análisis hiperespectral.
Teniendo presentes los anteriores objetivos, procedemos a describir la organización del resto de esta memoria, estructurada en una serie de capítulos cuyos contenidos se describen a continuación.
2.- Antecedentes. En este capítulo introductorio se describe el estado del arte en cuanto a
las técnicas de análisis de datos obtenidos de forma remota y, en particular, en las técnicas de análisis hiperespectral. El capítulo está compuesto por los siguientes bloques:
2.1. Medida de la radiación. Este bloque presenta algunos aspectos introductorios
sobre la forma en que se mide la radiación electromagnética.
2.2. Técnicas espaciales. En este bloque se describen las aproximaciones existentes
al problema desde un punto de vista exclusivamente espacial.
2.3. Técnicas espectrales. En este apartado se realiza una revisión detallada de las
técnicas de análisis de datos obtenidos remotamente mediante aproximaciones basadas en espectroscopía de imágenes
2.4. Técnicas que combinan información espacial y espectral. Por último, se
presenta un bloque con las tendencias existentes en la actualidad en cuanto a la integración de métodos espaciales y espectrales
3.- Metodología. Este capítulo describe propuestas algorítmicas originales para el análisis
hiperespectral. El capítulo se organiza en dos grandes bloques:
3.1. Primeros intentos. En este bloque se detallan los primeros intentos realizados
en cuanto al diseño de metodologías de análisis hiperespectral. Estas primeras experiencias constituyen la base sobre la que se asientan los fundamentos de la metodología desarrollada.
3.2. Metodología propuesta. Este apartado contiene una descripción crítica de la
algorítmicas consideradas, posibles variaciones sobre las mismas y líneas futuras de ampliación.
4. Análisis y discusión de resultados. Para validar la metodología propuesta en el capítulo
anterior, en este capítulo se muestran los resultados obtenidos con datos reales y datos sintéticos. El capítulo se divide en tres grandes bloques:
4.1. Metodología de análisis y discusión de resultados. Este bloque describe, a
modo de sinopsis, la metodología de análisis seguida a la hora de mostrar y discutir los resultados.
4.2. Análisis de imágenes sintéticas. En este apartado se describe una batería de
experimentos realizados con imágenes sintéticas, caracterizadas por simular propiedades del mundo real mediante representaciones simplificadas.
4.3. Análisis de imágenes reales. Por último, este apartado muestra un conjunto de
experimentos realizados con datos reales y una comparativa del método propuesto con respecto a otras aproximaciones existentes en la literatura.
5. Propuesta de arquitecturas. En este capítulo se describen y evalúan posibles
implementaciones eficientes de la metodología propuesta, utilizando arrays de sistólicos. El capítulo está estructrurado en cuatro grandes bloques.
5.1. Metodología de diseño. Este apartado describe la metodología de diseño
utilizada, a partir de la cual se desarrollan las dos aproximaciones propuestas.
5.2. Primera arquitectura. Esta sección contiene una descripción funcional de la
arquitectura sistólica denominada A1.
5.3. Segunda arquitectura. En este apartado se describe una arquitectura sistólica
alternativa denominada A2.
5.4. Estudio comparativo. Finalmente, este apartado contiene una comparativa
entre las arquitecturas paralelas A1 y A2, y la arquitectura serie correspondiente.
6. Principales aportaciones y conclusiones. Este capítulo está dedicado a resumir las
principales aportaciones realizadas por la presente memoria y a mostrar las conclusiones derivadas.
7. Líneas futuras. Por último, este capítulo sugiere un conjunto de líneas de trabajo que
pueden ser abordadas en futuros trabajos.
Capítulo 2
Antecedentes
La disponibilidad de información digital acerca de la superficie terrestre, obtenida de forma remota a partir de satélites o plataformas aerotransportadas, ha supuesto una auténtica revolución en nuestra concepción actual del mundo. Esta observación remota de la tierra constituye el marco de estudio de la teledetección, traducción latina del término inglés remote
sensing, que surgió a principios de los años 50 para designar cualquier medio de observación
remota, si bien se aplicó fundamentalmente a la fotografía aérea, principal sensor de aquel momento (Chuvieco, 1999). En 1957, el lanzamiento del Sputnik, el primer satélite construido por el hombre, supuso el comienzo de la era espacial y, al mismo tiempo, el inicio de una larga andadura para la disciplina hoy conocida como teledetección (Short y col., 2002).
No obstante, la llegada de la era dorada de la teledetección tuvo que esperar hasta que confluyeron una serie de circunstancias bien diferenciadas. En primer lugar, el desarrollo del computador digital permitió optimizar los mecanismos de almacenamiento, procesamiento y transmisión de los datos proporcionados por dispositivos remotos. En segundo lugar, el desarrollo de las técnicas de reconocimiento de patrones, propiciado en parte por la creciente capacidad de cómputo de los computadores digitales, ha supuesto que, en la actualidad, la extracción de información significativa y relevante a partir de los datos de observación remota sea una tarea simple y cada vez más automatizada (Landgrebe, 2002). Finalmente, no podemos olvidar otras circunstancias clave como el desarrollo tecnológico en los instrumentos de medida y en las técnicas de aerotransporte y navegación espacial.
Históricamente, las técnicas de análisis de datos obtenidos de forma remota han seguido una serie de etapas marcadas por la evolución en los instrumentos de observación remota (Short y col., 2002). En etapas tempranas, los medios de observación remota se caracterizaban por estar montados sobre plataformas exclusivamente espaciales, por lo que las técnicas de análisis derivadas se basaron en enfoques fundamentalmente espaciales. Posteriormente, la disponibilidad de instrumentos capaces de medir singularidades en el espectro de la luz reflejada por los diferentes materiales presentes en el mundo real trajo como consecuencia la introducción de técnicas basadas en espectroscopía.
En la actualidad, existen instrumentos que permiten un enfoque integrado en el que se considera tanto la información espacial como la espectral (Landgrebe, 2002). El trabajo descrito en esta memoria se engloba dentro de esta última categoría.
En el presente capítulo describimos los antecedentes de las técnicas de análisis características de cada uno los enfoques anteriormente mencionados. El capítulo está estructurado de la siguiente forma:
1.- En primer lugar, destacamos algunos aspectos introductorios sobre el proceso de
observación remota y la forma en que se mide la radiación electromagnética.
2.- Seguidamente, describimos las técnicas de análisis que más interesan en el dominio
espacial.
3.- A continuación, realizamos una revisión detallada de las técnicas de análisis de datos
obtenidos remotamente mediante aproximaciones basadas en espectroscopía de imágenes.
4.- Finalmente, a título de presentación del trabajo propuesto en esta memoria,
analizamos las tendencias existentes en lo referente a integración de métodos espaciales y espectrales.
2.1. Medida de la radiación
La observación remota de un determinado objeto está basada en la captación, por parte de un instrumento de medida o sensor, de la radiación electromagnética proveniente de la interacción entre el objeto y la fuente de la radiación. La radiación electromagnética recibe varios nombres dependiendo de la longitud de onda que la caracteriza, como puede apreciarse en la figura 2.1.1.
Para medir la radiación emitida o reflejada por una determinada superficie es preciso cuantificar la cantidad de flujo energético que procede de la misma. Por tanto, es necesario
disponer de una serie de unidades de medida basadas en el denominado flujo radiante (), que se define como la cantidad de energía emitida por una fuente de radiación, en todas las direcciones, por unidad de tiempo. Para analizar el flujo energético en una determinada dirección, se utiliza el flujo energético por ángulo sólido ().
Visible 10-7 10-5 10-3 10 103 105 103 Longitud de onda (m) Ultravioleta Infrarrojo Microondas Radar Rayos X Rayos 10-1 0.4 m 0.7 m
Figura 2.1.1. El espectro electromagnético.
La intensidad radiante se define como el flujo radiante por unidad de ángulo sólido, y viene dada por la expresión que se muestra a continuación:
I (2.1.1)
Esta magnitud se mide en Watios por estéreo-radián (W/sr). No obstante, la magnitud física que está directamente relacionada con nuestra percepción del brillo es la reflectividad, R, que se define como el flujo irradiado por unidad de superficie proyectada (Sp) y ángulo sólido en una
determinada dirección . La radiancia se mide en Watios por metro cuadrado y estéreo-radián (W/m2sr).
p
A I
El flujo incidente i interactúa con una superficie S, de forma que una parte del flujo es
reflejada (r), otra es absorbida por la propia superficie (a) y, finalmente, una tercera parte (t)
es transmitida a las capas inferiores (Short y col., 2002). La relación entre el flujo reflejado y el flujo incidente es la magnitud relativa conocida como reflectancia, .
i r (2.1.3)
La radiancia detectada en el sensor dependerá por tanto de la reflectancia, del flujo incidente, de la superficie, del ángulo de observación y del ángulo sólido. Además, la radiancia detectada por el sensor es también dependiente de la geometría de la observación y, en particular, del ángulo formado por la normal a la superficie con la radiación incidente (ángulo de incidencia ) y del ángulo formado por el haz detectado por el sensor con la normal a la superficie (ángulo de reflexión, ). Estas magnitudes aparecen descritas en la figura 2.1.2.
Sp Fuente radiación Detector
t Capas inferiores
i
r
a Normal Ángulo incidencia Ángulo reflexión SuperficieFigura 2.1.2. Flujo incidente (i), flujo reflejado (r), flujo absorbido (a) y flujo transmitido (t).
Existen dos comportamientos posibles para la superficie observada (denominada también como "cubierta") respecto de la geometría de la observación:
1.- Por un lado, las cubiertas especulares se caracterizan por reflejar la radiación incidente en una dirección cuyo ángulo de reflexión coincide con el ángulo de incidencia (ver parte izquierda de la figura 2.1.3).
2.- Por otra parte, las cubiertas lambertianas se caracterizan por reflejar la radiación incidente de igual forma en todas las direcciones, independientemente de cuál sea el ángulo de incidencia (ver parte derecha de la figura 2.1.3).
Normal Cubierta especular Normal Cubierta lambertiana Ángulo incidencia Ángulo reflexión
Figura 2.1.3. Propiedades de las cubiertas especulares (izquierda) y lambertianas (derecha).
A modo de resumen general de las ideas anteriormente presentadas, podemos definir la radiancia detectada (D) como una función de las siguientes magnitudes:
f , ,S, , ,
D i (2.1.4)
Todas estas magnitudes dependen del intervalo de longitud de onda considerado, y reciben el nombre de magnitudes espectrales. La radiancia medida por el detector o sensor se calcula mediante la siguiente expresión:
hD
r , (2.1.5)
Donde h es una función de transferencia que depende del sensor y D es la radiancia detectada. Como en todo proceso de medida, la señal detectada incluye una componente ruidosa, que será analizada en detalle en el apartado 2.3.1. Además, el proceso de medida puede verse afectado por una serie de imprecisiones adicionales, motivadas por efectos secundarios como los que se enumeran a continuación (Shaw y Manolakis, 2002):
Radiancia adicional medida por el sensor debido a efectos de dispersión de la luz solar, causados por efectos atmosféricos (Sreeka y col., 2002).
Efectos de dispersión múltiple (García-Haro y Sommer, 2002) sobre el material observado, causados por la luz reflejada por otros objetos en la escena.
Efectos de absorción del flujo incidente debidos a la atmósfera.
Variaciones del ángulo de incidencia debidas a la orografía del paisaje.
Estado fenológico de las cubiertas desde el punto de vista ambiental (Key y col., 2001).
La figura 2.1.4 ilustra de forma gráfica algunas de las fuentes de error comentadas, mediante un diagrama representativo del proceso de medición de la radiación en circunstancias reales.
Dispersión múltiple Sombras
Absorción y dispersión Radiancia
adicional
Figura 2.1.4. Proceso de medida de la radiación en un entorno real.
FOV
IFOV
GIFOV
Alturavuelo
La resolución espacial de un sensor se refiere a la capacidad del mismo para obtener información acerca de los detalles espaciales de la escena (Chuvieco, 1999). En los sensores opto-electrónicos, se utiliza el concepto de campo de visión instantáneo o instantaneous field of view (IFOV), definido como la sección angular en mrad observada por el sensor en un determinado momento (Small, 2002). También se suele utilizar la distancia sobre el terreno que corresponde a ese ángulo o ground instantaneous field of view (GIFOV), el cual tiene en cuenta la altura de vuelo y la velocidad de exploración del sensor. Estos conceptos aparecen ilustrados en la figura 2.1.5.
En el siguiente apartado destacamos las técnicas de análisis que se basan en la información espacial anteriormente introducida.
2.2. Técnicas espaciales
La teledetección espacial se plantea desde el punto de vista del análisis e interpretación de una o varias imágenes digitales. Por tanto, las técnicas de análisis de este tipo de datos toman su base en el procesado digital de imágenes (Haralick y Shapiro, 1992).
A pesar de que las técnicas espaciales permiten obtener información sobre áreas muy extensas a bajo coste, el uso de un enfoque estrictamente espacial no está exento de algunas limitaciones prácticas (Landgrebe, 2002). Así, la posibilidad de extraer modelos complejos utilizando exclusivamente información en el dominio espacial puede ser limitada. Este hecho ha propiciado que, en la actualidad, las técnicas espectrales sean las más ampliamente utilizadas a la hora de interpretar los datos terrestres adquiridos de forma remota (Richards y Jia, 1993).
Teniendo en cuenta las anteriores consideraciones, comenzamos el presente apartado realizando una descripción, a modo introductorio, del concepto de imagen digital. A continuación detallamos diferentes técnicas de análisis de imágenes digitales, particularizando en las técnicas más ampliamente utilizadas en las aplicaciones que nos ocupan.
El concepto de imagen digital en teledetección
El proceso de adquisición de una imagen digital por parte de un sensor de observación remota se basa en la exploración secuencial, por parte del sensor, de la superficie terrestre. El sensor adquiere, a intervalos regulares, la radiación que proviene de los objetos sobre él situados. La información recibida está en función de las características de la parcela del terreno que observa el sensor en cada instante, y el tamaño de ésta será una función de la resolución
espacial del sensor (Chuvieco, 1999), tal y como se describió en la figura 2.1.5. Cada una de estas parcelas, que constituyen la unidad mínima de información en la imagen, se denomina
pixel, término que proviene del vocablo picture element (González y Woods, 2002).
El valor asociado a cada pixel viene definido por un valor numérico denominado nivel digital (ND). El nombre se justifica por tratarse de un valor numérico, no visual, pero que puede fácilmente traducirse a una intensidad visual o nivel de gris mediante cualquier convertidor digital-analógico.
Teniendo presentes estas ideas, la organización de los datos obtenidos de forma remota en una imagen digital puede esquematizarse tal y como se describe en la figura 2.2.1. Como vemos, los datos se organizan en una matriz numérica de dos dimensiones que se corresponden con las coordenadas geográficas de la imagen. Las filas de la matriz suelen recibir el nombre de líneas, mientras que las columnas también suelen denominarse muestras. Cada celda de la matriz almacena un único ND.
Líneas Mu es tr as ND del pixel en coordenadas (x,y) Líneas Mu es tr as ND del pixel en coordenadas (x,y)
Figura 2.2.1. Representación de una imagen digital en forma de matriz de datos.
A continuación describimos los antecedentes de algunas técnicas clásicas de análisis de imágenes digitales, insistiendo especialmente en aquellas metodologías directamente relacionadas con el trabajo descrito en la presente memoria.
2.2.1. Convolución espacial y morfología matemática.
Convolución espacial
Una de la técnicas más ampliamente utilizadas en el dominio espacial es el filtrado. Esta técnica se basa en un procesamiento de grupo en el que el ND para el pixel de la imagen
resultante depende del ND del pixel correspondiente en la imagen original y de los ND’s de los
pixels que lo rodean (es decir, se trata de una operación sensible al contexto).
Matemáticamente, un operador de filtrado se puede representar como un operador que, aplicado a la imagen de entrada, I, da lugar a una función de salida O=(I) (Pratt, 1991). De forma conceptual, podemos distinguir entre dos tipos de filtros espaciales: lineales y no lineales. Los filtros lineales se utilizan de forma habitual debido a su simplicidad (Haralick y Shapiro, 1992; Shen, 1996). Cuando el filtrado es lineal e invariante frente a desplazamientos espaciales, el operador se corresponde con la operación de convolución espacial.
I(x,y) Imagen original Kernel de convolución
I
K
O(x,y) Imagen resultanteO
a b c
d e f
g h i
Operación de convolución
1 y , 1 x I 1 y , x I 1 y , 1 x I y , 1 x I y , x I y , 1 x I 1 y , 1 x I 1 y , x I 1 y , 1 x I 9 1 i h g f e d c b a a = K(-1,-1) b= K(0,-1) c= K(1,-1) d= K(-1,0) e= K(0,0) f = K(1,0) g= K(-1,1) h= K(0,1) i = K(1,1)Figura 2.2.2. Operación de convolución sobre una imagen digital.
La figura 2.2.2 muestra un ejemplo que ilustra una operación de convolución sobre una imagen I. Puede apreciarse cómo el ND del pixel I(x,y) en la imagen original y los de sus 8 vecinos se multiplican por los correspondientes coeficientes de convolución definidos en una ventana cuadrada que rodea al pixel. Este tipo de ventanas son características de las técnicas de procesamiento espacial, y aparecen normalmente denominadas como kernels en la literatura (Katkovnik y Shmulevich, 2002). Posteriormente, los resultados obtenidos se suman y el resultado promediado define el valor del pixel O(x,y) en la imagen resultante. El proceso se realiza para cada pixel en la imagen original. El conjunto de coeficientes en la figura 2.2.2 se conoce como kernel de convolución, de forma que dichos coeficientes define los diferentes tipos
de filtros espaciales lineales existentes en la literatura, tales como filtros alta, filtros pasa-baja, filtros de gradiente, filtros de detección de borde, etc. (Ramponi, 1999).
Si suponemos que K denota un kernel de convolución cuadrado de n pixels de alto por n
pixels de ancho, podemos formalizar la operación de convolución espacial antes ilustrada
mediante la siguiente expresión:
n/2 2 / n i 2 / n 2 / n j 2 I(x i,y j) K(i,j) 1 ) y , x ( O n (2.2.1)Como puede apreciarse en la figura 2.2.2, la elección del tamaño de kernel resulta determinante a la hora de realizar el proceso de convolución. A la hora de seleccionar un determinado tamaño de kernel, es preciso analizar en detalle las características espaciales concretas de las formas y objetos de la imagen que se desean caracterizar. Si no se dispone de información previa sobre los rasgos de interés en la imagen, o bien si las características espaciales de los objetos de interés son variables, la utilización de un único tamaño de kernel puede no resultar suficiente para caracterizar la totalidad de los objetos presentes en la imagen.
Una de las técnicas más utilizadas para solventar las limitaciones anteriormente descritas consiste en utilizar un conjunto de kernels de tamaño variable (Burt y Adelson, 1983). En la literatura, esta opción aparece englobada dentro del conjunto de técnicas denominadas descomposición multi-escala de una imagen. Conviene destacar que existen múltiples formas de realizar descomposiciones de este tipo (Gauch y Pizer, 1993; Strickland y Hahn, 1997), aunque, ciertamente, el uso de kernels de tamaño variable es una de las más populares (Bister y col., 1990).
En la figura 2.2.3 se muestra un ejemplo de creación de una descomposición multi-escala sobre una imagen en ND’s, utilizando kernels de tamaño variable. La descomposición consta de un conjunto de niveles, de forma que en diferentes niveles se realiza un tratamiento local alrededor de cada pixel que viene definido por el tamaño de kernel. En este ejemplo, el kernel actúa como una función de vecindad variable alrededor de cada pixel en la imagen original.
Además de las técnicas de filtrado lineal comentadas anteriormente, existen otras cuyo principio de funcionamiento sigue un comportamiento no lineal. Entre estas técnicas destacan las operaciones de morfología matemática (Serra, 1982), que presentan algunas características en común con la operación de convolución, como el uso de kernels. Por su parte, las técnicas morfológicas también han sido utilizadas para construir descomposiciones multi-escala de imágenes en ND’s (Jackway y Deriche, 1996).
Figura 2.2.3. Descomposición multi-escala de una imagen en ND’s.
A pesar de sus excelentes propiedades como técnicas de filtrado (Schavemaker y col., 2000), las técnicas morfológicas se han utilizado principalmente en el terreno de la detección de formas. A continuación, presentamos en detalle los fundamentos de las técnicas morfológicas, destacando sus propiedades en cuando a la identificación de objetos en la imagen.
Morfología matemática
Los conceptos fundamentales del procesamiento morfológico de imágenes tienen su base en los estudios de Matheron, 1975 y Serra, 1982. La matemática morfológica es una teoría para el análisis de estructuras espaciales dentro de una imagen. Su lenguaje es el de la teoría de conjuntos, de forma que los conjuntos en matemática morfológica representan formas, tanto en imágenes binarias como en imágenes en niveles de gris (Serra, 1993; Vincent, 1993). A pesar de que estas técnicas fueron inicialmente diseñadas para trabajar con imágenes binarias (Serra, 1982), no tardaron en ser extendidas a imágenes en ND’s (Sternberg, 1986) y en color (Lambert y Chanussot, 2000). A continuación detallamos cada una de estas aproximaciones.
Morfología binaria.
En morfología binaria, las imágenes se representan según la teoría de conjuntos (Serra, 1982). Si dividimos los pixels de una imagen binaria I en dos conjuntos: objetos y fondo, los
pixels pertenecientes a los objetos formarán parte de un conjunto que denominamos X, mientras
Las dos operaciones básicas de la morfología binaria son la erosión y la dilatación (Serra, 1982). Estas operaciones se basan en la transformación de los objetos de la imagen por medio de un nuevo conjunto K, conocido como elemento estructural, que realiza una función similar a la del kernel utilizado en la operación de convolución espacial. Así, la forma y tamaño del elemento estructural van a determinar las características espaciales de la imagen resultante de la transformación. De este modo, podemos definir la operación de dilatación de un objeto X utilizando un elemento estructural K mediante la siguiente expresión:
K a I :K X
X a (2.2.2)
Donde Ka es el kernel o elemento estructural que rodea al pixel a de la imagen. Es decir, el
resultado de la dilatación de un determinado objeto es una nueva forma, definida por los elementos estructurales que rodean a cada pixel del objeto, tales que su intersección con el objeto inicial es distinta del conjunto vacío.
Por su parte, la erosión de un objeto X utilizando un elemento estructural K puede denotarse como:
a I :K X
K
X a (2.2.3)
De este modo, el resultado de la erosión de un objeto es una nueva forma, definida por los elementos estructurales que rodean a cada pixel del objeto, tales que pueden incluirse de forma completa en el objeto inicial. Conviene destacar que las operaciones de erosión y dilatación son duales y complementarias entre sí (Serra, 1982).
X
K
X
K
b wXK
K
b wX
Figura 2.2.4. Interpretación gráfica de la operación de erosión (izquierda) y dilatación (derecha) de una imagen binaria.
La figura 2.2.4 muestra una interpretación gráfica de las operaciones de erosión y dilatación, aplicadas a un objeto rectangular. Como puede apreciarse en la parte izquierda de la figura, el
resultado de la dilatación es el ensanchamiento espacial del objeto según las propiedades espaciales (forma y tamaño) del elemento estructural. Por el contrario, la erosión (ver parte derecha de la figura) consiste en una operación de contracción (shrinking) del objeto dependiendo de la morfología del elemento estructural utilizado. En el ejemplo descrito en la figura 2.2.4 se ha utilizado como elemento estructural un cuadrado de ancho w. En la práctica, los elementos estructurales más utilizados debido a su simetría y sencillez son, precisamente, estas formas cuadradas (Chen y col., 2002).
Además de la erosión y la dilatación, la morfología matemática dispone de otras operaciones más complejas (Serra, 1993). Así, la apertura morfológica de un objeto X respecto de un elemento estructural K puede definirse de la siguiente forma:
K ) K X ( XK (2.2.4)
De forma similar, definimos la clausura morfológica de un objeto X utilizando un elemento estructural K como: K ) K X ( XK (2.2.5)
Como puede apreciarse en las expresiones (2.2.4) y (2.2.5), la apertura consiste en una operación de erosión seguida de una dilatación. Por su parte, la clausura se obtiene mediante la realización de una dilatación seguida de una erosión. En ambos casos, se recomienda utilizar el mismo elemento estructural en las dos operaciones con el objetivo de no alterar en gran medida el tamaño y forma del objeto original (Van Horebeek y Tapia-Rodríguez, 2001).
La figura 2.2.5 muestra un ejemplo de aplicación de las operaciones morfológicas binarias antes descritas sobre una imagen simple, correspndiente a una ilustración original de Pablo Picasso. La figura muestra el resultado de aplicar las operaciones de erosión, dilatación, apertura y clausura utilizando como elemento estructural un cuadrado de 5x5 pixels.
Una propiedad importante de las operaciones morfológicas binarias es la no linearidad. A continuación, ilustramos esta propiedad mediante un ejemplo. En la figura 2.2.5, la firma del autor de la ilustración, situada en la esquina superior izquierda, es filtrada al aplicar la operación de erosión con el elemento estructural de 5x5 pixels. La operación de apertura consiste en dilatar la imagen resultante de la erosión, utilizando el mismo elemento estructural. Sin embargo, la dilatación no puede recuperar rasgos espaciales eliminados por la erosión. Este es el motivo por el cual la firma del autor no aparece en la imagen resultante de la operación de apertura.
La propiedad de no linearidad condiciona gran parte de la filosofía inherente a la morfología matemática (Saryazdi y col., 2000). Así, el procesamiento de una imagen en términos
morfológicos da como resultado una información que resulta extremadamente rica en cuanto sus propiedades descriptivas respecto de los objetos en el dominio espacial (Serra, 1993).
Dilatación 5x5 Erosión 5x5
Imagen original
Clausura 5x5 Apertura 5x5
Figura 2.2.5. Aplicación de las operaciones de erosión y dilatación sobre una imagen de ejemplo.
Morfología en niveles de gris.
Los conceptos de la morfología binaria han sido extendidos al caso de imágenes en niveles de gris o ND’s (Sternberg, 1986). La idea fundamental de estas operaciones puede expresarse considerando la imagen en ND’s como una función f(x,y), en la que el valor en las coordenadas (x,y) viene dado por el ND en dicho punto. Esta función puede ser también entendida como un relieve sobre el que se desliza un elemento estructural K.
En la figura 2.2.6 se muestra el efecto obtenido al deslizar un elemento estructural sencillo sobre una sección unidimensional del relieve. Si el elemento estructural se desliza por la parte exterior de la función tenemos el caso de la dilatación, mientras que si se desliza por la parte interior de la función tenemos el caso de la erosión. La figura 2.2.6 pone de manifiesto que la variación del tamaño y forma del elemento estructural en operaciones morfológicas es crítica: así, la utilización de un elemento estructural pequeño permite conservar de forma muy aproximada el aspecto de los rasgos de la imagen original, mientras que la utilización de un elemento estructural grande tiende a eliminar los rasgos de la imagen original más pequeños que el elemento estructural. La alteración del tamaño del elemento estructural permite por tanto conservar o eliminar determinadas frecuencias espaciales en la imagen.
max
f(x-1) f(x) f(x+1) k(s)Dilataciones
Erosiones
Dilataciones
Erosiones
f(x s) k(s)
) x )( K f (Max
K s min
f(x s) k(s)
) x )( K f (Min
K s Figura 2.2.6. Interpretación gráfica de las operaciones morfológicas de erosión y dilatación en ND’s.
Una vez introducidos estos conceptos previos, procedemos a definir las operaciones básicas de la morfología matemática en ND’s. La dilatación de una imagen f(x,y) utilizando un elemento estructural K se define de la siguiente forma:
f(x s,y t) k(s, t)
) y , x )( K f (Max
K ) t , s ( (2.2.6)Por otra parte, la erosión de f(x,y) utilizando K se define como:
f(x s,y t) k(s, t)
) y , x )( K f (Min
K ) t , s ( (2.2.7)De forma similar a las operaciones en morfología binaria, la apertura y la clausura de f(x,y) mediante K se definen, respectivamente, de la siguiente forma:
) y , x )( K ) K f (( y) , x ( fK (2.2.8) fK(x,y)((fK)K)(x,y) (2.2.9)
Como puede deducirse a partir de las expresiones (2.2.6) y (2.2.7), las operaciones de dilatación y erosión en ND’s son semejantes a la operación de convolución, descrita en la
expresión (2.2.1). En concreto, las diferencias entre las operaciones de dilatación y erosión sobre imágenes en niveles de grises y la expresión de convolución son las siguientes:
El producto entre los pixels de la imagen y los pixels del kernel es reemplazado por una operación de resta en el caso de la dilatación y una operación de suma en el caso de la erosión.
El doble sumatorio es reemplazado por el cálculo del elemento máximo en el caso de la dilatación y del mínimo en la operación de erosión.
Finalmente, el kernel de convolución suele recibir el nombre de elemento estructural en las operaciones morfológicas.
Por razones ilustrativas, la figura 2.2.7 muestra un sencillo ejemplo de aplicación de las operaciones de erosión y dilatación descritas a una imagen en ND’s muy simple. En el ejemplo, se utiliza un elemento estructural plano, de forma cuadrada y dimensiones 3x3. pixels.
Dilatación
Elemento estructural de tamaño 3x3 alrededor del pixel P
Erosión
Max Min
P
Imagen original
Figura 2.2.7. Ejemplo de aplicación de las operaciones de erosión y dilatación a una imagen en ND’s.
Como puede apreciarse, la operación de erosión consiste en seleccionar el pixel con ND mínimo en una vecindad alrededor del pixel considerado en un momento dado en la imagen original. Este pixel se coloca en una posición equivalente a la del pixel considerado en la imagen original, pero en una imagen nueva que denominamos imagen erosionada. De forma similar, la operación de dilatación selecciona el pixel con ND máximo en la vecindad que rodea al pixel considerado en la imagen original. Este pixel se coloca en la misma posición que el original en
una nueva imagen, denominada imagen dilatada. El efecto de la erosión es reducir las zonas más claras de la imagen, permitiendo el crecimiento de las zonas más oscuras, caracterizadas por un ND bajo. El efecto de la operación de dilatación es el contrario; en este caso, las zonas con ND alto se ensanchan, mientras que las zonas oscuras se encogen.
El proceso de extensión/contracción de objetos se realiza en función de las propiedades espaciales del elemento estructural utilizado. De este modo, si consideramos un elemento estructural en forma de disco con radio igual a L pixels, una operación de dilatación utilizando este elemento estructural hará que los objetos con ND alto se ensanchen en aproximadamente
L/2 pixels en todas las direcciones. Por el contrario, una operación de erosión con el mismo elemento estructural dará como resultado el efecto contrario, es decir, la expansión en todas direcciones de las zonas de la imagen con ND bajo (Baxes, 1994). Este hecho aparece ilustrado en la figura 2.2.8, en la que se ha erosionado y dilatado una sencilla imagen utilizando como elemento estructural un disco de 4 pixels de radio.
Imagen original
Erosión
K
K
Dilatación Disco de 4 pixels de radio
Figura 2.2.8. Erosión y dilatación de una imagen en ND’s utilizando un disco de 4 pixels de radio.
Las operaciones morfológicas ND’s pueden utilizarse para reconocer objetos en la imagen. Esta particularidad aparece ilustrada mediante un ejemplo en la figura 2.2.9, en la que se ha aplicado una serie de operadores de apertura sobre la imagen original mostrada en la figura 2.2.8, utilizando como elementos estructurales discos de radio progresivamente creciente entre 2 y 8 pixels. Como puede apreciarse en la figura, las propiedades espaciales del elemento
estructural utilizado determinan qué objetos son reconocidos. Este sencillo ejemplo pone de manifiesto la importancia del elemento estructural utilizado en operaciones morfológicas (Soille, 2000).
K
K
K
K
Imagen original Apertura morfológicaDisco (radio = 2 pixels) Disco (radio = 4 pixels) Disco (radio = 6 pixels) Disco (radio = 8 pixels)
K
K
K
K
Imagen original Apertura morfológicaDisco (radio = 2 pixels) Disco (radio = 4 pixels) Disco (radio = 6 pixels) Disco (radio = 8 pixels) Figura 2.2.9. Apertura morfológica de la imagen mostrada en la figura 9 utilizando discos de radio igual a 2, 4, 6 y 8 pixels.
Finalmente, destacamos que las operaciones de dilatación y erosión en ND’s pueden aplicarse múltiples veces (de forma recursiva) en cada uno de los operadores de apertura y clausura, acentuando así su efecto sobre los objetos de la imagen original (Wang y col., 1995). El número de operaciones de erosión/dilatación en cada apertura/clausura y el tamaño del elemento estructural determinarán, como es previsible, el área de los objetos resaltados.
Morfología cromática.
La literatura contempla algunos intentos orientados a extender las operaciones morfológicas en ND’s a imágenes en color. Los primeros intentos realizados se conocen, de forma global, como aproximación marginal (Ortiz, 2000), y consisten en tratar cada componente o canal cromático de forma individual, tal y como se muestra en la figura 2.2.10. Evidentemente, este tipo de procesamiento es escalar, y se obtiene directamente a partir de la morfología en ND’s, puesto que cada canal cromático es una imagen en ND’s.
Operación Morfológica Canal R Canal G Canal B Resultado R Resultado G Resultado B Operación Morfológica Operación Morfológica
Figura 2.2.10. Aproximación marginal a la morfología cromática.
La aproximación marginal presenta la ventaja de ser sencilla de implementar (Ortiz, 2000). Sin embargo, su principal inconveniente consiste en que no se trata de una operación morfológica en el sentido estricto, sino de 3 operaciones morfológicas sobre imágenes distintas. Este hecho trae como consecuencia que las operaciones morfológicas que se realizan en una posición (x,y) de la imagen afectan individualmente a cada componente de esa posición, con lo que el pixel resultante puede venir asociado a una combinación de color no existente en la imagen original. Esta problemática aparece ilustrada en la figura 2.2.11 mediante un ejemplo, utilizando una operación de dilatación con un elemento estructural cuadrado de 3x3 pixels.
Figura 2.2.11. Problemática asociada a la aproximación marginal a la morfología cromática.
Para evitar la situación descrita en la figura 2.2.11, Lambert y Chanussot, 2000, proponen analizar los pixels de la imagen utilizando una aproximación vectorial, es decir, considerando los pixels como vectores y no como un conjunto de valores separados (ver figura 2.2.12).
Canal R Canal G Canal B Resultado R Resultado G Resultado B Operación Morfológica
Figura 2.2.12. Aproximación vectorial a la morfología cromática.
El problema que plantea la forma de actuar ilustrada en la figura 2.2.12 es la necesidad de introducir una relación de orden en el espacio de estos datos multivaluados. La función de ordenación, que puede ser parcial (Lambert y Chanussot, 2000), viene dada por la siguiente expresión:
Z :3
P , (2.2.10)
Donde Z3 es el espacio de datos compuesto por los pixels de la imagen en color. La función
P define por tanto un orden parcial, tal y como se muestra en la siguiente expresión:
) ( ) ( , xZ Z ) , (x y 3 3 x yP x P y , (2.2.11)
donde x e y son dos pixels de la imagen original. Es importante destacar que no existe un método universal para ordenar vectores; al contrario, hay numerosas formas de abordar el problema, dependiendo del objetivo que se pretenda alcanzar con la ordenación. Los autores consideran la utilización de los siguientes tipos de ordenación vectorial: canónica, según una componente, por medida de la distancia, lexicográfica y por entrelazado de bits (Lambert y Chanussot, 2000; Ortiz, 2000).
2.2.2. Umbralización.
Las técnicas de detección que se han descrito en el apartado anterior producen como resultado imágenes en las cuales la distinción entre objetos de interés y fondo es notoria. A partir de este resultado, uno de los pasos clave en la visión de bajo nivel es la segmentación o
separación estricta entre objetos y fondo. Este paso no siempre es inmediato, y existen aproximaciones muy diversas en la literatura para llevarlo a cabo (Haralick y Shapiro, 1992).
No obstante, las técnicas de umbralizado (Sahoo y col., 1988) constituyen el enfoque más simple e intuitivo para separar entre objetos de interés y fondo en imágenes en ND. Estas técnicas presuponen que el alto contraste existente entre objetos de interés y fondo en las imágenes obtenidas tras la etapa de detección hace que sea relativamente sencillo encontrar un nivel umbral para establecer la separación. Así, los pixels cuyo ND se encuentra por encima del umbral establecido serán considerados como pertenecientes a objetos de interés, mientras que los pixels con ND por debajo del establecido se consideran como pertenecientes al fondo.
Como puede intuirse, el paso clave en el proceso anteriormente descrito es la elección de un nivel umbral adecuado para realizar el proceso de umbralización, de forma que el porcentaje de acierto al asignar los pixels a las clases sea lo más alto posible (Lee y Chung, 1990). El proceso de selección de este valor puede verse afectado por un cúmulo de circunstancias que, en su mayor parte, van a depender de las características de la aplicación concreta. Este hecho hace que muchas de las técnicas de umbralización sean supervisadas, necesitando una gran cantidad de conocimiento a priori (Haralick y Shapiro, 1985).
Dado que uno de los objetivos del presente trabajo es diseñar una metodología no supervisada para el análisis de datos hiperespectrales, nuestro interés se centra en aquellos esfuerzos en la literatura orientados al diseño de técnicas automáticas, capaces de obtener el valor umbral óptimo en condiciones variables, y en problemas diferentes. Entre estas técnicas destaca el método de Otsu (Otsu, 1979), capaz de seleccionar, de forma automática y no supervisada, un valor umbral óptimo para una imagen en función de la distribución de los ND’s en la misma. En concreto, este método tiene como objetivo fundamental la separación de los
pixels de la imagen en varias categorías o clases dependiendo de una serie de criterios
relacionados con la varianza de los ND’s de los pixels en la imagen.
El método de Otsu puede formalizarse mediante la siguiente notación (Otsu, 1979; Sahoo y col., 1988). Sea L el número de ND’s de la imagen, y sea ni el número de pixels de la imagen en
los que ND . En virtud de lo anterior, podemos expresar el número total de pixels de una i imagen, n, como:
L 1 0 i i n n (2.2.12)Por otra parte, la probabilidad de ocurrencia del nivel digital i, pi, puede expresarse como:
n n
El objetivo del método de Otsu es la obtención de un valor umbral óptimo t capaz de separar el conjunto de ND’s de la imagen, G
0,1,...,L-1
, en dos clases: C0
0,1,..., t
y
t 1, t 1,...,L-1
C1 , correspondientes a fondo y objetos de interés. En lo sucesivo, asumimos que el ND es el más oscuro y que el 0 NDL1 es el más claro. Sea 2
T
la varianza total en G, definida de la siguiente forma:
L 1 0 i i 2 T 2 T i p ,
L 1 0 i i T i p . (2.2.14)Por otra parte, sea 2B la varianza entre las clases C0 y C1, definida de la siguiente forma:
2B 01
10
2, (2.2.15) donde:
t 0 i i 0 p , 1 10, (2.2.16) y: 0 t 0 , 0 t T 1 1 ,
t 0 i i t i p . (2.2.17)El umbral óptimo t, según el método de Otsu, se calcula mediante la siguiente expresión, basada en la selección del valor que maximiza una función dependiente de la varianza total de la imagen y de la varianza en las dos clases resultantes del proceso de umbralizado, utilizando dicho valor umbral:
T2 2 B G t Min _ Arg t (2.2.18)
El método de Otsu ha sido aplicado de forma satisfactoria en numerosas aplicaciones de segmentación (Sahoo y col., 1988), incluyendo algunas relacionadas con imágenes obtenidas de forma remota (Dulyakarn, 1999).
2.2.3. Crecimiento de regiones.
La fase de segmentación descrita en el apartado anterior da como resultado una imagen binaria con dos únicos ND’s, de forma que uno de ellos viene asociado a objetos de interés, mientras que el otro viene asociado a fondo (objetos o zonas no relevantes). Esta separación brusca entre componentes suele traer como consecuencia pequeñas imprecisiones a la hora de establecer de forma exacta el contorno y la distribución espacial de los objetos (Haralick y Shapiro, 1992).
Una de las aproximaciones más utilizadas para solucionar este problema y obtener una descripción exacta del borde de los objetos segmentados es la técnica denominada crecimiento de regiones. Esta aproximación se ha tenido en cuenta en el presente trabajo debido a que puede ser extendida de forma sencilla para incluir información espectral, mediante la utilización de criterios de similaridad en dicho dominio.
La técnica de crecimiento de regiones parte del supuesto de que existe un conjunto de puntos o regiones, denominados “semillas” (Adams y Bischof, 1994), que han sido obtenidos a partir de un método previo, por ejemplo, a partir de un proceso de segmentación. Sean Ri,i1,..,r las regiones semilla a partir de las cuales se inicia el proceso de crecimiento. El funcionamiento del método se basa en la realización de los pasos que a continuación se enumeran.
1.- En primer lugar, se establece un valor umbral de similaridad o tolerancia, T, que suele obtenerse a partir de propiedades específicas de la imagen (Nalwa y Binford, 1986).
2.- A continuación, se selecciona una determinada región semilla, R . i
3.- Seguidamente, se obtienen los pixels vecinos de la región semilla, utilizando para ello la expresión (2.2.19), donde V(x,y) es una función de vecindad que proporciona los
pixels en la vecindad del pixel I(x,y) de la imagen original. Por regla general, las
funciones de vecindad utilizadas son las que se muestran en la figura 2.2.13, denominadas conectividad-4 y conectividad-8 (González y Woods, 2002).
i i) I(x,y);V x,y R R ( V (2.2.19)4.- Una vez obtenidos los pixels vecinos de la región R , se incorporan a i R todos i
aquellos vecinos que satisfacen un criterio de similaridad con respecto a la región. El criterio de similaridad suele estar relacionado con el parecido entre los ND’s de los
pixels vecinos y los pixels que componen la región (Adams y Bischof, 1994). Esta
situación aparece descrita en la expresión (2.2.20), donde S es una medida de similaridad entre el ND del pixel I(x,y) y el ND de los pixels riRi.
I(x,y),r
T R R I(x,y) S , R r ) R ( V ) y , x ( I i i i i i i (2.2.20)5.- Si el paso 4 trajo como consecuencia la incorporación de algún pixel a R , se repiten i
los pasos 4-6 hasta que ninguno de los vecinos sea incorporado a la región.
6.- Seleccionamos una nueva región y repetimos los pasos 4-6 hasta que se hayan procesado las r regiones semilla iniciales.
I(x+1,y+1) I(x,y+1) I(x-1,y+1) I(x+1,y) I(x,y) I(x-1,y) I(x+1,y-1) I(x,y-1) I(x-1,y-1) V(x,y) Conectividad-8 I(x+1,y+1) I(x,y+1) I(x-1,y+1) I(x+1,y) I(x,y) I(x-1,y) I(x+1,y-1) I(x,y-1) I(x-1,y-1) V(x,y) Conectividad-8 I(x,y+1) I(x+1,y) I(x,y) I(x-1,y) I(x,y-1) V(x,y) Conectividad-4 I(x,y+1) I(x+1,y) I(x,y) I(x-1,y) I(x,y-1) V(x,y) Conectividad-4
Figura 2.2.13. Funciones de vecindad denominadas conectividad-4 y conectividad-8.
A lo largo del proceso de crecimiento, puede ocurrir que dos o más regiones se unan. Se dice que dos regiones R y i R se unen cuando: j
R R V(R ) ) R ( V i j i j
(2.2.21)
En caso de que se produzca esta situación, es preciso comprobar el grado de similaridad entre las regiones que se unen. Si las dos regiones son suficientemente similares, las regiones se combinan para dar lugar a una única región, tal y como se muestra en la siguiente expresión:
j i i j i,R ) T R R R R ( S
(2.2.22)
Si las regiones no son lo suficientemente similares, es decir, S(Ri,Rj) , las regiones no T se combinan y son susceptibles de crecer por separado, pero evitando que una crezca en la otra y viceversa (Adams y Bischof, 1994).
La figura 2.2.14 muestra un ejemplo de la aplicación de este proceso sobre una imagen sencilla. Como puede apreciarse, el crecimiento depende de las propiedades de cada una de las regiones, de forma que hay regiones que crecen en mayor medida que otras. El proceso de unión de regiones también aparece ilustrado en el ejemplo, en el que se puede comprobar un caso en el
que dos regiones dan lugar a una única región y otra situación en la que dos regiones, a pesar de unirse, mantienen su identidad propia y crecen por separado.
Imagen original Vegetación Suelo Fondo Zonas urbanas R1 R2 R3 R4 Regiones semilla (fase segmentación) R9 R10 R5 R6 R7 R8 R1, R2y R3se combinan R4 y R9se combinan, pero no crecen en el interior de R5, R6, R7, R8, R10
R6 y R8crecen sin invadir la región resultante de la unión
de R4y R9
Paso 1 Paso 2 Paso 3
Imagen original Vegetación Suelo Fondo Zonas urbanas R1 R2 R3 R4 Regiones semilla (fase segmentación) R9 R10 R5 R6 R7 R8 R1 R2 R3 R4 Regiones semilla (fase segmentación) R9 R10 R5 R6 R7 R8 R1, R2y R3se combinan R4 y R9se combinan, pero no crecen en el interior de R5, R6, R7, R8, R10
R6 y R8crecen sin invadir la región resultante de la unión
de R4y R9
Paso 1 Paso 2 Paso 3
Figura 2.2.14. Ejemplo de crecimiento de regiones utilizando una imagen sencilla.
Un aspecto a tener en cuenta a la hora de garantizar el buen funcionamiento de esta técnica es la necesidad de establecer de forma adecuada el umbral de similaridad inicial T. A continuación, realizamos algunas consideraciones acerca de las implicaciones de utilizar diferentes criterios de similaridad (González y Woods, 2002):
La utilización de un criterio de similaridad no demasiado estricto puede traer como consecuencia el sobre-crecimiento de algunas regiones. Esta situación aparece ilustrada en la figura 2.2.15.
Por otra parte, la utilización de un criterio de similaridad muy estricto puede dar como resultado varias detecciones para una misma región, situación que aparece descrita mediante un ejemplo en la figura 2.2.16.
En base a las consideraciones anteriormente realizadas, podemos afirmar que la utilización de criterios de similaridad relajados o demasiado estrictos puede traer como consecuencia una