Análisis de componentes principales de variables en imágenes satelitales de la ciudad de Loja años 1995-2000 /

(1)

jJ-Z•»q z

¡lien

1maJen

(2)

Inteligencia Artificial

"ANÁLISIS DE COMPONENTES PRINCIPALES DE

VARIABLES EN IMÁGENES SATELITALES DE LA

CIUDAD DE LOJA AÑOS 1995-2000"

Tesi previa a &z obtención dW Títuú Le Ingeniero en Sistemas Informáticos y Computación

AUTORA: María del Cisne Torres Ojeda

DIRECTOR:

¡ng.

Héctor F. Gómes A.

(3)

CERTIFICACIÓN

Ing. Héctor Fernando Gómez Alvarado

CERTIFICA:

Que la Señorita. María del Cisne Torres Ojeda, autora de la tesis "Análisis de Componentes Principales de variables en imágenes satelitales de la ciudad de Loja" ha cumplido con los requisitos estipulados en el Reglamento General de la Universidad Técnica Particular de Loja, la misma que ha sido coordinada y revisada durante todo el proceso de desarrollo desde su inicio hasta la culminación, por lo cual autorizo su presentación.

1 ÁagHéc2r G ez

DIRECTOR DET SIS

(4)

Yo, María del Cisne Torres Ojeda, declaro conocer y aceptar la disposición del Art. 67 del Estatuto Orgánico de la Universidad Técnica Particular de Loja que por su parte pertinente textualmente dice: "Forman parte del patrimonio de la Universidad la propiedad intelectual de investigaciones, trabajos científicos o técnicos y tesis de grado que se realicen a través con el apoyo financiero, académico o institucional (operativos) de la Universidad".

María del Cisne Torres Ojeda

(5)

AUTORIA

Las ideas, opiniones, conclusiones y

recomendaciones y más contenidos expuestos en el presente informe de tesis son de absoluta responsabilidad del autor.

(6)

El presente proyecto esfuerzo es fiel reflejo de muchos años de sacrificio, a lo largo de los cuales muchas personas fueron participes de cada paso que he dado para cumplir tan anhelado sueño. Por lo tanto, quiero de alguna forma hacer llegar mi agradecimiento a quienes estuvieron a mi lado, dedicando este trabajo, primero a Dios por haber sido quien me acompañaba en mis largas horas de trabajo, quien cuando me sentía derrotada me animaba a levantarme para seguir; luego a Efrén y Alicia, mis padres por ser mis amigos fieles, mi pilar fundamental y ejemplo de responsabilidad y perseverancia, así mismo por haber sacrificado cuanto pudieron para ayudarme a llegar a cumplir este objetivo; a mis hermanos, Carlos por ser mi compañero de tantas penas, alegrías y quien con su tolerancia corrigió mis errores ayudándome de esta manera a mirar hacia delante y convencerme de que la vida aún tiene mucho que ofrecerme y que yo no puedo ser indiferente ante este regalo, Kelly por ser mi niña preciada y en quien me inspiraba para dejar en ella una huella de bien que pudiera seguir durante su formación; a toda mi familia porque cada uno de ellos, tanto, abuelitas, tíos, primos colocaron un granito de arena para poder hoy culminar una etapa más de mi vida, a ti Israel que siempre fuiste, quien supo escucharme, y siempre estuvo en los momentos más difíciles para darme ánimo; a todos mis amigos y amigas quienes con sus ocurrencias hacían más llevadero el camino, y a la vez con sus conocimientos aportaron académicamente a mis estudios.

Gracias a ustedes de todo corazón. MIL GRACIAS!

(7)

AGRADECIMIENTO

Un especial agradecimiento a la Universidad Técnica Particular de Loja, por brindarme todos los conocimientos para poder formarme profesionalmente y espiritualmente; así mismo mi agradecimiento a la Escuela de Ciencias de la Computación por su aporte académico y administrativo a lo largo de mi

formación universitaria.

Un especial agradecimiento al grupo de Sistemas de Información Geográfica de forma muy especial al Ing. Héctor Gómez por ser mi guía y coordinador durante todo el desarrollo de la presente tesis; sin su apoyo hubiera sido difícil

la culminación de la misma.

(8)

Certificación

Cesión de derechos Autoría

Dedicatoria Agradecimiento

Indice VI

Índice de figuras ix

Índice de tablas xi

Anteproyecto de tesis 1

CAPITULO 1 Delimitación del tema de Tesis.

1.1 Introducción. 8

1.2 Conceptos Básicos. 9

Capítulo II Marco Referencia¡

2.1 Teledetección 12

2.1.1 Introducción 12

2.1.2 Concepto 13

2.1.3 Elementos de Teledetección 13

2.2 Imagen Satelital 14

2.2.2 Imagen LANDSAT 15

2.2.2.1 Descripción de Bandas 15

2.3 Transformación de una imagen 17

2.3.2 Tipos de Transformación 17

(9)

2.3.2.1.1 Introducción

2.3.2.1.2 Concepto 18

2.3.2.1.3 Características 18

2.3.2.1.4 Utilidad de ACP en imágenes satelitales. 19

2.3.2.1.5 Cálculo de los Componentes Principales 19

2.3.2.1.5.1 CP utilizando la matriz de varianza- 21

covarianza

2.3.2.1.5.2 CP utilizando la matriz de correlación 24

CAPITULO III Metodología

3.1 Selección y Análisis de la imagen dela zona de estudio 25

3.2 Formato de imágenes 29

3.3 Comparación y Selección de herramientas. 30

3.4 Obtención de cada banda de la imagen satelital 32

3.4.1 Datos Estadísticos de las bandas 33

3.4.2 Matriz de Correlación 34

3.4.3 Diagramas de Dispersión entre cada par de bandas 34

3.5 Histogramas de cada banda 39

3.5.2 Histogramas de cada banda de la imagen satelital 39

3.6 Obtención de los Componentes Principales 41

3.6.1 Matriz de varianza-covarianza 41

3.6.2 Autovalores y Autovectores. 42

3.6.3 Imágenes de la Componentes Principales 44

3.6.4 Correlación de las Componentes con las imágenes 46

satelitates

3.6.5 Criterio para elegir número de Componentes a utilizar 47

3.6.5.1 PIot de las Componentes Principales 49

3.6.6 Margen de error 49

(10)

CAPITULO IV Conclusiones, Recomendaciones y Proyectos

Futuros.

4.1

Conclusiones.

57 4.2 Recomendaciones.

59 4.3 Proyectos Futuros.

60 Bibliografía.

61

(11)

No. Figura Descripción Figura 1 Figura 2 Figura 3 Figura 4 Figura 5 Figura 6 Figura 7 Figura 8 Figura 9 Figura 10 Figura 11 Figura 12 Figura 13 Figura 14 Figura 15 Figura 16 Figura 17 Figura 18 Figura 19 Figura 20 Figura 21 Figura 22 Figura 23 Figura 24 Figura 25 Figura 26 Figura 27

Elementos de la Teledetección.

Proporción de una imagen satelital de la ciudad de Loja Metodología para aplicar ACP en imágenes satelitales

Modelo Cartográfico para aplicar Análisis de Componentes Principales en imágenes satelitales

Organización de datos de una imagen satelital.

Bandas Espectrales de la Imagen Satelital de la ciudad de Loja Diagrama de Dispersión entre cada par de Bandas

Histogramas cada Banda

Imágenes relacionadas con cada Componente obtenida

Porcentajes de la variación total explicada por cada componente. PIot que contiene los dos Componentes Principales.

Imágenes reconstruidas.

Diferencia entre imágenes satelitales e imágenes reconstruidas. Histogramas de las imágenes reconstruidas.

Matrices de las imágenes obtenidas en Matlab. Imagen obtenidas en Matlab.

Primera Componente.

Histogramas de los componentes principales. Primera imagen reconstruida.

Diferencia entre Banda original y banda reconstruida. Archivo .arff de las seis bandas de la imagen utilizada. Datos importados en Weka.

Histogramas de cada banda en Weka.

Diagramas de relación entre cada par de bandas en Weka. Cálculo de Componentes Principales en Weka.

(12)

(13)

No Tablas Descripción

Tabla 1 Organización de píxeles de cada banda en una imagen satelita

Tabla 2 Diferencia 1

Tabla 3 Descripción estadística de las bandas entre Weka y Matlab para aplicar ACP en imágenes satelitales.

Tabla 4 Matriz de Correlación

Tabla 5 Matriz de Varianza-Covarianza

Tabla 6 Autovalores y porcentaje de variación total. Tabla 7 Autovectores de las seis bandas.

Tabla 8 Relación de Componentes con Bandas Originales

Tabla 9 Diferencia entre Weka, Matlab y ACP para aplicar ACP en

imágenes satelitales

(14)

Universidad Técnica Particular de Loja

Ciudad.-De mi consideración:

Por medio del presente me permito solicitar se digne aprobar el proyecto de

tesis denominado: Análisis de componentes principales de variables en

imágenes satelitales de la ciudad de Loja años 1995 y 2000 luego de

haber realizado la revisión y análisis con el docente sugerido como director de

tesis.

Por la favorable atención al presente, le reitero mi sincero

agradecimiento.

Atentamente,

Maria del Cisne Torres Ojeda

ng. Héctor F Gómez A

DIRECTOR DE TESIS

lng. Nelson Piedra

Carlos Correa

(15)

Loja, 30 de mayo del 2006

Héctor Fernando Gómez Alvarado

Escuela de Ciencias de la Computación

Dejo constancia de haber revisado y estar de acuerdo con el proyecto

de Tesis, titulado: Análisis

de componentes principales de variables en

imágenes satelitales de la ciudad de Loja años 1995 y 2000.

Presentado por: María del Cisne Torres Ojeda

Particular que comunico para los fines legales pertinentes.

Héctor F Gómez A

(DIRECTOR DE TESIS)

Visto Bueno Dirección Escuela

F) ... ...

Nombre, cargo

(16)

Título Tema propuesto por: Sistemas de

Análisis de componentes principales Información Geográfica de variables en imágenes satelitales _Universidad _UTPL

de la ciudad de Loja años 1995y

2000 _Estudiantes _{María del}

Cisne Torres Oleda

Otros Mgs. Fernando

Sandoya, ES PO L Dr. Hugo Banda

Bigo. Stefano Torrachi

Nombres y Apellidos del Director de Tesis Héctor Fernando Gómez Alvarado

Nombres y apellidos del Profesional en Formación María del Cisne Torres Ojeda

Duración del Proyecto 12 meses

Tiempo previsto de ejecución 6 meses (máximo 9 meses)

(17)

Financiamiento del Trabajo

Costo Estimado del Trabajo: 6000

Explicar claramente la forma de financiamiento UTPL: 3000

APORTE FUNDACYT EN CASO DE QUE SE DIERA: 2000

Propio % 2000

Privado %

TÍTULO DEL PROYECTO DE TESIS

Análisis de componentes principales de variables en imágenes satelitales de la ciudad de Loja años 1995 y 2000

1. INTRODUCCIÓN DEL PROYECTO:

Una herramienta fundamental para la elaboración de cartografía es la teledetección espacial, técnica que permite adquirir imágenes multiespectrales desde sensores remotos. Estas imágenes brindan una mayor cantidad de observaciones de las coberturas, que cualquier levantamiento terrestre, trabajando a una misma escala. A través de los años, la disponibilidad al público y los costos de las imágenes fueron más accesibles, sumado a los avances en la resolución tanto espacial como espectral. Por este motivo su interpretación y análisis se encuentran en creciente desarrollo."

El presente trabajo trata entonces de utilizar imágenes aéreas como fuentes de datos, a través de los cuales se logra una clasificación temática y lógica de los mismos. Los datos en una imagen satelital se pueden clasificar en cobertura de suelo, agua e inclusive temperatura. Por ello, en la presente tesis se empezará observando las definiciones de sensores remotos y de imágenes aéreas con el fin de aprender cuales son sus potencialidades y ventajas.

Luego se presentará como se puede descomponer una imagen aérea en vectores los mismos que sostienen información que servirá de entrada para el análisis del

(18)

N. OBJETIVOS

General:

Análisis de componentes principales de variables en imágenes satelitales

de la

ciudad de Loja años 1995 y 2000.

Específicos:

+ Construir una metodología que permita la aplicación del análisis del componente

principal en imágenes satelitales.

+ Desarrollar una aplicación informática amigable que permita la comprobación

de las herramientas utilizadas así como una descripción del software aplicado.

METODOLOGÍA

Hipótesis:

El análisis del componente principal permite la obtención de información

importante de una imagen satelifal sin perder detalle de la misma.

Metodología:

Para el caso de los proyectos relativos a Inteligencia Artificial y en esencia los

de componentes principales se propone el uso de la experimentación como

lo expone [Martín del Brío, 20031 en su libro Redes Neuronales y Sistemas

Difusos, en el que se expresa los siguientes pasos, pag. 239:

+ Comprensión correcta del problema, por lo que se tendrá un estudio

previo de la imagen aérea en si mismo.

+ Introducción explícita del conocimiento apriorístico.

•:. Descomposición del problema en partes.

+ Ensayo de distintos métodos neuronales o no y seleccionar el más eficaz.

+ Integrar en una aplicación diversas soluciones.

+ Huir de las aplicaciones a ciegas de los sistemas de neuronas artificiales.

•• Se puede usar sistemas comerciales de simulación que proporcionan una

(19)

+ Si la aplicación precisa además tratar muchos datos en tiempo real, o

bien se requiere de un circuito dedicado, pequeño y de bajo consumo,

puede resultar necesario el empleo de hardware neuronal específico.

IV. RECURSOS

Humanos:

-

1 Tesista

- 1 Director de tesis

- 1 Asesor del área ambiental

- 1 asesor estadístico

- 1 asesor de Inteligencia Artificial

- 1 Asesor de resultados del proyecto

Equipos

EQUIPOS, MATERIALES E INSTALACIONES

DISPONIBILIDAD %

Computadores

100 Imágenes aéreas

100 Software

100 CronoQrama de actividades

ACTIVIDAD

TIEMPO (mes esJ

123456789

Data Mining

x

Determinación

x x

de vectores de

entrada

Uso de

x

simuladores y/o

construcción de

aplicaciones

Pruebas y

x x

conclusiones

finales

Presupuesto

ACTIVIDAD

COSTO

(20)

V. BIBLIOGRAFÍA

•• James Freeman/David Skapura. Redes Neuronales, Algoritmos, aplicaciones y

técnicas de programación. Addison - Wesley/Diaz de Santos. España, 1993. 431

•) GiarratanoRiley. Sistemas Expertos, Principios de Programación. Thomson,

México, 1998, 596 p.

•:• Nils J Nilson. Inteligencia Artificial, Una nueva síntesis. McGraw-Hill, Argentina,

2001, 457 p.

•. CHUVIECO, Emilio. Teledetección Ambiental, Editorial Ariel, España ,2002, 584

páginas.

+ Martin del Brio, Sanz Molina. Redes Neuronales y Sistemas Difusos,

Alfa-Omega, España, 2003, 399 p.

PDF:

(21)

Análisis de Componentes Principales de variables en imágenes satelitales de la ciudad de Loja años 1995 y 2000

CAPITULO 1

DELIMITACIÓN DEL TEMA DEL PROYECTO DE TESIS

1.1 INTRODUCCIÓN

Las diferentes coberturas de la superficie terrestre (campos cultivados, roca desnuda, agua) reflejan la radiación electromagnética que les llega desde el sol, con distintas intensidades o niveles digitales (N.D. 1 ) de acuerdo a la región del espectro (firma espectral). Este fenómeno es el eje fundamental de la TELEDETECCIÓN.

El presente estudio se ha elaborado una metodología para el procesamiento y análisis de imágenes satelitales, aplicando el Análisis de Componentes Principales, la misma que es una técnica estadística que ayuda a transformar un conjunto de bandas de una imagen, que se encuentran fuertemente correlacionadas a un conjunto de nuevas bandas y poder identificar nuevos ejes que maximizan la varianza en el conjunto de datos.

Los datos utilizados fueron adquiridos en soporte digital y en formato numérico, este tratamiento digital permite generar modelos cuantitativos e integrar los resultados con otro tipo de información geográfica.

El carácter digital de las imágenes y su forma vectorial permite generar nuevas imágenes aplicando transformaciones lineales a una o varias imágenes Las nuevas imágenes representan una descripción alternativa de los datos, en la cual los nuevos N.D. de un píxel están relacionados con sus N.D. originales a través de una operación lineal. La imagen transformada puede destacar ciertas

(22)

características que son difíciles de identificar en los datos originales o, alternativamente, preservar la información que es importante, contenida en la imagen en un número menor de dimensiones. Las transformaciones pueden llevarse a cabo para realizar un mejoramiento de la imagen o como un análisis previo a la aplicación de técnicas de clasificación [FERRERO Et al.,

1999].

1.2 CONCEPTOS

Es importante destacar la importancia de ciertos conceptos tanto de Teledetección como Estadística Descriptiva y Multivariada, esto con el fin de facilitar la interpretación de resultados estadísticos a nivel de Teledetección.

Banda: se denomina banda a cada uno de los canales de adquisición de datos de un sistema sensor [PINILLA, 20061.

Contraste: Razón existente entre la energía emitida o reflejada por un objeto y sus alrededores más inmediatos. El contraste en una imagen es un indicio de la información que proporciona y suele expresarse con la varianza de sus ND

[PINILLA, 2006].

Covarianza: Transformación estadística generadora de nuevas bandas linealmente independientes a partir de otras con información redundante [PINILLA, 20061.

Dispersión: Fenómeno por el cual la radiación electromagnética es desviada de su trayectoria original, como consecuencia de los choques entre los rayos luminosos y las partículas atmosféricas, ya sean éstas las moléculas de los gases que la constituyen o aerosoles en suspensión [PINILLA, 20061.

(23)

una variable aleatoria, el histograma correspondería a la función de densidad de probabilidad de encontrar cada ND [PINILLA, 20061.

Imagen Satelital: Función discretizada de la imagen analógica, tanto en las

dimensiones geométricas, mediante la generación de celdas por muestreo equiespaciado de la superficie, como en sentido radiométrico, mediante la asignación de valores enteros denominados Niveles Digitales (ND), que están comprendidos entre O y k-1, siendo k el margen dinámico del sistema, determinado a su vez por su resolución radiométrica (que habitualmente suele ser de 8 bits, es decir, k=2'8256, o de 10 bits, es decir,

k=1024)

[PINILLA, 2006].

Nivel Digital: Es una valor numérico, no visual, pero que puede fácilmente

traducirse a una intensidad visual o, si se prefiere, a un nivel de gris, mediante cualquier convertidor digital-analógico [PINILLA, 20061.

Píxel: Abreviatura de

picture element,

cada una de los elementos que componen una imagen dispuestos matricialmente en filas y columnas [PINILLA, 2006].

Radiometría: Es el conjunto de medidas efectuadas en campo con radiómetros, encaminadas a contrastar

in situ

la información adquirida mediante sensores situados en satélites [PINILLA, 2006]

Radiancia: Es la cantidad de energía radiada desde un objeto en la unidad de tiempo por cada unidad de ángulo sólido y de unidad de superficie del objeto perpendicular a la dirección de propagación. Es el parámetro físico medible con un radiómetro [PINILLA, 2006].

(24)

RGB: Sigla de rojo-verde-azul. Se trata de un sistema de especificación del color basado en la propiedad aditiva de los tonos primarios que es el comúnmente utilizado en los sistemas informáticos y en la composición en verdadero o en falso color de las imágenes espaciales [PINILLA, 2006].

Ruido: Todos aquellos errores aleatorios introducidos en la imagen durante el

proceso de adquisición, transmisión o grabación de la misma. Producen la alteración de los niveles digitales que corresponderían a la escena real. El proceso de análisis de la señal debe ser capaz de distinguir y separar las alteraciones que son consecuencia del ruido sin eliminar con ello información sustancial de la imagen [PINILLA, 20061.

Varianza: Medida de la dispersión de los valores de un conjunto alrededor de

(25)

Capítulo U

MARCO REFERENCIAL

2.1 TELEDETECCIÓN

2.1.1 INTRODUCCIÓN

El término teledetección indica la adquisición de información sobre un objeto a distancia, sin un contacto material entre el objeto observado y el observador. Uno de los principales objetivos de esta técnica es la búsqueda de una nueva visión de los paisajes terrestres. Para poder hacer un estudio de esta superficie terrestre se necesita básicamente de un objeto observado que en este caso es la superficie terrestre, un sensor que se encuentre ubicado en el aire o el espacio, el mismo que será capaz de detectar y capturar la información para su posterior análisis [CHUVIECO, 2002]. Este análisis permite el reconocimiento de las características de la superficie terrestre y de los fenómenos que en ella se producen. La teledetección es una traducción latina del término inglés remote sensing. En sentido amplio, la teledetección no engloba sólo procesos que permitan obtener una imagen, sino también su posterior tratamiento, en el contexto de una determina aplicación.

2.1.2 CONCEPTO

(26)

2.1.3 ELEMENTOS DE LA TELEDETECCIÓN

1

FIG 1: Elementos de la Teledetección

Fuente: [CHUVIECO, 20021

Un sistema de teledetección espacial, incluye los siguientes elementos [Chuvieco, 20021:

1. Fuente de energía, que supone el origen de la radiación electromagnética que detecta el sensor. La fuente de energía más importante, obviamente, es el sol.

2. Cubierta terrestre, formada por distintas masas de vegetación, suelos,

[image:26.584.202.396.154.457.2]

(27)

Análisis de Componentes Principales de variables en imágenes satelttales de la ciudad de Loja años 1995 y 2000

3. Sistema Sensor, compuesto por el sensor, y la plataforma que lo alberga. Tiene como objetivo captar la energía procedente de las cubiertas terrestres, codificarla y grabarla o enviarla directamente al sistema de recepción.

4. Sistema de recepción-comercialización, en donde se recibe la

información transmitida por la plataforma, se graba en un formato

apropiado.

S. Intérprete, que convierte los datos en información temática de interés, ya sea visual o digitalmente.

6. Usuario final, encargado de analizar el documento que se ha obtenido de la interpretación.

2.2 IMAGEN SATELITAL

Las imágenes obtenidas por los satélites de teledetección ofrecen una perspectiva única de la Tierra, sus recursos y el impacto que sobre ella ejercen los seres humanos. La teledetección por satélite ha demostrado ser una fuente rentable de valiosa información para numerosas aplicaciones [LATTUS, 2006].

(28)

Además de estas ventajas evidentes, las imágenes de satélite muestran, literalmente, mucho más de lo que el ojo humano puede observar, al desvelar detalles ocultos que de otra forma estarían fuera de su alcance.

2.2.2 IMAGEN LANDSAT

Una imagen LANDSAT 7 ETM+ está compuesta por 8 bandas espectrales que pueden ser combinadas de distintas formas para obtener variadas composiciones de color u opciones de procesamiento. Entre las principales mejoras técnicas respecto de su antecesor, el satélite Landsat 5, se destaca la adición de una banda espectral (Banda Pancromática) con resolución de 15 metros. También, cuenta con mejoras en las características geométricas y radiométricas y una mayor resolución espacial de la banda térmica para 60 m. Estos avances tecnológicos permiten calificar al Landsat7 como el satélite más interesante para la generación de imágenes con aplicaciones directas hasta una escala de 1:25.000, principalmente, en áreas rurales o territorios de grandes extensiones [GOMEZ, 2006].

2.2.2.1 DESCRIPCIÓN DE BANDAS

En el artículo publicado por [GOMEZ, 20061, se hace una descripción de lo que representa cada banda en una imagen satelital

(29)

Banda 2: (0,52 a 0,60 micrones - verde) Especialmente diseñada para evaluar

el vigor de a vegetación sana, midiendo su pico de reflectancia (o radiancia) verde. También es útil para diferenciar tipos de rocas y, al igual que la banda 1, para detectar la presencia o no de limonita.

Banda 3: (0,63 a 0,69 micrones - rojo) Es una banda de absorción de clorofila, muy útil para la clasificación de la cubierta vegetal. También sirve en la diferenciación de las distintas rocas.

Banda 4: (0,76 a 0,90 micrones - infrarrojo cercano) Es útil para determinar el contenido de biomasa, para la delimitación de cuerpos de agua y para la clasificación de las rocas.

Banda 5: (1,55 a 1,75 micrones - infrarrojo medio) Indicativa del contenido de humedad de la vegetación y del suelo. También sirve para discriminar entre nieve y nubes.

Banda 6: (10,40 a 12,50 micrones - infrarrojo termal) El infrarrojo termal es útil en el análisis del stress de la vegetación, en la determinación de la humedad del suelo y en el mapeo termal.

Banda 7: (2,08 a 2,35 micrones - infrarrojo medio) Especialmente seleccionada por su potencial para la discriminación de rocas y para el mapeo hidrotermal. Mide la cantidad de hidróxilos (OH) y la absorción de agua.

(30)

2.3 TRANSFORMACIÓN DE UNA IMAGEN

En Teledetección cuando se habla de transformaciones, se refiere a un grupo de operaciones que permiten obtener bandas satelitales a partir de combinaciones lineales entre las originales, esto con el objetivo de poder discernir con mayor claridad en las imágenes transformadas aspectos de importancia relevante, que en las originales era difícil de distinguir, ya que la información se encuentra en las bandas originales, pero su transformación la

resalta [RAMOS, 2005].

2.3.2 TIPOS DE TRANSFORMACIÓN

2.3.2.1 ANÁLISIS DE COMPONENTES PRINCIPALES

2.3.2.1.1 INTRODUCCIÓN

Un problema que se presenta a menudo en el tratamiento de imágenes satelitales, es la dimensionalidad de los datos con los que se está trabajando y la alta correlación de las variables.

El Análisis de los Componentes Principales (ACP) puede usarse para transformar un conjunto de bandas de una imagen tal que las nuevas bandas (llamadas componentes principales) se encuentran no correlacionadas entre si.

(31)

Se hace necesario, pues, reducir el número de variables. Es importante resaltar el hecho de que el concepto de mayor información se relaciona con el de mayor variabilidad o varianza. Cuanto mayor sea la variabilidad de los datos (varianza) se considera que existe mayor información, lo cual está relacionado con el concepto de entropía2.

2.32.1.2 CONCEPTO

El objetivo del Análisis de Componentes Principales (A.C.P.) es resumir un grupo amplio de variables en un nuevo conjunto (más pequeño) sin perder una parte significativa de la información original [Chuvieco, 2002]. Cuando se habla de Teledetección, el objetivo del A.C.P. es construir una o varias imágenes en las que se pueda diferenciar distintas coberturas. Es por ello que al realizar una composición color resulta interesante usar, en lugar de algunas bandas de la imagen, los componentes principales que se obtienen luego de aplicar esta técnica en la secuencia RGB respectivamente [RAMOS, 20051.

2.3.2.1.3 CARACTERÍSTICAS

No se establecen jerarquías entre las variables.

> No se necesita comprobar Normalidad.

Se selecciona un número de componentes de tal forma que en la

transformación no se pierda mucha información [Villardón, 20041.

(32)

2.3.2.1.4 UTILIDAD DE ACP EN IMÁGENES SATELITALES

El Análisis de Componentes Principales es útil en el análisis de imágenes

teledetectadas en dos casos:

Cuando se tiene las componentes espectrales de una imagen y se pretende eliminar la información que no es de importancia o redundante que posiblemente encierren [RAMOS, 20051.

Si se tienen varias imágenes multitemporales para observar la evolución en el tiempo de un cierto fenómeno [RAMOS, 20051.

2.3.2.1.5 CÁLCULO DE LOS COMPONENTES PRINCIPALES

En el articulo publicado por: [FERRERO Et al., 1999] establece que el estudio de la relación entre bandas, que es la base del ACP, puede realizarse de dos maneras:

a. Con la matriz de varianza-covarianza b. Con la matriz de Correlaciones

a) Con la matriz de varia nza-covarianza

17,11 ₁₂

c21 ₂₂ Ii2

x

pl

(33)

:T1 = 1 _{[xkE(x1 con}

Kl

1 E(x1)

-n _{k 1}

(2.3-1)

y los elementos fuera de la diagonal son las covarianzas entre los N.D. de dos

bandas [FERRERO Et al.,

19991:

cj ij = E(x1)j E(x1)1

kl

(2.3-2)

Como la covarianza entre la banda

¡

y la] es la misma que entre la banda] y la

i

(

= ) la matriz Ex es simétrica. Cuando hay relación lineal entre los N.D. de dos bandas las covarianzas son grandes en comparación con las varianzas, por eso es que esta matriz sirve para estudiar la relación entre pares de bandas

[FERRERO Et al., 1999].

b) Con la matriz de Correlaciones

íii í'12

P21 l22

(34)

(2.3-1)

Los elementos de la diagonal son unos porque son las correlaciones de cada banda consigo misma. Como la correlación entre la banda ¡ y la

_j

es la misma

que entre la banda

_{j y}

la ¡ (pij pji) la matriz es simétrica. Cuando hay relación lineal entre pares de bandas las correlaciones son cercanas a 1 ó a —1 [FERRERO Etal., 1999].

Cuando no hay relación entre bandas ambas matrices son diagonales (los elementos fuera de la diagonal son ceros). En este caso cada banda aporta información diferente y por lo tanto el ACP sería innecesario [FERRERO Et al.,

1999].

El objetivo del ACP es generar un nuevo sistema de coordenadas en el espacio multiespectral en el cual los datos pueden ser representados sin correlación, de tal manera que la matriz de varianza-covarianza sea diagonal en el nuevo sistema de coordenadas [FERRERO Et al., 1999].

2.3.2.1.5.1 COMPONENTES PRINCIPALES OBTENIDOS USANDO LA MATRIZ DE VARIANZA-COVARIANZA

Como se dijo, los componentes principales son nuevas variables Y1, Y2,..., Yp que se obtienen como combinaciones lineales de las variables originales (bandas) [FERRERO Et al., 1999]:

:--a Jtx= ztX,+ X-- +

Y2 = a 2 X = a12 X1 + a22 X2 + + aX

(35)

Análisis de Componentes Principales de variables en imágenes satelitales de la ciudad de Loja años 1995 _{y 2000}

Como los Y son combinaciones lineales de los X, tienen [FERRERO Et al., 1999]:

Var(Y)=a Ea Ccw(YYk)=a EXak

De todas las combinaciones lineales posibles, los componentes principales son aquellas que no están correlacionadas y tienen máxima varianza. Como la varianza se incrementa multiplicando el vector de coeficientes a por una constante, para que esta combinación lineal sea única es conveniente usar los vectores de coeficientes normalizados, es decir con longitud 1 (ait a = 1) [FERRERO Etal., 1999].

De esta manera:

> Primer componente principal = combinación lineal (ait X) que maximiza

Var (ait X) sujeto a que alt a11.

> Segundo componente principal = combinación lineal (a2t X) que maximiza

Var (a2t X) sujeto a que a2t a2 = 1 y que Cov(a lt X,a2t X) = O

i-ésimo componente principal = combinación lineal (att X) que maximiza

(36)

Como en el caso de las bandas, la matriz de varianza-covarianza de los

componentes (y) es simétrica (por ser Cov(Y I,Yk) = Cov(Yk,Yj), e i:#k). Además

COMO Coy (Yi,Yk)=O.(V ¡^k), Ey ésta es diagonal, [FERRERO Et al.,19991.

Por lo tanto el i-ésimo componente principal está dado por

Yj =ejt X=eij Xi +e2íX2 + ... +epi Xp con i=1,..,p

Donde los Ii son los autovalores (con ^?^O) y los e son los

autovectores de ly [FERRERO Et al., 1999].

Es decir:

...o

O 12

-Si algunos autovalores son iguales, tos autovectores y por lo tanto los componentes no son únicos. Sin embargo, los autovectores correspondientes a autovalores iguales pueden elegirse de manera tal que sean ortogonales, y así los componentes son únicos, [FERRERO Et. al., 1999].

La matriz Ey contiene en la diagonal las varianzas (autovalores) de los N.D. de

los píxeles en las coordenadas transformadas. Los autovalores son no crecientes, entonces la máxima varianza (en general) está en la primera componente Yi, la subsiguiente en Y2, y así sucesivamente.

(37)

Análisis de Componentes Principales de variables en imágenes satelitales de la ciudad de Loja años 1995 _y2000

direcciones de máxima variabilidad y proveen una descripción más simple y parsimoniosa de la estructura de covarianza. Los autovalores expresan la longitud de cada uno de los ejes (componentes), mientras que los autovectores dan la dirección de los mismos, [FERRERO Et al., 19991.

Por otra parte, cada

autovalor

representa la proporción de información que retiene el componente principal asociado (lo cual es útil para decidir qué componentes son más interesantes), en tanto que el autovector indica la ponderación que debe aplicarse a cada una de las bandas para obtener el componente principal (equivalentes a los coeficientes de regresión en una transformación lineal estándar, siendo las bandas de la imagen las variables independientes y los componentes principales, las dependientes). El valor absoluto del elemento E . del autovector eij indica el grado de contribución de la banda j al componente principal i definido por la transformación lineal

[Chuvieco, 2002].

2.3.2.1.5.2 COMPONENTES PRINCIPALES OBTENIDOS USANDO LA MATRIZ DE CORRELACIÓN.

Partiendo de la matriz Ex se otorga la misma importancia a todas las variables, lo cual es deseable o no dependiendo de la situación particular. En este caso se debe usar la matriz X para expresar las combinaciones lineales que determinan los componentes principales.

(38)

En Teledetección sería conveniente generar los componentes principales usando la matriz de correlación para atenuar el efecto de la diferencia de variabilidad entre bandas, sobre todo porque ésta puede deberse a diferencias entre las medias de los N.D. de los píxeles de distintas bandas. De esta manera se da la misma ponderación a todas las bandas.

CAPITULO III

M ETODO LOGIA

3.1 SELECCIÓN Y ANÁLISIS DE LA IMAGEN DE LA ZONA DE ESTUDIO

El proceso de Adquisición de una imagen satelital difiere, sustancialmente, del empleado en la fotografía área. En cualquier sistema fotográfico, la energía procedente de los objetos se registra sobre una superficie sensible a la luz. Esta puede componerse de una o varias capas, formando, respectivamente, una película pancromática o en color [GONZALEZ, Et. Al.,

19961.

(39)

Mediante una correcta metodología de cálculo e interpretación de resultados, es decir, haciendo un análisis estadístico sobre las matrices que se obtuvieron de las bandas de la imagen, especificando el peso de cada una de ellas, se pudo determinar que era necesario y justificable aplicar esta técnica, finalmente se procedió a obtener los componentes principales, y luego a su respectiva reconstrucción de la imagen, esto con el fin de hacer una comparación entre imágenes originales y reconstruidas, tomando en cuenta el número de componentes a retener y finalmente se obtuvo como resultado la identificación de nubes en las imágenes satelitales. En la (fig. 3, 4) muestra a través de de diagramas generales la metodología para aplicar Análisis de Componentes Principales en imágenes satelitales, en este caso en una imagen

de la ciudad de Loja.

..

d

.) .

• _:f

1

1 -. 1

[image:39.584.115.483.362.687.2]

L

(40)

Definición de Área de Estudio

Adquisición de imagen (Bandas

flrininls

Comparación y Análisis Estadístico de

Selección de la bandas

Hprrmintas

Datos Estadísticos de cada Datos Estadísticos entre cada par

Banda (Máximo, Mínimo, Media cíe bandas (Matriz de

Desviación Estándar, Correlación, Diagramas de

Histogramas) Dispersión, Matriz de

Varianza-Covarianza).

Correlación

NO

SI

Aplicar Componentes Principales (Transformación de imagen o

f

lptp 'rit'rn rip r'.mhinr

B Bandas B Componentes

a I Matriz de

d 1

d n Autovectores

Matriz de

'

a Covarianza a

'u-1 Selección de Componentes a

1 utilizar

No aplicable el Análisis de Componentes

Principales

Criterios de Selección

• Diagrama de Porcentaje

de variación explicada.

• Elegir los componentes

cuyos autovalores son mayores que el autovalor promedio

• Elegir las componentes

cuyos coeficientes de correlación con las bandas son grandes en valor absoluto.

Reconstrucción de Bandas a Detecciónde cambios en Detección de nubes

partir de componentes imágenes satelitales

seleccionados

[image:40.584.108.528.78.710.2]

(41)

7eess// J

MODELO CARTOGRÁFICO PARA APLICAR ANÁLISIS DE COMPONENTES PRINCIPALES Y DETECCIÓN DE NUBES EN IMÁGENES SATELITALES

/IT7

~2

ACP

Banda 3•

/cP2/

SoecCi,n de Componentes

(Figura 3)

Transfonnaclón øeitctÑ d* bki. Dat*cclón da

da Imágenes *a imágmes nubes

ACP: Análisis de Componentes Principales. CPI: Componente Principal l.

CP2:Componente Principal 2. CP3:Componente Principal 3.

CPn: Componente Principal o

[image:41.583.99.529.171.421.2]

(De acuerdo al número de variables es el número de componentes).

FIG 4. Modelo Cartográfico para aplicar Análisis de Componentes Principales en imágenes satelitales

(42)

BAN

BANDA

EANCA2 ,///

BANDA

1

rn.Lt

m. ti. 5

ni. u. 4

3.2 FORMATO DE IMÁGENES

FIG 5: Organización de datos en una imagen satelital

Como ya se mencionó anteriormente, se necesita seleccionar la imagen satelital con la que se va a trabajar, luego se la almacena como una traducción numérica de la radiancia. Cada una de las parcelas en las que se divide el territorio observado constituye la unidad mínima de información en la imagen, que se denomina píxel [Chuvieco, 2002].

En la (fig. 3) se puede observar una esquematización de la organización de los datos de una imagen digital, la misma, se trata de una matriz numérica de tres dimensiones.

(43)

tí

Universidad Técnica Particular de Loja

Bandal Banda2 Banda3 Banda4 Banda5 Banda7 Pixel 1 ND11(1) ND11(2) ND11(3) ND11(4) ND11(5) ND1l(7)

píxel 2 ND12(1) ND12(2) ND12(3) NDI2(4) ND12(5) ND12(7)

Píxel 3 ND13(1) ND13(2) ND13(3) ND13(4) ND13(5) ND13(7)

Píxel n NDij(l) NDij(2) NDij(3) NDij(4) NDiJ(5) NDij(7)

Tabla 1: Organización de píxeles de cada banda en una imagen satelital

3.3 COMPARACIÓN Y SELECCIÓN DE HERRAMIENTAS

Hoy en día existen muchas aplicaciones que permiten obtener los Componentes Principales, en algunas de ellas se trabaja directamente con las imágenes, entre las más conocidas y eficientes en procesamiento de imágenes es Matlab, así como también ARGIS; en otras únicamente con el archivo de píxeles correspondientes a las imágenes como es Weka 3, lnfoStat.

MATLAB WEKA APLICACIÓN PCA

Visualización de SI NO NO

Imágenes

Obtención de SI SI SI

Píxeles

Archivos de trabajo Texto, xIs, mat .arff XIs

Análisis Estadístico Evaluación, Evaluación, preparación y Evaluación,

Visualización de visualización de datos y preparación y

datos y resultados resultados visualización de datos y

resultados

Reconstrucción de SI NO NO

Imágenes

rabia 2: Diferencia entre Weka y Matlab para aplicar ACP en imágenes satelitales

(44)

En primera instancia se ingresó los datos en Excel, con el fin de obtener un

archivo con extensión *csv, el mismo que es un formato delimitado por comas, para luego leerlo desde Weka; teniendo en cuenta que esta herramienta necesita datos de entrada sobre los que operarán las técnicas implementadas, se necesita un tipo de especifico denominado

Attribute-Relation File Format

(extensión "arif'). Al utilizar Excel se encontró un inconveniente al tratar de cargar los datos, ya que las matrices de píxeles es de 300*300 , dándonos cuenta que la totalidad de datos es de 90000 píxeles por cada banda, ya que se necesita vectorizar las matrices, y Excel solo permite guardar hasta 65536 filas, en tal circunstancia se determinó leer las imágenes desde Matlab y hacer el tratamiento de las matrices para poder transformarlas en una sola matriz de 90000 x 6, la cual se almacenó en un archivo de texto, que luego se lo convirtió al tipo de archivo ARFF, con el cual se obtuvo los componentes principales en Weka, los resultados que presenta esta herramienta son resultados numéricos. La forma de ordenamiento de los píxeles, de las imágenes anteriormente expuesto se lo tomó del libro de [González Et. al., 19961.

Antes de seleccionar la herramienta más eficiente para obtener los Componentes Principales se hizo la comparación de tres herramienta: Tabla 2,

(45)

-Análisis de Componentes Principales de variables en imágenes satelitales de la ciudad de Loja años 1995 y 2000

3.4 OBTENCIÓN DE CADA BANDA DE LA IMAGEN SATELITAL

SG

-a: Banda 1 b: Banda 2

c: Banda 3 d: Banda 4

[image:45.584.126.467.107.677.2]

e:Banda 5 f: Banda 6

(46)

La (fig. 4) corresponden a la imagen con la que se está trabajando en sus seis bandas espectrales (4a,4b,4c,4d,4e,4f), las mismas que a simple vista no son tan legibles, esto se da por la redundancia de datos que existe entre las bandas adyacentes, para verificar que esto es verdad, se ha desarrollado una metodología tanto para determinar, cuándo es factible aplicar el Análisis de Componentes Principales, como de ser así, mejorar el contraste de cada banda de la imagen, tomando en cuenta las bandas con mayor ponderación, es decir, aquellas que contiene la mayor información, así como la mayor variabilidad en sus datos.

3.4.1 DATOS ESTADÍSTICOS DE LAS BANDAS

En la Tabla 3, se observa los estadísticos descriptivos de cada una de las bandas, donde se describe el valor mínimo, el valor máximo, la media, la desviación estándar y la varianza de cada banda que intervienen en el estudio.

BANDAS MINIMO MAXIMO MEDIA DESVIACIÓN EST. VARIANZA

BANDAI 19

254

70.74

64.04 4101.54

BANDA2

13

254

77.88

56.95

3242.84

BANDA3

6

254

60.66

42.80 1831.87

BANDA4

20

254

70.86

64.16 4116.19

BANDA5

14

254

77.95 5705

3254.39

BANDA6

6

254

60.66

42.87 1837.73

Tabla 3: Descripción estadística de las bandas

(47)

3.4.2 MATRIZ DE CORRELACIÓN

Banda 1 Banda 2 Banda 3 Banda 4 Banda 5 Banda 7

Banda 1 1

Banda 2 _0.87 1

Banda 3 0.85 0.73 1

Banda 4 098 0.85 0.82 1

Banda 5 0.86 0.98

1'I

0.87

Banda 7 _0.84 _Ó.96 0.85

Tabla 4: Matriz de Correlación

La Tabla 4, contiene ya la primera aproximación a la existencia de relación entre las bandas, en donde se puede ver claramente que la mayor correlación se da entre las bandas

1

y 4; 2 y 5; 3 y 7; mientras que la menores correlaciones se da en entre las bandas 3 y 5; 5 y 7, así como también entre las bandas 2 y 7, por tanto estas bandas de menor correlación se las descarta para el estudio, ya que esto muestra claramente que existe una dispersión muy elevada. La matriz de Correlación se la obtuvo en la herramienta Matlab y en Weka, ver Anexos #

2y6.

3.4.3 DIAGRAMAS DE DISPERSIÓN ENTRE CADA PAR DE BANDAS

Los diagramas de dispersión dan el sentido y el grado de la correlación lineal

(48)

Diagrama de Dispersión entre Banda 1 y Banda 2

/

---l50

/

50 1( 150 200 -- 250 - 300

Banda 1

a: Dispersión Bandal y 1

Diagrama de Dispersión entre Banda 1 y Banda 3 300

250---200

-150-

-100

sol

O 50 lOO 150 200 250 300

Banda

c: Dispersión Bandal y 3

Diagrama de Dispersión entre Banda 1 y Banda 6 300

---250

-200

0 150 -10

100

0 50 100 150 200 250 300

Sondo 1

e: Dispersión Banda 1 y 5

250--

---200

150

lOO

50

0 50 100 150 200 250 300

0ds 1

b: Dispersión Banda 1 y 2 Diagrama de Dispersión entre Banda 1 y Banda 4 300

---250 -'

200

1 150

1::

frfr

0 50 100 150 200 250

Banda 1

d: Dispersión Bandal y4

Diagrama de Dispersión entra Banda 1 y Banda 7

300---250

1

-200

0150

-1

50 100 150 200 250 300

Banda 1

(49)

Diagrama de Dispersión entre Banda 2 y Banda 3 Diagrama de Dispersión entre Banda 2 y Banda 2

300

/

1

0--- --- ---0 50 100 150 200 250 300

Banda 2

g: Dispersión Banda 2 y 2

300

250

200

4

so

0 50 100 150 200 250 300

Borlds 2

i: Dispersión Banda 2 y 4

250

-200 -

-150

Á

100 -- 2

-'1 _.5'

150 200 250 300

k: Dispersión Banda 2 y 7

50 _.

4j

0 50 100 150 200 250 300

h: Dispersión Banda 2 y 3

250

200 _1'

en

-p10 - •

1:: 4 í..fl

-0 50 100 150 200 250 300

Banda 1

j: Dispersión Banda 2 y 5

01 - -

---0 50 lOO 150 250 255 300

Bod0 3

(50)

:::

250

1 200 - ¡

150 ₁₅₀

lo

50 1so

1, li 100 150 200 250 300 0 50 100 150 200 250 300

B.

m: Dispersión Banda 3 y 4

Diagrama do Dispersión entre Banda 3 y Banda 7 00

---250 --''- -,'•--' -.'

- ¡2

200

0 50

150

100

- ).:' fO

100 150 200 250 350

o: Dispersión Banda 3 y 7

Diagrama de Dispersión entre Banda 4 y Banda 300

--250

200

-E

1

0 50 100 150 200 250 300

Banda 4

q: Dispersión Banda 4 y 5 r: Dispersión Banda 4 y 7

6I1d3 3

n: Dispersión Banda 3 y 5

Diagrama de Dispersión entre Banda 4 y Banda 4

---ci

/ so

50 lOO 150 200 250 300

Bd3 4

p: Dispersión Banda 4 y 4

- -Diagrama de Dispersión entre Banda 4 y Banda 7 300

750

CD

50

0 ₅₀ ₁₀₀ ₁₅₀ ₂₀₀ ₇₅₀ ₃₅₀

(51)

300 --- - --

---5

V

0 50 lOO 150 200 250 300

s: Dispersión Banda 5 y 5

300

---250

'

-200

iso

-m---

-100- ---

-so

0 50

-

-10 150 200 250 300

t: Dispersión Banda 5 y 7

Diagrama de Dispersión entre Banda 7 y Banda 7

300---/ 100

50

- 50 IDO 150 200 250 300

u: Dispersión Banda 7 y 7

Figura 7: Diagramas de Dispersión entre cada par de Bandas

(52)

50 100 150 200 250 2000

1500 1000 500 o

0.98, 0.98 y 0.96. Los diagramas de dispersión que se los observan en la (fig. 5), se obtuvieron en la herramienta Matia y Weka; ver Anexos # _{2 y 6.}

3.5 HISTOGRAMAS

Los histogramas permiten deducir la tonalidad dominante, la amplitud está relacionada con el contraste y la presencia de picos relativos es un indicador de distintas coberturas [FERRERO Et al., 19991.

Uno de los factores de gran importancia para poder determinar si es aplicable la técnica de Análisis de Componentes Principales sobre las seis bandas satelitales, es obtener los histogramas de cada una de estas a objeto de poder corregir y/o mejorar la visualización y contrastibilidad de la imagen. Observando en la tabla estadística, que las bandas con mayor desviación estándar son las bandas 1, 2, 4 y 5, se puede corroborar dicho dato en (fig. 6a, 6b, 6d, 6e).

3.5.2 HISTOGRAMAS DE CADA BANDA DE LA IMAGEN SATELITAL

1400 1200 1000

E

200'

o

O 50 100 150 200 250

(53)

Análisis de Componentes Principales de variables en imágenes satelitales de la ciudad de Loja años 1995 _y2000

1200 1000 8 600 400 200

0 50 100 150 200 250

c: Histograma Banda 3

50 100 150 200 250

e: Histograma Banda 5

2000 1500 1000 500

o .

-0 50 100 150 200 250

d: Histograma Banda 4

1200 1000 800 400 200 o

0 50 100 150 200 250

f: Histograma Banda 6

140) 1200 1000 800 600 400 200 o o

Figura 8: Histogramas de cada Banda

(54)

El eje horizontal del histograma representa los niveles de reflectancia 4 de los píxeles de la imagen satelital según el tipo de cobertura del suelo y el eje vertical muestra la cantidad de píxeles para cada valor de gris. La gama se

extiende desde 0 (negro) a 255 (blanco) 5 [MENDOZA, 2005].

3.6 OBTENCIÓN DE COMPONENTES PRINCIPALES

Luego de hacer el estudio estadístico de cada banda de la imagen y de determinar de acuerdo al peso de cada banda (media, varianza, desviación estándar, histogramas, diagramas de dispersión); que es necesaria la aplicación de Análisis de Componentes Principales, se genera los componentes principales de las seis bandas, utilizando la herramienta Matlab y se obtuvo los siguientes resultados.

3.6.1 MATRIZ DE VARIANZA-COVARIANZA

Banda! Banda2 Banda3 Banda4 Banda5 Banda7

Banda! 4101.538

Banda2

3187.241

3242.842

Banda3

anda

2318.167 1779.496 1831.866

4015.168 3121.049 2252.806

4116,186

Banda5

3141.149 3169.595 1726.139 3201.411 3254.392

Banda7

2310.752 1764.937 1768.678 2329.831 1790.393 1837.733

Tabla 5: Matriz de Varianza-Covarianza

La Tabla 5 contiene las varianzas y covarianza de las seis bandas utilizadas; donde es claro observar que la mayor variabilidad de varianza se encuentran

Porcentaje de radiación incidente que es reflejada por una superficie bidimensional (Chuvieco, 2002, pag 572).

(55)

en las bandas 1, 2, 4 y 5 esto indica que el estudio se centrará en estás bandas para obtener los componentes principales.

3.6.2 AUTOVALORES Y AUTOVECTORES

Valor Proporción Proporción Acum

Bandal 16297.782 0.89 0.89

Banda2 1266.015 0.07 0.96

Banda3 584.565 0.03 0.99

Banda4 176.873 0.01 1.00

Banda5 36.723 2.0E-03 1.00

Bandal 22.598 1.2E-03 1.00

Tabla 6: Autovalores y porcentaje de la variación total

BANDAS Cl C2 C3 C4 C5 C6

Bandal 0.49 -0.15 0.45 0.50 -0.28 -0.45

Banda2 0.42 0.50 -0.30 0.41 -0.17 0.54

Banda3 0.29 -0.48 -0.45 0.28 0.63 -0.05

Banda4 0.49 -0.13 0.52 -0.43 0.28 0.45

Banda5 0.42 0.51 -0.24 -0.43 0.17 -0.54

Banda7 0.30 -0.47 -0.41 -0.36 -0.63 0.05

Tabla 7: Autovectores de las seis bandas

Los autovalores y los autovectores resumen la información en términos de variabilidad. Los autovectores constituyen un conjunto de vectores bases para graficar los datos y los autovalores representan la variabilidad de los datos en cada una de las direcciones dadas por los autovectores. Luego, los autovalores son medidas de variabilidad, mientras que los autovectores expresan la dirección de la variabilidad [Di RIENZO, Et. al., 20041.

(56)

la banda 3 y 7 son los valores negativos más altos. Con la información que proporcionan los autovectores se puede interpretar que la CPI opondrá que las bandas

1

y 4 contengan la mayor información. La ortogonalidad de los

componentes principales garantiza que la CP2 provee nueva información sobre variabilidad respecto a la provista por la CP1, es decir explica variabilidad en las bandas no explicada por la CPI [Di RIENZO, Et. al., 20041.

Los datos de varianza explicada son muy importantes para saber cuántos componentes principales se utilizará en el proceso de reconstrucción. No hay una regla definida sobre el número que se debe utilizar, con lo cual se debe decidir en función del número de variables iniciales y tres criterios que se especifican más adelante [Di RIENZO, Et. al., 20041.

Los autovalores calculados a partir de la matriz de varianza-covarianza se presentan en la Tabla 6. La última columna de la tabla muestra la proporción de vananza total explicada por cada una de los píxeles de las bandas y la varianza explicada acumulada. Los tres primeros componentes contienen el 96% de la variabilidad total, mientras que con las demás retienen en conjunto el 1% de la variabilidad. Como el objetivo es reducir la dimensionalidad de los datos, se podría pensar que los dos primeros componentes retienen en su mayoría la información [Di RIENZO, Et. al., 2004].

(57)

t 1,11U 11

t

1)t

Análisis de Componentes Principales de variables en imágenes satelitales de la dudad de Loja años 1995 y 2000

3.6.3 INTERPRETACIÓN COMOMPONENTES PRINCIPALES OBTENIDOS

Con el procedimiento respectivo, el cual se lo encuentra en el Anexo # 2; se obtuvo las siguientes componentes:

a: Componente 1 b: Componente 2

,1'• :.' ••

• '• •

(1 1

(58)

e: Componente5 f: Componente6

FIG 9: Imágenes de las Componentes principales

Las imágenes de los Componentes Principales (fig. 7), muestran claramente que la mayor parte de la información se la encuentra en la Componente 1 (fig. 7a), y en la Componente 2 (fig. 7b), pero algo muy interesante que se puede observar en los Componentes 3 y 4 (fig. 7c, 7d), es que se nota claramente de una forma resaltada la cubierta nival. Para demostrar lo expuesto anteriormente se obtuvieron los componentes principales en ARGIS y Matlab, y de acuerdo al análisis respectivo se pudo observar que la Componente 3 señala claramente las nubes, esto en un rango de píxeles de entre 99— 115, y mayor o igual a

221(Anexo # 2, Anexo # 7). Por lo tanto, se determinó que el Análisis de Componentes Principales permite detectar la presencia de nubes, con esto ya se puede enmascarar para aplicar un filtro, que permita levantar un polígono con el fin de marcar zonas que se encuentren en este rango de píxeles, y de esta manera colocar datos con valor O.

(59)

3.6.4 CORRELACIÓN DE LAS COMPONENTES CON LAS BANDAS ORIGINALES

BANDAS CPI CP2 CP3 CP4 CP5 CP6 Bandal -0.08 0.17 0.10 -0.03 -0.03

Banda2 -0.13 0.10 -0.02 0.05

Banda3 0.87 -0.40 -0.26 0.09 0.09 -0.01

Banda4 -0.07 0.20 -0.09 0.03 0.03

Banda5 -0.10 -0.10 0.02 -0.05

Banda7 0.88 -0.39 -0.23 -0.11 -0.09 0.01

Tabla 8: Relación de Componentes con Bandas Originales

La Tabla 8, indica la relación que existe entre los componentes principales y las bandas originales, donde se puede observar que la banda 1, 2, 4 y 5, son las que más contribuyen al componente 1 (p=0.95) que es mayor al promedio de aportación de cada banda; mientras que la banda 3 y 7 son los que menos contribuye (p=0.88); para el componentes 2, las bandas 2 y 5 aportan con una mínima información, la misma que es información que no se encuentra en la componente 1. Todas las bandas que aportan a los dos componentes principales que se eligieron (1, 2, 4, 5), son aquellas que según la matriz de varianza-covarianza (Tabla 5), tienen mayor varianza y por ende determinó una ponderación de estas. La Correlación entre bandas originales y componentes que se presenta en la Tabla 8, se las obtuvo en la herramienta estadística InfoStat [Di RIENZO, Et. al., 2004].

Dichos valores de se obtuvieron aplicando siguiente fórmula [FERRERO Et al., 1999]:

PYk, Xl

(60)

1 2 3 4 5 6

—.--Seriel

Donde:

ek: Autovector de la banda i del primer componente k.

Ákk. Autovalor correspondiente a los componentes obtenidos k.

0ii: Varianza de las bandas originales u.

3.6.5 CRITERIO PARA ELEGIR EL NÚMERO DE COMPONENTES A [IIIli

Luego de haber realizado todo el estudio estadístico, de cada banda y determinar los seis componentes principales, se elegirá el número de componentes principales para hacer la respectiva transformación y de esta manera eliminar información redundante; para tal objetivo presentan tres criterios estadísticos para decidir el número de componentes principales a ser usados [FERRERO Et al.,

1999].

(a) Graficar los porcentajes de variación total explicada por cada componente, y tomar en cuenta aquellos que se encuentran antes del punto de inflexión, de acuerdo con lo expuesto en este criterio y si se observa en la (fig. 8), se determina que se debe tomar los dos primeras componentes.

i 1

0.9

G) 0.7

. 0.6

.2 0.5_c 0.4 c 0.3 0.2 0.1 O

Componente

(61)

(b) Elegir los componentes cuyos autovalores son mayores que el autovalor promedio que en nuestro estudio es 3064, por lo tanto se toma las

dos primeras componentes

(c) Elegir las componentes cuyos coeficientes de correlación con las bandas son grandes en valor absoluto, para lo cual la Tabla 8 revela que la mayor correlación se encuentra en los dos primeros componentes principales, por lo tanto se tomará estas para hacer la respectiva reconstrucción de las bandas originales.

De acuerdo a lo que se ha mencionado anteriormente en los tres criterios, se decidió tomar las dos primeras componentes en vista de que se cumplió con los dos últimos criterios.

Habitualmente el Análisis de Componentes Principales (ACP) se emplea para sintetizar información, eliminando la redundancia en un conjunto de variables.

(62)

iJ

g o.

3

3.6.5.1 PLOT DE LAS COMPONENTES PRINCIPALES

-2.

-3.07 -0.04 2. 6.02 9.05

ci

Figura 11: PIot que contiene los dos Componentes Principales

PLOT elaborado en lnfoStat

En el piot que se gráfica en la (Figura 9), se puede ver la toda la información representada en las dos primera componentes, tomando en cuenta que en su mayoría la información se encuentra proyecta hacia los dos ejes, en este caso banda

1

y banda 4, todo esto ya se lo definió en las interpretaciones

estadísticas antes expuestas.

3.6.6 MARGEN DE ERROR

(63)

Análisis de Componentes Principales de vanables en imágenes satelitales de la ciudad de Loja años 1995 y 2000

3.7 IMÁGENES RECONSTRUIDAS

Llegando a la decisión de que se usará las dos primeras componentes principales, se procedió a reconstruir las imágenes, a partir de estas dos componentes principales (Anexo# 3), lo cual dio los siguientes resultados:

Figura a: Imagen reconstruidal Figura b: Imagen reconstruída2

2

(64)

Ç

#\

tA

f4

[image:64.583.330.458.101.236.2]

.(

[image:64.583.332.459.491.619.2]

Figura e: Imagen reconstruída5 Figura f: Imagen reconstruída6

FIG 12: Imágenes Reconstruídas

En las imágenes reconstruidas (fig. 10), se observa que ha habido un cambio en el contraste mostrando de una manera mucho más visible las imágenes ya que con la técnica de Análisis de Componentes Principales se redujo la dimensionalidad de los datos eliminando información redundante, la cual no permitía tener una mejor visibilidad en las imágenes originales.

3.8 DIFERENCIA ENTRE LAS IMÁGENES ORIGINALES Y LA IMÁGENES RECONSTRUIDAS

a: Diferencia entre imagen original 1 b. Diferencia entre imagen original 2

(65)

c: Diferencia entre imagen original 3 d. Diferencia entre imagen original 4

e imagen reconstruida 3 e imagen reconstruida 4

e: Diferencia entre imagen original 5 f. DiferenciaDiferencia entre imagen original 6

[image:65.583.126.468.91.512.2]

e imagen reconstruida 5 e imagen reconstruida 6

FIG 13: Diferencia entre imágenes reconstruidas e imágenes originales

En la (fig.

11),

se observa la diferencia entre las imágenes reconstruidas y las

(66)

50 100 150 200 250 1400 1200 1000 A 800 600 400 200

3.9 HISTOGRAMAS DE LAS IMÁGENES RECONSTRUÍDAS

HISTOGRAMA DE LA FIGURA 9 (e) 1500V 1000 A O 500 U -PECTANCLR

0 50 lOO 150 200 250

a: Histograma imagen reconstruida 1

HISTOGRAMA CORRESPONDIENTE A LA FIGURA ge

c: Histograma imagen reconstruida 3

HISTOGRAMA CORREPONDIENTE A LA FIGURA 9 (5)

I6OO - - -

-

1400--1200

91 1000

-:

400 200

o

ÇLECTANCIA

0 50 100 - 150 200 250

b: Histograma imagen reconstruida 2

HISTOGRAMA CORRESPONDIENTE A LA FIGURA 9d 1600

1400

1200 -

-A 1000

- 800-600

400,-200

-O_________

0 55 100 150 200 -- - 250

d: Histograma imagen reconstruida 4

HISTOGRAMA CORRESPONDIENTE ALA FIGURA 91 HISTOGRAMA CORRESPONDIENTE A LA FIGURA 80

1600

-1400

-1200

91 1000

A 800 600 400

200-o

.-,----2I1EPLECTANCIA

0 50 100 150 200 - 250

e: Histograma imagen reconstruida 5

1400

1200

1000

A 800

D O 600 400 200 U EFLECTANC0A

0 50 lOO 150 200 250

f: Histograma imagen reconstruida 6

[image:66.583.101.494.90.694.2]

(67)

En el apartado anterior se puede ver los histogramas correspondientes a cada

una de las componentes (fig. 12), los mismos que indican una mejor

dispersión de los datos, lo que quiere decir que los mismos se han distribuidos de una mejor forma, por lo tanto las nuevas imágenes tendrán una mejor legibilidad, esto dado que se ha hecho una nueva combinación lineal de los píxeles, eliminando de esta manera información no relevante y conservando casi en su totalidad la información que si es relevante.

Al finalizar todo el estudio se hizo una comparación de resultados en tres herramientas (Weka, Matlab, PCA) que se utilizó para obtener los componentes principales de las bandas satelitales Tabla 9; donde se puede ver que la proporción acumulada por los dos componentes principales obtenidos varía entre el 96% y 97%, que es aceptable en términos de teledetección. Hay que

tomar en cuenta que PCA retiene un 97% de la información, que resulta mejor

que Weka y Matlab, pero esto se debe a que al cargar los datos se tuvieron que recortar un buena porción debido a que Excel solo soporta 65536 filas y el

archivo de la matriz de los píxeles de 90000 x 6.

Matlab Weka PCA

Proporción Acumulada 89% 88% 94%

(Primer Componente)

Proporción Acumulada 98% 95% 97%

(Segundo Componente)

Tabla 9: Comparación de proporción acumulada por cada componente.

(68)

a los resultados obtenidos, a través la metodología antes mencionada, (Tabla 10).

Paper[CARAGUAY, Tesis Actual Stalin, 2006]

Herramientas Utilizadas Matlab, Weka Excel, Matlab, Weka,

ARGIS, InfoStat