Predicción Espacial para variables categóricas

3.3. La regresión-kriging en la clasificación de imágenes satelitales

3.3.3. Predicción Espacial para variables categóricas

Aunque la geoestadística se emplea principalmente para trabajar con las variables continuas, también se puede utilizar para predecir diversos tipos de variables categóricas o de tipo de clase. El análisis geoestadístico de variables categóricas es más conocido como geoestadística indicadora[79]. En la práctica, los cálculos que requiere el kriging indicador no suelen ser sencillos, lo que probablemente explica por qué no hay muchas aplicaciones de mapeo geoestadístico relacionadas con variables categóricas[80]. Por ejemplo, normalmente será difícil ajustar semivariogramas para las clases de menos frecuencia y que se presentan en lugares aislados (Figura 8d).

Figura 8. Dificultades para predecir los datos de clase punto (b) y (d), en comparación con las variables cuantitativas (a) y (c), es que la clase-interpoladores son típicamente más complejo y computacionalmente más tiempo[59].

Papritz[81] reconoce varias dificultades conceptuales al trabajar con los datos de tipo indicador: (1) el modelado inconsistente del semivariograma indicador, y (2) el uso de semivariogramas globales que conduce a predicciones sesgadas debido a que los residuos son, por definición, no estacionarios. Cualquier intento de utilizar kriging indicador para

datos con una tendencia aparente, ya sea explícita o implícitamente mediante el uso de un kriging indicador ordinario dentro de un vecindario, requiere modelar la no estacionariedad en los semivariogramas indicadores para garantizar que el error medio cuadrático de kriging sea óptimo. La regresión-kriging indicadora sin ninguna transformación también ha sido criticada porque el modelo (variable binomial) sugiere que los residuos tienen varianza media-dependiente ( ( )), y por lo tanto el uso de un solo semivariograma para el conjunto completo de residuos no va en línea con la teoría[81].

Denótense las observaciones de campo de una variable de tipo clase como

( ) ( ) ( ), donde son categorías discretas (o estados) y es el número total de clases. Una técnica que estima la clase desconocida en una ubicación

determinada ̂ ( ), dado el conjunto de datos de punto de entrada

( ( ) ( ) ( )), puede ser llamado interpolador tipo de clase. Si espacialmente los predictores (donde es el número de predictores) están disponibles, estos pueden ser utilizados para mapear cada categoría sobre el área de interés. Hasta el momento, hay un número limitado de técnicas que puedan lograr esto:

 Cokriging Multi-indicador: El básico kriging multi-indicador también se puede extender a un caso en el que se utilizan varios covariables para mejorar las predicciones. Esta técnica se conoce con el nombre de cokriging indicador[82]. Aunque la teoría matemática está bien explicada por Bierkens & Burrough[79], Goovaerts[74] y Pardo-Igúzquiza & Dowd[83], la aplicación es engorrosa pues es necesario ajustar un gran número de funciones de covarianza cruzadas.

 Regresión multinomial log-lineal: Esta es una generalización de la regresión logística para situaciones en las que hay varias clases de una variable objetivo[84]. Cada clase tiene un conjunto separado de coeficientes de regresión ( ). Debido a que los valores observados son iguales a 0 o 1, los coeficientes de regresión deben resolverse a través de un algoritmo iterativo de máxima verosimilitud[85], esto hace que todo el método sea un poco más exigente computacionalmente que una simple regresión múltiple.

 Regresión-kriging de indicadores: Un enfoque para interpolar las variables categóricas es primero asignar membresías a puntos observados y luego interpolar cada membresía por separado. Este enfoque fue elaborado por primera vez por De Gruijter et al[86] y luego aplicado por Bragato[87] y Triantafilis et al[88]. Una

alternativa hacer un mapeo sencillo pero descriptivas, determinar distancias y luego clasificarlo por píxel en un SIG[89].

En el caso de la regresión logística, la probabilidad de observar una clase ( ) en nuevas ubicaciones se calcula como:

̂ ( ) [ ( )] ₍₅₂₎

donde ̂ ( ) son las probabilidades estimadas para la clase ( ) en una nueva ubicación y es el número de clases. La regresión logística multinomial se puede extender también a la regresión-kriging. Esto significa que el modelo de regresión se complementa con el modelado de semivariogramas para residuos de la regresión, que luego de ser interpolada y se añade de nuevo a la estimación de regresión. Así que las predicciones se obtienen mediante[59]:

̂ ( ) [ ( )] _̂ ₍ ₎ ₍₅₃₎

donde ̂ son los residuos interpolados. La extensión de la regresión multinomial a la regresión-kriging no es tan simple como parece. Esto se debe a los valores estimados en nuevas ubicaciones en la (Ec. 53) están limitados dentro de un rango indicador, lo que significa que la interpolación de los residuos puede dar lugar a valores fuera del rango físico (<0 o >1). Una solución a este problema es predecir la parte tendencia en el espacio transformado, luego interpolar los residuos, sumar la tendencia y parte residual y volver a transformar los valores[59].

Hengl et al[90] muestran que la membresía ( ), en lugar de los indicadores, son más adecuados tanto para la regresión y el modelamiento geoestadístico, hecho que ha sido confirmado por otros autores como McBratney et al[91], De Gruijter et al[86];. Triantafilis et al[88]. Las membresías pueden ser linealizadas directamente a través de la transformación logit:

( ) (54)

donde son los valores de membresía utilizadas como entrada a la interpolación. Luego todos los valores ajustados estarán dentro de un rango físico (0-1). Las predicciones de la membresía para la clase en nuevas ubicaciones son obtenidas utilizando el modelo estándar de regresión-kriging:

( ) ̂ ( ̂) (55)

Después los valores interpolados pueden volver a transformarse al rango de la membresía utilizando[92]:

̂ ( ) ( )

( ) (56)

En el caso de la regresión-kriging de membresías, tanto la dependencia espacial como la correlación con los predictores se modelan de una manera estadísticamente sofisticada. Además, la regresión-kriging de membresías permite el ajuste de cada clase por separado, lo que facilita la comprensión de la distribución de las variables y la identificación de las clases problemáticas, es decir, clases que no están correlacionados con los predictores o no muestran ninguna autocorrelación espacial, etc[59].

La predicción espacial de la membresía puede ser excesiva en tiempo de cálculo. Otro problema es que, si las clases interpoladas (probabilidades, membresías) son ajustadas

solamente usando los datos de la muestra, las predicciones de las

probabilidades/membresías no serán sumadas a la unidad en nuevas ubicaciones. En este caso, es necesario estandarizar los valores de cada nodo de la red por medio dividiendo los valores originales por la suma de las probabilidades/membresías para garantizar que estos se suman la unidad, que es una solución ad-hoc. Un algoritmo, tal como la composición de regresión-kriging tendría que ser desarrollado[59].

In document Clasificación de Cobertura del Suelo sobre Área Urbana a partir de Imágenes Satelitales de Mediana Resolución Empleando Regresión kriging: una Comparación con otros Métodos no Convencionales (página 60-64)