El mejor estimador lineal insesgado (MELI) para datos espaciales

3.3. La regresión-kriging en la clasificación de imágenes satelitales

3.3.1. El mejor estimador lineal insesgado (MELI) para datos espaciales

espaciales

Retomando conceptos presentados en el Capítulo 1, en el enfoque geoestadístico clásico, las predicciones se hacen comúnmente mediante el cálculo de algunos promedios ponderados de las observaciones:

̂( ) ∑ ( )

(34)

donde ̂( ) es el valor predicho de la variable de objetivo en una ubicación desconocida , los datos de la muestra están dados por ( ) ( ) ( ). Los pesos se obtienen de manera que la varianza de error de predicción se reduce al mínimo, considerando que los pesos dependen de la estructura de autocorrelación espacial de la variable. Esto fue lo que se definió previamente como kriging ordinario[53].

Matheron[54] propuso que el valor de una variable objetivo en alguna ubicación puede ser modelado como una suma de los componentes determinístico y estocástico:

( ) ( ) ( ) (35)

A esto lo denominó modelo universal de la variación espacial, en el cual tanto la componente determinista como la estocástica de la variación espacial pueden ser modeladas por separado.

Con base en lo anterior surge una alternativa al método kriging, es el enfoque de regresión, que hace predicciones modelando la relación entre las variables objetivo y auxiliares en las ubicaciones muestreadas, y aplicando el modelo en ubicaciones desconocidas utilizando el valor conocido de las variables auxiliares en esos lugares[55].

Comúnmente los predictores auxiliares son parámetros de la superficie de la tierra, imágenes de teledetección, y geológica, el suelo y mapas de uso del suelo[56]. Un enfoque común de regresión es la regresión lineal múltiple, donde la predicción es de nuevo una media ponderada, esta vez de los predictores:

̂( ) ∑ ̂ ( ) ( )

donde ( ) son los valores de las variables auxiliares en la ubicación objetivo, ̂ son los coeficientes de regresión estimados y es el número de predictores o variables auxiliares[57, 58].

Figura 6. Ejemplo esquemático del concepto de regresión-kriging[59]

La regresión-kriging combina estos dos enfoques: la regresión se utiliza para ajustar la variación objetivo, esto es la variación explicada, y kriging simple con valor esperado 0 se utiliza para ajustar los residuos, es decir, la variación no explicada[60]. En otras palabras la regresión resuelve los coeficientes del modelo de deriva o tendencia, mientras que los residuos son interpolados con un método kriging, para ser añadidos a la deriva del modelo; aquí, la dificultad es la obtención de coeficientes de regresión imparciales en presencia de auto-correlación espacial de los residuos:

̂( ) ̂( ) ̂( ) ∑ ̂ ( ) ∑ ( )

(37)

donde ̂( ) es la deriva ajustada, ̂( ) es la interpolación residual, ̂ son los coeficientes ajustados del modelo de deriva ( ̂ es el intercepto estimado), son pesos kriging determinados por la estructura de dependencia espacial de los residuales y ( )es el residual en la ubicación [16]. Los coeficientes de regresión ̂ pueden estimarse a partir de la muestra por algún método apropiado, por ejemplo, mínimos cuadrados

ordinarios (MCO) o, de manera óptima, utilizando mínimos cuadrados

generalizados (MCG), para tomar la correlación espacial entre las observaciones individuales en cuenta:

̂ ( ₎ ₍₃₈₎

[ ( ) ( ) ( ) ( )]

donde ̂ es el vector de coeficientes de regresión estimados, es la matriz de covarianza de los residuales, es una matriz de predictores en las ubicaciones muestreadas, y es el vector de valores de medición de la variable de objetivo[16]. Una vez la tendencia ha sido estimada, los residuos se interpolan con kriging y se añaden a la tendencia estimada. En notación matricial, esto se escribe como:

̂( ) ̂ ( ̂ ) (39)

donde ̂( ) es el valor predicho en la ubicación , es el vector de predictores de orden y es el vector de pesos kriging utilizados para interpolar los residuos[61]. La (Ec. 39), en términos estadísticos, es el MELI[62].

La estimación de los residuos es un proceso iterativo: en primer lugar el modelo de deriva es estimado usando mínimos cuadrados ordinarios (MCO); a continuación, la función de covarianza de los residuales se utiliza para obtener los coeficientes de MCG; éstos se pueden utilizar para volver a calcular residuales y así sucesivamente[63].

Aunque muchos expertos recomiendan como este proceso iterativo como el más adecuado, Kitanidis[64] mostró que el uso de la función de covarianza derivado de los residuos MCO (es decir, una única iteración) es a menudo satisfactorio, ya que no es lo suficientemente diferente de la función derivada después de varias iteraciones para afectar la interpolación kriging.

La relación de adición de la ecuación (Ec. 37) se extiende a las varianzas también. Por lo tanto, el error de predicción es la suma de error de predicción del error de deriva y el kriging de los residuos. El error está dado entonces por:

( ) { ̂( )} { ̂( )} (40)

donde { ̂( )} es el error de predicción de la deriva y { ̂( )} es la varianza obtenida al aplicar el método kriging sobre los residuos[65]. La (Ec. 40) también puede ser llamada como la varianza compuesta. Si los coeficientes del modelo de deriva se estiman utilizando MCO, la covarianza entre los residuos y la deriva estimada se supone que es cero. Por lo tanto, la varianza compuesta se puede calcular usando:

( ) ( ⏟ ) { ̂( )}

_⏟ ( ₎ { ̂ ( )}

donde es el vector de predictores en lugar no observado y es el vector de covarianza en la nueva ubicación:

{ ( ) ( )} (42)

Esta es una solución sub-óptima ya que la estimación MCO debe ser sustituida por la estimación MCG de la deriva para obtener una estimación insesgada de coeficientes. En el caso de la estimación vía MCG, utilizamos los residuos para estimar los coeficientes de deriva y por lo tanto la covarianza entre la deriva estimada y los es diferente de cero. Una fórmula utilizada comúnmente para calcular la varianza del error de predicción, tanto para la deriva como para los residuos, y dar cuenta de covarianza entre la estimación de deriva y residuales es la varianza del kriging universal[16]

( ) ( ) ₍ ₎ ₍ ₎ ₍ ₎ ₍₄₃₎

La (Ec. 43) se parece mucho a la (Ec. 41), excepto que dará valores ligeramente, más bajos[63].

La varianza del kriging universal es, de hecho, presentada como la varianza de predicción del error [66]

( ) 〈{ ̂( ) ( )} 〉 { ( )} { ̂( ) ( )} { ̂( )} (44)

( ) ( ) (45) Siendo es:

[ ( ₎ ₍ _)] ₍₄₆₎

El supuesto asumido por la regresión-kriging es que no hay dependencia espacial entre la variable auxiliar y los residuales de la regresión lineal de la variable a predecir sobre la variable auxiliar en el mismo punto[67]. La varianza del kriging universal es igual a la varianza del error de predicción de un modelo de regresión si no hay correlación espacial entre los residuos (efecto pepita puro). Por lo tanto, puede ser reducir a la matriz identidad:

[

y es el vector cero, por lo tanto la varianza de kriging universal se reduce a:

( ) ( ) ( )

(48)

( ) ( ) ( ) ( ) (49) y siendo ( ) ( ) , la varianza del kriging universal se reduce a:

( ) [ ( ) ] (50) que es igual al error de predicción alrededor de la línea de regresión[68].

La expresión { ̂( )} en la (Ec. 41), en términos de regresión lineal, es equivalente a la curvatura ponderada de los intervalos de confianza de todo el hiperplano de regresión. En el caso multivariado, el error de regresión en todo el hiperplano de regresión se vería así:

{ ̂( )} ∑ ( ̅ )

∑ ∑ ( ̅ ) (51)

donde ̅ es la media ponderada de los valores predichos. Por lo tanto, a partir de la (Ec. 51) se infiere que la incertidumbre de la predicción aumentará a medida que el nuevo punto se localiza más lejos de los puntos de observación y geográficamente más lejos del centro del espacio característico[63].

In document Clasificación de Cobertura del Suelo sobre Área Urbana a partir de Imágenes Satelitales de Mediana Resolución Empleando Regresión kriging: una Comparación con otros Métodos no Convencionales (página 53-57)