5. Manejo de datos espaciales
5.3. Creación de superficies continuas a partir de datos puntuales
En este punto se explicarán los métodos de creación de superficies continuas para mapear la variación de atributos sobre el espacio. Las fuentes de datos comúnmente son observaciones en una distribución de muestras de puntos dispersos, como pozos en el subsuelo, perfiles de suelo, estaciones meteorológicas o presencia/ausencia de datos de vegetación o conteo de animales, personas o puntos de venta de productos para unidades espaciales básicas, como mallas de puntos o áreas administrativas. Los resultados normalmente son interpolados a mallas regulares y pueden ser representados como mapas con una paleta de escala de colores o tonos de grises o por líneas de color. Se describen las estrategias de muestreo espaciales y métodos de predicción espacial incluyendo métodos globales de clasificación y regresión y métodos de interpolación locales determinísticos. Los modelos digitales de elevaciones y ortofotomapas están examinados como casos especiales de superficies continuas.
M.D.E. original
M.D.E. tratados con filtros de paso bajo
de 3x3
M.D.E. tratados con filtros de paso bajo
de 5x5
M.D.E. tratados con filtros de paso bajo
de 7x7
M.D.E. tratados con filtros de paso alto
Juan Peña Llopis
• Interpolación. Fuentes y métodos de interpolación.
La interpolación es el procedimiento para predecir el valor de los atributos en sitios donde no se ha muestreado, a partir de medidas realizadas en localizaciones puntuales en el mismo área o región. La predicción del valor de un atributo en sitios fuera del área de recubrimiento, a partir de observaciones existentes se denomina extrapolación.
La interpolación se utiliza para convertir datos desde observaciones puntuales a campos continuos, así pues, los patrones espaciales muestreados por estas medidas pueden ser comparados con los patrones espaciales de otras entidades espaciales. La interpolación es necesaria en los siguientes casos:
La superficie discreta tiene diferente nivel de resolución, tamaño de celda u orientación desde donde se requiere. Consiste en la conversión de imágenes escaneadas (documentos, fotografías aéreas o imágenes de sensores remotos) de una malla de teselación con un tamaño y/o orientación dado a otro. Este procedimiento se conoce generalmente como convolución.
La superficie continua se representa por un modelo de datos que es diferente de los requeridos. Son las transformaciones de superficie continua de un tipo de teselación a otro. Por ejemplo, conversión T.I.N. (Triangulated Irregular Network) a ráster o ráster a T.I.N. o polígono vectorial a ráster.
Los datos no cubren el ámbito de interés completamente. Se trata de las conversiones de datos de conjuntos de muestras puntuales que se discretizan en una superficie continua. Se deben distinguir situaciones con muestreos densos y dispersos o datos recogidos a lo largo de amplios transectos. Los muestreos densos son comunes cuando se crean superficies hipsométricas para representar variaciones en la elevación de la superficie del terreno (M.D.E.), a partir de fotografías aéreas e imágenes de satélite donde la fuente de datos es barata y los atributos se pueden observar directamente. Los muestreos dispersos se han impuesto por el coste de tediosos análisis de laboratorio y estudios de campo, la variación espacial de los atributos de interés no puede ser vista y debe ser derivada indirectamente.
Las superficies continuas obtenidas de la interpolación pueden ser usadas para superponer mapas en un S.I.G. o ser representadas como tales. Estas superficies pueden estar constituidas por modelos de datos de líneas de contorno, mallas de celdas regulares (rásters) o por redes de triángulos irregulares. Como consecuencia de que las superficies interpoladas varían continuamente sobre el espacio, las interpolaciones en las mallas regulares deben estar representadas por una estructura de datos en la cual cada celda o píxel puede tomar un valor diferente, pero tiene el inconveniente de la cantidad de espacio que ocupa en memoria.
Sistemas de Información Geográfica aplicados a la gestión del territorio
Los datos originales pueden aparecer como muestras puntuales distribuidas regularmente o irregularmente en el espacio (y/o tiempo), y éstas pueden tomarse de superficies en malla de celdas, como las imágenes de sensores remotos e imágenes escaneadas. Los atributos predichos mediante la interpolación se expresan generalmente como los mismos tipos de datos que se han medido, pero algunos métodos de interpolación proporcionan medidas para estimar funciones indicadoras que muestren la probabilidad de que el valor dado sea excesivo o que pueda ocurrir.
Fuentes de datos para la interpolación:
Las fuentes de datos para superficies continuas incluyen:
Estereofotopares aéreos o imágenes satélite superpuestas usando fotogrametría. Escáners en satélites o aviones y documentos escaneados.
Muestras puntuales de atributos medidos directamente o indirectamente en el campo en muestras aleatorias, estructuradas o de patrones lineales, como los transectos regulares o contornos digitalizados.
Mapas de polígonos digitalizados.
La mayor parte de los datos de interpolación vienen del muestreo de un complejo patrón de variación mediante pocos puntos. Cuando los datos están muy dispersos es muy útil obtener información de los procesos físicos o fenómenos que causan el patrón, y sirven para realizar la interpolación. En la mayoría de casos, sin embargo, el proceso físico es desconocido y se deben tomar varios tipos de suposiciones sobre la naturaleza de la variación espacial del atributo en cuestión.
La localización de los puntos de muestreo puede ser crítica para la realización de los análisis. Idealmente, para conseguir un mapeo representativo, los muestreos deberían estar localizados sobre todo el área. Un muestreo completamente regular puede tener prejuicios, sin embargo, si éste coincide en frecuencia con el patrón regular del paisaje, como las zonas de drenaje entre árboles, no será muy correcto. Por esta razón los estadísticos han preferido tener algún tipo de muestreo aleatorio para calcular medias y varianzas libre de fallos.
En la Figura 5-11 se presentan las principales opciones disponibles. Un buen compromiso entre muestreos aleatorios y regulares está proporcionado por el muestreo aleatorio estratificado, donde los puntos individuales están localizados en sitios aleatorios dentro de estratos regulares. El muestreo anidado o de cluster, puede ser utilizado para examinar la variación espacial a escalas diferentes. El muestreo en transecto regular se utiliza con frecuencia para estudiar perfiles de ríos, playas y laderas de colinas. Digitalizar líneas de contorno es un método común de muestreo de mapas impresos para crear modelos digitales del terreno (M.D.E.).
Juan Peña Llopis
Figura 5-11. Diferentes tipos de muestreos para adquirir datos espaciales puntuales.
Métodos para la interpolación:
Los métodos de interpolación se dividen en:
¾ Métodos globales: clasificación usando información externa, superficies de tendencia en coordenadas geométricas, modelos de regresión y métodos de análisis espectral.
¾ Métodos locales determinísticos: métodos de polígonos Thiessen, ponderación lineal y de la inversa de la distancia.
Todos estos métodos son relativamente directos, requiriendo sólo el entendimiento de los métodos estadísticos determinísticos o simples. Estos métodos están frecuentemente incluidos en el S.I.G. comercial, aunque los métodos de operación rara vez están dados. Los interpoladores globales utilizan todos los datos disponibles para proporcionar predicciones en todo el área de interés, mientras que los interpoladores locales operan dentro de una zona pequeña alrededor de los puntos que van a ser interpolados para asegurar que las estimaciones están hechas solo con los datos de localizaciones en las inmediaciones de los vecinos, y ajustando lo mejor posible.
Los interpoladores globales son los más utilizados, no para interpolación directa, sino para examinar y eliminar los efectos de variaciones globales causados por las tendencias principales o la presencia de varias clases de terrenos que indiquen distintos valores promedio. Una vez los efectos globales se han tomado con cuidado, los residuales de las variaciones globales se pueden interpolar localmente.
Los métodos globales son usualmente más simples de calcular y con frecuencia están basados en ideas estadísticas como el análisis de la varianza y la regresión.
Muestreo aleatorio
Muestreo regular Muestreo en transecto
Muestreo en contorno Muestreo anidado
o de cluster Muestreo aleatorio
Sistemas de Información Geográfica aplicados a la gestión del territorio
Métodos globales:
Predicción global usando modelos de clasificación: cuando los datos espaciales son escasos y dispersos es conveniente asumir que las observaciones que se toman desde una población estadísticamente estacionaria (la media y varianza de los datos son independientes tanto de la localización como del tamaño del área). Si se opta por lo anterior, se selecciona automáticamente una aproximación clasificadora de la predicción espacial, implicando que la estructura espacial de la variación está determinada por estas unidades definidas externamente. Se escoge la clasificación, y se pueden calcular las predicciones usando un análisis de la varianza conocido y estándar. La clasificación por polígonos homogéneos asume que la variación dentro de una unidad es menor que entre unidades; los cambios más importantes tienen lugar en los límites. Este modelo conceptual se utiliza comúnmente en el cartografiado del suelo y del paisaje para definir "homogéneas" unidades del suelo, unidades del paisaje, ecotopos, etc. donde los "objetos" han sido reconocidos como características útiles para tener información sobre otros aspectos del paisaje.
El modelo estadístico más simple es el modelo ANOVAR:
donde la z es el valor del atributo en la localización x0, µ es la media general de z sobre el dominio de interés, αk es la desviación entre µ y la media de unidad k, y ε es el error residual, conocido a veces como ruido.
Las suposiciones que tiene este modelo son: (a) las variaciones del valor z dentro del mapa son aleatorias, (b) todas las unidades mapeadas tienen la misma varianza (ruido) dentro de los polígonos, (c) todos los atributos están normalmente distribuidos y (d) todos los cambios espaciales tienen lugar en los límites, los cuales son finos y no graduales.
Interpolación global utilizando superficies de tendencia: este método se utiliza cuando la variación de un atributo ocurre continuamente sobre un paisaje y éste se puede modelizar por una superficie matemática. Hay varias maneras de realizar el modelo: todos ellos ajustan las observaciones de los puntos de datos a algunas ecuaciones polinomiales, con lo cual los valores de las localizaciones sin muestrear se calculan a partir de sus coordenadas.
La forma más simple de modelizar las variaciones espaciales es por una regresión múltiple de los valores de los atributos enfrentados a su localización geográfica. La idea es ajustar una línea o superficie polinomial, dependiendo de si los datos de origen están en 2 ó 3 dimensiones. Se asume que las coordenadas espaciales (x,y)
son variables independientes, y que la z, es el atributo de interés, la variable
dependiente z está normalmente distribuida. También, se asume que los errores de
regresión son independientes de la localización, lo cual no siempre ocurre.
Juan Peña Llopis
Como un simple ejemplo, se considera el valor de un atributo ambiental z que ha sido medida a lo largo de los puntos x1, x2, xn en un transecto. Si, aparte de la variación, el valor z se incrementa linealmente con la localización x, su rango de
variación puede ser aproximado por un modelo de regresión:
donde b0 y b1 son los coeficientes polinomiales conocidos respectivamente como la intersección y la pendiente en una regresión simple. El residual ε (el ruido) se asume normalmente distribuido e independiente de los valores x.
En la mayoría de circunstancias z no es una función lineal de x, pero puede variar de
una forma muy complicada, como los modelos cuadráticos o incluso de orden superior:
Con el incremento del número de términos es posible ajustar cualquier conjunto de puntos mediante una curva complicada, de este modo reduciendo la ε a cero.
En 2 dimensiones los polinomios derivados por regresión múltiple en coordenadas x e y son superficies de la forma de la siguiente función, en el que los 3 primeros son:
{
}
∑
≤ + = p s r s r rs x y b y x f ( , ) ( · · )El entero p es el orden de la superficie de tendencia. Hay P = (p+1 ) (p+2 )
coeficientes que están normalmente elegidos para minimizar
{
}
2 1 ) ( ) (∑
= − n i i i x f x zdonde x es el vector notación para (x,y). Entonces, un plano horizontal es de orden cero, un plano inclinado es de primer orden, una superficie cuadrática es de segundo orden y una superficie cúbica con 10 parámetros de tercer orden. Encontrar los coeficientes bi es un problema estándar en la regresión múltiple, de este modo los cálculos son fáciles con paquetes estadísticos estándares.
La ventaja de los análisis de superficie de tendencia reside en ser una técnica que es superficialmente fácil de entender, al menos con respecto al tipo de superficie que se tiene que calcular.
En la Figura 5-12 se muestran dos ejemplos de interpolaciones globales con superficies de tendencia que se obtienen a partir de puntos o líneas.
z(x) = b0 + b1x + ε
z(x) = b0 + b1x + b2x2 + ε
b0 uniforme
b0 + b1·x + b2·y linear
Sistemas de Información Geográfica aplicados a la gestión del territorio
Figura 5-12 . Interpolación de superficies de tendencia con datos puntuales y lineales.
Predicción espacial utilizando regresión global en los atributos: Las coordenadas geográficas y sus atributos asociados pueden ser combinados en una regresión que utilice la mayor cantidad de información posible de los datos. Un punto importante a tener en cuenta es que el modelo de regresión tiene un sentido físico, por lo tanto se puede considerar que los modelos de regresión tienen interpoladores inexactos. El modelo de regresión se suele presentar de la siguiente forma:
En la Figura 5-13 se representa un ejemplo en el que las variables independientes son la distancia a las vías de acceso, la precipitación y el número de habitantes, y la variable dependiente es la concentración de zinc. Estos métodos de regresión múltiple están disponibles en la mayor parte de los paquetes estadísticos.
El mismo procedimiento puede ser utilizado con cualquier grupo de variables independientes y dependientes, como la temperatura con la altitud, la precipitación con la distancia al mar, la composición de la vegetación como una función de la humedad, etc.
Mapa de datos puntuales Mapa de datos lineales
Mapa TIN interpolado Mapa ráster interpolado
z(x) = b0 + b1P1 + b2P2 + ε donde b0 ... bn son coeficientes de regresión y
Juan Peña Llopis
Figura 5-13. Resultados de la regresión múltiple.
Métodos locales:
Todos los métodos presentados hasta ahora habían impuesto una estructura espacial global externa en la interpolación. En todos los casos, el corto rango de las variaciones locales había sido descartado como ruido aleatorio y sin estructura. Intuitivamente, estos métodos no son sensibles, como se espera que el valor de un punto sin visitar sea similar a los valores medidos directamente. Por lo tanto, los usuarios, científicos y desarrolladores han buscado métodos locales para la interpolación que utilicen directamente la información desde los puntos de datos más cercanos. Para esta aproximación, la interpolación tiene que tener en cuenta: (a) la definición de puntos vecinos alrededor de los puntos a predecir, (b) la búsqueda de puntos de datos dentro de los puntos vecinos, (c) la elección de una función matemática para representar la variación sobre un número limitado de puntos (d) la evaluación de los puntos sobre una malla regular. El procedimiento se repite hasta que todos los puntos de la malla han sido calculados.
Los siguientes puntos tienen que ser tomados en cuenta a la hora de utilizar un interpolador local:
El tipo de función de interpolación que se use. El tamaño, forma y orientación de los puntos vecinos El número de puntos de datos
La distribución de los puntos de datos: malla distribuida regular o irregularmente La posibilidad de incorporación de la información externa en las tendencias. Se pueden examinar los puntos en distintas funciones de interpolación, específicamente:
1) Los vecinos más cercanos (los polígonos de Thiessen o Voronoi). 2) La ponderación de la inversa de la distancia.
3) Las láminas y otras funciones no lineales (ej. Laplace). 4) Las funciones óptimas utilizando covariación espacial.
ZINC = - 0.0992*DIST.VIAS - 0.0253*PRECIP + 0.2424*NºHAB + 87.0431
Mapa de cantidad de Zn en el suelo (ppm)
Mapa de distancias a las vías de acceso (m)
Mapa de precipitaciones (mm)
Mapa del número de habitantes por provincia
= ++
Sistemas de Información Geográfica aplicados a la gestión del territorio
• Modelos Digitales de Elevaciones (M.D.E.).
Los Modelos Digitales de Elevaciones (M.D.E.) son un caso especial de una superficie continua interpolada con gran cantidad de usos en un S.I.G. Los M.D.E. fueron calculados inicialmente como un precursor de los ortofotomapas, pero a día de hoy tienen gran cantidad de aplicaciones:
• Almacenar datos de elevación de mapas topográficos digitales en bases de datos nacionales.
• Crear ortofotomapas digitales y analógicos.
• Aclarar problemas en el diseño de carreteras y otros proyectos de ingeniería civil o militar.
• Representar tridimensionalmente el terreno para propósitos militares y para el diseño de paisajes y planificación.
• Analizar la visibilidad en el campo.
• Planificar rutas de carreteras, localización de presas, etc.
• Realizar análisis estadísticos y comparación de diferentes tipos de terreno.
• Fuente de datos para mapas derivados: orientaciones, insolación, pendiente, perfil de la curvatura, modelización de hidrología y ecología.
• Como una base sobre la que representar información temática para combinar los datos de relieve con datos temáticos como suelos, usos del suelo, o vegetación. • Proporcionar datos para la simulación de modelos de paisajes y procesos de
paisajes.
La variación de elevación en la superficie de un área puede ser modelizada de muchas maneras. Los M.D.E. pueden estar representados por imágenes de superficies, puntos o líneas definidas matemáticamente. Las líneas suelen utilizarse para representar los contornos o isolíneas, y características críticas como ríos, sierras, líneas de costa y cortados en la pendiente. En los S.I.G. los M.D.E. suelen estar modelizados por mallas regulares (matrices de altitud) y red de triángulos irregulares o TIN. Las dos formas son interconvertibles y la preferencia de una u otra depende del tipo de análisis de datos que se necesite realizar.
Las matrices de altitud son la forma más común de superficie de elevación discreta. Originalmente, éstas han derivado de medidas cuantitativas de fotografías aéreas estereoscópicas creadas en restituidores espaciales analíticos. Alternativamente, la matriz de altitud puede ser producida por interpolación de puntos espaciados irregularmente o regularmente de la misma forma que otros datos cuantitativos.
Juan Peña Llopis
Debido a su facilidad de uso, las matrices suelen ser manejadas en el ordenador, en particular en S.I.G., basadas en formatos ráster, como el Idrisi. Utilizando las paletas de colores adecuadas se pueden mostrar convenientemente los cambios de altitud, y mediante vistas tridimensionales se puede mostrar el aspecto del relieve desde cualquier punto de vista y de este modo conocer de forma general la estructura del territorio. A continuación se ha creado un ejemplo en el que a partir de las curvas de nivel se han interpolado y se ha obtenido un mapa de superficie continua que es el M.D.E. (ver
Figura 5-14) y posteriormente se puede representar en tres dimensiones.
Figura 5-14. Creación de un modelo digital de elevaciones (M.D.E.).
A partir de los M.D.E. se suelen derivar gran cantidad de mapas, como pueden ser: mapa de pendientes, mapa de orientaciones, mapa de iluminación, mapa de campo de visión, mapa de características topográficas, etc. (ver Figura 5-15). De aquí la importancia que tienen los M.D.E. a la hora de extraer gran cantidad de información.
Figura 5-15. Tipos de mapas que se pueden extraer de un M.D.E.
Mapa de curvas de
nivel o isolíneas digital de elevacionesMapa del modelo Representación tridimensional del modelo digital de elevaciones
Interpolación
Mapa de pendientes Mapa de orientaciones Mapa de iluminación Mapa de escorrentía
Sistemas de Información Geográfica aplicados a la gestión del territorio
• Red de triángulos irregulares.
Aunque, las matrices de altitud son útiles para calcular contornos, ángulos de pendientes, mapas de iluminación y delineación automática de cuencas, el sistema de malla regular también manifiesta desventajas. Estos inconvenientes incluyen:
Gran cantidad de datos redundantes en áreas de terreno uniforme.