LECCIÓN 27: INTRODUCCIÓN: BASES DE DATOS GEOGRÁFICAS
OBJETIVOS DE LA LECCIÓN:
Comprender como se produce la transformación de objetos del mundo real a entidades del S.I.G.
Repasar y afianzar los conceptos de Naturaleza de los Datos Geográficos y sus Componentes y como inciden estos en la Base de Datos Geográfica.
Aplicar algunos de los conceptos aprendidos para las Bases de Datos en las Unidades 1, 2 y 3 para el caso de las Bases de Datos Geográfica y más específicamente de la Base de Datos Gráfica o Espacial.
1.- INTRODUCCIÓN: LA BASE DE DATOS GENÉRICA
En lecciones anteriores se han estado describiendo las Bases de Datos en las que se guardarán los “datos geográficos”. Sin embargo, esta descripción ha sido realizada de forma completamente general, es decir, se ha descrito cómo son, se ha indicado qué operaciones se pueden realizar, y todo ello se ha explicado para una serie de “modelos” o “tipos” de Bases de Datos, haciendo mayor hincapié en uno de los modelos más usado actualmente, el modelo relacional. Sin embargo, lo dicho es válido tanto para una base de datos geográfica como para cualquier otra base de datos (comercio, gestión de personal, etc.).
En esta lección que nos ocupa trataremos de adecuar los conocimientos generales sobre las Bases de Datos a la aplicación concreta de las Bases de Datos Geográficas que necesitamos para la constitución de un S.I.G., estudiando sus particularidades, no sólo en función de la naturaleza un tanto especial de los datos geográficos sino también en función del modelo de datos elegido o usado para su representación y tratamiento.
2.- DE LA REALIDAD AL S.I.G. : SÍNTESIS E INTERPRETACIÓN
Una de las primeras preocupaciones que se plantean en el estudio de los Sistemas de Información Geográfica es cómo representar la realidad del territorio dentro del sistema, y la resolución a ese problema es precisamente una de las características diferenciales de los Sistemas de Información Geográfica.
Antes de llegar a sistematizar los datos en las tablas antes descritas, es imprescindible realizar una profunda reflexión sobre los propios datos. Necesitamos realizarnos preguntas como ¿Qué quiero representar del mundo real? ¿Bajo que punto de vista realizo el trabajo? ¿Con que nivel de detalle voy a trabajar? etc.
Para la realización de esta tarea es necesario el desarrollo de varios procesos intelectuales que pueden separarse en fases, según Comas y Ruiz (1993) pueden ser:
REALIDAD GEOGRAFICA VISION A VISION B VISION C M O D E L O C O N C E P T U A L MODELO LÓGICO MODELO FÍSICO
Figura 27.1. Fases del Proceso de representación de la realidad en el S.I.G. (Tomado de Comas y Ruiz, 1993, pag. 96)
En la figura anterior, la línea de puntos gruesa representa el paso a un formato digital y por tanto este es el comienzo del tratamiento informático. Por otra parte, no es objetivo de este curso llegar a desarrollar los aspectos técnicos hasta el límite de comprender y diseñar el modelo físico de la Base de Datos, por lo que en los procesos anteriores únicamente llegaremos al Modelo Lógico.
La primera y segunda fases, es decir, hasta obtener el Modelo Conceptual, son bastante generales, y pueden ser comprendidas incluso con independencia de los matices que luego se tratarán sobre los dos modelos conceptuales más importantes, el raster y el vector.
En el desarrollo de dichas fases, intervienen dos procesos fundamentales, el de
síntesis y el de interpretación.
En primer lugar, se debe realizar una ardua labor de síntesis, puesto que el territorio que se quiere representar suele ser tan complejo, variado y rico en matices que no es posible, ni recomendable, tratar de reproducir dicha complejidad en el sistema.
Por otra parte, se realiza una labor de interpretación, ya que en función del objetivo del trabajo, es decir, del punto de vista, o del nivel de detalle con el que se desarrolle, el objeto real se convertirá en una u otra entidad del sistema y con unas u otras propiedades.
Así pues, ante todo y en primer lugar, se realiza una lectura del territorio bajo un determinado punto de vista y cumpliendo unas condiciones. Estos procesos de síntesis e interpretación son los que permiten la representación de dicho territorio y su gestión el sistema.
Para ilustrar el proceso que se acaba de describir se utilizará el ejemplo de un objeto real : la Carretera Nacional I Madrid-Burgos.
Este es un objeto de la realidad territorial con un sin fin de características y una enorme complejidad como objeto real: desde características técnicas de las distintas capas que componen el firme, hasta su trazado, afecciones socio-económicas etc.. Dicho objeto puede ser analizado según distintos puntos de vista o requerimientos de distintos Organismos o Administraciones; según la interpretación de esa realidad, se introducirán en el sistema unas u otras entidades y con unas u otras propiedades almacenadas, lo dicho se resume en el siguiente gráfico:
Figura 27.2. De la Realidad al Modelo Conceptual del S.I.G. : Síntesis e Interpretación.
Es decir, a través de unos procesos de síntesis e interpretación se obtienen entidades del Sistema que representan los objetos de la realidad territorial que se desea estudiar. No se debe olvidar que no se trabaja en el Sistema con dicha realidad, sino con una representación de la misma realizada en función de un modelo conceptual elegido.
3.- DEFINICIÓN DE LA BASE DE DATOS GEOGRÁFICA. MODELO LÓGICO
Así pues, los datos son la representación concreta de hechos y constituyen el antecedente necesario para el conocimiento de un fenómeno (Comas y Ruiz 1993), según esta definición se deben buscar datos que representen la realidad del territorio de forma concreta y adaptada a las necesidades del sistema; y cuando se obtenga un conjunto de datos relacionados entre sí se habrá obtenido una base de datos.
Se denomina como Base de Datos Geográfica al conjunto de datos que definen la representación concreta del territorio que se quiere estudiar. Esta base de datos geográfica está constituida por Datos Geográficos, que son, por su propia naturaleza, variados y complejos. Se ha estudiado ya la Naturaleza de los Datos Geográficos (ver Lección 3), y también las distintas Componentes de los Datos Geográficos (ver Lección 4), pero en esta y sucesivas lecciones se estudia cómo
CARRETERA NACIONAL I MADRID-BURGOS
El objeto real con todas sus características y hecho diferencial: tramos, circulación accidentes, tráfico de mercancías, firmes buen y mal estado etc. REALIDAD Estudio de la Accidentalidad en función de la densidad de tráfico SÍNTESIS - INTERPRETACIÓN Tramos de carretera representados por segmentos lineales
Datos sobre accidentes en cada tramo
Datos sobre intensidad de tráfico en cada tramo
S.I.G.
Tramos de carretera representados por areas de polígonos
Datos sobre fecha de revisión
Datos sobre estado del firme y tipo y superficie a reponer Presupuesto y
planificación del parcheado del firme
describir y almacenar la información relativa a dichas Componenetes de los Datos Geográficos en la Base de Datos.
Recordemos cuales son las Componentes de los Datos Geográficos, según Gutierrez y Gould (1994) : Componente espacial Localización Geográfica Propiedades Espaciales Relaciones Espaciales Componente temática
Autocorrelación espacial y temporal Tipos de variables y escalas de medidas Componente temporal
Cuando nos referimos a la Base de Datos Geográfica, nos referimos a tener almacenados y estructurados datos suficientes para describir y definir cada uno de estos componentes. En el apartado anterior se ha expuesto cómo llegar a una modelización conceptual de la realidad a representar, ahora se trata de definir en que “lenguaje expresar” este modelo conceptual para crear un modelo lógico.
Si bien hasta ahora hemos tratado el tema de una forma genérica, para todos los casos, para todos los modelos, independientemente de los recursos, para definir el
modelo lógico es necesario describir algunas diferencias entre los dos modelos conceptuales principales, el raster y el vector, estas diferencias se tratarán en cada momento de la explicación cuando surga la necesidad.
Por otra parte, se considera útil ilustrar esta exposición teórica con un ejemplo concreto, aunque simplificándolo todo lo posible en aras de su mayor capacidad didáctica. Se desea estudiar la disminución de la erosión, y la evolución de una zona concreta en una cuenca hidrógrafica en función de las repoblaciones de masas
forestales realizadas en una época determinada. La representación sobre un mapa de los distintos elementos de esa realidad geográfica, podría ser:
Polígonos:
Zonas de Vegetación, Límites administrativos etc.
Líneas:
Carreteras, Ríos etc.
Puntos:
Manantiales, arbóles singulares etc.
Figura 27.3. Componenetes de los Datos Geográficos y su representación.
Analizemos brevemente cada uno de los componentes de los datos geográficos.
La componente temporal es esencial en el análisis y la interpretación de la realidad que se desea estudiar. Es imprescindible pues, describirla en la base de datos, ya que la realidad territorial es, en parte, lo que el tiempo ha querido que sea; los geográfos clásicos franceses afirmaban que “la Historia explica el presente” (Gutierrez y Gould, 1994). En muchos casos, conocer el año, la estación climátológica o incluso la fecha y hora en la que han sido tomados los datos que describen un determinado fenómeno es fundamental para el sistema.
Así en el ejemplo de la figura 27.3., es imprescindible el conocimiento del año en el que se realiza la toma de datos, puesto que para el estudio a realizar deberán compararse datos anteriores y posteriores a las distintas repoblaciones realizadas.
Sin embargo, la representación del tiempo supone un grado de complejidad añadido que es difícil de manejar y que, hasta el momento, no ha sido solucionado de forma satisfactoria (Aronoff, 1989). Una de las formas más sencillas de considerar esta
componente consiste en fijarla. Es decir, se describen todas las demás componenetes en un determinado momento del tiempo, y para considerarlas en distintos momentos, se vuelven a describir para otro momento diferente. Por esta razón, la consideración de la dimensión temporal en un SIG supone la necesidad de almacenar y tratar grandes volúmenes de datos, ya que cada estrato de información se debe almacenar tantas veces como momentos temporales se consideren (Gutierrez y Gould, 1994).
En el modelo lógico la componente temporal no tiene pues una representación concreta, sino que será recogida como análisis o variación, mediante comparación de todas las demás.
La componenete temática recoge las características propias de los objetos reales que se desean representar. Estas características reciben el nombre de
atributos temáticos, o simplemente atributos, y aunque caracterizan los objetos reales, evitan expresamente recoger las características de los mismos que pueden ser consideradas como componente espacial. Su función consiste en describir detalladamente la realidad que se pretende estudiar con el prisma adecuado. Como ya se ha dicho, son muchas las características que de cualquier realidad se pueden extraer y probablemente no sería posible tratar de recoger todas ellas de forma exhaustiva, sin embargo, los atributos temáticos pretenenden únicamente describir la realidad a estudiar según un enfoque o visión concreta de la misma.
Así, en el caso propuesto, serían atributos temáticos, por ejemplo: de los manantiales, el caudal continuo emergente; de las areas de vegetación la especie o mezcla de ellas que la constituyen, la densidad de las mismas y su estado fitosanitario; del río, en cada tramo, el caudal transportado, la velocidad del agua, el contenido en sedimentos, grado de contaminación etc.
La modelización lógica para esta componente de los datos geográficos es sencilla y se recoge fácilmente en tablas de una base de datos relacional, almacenando cada característica citada en un campo de la tabla, y recogiendo valores para cada uno de los registros, que como se ve representan los distintos objetos, así, en el caso propuesto, las tablas de atributo podrían ser las que se representan en la figura 27.4.
Tabla de áreas de vegetación Tabla de Manatiales
Tabla de tramos del río
_id caudal velocidad sedimentos contam.
tramo 1 41.6 8.3 26.3 BAJO
tramo 2 35.2 2.1 36.9 ALTO
....
tramo n 52.1 1.7 85.2 MEDIO
_id especie densidad estado
area 1 A 102.5 BUENO area 2 B 125.3 MALO .... area n A 133.8 MEDIO _id Caudal Manantial 1 10 Manantial 2 12.3 .... Manantial n 21.5
Figura 27.4. Componenetes de los Datos Geográficos y su representación.
Esta ejemplificación del modelo lógico tiene validez tanto para el modelo conceptual raster como para el vector, si bien, es conveniente aclarar, que en función de su misma esencia, hay muchas diferencias entre uno y otro.
En el modelo vectorial se eligen las entidades que representan los objetos en función de sus propiedades, sin embargo, en el modelo raster las entidades que representan los objetos lo hacen atendiendo únicamente a su posición.
Realizando una explicación rápida, como es sabido, (ver Lecciones 13 y 14), el modelo vectorial representa objetos de la realidad en función de entidades gráficas simplificadas que pueden ser: puntos (representarían los manantiales), arcos – líneas (representarían los tramos del río) y polígonos (representarían las áreas con disntinta vegetación), luego en las tablas descritas, cada fila o registro se relaciona con una
entidad que a su vez representa un determinado objeto real (mediante una relación biunívoca). En cambio en el modelo raster se describe toda la realidad territorial a través de celdillas, que van tomando distintos valores (manantial, río, vegetación) en función de la posición que ocupen en el espacio
Así, en el modelo vectorial las entidades, por ejemplo arcos, representan un objeto real único, el río, y se elige aquella entidad (línea) que agrupa las propiedades que interesan del río. Sin embargo, en el modelo raster, las entidades son siempre celdillas, y es precisamente la posición de la celdilla la que decide si representa uno u otro objeto real, así, si se elige una celdilla cuya posición es plenamente coíncidente con el río esta celdilla llevará asociados los atributos propios del río en esa posición, sin embargo, si la posición de la celdilla es tal que es plenamente coíncidente con un manantial, la celdilla describiría otro objeto real completamente diferente, y llevaría asociados los atributos propios de los manantiales
Modelo Raster:
Entidad del sistema = celdilla
Objeto real no coindente con entidad
Modelo Vector:
Entidad del sistema = punto/arco/polígono Objeto real coindente con entidad
ENTIDAD
_id Atributo1 Atributo2 .... Atributo n.
registro 1
registro 2
....
registro n
Figura 27.5. Tabla de atributos. Relación entre registro y entidad en modelo raster/vector.
En la figura 27.5 trata de reflejarse de una manera gráfica la relación entre registro de la tabla y entidad del sistema, así como entre campo y atributo recogido. (Se hace hincapié en la difrencia entre los modelos conceptuales).
Así pues, si realizamos una adaptación al modelo raster, en las tablas descritas antes, cada registro se correspondería también con una entidad del sistema, pero en este caso, la entidad es una celdilla, por lo que la correspondencia del registro con el objeto real no es biunívoca; cada celdilla se corresponde con un objeto real, pero cada objeto real no se corresponde con una sola celdilla sino con varias.
Es al tratar el modelo lógico de la Componente Espacial cuando se hace inevitable realizar diferencias muy significativas entre los dos modelos conceptuales principales, raster y vector. La componente espacial describe tres aspectos fundamentales de los objetos reales que son : la localización geográfica, las propiedades espaciales de cada objeto, y las relaciones espaciales existentes entre distintos objetos.
La localización geográfica en el modelo vectorial depende de las entidades que son puntos, líneas o polígonos, su localización geográfica es sencilla almacenando las coordenadas x e y (en su caso z) de los puntos en una tabla; así, la localización de las entidades punto vendrá determinada por dicha tabla, la de las líneas será un poco más compleja puesto que para determinarla se necesitarán las coordenadas de dos puntos inicio y final del segmento de línea, un arco complejo estará definido por un conjunto de segmentos, y por fín, un polígono quedará definido por un conjunto de arcos, en todos los casos, el problema se reduce a guardar coordenadas de puntos en una tabla.
En el modelo raster, la localización geográfica depende de cada celdilla, de manera que lo que se guarda, también en una tabla, es el número de fila y de columna para cada una. Además por otra parte se almacenan las coordenadas de un punto representativo de la celdilla (alguno de sus vértices o el punto central), así como la información para definir la posición de dicho punto respecto a la celdilla y las dimensiones de ésta, lo que equivale a situar el conjunto de celdillas sobre un sistema de referencia.
En el caso del modelo vector, las propiedades espaciales de los objetos (longitud de una carretera, superficie de un lago), vendrán representadas por las propiedades de las entidades correspondientes, así en una entidad arco – línea se
puede identificar su longitud, su dirección, su pendiente etc., en una entidad polígono serán el área, el perímetro, la forma, la pendiente, la orientación etc.. En el caso del modelo raster, todos los objetos son de igual forma y tamaño, las celdas o teselas, y pueden ser tratados a efectos de sus propiedades espaciales como si fueran polígonos. Igual que en el caso de la localización geográfica, todos los datos de las propiedades espaciales se almacenan fácilmente en tablas de una base de datos.
Las relaciones espaciales, son aquellas que mantienen los objetos reales entre sí, su almacenamiento en el SIG le proporciona una de sus mayores potencialidades, ya que permite generar información en formas explícitas requeridas por el usuario que no permite ningún otro sistema de los afines al SIG como pueden ser las Bases de Datos o los Sistemas CAD o de Cartografía automática. Estas relaciones son extremadamente complejas y numerosas, pero aún así, podemos realizar una clasificación en dos grandes grupos: las relaciones que pueden expresarse de forma cualitativa y no dependen de criterios o referentes establecidos por el usuario, relaciones topológicas, y aquellas que se expresan de forma cuantitativa y cuyo cálculo se realiza atendiendo a unas consideraciones previas propuestas por el usuario, relaciones geométricas. Ejemplo de las primeras: conectividad, un segmento de línea y otro están conectados si tienen un nodo o punto en común, esto representa dos carreteras que tienen un cruce, no posible p.e. en autovías; ejemplo de las segundas: proximidad, el pueblo se encuentra próximo a la carretera comarcal si la distancia que los separa (a través de carretera local o camino) es menor de un kilómetro.
En el modelo lógico, la existencia, el almacenamiento y la adecuada gestión de todas estas relaciones espaciales en la Base de Datos, es lo que va a permitir los potentes procesos de análisis y cálculos a realizar por el SIG. Es precisamente la forma en la que puede crearse este modelo lógico para el conjunto de la componente espacial el tema que se desarrolla en el siguiente epígrafe.
4.- COMPONENTES DE LA BASE DE DATOS GEOGRÁFICA
Como se ha dicho ya, uno de los objetivos de esta lección consiste en la aplicación o particularización de los conocimientos adquiridos de una forma un poco
más general en las Lecciones anteriores, esta particularización es la Base de Datos Geográfica.
Se realizarán en este apartado algunas reflexiones sobre temas que ya se han estudiado, analizandolos bajo el punto de vista de su aplicación directa a una Base de Datos Geográfica.
En primer lugar, y de lo que se deduce de lo expuesto en apartados anteriores, se puede decir que la Base de Datos Geográfica se compone a su vez de otras bases de datos, que siempre relacionadas entre sí, describen el conjunto de los componentes de los datos geográficos.
Es importante en cualquier caso, comprender e identificar como única la Base de Datos Geográfica. Aunque como ahora veremos muchos de los SIG crean, gestionan y mantienen distintas bases de datos para los distintos componentes en el modelo conceptual, la Base de Datos Geográfica es única y describe perfectamente, de acuerdo a los requerimientos del sistema, los objetos reales que se pretenden gestionar con el mismo.
Como se ha visto en el apartado anterior, la Base de Datos Geográfica describe los componentes geográficos, por lo que se trata de una base de datos normalmente compleja. Esta base de datos suele estar estructurada y, en la mayoría de los sistemas, se prefiere separala en varias bases de datos relacionadas entre sí pero que se guardan y gestionan de forma independiente.
Así, y debido a la diferencia sustancial expresada antes respecto a la componente gráfica o espacial de los datos geográficos, según se trate del modelo raster y el modelo vector, es muy habitual que la Base de Datos Geográfica se separe en dos componentes, la Base de Datos Temática o de Atributos y la Base de Datos Gráfica o Espacial.
En la figura 27.6 se realiza un a descripción de los componentes de la base de datos geográfica, y se ilustra para un modelo vectorial que a su vez gestiona una Base
de Datos de Modelo Híbrido (se denomina de modelo híbrido precisamente por esta característica de gestionar la base de datos de atributo y la gráfica de forma separada).
BASE DATOS GEOGRÁFICA
_id Atributo 1 Atributo 2 ... Atributo n T 1 V11 V12 ... V1n T 2 V21 V22 ... V2n .... T n Vn1 Vn2 ... Vnn TABLA DE LOCALIZACIÓN BASE DATOS ATRIBUTO BASE DATOS GRÁFICA TABLA DE PROPIEDADES ESPACIALES TABLA DE RELACIONES ESPACIALES T1 T2 T3 T4
Figura 27.6. Componentes de la Base de Datos Geográfica.
Normalmente el usuario tiene a la vista el primer nivel de las componentes, es decir, visualiza la base de datos de la componente temática en forma de tabla, en la que los distintos atributos se recogen en campos y los registros representan entidades del sistema, que adquieren diferentes valores alfanuméricos para los diversos atributos. Sin embargo, la base de datos gráfica o espacial se suele visualizar a través de un entorno específico, y se gestiona como tales entidades gráficas, es decir, si el usuario requiere cambiar por ejemplo la localización de una entidad puntual, no manipula directamente la tabla de localización, sino que desplaza mediante una herramienta gráfica la entidad, y es el sistema, en una operación oculta al usuario el que modifica las coordenadas en la tabla de localización.
Lo que se acaba de describir corresponde con un modelo de base de datos híbrido, en el que a cada entidad espacial le corresponden un registro en la base de datos temática y otro en la base de datos gráfica, relacionados entre ellos y con la entidad espacial a través del identificador “id”.
Este sistema se utiliza por algunos de los más potentes sistemas, como ARC/INFO y MGE, por ejemplo ARC/INFO utiliza INFO, ORACLE, INGRES etc. para la gestión de la base de datos de atributos, mientras que la base de datos gráfica se gestiona internamente por el módulo ARC.
Las ventajas de este sistema se concretan fundamentalmente en:
1. gestionar de manera independiente la información gráfica, que por su propia naturaleza se gestiona dificilmente en un entorno de base de datos convencional
2. las modificaciones en las tablas de la base de datos son realizadas por el sistema, con operaciones “ocultas” al usuario
Según Aronoff (1991), existen dificultades importantes para tratar la información espacial:
1. Los registros de datos gráficos tienen una longitud variable (distinto número de puntos para definir una línea o el perímetro de un polígono), sin embargo, los sistemas de gestión de bases de datos trabajan con registros de longitud fija
2. Se requiere el manejo de conceptos espaciales tales como la proximidad, conectividad, superposición
3. El propio sistema necesita capacidades puramente gráficas que normalmente no son soportadas por los sistemas de gestión de bases de datos convencionales.
No obstante, es importante resaltar que otros sistemas, entre los que se van contando los más modernos, utilizan el Modelo de Datos Integrado en lugar del Modelo de datos híbrido, que consiste en almancenar en una misma base de datos (generalmente relacional) ambos tipos de datos, e implementar al gestor de base de datos funciones gráficas específicamente desarrolladas.
RESUMEN
Una de las primeras preocupaciones que se plantean en el estudio de los Sistemas de Información Geográfica es cómo representar la realidad del territorio dentro del sistema. Para ello, se debe realizar en primer lugar, una ardua labor de
síntesis, puesto que el territorio que se quiere representar suele ser tan complejo, variado y rico en matices que no es posible, ni recomendable, tratar de reproducir dicha complejidad en el sistema. En segundo lugar, se realiza una labor de interpretación, ya que en función del objetivo del trabajo, es decir, del punto de vista, o del nivel de detalle con el que se desarrolle, el objeto real se convertirá en una u otra entidad del sistema y con unas u otras propiedades. Una vez obtenidas las entidades que representan los objetos hemos definido el modelo conceptual.
Cuando nos referimos a la Base de Datos Geográfica, nos referimos a tener almacenados y estructurados datos suficientes para describir y definir cada una de las componentes de los datos geográficos. Una vez definido el modelo conceptual es necesario definir el modelo lógico, este modelo presenta diferencias según que el modelo conceptual elegido sea raster o vector.
Base de datos única que se puede desglosar según las componentes de los Datos Geográficos:
BASE DATOS GEOGRÁFICA
TABLA DE LOCALIZACIÓN BASE DATOS ATRIBUTO BASE DATOS GRÁFICA TABLA DE PROPIEDADES ESPACIALES TABLA DE RELACIONES ESPACIALES TABLA DE ATRIBUTOS