• No se han encontrado resultados

Modelos de representación de información geográfica

N/A
N/A
Protected

Academic year: 2020

Share "Modelos de representación de información geográfica"

Copied!
213
0
0

Texto completo

(1)

Universidad Nacional del Sur

Tesis de Magister en Ciencias de la Computaci´

on

Modelos de Representaci´

on

de Informaci´

on Geogr´

afica

Mar´ıa Mercedes Vitturini

Bah´ıa Blanca

Argentina

(2)
(3)

Universidad Nacional del Sur

Tesis de Magister en Ciencias de la Computaci´

on

Modelos de Representaci´

on

de Informaci´

on Geogr´

afica

Mar´ıa Mercedes Vitturini

Bah´ıa Blanca

Argentina

(4)
(5)

Prefacio

Esta Tesis es presentada como parte de los requisitos para optar al grado acad´emico de Magister en Ciencias de la Computaci´on, de la Universidad Nacional del Sur, y no ha sido presentada previamente para la obtenci´on de otro t´ıtulo en esta Universidad u otras. La misma contiene los resultados obtenidos en investigaciones llevadas a cabo en el De-partamento de Ciencias e Ingenier´ıa de la Computaci´on, durante el per´ıodo comprendido entre el 1 de noviembre de 2002 y el 24 de diciembre e 2010, bajo la direcci´on del Dr. Pablo R. Fillottrani, Profesor Asociado del Departamento de Ciencias e Ingenier´ıa de la Computaci´on y la Dra. Silvia M. Castro, Profesora Titular del Departamento de Ciencias e Ingenier´ıa de la Computaci´on.

Mar´ıa Mercedes Vitturini

mvitturi@cs.uns.edu.ar

Departamento de Ciencias e Ingenier´ıa de la Computaci´on Universidad Nacional del Sur

(6)
(7)

UNIVERSIDAD NACIONAL DEL SUR

Secretar´ıa General de Posgrado y Educaci´on Continua

(8)
(9)

Agradecimientos

A mis directores de tesis, Dr. Pablo R. Fillottrani y Dra. Silvia M. Castro por su generosidad, capacidad y experiencia cient´ıfica brindadas en un marco de confianza y afecto.

Al jurado, Dr. Marcelo A. Falappa, Dr. Daniel E. Riesco y Dra. Aurora Vizca´ıno por la dedicaci´on y valiosas devoluciones.

A las autoridades y directivos del Departamento de Ciencias e Ingenier´ıa de la Compu-taci´on y de la Direcci´on General de Sistemas de Informaci´on por alentar, comprender y permitir que trabaje en este proyecto.

A mi amiga y compa˜nera de trabajo Mg. Karina M. Cenci por su ´animo, presencia y colaboraci´on desinteresada leyendo y corrigiendo este trabajo de tesis.

Al Ing. Carlos J. Matrangolo y personal t´ecnico del Centro Cient´ıfico Tecnol´ogico CONICET de Bah´ıa Blanca que hicieron posible el desarrollo de la defensa mediado por video conferencia.

Al personal administrativo del Departamento de Ciencias e Ingenier´ıa de la Compu-taci´on por su disposici´on, colaboraci´on y calidez humana.

A mi familia y amigos por su comprensi´on y compa˜n´ıa en todo momento.

A mis compa˜neros de trabajo del Departamento de Ciencias e Ingenier´ıa de la Compu-taci´on y de la Direcci´on General de Sistemas de Informaci´on que me brindan cotidiana-mente la oportunidad de crecer compartiendo la actividad profesional.

A mis padres y mi hermano que me acompa˜nan y est´an siempre presentes.

A mis sobrinos Juan, Ramiro, Tom´as y Violeta que alegran mi vida.

(10)
(11)

Resumen

Los primeros sistemas automatizados que usaron informaci´on geogr´afica datan de los ’70. Desde esa ´epoca y hasta ahora se crean aplicaciones para satisfacer las necesidades de diversos ´ambitos de uso y problemas variados incluyendo: metereolog´ıa, planeamiento urbano, transporte, servicios ambientales, turismo, distribuci´on econ´omica, etc. Entre sus usuarios se cuenta a organizaciones estatales y gubernamentales, educativas y de investigaci´on, industriales y comerciales.

Representar informaci´on geogr´afica es un problema complejo, se necesita mantener referencia a una o m´as ubicaciones de la superficie de la Tierra y eventualmente se puede requerir de propiedades geom´etricas. La informaci´on geogr´afica que modela a los fen´ ome-nos del mundo real se organiza en dos abstracciones: el modelo discreto que considera al espacio y sus objetos, y el modelo continuo que imagina al espacio formado por posicio-nes junto con las propiedades que las describen. Originalmente cada soluci´on result´o en un sistema de informaci´on que administra datos espaciales desarrollado en base a una tecnolog´ıa, jurisdicci´on y empresa, y generalmente no interoperable con otros sistemas. En las ´ultimas d´ecadas, con la explosi´on de los sistemas distribuidos y las redes globales, ha crecido el inter´es por facilitar la interoperabilidad, reutilizaci´on e integraci´on de da-tos espaciales. Para muchos sistemas, incorporar tecnolog´ıas con gesti´on de informaci´on geogr´afica resulta un valor agregado que no hab´ıa sido considerado previamente, como es el caso de los servicios basados en ubicaci´on.

(12)
(13)

Abstract

First automated systems working with geographic information date back to the ’70s. Since then, several applications have evolved to satisfy the needs of different areas, like meteorology, urban planning, transport, environmental services, tourism, economic distri-bution, etc. Among its users are state and governmental organizations, educational and research institutions, industry and commerce.

Finding ways for representing geographic information is a complex problem. Geograp-hic data have references to one or more locations of the Earth’s surface and eventually may require to include geometric properties. Models to represent geographic information about real-world phenomena are organized in one of two abstractions: discrete model, which considers the space and its objects, and continuous model, which imagines the spa-ce as formed by positions with properties that describe them. First information systems with the capacity of managing spatial data were restricted to a certain technology, juris-diction and business rules, and in general were not interoperable with other systems of the same kind. In the last few decades, due to the explosion of distributed systems and global networks, a strong interest in providing interoperability, reuse and integration of spatial data have emerged. Nowadays, for many systems incorporating technologies with geographic information management is an added value that was not previously considered, like is the case of location-based services.

(14)
(15)

´

Indice general

´Indice general VII

´Indice de figuras XIII

´Indice de cuadros XVII

1. Introducci´on 2

1.1. Contexto . . . 2

1.2. Objetivos . . . 5

1.3. Propuesta de investigaci´on . . . 6

1.4. Organizaci´on . . . 8

1.5. Resumen de las contribuciones . . . 9

2. Fundamentos de Bases de Datos Geogr´aficas 11 2.1. Niveles de abstracci´on . . . 12

2.2. Modelos conceptuales para sistemas geogr´aficos . . . 14

2.2.1. Modelo de datos geogr´afico . . . 14

2.2.2. Modelos para esquemas de aplicaci´on geogr´aficos . . . 16

2.3. Modelos l´ogicos para informaci´on geogr´afica . . . 24

2.3.1. Modelo mosaico . . . 25

(16)

2.4.1. Tipos de Datos Abstractos Espaciales . . . 31

2.4.2. Operaciones espaciales . . . 31

2.5. Resumen del cap´ıtulo . . . 34

3. Sistemas de Informaci´on Geogr´afica 37 3.1. La tecnolog´ıa SIG . . . 38

3.1.1. Alcance y servicios . . . 38

3.1.2. Organizaci´on . . . 39

3.2. Informaci´on geogr´afica . . . 41

3.3. Caracterizaci´on de las aplicaciones SIG . . . 42

3.3.1. Aspectos funcionales . . . 42

3.3.2. Restricciones . . . 45

3.4. Visualizaci´on de mapas . . . 45

3.4.1. Formas de representaci´on . . . 46

3.4.2. Los mapas interactivos . . . 47

3.5. Arquitectura de los SIG . . . 49

3.6. ´Areas de aplicaci´on . . . 50

3.7. Aplicaciones . . . 52

3.7.1. Sismos y Terremotos en el mundo . . . 52

3.7.2. TOXMAP: Mapas sobre salud ambiental . . . 53

3.7.3. MAPS: Herramientas de An´alisis y Mapas sobre Seguridad P´ublica 54 3.7.4. PROSIGA: Proyecto Sistema de Informaci´on Geogr´afica Nacional de la Rep´ublica Argentina . . . 55

(17)

´INDICE GENERAL ix

4. Integraci´on de Informaci´on Geogr´afica 59

4.1. Motivaci´on . . . 60

4.2. Interoperabilidad e Integraci´on . . . 61

4.2.1. Heterogoneidad de informaci´on . . . 62

4.2.2. Integraci´on de bases de datos heterog´eneas . . . 65

4.3. Integraci´on de Informaci´on Geogr´aficos . . . 67

4.3.1. Caracterizaci´on de la informaci´on geogr´afica . . . 67

4.3.2. Heterogeneidad en informaci´on geogr´afica . . . 68

4.4. Soluci´on a los problemas anteriores . . . 74

4.4.1. Vocabularios y tesauros . . . 74

4.4.2. Limitaciones de los tesauros . . . 77

4.5. Resumen del cap´ıtulo . . . 79

5. Est´andares Internacionales para Sistemas de Informaci´on Geogr´afica 81 5.1. Conceptos generales . . . 82

5.2. Organismos internacionales de estandarizaci´on . . . 83

5.2.1. Open Geospatial Consortium (OGC) . . . 84

5.2.2. Organizaci´on Internacional para la Estandarizaci´on ISO/TC 211 . . 85

5.3. Est´andares para informaci´on geogr´afica . . . 87

5.3.1. ISO/TC211 19101 Modelo de Referencia . . . 88

5.3.2. ISO/TC211 19109 Modelo conceptual est´andar para Esquemas de Aplicaci´on . . . 90

5.3.3. ISO/TC211 19107 Modelo conceptual est´andar para Fen´omenos Geogr´aficos . . . 94

5.3.4. Otras normas de la familia ISO 19000 . . . 99

5.4. GML: El Lenguaje de Marcado Geogr´afico . . . 101

(18)

6. Ontolog´ıas para Informaci´on Geogr´afica 109

6.1. Ontolog´ıas y representaci´on de conocimiento . . . 110

6.1.1. ¿Por qu´e definir ontolog´ıas? . . . 111

6.1.2. Uso de ontolog´ıas en Ciencias de la Computaci´on . . . 112

6.2. Formalizaci´on . . . 113

6.2.1. Definici´on . . . 113

6.2.2. Componentes de una ontolog´ıa . . . 114

6.2.3. Definici´on formal . . . 115

6.3. Tipos de ontolog´ıas . . . 116

6.3.1. Clasificaci´on seg´un generalidad . . . 117

6.3.2. Clasificaci´on seg´un expresividad . . . 117

6.4. Interoperabilidad e Integraci´on para Informaci´on Geogr´afica . . . 120

6.4.1. Recuperaci´on de IG basada en cat´alogos . . . 120

6.4.2. Recuperaci´on de IG basada en ontolog´ıa . . . 122

6.5. Dise˜no de ontolog´ıas para informaci´on geogr´afica . . . 124

6.5.1. Creaci´on de ontolog´ıas . . . 124

6.5.2. Cohesi´on entre una aplicaci´on y una ontolog´ıa de dominio . . . 126

6.6. Sistemas de Informaci´on Geogr´afica conducidos por ontolog´ıas . . . 128

6.6.1. El ciclo de vida del sistema . . . 128

6.6.2. Inclusi´on de ontolog´ıas en la etapa de desarrollo . . . 129

6.6.3. Vinculaci´on de un SIG en producci´on con nuevas ontolog´ıas . . . . 130

(19)

´INDICE GENERAL xi

7. Conclusiones y Trabajos Futuros 133

7.1. Resumen de la investigaci´on . . . 133

7.2. Resultados obtenidos . . . 135

7.3. Publicaciones . . . 137

7.4. Trabajo Futuro . . . 138

A. Ejmplo GML 141 A.1. Definici´on GML del Esquema de Aplicacion Mapa Urbano . . . 141

B. Abreviaturas y Acr´onimos 147

C. Glosario 149

(20)
(21)

´

Indice de figuras

1.1. El proceso de modelado . . . 4

1.2. Niveles de Abstracci´on y Modelos de Representaci´on . . . 7

1.3. Integraci´on de IG . . . 7

2.1. Abstracciones en SMBD . . . 13

2.2. Modelos Conceptuales Geogr´aficos . . . 14

2.3. El espacio seg´un el modelo basado en campos . . . 15

2.4. El espacio seg´un el modelo basado en objetos . . . 15

2.5. Jerarqu´ıa de abstracci´on espacial en MADS . . . 19

2.6. Vista parcial de un modelo conceptual para un problema dise˜nado con MADS 20 2.7. Esquema de aplicaci´on en MADS con objetos y relaciones espaciales . . . . 21

2.8. Clases espaciales Geo-campos o continuas . . . 22

2.9. Clases espaciales Geo-objetos o discretas . . . 22

2.10. Generalizaci´on en OMT-G . . . 23

2.11. Agregaci´on espacial en OMT-G . . . 23

2.12. Modelos de representaci´on . . . 25

2.13. Dos representaciones del modelo mosaico . . . 25

3.1. Composici´on de un SIG . . . 40

3.2. Representaciones geogr´aficas en el mapa . . . 46

(22)

4.1. Dos modelos de datos para un mismo problema inmobiliario . . . 64

4.2. Mapas Tem´aticos de Europa - variables cualitativas y cuantitativas . . . . 68

4.3. Definici´on del Thesaurus GEMET para el concepto “Wetland” . . . 75

5.1. El proceso de modelado . . . 88

5.2. Proceso de Transformaci´on: de la realidad a los datos . . . 89

5.3. Fragmento del Modelo de Fen´omeno General . . . 90

5.4. Fragmento del Esquema Conceptual de Aplicaci´on “R´ıos de Argentina” . . 91

5.5. Modelo de Objetos de GFM para el modelado de “R´ıos de Argentina” . . . 91

5.6. Jerarqu´ıa de Tipo de Atributo . . . 93

5.7. Jerarqu´ıa de Tipo de Asociaci´on . . . 93

5.8. ISO 19107 - Paquetes y sus clases geom´etricas . . . 95

5.9. Jerarqu´ıa de clases de geom´etricas . . . 97

5.10. Paquetes Topol´ogicos . . . 98

5.11. Diagrama de Clases Topol´ogicas . . . 99

5.12. Primitivas topol´ogicas . . . 99

5.13. Relaci´on entre geometr´ıa y topolog´ıa . . . 100

5.14. Ejemplo de esquema de aplicaci´on Mapa Urbano . . . 105

6.1. Ejemplo de Modelado de Conceptos y Relaciones . . . 112

6.2. Composici´on de una ontolog´ıa . . . 113

6.3. Conceptualizaci´on y ontolog´ıa . . . 114

6.4. El entorno Cliente-Proveedores en el proceso de b´usqueda de IG . . . 120

(23)

´INDICE DE FIGURAS xv

6.6. Un ejemplo de ontolog´ıas de dominio . . . 125

6.7. Asociaciones sem´anticas entre Fen´omenos, Tipos de Fen´omenos y Onto-log´ıas de Dominio . . . 125

6.8. Vistas m´ultiples de un fen´omenos geogr´aficos . . . 126

6.9. Integraci´on entre aplicaciones usando ontolog´ıa h´ıbrida . . . 126

6.10. Cohesi´on: Ontolog´ıa de Aplicaci´on y Ontolog´ıa de Dominio . . . 128

(24)
(25)

´

Indice de cuadros

1.1. Ejemplos de heterogeneidad entre SIG . . . 6

2.1. Ejemplos de Objetos Espaciales . . . 16

2.2. Ejemplos de aplicaci´on para los tipos espaciales en MADS . . . 20

2.3. Operaciones de los tipos regi´on y l´ınea . . . 32

4.1. Heterogeneidad sem´antica en ontolog´ıas . . . 71

4.2. Definici´on de las Relaciones entre T´erminos de un Tesauro . . . 76

4.3. Relaciones entre t´erminoZona Inundable y otros elementos del tesauro . 77

5.1. Modelos Abstractos OGC . . . 86

(26)
(27)

Cap´ıtulo 1

Introducci´

on

1.1.

Contexto

Se re´une bajo el nombre de Sistema de Informaci´on Geogr´afico (SIG)1 al conjunto

de herramientas que sirven para capturar, almacenar, analizar, administrar y presentar datos con referencia a una o varias ubicaciones sobre la superficie terrestre. Los requisitos principales que se consideran para la definici´on de los servicios esperados de un SIG son [Lua04, Mit99a]:

1. un SIG es una colecci´on de herramientas computacionales para realizar an´alisis geogr´afico y simulaciones [RSV02, BM98, DJ06].

2. un SIG est´a basado en unconjunto de estructuras de datos y algoritmos para repre-sentar, recuperar y gestionar informaci´on geogr´afica[WD04, RSV02].

3. un SIG es una herramienta que colabora con la toma de decisiones en tareas rela-cionadas con aspectos geogr´aficos [RSV02, LGMR05].

En la tecnolog´ıa SIG se combina conocimiento de diversas ´areas de las ciencias como Cartograf´ıa, An´alisis Estad´ıstico y Bases de Datos, entre otras. Los SIG son una tecno-log´ıa de prop´osito general que incluye servicios para analizar modelos, localizar eventos, medir distancia entre eventos, encontrar caminos y explorar las relaciones entre dos o m´as

(28)

En un SIG las piezas de informaci´on se organizan por temas [Cor00, ASR+05,

LGMR05]. Un ejemplo de tema podr´ıa ser “Hidrograf´ıa de Argentina” con datos sobre r´ıos, lagos, lagunas; as´ı como sus ubicaciones, caudales, cuencas, cauces, etc. Tradicional-mente, en el campo de la geograf´ıa, se utiliz´o la estrategia de organizar la informaci´on por temas. Utilizar esta misma abstracci´on en la representaci´on digital de informaci´on geogr´afica (IG) favorece el modelado y los servicios de visualizaci´on. Desde la visi´on del modelado, permite dividir y concentrar las necesidades de representaci´on a un conjunto acotado de fen´omenos reales y sus v´ınculos. Desde la visualizaci´on, la opci´on de filtrado por tema da libertad a los usuarios para decidir din´amicamente qu´e temas mostrar y qu´e temas ocultar creando distintas representaciones visuales del mismo espacio geogr´ afi-co. Por ejemplo, de la superposici´on de los temas “Hidrograf´ıa de Argentina ” y “Caminos y rutas de acceso de Argentina” se puede responder a la consulta ¿c´omo llegar desde Bah´ıa Blanca al lago Nahuel Huapi?

La unidad de representaci´on en IG se denomina fen´omeno geogr´afico o simplemen-tefen´omeno2[MFW90, SMB+97]. Cada fen´omeno es ´unico y distinguible; ´este referencia a una locaci´on, espacio, ´area o regi´on, y se puede visualizar en un mapa. Los fen´ ome-nos geogr´aficos se organizan en dos abstracciones: objetos discretos, por ejemplo, un monumento, una monta˜na o un lago, y objetos continuos, por ejemplo, elevaci´on de la superficie terrestre o el nivel de lluvias. Paralelamente, tambi´en existen dos formas de representar digitalmente los datos geogr´aficos: el modelo mosaico o raster y el modelo vector[LT92, SCG+97, SC03].

En el proceso de modelado de un tema se identifican los fen´omenos de inter´es para un

contexto de aplicaci´on, se los organiza en patrones o tipos de fen´omenos y se caracteri-zan por sus atributos y relaciones. Los atributos pueden ser atributos alfanum´ericos y/o atributos espaciales. Finalmente, la instanciaci´on de los fen´omenos reales a los tipos de fen´omenos y relaciones materializa la base de datos de la aplicaci´on (figura 1.1). Los atri-butos espaciales tienen asociada una componente geom´etrica, que determina la forma y dimensi´on del fen´omeno. Tambi´en se identifican las relaciones espaciales geom´etricas y/o

(29)

Contexto 3

Figura 1.1: El proceso de modelado

topol´ogicas de inter´es. Las propiedades m´etricas de objetos geogr´aficos incluyen longitud y superficie (dependen de de la dimensi´on del objeto) y relaciones m´etricas entre objetos como distancia y/o relaciones de orientaci´on (“sobre”, “a la derecha de”, etc.). Las ope-raciones topol´ogicas hacen referencia a propiedades de vecindad, adyacencia, inclusi´on y conectividad y permanecen invariantes ante cambios morfol´ogicos, de escala o de proyec-ci´on. Las representaciones usando los modelos vector o mosaico difieren en cuanto a la eficiencia de representaci´on y la capacidad para resolver consultas espaciales. La elecci´on de una u otra implementaci´on depende principalmente del problema. En general los SIG proveen ambos modelos de representaci´on.

(30)

En la ´ultima d´ecada est´a creciendo la necesidad de interoperabilidad e integraci´on en distintos ´ambitos de aplicaci´on de IG: SIG, Infraestructuras de Datos Espaciales (IDE)3

y Sistemas M´oviles Basados en Ubicaci´on (LBMS)4. Interoperabilidad e integraci´on son

calidades que ganan importancia en el campo de los productos tecnol´ogicos de infor-maci´on geogr´afica. La integraci´on en las aplicaciones que trabajan con IG presenta una dificultad adicional: al momento de intercambiar informaci´on no solo aparecen diferencias a nivel de modelos del dominio, sino tambi´en de modelos de representaci´on para datos geogr´aficos heredados desde sistemas de geoprocesamiento ya desarrollados y que carecen de estandarizaci´on en lo que hace a la representaci´on de la IG.

Los problemas de heterogeniedad en IG se clasifican en niveles o vistas que impactan de distinta forma en cuanto a las dificultades de integraci´on. La vista de heterogeneidad sint´actica considera que distintas soluciones pueden ofrecer diferentes formatos y modelos de datos (vector y mosaico) y hasta distintos sistemas de coordenadas para representar fen´omenos id´enticos. Se considera como nivel de heterogeneidad estructural en IG cuan-do los modelos de distintas soluciones representan los mismos fen´omenos con distintos atributos (estructuras distintas). El nivel deheterogeneidad sem´antica en IG se establece cuando distintas soluciones interpretan significados distintos para los mismos fen´omenos del mundo a modelar. El cuadro 1.1 ejemplifica dichos niveles de heterogeneidad. Las dificultades de heterogeneidad sint´actica son m´as simples de resolver usando sistemas de transformaci´on autom´aticos. Una soluci´on parcial a los problemas de heterogeneidad es-tructural y sem´antica es contar con tesauros que normalicen los t´erminos del dominio de aplicaci´on. La integraci´on sem´antica de IG ha motivado importantes investigaciones en el ´

area de Ciencias de la Computaci´on. Las soluciones a problemas de integraci´on sem´ anti-ca generalmente se vinculan con la definici´on de ontolog´ıas que incluyan especificaciones formales para los modelos de representaci´on de cada soluci´on.

(31)

Objetivos 5

Ejemplos

Heterogeneidad Sistema S1 Sistema S2

sint´atica S1 representa zonas por

densidad de poblaci´on de Bah´ıa Blanca bajo el mode-lo vector.

S2 representa zonas por

densidad de poblaci´on de Bah´ıa Blanca bajo el mode-lo mosaico.

estructural S1 representa zonas por

densidad de poblaci´on de Bah´ıa Blanca, incluyendo detalle de los servicios p´ublicos.

S2 representa zonas por

densidad de poblaci´on de Bah´ıa Blanca, incluyendo detalles sobre los tipos de construcci´on (edificios, ca-sas, barrios cerrados, etc.).

sem´antica S1 representa densidad de

poblaci´on de Bah´ıa Blanca considerando n´umero de ha-bitantes.

S2 representa densidad de

poblaci´on de Bah´ıa Blanca considerando unidades fa-miliares.

Cuadro 1.1: Ejemplos de heterogeneidad entre SIG

1.2.

Objetivos

El objetivo principal de este trabajo es “estudiar los modelos de representaci´on para IG con el fin deestablecer las necesidades de descripci´on sem´antica que permitan avanzar hacia una mejora en la disponibilidad de la IG en entornos heterog´eneos distribuidos”.

Como parte de este objetivos se identifican las siguientes metas parciales que colabo-rar´an con el resultado final:

1. Estudiar las particularidades de representar IG.

2. Estudiar los modelos de representaci´on para IG existentes, organiz´andolos seg´un su nivel de abstracci´on.

3. Identificar las necesidades y las dificultades en integraci´on de IG.

(32)

1.3.

Propuesta de investigaci´

on

Como se mencion´o en la secci´on anterior, el objetivo de esta tesis es el estudio de los modelos de representaci´on de IG con el prop´osito de a˜nadir conocimiento sem´antico a los mismos. Inicialmente, el tema de investigaci´on plantea dos desaf´ıos: existen diversas formas de representaci´on para la IG y de las que no se tiene un conocimiento acabado y por otra parte, el dominio de aplicaci´on y las necesidades de los SIG son desconocidos.

Como inicio de la investigaci´on se abordar´an estos dos temas. Para los modelos exis-tentes, se utilizar´a la estrategia usada por las tecnolog´ıas de bases de datos y se iden-tificar´an las vistas abstractas para los datos geogr´aficos: f´ısica, l´ogica y conceptual. Se har´a un relevamiento de los modelos actuales, analizando sus caracter´ısticas y restriccio-nes [Ull88, RSV02, PSZ+98, RJB98, RBP+91]. En la figura 1.2 se presentan gr´aficamente

las piezas en las que se organizan estos temas de estudio.

A partir del conocimiento b´asico sobre representaci´on de IG, se har´a un relevamiento de las caracter´ısticas y requerimientos de los SIG. Para ellos se estudiar´an las tecno-log´ıas existentes, arquitecturas, representaci´on de abstracciones geogr´aficas, los SIG como una herramienta de prop´osito general para problemas con datos espaciales, ´ambitos de aplicaci´on y algunos ejemplos de uso [Zei99, Cla86, BM98].

(33)

Organizaci´on 7

Figura 1.2: Niveles de Abstracci´on y Modelos de Representaci´on

con IG [Gru93, Gua98, WVV+01, Usc98]. En la figura 1.3 se esquematiza c´omo se

orga-niza la definici´on de est´andares y ontolog´ıas para SIG en relaci´on con las posibilidades de integraci´on.

1.4.

Organizaci´

on

La estructura de esta tesis es la siguiente:

(34)

Figura 1.3: Integraci´on de IG

l´ogico o discreto es un nivel de abstracci´on intermedia. ´Este provee los constructores para representar los esquemas de aplicaci´on en la computadora. Finalmente el nivel f´ısico o menos abstracto es el que se ocupa de las estructuras de bajo nivel para administrar y optimizar el acceso a los datos almacenados. En este cap´ıtulo se caracterizan los requeri-mientos espec´ıficos de la IG en los distintos niveles y se recopilan y describen los modelos de datos para IG existentes.

En el Cap´ıtulo 3 se hace un estudio de las caracterizaciones y requerimientos de los SIG y se identifican sus componentes. En los ‘70 cuando surgen las primeras aplicaciones SIG, bases de datos, lenguajes de programaci´on y paradigmas de desarrollo no estaban preparados para representar informaci´on con requerimientos espaciales. As´ı cada provee-dor defini´o sus propios modelos y estrategias de representaci´on. Las ´areas de aplicaci´on para los SIG son amplias y siguen creciendo. Asimismo, son diversas las necesidades de informaci´on y consulta. Entre los dominios de aplicaci´on se incluyen econom´ıa, gesti´on ambiental, turismo, comunicaciones, demograf´ıa y organizaci´on pol´ıtica entre varios otros. ´

(35)

Organizaci´on 9

al espacio de referencia. Por esta raz´on los SIG se han hecho populares en el ´ambito pri-vado, p´ublico y de investigaci´on y educaci´on. Al final de este cap´ıtulo se incluyen a modo de ejemplo algunas aplicaciones de variados dominios de inter´es.

En elCap´ıtulo 4 se presentan los conceptos deintegraci´on einteroperabilidad relacio-nados con aplicaciones que manejan IG. Se clasifican y estudian los niveles de heterogenei-dad en la informaci´on en general y en particular los relacionados con IG. Varias fuentes de datos SIG heterog´eneas acumulan IG con datos espaciales en diversos formatos. El costo que significa para un SIG contar con IG y el hecho de que cierta informaci´on de base, como por ejemplo la distribuci´on pol´ıtica de una regi´on exista, hacen que haya crecido el inter´es en clientes y proveedores por compartir datos y servicios. Para compartir IG se trabaja en definir normas y est´andares relacionados con la representaci´on de informaci´on en los distintos niveles de abstracci´on.

En el Cap´ıtulo 5 se recopila el trabajo en estandarizaci´on de los dos organismos in-ternacionales que trabajan en normalizaci´on geoespacial: el consorcio “Open Geoespacial Consortium” (OGC) y el Organismo Internacional de Estandarizaci´on (ISO) desde su co-mit´e T´ecnico ISO/TC 211. Ambas organizaciones vienen trabajando desde el a˜no 1990, y lo siguen haciendo en la actualidad, en lo que respecta a la definici´on de est´andares para favorecer la geodisponibilidad de la informaci´on y de los servicios geogr´aficos. Ac-tualmente trabajan cooperativamente, ISO/TC 211 definiendo las normas y est´andares de representaci´on y OGC especificando est´andares implementables que respeten las normas ISO. Los resultados obtenidos hasta el momento son aceptados en el dominio de IG y han incrementado las posibilidades de compartir informaci´on y servicios.

En el Cap´ıtulo 6 se estudian a las ontolog´ıas como medio para enriquecer sem´ antica-mente a las aplicaciones geogr´aficas. Las ontolog´ıas buscan unificar la representaci´on para s´ımbolos y t´erminos de forma tal que dicha interpretaci´on sea ´unica y adem´as pueda ser “leida” por agentes autom´aticos. Existen diversas ontolog´ıas y entre ellas difieren en el nivel de detalle que expresan. M´as a´un, una buena pr´actica es organizar los t´erminos en distintas ontolog´ıas seg´un el nivel de detalle. Esto permite contar con ontolog´ıas generales y espec´ıficas. Una o m´as ontolog´ıas definidas para un dominio de aplicaci´on com´un a va-rios SIG podr´ıan ser las mediadoras para la integraci´on de informaci´on. En este cap´ıtulo se va estudiar el estado actual del arte en el uso de ontolog´ıas para SIG.

(36)

1.5.

Resumen de las contribuciones

Como resultado de este trabajo de investigaci´on se esperan realizar las siguientes contribuciones:

1. Recopilar y organizar el estado actual del arte en modelos de representaci´on para IG. La informaci´on geogr´afica es naturalmente compleja y variada. Para administrar su complejidad se han definido diversos modelos con diferentes grados de represen-taci´on. Sin embargo, el material existente sobre este t´opico es disperso y en general poco relacionado. Se espera contribuir en su organizaci´on.

2. Hacer un an´alisis exhaustivo de los problemas de integraci´on de IG y las soluciones actuales. Las exigencias por integrar informaci´on y servicios geogr´aficos han tomado impulso como resultado de las tecnolog´ıas emergentes para IG. Las caracter´ısticas particulares de los fen´omenos geogr´aficos y las heterogeneidades de representaci´on exigen analizar los nuevos desaf´ıos de integraci´on que se presentan.

3. Recopilar los est´andares en IG e identificar los aportes de los mismos con relaci´on a interoperabildad e integraci´on de IG. Las primeras tecnolog´ıas SIG datan de los ‘70. Originalmente cada proveedor determin´o sus propios modelos y estructuras de representaci´on. La falta de unificaci´on en los modelos es la primera dificultad a sortear para avanzar en las calidades de interoperabilidad e integraci´on. Desde la d´ecada del ‘90 organizaciones internacionales vienen trabajando en definir est´ anda-res para datos y servicios geogr´aficos. En este trabajo se recopilar´an los principales resultados obtenidos.

(37)

Resumen de las contribuciones 11

impl´ıcito que no se puede expresar en el diccionario de datos. Un medio emergen-te para representar conocimiento sem´antico son las ontolog´ıas. En este trabajo se van a investigar las posibilidades de uso de ontolog´ıas para modelar conocimiento sem´antico sobre IG.

(38)
(39)

Cap´ıtulo 2

Fundamentos de Bases de Datos

Geogr´

aficas

Se denominan Sistemas de Informaci´on Geogr´afica (SIG) a los sistemas usados para recolectar, analizar y presentar informaci´on que describe propiedades f´ısicas y l´ogicas del mundo de la geograf´ıa. En un sentido amplio, el t´ermino SIG se aplica al conjunto de procedimientos manuales o asistidos por la tecnolog´ıa que sirven para gestionar datos con referencias geogr´aficas [SMB+97] o datos espaciales1. Los datos geogr´aficos est´an

vinculados con una locaci´on en la superficie terrestre.

En sus or´ıgenes, el manejo de IG se limit´o a procesos manuales no interactivos con representaci´on en el plano bajo la forma de mapas. Con el desarrollo de tecnolog´ıas para la recolecci´on y digitalizaci´on de datos geogr´aficos surgi´o la necesidad de proveer alg´un tipo de aplicaci´on que permitiera el manejo y an´alisis interactivo de los mismos. Esto dio lugar a aplicaciones que se conocen como aplicaciones geogr´aficas oSIG. Un SIG [RSV02] es m´as que una herramienta cartogr´afica para producir mapas, es un tipo de software de aplicaci´on que incluye, entre otras, capacidades para manipular datos geogr´aficos, provee herramientas para an´alisis espacial y ofrece mecanismos de visualizaci´on e interacci´on que permiten que usuarios expertos del dominio analicen la informaci´on.

Debido al incremento en el volumen de los datos geogr´aficos, una de las tareas de un SIG es tambi´en administrar eficientemente grandes bases de datos con IG. Las bases de

(40)

para aplicaciones comerciales no est´an preparados para representar y administrar IG. Ni los modelos conceptuales de datos tradicionales como Modelo Entidad−Relaci´on (MER) [Che76] o los modelos orientados a objetos como elModelo de Clases de UML[RJB98]; ni los modelos l´ogicos como elrelacional [Cod70] cuentan con las estructuras adecuadas para representar entidades y relaciones que se ajusten naturalmente a problemas geogr´aficos. La representaci´on de IG en una computadora requiere de nuevas abstracciones como pun-to, curva o surperficie y colecciones de ´estos. Las operaciones provistas por los modelos l´ogicos tradicionales tambi´en resultan incompletas para resolver consultas como distan-cia, direcci´on o intersecci´on. Finalmente las representaciones f´ısicas t´ıpicas tampoco son adecuadas para manipular de forma eficiente datos geogr´aficos almacenados.

En este cap´ıtulo se recopilan y se describen los requerimientos para representar IG en los distintos niveles de abstracci´on conceptual, l´ogico y f´ısico bajo la premisa de cubrir las necesidades de diversas aplicaciones SIG. Se presentan los principales modelos existentes para cada uno de los niveles, sus componentes, capacidades y limitaciones. Se presentan los sistemas de manejo o gesti´on para Bases de Datos Espaciales como el componente de la arquitectura de un SIG responsable de la representaci´on, recuperaci´on y consulta de IG.

2.1.

Niveles de abstracci´

on

Para proveer manejo eficiente de grandes vol´umenes de informaci´on almacenada las bases de datos se apoyan en estructuras complejas. Tradicionalmente, los Sistemas de Manejo de Bases de Datos (SMBD)2 [Ull88, EN00, GMPQ+04, SKS10] han utilizado el

recurso de definir niveles o vistas abstractas sobre los datos para lograr cierta indepen-dencia entre modelos. Esto permite ocultar detalles de implementaci´on y simplificar las interfaces a los usuarios de bases de datos. La figura 2.1 muestra los tres modelos de abstracci´on tradicionalmente usados.

(41)

Niveles de abstracci´on 15

Figura 2.1: Abstracciones en SMBD

El modelo conceptual o abstracto se utiliza para identificar componentes del mundo real. El modelo conceptual no es directamente representable en la computadora porque ignora las limitaciones computacionales para expresar tama˜no, continuidad o precisi´on. Elmodelo l´ogico o discreto provee los constructores para trasladar el modelo conceptual a las estructuras usadas a nivel de desarrollo. Elmodelo f´ısico, por su parte, define c´omo se almacenan los datos. Los modelos del nivel f´ısico incluyen estructuras de datos complejas y de bajo nivel.

Los modelos de datos para SI tradicionales son insuficientes para modelar IG. Mode-los conceptuales hist´oricos como el MER carecen de constructores para describir ciertas propiedades espaciales t´ıpicas de las entidades geogr´aficas como forma o relaciones y/o restricciones espaciales: distancia, inclusi´on, ´area y adyacencia entre otras. De la misma forma, las transformaciones al modelo l´ogico son incompletas en los mismos aspectos. El modelo relacional tradicional ampliamente utilizado para SI provee un conjunto de tipos de datos b´asicos (cadena, fecha, n´umero) insuficiente. Estos problemas de representaci´on obviamente tampoco han sido considerados en el modelo f´ısico.

A continuaci´on a modo de ejemplo plantean se los requerimientos para un problema que requiere de entidades geogr´aficas y relaciones espaciales.

Ejemplo 2.1.1 Plantear el dise˜no para un problema que modele la organizaci´on

(42)

Dificultades de modelar el problema con los modelos tradicionales.

No contar con tipos de datos para representar la geometr´ıa de las provincias.

No existen constructores para relaciones espaciales como Bah´ıa Blanca “est´a inclui-da” en la provincia de Buenos Aires, ´o Buenos Aires “limita con” La Pampa.

Responder a consultas como “¿qu´e distancia separa a Bah´ıa Blanca de Mar del Plata?” no es simple.

En las pr´oximas secciones se presentan los principales modelos desarrollados para repre-sentar IG. El proceso de modelado se basa en fundamentos matem´aticos rigurosos fuera del alcance de esta tesis. A modo de referencia las entidades se localizan sobre unespacio

de inter´es<d y la funci´on distancia euclidiana al que se denomina Espacio Eucl´ıdeo. Los

puntos son elementos del espacio, asociados a un par de coordenadas cartesianasxey. Las entidades geogr´aficas a trav´es del proceso denominado proyecci´on al mapa son mapeadas a una representaci´on plana.

En lo que sigue siempre que se hable de “entidad espacial” se est´a refiriendo indis-tintamente a una entidad geogr´afica siguiendo el tema de inter´es de esta tesis. En un sentido estricto, el t´ermino “espacial” implica un alcance m´as general, una instancia es-pacial est´a vinculada a una ubicaci´on en un plano, que puede ser la Tierra o cualquier otro, como por ejemplo el plano de dise˜no de un circuito electr´onico. Los datos geogr´aficos est´an espec´ıficamente vinculados con una locaci´on en la superficie terrestre.

2.2.

Modelos conceptuales para sistemas geogr´

aficos

(43)

Modelos conceptuales para sistemas geogr´aficos 17

Figura 2.2: Modelos Conceptuales Geogr´aficos

2.2.1.

Modelo de datos geogr´

afico

La interpretaci´on del espacio geogr´afico depende de la sem´antica del problema. Por ejemplo, dado el territorio de la provincia de Buenos Aires, en un problema administrativo, la provincia se particiona en municipios; desde una visi´on geol´ogica, el espacio se organiza en ´areas geol´ogicas; en control del tr´afico, el foco se ubica en la red de caminos. Cada problema define una interpretaci´on del espacio y la colecci´on de entidades necesarias para describirlo. La organizaci´on de las entidades sobre un t´opico particular en un SIG se denomina tema.

Las tecnolog´ıas SIG reconocen dos formas diferentes de representaci´on para el espacio subyacente [SCG+97]: elmodelo espacial basado en campos3y elmodelo espacial basado en objetos4. En la aproximaci´on espacial basada en campos cada punto del espacio est´a

aso-ciado con uno o varios valores de atributos definidos como funciones continuas sobre x e

y. Por ejemplo, altitud sobre el nivel del mar, temperatura, etc. Las mediciones sobre los distintos fen´omenos se re´unen como valores de atributos variando con la ubicaci´on en el plano. La figura 2.3 muestra la representaci´on en un mapa para el modelo espacial basado en campos. La interpretaci´on del espacio como un campo continuo es lo que contrasta con el modelo basado en objetos.

En la aproximaci´on basada en objetos el espacio est´a poblado de entidades discretas

con identificaci´on. Cada entidad tiene asociada un componente espacial, que se corres-ponde con la forma y ubicaci´on del objeto en el espacio subyacente, y un conjunto de propiedades descriptivas. En la figura 2.4 se muestra el mapa de la provincia de Buenos Aires bajo esta representaci´on; se pueden observar las entidades discretas rutas

repre-sentadas como “l´ıneas” y ciudades que est´an simbolizadas con “puntos”.

(44)

Figura 2.3: El espacio seg´un el modelo basado en campos

Los modelos basados en objetos usan abstracciones para representar las distintas clases de objetos geogr´aficos. La elecci´on de alguna abstracci´on depende de las dimensiones del objeto geogr´aficopunto(0−dimensi´on),curva(1−dimensi´on),superficie(2−dimensi´on) ´

o vol´umen(3−dimensi´on). Los puntos son usados para representar entidades cuya forma no es de inter´es o es despreciable, pero s´ı se quiere conocer su ubicaci´on. Los objetos de tipo l´ıneas comm´unmente se utilizan para representar redes. El tipo geom´etrico generalmente se conoce como polil´ınea. Una polil´ınea se define como un conjunto finito de arcos o

segmentos, de modo que cada extremo es compartido exactamente por dos segmentos a excepci´on de los puntos extremos, que pertenecen a un ´unico segmento. Los objetos de dimensi´on dos se usan para representar ´areas y su tipo geom´etrico es el pol´ıgono. Un pol´ıgono es una regi´on del plano limitada por una polil´ınea cerrada.

El cuadro 2.1 muestra algunos de los usos cl´asicos de estas abstracciones. La elecci´on del tipo de abstracci´on no es fija y depende del uso que se dar´a a la colecci´on de entidades. Distintos factores pueden influenciar en la decisi´on, uno especialmente importante es la

(45)

Modelos conceptuales para sistemas geogr´aficos 19

Figura 2.4: El espacio seg´un el modelo basado en objetos

del aeropuerto.

2.2.2.

Modelos para esquemas de aplicaci´

on geogr´

aficos

El t´erminoesquema de aplicaci´on en el ´area de bases de datos se utiliza para referir al dise˜no de la estructura est´atica que mantiene la informaci´on, mientras que se denomina

instancia de base de datos al conjunto de valores ajustados a un esquema en un instan-te de tiempo. Las instancias son din´amicas y se espera que el contenido de la base de datos evolucione constantemente en el tiempo; los esquemas son est´aticos y se desea que permanezcan invariantes.

(46)

Ejemplos: ciudades, centros comerciales, etc. 1-Dimensi´on l´ınea Se usan para representar entidades con forma de

redes o grafos.

Ejemplos: r´ıos, caminos, etc.

2-Dimensi´on superficie Representan entidades con ´area. Los pol´ıgonos son el principal tipo geom´etrico para representar tales objetos.

Ejemplos: regiones, secciones, etc.

Cuadro 2.1: Ejemplos de Objetos Espaciales

Abstracciones de alto nivel para modelos espaciales basadas en objetos o en campos.

Entidades tradicionales y georeferenciadas.

Tipos de atributos usados por aplicaciones geogr´aficas incluyendo abstracciones geom´etricas.

Relaciones espaciales y restricciones de integridad espacial.

El modelo conceptual de esquemas de aplicaci´on provee las abstracciones para repre-sentar a los elementos del mundo real. En orientaci´on a objetos a esta abstracci´on se la denomina objeto, mientras que en el MER se la identifica como entidad. En los modelos conceptuales para IG recibe el nombre de fen´omeno y es lo que identifica a un objeto geogr´afico del mundo real distinguible de otros. Por ejemplo, el parque nacional “Los Arrayanes” es un fen´omeno. Los fen´omenos se caracterizan por atributos que pueden ser

atributos espaciales y/oatributos descriptivos oalfanum´ericos.

Ejemplo 2.2.1 Fen´omeno

Parque Nacional Los Arrayanes = ((nombre,“Los Arrayanes”), (a˜ no-fundaci´on,“1971”), (ubicaci´on, instancia de GM Surface5), (descripci´on, “Unidad boscosa

(47)

Modelos conceptuales para sistemas geogr´aficos 21

compuesta por arrayanes. El Parque Nacional Los Arrayanes conserva una muestra de la eco-regi´on bosque patag´onico, cuyo clima es templado a fr´ıo y h´umedo, con nevadas y llu-vias invernales. Se caracteriza por un paisaje de monta˜na de relieve abrupto y escarpado, con valles glaciarios”)).

En la literatura se pueden encontrar diversas propuestas para modelar esquemas con IG [SCG+97, KPS95, OPM97, MFW90]. Los beneficios de utilizar un enfoque de

mo-delado conceptual que apoye el dise˜no de la base de datos son conocidos y ampliamen-te aceptados: dise˜nadores y usuarios pueden expresar e intercambiar su conocimiento acerca de la aplicaci´on utilizando conceptos que les son familiares; independiz´andose as´ı de cuestiones propias de la herramienta de software de implementaci´on. En esta secci´on se incluye la presentaci´on de dos de los modelos existentes para esquemas de aplicaci´on geogr´aficos: Modeling Application Data with Spatio-temporal features (MADS) [PSZ99, PSZ+98, PSZ06b, PSZ06a] y OMT−G [BLD99, KABL01]. Ambos proveen so-porte visual para representar informaci´on espacial y temporal, lo que los hace m´as claros e intuitivos para modelar. Se eligieron estos dos modelos por ser representativos de los tipos de modelos m´as usados en dise˜no conceptual de SI. Mientras que MADS se asemeja al MER tradicional, OMT−G se presenta como una extensi´on del Lenguaje de Modelado Orientado a Objetos OMT6 [RBP+91], que sustent´o la definici´on del Lenguaje Unificado

de Modelado UML [RJB98].

MADS: Modelado de aplicaciones de datos que incluyen fen´omenos espacio

temporales

MADSes un modelo conceptual creado para problemas que manejan datos espaciales y/o temporales dise˜nado respetando las calidades de simplicidad y poder expresivo. Una caracter´ıstica saliente de MADS es que se apoy´o en el principio de ortogonalidad. Maneja los aspectos multidimensionales descomponi´endolos en vistas independientes, consideran-do por separaconsideran-do las diferentes dimensiones a modelar: estructuras de datos, espacio, tiem-po y representaci´on. Incluye una sintaxis visual y adopta el paradigma objeto−relacional y las definiciones normalizadas por Object Database Management Group (ODMG)7.

En MADS la espacialidad y la temporalidad se asocian con tipos de objetos, atributos, relaciones y agregados. El sistema de tipos cuenta con los tipos espaciales b´asicos: punto,

6En Ingl´esObject-Modeling Technique. 7

(48)

Figura 2.5: Jerarqu´ıa de abstracci´on espacial en MADS

l´ınea, ´area y especializaciones de ´estas. Tambi´en incluye tipos espaciales para representar conjuntos homog´eneos de objetos b´asicos: conjunto de puntos, conjunto de l´ıneas, conjunto de l´ıneas orientadas y conjuntos de ´areas. Estos tipos espaciales conforman la jerarqu´ıa que se muestra en la figura 2.5. La ra´ız se corresponde con el tipo espacial “geo” del que desprenden “simple geo” y “complex geo”. Tambi´en se puede observar que para cada tipo espacial la espacialidad se visualiza con ´ıconos que expresan la informaci´on de manera no ambigua, visual y sint´etica.

Cada tipo espacial tiene asociado un conjunto de m´etodos que permiten definir y manipular instancias del tipo. Por ejemplo, el m´etodo dimensi´on est´a definido para tipo geo, mientras que longitud se define para l´ınea. De manera similar MADS define una jeraqu´ıa de tipos para tipos de datos temporales [PSZ06b].

Ejemplo 2.2.2 Problema de Aplicaci´on

Dise˜nar el modelo de datos para el problema de representar recorridos de las l´ıneas de colectivo urbano.

El cuadro 2.2 muestra ejemplos de entidades y sus tipos espaciales seg´un MADS para el problema del ejemplo.

(49)

Modelos conceptuales para sistemas geogr´aficos 23

Tipo de Objeto Tipo Espacial Descripci´on

Parada punto Representa a fen´omenos del tipo

para-da de coletivo.

ParadasLinea conjunto de

pun-tos

Representa a fen´omenos formados por todas las paradas de una l´ınea de colec-tivos.

RedVial conjunto de

l´ıneas

Representa a los fen´omenos de tipo red de caminos.

Cuadra l´ınea dirigida Mantiene a los fen´omenos Cuadra. La

direcci´on se˜nala el sentido de numera-ci´on.

Parcela

´

area simple Mantiene fen´omenos que representan a porciones peque˜nas de terreno. Cada Parcela tiene un propietario

Manzana conjunto de

´ areas

Contiene fen´omenos manzana como la composici´on de varias Parcelas.

Cuadro 2.2: Ejemplos de aplicaci´on para los tipos espaciales en MADS

Para los objetos asociados a un tipo espacial gen´erico, el tipo espacial de cada instancia se define en tiempo de creaci´on. La posici´on de un objeto tambi´en se puede definir en forma absoluta fijando las coordenadas del objeto, o relativa, definiendo la posici´on con respecto a otra ubicaci´on conocida, por ejemplo,X est´a a 60km de Y, sobre la ruta Z.

Adem´as MADS define relaciones espaciales, las que pueden ser topol´ogicas, de orien-taci´on, m´etricas o agregados espaciales. Las relaciones espaciales est´an restringidas por la espacialidad de los objetos. Sin embargo, es importante contar con medios para definir expl´ıcitamente relaciones espaciales en el modelo conceptual, por ejemplo, para especifi-car que dos secciones de un mismo r´ıo pertenecen a la relaci´on “est´a adyacente a”. Esto enriquece el esquema, permite nombrar a las relaciones, agregarles atributos y m´etodos y darles sem´antica adicional. Una relaci´on espacial vincula al menos dos objetos espaciales.

Ejemplo 2.2.3 Vista de un modelo conceptual MADS

(50)

Figura 2.6: Vista parcial de un modelo conceptual para un problema dise˜nado con MADS

atributo espacial de tipo conjunto de ´areas,Ciudadcuyo atributo espacial es de tipo punto y Lago, con espacialidad de tipo ´area simple. Entre los tipos de objeto Pais y Ciudad se defini´o la relaci´on espacial “contiene” por la cual se impone la restricci´on que una

instancia de Ciudad debe estar incluida en el espacio ocupado por la instancia de Pais a la que pertenece. Existe otra relaci´on topol´ogica entre Ciudad y Lago que permite expresar si un fen´omeno ciudad est´a en relaci´on de “adyacencia” a un lago.

La figura 2.7 muestra un modelo conceptual completo para un problema dise˜nado usando MADS [PSZ06b]. Incluye atributos y relaciones espaciales y temporales. La misma figura contiene las referencias simb´olicas. Se puede observar que el modelo es claramente interpretable por distintos usuarios: fen´omenos que maneja, sus representaciones y las relaciones de asociaci´on y espaciales definidas entre ellos.

En general se puede decir que MADS favorece el dise˜no de estructuras para una repre-sentaci´on del espacio basada en objetos. Sin embargo tambi´en provee mecanismos para representar vistas continuas del espacio basadas en campos.

OMT−G: Lenguaje de Modelado Orientado a Objetos para fen´omenos

geogr´aficos

OMT−G es un modelo conceptual para dise˜nar esquemas de aplicaci´on que incluyan elementos geogr´aficos. Provee las primitivas para modelar geometr´ıa y topolog´ıa de da-tos geogr´aficos, soporta estructuras topol´ogicas agregadas bajo el modelo “todo-parte”, estructuras de red, m´ultiples vistas de objetos, y relaciones espaciales.

Incluye los conceptos b´asicos de clases, relaciones y restricciones de integridad espacial. Distingue entreclases convencionaleso no espaciales yclases espaciales o georeferenciadas

(51)

Modelos conceptuales para sistemas geogr´aficos 25

Figura 2.7: Esquema de aplicaci´on en MADS con objetos y relaciones espaciales

(52)

Figura 2.8: Clases espaciales Geo-campos o continuas

y operaciones.

OMT-G propone un conjunto fijo de tipos geom´etricos y usa representaci´on simb´olica para distinguir las clases georeferenciadas de geo-objetos y de geo-campos (Figuras 2.9 y 2.8). El uso de estos tipos y su iconograf´ıa simplifica el modelado. Cuenta con cinco clases descendientes de geo-campos: isol´ınea, pol´ıgonos adyacentes, mosaico, muestreo y red triangular irregular. Existen dos clases descendientes de geo-objetos:geo-objetos con geometr´ıa y geo-objetos con geometr´ıa y topolog´ıa. Estas especializaciones junto con la agregaci´on espacial (la primitiva todo-parte) permiten definir reglas de integridad espa-cial. Las clases de geo-objetos con geometr´ıa se utilizan para los objetos que s´olo tienen propiedades geom´etricas que se especializan en las clases Punto, L´ınea, y Pol´ıgono. Las clases de geo-objetos geometr´ıa y topolog´ıa representan a los objetos que tienen, adem´as de geometr´ıa, propiedades de conectividad topol´ogicas y se usan para representar estruc-turas de red. Incluyen a las clases Nodo y Arco con o sin direcci´on.

OMT-G considera tres tipos de relaciones entre sus clases: asociaciones simples, re-laciones topol´ogicas de red y relaciones espaciales. La discriminaci´on de estas clases de relaciones permite definir expl´ıcitamente el tipo de interacci´on que existe entre objetos. Las asociaciones simples muestran relaciones entre objetos de diferentes clases conven-cionales o georeferenciadas. Las relaciones espaciales representan relaciones topol´ogicas y m´etricas: tangente, dentro, atraviesa, superpone, disjunto, adyacente, coincide, contiene, etc. Para cada unas de estas relaciones se definen las restricciones de integridad espacial, y es posible definir nuevas relaciones espaciales con sus restricciones. Las relaciones de red se definen entre objetos que est´an conectados bajo alguno de los modelosarco−nodo

´

oarco−arco.

(53)

Modelos conceptuales para sistemas geogr´aficos 27

(54)

Figura 2.10: Generalizaci´on en OMT-G

sobre clases georeferenciadas y clases convencionales, siguiendo las definiciones y notaci´on propuesta por UML (figura 2.10). La agregaci´on es una forma especial de asociaci´on entre objetos que define la composici´on (figura 2.11); se puede definir entre clases convencio-nales, georeferenciadas o combinaciones de ambas. Cuando la agregaci´on est´a definida entre clases georeferenciadas, se denomina “agregaci´on espacial”. En la agregaci´on espa-cial la relaci´on topol´ogica todo-parte es expl´ıcita. El uso de agregaci´on espacial impone restricciones de integridad.

Ejemplo 2.2.4 En la figura 2.11 se muestra un ejemplo de agregaci´on espacial entre

las clases espaciales Manzana y Lote, ambas con geometr´ıa pol´ıgono. Esta agregaci´on implica las siguientes restricciones de integridad espacial:

1. El ´area de una instancia de Manzana est´a limitada al ´area ocupada por las ins-tancias de Lote que la componen.

2. No existe superposici´on entre instancias de Lote.

3. No existe ning´un objeto de Lote fuera de un objeto Manzana.

(55)

Modelos l´ogicos para informaci´on geogr´afica 29

Figura 2.11: Agregaci´on espacial en OMT-G

as´ı en reglas de integridad topol´ogicas, sem´anticas y/o restricciones definidas por el usua-rio. Las reglas de integridad topol´ogicas est´an restringidas por las propiedades geom´etricas y las relaciones espaciales de las entidades espaciales [EF91]. Por ejemplo, una restricci´on de integridad topol´ogica podr´ıa ser: “la parada(punto) de una l´ınea de colectivos debe

estar ubicada sobre laruta(conjunto de l´ıneas) de recorrido”. Las restricciones sem´

anti-cas tienen que ver con el significado de los fen´omenos y son propias de la aplicaci´on. Un ejemplo de restricci´on sem´antica es el siguiente: “no es posible ubicar unaconstrucci´on

de edificio sobre un r´ıo”. Las restricciones definidas por el usuario se conocen como

“re-glas de negocio”. Por ejemplo: “por cuestiones legales no se permiten centros comerciales cercanos a menos de 200mts de unhospital”.

Una caracter´ıstica saliente de OMT−G es que se dise˜n´o no solo resaltando las carac-ter´ısticas de modelado, sino tambi´en la capacidad de definir restricciones de integridad a nivel conceptual. OMT−G provee las primitivas necesarias para definir datos espaciales, relaciones espaciales, y permite definir expl´ıcitamente restricciones topol´ogicas, sem´ anti-cas y reglas de negocio. Siendo un modelo orientado a objetos, adem´as permite que ciertas restricciones espaciales sean encapsuladas como m´etodos asociados a clases espaciales.

2.3.

Modelos l´

ogicos para informaci´

on geogr´

afica

(56)

usan las estructuras l´ogicas, sin necesidad de manejarse con la complejidad del nivel f´ısico, lo que simplifica considerablemente el dise˜no de la aplicaci´on.

Con relaci´on a los modelos de datos para informaci´on espacial de inter´es en esta tesis, en la secci´on anterior se identificaron los objetos espaciales y su componente geom´etrica al mayor nivel de abstracci´on. A nivel l´ogico se definen primitivas como puntos, arcos o superficies y se considera sus formas de representaciones. Se necesita representar conjuntos infinitos de puntos del espacio Eucl´ıdeo en la computadora. Existen dos modos principales de resolver ese problema [RSV02, Mol95]:

Modelo mosaico8, aproxima el espacio continuo a uno discreto (figura 2.12(a)).

Modelo vector, construye estructuras de datos que incluyen arcos y puntos (figura 2.12(b)). De manera similar trabaja la representaci´on “Medio Plano” [BT88].

Ejemplo 2.3.1 Supongamos que se requiere mantener informaci´on sobre el ´area ocupada por una ciudad C. La geometr´ıa del ´area que ocupa la ciudad es un pol´ıgono. Bajo la representaci´on mosaico, se identifica al conjunto de celdas que aproximan el ´area ocupada por el interior de la ciudad, mientras que en el modelo vector se representar´ıa con la lista

de puntos que definen el contorno del pol´ıgono que aproxima al ´area.

2.3.1.

Modelo mosaico

El modelo mosaico define una descomposici´on celular del plano como una grilla o arreglo de celdas disjuntas. A cada celda se le asocia un conjunto de valores de atributos. La partici´on del espacio en celdas define el plano discreto, llamado malla, el que puede hacerse en un azulejado de celdas fijas o regulares denominado raster o en mosaicos variables o irregulares (figura 2.13 (a-b)). En este modelo cada celda est´a asociada con una posici´on en el arreglo y podr´ıa asociarse con un pixel.

(57)

Modelos l´ogicos para informaci´on geogr´afica 31

Figura 2.12: Modelos de representaci´on

Si bien en la pr´actica existe una asociaci´on natural entre el modelo mosaico y la representaci´on del espacio basado en campos, el modelo mosaico tambi´en se puede utilizar para el modelo del espacio basado en objetos, donde los objetos abstractos como polil´ınea, pol´ıgono o regi´on se representan por la enumeraci´on finita de celdas. En el modelo mosaico se aproxima cada objeto espacial con un conjunto finito de celdas. A mayor resoluci´on de grilla, mejor representaci´on pero mayor cantidad de celdas a almacenar para representar un objeto. Por ejemplo, para una imagen A4, con 12pts/mm se requieren de 9 millones de pixels. Un problema claro es que a mayor resoluci´on, m´as ineficiente ser´a el tiempo de respuesta de las operaciones.

2.3.2.

Modelo vector

(58)

Figura 2.13: Dos representaciones del modelo mosaico

Representar polil´ıneas como una lista de puntos < p1, ..., pn >, donde cada pi es un

v´ertice. Cada par (pi, pi+1), con i < n, representa un segmento de la polil´ınea.

Representar pol´ıgonos tambi´en como una lista de puntos con la restricci´on polil´ınea

cerrada, y el par (pn, p1) como un arco m´as del pol´ıgono.

Representar regi´on como un conjunto de pol´ıgonos.

Para el modelo espacial basado en campos la presentaci´on generalmente se basa en Modelos de Elevaci´on Digital (DEM’s). Los DEM’s son ´utiles para representar cualquier fen´omeno natural que es una funci´on continua del espacio 2D. Los DEM’s toman colec-ciones de datos de muestra, a partir de los cuales los otros puntos son obtenidos por interpolaci´on. Un m´etodo de interpolaci´on usado es el de Redes Irregulares Triangulares (TIN’s).

2.3.3.

Representaci´

on de geometr´ıa para colecciones de objetos

Las siguientes representaciones est´an enfocadas al modelo vector y espacio basado en objetos. Al considerar colecciones y no objetos individuales interesan las relaciones

(59)

Modelos l´ogicos para informaci´on geogr´afica 33

de objetos son [RSV02]: spaghetti,red, ytopol´ogico. Entre ellos fundamentalmente difieren en la expresi´on de lasrelaciones topol´ogicas entre los objetos componentes. Las relaciones topol´ogicas entre los objetos espaciales son aquellas que permanecen invariantes bajo transformaciones topol´ogicas (adyacencia, superposici´on, disjunto e inclusi´on). Esto es, se preservan a´un cuando los objetos espaciales son trasladados, rotados o escalados en el plano. La representaci´on expl´ıcita de tales relaciones en el modelo de datos espacial provee mayor conocimiento y es ´util para la evaluaci´on de consultas espaciales.

En el modelo de representaci´on spaghetti [LT92, WD04], la geometr´ıa de cualquier objeto espacial que pertenece a la colecci´on se describe en forma independiente de los otros objetos. En este modelo no se guarda la topolog´ıa y las relaciones topol´ogicas se calculan por demanda. Las principales caracter´ısticas del modelo son que es simple y que habilita la representaci´on heterog´enea para poder mezclar puntos, polil´ıneas y regiones sin restricciones. Adem´as, debido a que los objetos se guardan independientemente, provee al usuario final una manera simple de ingresar nuevos objetos a la colecci´on. Por otro lado, las desventajas del modelo son principalmente la p´erdida de informaci´on expl´ıcita sobre las relaciones topol´ogicas entre objetos espaciales y la redundancia que implica la representaci´on. Por ejemplo, los l´ımites entre dos regiones adyacentes se mantienen duplicados y eventualmente podr´ıan no coincidir.

El modelo de representaci´on red9 [LT92, WD04] fue dise˜nado para modelar redes y grafos. Es especialmente adecuado para aplicaciones cuyo modelo conceptual subyacente es del tipo red, como por ejemplo las redes de transporte. El modelo almacena las relacio-nes topol´ogicas entre puntos y polil´ıneas. El conjunto de tipos geom´etricos a considerar incluye:

punto: [x:real, y :real]

nodo: [punto, < arco >]

arco: [nodo−inicial, nodo−f inal, < punto >]

pol´ıgono: < punto >

(60)

el test de conectividad y c´alculos de red, como camino m´as corto. Dependiendo de la implementaci´on, las redes pueden ser planas o no. La principal ventaja de este modelo es su descripci´on intr´ınseca de topolog´ıas de red, con la noci´on de conectividad. Esto lo hace apropiado para los requerimientos de representaci´on y consultas de cierto tipo de aplicaciones basadas en redes.

El modelo topol´ogico [LT92, WD04] es similar al modelo de red, excepto que la red es planar. Este tipo de red induce a la subdivisi´on planar en pol´ıgonos adyacentes, algunos de los cuales pueden no corresponder a objetos geogr´aficos. Los objetos de inter´es de este modelo son:

punto: [x:real, y :real]

nodo: [punto, < arco >]

arco: [nodo-inicial, nodo-final, pol´ıgono-izq, pol´ıgono-der, <punto>]

pol´ıgono:< arco >

regi´on: {pol´ıgono}

Como en el modelo de red, un nodo se representa por un punto y la lista de arcos que se inician o terminan en dicho nodo. Si la lista est´a vac´ıa corresponde a un punto. Los puntos sueltos se usan para identificar ubicaciones espec´ıficas, como torres, capitales, etc. Los arcos, adem´as de los puntos extremos y v´ertices, tienen referencia al pol´ıgono izquierdo y derecho que los tienen como l´ımite com´un.

Un pol´ıgono se representa por una lista de arcos, cada arco siendo compartido con pol´ıgonos vecinos. Existe cierta redundancia por razones de eficiencia al acceder a los ob-jetos. Por ejemplo, los pol´ıgonos pueden ser accedidos a trav´es de la estructura pol´ıgono o de sus arcos. Sin embargo, no hay redundancia al almacenar la geometr´ıa, cada punto/l´ınea se guarda una ´unica vez.

(61)

Modelos l´ogicos para informaci´on geogr´afica 35

P” es directa. Otra ventaja est´a relacionada con la consistencia de la actualizaci´on. Como los objetos est´an compartidos, la consistencia de operaciones de actualizaci´on es m´as f´acil de garantizar. Esta aproximaci´on tiene algunas desventajas. Mostrar una regi´on requiere recuperar los pol´ıgonos adyacentes y filtrar la informaci´on que no interese. Segundo, la complejidad de la estructura subyacente puede resultar en p´erdida de eficiencia para algunas operaciones, por ejemplo, mostrar una vista de un mapa. En el modelo topol´ogico, las operaciones de recorrido son mucho m´as lentas que en otros modelos. Y finalmente, agregar un objeto requiere el c´alculo previo de parte del grafo planar.

2.3.4.

Evaluaci´

on de los modelos

La selecci´on de un modelo conceptual y un modelo l´ogico son independientes. Cualquie-ra de los dos modelos l´ogicos vistos sirve para representar tanto los modelos conceptuales basados en objetos como en campos. En [Lua04] se enumeran algunos aspectos que pueden considerarse al momento de tomar una decisi´on:

Eficiencia de la representaci´on. El modelo vector es m´as eficiente en el uso del espacio de almacenamiento que el modelo mosaico, que dependiendo de la precisi´on requerida, puede implicar grandes vol´umenes de datos o celdas. Esto adem´as implica que las operaciones sobre los datos consumen m´as tiempo.

Eficiencia de c´alculo. El modelo vector implica el manejo de estructuras de datos m´as complejas que hace que ciertas operaciones espaciales como por ejemplo “cubri-miento” entre fen´omenos sean m´as ineficientes que en el modelo mosaico. El modelo mosaico, por su parte, usa una estructura de datos simple como el arreglo y las que operaciones como filtrado son simples de implementar.

Poder expresivo. El modelo vector permite representaciones expl´ıcitas de las rela-ciones topol´ogicas entre objetos geogr´aficos, por lo que resulta m´as apropiado en problemas que requieren de an´alisis topol´ogico como “identificar caminos”.

(62)

provienen de sat´elites y existen aplicaciones donde esta manera de recuperar in-formaci´on es esencial. El modelo vector se asocia a aplicaciones donde los datos provienen de dise˜nos del tipo Dise˜no Asistido por Computadora (CAD)10.

2.4.

Bases de Datos Espaciales

UnSistema de Manejo de Bases de Datos Espacial (SMBDE)11 provee la administra-ci´on efectiva y eficiente de datos que est´an relacionados con un espacio de inter´es. Este espacio puede referirse al mundo f´ısico (geograf´ıa, planificaci´on urbana, astronom´ıa), a par-tes de organismos vivos (anatom´ıa humana), a dise˜nos de ingenier´ıa (circuitos integrados de gran escala, dise˜no de autom´oviles o estructuras moleculares para drogas farmacol´ ogi-cas), etc. Un SMBDE es una clase particular de Sistemas de Manejo de Base de Datos (DBMS) (SMBD)12 que adem´as administra informaci´on con referencia a un espacio. Los requerimientos y t´ecnicas necesarias para manipular objetos geogr´aficos, que tienen iden-tidad, extensi´on, ubicaci´on y relaciones particulares son diferentes de los necesarios para manejar im´agenes capturadas. Por su parte, los servicios ofrecidos por los sistemas de bases de datos tradicionales tampoco son suficientes. Seg´un [Gut95] un sistema de bases de datos espacial se puede definir como un software con las siguientes caracter´ısticas.

1. Un SMBDE es un SMBD.

2. Cuenta con un modelo de datos, tipos de datos espaciales y el lenguaje de consulta para acceder a los datos.

3. Provee la implementaci´on de datos espaciales, capacidades para indexado espacial y algoritmos eficientes para recuperar informaci´on.

Una forma de extender un SMDB Relacional a un SMBDE ser´ıa enriqueciendo el sistema de tipos de forma que incluya datos espaciales. La inclusi´on de estos tipos de datos

10En Ingl´esComputer-Aided Design (CAD).

(63)

Bases de Datos Espaciales 37

requiere definir su estructura junto con las operaciones sobre ellos. Por ejemplo, si se define el tipo de datos pol´ıgono se podr´ıa incluir la operaci´on ´areaPoligono. Las combinaciones de tipos de datos y sus operaciones se definen como tipos de datos abstractos espaciales

(TDAE). Definir el sistema de TDAE adecuado es una tarea desafiante y, en general, se puede decir que el resultado final es un compromiso entre simplicidad de la definici´on y riqueza de la representaci´on.

Por otra parte, los Sistemas de Manejo de Bases de Datos Relacionales Orientados (SMBDROO)a Objetos13 combinan dos tecnolog´ıas: sistemas de bases de datos y len-guajes de programaci´on orientados a objetos. Esta mezcla trae ventajas tanto desde el punto de vista de dise˜no como desde el punto de vista de desarrollo: poder de modelado, extensibilidad, reutilizaci´on de c´odigo y facilidad de mantenimiento.

2.4.1.

Tipos de Datos Abstractos Espaciales

La definici´on detipos de datos abstractos (TDA) es una estrategia de los SMBDROO para solucionar la falta de poder de modelado de las bases de datos relacionales para ciertos problemas. Un TDA es una vista de los objetos que define y el conjunto de operaciones sobre ellos. La idea es ocultar la estructura del tipo de dato y extender el lenguaje de consulta. El primer desaf´ıo consiste en definir los tipos geom´etricos. En general, existe un compromiso entre el poder de modelado capturado por la definici´on y las restricciones impuestas sobre la representaci´on geom´etrica elegida. Esta relaci´on est´a fuera del estudio de esta tesis. Sin perder generalidad se enumeran los siguientes objetos espaciales:

punto(0-dimensi´on).

polil´ınea(1-dimensi´on). Lista de pares de segmentos conectados, quedan fuera las polil´ıneas complejas.

regi´on(2-dimensi´on). Una instancia de este tipo es cualquier conjunto de pol´ıgonos no superpuestos.

Para completar la definici´on de un TDA Espacial (TDAE) el pr´oximo paso es definir las operaciones necesarias para expresar las consultas.

Referencias

Documento similar

dente: algunas decían que doña Leonor, &#34;con muy grand rescelo e miedo que avía del rey don Pedro que nueva- mente regnaba, e de la reyna doña María, su madre del dicho rey,

No había pasado un día desde mi solemne entrada cuando, para que el recuerdo me sirviera de advertencia, alguien se encargó de decirme que sobre aquellas losas habían rodado

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

You may wish to take a note of your Organisation ID, which, in addition to the organisation name, can be used to search for an organisation you will need to affiliate with when you

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación