5. Análisis de Resultados
5.3. Explotar los datos enlazados a través de herramientas de visualización
Una vez que obtuvimos los datos en formato RDF representados bajo el estándar Geosparql, se desarrolló una herramienta web que nos permite visualizar la información que se encontraba en el servidor de datos RDF.
Consultar los datos en este servidor resulta dificultoso para usuarios que desconozcan lenguaje de consulta sparql.
Para ello se creó un mecanismo que permitan consultar datos de forma sencilla e intuitiva. Representando los resultados sobre un mapa de Open Street Map, lo que le permitirá al usuario tener un razonamiento espacial.
Se implementó un mecanismo que permita utilizar las funciones de procesamiento de datos espaciales de geosparql para procesar la información almacenada en el servidor de tripletas.
96
Sin embargo el servidor de tripletas seleccionado lastimosamente tiene un rendimiento muy malo a la hora de procesar datos geoespaciales ocasionando que el servidor deje de estar disponible, hasta un reinicio del mismo.
Para mejorar el rendimiento del servidor se recomienda aumentar las características del equipo donde se ejecuta Parliament Triple Store, sin embargo por cuestión de recursos económicos este resulta complicado.
Luego de realizar este análisis en base a la problemática inicial y a la solución propuesta para cumplir con los objetivos planteados al inicio del proyecto podemos obtener un cuadro comparativo de las ventajas y desventajas que se tiene al almacenar los datos geográficos en un archivo shapefile o en formato para la web semántica bajo el estándar geosparql.
Tabla 19. Ventajas y desventajas de utilizar shapefile y RDF bajo el estándar Geosparql
Ventajas de los datos almacenados en Shapefile
Ventajas de los datos representados en web semántica utilizando el estándar Geosparql
Menor espacio en disco
Gran cantidad de herramientas para procesamiento de datos espaciales Formato estándar para datos
geográficos
Se puede almacenar la información en distintos sistemas de coordenadas Mantiene por separado los datos de
los metadatos
Gran cantidad de herramientas para visualizar este tipo de archivos
Integración de datos a través de linked data
Datos geográficos con significado semántico
Datos listos para ser integrados con otros datos a través de Linked Data (Interoperabilidad)
Funciones básicas para
procesamiento de datos
geoespaciales
Rendimiento bajo de las herramientas disponibles hasta el momento a la hora procesar datos geoespaciales bajo el estándar geosparql
Representación de coordenadas en serialización WKT o GML
Todas las coordenadas en WGS 84 Desventajas de los datos almacenados en
Shapefile
Desventajas de los datos representados en web semántica utilizando el estándar
97
Geosparql La mayoría de las herramientas
disponibles para visualizar este tipo de archivos son pagadas.
Se compone de varios archivos. Solo puede almacenar una geometría
por tabla
No puede almacenar valores nulos
Falta de rendimiento de las herramientas disponibles para procesar datos espaciales.
Necesitan una infraestructura de gran capacidad para procesar la información.
Funciones básicas de procesamiento de datos geoespaciales
Inexistencia de herramientas para levantar información en este formato
Por la experiencia adquirida en el desarrollo del presente trabajo, es de suma importancia que se maneje un estándar para el manejo de la información, se recomienda que la información que liberen estas instituciones, tienen que estar basada en estándares, ya sea utilizando los estándares definidos por SEMPLADES para el caso de Ecuador, u optar por los estándares propuestos por OGC para los sistemas de información geográfica
La información debería ser liberada en formatos libres como: txt, CSV, json, GML/XML entre otros, para permitir consumir dicha información.
Luego de transformar todos estos datos a RDF bajo el estándar Geosparql, utilizando las herramientas desarrolladas se tiene como resultado: La base de datos no relacional subida en el servidor de tripletas Parliament Triple Store.y a la vez se puede visualizar esta información a través del visualizador desarrollado. Esta iniciativa se ha probado con datos de Ecuador, sin embargo se podría extender a los demás países.
Después de analizar los resultados obtenidos con las herramientas implementadas con el fin de dar solución a la problemática planteada.
Se determinó que se logró solucionar el problema parcialmente, ya que no se buscó crear un repositorio geoespacial estandarizado. No se definió un estándar para que todas las instituciones o personas que se dedican a levantar información lo adopten. Únicamente se brindó una serie de herramientas que permitan a los usuarios transformar su información a un formato libre, estandarizado, que permita integrar la información. Centrándonos en la información almacena en shapefile, primeramente por la cantidad de información que hay y segundo porque la información publicada en este formato por las diferentes instituciones, podríamos considerarla como información formal u oficial.
98
Abriendo las puertas para estudios futuros, a través de diferentes ramas, por ejemplo:
Extender la herramienta para que trabaje con otros formatos de archivos como csv, xls, def, etc.
Implementar un repositorio semántico utilizando las herramientas Enlazar datos geoespaciales con otro tipo de información.
Mejorar el visualizador, creando o implementando nuevas funcionalidades. Generar un proceso de transformación inverso con la información enlazada.
Implementar un visualizador de mapas para móviles, que permite realizar consultas y búsquedas básicas de información.
Servicios de consulta con protocolo REST.
Sin duda alguna existen un sin número de trabajos futuros que se puede desarrollar a partir de este proyecto.
En este capítulo se analizó los resultados obtenidos con las herramientas desarrolladas, determinado en cada una de las etapas, como aportaron a la solución de la problemática planteada, a pesar de que no se logró solucionar como se esperaba debido a la complejidad del caso y a la magnitud del mismo, sin embargo se brindó una serie de herramientas que hace un considerable aporte a la solución La herramienta para transformar los shapefile a RDF nos da una efectividad del 72% a la hora de transformar información, a pesar de no tener la efectividad buscada o requerida por los usuarios que buscan interoperabilidad de datos geoespaciales, sin embargo se la puede usar como base para generar datos de prueba para trabajos fututos.
99
CONCLUSIONES
El presente trabajo de fin de titulación tuvo como objetivo desarrollar un prototipo funcional que permite integrar información geoespacial proveniente de diferentes fuentes de información. Luego de implementar la solución planteada se puede concluir lo siguiente: A pesar de no solucionar en su totalidad la problemática planteada en un inicio, sin embargo si se brinda una herramienta que nos permita integrar la información a través de la web semántica, dando una solución parcial al problema.
Las herramientas que nos permite integrar datos geoespaciales provenientes de instituciones gubernamentales y privadas que han liberado información geográfica, utilizando tecnología linked data como parte de la iniciativa de datos abiertos. Para el proceso de conversión de datos geográficos desde formatos shapefile a RDF fue necesario el desarrollo de una herramienta que permita al usuario hacerlo fácilmente a través de una interfaz gráfica o de línea de comandos, adaptándose a la estructura del shapefile. Esta herramienta ha quedado como una librería java para ser consumida desde otra aplicación. Para todo el proceso se ha trabajado bajo el estándar geosparql.
Las consultas sobre los datos geográficos en formato RDF se presentan utilizando geosparql como estándar y como extensión del lenguaje de consulta SPARQL, que permite realizar procesamiento de datos espaciales a través de las funciones que éste tiene implementadas.
Todos los resultados de este trabajo, tales como documentación técnica y archivos de prueba están disponibles. La información se encuentra en formato RDF.
Actualmente se han enlazado datos de las fuentes de datos utilizadas en este trabajo, sin embargo están listos para ser enlazados a fuentes externas tales como dbpedia, u otras fuentes de datos que se puedan georeferenciar con los conjuntos de datos obtenidos.
Para la visualización de estos datos geográficos generados, se desarrolló una herramienta web que permite conectarse a cualquier endpoint que contenga una implementación de geosparql, proporcionando las funciones de navegación a través de facetas. Se puede visualizar la información geoespacial sobre un mapa de OpenStreetMap y realizar procesamiento de los datos utilizando algunas funciones de geosparql.
Las funciones para procesamiento de información espacial, a pesar de tener un rendimiento bastante bajo, brindan una gran utilidad para enriquecer la información.
100
Las herramientas GIS nos brindan un mejor rendimiento y una mayor diversidad a la hora de realizar procesamiento de datos geoespaciales, sin embargo, es posible realizar un procesamiento de datos con la extensión de lenguaje de consulta geosparql, siendo este procesamiento válido para usuarios que buscan únicamente herramientas básicas de procesamiento de datos geoespaciales.
Se ha verificado que los archivos en formato shapefile son mucho más livianos que los datos en formato RDF habiendo una diferencia aproximadamente de 240% en relación al peso.
Para el almacenamiento de tripletas de tipo geográfico se utilizó Parliament Triple Store, porque brinda en su totalidad la extensión de lenguaje de consulta geosparql, sin embargo a la hora de ejecutar el procesamiento de datos espaciales a través de las consultas geosparql tiene un rendimiento bastante bajo cuando se procesan grandes volúmenes de datos, ocasionando respuestas inesperadas por el servidor.
101
RECOMENDACIONES
Para dar continuidad a este proyecto se recomienda utilizar la herramienta desarrollada para la extracción de información geográfica desde fuentes shapefile, ya que existe gran cantidad y variedad de información, que puede ser representada en la web semántica, quedando lista esta para ser enlazada a otras fuentes de información permitiendo el enriquecimiento de la misma.
En la sección de visualización de este trabajo se pueden incrementar funciones geosparql para el procesamiento de datos Geoespaciales dentro del visualizador.
Este trabajo de tesis queda abierto a la definición de vocabularios extendidos que permitirán representar información adicional a las geometrías que contienen los datos geográficos observados dentro de un archivo shapefile
Es factible la extracción desde diferentes fuentes de datos, como Excel, bases de datos relacionales entre otros para ampliar las fuentes de datos de consulta
Seguir una metodología de desarrollo de software y a la vez una metodología para generar linked data, a pesar de la dificultad para llevar ambas metodologías a la par, se obtiene muy buenos resultados, garantizando la fiabilidad del proyecto.
Las instituciones pueden brindar a sus usuarios la posibilidad de visualizar datos espaciales proporcionado visualizadores geoespaciales a sus usuarios.
102
BIBLIOGRAFÍA
(OGC), O. G. (2012). OGC. Retrieved from http://www.opengeospatial.org/ogc
Diseño e Dmplementacion de un Repositorio Ecuatoriano de Datos Enlazados Geoespaciales. (2014, Junio). Cuenca, Azuay, Ecuador.
Antonio Morales Nicolás, I. M. (2010, 03). Razonamiento Espacial con Relaciones Cardinales Basado en Problemas de Satisfacción de Restricciones y Lógicas Modales. Universidad de Murcia, 223.
Battle, R., & Kolas, D. (2012). Enabling the geospatial Semantic Web with Parliament and GeoSPARQL. Semantic Web, 355-370.
Berners-Lee, T. (2006, 07 27). Linked Data. Retrieved 06 14, 2014, from
http://www.w3.org/DesignIssues/LinkedData.html
bioontology. (n.d.). Comparison of Triple Stores. Retrieved from bioontology.org:
http://www.bioontology.org/wiki/images/6/6a/Triple_Stores.pdf Coors, V. (2015). Ohne smarte Geodaten keine smarten Städte. Fachbeitrag, 248. Corcho, O. (2011). Map4rdf. Retrieved from http://oeg-upm.github.io/map4rdf/
Elmes, G. A. (2005). GIS and Society: Interrelation, Integration, and. A Research Agenda for Geographic Information, 287.
Group, R. W. (2014, 02 25). Resource Description Framework (RDF). Jens Lehmann. (2010, 04 20). Linjked GeoData. Retrieved 11 10, 2015, from
http://linkedgeodata.org/LGDBrowser
José A. Cajaraville, T. F. (2006). Configuraciones epistémicas y cognitivas en tareas de visualización y razonamiento espacial. In X SIMPOSIO DE LA SEIEM, 7.
Kruchten, P. (1995). Architectural Blueprints—The 4+1 View. Tutorial Proceedings of Tri-Ada,
540-555.
Lapuente, M. J. (2013, 12 08). Hipertexto, el nuevo concepto de documento en la cultura de la imagen. Universidad Complutense de Madrid, 184.
Lieberman, J., Singh, R., & Goad, C. (2007, 07 21). W3c geospatial vocabulary. Incubator group report. W3C.
Luca, D. d. (2011, 07 02). RedUsers Comunidad de Tecnología. Retrieved 06 12, 2014, from
http://www.redusers.com/noticias/html5-y-su-importancia-en-la-web-semantica/ MULTIAYUNTAMIENTO, O. -P. (n.d.). Open data Portal de dades obertes. Retrieved 11 11, 2015,
from http://opendata.cloudbcn.cat/MULTI/es/what-is-open-data
Open Geospatial Consortium. (2012, 09 10). OGC GeoSPARQL - A Geographic Query Language for RDF Data, 1.0. (M. P. Herring, Editor) Retrieved from
103
Parliament. (2009, 06). Parliament™ A High-Performance Triple Store, SPARQL Endpoint, and Reasoner. Retrieved from http://parliament.semwebcentral.org/
Randell, D. A., Cui, Z., & Cohn, A. (1992). A spatial logic based on regions and connection. kr, 92, 165-176.
Salas, J. M., Hart, A., Norton, B., Vilches, L. M., De León, A., Goodwin, J., et al. (2011). eoGeo Vocabulary: Defining a shared RDF representation for GeoData. NeoGeo.
Saquicela, V., Espinoza, M., Piedra, N., & Villazón, B. (2014). Ecuadorian Geospatial Linked Data. SENPLADES. (2013). Catálogo Nacional de Objetos Geográficos Versión 2.0. Quito, Ecuador.
Smartland, UTPL. (2014, 06 12). Smartland. (U. T. Particular, Producer) Retrieved from
Smartland: http://smartland.utpl.edu.ec/
Stadler, C. (2015, 07 21). LinkedGeoData.org. Retrieved 11 10, 2015, from
http://linkedgeodata.org/About
Stadler, C., Lehmann, J., Höffner, K., & Auer, S. (2012). LinkedGeoData: A Core for a Web of Spatial Open Data. Semantic Web, 333-354.
Vatant, B., & Wick, M. (2012, noviembre). geonames.org. Retrieved 11 10, 2015, from
http://www.geonames.org/ontology/documentation.html
Vilches-Blázquez, L. M., Sevilla Sánchez, C., Villalón, M., Rodríguez, A. F., & Gómez Pérez, A. (2013). Combinando Linked Data con servicios geoespaciales. IV Jornadas Ibéricas de Infraestructuras de Datos Espaciales , 10.
Vilches-Blázquez, Manuel, L., Villazón-Terrazas, B., Corcho, O., & Gómez Pérez, A. (2010). GeoLinked data and INSPIRE through an application case. In Proceedings of the 18th SIGSPATIAL International Conference on Advances in Geographic Information Systems, 446 - 449.
W3C. (n.d.). Guía Breve de Web Semántica. Retrieved 05 23, 2014, from W3C:
104 APÉNDICES
105
Apéndice A.
Manual de usuario para cambiar el sistema de coordenadas
al sistema WGS84 de un shapefile
Para ejecutar este proceso se realiza lo siguiente:1. Abrir ArcMap 10.2.2
2. Crear un mapa en blanco para ello clic en Archivo/Nuevo/Mapa en blanco/Aceptar
Figura 38. Captura de pantalla de Arcmap - Creación de un mapa nuevo en blanco.
3. Añadir el o los archivos shapefile que se necesitar transformar a WGS84 para ello clic Archivo/Añadir datos/Añadir datos…, se selecciona el archivo *.shp que se desea añadir y realizar clic en Agregar.
106
Figura 39. Captura de Pantalla de ARCMAP – Añadir información geográfica desde archivos shape
4. Después de agregar el archivo shape al software, se procede a realizar la transformación del sistema de coordenadas, para ello se hace clic derecho sobre Capas, clic en Propiedades, en la pestaña de Sistema de Coordenadas.
107
Figura 40. Propiedades del shapefile - Sistema de coordenadas
Se muestra el sistema de coordenadas actual del shapefile, hacer clic en Transformaciones.
5. Se selecciona el sistema de coordenadas inicial, Convertir desde: GCS_ WGS_1984 En: WGS 84, en caso de que no haya esta opción pulsamos el botón agregar, buscamos WGS 84, clic en Aceptar.
108
Figura 41. Ventana de configuración para transformación del sistema de coordenadas
6. Clic en Aceptar.
7. Una vez realizada la trasformación, proceder a exportar los datos en el nuevo sistema de coordenadas, para ello clic derecho sobre los datos de la capa que se va a exportar, en este casoaptitud_agricola, datos/Exportar Datos…
109
Figura 42. Ventana de configuración para exportar shapefile en el nuevo sistema de coordenadas
8. Marcar la opción el marco de los datos, definir la URL de la ruta de salida, con el nombre del nuevo archivo y clic en Aceptar.
9. Como resultado de este proceso, se obtiene un nuevo archivo shapefile, en el sistema WGS 84.
Se repite este proceso desde el paso 3, para transformar nuevos archivos shapefile al sistema de coordenadas WGS 84.
110
Apéndice B. Manual de Usuario – Extraer datos desde fuente shapefile a
sujeto, predicado y objeto.
Para ello se lleva a cabo el siguiente proceso:Figura 43 Convertir de Shapefile a Sujeto, Predicado y Objeto
La herramienta extrae toda la información que contiene el shapefile y genera un script SQL de MySQL en forma de tripletas, utilizando dos archivos de configuración en la que se detalla la forma de extraer los datos.
La información que extrae la herramienta, difiere según el archivo, ya que la estructura de cada uno de estos archivos puede ser diferente, sin embargo la herramienta adapta la información bajo la estructura de sujeto, predicado y objeto propuesto, para ello se cambia los parámetros en los archivos de configuración. Sin embargo es importante tener en cuenta las recomendaciones realizadas en el apartado 4.1 Extracción de Información.
La herramienta se encuentra disponible en:
111
La herramienta actualmente dispone de interfaz gráfica para permitir de manera sencilla la extracción de datos, sin embargo adicional a ello permite ejecutar únicamente el archivo jar, para recibir un archivo de configuración previamente diseñado, siempre y cuando mantenga la misma estructura.
Para ejecutar la herramienta se abre el proyecto ShapeRdf desde cualquier IDE, ya sea Netbeans o Eclipse, se recomienda Netbeans 8.0, y se ejecuta el proyecto. (Clic derecho sobre el proyecto y clic en Run), o ejecutar el archivo jar que se encuentra en la carpeta dist directamente, ya sea desde consola o con doble clic en Windows.
Figura 44 Ejecutar la Herramienta desde Netbeans ShapeRDF
112
Figura 45 Herramienta - Formulario de configurar Conexión a Base de datos
1. Inicialmente pedirá que se configure la conexión a la base de datos MySql. Esto es opcional, en caso que se desee que los datos se exporten directamente a la base de datos se deberá configurar en esta ventana, caso contrario la aplicación crea un script Mysql con la información extraída.
2. Clic en Conectar.
113
Figura 46 Herramienta - Abrir herramienta de Extraer Datos
4. La herramienta solicita seleccionar el archivo shape (*.shp)
Figura 47 Seleccionar archivo con extensión *.shp para la extracción de datos
5. Clic en Abrir, la herramienta carga la interfaz que permitirá crear el archivo de configuración para la extracción, para ello solicita el número de grupos en los que se
114
desea extraer la información, esto se lo obtiene del análisis previo que se realiza al archivo a exportar, en este caso de ejemplo, parroquia_rural.shp, tiene información de parroquias rurales, cantones y provincias, por lo tanto se necesita 3 grupos.
Figura 48 Formulario de configurar el número de grupos a crear para la extracción de datos
6. Clic en Aceptar, posterior a esto se carga la ventana en la que se asignará las diferentes columnas, a los grupos.
Figura 49 Formulario para clasificar los diferentes campos en objetos
Tener en cuenta de asignar todas las columnas a los grupos, con el fin de extraer toda la información necesaria.
115
7. Clic en Siguiente, En esta parte se configura la columna que contiene el identificador del recurso, esto se lo debe realizar por cada grupo creado.
Figura 50 Formulario de configurar el identificador de cada uno de los grupos
8. Hacer clic en Asignar Identificador, posteriormente se procede a configurar el tipo de información a la que corresponde cada uno de los grupos. Se recomienda que el tipo sea igual al nombre del archivo correspondiente en el catálogo nacional de Objetos Geográficos, teniendo en cuenta las recomendaciones para nombrar el archivo.
116
Figura 51 Formulario para asignar un tipo de objeto geográfico a cada uno de los grupos
9. Clic en Asignar Tipo. Con esto se finaliza la extracción, posteriormente pasar a configurar las relaciones entre los grupos en caso de existan.
117
Figura 52 Configuración de las relaciones entre los diferentes grupos
En este paso se asigna la relación entre los grupos, según el previo análisis que se realizó al inicio.
10. Finalmente clic en Extraer Datos, esperar que se ejecute el proceso de extracción,