R ESUMEN EXTENDIDO
6.2. Método y material
Gordo (2008), Ariza-López et al. (2011), Ariza-López y Mozas-Calvache (2012), Ariza- López y Rodríguez-Avi (2014), Ruiz Lendínez et al. (2016) y Gil de la Vega et al.
(2016).
El proyecto de investigación fue apoyado por el Departamento de Ciencia y Tecnología (DCT) del Ejército de Tierra de Brasil, que patrocinó este proyecto en beneficio de su Servicio Geográfico (DSG). DSG lleva la información geoespacial en el ejército brasileño. Según la legislación brasileña (Brasil 1967) DSG es el órgano responsable de generar y mantener los estándares técnicos para la asignación cartografía terrestre en Brasil.
Este proyecto de investigación ha generado, hasta el momento presente, las siguientes publicaciones hasta el momento presente: Xavier et al. (2014), Ariza-López et al.
(2015), Xavier et al. (2015a, 2015b, 2015c), y Xavier et al. (2016a, 2016b). Dos trabajos están actualmente bajo consideración de los comités editoriales: Ariza-López et al.
(2017) y Xavier et al. (2017).
La capa Acceso a datos gestiona a la relación entre los datos de prueba y de referencia. Puesto que los procedimientos de evaluación externa dependen de datos de referencia para la comparación, este nivel proporciona las correspondencias (casados) entre ambos conjuntos de datos para así permitir comparaciones. Hay dos maneras de facilitar los datos de referencia: (1) remoto: tal que quien llama al servicio proporciona los datos de referencia; (2) local: tal que el servicio mismo tiene su propio conjunto de datos de referencia. Esta capa administra el acceso a datos de referencia locales y también ofrece un módulo de casado que proporciona las correspondencias entre los datos de prueba y de referencia (locales o remotos). Según lo que se requiera por el método externo, este casado puede ser en el nivel de objeto geográfico, o en el ámbito interno, es decir, teniendo en cuenta los vértices de una geometría.
El casado entre objetos es un requisito de los métodos de evaluación externa para la calidad de datos geoespaciales. En la arquitectura propuesta el módulo de casado desempeña el papel de encontrar las correspondencias entre estos dos conjuntos de datos (referencia y prueba). Estas correspondencias pueden ser a nivel de función (entre objetos), o el nivel interno (entre partes de objetos, por ejemplo, los vértices).
Según se analizó en Xavier et al. (2016a), hay una diversidad de soluciones en la literatura para el casado de objetos. Así que decidimos investigar cuáles serían adecuadas a nuestro servicio de control de calidad. Para lograr este objetivo hemos abierto tres frentes de trabajo: (1) el desarrollo de medidas de similitud; (2) preparación de un banco de pruebas de casado; y (3) sobre este banco de pruebas la aplicación de algunos métodos de casado bajo un diseño de experimentos. En cuanto al casado interno, hay pocos métodos en este nivel de actuación, como podemos ver en Xavier et
Figure 6.1. Arquitectura propuesta para un servicio de control de calidad.
al. (2016a). En este trabajo se propone un nuevo método para casado a nivel interno que está basado en el descriptor de contexto de forma de Belongie et al. (2002).
La capa Evaluación contiene las implementaciones de métodos de evaluación directos externos y directos internos. Los métodos directos externos requieren una referencia externa que se maneja en el nivel del Acceso a datos. La capa de Evaluación también contiene el módulo de informe que es responsable de generar el informe de calidad de diferentes maneras: un informe legible, o un informe XML en formato ISO, actual (ISO 2016) o antigo (ISO 2003b). Este nivel representa el núcleo de la arquitectura propuesta para la evaluación de la calidad de datos geoespaciales utilizando servicios web. En este estudio adoptamos la norma brasileña para la calidad de los datos geoespaciales, llamada CQDG (DCT 2016a). Teniendo en cuenta que esta norma proporciona los procedimientos de evaluación de calidad para todos los productos de datos geoespaciales en Brasil, esta norma desempeña el papel de modelo de calidad en este proyecto de investigación. En esta parte de la arquitectura desarrollamos procedimientos de evaluación de la calidad descritos en la norma CQDG para los productos datos geoespaciales vectoriales.
En la arquitectura propuesta, la capa WPS es el punto de contacto con los clientes.
Esta capa está encargada de las solicitudes y respuestas usando la interfaz WPS. Los procedimientos de evaluación de la calidad a menudo implican tareas complejas y personas de diferentes organizaciones o departamentos. Ante esta situación tenemos dos principios de diseño: interoperabilidad y simplicidad. El principio de interoperabilidad indica que el nivel WPS debe seguir la especificación WPS y sus esquemas XML con el fin de permitir una forma estandarizada de comunicación. El principio de simplicidad nos lleva a evitar problemas innecesarios en el proceso sí mismo, así que el proceso debe ser tan directo como sea posible. El nivel WPS debe manejar todas las cuestiones de comunicación, procedimientos de validación y tareas de cliente-servidor.
La arquitectura propuesta pretende ser general para la evaluación automática de la calidad y puede aplicarse independientemente de las bases de datos o plataforma de software.
6.2.2. Material
En esta investigación utilizamos R como la herramienta informática estadística. R es un lenguaje y un entorno enfocado en herramientas estadísticas y gráficos (R Core Team 2014). Otros materiales relevantes son los datos geoespaciales utilizados para probar el servicio de control de calidad, y el software desarrollado que implementa efectivamente los conceptos propuestos en este estudio.
Se ha trabajado con conjuntos de datos geoespaciales producidos por el IGN y el IECA. Se han utilizado datos de la Base Topográfica Nacional 1:25.000 (BCN25) de la cartografía nacional proporcionados por el Instituto Geográfico Nacional de España
(IGN 2015); y también datos de 1:10.000 de la Base Cartográfica de Andalucía 1:10.000 (BCA10) de la cartografía regional proporcionados por el Instituto de Estadística y Cartografía de Andalucía (ICEA 2015). Hemos seleccionado diferentes paisajes: costa y montaña, rural y urbana. Las siguientes hojas 1:25.000 fueron utilizadas para proporcionar los datos: 0896-3, 0896-4, 1003-4, 0999-1, 0999-2, 0999-3 y 0999-4.
Todo el software desarrollado en este proyecto de investigación se basa en la biblioteca TerraLib. TerraLib es una librería de código abierto desarrollada por el Instituto Brasileño para la Investigación Espacial (INPE) (Câmara et al. 2008), y está disponible en su repositorio (DPI 2013). Dentro de TerraLib existe un subproyecto llamado TerraOGC – una estructura para el desarrollo de Web-GIS que contiene módulos para muchas de las especificaciones del OGC, como GML, WMS, WFS y WCS. Para esta investigación, el módulo WPS existente fue mejorado para atender a los principios de diseño descritos aquí. Como parte de los procesos WPS, se creó un módulo de para procesamiento de la calidad de datos (DQEval) que contiene la mayor parte del código relacionados con este proyecto. Se puede encontrar en línea en su repositorio (DPI 2017).