• No se han encontrado resultados

Recopilación de herramientas de procesamiento y visualización de datos

N/A
N/A
Protected

Academic year: 2022

Share "Recopilación de herramientas de procesamiento y visualización de datos"

Copied!
26
0
0

Texto completo

(1)

Recopilación de herramientas de procesamiento y visualización de datos

Madrid, Junio 2013

(2)

Contenidos

Contenidos...2

1 Introducción...3

2 Características de las herramientas...4

2.1 Herramientas de procesamiento...4

A.Herramientas de depuración...4

B. Herramientas de conversión...6

2.2 Herramientas de análisis estadístico...6

2.3 Servicios de visualización...6

C. Aplicaciones de visualización genéricos...7

D.Wizards, librerías, API...11

E. Herramientas de visualización geoespacial...17

F. Herramientas de visualización de datos temporales...19

2.4 Herramientas para el análisis de redes...20

3 Comparativa...22

4 Conclusiones finales...24

(3)

1 Introducción

En los últimos años se ha producido una enorme proliferación de datos en bruto, que deben ser procesados y preparados en una forma comprensible para el usuario final.

Todos estos datos en bruto suelen ser difíciles de entender, de ahí que se hayan desarrollado distintas herramientas de visualización que faciliten su interpretación.

Sin embargo, este tipo de herramientas, por impactante que puedan ser sus resultados, no soluciona los problemas que puede generar una baja calidad de los datos fuente. De ello se deduce la importancia de trabajar adecuadamente con los datos, antes de proceder a su tratamiento gráfico. El esquema clásico de tratamiento de datos, previo a la ejecución de cualquier análisis, establece que hay que prestar atención a las técnicas de adquisición de los datos, y llevar a cabo un estudio de los datos obtenidos para asegurar que representan adecuadamente al universo de discurso. Una vez asegurados ambos, se puede proceder a someter al conjunto en cuestión a análisis (exploratorio, cualitativo…), y obtener los resultados y la visualización que mejor se ajuste a los resultados obtenidos, y a la información que se quiere transmitir.

El presente documento incluye una recopilación de las mejores herramientas de procesamiento, análisis y visualización de datos gratuitas que se ofrecen actualmente en el mercado.

(4)

2 Características de las herramientas

Para crear un buen análisis y visualización de datos, lo más importante es conocer y entender las herramientas disponibles y su correcta aplicación en los campos relacionados.

Existen muchas herramientas para ayudar a transformar los datos en gráficos, pero éstas pueden conllevar un alto coste.

A continuación se presenta una selección de las mejores herramientas de tratamiento y visualización de datos gratuitas, agrupadas en base a su uso y aplicación principales.

2.1 Herramientas de procesamiento

Las tres herramientas que se muestran a continuación han sido diseñadas para ayudar en la depuración y transformación de los datos a analizar.

A. Herramientas de depuración

2.1.1 DataWrangler

TIPO. Aplicación Web TECNOLOGÍA. HTML LICENCIA. De uso libre ENLACES.

 Sitio web. http://vis.stanford.edu/wrangler/

 Trabajo de investigación. http://vis.stanford.edu/papers/wrangler

Aplicación web interactiva para la limpieza y transformación de datos. Wrangler combina la manipulación directa de los datos visualizados con la inferencia automática de las transformaciones de datos relevantes, lo que permite a los analistas la exploración repetida del espacio de operaciones aplicable y prever sus efectos.

Aprovecha los tipos de datos semánticos (localizaciones geográficas, fechas, códigos de clasificación) para ayudar a la validación y conversión de tipos.

2.1.2 Google Refine

TIPO. Aplicación de escritorio TECNOLOGÍA. Java

LICENCIA. BSD ENLACES.

(5)

 Sitio web. http://code.google.com/p/google-refine/

 Documentación para usuarios. http://code.google.com/p/google- refine/wiki/DocumentationForUsers

 Documentación para desarrolladores. http://code.google.com/p/google- refine/wiki/DocumentationForDevelopers

Herramienta gratuita diseñada con los objetivos de ayudar a entender la estructura y calidad de los datos, y permitir corregir determinados tipos de errores comunes a ellos.

Admite un amplio abanico de formatos: TSV, CSV, *SV, Excel (.xls y .xlsx), JSON, XML, RDF como XML, y documentos Google Data. La fuente de datos puede ser de 4 tipos: a partir de fichero local, desde una URL (puede importar datos de una tabla de una web, de un xml,...), directamente desde clipboard o enlazando un documento de Google Docs. Una vez tratados los datos se pueden volver a exportar para su uso fuera de Google Refine en los formatos TSV (Tab separated values), CSV (Comma separated values), Excel y HTML table.

Google Refine tiene tres aspectos a destacar:

 Limpieza de datos. Permite cambiar contenido de celdas y unificar campos, de forma manual o ayudado por el propio programa (el sistema es capaz de sugerir optimizaciones).

 Transformación de datos. A través de las instrucciones que se pueden usar mediante el lenguaje GREL propio de Google Refine. Permite dividir columnas, crear nuevas columnas según el valor de otra columna, tomar parte del contenido de una columna para crear otra nueva,...

 Creación de nuevos campos de datos. Mediante servicios externos para poder disponer de datos nuevos a partir de datos ya existentes; o haciendo uso de Freebase (base de datos libre colaborativa) para hacer una conciliación de datos.

B. Herramientas de conversión

2.1.3 Mr. Data Converter TIPO. Biblioteca

TECNOLOGÍA. JavaScript

(6)

LICENCIA. MIT ENLACES.

 Sitio web. http://shancarter.com/data_converter/

 Repositorio GitHub. https://github.com/shancarter/Mr-Data-Converter

Aplicación web que convierte los datos de Excel en uno de varios formatos web amigables, incluyendo HTML, JSON y XML.

2.2 Herramientas de análisis estadístico

Herramientas para la combinación de representaciones gráficas de los datos junto con un análisis numérico robusto.

2.2.1 The R Project for Statistical Computin g

TIPO. Lenguaje de programación TECNOLOGÍA. R

LICENCIA. GPL ENLACES.

 Sitio web. http://www.r-project.org/

R es un lenguaje y entorno de programación para gráficos y computación estadísticos, de distribución libre y de código abierto.

Lenguaje basado en comandos, lo que permite crear gráficos a medida, y no sólo d elos tipos de gráficos estandarizados, sino de nuevos gráficos adecuados al conjunto de datos y al problema tratado.

2.3 Servicios de visualización

A continuación se describen algunas de las herramientas de visualización gratuitas clasificadas de acuerdo a sus características tecnológicas

A. Aplicaciones de visualización genéricos

Herramientas que ofrecen diversas opciones de visualización. Aunque algunas siguen apostando por las tablas y gráficos convencionales, muchas otras abogan por ofrecer nuevas opciones tales como diagramas de árbol y nubes de palabras.

(7)

2.3.1 Google Fusion Tables

TIPO. Aplicación Web y API TECNOLOGÍA. JavaScript, Flash LICENCIA. De uso libre

ENLACES.

 Sitio web. http://www.google.com/fusiontables/

 Galería de imágenes. https://sites.google.com/site/fusiontablestalks/stories/

 Documentación de la API. https://developers.google.com/fusiontables/

Aplicación web que permite organizar, gestionar, colaborar, visualizar y publicar datos en la web de una manera sencilla.

Gestiona grandes colecciones de datos que deben estar normalizados y guardados en un archivo Excel, .ods, .csv o .kml.

Permite visualizar los datos mediante gráficos circulares, gráficos de barras, diagramas de dispersión y líneas de tiempo; así como mapas geográficos basados en Google Maps.

2.3.2 Tableau Public

TIPO. Aplicación de escritorio TECNOLOGÍA. Windows, JavaScript LICENCIA. De uso libre

ENLACES.

 Sitio web. http://www.tableausoftware.com/public/

 Galería. http://www.tableausoftware.com/public/gallery

Herramienta gratuita de visualización de datos mediante gráficos que combina algunos elementos tradicionales de las herramientas de business intelligence como puedan ser el modelo de organización de variables mediante el uso de dimensiones y medidas o la conexión con otros sistemas de gestión de información como las bases de datos o las hojas de cálculo con el uso de un interfaz gráfico atractivo, eficiente y rápido.

Algunas de las características más relevantes de esta herramienta son:

 Detección de datos rápida y fácil. Permite trabajar con bases de datos y hojas de cálculo de cualquier tamaño. Acepta formatos como Excel, Access, y formatos de texto.

(8)

 Trabaja con una gran variedad de gráficos: fiebres, barras, barras apiladas, tartas, tablas, mapas con polígonos, líneas o puntos, etc.

 Publicación de gráficos interactivos.

 Combinación de diversas fuentes de datos en una sola vista.

 Los datos son públicos.

 Descarga de datos en crudo desde las mismas visualizaciones.

2.3.3 Many eyes

TIPO. Aplicación Web TECNOLOGÍA. Java, Flash LICENCIA. De uso libre ENLACES.

 Sitio web. http://www-958.ibm.com/software/data/cognos/manyeyes

Aplicación web para crear, compartir y discutir la representación gráfica de los datos de usuario cargados.

Esta herramienta de visualización de datos gratuita ha sido puesta a disposición de los usuarios por parte de la empresa IBM.

Many Eyes permite compartir las visualizaciones creadas fomentando las conversaciones alrededor de una visualización y proponiendo otros enfoques a partir de los mismos datos. Se trata de una herramienta de uso público, es decir, que todos los datos y visualizaciones que se realicen estarán a disposición del resto de usuarios; no se puede usar de forma privada.

Permite realizar gran cantidad de tipos de visualizaciones:

 Relaciones entre puntos (Scatterplot, matriz de gráficos y diagramas de red).

 Comparar valores (gráficos de barras, histogramas y gráficos de burbuja).

 Traceo de cambios de tendencia en el tiempo (gráficos de líneas, barras y barras por categorías).

 Ver partes de totales (gráficos de queso, mapas de secciones simples y con comparaciones).

(9)

 Analizadores de texto (árbol de conceptos, nube de etiquetas, relaciones de frase y generador de nubes de palabras).

 Gráficos geográficos (gráficos sobre mapas).

Uno de los ejemplos más famosos donde se puede ver el potencial de esta herramienta es el discurso de Obama sobre el trabajo en forma de árbol y nube de palabras (http://www- 958.ibm.com/software/data/cognos/manyeyes/visualizations/word-tree-for-president-

obamas-job).

2.3.4 CartoDB

TIPO. Aplicación Web

TECNOLOGÍA. JavaScript, base de datos Open Source PostgreSQL y su extensión geoespacial PostGIS.

LICENCIA. Comercial ENLACES.

 Sitio web. http://www.cartodb.com

 Tutoriales. http://vimeo.com/channels/cartodb

 Blog CartoDB. http://blog.cartodb.com/

 Blog Vizzuality. http://blog.vizzuality.com/

 Repositorio GitHub. https://github.com/Vizzuality

Base de datos geoespacial en la nube, que funciona con los servicios web de Amazon por detrás, permitiendo la escalabilidad, la flexibilidad y la elasticidad de sus servicios. Es un proyecto Open Source que también se ofrece como un servicio bajo demanda.

La finalidad de CartoDB es facilitar la creación de aplicaciones geolocalizadas y la creación de mapas. Permite diseñar y desarrollar mapas en tiempo real que funcionan en todas las plataformas web y móviles.

Entre sus características podemos destacar:

 Diseño de mapas: Para sus capas de datos, es posible utilizar CartoCSS para editar fácilmente el formato y la apariencia con la que se generan.

 Integración con otros servicios cartográficos (Google Maps, MapBox): CartoDB produce las capas de datos, y para la capa de mapa utiliza GoogleMaps y, desde la versión 2.0 MapBox. Estos mapas incluyen las funciones básicas de zoom, desplazamiento, etc.

(10)

 Integración con otras librerías: CartoDB cuenta ya con varias librerías a su alrededor que permiten extender su uso o integrar otros servicios.

 Geocodificación: Es posible obtener información geográfica a partir de otros elementos distintos de las coordenadas.

 Capacidad de importar datos fácilmente: CartoDB permite introducir datos directamente en las tablas a partir de su panel, añadir datos vía SQL o lectura desde URLs, pero también se pueden importar colecciones de datos directamente en múltiples formatos.

 Realizar peticiones SQL con componentes espaciales: Gracias al uso de PostGIS, CartoDB permite consultar y combinar conjuntos de datos utilizando los datos geoespaciales para realizar la combinación.

 Tablas públicas y privadas: Como corresponde a un servicio cloud, CartoDB permite diferenciar entre un uso de las tablas público, o un uso privado.

Está orientado a desarrolladores sin experiencia en sistemas de información geoespacial, con una interfaz muy amigable.

Entre sus clientes se cuentan diversas instituciones tales como ONU, Google, la NASA, la Universidad de Oxford, de Yale, entre otros.

2.3.5 GeoCommons

TIPO. Aplicación Web y API TECNOLOGÍA. JavaScript, Ruby

LICENCIA. Varios (http://geocommons.com/help/Open_Source) ENLACES.

 Sitio web. http://geocommons.com/

 Documentación de la API. http://geocommons.com/api/

Plataforma geoespacial de gestión de datos, visualización, creación de mapas y análisis espacial.

Admite la carga de datos desde distintos tipos de fuentes de datos: hojas de cálculo, archivos KML, shape, servidores de bases de datos con soporte espacial, servicios OGC como WMS y TMS, o del repositorio público de la plataforma.

Las técnicas de representación cartográficas que permite son mapas de coropletas, de símbolos

(11)

proporcionales clasificados en intervalos y color aplicado a simbología puntual. También destacan las funcionalidades de animación temporal. Los mapas se pueden exportar a formato KML y los datos a formato KML, hoja de cálculo o shape, entre otros, e incrustar en una página web.

B. Wizards, librerías, API

Amplia gama de librerías y APIs disponibles para ayudar al desarrollador a crear sus propias visualizaciones.

2.3.6 Google Chart Tools

TIPO. Biblioteca

TECNOLOGÍA. JavaScript LICENCIA. De uso libre ENLACES.

 Sitio web. https://developers.google.com/chart/

 Galería de imágenes. https://google-

developers.appspot.com/chart/interactive/docs/gallery/

 Código. https://code.google.com/apis/ajax/playground/?type=visualization/

 Documentación de la API. https://google-

developers.appspot.com/chart/interactive/docs/reference

Herramienta de Google Developers que permite la creación de gráficas en forma de imágenes PNG. Su funcionamiento se basa en peticiones http a una determinada url (http://chart.apis.google.com).

Es de uso gratuito pero con ciertas limitaciones. Inicialmente, su uso estaba limitado a 50.000 peticiones por url y día, pero, actualmente este límite se sitúa en 250.000. Para evitar esta limitación, almacenar las imágenes generadas en un servidor propio a modo de cache de imágenes.

Dispone de una gran variedad de tipos de gráficas, los cuales vienen dados como clases de JavaScript. Una de las ventajas que tienen este sistema de generación de gráficas es que no se necesita instalar ningún componente en nuestro entorno o servidor, por lo que se puede generar cada gráfica “al vuelo”.

(12)

2.3.7 JavaScript InfoVis Toolkit

TIPO. Conjunto de herramientas TECNOLOGÍA. JavaScript, Phyton LICENCIA. MIT

ENLACES.

 Sitio web. http://thejit.org/

 Repositorio GitHub. https://github.com/philogb/jit

 Grupo de Google. https://groups.google.com/forum/?fromgroups#!

forum/javascript-information-visualization-toolkit

Biblioteca de JavaScript que proporciona herramientas para crear visualizaciones de datos interactivas en aplicaciones web (mapas estratégicos, árboles jerárquicos, mapas relacionales, etc.). Debido a su gran diversidad de representaciones, se adapta a cualquier necesidad del desarrollador.

Algunas de las características más relevantes de esta librería son:

 Posee diferentes tipos de representaciones de datos.

 Permite interactuar con los datos en tiempo real.

 Compatible con la mayoría de navegadores.

 Recurso Open Source de fácil integración en desarrollos web.

 Extensible.

 Permite combinar las visualizaciones para crear nuevas formas de visualización.

 Gran velocidad de proceso para estructuras complejas.

Desde el punto de vista técnico, la representación de los datos a mostrar viene marcada por una estructura JSON (JavaScript Object Notation) un formato ligero de intercambio de datos, el cual se basa en dos estructuras: una colección de pares de nombre/valor (objeto, registro, estructura, diccionario, tabla hash, etc.) y una lista ordenada de valores (vectores, listas o secuencias), estas son estructuras universales y permite a todos los lenguajes de programación adaptarse con facilidad.

Los casos de uso o posibilidades de esta librería son innumerables:

 Desarrollo en entornos BI (Business Intelligence).

(13)

 Representación de organigramas.

 Mapas estratégicos en cuadros de mando (Balanced Scorecard).

 Mapas estadísticos de datos.

 Mapas relacionales.

2.3.8 D3.js

TIPO. Biblioteca

TECNOLOGÍA. JavaScript

LICENCIA. BSD (permite el uso del código fuente en software no libre) ENLACES.

 Sitio web. http://d3js.org/

 Repositorio GitHub. https://github.com/mbostock/d3

 Galería. https://github.com/mbostock/d3/wiki/Gallery

 Tutoriales. https://github.com/mbostock/d3/wiki/Tutorials

Librería de JavaScript que permite crear visualizaciones complejas y gráficos interactivos.

Básicamente, la librería permite manipular documentos basados en datos usando estándares abiertos de la web; y los navegadores pueden crear visualizaciones complejas sin depender de un software propietario. Sus desarrollos son abiertos y pueden ser reimplementados por otros desarrolladores. Sus posibilidades son tan amplias como la geometría misma (burbujas, diagramas Chrod, links de nodos,…)

D3 permite enlazar datos al DOM (Modelo en Objetos para la Representación de Documentos) y aplicar transformaciones. Por ejemplo, generar una tabla HTML a partir de una serie de números. O bien utilizar los mismos datos para crear un gráfico interactivo SVG con transiciones e interacción.

(14)

Ejemplos.

 “Caminos a la Casa Blanca”

(http://elections.nytimes.com/2012/results/president/scenarios)

 “Tamaño de la industria manufacturera china”

(http://www.nytimes.com/interactive/2013/04/08/business/global/asia-map.html)

 “Aumento de las fuerzas de vigilancia en la frontera entre EEUU y México”

(http://www.nytimes.com/interactive/2013/03/01/world/americas/border- graphic.html)

 “Conexiones entre los contendientes a los premios Oscars”

(http://www.nytimes.com/interactive/2013/02/20/movies/among-the-oscar- contenders-a-host-of-connections.html)

2.3.9 Protovis

TIPO. Librería

TECNOLOGÍA. JavaScript LICENCIA. BSD

ENLACES.

 Sitio web. http://mbostock.github.com/protovis/

 Repositorio GitHub. https://github.com/mbostock/protovis

Librería gráfica JavaScript orientada a la realización de visualizaciones.

Proporciona al desarrollador un gran conjunto de componentes y herramientas, y otorga la posibilidad de personalizar las visualizaciones con un control detallado.

Algunas de las características más relevantes de esta librería son:

(15)

 Versatilidad prácticamente ilimitada. Se basa en el framework de la gramática de los gráficos.

 Configuración de gráficos sencillo, basado en el método de encadenamiento.

 Enfocada a los gráficos estadísticos, su método de desarrollo permite, además, su uso para visualizaciones más bien estructuradas y basadas en los datos.

 Incorpora algunas funciones estadísticas como preparación de los datos.

El principal inconvenientes que presenta es que Protovis es una biblioteca pesada (pesa más de 700 Kb), pensada para Intranets o conexiones rápidas.

2.3.10Recline.js

TIPO. Biblioteca

TECNOLOGÍA. JavaScript LICENCIA. MIT

ENLACES.

 Sitio web. http://reclinejs.com/

 Repositorio GitHub. https://github.com/okfn/recline/

Biblioteca para el desarrollo de aplicaciones basadas en HTML y JavaScript. Diseñada para la integración, por lo que es fácil de integrar en otros sitios web y aplicaciones. Orientada a desarrolladores sin grandes conocimientos de programación, que utiliza una interfaz sencilla para la vista (y edición) de datos. Las visualizaciones se ofrecen en modo gráfico, mapa y líneas de tiempo.

Recline funciona sobre Backbone, esta estructura provee un excelente soporte para la construcción de aplicaciones que manejan importantes cargas de datos, utilizando modelos para la gestión de la información y vistas para mostrarlas. Además, resulta fácilmente extensible a través de nuevos Backends que permiten conectar una base de datos o capa de almacenamiento.

Esta biblioteca cuenta con muchas funciones para la manipulación de bases de datos, incluida su carga, consulta y manipulación. Consta de soporte para cargar datos de archivos CSV, Excel, Google Docs, ElasticSearch, CouchDB y DataHub entre otros.

(16)

Provista de mecanismos de limpieza y actualización de datos mediante un sencillo script.

La biblioteca Recline consiste en tres módulos:

 Modelo. Definición de la estructura de los datos, (por ejemplo: definición del dataset a utilizar según origen y tipo de datos).

 Backend. Conexión de los datos mediante el API de Recline.js directamente con el origen de datos, que puede ser una base de datos, un archivo separado con comas, etc.

 Vistas. Muestra de la información obtenida y gestión en las dos instancias anteriores.

C. Herramientas de visualización geoespacial Herramientas para la representación de datos geográficos.

2.3.11OpenHeatMap

TIPO. Aplicación Web y API TECNOLOGÍA. JavaScript LICENCIA. GPL 3

ENLACES.

 Sitio web. http://www.openheatmap.com/

(17)

 Repositorio GitHub. https://github.com/petewarden/openheatmap/wiki

Aplicación web capaz de convertir datos estadísticos de hojas de cálculo en mapas térmicos.

Su funcionamiento es sencillo y soporta diferentes formatos de archivos como fuente: Excel, CVS o documentos vinculados desde Google Docs.

Los ficheros deben tener un formato concreto con una columna que indique la dirección o posición geográfica de cada uno de los datos para poder posicionarlos.

OpenHeatMap permite compartir los mapas a través del correo o redes sociales, o también embeberlo en una página web.

2.3.12OpenLayers

TIPO. API

TECNOLOGÍA. JavaScript LICENCIA. BSD

ENLACES.

 Sitio web. http://www.openlayers.org/

 Documentación. http://trac.openlayers.org/wiki/Documentation

Biblioteca de JavaScript de código abierto que permite la inclusión de un componente tipo mapa en cualquier página web, con georeferencias.

Es una librería del lado del cliente, un visor de mapas en javascript, por lo que la descarga de estos se realiza directamente desde el navegador a través de Ajax. No genera tráfico en el servidor, los mapas se descargan directamente del servidor de mapas.

OpenLayers permite sobreponer distintas capas sobre una básica, añadir indicadores o puntos en el mapa con leyendas, así como polígonos y proporciona su propio API para dibujarlos de una manera sencilla.

Incorpora un set de controles básicos y una toolbar de controles avanzados y permite incluir los controles necesarios haciendo uso del API.

2.3.13OpenStreetMap TIPO. Aplicación Web y API TECNOLOGÍA. Ruby, PostgreSQL,

(18)

LICENCIA. CC BY-SA ENLACES.

 Sitio web. http://www.openstreetmap.org/

Proyecto colaborativo de creación de mapas libres y editables.

Los mapas se crean utilizando información geográfica capturada con dispositivos GPS móviles, ortofotografías y otras fuentes libres. Esta cartografía, tanto las imágenes creadas como los datos vectoriales almacenados en su base de datos, se distribuye bajo licencia abierta Open Database License (ODbL).

Los usuarios registrados pueden subir sus trazas desde el GPS y crear y corregir datos vectoriales mediante herramientas de edición creadas por la comunidad OpenStreetMap.

OpenStreetMap utiliza una estructura de datos topológica. Los datos se almacenan en el datum WGS84 lat/lon (EPSG:4326) de proyección de Mercator. Los elementos básicos de la cartografía OSM son:

 Los nodos (nodes). Puntos que recogen una posición geográfica dada.

 Las vías (ways). Lista ordenada de nodos que representa una polilínea o polígono (cuando una polilínea empieza y finaliza en el mismo punto).

 Las relaciones (relations). Grupos de nodos, caminos y otras relaciones a las que se pueden asignar determinadas propiedades comunes. Por ejemplo, todas aquellas vías que forman parte del Camino de Santiago.

 Las etiquetas (tags). Se pueden asignar a nodos, caminos o relaciones y constan de una clave (key) y de un valor (value). Por ejemplo: highway=trunk

Los atributos de los datos siguen un modelo más elaborado que las folcsonomías de indexación social. La ontología de las características del mapa (principalmente el significado de las etiquetas) se mantiene mediante una wiki.

D.Herramientas de visualización de datos temporales

Herramientas para el análisis de datos en los que el tiempo es una componente importante.

2.3.14TimeFlow

TIPO. Aplicación de escritorio TECNOLOGÍA. Java Script

(19)

LICENCIA. Libre ENLACES.

 Sitio web.

 Repositorio GitHub. https://github.com/FlowingMedia/TimeFlow/wiki

Herramienta de visualización para datos temporales. La versión actual es “alfa”, por lo que puede contener errores.

Esta herramienta ayuda a analizar los datos temporales a través de cinco vistas diferentes:

 Vista Línea de Tiempo.

 Vista Calendario.

 Vista Diagrama de barras.

 Vista Tabla.

 Vista Lista.

2.4 Herramientas para el análisis de redes

Este tipo de herramientas resulta de interés en el análisis de las redes sociales, en referencia a la disciplina de encontrar conexiones entre las personas en base a varios conjuntos de datos.

Es necesario entender las teorías estadísticas del análisis de nodos de redes para usar esta categoría de software.

2.4.1 Gephi

TIPO. Aplicación de escritorio

TECNOLOGÍA. Windows, Linux, MacOS X, Java LICENCIA. CDDL, GPL3

ENLACES.

 Sitio web. http://gephi.org/

 Documentación. http://wiki.gephi.org/index.php/Main_Page/

Plataforma de exploración y visualización interactiva para todo tipo de redes y grafos complejos, dinámicos y jerárquicos.

Permite visualizar la relación entre datos y su evolución, agrupando conjuntos, definiendo jerarquías, exportando e importando tablas…

(20)

Tiene la particularidad que permite manejar grafos grandes, redes de hasta 50.000 nodos y un millón de aristas.

2.4.2 NodeXL

TIPO. Aplicación de escritorio TECNOLOGÍA. Microsoft

LICENCIA. Microsoft Public License (Ms-PL) ENLACES.

 Sitio web. http://nodexl.codeplex.com/

Potente herramienta de análisis y representación de grafos que trabaja con Excel. Trabaja mostrando gráficos de red a partir de una lista dada de conexiones, ayudando en el análisis y descubrimiento de patrones y relaciones en los datos.

Algunas de las características más relevantes de esta herramienta son:

 Importación y exportación flexible. Importación de datos desde múltiples fuentes.

 Conexiones directas a las redes sociales. Optimizada para analizar medios sociales en línea; incluyendo conexiones incorporadas para hacer query en las API de Twitter, Flickr y YouTube.

 Diseño flexible.

 Combinación de enlaces duplicados.

 Cálculo de métricas y análisis de redes.

 Inserción de imágenes de subgrafos de redes.

 Automatización de tareas.

(21)

3 Comparativa

A continuación se incluye un cuadro resumen en el que se presenta una comparativa con las herramientas de visualización analizadas en el presente documento.

Herramienta Categoría

Visualización multipropósit o

Tipo Tecnología Licenci a

Plataform a

Almacenamient o de datos

Publicació n

Web?

DataWrangler Depuración de datos

No Aplicación

Web

HTML Libre Navegador Servidor externo No

Google Refine Depuración de datos

No Aplicación

de escritorio

Java BSD Navegador Local No

Mr. Data Converter

Conversor de datos

No Biblioteca JavaScript MIT Navegador Local No

The R Project for Statistical Computing

Análisis estadístico

Si Lenguaje de

programa- ción

R GPL Linux, Mac

OS X, Unix, Windows XP

Local No

Google Fusion Tables

Aplicación/

Servicio de visualizació n

Si Aplicación

Web y API

JavaScript, Flash

Libre Navegador Servidor externo Si

Tableau Public

Aplicación/

Servicio de visualizació n

Si Aplicación

de escritorio

Windows, JavaScript

Libre Windows Servidor público externo

Si

Many eyes Aplicación/

Servicio de visualizació n

Si Aplicación

Web

Java, Flash Libre Navegador Servidor público externo

Si

CartoDB Aplicación/

Servicio de visualizació n

Si Aplicación

Web

JavaScript, PostgreSQL

Comer- cial

Navegador Servidor externo Si

GeoCommons Aplicación/

Servicio de visualizació n

Si Aplicación

Web y API

JavaScript, Ruby

Varios Navegador Servidor local o externo

Si

Google Chart Tools

Librería y servicio de visualizació n

Si Bibioteca JavaScript Libre Editor de

código y navegador

Servidor local o externo

Si

JavaScript InfoVis Toolkit

Librería Si Conjunto de

herramien- tas

JavaScript, Phyton

MIT Editor de código y navegador

Servidor local o externo

Si

D3.js Librería Si Biblioteca JavaScript BSD Editor de

código y navegador

Servidor local o externo

Si

Protovis Librería Si Biblioteca JavaScript BSD Editor de Local No

(22)

código Recline.js Librería Si Biblioteca JavaScript MIT Editor de

código

Servidor local o externo

No

OpenHeatMap GIS No Aplicación

Web y API

JavaScript GPL 3 Navegador Servidor externo Si

OpenLayers GIS No API JavaScript BSD Editor de

código y navegador

Servidor externo Si

OpenStreetMa p

GIS No Aplicación

Web y API

Ruby, PostgreSQL

CC BY- SA

Navegador o equipos de escritorio que ejecutan Java

Servidor local o externo

Si

TimeFlow Análisis de datos temporales

No Aplicación

de escritorio

JavaScript Libre Equipos de escritorio que ejecutan Java

Local No

Gephi Análisis de redes

No Aplicación

de escritorio

Windows, Linux, MacOS X, Java

CDDL, GPL3

Equipos de escritorio que ejecutan Java

Local Como

imagen

NodeXL Análisis de redes

No Aplicación

de escritorio

Microsoft Microso ft Public License (MS-PL)

Excel 2007 y 2010 en Windows

Local Como

imagen

(23)

4 Conclusiones finales

Como conclusión general, ante la gran cantidad y diversidad de herramientas de visualización gratuitas existentes en el mercado se puede inferir que estamos ante un periodo de gran proliferación de datos en bruto, en el que existe un creciente interés por encontrar la manera más adecuada de presentar esta información de manera atractiva, clara, concisa y comprensible para el usuario final.

Herramientas de visualización de datos e información hay muchas. A continuación se presentan las que se consideran más recomendables en base a las capacidades aportadas y al nivel de experiencia requerido.

 En la categoría de aplicaciones Web, destacan:

o Google Fusion Tables.

Herramienta excelente para los principiantes o para aquellas personas que no saben de programación. De todas formas, para los usuarios más avanzados existe una API que permite producir gráficas o mapas a partir de información.

Una de las ventajas de esta aplicación es la diversidad de representaciones de datos que se ofrecen a disposición del usuario. Además, ofrece una creación de gráficos o mapas relativamente rápida, incluyendo funciones GIS para analizar datos por geografías. El servicio automáticamente establece direcciones de códigos geográficos, lo cual es útil cuando se intenta colocar muchos puntos en un mapa.

Google permite designar los datos como privados o no listados o públicos, a pesar de que los datos aún residen en los servidores de Google, lo cual se convierte en un inconveniente, teniendo en cuenta el problema de la privacidad de los datos.

o CartoDB.

Servicio Open Source dirigido a cualquier usuario, independientemente del nivel técnico que tenga, con una interfaz muy amigable.

Destaca su activo grupo de desarrolladores que aporta gran cantidad de documentación y ejemplos. El carácter abierto de su API hace que continuamente se están desarrollando nuevas integraciones y aumentando las

(24)

capacidades de la herramienta, con nuevas librerías.

Entre sus clientes se cuentan diversas instituciones tales como ONU, Google, la NASA, la Universidad de Oxford, de Yale, entre otros.

 El empleo de librerías y APIs permiten al desarrollador crear visualizaciones a medida, según las necesidades del proyecto.

o Google Chart Tools.

Esta API tiene dos modos de funcionamiento, los gráficos estáticos mediante imágenes (más sencilla) y gráficas interactivas (más potente).

La generación de gráficos estáticos mediante imágenes es fácil de usar, obteniendo los gráficos mediante una petición a los servidores de Google, y ofrece gran variedad de tipos de gráficas y opciones. Presenta la herramienta Live Chart Playground, que permite generar urls de gráficas para incrustar en nuestro código html, así como previsualizar las modificaciones en los parámetros en tiempo real. Además, no es necesario instalar ningún componente en nuestro entorno o servidor, generando las gráficas “al vuelo”.

El modo de generación de gráficas interactivas, mediante una librería JavaScript, es más completo y permite generar gráficos funcionales. El problema radica en que, como ocurre con otras librerías de JavaScript, se hace necesaria la programación de código.

Es de uso gratuito pero con ciertas limitaciones de peticiones por url y día, actualmente este límite se sitúa en 250.000.

o Recline.js.

Esta librería resulta sencilla de usar por aquellos usuarios que no tengan grandes conocimientos de programación.

Es considerada una biblioteca versátil debido a su modularidad. Esto significa que sólo vas a utilizar aquellos módulos que necesites para construir tu aplicación.

Otra de sus ventajas, es que sus vistas pueden ser embebidas en otras aplicaciones, exactamente como han hecho para CKAN y el DataHub.

(25)

 Entre las herramientas disponibles para la representación de datos geográficos, se destaca:

o OpenLayers.

Librería muy potente que requiere profundizar en conocimientos de GIS. La gran ventaja es que no requiere el uso de licencias como Google maps.

Resulta una opción interesante para aquellos usuarios que están acostumbrados a programar en JavaScript y prefieren no usar una plataforma comercial como Google o Bing. Es totalmente compatible con tecnologías propietarias además de cumplir con los estándares WMS y WFS.

Permite un enorme abanico de posibilidades: importar marcas en formato KML, marcar polígonos con islas, posicionar marcas con el parseo de rss, integración con jQuery Mobile, añadir animaciones a los polígonos para representar, por ejemplo, una trayectoria,...

Referencias

Documento similar