• No se han encontrado resultados

Ontologías informáticas: Análisis Contextual

ÍNDICE DE ALGORITMOS

Problema 1.Alq. De Isobutano 2 Loc Óptima de Catalizador

5.2 Ontologías informáticas: Análisis Contextual

El concepto de ontología, en el ámbito de la informática, hace referencia a la

construcción de un esquema conceptual con un determinado nivel de rigurosidad, con el

objetivo de facilitar la comunicación entre diferentes entidades. En una gran cantidad de

trabajos como los enumerados aquí, se intenta hacer uso de ontologías de diversas clases

para distintos propósitos. Las relaciones entre las entidades que se modelan mediante una

ontología pueden ser de diversos tipos. Por ejemplo, en ODP se puede modelar estructuras

jerárquicas o relaciones conceptuales entre los tópicos del directorio. Los enlaces del tipo

jerárquico pueden ser, a su vez, de dos clases: componentes de la jerarquía principal o

clasificaciones alternativas. En la Figura 5-1 se puede apreciar esta situación.

En el siguiente apartado se detallan distintos trabajos publicados por diversos

autores, en los cuales es notable la forma en que se manipulan los datos de grandes

volúmenes de información representados mediante ontologías, partiendo de un enfoque

estructural, y utilizando los conceptos de relevancia y similitud semántica. Para esta

recopilación, se tuvo en cuenta aquellos trabajos en los que se hace importante la

Capítulo 5 Análisis Estructural en Ciencias de la Información

119

Figura 5-1: Porción del grafo de la ontología de ODP.

5.2.1 Relevancia y Similitud Semántica: Distintos ámbitos de aplicación

La similitud semántica constituye una medida muy confiable acerca de cuan

relevante es un objeto de información respecto a otro. Hoy en día, podemos encontrar

diversas aplicaciones de esta medida sobre ontologías, como por ejemplo la evaluación

automática de estudiantes en exámenes de respuestas cortas [76] o la desambiguación del

sentido de las palabras mediante el uso de un enfoque basado en el conocimiento [77].

Dentro de áreas más específicas del conocimiento, tales como la biología o la medicina,

técnicas de cálculo de valores de similitud semántica y herramientas de minería de texto

pueden ser útiles para la determinación de patrones de interacción entre entidades, como

por ejemplo Interacciones Proteína-Proteína (PPI) ( [78], [79]), relaciones y tratamientos de

Capítulo 5 Análisis Estructural en Ciencias de la Información

120

anómica [81], y la generación automática de anotaciones en ontologías como GO [82].

Otros enfoques para el cómputo de medidas de similitud semántica en ontologías biológicas

fueron propuestos en [35] y [83].

En otro ámbito de aplicación, algunos lenguajes para ontologías como OWL2 han

sido utilizados para clasificar servicios web. Tomando ventaja de estas estructuras, algunos

autores han propuesto implementaciones de esquemas semánticos [84] y pareamiento de

servicios (service matching) [85], como también técnicas para cómputo de similitud entre

documentos XML [86]. Las medidas de similitud semántica también han sido propuestas en

el área de procesos de negocio, con aplicaciones a problemas específicos como se describe

en [87] y [88].

Existen otras ontologías pensadas para diferentes propósitos, como búsqueda

geográfica [89], búsqueda sobre bibliotecas digitales [90] y recomendación [91]. Los

modelos de propagación de relevancia que son propuestos en el próximo capítulo y el

cálculo de medidas de similitud semántica pueden ser naturalmente aplicados a estas

ontologías. También Wikipedia3 puede ser útil como una fuente para derivar relaciones

semánticas, como se propone en [92] y [93]. Otro ejemplo de una medida de similitud

semántica es SimRank [94], la cual es implementada y mejorada en trabajos subsiguientes (

[95], [96], [97]).

Como no podía ser de otra manera, las redes sociales también han motivado

diversos estudios basados en medidas de similitud semántica, lo cual puede verse en los

trabajos de [98], [99], y [100]. Estudios adicionales de similitud semántica en ontologías

pueden ser encontrados en [101], [102], [103] [104] [105], [106], [107], [108] y [22].

2 http://www.w3.org/2001/sw/wiki/OWL 3 http://es.wikipedia.org/

Capítulo 5 Análisis Estructural en Ciencias de la Información

121

Un tema que no escapa del ámbito de la relevancia y la similitud semántica es la

Recuperación de Información. Mediante la implementación de medidas de similitud o

esquemas de relevancia es posible definir métricas más adecuadas de valores de precisión y

exhaustividad (recall), los cuales reflejan el desempeño general de un entorno de Recuperación de Información [109]. También los procesos de Minería de Datos pueden ser

mejorados mediante la aplicación de estos conceptos [110].

5.2.2 Tratamiento de Grandes Volúmenes de Información mediante grafos

La representación de corpus de documentos por medio de grafos puede ser muy

adecuada para muchos propósitos. Por ejemplo, en [111] se efectúa el cálculo de similitud

semántica mediante la utilización de este concepto. También, en [112] se lleva a cabo un

trabajo sobre compresión y representación de grandes conjuntos de información en la

estructura de la web, y en [10] se realizan variados análisis respecto a la organización de

internet y su macroestructura de conectividad.

La identificación de comunidades temáticas en grandes volúmenes de información

puede ser un punto de partida para trabajos de investigación de distintas clases. Los

sistemas de recomendación, por ejemplo, pueden beneficiarse del uso extensivo que se

puede hacer de estas comunidades formadas en los corpus ( [113], [114], [115]). También

hay variados casos de aplicación que pueden beneficiarse de la creación de tales

comunidades, como por ejemplo sistemas exploradores o “crawlers” de la web ( [116],

[117], [118]) y redes sociales ( [98], [100]).

Otros casos interesantes en los que es muy importante el tratamiento de estructuras

de redes de información pueden ser el trabajo detallado en [119], en el cual se exploran las

Capítulo 5 Análisis Estructural en Ciencias de la Información

122

sobre prácticas en temas particulares; adicionalmente [121], que explica el proceso de

elaboración de una plataforma de búsqueda de archivos similares en un gran almacén de

datos referentes a servicios a clientes; y por último [122], que destaca la búsqueda de

código fuente en grandes repositorios, utilizando conceptos de la web semántica.