ÍNDICE DE ALGORITMOS
Problema 1.Alq. De Isobutano 2 Loc Óptima de Catalizador
5.2 Ontologías informáticas: Análisis Contextual
El concepto de ontología, en el ámbito de la informática, hace referencia a la
construcción de un esquema conceptual con un determinado nivel de rigurosidad, con el
objetivo de facilitar la comunicación entre diferentes entidades. En una gran cantidad de
trabajos como los enumerados aquí, se intenta hacer uso de ontologías de diversas clases
para distintos propósitos. Las relaciones entre las entidades que se modelan mediante una
ontología pueden ser de diversos tipos. Por ejemplo, en ODP se puede modelar estructuras
jerárquicas o relaciones conceptuales entre los tópicos del directorio. Los enlaces del tipo
jerárquico pueden ser, a su vez, de dos clases: componentes de la jerarquía principal o
clasificaciones alternativas. En la Figura 5-1 se puede apreciar esta situación.
En el siguiente apartado se detallan distintos trabajos publicados por diversos
autores, en los cuales es notable la forma en que se manipulan los datos de grandes
volúmenes de información representados mediante ontologías, partiendo de un enfoque
estructural, y utilizando los conceptos de relevancia y similitud semántica. Para esta
recopilación, se tuvo en cuenta aquellos trabajos en los que se hace importante la
Capítulo 5 Análisis Estructural en Ciencias de la Información
119
Figura 5-1: Porción del grafo de la ontología de ODP.
5.2.1 Relevancia y Similitud Semántica: Distintos ámbitos de aplicación
La similitud semántica constituye una medida muy confiable acerca de cuan
relevante es un objeto de información respecto a otro. Hoy en día, podemos encontrar
diversas aplicaciones de esta medida sobre ontologías, como por ejemplo la evaluación
automática de estudiantes en exámenes de respuestas cortas [76] o la desambiguación del
sentido de las palabras mediante el uso de un enfoque basado en el conocimiento [77].
Dentro de áreas más específicas del conocimiento, tales como la biología o la medicina,
técnicas de cálculo de valores de similitud semántica y herramientas de minería de texto
pueden ser útiles para la determinación de patrones de interacción entre entidades, como
por ejemplo Interacciones Proteína-Proteína (PPI) ( [78], [79]), relaciones y tratamientos de
Capítulo 5 Análisis Estructural en Ciencias de la Información
120
anómica [81], y la generación automática de anotaciones en ontologías como GO [82].
Otros enfoques para el cómputo de medidas de similitud semántica en ontologías biológicas
fueron propuestos en [35] y [83].
En otro ámbito de aplicación, algunos lenguajes para ontologías como OWL2 han
sido utilizados para clasificar servicios web. Tomando ventaja de estas estructuras, algunos
autores han propuesto implementaciones de esquemas semánticos [84] y pareamiento de
servicios (service matching) [85], como también técnicas para cómputo de similitud entre
documentos XML [86]. Las medidas de similitud semántica también han sido propuestas en
el área de procesos de negocio, con aplicaciones a problemas específicos como se describe
en [87] y [88].
Existen otras ontologías pensadas para diferentes propósitos, como búsqueda
geográfica [89], búsqueda sobre bibliotecas digitales [90] y recomendación [91]. Los
modelos de propagación de relevancia que son propuestos en el próximo capítulo y el
cálculo de medidas de similitud semántica pueden ser naturalmente aplicados a estas
ontologías. También Wikipedia3 puede ser útil como una fuente para derivar relaciones
semánticas, como se propone en [92] y [93]. Otro ejemplo de una medida de similitud
semántica es SimRank [94], la cual es implementada y mejorada en trabajos subsiguientes (
[95], [96], [97]).
Como no podía ser de otra manera, las redes sociales también han motivado
diversos estudios basados en medidas de similitud semántica, lo cual puede verse en los
trabajos de [98], [99], y [100]. Estudios adicionales de similitud semántica en ontologías
pueden ser encontrados en [101], [102], [103] [104] [105], [106], [107], [108] y [22].
2 http://www.w3.org/2001/sw/wiki/OWL 3 http://es.wikipedia.org/
Capítulo 5 Análisis Estructural en Ciencias de la Información
121
Un tema que no escapa del ámbito de la relevancia y la similitud semántica es la
Recuperación de Información. Mediante la implementación de medidas de similitud o
esquemas de relevancia es posible definir métricas más adecuadas de valores de precisión y
exhaustividad (recall), los cuales reflejan el desempeño general de un entorno de Recuperación de Información [109]. También los procesos de Minería de Datos pueden ser
mejorados mediante la aplicación de estos conceptos [110].
5.2.2 Tratamiento de Grandes Volúmenes de Información mediante grafos
La representación de corpus de documentos por medio de grafos puede ser muy
adecuada para muchos propósitos. Por ejemplo, en [111] se efectúa el cálculo de similitud
semántica mediante la utilización de este concepto. También, en [112] se lleva a cabo un
trabajo sobre compresión y representación de grandes conjuntos de información en la
estructura de la web, y en [10] se realizan variados análisis respecto a la organización de
internet y su macroestructura de conectividad.
La identificación de comunidades temáticas en grandes volúmenes de información
puede ser un punto de partida para trabajos de investigación de distintas clases. Los
sistemas de recomendación, por ejemplo, pueden beneficiarse del uso extensivo que se
puede hacer de estas comunidades formadas en los corpus ( [113], [114], [115]). También
hay variados casos de aplicación que pueden beneficiarse de la creación de tales
comunidades, como por ejemplo sistemas exploradores o “crawlers” de la web ( [116],
[117], [118]) y redes sociales ( [98], [100]).
Otros casos interesantes en los que es muy importante el tratamiento de estructuras
de redes de información pueden ser el trabajo detallado en [119], en el cual se exploran las
Capítulo 5 Análisis Estructural en Ciencias de la Información
122
sobre prácticas en temas particulares; adicionalmente [121], que explica el proceso de
elaboración de una plataforma de búsqueda de archivos similares en un gran almacén de
datos referentes a servicios a clientes; y por último [122], que destaca la búsqueda de
código fuente en grandes repositorios, utilizando conceptos de la web semántica.