• No se han encontrado resultados

Marco de trabajo para el desarrollo de aplicaciones con ontologías de dominio

N/A
N/A
Protected

Academic year: 2020

Share "Marco de trabajo para el desarrollo de aplicaciones con ontologías de dominio"

Copied!
82
0
0

Texto completo

(1)Ministerio de Educación Superior Universidad Central “Marta Abreu” de Las Villas. Facultad de Matemática, Física y Computación. “Marco de Trabajo para el desarrollo de aplicaciones con ontologías de dominio” Tesis presentada en opción al Título Académico de Master en Ciencias de la Computación.. Autor: Lic. Raydel Reuco Rodríguez Tutores: Dra. Luisa González González M.Sc. Manuel Castro Artiles. Santa Clara -2008-.

(2) Resumen La gran cantidad y diversidad de datos que actualmente existen, podrían tener un mayor y más efectivo aprovechamiento en diversos fines, lo que se logra al disponer de una descripción lo más completa posible de los mismos a través de las ontologías. El presente trabajo hace referencia a las definiciones más importantes de ontologías, así como los componentes y clasificaciones de las mismas, con el objetivo de brindar los aspectos fundamentales de las ontologías. Se realiza una caracterización de las metodologías, lenguajes, herramientas y razonadores existentes, con el objetivo de contar con los elementos necesarios para al enfrentarse a un proyecto ontológico, poder determinar cual utilizar. Como objetivo fundamental y resultado novedoso se propone un Marco de Trabajo para el desarrollo de aplicaciones con ontologías de dominio, conformado por Methontology como metodología, OWL como lenguaje, Protégé como herramienta y Pellet como razonador, todos sobre la base del software libre. Para mostrar las potencialidades del Marco de Trabajo propuesto, se desarrolla la ontología GlosBanc, modelación conceptual representativa de la actividad bancaria. Palabras claves: Ontología, metodología, lenguaje, herramienta, razonador, Marco de Trabajo..

(3) Abstract The big quantity and diversity of data that at the moment exist could have a bigger and more effective use in diverse goals, what is possible when having a description the most complete possible of the same ones through the ontologies. The present paper makes reference to the most important definitions in ontologies, as well as the components and classifications of the same ones, with the objective of offering the fundamental aspects of the ontologies. We are carried out a characterization of the methodologies, languages, tools and existent reasoners, with the objective of having the necessary elements to facing an ontologic project, to be able to determine which to use. As fundamental objective and novel result intends a FrameWork for the development of applications with domain ontologies, conformed by Methontology like methodology, OWL like language, Protégé like tool and Pellet like reasoner, all on the base of the free software. To show the potentialities of the FrameWork, the ontology GlosBanc, conceptual representative modelation of the bank activity is developed. Keywords: Ontology, methodology, language, tool, reasoner, FrameWork..

(4) Tabla de Contenidos INTRODUCCIÓN........................................................................................................................................................6 I. ONTOLOGÍAS .......................................................................................................................................................10 I.1 ¿QUÉ ES UNA ONTOLOGÍA?..................................................................................................................................10 I.2 DE METADATOS A ONTOLOGÍAS ..........................................................................................................................12 I.2.1 Importancia de los metadatos.....................................................................................................................13 I.2.2 Tipología de los Metadatos ........................................................................................................................13 I.3 COMPONENTE DE LAS ONTOLOGÍAS .....................................................................................................................14 I.4 APLICACIONES DE LAS ONTOLOGÍAS ...................................................................................................................16 I.4.1 Aplicación de las ontologías en la Web Semántica ....................................................................................16 I.4.2 Aplicación de las ontologías en ingeniería del conocimiento ....................................................................17 I.4.3 Aplicación de ontologías en sistemas de información ................................................................................18 I.5 LAS ONTOLOGÍAS EN LA INTEROPERABILIDAD DE SISTEMAS ...............................................................................19 I.6 TIPOS DE ONTOLOGÍAS ........................................................................................................................................21 I.7 MODELO DE DATOS CONCEPTUAL COMO UN TIPO DE ONTOLOGÍA .......................................................................22 I.7.1 ¿Que es un modelo de datos? .....................................................................................................................23 I.7.2 Dos formas básicas de suposición del mundo. ...........................................................................................24 I.7.3 Modelos de datos conceptuales y lenguajes ontológicos............................................................................24 I.8 CONCLUSIONES DEL CAPÍTULO ............................................................................................................................25 II. CARACTERIZACIÓN DE METODOLOGÍAS, LENGUAJES, HERRAMIENTAS Y RAZONADORES DE ONTOLOGÍAS. PROPUESTA DE MARCO DE TRABAJO PARA EL DESARROLLO DE ONTOLOGÍAS DE DOMINIO. ...............................................................................................................................27 II.1 METODOLOGÍAS PARA LA CONSTRUCCIÓN DE ONTOLOGÍAS ...............................................................................27 II.1.1 Pasos y principios para la construcción de ontologías.............................................................................27 II.1.2 IDEF 5.......................................................................................................................................................29 II.1.2.1 Organización y alcance........................................................................................................................................ 29 II.1.2.2 Recolección de datos ........................................................................................................................................... 30 II.1.2.3 Análisis de datos .................................................................................................................................................. 30 II.1.2.4 Desarrollo de la ontología inicial ......................................................................................................................... 30 II.1.2.5 Validación y refinamiento de la ontología ........................................................................................................... 30. II.1.3 Methontology.............................................................................................................................................31 II.1.3.1 Proceso de desarrollo de Ontologías.................................................................................................................... 31 II.1.3.2 Ciclo de vida de ontologías.................................................................................................................................. 33. II.1.4 Propuesta de Metodología para el Marco de Trabajo..............................................................................34 II.2 LENGUAJES DE ESPECIFICACIÓN DE ONTOLOGÍAS ..............................................................................................35 II.2.1 SHOE (Simple HTML Ontology Extensions).............................................................................................36 II.2.2 Ontolingua.................................................................................................................................................36 II.2.3 RDF (Resource Description Framework) y RDFS (RDF Schema) ...........................................................36 II.2.4 OIL (Ontology Inference Layer)................................................................................................................37 II.2.5 DAML + OIL.............................................................................................................................................38 II.2.6 KIF (Knowledge Interchange Format)......................................................................................................38 II.2.7 OWL (Web Ontology Language)...............................................................................................................39 II.2.8 Propuesta de lenguaje para el Marco de Trabajo.....................................................................................40 II.3 HERRAMIENTAS PARA LA CONSTRUCCIÓN DE ONTOLOGÍAS ...............................................................................41 II.3.1 OILEd........................................................................................................................................................42 II.3.2 OntoEdit ....................................................................................................................................................43 II.3.3 Protégé ......................................................................................................................................................44 II.3.3.1 PAL (Protégé Axiom Language) ......................................................................................................................... 45 II.3.3.2 Interfaz................................................................................................................................................................. 45 II.3.3.3 Posibilidad de incorporar nuevas funcionalidades (Plugins)................................................................................ 46. II.3.4 Propuesta de herramienta para el Marco de Trabajo...............................................................................47 II.4 RAZONADORES ..................................................................................................................................................47 II.4.1 Jena ...........................................................................................................................................................48 II.4.2 FaCT++ ....................................................................................................................................................49.

(5) II.4.3 RacerPro ...................................................................................................................................................49 II.4.4 Pellet .........................................................................................................................................................50 II.4.5 Propuesta de razonador para el Marco de Trabajo..................................................................................51 II.5 CONCLUSIONES DEL CAPÍTULO ..........................................................................................................................52 III. GLOSBANC (ONTOLOGÍA BANCARIA) ......................................................................................................53 III.1 DEFINICIÓN DE LA ONTOLOGÍA .........................................................................................................................53 III.2 ESPECIFICACIÓN. OBJETIVO Y ALCANCE DE LA ONTOLOGÍA .............................................................................54 III.3 ADQUISICIÓN DE CONOCIMIENTO .....................................................................................................................54 III.4 CONCEPTUALIZACIÓN .......................................................................................................................................55 III.4.1 Conceptos (Clases) ..................................................................................................................................55 III.4.2 Slots (Propiedades)..................................................................................................................................56 III.4.3 Relaciones................................................................................................................................................56 III.4.4 Axiomas....................................................................................................................................................57 III.5 IMPLEMENTACIÓN ............................................................................................................................................58 III.5.1 Construcción de GlosBanc en Protégé ....................................................................................................58 III.5.2 Evaluación ...............................................................................................................................................60 III.5.3 Uso del razonador para inferencia ..........................................................................................................65 III.6 CONCLUSIONES DEL CAPÍTULO .........................................................................................................................66 CONCLUSIONES ......................................................................................................................................................67 RECOMENDACIONES ............................................................................................................................................68 REFERENCIAS BIBLIOGRÁFICAS .....................................................................................................................69 ANEXOS .....................................................................................................................................................................72 ANEXO I. ARBOL DE CLASES DE LA ONTOLOGÍA GLOSBANC....................................................................................72 ANEXO II. CONCEPTOS DE LA ONTOLOGÍA GLOSBANC. ...........................................................................................73 ANEXO III. PROPIEDADES DE TIPOS DE DATOS DE LA ONTOLOGÍA GLOSBANC. ........................................................78 ANEXO IV. RELACIONES DE LA ONTOLOGÍA GLOSBANC..........................................................................................80.

(6) Introducción Los dispositivos computacionales, sistemas de comunicación y dispositivos de almacenamiento son productos primarios. La ley de Moore aún es válida, la relación precio/rendimiento del equipamiento decrece por mes. Las computadoras serán tan profundamente incorporadas a la sociedad que dejarán de ser dispositivos aislados. El software, las personas. y todo tipo de artefacto inteligente serán entrelazados en. sistemas de información de subsistemas autónomos que interactúan. Uno de los grandes desafíos es manipular la complejidad técnica, el otro es ser capaces de poder cambiar fácilmente en nuestra sociedad lo qué hacemos y cómo lo hacemos. La poca habilidad de dominar la complejidad técnica unido a no cambiar el comportamiento, significaría el desastre. Tenemos que tener sistemas que pueden desarrollarse según las necesidades y los deseos de personas individuales y organizaciones. Tenemos que construir una sociedad de forma que pueda cambiar cuando las nuevas tecnologías hagan posibles nuevos desarrollos (Sølvberg, 2004). El espectacular desarrollo tecnológico que la humanidad ha alcanzado en los últimos años, ha propiciado de manera explosiva que exista gran cantidad y diversidad de datos, así como el constante incremento e interrelación entre los mismos, los cuales constituyen un recurso indispensable y estratégico, tanto para la competitividad y calidad de los servicios de las empresas, como en la vida cotidiana. Esta gran cantidad de datos, podría tener un mayor y más efectivo aprovechamiento en diversos fines, incluso diferentes para los que fueron creados, cuestión esta que se logra al disponer de una descripción lo más completa posible de los mismos. Tal descripción posibilita que estos datos se puedan compartir, reutilizar y analizar; pero de manera especial que se “entiendan” por parte de las personas y en especial por los sistemas. computarizados. Por tales motivos se debe lograr que se incremente la. posibilidad de proporcionar mayor información sobre los datos, reto actual de la industria de las tecnologías de la información. La modelación ha sido siempre una parte esencial en el desarrollo de sistemas de información (Krogstie et al., 2007). Para lograr una adecuada descripción de los datos. 6.

(7) se deben considerar como aspectos fundamentales: significado y modelación. De esta forma al contar con la descripción resultante podemos manipular dichos datos a través de la lógica matemática y motores de inferencia, lo cual permite extraer conclusiones. La descripción formal de un conjunto de datos que representan el conocimiento de un determinado dominio constituye el rol fundamental de las ontologías. Debido a la necesidad de modelar el significado de los datos y dado que existen diferentes formas que lo permiten, las ontologías dentro de sus disímiles usos se erigen como una de las más completas para hacerlo. De esta forma cobran cada vez más importancia en diferentes áreas del ámbito computacional, donde tenemos la indexación de sitios Web, la interoperabilidad entre sistemas, la modelación empresarial, el procesamiento del lenguaje natural, etc. De tal manera existen y se desarrollan diferentes metodologías, lenguajes, herramientas y razonadores que permiten definirlas, construirlas y utilizarlas; lo que hace difícil una selección adecuada de cada uno de estos elementos para un fin específico.. Cuando se cuenta con. diferentes alternativas que nos permiten llevar a cabo determinado proyecto y nos vemos obligados a emplear tiempo y recursos para establecer los criterios que nos lleven a seleccionar adecuadamente la alternativa idónea, entonces es cuando se valora la disponibilidad de los Marcos de Trabajo (Thalheim, 2004). Existen varias clasificaciones de ontologías, en la más acertada para definir los diferentes aspectos del proceso de construcción de ontologías tenemos el tipo de ontologías de dominio, que representan el conocimiento de un dominio dado, que además son las de más aplicación y las más generalizadas, pues la mayoría de las organizaciones al representar algún conocimiento es el del dominio propio o con el que tengan alguna relación. Por lo anteriormente expuesto se presenta como problema de investigación de la presente tesis que, dado que las ontologías se pueden usar para distintos fines y han proliferado numerosas metodologías, lenguajes, herramientas y razonadores para su desarrollo; se hace difícil una selección adecuada para iniciar un proyecto basado en este enfoque, en particular para las ontologías de dominio.. 7.

(8) Como consecuencia de la revisión bibliográfica y el estudio de factibilidad del trabajo se obtiene la siguiente hipótesis de investigación: disponer de un Marco de Trabajo bien definido y detallado permitirá obtener mejores resultados de forma ágil, precisa y eficiente en el desarrollo de aplicaciones con ontologías de dominio. Por tanto, el objetivo general de la presente investigación es proponer un Marco de Trabajo para el desarrollo de aplicaciones con ontologías de dominio. Como objetivos específicos se tienen los siguientes: 9 Brindar todos los elementos necesarios para enfrentarse a proyectos ontológicos. 9 Caracterizar los diferentes componentes que intervienen en el proceso de desarrollo de ontologías. 9 Elegir por cada componente que interviene en el proceso de desarrollo de ontologías de dominio, el que va formar parte del Marco de Trabajo. 9 Desarrollar una ontología representativa de la actividad bancaria que describa de forma práctica la utilización del Marco de Trabajo propuesto. Como tareas de investigación se tienen las siguientes: 1. Realizar una revisión bibliográfica de los temas relacionados con los aspectos generales; así como de cada uno de los componentes que intervienen en el proceso de desarrollo de ontologías. 2. Presentar las principales definiciones de ontologías y demás aspectos relacionados que permitan el dominio del tema. 3. Caracterizar las metodologías, lenguajes, herramientas y razonadores existentes para el desarrollo de ontologías sobre la base de exponer los elementos distintivos que permitan elegir cual es el más conveniente en cada caso. 4. Proponer una metodología, un lenguaje de representación, una herramienta y un razonador que van a constituir el Marco de Trabajo para desarrollar ontologías de dominio. 8.

(9) 5. Diseñar una ontología del dominio bancario sobre la base y utilización en la práctica del Marco de Trabajo propuesto. El valor científico está compuesto por la caracterización de los diferentes componentes que se utilizan en el desarrollo de aplicaciones con ontologías de dominio para así proponer un Marco de Trabajo que permita dicho proceso. El valor práctico está dado por la descripción detallada que permite desarrollar de forma práctica una ontología, así como su ejemplificación a través del desarrollo de una ontología representativa de la actividad bancaria con el uso del Marco de Trabajo propuesto. El trabajo ha sido organizado en tres capítulos de la siguiente forma: El Capítulo I aborda los aspectos básicos sobre las ontologías, como son las principales definiciones,. sus. componentes,. clasificaciones,. aplicaciones. y. otros. temas. estrechamente vinculados. Se destaca para la propuesta del Marco de trabajo el tipo de ontología de dominio. En el Capítulo II se caracterizan y comparan las diferentes metodologías, lenguajes, herramientas y razonadores existentes para el desarrollo de ontologías, donde para cada uno de estos componentes se selecciona el que va a formar parte del Marco de Trabajo. El Capítulo III muestra el proceso de desarrollo de una ontología representativa de la actividad bancaria mediante el uso del Marco de Trabajo propuesto. Finalmente se exponen las conclusiones del trabajo haciendo recomendaciones para darle continuidad en investigaciones futuras.. 9.

(10) I. Ontologías En el presente capítulo se hace referencia a los aspectos fundamentales de las ontologías; definiciones, clasificaciones y características más importantes, donde se expone lo relacionado con las ontologías para más allá de entenderlas, contar con los argumentos necesarios para enfrentar proyectos ontológicos. También se abordan otros conceptos que están estrechamente vinculados a las ontologías, como es el caso de los metadatos, a los cuales se hace referencia para permitir comprender y analizar el alcance e importancia de las ontologías. Se exponen diferentes clasificaciones existente para las ontologías enfatizando en las de dominio.. I.1 ¿Qué es una ontología? A principios de la década de los 90 comienza un gran auge de las ontologías, se desarrollan estudios e investigaciones sobre este tema que propician el surgimiento de determinados conceptos que se convierten en la base para la comprensión, definición y aplicación de las ontologías. Existen varias definiciones de ontologías, dentro de las más importantes tenemos: 9 "Una ontología es una especificación explícita y formal de una conceptualización compartida"(Gruber, 1993) 9 "Una ontología es un instrumento que define los términos básicos y relaciones a partir del vocabulario de un área de conocimiento, así como las reglas de combinación de estos términos y relaciones para definir extensiones a un vocabulario" (Neches, 1991). 9 "Una ontología es una especificación formal de una conceptualización compartida" (Borst, 1997). Como se puede apreciar el término formal se refiere a que es procesable computacionalmente. 9 "Una ontología es una base de datos que describe los conceptos generales o sobre un dominio, algunas de sus propiedades y cómo los conceptos se. 10.

(11) relacionan unos con otros" (Weigand, 1997). Una de las definiciones más concretas.. De las definiciones existentes, la de Grubber, aunque a primera vista parezca un trabalenguas, en realidad es la más sencilla y extendida, convertida ya en estándar, donde conceptualización se refiere a la modelación abstracta de los conceptos identificados en algún área de interés (dominio), donde los conceptos constituyen las ideas básicas a formalizar; se entiende por explícita que dichos conceptos que conforman una ontología se especifiquen de alguna forma, por medio de un lenguaje de representación, formalizado y compartido; reflejando que una ontología debe, en el mejor de los casos, dar cuenta de conocimiento aceptado (como mínimo, por el grupo de personas que deben usarla). Como ya sabemos una ontología empieza con un concepto. Tenemos que encontrar primeramente un concepto importante; y al encontrarlo, tenemos que expresarlo de una manera tan precisa como sea posible que pueda ser interpretado y usado por sistemas de cómputo. Una de las diferencias entre un diccionario o un glosario y una ontología es que las definiciones de diccionario no son realmente procesables por sistemas de cómputo a nivel conceptual. Pero la otra diferencia es que en una ontología empezando por el concepto y especificándolo los más rigurosamente posible, conseguimos un significado que es en gran medida independiente del lenguaje o terminología. Además, por supuesto, se le adicionan términos a estos conceptos, ya que para usar la ontología por los seres humanos, tenemos que asociarlos con términos que comúnmente usamos. En términos generales, una ontología es una organización de conocimientos o por lo menos una organización de un conjunto de los términos relacionados con. dicho. conocimiento. Sin embargo, a diferencia de un glosario o diccionario, que toman términos y suministran las definiciones para ellos, una ontología permite modelar el dominio de forma más completa y precisa (Huhns and Singh, 1997).. 11.

(12) Al analizar la mayoría de las definiciones de ontologías se puede inferir que constituyen el mecanismo para construir los metadatos que se usan para estructurar el contenido. Es decir, convertir la información en conocimiento, a través de estructuras de conocimiento formalizadas que se refieren a los datos, bajo un esquema común normalizado sobre algún dominio del conocimiento, logrando que se represente cierta visión del mundo con respecto a un dominio (Noy and McGuinness, 2005).. I.2 De metadatos a ontologías Literalmente metadatos significa "datos sobre los datos" (LANGE and WINKLER, 1997), concepto que recibe especial atención en las comunidades de Sistemas de Información, dada la necesidad de comprenderlos y hacer uso eficiente de ellos. El propósito de los metadatos radica fundamentalmente en hacer útiles los datos, mostrar dónde se originaron y son guardados actualmente, brindar una gran cantidad de atributos descriptivos y técnicos de esos datos. Las ontologías son la solución que nos permite proveer los metadatos necesarios en un determinado contexto. Aunque los metadatos son "datos sobre los datos", su estructura y funcionalidad pueden ser aplicadas a cualquier objeto de información (textos, fotos, audio/video, gráfico, etcétera) (HUSBY, 1997). Todos los objetos de información tienen tres características en común: el contenido, el contexto y la estructura. El contenido se relaciona con “qué contiene o es un objeto”; el contexto con "quién, qué, por qué, dónde y cómo", aspectos estos asociados con la creación del objeto; la estructura está relacionada con el conjunto de asociaciones entre objetos. Todas estas características pueden ser descritas como metadatos, y podrían ser de importancia para uno o más grupos de usuarios de ese objeto. Pero los metadatos solo van a estructurar los contenidos, por lo que necesitaremos algo que nos permita estructurar la semántica de un recurso, ese algo son las ontologías. Debido a que los metadatos son diversos y son utilizados de muchas formas por varios tipos de usuarios, el manejo de los metadatos es de extrema importancia en cualquier organización. El conocimiento de buenas prácticas para el manejo de metadatos puede llevar a desarrollar un enfoque robusto y flexible para el manejo de metadatos y a. 12.

(13) proveer el valor agregado a los objetos de información que son importantes para la toma de decisiones de la organización.. I.2.1 Importancia de los metadatos Hay mucha fuerza encaminada a un mejor conocimiento y manejo de los varios tipos de metadatos. Algunas de estos intereses incluyen: 9 Manejo, almacenamiento y acceso a los datos personales, tanto confidenciales como bases de datos en el sector público 9 Mejoramiento del acceso a servicios y datos por el público 9 Incremento del reconocimiento que las organizaciones deben hacer para el mejor uso de sus datos para la toma de decisiones y operaciones 9 Dominio de los datos, comprendiendo y administrando colecciones de datos, para su almacenamiento y uso en propósitos específicos. I.2.2 Tipología de los Metadatos Hay varias categorías de metadatos, cada uno con su propia definición y ejemplos de uso (GILLILAND, 1998). Tipo de Definición Ejemplos de su uso metadato Administrativo Usados en la gestión y • Adquisición de Información administración de recursos • Derechos y reproducción de información • Requerimientos legales para el acceso • Localización de información • Criterios de selección para la digitalización • Control de versiones Descriptivo Utilizados para representar • Registros catalográficos recursos de información • Proporcionar ayuda en la (también referido como búsqueda "Metadatos de la empresa") • Indices especializados • Hiperenlazar relaciones entre recursos 13.

(14) Preservación. Para salvaguardar los recursos de información. Técnico. Relativos a cómo funcionan los sistemas o el comportamiento de los metadatos. Uso. Relativos al nivel y tipo de uso que se hace con los recursos informativos. • Anotaciones de los usuarios • Informar sobre las condiciones de uso de los recursos físicos • Informar sobre las acciones llevadas a cabo para preservar versiones físicas y digitales de recursos • Documentación de Hardware y Software • Digitalización de la información (formato, ratio de compresión,….) • Autentificación y datos de seguridad (encriptación, passwords,….) • Control de tiempo de respuesta de sistemas • Información sobre versiones • Reutilización del contenido del recurso. Los metadatos no son creados por sí mismos, a menudo es un subproducto directo de los sistemas de información de fuentes originales que crean, mantienen actualizados y diseminan los datos. También, los metadatos son creados y pueden ser derivados después del uso de un conjunto de componentes de operaciones o toma de decisiones del sistema y la organización. Sin metadatos accesibles y comprensibles, el contenido de información podría carecer de sentido al usuario.. I.3 Componente de las ontologías A continuación se exponen los componentes de las ontologías, algunos de los cuales han sido mencionados en las definiciones expuestas anteriormente. Conceptos (o clases) Son las ideas básicas que se intentan formalizar de algún fenómeno o dominio del mundo. Los conceptos pueden ser clases de objetos, métodos, planes, estrategias, procesos de razonamiento, etc. Propiedades (o slots, o roles) 14.

(15) Describen los rasgos y atributos de los conceptos. Restricciones (o facetas) Restricciones sobre los slots; la cardinalidad, tipo y rango, son facetas de los slots. La cardinalidad se refiere al número de valores que puede tener un slot. Cadena de caracteres (string), Números, verdadero/falso (boolean) e instancias son tipos de valores comunes. El rango de un slot es usado para los tipos de valores Instancia y específica cuales objetos en la ontología pueden asignarse a dicho slot. Instancias Se utilizan para representar objetos determinados de un concepto. Relaciones Representan la interacción y enlace entre los conceptos del dominio. Suelen formar la taxonomía del dominio. Por ejemplo: subclase-de, parte-de, parte-exhaustiva-de, conectado-a, etc. Es habitual que el formalismo sólo permita representar relaciones binarias. Cada una de las ontologías suele permitir el uso de un número acotado y cerrado de relaciones. Cada una de las relaciones puede estar dotada de determinadas propiedades que determinan su comportamiento. La mayoría de las ontologías incluyen relaciones de tipo taxonómico como la generalización/especificación (herencia) o los diversos tipos de meronimia 1 . Existen ontologías que incluyen muchos otros tipos de relaciones semánticas entre sus componentes. Existen ontologías que representan conceptos más o menos generales mientras que en otras se admite también la representación de ejemplares de dichos conceptos. Además, algunas ontologías permiten expresar de alguna forma conocimiento procedimental (métodos, funciones) o inferencial (axiomas, reglas de inferencia). Funciones 1. Meronimia: Es la relación que se establece entre un elemento entero y sus partes, la relación imperante es “parte-de”. 15.

(16) Son un tipo concreto de relación donde se identifica un elemento mediante el cálculo de una función que considera varios elementos de la ontología. Por ejemplo, pueden aparecer funciones como categorizar-clase, asignar-fecha, etc. Axiomas Son teoremas que se declaran sobre relaciones que deben cumplir los elementos de la ontología. Por ejemplo: “Si A y B son de la clase C, entonces A no es subclase de B”, “Para todo A que cumpla la condición C1, A es B”, etc. Los Axiomas junto con la herencia de conceptos, permiten inferir conocimiento que no esté indicado explícitamente en la taxonomía de conceptos.. I.4 Aplicaciones de las ontologías Las ontologías proporcionan una comprensión compartida del conocimiento de un dominio, que puede ser comunicada entre personas y sistemas heterogéneos (Gasevic et al., 2006). Para poder reutilizar conocimientos de otros sistemas es necesario conocer y estar conforme con la terminología y su significado. Por ello, se llaman acuerdos ontológicos a los acuerdos terminológicos necesarios para reutilizar conocimiento. Se trata de convertir la información en conocimiento (Sharman et al., 2007). El amplio desarrollo de la investigación en el campo de las ontologías, permite un aumento notable de los usos de éstas, basados en los estudios de Gruber (Gruber, 1995) y de Gruninger y Lee (Gruninger and Lee, 2002), donde se refieren como los más frecuentes en el campo de la denominada Web Semántica, la ingeniería del conocimiento y los sistemas de información.. I.4.1 Aplicación de las ontologías en la Web Semántica 9 Indización de documentos: La indexación de un sitio Web con apoyo de una ontología terminológica comienza con la extracción de los términos más relevantes de cada página, y después de asociar a estos términos conceptos candidatos, se evalúa la capacidad de representación de la página de cada uno de estos conceptos, que determina su nivel de representatividad, y finalmente se 16.

(17) construye el índice. De esta manera, las consultas se procesan a un nivel conceptual, lo que reportará un mayor grado de acierto. 9 Agrupamiento:. Las. técnicas. de. agrupamiento(clustering). permiten. el. crecimiento de un sistema mediante la adición de procesadores o CPU (central processing units) a la unidad primitiva. Las ontologías aportan las herramientas para que los distintos equipos puedan entenderse entre sí y funcionar como si fuera uno sólo. 9 Servicios Web: Las ontologías representarán los datos en la red de tal forma que puedan ser utilizados y comprendidos por las máquinas sin necesidad de la intervención humana. 9 Comercio electrónico: Hay ontologías orientadas a aplicaciones que facilitan el comercio electrónico, destacando el sistema MKBEEM (Multilingual Knowledge Based European Electronic Marketplace), que es un portal multilingüe que combina procesamiento basado en ontologías y procesamiento de lenguaje humano.. I.4.2 Aplicación de las ontologías en ingeniería del conocimiento 9 Ingeniería del conocimiento: Por un lado en el modelado conceptual se crea un glosario de la terminología del dominio de la aplicación (los conceptos), las relaciones entre dichos términos y las restricciones de uso. Este modelo conceptual explícito es la ontología. Por otro lado, la construcción de la base de conocimiento usa la ontología definida en la etapa anterior como un conjunto de esquemas o contenedores de conocimiento. Las ontologías, junto con los métodos de solución de problemas (PSM), prometen la posibilidad de reutilizar componentes en ingeniería de conocimiento. Mientras las ontologías definen el conocimiento declarativo del dominio a un nivel genérico, los PSM especifican conocimiento de razonamiento sobre el dominio. 9 Procesamiento del lenguaje natural: Una ontología puede mantener la definición de elementos gramaticales del lenguaje y sus relaciones, permitiendo, por ejemplo, el análisis sintáctico de un texto. 17.

(18) 9 Distribución del conocimiento desde el punto de vista de la reutilización: Uno de los fines principales de la utilización de una ontología en un sistema es poder reutilizar conocimiento para sistemas futuros. Se podrán integrar ontologías para la constitución de una nueva, más grande y que a su vez mejore la conceptualización que aportaban todas ellas por separado. Sistemas distintos podrán entender la información almacenada en una ontología sobre un dominio y trabajar con dicha información aunque no haya sido generada por y para ellos. 9 Distribución de conocimiento como un camino para resolver la integración de sistemas basados en conocimiento: Integración inteligente de información. La distribución de un conocimiento de forma estandarizada se traducirá en importantes mejoras en el desarrollo de agentes inteligentes que tendrán a su disposición un mayor número de bases de conocimiento disponibles. 9 Implementación de agentes inteligentes: Una posible meta de esta tecnología es poder disponer de un agente de software para cada dominio o cada tarea que tenga que realizar un humano facilitándole la obtención de resultados. 9 Creación y construcción de cursos de manera colaborada destinados al desarrollo y la integración de sistemas de aprendizaje.. I.4.3 Aplicación de ontologías en sistemas de información 9 Interoperatividad entre sistemas heterogéneos: Las ontologías se presentan como una solución para lograr una integración inteligente. Con una ontología terminológica se pueden organizar los términos que son usados en interacciones entre sistemas heterogéneos, de manera que reconozca cuándo una aplicación está usando un término que es más general o más específico que otro que está en uso por otra aplicación. 9 Sistemas de información cooperativa: El objetivo es que múltiples sistemas de información sean capaces de trabajar de forma cooperativa combinando sus datos y funcionalidades, con ayuda de las ontologías.. 18.

(19) 9 Medio de distribución de conocimiento dentro de aplicaciones de software y entre aplicaciones de software mediante la comunicación entre aplicaciones sin. intervención. humana,. utilizando. estándares. y. protocolos. para. el. entendimiento recíproco. 9 Recuperación de información, enfocado a mejorar la formulación de consultas: Si se añade semántica a las consultas y no sólo se efectúan por palabras claves se proporciona una calidad superior en los resultados de una búsqueda. Las consultas serán tratadas desde un punto de vista conceptual. De este modo, se reducirá el ruido y el silencio en los resultados de una búsqueda, lo que permitirá que no se omitan aquellos resultados, que aún siendo conceptualmente sinónimos al de la consulta, no se encuentran por ser distintos terminológicamente. 9 Normalización de sistemas documentales: La documentación generada por los nuevos sistemas contará con características como la identificación del contenido documental (información) mediante el uso de códigos de identificación y descriptores, el etiquetado de la documentación legible en las fuentes y en los instrumentos de representación (catálogos, listados, bases de datos, etc.), el establecimiento de una estructura base que permita la relación de los términos empleados en la identificación documental (tesauros) y la creación de instrumentos auxiliares para la recuperación de la información como índices, tablas, etc.. I.5 Las ontologías en la interoperabilidad de sistemas La interoperabilidad es definida por la IEEE (IEEE, 1990) como “la habilidad de dos o más sistemas o componentes para intercambiar información y para usar la información que ha sido intercambiada”. Actualmente, las organizaciones se encuentran en un contexto globalizado, donde el mercado aún está en proceso de permanente redefinición, lo cual hace que se abran constantemente nuevas oportunidades de negocios. Para enfrentar esta situación es de vital importancia poder gestionar el creciente cúmulo de información almacenada en bases de datos de las distintas organizaciones, en sus Intranets, así como información proveniente de Internet. 19.

(20) Al integrar información proveniente de distintas fuentes surge un gran problema a resolver: la heterogeneidad de la misma. Esta heterogeneidad es tanto a nivel sintáctico como semántico. A nivel sintáctico la interoperabilidad significa integrar datos que están presentes en los sistemas de información en diferentes lenguajes y representaciones de datos. Para alcanzar este nivel de integración generalmente se emplea XML (eXtensible Markup Language). Por otro lado, al hecho que un término pueda representar distintos conceptos o un concepto pueda ser representado por distintos términos se lo denomina heterogeneidad semántica. Para resolver este problema se utilizan las ontologías. Así, dos sistemas de información que utilizan términos diferentes, podrán dialogar si existe una ontología que establece relaciones de sinónimos, o de especialización, o de generalización, o de equivalencia matemática, entre los conceptos de los distintos sistemas a integrar. La mayoría de los sistemas actualmente interoperan mediante interfaz punto a punto, lo que hace que esta arquitectura sea ineficiente, requiriendo 2N interfaces para N sistemas. Progresivamente los sistemas se están trasladando a otras arquitecturas como ESB (Entreprise Service Bus), donde cada sistema solo interactúa con el bus y la información es encaminada a través de este hasta el correspondiente destino. Esta forma es mucho más eficiente ya que requiere N interfaces. Dicho modelo asegura que cada sistema tiene solo una forma de convertir de/para. Debido a que cada sistema tiene su propia clave de conversión es difícil asegurar un mayor aprovechamiento de la interoperabilidad. Las ontologías solventan en gran medida los siguientes impedimentos encontrados en la interoperabilidad de sistemas inteligentes: 1.. Representaciones heterogéneas: Existen múltiples aproximaciones para representar el conocimiento, no pudiéndose representar siempre en un formalismo el conocimiento que está representado con otro formalismo. Una cuestión similar ocurre con los distintos lenguajes de información de gestión, donde no todos son orientados a objetos.. 2.. Dialectos en familias de lenguajes: Dentro de una misma familia de formalismos de representación del conocimiento, puede ser complicado 20.

(21) compartir conocimiento entre dialectos, Por ejemplo. dentro de los lenguajes de información de gestión orientados a objetos, no todos permiten la herencia múltiple. 3.. Falta de convenciones de comunicación: No existe un protocolo que especifique cómo distintos sistemas pueden consultarse el conocimiento que poseen.. 4.. Desemparejamiento de modelos en el nivel de conocimiento: Aunque los problemas del nivel de lenguaje se resuelvan. sigue siendo difícil combinar dos bases de conocimiento. Estas barreras aparecen cuando se usan diferentes términos primitivos para organizarlas.. I.6 Tipos de ontologías Diversas son las formas de clasificar las ontologías, la amplia utilización de las mismas en aplicaciones informáticas ha propiciado que se distingan. los aspectos más. representativos para determinados campos de aplicación, esta clasificación permite realizar una distinción entre las ontologías para determinar los aspectos a tener en cuenta en el proceso de definición, concepción y construcción. En tal sentido se distinguen tres tipos fundamentales de ontologías (Steve et al., 1998): 9 Ontologías de alto nivel o genéricas: describen conceptos muy generales y fundacionales del conocimiento como las estructuras parte/todo, la cuantificación, los procesos o los tipos de objetos, que son independientes de un problema o dominio particular. Parece razonable tener ontologías de alto nivel unificadas para una gran cantidad de comunidades de usuarios. En relación con los sistemas de información, estas ontologías describirían conceptos básicos. 9 Ontologías de dominio: representan el conocimiento especializado pertinente de un dominio o subdominio genérico especializando los conceptos introducidos en la ontología de nivel superior, proporcionan el vocabulario para describir un dominio dado, como el bancario, la medicina, las aplicaciones militares, la cardiología, etc.. 21.

(22) 9 Ontologías de aplicación: son las ontologías más específicas. Describen conceptos que dependen de las ontologías de dominio y de tarea, siendo con frecuencia especializaciones de ambas ontologías. Los conceptos en estas ontologías a menudo se corresponden con los roles propios de las entidades del dominio. Ej: procesos Hay otras posibles clasificaciones de ontologías atendiendo a diversos criterios, una de ellas podría hacerse atendiendo a su destino. Según este criterio, se pueden distinguir los siguientes tipos de ontologías (GUARINO, 1996): 9 Ontologías. lingüísticas:. están. relacionadas. con. aspectos. lingüísticos,. gramáticos, semánticos y sintácticos destinados a su utilización por los seres humanos. 9 Ontologías no lingüísticas: para ser utilizadas por robots y agentes inteligentes. 9 Ontologías mixtas: combinan las características de las anteriores. Otra forma de identificarlas es por el grado o nivel de abstracción y razonamiento lógico que permitan: 9 Ontologías descriptivas: incluyen descripciones, taxonomías de conceptos, relaciones entre los conceptos y propiedades, pero no permiten inferencias lógicas. 9 Ontologías lógicas: permiten inferencias lógicas mediante la utilización de una serie de componentes como la inclusión de axiomas, reglas, etc. Como se mencionó anteriormente la clasificación en base a la aplicabilidad es la que permite definir los aspectos distintivos en el proceso de construcción de ontologías. De los tipos de ontologías según esta clasificación las de dominio son las de más aplicación y las más generalizadas, pues la mayoría de las organizaciones al representar algún conocimiento es el del dominio propio o con el que tengan alguna relación.. I.7 Modelo de datos conceptual como un tipo de ontología 22.

(23) La modelación de datos surgió hace alrededor de tres décadas asistiendo el diseño de bases de datos, específicamente en las bases de datos relacionales. Técnica que ha sido reconocida como herramienta para el análisis de la organización de la información.. I.7.1 ¿Que es un modelo de datos? Un modelo de datos es una ilustración que representa datos y las relaciones entre ellos. El significado de modelo de datos varia, dependiendo de su propósito: 9 Puede representar un diseño de base de datos, con cuadros que representan tablas y líneas que representan las llaves foráneas. También se representan las columnas de las tablas. 9 Puede ser una representación de un modelo conceptual de estructuras de negocio, donde los cuadros representan elementos significativos del negocio y las relaciones entre ellos. También se representan las definiciones de descripciones de datos significativos. Estas son elementos muy diferentes. Un modelo de datos de negocio (o “conceptual”) captura la semántica de una organización con el propósito tanto de comunicación con la comunidad de negocio, como proveer una arquitectura para base de datos y diseño de sistemas. De otra manera las restricciones de cardinalidad y reglas de negocio no son generalmente representadas en modelos de datos de ambos tipos. Incluso en el caso de modelos de datos de negocio, los modelos representan las estructuras fundamentales, mientras las reglas de negocio representan restricciones variables. En otras palabras, el diseño de base de datos, la modelación de datos de negocio y la modelación de reglas de negocio son tres cosas bien diferentes, por lo que existen tendencias en la modelación de datos.. Los modelos de datos son las. conceptualizaciones desarrolladas para aplicaciones de dominios bien limitados, mientras que una ontología es la conceptualización de un elevado nivel genérico del dominio para ser compartida por todas las aplicaciones de dicho dominio (Spyns et al., 2002).. 23.

(24) I.7.2 Dos formas básicas de suposición del mundo. Al expresar el alcance de la representación del conocimiento existen dos formas básicas de suposición del mundo. La primera asume que todo lo que actualmente no es conocido como verdadero es falso, esta presunción es llamada “suposición de mundo cerrado” (CWA, Closed World Assumption). Esta interpretación es usada principalmente cuando la base de conocimiento contiene todos los factores relevantes, esto lo podemos apreciar en bases de datos empresariales, es decir se acepta que la información contenida es completa. En oposición a la primera, la otra presunción asume que la falta de determinado conocimiento no quiere decir que sea falso, la cual es llamada “suposición de mundo abierto” (OWA, Open World Assumption). Se parte que la base de conocimiento es incompleta (no se cuenta con suficiente información para producir una respuesta a una pregunta), es decir lo que no se conoce está indefinido y la “mejor” repuesta debe ser derivada de la información incompleta, situación esta familiar para la mayoría de las personas. CWA es mucho más estricto y menos diplomático; es decir más absolutista: se obtiene lo que se conoce sin hacer suposiciones. En su formalización, para un mayor alcance pueden adicionarse a la base de conocimiento negaciones de los literales que no están comprendidos actualmente en dicha base.. I.7.3 Modelos de datos conceptuales y lenguajes ontológicos Un modelo de datos conceptual, es un tipo de ontología. Esto es una definición de categorías de datos, donde la descripción gráfica proporciona las bases para la discusión y negociación del significado de estas categorías. Unido al análisis de las reglas de negocio permiten el entendimiento por parte de los humanos. y que los. sistemas de cómputo puedan realizar inferencias. El propósito de la modelación de datos está basada sobre la “suposición de mundo cerrado”(solo es acertado lo que es conocido) y los lenguajes ontológicos se basan en la “suposición de mundo abierto” (todas las afirmaciones son asumidas como verdaderas hasta que se pruebe lo contrario). 24.

(25) Esto significa que al construir un sistema usando modelación de datos: 9 Solo se pueden introducir datos que se sabe que son válidos. 9 Se está obligado a entrar información completa. 9 No existen otros datos. 9 Las clases de las entidades del modelo de datos y las tablas derivadas son plantillas. Con una base de datos ontológica: 9 Se puede introducir lo que se conoce como cierto. 9 Se puede entrar información incompleta. 9 Las personas y sistemas de computo pueden inferir otras cosas. 9 Las clases ontológicas son un simple conjunto de cosas.. I.8 Conclusiones del capítulo Con el objetivo de brindar los aspectos fundamentales de las ontologías, a lo largo del capítulo se hace referencia a las definiciones más importantes de ontologías, así como los componentes y clasificaciones de las mismas. Se destacan además, las campos de aplicación, tales como la Web Semántica, ingeniería del conocimiento y sistemas de información. De igual forma se tratan conceptos estrechamente vinculados con las ontologías que permiten alcanzar un mayor entendimiento y alcance de las mismas, tales como la modelación de datos, los metadatos y la interoperabilidad de sistemas, donde las ontologías dan solución a muchos de los impedimentos encontrados. Se destaca la clasificación de ontologías en base a la aplicabilidad la cual permite definir los aspectos distintivos en el proceso de construcción de ontologías. Dentro de esta clasificación las ontologías de dominio son las de más aplicación y las más generalizadas, pues la mayoría de las organizaciones al representar algún conocimiento es el del dominio propio o con el que tengan alguna relación. De esta 25.

(26) forma es el tipo de ontología para las que en el presente trabajo proponemos el Marco de Trabajo.. 26.

(27) II. Caracterización de metodologías, lenguajes, herramientas y razonadores de ontologías. Propuesta de Marco de Trabajo para el desarrollo de ontologías de dominio. En el desarrollo de una aplicación ontológica se debe transitar por diferentes etapas, donde en cada una de ellas se toman decisiones importantes, como es la metodología a utilizar, el lenguaje, la herramienta y el razonador. Contar con el conocimiento necesario para determinar de forma efectiva que decisión tomar en cada etapa permitirá el éxito de dicha aplicación. En estos momentos existen gran cantidad y variedad de metodologías, lenguajes, herramientas y razonadores para el tratamiento de ontologías, que han sido creados y desarrollados en los últimos años. En el presente capítulo se exponen las más representativos y utilizados, donde se caracterizan, de forma tal que se destacan sus aspectos más relevantes, tanto favorables como desfavorables para el desarrollo de determinados tipos de ontologías. Al concluir cada tema se indica el elemento elegido para conformar el Marco de Trabajo que se propone, dicha conformación se basa en tipos de ontologías de dominio.. II.1 Metodologías para la construcción de ontologías En esta sección se aborda lo relacionado con las metodologías para la construcción de ontologías. Se caracterizan las principales metodologías existentes. IDEF5 y Methontology son propuestas de metodologías de propósito general para la construcción de ontologías.. II.1.1 Pasos y principios para la construcción de ontologías A pesar de que existen varias metodologías para el diseño de ontologías, no existe una metodología estándar al no establecerse un acuerdo entre la comunidad involucrada,. 27.

(28) pero si pueden distinguirse 4 pasos fundamentales (Uschold and Gruninger, 1996) en la creación de ontologías que pueden ayudar en este proceso: 1. Identificar el propósito y el alcance: Esta fase lo que va a intentar conseguir es especificar el contexto de aplicación y el punto de vista del modelado. El contexto de aplicación describe el dominio de aplicación, los objetos de interés del dominio y las tareas que van a realizarse por la ontología; es decir, para que va a construirse. El modelado del punto de vista describe el tipo de modelo, tales como dinámico-estático, funcional-causal, etc. 2. Construcción de la ontología: Este paso a su vez puede dividirse en Captura; Codificación, que es la representación explícita de la conceptualización en un lenguaje formal; Integración de las ontologías existentes, es decir, cómo, cuáles y si va a usarse alguna ontología previamente existente, reutilizando así conocimiento. 3. Evaluación: Esta fase trata de hacer un diseño definitivo y evaluarlo. Aquí debe de considerarse aspectos como la posible reutilización de la ontología para la construcción de ontologías futuras. 4. Documentación y reutilización: La documentación, ha de hacerse de forma paralela a los puntos anteriores, y debe de cumplirse la metodología usada para la construcción, diferencias semánticas con las ontologías seleccionadas, justificación de las decisiones tomadas, evaluación, conocimiento adicional para usarla, etc. También ha de ser indexada y colocada con las ontologías existentes para su posible reutilización. De todas formas, aunque se sigan los pasos anteriores para la construcción de una ontología, debe tenerse en cuenta los siguientes principios de construcción (VAN HEIJST et al., 1996): 1. Claridad y objetividad: Una ontología debe proveer al usuario con el significado del término de forma objetiva, y también, en lenguaje natural para su comprensión.. 28.

(29) 2. Completitud: Las definiciones han de ser expresadas en términos necesarios y suficientes. 3. Coherencia para asegurar que las inferencias realizadas de ésta, sean consistentes con las definiciones. 4. Máxima extensibilidad monótona: Es decir, que las especializaciones o generalizaciones deben ser incluidas en la ontología de tal forma que no se requiera una revisión de las definiciones preexistentes. 5. Principio de distinción ontológica: Las clases en una ontología deben ser disjuntas. 6. Diversificación: Se han de diversificar las jerarquías incluidas para aumentar la potencia de los mecanismos de herencia múltiple. 7. Modularidad para disminuir el acoplamiento entre los módulos. 8. Estandarización de los nombres, siempre que esto sea posible. 9. Minimización de la distancia semántica entre conceptos emparentados. Conceptos similares estarán agrupados y representados utilizando las mismas primitivas.. II.1.2 IDEF 5 IDEF5 es una metodología sobre la base de un modelo de desarrollo de prototipos diseñado para asistir la creación y dirección de modelos de ontología de dominio, usa los términos tipo para referirse a las clases y características para los atributos de las clases. La metodología es dividida en cinco actividades: organización y alcance, recolección de datos, análisis de datos, desarrollo de la ontología inicial, y los refinamientos y validación de la ontología. II.1.2.1 Organización y alcance El diseñador primeramente debe establecer el propósito, contexto y el punto de vista para el proyecto de desarrollo de ontología y asignar los roles a los miembros del 29.

(30) equipo. El punto de vista describe desde que perspectiva el dominio está siendo diseñado, por ejemplo, desde el punto de vista del diseñador del proyecto. II.1.2.2 Recolección de datos Con el proyecto definido, el diseñador debe determinar qué información debe contener la ontología. IDEF5 define tres modos de recolección de datos: la observación de las actividades, las entrevistas y análisis con expertos de dominio, y transcripción directa de datos de documentos del dominio. Seis tipos diferentes de formas son usadas para catalogar la fuente y conjunto de términos. El conjunto de términos es similar a una lista creada por la tormenta de ideas; representa los términos significativamente relevantes para el desarrollo de la ontología. Estos términos podrían convertirse en tipos, relaciones, o características en la ontología. II.1.2.3 Análisis de datos El objetivo de este paso es analizar la fuente material y el conjunto de términos del paso anterior y formular una caracterización inicial de la ontología. Listar objetos de interés en el dominio es la primera parte de esta caracterización. El punto de vista y el contexto del proyecto, es determinante en la actividad de organización y alcance, así como encamina al nivel de detalle para especificar objetos. El equipo debe buscar sistemas de objetos que trabajen en conjunto para lograr objetivos comunes. II.1.2.4 Desarrollo de la ontología inicial La actividad de desarrollo de la ontología inicial desarrolla proto-tipos, protopropiedades, proto-atributos, y proto-relaciones. El proto sólo se refiere al hecho de que éstos son el primer intento por especificar estos conceptos en la ontología. IDEF5 provee una representación visual de la ontología con el propósito de que la ontología puede ser desarrollada gráficamente. II.1.2.5 Validación y refinamiento de la ontología El diseñador debe asegurar ahora que la ontología desarrollada contenga toda la información del dominio. Esta actividad completa el proceso de diseño validando y refinar los proto-conceptos en la ontología desarrollada. El analista debe instanciar los 30.

(31) proto-tipos usando ejemplos de datos en el dominio. Cualquier información del dominio que no pueda ser representada por un proto-tipo debe ser analizada para determinar si es necesitado en la ontología. Si lo es, entonces debe desarrollarse un nuevo tipo o ampliar el existente para incorporar la información. Finalmente, los tipos deben ser verificados para asegurar que no hay duplicados. Las relaciones son verificadas en un procedimiento similar para asegurar que no hay ausencias, duplicaciones o relaciones contradictorias. La ontología puede ser cambiada del lenguaje de esquemas gráficos de IDEF5 al lenguaje de elaboración de IDEF5. El lenguaje de elaboración es un lenguaje de texto estructurado con gran poder en lógica de primer-orden.. II.1.3 Methontology Methontology esta basada en la experiencia de Fernández (Fernández-López et al., 1999) en la construcción de una ontología para un dominio de la Química y es un método estructurado para la construcción de ontologías, incluye la identificación del proceso de desarrollo de ontologías, ciclo de vida basado en el desarrollo de prototipos y técnicas particulares para la realización de cada actividad. II.1.3.1 Proceso de desarrollo de Ontologías El proceso de desarrollo de ontología (Fernández-López et al., 1997) hace referencia a cuales actividades son realizadas. Es crucial identificar estas actividades para llegar a un acuerdo sobre ontologías que son desarrolladas cooperativamente por equipos geográficamente distantes, con alguna garantía de corrección y completitud. Si esto es el caso, es aconsejable hacer tres categorías de actividades que se presentan a continuación (Figura II-1).. 31.

(32) Figura II-1 Proceso de desarrollo Methontology.. Actividades de Dirección de Proyecto: incluyen la planificación, el control y la garantía de la calidad. La planificación identifica qué tareas son desarrolladas, cómo serán organizadas, cuánto tiempo y qué recursos son necesarios para su terminación. Estas actividades son esenciales para reusar ontologías que ya han sido desarrolladas o para la construcción de ontologías que requieren diferentes niveles de conceptos abstractos y generalización. El Control garantiza que las tareas planeadas sean completadas de acuerdo con la manera en que fueron deseadas desarrollar. Finalmente, la garantía de la calidad, garantiza que la calidad de todo y cada uno de los productos obtenidos (ontología, software y documentación) sean satisfactorias. Actividades orientadas al desarrollo: incluyen la especificación, la conceptualización, la formalización, implementación y mantenimiento. La especificación dice por qué está siendo desarrollada la ontología, cuales son sus usos propósitos y quienes son los usuarios finales. La conceptualización estructura los conocimientos del dominio como modelos significativos en el nivel de conocimientos. La formalización transforma el modelo conceptual en un modelo formal o semi-computable. La implementación desarrolla modelos computable en un lenguaje computacional. Finalmente, el mantenimiento actualiza y corrige la ontología. 32.

(33) Actividades de soporte: incluyen series de actividades desarrolladas a la misma vez como actividades orientadas al desarrollo, sin las que la ontología no pudiera ser desarrollada. Estas incluyen la adquisición de conocimientos, la evaluación, la integración, la documentación y el manejo de configuración. La adquisición de conocimientos obtiene conocimientos de un dominio en particular. La evaluación hace una valoración técnica de las ontologías, sus ambientes de software asociados y documentación con respecto a un marco de referencia durante cada fase y entre las fases de su ciclo de vida. La integración de ontologías es requerida cuando se desarrolla una. nueva ontología rehusando otras que ya están disponibles. La. documentación detalla, claramente y exhaustivamente, todas y cada una de las fases terminadas y productos generados. El manejo de de configuración registra todas las versiones de la documentación, los software y los códigos de ontología para controlar los cambios. II.1.3.2 Ciclo de vida de ontologías Esto Identifica el conjunto de etapas a través de las cuales las ontologías se mueven durante su vida, describe qué actividades van a ser desarrolladas en cada etapa y cómo están relacionadas (relación de precedencia, retorno, etcétera.). Se justifica por qué el ciclo vida de ontologías debe estar basado en el desarrollo de prototipos. Para cada prototipo, Methontology propone la especificación de la ontología en primer lugar. Simultáneamente con esta fase, la actividad de adquisición de conocimientos comienza. Una vez que el primer prototipo ha sido especificado, la construcción del modelo conceptual es realizada en la fase de conceptualización. Esto es como ensamblar un rompecabezas con las piezas suministradas por la actividad de adquisición de conocimientos. El rompecabezas es completado durante la etapa de conceptualización. Después de la conceptualización, la formalización e implementación de conocimientos son llevadas a cabo. La formalización no es una actividad obligatoria, porque con el uso de herramientas de ontología. el. modelo. de. conceptualización. es. generalmente. automáticamente con traductores a lenguajes de ontologías.. 33. implementado.

(34) El control, la calidad, la integración, la evaluación, la documentación, y el manejo de configuración son llevadas a cabo simultáneamente por las actividades de desarrollo. Sin embargo, la etapa donde el esfuerzo es mayor para realizar la integración y evaluación es en la conceptualización.. II.1.4 Propuesta de Metodología para el Marco de Trabajo Además de las metodologías descritas anteriormente existes muchas otras, así como trabajos realizados por diferentes autores donde realizan comparaciones de las mismas (Corcho et al., 2003), en la siguiente tabla se comparan algunas de estas metodologías. Características. CYC. Uschold & King. Ciclo de vida propuesto. Desarrollo de prototipos. Estrategia con respecto a la aplicación. Independiente Independiente Semide aplicación de aplicación dependiente de aplicación. Estrategia para No especificada identifícar conceptos. No propuesta. Grüninger & KACTUS Fox. METH0NT0L0GY. Desarrollo Desarrollo Desarrollo de de prototipos de prototipos o prototipos incremental. IDEF5. 0TK. Desarrollo Incremental y de prototipos cíclica con desarrollo de prototipos. Dependien Independiente te de aplicación de aplicación. Independient Dependiente e de de aplicación aplicación. Middle-out. Middle-out. Top-down Middle-out. Middle-out. Top-down. bottom-up, middle-out depende de la aplicación. No. Depende de los recursos disponibles para el Proyecto. Ninguna específica. 0ntoEdit con sus plugins. Uso de una ontología base. Si. No. No. No. No. Herramientas que dan soporte. Cyc. Ninguna específíca. Ninguna específica. Ninguna 0DE específica Web0DE 0ntoEdit Protégé2000. Como se puede apreciar, Methontology se destaca en muchas características comparativas, tales como en las herramientas que pueden ser utilizadas, se pueden construir ontologías tanto partiendo de cero como reusando otras, no fue concebido para un tipo particular de aplicaciones. Unido a esto se debe destacar que existe mayor experiencia y posibilidades en su utilización. Un elemento distintivo es que fue creada 34.

Figure

Figura II-1
Figura II-2
Figura II-3
Figura III-1
+4

Referencias

Documento similar

SVP, EXECUTIVE CREATIVE DIRECTOR JACK MORTON

Social Media, Email Marketing, Workflows, Smart CTA’s, Video Marketing. Blog, Social Media, SEO, SEM, Mobile Marketing,

Por lo tanto, en base a su perfil de eficacia y seguridad, ofatumumab debe considerarse una alternativa de tratamiento para pacientes con EMRR o EMSP con enfermedad activa

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,

o Si dispone en su establecimiento de alguna silla de ruedas Jazz S50 o 708D cuyo nº de serie figura en el anexo 1 de esta nota informativa, consulte la nota de aviso de la

La cuestión, por lo tanto, no radica únicamente en la mejora o en el cambio de herramienta sino, sobre todo, en intentar estudiar hasta qué punto el EML es útil para transformar

El marco de trabajo PLASER, sobre el cual es posible desarrollar aplicaciones, no es utilizado actualmente para crear sistemas que puedan ser accedidos desde

Proporcione esta nota de seguridad y las copias de la versión para pacientes junto con el documento Preguntas frecuentes sobre contraindicaciones y