CAPÍTULO 2. Alineación de Ontologías en la Web Semántica
2.2 Ontologías
2.2.3 Representación de las Ontologías
Durante los últimos años se han desarrollado varios lenguajes de representación de ontologías que pueden ser aplicables en el contexto de la Web Semántica. Los primeros lenguajes se basaban en la sintaxis XML, mientras que otros como RDF y RDFS han sido creados por los grupos de trabajo del W3C con fines puramente semánticos. Los lenguajes de ontologías más recientes como OIL, DAML+OIL y OWL constituyen una capa por encima de RDF y RDFS con el objetivo de incrementar su expresividad. A continuación explicamos brevemente cada uno de estos lenguajes.
2.2.3.1
RDF y RDFS
El Marco de Descripción de Recursos, RDF (Resource Description Framework) [Lassila y Webick, 1999] fue diseñado originalmente como un modelo de metadatos y se ha convertido en un método general muy utilizado para la descripción conceptual o modelado de información implementado en los recursos Web, utilizando varios formatos de sintaxis. El modelo de datos RDF es similar a los métodos clásicos de modelado conceptual como el esquema entidad-relación o los diagramas de clases, ya que se basa en la idea de formar enunciados sobre recursos (en particular, los recursos Web) utilizando expresiones en forma de sujeto-predicado-objeto. Estas expresiones son conocidas como tripletes RDF. El sujeto denota el recurso, el objeto denota rasgos o aspectos del recurso y el predicado expresa una relación entre el sujeto y el objeto. El sujeto pertenece a un conjunto llamado Resource, el predicado pertenece a un conjunto llamado Properties y el objeto puede pertenecer al conjunto Resource o al conjunto Literal. Por ejemplo, si queremos representar en RDF la expresión: “La pelota es de color rojo”, el sujeto o recurso sería “la pelota”, el predicado sería “es de color” y el objeto sería “rojo”.
Alineación de Ontologías en la Web Semántica 41
RDFS o RDF Schema [RDFS, 1998] es una extensión semántica del modelo RDF que proporciona un mejor soporte para la definición y clasificación, bajo la influencia de los sistemas de frames y los modelos orientados a objetos. Los sistemas de frames organizan el conocimiento de una manera centrada en el concepto con construcciones descriptivas de las ontologías y construyen axiomas de herencia. Estos modelos permiten a los usuarios representar el mundo en diferentes niveles de abstracción haciendo énfasis en las entidades, a diferencia del modelo de grafo plano ofrecido por la mayoría de las redes semánticas. Además de heredar las características básicas de los sistemas de frames, RDFS proporciona construcciones ontológicas que hacen que las relaciones sean menos dependientes de los conceptos. Por ejemplo los usuarios pueden definir relaciones como instancias de
rdf:Property, describir relaciones de herencia entre las relaciones utilizando
rdfs:subPropertyOf, y asociar relaciones definidas con clases utilizando
rdfs:domain o rdfs:range.
2.2.3.2
OIL
OIL (Ontology Inference Layer) [Fensel et al., 2000] es el primer lenguaje de representación de ontologías basado en estándares del W3C y su sintaxis está definida como una extensión de RDFS. El modelo de representación del conocimiento lo ha heredado, por una parte, de la Lógica Descriptiva (declaración de axiomas o reglas) y, por otra, de los sistemas basados en frames (taxonomía de clases y atributos). OIL se encuentra estructurado en varias capas de sublenguajes. La capa base de OIL coincide plenamente con RDFS, y cada una de las capas superiores añade funcionalidad y complejidad a su capa subyacente. Esto posibilita la reutilización de agentes diseñados para RDFS para procesar ontologías OIL [Fensel, 2002].
Además de las ventajas enunciadas, OIL ofrece un completo conjunto de utilidades software como editores de ontologías y herramientas de razonamiento avanzado sobre las ontologías. Entre las limitaciones de OIL [Horrocks et al., 2001] podemos destacar la falta de expresividad en la declaración de axiomas (reglas) y que no soporta dominios concretos (e.g. números enteros, cadenas de caracteres, etc.).
42 Alineación de Ontologías en la Web Semántica
2.2.3.3
DAML+OIL
DAML+OIL [Horrocks y van Harmelen, 2001] surge de la cooperación entre los grupos de trabajo de OIL y DARPA (US Defense Advanced Research Projects Agency), quienes anteriormente habían desarrollado el lenguaje DAML (DARPA’s Agent Markup Language) con la finalidad de extender el nivel de expresividad de RDFS. Por tanto DAML+OIL unifica estos dos lenguajes, con el objetivo de la construcción de un lenguaje estándar para la definición de ontologías. Este lenguaje hereda muchas características de OIL, pero se aleja un poco del modelo basado en frames aprovechando más los elementos de la lógica descriptiva.
DAML+OIL divide el dominio en dos partes disjuntas: una parte se llama dominio de tipos de datos y se refiere a los valores que pertenecen a los tipos de datos del esquema XML; y la otra parte se llama dominio de objetos y trata los objetos que son considerados miembros de clases descritas en DAML+OIL (o RDF). En DAML+OIL las clases se llaman clases de objetos y son elementos de daml:Class (una subclase de rdfs:Class). Los tipos de datos son elementos implícitos de daml:Datatype y se usan en DAML+OIL incluyendo sus URLs en la ontología. Los elementos principales del lenguaje son:
• Elementos de clase: Un elemento de clase daml:Class contiene la definición de una clase de objetos.
• Enumeraciones: Es un elemento daml:oneOf, que contiene una lista de objetos, permitiendo enumerar los elementos concretos de una clase.
• Propiedades: Un elemento rdf:Property se refiere al nombre de una propiedad. Las propiedades que se usan en restricciones de propiedades son las que relacionan objetos (instancias de ObjectProperty) o las que relacionan objetos a valores de tipos de datos (instancias de DatatypeProperty).
• Restricciones de propiedad: Una restricción de propiedad es un tipo especial de expresión de clase. Se define implícitamente una clase anónima, llamada clase de objetos que satisface la restricción.
Alineación de Ontologías en la Web Semántica 43
2.2.3.4
OWL
OWL (Web Ontology Language) [Dean y Schreiber, 2004], inspirado en DAML+OIL también constituye una extensión de RDFS para permitir una inferencia lógica más rica. Actualmente existen tres variantes de OWL, que incorporan diferentes funcionalidades:
• OWL-Lite: Es la variante más sencilla para la creación de un sistema de frames (o una base de datos orientada a objetos) en términos de clases, propiedades, relaciones de subclases y restricciones. En OWL-Lite no se utiliza el vocabulario completo de OWL y algunos de los términos se utilizan bajo ciertas restricciones.
• OWL-DL: Se basa en la lógica descriptiva, y se centra en la semántica formal común y la decidibilidad de la inferencia. La lógica descriptiva ofrece construcciones adicionales de ontología (como conjunción, disyunción y negación), además de las clases y relaciones, y tiene dos mecanismos de inferencia importantes: la subsunción, que consiste en inferir cuando un elemento es abarcado por otro; y la consistencia, que consiste en verificar la imposibilidad de contradicción dentro del sistema. La fortaleza de la teoría de conjuntos hace que la lógica descriptiva sea adecuada para capturar el conocimiento sobre un dominio en el que las instancias pueden ser agrupadas en clases y las relaciones entre clases son binarias. OWL-DL utiliza todas las construcciones ontológicas de OWL con algunas restricciones.
• OWL-Full: Es la versión más expresiva de OWL. La mayor diferencia entre OWL- DL y OWL-Full es que el espacio de clase y el espacio de instancia son disjuntos en OWL-DL, pero no en OWL-Full. Es decir, en OWL DL una clase no puede ser también un individuo o una propiedad, y una propiedad no puede ser tampoco un individuo o una clase. En cambio en OWL-Full una clase puede interpretarse simultáneamente como un conjunto de individuos y como un individuo que pertenece a otra clase. En OWL-Full se puede utilizar el vocabulario completo de OWL sin ningún tipo de restricciones.
44 Alineación de Ontologías en la Web Semántica