CAPITULO 4: CONCLUSIONES
2.3 WEB SEMÁNTICA
2.3.1 ARQUITECTURA DE LA WEB SEMÁNTICA
2.3.1.1 CAPA DEL LENGUAJE DE MARCADO EXTENDIDO
Cada vez son más frecuentes las páginas Web que contienen tablas, estadísticas, formularios repletos de datos que proceden de alguna fuente de información estructurada, sin embargo, estos datos al ser convertidos en texto HTML no tienen estructura lógica, por lo cual pierden toda su capacidad operativa. El lenguaje XML fue creado en 1998 por el W3C con el objetivo de traducir los documentos a un código “comprensible”35 por la computadora. XML es un subconjunto simplificado de SGML que incorpora muchas de las características de SGML, entre las que se incluyen las más importantes: extensibilidad, estructura y validación, permitiendo describir la estructura de los contenidos de datos que se encuentran en las páginas Web. XML es una especificación que sirve para diseñar lenguajes de marcado, es decir es un metalenguaje, permitiendo diseñar la descripción de los datos mediante un marcado personalizado además permite separar el contenido (datos) de la presentación (como se ven los datos) en los documentos Web (ver figura 2.10a y 2.10b) (Morrison et al., 2000).
<html> <body>
<p><u> Datos de Libro </u> : <p>Titulo: Inteligencia Artificial</p> <p>Autor: Rusell y Norvig</p> <p>Edición: Segunda Edición </p> <p>ISBN: 84-205-4003-X</p> <p> Nro. de Paginas: 1240</p> </body> </html> <?xml version="1.0"?> < xmlns=”x-schema:LibroEsquema.xml”> <Libro> <b>Datos de Libro</b>
<Titulo> Inteligencia Artificial </Titulo> <Autor> Rusell S.J. </Autor>
<Autor> Norvig P. </Autor> <ISBN>84-205-4003-X </ISBN> <Paginas>1240</Paginas> </Libro>
Figura 2.10a: Esquema del lenguaje de marcado de hipertexto y lenguaje de marcado extensible para describir un documento Web, interpretado por el ser humano.
Fuente: Adaptado de (Morrison et al., 2000).
<html> <body> <p><u> </u> : <p> </p> <p> </p> <p> </p> <p> </p> <p> </p> </body> </html <?xml version="1.0"?> <Libro> <b> </b> <Titulo> </Titulo> <Autor> . </Autor> <Autor> </Autor> <ISBN> </ISBN> <Paginas> </Paginas> </Libro>
Figura 2.10b: Sintaxis HTML y XML para describir un documento Web, interpretado por la computadora.
Fuente: Adaptado de (Morrison et al., 2000).
XML es la base sintáctica de la Web semántica sobre la que se sustentan el resto de capas de la arquitectura de la Web semántica, es un metalenguaje que permite definir lenguajes de etiquetado validándolos mediante DTDs36 o esquemas de XML. Un etiquetado XML, por sí solo, no representa un mecanismo para expresar la semántica de los documentos. El lenguaje XML permite incluir metadatos (datos que describen datos) dentro de los documentos web de modo que la computadora del usuario, realice tareas de manipulación de la información (Martín, 2004) (Peis et al, 2003).
Un documento XML es, en esencia, un medio estructurado para almacenar información. Para valorar la validez de un documento XML, deberá establecer con exactitud a que estructura debe adherirse la información que hay en el documento. Esto se lleva a cabo a través de un esquema, que es un modelo utilizado para describir la estructura de información que hay en un documento XML. Los esquemas se usan en XML para modelar una clase de datos, es posible crear documentos XML estructurados que se adhieran a ese modelo. Un esquema describe la organización de los datos de marcado y de los caracteres en un documento XML, un documento XML debe adherirse aun esquema para ser válido. XML Schema constituye una forma para la definición de esquemas para los documentos XML, XML
Schema describe elementos y sus modelos de contenido de forma que los documentos XML sean validados (Morrison et al., 2000).
De acuerdo con el W3C, un esquema es “un conjunto de reglas que sirve para forzar la estructura y la articulación del conjunto de documentos XML” (ver figura 2.11). La sintaxis de XML se usa como base para crear documentos XML Schema.
<?xml version="1.0"?>
<Schema name=”EsquemaLibro”
xmlns=”urn:schema-microsoft-com:xml-data” xmlns:dt=”urn:schema-microsoft-com:datatypes”> <ElementType name=”Titulo” content=”textOnly” /> <ElementType name=”Autor” content=”textOnly” /> <ElementType name=”ISBN” content=”float” /> <ElementType name=”Paginas” content=”float” /> </Schema>
Figura 2.11: Esquema del lenguaje de marcado extensible para describir un documento Web. Fuente: Adaptado de (Morrison et al., 2000).
Los espacios de nombres son importantes para aislar los nombres utilizados en un determinado objeto para evitar el conflicto de nombres al utilizar diferentes fuentes de objetos. XML Namespaces es una iniciativa del W3C, que garantiza la singularidad de la asignación de nombres de los elementos y atributos, mediante una declaración de espacios de nombres, ya sea por el uso de URI37 o URN38.
En la figura 2.12 inciso a), b), c) se muestra la sintaxis de la declaración de espacios de nombres de URI y URN respectivamente.
a) <xmlns:Prefix=”NameSpace”> b) <xmlns:w3c=”http://www.w3c.org”> c) <xmlns:w3c=”urn:w3c.org”>
Figura 2.12: Formas de declaración de espacio de nombres. a) Formato general b) Mediante URI c) Mediante URN.
Fuente: Adoptado de (Morrison et al., 2000).
37 Del ingles Uniform Resource Identifiers, Identificadores Uniformes de Recursos. 38 Del ingles Universal Resource Name, Nombre Uniforme de Recurso.