CFGS Administración de Sistemas Informáticos en Red IES Juan de la Cierva (Vélez-Málaga)
Índice
Orígenes
Evolución histórica
Relación entre los Lenguajes de Marcas
Concepto y tipos
Evolución futura
Orígenes
Tradicionalmente, en la época de la imprenta, los manuscritos de autor incluían instrucciones que indicaban el tipo de letra, el estilo y el tamaño con que debía ser representado el texto, etc…
A estas indicaciones se les llamaba
marcas, y existía un buen número de ellas conocidas y manejadas
informalmente por los tipógrafos Con la introducción de las
computadoras, y sobre todo de la web, se trasladó este concepto al mundo de la informática
Evolución histórica: SGML
La idea de crear un lenguaje estándar de marcado de texto fue expuesta por William W. Tunnicliffe en 1967. La mayor novedad consistía en separar presentación y estructura del texto
Pero es a Charles Goldfarb, de IBM a quien se le considera el padre de la idea. Participó en la creación del lenguaje
GML, y posteriormente dirigió el comité que elaboró el estándar SGML
SGML es un meta-lenguaje, o sea, un lenguaje para la
definición de lenguajes de marcas. Todos los lenguajes de marcas actuales descienden de él
En general se considera que la idea surgió de forma
independiente varias veces durante los años 70, pero que no se materializó su uso hasta los 80
Evolución histórica: TEX
Una de las primeras aplicaciones prácticas de esta idea fue el estándar TeX, creado y
mantenido por Donald Knuth en los años 70 y 80
TeX requiere amplios conocimientos para ser utilizado, por lo que sólo se utiliza en entornos científicos a través de LaTeX.
Los lenguajes troff y nroff, surgieron para
maquetación en sistemas UNIX y no llegaron a cuajar
La aparición de procesadores de texto tipo WYSIWYG relegó estos sistemas al olvido
Evolución histórica: HTML
En 1991, la situación cambió drásticamente cuando Tim
Berners-Lee, el inventor de la Web, utilizó la sintaxis SGML para crear HTML
La extraordinaria sencillez del HTML, junto con el empleo de URLs y la distribución libre de los primeros
navegadores, están en el origen del éxito de la World Wide Web
El HTML es hoy día el tipo de documento más empleado en el mundo
El motivo de su éxito es también su principal handicap: su extrema simplicidad en declaración e interpretación,
impide restringir la generación de documentos mal formados
Además, se comenzaron a mezclar presentación y
Evolución histórica: XML
XML aparece para solventar los problemas de HTML Se trata de un meta-lenguaje que permite crear etiquetas
adaptadas a las necesidades
El estándar define cómo pueden ser esas etiquetas y qué se puede hacer con ellas y es especialmente estricto en lo que está permitido y lo que no, todo documento debe cumplir dos condiciones: ser válido y estar bien formado
El XML fue desarrollado por el World Wide Web
Consortium, teniendo como objetivo principal simplificar el SGML para adaptarlo a los documentos en internet
Evolución histórica: XML
Se solucionaron otros viejos problemas, como los surgidos de la internacionalización, y la imposibilidad de validar El acierto fundamental de este lenguaje en que logra un
equilibrio entre simplicidad y flexibilidad
XHTML, es una redefinición del HTML en clave XML
Pero los lenguajes basados en XML tienen además
múltiples aplicaciones, como el intercambio de datos entre servidores y un largo etcétera
Relación entre los distintos
Lenguajes de Marcas
Concepto y tipos
Un lenguaje de marcas codifica un documento añadiendo
al texto, etiquetas o marcas que indican o bien su estructura, o bien su presentación o ambas cosas
Existe una clasificación de los L. de M., si bien no es excluyente:
Marcado de presentación Marcado de procedimientos Marcado descriptivo
Marcado de presentación
Indica el formato del texto
Se usa para maquetar la presentación de un documento para su lectura
No es útil para el procesamiento automático de la información
Resulta complicado de mantener o modificar ya que el creador no ve el resultado final
Su uso se fue reduciendo a medida que los proyectos crecían
Marcado de procedimientos
Está enfocado hacia la presentación del texto
También es visible para el usuario que edita el texto
El programa que representa el documento debe interpretar el código en el mismo orden en que aparece
Se usa mucho en aplicaciones de edición profesional y pueden ser bastante complejos
Algunos ejemplos de marcado de procedimientos son nroff, troff, TeX
Ejemplo de documento LaTex
Marcado descriptivo
Utiliza etiquetas para describir los fragmentos de texto No especifican cómo deben ser representados, o en que
orden
Los lenguajes expresamente diseñados para generar marcado descriptivo son el SGML y el XML
Una de sus virtudes es la flexibilidad: los fragmentos de texto se etiquetan tal como son, y no tal como deben aparecer
Por ello pueden utilizarse para más usos de los previstos inicialmente
También simplifica la tarea de reformatear un texto, debido a la separación de formato y contenido
Otras aplicaciones
Los lenguajes de marcas no solamente poseen aplicaciones en la presentación de documentos textuales y/o
hipermedia en sentido clásico
También existen lenguajes especializados para la representación de:
Gráficos 2D y 3D
Música Finanzas
Matemáticas, etc
(Con el evidente objetivo último del procesamiento automático de la información representada)
Evolución futura
El marcado descriptivo está evolucionando hacia el marcado genérico
Los nuevos sistemas de marcado descriptivo estructuran los documentos en árbol, con la posibilidad de añadir referencias cruzadas
Permite tratarlos como bases de datos, en las que el propio almacenamiento tiene en cuenta la estructura
Estos sistemas no tienen un esquema estricto como las bases relacionales, por lo que a menudo se las considera bases semiestructuradas
La web semántica
Los lenguajes de marcado son la herramienta fundamental en el diseño de la web semántica
En ella, no solo se puede acceder a la información, sino que además define su significado, es más fácil su
procesamiento automático y se pueda reutilizar para distintas aplicaciones
Esto se consigue añadiendo datos adicionales a los
documentos, por medio de dos lenguajes expresamente creados: el RDF (Resource descriptión
framework-Plataforma de descripción de recursos) y OWL (Web
Ontology Language-Lenguaje de ontologías para la web), ambos basados en XML