Integraci´ on en la arquitectura

3.5. Acceso al contenido

3.5.3. Integraci´ on en la arquitectura

Las funciones del componente de acceso al medio están claramente divididas. Por un lado, el proceso de acceso f´ısico se encarga de manejar los aspectos relacionados con la localización de los contenidos f´ısicos. Complementariamente, el proceso de decodificación/demultiplexación se encarga de realizar dichas tareas y de manejar los mecanismos de optimización mediante el uso de una cachede fotogramas. Esta división queda patente en la figura 3.17 y motiva la separación de la funcionalidad en dos módulos independientes.

La integración de dichos módulos en la arquitectura se ilustra en la figura 3.18. Se muestra como la división funcional exige la distribución del proceso de gestión de acceso al contenido en varios componentes independientes (marcados en la figura con color azul): a nivel de framework global, a nivel de cada nodo y a nivel de cada componente. Cada uno cumple con una fracción de las responsabilidades conjuntas de la capa de acceso. Las siguientes secciones detallan que función realiza cada uno.

Acceso f´ısico al contenido

La organización de los contenidos multimedia está sujeta a numerosos requisitos, muchos de ellos propios de las normas espec´ıficas de organizaciones y proyectos. En todos los casos, las exigencias de espacio requieren la distribución de los contenidos en varios soportes inter- conectados. La arquitectura requiere la existencia de un paradigma de árbol de directorios ´

unico para esta diversidad, cuya creaci´on es posible en la mayor´ıa de los sistemas operativos actuales.

La tecnolog´ıa RAID (Redundant Array of Independent/Inexpensive Disks) [23] permite la unión de varios soportes de almacenamiento para formar un único soporte virtual. RAID permite mejorar la paralelización de lecturas/escrituras, ya que diferentes áreas del disco virtual pueden utilizarse concurrentemente, y además mejora la fiabilidad, ya que un fallo hardware en uno de los soportes no afecta a los datos de los demás. La naturaleza de RAID es puramente local, siendo necesario que los discos se conecten al bus RAID directamente. Diferentes “niveles” se han definido en el estándar RAID, en función de las necesidades de cada sistema. Cada nivel abarca una franja del espectro que va desde la fiabilidad máxima (todos los disco se emplean como espejos para garantizar el funcionamiento en presencia de fallos) hasta el rendimiento/capacidad máxima(ningún disco actúa de espejo, sino que todos guardan datos distintos ofreciendo la imagen de un disco virtual mucho más grande y rápido). El uso único de RAID no permite la abstracción local de sistemas de ficheros remotos, solo accesible a partir de soluciones de almacenamiento en red. En la actualidad existen

Nodo

Middleware

Framework local

Gestor Contenido LAN

NFS SAMBA .... Gestor Contenido Local Gestor Framework API Decod Componentes API Decod Componentes

Figura 3.18: Distribuci´on de los componentes b´asicos de la capa de acceso.

numerosos sistemas de almacenamiento en red. Los sistemas de ficheros ofrecidos por sistemas operativos de red, como Sprite [145] o AFS [167], son una primera alternativa. En ésta, el sistema de ficheros está distribuido en varios servidores, requiriendo complejos mecanismo de sincronización entre servidores y clientes que garanticen la integridad del sistema. AFS ha servido como base a otros sistemas de ficheros en red, como DCE [56] o Coda [166], centrados en mejorar las carencias de AFS en cuanto a escalabilidad y disponibilidad cuando los servidores fallan.

Los sistemas de ficheros distribuidos forman parte de sistemas operativos determina- dos, siendo necesario la utilización de estos en todos los nodos del sistema. La necesidad de heterogeneidad motiva la utilización de protocolos comunes en la generalidad de sistemas operativos actuales, como los omnipresentes NFS y SAMBA. Las necesidades de cada aplicación en términos de distribución de datos, necesidades de fiabilidad, heterogeneidad, disponibilidad, . . . determinaran la aproximación más adecuada.

El m´odulo de acceso al contenido se implementa como un servicio CORBA del framework global, etiquetado como Gestor Contenido en la figura 3.18. El servicio CORBA de acceso al contenido ofrece metadatos sobre los posibles protocolos de acceso al ´arbol remoto y su consiguiente identificador y otros datos de acceso. Cada nodo debe montar localmente el ´

arbol de directorios para acceder con el paradigma habitual de acceso a fichero. Los sistemas operativos de ambas m´aquinas se encargan de transportar los contenidos de manera transparente a las aplicaciones que se ejecuten en dicho nodo.

Es importante resaltar el hecho de que las aplicaciones utilizan nombres de fichero relati- vos al directorio ra´ız de este árbol. Gracias a ello, las aplicaciones no dependen de la ruta en la que el árbol ha sido montado en el sistema local, y que puede variar en función del sistema operativo o de la máquina en la que se ejecuta en un momento dado dicha aplicación (y que, gracias a la flexibilidad de la arquitectura, puede cambiar). El nombre relativo utilizado para acceder al contenido es completado por el subproceso deconfiguración de acceso multimedia que se describe en la sección 3.5.3.

Demultiplexaci´on y decodificaci´on

La funcionalidad de este módulo se divide en función de su carácter. Por un lado, cada nodo ejecuta un servidor de optimización local (Gestor Contenido Local en la figura 3.5.3), encargado de gestionar la cache. Por otro lado, cada componente debe ser capaz de acceder al contenido individualmente (API Decod en la figura 3.5.3), ya que la existencia de dicha cache no garantiza la presencia del fotograma requerida dentro de ella. La división da lugar a dos componentes de la arquitectura separados, que colaboran para facilitar los objetivos de este proceso.

El servidor de optimización local se implementa como un servicio CORBA asociado al nodo. Este servicio realizar´ıa las funciones de los procesosacceder a fotogramayconfiguración de acceso multimediade la figura 3.17. La aplicación suministra el identificador del contenido al que desea acceder al segundo de estos subprocesos. El identificador debe especificar las regiones temporales a las que se desea el acceso (contemplado en el estándar URI). Mediante esta llamada, el nombre relativo que maneja la aplicación se convierte en un nombre absoluto, válido para el acceso f´ısico al contenido dentro del nodo en el que se está ejecutando. La información del identificador se almacena en un diccionario local, que guarda registro de todos los contenidos (y regiones temporales) a los que todas las aplicaciones locales han pedido acceso. Utilizando esta información, el subproceso acceder a fotograma realiza la optimización del proceso. Para ello, cuando una aplicación pide acceso a un fotograma se sigue el siguiente proceso:

pedido por la aplicaci´on, y que viene definido por su timestamp de visualizaci´on (el momento exacto de tiempo en el que debe ser mostrado al usuario).

2. Obtención del fotograma a través del medio: si la búsqueda en la cache fracasa, se utiliza el subprocesodemultiplexación y decodificación para obtenerlo a partir del contenido original.

3. Actualización de la cache: Mediante la información contenida en el diccionario local de accesos, se puede inferir qué aplicaciones requieren un determinado fotograma en función de sutimestamp. Una vez un fotograma de la caché ha sido entregado a todas las aplicaciones que pidieron su uso, se elimina de la cache. En el caso de que se genere un nuevo fotograma, se comprueba si más aplicaciones han pedido su uso, almacenándose en la cache en caso positivo

El subproceso demultiplexación y decodificación multimedia en cada componente se implementa como un API del framework local ofrecido a componentes y aplicaciones. Ante la ausencia del fotograma en la cache el acceso real al contenido se realiza por un complejo módulo software encargado de la demultiplexación/decodificación. Las responsabilidades de este módulo son completamente independientes de la arquitectura y, por lo tanto, pueden ser aprovechadas en otras aplicaciones. Esta capa de software se convirtió, finalmente, en el proyecto Fobs, cuyas funciones e implementación se detallan en el cap´ıtulo 4.

3.6. Gesti´on de anotaciones

La gestión de anotaciones permite a las aplicaciones interactuar con los metadatos aso- ciados a los contenidos multimedia existentes en la arquitectura. Los metadatos son el centro del ciclo de vida multimedia; todos los procesos de éste utilizan y actualizan esta informa- ción. En la arquitectura propuesta se ofrece un gestor de anotaciones, representación de éste concepto abstracto en el modelo software real. Los componentes y aplicaciones integrados en la arquitectura utilizan este servicio para lograr acceso a los metadatos, tanto de lectura como de escritura y actualización.

Los procesos del ciclo de vida se dividen generalmente en tres etapas funcionales bien definidas y acotadas. En la primera, el proceso accede a los metadatos y busca información relativa a las caracter´ısticas propias de éste. En la segunda etapa, el proceso utiliza la in- formación de los metadatos y, opcionalmente, el propio contenido para generar una serie de resultados. En la última etapa, dichos resultados son incluidos como parte de los metadatos, complementando la descripción global del contenido. A pesar de que no todos los procesos siguen este patrón de manera tan fiel, en la mayor parte de los casos estas tres etapas se realizan complementadas con otras y con posibles variaciones en su orden.

Según este modelo de proceso del ciclo de vida multimedia, el papel de los metadatos es el de elemento de sincronización. Los procesos son meros consumidores y productores de metadatos y todos sus resultados son almacenados en éstos. La concurrencia de procesos puede, en definitiva, controlarse al nivel de metadatos por ser el único recurso mutable compartido entre ellos.

Las funciones principales del gestor de anotaciones son, por tanto, dos: facilitación del acceso a los metadatos, con independencia de su localización y distribución, y sincronización en el acceso a éstos por los diferentes componentes funcionales del sistema. En esta sección se describen las tecnolog´ıas informáticas utilizadas para lograr la creación de este componente, su integración como servicio dentro de la arquitectura y las facilidades ofrecidas a componentes y aplicaciones para el acceso directo a metadatos.

3.6.1. Acceso a anotaciones

En el cap´ıtulo 1 se define el concepto de metadatos y su función central en el ciclo de vida multimedia. Las aplicaciones de análisis y procesamiento toman como entrada metadatos y contenidos para generar nuevos metadatos útiles para el resto de aplicaciones, como distribución, consulta, . . . . En dicho cap´ıtulo se introduce el esfuerzo más ambicioso de es- tandarización de los metadatos, MPEG-7 y su extensión MPEG-21, enfocado a permitir la interoperabilidad entre todos los agentes presentes en el contexto multimedia: productores, proveedores y consumidores.

Los estándares de anotación del grupo MPEG, utilizados en la arquitectura propuesta, están implementados sobre el lenguaje XML. Cada descripción es, por tanto, un documento XML; su almacenamiento, manejo, búsqueda y acceso están delimitados por éste hecho. La proliferación de las aplicaciones basadas en documentos XML ha motivado que la industria informática haya creado un paradigma para su manejo en analog´ıa a las bases de datos relacionales clásicas: las bases de datos XML nativas.

Caracter´ısticas de las bases de datos XML nativas

Una base de datos XML nativa tiene como unidad fundamental de almacenamiento lógico un documento XML, al igual que en una base de datos relacional tiene como unidad fundamental de almacenamiento lógico a cada fila de una tabla. El modelo de almacenamiento f´ısico es independiente de esta vista lógica; la práctica más habitual es aprovechar las facilidades de las bases de datos relacionales existentes o, preferiblemente, utilizar un formato propietario enfocado a mejorar la indexación y compresión de los documentos XML que contiene.

Las bases de datos XML nativas están especializadas en el almacenamiento de datos XML, y guardan todos los componentes del modelo XML dejándolo intacto. Sin embargo, no pueden ser considerados sistemas de gestión de bases de datos por si mismos, i.e. no están pensadas para reemplazar a los sistemas de gestión de bases de datos existentes. Son simple- mente herramientas enfocadas a facilitar a los desarrolladores las tareas de almacenamiento y manipulación robusta de documentos XML.

Las bases de datos XML nativas organizan los documentos en colecciones, lo que permite consultar y manipular este conjunto con independencia del resto de documentos del sistema. Es un concepto análogo a las tablas en las bases de datos relacionales. El concepto difie- re, no obstante, en que las colecciones no imponen un esquema determinado (una colección de campos en el modelo relacional) en los documentos que almacena. Es decir, se permite almacenar cualquier documento XML en la colección, independientemente de su estructura

interna (que viene definida por un esquema). A pesar de esta heterogeneidad, es posible cons- truir consultas sobre todos los documentos de la colecci´on por las particulares caracter´ısticas del lenguaje XML. La independencia del esquema del documento en las colecciones ofrece una gran flexibilidad para el desarrollo de aplicaciones que trabajan con bases de datos XML nativas.

Las consultas en bases de datos XML nativas se realizan mediante el lenguaje XPath y sus recientes revisiones, que han sido bautizadas con el nombre de XQuery [202]. La es- pecificación XPath se utiliza para la consulta de documentos únicos, pero no colecciones, almacenados localmente. Entre las carencias más importantes de XPath destacan la ausencia de agrupaciones, ordenaciones, uniones entre documentos y soporte para tipos de datos. Las nuevas versiones del estándar XQuery añaden soporte para todas estas carencias, utilizando como base el estándar XPath y extendiendo su sintaxis para adaptarlo a las exigencias del acceso a una base de datos.

La actualización de documentos es, sin lugar a dudas, la mayor debilidad de las bases de datos XML nativas actuales. El método más frecuente ofrecido por éstas requiere recuperar el documento completo, cambiarlo utilizando un API XML local y, finalmente, devolverlo modificado a la base de datos. Algunas implementaciones permiten realizar actualizaciones mediante lenguajes propietarios o a través del estándar XML:DB XUpdate [208]. El consorcio W3C trabaja en la extensión de XQuery para la actualización de documentos XML, y algunas implementaciones tienen su propia extensión a XQuery para realizarlo.

Implementaciones consideradas Siguiendo la pauta de utilizar proyectos libres en los diferentes componentes del sistema, se localizaron las implementaciones de base de datos XML nativa más importantes y utilizadas por la comunidad de código abierto. Éstas son dos: Xindice [54] y eXist [131].

Xindice: Xindice es la base de datos XML nativa del grupo Apache [51], creador de múltiples proyectos relacionados con estándares del consorcio W3C muy cercanos al XML, como el servidor HTTP apache, o los proyectos Xerces y Xalan de procesamien- to de documentos XML. Xindice utiliza Xpath como lenguaje de consultas y XML:DB XUpdate como lenguaje de actualización. El proyecto ofrece un interfaz de programa- ción para aplicaciones Java a través de XML:DB API [40]; el acceso a Xindice desde otros lenguajes de programación se realiza a través del XML-RPC API [204]. El proyec- to se encuentra en continua evolución; a medida que los estándares en el campo de las bases de datos XML maduren, se incluirá soporte para ellos en las sucesivas revisiones. eXist: eXist es una base de datos XML nativa que ofrece procesamiento eficiente de consultas XQuery basado en ´ındices automáticos, extensiones para búsqueda de tex- to completo, soporte para XUpdate y una gran integración con las herramientas de desarrollo XML existentes. La base de datos implementa las últimas caracter´ısticas del estándar XQuery 1.0, con excepción de las relacionadas con el procesamiento de esquemas. El proyecto eXist utiliza una eficiente estructura de ´ındice basada en un esquema numérico de indexación para identificar los nodos XML directamente sobre éste. La base de datos es ligera, completamente implementada en Java y con la posibilidad

de ser implantada en m´ultiples formas, como un proceso servidor, como un servlet o directamente embebido en una aplicaci´on.

Se puede apreciar una considerable diferencia de madurez entre ambos proyectos. Es el proyecto eXist, sin duda, el más eficiente y el que mejor soporte ofrece de los nuevos estándares de acceso a bases de datos XML. Sus caracter´ısticas satisfacen todos los requisitos de almacenamiento y actualización del gestor de anotaciones de la arquitectura propuesta. Además aporta funcionalidad extra, como el interfaz directo con servidores HTTP que permite la programación de aplicaciones WEB en el contexto de la arquitectura.

3.6.2. Sincronizaci´on de anotaciones

La concurrencia de aplicaciones y componentes en el sistema distribuido requiere un con- trol de acceso eficiente a estos metadatos. La mayor parte de las aplicaciones consultan y actualizan metadatos a lo largo de su proceso. La capa de gesti´on de anotaciones es res- ponsable de que los metadatos sean accedidos apropiadamente para evitar incoherencias y corrupci´on de datos.

La centralización del recurso de anotación para las aplicaciones ofrece no sólo problemas, como los mencionados de sincronización, sino un conjunto de ventajas que permiten facilitar la concurrencia de procesos. La concurrencia se permite a dos niveles diferentes:

Nivel de colección: En la terminolog´ıa de bases de datos XML nativas, una colección es un conjunto de documentos XML. Cada documento de la colección está asociado a un contenido multimedia determinado. La concurrencia a nivel de colección permite la ejecución concurrente de tareas de análisis sobre diferentes documentos de la colección sin ninguna limitación, como muestra la figura 3.19. Los procesos concurrentes son completamente independientes lo que imposibilita la existencia de secciones cr´ıticas. Nivel de documento: A nivel de documento la concurrencia es mucho más compleja, como se muestra en la figura 3.20. Cuando dos o más procesos requieren trabajar concurrentemente sobre el mismo documento XML, i.e. sobre los metadatos del mismo contenido, se deben seguir una serie de normas que garanticen la consistencia de los datos. A este nivel, el acceso se puede subdividir en función del tipo de acceso y de la sección de datos a acceder:

• Tipo de acceso: el acceso a los metadatos puede ser de solo lectura o de lectura/escritura. La sincronización según este parámetro se realiza siguiendo el paradigma de los lectores-escritores. Según éste, se permite el acceso a un lector siempre que el documento no esté siendo utilizado o bien sólo lo estén utilizando otros lectores. En el caso de un escritor, sólo se permite su acceso si el recurso no está siendo utilizado por ningún otro lector o escritor.

• Sección a acceder: esta subdivisión tiene especial sentido cuando los procesos concurrentes colaboran para realizar el trabajo de un proceso padre único. En este caso, cada proceso se encarga del análisis de una fracción del contenido y, conse-

In document Arquitectura paralela para el procesamiento y análisis de vídeo digital utilizando anotación MPEG-21. Aplicaciones implantadas (página 132-178)