Descripci´ on detallada - Acceso al contenido

3.5. Acceso al contenido

3.5.1. Descripci´ on detallada

En cualquier aplicación de análisis o procesamiento de contenido multimedia, su funcionalidad más básica es la que permite acceder a cada uno de los elementos de este contenido. La capa de acceso al contenido multimedia cubrir´ıa lo que en un sistema operativo ser´ıa la gestión del sistema de ficheros. La gestión de un sistema de ficheros debe ofrecer a las aplicaciones un interfaz de programación que les permita abrir, leer, procesar y escribir ficheros. Esta capa permite a las aplicaciones abstraerse del tipo de sistema de ficheros en el que se encuentra almacenado (FAT, NTFS, HFS, EXT2, . . . ) y también de su localización f´ısica (NFS, SAMBA, . . . ). Análogamente las aplicaciones que trabajan con contenido multimedia requieren de funcionalidad que les permita acceder a estos contenidos, permitiendo una abstracción de localización f´ısica y de formato.

Aunque la analog´ıa es válida, el concepto de abstracción de formato es diferente en ambas situaciones. Los sistemas de ficheros permiten organizar el contenido de éstos de diferentes maneras dentro del medio f´ısico. Las aplicaciones pueden obviar este nivel f´ısico, ya que se les ofrece una interfaz de programación que lo abstrae en la forma de un fichero contiguo al que pueden acceder secuencial y aleatoriamente. En el caso de los contenidos multimedia, la abstracción debe ser doble: en primer lugar la correspondiente al fichero f´ısico que se acaba de explicar; en segundo, la correspondiente a la codificación propia del formato multimedia. La necesidad de éste segundo nivel de codificación (en este caso, puramente software) viene dada por la complejidad de los datos multimedia. El espacio necesario para almacenar una hora de v´ıdeo y audio en crudo es de más de 125GB (considerando una resolución espacial de 720x576 p´ıxeles y temporal de 29,97 fotogramas por segundo). Los formatos de codificación y multiplexación de elementos multimedia se crearon con la intención de resolver los problemas asociados al almacenamiento y reproducción de este tipo de contenido. El objetivo es por tanto reducir las necesidades de almacenamiento y multiplexar eficientemente en el sistema de ficheros los diferentes streams de datos con los que cuenta una entidad multimedia.

El primer problema, la elevada complejidad espacial, se soluciona utilizando técnicas de compresión de datos. Las técnicas clásicas de compresión de datos pueden ser utilizadas (los datos multimedia son, en esencia, datos) aunque no son una solución suficiente para el problema. Las técnicas más utilizadas hacen uso de la correlación temporal de los fotogramas y de las limitaciones sensoriales humanas (a la hora de percibir ciertas frecuencias de las señales) para eliminarlas de la señal original. De esta manera se reducen drásticamente los requisitos espaciales para el almacenamiento de contenido multimedia a expensas de perdida de calidad de la señal resultante (tanto más perceptible como mayores sean las limitaciones de espacio). La reconstrucción de la señal a la hora de la reproducción se realiza siguiendo el proceso inverso. Es práctica habitual que el algoritmo de comprensión (que llamaremos codificación) vaya acompañado del algoritmo de descompresión (que llamaremos decodificación). Al conjunto formado por estos dos algoritmos se le denominacodec(codificador/decodificador). El número decodecs existentes en la actualidad es considerablemente grande, haciendo prácti- camente imposible la compatibilidad de las aplicaciones con todos ellos. El grupo MPEG ha creado algunos de los más utilizados, como el MPEG-2 que se emplea en la codificación del v´ıdeo en los DVDs. Sin embargo, no existe un estándar mayoritario. Las aplicaciones deben limitarse por tanto a trabajar únicamente con aquellos contenidos que puede decodificar según el conjunto decodecs que soporta.

El problema del multiplexado de los contenidos se deriva del hecho de que los contenidos multimedia constan habitualmente de varios elementos que además deben presentarse sincronizadamente. Volviendo al ejemplo de un DVD, el usuario tiene la opción de seleccionar la pista de audio correspondiente al idioma que prefiera (e incluso una pista adicional de subt´ıtulos). Es decir, en un sólo fichero el DVD almacena al menos una pista de v´ıdeo, varias de audio y otras más de texto. A esta funcionalidad de contenedor, hay que añadir también la necesidad de que los contenidos se presenten sincronizadamente, i.e. cada fotograma del v´ıdeo debe ser presentado en consonancia con la muestra de audio y frase del subt´ıtulo ade- cuado. A los estándares que definen la manera de almacenar los diferentes elementos de una entidad multimedia se les conoce con el nombre de formatos. Los formatos no son normal-

mente estructuras triviales: no es una solución satisfactoria guardar losstreams de manera consecutiva, ya que al estar asociadas la muestras de cada stream se producir´ıan multitud de operaciones seek() dentro del fichero para ir accediendo a los puntos correspondientes de los streams. La forma más habitual de almacenar la información dentro del contenedor es mediante la segmentación de losstreams en fragmentos (a ser posible que contengan un subelemento completo) y encapsulando esa porción en un paquete de datos, con una cabecera que identifica el tipo de datos (audio, v´ıdeo, . . . ), el tiempo de presentación e información adicional necesaria para la decodificación. Al igual que ocurre con los codecs, el número existente de formatos es muy elevado.

La complejidad para acceder a contenido multimedia viene causada principalmente por la inmensa cantidad de combinaciones de formatos y codecs en los que pueden venir encap- sulados. La funcionalidad necesaria para tratar con esta complejidad es la que est´a recogida dentro de lo que se ha denominado, en el contexto de esta arquitectura, capa de acceso al contenido multimedia.

In document Arquitectura paralela para el procesamiento y análisis de vídeo digital utilizando anotación MPEG-21. Aplicaciones implantadas (página 125-127)