3. Técnicas y arquitecturas de sistemas de recomendación multimedia
3.2 Adaptación a distintos escenarios
3.2.3 Arquitectura con recomendación en servidor
Ejemplo: escenario orientado a búsqueda
Por último, se presenta otra posible aplicación a un escenario Web caso no directamente de consumo, s
un inmediato consumo).
En esta arquitectura se presenta un número indefinido de usuarios que interactúan con una plataforma de búsqueda dotada de funcionalidades completas de distribución y visualización de contenidos multimedia.
través de un PC o de un dispositivo personal.
de obtener información del usuario y del contexto y medir con suficiente precisión los consumos que se llevan a cabo. Finalmente, se realizará una comunicación con el servidor para transferir esos datos.
El servidor recogerá los datos de todos los usuarios. Recibirá de cada dispositivo personal la información de consumo y la
continuación, el conversor de consumo a interés actualizará esta base de datos usuarios con el valor de interés inferido.
Por otro lado, cuando se desee obtener una recomendación,
establecidos podrán utilizar directamente la información de la base de datos para ejecutar sus algoritmos de predicción. Sobre estos
elementos con una mayor predicción de interés.
22
facilitaría el acceso a metadatos más complejos o extraídos previamente del contenido, según la caracterización que se desarrolla en el capítulo 5 de esta tesis.
Arquitectura con recomendación en servidor
orientado a búsqueda
Por último, se presenta otra posible aplicación a un escenario Web (Fig.
caso no directamente de consumo, sino de búsqueda de contenidos (con vistas, eso sí, a
En esta arquitectura se presenta un número indefinido de usuarios que interactúan con una plataforma de búsqueda dotada de funcionalidades completas de distribución y n de contenidos multimedia. Los usuarios interactuarán con la plataforma a través de un PC o de un dispositivo personal. Este dispositivo llevará un software capaz de obtener información del usuario y del contexto y medir con suficiente precisión los mos que se llevan a cabo. Finalmente, se realizará una comunicación con el servidor para transferir esos datos.
El servidor recogerá los datos de todos los usuarios. Recibirá de cada dispositivo la información de consumo y la introducirá en una base de datos. A continuación, el conversor de consumo a interés actualizará esta base de datos
con el valor de interés inferido.
Por otro lado, cuando se desee obtener una recomendación, los diversos
utilizar directamente la información de la base de datos para ejecutar sus algoritmos de predicción. Sobre estos datos, se recomendarán
elementos con una mayor predicción de interés.
Fig. 5. Arquitectura orientada a búsqueda
facilitaría el acceso a metadatos más complejos o extraídos previamente del contenido,
Fig. 5), pero en este ino de búsqueda de contenidos (con vistas, eso sí, a
En esta arquitectura se presenta un número indefinido de usuarios que interactúan con una plataforma de búsqueda dotada de funcionalidades completas de distribución y Los usuarios interactuarán con la plataforma a Este dispositivo llevará un software capaz de obtener información del usuario y del contexto y medir con suficiente precisión los mos que se llevan a cabo. Finalmente, se realizará una comunicación con el
El servidor recogerá los datos de todos los usuarios. Recibirá de cada dispositivo introducirá en una base de datos. A continuación, el conversor de consumo a interés actualizará esta base de datos de
los diversos módulos utilizar directamente la información de la base de datos para recomendarán al usuario los
23
En este caso se supone que no está limitada la carga del servidor o servidores, por lo que se pueden implementar todas las técnicas de recomendación posibles, tanto sociales como basadas en contenido, sin imponer restricciones no funcionales. La Fig. 5 recoge los tipos de técnicas más populares recogidas en el estado del arte dentro de la clasificación general de técnicas basadas en contenido (Information Filtering, Case- Based Reasoning, Attribute Prediction), técnicas sociales (Filtrado colaborativo, Estereotipos y demografía, Popularidad, Media) y técnicas de hibridación (Weighted, Switching, Mixed, Feature combination, Cascade, Feature Augmentation, Meta-Level) [13].
La heterogeneidad de los tipos de búsqueda y las posibilidades que da una capacidad computacional distribuida y con bases de datos que puedan utilizar gran cantidad de información, permite que se desarrollen módulos de recomendación de complejidad creciente, obteniendo en las diferentes combinaciones posibles de hibridación una solución que puede ser muy eficiente. Del mismo modo, el resultado de la recomendación puede orientarse hacia el usuario con un carácter general o particular. En la primera opción, en función de la búsqueda y del historial del usuario obtenido con anterioridad, el sistema realiza las recomendaciones que más se ajusten a lo que el usuario pide. En la segunda, de carácter particular, se enfoca la recomendación hacia la similitud entre contenidos partiendo de lo que el usuario ha consumido, es decir, a partir de la selección de contenidos que ha realizado sobre los resultados recomendados. Este método podría ser iterativo e ir redimensionándose en tiempo real.
La amplia infraestructura involucrada en un motor de búsqueda, con una gran cantidad de metadatos asociada a cada uno de los objetos multimedia indexados, permite la utilización de algoritmos de recomendación muy variados.
Siguiendo la definición de metadatos mostrada en la Fig. 2, se explica en [10] una estructura de metadatos diferenciada en tres capas:
1) La capa de metadatos técnicos es útil para funcionalidades de búsqueda y para realizar filtrados específicos o aportar información complementaria al usuario, pero en esta tesis no se consideran para generar directamente recomendaciones a partir de ellos, ya que no se trata de atributos intrínsecos al objeto audiovisual, sino de características de una determinada réplica. Ejemplos de metadatos técnicos puede ser el formato de un vídeo, su códec de vídeo o audio, la resolución, tasa binaria, etc.
2) La capa de metadatos descriptivos engloba tanto metadatos estructurales como semánticos. Ambos tipos pueden resultar muy útiles para la recomendación. Sin embargo, en esta tesis sólo se hará uso de metadatos estructurales, dado que no son específicos de determinados dominios de conocimiento y son comunes a un determinado tipo de media. Ejemplos de metadatos estructurales pueden ser los que hacen referencia a la luminosidad o a la textura de una imagen, mientras que los metadatos semánticos articulan conceptos relacionados con el contenido de esa imagen (mediante el reconocimiento de objetos y el posterior uso de ontologías para relacionar conceptos, por ejemplo).
3) La capa de metadatos funcionales es aquella construida a partir de los metadatos que los distintos procesos funcionales (búsqueda, recomendación, generación automática, etc.) crean dentro de sus procesos y a partir de los metadatos de
24
capas inferiores para llevar a cabo sus operaciones. El almacenamiento de estos metadatos permite enriquecer la información relativa a un objeto multimedia, con la consiguiente posibilidad de mejorar el rendimiento e incorporar facilidades a otros procesos no directamente relacionados. Algunos ejemplos pueden ser los metadatos sintácticos (como podría ser la duración media de plano de un vídeo), los metadatos narrativos (como la densidad de escenas), o los metadatos de afinidad (como la media de valoraciones de los usuarios sobre el objeto multimedia). La definición de metadatos útiles para la recomendación se desarrolla ampliamente en el capítulo 5 de la tesis.
La heterogeneidad de los procesos involucrados en la indexación y búsqueda de contenidos multimedia abre una gran cantidad de posibilidades a la recomendación multimedia, cuyo tratamiento dentro de esta tesis han sido acotados a las funcionalidades ya descritas. Por lo tanto, en este escenario se pueden emplear todos los mecanismos de personalización presentes en el estado del arte, y todos aquellos que vayan más allá en la comprensión de la percepción y las preferencias del ser humano. Los tres escenarios expuestos presentan posibles aplicaciones, con diferente nivel restrictivo, a los avances en el estado del arte que se presentan en esta tesis. Por lo tanto, los siguientes capítulos de la tesis explican, en primer lugar, la manera de obtener preferencias a partir del consumo audiovisual de los usuarios (capítulo 4), a continuación, la extracción de descriptores relevantes de los contenidos (capítulo 5) y, por último, el desarrollo de algoritmos que generen recomendaciones a partir de esos ratings y descriptores (capítulo 6).
A modo de conclusión, la Tabla 2 sintetiza la posibilidad de aplicar algunas de las técnicas descritas a los tres tipos de arquitectura propuestos.
Técnica Recomendador en
cliente
Recomendador en cliente o con baja carga en servidor
Recomendador en servidor
Inferencia del interés del usuario a partir del consumo audiovisual Recomendación basada en contenido Recomendación basada en estereotipos Recomendación basada en filtrado colaborativo
Tabla 2. Aplicabilidad de técnicas a los distintos tipos de arquitectura
Es necesario recordar que, dado que la tesis se centra en recomendación de contenido audiovisual y las técnicas desarrolladas analizan sus características, los escenarios que se han planteados son escenarios controlados, en los que se tiene constancia de qué elementos existen en el corpus para ser recomendados, debido a un procesado previo que puede ser manual o automático. Por esta razón, la recomendación basada en
25
contenido se puede aplicar en todos los casos; por el contrario, ante un escenario completamente abierto en el que no existiera ni se pudiera extraer ninguna información de los contenidos, ya que estos podrían ser de cualquier naturaleza (no necesariamente audiovisual) no se podría recurrir a las técnicas basadas en contenido.
La naturaleza de un contenido, de cara a la recomendación, viene dada por su descripción disponible antes que por su esencia; es decir, si la única información disponible de un vídeo es un identificador, ligado con valoraciones de distintos usuarios sobre él, carece de importancia de cara a la recomendación el hecho de que lo que queremos recomendar sea un vídeo y tenga, por lo tanto, naturaleza audiovisual. Si se tratara, por ejemplo, de un libro, ese mismo tipo de información podría estar disponible y la técnica de recomendación (siempre ligada al tipo de información disponible) podría ser la misma. Esta es la razón por la que, en una tesis focalizada en la recomendación de contenidos audiovisuales, es necesario considerar escenarios controlados, en los que la ingesta de contenidos esté asociada a procesos de anotación predefinidos.
27