• No se han encontrado resultados

3.3 Aproximaci´on a la inclusi´on de contexto dentro de los sistemas de recomendaciones

3.3.1 Prefiltrado y Postfiltrado

Como ya se ha mencionado, el prefiltrado y postfiltrado tienen lugar antes y despu´es de hacer la predicci´on utilizando un RS cl´asico. Dado a que se trata de mecanismos similares, las herramientas utilizadas para realizar el proceso de reducci´on de dimensionalidad pueden usarse tambi´en en ambos casos. A continuaci´on se listan cuatro opciones para dar paso a la reducci´on que fueron estudiadas en el desarrollo de este proyecto.

1. Sistema de recomendaciones basado en contenido:

Los SR basados en contenido a diferencia de los filtrados colaborativos no se enfocan en las interacciones pasadas de los usuarios con el sistema sino en la informaci´on que conforma cada

Cap´ıtulo 3. Contexto en entornos de publicidad ubicua y su implantaci´on en Sistemas de Recomendaciones Data U x I x C x R Contextualized Data U x I x R C 2D Recommender U x I R Contextual Recommendations i1, i2, ... , in U Contextual Pre-filtering Data U x I x C x R Recommendations i1, i2, ... , i3 C 2D Recommender U x I R Contextual Recommendations i1, i2, ... , in U Contextual Post-filtering Data U x I x C x R C MD Recommender U x I x C R Contextual Recommendations i1, i2, ... , in U Contextual Modeling

Figura 3.5: Paradigma para la inclusi´on de informaci´on contextual en SR cl´asicosFuente: Adaptaci´on de [72]

uno de los ´ıtems y usuarios del mismo. De esta manera, mide la cercan´ıa entre cada uno de estos elementos a partir de la cercan´ıa entre sus caracter´ısticas. Si se considera el contexto como una caracter´ıstica que puede ser intr´ınseca de los ´ıtems o de los usuarios, es viable considerar que un SR basado en contenido podr´ıa aplicarse como filtrado inicial para determinar una vecindad de ´ıtems para los cuales el contexto sea similar a aquel en el momento justo en el que se pre- tende hacer la recomendaci´on. Sobra aclarar que dicha vecindad ser´ıa el dataset reducido que se utilizar´ıa como entrada al mecanismo de recomendaciones utilizado en el caso de un pre- filtrado y ser´ıa el paso final de la recomendaci´on en el caso del postfiltrado. [74] presenta un trabajo donde es utilizado este mecanismo como reducci´on de dimensionalidad combinado con recomendaciones basadas en conocimiento y procesos anal´ıticos en l´ınea (por sus iniciales en ingl´es: OLAP).

2. Razonamiento basado en casos CBR:

El razonamiento basado en casos es una aproximaci´on utilizada en diferentes tareas de clasificaci´on y resoluci´on de problemas. Con el objetivo de resolver problemas nuevos este tipo de sistemas utiliza los problemas pasados que han sido resueltos y almacenados en una base de casos. Cada uno de dichos casos cuenta con una parte que describe el problema y otra que describe la soluci´on. El proceso de resoluci´on cuenta con cuatro pasos: el primero es la recuperaci´on, equivalente a buscar todos los problemas similares a aquel al que se le desea dar soluci´on. Utilizando para ello la descripci´on del problema almacenada junto con cada caso. Si alguno de los problemas hallados es el mismo o similar se pasa al siguiente paso; la reutilizaci´on, en el que dicho caso es duplicado temporalmente para determinar si resuelve el

3.3. Aproximaci´on a la inclusi´on de contexto dentro de los sistemas de recomendaciones

nuevo problema y envuelve consigo una fase de adaptaci´on; El tercer paso es la revisi´on, donde se eval´ua si la soluci´on propuesta eventualmente resuelve el problema planteado, para ello se pueden utilizar diferentes aproximaciones como por ejemplo el juicio de expertos; finalmente se pasa a la retenci´on, donde se determina si el caso es algo nuevo y debe almacenarse o es completamente igual a otro existente y debe desecharse. [75] presenta un trabajo donde se ha utilizado esta aproximaci´on como m´etodo de reducci´on de dimensionalidad. Por otra parte, el proyecto MyCBR [86] ha desarrollado una implementaci´on opensource de algunas t´ecnicas de Razonamiento basado en casos y se encuentra disponible para su descarga.

3. Arboles de decisi´on aleatorios:´

En [73] se presenta una aproximaci´on para seleccionar la dimensi´on del contexto en la cual aplicar un filtrado colaborativo cl´asico a partir de un algoritmo de ´arboles de decisi´on aleatorios. El cual, es muy utilizado para crear ´arboles de decisi´on m´ultiples de forma aleatoria. La idea es particionar los ratings del dataset original y agruparlos en ratings con contextos similares. Cuando se construye cada ´arbol de decisi´on, en cada nivel se selecciona aleatoriamente una de las variables contextuales para particionar el data set. La partici´on se hace acorde a la variable seleccionada, si por ejemplo se selecciona el d´ıa, entonces se hace una partici´on para cada una de las opciones (lunes, martes, etc.). Cuando la partici´on se ha completado, se elimina la variable seleccionada de las variables posibles en el contexto con el objetivo de procesar una variable a la vez. A continuaci´on, se toma cada una de las particiones y se repite el proceso hasta contar con un ´arbol que se ajuste a las necesidades. Otro trabajo que utiliza la misma aproximaci´on se presenta en [87].

4. ´ıtems virtuales:

En [16] se presenta una aproximaci´on para la reducci´on de dimensionalidad un poco diferente. En ella cada variable contextual es tratada como un nuevo ´ıtem (´ıtems virtuales) en el dataset. Es decir que agrega una nueva fila y una nueva columna a la matriz de similitud pa- ra cada variable contextual y calcula la similitud correspondiente con los otros ´ıtems del sistema.

Como se expuso con anterioridad, la decisi´on de utilizar un aproximaci´on prefiltrado-postfiltrado o una basada en modelo puede depender en gran medida del dataset utilizado. Durante el desarrollo de este proyecto se tuvo una gran limitaci´on referente a este tema y de hecho la secci´on 3.5 est´a enfocada a la construcci´on de un dataset con la informaci´on de contexto necesaria para los requerimientos propios del proyecto, pues no fue posible encontrar uno existente que se adaptara a nuestras necesidades. Ahora bien, trabajos como [78] han hecho una comparaci´on entre pre y post-filtrado buscando determinar cual de los dos presenta mejores resultados y en qu´e circuns- tancias. Su conclusi´on no logra ser contundente y pone como variable importante el tama˜no del dataset. Por su parte [88] incluye la aproximaci´on basada en modelo en un experimento similar y demostr´o, al menos emp´ıricamente, que esta aproximaci´on genera, en la mayor´ıa de los casos, mejores resultados cuando el RS es evaluado combinando las m´etricas de diversidad y precisi´on. Adem´as su experimento tambi´en mostr´o que en muchos casos utilizar un enfoque sin contexto puede ser m´as efectivo que utilizar un pre o post-filtrado. Por otra parte, algunos experimentos simples que se ejecutaron utilizando ´arboles de decisi´on y un dataset que luego fue utilizado como

Cap´ıtulo 3. Contexto en entornos de publicidad ubicua y su implantaci´on en Sistemas de Recomendaciones

base para la creaci´on de la fuente final de datos para pruebas, mostraron que no se obten´ıan resul- tados relevantes al incluir el contexto, bajo esta aproximaci´on, en la precisi´on de las recomendaciones.

Por los motivos ya planteados se tom´o la decisi´on de enfocarse en una inclusi´on de contexto bajo una aproximaci´on basada en modelo.