2.6 Conclusiones del cap´ıtulo
3.1.3 Elecci´ on del mecanismo de recomendaci´ on
Despu´es del an´alisis de los beneficios y desventajas de cada uno, se realiz´o un peque˜no trabajo de desarrollo, para evaluar la viabilidad del sistema escogido y as´ı tener clar- idad que el sistema escogido tendr´a un rendimiento adecuado a la hora de integrarlo con la aplicaci´on m´ovil y los dispositivos Beacons.
3.1.3.1 Estudios previos
Debido a la necesidad de implementar un sistema de recomendaci´on que trabaje en conjunto con una aplicaci´on m´ovil, se escoge como primera opci´on los algoritmos disponibles en Apache Mahout (proyecto de acceso gratuito creado por “Apache Software Foundation”)[50]. Estos algoritmos generan recomendaciones basados en la semejanza entre usuarios, calculando mediante de coeficientes de similitud (Tani- moto (”TanimotoCoefficientSimilarity [51]”), Pearson (”PearsonCorrelationSimilar- ity [52]”), entre otros) usuarios semejantes basados en los productos preferidos por cada uno.
El sistema de recomendaciones basado en mahout (disponible en anexos, en la car- peta ”Primera version sistema recomendacion”) solo necesita el id de usuario y los id de los productos de su preferencia, para generar una recomendaci´on. Al caracterizar los art´ıculos se evidencio que el sistema de recomendaci´on actual no era suficiente, ya que la informaci´on nutricional no era tenida en cuenta; como soluci´on a esto, se dise˜n´o un sistema de recomendaci´on el cual no esta basado en la similitud entre
3.1. An´alisis de los enfoques de recomendaciones 40
usuarios sino en los productos, este sistema se explica a profundidad en la Secci´on 3.3.1 ”Estructura de la recomendaci´on por preferencias” de este cap´ıtulo.
3.1.3.2 Elecci´on final
Despu´es de la exploraci´on de las m´ultiples posibilidades de recomendaci´on, se es- tablece que el mecanismo que puede traer mayores ventajas al estudio es el sistemas de recomendaci´on basado en contenido, esto debido a m´ultiples factores:
• Entre mayor sea la cantidad de productos y mejor sea la descripci´on que se haga a cada uno de ellos, se tendr´an recomendaciones m´as acertadas, lo cual es muy viable a la hora de la realizaci´on, aunque requiere un gran esfuerzo en la tratamiento de datos, existe la disponibilidad de varios medios para conseguir una base de datos abundante.
• Considerando la caracterizaci´on de los datasets abordados en la Secci´on “3.2 Creaci´on de Datasets”, se puede inferir que por medio de la comparaci´on del tama˜no obtenido en cada uno de ellos (ochocientos siete productos clasificados y doscientos quince usuarios), la recomendaci´on basada en contenido brinda mayores beneficios.
• Hay estudios que brindan soporte al sistemas de recomendaci´on basado en contenido a la hora de recomendar nuevos ´ıtems, debido a m´ultiples factores. A continuaci´on se presenta una tabla que que brinda un buen aporte:
En la tabla 3.2 se realiza una comparaci´on entre los sistemas, para esto se dispone de una nomenclatura presentada en la tabla 3.1:
3.1. An´alisis de los enfoques de recomendaciones 41
Nombre Nomenclatura
Desaf´ıos pendientes DPD
Basado en contenido BCT
Filtrado colaborativo FCT
Consciente del contexto CCT
Demograficos DMF
Basado en conocimiento BCM
Consciente de la confianza CCF
Tabla 3.1: Tabla nomenclatura. Basado de [53]
DPD BCT FCT CCT DMF BCM CCF OBSERVACIONES
Nuevo item X x X x X x El filtrado colaborativo y la confianza consciente sobresalen en aplicaciones donde el conjunto de elementos es estable
o semiestable. Nuevo
usuario
x x x x X x El nuevo usuario basado en contenido es m´as problem´atico que el filtrado
colaborativo. Grandes
datos hist´oricos
x x X X X X El filtrado colaborativo es m´as exigente para grandes datos hist´oricos.
Limitaci´on de contenido
x X X X X X Basado en contenido es bueno para las recomendaciones basadas en texto, pero
ineficiente para elementos no estructurados como pel´ıculas y m´usica.
3.1. An´alisis de los enfoques de recomendaciones 42
DPD BCT FCT CCT DMF BCM CCF OBSERVACIONES
Limitaci´on de contenido
x X X X X X Basado en contenido es bueno para las recomendaciones basadas en texto, pero
ineficiente para elementos no estructurados como pel´ıculas y m´usica. Escasez X x X X X x El filtrado colaborativo es naturalmente escaso, pero existen algunos algoritmos
como la factorizaci´on de matrices que alivian el problema. Algunos de los algoritmos basados en contenido tambi´en
tienen este problema, como IF-TDF. Dependencia
del usuario
X x X x X x Las t´ecnicas h´ıbridas que utilizan informaci´on de contenido pueden superar los problemas de bootstrapping (arranque
en frio). Adquisici´on
de datos
X X x x X X La adquisici´on de datos es la primera cuesti´on para todas las t´ecnicas, pero
para las t´ecnicas de contexto y demogr´aficas es m´as dif´ıcil.
Adquisici´on de conocimiento
X X X X x X Los m´etodos basados en la restricci´on tienen m´as dificultades para adquirir
conocimientos. X: es problem´atica,X: no es problem´atico
Tabla 3.2: Estudio sistemas de recomendaci´on. Basado de [53]
Basado en el estudio planteando en esta tabla 3.2, los tipos de datos “nuevo ´ıtem” y “nuevo usuario” tienen un comportamiento problem´atico al trabajar con un fil- trado colaborativo, es decir, si se habla de un nuevo ´ıtem, este producto no ser´a recomendado de forma r´apida, ya que ning´un usuario lo contendr´ıa en su lista, por otra parte, un nuevo usuario no aportar´ıa mucha informaci´on inicial dificultando el proceso de recomendaci´on. El enfoque basado en contenido, aunque tambi´en pre- senta problemas en la integraci´on de nuevo usuario, tiene una mayor adaptabilidad a nuevos productos.
3.1. An´alisis de los enfoques de recomendaciones 43