• No se han encontrado resultados

Sistema recomendador híbrido basado en modelos probabilísticos

N/A
N/A
Protected

Academic year: 2020

Share "Sistema recomendador híbrido basado en modelos probabilísticos"

Copied!
127
0
0

Texto completo

(1)Universidad Politécnica de Madrid Escuela Técnica Superior de Ingenierı́a de Sistemas Informáticos Doctorado en Ciencias y Tecnologı́as de la Computación para Smart Cities. Tesis Doctoral Sistema recomendador hı́brido basado en modelos probabilı́sticos. Autor Priscila Marisela Valdiviezo Diaz. Directores Dr. Jesús Bobadilla. Dr. Antonio Hernando. Septiembre 2019.

(2) 2. TRIBUNAL Tribunal nombrado por el Sr. Rector Magnı́fico de la Universidad Politécnica de Madrid, el dı́a de de 2019.. Presidente: D. Fernando Ortega Requena (Universidad Politécnica de Madrid) Vocales:. D. Miguel Ángel Patricio Guisado (Universidad Carlos III de Madrid) D. Francisco Javier Garcı́a Algarra (U-tad: Centro Universitario de Tecnologı́a y Arte Digital) D. Alejandro Martin (Universidad Autónoma de Madrid). Secretario: D. Abraham Gutierrez (Universidad Politecnica de Madrid) Suplente: Suplente:. D. Antonio González Pardo (Universidad Autónoma de Madrid) D. Luis Usero Aragonés (Universidad de Alcalá de Henares). de Realizado el acto de lectura y defensa de la Tesis el dı́a de 2019 en la Escuela Técnica Superior de Ingenierı́a de Sistema Informáticos de la Universidad Politécnica de Madrid. Calificación:. EL PRESIDENTE. LOS VOCALES. EL SECRETARIO.

(3) Resumen Los sistemas de recomendación están diseñados para proporcionar recomendaciones a los usuarios por medio de un análisis de preferencias pasadas. Para lograr esto, los sistemas de recomendación utilizan técnicas de filtrado de información, las más conocidas son: filtrado colaborativo, filtrado basado en contenido, filtrado demográfico e hı́brido. El filtrado colaborativo calcula las recomendaciones en función de las votaciones que la comunidad de usuarios ha realizado sobre un conjunto de ı́tems. Hay dos enfoques de filtrado colaborativo: basados en la memoria, que generalmente proporciona recomendaciones inexactas pero explicables; y basado en modelos, cuyas recomendaciones son más precisas pero difı́ciles de entender. En la actualidad, se ha incrementado el desarrollo de sofisticados algoritmos de aprendizaje automático que se pueden usar en el contexto de los sistemas de recomendación. En esta tesis doctoral primero se presenta una revisión comprensiva sobre los enfoques basados en modelos para sistemas de recomendación de filtrado colaborativo, resaltando las ventajas y desventajas identificadas entorno a estos modelos. Luego, en base a las ventajas que ofrecen los enfoques basados en modelos probabilı́sticos, se propone un modelo bayesiano que combina el espacio de usuarios e ı́tems, y que proporciona tan buenos resultados como los modelos de factorización matricial, pero que a diferencia de éstos, genera una representación fácilmente interpretable, por tanto las recomendaciones son fáciles de explicar. El modelo propuesto predice los nuevos votos de un usuario en función de los votos existentes en el conjunto de datos y éste permite fácilmente calcular una medida de confiabilidad relacionada con las predicciones. La confiabilidad se puede definir como la certeza que tiene el sistema de recomendación en el cálculo de las predicciones. Se realizaron algunos experimentos con el objeto de comparar el enfoque propuesto con varios modelos de lı́nea base, los cuales fueron seleccionados tanto de 3.

(4) Resumen. 4. la familia de enfoques basados en factorización matricial y de aquellos que utilizan un enfoque probabilı́stico para explicar sus resultados. Para los experimentos, se procesaron cuatro conjuntos de datos públicos de filtrado colaborativo, éstos fueron: MovieLens, FilmTrust, Yahoo, BookCrossing. El modelo fue evaluado considerando algunas medidas de calidad estándar: Error medio absoluto (MAE) para evaluar la calidad de las predicciones; Precisión y Recall para evaluar la calidad de las recomendaciones y la ganancia acumulada descontada normalizada (nDCG) para medir la calidad de las listas de recomendaciones. Los resultados de los experimentos presentaron un mejor rendimiento con el enfoque propuesto utilizando nDCG en comparación con los métodos de lı́nea base, también se presenta mejoras significativas en la precisión de la predicción en dos de los conjuntos de datos probados y se obtiene buenos resultados en la calidad de las recomendaciones, especialmente cuando el número de recomendaciones es bajo..

(5) Abstract Recommender systems are designed to provide recommendations to users by means of an analysis of past preferences. To achieve this, recommender systems use information filtering techniques, these can be: Collaborative Filtering, Content-based Filtering, Demographic Filtering, and Hybrid. Collaborative Filtering computes the recommendations based on the ratings that the community of users have made over a set of items. There are two collaborative filtering approaches: memory-based, which usually provides inaccurate but explainable recommendations; and model-based, whose recommendations are more precise but hard to understand. Today’s has increased the development of sophisticated machine learning algorithms which can be used in recommendation systems context. In this doctoral thesis, firts is presented a comprehensive review the literature on modelbased approaches for recommender systems of collaborative filtering, highlighting strengths and weaknesses they provide. Then, based on the advantages offered by the approaches based on probabilistic models, a Bayesian model is proposed, that combines the space of users and items, and that provides as good results as the matrix factorization models, but unlike these, generates an easily interpretable representation, therefore, the recommendations are easy to explain. The proposed modelit predicts new ratings of a user based on the existing ratings in the dataset, and it allows to easily compute a measure of reliability associate to the predictions. Reliability can be defined as the certainty of the recommendation system in the calculation of predictions. Some experiments were performed in order to compare the proposed approach with several baseline models, which were selected both from the family of approaches based on matrix factorization and from those that use a probabilistic approach to explain their results. The experiments were carried out using four public datasets of collaborative filtering, these were: MovieLens, FilmTrust, Yahoo, 5.

(6) Abstract. 6. BookCrossing. The model was evaluated considering some standard quality measures: Mean Absolute Error (MAE) to evaluate the quality of the predictions; Precision and Recall to evaluate the quality of the recommendations and the Normalized Discounted Cumulative Gain (nDCG) to measure the quality of recommendation lists. The results of the experiments achieved a best performance in the quality measure nDCG compared to baseline methods, there are also significant improvements in the prediction accuracy in two of the tested datasets and good results are obtained in the quality of recommendations, especially when the number of recommendations is low..

(7) Agradecimientos En primer lugar quiero agradecer a Dios por la sabidurı́a, fortaleza y protección que me dio durante este tiempo de estudios y estancias fuera del paı́s, por siempre estar conmigo en los momentos más difı́ciles que pasé en este proceso de formación. Gracias a Él estoy cumpliendo esta meta propuesta. De igual manera, agradezco el apoyo de todas aquellas personas que de alguna forma me han ayudado en la realización de este trabajo. A mis directores de tesis y en especial agradezco al Dr. Fernando Ortega por su excelente asesorı́a, paciencia y amabilidad durante el desarrollo de esta tesis, quién además me brindó el apoyo necesario para que este trabajo llegara a buen término. Mi más sincero agradecimiento a la Universidad Técnica Particular de Loja y a la Fundación Carolina por el apoyo brindado para realizar mi formación doctoral. Finalmente, agradezco a mi madre y hermano por su confianza y comprensión, por sus ánimos en los momentos más difı́ciles y por siempre estar pendiente de mi desarrollo profesional y personal.. 7.

(8) Listado de Publicaciones Varios artı́culos resultantes de este trabajo de investigación han sido publicados en revistas y conferencias en el área de sistemas de recomendación.. Artı́culo: Valdiviezo-Diaz, P., Ortega, F., Cobos, E., Lara-Cabrera, R. (2019). A Collaborative Filtering approach based on Naive Bayes Classifier. IEEE Access, 7, 108581-108592, doi: 10.1109/ACCESS.2019.2933048. Factor de impacto: 4.098 Q1. Indexación: JCR. Artı́culo: Ortega, F., Rojo, D., Valdiviezo-Diaz, P., & Raya, L. (2018). Hybrid Collaborative Filtering based on Users Rating Behavior. IEEE Access, 6, 69582–69591, doi: 10.1109/ACCESS.2018.2881074. Factor de impacto: 4.098 Q1. Indexación: JCR. Artı́culo: Aguilar, J., Valdiviezo-Diaz, P., & Riofrio, G. (2016). A General Framework for Intelligent Recommender Systems. Applied Computing and Informatics, 13(2), 147–160, doi: 10.1016/j.aci.2016.08.002 Factor de impacto: 0.44 Q2. Indexación: SJR. Publicaciones en Congresos Artı́culo: Valdiviezo-Diaz, P., & Bobadilla, J. (2018). A hybrid approach of recommendation via extended matrix based on collaborative filtering with demographics information. In International Conference on Technology Trends, CITT 2018 (pp. 384–398). vol 895, Springer, Cham. Artı́culo: Aguilar, J., Valdiviezo-Diaz, P., & Riofrio, G. (2018). A Recom8.

(9) Listado de Publicaciones. 9. mender System Based on Cognitive Map for Smart Classrooms. In Proceedings of the International Conference on Information Technology Systems (ICITS 2018). Advances in Intelligent Systems and Computing, (pp. 427–442). Springer, Cham. Artı́culo: Valdiviezo, P., & Hernando, A. (2016). A Comprehensive View of Recommendation Methods based on Probabilistic Techniques. In A. Rocha, L. Reis, M. Cota, R. Goncalves, O. Suarez (Eds.), Iberian Conference on Information Systems and Technologies, CISTI (pp. 604–609). Gran Canaria, Spain: IEEE Computer Society..

(10) Índice general Resumen. 3. Abstract. 5. Agradecimientos. 7. Listado de Publicaciones. 8. 1. Introducción. 16. 1.1. Técnicas de recomendación . . . . . . . . . . . . . . . . . . . . . .. 17. 1.1.1. Filtrado colaborativo . . . . . . . . . . . . . . . . . . . . .. 17. 1.1.2. Filtrado basado en contenido . . . . . . . . . . . . . . . .. 19. 1.1.3. Filtrado demográfico . . . . . . . . . . . . . . . . . . . . .. 21. 1.1.4. Filtrado hı́brido . . . . . . . . . . . . . . . . . . . . . . . .. 21. 1.2. Enfoques de filtrado colaborativo basado en modelos . . . . . . .. 23. 1.2.1. Factorización matricial . . . . . . . . . . . . . . . . . . . .. 23. 1.2.2. Modelos probabilı́sticos . . . . . . . . . . . . . . . . . . . .. 23. 1.3. Motivación, Objetivos e Hipótesis . . . . . . . . . . . . . . . . . .. 24. 1.4. Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . .. 27. 2. Estado del arte sobre enfoques basados en modelos. 28. 2.1. Visión general . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 28. 2.2. Modelos basados en factorización matricial . . . . . . . . . . . . .. 33. 2.2.1. Factorización matricial con bias . . . . . . . . . . . . . . .. 33. 2.2.2. Factorización matricial no negativa . . . . . . . . . . . . .. 34. 2.2.3. Limitaciones de los modelos de factorización matricial . . .. 36. 2.3. Modelos probabilı́sticos . . . . . . . . . . . . . . . . . . . . . . . .. 36. 2.3.1. Método Naı̈ve Bayes mejorado . . . . . . . . . . . . . . . .. 37 10.

(11) Índice general. 11. 2.3.2. Modelo Gaussian-Gamma . . . . . . . . . . . . . . . . . .. 39. 2.3.3. Modelo de regresión Naı̈ve Bayes para filtrado colaborativo. 40. 2.4. Modelos probabilı́sticos con factorización matricial . . . . . . . . .. 42. 2.4.1. Factorización matricial probabilı́stica . . . . . . . . . . . .. 43. 2.4.2. Modelo bayesiano de factorización matricial no negativa . .. 44. 2.4.3. Modelo Gaussian-Gamma de filtrado colaborativo: Bayesiano jerárquico . . . . . . . . . . . . . . . . . . . . . . . .. 47. 2.4.4. Otros modelos probabilı́sticos basados en factorización matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 48. 2.5. Modelos basados en reglas . . . . . . . . . . . . . . . . . . . . . .. 51. 2.5.1. Basados en árboles . . . . . . . . . . . . . . . . . . . . . .. 52. 2.5.2. Basado en reglas de asociación . . . . . . . . . . . . . . . .. 53. 2.6. Ventajas y desventajas de los enfoques basados en modelos. . . .. 54. 2.7. Sumario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 58. 3. Método propuesto. 60. 3.1. Diseño del método . . . . . . . . . . . . . . . . . . . . . . . . . .. 60. 3.1.1. Componentes del método propuesto . . . . . . . . . . . . .. 61. 3.1.2. Clasificador Naive Bayes . . . . . . . . . . . . . . . . . . .. 61. 3.2. Formulación del método propuesto . . . . . . . . . . . . . . . . .. 63. 3.2.1. Enfoque basado en el usuario . . . . . . . . . . . . . . . .. 64. 3.2.2. Enfoque basado en ı́tems . . . . . . . . . . . . . . . . . . .. 65. 3.2.3. Enfoque hı́brido . . . . . . . . . . . . . . . . . . . . . . . .. 66. 3.3. Cálculo de la predicción . . . . . . . . . . . . . . . . . . . . . . .. 66. 3.4. Cálculo de confiabilidad . . . . . . . . . . . . . . . . . . . . . . .. 67. 3.5. Ejemplo de ejecución . . . . . . . . . . . . . . . . . . . . . . . . .. 68. 3.6. Algoritmo NBCF . . . . . . . . . . . . . . . . . . . . . . . . . . .. 72. 4. Experimentos y resultados. 74. 4.1. Configuración del experimento . . . . . . . . . . . . . . . . . . . .. 74. 4.2. Medidas de calidad . . . . . . . . . . . . . . . . . . . . . . . . . .. 78. 4.2.1. Calidad de las predicciones . . . . . . . . . . . . . . . . . .. 78. 4.2.2. Calidad de las recomendaciones . . . . . . . . . . . . . . .. 80. 4.2.3. Calidad de las listas de recomendaciones . . . . . . . . . .. 83. 4.2.4. Medidas de calidad seleccionadas . . . . . . . . . . . . . .. 85. 4.3. Desempeño del clasificador . . . . . . . . . . . . . . . . . . . . . .. 86.

(12) Índice general. 4.4. 4.5. 4.6. 4.7.. 4.3.1. MovieLens . . . . . . . . . . . . . . 4.3.2. FilmTrust . . . . . . . . . . . . . . 4.3.3. Yahoo . . . . . . . . . . . . . . . . 4.3.4. BookCrossing . . . . . . . . . . . . Desempeño del sistema de recomendación . Medida de confiabilidad . . . . . . . . . . Análisis de complejidad computacional . . Discusión . . . . . . . . . . . . . . . . . .. 12. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . 86 . 87 . 88 . 90 . 91 . 100 . 101 . 102. 5. Explicación de recomendaciones 104 5.1. Modelos de recomendación explicables . . . . . . . . . . . . . . . 105 5.2. Explicación de recomendaciones con el método propuesto . . . . . 108 6. Conclusiones y trabajo futuro. 113. Referencias. 116.

(13) Índice de figuras 1.1. Esquema de los elementos que intervienen en un RS. . . . . . . .. 22. 1.2. Fundamentos de la propuesta . . . . . . . . . . . . . . . . . . . .. 25. 2.1. Clasificación de los enfoques basados en modelos. . . . . . . . . .. 30. 4.1. (a) matriz de confusión; (b) matriz de confusión normalizada; (c) matriz de confusión discretizando el voto (NoGusta = 1, 2, 3, Gusta = 4, 5); (d) Matriz de confusión normalizada discretizando el voto. Conjunto de datos de MovieLens-1M . . . . . . . . . . . . . . . .. 87. 4.2. (a) matriz de confusión; (b) matriz de confusión normalizada; (c) matriz de confusión discretizando el voto (NoGusta = 1, 2, 3, Gusta = 4, 5); (d) Matriz de confusión normalizada discretizando el voto. Conjunto de datos FilmTrust . . . . . . . . . . . . . . . . . . . .. 88. 4.3. (a) matriz de confusión; (b) matriz de confusión normalizada; (c) matriz de confusión discretizando el voto (NoGusta = 1, 2, 3, Gusta = 4, 5); (d) Matriz de confusión normalizada discretizando el voto. Conjunto de datos Yahoo . . . . . . . . . . . . . . . . . . . . . . .. 89. 4.4. (a) matriz de confusión; (b) matriz de confusión normalizada; (c) matriz de confusión discretizando el voto (NoGusta = 1, 2, 3, Gusta = 4, 5); (d) Matriz de confusión normalizada discretizando el voto. Conjunto de datos BookCrossing . . . . . . . . . . . . . . . . . .. 90. 4.5. Ganancia acumulada descontada normalizada (nDCG) para el conjunto de datos MovieLens . . . . . . . . . . . . . . . . . . . . . .. 92. 4.6. Precisión y Recall de cada método de recomendación para el conjunto de datos MovieLens . . . . . . . . . . . . . . . . . . . . . .. 93. 4.7. Ganancia acumulada descontada normalizada (nDCG) para el conjunto de datos FilmTrust . . . . . . . . . . . . . . . . . . . . . . .. 94 13.

(14) Índice de figuras. 14. 4.8. Precisión y Recall de cada método de recomendación para el conjunto de datos FilmTrust . . . . . . . . . . . . . . . . . . . . . . . 95 4.9. Ganancia acumulada descontada normalizada (nDCG) para el conjunto de datos Yahoo . . . . . . . . . . . . . . . . . . . . . . . . . 96 4.10. Precisión y Recall de cada método de recomendación para el conjunto de datos Yahoo . . . . . . . . . . . . . . . . . . . . . . . . . 97 4.11. Ganancia acumulada descontada normalizada (nDCG) para el conjunto de datos BookCrossing . . . . . . . . . . . . . . . . . . . . . 98 4.12. Precisión y Recall de cada método de recomendación para el conjunto de datos BookCrossing . . . . . . . . . . . . . . . . . . . . . 99 4.13. Confiabilidad de la recomendación en (a) conjunto de datos MovieLens, (b) conjunto de datos FilmTrust, (c) conjunto de datos Yahoo y (d) conjunto de datos BookCroosing. . . . . . . . . . . . 101 5.1. 5.2. 5.3. 5.4.. Matriz de votos . . . . . . . . . . . . . . . . . . . . . . . . . Naı̈ve Bayes based Collaborative Filtering - NBCF (usuario) Naı̈ve Bayes based Collaborative Filtering - NBCF (ı́tems) . Naı̈ve Bayes based Collaborative Filtering - NBCF (hı́brido). . . . .. . . . .. . . . .. 110 110 111 112.

(15) Índice de tablas 2.1. Caracterı́sticas de los modelos probabilı́sticos. . . . . . . . . . . .. 58. 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. 3.8.. 68 69 69 70 71 71 71 72. Ejemplo de matriz de votos . . . . . . . . . . . . . . . . . . . . . Probabilidad prior del ı́tem i1 usando el enfoque basado en el usuario Probabilidad prior del usuario u1 usando el enfoque basado en ı́tem Likelihood del ı́tem i1 basado en el voto del usuario u1 . . . . . . Likelihood del usuario u1 basado en el voto del ı́tem i1 . . . . . . Valor de clasificación, usando el enfoque basado en el usuario . . . Valor de clasificación, usando el enfoque basado en ı́tem . . . . . . Valor de clasificación, usando el enfoque hı́brido . . . . . . . . . .. 4.1. Principales propiedades de los datasets usados en los experimentos 4.2. Métodos de lı́nea base de CF utilizados para comparar los resultados con el método propuesto . . . . . . . . . . . . . . . . . . . . . 4.3. Principales hiperparámetros utilizados en los experimentos. Datasets: MovieLens, FilmTrust, Yahoo, BookCrossing . . . . . . . . . 4.4. Error medio absoluto (MAE) del desempeño de las predicciones de los votos de test. . . . . . . . . . . . . . . . . . . . . . . . . . . .. 75 76 77 91. 15.

(16) Capı́tulo 1 Introducción Los sistemas de recomendación (RS, por sus siglas en inglés) se están convirtiendo en una alternativa para enfrentar el problema de la sobrecarga de información en la web (Lu, Wu, Mao, Wang, y Zhang, 2015). Estos sistemas están diseñados para proporcionar recomendaciones a usuarios registrados mediante un análisis de preferencias pasadas o en base a preferencias de usuarios similares (Ricci, Rokach, Shapira, y Kantor, 2011). RS actúa como un filtro que permite pasar la información relevante al usuario y bloquea la información irrelevante. Para este proceso, algunas técnicas de filtrado de información en RS y algoritmos de aprendizaje automático pueden ser usados. Las técnicas de recomendación más conocidas son el filtrado basado en contenido (CBF, por sus siglas en inglés), el filtrado colaborativo (CF, por sus siglas en inglés), filtrado demográfico, y filtrado hı́brido (Bobadilla, Ortega, Hernando, y Gutiérrez, 2013). En (Aguilar, Valdiviezo-Dı́az, y Riofrio, 2016) se presentan otras técnicas de recomendación como aquellas basadas en el conocimiento y en la comunidad. Los sistemas de recomendación se han utilizado ampliamente en diferentes dominios de aplicación, con el objeto de recomendar una variedad de ı́tems, ası́ podemos citar entre otros (Ricci y cols., 2011; Park, Kim, Choi, y Kim, 2012): Comercio electrónico: libros, dispositivos electrónicos, etc. Entretenimiento: programas de televisión, pelı́culas, música, juegos, etc. Turismo electrónico: restaurantes, servicios de viajes, casas en renta, etc. Educación: recursos educativos, cursos, etc. 16.

(17) Capı́tulo 1. Introducción. 17. En el dominio del comercio electrónico, por ejemplo, la recomendación se basa en algoritmos de CF. Podemos citar, la ventas por Amazon, las pelı́culas por Netflix que son seleccionadas en función de RS. En la literatura podemos encontrar dos enfoques de CF: a) basado en la memoria, que generalmente proporciona recomendaciones inexactas pero explicables, éste se divide principalmente en dos tipos: enfoques basados en el usuario y basados en ı́tems; b) basado en modelos, cuyas recomendaciones son más precisas pero difı́ciles de entender. Hoy en dı́a, los métodos basados en modelos están logrando mejores resultados en precisión y rendimiento. La implementación más popular del enfoque basado en modelos es la factorización matricial (MF, por sus siglas en inglés) (Koren, Bell, y Volinsky, 2009). En el contexto de RS, el principal problema de la factorización matricial es que el espacio latente aprendido no es fácil de interpretar (K. Wang y Tan, 2011), por lo que estos modelos no son susceptibles de explicar sus resultados (Rastegarpanah, Crovella, y Gummadi, 2017). En esta tesis se direcciona este problema creando un modelo probabilı́stico que el usuario puede interpretar. El modelo propuesto combina enfoques basados en el usuario y en el ı́tem. Para explicar en detalle el método propuesto, en este capı́tulo se abordan los conceptos fundamentales que involucran los sistemas de recomendación, se hace referencia a enfoques de factorización matricial y probabilı́sticos que son de interés en esta investigación. Luego se presenta la motivación e hipótesis de esta tesis. Finalmente se presenta la estructura de la tesis.. 1.1.. Técnicas de recomendación. En la literatura se distinguen diferentes enfoques de recomendación, entre ellos tenemos:. 1.1.1.. Filtrado colaborativo. En este enfoque las recomendaciones se calculan en función de las votaciones que la comunidad de usuarios ha realizado sobre un conjunto de ı́tems (Bobadilla y cols., 2013). Estos enfoques buscan similaridad entre los patrones de votación de los usuarios y hacen sugerencias de ı́tems que fueron considerados por otros usuarios en el pasado. Los sistemas de recomendación basados en CF utilizan una matriz de votos en la que cada usuario proporciona información sobre cuánto le.

(18) Capı́tulo 1. Introducción. 18. gusta o no le gustan algunos ı́tems. Ası́, los métodos de CF actúan directamente sobre la matriz de votos para calcular las predicciones y recomendaciones. El CF puede subdividirse en enfoques basados en modelos y en memoria. En los enfoques basados en memoria la información a recomendar se obtiene directamente de la matriz de votos (Zhu, Hurtado, Bobadilla, y Ortega, 2018). La implementación más habitual del enfoque basado en memoria es KNN (K-NearestNeighbour )(Z. Wen, 2008), el cual captura relaciones similares entre usuarios o ı́tems según la matriz de votos, luego recomiendan los ı́tems que son altamente calificados por los usuarios similares al usuario activo (Yang, Wu, Zheng, Wang, y Lei, 2016), en este sentido el sistema de recomendación encuentra vecinos para un cierto usuario o ı́tem y calcula el valor de predicción para el voto desconocido. El método de recomendación basado en la memoria se puede subdividir en dos tipos: CF basado en el usuario y CF basado en ı́tems (Ricci y cols., 2011). Los métodos basados en el usuario predicen las votaciones de los usuarios activos basándose en las votaciones de los usuarios similares, y los enfoques basados en ı́tems predicen las votaciones del usuario en base a la información de ı́tems similares a los elegidos por el usuario activo. Los sistemas basados en memoria son la técnica más popular utilizada en aplicaciones de sistemas de filtrado colaborativo, son simples, fáciles de implementar y permiten explicar las recomendaciones que proporcionan (Hernando, Bobadilla, y Ortega, 2016). Las explicaciones con técnicas basadas en vecindarios son sencillas, ya que las recomendaciones se deducen directamente del comportamiento de los usuarios anteriores (Hu, Volinsky, y Koren, 2008), pero éstas no son precisas. Los métodos basados en memoria usualmente aplican métricas de similitud para obtener el parecido entre dos usuarios o dos ı́tems (Bobadilla y cols., 2013). Éstas pueden ser: Correlación de Pearson, Spearman Rank, Coseno, Jaccard, etc. Por otro lado, en el enfoque basado en modelos, se crea un modelo a partir de la matriz de votaciones, que posteriormente se utiliza para hacer recomendaciones. Algunos ejemplos de métodos basados en modelos son entre otros, la factorización matricial (Salakhutdinov y Mnih, 2007), las redes bayesianas (Du y Chen, 2013), clustering (Bobadilla, Bojorque, Hernando, y Hurtado, 2018), reglas (Ali y cols., 2018), y enfoques basados en grafos (Fouss, Pirotte, Renders, y Saerens, 2007), son técnicas que trabajan exitosamente con sistemas de filtrado colaborativo basado en modelos. En contraste con el enfoque basado en la memoria, el basado en modelos (es-.

(19) Capı́tulo 1. Introducción. 19. pecialmente la factorización matricial) ofrecen recomendaciones confiables pero son difı́ciles de explicar, porque todas las acciones pasadas del usuario se introducen en un modelo abstracto, bloqueando la relación directa entre las acciones pasadas del usuario y las recomendaciones proporcionadas (Hu y cols., 2008). Sin embargo, existen otro tipo de modelos como los probabilı́sticos que brindan facilidades en la explicación y justificación de las recomendaciones. Los enfoques de filtrado colaborativo se enfrentan a problemas como (Aghdam, Analoui, y Kabiri, 2015; Parambath, 2013): Dispersión de la matriz de votos (Sparsity): este problema surge porque los usuarios no votan todos los ı́tems, es decir, los usuarios únicamente votan un pequeño porcentaje de los ı́tems que hay registrados en el sistema, y esto puede dar lugar a que el rendimiento del sistema disminuya. Escalabilidad: en los sistemas de recomendación el número de usuarios e ı́tems puede ser bastante grande, lo cual puede retardar el proceso de recomendación de manera significativa. Arranque en frı́o (Cold-start): en vista de que los sistemas de colaboración realizan la predicción basados en el voto de un usuario similar, surgen tres problemas de arranque en frı́o: nueva comunidad, nuevo ı́tem y nuevo usuario. El problema de nueva comunidad se da al iniciar con el sistema de recomendación, cuando existen pocos votos y todavı́a no existe información para aprender nada. Por tanto el sistema necesitarı́a obtener suficiente información de votos para poder realizar predicciones confiables. En el problema de nuevos ı́tems, si un ı́tem no ha sido votado, no tiene probabilidad de ser recomendado, o si ha sido votado por pocos usuarios, los resultados del sistema pueden ser muy sesgados. En el problema de nuevos usuarios, cuando un nuevo usuario ingresa al sistema no se tiene información de lo que le interesa, por tanto no es posible realizar las recomendaciones. De ahı́ que, el CF tiene como desventaja que el usuario siempre tiene que proporcionar algún voto, aunque no tenga una opinión formada sobre el ı́tem.. 1.1.2.. Filtrado basado en contenido. Puede diseñarse para recomendar ı́tems similares a los que a un usuario predeterminado le gustó en el pasado (Ricci y cols., 2011). Éstos utilizan información.

(20) Capı́tulo 1. Introducción. 20. de los ı́tems para la predicción. La información de los ı́tems es importante para predecir su relevancia basado en un perfil de usuario, el cual incluye los gustos, preferencias y otras caracterı́sticas, y sólo los ı́tems que tienen un alto grado de similitud con el perfil del usuario son recomendados (T.-m. Chang y Hsiao, 2013). Entre los métodos basados en modelos mayormente utilizados en RS basados en contenido, son: el método Latent Dirichlet Allocation (LDA) (Blei, Ng, y Jordan, 2003), un modelo generativo probabilı́stico no supervisado que puede ser utilizado para encontrar contenido semántico oculto en un corpus de texto. Este modelo permite modelar grandes corpus de texto, y generar aleatoriamente los documentos que se observan en este corpus; Análisis Semántico Probabilı́stico Latente (PLSA, también llamado PLSI por sus siglas en inglés), es una técnica de factorización matricial, que descompone la matriz de apariciones de palabras/ı́tems, en dos matrices que van a tener un significado probabilı́stico. Los ı́tems y las palabras están caracterizadas por una distribución de probabilidad la cual indica el grado de pertenencia de un ı́tem o palabra hacia un tópico u otro (Ekstrand, Riedl, y Konstan, 2011). El enfoque basado en contenido tiene las siguientes limitaciones: Análisis de contenido limitado: está relacionado con la eficacia de las palabras claves y con las caracterı́sticas asociadas a los ı́tems, por tanto, las técnicas basadas en el contenido están limitadas a las caracterı́sticas que se asocian con los ı́tems que estos sistemas recomiendan (Ricci, Rokach, y Shapira, 2015). Sobre especialización: dado que los sistemas basados en contenido sólo recomiendan ı́tems que tienen un alto grado de similitud con aquellos preferidos en el pasado, el usuario está limitado a que el sistema le recomiende ı́tems que son similares a esos que ya fueron puntuados. Por tanto, el conjunto de ı́tems recomendados podrı́a ser obvio y demasiado homogéneo (Lops, Gemmis, y Semeraro, 2011). Problema de nuevos usuarios (cold-start): el usuario tiene que evaluar un número suficiente de ı́tems antes de que un sistema de recomendación basado en contenido pueda entender las preferencias del usuario y proporcionar recomendaciones confiables. Esto además significa que los sistemas de recomendación deben ser lo suficientemente capaces para brindar recomendaciones no triviales para un usuario sin suficientes recomendaciones previas.

(21) Capı́tulo 1. Introducción. 21. en su perfil (Adomavicius y Tuzhilin, 2005).. 1.1.3.. Filtrado demográfico. Los sistemas están basados en información demográfica del usuario, como: la edad, género, ciudad, lenguaje, sexo, opiniones que tienen los usuarios sobre los ı́tems (Bobadilla y cols., 2013), etc. Esta información es necesaria para conocer las preferencias comunes entre los usuarios y ası́ generar las recomendaciones. En esta técnica de recomendación se clasifica al usuario según sus atributos personales. De acuerdo a (Pazzani, 2000) las recomendaciones pueden estar basadas en información sobre otros usuarios del grupo al que pertenecen. Un problema con este tipo de filtrado es la de obtener información demográfica que puede ser una tarea difı́cil y necesariamente se deberı́a obtener información del usuario para poder hacer la recomendación. Algunos trabajos desarrollados que incorporan información demográfica son: (Valdiviezo-Dı́az y Bobadilla, 2018), el cual usa el enfoque de matriz extendida para incorporar información demográfica del usuario. En (H. Zhang, Nikolov, y Ganchev, 2017) proponen el uso de perfiles de usuario combinados, que son aprendidos de los ı́tems vistos por el usuario.. 1.1.4.. Filtrado hı́brido. Combina dos o más enfoques de recomendación para tener un mejor funcionamiento. Se utilizan comúnmente el filtrado colaborativo con otra técnica que reduzca problemas de recomendación con nuevos ı́tems (Valdiviezo y Hernando, 2016). Estos sistemas tratan de mejorar todas las limitaciones que tienen los demás enfoques de recomendación, por ejemplo: CF se basa sólo en información de votos, y descarta caracterı́sticas significativas de usuarios e ı́tems; CBF emplea caracterı́sticas de usuarios e ı́tems, pero ignora los votos del usuario. Actualmente se han propuesto enfoques de filtrado hı́brido para integrar información ya sea del usuario o del ı́tem, por ejemplo: información demográfica del usuario o preferencias explı́citas del usuario, metadatos de ı́tems o algún otro contenido del ı́tem, etc., con el objeto de mejorar la calidad de las recomendaciones. Un modelo hı́brido que combina filtrado colaborativo y filtrado demográfico usando un modelo de factorización matricial, se presenta en (Valdiviezo-Dı́az y Bobadilla, 2018). En (Tiwari y Potter, 2015), se propone un sistema de recomen-.

(22) Capı́tulo 1. Introducción. 22. dación para el usuario combinando filtrado colaborativo en los datos de transacción con el voto estimado, la información demográfica del usuario y la similitud del ı́tem. También es posible construir sistemas hı́bridos combinando los enfoques basados en memoria y basado en modelos correspondientes a una misma técnica de recomendación. Por ejemplo algunos trabajos que combinan enfoques de CF basado en el usuario y basado en ı́tems dentro de un enfoque basado en modelo son los presentados por (Zhao, Sun, Han, y Peng, 2016; Kumar y Fan, 2015; Valdiviezo-Diaz, Ortega, Cobos, y Lara-Cabrera, 2019). La figura 4.4 contiene un resumen de lo anteriormente explicado: Sistemas de Recomendación Enfoques híbridos. Filtrado Colaborativo. Filtrado Demográfico. Basado en Contenido. híbrido. Basado en Modelos. Basado en Memoria. LDA, PLSI Documentos Palabras - Tópicos. Factorización Matricial. Modelos probabilísticos. Basado en usuarios. Basado en ítems KNN, medidas de similaridad. Matriz de votos usuario-ítem. Predicción Recomendación. Figura 1.1: Esquema de los elementos que intervienen en un RS En la figura anterior podemos observar los tipos de enfoques de sistemas de recomendación más utilizados en la literatura y los métodos de recomendación que se pueden utilizar en cada uno de ellos. Se observa también que un enfoque hı́brido puede estar formado por la combinación de varias técnicas de recomendación (CF y CBF, CF y Demográfico, etc.), o por la combinación de diferentes algoritmos.

(23) Capı́tulo 1. Introducción. 23. de CF, a fin de mejorar el desempeño del sistema.. 1.2.. Enfoques de filtrado colaborativo basado en modelos. La mayorı́a de los enfoques actuales de filtrado colaborativo se enfrentan a tres problemas: dispersión, escalabilidad y cold-start (Parambath, 2013; Aghdam y cols., 2015). Adicional a éstos, en (Mohamed, Khafagy, y Ibrahim, 2019) se mencionan otros desafı́os como: Sobre-especialización, Diversidad, Novedad, etc., que también necesitan ser investigados y solucionados. Estos problemas se han abordado desde una amplia gama de perspectivas que aplican diferentes métodos en orden a proporcionar recomendaciones. A continuación se mencionan algunos de ellos.. 1.2.1.. Factorización matricial. La factorización matricial se ha convertido en una de las técnicas principales para dar solución a los problemas de escalabilidad. La factorización matricial es un método basado en modelos, donde los votos del usuario a ı́tems se modelan con un conjunto de factores latentes, que representan las caracterı́sticas de los usuarios e ı́tems. Algunas implementaciones de este método son: Factorización Matricial con bias (BiasedMF) (Koren y Bell, 2015), Factorización Matricial Probabilı́stica (PMF, por sus siglas en inglés) (Salakhutdinov y Mnih, 2007), Factorización Matricial No Negativa (NMF, por sus siglas en inglés) (L. Zhang, Chen, Zheng, y He, 2011), Factorización Matricial No Negativa Bayesiana (BNMF, por sus siglas en inglés) (Hernando y cols., 2016).. 1.2.2.. Modelos probabilı́sticos. En la literatura hay algunos métodos de recomendación desarrollados a partir de la teorı́a de la probabilidad. De acuerdo a (Ekstrand y cols., 2011) estos métodos por lo general tienen como objetivo construir modelos probabilı́sticos del comportamiento del usuario y usar esos modelos para predecir el comportamiento futuro. Los modelos probabilı́sticos han sido desarrollados tanto para ser usados en enfoques de filtrado colaborativo (ejemplo: PMF, BNMF), como en aquellos.

(24) Capı́tulo 1. Introducción. 24. basados en contenidos (LDA, PLSA), algunos de ellos se mencionaron también en el apartado anterior. De acuerdo a (Herlocker, Konstan, y Riedl, 2000), las explicaciones de recomendaciones de RS adecuadas conducen a una mayor confianza del usuario. Por lo tanto, es necesario tener modelos de recomendación que permitan justificar correctamente sus predicciones. Los modelos probabilı́sticos son una alternativa para este proceso. Hoy en dı́a, los métodos basados en modelos probabilı́sticos están logrando mejores resultados en precisión y rendimiento, ya que éstos presentan buen desempeño de predicción. Algunos trabajos desarrollados recientemente con este tipo de modelos para enfoques de filtrado colaborativo, son discutidos en el capitulo 2.. 1.3.. Motivación, Objetivos e Hipótesis. Diversas propuestas de enfoques de recomendación basados en modelos se han centrado en solucionar algunos de los problemas que enfrentan los sistemas de recomendación como: escalabilidad, interpretabilidad, cold-start, calidad de las predicciones, etc., sin embargo los resultados que proporcionan siguen siendo difı́ciles de interpretar. Si bien es cierto los enfoques basados en la memoria son de fácil implementación y pueden explicar fácilmente sus resultados, pero éstos generalmente proporcionan peores recomendaciones que los basados en modelos. Los enfoques basados en modelos presentan un mejor desempeño en la predicción proporcionando recomendaciones altamente precisas, sin embargo los modelos, especialmente los basados en factorización matricial, siguen siendo demasiado abstractos para explicar las recomendaciones. Por otro lado, los modelos probabilı́sticos explican mejor sus resultados que los basados en factorización matricial, debido al concepto de probabilidad que es más cercano al usuario que el concepto de espacio de factores latentes. De ahı́ que el desarrollo de modelos que faciliten la explicación de sus recomendaciones es un tema que aún continua siendo explorado. Por lo tanto se ha visto la necesidad de entrar en el tema de los enfoques basados en modelos probabilı́stico aplicados a CF, que permitan explicar sus predicciones..

(25) Capı́tulo 1. Introducción. 25. Objetivo principal Desarrollar un modelo que proporcione recomendaciones tan certeras como las generadas mediante factorización matricial y que permita justificarlas. El objetivo principal de esta tesis se fundamenta principalmente en el siguiente esquema:. PMF factores abstractos valores negativos. >>. NMF factores abstractos. >>. BNMF. >>. factores abstractos probabilidades. Método Propuesto NBCF. probabilidadess. Figura 1.2: Fundamentos de la propuesta Se conoce que la factorización matricial probabilı́stica ofrece recomendaciones confiables pero su gran limitante es la explicación de sus resultados en términos de factores latentes. La principal problemática de estos factores, más allá de su alto nivel de abstracción, es la inclusión de factores negativos dentro del modelo de fatorización matricial. NMF restringe estos factores a solo valores positivos, pero las predicciones siguen estando sujetas a factores latentes, por lo que el problema de intentar dar un significado a estos factores continua estando presente. Actualmente se ha intentado juntar modelos que expliquen bien los resultados y que además tengan las virtudes de la factorización matricial, como por ejemplo BNMF (Hernando y cols., 2016) que ha sido desarrollado para aliviar el problema de la interpretación de resultados, aplicando un enfoque probabilı́stico para interpretar los factores de usuarios e ı́tems. Sin embargo, estos factores siguen siendo extremadamente abstractos para los usuarios. De ahı́ que, los modelos probabilı́sticos están siendo ampliamente estudiados dentro del CF porque brindan ventajas para la explicación de recomendaciones, además éstos están dando buenos resultados debido a que pueden aplicarse para modelar y razonar sobre la incertidumbre en el proceso de hacer las recomendaciones. De acuerdo a la figura 1.2 se ha ido convergiendo a un modelo que intente explicar los factores latentes, pero seguimos estando sujetos a las limitaciones que éstos presentan. Por ello en esta tesis se propone un modelo probabilı́stico fácilmente interpretable, que no use factorización matricial, y que proporcione una.

(26) Capı́tulo 1. Introducción. 26. explicación muy clara de sus resultados, el cual además compita con los modelos del estado del arte analizados. El modelo propuesto está basado en técnicas bayesianas y combina los dos enfoques de CF: basado en el usuario y basado en ı́tems. Se combinan estos enfoques porque se complementan adecuadamente. El objetivo principal es logrado mediante los siguientes objetivos especı́ficos: Analizar y seleccionar los trabajos de investigación que usen modelos probabilı́sticos para filtrado colaborativo y que además puedan ser utilizados como métodos de linea base para comparar con los resultados del modelo propuesto. Diseñar un nuevo modelo probabilı́stico para filtrado colaborativo que permita explicar las recomendaciones. Seleccionar datasets del estado del arte utilizados en el contexto de los sistemas de recomendación. Evaluar el desempeño del modelo con los datasets seleccionados usando medidas de calidad estándar y comparar sus resultados con otros métodos de lı́nea base. Hipótesis Para alcanzar estos objetivos se plantea la siguiente hipótesis. Es posible construir un modelo probabilı́stico que brinde tan buenos resultados como los modelos de factorización matricial y que además permita justificar de forma simple las recomendaciones que el modelo proporcione. Las principales contribuciones de esta tesis son:. Proporcionar un estado del arte sobre enfoques basados en modelos aplicados a sistemas de recomendación, resaltando las ventajas y desventajas identificadas entorno a estos modelos. Aprovechar las posibilidades que ofrecen los enfoques basados en modelos como los métodos probabilı́sticos, desarrollando un modelo hı́brido basado.

(27) Capı́tulo 1. Introducción. 27. en técnicas bayesianas que combine los enfoques de CF de usuarios e ı́tems y que además permita la explicación de las recomendaciones. Sugerir un conjunto de métricas que puedan ser utilizadas para medir la calidad de las predicciones y recomendaciones de modelos probabilı́sticos para CF. Además de proporcionar una medida de confiabilidad relacionada con las predicciones. Facilitar una serie de datasets que han sido preparados para ser utilizados en la evaluación del método propuesto.. 1.4.. Estructura de la tesis. Este trabajo de investigación está estructurado de la siguiente manera: Capı́tulo 2, presenta el estado del arte sobre enfoques basados en modelos para filtrado colaborativo, sean éstos: basados en factorización matricial, probabilı́sticos y basados en reglas. Capı́tulo 3, describe el método propuesto para CF, haciendo referencia a tres enfoques, basado en el usuario, basado en ı́tems e hı́brido. Además se presenta el cálculo de una medida de confiabilidad relacionada con las predicciones. Capı́tulo 4, presenta la experimentación y evaluación de resultados, comparando el método propuesto con otros modelos del estado del arte, mediante el uso de métricas para la evaluación de la calidad de las predicciones y recomendaciones. Se presenta también el desempeño del clasificador para los conjuntos de datos utilizados. Capı́tulo 5, se mencionan algunos modelos de recomendación explicables, y se muestra la explicación de los resultados con el modelo propuesto. Capı́tulo 6, finalmente en este capı́tulo se detallan las conclusiones y trabajos futuros..

(28) Capı́tulo 2 Estado del arte sobre enfoques basados en modelos En esta sección se brinda unan visión general del estado actual de los enfoques de filtrado colaborativo basados en modelos. Luego se describen algunos métodos seleccionados de la revisión de la literatura, los cuales se los ha categorizado de acuerdo a la técnica que utilizan. Algunos de estos modelos son considerados como métodos de lı́nea base con el objeto de comparar los resultados obtenidos con el enfoque propuesto. Para tener una idea clara de las caracterı́sticas que poseen estos enfoques, se identifican además las principales ventajas y desventajas que brindan cada tipo de modelo establecido.. 2.1.. Visión general. En la literatura se proponen un gran número de enfoques de CF basados en modelos, algunos de ellos son modelos probabilı́sticos que facilitan la interpretación de sus resultados. También existen otros modelos como los basados en factorización matricial que generan una representación que no es fácilmente interpretable para el usuario. Debido a las ventajas que brindan los modelos probabilı́sticos, como: buen 28.

(29) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 29. desempeño de predicción, facilidad para la explicación y justificación de resultados, etc. éstos en los últimos años han ido ganando importancia en diferentes campos de aplicación, por ejemplo, en el comercio electrónico autores como (Gaikwad, Udmale, y Sambhe, 2018) proponen un modelo probabilı́stico de CF para mejorar el análisis de las consultas de búsqueda y predecir la probabilidad de los productos que serán recomendados al usuario; en medicina (X. Li y Li, 2018), proponen un modelo probabilı́stico de aprendizaje en profundidad para analizar gran cantidad de datos médicos y hacer una predicción personalizada del riesgo para la salud; en transporte (Tang, Chen, Liu, y Khattak, 2018), desarrollan un modelo probabilı́stico bayesiano para la estimación del tiempo de viaje personalizado, utilizando las trayectorias de GPS dispersas y a gran escala generadas por los taxis. De acuerdo a (Ekstrand y cols., 2011), los modelos probabilı́sticos son aplicables cuando el proceso de recomendación debe seguir modelos de comportamiento del usuario. El objetivo del aprendizaje en los modelos probabilı́sticos es estimar la función de densidad de probabilidad de los datos o la distribución de probabilidad, para lo cual es necesario hacer ciertas suposiciones sobre:. El modelo de distribución que describe los atributos. Es muy importante conocer con qué atributos contamos en nuestro conjunto de entrenamiento para asumir el tipo de distribución que estos atributos representan, en nuestro caso serı́an los votos del usuario. Por ejemplo una distribución multinomial es comúnmente utilizada cuando los atributos son discretos, y cuando los atributos son continuos, éstos son distribuidos mediante una distribución normal. El modelo de distribución que describe las clases. Conocer cuál es la salida esperada del algoritmo, si ésta va ser binaria o categórica. En caso de que la clase sea discreta se utiliza una distribución multinomial. Además en este punto también se puede considerar como realizar la estimación de la clase, la cual puede ser con una distribución posterior, es decir considerar solo la clase con la mayor probabilidad a posteriori Maximum A Posteriori (MAP, por sus siglas en inglés), o utilizar el método de estimación de máxi-.

(30) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 30. ma verosimilitud Maximum Likelihood Etimation (MLE, por sus siglas en inglés). La dependencia entre las variables. Puede darse el caso de que todas las variables sean independientes, que hayan variables que tengan independencia y otras no, que las variables sean dependientes, etc. De esto depende el método que se utilice para el modelado, por ejemplo si suponemos que todas las variables son independientes conocido el valor de la clase, entonces se puede utilizar el método naives bayes.. En base a la revisión de la literatura, en la siguiente figura se muestra una clasificación de los enfoques basados en modelos y algunos de los algoritmos estudiados en cada uno de ellos. Basados en modelos Probabilísticos PNN Factorización matricial. BiasedMF NMF. PMF BNMF. EM. GGM INBM NBRMCF. árboles reglas de asociación Reglas. Figura 2.1: Clasificación de los enfoques basados en modelos En la figura 2.1 se diferencia tres familias de enfoques basados en modelos: de factorización matricial, probabilı́sticos y basados en reglas. Se puede ver también como los métodos probabilı́sticos pueden ser utilizados en combinación con otras técnicas como la factorización matricial.. Factorización matricial (Koren y cols., 2009), consisten en descomponer una matriz en dos o más matrices que hacen referencia a los usuario e ı́tems.

(31) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 31. respectivamente. En esta categorı́a se incluyen modelos no probabilı́sticos como la factorización matricial no negativa y la factorización matricial con bias. Modelos probabilı́sticos, en esta familia se listan algunos modelos bayesianos y no bayesianos. Los bayesianos de acuerdo a (Barber, 2012), utilizan el conocimiento previo junto con un modelo dado, para hacer inferencias sobre cantidades desconocidas. Los métodos bayesianos tienen como punto central el Teorema de Bayes. En este conjunto también se mencionan trabajos que combinan modelos probabilı́sticos con técnicas de factorización matricial. En la siguiente sección se desarrolla más este tipo de modelos. Modelos basados en reglas (Hernando, Bobadilla, Ortega, y Gutiérrez, 2017; Najafabadi, Mahrin, Chuprat, y Sarkan, 2017): Los hemos subdivido en aquellos modelos basados en árboles (los cuales pueden realizar una selección de variables en la construcción del modelo); y aquellos modelos basados en reglas de asociación, que describen las asociaciones entre los datos (usuario - ı́tem) en la base de datos. Los modelos probabilı́sticos modelan la incertidumbre con las distribuciones de probabilidad y, a menudo, utilizan la máxima verosimilitud (likelihood) para encontrar un simple modelo óptimo. El likelihood o la estimación de máxima verosimilitud se puede utilizar para estimar los parámetros del modelo de aprendizaje. Como parte de los modelos probabilı́sticos están también, las redes neuronales probabilı́sticas (PNN, por sus siglas en inglés) (Devi, Samy, Kumar, y Venkatesh, 2010), las cuales han sido utilizadas para aliviar problemas de sparsity y cold-start en filtrado colaborativo. Las redes neuronales también han sido usadas en combinación con la factorización matricial. En la literatura se encuentran algunos estudios realizados recientemente con este tipo de combinación, podemos citar entre otros: un modelo probabilı́stico que usa una red neuronal para filtrado colaborativo presentado por (He y cols., 2017), y un modelo probabilı́stico hı́brido basado en redes neuronales para extraer factores latentes de los usuarios e ı́tems (Liu y Wang, 2017). Por otro lado, existen modelos basado en técnicas de clustering, como el Expectation-Maximization para filtrado colaborativo (EMCF, por.

(32) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 32. sus siglas en inglés) (K. Wang y Tan, 2011), el cuál también se basa en MF para inferir las preferencias del usuario. En (Nilashi, bin Ibrahim, Ithnin, y Sarmin, 2015) se presenta un método hı́brido de CF multi-criterio basado en EM en combinación con redes neuronales y técnicas de reducción de dimensionalidad, para la recomenación de hoteles. Por otra parte, los modelos probabilı́sticos bayesianos son capaces de integrar el conocimiento anterior en sus probabilidades condicionales y manejar observaciones faltantes. De acuerdo a (Shengbo, 2011) los métodos bayesianos a menudo asumen que el parámetro del modelo (clase) se extrae de alguna distribución de probabilidad previa con algunos parámetros llamados hiperparámetros utilizados para distinguirlos de los parámetros del modelo. Los modelos probabilı́sticos incluidos en la figura 2.1, son explicados en la siguiente sección, algunos de ellos son considerados como métodos de linea base para comparar sus resultados con el modelo propuesto. Externamente a todos los tipos de modelos mencionados, se identificaron otros modelos, que se ubicarı́an dentro del recuadro general; hablamos de aquellos modelos basados en: métodos difusos (S.-M. Chen, Cheng, y Lin, 2015), algoritmos genéticos (Hassan y Hamada, 2018), entre otros, los cuales han presentado buen desempeño en la calidad de las predicciones y recomendaciones. Sin embargo, siguen presentando ciertas limitaciones, por ejemplo, en los algoritmos genéticos, la implementación de la solución podrı́a tornarse demasiado costosa en términos de tiempo y recursos. En el contexto de los RS, existen problemas que son necesarios modelarlos usando distribuciones de probabilidad para representar los conceptos, por ello en la sección 2.3 se describen algunos de los modelos probabilı́sticos señalados en la figura 2.1..

(33) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 2.2.. 33. Modelos basados en factorización matricial. El modelo básico de factorización matricial consiste en encontrar para cada usuario un vector pu ∈ <f que mide el interés que el usuario tiene en los ı́tems, y un vector qi ∈ <f para cada ı́tem, que mide el grado en el que el ı́tem posee esos factores (Koren y cols., 2009). En este caso, f , representa la dimensión del espacio de factores latentes. Las interacciones usuario-ı́tem se modelan como un producto escalar entre sus correspondientes vectores, tales como: r̂u,i = qiT pu. (2.1). El producto resultante denota el voto estimado de un usuario hacia un ı́tem. Para aprender los vectores p y q el sistema minimiza el error cuadrático regularizado sobre el conjunto de votos conocidos (Koren y cols., 2009). mı́n ∗. X. q·p. rui − qiT pu. 2. + λ kqi k2 + kpu k2. . (2.2). (u,i)∈κ. Donde: K es el conjunto de los pares (u, i) para lo cual rui es conocido,  λ kqi k2 + kpu k2 , es el término de regularización para evitar el sobreajuste. Como se muestra en la figura 2.1, existen algunas implementaciones basadas en factorización matricial, en este trabajo se describen las más comúnmente usadas.. 2.2.1.. Factorización matricial con bias. El método de factorización matricial con bias (BiasedMF), surge debido a que gran parte de la variación observada en los votos se debe a los efectos asociados con los usuarios o ı́tems, conocidos como sesgos (bias). Es decir que, estos sesgos probablemente sean causados por desviaciones del voto, por ejemplo algunos usuarios proporcionan votos más altos que otros usuarios, y algunos ı́tems pueden obtener votos más altos que otros ı́tems (L. Chen, Chen, y Wang, 2015). Formalmente, la estimación del voto se calcula utilizando el sesgo involucrado.

(34) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 34. en el voto: bui = µ + bu + bi. (2.3). Donde: µ es el promedio global de los votos, los parámetros bu y bi indican la desviación observada del usuario e ı́tem, respectivamente, desde el promedio (Koren y Bell, 2011). Las bias se pueden estimar con el método de gradiente descendente. La ecuación de este método está dada por (Adomavicius y Tuzhilin, 2011): r̃u,i = bui + qiT pu. (2.4). Igualmente, el sistema aprende minimizando la función del error cuadrático, como sigue: mı́n ∗ ∗. p ,q ,b. X. (rui − r̃ui )2 + λ kpu k2 + kqi k2 + b2u + b2i. . (2.5). (u,i)∈K. Existen algunos trabajos desarrollados con el uso de este método, por ejemplo en (Sun, Zhang, Liang, y He, 2015), desarrollan un algoritmo de factorización matricial con bias para modelar caracterı́sticas explı́citas basados en los valores del voto, al añadir factores de alta dimensión; por otro lado en (H. Zhang y cols., 2017) utilizan el método BiasedMF para fusionar los votos con los perfiles del usuario en un solo modelo.. 2.2.2.. Factorización matricial no negativa. Otro método que se deriva de la factorización matricial y que ha ganado popularidad en los últimos años, es el método de factorización matricial no negativa (NMF) (L. Zhang y cols., 2011), la cual consiste en la factorización de la matriz de votos R con entradas positivas, en dos nuevas matrices: W que representa la matriz de factores latentes de los usuarios y H que representa la matriz de factores latentes de los ı́tems. Este modelo impone como restricción la no negatividad.

(35) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 35. de los factores de estas dos matrices, tales que verifiquen la siguiente expresión:. R≈W ·H. (2.6). Por lo tanto, el algoritmo NMF trata de minimizar la diferencia cuadrática entre R y W · H , obteniendo la siguiente función de coste:. X. (Ru,i − (W · H)u,i )2. (2.7). ui. Las matrices W y H minimizan el error sujeto a las restricciones no negativas. Este problema se puede plantear mediante el descenso de gradiente tal y como se realiza en PMF, sin embargo, la restricción de valores positivos permite transformar la función de coste para acelerar el proceso de aprendizaje. Dada la función de coste anterior, las reglas de actualización de las matrices W y H están dadas por: W ←W ←. H←H·. R · HT W · H · HT. (2.8). WT · R W · WT · H. Donde W y H, están restringidas a ser no negativas. NMF a diferencia de BiasedMF y PMF facilita la interpretabilidad de los resultados, debido a sus factores positivos. Algunos trabajos aplicados a CF basados en NMF son: (Hernando y cols., 2016), el cual combina métodos bayesianos con NMF para predecir los gustos del usuario en sistemas de recomendación; (S. Zhang, Wang, Ford, y Makedon, 2013) proponen una variación de NMF basado en el método de ExpectativaMaximización (EM) para encontrar un modelo cuando la matriz de votos es incompleta; (Aghdam y cols., 2015) utilizan NMF y similaridad para aprender.

(36) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 36. los factores latentes de los usuarios e ı́tems y estimar los votos desconocidos utilizando estas caracterı́sticas latentes; en (Parvin, Moradi, Esmaeili, y Qader, 2019) se propone un recomendador de factorización matricial no negativa basado en la confianza usando un método de dirección alterna, etc.. 2.2.3.. Limitaciones de los modelos de factorización matricial. De la revisión del estado del arte, se determinó que los métodos de factorización matricial poseen algunas debilidades como:. El espacio latente aprendido no es fácil de interpretar (C. Wang y Blei, 2011). Las matrices que representan las caracterı́sticas latentes de los usuarios e ı́tems son abstractas para entender su significado, por tanto no son intuitivas para interpretar. Cuando la dispersión es demasiado grande, la precisión de la recomendación se reduce (R. Chen y cols., 2018). El problema de dispersión tiene un fuerte efecto sobre el poder predictivo de los algoritmos, puede conllevar a un sobre ajuste (over-fitting) de los datos y dar como resultado una mala precisión. Problemas para explicar las recomendaciones. Debido a que la descomposición en factores latentes es difı́cil de interpretar, y éste a su vez pueden generar valores negativos, la predicciones resultan difı́ciles de explicar (Rastegarpanah y cols., 2017).. 2.3.. Modelos probabilı́sticos. Los sistemas de recomendación de filtrado colaborativo basado en factorización matricial proporcionan unos resultados excelentes en cuanto a calidad de predicciones y recomendaciones, pero éstos son difı́ciles de interpretar. Este tipo de algoritmos tienen una deficiencia: la transformación de la matriz de votaciones en matrices de factores latentes es altamente abstracta para los usuarios y, por.

(37) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 37. ende, imposibilita la explicación de las recomendaciones. Por otra parte, existen modelos probabilı́sticos que facilitan la tarea de interpretar y justificar sus resultados. Dentro del estudio del estado del arte se identifican dos familias de modelos probabilı́sticos aquellos bayesianos y no bayesianos. De acuerdo a (Barnard y Prügel-Bennett, 2011) los sistemas recomendadores bayesianos que utilizan conocimiento previo pueden producir resultados mejores que los utilizados en el filtrado colaborativo basado en la memoria, y aquellos recomendadores probabilı́sticos simples que no utilizan conocimiento previo. Los modelos bayesianos se basan en la definición de probabilidad condicional y el teorema de bayes. Éstos utilizan la probabilidad para representar la incertidumbre sobre las relaciones aprendidas de los datos. Además, el concepto de prior (anterior) es muy importante, para representar nuestras expectativas o conocimientos previos sobre cuál podrı́a ser la verdadera relación. Desde la perspectiva bayesiana, la probabilidad de obtener los parámetros dado los datos (posteriori), es proporcional al producto de la probabilidad de los datos dado los parámetros (likelihood), por la probabilidad de los parámetros (prior). El componente de likelihood incluye el efecto de los datos, mientras que el prior especifica la creencia en el modelo antes de que se observaran los datos (Ricci y cols., 2015). Basado en esto, a continuación se mencionan algunos modelos bayesianos que no usan factorización matricial, y que son utilizados en filtrado colaborativo.. 2.3.1.. Método Naı̈ve Bayes mejorado. Este método de filtrado colaborativo se basa en Naı̈ve Bayes y tiene una complejidad similar al método original. A diferencia del método bayesiano ingenuo (naive) original, este algoritmo se puede aplicar a los casos en que la suposición de independencia condicional no se cumple estrictamente (K. Wang y Tan, 2011). El método INBM (por sus siglas en inglés) proporciona una nueva solución simple a la falta de independencia en comparación con las redes bayesianas..

(38) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 38. En el algoritmo propuesto para este método, los ı́tems de una alta probabilidad condicional tiene una alta prioridad a ser recomendados y la tarea aquı́ es calcular la probabilidad condicional de cada ı́tem para cada usuario. En este método, la relevancia entre los ı́tems es el fundamento teórico. El funcionamiento es el siguiente: primero se calcula la probabilidad prior p(mi ), que es la posibilidad de que el ı́tem mi sea interesante para todos los usuarios. P p(mi ) =. i∈U ti. (2.9). N. Donde: U: Conjunto de usuarios interesados en el ı́tem N: Número total de usuarios Para calcular la matriz de probabilidad condicional, primero se obtiene la probabilidad conjunta y luego ésta se convierte en probabilidad condicional.. ti,j N. (2.10). p(mi , mj ) p(mj ). (2.11). p(mi , mj ) =. p(mi |mj ) =. Sobre la base de estas dos matrices se hace la recomendación. Para lo cual se aplica la siguiente ecuación. cn. p(mx |mu1 , mu2 ...) = p(mx ) · q n. (2.12). Donde n es el número de intereses conocidos del usuario y cn es una constante entre 1 y n. cn representa cuán independiente son los ı́tems. El valor de cn es calculado por experimentos. p(mx ), muestra si el elemento x en sı́ es atractivo para el usuario, y q representa la probabilidad condicional obtenida en la ecuación 2.11, que muestra si el.

(39) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 39. ı́tem es adecuado para el usuario. Una limitante de este método es el cálculo de cn en base a experimentos, el valor de este parámetro deberı́a ser obtenido de forma automática y adecuada.. 2.3.2.. Modelo Gaussian-Gamma. En (Barnard y Prügel-Bennett, 2011) se presenta un modelo Gaussiano para el comportamiento del voto con la adición de un prior Gaussian-Gamma. El modelo llamado GGM (por sus siglas en inglés) presenta un buen desempeño cuando se usa conjuntos de datos muy dispersos. Es decir, este modelo utiliza el conocimiento previo dentro de las estimaciones de probabilidad, para reducir el impacto de la dispersión (sparsity). De acuerdo con (Luo, Zhang, Xiang, y Qi, 2017), la distribución GaussianGamma se ha utilizado con éxito en aplicaciones que requieren un modelo robusto o disperso, y se puede usar para mejorar la precisión de la Gaussiana. La distribución gaussiana y gamma pertenece a la familia exponencial. Sin embargo, en este modelo, las probabilidades son discretas, en lugar de continuas. Los autores consideran que los priors y los likelihoods son independientes del ı́tem de interés, y actualizan incrementalmente la probabilidad posterior dada cada caracterı́stica. 0. p(ru,i = k|ru0 i = k ) = P. P (ru = k)P (ru0 = k 0 |ru = k) 00 0 00 k00 P (ru = k )P (ru0 = k |ru = k ). (2.13). Las probabilidades posteriores se combinan para encontrar el valor esperado del voto.. E(ru,i ) =. X. P (ru,i = k)k. (2.14). k∈K. Para calcular las probabilidades anteriores (prior) se considera la cantidad de veces que el usuario u ha dado un voto k a un ı́tem. Para el cálculo del likelihood.

(40) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 40. se consideran las diferencias en los votos del usuario. Éstas diferencias ru − ru0 son modeladas desde una distribución gaussiana. El modelo no es estrictamente gaussiano se hacen algunas simplificaciones removiendo constantes, por tanto los likelihoods llegan a ser discretos, en lugar de continuos. La ecuación es la siguiente: exp(−τu,u0 /2(k − k 0 − µu,u0 )2 ) 00 0 2 k00 exp(−τu,u0 /2(k − k − µu,u0 ) )). P (ru0 = k 0 |ru = k) = P. τu,u0 =. 1 σ2. (2.15). (2.16). Donde: µu,u0 Es la diferencia media entre los dos votos de usuarios. τu,u0 Es la precisión de la distribución gaussiana, o σ −2 la recı́proca de la varianza. El modelo puede ser incrementado considerando un prior Gaussian-Gamma, donde la media y la varianza son tratados como desconocidos, la media serı́a modelada por una gaussiana y la varianza por una distribución gamma. Según (Barnard y Prügel-Bennett, 2011), en estos modelos las creencias son la probabilidad de que un usuario asigne un voto de una clase dada a un ı́tem, y las caracterı́sticas son los votos realizados por otros usuarios. Para ello, se consideran los prior y los likelihoods.. 2.3.3.. Modelo de regresión Naı̈ve Bayes para filtrado colaborativo. En (S. Wen, Wang, Li, y Wen, 2018) proponen un algoritmo de recomendación de filtrado colaborativo basado en Naive Bayes. El modelo original de clasificación Naive Bayes se modifica dentro de un modelo de regresión bayesiano y se aplica a la recomendación de filtrado colaborativo con el objeto de mejorar la precisión. El algoritmo NBRMCF (por sus siglas en inglés) transforma el problema de la predicción de votos en un problema de clasificación. Los votos se consideran categorı́as de la clasificación, de esta forma para realizar la recomendación utilizando.

(41) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 41. el modelo Naı̈ve Bayes, el proceso de predecir el voto de usuarios se convertirá en el proceso de dividir usuarios e ı́tems en diferentes categorı́as de calificación. Los valores de los atributos y los valores de las categorı́as se discretizan para simplificar la complejidad del modelo de regresión de Naı̈ve Bayes. Además se cambian los resultados de clasificación a un resultado de regresión, es decir que este modelo lleva a cabo la regresión lineal de los valores de clasificación discretizados, multiplicando la probabilidad de cada clase de clasificación por el valor del voto para obtener el valor matemático esperado, el cual se utiliza como resultado final. Basado en esto, los pasos para aplicar el algoritmo son los siguientes:. Determinación del usuario e ı́tem como atributo caracterı́stico: se selecciona un conjunto de usuarios U y un conjunto de ı́tems I como atributos caracterı́sticos, el conjunto de clasificación Ri , con s categorı́as de clasificación. Los votos suelen ser números enteros y se redondean si el voto es un decimal.. Obtención de los ejemplos de entrenamiento: los datos de entrada se pueden expresar en forma de una matriz de votos usuario-ı́tems. La matriz consta de m usuarios e n ı́tems. Se define ra,b ∈ R como el valor del voto del ı́tem i dado por el usuario a.. Cálculo de la probabilidad de cada categorı́a de clasificación. Cuenta el número de cada tipo de calificación N U M− Ri y el número de calificaciones NUM. Entonces la probabilidad de cada clasificación se calcula como: P (Ri ) =. N U M− Ri NUM. (2.17). Cálculo de las probabilidades prior: dado que, P (Ri ) y P (Ua |Ri ) y P (Ib |Ri ) como condición, en este método la probabilidad prior se obtiene como: P (X|Ri ) = P (Ua , Ib |Ri ) = P (Ua |Ri ) ∗ P (Ib |Ri ). (2.18).

(42) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 42. Obtención del valor esperado: en el método original de naive bayes, usualmente el valor más grande de probabilidad previa de la categorı́a de clasificación es considerada como la categorı́a de clasificación final. Pero este método cambia el resultado de la clasificación a un resultado de regresión. Este método ya no usa la categorı́a de la probabilidad prior máxima como clasificación final. Este método calcula la probabilidad de la muestra X, donde X representa el ı́tem y el usuario que deben clasificarse.. P (X) =. s X i=1. P (X|Ri ) =. s X. P (Ri )P (Ua |Ri )P (Ib |Ri ). (2.19). i=1. Finalmente, se obtiene el valor matemático esperado E(X) de la muestra X como el voto final. s X P (X|Ri ) ∗ Ri (2.20) E(X) = P (X) i=1 En este trabajo podemos ver que las técnicas bayesianas no sólo pueden ser utilizadas para resolver problemas de clasificación, sino que estos métodos también pueden extenderse a problemas de regresión. En vista de que la regresión es utilizada para simular la relación existente entre dos o más variables, el método propuesto por estos autores predice el comportamiento de la variable dependiente (en este caso la clase ) a partir de un conjunto de variables independientes.. 2.4.. Modelos probabilı́sticos con factorización matricial. En el contexto de los RS de filtrado colaborativo los modelos probabilı́sticos están siendo muy utilizados en combinación con la factorización matricial, y algunos de ellos con información complementaria (por ejemplo, caracterı́sticas del usuario y/o ı́tem, preferencias explı́citas del usuario, información contextual, etc.). La factorización matricial es el método más popular de CF basado en modelos, algunas implementaciones probabilı́sticas de este método son PMF (Salakhutdinov.

(43) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 43. y Mnih, 2007), BNMF (Hernando y cols., 2016), GGMCF (Luo y cols., 2017), etc., ası́ mismo se tienen algunas combinaciones de PMF con enfoques basados en usuario e ı́tems. En este apartado se describen estos modelos, algunos de los cuales se presentan en la figura 2.1.. 2.4.1.. Factorización matricial probabilı́stica. La factorización matricial probabilı́stica (PMF), es un modelo de análisis factorial, que consiste en un modelo lineal gaussiano de variable latente restringido. Esto es, si tenemos un conjunto de datos de N usuarios y M ı́tems, y una matriz de votos R de N × M , este modelo consiste en encontrar dos matrices P ∈ RK×N que hace referencia a los usuarios y Q ∈ RK×M , a los ı́tems. Siendo Pi , Qj con i ∈ {1, 2, ..., N } y j ∈ {1, 2, ..., M }, vectores columna correspondientes a la u−ésima columna de P y i−ésima columna de Q, respectivamente. En este caso K es el tamaño de las caracterı́sticas latentes. En este modelo se define la distribución condicional sobre las calificaciones observadas, Ri,j que representa el voto del ı́tem j dado por el usuario i , calculado en base a las matrices latentes P y Q. La distribución condicional sobre los votos observados estarı́a dado por (Salakhutdinov y Mnih, 2007): p(R|P, Q, σ 2 ) =. N Y M Y . Iij η(Ri,j |PiT Qj , σ 2 ). (2.21). i=1 j=1. Donde η(x|µ, σ 2 ) es la función de densidad de probabilidad de la distribución gaussiana con media µ y varianza σ 2 , Iij es la función indicadora que es igual a 1 si el usuario i calificó el ı́tem j y es igual a 0 en caso contrario. La distribución prior gaussiana sobre el vector de caracterı́sticas del usuario P e ı́tem Q, se obtienen con las siguientes ecuaciones (Jung y Lease, 2012):. P (σP2 ). =. N Y i=1. η(Pi |µP , σP2 I). (2.22).

(44) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 2 Q(σQ ). =. M Y. 2 η(Qj |µQ , σQ I). 44. (2.23). j=1. En este caso I denota una matriz identidad de dimensión K , donde µP = 0, 2 µQ = 0 y σP2 = σP IK , σQ = σQ IK que serı́an matrices diagonales. En base a estos datos se obtiene la distribución posterior del modelo, tal y como se muestra en (Salakhutdinov y Mnih, 2007), donde la estimación de los parámetros del modelo anterior se puede encontrar utilizando el método del logaritmo de estimación de máxima verosimilitud, en base al logaritmo de la distribución posterior. La predicción del voto se lleva a cabo multiplicando el vector de usuario correspondiente y vector de ı́tems Pu y Qi respectivamente (2.21). Lo ideal de este modelo probabilı́stico, es que la predicción se expresa en términos de la distribución predictiva sobre R que es gaussiana en lugar de simplemente una estimación puntual. El resultado será una matriz completa de votos estimados. En este sentido, los nuevos votos de los ı́tems que aún no han sido votados son estimados. Este método presenta una muy buena escalabilidad, puesto que, una vez aprendido el modelo, el cálculo de las predicciones se realiza en un tiempo mı́nimo, además proporciona unos resultados excelentes en cuanto a calidad de predicciones y recomendaciones. Sin embargo, el algoritmo PMF tiene una deficiencia: la transformación de la matriz de votaciones en matrices de factores latentes es altamente abstracta para los usuarios y, por ende, dificulta la interpretación de resultados.. 2.4.2.. Modelo bayesiano de factorización matricial no negativa. Esta técnica se basa en un modelo probabilı́stico bayesiano de factorización no negativa para filtrado colaborativo (BNMF, por sus siglas en ingles) presentado.

Referencias

Documento similar

La consulta d’aquesta tesi queda condicionada a l’acceptació de les següents condicions d'ús: La difusió d’aquesta tesi per mitjà del servei TDX (www.tdx.cat) i a través

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de

Los Sistemas de Detección de Intrusos son sistemas que nos permiten detectar la presencia de personas ajenas a un sistema (red, aplicaciones, ordenador(hosts), información...),

Nuestro vector de entrada estará conformado por los siguientes atributos: el código de identidad de la estación base actualmente en servicio (BSIC), el código

Nos parece interesante hacer una referencia especial a este concepto de &#34;exis- tencia&#34; (astitva) que desarrolla el atado texto de Shfidhára. Arnarakosha), su &#34;naturaleza

El desarrollo de la aplicación estará basado en herramientas de desarrollo de software establecidas como el sistema de transformaciones de modelos ATL, desarrollada por

Esta información resulta útil para el diseñador de la interfaz, que puede decidir modificar el modelo CUI (en el caso del proceso “1” de la Figura 3), o bien modelos de más