Sistema recomendador híbrido basado en modelos probabilísticos

Texto completo

(1)Universidad Politécnica de Madrid Escuela Técnica Superior de Ingenierı́a de Sistemas Informáticos Doctorado en Ciencias y Tecnologı́as de la Computación para Smart Cities. Tesis Doctoral Sistema recomendador hı́brido basado en modelos probabilı́sticos. Autor Priscila Marisela Valdiviezo Diaz. Directores Dr. Jesús Bobadilla. Dr. Antonio Hernando. Septiembre 2019.

(2) 2. TRIBUNAL Tribunal nombrado por el Sr. Rector Magnı́fico de la Universidad Politécnica de Madrid, el dı́a de de 2019.. Presidente: D. Fernando Ortega Requena (Universidad Politécnica de Madrid) Vocales:. D. Miguel Ángel Patricio Guisado (Universidad Carlos III de Madrid) D. Francisco Javier Garcı́a Algarra (U-tad: Centro Universitario de Tecnologı́a y Arte Digital) D. Alejandro Martin (Universidad Autónoma de Madrid). Secretario: D. Abraham Gutierrez (Universidad Politecnica de Madrid) Suplente: Suplente:. D. Antonio González Pardo (Universidad Autónoma de Madrid) D. Luis Usero Aragonés (Universidad de Alcalá de Henares). de Realizado el acto de lectura y defensa de la Tesis el dı́a de 2019 en la Escuela Técnica Superior de Ingenierı́a de Sistema Informáticos de la Universidad Politécnica de Madrid. Calificación:. EL PRESIDENTE. LOS VOCALES. EL SECRETARIO.

(3) Resumen Los sistemas de recomendación están diseñados para proporcionar recomendaciones a los usuarios por medio de un análisis de preferencias pasadas. Para lograr esto, los sistemas de recomendación utilizan técnicas de filtrado de información, las más conocidas son: filtrado colaborativo, filtrado basado en contenido, filtrado demográfico e hı́brido. El filtrado colaborativo calcula las recomendaciones en función de las votaciones que la comunidad de usuarios ha realizado sobre un conjunto de ı́tems. Hay dos enfoques de filtrado colaborativo: basados en la memoria, que generalmente proporciona recomendaciones inexactas pero explicables; y basado en modelos, cuyas recomendaciones son más precisas pero difı́ciles de entender. En la actualidad, se ha incrementado el desarrollo de sofisticados algoritmos de aprendizaje automático que se pueden usar en el contexto de los sistemas de recomendación. En esta tesis doctoral primero se presenta una revisión comprensiva sobre los enfoques basados en modelos para sistemas de recomendación de filtrado colaborativo, resaltando las ventajas y desventajas identificadas entorno a estos modelos. Luego, en base a las ventajas que ofrecen los enfoques basados en modelos probabilı́sticos, se propone un modelo bayesiano que combina el espacio de usuarios e ı́tems, y que proporciona tan buenos resultados como los modelos de factorización matricial, pero que a diferencia de éstos, genera una representación fácilmente interpretable, por tanto las recomendaciones son fáciles de explicar. El modelo propuesto predice los nuevos votos de un usuario en función de los votos existentes en el conjunto de datos y éste permite fácilmente calcular una medida de confiabilidad relacionada con las predicciones. La confiabilidad se puede definir como la certeza que tiene el sistema de recomendación en el cálculo de las predicciones. Se realizaron algunos experimentos con el objeto de comparar el enfoque propuesto con varios modelos de lı́nea base, los cuales fueron seleccionados tanto de 3.

(4) Resumen. 4. la familia de enfoques basados en factorización matricial y de aquellos que utilizan un enfoque probabilı́stico para explicar sus resultados. Para los experimentos, se procesaron cuatro conjuntos de datos públicos de filtrado colaborativo, éstos fueron: MovieLens, FilmTrust, Yahoo, BookCrossing. El modelo fue evaluado considerando algunas medidas de calidad estándar: Error medio absoluto (MAE) para evaluar la calidad de las predicciones; Precisión y Recall para evaluar la calidad de las recomendaciones y la ganancia acumulada descontada normalizada (nDCG) para medir la calidad de las listas de recomendaciones. Los resultados de los experimentos presentaron un mejor rendimiento con el enfoque propuesto utilizando nDCG en comparación con los métodos de lı́nea base, también se presenta mejoras significativas en la precisión de la predicción en dos de los conjuntos de datos probados y se obtiene buenos resultados en la calidad de las recomendaciones, especialmente cuando el número de recomendaciones es bajo..

(5) Abstract Recommender systems are designed to provide recommendations to users by means of an analysis of past preferences. To achieve this, recommender systems use information filtering techniques, these can be: Collaborative Filtering, Content-based Filtering, Demographic Filtering, and Hybrid. Collaborative Filtering computes the recommendations based on the ratings that the community of users have made over a set of items. There are two collaborative filtering approaches: memory-based, which usually provides inaccurate but explainable recommendations; and model-based, whose recommendations are more precise but hard to understand. Today’s has increased the development of sophisticated machine learning algorithms which can be used in recommendation systems context. In this doctoral thesis, firts is presented a comprehensive review the literature on modelbased approaches for recommender systems of collaborative filtering, highlighting strengths and weaknesses they provide. Then, based on the advantages offered by the approaches based on probabilistic models, a Bayesian model is proposed, that combines the space of users and items, and that provides as good results as the matrix factorization models, but unlike these, generates an easily interpretable representation, therefore, the recommendations are easy to explain. The proposed modelit predicts new ratings of a user based on the existing ratings in the dataset, and it allows to easily compute a measure of reliability associate to the predictions. Reliability can be defined as the certainty of the recommendation system in the calculation of predictions. Some experiments were performed in order to compare the proposed approach with several baseline models, which were selected both from the family of approaches based on matrix factorization and from those that use a probabilistic approach to explain their results. The experiments were carried out using four public datasets of collaborative filtering, these were: MovieLens, FilmTrust, Yahoo, 5.

(6) Abstract. 6. BookCrossing. The model was evaluated considering some standard quality measures: Mean Absolute Error (MAE) to evaluate the quality of the predictions; Precision and Recall to evaluate the quality of the recommendations and the Normalized Discounted Cumulative Gain (nDCG) to measure the quality of recommendation lists. The results of the experiments achieved a best performance in the quality measure nDCG compared to baseline methods, there are also significant improvements in the prediction accuracy in two of the tested datasets and good results are obtained in the quality of recommendations, especially when the number of recommendations is low..

(7) Agradecimientos En primer lugar quiero agradecer a Dios por la sabidurı́a, fortaleza y protección que me dio durante este tiempo de estudios y estancias fuera del paı́s, por siempre estar conmigo en los momentos más difı́ciles que pasé en este proceso de formación. Gracias a Él estoy cumpliendo esta meta propuesta. De igual manera, agradezco el apoyo de todas aquellas personas que de alguna forma me han ayudado en la realización de este trabajo. A mis directores de tesis y en especial agradezco al Dr. Fernando Ortega por su excelente asesorı́a, paciencia y amabilidad durante el desarrollo de esta tesis, quién además me brindó el apoyo necesario para que este trabajo llegara a buen término. Mi más sincero agradecimiento a la Universidad Técnica Particular de Loja y a la Fundación Carolina por el apoyo brindado para realizar mi formación doctoral. Finalmente, agradezco a mi madre y hermano por su confianza y comprensión, por sus ánimos en los momentos más difı́ciles y por siempre estar pendiente de mi desarrollo profesional y personal.. 7.

(8) Listado de Publicaciones Varios artı́culos resultantes de este trabajo de investigación han sido publicados en revistas y conferencias en el área de sistemas de recomendación.. Artı́culo: Valdiviezo-Diaz, P., Ortega, F., Cobos, E., Lara-Cabrera, R. (2019). A Collaborative Filtering approach based on Naive Bayes Classifier. IEEE Access, 7, 108581-108592, doi: 10.1109/ACCESS.2019.2933048. Factor de impacto: 4.098 Q1. Indexación: JCR. Artı́culo: Ortega, F., Rojo, D., Valdiviezo-Diaz, P., & Raya, L. (2018). Hybrid Collaborative Filtering based on Users Rating Behavior. IEEE Access, 6, 69582–69591, doi: 10.1109/ACCESS.2018.2881074. Factor de impacto: 4.098 Q1. Indexación: JCR. Artı́culo: Aguilar, J., Valdiviezo-Diaz, P., & Riofrio, G. (2016). A General Framework for Intelligent Recommender Systems. Applied Computing and Informatics, 13(2), 147–160, doi: 10.1016/j.aci.2016.08.002 Factor de impacto: 0.44 Q2. Indexación: SJR. Publicaciones en Congresos Artı́culo: Valdiviezo-Diaz, P., & Bobadilla, J. (2018). A hybrid approach of recommendation via extended matrix based on collaborative filtering with demographics information. In International Conference on Technology Trends, CITT 2018 (pp. 384–398). vol 895, Springer, Cham. Artı́culo: Aguilar, J., Valdiviezo-Diaz, P., & Riofrio, G. (2018). A Recom8.

(9) Listado de Publicaciones. 9. mender System Based on Cognitive Map for Smart Classrooms. In Proceedings of the International Conference on Information Technology Systems (ICITS 2018). Advances in Intelligent Systems and Computing, (pp. 427–442). Springer, Cham. Artı́culo: Valdiviezo, P., & Hernando, A. (2016). A Comprehensive View of Recommendation Methods based on Probabilistic Techniques. In A. Rocha, L. Reis, M. Cota, R. Goncalves, O. Suarez (Eds.), Iberian Conference on Information Systems and Technologies, CISTI (pp. 604–609). Gran Canaria, Spain: IEEE Computer Society..

(10) Índice general Resumen. 3. Abstract. 5. Agradecimientos. 7. Listado de Publicaciones. 8. 1. Introducción. 16. 1.1. Técnicas de recomendación . . . . . . . . . . . . . . . . . . . . . .. 17. 1.1.1. Filtrado colaborativo . . . . . . . . . . . . . . . . . . . . .. 17. 1.1.2. Filtrado basado en contenido . . . . . . . . . . . . . . . .. 19. 1.1.3. Filtrado demográfico . . . . . . . . . . . . . . . . . . . . .. 21. 1.1.4. Filtrado hı́brido . . . . . . . . . . . . . . . . . . . . . . . .. 21. 1.2. Enfoques de filtrado colaborativo basado en modelos . . . . . . .. 23. 1.2.1. Factorización matricial . . . . . . . . . . . . . . . . . . . .. 23. 1.2.2. Modelos probabilı́sticos . . . . . . . . . . . . . . . . . . . .. 23. 1.3. Motivación, Objetivos e Hipótesis . . . . . . . . . . . . . . . . . .. 24. 1.4. Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . .. 27. 2. Estado del arte sobre enfoques basados en modelos. 28. 2.1. Visión general . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 28. 2.2. Modelos basados en factorización matricial . . . . . . . . . . . . .. 33. 2.2.1. Factorización matricial con bias . . . . . . . . . . . . . . .. 33. 2.2.2. Factorización matricial no negativa . . . . . . . . . . . . .. 34. 2.2.3. Limitaciones de los modelos de factorización matricial . . .. 36. 2.3. Modelos probabilı́sticos . . . . . . . . . . . . . . . . . . . . . . . .. 36. 2.3.1. Método Naı̈ve Bayes mejorado . . . . . . . . . . . . . . . .. 37 10.

(11) Índice general. 11. 2.3.2. Modelo Gaussian-Gamma . . . . . . . . . . . . . . . . . .. 39. 2.3.3. Modelo de regresión Naı̈ve Bayes para filtrado colaborativo. 40. 2.4. Modelos probabilı́sticos con factorización matricial . . . . . . . . .. 42. 2.4.1. Factorización matricial probabilı́stica . . . . . . . . . . . .. 43. 2.4.2. Modelo bayesiano de factorización matricial no negativa . .. 44. 2.4.3. Modelo Gaussian-Gamma de filtrado colaborativo: Bayesiano jerárquico . . . . . . . . . . . . . . . . . . . . . . . .. 47. 2.4.4. Otros modelos probabilı́sticos basados en factorización matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 48. 2.5. Modelos basados en reglas . . . . . . . . . . . . . . . . . . . . . .. 51. 2.5.1. Basados en árboles . . . . . . . . . . . . . . . . . . . . . .. 52. 2.5.2. Basado en reglas de asociación . . . . . . . . . . . . . . . .. 53. 2.6. Ventajas y desventajas de los enfoques basados en modelos. . . .. 54. 2.7. Sumario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 58. 3. Método propuesto. 60. 3.1. Diseño del método . . . . . . . . . . . . . . . . . . . . . . . . . .. 60. 3.1.1. Componentes del método propuesto . . . . . . . . . . . . .. 61. 3.1.2. Clasificador Naive Bayes . . . . . . . . . . . . . . . . . . .. 61. 3.2. Formulación del método propuesto . . . . . . . . . . . . . . . . .. 63. 3.2.1. Enfoque basado en el usuario . . . . . . . . . . . . . . . .. 64. 3.2.2. Enfoque basado en ı́tems . . . . . . . . . . . . . . . . . . .. 65. 3.2.3. Enfoque hı́brido . . . . . . . . . . . . . . . . . . . . . . . .. 66. 3.3. Cálculo de la predicción . . . . . . . . . . . . . . . . . . . . . . .. 66. 3.4. Cálculo de confiabilidad . . . . . . . . . . . . . . . . . . . . . . .. 67. 3.5. Ejemplo de ejecución . . . . . . . . . . . . . . . . . . . . . . . . .. 68. 3.6. Algoritmo NBCF . . . . . . . . . . . . . . . . . . . . . . . . . . .. 72. 4. Experimentos y resultados. 74. 4.1. Configuración del experimento . . . . . . . . . . . . . . . . . . . .. 74. 4.2. Medidas de calidad . . . . . . . . . . . . . . . . . . . . . . . . . .. 78. 4.2.1. Calidad de las predicciones . . . . . . . . . . . . . . . . . .. 78. 4.2.2. Calidad de las recomendaciones . . . . . . . . . . . . . . .. 80. 4.2.3. Calidad de las listas de recomendaciones . . . . . . . . . .. 83. 4.2.4. Medidas de calidad seleccionadas . . . . . . . . . . . . . .. 85. 4.3. Desempeño del clasificador . . . . . . . . . . . . . . . . . . . . . .. 86.

(12) Índice general. 4.4. 4.5. 4.6. 4.7.. 4.3.1. MovieLens . . . . . . . . . . . . . . 4.3.2. FilmTrust . . . . . . . . . . . . . . 4.3.3. Yahoo . . . . . . . . . . . . . . . . 4.3.4. BookCrossing . . . . . . . . . . . . Desempeño del sistema de recomendación . Medida de confiabilidad . . . . . . . . . . Análisis de complejidad computacional . . Discusión . . . . . . . . . . . . . . . . . .. 12. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . . . . . . . .. . 86 . 87 . 88 . 90 . 91 . 100 . 101 . 102. 5. Explicación de recomendaciones 104 5.1. Modelos de recomendación explicables . . . . . . . . . . . . . . . 105 5.2. Explicación de recomendaciones con el método propuesto . . . . . 108 6. Conclusiones y trabajo futuro. 113. Referencias. 116.

(13) Índice de figuras 1.1. Esquema de los elementos que intervienen en un RS. . . . . . . .. 22. 1.2. Fundamentos de la propuesta . . . . . . . . . . . . . . . . . . . .. 25. 2.1. Clasificación de los enfoques basados en modelos. . . . . . . . . .. 30. 4.1. (a) matriz de confusión; (b) matriz de confusión normalizada; (c) matriz de confusión discretizando el voto (NoGusta = 1, 2, 3, Gusta = 4, 5); (d) Matriz de confusión normalizada discretizando el voto. Conjunto de datos de MovieLens-1M . . . . . . . . . . . . . . . .. 87. 4.2. (a) matriz de confusión; (b) matriz de confusión normalizada; (c) matriz de confusión discretizando el voto (NoGusta = 1, 2, 3, Gusta = 4, 5); (d) Matriz de confusión normalizada discretizando el voto. Conjunto de datos FilmTrust . . . . . . . . . . . . . . . . . . . .. 88. 4.3. (a) matriz de confusión; (b) matriz de confusión normalizada; (c) matriz de confusión discretizando el voto (NoGusta = 1, 2, 3, Gusta = 4, 5); (d) Matriz de confusión normalizada discretizando el voto. Conjunto de datos Yahoo . . . . . . . . . . . . . . . . . . . . . . .. 89. 4.4. (a) matriz de confusión; (b) matriz de confusión normalizada; (c) matriz de confusión discretizando el voto (NoGusta = 1, 2, 3, Gusta = 4, 5); (d) Matriz de confusión normalizada discretizando el voto. Conjunto de datos BookCrossing . . . . . . . . . . . . . . . . . .. 90. 4.5. Ganancia acumulada descontada normalizada (nDCG) para el conjunto de datos MovieLens . . . . . . . . . . . . . . . . . . . . . .. 92. 4.6. Precisión y Recall de cada método de recomendación para el conjunto de datos MovieLens . . . . . . . . . . . . . . . . . . . . . .. 93. 4.7. Ganancia acumulada descontada normalizada (nDCG) para el conjunto de datos FilmTrust . . . . . . . . . . . . . . . . . . . . . . .. 94 13.

(14) Índice de figuras. 14. 4.8. Precisión y Recall de cada método de recomendación para el conjunto de datos FilmTrust . . . . . . . . . . . . . . . . . . . . . . . 95 4.9. Ganancia acumulada descontada normalizada (nDCG) para el conjunto de datos Yahoo . . . . . . . . . . . . . . . . . . . . . . . . . 96 4.10. Precisión y Recall de cada método de recomendación para el conjunto de datos Yahoo . . . . . . . . . . . . . . . . . . . . . . . . . 97 4.11. Ganancia acumulada descontada normalizada (nDCG) para el conjunto de datos BookCrossing . . . . . . . . . . . . . . . . . . . . . 98 4.12. Precisión y Recall de cada método de recomendación para el conjunto de datos BookCrossing . . . . . . . . . . . . . . . . . . . . . 99 4.13. Confiabilidad de la recomendación en (a) conjunto de datos MovieLens, (b) conjunto de datos FilmTrust, (c) conjunto de datos Yahoo y (d) conjunto de datos BookCroosing. . . . . . . . . . . . 101 5.1. 5.2. 5.3. 5.4.. Matriz de votos . . . . . . . . . . . . . . . . . . . . . . . . . Naı̈ve Bayes based Collaborative Filtering - NBCF (usuario) Naı̈ve Bayes based Collaborative Filtering - NBCF (ı́tems) . Naı̈ve Bayes based Collaborative Filtering - NBCF (hı́brido). . . . .. . . . .. . . . .. 110 110 111 112.

(15) Índice de tablas 2.1. Caracterı́sticas de los modelos probabilı́sticos. . . . . . . . . . . .. 58. 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. 3.8.. 68 69 69 70 71 71 71 72. Ejemplo de matriz de votos . . . . . . . . . . . . . . . . . . . . . Probabilidad prior del ı́tem i1 usando el enfoque basado en el usuario Probabilidad prior del usuario u1 usando el enfoque basado en ı́tem Likelihood del ı́tem i1 basado en el voto del usuario u1 . . . . . . Likelihood del usuario u1 basado en el voto del ı́tem i1 . . . . . . Valor de clasificación, usando el enfoque basado en el usuario . . . Valor de clasificación, usando el enfoque basado en ı́tem . . . . . . Valor de clasificación, usando el enfoque hı́brido . . . . . . . . . .. 4.1. Principales propiedades de los datasets usados en los experimentos 4.2. Métodos de lı́nea base de CF utilizados para comparar los resultados con el método propuesto . . . . . . . . . . . . . . . . . . . . . 4.3. Principales hiperparámetros utilizados en los experimentos. Datasets: MovieLens, FilmTrust, Yahoo, BookCrossing . . . . . . . . . 4.4. Error medio absoluto (MAE) del desempeño de las predicciones de los votos de test. . . . . . . . . . . . . . . . . . . . . . . . . . . .. 75 76 77 91. 15.

(16) Capı́tulo 1 Introducción Los sistemas de recomendación (RS, por sus siglas en inglés) se están convirtiendo en una alternativa para enfrentar el problema de la sobrecarga de información en la web (Lu, Wu, Mao, Wang, y Zhang, 2015). Estos sistemas están diseñados para proporcionar recomendaciones a usuarios registrados mediante un análisis de preferencias pasadas o en base a preferencias de usuarios similares (Ricci, Rokach, Shapira, y Kantor, 2011). RS actúa como un filtro que permite pasar la información relevante al usuario y bloquea la información irrelevante. Para este proceso, algunas técnicas de filtrado de información en RS y algoritmos de aprendizaje automático pueden ser usados. Las técnicas de recomendación más conocidas son el filtrado basado en contenido (CBF, por sus siglas en inglés), el filtrado colaborativo (CF, por sus siglas en inglés), filtrado demográfico, y filtrado hı́brido (Bobadilla, Ortega, Hernando, y Gutiérrez, 2013). En (Aguilar, Valdiviezo-Dı́az, y Riofrio, 2016) se presentan otras técnicas de recomendación como aquellas basadas en el conocimiento y en la comunidad. Los sistemas de recomendación se han utilizado ampliamente en diferentes dominios de aplicación, con el objeto de recomendar una variedad de ı́tems, ası́ podemos citar entre otros (Ricci y cols., 2011; Park, Kim, Choi, y Kim, 2012): Comercio electrónico: libros, dispositivos electrónicos, etc. Entretenimiento: programas de televisión, pelı́culas, música, juegos, etc. Turismo electrónico: restaurantes, servicios de viajes, casas en renta, etc. Educación: recursos educativos, cursos, etc. 16.

(17) Capı́tulo 1. Introducción. 17. En el dominio del comercio electrónico, por ejemplo, la recomendación se basa en algoritmos de CF. Podemos citar, la ventas por Amazon, las pelı́culas por Netflix que son seleccionadas en función de RS. En la literatura podemos encontrar dos enfoques de CF: a) basado en la memoria, que generalmente proporciona recomendaciones inexactas pero explicables, éste se divide principalmente en dos tipos: enfoques basados en el usuario y basados en ı́tems; b) basado en modelos, cuyas recomendaciones son más precisas pero difı́ciles de entender. Hoy en dı́a, los métodos basados en modelos están logrando mejores resultados en precisión y rendimiento. La implementación más popular del enfoque basado en modelos es la factorización matricial (MF, por sus siglas en inglés) (Koren, Bell, y Volinsky, 2009). En el contexto de RS, el principal problema de la factorización matricial es que el espacio latente aprendido no es fácil de interpretar (K. Wang y Tan, 2011), por lo que estos modelos no son susceptibles de explicar sus resultados (Rastegarpanah, Crovella, y Gummadi, 2017). En esta tesis se direcciona este problema creando un modelo probabilı́stico que el usuario puede interpretar. El modelo propuesto combina enfoques basados en el usuario y en el ı́tem. Para explicar en detalle el método propuesto, en este capı́tulo se abordan los conceptos fundamentales que involucran los sistemas de recomendación, se hace referencia a enfoques de factorización matricial y probabilı́sticos que son de interés en esta investigación. Luego se presenta la motivación e hipótesis de esta tesis. Finalmente se presenta la estructura de la tesis.. 1.1.. Técnicas de recomendación. En la literatura se distinguen diferentes enfoques de recomendación, entre ellos tenemos:. 1.1.1.. Filtrado colaborativo. En este enfoque las recomendaciones se calculan en función de las votaciones que la comunidad de usuarios ha realizado sobre un conjunto de ı́tems (Bobadilla y cols., 2013). Estos enfoques buscan similaridad entre los patrones de votación de los usuarios y hacen sugerencias de ı́tems que fueron considerados por otros usuarios en el pasado. Los sistemas de recomendación basados en CF utilizan una matriz de votos en la que cada usuario proporciona información sobre cuánto le.

(18) Capı́tulo 1. Introducción. 18. gusta o no le gustan algunos ı́tems. Ası́, los métodos de CF actúan directamente sobre la matriz de votos para calcular las predicciones y recomendaciones. El CF puede subdividirse en enfoques basados en modelos y en memoria. En los enfoques basados en memoria la información a recomendar se obtiene directamente de la matriz de votos (Zhu, Hurtado, Bobadilla, y Ortega, 2018). La implementación más habitual del enfoque basado en memoria es KNN (K-NearestNeighbour )(Z. Wen, 2008), el cual captura relaciones similares entre usuarios o ı́tems según la matriz de votos, luego recomiendan los ı́tems que son altamente calificados por los usuarios similares al usuario activo (Yang, Wu, Zheng, Wang, y Lei, 2016), en este sentido el sistema de recomendación encuentra vecinos para un cierto usuario o ı́tem y calcula el valor de predicción para el voto desconocido. El método de recomendación basado en la memoria se puede subdividir en dos tipos: CF basado en el usuario y CF basado en ı́tems (Ricci y cols., 2011). Los métodos basados en el usuario predicen las votaciones de los usuarios activos basándose en las votaciones de los usuarios similares, y los enfoques basados en ı́tems predicen las votaciones del usuario en base a la información de ı́tems similares a los elegidos por el usuario activo. Los sistemas basados en memoria son la técnica más popular utilizada en aplicaciones de sistemas de filtrado colaborativo, son simples, fáciles de implementar y permiten explicar las recomendaciones que proporcionan (Hernando, Bobadilla, y Ortega, 2016). Las explicaciones con técnicas basadas en vecindarios son sencillas, ya que las recomendaciones se deducen directamente del comportamiento de los usuarios anteriores (Hu, Volinsky, y Koren, 2008), pero éstas no son precisas. Los métodos basados en memoria usualmente aplican métricas de similitud para obtener el parecido entre dos usuarios o dos ı́tems (Bobadilla y cols., 2013). Éstas pueden ser: Correlación de Pearson, Spearman Rank, Coseno, Jaccard, etc. Por otro lado, en el enfoque basado en modelos, se crea un modelo a partir de la matriz de votaciones, que posteriormente se utiliza para hacer recomendaciones. Algunos ejemplos de métodos basados en modelos son entre otros, la factorización matricial (Salakhutdinov y Mnih, 2007), las redes bayesianas (Du y Chen, 2013), clustering (Bobadilla, Bojorque, Hernando, y Hurtado, 2018), reglas (Ali y cols., 2018), y enfoques basados en grafos (Fouss, Pirotte, Renders, y Saerens, 2007), son técnicas que trabajan exitosamente con sistemas de filtrado colaborativo basado en modelos. En contraste con el enfoque basado en la memoria, el basado en modelos (es-.

(19) Capı́tulo 1. Introducción. 19. pecialmente la factorización matricial) ofrecen recomendaciones confiables pero son difı́ciles de explicar, porque todas las acciones pasadas del usuario se introducen en un modelo abstracto, bloqueando la relación directa entre las acciones pasadas del usuario y las recomendaciones proporcionadas (Hu y cols., 2008). Sin embargo, existen otro tipo de modelos como los probabilı́sticos que brindan facilidades en la explicación y justificación de las recomendaciones. Los enfoques de filtrado colaborativo se enfrentan a problemas como (Aghdam, Analoui, y Kabiri, 2015; Parambath, 2013): Dispersión de la matriz de votos (Sparsity): este problema surge porque los usuarios no votan todos los ı́tems, es decir, los usuarios únicamente votan un pequeño porcentaje de los ı́tems que hay registrados en el sistema, y esto puede dar lugar a que el rendimiento del sistema disminuya. Escalabilidad: en los sistemas de recomendación el número de usuarios e ı́tems puede ser bastante grande, lo cual puede retardar el proceso de recomendación de manera significativa. Arranque en frı́o (Cold-start): en vista de que los sistemas de colaboración realizan la predicción basados en el voto de un usuario similar, surgen tres problemas de arranque en frı́o: nueva comunidad, nuevo ı́tem y nuevo usuario. El problema de nueva comunidad se da al iniciar con el sistema de recomendación, cuando existen pocos votos y todavı́a no existe información para aprender nada. Por tanto el sistema necesitarı́a obtener suficiente información de votos para poder realizar predicciones confiables. En el problema de nuevos ı́tems, si un ı́tem no ha sido votado, no tiene probabilidad de ser recomendado, o si ha sido votado por pocos usuarios, los resultados del sistema pueden ser muy sesgados. En el problema de nuevos usuarios, cuando un nuevo usuario ingresa al sistema no se tiene información de lo que le interesa, por tanto no es posible realizar las recomendaciones. De ahı́ que, el CF tiene como desventaja que el usuario siempre tiene que proporcionar algún voto, aunque no tenga una opinión formada sobre el ı́tem.. 1.1.2.. Filtrado basado en contenido. Puede diseñarse para recomendar ı́tems similares a los que a un usuario predeterminado le gustó en el pasado (Ricci y cols., 2011). Éstos utilizan información.

(20) Capı́tulo 1. Introducción. 20. de los ı́tems para la predicción. La información de los ı́tems es importante para predecir su relevancia basado en un perfil de usuario, el cual incluye los gustos, preferencias y otras caracterı́sticas, y sólo los ı́tems que tienen un alto grado de similitud con el perfil del usuario son recomendados (T.-m. Chang y Hsiao, 2013). Entre los métodos basados en modelos mayormente utilizados en RS basados en contenido, son: el método Latent Dirichlet Allocation (LDA) (Blei, Ng, y Jordan, 2003), un modelo generativo probabilı́stico no supervisado que puede ser utilizado para encontrar contenido semántico oculto en un corpus de texto. Este modelo permite modelar grandes corpus de texto, y generar aleatoriamente los documentos que se observan en este corpus; Análisis Semántico Probabilı́stico Latente (PLSA, también llamado PLSI por sus siglas en inglés), es una técnica de factorización matricial, que descompone la matriz de apariciones de palabras/ı́tems, en dos matrices que van a tener un significado probabilı́stico. Los ı́tems y las palabras están caracterizadas por una distribución de probabilidad la cual indica el grado de pertenencia de un ı́tem o palabra hacia un tópico u otro (Ekstrand, Riedl, y Konstan, 2011). El enfoque basado en contenido tiene las siguientes limitaciones: Análisis de contenido limitado: está relacionado con la eficacia de las palabras claves y con las caracterı́sticas asociadas a los ı́tems, por tanto, las técnicas basadas en el contenido están limitadas a las caracterı́sticas que se asocian con los ı́tems que estos sistemas recomiendan (Ricci, Rokach, y Shapira, 2015). Sobre especialización: dado que los sistemas basados en contenido sólo recomiendan ı́tems que tienen un alto grado de similitud con aquellos preferidos en el pasado, el usuario está limitado a que el sistema le recomiende ı́tems que son similares a esos que ya fueron puntuados. Por tanto, el conjunto de ı́tems recomendados podrı́a ser obvio y demasiado homogéneo (Lops, Gemmis, y Semeraro, 2011). Problema de nuevos usuarios (cold-start): el usuario tiene que evaluar un número suficiente de ı́tems antes de que un sistema de recomendación basado en contenido pueda entender las preferencias del usuario y proporcionar recomendaciones confiables. Esto además significa que los sistemas de recomendación deben ser lo suficientemente capaces para brindar recomendaciones no triviales para un usuario sin suficientes recomendaciones previas.

(21) Capı́tulo 1. Introducción. 21. en su perfil (Adomavicius y Tuzhilin, 2005).. 1.1.3.. Filtrado demográfico. Los sistemas están basados en información demográfica del usuario, como: la edad, género, ciudad, lenguaje, sexo, opiniones que tienen los usuarios sobre los ı́tems (Bobadilla y cols., 2013), etc. Esta información es necesaria para conocer las preferencias comunes entre los usuarios y ası́ generar las recomendaciones. En esta técnica de recomendación se clasifica al usuario según sus atributos personales. De acuerdo a (Pazzani, 2000) las recomendaciones pueden estar basadas en información sobre otros usuarios del grupo al que pertenecen. Un problema con este tipo de filtrado es la de obtener información demográfica que puede ser una tarea difı́cil y necesariamente se deberı́a obtener información del usuario para poder hacer la recomendación. Algunos trabajos desarrollados que incorporan información demográfica son: (Valdiviezo-Dı́az y Bobadilla, 2018), el cual usa el enfoque de matriz extendida para incorporar información demográfica del usuario. En (H. Zhang, Nikolov, y Ganchev, 2017) proponen el uso de perfiles de usuario combinados, que son aprendidos de los ı́tems vistos por el usuario.. 1.1.4.. Filtrado hı́brido. Combina dos o más enfoques de recomendación para tener un mejor funcionamiento. Se utilizan comúnmente el filtrado colaborativo con otra técnica que reduzca problemas de recomendación con nuevos ı́tems (Valdiviezo y Hernando, 2016). Estos sistemas tratan de mejorar todas las limitaciones que tienen los demás enfoques de recomendación, por ejemplo: CF se basa sólo en información de votos, y descarta caracterı́sticas significativas de usuarios e ı́tems; CBF emplea caracterı́sticas de usuarios e ı́tems, pero ignora los votos del usuario. Actualmente se han propuesto enfoques de filtrado hı́brido para integrar información ya sea del usuario o del ı́tem, por ejemplo: información demográfica del usuario o preferencias explı́citas del usuario, metadatos de ı́tems o algún otro contenido del ı́tem, etc., con el objeto de mejorar la calidad de las recomendaciones. Un modelo hı́brido que combina filtrado colaborativo y filtrado demográfico usando un modelo de factorización matricial, se presenta en (Valdiviezo-Dı́az y Bobadilla, 2018). En (Tiwari y Potter, 2015), se propone un sistema de recomen-.

(22) Capı́tulo 1. Introducción. 22. dación para el usuario combinando filtrado colaborativo en los datos de transacción con el voto estimado, la información demográfica del usuario y la similitud del ı́tem. También es posible construir sistemas hı́bridos combinando los enfoques basados en memoria y basado en modelos correspondientes a una misma técnica de recomendación. Por ejemplo algunos trabajos que combinan enfoques de CF basado en el usuario y basado en ı́tems dentro de un enfoque basado en modelo son los presentados por (Zhao, Sun, Han, y Peng, 2016; Kumar y Fan, 2015; Valdiviezo-Diaz, Ortega, Cobos, y Lara-Cabrera, 2019). La figura 4.4 contiene un resumen de lo anteriormente explicado: Sistemas de Recomendación Enfoques híbridos. Filtrado Colaborativo. Filtrado Demográfico. Basado en Contenido. híbrido. Basado en Modelos. Basado en Memoria. LDA, PLSI Documentos Palabras - Tópicos. Factorización Matricial. Modelos probabilísticos. Basado en usuarios. Basado en ítems KNN, medidas de similaridad. Matriz de votos usuario-ítem. Predicción Recomendación. Figura 1.1: Esquema de los elementos que intervienen en un RS En la figura anterior podemos observar los tipos de enfoques de sistemas de recomendación más utilizados en la literatura y los métodos de recomendación que se pueden utilizar en cada uno de ellos. Se observa también que un enfoque hı́brido puede estar formado por la combinación de varias técnicas de recomendación (CF y CBF, CF y Demográfico, etc.), o por la combinación de diferentes algoritmos.

(23) Capı́tulo 1. Introducción. 23. de CF, a fin de mejorar el desempeño del sistema.. 1.2.. Enfoques de filtrado colaborativo basado en modelos. La mayorı́a de los enfoques actuales de filtrado colaborativo se enfrentan a tres problemas: dispersión, escalabilidad y cold-start (Parambath, 2013; Aghdam y cols., 2015). Adicional a éstos, en (Mohamed, Khafagy, y Ibrahim, 2019) se mencionan otros desafı́os como: Sobre-especialización, Diversidad, Novedad, etc., que también necesitan ser investigados y solucionados. Estos problemas se han abordado desde una amplia gama de perspectivas que aplican diferentes métodos en orden a proporcionar recomendaciones. A continuación se mencionan algunos de ellos.. 1.2.1.. Factorización matricial. La factorización matricial se ha convertido en una de las técnicas principales para dar solución a los problemas de escalabilidad. La factorización matricial es un método basado en modelos, donde los votos del usuario a ı́tems se modelan con un conjunto de factores latentes, que representan las caracterı́sticas de los usuarios e ı́tems. Algunas implementaciones de este método son: Factorización Matricial con bias (BiasedMF) (Koren y Bell, 2015), Factorización Matricial Probabilı́stica (PMF, por sus siglas en inglés) (Salakhutdinov y Mnih, 2007), Factorización Matricial No Negativa (NMF, por sus siglas en inglés) (L. Zhang, Chen, Zheng, y He, 2011), Factorización Matricial No Negativa Bayesiana (BNMF, por sus siglas en inglés) (Hernando y cols., 2016).. 1.2.2.. Modelos probabilı́sticos. En la literatura hay algunos métodos de recomendación desarrollados a partir de la teorı́a de la probabilidad. De acuerdo a (Ekstrand y cols., 2011) estos métodos por lo general tienen como objetivo construir modelos probabilı́sticos del comportamiento del usuario y usar esos modelos para predecir el comportamiento futuro. Los modelos probabilı́sticos han sido desarrollados tanto para ser usados en enfoques de filtrado colaborativo (ejemplo: PMF, BNMF), como en aquellos.

(24) Capı́tulo 1. Introducción. 24. basados en contenidos (LDA, PLSA), algunos de ellos se mencionaron también en el apartado anterior. De acuerdo a (Herlocker, Konstan, y Riedl, 2000), las explicaciones de recomendaciones de RS adecuadas conducen a una mayor confianza del usuario. Por lo tanto, es necesario tener modelos de recomendación que permitan justificar correctamente sus predicciones. Los modelos probabilı́sticos son una alternativa para este proceso. Hoy en dı́a, los métodos basados en modelos probabilı́sticos están logrando mejores resultados en precisión y rendimiento, ya que éstos presentan buen desempeño de predicción. Algunos trabajos desarrollados recientemente con este tipo de modelos para enfoques de filtrado colaborativo, son discutidos en el capitulo 2.. 1.3.. Motivación, Objetivos e Hipótesis. Diversas propuestas de enfoques de recomendación basados en modelos se han centrado en solucionar algunos de los problemas que enfrentan los sistemas de recomendación como: escalabilidad, interpretabilidad, cold-start, calidad de las predicciones, etc., sin embargo los resultados que proporcionan siguen siendo difı́ciles de interpretar. Si bien es cierto los enfoques basados en la memoria son de fácil implementación y pueden explicar fácilmente sus resultados, pero éstos generalmente proporcionan peores recomendaciones que los basados en modelos. Los enfoques basados en modelos presentan un mejor desempeño en la predicción proporcionando recomendaciones altamente precisas, sin embargo los modelos, especialmente los basados en factorización matricial, siguen siendo demasiado abstractos para explicar las recomendaciones. Por otro lado, los modelos probabilı́sticos explican mejor sus resultados que los basados en factorización matricial, debido al concepto de probabilidad que es más cercano al usuario que el concepto de espacio de factores latentes. De ahı́ que el desarrollo de modelos que faciliten la explicación de sus recomendaciones es un tema que aún continua siendo explorado. Por lo tanto se ha visto la necesidad de entrar en el tema de los enfoques basados en modelos probabilı́stico aplicados a CF, que permitan explicar sus predicciones..

(25) Capı́tulo 1. Introducción. 25. Objetivo principal Desarrollar un modelo que proporcione recomendaciones tan certeras como las generadas mediante factorización matricial y que permita justificarlas. El objetivo principal de esta tesis se fundamenta principalmente en el siguiente esquema:. PMF factores abstractos valores negativos. >>. NMF factores abstractos. >>. BNMF. >>. factores abstractos probabilidades. Método Propuesto NBCF. probabilidadess. Figura 1.2: Fundamentos de la propuesta Se conoce que la factorización matricial probabilı́stica ofrece recomendaciones confiables pero su gran limitante es la explicación de sus resultados en términos de factores latentes. La principal problemática de estos factores, más allá de su alto nivel de abstracción, es la inclusión de factores negativos dentro del modelo de fatorización matricial. NMF restringe estos factores a solo valores positivos, pero las predicciones siguen estando sujetas a factores latentes, por lo que el problema de intentar dar un significado a estos factores continua estando presente. Actualmente se ha intentado juntar modelos que expliquen bien los resultados y que además tengan las virtudes de la factorización matricial, como por ejemplo BNMF (Hernando y cols., 2016) que ha sido desarrollado para aliviar el problema de la interpretación de resultados, aplicando un enfoque probabilı́stico para interpretar los factores de usuarios e ı́tems. Sin embargo, estos factores siguen siendo extremadamente abstractos para los usuarios. De ahı́ que, los modelos probabilı́sticos están siendo ampliamente estudiados dentro del CF porque brindan ventajas para la explicación de recomendaciones, además éstos están dando buenos resultados debido a que pueden aplicarse para modelar y razonar sobre la incertidumbre en el proceso de hacer las recomendaciones. De acuerdo a la figura 1.2 se ha ido convergiendo a un modelo que intente explicar los factores latentes, pero seguimos estando sujetos a las limitaciones que éstos presentan. Por ello en esta tesis se propone un modelo probabilı́stico fácilmente interpretable, que no use factorización matricial, y que proporcione una.

(26) Capı́tulo 1. Introducción. 26. explicación muy clara de sus resultados, el cual además compita con los modelos del estado del arte analizados. El modelo propuesto está basado en técnicas bayesianas y combina los dos enfoques de CF: basado en el usuario y basado en ı́tems. Se combinan estos enfoques porque se complementan adecuadamente. El objetivo principal es logrado mediante los siguientes objetivos especı́ficos: Analizar y seleccionar los trabajos de investigación que usen modelos probabilı́sticos para filtrado colaborativo y que además puedan ser utilizados como métodos de linea base para comparar con los resultados del modelo propuesto. Diseñar un nuevo modelo probabilı́stico para filtrado colaborativo que permita explicar las recomendaciones. Seleccionar datasets del estado del arte utilizados en el contexto de los sistemas de recomendación. Evaluar el desempeño del modelo con los datasets seleccionados usando medidas de calidad estándar y comparar sus resultados con otros métodos de lı́nea base. Hipótesis Para alcanzar estos objetivos se plantea la siguiente hipótesis. Es posible construir un modelo probabilı́stico que brinde tan buenos resultados como los modelos de factorización matricial y que además permita justificar de forma simple las recomendaciones que el modelo proporcione. Las principales contribuciones de esta tesis son:. Proporcionar un estado del arte sobre enfoques basados en modelos aplicados a sistemas de recomendación, resaltando las ventajas y desventajas identificadas entorno a estos modelos. Aprovechar las posibilidades que ofrecen los enfoques basados en modelos como los métodos probabilı́sticos, desarrollando un modelo hı́brido basado.

(27) Capı́tulo 1. Introducción. 27. en técnicas bayesianas que combine los enfoques de CF de usuarios e ı́tems y que además permita la explicación de las recomendaciones. Sugerir un conjunto de métricas que puedan ser utilizadas para medir la calidad de las predicciones y recomendaciones de modelos probabilı́sticos para CF. Además de proporcionar una medida de confiabilidad relacionada con las predicciones. Facilitar una serie de datasets que han sido preparados para ser utilizados en la evaluación del método propuesto.. 1.4.. Estructura de la tesis. Este trabajo de investigación está estructurado de la siguiente manera: Capı́tulo 2, presenta el estado del arte sobre enfoques basados en modelos para filtrado colaborativo, sean éstos: basados en factorización matricial, probabilı́sticos y basados en reglas. Capı́tulo 3, describe el método propuesto para CF, haciendo referencia a tres enfoques, basado en el usuario, basado en ı́tems e hı́brido. Además se presenta el cálculo de una medida de confiabilidad relacionada con las predicciones. Capı́tulo 4, presenta la experimentación y evaluación de resultados, comparando el método propuesto con otros modelos del estado del arte, mediante el uso de métricas para la evaluación de la calidad de las predicciones y recomendaciones. Se presenta también el desempeño del clasificador para los conjuntos de datos utilizados. Capı́tulo 5, se mencionan algunos modelos de recomendación explicables, y se muestra la explicación de los resultados con el modelo propuesto. Capı́tulo 6, finalmente en este capı́tulo se detallan las conclusiones y trabajos futuros..

(28) Capı́tulo 2 Estado del arte sobre enfoques basados en modelos En esta sección se brinda unan visión general del estado actual de los enfoques de filtrado colaborativo basados en modelos. Luego se describen algunos métodos seleccionados de la revisión de la literatura, los cuales se los ha categorizado de acuerdo a la técnica que utilizan. Algunos de estos modelos son considerados como métodos de lı́nea base con el objeto de comparar los resultados obtenidos con el enfoque propuesto. Para tener una idea clara de las caracterı́sticas que poseen estos enfoques, se identifican además las principales ventajas y desventajas que brindan cada tipo de modelo establecido.. 2.1.. Visión general. En la literatura se proponen un gran número de enfoques de CF basados en modelos, algunos de ellos son modelos probabilı́sticos que facilitan la interpretación de sus resultados. También existen otros modelos como los basados en factorización matricial que generan una representación que no es fácilmente interpretable para el usuario. Debido a las ventajas que brindan los modelos probabilı́sticos, como: buen 28.

(29) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 29. desempeño de predicción, facilidad para la explicación y justificación de resultados, etc. éstos en los últimos años han ido ganando importancia en diferentes campos de aplicación, por ejemplo, en el comercio electrónico autores como (Gaikwad, Udmale, y Sambhe, 2018) proponen un modelo probabilı́stico de CF para mejorar el análisis de las consultas de búsqueda y predecir la probabilidad de los productos que serán recomendados al usuario; en medicina (X. Li y Li, 2018), proponen un modelo probabilı́stico de aprendizaje en profundidad para analizar gran cantidad de datos médicos y hacer una predicción personalizada del riesgo para la salud; en transporte (Tang, Chen, Liu, y Khattak, 2018), desarrollan un modelo probabilı́stico bayesiano para la estimación del tiempo de viaje personalizado, utilizando las trayectorias de GPS dispersas y a gran escala generadas por los taxis. De acuerdo a (Ekstrand y cols., 2011), los modelos probabilı́sticos son aplicables cuando el proceso de recomendación debe seguir modelos de comportamiento del usuario. El objetivo del aprendizaje en los modelos probabilı́sticos es estimar la función de densidad de probabilidad de los datos o la distribución de probabilidad, para lo cual es necesario hacer ciertas suposiciones sobre:. El modelo de distribución que describe los atributos. Es muy importante conocer con qué atributos contamos en nuestro conjunto de entrenamiento para asumir el tipo de distribución que estos atributos representan, en nuestro caso serı́an los votos del usuario. Por ejemplo una distribución multinomial es comúnmente utilizada cuando los atributos son discretos, y cuando los atributos son continuos, éstos son distribuidos mediante una distribución normal. El modelo de distribución que describe las clases. Conocer cuál es la salida esperada del algoritmo, si ésta va ser binaria o categórica. En caso de que la clase sea discreta se utiliza una distribución multinomial. Además en este punto también se puede considerar como realizar la estimación de la clase, la cual puede ser con una distribución posterior, es decir considerar solo la clase con la mayor probabilidad a posteriori Maximum A Posteriori (MAP, por sus siglas en inglés), o utilizar el método de estimación de máxi-.

(30) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 30. ma verosimilitud Maximum Likelihood Etimation (MLE, por sus siglas en inglés). La dependencia entre las variables. Puede darse el caso de que todas las variables sean independientes, que hayan variables que tengan independencia y otras no, que las variables sean dependientes, etc. De esto depende el método que se utilice para el modelado, por ejemplo si suponemos que todas las variables son independientes conocido el valor de la clase, entonces se puede utilizar el método naives bayes.. En base a la revisión de la literatura, en la siguiente figura se muestra una clasificación de los enfoques basados en modelos y algunos de los algoritmos estudiados en cada uno de ellos. Basados en modelos Probabilísticos PNN Factorización matricial. BiasedMF NMF. PMF BNMF. EM. GGM INBM NBRMCF. árboles reglas de asociación Reglas. Figura 2.1: Clasificación de los enfoques basados en modelos En la figura 2.1 se diferencia tres familias de enfoques basados en modelos: de factorización matricial, probabilı́sticos y basados en reglas. Se puede ver también como los métodos probabilı́sticos pueden ser utilizados en combinación con otras técnicas como la factorización matricial.. Factorización matricial (Koren y cols., 2009), consisten en descomponer una matriz en dos o más matrices que hacen referencia a los usuario e ı́tems.

(31) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 31. respectivamente. En esta categorı́a se incluyen modelos no probabilı́sticos como la factorización matricial no negativa y la factorización matricial con bias. Modelos probabilı́sticos, en esta familia se listan algunos modelos bayesianos y no bayesianos. Los bayesianos de acuerdo a (Barber, 2012), utilizan el conocimiento previo junto con un modelo dado, para hacer inferencias sobre cantidades desconocidas. Los métodos bayesianos tienen como punto central el Teorema de Bayes. En este conjunto también se mencionan trabajos que combinan modelos probabilı́sticos con técnicas de factorización matricial. En la siguiente sección se desarrolla más este tipo de modelos. Modelos basados en reglas (Hernando, Bobadilla, Ortega, y Gutiérrez, 2017; Najafabadi, Mahrin, Chuprat, y Sarkan, 2017): Los hemos subdivido en aquellos modelos basados en árboles (los cuales pueden realizar una selección de variables en la construcción del modelo); y aquellos modelos basados en reglas de asociación, que describen las asociaciones entre los datos (usuario - ı́tem) en la base de datos. Los modelos probabilı́sticos modelan la incertidumbre con las distribuciones de probabilidad y, a menudo, utilizan la máxima verosimilitud (likelihood) para encontrar un simple modelo óptimo. El likelihood o la estimación de máxima verosimilitud se puede utilizar para estimar los parámetros del modelo de aprendizaje. Como parte de los modelos probabilı́sticos están también, las redes neuronales probabilı́sticas (PNN, por sus siglas en inglés) (Devi, Samy, Kumar, y Venkatesh, 2010), las cuales han sido utilizadas para aliviar problemas de sparsity y cold-start en filtrado colaborativo. Las redes neuronales también han sido usadas en combinación con la factorización matricial. En la literatura se encuentran algunos estudios realizados recientemente con este tipo de combinación, podemos citar entre otros: un modelo probabilı́stico que usa una red neuronal para filtrado colaborativo presentado por (He y cols., 2017), y un modelo probabilı́stico hı́brido basado en redes neuronales para extraer factores latentes de los usuarios e ı́tems (Liu y Wang, 2017). Por otro lado, existen modelos basado en técnicas de clustering, como el Expectation-Maximization para filtrado colaborativo (EMCF, por.

(32) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 32. sus siglas en inglés) (K. Wang y Tan, 2011), el cuál también se basa en MF para inferir las preferencias del usuario. En (Nilashi, bin Ibrahim, Ithnin, y Sarmin, 2015) se presenta un método hı́brido de CF multi-criterio basado en EM en combinación con redes neuronales y técnicas de reducción de dimensionalidad, para la recomenación de hoteles. Por otra parte, los modelos probabilı́sticos bayesianos son capaces de integrar el conocimiento anterior en sus probabilidades condicionales y manejar observaciones faltantes. De acuerdo a (Shengbo, 2011) los métodos bayesianos a menudo asumen que el parámetro del modelo (clase) se extrae de alguna distribución de probabilidad previa con algunos parámetros llamados hiperparámetros utilizados para distinguirlos de los parámetros del modelo. Los modelos probabilı́sticos incluidos en la figura 2.1, son explicados en la siguiente sección, algunos de ellos son considerados como métodos de linea base para comparar sus resultados con el modelo propuesto. Externamente a todos los tipos de modelos mencionados, se identificaron otros modelos, que se ubicarı́an dentro del recuadro general; hablamos de aquellos modelos basados en: métodos difusos (S.-M. Chen, Cheng, y Lin, 2015), algoritmos genéticos (Hassan y Hamada, 2018), entre otros, los cuales han presentado buen desempeño en la calidad de las predicciones y recomendaciones. Sin embargo, siguen presentando ciertas limitaciones, por ejemplo, en los algoritmos genéticos, la implementación de la solución podrı́a tornarse demasiado costosa en términos de tiempo y recursos. En el contexto de los RS, existen problemas que son necesarios modelarlos usando distribuciones de probabilidad para representar los conceptos, por ello en la sección 2.3 se describen algunos de los modelos probabilı́sticos señalados en la figura 2.1..

(33) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 2.2.. 33. Modelos basados en factorización matricial. El modelo básico de factorización matricial consiste en encontrar para cada usuario un vector pu ∈ <f que mide el interés que el usuario tiene en los ı́tems, y un vector qi ∈ <f para cada ı́tem, que mide el grado en el que el ı́tem posee esos factores (Koren y cols., 2009). En este caso, f , representa la dimensión del espacio de factores latentes. Las interacciones usuario-ı́tem se modelan como un producto escalar entre sus correspondientes vectores, tales como: r̂u,i = qiT pu. (2.1). El producto resultante denota el voto estimado de un usuario hacia un ı́tem. Para aprender los vectores p y q el sistema minimiza el error cuadrático regularizado sobre el conjunto de votos conocidos (Koren y cols., 2009). mı́n ∗. X. q·p. rui − qiT pu. 2. + λ kqi k2 + kpu k2. . (2.2). (u,i)∈κ. Donde: K es el conjunto de los pares (u, i) para lo cual rui es conocido, λ kqi k2 + kpu k2 , es el término de regularización para evitar el sobreajuste. Como se muestra en la figura 2.1, existen algunas implementaciones basadas en factorización matricial, en este trabajo se describen las más comúnmente usadas.. 2.2.1.. Factorización matricial con bias. El método de factorización matricial con bias (BiasedMF), surge debido a que gran parte de la variación observada en los votos se debe a los efectos asociados con los usuarios o ı́tems, conocidos como sesgos (bias). Es decir que, estos sesgos probablemente sean causados por desviaciones del voto, por ejemplo algunos usuarios proporcionan votos más altos que otros usuarios, y algunos ı́tems pueden obtener votos más altos que otros ı́tems (L. Chen, Chen, y Wang, 2015). Formalmente, la estimación del voto se calcula utilizando el sesgo involucrado.

(34) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 34. en el voto: bui = µ + bu + bi. (2.3). Donde: µ es el promedio global de los votos, los parámetros bu y bi indican la desviación observada del usuario e ı́tem, respectivamente, desde el promedio (Koren y Bell, 2011). Las bias se pueden estimar con el método de gradiente descendente. La ecuación de este método está dada por (Adomavicius y Tuzhilin, 2011): r̃u,i = bui + qiT pu. (2.4). Igualmente, el sistema aprende minimizando la función del error cuadrático, como sigue: mı́n ∗ ∗. p ,q ,b. X. (rui − r̃ui )2 + λ kpu k2 + kqi k2 + b2u + b2i. . (2.5). (u,i)∈K. Existen algunos trabajos desarrollados con el uso de este método, por ejemplo en (Sun, Zhang, Liang, y He, 2015), desarrollan un algoritmo de factorización matricial con bias para modelar caracterı́sticas explı́citas basados en los valores del voto, al añadir factores de alta dimensión; por otro lado en (H. Zhang y cols., 2017) utilizan el método BiasedMF para fusionar los votos con los perfiles del usuario en un solo modelo.. 2.2.2.. Factorización matricial no negativa. Otro método que se deriva de la factorización matricial y que ha ganado popularidad en los últimos años, es el método de factorización matricial no negativa (NMF) (L. Zhang y cols., 2011), la cual consiste en la factorización de la matriz de votos R con entradas positivas, en dos nuevas matrices: W que representa la matriz de factores latentes de los usuarios y H que representa la matriz de factores latentes de los ı́tems. Este modelo impone como restricción la no negatividad.

(35) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 35. de los factores de estas dos matrices, tales que verifiquen la siguiente expresión:. R≈W ·H. (2.6). Por lo tanto, el algoritmo NMF trata de minimizar la diferencia cuadrática entre R y W · H , obteniendo la siguiente función de coste:. X. (Ru,i − (W · H)u,i )2. (2.7). ui. Las matrices W y H minimizan el error sujeto a las restricciones no negativas. Este problema se puede plantear mediante el descenso de gradiente tal y como se realiza en PMF, sin embargo, la restricción de valores positivos permite transformar la función de coste para acelerar el proceso de aprendizaje. Dada la función de coste anterior, las reglas de actualización de las matrices W y H están dadas por: W ←W ←. H←H·. R · HT W · H · HT. (2.8). WT · R W · WT · H. Donde W y H, están restringidas a ser no negativas. NMF a diferencia de BiasedMF y PMF facilita la interpretabilidad de los resultados, debido a sus factores positivos. Algunos trabajos aplicados a CF basados en NMF son: (Hernando y cols., 2016), el cual combina métodos bayesianos con NMF para predecir los gustos del usuario en sistemas de recomendación; (S. Zhang, Wang, Ford, y Makedon, 2013) proponen una variación de NMF basado en el método de ExpectativaMaximización (EM) para encontrar un modelo cuando la matriz de votos es incompleta; (Aghdam y cols., 2015) utilizan NMF y similaridad para aprender.

(36) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 36. los factores latentes de los usuarios e ı́tems y estimar los votos desconocidos utilizando estas caracterı́sticas latentes; en (Parvin, Moradi, Esmaeili, y Qader, 2019) se propone un recomendador de factorización matricial no negativa basado en la confianza usando un método de dirección alterna, etc.. 2.2.3.. Limitaciones de los modelos de factorización matricial. De la revisión del estado del arte, se determinó que los métodos de factorización matricial poseen algunas debilidades como:. El espacio latente aprendido no es fácil de interpretar (C. Wang y Blei, 2011). Las matrices que representan las caracterı́sticas latentes de los usuarios e ı́tems son abstractas para entender su significado, por tanto no son intuitivas para interpretar. Cuando la dispersión es demasiado grande, la precisión de la recomendación se reduce (R. Chen y cols., 2018). El problema de dispersión tiene un fuerte efecto sobre el poder predictivo de los algoritmos, puede conllevar a un sobre ajuste (over-fitting) de los datos y dar como resultado una mala precisión. Problemas para explicar las recomendaciones. Debido a que la descomposición en factores latentes es difı́cil de interpretar, y éste a su vez pueden generar valores negativos, la predicciones resultan difı́ciles de explicar (Rastegarpanah y cols., 2017).. 2.3.. Modelos probabilı́sticos. Los sistemas de recomendación de filtrado colaborativo basado en factorización matricial proporcionan unos resultados excelentes en cuanto a calidad de predicciones y recomendaciones, pero éstos son difı́ciles de interpretar. Este tipo de algoritmos tienen una deficiencia: la transformación de la matriz de votaciones en matrices de factores latentes es altamente abstracta para los usuarios y, por.

(37) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 37. ende, imposibilita la explicación de las recomendaciones. Por otra parte, existen modelos probabilı́sticos que facilitan la tarea de interpretar y justificar sus resultados. Dentro del estudio del estado del arte se identifican dos familias de modelos probabilı́sticos aquellos bayesianos y no bayesianos. De acuerdo a (Barnard y Prügel-Bennett, 2011) los sistemas recomendadores bayesianos que utilizan conocimiento previo pueden producir resultados mejores que los utilizados en el filtrado colaborativo basado en la memoria, y aquellos recomendadores probabilı́sticos simples que no utilizan conocimiento previo. Los modelos bayesianos se basan en la definición de probabilidad condicional y el teorema de bayes. Éstos utilizan la probabilidad para representar la incertidumbre sobre las relaciones aprendidas de los datos. Además, el concepto de prior (anterior) es muy importante, para representar nuestras expectativas o conocimientos previos sobre cuál podrı́a ser la verdadera relación. Desde la perspectiva bayesiana, la probabilidad de obtener los parámetros dado los datos (posteriori), es proporcional al producto de la probabilidad de los datos dado los parámetros (likelihood), por la probabilidad de los parámetros (prior). El componente de likelihood incluye el efecto de los datos, mientras que el prior especifica la creencia en el modelo antes de que se observaran los datos (Ricci y cols., 2015). Basado en esto, a continuación se mencionan algunos modelos bayesianos que no usan factorización matricial, y que son utilizados en filtrado colaborativo.. 2.3.1.. Método Naı̈ve Bayes mejorado. Este método de filtrado colaborativo se basa en Naı̈ve Bayes y tiene una complejidad similar al método original. A diferencia del método bayesiano ingenuo (naive) original, este algoritmo se puede aplicar a los casos en que la suposición de independencia condicional no se cumple estrictamente (K. Wang y Tan, 2011). El método INBM (por sus siglas en inglés) proporciona una nueva solución simple a la falta de independencia en comparación con las redes bayesianas..

(38) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 38. En el algoritmo propuesto para este método, los ı́tems de una alta probabilidad condicional tiene una alta prioridad a ser recomendados y la tarea aquı́ es calcular la probabilidad condicional de cada ı́tem para cada usuario. En este método, la relevancia entre los ı́tems es el fundamento teórico. El funcionamiento es el siguiente: primero se calcula la probabilidad prior p(mi ), que es la posibilidad de que el ı́tem mi sea interesante para todos los usuarios. P p(mi ) =. i∈U ti. (2.9). N. Donde: U: Conjunto de usuarios interesados en el ı́tem N: Número total de usuarios Para calcular la matriz de probabilidad condicional, primero se obtiene la probabilidad conjunta y luego ésta se convierte en probabilidad condicional.. ti,j N. (2.10). p(mi , mj ) p(mj ). (2.11). p(mi , mj ) =. p(mi |mj ) =. Sobre la base de estas dos matrices se hace la recomendación. Para lo cual se aplica la siguiente ecuación. cn. p(mx |mu1 , mu2 ...) = p(mx ) · q n. (2.12). Donde n es el número de intereses conocidos del usuario y cn es una constante entre 1 y n. cn representa cuán independiente son los ı́tems. El valor de cn es calculado por experimentos. p(mx ), muestra si el elemento x en sı́ es atractivo para el usuario, y q representa la probabilidad condicional obtenida en la ecuación 2.11, que muestra si el.

(39) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 39. ı́tem es adecuado para el usuario. Una limitante de este método es el cálculo de cn en base a experimentos, el valor de este parámetro deberı́a ser obtenido de forma automática y adecuada.. 2.3.2.. Modelo Gaussian-Gamma. En (Barnard y Prügel-Bennett, 2011) se presenta un modelo Gaussiano para el comportamiento del voto con la adición de un prior Gaussian-Gamma. El modelo llamado GGM (por sus siglas en inglés) presenta un buen desempeño cuando se usa conjuntos de datos muy dispersos. Es decir, este modelo utiliza el conocimiento previo dentro de las estimaciones de probabilidad, para reducir el impacto de la dispersión (sparsity). De acuerdo con (Luo, Zhang, Xiang, y Qi, 2017), la distribución GaussianGamma se ha utilizado con éxito en aplicaciones que requieren un modelo robusto o disperso, y se puede usar para mejorar la precisión de la Gaussiana. La distribución gaussiana y gamma pertenece a la familia exponencial. Sin embargo, en este modelo, las probabilidades son discretas, en lugar de continuas. Los autores consideran que los priors y los likelihoods son independientes del ı́tem de interés, y actualizan incrementalmente la probabilidad posterior dada cada caracterı́stica. 0. p(ru,i = k|ru0 i = k ) = P. P (ru = k)P (ru0 = k 0 |ru = k) 00 0 00 k00 P (ru = k )P (ru0 = k |ru = k ). (2.13). Las probabilidades posteriores se combinan para encontrar el valor esperado del voto.. E(ru,i ) =. X. P (ru,i = k)k. (2.14). k∈K. Para calcular las probabilidades anteriores (prior) se considera la cantidad de veces que el usuario u ha dado un voto k a un ı́tem. Para el cálculo del likelihood.

(40) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 40. se consideran las diferencias en los votos del usuario. Éstas diferencias ru − ru0 son modeladas desde una distribución gaussiana. El modelo no es estrictamente gaussiano se hacen algunas simplificaciones removiendo constantes, por tanto los likelihoods llegan a ser discretos, en lugar de continuos. La ecuación es la siguiente: exp(−τu,u0 /2(k − k 0 − µu,u0 )2 ) 00 0 2 k00 exp(−τu,u0 /2(k − k − µu,u0 ) )). P (ru0 = k 0 |ru = k) = P. τu,u0 =. 1 σ2. (2.15). (2.16). Donde: µu,u0 Es la diferencia media entre los dos votos de usuarios. τu,u0 Es la precisión de la distribución gaussiana, o σ −2 la recı́proca de la varianza. El modelo puede ser incrementado considerando un prior Gaussian-Gamma, donde la media y la varianza son tratados como desconocidos, la media serı́a modelada por una gaussiana y la varianza por una distribución gamma. Según (Barnard y Prügel-Bennett, 2011), en estos modelos las creencias son la probabilidad de que un usuario asigne un voto de una clase dada a un ı́tem, y las caracterı́sticas son los votos realizados por otros usuarios. Para ello, se consideran los prior y los likelihoods.. 2.3.3.. Modelo de regresión Naı̈ve Bayes para filtrado colaborativo. En (S. Wen, Wang, Li, y Wen, 2018) proponen un algoritmo de recomendación de filtrado colaborativo basado en Naive Bayes. El modelo original de clasificación Naive Bayes se modifica dentro de un modelo de regresión bayesiano y se aplica a la recomendación de filtrado colaborativo con el objeto de mejorar la precisión. El algoritmo NBRMCF (por sus siglas en inglés) transforma el problema de la predicción de votos en un problema de clasificación. Los votos se consideran categorı́as de la clasificación, de esta forma para realizar la recomendación utilizando.

(41) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 41. el modelo Naı̈ve Bayes, el proceso de predecir el voto de usuarios se convertirá en el proceso de dividir usuarios e ı́tems en diferentes categorı́as de calificación. Los valores de los atributos y los valores de las categorı́as se discretizan para simplificar la complejidad del modelo de regresión de Naı̈ve Bayes. Además se cambian los resultados de clasificación a un resultado de regresión, es decir que este modelo lleva a cabo la regresión lineal de los valores de clasificación discretizados, multiplicando la probabilidad de cada clase de clasificación por el valor del voto para obtener el valor matemático esperado, el cual se utiliza como resultado final. Basado en esto, los pasos para aplicar el algoritmo son los siguientes:. Determinación del usuario e ı́tem como atributo caracterı́stico: se selecciona un conjunto de usuarios U y un conjunto de ı́tems I como atributos caracterı́sticos, el conjunto de clasificación Ri , con s categorı́as de clasificación. Los votos suelen ser números enteros y se redondean si el voto es un decimal.. Obtención de los ejemplos de entrenamiento: los datos de entrada se pueden expresar en forma de una matriz de votos usuario-ı́tems. La matriz consta de m usuarios e n ı́tems. Se define ra,b ∈ R como el valor del voto del ı́tem i dado por el usuario a.. Cálculo de la probabilidad de cada categorı́a de clasificación. Cuenta el número de cada tipo de calificación N U M− Ri y el número de calificaciones NUM. Entonces la probabilidad de cada clasificación se calcula como: P (Ri ) =. N U M− Ri NUM. (2.17). Cálculo de las probabilidades prior: dado que, P (Ri ) y P (Ua |Ri ) y P (Ib |Ri ) como condición, en este método la probabilidad prior se obtiene como: P (X|Ri ) = P (Ua , Ib |Ri ) = P (Ua |Ri ) ∗ P (Ib |Ri ). (2.18).

(42) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 42. Obtención del valor esperado: en el método original de naive bayes, usualmente el valor más grande de probabilidad previa de la categorı́a de clasificación es considerada como la categorı́a de clasificación final. Pero este método cambia el resultado de la clasificación a un resultado de regresión. Este método ya no usa la categorı́a de la probabilidad prior máxima como clasificación final. Este método calcula la probabilidad de la muestra X, donde X representa el ı́tem y el usuario que deben clasificarse.. P (X) =. s X i=1. P (X|Ri ) =. s X. P (Ri )P (Ua |Ri )P (Ib |Ri ). (2.19). i=1. Finalmente, se obtiene el valor matemático esperado E(X) de la muestra X como el voto final. s X P (X|Ri ) ∗ Ri (2.20) E(X) = P (X) i=1 En este trabajo podemos ver que las técnicas bayesianas no sólo pueden ser utilizadas para resolver problemas de clasificación, sino que estos métodos también pueden extenderse a problemas de regresión. En vista de que la regresión es utilizada para simular la relación existente entre dos o más variables, el método propuesto por estos autores predice el comportamiento de la variable dependiente (en este caso la clase ) a partir de un conjunto de variables independientes.. 2.4.. Modelos probabilı́sticos con factorización matricial. En el contexto de los RS de filtrado colaborativo los modelos probabilı́sticos están siendo muy utilizados en combinación con la factorización matricial, y algunos de ellos con información complementaria (por ejemplo, caracterı́sticas del usuario y/o ı́tem, preferencias explı́citas del usuario, información contextual, etc.). La factorización matricial es el método más popular de CF basado en modelos, algunas implementaciones probabilı́sticas de este método son PMF (Salakhutdinov.

(43) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 43. y Mnih, 2007), BNMF (Hernando y cols., 2016), GGMCF (Luo y cols., 2017), etc., ası́ mismo se tienen algunas combinaciones de PMF con enfoques basados en usuario e ı́tems. En este apartado se describen estos modelos, algunos de los cuales se presentan en la figura 2.1.. 2.4.1.. Factorización matricial probabilı́stica. La factorización matricial probabilı́stica (PMF), es un modelo de análisis factorial, que consiste en un modelo lineal gaussiano de variable latente restringido. Esto es, si tenemos un conjunto de datos de N usuarios y M ı́tems, y una matriz de votos R de N × M , este modelo consiste en encontrar dos matrices P ∈ RK×N que hace referencia a los usuarios y Q ∈ RK×M , a los ı́tems. Siendo Pi , Qj con i ∈ {1, 2, ..., N } y j ∈ {1, 2, ..., M }, vectores columna correspondientes a la u−ésima columna de P y i−ésima columna de Q, respectivamente. En este caso K es el tamaño de las caracterı́sticas latentes. En este modelo se define la distribución condicional sobre las calificaciones observadas, Ri,j que representa el voto del ı́tem j dado por el usuario i , calculado en base a las matrices latentes P y Q. La distribución condicional sobre los votos observados estarı́a dado por (Salakhutdinov y Mnih, 2007): p(R|P, Q, σ 2 ) =. N Y M Y . Iij η(Ri,j |PiT Qj , σ 2 ). (2.21). i=1 j=1. Donde η(x|µ, σ 2 ) es la función de densidad de probabilidad de la distribución gaussiana con media µ y varianza σ 2 , Iij es la función indicadora que es igual a 1 si el usuario i calificó el ı́tem j y es igual a 0 en caso contrario. La distribución prior gaussiana sobre el vector de caracterı́sticas del usuario P e ı́tem Q, se obtienen con las siguientes ecuaciones (Jung y Lease, 2012):. P (σP2 ). =. N Y i=1. η(Pi |µP , σP2 I). (2.22).

(44) Capı́tulo 2. Estado del arte sobre enfoques basados en modelos. 2 Q(σQ ). =. M Y. 2 η(Qj |µQ , σQ I). 44. (2.23). j=1. En este caso I denota una matriz identidad de dimensión K , donde µP = 0, 2 µQ = 0 y σP2 = σP IK , σQ = σQ IK que serı́an matrices diagonales. En base a estos datos se obtiene la distribución posterior del modelo, tal y como se muestra en (Salakhutdinov y Mnih, 2007), donde la estimación de los parámetros del modelo anterior se puede encontrar utilizando el método del logaritmo de estimación de máxima verosimilitud, en base al logaritmo de la distribución posterior. La predicción del voto se lleva a cabo multiplicando el vector de usuario correspondiente y vector de ı́tems Pu y Qi respectivamente (2.21). Lo ideal de este modelo probabilı́stico, es que la predicción se expresa en términos de la distribución predictiva sobre R que es gaussiana en lugar de simplemente una estimación puntual. El resultado será una matriz completa de votos estimados. En este sentido, los nuevos votos de los ı́tems que aún no han sido votados son estimados. Este método presenta una muy buena escalabilidad, puesto que, una vez aprendido el modelo, el cálculo de las predicciones se realiza en un tiempo mı́nimo, además proporciona unos resultados excelentes en cuanto a calidad de predicciones y recomendaciones. Sin embargo, el algoritmo PMF tiene una deficiencia: la transformación de la matriz de votaciones en matrices de factores latentes es altamente abstracta para los usuarios y, por ende, dificulta la interpretación de resultados.. 2.4.2.. Modelo bayesiano de factorización matricial no negativa. Esta técnica se basa en un modelo probabilı́stico bayesiano de factorización no negativa para filtrado colaborativo (BNMF, por sus siglas en ingles) presentado.