Filtrado colaborativo basado en confianza

En términos generales, los sistemas de recomendaciones se usan para estimar con la mayor precisión posible en qué grado un ítem específico puede ser del agrado de un usuario en particular. Específicamente, el filtrado colaborativo es un algoritmo de recomendación que basa sus predicciones en los ratings que han proporcionado otros usuarios en el sistema; en términos simples, bajo esta aproximación el sistema de recomendaciones busca usuarios cuyos ratings previos son similares a los del usuario objetivo para intentar predecir los items que probablemente son de su agrado [127]. Tradicionalmente los sistemas de recomendaciones basados en este tipo de filtro usan una métrica de similitud para encontrar

usuarios vecinos y de acuerdo a las preferencias en ese conjunto devecinos se calcula una predicción para un item específico. La ecuación 4.6 muestra la función de agregación con la que normalmente se calcula la predicción de un rating en el filtrado colaborativo.

P

a,i

= ¯r

+

Pn

u=1

(r

u,i

−r¯

)×W

a,u

Pn

u=1

W

a,u

(4.6)

P

a,i es el rating que predice el sistema de recomendaciones para un usuario a sobre el

itemi;

r¯

arepresenta el promedio de los ratings dea,n corresponde al tamaño del vecinda-

rio (neighborhood) y

W

a,u es una métrica de similitud entre usuarios que frecuentemente

se calcula a través de coeficientes de correlación comoPearson oSpearman . No obstante, en la práctica los sistemas de recomendaciones basados en el esquema colaborativo clásico presentan algunas debilidades relacionadas con la dispersión de los datos (típicamente los usuarios sólo califican una fracción de los items disponibles) o el problema de arranque en frío o cold start (los usuarios nuevos no han calificado los items necesarios para ser rela- cionados con otros usuarios); a esto se suma algo que es de mayor trascendencia para el dominio de la publicidad ubicua y que tiene que ver con la naturaleza misma del algoritmo para calcular similitud a partir de los ratings de usuarios anónimos.[110] y [111] demostra- ron que las personas tienden a creer más en recomendaciones de individuos en los cuales confían que en usuarios desconocidos. Esto supone una motivación importante para incor- porar información de confianza entre usuarios a través del proceso de inferencia ilustrado en la sección anterior en el algoritmo de filtrado colaborativo.

Al respecto, trabajos previos han utilizado dos estrategias para incluir información de confianza en el algoritmo de recomendación: promedio ponderado basado en confianza y

filtrado colaborativo basado en confianza. La primera técnica redefine la estrategia de re- comendación al calcular un promedio ponderado basado en confianza; en lugar de calcular el rating promedio para un itemi a partir del conjunto de ratings

r

u,ide todos los usuarios

que ya están familiarizados coni, se incluye además valores

t

a,u que reflejan el grado de

confianza para los raters u, de tal manera que los ratings de los usuarios más confiables tendrán un mayor peso (Ecuación 4.7).

p

a,i

=

P

u∈n

t

a,u

r

u,i

P

u∈n

t

a,u (4.7) Siguiendo esta aproximación, [31] propone un algoritmo denominado Tidal Trust. De acuerdo los resultados de esta investigación, esta estrategia no ofrece un beneficio claro sobre la precisión que ofrece el algoritmo de filtrado colaborativo clásico, salvo en los ca- sos de ratings controversiales, es decir existe una mejora en el proceso de recomendación para aquellos usuarios que difieren significativamente del rating promedio para un item específico.

Por otro lado, la segunda estrategia define un método alternativo para el cálculo del peso

W

a,uen la ecuación 4.6, al inferir el valor a partir de las relaciones del usuario objetivo en la

red de confianza (usando técnicas de agregación o propagación). De esta manera, los pesos definidos en el Coeficiente de Correlación en la ecuación 4.6 son reemplazados por pesos de confianza

T

a,u:

P

a,i

= ¯r

+

P

u=1

(r

u,i

−r¯

)×T

a,u

Pn

u=1

T

a,u

(4.8) Al respecto, [128] propone un ejemplo que sigue esta aproximación. De acuerdo a los hallazgos de este estudio, se obtuvo una mejora en la precisión de las recomendaciones para usuarios controversiales como en el caso anterior, pero adicionalmente se obtuvo un mejor comportamiento para usuarios nuevos (cold start users).

Al hacer un análisis de las dos aproximaciones, aunque ambas mejoran el comportamiento de las predicciones para items controversiales y pueden contribuir a disminuir el problema de cold start como en el segundo caso, el problema es que reemplazan el componente de correlación que calcula la similitud entre usuarios, probablemente asumiendo que la confianza y la similitud están relacionadas, de acuerdo a lo planteado en [129]. No obstante, para los propósitos de la presente investigación se considera que esta suposición no es exacta ya que la confianza entre usuarios no necesariamente es un indicador de gustos similares. En este sentido, se propone adaptar la técnica de filtrado colaborativo basada en confianza, reemplazando el componente de correlación de similitud de la ecuación con uno que incluya una contribución ponderada de similitud y confianza, como se ilustra en las ecuaciones 4.9 y 4.10.

P

a,i

= ¯r

+

Pn

u=1

(r

u,i

−r¯

)×W T S

a,u

Pn

u=1

W T S

a,u

W T S

a,u

=αW

a,u

+βT

a,u (4.10)

En este caso,

α+β

= 1,

T

a,u representa el score de confianza que se calcula a través

del proceso descrito en la sección 4.2 y

W

a,u refleja la similitud entre usuarios calculada

por el Coeficiente de Correlación de Pearson o alguno equivalente. Específicamente, el algoritmo calcula inicialmente el coeficiente de correlación entre usuarios y luego aplica el procedimiento para calcular el score de confianza entre los usuarios del vecindario (neighborhood) como se observa en la figura 4.5. Alternativamente, podría utilizarse una técnica donde precisamente los scores de confianza actúen como un filtro en el cual sólo los vecinos (neighbors) más confiables participen en el proceso de recomendación como se sugiere en [68]. No obstante, esta aproximación demanda un grupo de personas con un buen número de conexiones entre sí en la red social para asegurar una buena conformación del vecindario, lo cual resulta más complejo de implementar en la práctica. Por otro lado,

α

β

son pesos que permiten calibrar el comportamiento del algoritmo para dar una mayor contri- bución al factor similitud o al factor confianza durante el proceso de recomendación. Esta característica fue utilizada durante la experimentación para generar conclusiones alrede- dor de los resultados para diferentes combinaciones de similitud y confianza como se verá más adelante.

n neighbors

They are similar but no friends

They are friends but no similar

They are similar and friends For each i in n Correlation coefficient calculation Trust coefficient calculation WTS calculation

In document Sistema de recomendaciones soportado en un esquema de cooperación smart tv - smartphone para entornos de publicidad ubicua (página 72-75)