Monterrey, Nuevo León a 4 de Septiembre de 2006.
Lic. Arturo Azuara Flores:
Director de Asesoría Legal del Sistema
Por medio de la presente hago constar que soy autor y titular de la obra titulada "Sistema de recomendación turística basado en RBR y CBR", en los sucesivo LA OBRA, en virtud de lo cual autorizo a el Instituto Tecnológico y de Estudios Superiores de Monterrey (EL INSTITUTO) para que efectúe la divulgación, publicación, comunicación pública, distribución y reproducción, así como la digitalización de la misma, con fines académicos o propios al objeto de EL INSTITUTO.
El Instituto se compromete a respetar en todo momento mi autoría y a otorgarme el crédito correspondiente en todas las actividades mencionadas anteriormente de la obra.
De la misma manera, desligo de toda responsabilidad a EL INSTITUTO por cualquier violación a los derechos de autor y propiedad intelectual que cometa el suscrito frente a terceros.
Sistema de Recomendación Turística Basado en RBR y
CBR-Edición Única
Title Sistema de Recomendación Turística Basado en RBR y CBR-Edición Única
Authors José Arturo Tejeda Gómez
Affiliation ITESM-Campus Estado de México
Issue Date 2006-08-01
Item type Tesis
Rights Open Access
Downloaded 19-Jan-2017 10:40:45
SISTEMA DE RECOMENDACIÓN TURÍSTICA BASADO EN
RBR Y CBR
TESIS QUE PARA OPTAR EL GRADO DE MAESTRO EN CIENCIAS COMPUTACIONALES
PRESENTA
JOSÉ ARTURO TEJEDA GÓMEZ
Asesor: Co-Asesor:
Dra. MA. DE LOS ÁNGELES JUNCO REY Dr. JORGE ADOLFO RAMÍREZ URESTI
Comité de tesis: Dr. STEVEN WILMOTT
Dr. ISAAC JUAN RUDOMIN GOLDBERG
Jurado: Dr. ISAAC JUAN RUDOMIN GOLDBERG, Dr. JORGE ADOLFO RAMÍREZ URESTI, Dr. STEVEN WILMOTT,
Dr. MA. DE LOS ÁNGELES JUNCO REY
Presidente Secretario Vocal Vocal
A Dios por permitirme alcanzar un logro más en mi vida profesional.
A mis padres, sería difícil imaginar mi vida sin su apoyo, comprensión y su inmenso amor. Ha sido difícil no convivir con ustedes durante estos tres años pero éste también es un logro para ustedes.
A mi padrino (q.e.p.d.), este logro también es tuyo, fuiste y serás mi gran ejemplo a seguir.
A mi directora de tesis, Dra. Angeles Junco, por su generosidad al brindarme la oportunidad de recurrir a su capacidad y experiencia científica en un marco de confianza, afecto y amistad, fundamentales para la concreción de este trabajo de tesis. Además por haberme dado la oportunidad de trabajar de la misma manera con usted para el proyecto @lisTechNet.
A mi co-director de tesis, Dr. Jorge Uresti, por su apoyo y valiosa colaboración para la realización de este trabajo.
Al Dr. Isaac Rudomin, por haber revisado con paciencia este trabajo.
Al Dr. Steven Wilmott, por haber aceptado ser miembro del jurado y revisar con paciencia este trabajo. Su confianza depositada en mi trabajo realizado para el proyecto @lisTechNet ha sido fundamental.
Al Dr. Neil Hernández, por su comprensión y apoyo a lo largo de todo el postgrado.
Al Dr. Ricardo Swain, por su apoyo, estímulo y confianza; los cuales han sido invaluables.
Al M.Sc. Steven Bogaerts de la Universidad de Indiana, EEUU, por permitirme utilizar la herramienta IUCBRF para implementar el razonamiento basado en casos.
Al proyecto @lisTechNet y a sus miembros por los conocimientos aportados, ya que en el marco de este proyecto surgió éste trabajo de tesis.
A todos mis profesores del programa de la maestría en ciencias de la computación que de alguna manera contribuyeron en mi formación profesional.
A mi mejor amigo, Zeus Andrade, por soportarme durante estos tres años en los que su amistad incondicional ha sido un pilar para que la cotidianidad de la vida sea más llevadera.
El turismo representa una fuente de ingresos para todos los países del mundo. Hoy en día, los turistas prefieren utilizar la Internet para reservar una fórmula de vacaciones combinadas. Por lo tanto, los sistemas de recomendación turística son fundamentales para que los turistas cuenten con los recursos o servicios turísticos que mejor concuerden con sus preferencias.
Los sistemas de recomendación proveen sugerencias específicas con base en las preferencias del usuario y representan un medio eficaz de filtrado cuando existe demasiada información significativa. En el ámbito del turismo, un sistema de recomendación es una herramienta que debe presentar al usuario un subconjunto de la información total acerca de servicios turísticos que representa y satisface en un cierto grado las preferencias del usuario. No obstante, proveer de mecanismos que incrementen la precisión del sistema es indispensable para mejorar el grado de satisfacción del usuario.
En esta tesis, se ha planteado el problema de integrar los mecanismos de razonamiento basado en reglas (RBR) y razonamiento basado en casos (CBR), en el desarrollo de un sistema de recomendación turística que sea capaz de proveer recomendaciones de recursos e itinerarios turísticos de manera personalizada. Además se propone una metodología para el desarrollo de un sistema de recomendación turística que combina ambos tipos de razonamiento. Con base en dicha metodología se ha desarrollado un prototipo llamado SyRec, que tiene el objetivo de evaluar un sistema provisto de ambos mecanismos de razonamiento y con base en la metodología propuesta. El RBR es utilizado para la recomendación de ítems turísticos en donde se lleva acabo procesos tales como: filtración, clasificación e inferencia de ítems turísticos para la planeación y modificación de un itinerario. El CBR es utilizado para la recomendación de itinerarios tiene el objetivo de recomendar al usuario los cinco principales itinerarios que satisfagan las preferencias del usuario en mayor grado con opción de modificarlos.
La principal contribución de este trabajo de tesis es un sistema de recomendación turística desarrollado con la metodología propuesta que integra el RBR y el CBR para solucionar el proceso de planeación de un itinerario turístico con base en las recomendaciones de ítems e itinerarios turísticos.
CONTENIDO
ÍNDICE DE FIGURAS ...13
INDICE DE TABLAS ...15
1. INTRODUCCIÓN...17
1.1 GENERALIDADES...17
1.2 PROYECTO @LIS-TECHNET...19
1.2.1 Programa @lis ... 19
1.2.2 Proyecto @lis TechNET ... 21
1.3 DESCRIPCIÓN DEL PROBLEMA...23
1.4 OBJETIVOS...24
1.5 JUSTIFICACIÓN...25
1.6 HIPÓTESIS...25
1.7 ALCANCES Y LIMITACIONES...26
1.8 METODOLOGÍA...26
1.9 ORGANIZACIÓN DEL DOCUMENTO...27
2. SISTEMAS DE RECOMENDACIÓN TURÍSTICA ...29
2.1 EL COMERCIO ELECTRÓNICO Y EL TURISMO: PROBLEMÁTICA Y RETOS...29
2.2 LA TOMA DE DECISIÓN EN LA PLANEACIÓN DE VIAJES TURÍSTICOS...32
2.3 SISTEMAS DE RECOMENDACIÓN...33
2.3.1 La recuperación de información preferencial... 34
2.3.2 Tipos de sistemas de recomendación ... 34
2.3.4 Objetivos de un sistema de recomendación... 35
2.3.5 Evaluación de sistemas de recomendación ... 36
2.4 SISTEMAS DE RECOMENDACIÓN TURÍSTICA...39
2.5 RESUMEN...41
3. RAZONAMIENTO BASADO EN REGLAS ...43
3.1 SISTEMAS DE PRODUCCIÓN...44
3.2 ELEMENTOS DE UN SISTEMA DE PRODUCCIÓN...46
3.2.1 Producción de reglas... 46
3.2.2 La memoria de trabajo ... 47
3.2.3 La unidad de control ... 47
3.3 PROPIEDADES DE UN SISTEMA DE PRODUCCIÓN...49
3.4 TIPOS DE SISTEMAS DE PRODUCCIÓN...51
3.4.1 Sistemas conmutativos... 51
3.4.2 Sistemas particionados ... 51
4. RAZONAMIENTO BASADO EN CASOS...53
4.1 INTRODUCCIÓN...53
4.2 EL CICLO DEL RAZONAMIENTO BASADO EN CASOS...55
4.3 MÉTODOS DEL RAZONAMIENTO BASADO EN CASOS...58
4.3.1 Representación de casos... 58
4.3.2 Recuperación ... 59
4.3.3 Reutilización ... 62
4.3.4 Revisión ... 63
4.3.5 Almacenamiento ... 63
4.4 COMPARATIVA DEL RAZONAMIENTO BASADOS EN CASOS VS. OTRAS TÉCNICAS...64
4.4.1 CBR y la recuperación de información ... 64
4.4.2 CBR vs. Técnicas estadísticas ... 64
4.4.3 CBR vs. Sistemas de producción ... 65
4.4.4 CBR vs. Máquinas de aprendizaje... 66
4.4.5 CBR vs. Redes neuronales ... 66
4.5 APLICACIONES DEL RAZONAMIENTO BASADO EN CASOS...67
4.6 RESUMEN...69
5. TRABAJO RELACIONADO...71
5.1 SISTEMAS DE RECOMENDACIÓN TURÍSTICA BASADOS EN CBR ...72
5.1.1 Metodología Trip@dvice... 73
5.1.2 ITR: Un sistema de recomendación inteligente de viajes ... 81
5.2 SISTEMA DE RECOMENDACIÓN Y PLANEACIÓN DEL PROYECTO @LISTECHNET...86
5.2.1 Descripción del sistema demostrativo @lisTechNet ... 87
5.2.2 Arquitectura del sistema... 92
5.2.3 Razonamiento dentro del sistema demostrativo de @lisTechnet ... 94
5.3 OTROS SISTEMAS...102
5.3.1 Sistemas de recomendación turística basados en MAS... 102
5.3.2 Sistemas de recomendación turística comerciales ... 106
5.3.3 Sistemas que combinan el RBR y CBR ... 107
5.4 COMPARATIVA DE SISTEMAS...108
5.5 RESUMEN...111
6. SISTEMA DE RECOMENDACIÓN TURÍSTICA PROPUESTO: SYREC...113
6.1 INTRODUCCIÓN...113
6.2 METODOLOGÍA...114
6.2.1 Modelación de plan-itinerario ... 115
6.2.2 Modelación de reglas para la recomendación de ítems turísticos... 116
6.2.3 Modelación de casos para la recomendación de itinerarios turísticos ... 118
6.2.4 Recomendación de ítems turísticos ... 120
6.2.5 Recomendación de itinerarios turísticos ... 122
6.3 EL SISTEMA SYREC...123
6.3.1 Arquitectura del sistema... 125
6.3.2 Interfaz de usuario... 127
6.3.4 El CBR y la recomendación de un itinerario turístico ... 145
6.3.5 Software de desarrollo ... 149
6.4 EXPERIMENTACIÓN...149
6.4.1 RECOMENDACIÓN DE ÍTEMS TURÍSTICOS...149
6.4.2 RECOMENDACIÓN DE ITINERARIOS TURÍSTICOS...155
6.5 COMPARATIVA ENTRE NUTKING, @LISTECHNET Y SYREC...160
7. RESULTADOS, CONCLUSIONES Y TRABAJO FUTURO ...163
7.1 RESULTADOS...163
7.2 CONCLUSIONES...165
7.3 TRABAJO FUTURO...166
ÍNDICE DE FIGURAS
FIGURA 1. DIAGRAMA DE BLOQUES DE LAS FASES DEL DESARROLLO DEL PROYECTO DE TESIS.26
FIGURA 2. DIAGRAMA DE CONSUMO DE LOS PRODUCTOS TURÍSTICOS ANTES DE INTERNET...30
FIGURA 3. DIAGRAMA DE CONSUMO DE LOS PRODUCTOS TURÍSTICOS DESPUÉS DE INTERNET. ..31
FIGURA 4. ARQUITECTURA DE UN SISTEMA DE PRODUCCIÓN. ...49
FIGURA 5. CICLO DEL RAZONAMIENTO BASADO EN CASOS. ...55
FIGURA 6. ESQUEMA DE DESCOMPOSICIÓN TAREA MÉTODO DEL CBR ...57
FIGURA 7. ESPACIOS DE PROBLEMA Y SOLUCIÓN...59
FIGURA 8. GRÁFICA REPRESENTATIVA DE LAS DISTANCIAS DEL VECINO MÁS CERCANO...60
FIGURA 9. EJEMPLO DE UN CASO BAJO LA METODOLOGÍA [email protected]
FIGURA 10. RECOMENDACIÓN DE UN SOLO ÍTEM EN LA METODOLOGÍA [email protected]
FIGURA 11. BÚSQUEDA DE INSPIRACIÓN DE LA METODOLOGÍA [email protected]
FIGURA 12. INTRODUCCIÓN DE LAS PREFERENCIAS DEL USUARIO EN LA INTERFAZ DE USUARIO DE NUTKING...82
FIGURA 13. CASO EJEMPLO EN EL SISTEMA NUTKING...82
FIGURA 14. OPCIONES PARA SELECCIONAR ÍTEMS EN NUTKING. ...83
FIGURA 15. SELECCIÓN DE LUGARES TURÍSTICOS EN LA REGIÓN DE TRENTINO, ITALIA EN NUTKING...83
FIGURA 16. RECOMENDACIONES DE ITINERARIOS TURÍSTICOS EN NUTKING...84
FIGURA 17. MANIPULACIÓN DE UN ITINERARIO RECOMENDADO EN NUTKING...85
FIGURA 18. ARQUITECTURA DEL SISTEMA NUTKING...85
FIGURA 19. INTERFAZ DE USUARIO DEL DEMOSTRADOR @LISTECHNET (A) ...90
FIGURA 20. INTERFAZ DE USUARIO DEL DEMOSTRADOR @LISTECHNET (B) ...91
FIGURA 21. PLANEACIÓN DE UN ITINERARIO EN @LISTECHNET...92
FIGURA 22. ARQUITECTURA DEL SISTEMA DEMOSTRATIVO @LISTECHNET...93
FIGURA 23. NÚCLEO DE RAZONAMIENTO DEL SISTEMA DEMOSTRATIVO @LISTECHNET...95
FIGURA 24. NIVELES DE DESCOMPOSICIÓN DEL SISTEMA DEMOSTRATIVO @LISTECHNET...97
FIGURA 25. AGENTES INMERSOS EN LA DESCOMPOSICIÓN DE UN ITINERARIO...98
FIGURA 26. OBJETIVOS DE LAS REGLAS INMERSAS EN LOS AGENTES...99
FIGURA 27. TIPOS DE REGLAS INMERSAS EN EL AGENTE LPA...100
FIGURA 28. ITINERARIO TURÍSTICO CONFORMADO EN EL SISTEMA DEMOSTRATIVO @LISTECHNET. ...101
FIGURA 29. ARQUITECTURA DEL MAS1...103
FIGURA 30. ARQUITECTURA DEL PTM ...104
FIGURA 31. ARQUITECTURA DEL SISTEMA TRAVELPLAN...105
FIGURA 32. UN EJEMPLO DE PLAN-ITINERARIO...116
FIGURA 33. MAPEO DE LAS PREFERENCIAS...118
FIGURA 34. EJEMPLO DE MODELACIÓN DE UN CASO...119
FIGURA 35. RECOMENDACIÓN DE ÍTEMS TURÍSTICOS (A). ...121
FIGURA 37. RECOMENDACIÓN DE ITINERARIOS TURÍSTICOS. ...123
FIGURA 38. ARQUITECTURA LÓGICA DE SYREC...126
FIGURA 39. ARQUITECTURA DE COMPONENTES...127
FIGURA 40. ESTRUCTURA JERÁRQUICA DE PREFERENCIAS DEL USUARIO...128
FIGURA 41. PREFERENCIAS DE VIAJE EN LA INTERFAZ DE USUARIO...129
FIGURA 42. ESPECIFICACIÓN DEL TIPO DE ALOJAMIENTO. ...129
FIGURA 43. PREFERENCIAS DE ALOJAMIENTO...130
FIGURA 44. PREFERENCIAS DE TRANSPORTE Y RESTAURANTES...131
FIGURA 45. PREFERENCIAS DE LUGARES DE INTERÉS...132
FIGURA 46. PREFERENCIAS DE ACTIVIDADES...133
FIGURA 47. ESTRUCTURA DE HORARIOS PARA UN ITINERARIO TURÍSTICO EN SYREC. ...135
FIGURA 48. RECOMENDACIÓN DE ÍTEMS TURÍSTICOS EN SYREC...138
FIGURA 49. INFERENCIA DE SYREC PARA TRANSPORTES...151
FIGURA 50. RECOMENDACIONES DE ALOJAMIENTO. ...152
FIGURA 51. FILTRADO E INFERENCIA DE ALOJAMIENTOS...153
FIGURA 52. FILTRADO Y ORDENAMIENTO DE RESTAURANTES. ...153
FIGURA 53. FILTRADO Y ORDENAMIENTO DE LUGARES. ...154
FIGURA 54. FILTRADO Y ORDENAMIENTO DE TIPOS DE ACTIVIDADES. ...154
FIGURA 55. ITINERARIO EN PROCESO DE PLANEACIÓN...155
FIGURA 56. PREFERENCIAS DE VIAJE...157
FIGURA 57. PREFERENCIAS DE ALOJAMIENTO...157
FIGURA 58. RECOMENDACIÓN DE ITINERARIOS. ...158
FIGURA 59. CASOS PROPUESTOS PARA LA RECOMENDACIÓN DE ITINERARIOS...159
ÍNDICE DE TABLAS
TABLA 1. ALGORITMOS DE FILTRADO PARA TIPOS DE INFORMACIÓN...39
TABLA 2. COMPARATIVA ENTRE EL RBR Y EL CBR...65
TABLA 3. COMPARATIVA DE TÉCNICAS DE RAZONAMIENTO...67
TABLA 4. PONDERACIÓN DE PESOS EN LA METODOLOGÍA [email protected]
TABLA 5. COMPARATIVA DE STR COMERCIALES. ...106
TABLA 6. COMPARATIVA ENTRE LOS DIFERENTES SISTEMAS DESCRITOS EN ESTE CAPÍTULO. ..110
TABLA 7. EJEMPLOS DE REGLAS DE EVALUACIÓN DE FACTORES EXTERNO...117
TABLA 8. EJEMPLO DE REGLAS DE FILTRADO...117
TABLA 9. EJEMPLOS DE INSTANCIAS INFERIDAS. ...118
TABLA 10. EJEMPLO DE LA MODELACIÓN DE LAS CARACTERÍSTICAS DISCRIMINANTES DE UN PLAN-ITINERARIO. ...134
TABLA 11. EJEMPLO DE MODELACIÓN DE UN CASO EN SYREC...136
TABLA 12. MAPEO...137
TABLA 13. ENCAPSULAMIENTO DEL GRADO DE PREFERENCIA POR TIPO DE ACTIVIDAD...137
TABLA 14. REGLAS DE INFERENCIA PARA TRANSPORTES EN SYREC...139
TABLA 15. REGLAS DE FILTRADO PARA LAS INSTANCIAS DE TRANSPORTE EN SYREC. ...140
TABLA 16. REGLAS DE ALOJAMIENTO EN SYREC...141
TABLA 17. REGLAS DE RESTAURANTES EN SYREC...142
TABLA 18. REGLAS DE INFERENCIA DE RESTAURANTES EN SYREC...142
TABLA 19. REGLAS DE LUGARES EN SYREC...143
TABLA 20. REGLAS DE ACTIVIDADES EN SYREC...144
TABLA 21. ESPECIFICACIÓN DE PESOS EN SYREC...148
TABLA 22. CASO DE PRUEBA PARA LA RECOMENDACIÓN DE ÍTEMS...150
TABLA 23. CASO DE PRUEBA PARA LA RECOMENDACIÓN DE ITINERARIOS...156
1. INTRODUCCIÓN
1.1 Generalidades
El acceso a la información a través de medios electrónicos es una realidad que demanda avances tecnológicos que faciliten dicha tarea. El Internet es el medio electrónico más utilizado en la actualidad en la búsqueda de información. Sin embargo, éste medio ha sido además una herramienta capaz de transformar la forma de realizar negocios en la sociedad actual. El comercio electrónico es ahora un término empleado normalmente para denominar las transacciones comerciales hechas a través de Internet. El principal factor que ha impulsado la proliferación del comercio electrónico es la comodidad y el bajo costo que representa este medio para la adquisición de productos o servicios.
La industria del turismo es uno de los sectores que han visto en los medios electrónicos – principalmente el Internet – la forma de verter la información de sus ofertas de manera global. El primer sistema de información electrónica en este rubro fue el sistema de reservación para las aerolíneas en la década de los 60s [23]. Hoy en día, los sistemas de información turística representan una de las aplicaciones más importante en el comercio electrónico.
catálogos de ofertas ya sea con base en sus preferencias o bien, de manera libre. Para aquellos usuarios que únicamente necesitan recursos aislados, estos sitios pueden ser de gran utilidad. Sin embargo, para realizar la planeación de un itinerario de viaje (conjunto ordenado de recursos turísticos) existen factores que pueden incrementar el tiempo para obtener un itinerario al gusto del usuario, estos factores pueden ser: buscar recurso por recurso, verificar los horarios disponibles, adaptar cada recurso al presupuesto, etc.
El modelado de un sistema de recomendación debe capturar las preferencias del usuario y ser capaz de realizar procesos de inferencia para buscar y proveer las mejores opciones que se adapten a dichas preferencias. Actualmente, existen sistemas de recomendación turística no-comerciales [16, 47] provistos por el mecanismo de razonamiento basado en casos: CBR (Case-Based Reasoning) y por el mecanismo de
razonamiento basado en reglas: RBR (Rule-Based Reasoning) que recomiendan tanto ítems
como itinerarios turísticos [4].
En los sistemas que implementan el CBR, se enfocan principalmente en la recomendación de ítems e itinerarios turísticos basados en la experiencia del sistema y en la retroalimentación de los usuarios. Básicamente, se utiliza un proceso de búsqueda y reutilización de lo previamente aprendido por el sistema. Por otra parte los sistemas que implementan el RBR, evalúan las preferencias del usuario para recomendar tanto los ítems como los itinerarios turísticos.
Los sistemas multiagentes (MAS – MultiAgent Systems) por su parte han servido
como paradigma de sistemas de recomendación turística por la propiedad que tienen estos sistemas de trabajar en ambientes distribuidos. Su principal característica es la definición de roles y tareas de sus entidades distribuyendo así una tarea compleja [57]. Cada entidad del sistema (agente) tiene la capacidad de percibir su ambiente y actuar de manera autónoma. Los sistemas de recomendación turística que se basan en este paradigma para su desarrollo asumen que las fuentes de información se encuentran dispersas geográficamente y que nuevas fuentes de información pueden ser introducidas al sistema a través de agentes encargados de registrar sus servicios para poder ser accedidos. Un sistema de recomendación turística basado en un MAS también puede implementar mecanismos de razonamiento como el CBR o RBR para mejorar el proceso de recomendación. Tal es el caso del sistema demostrativo del proyecto @lisTechNet [2, 4], el cual es un MAS provisto del RBR para la planeación de un itinerario turístico.
En el dominio del problema de la planeación de un itinerario de viaje, no solamente se identifica la necesidad de dotar al sistema de un mecanismo de razonamiento sino que además el proceso de búsqueda en un cierto ámbito de recursos de viaje evite ser lento. La libertad con la que el usuario pueda seleccionar o rechazar recursos, así como una interfaz que le permita realizar cambios de manera transparente es determinante para obtener una calificación satisfactoria por parte del usuario.
basado en reglas (RBR). Se propone una metodología como guía para el desarrollo de un sistema de recomendación híbrido, así como una arquitectura siendo ambas las principales aportaciones de este trabajo. Además se presenta el análisis del comportamiento del sistema, así como una comparativa con otros sistemas similares. Es necesario señalar que este trabajo de tesis se encuentra inmerso dentro del proyecto @lisTechNet [3], y se origina como una derivación del enfoque propuesto para el desarrollo de un sistema de recomendación turística concretado en la aplicación demostrativa del mismo proyecto.
1.2 Proyecto @lis-TechNet
Este trabajo de tesis es una contribución por parte de la cátedra de Ambientes Virtuales del Instituto Tecnológico y de Estudios Superiores de Monterrey (ITESM), Campus Estado de México; para el proyecto @lisTechnet. Los objetivos y tareas de este proyecto serán descritos en los siguientes párrafos, así como la participación del ITESM en éste proyecto.
1.2.1 Programa @lis
El programa de cooperación @lis (Alliance for the Information Society) - Alianza
para la Sociedad de la Información – nace del dialogo político establecido en junio de1999, en Río de Janeiro, entre los jefes de estado y de gobierno de la Unión Europea y de América Latina. Mediante @lis, la Comisión Europea aspira extender las ventajas de la Sociedad de la Información al conjunto de ciudadanos de América Latina, reduciendo así la brecha digital que divide a los que disponen de acceso a las nuevas tecnologías de la información, de aquellos excluidos de ellas. @lis fue creado por decisión de la Comisión Europea el 6 de diciembre de 2001[1].
Los objetivos del programa @lis son los siguientes [1]:
• Estimular la cooperación entre los socios europeos y los socios latinoamericanos;
• Responder a las necesidades de las colectividades locales y los ciudadanos con vistas a un desarrollo sostenible;
• Fomentar el diálogo entre todos los protagonistas y usuarios de la sociedad de la información;
• Poner en práctica aplicaciones derivadas de los proyectos de demostración.
@lis consta de cinco líneas de acción que corresponden a otros tantos proyectos a realizar entre 2002 y 2005. Cada uno de estos proyectos contribuirá a acercar a los agentes y usuarios de las dos regiones y a favorecer la integración de los países latinoamericanos en la sociedad de la información global.
• Un primer capítulo titulado “Diálogo político y reglamentación” tiene por objeto reforzar la integración regional y subregional en América Latina y consolidar las relaciones entre las dos regiones fomentando el diálogo en cuanto a políticas, reglamentación y la e-gobierno (buena gestión por medios electrónicos).
• Un segundo capítulo se propone favorecer una mejor integración de los países latinoamericanos en la sociedad de la información global fomentando normas globales y abiertas y alentando las colaboraciones en materia tecnológica.
• Un tercer capítulo intensificará la interconexión del colectivo europeo y latinoamericano de investigadores gracias a la instalación de una red informática de alta velocidad.
• Además se han constituido dos asociaciones birregionales entre redes de intermediarios y usuarios. La primera procurará estimular la transferencia de conocimientos técnicos entre regiones gracias, en particular, a la creación de comunidades virtuales, a la organización de conferencias anuales o también al desarrollo de hermanamientos a través de Internet. La segunda será una plataforma de apoyo y de intercambio entre organismos reguladores de las telecomunicaciones de América Latina.
• En paralelo a estas acciones, permitirán realizar aproximadamente veinte proyectos de demostración distribuidos en cuatro ámbitos temáticos que son la gobernanza local, la educación y la diversidad cultural, la salud pública y la inserción social.
El programa @lis tiene por objeto contribuir a la elaboración y aplicación de un enfoque regional de e-Estrategias (estrategias electrónicas) a cargo de los socios latinoamericanos y reforzar sus capacidades políticas y de reglamentación. La acción que acompañará a la transformación hacia la sociedad de la información se realizará en dos frentes: a nivel regional y a nivel nacional o subregional. Cada una de las partes incluirá foros de debate político, talleres, redes, intercambios de información, programas de formación y estudios específicos que abordarán las cuestiones más convenientes. Estas actividades se desarrollarán a lo largo de 36 meses [1].
Los cuatro ámbitos son los siguientes [1]:
• la gobierno local;
• la educación y la diversidad cultural; • la salud pública;
• la inserción social (o e-inclusión).
1.2.2 Proyecto @lis TechNET
Dentro de los proyectos aprobados por el programa @lis dentro del ámbito de la educación diversidad cultural, se encuentra el proyecto: @lis TechNET (Advanced Technology Demonstration Network for Education and Cultural Applications in Europe and Latin America). Siendo el solicitante del proyecto la Universidad Politécnica de
Catalunya, España. El proyecto @lis TechNet está diseñado para crear un entorno innovador de experimentación y enseñanza en Europa y América Latina. Las funcionalidades del entorno permitirán la conexión continua de todos los socios del consorcio en una red conformada de componentes de software autónomos y capaces de interactuar de forma dinámica entre ellos para proveer servicios a los usuarios [3].
Los socios que componen al proyecto @lis TechNET son los siguientes:
Europa
• Universidad Politécnica de Catalunya (España). • University of Bath (Gran Bretaña).
• Università degli Studi di Parma (Italia).
Latinoamérica
• Instituto Superior Politécnico José Antonio Echeverría (Cuba). • Universidad de Costa Rica (Costa Rica).
• Universidad Tecnológica Metropolitana (Chile). • Instituto Politécnico Nacional (México).
• Instituto Tecnológico y de Estudios Superiores de Monterrey, Campus Estado de México (México).
Este proyecto tiene como base de desarrollo la plataforma experimental Agentcities
para utilizar las más modernas tecnologías de agentes autónomos, Web Internet. Entre los resultados más importantes se espera obtener los siguientes [3]:
• Disponer de una infraestructura tecnológica de agentes autónomos, Web Internet – basada en Agentcities—que conecte Chile, Costa Rica, Cuba, México, España,
• Disponer de un entorno virtual de enseñanza extendiendo la infraestructura que permita a estudiantes, profesionales de la educación e investigadores a adquirir experiencia al trabajar con tecnologías de punta en las áreas de los agentes autónomos, Web Internet para crear aplicaciones complejas, dinámicas y disponibles en línea.
• Disponer de un demostrador capaz de crear servicios personalizados de carácter cultural o turístico que sean accesibles en línea desde un PC y/o dispositivos inalámbricos (teléfonos móviles, PDAs con servicio de roaming u otros
dispositivos) a través de la composición dinámica de los servicios instalados por los distintos socios en los diferentes países de los socios del consorcio.
Ahora bien, dentro de los resultados esperados, se pueden concentrar en tres ámbitos: despliegue, creación y demostración, cada uno de los cuales han especificados algunas tareas como lo son [3]:
• Despliegue
o Una plataforma de prueba funcionando 24/7 y que integre tecnologías de
agentes, web services y redes semánticas, ligando a todos los participantes
del proyecto y que permita conexiones de otros participantes.
o Permitir a cada participante la creación y despliegue de servicios basados en
agentes que puedan comunicarse con la red y con servicios desarrollados por terceros.
• Creación
o Un ambiente de educación que incluya tutoriales, ejemplos de código,
modelos de ejercicios y soporte en línea para estudiantes de modo que puedan experimentar el desarrollo y despliegue de aplicaciones basadas en agentes, web services y redes semánticas.
o Organizar un conjunto de clases distribuidas que permitan a los estudiantes
de diferentes universidades desarrollar sistemas que puedan comunicarse con aquellos desarrollados por cualquier otro estudiante.
• Demostración
o Una aplicación innovadora de turismo/herencia cultural usando la
plataforma de prueba que es capaz de integrar dinámicamente datos de turismo/culturales de diferentes países de modo que se facilite al usuario la planeación de viajes y actividades.
o Hacer que la aplicación sea accesible utilizando tecnologías de red
inalámbricas y alámbricas.
La plataforma experimental, o bien de prueba, sugerida por @lis es Agentcities, la
• Crear y proveer un ambiente a gran escala, abierto y heterogéneo de entidades autónomas (agentes) y permitir a estas entidades interactuar unas con otras. Por lo que el ambiente debe ser público y abierto a cualquier agente.
• Actuar como una plataforma experimental y de pruebas de interoperatividad para agentes.
• Permitir la composición dinámica, inteligente y autónoma de servicios, para satisfacer las distintas necesidades comerciales, así como las de los posibles usuarios.
1.3 Descripción del problema
La industria del turismo ha utilizado al comercio electrónico fundamentalmente para ofertar sus productos y servicios, dado que la información que describe a estos recursos turísticos es el fundamento de su oferta y demanda y el medio propicio para esto ha sido Internet.
Debido a que en la actualidad, el principal problema al que se enfrentan los consumidores es la gran dimensión que tiene el volumen de la información turística, lo que ha derivado en la necesidad de filtrar todo ese volumen de información con base en parámetros como las preferencias del consumidor. Hoy en día, las necesidades de los consumidores han evolucionado por lo que ya no es suficiente proveerles recursos turísticos de acorde a sus necesidades sino que han buscado también que se les provea de paquetes o itinerarios turísticos de manera personalizada ocasionando un problema complejo de planeación turística aunado a un problema de satisfacción de las necesidades de los consumidores.
Los sistemas de recomendación turística han solucionado estos problemas utilizando mecanismos de razonamiento, como el razonamiento basado en reglas y el razonamiento basado en casos, dentro del área de la inteligencia artificial para filtrar y recomendar soluciones que concuerden con las necesidades o deseos del usuario.
El problema abordado en este trabajo de tesis es la integración de los mecanismos RBR y CBR, en el desarrollo de un sistema de recomendación turística que sea capaz de proveer recomendaciones de recursos e itinerarios turísticos de manera personalizada.
1.4 Objetivos
Los objetivos generales en este trabajo de tesis son los siguientes:
1. Establecer un enfoque general en sistemas híbridos de recomendación integrando explotando las fortalezas del RBR y del CBR, ya que hasta la fecha no se ha establecido.
2. Proveer una metodología para el desarrollo de un sistema híbrido de recomendación turística que integre RBR y CBR.
3. Proveer un sistema híbrido de recomendación turística que integre el RBR y el CBR que sea capaz de proveer recomendaciones de recursos e itinerarios turísticos de manera personalizada.
Los objetivos particulares de este trabajo de tesis son:
1. Identificar las necesidades actuales en el ámbito de los sistemas de recomendación turística.
2. Analizar y comparar los trabajos relacionados.
3. Analizar las técnicas y métodos del RBR y CBR para identificar sus fortalezas.
4. Establecer el dominio de aplicación del RBR y CBR en el proceso de recomendación turística.
5. Proponer una metodología simplificada para el desarrollo de un sistema híbrido de recomendación turística que integre los mecanismos de razonamiento RBR y CBR.
6. La metodología debe abordar los principales modelos del RBR y CBR los cuales son la producción de reglas y los casos de manera respectiva.
1.5 Justificación
En este trabajo de tesis, se tienen los siguientes puntos que constituyen la justificación de este trabajo:
• El sector turismo es quizás el principal sector de servicios en el que cualquier país que ofrece oportunidades concretas y cuantificadas a cualquier país del mundo sin importar el grado de desarrollo y representa en mucho de los casos la primer fuente de ingresos económicos. Por lo que es importante proveer una metodología para dar a conocer una forma de desarrollo de sistemas de recomendación turística como un medio para dar a conocer los recursos turísticos de un país.
• Satisfacer la necesidad de los turistas de encontrar un sistema de recomendación que les permita realizar la planeación personalizada de un itinerario turístico organizado en el tiempo sin tener que adaptarse a los itinerarios previamente establecidos.
1.6 Hipótesis
• Un sistema híbrido de recomendación turística – híbrido en el sentido de combinar tanto el RBR como el CBR – simplifica las tareas de filtración, ordenamiento, inferencia y recomendar recursos o ítems turísticos sin que el costo del proceso sea mayor que su beneficio.
• El RBR simplifica la recomendación de ítems turísticos a través de la filtración, ordenamiento e inferencia de ítems turísticos en lugar del CBR, a través de la producción de reglas. Ya que en el CBR se tiene que recurrir a su ciclo de razonamiento para establecer todas estas tareas, además del establecimiento de métricas de similaridad.
1.7 Alcances y limitaciones
• La metodología propuesta para el desarrollo de sistemas híbridos de recomendación turística basados en CBR y RBR
• El sistema desarrollado SyRec es un prototipo demostrativo de la metodología propuesta y por lo tanto no debe ser considerado como un producto final.
• Las métricas aplicadas al sistema SyRec tienen el objetivo de analizar la funcionalidad y coherencia de las recomendaciones generadas bajo casos específicos de prueba. El uso de métricas robustas representa un costo en recursos y tiempo para la realización de este trabajo y son consideradas como trabajo futuro.
1.8 Metodología
La metodología considerada para el desarrollo de este trabajo de tesis comprende las siguientes fases:
Figura 1. Diagrama de bloques de las fases del desarrollo del proyecto de tesis
Posteriormente se recupera la información para analizar los sistemas de recomendación actuales e identificar las necesidades actuales de los consumidores de productos y servicios turísticos.
• Fase 2. Definición y desarrollo de la propuesta. En esta fase se analizan e identifican las características de los sistemas de recomendación. Se establece que prototipos experimentales han utilizado el razonamiento basado en casos para resolver el problema de la recomendación de itinerarios turísticos. A razón del proyecto @lisTechNet el cual ha generado un sistema de planeación y recomendación turística basado en RBR se origina el problema de integrar las principales características de ambos tipos de razonamiento.
Finalmente, se identifica la metodología Trip@dvice para el desarrollo de sistemas
de recomendación turística basados en CBR. Posteriormente, se establecen los criterios para proveer una metodología híbrida. La fase de requerimientos del sistema se establece para producir un prototipo demostrativo llamado SyRec, para la recomendación de ítems e itinerarios turísticos. La etapa de diseño se basa en la metodología propuesta que posteriormente da origen a la implementación del sistema.
• Fase 3: Finalización del proyecto. En esta última fase se realizan pruebas al
sistema Syrec para verificar la coherencia de la recomendación de ítems e itinerarios turísticos implementados con base en la metodología.
1.9 Organización del documento
Este documento esta organizado en ocho capítulos y un anexo. En este capítulo se ha dado una introducción al trabajo realizado, se establece el problema abordado, así como los objetivos, alcances y limitaciones, así como la metodología del propio trabajo.
En el capítulo 2, se establece el origen de los sistemas de recomendación turística. La primera sección de este capítulo se enmarca la problemática y retos del turismo y comercio electrónico. En la segunda sección, se define a los sistemas de recomendación, se describen la taxonomía y características de éstos sistemas y se presentan las principales métricas de evaluación de un sistema de recomendación. Finalmente, se describen a los sistemas de recomendación turística.
propiedades de un sistema de producción. En la cuarta sección, se define la taxonomía de los sistemas de producción.
En el capítulo 4, se describe al razonamiento basado en casos. En la primera sección se presentan las motivaciones y antecedentes de este tipo de razonamiento. En la segunda sección se describe y define el ciclo del CBR. En la tercera sección se describen los métodos o técnicas utilizadas en el ciclo del CBR. En la cuarta sección, se presenta una comparativa de los mecanismos de razonamiento contra otras técnicas o mecanismos de razonamiento para analizar sus propiedades y dominios de aplicación. En la quinta sección se describen las principales aplicaciones del CBR.
En el capítulo 5, se presentan los trabajos relacionados con los sistemas de recomendación turística. En la primera sección, se describe la principal metodología de desarrollo para los sistemas de recomendación turística basados en CBR y el análisis del prototipo desarrollado con base en dicha metodología. En la segunda sección se describe y analiza el sistema de recomendación turística del proyecto @lisTechNet. En la tercera sección, se describen y analizan brevemente otros sistemas de recomendación turísticos basados en sistemas multiagente, sistemas comerciales y sistemas fuera del ámbito del turismo que han combinado tanto al RBR como al CBR. En la cuarta sección se presenta un análisis comparativo de los sistemas contemplados en éste capítulo.
En el capítulo 6, se describe la metodología propuesta para el desarrollo de un sistema de recomendación híbrido que integra el RBR y el CBR para establecer las tareas de recomendación de ítems e itinerarios turísticos. En la primera sección, se identifican los principales problemas de los sistemas de recomendación turística en la actualidad .En la segunda sección, se describe la metodología, abordando la modelación de las reglas y casos para la recomendación de ítems e itinerarios turísticos. En la tercera sección, se describe al sistema SyRec describiendo su arquitectura desde el punto de vista lógico y de componentes. En la cuarta sección, se describen los principales casos de prueba realizados a SyRec en donde se verifica la coherencia de las recomendaciones sugeridas.
2. Sistemas de recomendación turística
La industria del turismo fue una de las primeras en utilizar el comercio electrónico, a través de Internet, para difundir sus productos y servicios; con la aparición de los sistemas de reservación en línea [35]. Aunque en un principio los sistemas de reservación fueron acogidos por las empresas de aerolíneas, actualmente son concebidos como sistemas de información turística y no solamente son una herramienta de reserva y contratación de un único servicio sino que ahora se incluyen: alojamientos, medios de transportes, restaurantes, paquetes turísticos, etc.
Los sistemas de información turística ahora han tratado de evolucionar hacia un sistema de recomendación turística incluyendo inherentemente la reservación de los productos y servicios turísticos y dotando de resultados personalizados. La razón principal de esta evolución es la gran cantidad de proveedores turísticos que han diseminado la información de sus ofertas a través del mercado electrónico. Por lo que es necesario un sistema que englobe y filtre de alguna manera dicha información de acuerdo a criterios establecidos por el usuario, resultando así los sistemas de recomendación turística.
2.1 El comercio electrónico y el turismo: problemática y retos
a) Business-to-Business (B2B): definen transacciones entre empresas.
b) Business-to-Consumers (B2C): definen transacciones entre empresas y
consumidores finales.
c) Consumers-to-Consumers (C2C): definen transacciones entre consumidores
finales.
La industria del turismo se encuentra clasificada como B2C y es el principal motor de éste tipo de comercio electrónico tanto en Estados Unidos como en Europa [34].
Los productos y servicios turísticos tienen una característica particularmente importante que los coloca en un primer plano del comercio electrónico: la información es el fundamento de su oferta y consumo. Ésta característica se debe a la propiedad de intangibilidad que tienen en si mismos los productos y servicios turísticos.
Por lo tanto, el principal problema de esta propiedad es que tiene un producto o servicio basado en la confianza. Entonces hasta que se consume el producto, el consumidor debe tener plena confianza en la calidad de la información con la que se describió el producto o servicio, asumiendo así que cumplirá con sus expectativas. De tal modo que cualquier proveedor turístico que no utilice las tecnologías de comunicación de la información como es el caso del comercio electrónico esta destinado a desaparecer.
Debido al hecho de que la difusión de la información de los productos turísticos es la parte fundamental en este sector, el medio eficaz para realizar esta diseminación ha sido hasta el momento Internet siendo éste la base del comercio electrónico [29]. La apertura del mercado de productos y servicios turísticos se le debe a Internet, que permite llegar a millones de clientes potenciales. Antes de la aparición del Internet, se tenía una estructura descentralizada en el consumo de los productos turísticos como se muestra en la figura 2.
Figura 2. Diagrama de consumo de los productos turísticos antes de Internet.
Figura 3. Diagrama de consumo de los productos turísticos después de Internet.
Más que cualquier otro medio, hoy en día Internet permite encontrar cualquier tipo de información sobre cualquier actividad o destino turístico. Sin embargo, al existir una gran cantidad de información es necesario clasificarla y presentarla al consumidor de tal manera que le sea cómodo identificar la información de su interés.
Los sistemas de información turística surgen, aunados a la necesidad de difundir la información de los productos y servicios turísticos de manera electrónica, con la finalidad de presentar ordenada y detalladamente la información, además de establecer un contacto directo con el consumidor. Las principales características que definen a los sistemas de información turística son: la calidad de la información presentada y la calidad de acceso.
La calidad de contenido provee de comprensión, precisión, consistencia y temática a la información presentada. La calidad de acceso esta orientada a desarrollar aplicaciones electrónicas que puedan ser accedidas a través de cualquier medio electrónico, en cualquier momento y desde cualquier sitio. Aunque, esto puede ser acotado a medios electrónicos con soporte de Internet. De esta manera, los servicios ofrecidos pueden ser independientes de dispositivos, localización del usuario y personalizados.
Los sistemas de información turística se han venido desarrollando como aplicaciones web en donde se incluye información y material visual acerca de los productos turísticos ofertados. Este tipo de sistemas en línea se les ha denominado con el nombre de “portales” y representan puntos centrales de acceso que contienen la información de productos y servicios turísticos de una cierta región geográfica que incluso puede ser un país [23].
turístico, así como los servicios que necesitan comparando las ofertas disponibles. Puesto que cada turista tiene un estilo de vida particular e intereses específicos es necesario proveer productos que se adapten a sus preferencias.
A fin de satisfacer a los turistas en sus necesidades y deseos, los cuales pueden tener una compleja estructura multi-nivel con un cierto grado de flexibilidad, las ofertas proporcionadas deben ser multi-opcional y de alta calidad [13].
La proliferación de los sistemas de información turística ha permitido introducir al usuario a un escenario interactivo y con un rol activo en la selección y comparación de productos turísticos. Además de permitir incluso la planeación detallada de un itinerario turístico. Sin embargo, el proceso de búsqueda de información y planeación turística es dinámico y complejo. No obstante, se han convertido en medios de soporte para la toma de decisiones [13, 34].
2.2 La toma de decisión en la planeación de viajes turísticos
Un gran número de investigadores se han dado a la tarea de desarrollar teorías o bien a definir conceptos acerca de la influencia de la toma de decisiones en el ámbito turístico [29]. Sin embargo, estas teorías han estado limitadas en la discusión de los componentes de la toma de decisión.
Una topología que define las influencias en el proceso de toma de decisión además de englobar características determinantes, se divide en tres categorías [29]:
a) Inter-personal: se basa en la influencia social que involucran la interacción de personas o grupos sociales las cuales pueden modificar las características psicológicas y comportamientos de un individuo.
b) Intra-personal: se basa en la influencia de los aspectos individuales característicos, v. gr. Estilo de vida, intereses y gustos personales, etc.
c) Cicunstancial: se basa en la influencia externa no-social v.gr. objetos, agentes, factores ambientales, etc.
Ahora bien, la planeación de un viaje turístico es un proceso multifacético que consiste en la elección de un destino (o conjunto de destinos) y de productos y servicios turísticos asociados [44].
sea una ciudad. Entonces se dice que los términos “destino” y “planeación” son conceptos difusos que carecen de una definición universal.
Dado que la planeación de un viaje turístico puede variar en cuanto a su estructura y contenido pueden utilizarse diferentes estrategias para su construcción. Mientras que existen usuarios que prefieren obtener paquetes turísticos, hay otros más que desean seleccionar componente a componente turístico e incluso hay quienes desean un paquete turístico y modificar algunos componentes.
El proceso de toma de decisión no solamente se enfoca en ayudar al usuario a seleccionar productos turísticos sino que también esta inmerso en el sistema de información turística. Dado que el sistema debe tener la capacidad de poder inferir o predecir los resultados que mejor se adapten a las preferencias del usuario tomando en cuenta los diferentes tipos de influencias mencionadas anteriormente. En general, un sistema de información turística que tenga la capacidad de clasificar, ordenar e inferir información puede denominarse como un sistema de recomendación turística.
2.3 Sistemas de recomendación
Los sistemas de recomendación han proliferado en el interés del público durante la última década y se han convertido en una gran oportunidad de negocio en el comercio electrónico [13, 44]. Algunas empresas en éste rubro, han implantado diferentes tipos de sistemas de recomendación como lo son: BookPool.com (libros), Amazon.com (multiples artículos) y vacations-explorer (turismo). En el ámbito del turismo, las recomendaciones se han convertido en un medio para la selección y planeación de recursos turísticos (alojamientos, transportes, etc.) de manera significativa.
Un sistema de recomendación tiene por objetivo ayudar al usuario en la toma de decisiones cuando no existe la suficiente experiencia personal en un cierto tópico o ámbito de interés; además de optimizar la compensación de la relación costo-beneficio.
Algunos factores que un sistema de recomendación toma en cuenta para la simplificación de la toma de decisiones pueden ser: simplificar el proceso de búsqueda y comparación de productos, reportar reseñas de otros usuarios o incluso explotar un historial de experiencias pasadas de otros usuarios para sugerir productos.
sistema. Por lo tanto es necesario identificar las preferencias del usuario así como la valoración que el usuario determine para cada una.
2.3.1 La recuperación de información preferencial
Para generar recomendaciones personalizadas es necesario entonces recuperar las preferencias del usuario, dichas preferencias dependerán del ámbito del problema. Para cada una de las preferencias se debe reflejar el grado de interés o necesidad del usuario, a lo que se le llama rating (valoración o tasación) de la preferencia. Existen dos tipos
principales de rating [58]:
a. Explicitas. El usuario especifica su preferencia hacia un ítem en particular indicando el grado de interés o necesidad en una escala determinada, por ejemplo: escala de 5 puntos, escala semántica, etc. Las escalas son mapeadas a valores numéricos que indican el grado de preferencia.
b. Implícitas. Los usuarios frecuentemente tienden a dirigir la carga de sus preferencias al sistema y confiarle la generación de un resultado. Sin embargo, recuperar información acerca de las propias preferencias del usuario puede ayudar a obtener mayor información en el contexto de las necesidades del usuario y generar un resultado optimizado. Mientras más fácil sea de recuperar la información implícita de las preferencias del usuario, el rating implícito reflejará implicaciones
discriminantes.
Debido a la dificultad que muchas veces representa adquirir ratings explícitos, se
pueden adoptar ambos enfoques de manera suplementaria.
2.3.2 Tipos de sistemas de recomendación
Hasta ahora se tienen cuatro diferentes enfoques acerca de los sistemas de recomendación. Cada uno de estos enfoques no solo difiere en las técnicas o métodos empleados sino que en la interpretación real del algoritmo esencial de recomendación. De acuerdo al objetivo de la aplicación del sistema de recomendación se puede optar por alguno de los siguientes enfoques [13, 44, 58]:
Basados en Contenido
han sido calificados como preferenciales por el usuario. Los resultados son mostrados de acuerdo al grado de concordancia hacia las preferencias del usuario [44].
Filtrado Colaborativo
El sistema almacena las valoraciones de los usuarios hacia productos sugeridos o aceptados, con el objetivo de inferir alguna posible similaridad entre los usuarios. Este enfoque es efectivo en la sugerencia de ítems. Ahora bien, la calidad de la recomendación tiende a mejorar a medida que se vayan acumulando nuevas valoraciones [13, 44]. Por lo tanto, los métodos colaborativos requieren una gran cantidad de valoraciones para producir recomendaciones satisfactorias y no pueden realizar adaptaciones con base en nuevos requerimientos ya que solo se basan en los comportamientos de experiencias pasadas.
Filtrado Basado en Conocimiento
Los sistemas dependen de la representación del conocimiento que usualmente son conjuntos de declaraciones, ontologías u otras formas de sistemas basados en reglas [13]. Este tipo de sistemas es apropiado cuando se requiere un alto rendimiento y flexibilidad en aplicaciones que se enfoquen tanto en las semánticas de contenido y social. Además de contemplar a la inferencia y razonamiento como parte del sistema, el enfoque basado en conocimiento permite beneficiarse de las diferentes representaciones del conocimiento.
Híbridos
Este tipo de sistemas pueden emerger de cualquier combinación de los enfoques anteriores que generalmente tratan de minimizar las deficiencias de cada enfoque. De hecho, existen diferentes métodos de hibridación como se menciona en [13, 44, 58].
2.3.4 Objetivos de un sistema de recomendación
Es importante entender los objetivos y tareas para las cuales se ha construido un sistema de recomendación para poder evaluarlo posteriormente. A pesar de enunciar estas tareas, no todas son necesariamente significativas dentro del contexto en el cual se sitúa un sistema de recomendación. Entre las tareas más importantes se encuentran [28]:
b) Encontrar todos los ítems de interés. La mayoría de los sistemas de recomendación solo encuentra algunos ítems de interés. Pero pueden existir casos en los que se desea invertir una mayor cantidad de tiempo para encontrar el mejor ítem; entonces es importante ampliar la cobertura de recomendación de los ítems de interés.
c) Solo búsqueda. Los sistemas de recomendación se evalúan generalmente por que tan bien ayudan se acercan a lo que el usuario desea. Pero en ocasiones el usuario centra la importancia en: la interfaz, la facilidad de uso y en el nivel y naturaleza de la información provista que en los algoritmos de recomendación.
d) Proveer credibilidad. Un usuario no confiará automáticamente en un sistema de recomendación. Muchas veces el usuario lo utiliza para darse cuenta si el sistema encuentra las opciones que el desea.
e) Expresar calificaciones. Algunos usuarios no les interesa tanto las reservaciones sino que les parece más importante contribuir con calificar los productos recomendados y esto puede contribuir a ayudar a otros usuarios a formularse una opinión acerca del producto.
Para poder llevar a cabo la evaluación de los sistemas de recomendación se debe haber definido cuales son las tareas que el sistema soporta. Una vez que se identifican las tareas, se debe seleccionar el conjunto de datos para el cual se aplicarán los métodos de evaluación.
2.3.5 Evaluación de sistemas de recomendación
La evaluación de los sistemas de recomendación es fundamental para cuantificar el grado de utilidad de las recomendaciones hechas por un sistema comparadas con el de otro sistema sobre un conjunto definido de usuarios [58].
Las evaluaciones online vs offline
Las evaluaciones online (en línea) son consideradas más representativas ya que
están orientadas a determinar la reacción del usuario respecto a los sistemas de recomendación. La cantidad de personas que pueden necesitarse para la evaluación es significativa, además que el tiempo de las evaluaciones pueden superar el tiempo de la realización del proyecto [58]. Se pueden encontrar un conjunto de dimensiones de evaluación que describen las evaluaciones en línea como a continuación se enuncian [28]:
respecto al sistema v.gr. una encuesta; la segunda se observa y registra el comportamiento del usuario.
b) Estudios de laboratorio y de campo. Los estudios de laboratorio se enfocan a investigar problemas específicos (hipótesis bien definidas) bajo condiciones controladas. Los estudios de campo revelan la situación de los usuarios en escenarios reales mostrando los patrones de uso así como problemas o cuestiones que el estudio de laboratorio puede no mostrar.
c) Resultados y procesos. Para cualquier tarea se deben tener métricas apropiadas que definan cuando un resultado es exitoso. Por lo que la precisión puede ser una métrica fundamental. Los factores de un proceso: el tiempo y el esfuerzo para realizar una tarea deben ser medidos para asegurar que el costo de un resultado exitoso no sobrepase el beneficio.
La evaluación offline (fuera de línea) es aplicable a un conjunto de datos que
contiene ratings y tiene dos principales debilidades [28]:
a) El escaso rating de los datos, lo que representa un limite en la cardinalidad del
conjunto de datos que pueda ser evaluado.
b) Limitantes de resultado, esto significa que los resultados están limitados a proveer una evaluación objetiva.
Por lo tanto una evaluación offline no puede ser determinante para calificar sistemas
de recomendación.
Conjuntos de datos naturales vs. Sintetizados
Los conjuntos de datos naturales representan tal cual la realidad. Sin embargo, pueden ser difíciles de obtener principalmente por el tiempo que implica. El uso de conjuntos de datos sintetizados facilita la manipulación de la dispersión de los datos y puede ser requerido para un cierto numero de casos pero únicamente debe ser considera como un primer paso en la recuperación de conjuntos de datos. Establecer conclusiones acerca de los conjuntos de datos sintetizados es riesgoso, debido a que los datos pueden comportarse de mejor forma con ciertos algoritmos.
Propiedades de los conjuntos de datos
Con la finalidad de establecer que propiedades debe tener un conjunto de datos para que el modelo de tareas pueda ser evaluado, se establecen tres categorías [28]:
• Características inherentes. Reflejan la naturaleza del sistema de recomendación al cual pertenecen
• Características ejemplo. Reflejan la distribución de los datos.
Métricas de precisión
Las métricas de precisión evalúan el grado con el que el sistema puede predecir el
rating para un ítem específico además de evaluar la efectividad con la que el sistema ayuda
al usuario a seleccionar ítems de mayor interés del conjunto de todos los productos [58]. Las métricas de precisión están clasificadas de la siguiente manera [28, 58]:
a) Métricas de precisión predictiva. Es la medida en la que se cuantifica que tan cercanos se encuentran los ratings pronosticados de los que el usuario ha
establecido. La métrica más utilizada en este tipo es el error absoluto medio (MAE – mean absolute error) aunque no es apropiada para tareas como: encontrar los
ítems de interés. Otras métricas del mismo tipo son: media del error al cuadrado, media de la raíz del error al cuadrado y media normalizada del error absoluto. Las primeras dos elevan al cuadrado el error antes de sumarlo y la última normaliza el error respecto al rango de valores del rating.
b) Métricas de precisión en clasificación y soporte de decisión. Esta métrica esta orientada a cuantificar la relevancia del conjunto de recomendaciones, en otras palabras esta orientada a medir la frecuencia con la que un sistema de recomendación realiza correcta o incorrectamente la decisión si un ítem puede ser de interés. Las métricas más utilizadas en este tipo son: Precisión y Retiro [28, 58].
o La precisión se define como la proporción de los ítems destacados respecto
del número de ítems seleccionados, en otras palabras representa la probabilidad que un ítem seleccionado sea relevante.
o Retiro se define como la proporción de los ítems destacados con respecto al
número total de ítems destacados disponibles.
c) Métricas de precisión en ordenamiento. Mide la habilidad de un algoritmo para producir el ordenamiento de los ítems que concuerdan con respecto de cómo el usuario podría realizarlo por él mismo. Esta métrica es propicia cuando el dominio del problema presenta valores de preferencias no binarios.
Algo más que precisión
Los sistemas de recomendación no solo deben proveer de precisión sino también de utilidad, a fin de incorporar respuestas ante posibles valores de ratings que exceden el
a) Métrica de cobertura. Se basa en el porcentaje de elementos del dominio del problema para los cuales las predicciones pueden realizarse.
b) Métricas de novedad y serendipia. Son aquellas métricas que miden la forma en la que las recomendaciones son abiertas hacia los intereses del usuario en el tiempo.
2.4 Sistemas de recomendación turística
Aún cuando los sistemas de recomendación turística son difíciles de construir, han proliferado en el área de la investigación como en el comercio electrónico. La dificultad radica en considerar el amplio grado de heterogeneidad de la información disponible en el ámbito del turismo además de las propias dificultadas que implica el proceso de toma de decisión orientado a la planeación de un itinerario turístico.
En el ámbito del turismo, los atributos de las entidades turísticas son esenciales para el desarrollo de un sistema de recomendación turística (preferencias del usuario, destino, alojamientos, restaurantes, actividades, etc) [13]:
a) Información espacio-temporal
b) Costo y aspectos económicos de los ítems
c) Archivos multimedia (texto, imágenes, audio y video) d) Clasificación de la información
e) Modelos ontológicos de las propiedades especificas del objeto (bases de datos, ontologías, etc).
Con base en estas consideraciones acerca de los tipos de datos e información, se pueden describir enfoques iniciales acerca de las técnicas que son apropiadas para un cierto tipo de información, como se describe en la siguiente tabla [13]:
Tipo de Información Técnica de filtrado
Espacio-temporal Selección en la base de datos, filtrado y razonamiento basado en conocimiento
Económica Selección en la base de datos, filtrado y razonamiento basado en conocimiento
Clasificación Multimedia
Filtrado basado en contenido y modelos ontológicos
Modelos ontológicos Diseño y selección en la base de datos, Construcción y razonamiento ontológico Usuarios Filtrado colaborativo
Existen diferentes enfoques establecidos en [13] para abordar el problema de la recomendación en los sistemas de recomendación turística, tomando como base se deben los aspectos de los objetos del mundo real – anteriormente mencionados – que son importantes para un sistema de recomendación turística, se enuncian a continuación:
• Diseño y selección en la base de datos. La selección de ítems en una petición (query) puede ser un primer paso para el filtrado de los datos y reducción de ítems.
Aunque, no representa un método flexible y óptimo si se agregan más condiciones en la petición, en algunos casos implica un constante acceso a la base de datos.
• Modelos ontológicos. Para proyectos de gran magnitud, las ontologías proveen un medio eficiente de representación y almacenamiento de objetos y proveen una base para el razonamiento. No obstante, el desarrollo de un modelo ontológico requiere de un gran esfuerzo en comparación con el diseño de una base de datos.
• Filtrado y razonamiento basado en conocimiento. Esta técnica permite incorporar el conocimiento dentro de un dominio y es un medio eficaz para incrementar el rendimiento del sistema de recomendación sin la necesidad de recurrir a algoritmos sumamente más complejos. El razonamiento basado en reglas (RBR), así como el razonamiento basado en casos (CBR) representan un enfoque plausible en la construcción de sistemas de recomendación. Por un lado, el razonamiento basado en reglas, dependiendo del número de éstas y de la complejidad de la lógica establecida, el proceso de construcción de reglas puede ser simple o complejo. Las reglas pueden incorporar la clasificación, ordenamiento e inferencia de ítems de manera dinámica. Por el otro, el razonamiento basado en casos, explota la capacidad de encontrar ítems similares aprovechando la re-utilización de los mismos y provee técnicas de clasificación y ordenamiento basadas en la similaridad de los ítems.
• Filtrado de contenido base y métodos de clasificación multimedia. Cuando el sistema de recomendación turística incorpora multimedia, en especial audio y video no así con archivos de texto e imágenes, implica un requerimiento de un alto poder computacional.
• Filtrado colaborativo. Requiere de un esfuerzo en el desarrollo integral para recuperar y conjuntar votos o ratings sobre los ítems. Generalmente, se tiene una
gran cantidad de ítems de interés y una menor cantidad de votos sobre los items, por lo que el filtrado colaborativo requiere de modificaciones para ser utilizado en el dominio del turismo.
• Sistemas híbridos. La combinación de las anteriores técnicas para abordar el tema de la heterogeneidad pueden constituir una buena opción.
precisión y utilidad de un sistema de recomendación turística debe considerar de manera jerárquica: el filtrado, la clasificación, ordenamiento e inferencia, así como un modelo de conocimiento que permita persuadir al usuario de los beneficios del sistema.
2.5 Resumen
En este capítulo se describe un punto relevante para esta tesis, como lo es la conceptualización de un sistema de recomendación turística. Se han analizado los problemas y retos del sector turismo y como los sistemas de recomendación dentro del comercio electrónico han proliferado por los beneficios que representan, siendo el más destacable la personalización de productos turísticos con base en las preferencias del usuario.
Se han señalado los elementos importantes en la toma de decisión en la planeación de un viaje turístico, los tipos de influencias que el usuario toma en cuenta en el momento de su decisión (inter-personal, intra-personal y circunstancial), además que el sistema de recomendación debe tomar en cuenta estos aspectos para inferir mejores resultados.
La funcionalidad de un sistema de recomendación turística se centra en el manejo de la heterogeneidad de la información dentro del dominio del problema, en la definición de las tareas que realizará y en las preferencias del usuario. Se describieron los enfoques más importantes en el desarrollo de este tipo de sistemas, siendo el más importante para este trabajo: el filtrado y razonamiento basado en el conocimiento. La evaluación de los sistemas de recomendación debe basarse en las tareas definidas del sistema y para ello se han descrito diferentes técnicas que miden la precisión y la utilidad del sistema.
Finalmente, se han mencionado las técnicas que pueden ser utilizadas para el filtrado de la información en el ámbito turístico, siendo el enfoque central de esta tesis el filtrado y razonamiento basado en conocimiento.
3. Razonamiento basado en reglas
El razonamiento es la habilidad de realizar inferencias para llegar a una conclusión. El razonamiento automatizado esta orientado a la construcción de sistemas de cómputo que realicen dicho proceso. En un problema de razonamiento, se trata de llegar a una meta u objetivo partiendo de uno o más estados iniciales, a menor número de transiciones que ocurran para llegar a la meta el sistema de razonamiento tendrá una mejor eficiencia. La eficiencia dependerá si la base de conocimiento es completa y organizada de manera que no requiera una búsqueda extenuante e identificación del conocimiento que el sistema requiera para resolver el problema [50].
En la ingeniera del conocimiento es el proceso por el cual se lleva a cabo la construcción de una base de conocimiento, por lo que es importante contemplar la organización de dicho conocimiento [30].
Existen una gran variedad de técnicas de representación de conocimiento dentro de la inteligencia artificial como lo son: producción de reglas, redes semánticas y lógica de predicados por mencionar algunas.
El razonamiento basado en reglas (RBR – Rule-Based Reasoning) se encuentra