• No se han encontrado resultados

RESUMEN DEL PROYECTO. Palabras Clave

N/A
N/A
Protected

Academic year: 2021

Share "RESUMEN DEL PROYECTO. Palabras Clave"

Copied!
10
0
0

Texto completo

(1)

SISTEMA RECOMENDADOR DE ACTIVIDADES DEPORTIVAS

Autor: Seisdedos Armbruster, Roberto.

Directora: Puente Águeda, Cristina.

Co-director: Olivas Varela, José Ángel.

Entidad Colaboradora: ICAI – Universidad Pontificia Comillas

RESUMEN DEL PROYECTO

El objeto de este Proyecto de Fin de Carrera consiste en la continuación del estudio del proceso de análisis de tendencias para la mejora de recomendaciones según los perfiles de usuario. A la vez que se trata de integrar el funcionamiento de este tipo de sistemas con sistemas de búsqueda de información.

Palabras Clave

sistema recomendador, sistema experto, crawler, análisis de tendencias, Pareto, similitud de usuarios, lógica borrosa.

1. Introducción

En las últimas décadas, en la rama de la Inteligencia Artificial, se han dado importantes avances que han mejorado en muchos aspectos la calidad de vida del hombre. Dentro de estos avances, se pueden destacar los diferentes tipos de sistemas basados en la información como puedan ser los sistemas expertos o los sistemas recomendadores. Los sistemas expertos tienen las capacidades de resolver problemas en concreto proporcionando unos datos variables al compararlos con una base de información muy amplia, mientras que los sistemas recomendadores hacen uso tanto de la información que se encuentra almacenada en el sistema como de la propia generada por el usuario para llevar a cabo unos análisis de tendencias y proporcionar las recomendaciones más ajustadas en cada momento.

Uno de los fines de este proyecto consiste en estudiar la viabilidad de la posible integración de sistemas que basan su funcionamiento en la información como son los sistemas anteriormente descritos, con sistemas que buscan la información en la red tales

(2)

como Arañas Web o Crawlers. Estos sistemas lo que hacen es analizar la web para recuperar la información que es importante para el resto de la aplicación.

Este proyecto se centra en una temática de presentación de ofertas y recomendaciones de viajes en relación a unas características de los usuarios. Las recomendaciones estarán basadas tanto en la información que el usuario proporciona al sistema, como la información que el mismo genera al interactuar con el sistema. De forma que el proceso aprende de forma automática para mejorar las recomendaciones respetando las tendencias y los requisitos de los usuarios.

Para ello se lleva a cabo un análisis de los procesos de recomendación y se trata de proporcionar modificaciones a dichos procesos con el fin de mejorar la eficiencia del mismo. Estas modificaciones estarán basadas en su gran mayoría en el cálculo y procesamiento de información de tipo borroso que será generada por el sistema de forma automática.

2. Objetivos

Los objetivos que se pretenden alcanzar con este proyecto son una integración fiable entre los sistemas de recolección de información con los sistemas de recomendación basados en información, proporcionar nuevas perspectivas a la hora de llevar a cabo el proceso de recomendación haciendo uso de lógica borrosa y desarrollar una aplicación para móviles que permita hacer uso del mismo ante la todavía inexplorada senda de esta rama.

3. Metodología

Como este proyecto se compone de diferentes componentes que todos ellos se encuentran integrados entre sí, la metodología que se ha seguido para el desarrollo del proyecto se ha basado, en un primer plano, en el desarrollo de cada uno de los componentes por separado para, posteriormente, integrarlos entre sí.

3.1. Sistema Crawler de recolección de información

Haciendo uso de la tecnología existente de los lenguajes de programación del lado de servidor como PHP, se pretende diseñar y desarrollar un sistema de estas características. Para ello se hará uso de las funcionalidades disponibles por el lenguaje de programación seleccionado (PHP) y de las tecnologías de las páginas como puede ser la jerarquía DOM. La implementación que se llevará a cabo, queda representada a alto nivel en la siguiente figura:

(3)

Figura 1: Arquitectura de alto nivel del sistema de recolección de información implantado 3.2. Sistema Experto batch para la generación de ofertas

Este componente del sistema es una de las claves principales para el correcto funcionamiento del mismo. Es un sistema experto que no interactúa con el usuario de forma dinámica sino que por medio de la información recolectada por el componente de búsqueda de información en la red, y a partir de las características tanto del usuario como de la búsqueda realizada desde la interfaz web o móvil, se generan todas las posibles ofertas que correspondan con dicha información y que puedan ser interesantes para el usuario que haya realizado la búsqueda.

3.3. Sistema Recomendador de ofertas

Éste puede que sea el componente de mayor importancia dentro del conjunto del proyecto. Este sistema hace uso de toda la información que ha sido generada por el sistema experto, de las características del usuario que ha realizado la búsqueda y de las tendencias pasadas tanto del propio usuario como de usuarios similares para proporcionar un orden de presentación en las ofertas finales.

Para ello se hace uso de varios procesos que generan información borrosa derivada de los usuarios. Este sistema se compone de procesos como el cálculo del grado de semejanza entre los usuarios, proceso que tiene que ser ejecutado de forma batch por la cantidad de cálculo que el mismo conlleva, y el análisis de las tendencias de los usuarios por medio de la función de distribución acumulada de Pareto.

(4)

Figura 2: Función de distribución acumulada de Pareto

El cálculo del grado de similitud de los usuarios está inspirado en el cálculo de la distancia que hay entre dos puntos, es decir, la obtención del módulo del vector que une dichos puntos. En el caso del cálculo de la semejanza se tratan a los usuarios como puntos donde cada una de sus características corresponde con una coordenada en un espacio de 5 dimensiones. Una vez que se calcula la diferencia entre todas y cada una de las coordenadas éstas diferencias son tipificadas entre los valores 0 y 1 y se calcula el grado de semejanza final. Éste cálculo del grado final se hace teniendo en cuenta que el resultado que se quiere obtener es un resultado borroso y que representa lo mucho que se parecen los dos usuarios entre sí.

Para el cálculo de las recomendaciones finales, se emplea la función de distribución acumulada de Pareto que se encuentra dibujada en la Figura' 2. Las variables que se han tenido en cuenta para el desarrollo de esta funcionalidad son el presupuesto máximo que el usuario está dispuesto a gastar, la distancia que hay entre el usuario y el lugar donde se realiza la determinada actividad, el nivel general del grupo que va a desarrollar dicha actividad, la evaluación del lugar donde se realiza, la duración de la actividad y las tendencias pasadas tanto del propio usuario como la de usuarios similares. En el caso de las tendencias pasadas de los usuarios similares, se tiene en cuenta además el grado de similitud entre los mismos, para que no condicionen demasiado el resultado de la recomendación.

(5)

3.4. Interfaces de interacción con el usuario

Para conseguir que un usuario pueda utilizar el sistema, se han desarrollado dos tipos de interfaces para esta aplicación que son: una interfaz web y una interfaz móvil.

El desarrollo de la interfaz móvil del sistema con el usuario no ha sido desarrollado solamente para facilitar el acceso al mismo, sino que también para poder abrir e investigar en nuevas tecnologías para la implementación de sistemas de recomendaciones móviles. Esto se ha llevado a cabo para intentar dar una solución a la conexión que este tipo de sistemas tienen con la localización geográfica.

4. Resultados

Las pruebas realizadas en relación al sistema se centran exclusivamente en el componente del sistema de recomendaciones de ofertas. Para el desarrollo de las pruebas, se han generado dos perfiles de usuario diferentes entre sí y se han realizado diferentes búsquedas analizando los resultados numéricos de las búsquedas, y por tanto el orden de presentación de las mismas ante el usuario.

Los resultados obtenidos son lo suficientemente satisfactorios para la escasez de información de la que se dispone en el momento y representan con claridad las diferencias en el análisis de las tendencias y las recomendaciones a ambos usuarios.

5. Conclusiones

• Se logrado implementar una combinación de diferentes tecnologías basadas en la información para tener un aprendizaje continuo.

• Se ha desarrollado un sistema híbrido entre sistemas de recomendación y sistemas expertos para el análisis de tendencias, con resultados muy de acuerdo con las expectativas ante las características.

(6)

RECOMMENDING SYSTEM OF SPORT ACTIVITIES

Author: Seisdedos Armbruster, Roberto.

Director: Puente Águeda, Cristina.

Co-director: Olivas Varela, José Ángel

Contributor Entity: ICAI – Comillas Pontifical University.

ABSTRACT

The aim of this project is to continue the study of the analysis process of past tendencies to improve user profile based recommendations. Additionally, it strives to integrate the functioning of this type of systems with information searching systems.

Keyword compound: recommending system, expert system, web harvesting system, tendencies analysis, Pareto, user similarities, fuzz logic.

1. Introduction

In the past few decades, there have been a big amount of improvements in the field of Artificial Intelligence. These new findings have managed to change the quality of life in the world. Among these achievements, it is possible to point out information-based systems such as expert systems or recommending systems.

Expert systems have the capability of problem solving by making use of the information they have been provided, comparing it to a knowledge base, whereas recommending systems use not only the information stored in the knowledge base, but also the information which is generated by the user to make tendency analysis to provide a more accurate recommendation.

One of the main goals of this project is to study the viability of the possible integrations of the systems previously described with web harvesting systems such as web spiders or crawlers. This type of systems analyzes the web to retrieve the important information for the other systems to work with.

(7)

The subject of this project is the generation of travelling offers regarding some of the user characteristics. This offers will be based on both the information the users provide the system, and the information they generate while interacting with the system. This way, the system is able to learn from the past tendencies to improve these offers with respect to the user profiles and past tendencies.

To achieve this, an analysis of the recommending processes is done to add some new modifications to improve its performance. This new modifications will be mainly based on the calculus and processing of fuzzy logic-based information created by the system.

2. Objectives

The objectives that are to be achieved with this project are: a reliable integration of the information harvesting systems and the information based systems, provide new perspectives on how to tackle user profile based recommendations using fuzzy logic and to develop a mobile application to give a new point of view regarding this unexplored field of mobile recommending systems.

3. Methodology

As this project is composed by different systems that are integrated among them, the methodology that has been used has its focus on firstly, develop each compound separately, and finally integrate the different processes. The different parts are:

3.1. Web crawler for web information harvesting

Using the existing technology of the server-side programming languages like PHP, it is expected to develop such a system. To do so, it will be necessary to make use of the selected programming language and the web page techniques like the DOM hierarchy, to implement the high level architecture that is displayed in the following figure:

(8)

Figure 1: High level architecture of the implemented Web Crawler

3.2. Batch expert system for the offer creation

This is one of the main keys of the project and is needed for the correct functioning of the whole. This expert system is called batch, as it does not interact with the user at any time, and only uses the information harvested by the web crawler and provided by the search made by the user to create the offers. Additionally, the process of offer creation is also based on the users characteristics to adapt as much as possible to the user doing the search.

3.3. Offer recommender system

This might be the most important component of the whole project. This system uses all the generated information by the expert system, the information of the user profile and the past tendencies of the user as well as the tendencies of users that are similar to him. This final goal of this system is to order the generated offers from high to low probability to be selected. To achieve this, there are several different processes that interfere in the system that generate fuzzy information derived from the users. This processes calculate the similarity grade between the users (process that has to be executed in batch mode due to its processing weight), and the analysis of past tendencies using the cumulative distribution function of Pareto.

(9)

Figure 2: Cumulative distribution function of Pareto

The calculus of the similarity grade of two users has been inspired by the idea of calculating the vector distance of two points in an n-dimensional space. This means, calculating the modulo of the vector that link the two points. In the similarity case, each user is treated as a point in a 5 dimensional space where each one of the characteristics that takes part of this process would correspond to a coordinate in the space. Once the difference between each pair of coordinates has been calculated, and the value has been categorized from 0 to 1, the final similarity grade is calculated. The calculation of the final grade is done taking into consideration that the final result that is expected has to be a fuzzy value that represents how much two users are alike.

For the final recommendations to be decisive, the cumulative distribution function of Pareto is used. This function can be seen in Figure 2. The variables that have been taken into consideration for the development of this part of the project are the maximum budget the user wants to spend, the distance between the user location and the place where the offer is valid, the level of the activity the general group has as well as the user’s level that is doing the search, the evaluation of the place, the duration of the stay and finally, the past tendencies not only of the user doing the search, but also those of similar users. In this case, it is not only

(10)

considered the tendencies but also the similarity grade that has been calculated before, to lower the weight of their tendencies in the final recommendation.

3.4. User interfaces

Two different interfaces have been developed for the user to interact with the system, a web interface and a mobile interface.

The mobile interface has not only been developed to ease the users use of the system, but also to open new paths of investigation regarding new technologies to implement mobile recommending systems. The aim of this is to give a solution to the nexus between the geographical location and the system in use.

4. Results

The$ testing$ that$ has$ been$ done$ was$ focused$ on$ the$ recommending$ side$ of$ the$ whole$ compound.$ For$ the$ tests$ to$ work,$ to$ different$ profiles$ have$ been$ created$ and$ several$different$searches$have$been$done$to$analyze$the$numerical$output$of$the$Pareto$ function$over$the$defined$variables$and$thus,$the$final$presentation$order$of$the$offers.$

$

The obtained results meet the expectations regarding the current lack of information. However, they present a clarified vision of the differences in the tendency analysis and recommendations of the users.

5. Conclusions

• It has been possible to integrate different kinds of information-based systems to gain a continuous learning.

• A hybrid system between expert systems and recommending systems has been developed for the tendency analysis, with results meeting the expectations regarding the characteristics.

Referencias

Documento similar

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

E Clamades andaua sienpre sobre el caua- 11o de madera, y en poco tienpo fue tan lexos, que el no sabia en donde estaña; pero el tomo muy gran esfuergo en si, y pensó yendo assi

D) El equipamiento constitucional para la recepción de las Comisiones Reguladoras: a) La estructura de la administración nacional, b) La su- prema autoridad administrativa

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de

Se indica, tanto en el hombre como en la mujer, en el tratamiento de las siguientes infecciones de transmisión sexual: infecciones genitales no complicadas debidas a

En un ensayo clínico (EC) fase III, para evaluar la eficacia y seguridad del Surfacen® en el tratamiento del síndrome de distrés respiratorio agudo (SDRA) en edades

Solo se debe utilizar durante el embarazo cuando los beneficios esperados justifiquen el riesgo para el feto.. Lactancia materna: solo deberá utilizar cuando los