Uso de modelos de lenguaje natural para la interacción humano-robot

(1)

Máster Universitario en Ciencia y Tecnología Informática 2022 – 2023

Trabajo Fin de Máster

“Uso de modelos de lenguaje natural para la interacción humano-robot”

Javier Cruz del Valle

Tutores

Álvaro Castro González Teresa Onorati

Esta obra se encuentra sujeta a la licencia Creative Commons Reconocimiento – No Comercial – Sin Obra Derivada

(2)

(3)

III

RESUMEN

Este proyecto fin de Máster se ha realizado en el marco del proyecto "Minería de Datos de Redes Sociales para la Interacción Humano Robot", acción financiada por la Comunidad de Madrid a través de la línea "Estímulo a la Investigación de Jóvenes Doctores/as" del Convenio Plurianual con la UC3M (SMM4HRI-CM-UC3M), en el marco del V PRICIT.

El principal propósito del proyecto es el desarrollo de una nueva funcionalidad para el robot social Mini, que utilice las redes sociales para mantener a las personas informadas y conectadas con la actualidad. Para ello, se obtiene información actualizada de las noticias más recientes publicadas en Twitter, se procesa el contenido de estas, se genera un resumen mediante modelos de Inteligencia Artificial conocidos como grandes modelos de lenguaje y se responden las preguntas de los usuarios relacionadas con dichos artículos mediante otros modelos similares. Con todo ello, se ha implementado una solución adaptable a las gustos individuales de los usuarios que permite la personalización del contenido, estimulando una mayor adopción e interacción con el sistema.

Los resultados obtenidos en la experimentación avalan un buen resultado en las respuestas generadas por los diferentes modelos de procesamiento de lenguaje natural que se han empleado, así como la capacidad para proporcionar información útil y responder preguntas de manera efectiva. Las conclusiones obtenidas respaldan una experiencia de usuario totalmente satisfactoria y una percepción del robot con altas capacidades para la tarea desarrollada. Por tanto, el proyecto demuestra ser una solución prometedora, ofreciéndose como una herramienta útil para mejorar la calidad de vida, especialmente para las personas mayores. La aplicación y uso están destinados en última instancia a la asistencia de personas mayores, con el objetivo de reducir su aislamiento social causado por las nuevas tecnologías, promoviendo así una sociedad más inclusiva. El proyecto se ha llevado a cabo de manera interdisciplinaria en conjunto con el Laboratorio de Robótica Social y el Grupo de Sistemas Interactivos, ambos de la Universidad Carlos III de Madrid.

Palabras clave:

Software, inteligencia artificial, robótica social, minería de redes sociales, diálogos.

(4)

(5)

V

ABSTRACT

This master's thesis is part of the project "Social Media data mining for Human- Robot Interaction", funded by the Madrid Regional Government through "Estímulo a la Investigación de Jóvenes Doctores/as" line under the agreement with UC3M (SMM4HRI- CM-UC3M), in the V PRICIT framework.

The main purpose of the project is to develop a new functionality for the Mini social robot, which uses social networks to keep people informed and connected with current events. To do this, updated information is obtained from the most recent news published on Twitter, the content of these is processed, a summary is generated using Artificial Intelligence models known as large language models and users' questions related to these articles are answered using other similar models. With all this, a solution adaptable to the individual preferences of the users has been implemented that allows the personalisation of the content, stimulating a greater adoption and interaction with the system.

The results obtained in the experimentation support a good result in the answers generated by the different natural language processing models that have been used, as well as the capacity to provide useful information and answer questions effectively. The conclusions obtained support a totally satisfactory user experience and a perception of the robot with high capabilities for the task developed. Therefore, the project proves to be a promising solution, offering itself as a useful tool to improve the quality of life, especially for the elderly. The application and use are ultimately aimed at assisting elderly people, with the objective of reducing their social isolation caused by new technologies, thus promoting a more inclusive society. The project has been reached in an interdisciplinary manner in conjunction with the Social Robotics Laboratory and the Interactive Systems Group, both at the Carlos III University of Madrid.

Keywords:

Software, artificial intelligence, social robotics, social media mining, dialogues.

(6)

(7)

VII

DEDICATORIA

Este proyecto ha sido posible gracias a la Universidad Carlos III de Madrid, que me ha brindado la oportunidad de desarrollar mi Trabajo Fin de Máster en el laboratorio de investigación de Robótica Social. También quisiera expresar mi agradecimiento por proporcionarme los medios y herramientas necesarias para llevar a cabo este proyecto.

Agradezco especialmente a mis tutores, Álvaro Castro González y Teresa Onorati, por su apoyo, guía y conocimiento experto aportado, que han sido fundamentales durante el desarrollo. Asimismo, agradezco a mis compañeros del laboratorio por el intercambio de ideas y aprendizajes enriquecedores durante el proceso de investigación.

Por último, quisiera agradecer a mi familia, amigos y compañeros por su constante apoyo y motivación a lo largo del máster.

Muchas gracias por todo.

(8)

(9)

IX

ÍNDICE DE CONTENIDOS

1. INTRODUCCIÓN ... 1

1.1. Motivación ... 1

1.2. Objetivos ... 2

1.3. Marco regulador ... 4

1.4. Entorno socioeconómico ... 6

1.5. Metodología de investigación ... 7

1.6. Estructura del documento ... 10

2. ESTADO DEL ARTE ... 12

2.1. Áreas de investigación relacionadas ... 12

2.1.1. Robótica social ... 12

2.1.2. Procesamiento del lenguaje natural ... 16

2.1.3. Sistemas de diálogo ... 19

2.1.4. Uso de redes sociales ... 21

2.2. Marco de trabajo ... 21

3. DISEÑO Y DESARROLLO DE LA SOLUCIÓN ... 23

3.1. Ideación del flujo de comportamiento general ... 23

3.2. Integración del motor de las fuente de noticias ... 25

3.3. Selección de los modelos de lenguaje natural ... 28

3.3.1. Introducción y explicación de los modelos ... 28

3.3.2. Tarea 1: generación de resúmenes ... 32

3.3.3. Tarea 2: respuesta a preguntas largas ... 34

3.4. Comparativa de los grandes modelos de lenguaje empleados ... 36

3.4.1. Modelos de código abierto ... 36

3.4.2. Modelos propietarios ... 40

3.5. Integración del desarrollo en el robot social ... 42

(10)

X

4. EXPERIMENTACIÓN ... 45

4.1. Descripción de las pruebas realizadas ... 45

4.2. Análisis de los usuarios experimentados ... 48

4.3. Resultados obtenidos tras la experimentación ... 51

4.3.1. Métricas de carácter general ... 51

4.3.2. Escalas de usabilidad del sistema ... 52

4.3.3. Categorías de atributos sociales del robot ... 54

4.3.4. Análisis globales ... 56

5. CONCLUSIONES ... 60

5.1. Propuesta final ... 60

5.2. Objetivos cumplidos ... 61

5.3. Limitaciones encontradas ... 63

5.4. Líneas futuras de trabajo ... 64

BIBLIOGRAFÍA ... 67 ANEXO A. PLANIFICACIÓN DEL PROYECTO

ANEXO B. GUION DEL PROCESO DE EXPERIMENTACIÓN ANEXO C. FORMULARIO DE CONSENTIMIENTO INFORMADO ANEXO D. CUESTIONARIO DE CARÁCTER GENERAL

ANEXO E. FORMULARIO DE EVALUACIÓN

(11)

XI

ÍNDICE DE FIGURAS

Figura 1: Metodología de investigación en ciencias del diseño ... 8

Figura 2: Transiciones de la interacción ideada ... 24

Figura 3: Elementos de integración del motor de las fuentes de noticias ... 27

Figura 4: Implementación de los modelos de lenguaje natural ... 31

Figura 5: Métricas de los modelos gratuitos para la generación de resúmenes ... 37

Figura 6: Métricas de los resúmenes generados por cada parte de la noticia ... 38

Figura 7: Tiempos de llamada para la generación de resúmenes ... 38

Figura 8: Métricas de los modelos gratuitos para la respuesta a preguntas largas ... 39

Figura 9: Tiempos de llamada para la respuesta a preguntas largas ... 40

Figura 10: Tamaños de los grandes modelos de lenguaje mencionados ... 41

Figura 11: Componentes de la integración del desarrollo en el robot social ... 43

Figura 12: Escenario físico de la experimentación ... 47

Figura 13: Rangos de edades de los usuarios experimentados ... 49

Figura 14: Niveles de estudios de los usuarios experimentados ... 50

Figura 15: Valoraciones de las métricas de carácter general ... 51

Figura 16: Puntuaciones de las escalas de usabilidad del sistema ... 52

Figura 17: Puntuaciones a las categorías de atributos sociales del robot ... 54

Figura 18: Puntuaciones a las escalas de capacidades ... 55

Figura 19: Puntuaciones a las escalas de afectividad ... 55

Figura 20: Puntuaciones a las escalas de malestar ... 56

Figura 21: Evaluaciones globales de la satisfacción del usuario ... 57

Figura 22: Diferencias en las calificaciones a la misma pregunta ... 57

Figura 23: Aspectos positivos de la interacción con Mini ... 58

Figura 24: Aspectos negativos de la interacción con Mini ... 59

Figura 25: Conclusiones en base a la metodología de investigación ... 60 Figura 26: Diagrama de Gantt

Figura 27: Formulario de consentimiento informado

Figura 28: Cuestionario de carácter general (primera parte) Figura 29: Cuestionario de carácter general (segunda parte) Figura 30: Formulario de evaluación (primera parte)

Figura 31: Formulario de evaluación (segunda parte) Figura 32: Formulario de evaluación (tercera parte) Figura 33: Formulario de evaluación (cuarta parte)

(12)

(13)

XIII

ÍNDICE DE TABLAS

Tabla 1: Modelos de diálogo más importantes ... 19

Tabla 2: Estructura del prompt para la tarea de generación de resúmenes ... 33

Tabla 3: Estructura del prompt para la tarea de respuesta a preguntas largas ... 35

Tabla 4: Resumen de las métricas para todos los modelos evaluados ... 42

Tabla 5: Anotaciones realizadas durante la experimentación ... 48

Tabla 6: Sentencias de las escalas de usabilidad del sistema ... 52

Tabla 7: Valores estandarizados para medir la usabilidad del sistema ... 53

(14)

(15)

(16)

(17)

1

1. INTRODUCCIÓN

1.1. Motivación

En la era actual de la información y la conectividad global, la tecnología desempeña un papel fundamental al mantener a las personas informadas y conectadas con el mundo.

Esta dinámica ha abierto la puerta a un nuevo escenario de interacción entre humanos y tecnología, donde se exploran soluciones innovadoras que se adapten y satisfagan las necesidades cambiantes de la sociedad.

Un robot social se define como una entidad tecnológica diseñada para interactuar con los seres humanos de una manera que simula o facilita la interacción humana. Con frecuencia, las interacciones actuales entre seres humanos y robots sociales se ven restringidas por respuestas previamente programadas y comunicaciones verbales que tienden a ser repetitivas, sin incorporar elementos de comunicación no verbal. Estas limitaciones nos plantean un desafío importante en la mejora de la calidad de la interacción y la utilidad de estos robots en la vida cotidiana.

La personalización en la interacción de la mano de un avance en los modelos de lenguaje se presenta como una posible aplicación esencial en la búsqueda de mejorar el paradigma actual. Imaginemos un escenario donde los diálogos con los robots se adaptasen a las preferencias e intereses individuales de cada usuario. Esto implica que el robot no solo comprende las preguntas planteadas, sino que también ofrece respuestas contextualmente relevantes, creando así una experiencia más rica y útil para los usuarios.

Los beneficios potenciales de esta innovación son considerablemente notables. Mantener a los usuarios informados en tiempo real, proporcionándoles respuestas precisas y actualizadas sobre temas de actualidad, podría empoderar a las personas de todas las edades y niveles de experiencia tecnológica para tomar decisiones más informadas en su vida diaria. Esta democratización del acceso a la información es un avance significativo en la evolución de la interacción entre humanos y tecnología.

Además, la mejora de la interacción entre humanos y robots no solo impacta a nivel individual, sino que también tiene implicaciones sociales más amplias. Al enriquecer la calidad de vida de las personas y fomentar una sensación de comunidad a través de la tecnología, se avanza hacia una sociedad más inclusiva y equitativa.

(18)

2 En última instancia, este proyecto tiene el potencial de beneficiar a una amplia gama de usuarios. Aunque no se ha enfocado exclusivamente en un grupo demográfico específico, es relevante destacar que las personas mayores son una de las poblaciones que podría experimentar unas ventajas más significativas. La capacidad de mantenerse informados y de interactuar de manera personalizada con un robot social podría ayudar a mitigar el aislamiento social [1] producido en gran medida por las nuevas tecnologías emergentes.

Además, el uso de tecnología en el cuidado de la tercera edad alivia la carga de los sistemas de atención médica [2], así como de los cuidadores [3], permitiéndoles brindar una atención más personalizada y centrada en las necesidades individuales.

1.2. Objetivos

Dentro de este contexto, se propone el desarrollo de una nueva funcionalidad para el robot social Mini, que le permita ser capaz de obtener información actualizada de diversas fuentes digitales a través de las redes sociales, proporcionando respuestas pertinentes a preguntas específicas sobre sus artículos. Todo ello con el uso de modelos de Inteligencia Artificial denominados grandes modelos de lenguaje o LLM (Large Language Models por su traducción al inglés).

Este proyecto no solo persigue mantener a los usuarios informados, sino también crear una experiencia de conversación dinámica y fluida. Con todo ello se pretende generar una interacción enriquecedora sobre noticias de relevancia para los usuarios, aprovechando la riqueza de contenido disponible en las redes sociales como punto de partida que genere diálogos significativos. Para su consecución, se subdividirá el proyecto en los siguientes subobjetivos concretos, especificando los beneficios de la obtención de cada uno de ellos y subrayando su relevancia:

• Integración de fuentes de noticias: el primer subobjetivo es incorporar fuentes de información digitales confiables y relevantes para los usuarios, extrayendo los últimos tweets relacionados para obtener información actualizada sobre los temas de su interés. La selección de las fuentes de noticias debe ser cuidadosamente evaluada para asegurarse que sean de calidad y estén dirigidas al público objetivo.

De su consecución se pueden esperar beneficios tales como el acceso a información actualizada que cuente con la certeza de provenir de fuentes oficiales contrastadas. Esto también implicaría una mejora en la calidad de la información, que además contribuye a evitar la difusión de noticias falsas o engañosas.

(19)

3

• Uso de grandes modelos de lenguaje: el segundo subobjetivo es la aplicación de modelos de Inteligencia Artificial denominados grandes modelos de lenguaje.

Estos mismo deben en primer lugar, procesar el contenido extraído de los tweets y resumir este de manera eficaz. Y en segundo lugar, permitir a los usuarios hacer preguntas relacionadas con el artículo en las que se obtengan respuestas precisas y relevantes. De su realización se puede observar mejoras en la síntesis efectiva del contenido, así como la identificación de partes importantes de los artículos que permitan obtener una visión general y rápida de la información, y la resolución de dudas e inquietudes relacionadas con la noticias que permitan profundizar en los temas de interés, fomentando la interacción con el sistema.

• Interacción personalizada: el tercer subobjetivo es desarrollar un sistema que se adapte a las preferencias individuales de los usuarios. Esto implica la posibilidad de personalizar el contenido, la interacción y la presentación de la información para que se ajusten a las preferencias y necesidades específicas de cada usuario.

De su cumplimiento se pueden anticipar ventajas como la mejora en la experiencia de usuario, mayor usabilidad del sistema y satisfacción en su uso.

• Implementación en el robot: el cuarto subobjetivo se enfoca en implementar los resultados obtenidos en el propio robot. Este proceso involucra llevar a cabo las funcionalidades desarrolladas y optimizar su desempeño para ofrecer una experiencia completa y beneficiosa para los usuarios. De su logro se pueden esperar beneficios tales como la interacción tangible con la tecnología que habilite una experiencia más cercana a la comunicación humana, ya que posibilitará hacer preguntas y recibir respuestas a través de un medio físico.

• Evaluación de la eficacia del sistema: el quinto subobjetivo es evaluar la eficacia del robot en términos de su capacidad para proporcionar información relevante y útil a las usuarios, así como su aptitud para mantener conversaciones de calidad.

Esto implica la realización de pruebas y evaluaciones con un grupo de usuarios para identificar las fortalezas y debilidades del sistema, realizando las mejoras necesarias. De su consecución se pueden esperar como beneficios el ajuste a las preferencias de los usuarios, lo que maximizará su utilidad y provecho. Además, proporcionará una retroalimentación valiosa para el desarrollo del robot en futuro proyectos similares.

(20)

4 1.3. Marco regulador

El marco regulador es uno de los factores más relevantes referidos al impacto en el ámbito legal, económico y social posibles en la aplicación del proyecto. Este marco establece las normativas y leyes que deben seguirse para garantizar el correcto funcionamiento en un determinado contexto jurídico. Por lo tanto, se examinan las leyes y regulaciones que se aplican al objeto de estudio, así como las autoridades responsables de su implementación y cumplimiento. Asimismo, se identificarán las posibles limitaciones o restricciones que puedan afectar y los desafíos que puedan surgir a raíz del marco regulador existente.

• Protección de datos personales: el uso de datos personales de los usuarios, como la selección del tema o sus preguntas durante la interacción, puede estar sujeto a regulaciones de protección de datos personales. Es importante que el proyecto cumpla con todas las leyes y regulaciones aplicables en este ámbito, como es el caso del Reglamento General de Protección de Datos (RGPD) [4] en la Unión Europea. Este marco legal establece sólidas bases para la recopilación, tratamiento y seguridad de datos personales, garantizando la privacidad y control de la información por parte de los usuarios. Una de las principales limitaciones que puede afectar al proyecto es el cumplimiento del derecho al olvido en dónde se ha de asegurar que los datos de un usuario puedan borrarse si este lo exige. En este caso, se implementa un requisito técnico de identificación del usuario que habilita su total cumplimiento.

• Seguridad de los datos: el proyecto debe garantizar la seguridad de los datos de los usuarios, para evitar posibles pérdidas o accesos no autorizados. Esto puede implicar el uso de medidas de seguridad adecuadas [5], como la encriptación de los datos y la implementación de controles de acceso. Comprender las mejores prácticas en seguridad de datos es crucial no solo para cumplir con las normativas, sino también para preservar la confianza de los usuarios en la plataforma.

• Cumplimiento de las normas de seguridad eléctrica: dadas las características del robot social Mini y las pruebas que se han realizado, no existe riesgo físico dado su tamaño y hardware. Si bien es cierto, el robot no está sujeto a regulaciones específicas de seguridad eléctrica y de productos ya que se trata de un prototipo, esto se debe a su diseño y funcionalidad que no presentan riesgos significativos que requieran cumplir con tales regulaciones.

(21)

5

• Regulación de Inteligencia Artificial: el empleo de modelos de Inteligencia Artificial en el proyecto puede estar sujeto a regulaciones específicas en algunos países. Por ejemplo, la Unión Europea propone una regulación detallada para la Inteligencia Artificial [6] que se encuentra en proceso de aprobación. Esta regulación aborda los riesgos asociados [7] y establece cuatro niveles de riesgo para las distintas aplicaciones de la Inteligencia Artificial:

En el nivel de "Riesgo inaceptable", se prohíben sistemas que representen una clara amenaza para la seguridad y los derechos de las personas, como la puntuación social gubernamental o el fomento de comportamientos peligrosos. En el nivel de "Alto riesgo", se incluyen sistemas utilizados en áreas críticas como infraestructuras, educación, empleo, servicios esenciales, entre otros. Estos sistemas deben cumplir con obligaciones estrictas antes de comercializarse, como evaluación de riesgos, transparencia, supervisión humana y seguridad robusta. En el nivel de "Riesgo limitado", se aplican obligaciones específicas de transparencia para sistemas como bots conversacionales (chatbots), en donde se debe asegurar en todo momento que los usuarios son conscientes de estar interactuando con una máquina. En el nivel de "Riesgo mínimo o nulo", se permite el libre uso de sistemas de Inteligencia Artificial de bajo riesgo, como videojuegos habilitados para ello o filtros de spam.

La mayoría de los sistemas de Inteligencia Artificial en la Unión Europea entran en esta última categoría. Una vez en el mercado, las autoridades se encargan de vigilar el cumplimiento, los desarrolladores garantizan la supervisión humana, y los proveedores implementan un seguimiento posterior a la comercialización, en el que se reportan los incidentes graves o mal funcionamiento.

Siguiendo la mencionada normativa, se ha evaluado el nivel de riesgo del proyecto y se ha concluido que se clasifica como de "Riesgo limitado", lo que implica un impacto reducido, aunque total cumplimiento de las regulaciones pertinentes. Esta tipificación se basa en su similitud como aplicación de un chatbot. Es importante destacar que los usuarios siempre tienen conocimiento de estar interactuando con un robot, garantizando la confidencialidad y el anonimato de todos los usuarios en cualquier momento. Es vital comprender estas regulaciones para asegurarse de cumplir con todos los requisitos legales relacionados con la Inteligencia Artificial.

(22)

6 1.4. Entorno socioeconómico

El análisis del entorno socio-económico es una herramienta esencial en la planificación de proyectos, ya que implica la evaluación de factores sociales y económicos que pueden influir en el rendimiento y la sostenibilidad de la iniciativa. Al explorar el entorno socioeconómico, es crucial tener en cuenta variables que van más allá de lo meramente económico, incluyendo las necesidades de los usuarios, las tendencias culturales, las dinámicas sociales y otros aspectos relevantes.

El proyecto se enfoca en el desarrollo de una funcionalidad diseñada en última instancia para ayudar a las personas mayores a mantenerse informadas y conectadas con el mundo a través de las noticias más recientes publicadas en diversas redes sociales. Además de los beneficios más evidentes comentados con anterioridad, como el acceso rápido a información relevante, existen otros aspectos sociales igualmente importantes que deben considerarse.

La aceptación y adopción de esta tecnología por parte de los usuarios finales, y la sociedad en general, son factores cruciales para su correcto desempeño e integración. Con el objetivo de fomentar su adopción, se requiere una estrategia educativa y promocional sólida por parte de todos los agentes implicados. Asimismo, la colaboración con organizaciones y grupos de interés relacionados con el cuidado de las personas mayores es fundamental. Trabajar en conjunto con estas entidades garantiza un enfoque más centrado en las necesidades reales de los usuarios, facilitando la formación de alianzas estratégicas que respalden la implementación exitosa del proyecto.

Además de su impacto directo en las personas mayores que obtienen compañía constante, el proyecto también puede brindar un apoyo adicional a los cuidadores. Al liberar tiempo y recursos que los cuidadores a menudo dedican a obtener información y o realizar diferentes asistencias, el robot les permite enfocarse en otras responsabilidades de cuidado, potencialmente mejorando la atención y cuidado.

El impacto económico de la herramienta propuesta es un aspecto que requiere un enfoque meticuloso. Aunque los beneficios económicos concretos, ya sean directos o indirectos, no pueden cuantificarse de manera precisa, existen áreas en las que este impacto puede manifestarse. El proyecto tiene el potencial de reducir algunos de los costes en sistemas sanitarios nacionales públicos relacionados con el cuidado de personas mayores.

(23)

7 Además, los familiares de las personas mayores también pueden obtener beneficios económicos del proyecto. Al proporcionar una compañía constante y una fuente confiable de información, el robot podría aliviar la carga de cuidado que recae sobre los familiares, permitiéndoles mantener sus empleos y dedicar menos tiempo y recursos al cuidado directo.

1.5. Metodología de investigación

La metodología de investigación que se ha empleado para llevar a cabo este proyecto se conoce como Design Science Research Methodology.

Esta metodología se destaca por su enfoque en generar conocimiento a través de la acción y la creación de soluciones muy concretas en entornos prácticos, impulsando a los investigadores a desarrollar artefactos funcionales que resuelvan problemas reales. Este enfoque es idóneo para proyectos que requieren innovación tangible y resultados aplicables en el mundo real, como el desarrollo de tecnología avanzada, sistemas de información eficientes, avances en salud y medicina, mejoras en gestión y organización, diseño de productos innovadores, así como investigaciones en Inteligencia Artificial y ciencia de datos.

Se compone de tres partes fundamentales: el entorno, la investigación y el conocimiento;

que colaboran de manera sinérgica para resolver problemas en un contexto específico.

Entorno: la metodología comienza por identificar las oportunidades y los desafíos en un contexto práctico y aplicado. Este enfoque se revela esencial, ya que se centra en la mejora del entorno en sí mismo. Esto incluye identificar las necesidades y problemas existentes.

Al seguir este método, se asegura que los resultados del diseño no solo sean teóricamente sólidos, sino que también tengan un gran impacto medible y significativo en el ambiente donde se aplican.

Investigación: en esta parte, se lleva a cabo la investigación propiamente dicha. Aquí se aplican los principios de diseño para desarrollar una solución novedosa y efectiva. La investigación implica diseñar y construir un artefacto, este artefacto puede tomar diversas formas, como por ejemplo: sistemas informáticos, procesos organizativos o aplicaciones específicas, y se crea con el propósito de abordar los problemas identificados en el entorno de estudio.

(24)

8 Conocimiento: esta fase se enfoca en generar y documentar el conocimiento adquirido durante la investigación y desarrollo. Esto enriquece el cuerpo de conocimientos en el área de estudio y asegura la claridad y utilidad de los resultados. Implica documentar exhaustivamente los resultados, desde el diseño hasta la implementación del artefacto, para permitir a otros investigadores comprender y replicar el trabajo. También implica la evaluación del artefacto a través de pruebas de usabilidad y rendimiento, así como un análisis profundo de los resultados para extraer lecciones, conclusiones y contribuciones al conocimiento existente, incluso teorías y modelos basados en los hallazgos.

En la metodología Design Science Research Methodology, estos tres componentes se interconectan de tal manera que los ciclos de relevancia, diseño y rigor se refuerzan mutuamente. La Figura 1 expone en un diagrama todos los elementos de la metodología de investigación en ciencias del diseño, según el autor Hevner [8].

Figura 1: Metodología de investigación en ciencias del diseño

Asimismo, los tres ciclos que forman parte de esta metodología: relevancia, diseño y rigor; aseguran un enfoque completo y sólido representando etapas críticas que guían el proceso de investigación y desarrollo.

Ciclo de relevancia: se inicia al identificar oportunidades y comprender los problemas en un entorno de aplicación real. En este punto, se establece una conexión crucial con el proyecto, ya que se busca abordar las necesidades de los usuarios en términos de obtener información y respuestas a preguntas comunes. Para ello, se lleva a cabo una revisión exhaustiva de la literatura que permita entender el estado actual del conocimiento en el área de estudio, definiendo los puntos clave que deben abordarse.

(25)

9 La ejecución de este ciclo garantiza que los resultados del diseño sean altamente pertinentes y aplicables en el contexto en el que se implementarán. Si es necesario, este ciclo puede repetirse utilizando la retroalimentación obtenida para mejorar aún más los resultados. Esto asegura que las soluciones propuestas evolucionen en respuesta a las necesidades cambiantes del entorno.

Ciclo de diseño: se trata del corazón de la metodología de investigación. Durante el ciclo, las actividades de investigación iteran de manera ágil entre la construcción del artefacto, su evaluación y la retroalimentación posterior. El diseño se basa en principios teóricos y prácticos, ya que se busca crear una solución efectiva y práctica. Las pruebas rigurosas, tanto en laboratorios controlados como en entornos experimentales, aseguran que la solución propuesta sea refinada y perfeccionada antes de implementarse en un entorno real. Este proceso es iterativo, acelerando la mejora continua del diseño y garantizando que el artefacto final sea robusto y efectivo en su función.

Ciclo de rigor: se evalúa la solución desarrollada en términos de su eficacia y utilidad.

Tiene un papel esencial para asegurar la innovación y la calidad científica del proyecto.

Se utilizan métodos de evaluación y se recopilan los datos necesarios para determinar si la solución cumple con los objetivos establecidos inicialmente. Su objetivo es garantizar que los diseños desarrollados sean auténticas contribuciones a la investigación, en lugar de ser simples aplicaciones repetitivas de métodos previamente conocidos. Además, el ciclo de rigor incorpora las adiciones a la base de conocimientos como resultados de la investigación, incluyendo extensiones de teorías y métodos originales, así como nuevas experiencias adquiridas durante la realización del proyecto.

Por último, cabe mencionar que se ha diseñado un diagrama de Gantt que actúa como la columna vertebral que ordena las tareas según su secuencia temporal y establece su respectivo tiempo de desarrollo. Para acceder a una visión completa de esta organización del proyecto, se adjunta (anexo A) el gráfico al final del documento. El diagrama de Gantt se presenta como el resultado analítico de la metodología de investigación, previamente discutida, planteada desde una perspectiva empresarial en la que se analizan los tiempos entre tareas con el fin de observar posibles desarrollos en paralelo evitando la generación de dependencias. Este gráfico no solo representa el progreso del proyecto divido en cada una de sus partes más importantes, sino que también integra con el proceso de elaboración de este mismo informe.

(26)

10 1.6. Estructura del documento

Este trabajo se ha organizado por capítulos con sus correspondientes epígrafes, además del uso de anexos, todos estos componentes se describirán y presentarán a continuación:

• En la introducción, se establece el contexto del trabajo, resaltando la situación en el área específica de estudio, así como la motivación que impulsa su realización.

Además, se destaca la importancia de resolver el problema planteado, señalando las implicaciones y beneficios esperados de dicha resolución. A continuación, se presentan el objetivo y subobjetivos del trabajo, los cuales actuarán como guía para el desarrollo de la investigación. De todos ellos, se describen en detalle las ventajas esperadas que se derivarán de la consecución de estos subobjetivos, subrayando su relevancia en el campo de estudio.

Asimismo, se aborda el contexto jurídico, normativo y las leyes que afectan el desarrollo del trabajo, analizando su influencia y proporcionando un marco regulador necesario para comprender las limitaciones y oportunidades. En el apartado del entorno socioeconómico, se exploran tanto los factores sociales como los económicos que pueden influir en el proyecto. Se consideran variables como las necesidades de los usuarios, las tendencias culturales y las dinámicas sociales;

así como en los aspectos económicos, los recursos financieros disponibles y las perspectivas de mercado. Esto permite comprender el entorno actual en el que se desarrolla el trabajo y su viabilidad en el contexto socioeconómico presente.

Finalmente, se analiza la metodología de investigación empleada, indicando los proyectos en los que se puede aplicar y detallando exhaustivamente cada uno de los elementos que la componen.

• En el estado del arte, se realiza un análisis minucioso de la situación actual en las diferentes áreas de investigación involucradas. Para cada una de ellas se identifica sus respectivas tendencias, avances y desafíos existentes. Además, se presentan ejemplos concretos de aplicaciones ya existentes, demostrando su relevancia y potencial para generar impacto en las diversas áreas. También se destacan las soluciones previamente desarrolladas, diferenciando el enfoque propuesto y las mejoras que se han logrado en comparación con dichas soluciones existentes.

(27)

11 En último lugar, en el marco de trabajo se detalla la colaboración interdisciplinaria entre los laboratorios involucrados. Indicando la importancia que tiene realizar un enfoque integral para el desarrollo de una nueva funcionalidad del robot social.

También se analizarán algunas de las tecnologías empleadas en la integración, así como las ventajas manifiestas como resultado de la correcta fusión de ambas áreas de investigación.

• El diseño y desarrollo de la solución se estructura en torno al avance del trabajo, donde se explica la ideación propuesta y el comportamiento que debe seguir el robot social para resolver el problema planteado. Además, se describen en detalle los pasos seguidos y las tareas realizadas durante el desarrollo del proyecto, asegurando la coherencia en cuanto a tiempo y recursos. También, se justifican las decisiones tomadas durante el análisis de los modelos, proporcionando una comparativa entre las alternativas consideradas. En último lugar, se describe la integración realizada del desarrollo en el propio robot social.

• La experimentación se centra en descripción de las pruebas de interacción que se han realizado con los usuarios, así como un estudio estadístico de los evaluados.

A continuación, se presentan las gráficas, tablas y conclusiones obtenidas tras la experimentación, lo que permite evaluar los resultados analizando su validez y aplicabilidad en el contexto del trabajo.

• En las conclusiones, se realiza un resumen del comportamiento final del producto obtenido como consecuencia del desarrollo y la experimentación. Se destacan los objetivos cumplidos respecto los que inicialmente se marcaron, mencionando los logrados adicionales de maneara paralela. Además, se establecen las limitaciones descubiertas y se identifican las posibles mejoras del producto, proponiendo líneas futuras de trabajo para continuar avanzando en el desarrollo y perfeccionamiento.

Finalmente, cabe mencionar la bibliografía, que recopila todas las referencias utilizadas a lo largo del trabajo. En esta sección se incluirán libros, artículos, estudios y otras fuentes consultadas. Además, se incluirán varios anexos que complementen y respalden el trabajo realizado. Al final del documento se adjuntará la planificación del proyecto, el guion de experimentación utilizado en las pruebas y, los formularios y cuestionarios rellenados por los usuarios.

(28)

12

2. ESTADO DEL ARTE

2.1. Áreas de investigación relacionadas

En cualquier proyecto, es esencial comprender el estado actual del contexto en el que se va a desarrollar. Para lograrlo, se deben analizar las distintas áreas de conocimiento involucradas y cómo impactan en el diseño, desarrollo y eventual implementación. Para ello se hará una revisión sistemática de la literatura relacionada con los temas de interés, siguiendo un orden lógico que abarca cuatro áreas fundamentales en un orden que parta desde las áreas más generales a otras cuyo uso sea más específico.

En conjunto, este análisis no solo proporcionará una comprensión profunda del estado actual de estas áreas de investigación, sino que también resaltará cómo el proyecto aborda desafíos críticos, supera limitaciones y confiere ventajas valiosas en el panorama actual de la interacción robótica social.

2.1.1. Robótica social

La robótica social, definida como el área de estudio de robots diseñados específicamente para la interacción y colaboración social y emocional con seres humanos, se encuentra en una etapa inicial de desarrollo, aunque se están llevando a cabo varios proyectos en universidades, empresas privadas y centros de investigación. Estos proyectos se centran en áreas como el cuidado de personas mayores, la educación y la terapia, y tienen como objetivo mejorar la calidad de vida de las personas mediante el uso de la tecnología. A nivel internacional, los proyectos de robótica social están experimentando un crecimiento significativo, especialmente en países como Japón, Estado Unidos y Corea del Sur [9], donde la población envejecida está aumentando y la necesidad de atención y cuidado es cada vez mayor. En estos países, también se están desarrollando robots capaces de realizar tareas de cuidado, como ayudar a las personas mayores a vestirse o levantarse de la cama, y robots que pueden brindar compañía y apoyo emocional.

En Europa, algunos países como Alemania [10] y el Reino Unido [11] están invirtiendo significativamente en robótica social, con el mismo enfoque especializado en el cuidado de personas mayores y la educación. Se espera que este campo siga creciendo debido a la creciente demanda de soluciones tecnológicas para el cuidado y atención de las personas, impulsada por los avances en tecnología y el desarrollo de algoritmos de Inteligencia Artificial más sofisticados.

(29)

13 Por tanto, a nivel general se puede establecer dos casos de uso claramente diferenciados.

A continuación, se analizarán cada una de las áreas de aplicación, destacando la primera de estas especialmente debido a su similitud con el proyecto desarrollado.

En primer lugar, robots de compañía para personas mayores o con discapacidades [12], que puedan proporcionar interacción social y apoyo emocional. Estos robots demuestran ser una compañía valiosa para aquellos que se encuentran solos o que tienen dificultades para socializar. Son capaces de entablar conversaciones, realizar actividades recreativas, reproducir música/videos, además de brindar un sentido de conexión y confort emocional.

También, algunos de estos robots están equipados con sensores para detectar caídas y alertar a los servicios de emergencia. Entre los proyectos más importantes se encuentran:

• Proyecto ROBSEN [13]: desarrollo de robots sociales y asistenciales para ayudar a personas mayores, especialmente aquellas con deterioro cognitivo. Estos robots no pretenden reemplazar a los cuidadores, sino servir como asistentes para aliviar su carga de trabajo. La interacción entre estos robots y usuarios mayores plantea desafíos tecnológicos importantes debido a los problemas de deterioro cognitivo, visión, audición y falta de familiaridad con la tecnología. Estos robots están diseñados para funcionar en entornos reales, como centros geriátricos, centros de día y hogares; como es el caso de la Fundación Alzheimer España en donde pudo evaluarse. El proyecto se centra en avanzar en aspectos técnicos clave, como el desarrollo en habilidades variadas: vigilancia y estimulación física y cognitiva. Es relevante mencionar que el proyecto se basa en una versión inicial del robot social Mini, que es el robot utilizado para las funcionalidades del presente proyecto.

• Proyecto Accompany [14]: programa de investigación y desarrollo que se centra en la construcción de robots de servicio que asisten a las personas mayores en su hogar. La iniciativa surge como respuesta a la creciente necesidad de proporcionar apoyo a una población envejecida que afronta limitaciones para realizar tareas cotidianas. El objetivo principal de Accompany es desarrollar robots de bajo costo y alta efectividad que proporcionen compañía y asistencia en la realización de tareas diarias como la toma de medicamentos, el control de la alimentación y la realización de ejercicios, mejorando así la calidad de vida de las personas mayores. Además, estos robots también ofrecen una solución efectiva para mitigar el aislamiento social y la soledad que muchas personas mayores sufren.

(30)

14

• Proyecto Robocare [15]: utilización del robot social Pepper para interactuar con personas mayores y ayudarles a mejorar sus capacidades físicas y cognitivas, con el objetivo de mejorar su calidad de vida. Algunas de sus diversas funcionalidades son: generación de conversaciones, interacción por voz e interfaz táctil, obtención de información, elaboración de juegos y ejercicios, reproducción de música.

El robot se ha probado en un laboratorio y en una residencia real, demostrando que es una herramienta muy útil con gran potencial para interactuar con personas mayores, logrando que estén entretenidas y motivadas al interactuar con el robot, en particular disfrutando de los juegos y ejercicios.

• Proyecto CoCoBot [16]: se trata de un robot social diseñado en especial para ser un acompañante y asistente de las personas mayores que tienen dificultades para realizar tareas cotidianas. CoCoBot cuenta con movilidad, autonomía, flexibilidad y capacidad de realizar diversas tareas, interactuando con los usuarios mediante voz y a través de una pantalla. Su objetivo es reducir la sensación de aislamiento y soledad de las personas mayores, así como ayudarlas a realizar tareas cotidianas como recordar tomar medicamentos o llamar a familiares.

• Proyecto SHAPES: robot asistencial humanoide usado para mejorar la calidad de vida de las personas mayores. ARI es un robot asistencial humanoide que se ha adaptado para utilizarse en el proyecto europeo SHAPES, donde desempeña un papel fundamental en el apoyo a los usuarios en sus hogares como un robot de asistencia doméstica. Una de sus características más interesante es la capacidad para integrar algoritmos de Inteligencia Artificial, lo que abre un amplio abanico de posibilidades de desarrollo y exploración de diversas aplicaciones. ARI no trata de reemplazar a los cuidadores, sino más bien colaborar con ellos y aliviar su carga de trabajo, al igual que en proyecto previos, brindando asistencia en múltiples áreas de cuidado a las personas mayores.

Este robot social ha sido diseñado por la empresa PAL Robotics S.L. y está específicamente configurado para operar en entornos reales, como centros geriátricos, centros de día y hogares. ARI se dedica a tareas diversas que incluyen desde ejercicios de movilidad y rehabilitación hasta participación en actividades sociales, así como la asistencia en tareas específicas y recordatorios importantes para los usuarios.

(31)

15 Uno de los aspectos más impactantes del proyecto ARI fue su contribución en la lucha contra la pandemia de COVID-19 [17]. ARI se adaptó para brindar apoyo a las personas mayores que debían quedarse en casa y que a menudo se vieron afectadas por el aislamiento social y la soledad. Los robots compañeros sociales como ARI, desempeñan un papel fundamental al interactuar con las personas mayores de una manera humanizada, fortaleciendo su participación en la sociedad.

El proyecto SHAPES (Smart & Healthy Ageing through People Engaging in Supportive Systems) de la Unión Europea tiene como objetivo crear un entorno que facilite la implementación de soluciones digitales para apoyar una vida saludable e independiente para las personas mayores. La plataforma SHAPES integra soluciones digitales inteligentes para recopilar y analizar información sobre la salud, el entorno y el estilo de vida de las personas mayores, y ofrece soluciones personalizadas. Este proyecto tiene como meta aumentar la eficiencia de la atención médica en toda Europa.

En la actualidad, ARI participa en varios proyectos piloto en Europa, incluyendo España, Italia, Grecia e Irlanda, brindando apoyo a personas mayores que viven en sus propios hogares, apartamentos protegidos o residencias.

En segundo lugar, está el caso de uso de robots educativos para ayudar en la enseñanza y el aprendizaje de habilidades en niños [18] y jóvenes que puedan presentar necesidades especiales. Estos robots son herramientas eficaces que fomentan la participación y el aprendizaje en estudiantes con autismo, síndrome de Down [19] y otras necesidades que requieren mayor atención. Pueden programarse para proporcionar instrucciones claras, interactuando de manera amigable y adaptando su comportamiento a las necesidades individuales de cada estudiante. Además, su presencia en el aula puede suponer la creación de un ambiente inclusivo y motivador para el resto.

Respecto a las tendencias, avances y desafíos, se pueden identificar una serie de patrones en los proyectos mencionado que merecen exponerse.

En primer lugar, la demanda claramente está en aumento ya que la población envejece cada vez más y la necesidad de cuidado y atención se incrementa, generando una mayor necesidad de soluciones tecnológicas en este campo.

(32)

16 Además, los desarrollos tienen un mismo enfoque en mejorar la calidad de vida y brindar apoyo en actividades diarias, sin que supongan un reemplazo a los profesional de este sector. También se observa cada vez más, un interés en la aplicación de robots en entornos educativos para facilitar el aprendizaje y promover la interacción social. Por lo que la integración de la robótica en la educación también es una tendencia en crecimiento [20].

Sin embargo, la robótica social enfrenta importantes desafíos. Lograr que los robots sean capaces de entender y responder adecuadamente al lenguaje natural de las personas sigue siendo un objetivo complejo. La interacción natural y la comprensión del lenguaje son temas críticos que deben abordarse para mejorar la experiencia con estos dispositivos.

Además, el uso de robots en entornos sociales plantea cuestiones éticas y de privacidad.

Es importante garantizar el respeto a la autonomía de las personas y proteger sus datos personales, asegurando que los robots actúen de manera ética y responsable.

Otro desafío significativo es el coste y la accesibilidad de los robots sociales. A pesar de los avances, los precios siguen siendo elevados para la mayoría de los proyectos, lo que puede dificultar el acceso a estos dispositivos para muchos usuarios y limitar su adopción generalizada. Resolver este problema permitiría ampliar el alcance y los beneficios de la robótica social a un mayor número de personas.

2.1.2. Procesamiento del lenguaje natural

En cuanto al procesamiento del lenguaje natural (NLP, por sus siglas en inglés de Natural Language Processing), actualmente está experimentando un increíble auge que se debe en gran medida gracias a la creciente disponibilidad de datos en formato de texto, así como al aumento en el poder de cómputo y al desarrollo de algoritmos de aprendizaje profundo mucho más sofisticados. El NLP hace referencia a la capacidad de las máquinas para procesar, interpretar y generar lenguaje natural de manera similar a los humanos. Sus avances suponen una revolución en el modo de comunicación entre humanos y sistemas automatizados.

Los modelos avanzados como ChatGPT [21], son capaces de aprender a partir de grandes cantidades de datos de lenguaje natural y mejorar constantemente su capacidad para comprender y generar lenguaje. Esto ha llevado a avances significativos en varias áreas, en las que se destacan los siguientes casos de uso específicos: atención médica, servicio al cliente, seguridad, y análisis y generación de texto.

(33)

17 En la atención médica, se ha producido una revolución en la documentación clínica mediante la simplificación de los registros electrónicos de salud. Los médicos pueden tomar notas más rápidamente a través de la conversión de voz a texto, lo que ahorra tiempo y mejora la atención al paciente. Además, se destaca en el análisis predictivo y la detección temprana de condiciones de salud, facilitando la identificación de candidatos adecuados para ensayos clínicos.

En el servicio al cliente, los chatbots y agentes virtuales juegan un papel fundamental al imitar conversaciones humanas y ofrecer respuestas precisas. Su versatilidad simplifica la comunicación con los clientes, automatizando tareas como la respuestas a preguntas frecuentes o gestión de reservas, mejorando la experiencia del cliente. Los asistentes inteligentes van más allá al reconocer patrones de diálogo por voz e interpretando sus significados, interactuando con varios dispositivos simultáneamente y personalizando las interacciones.

En la seguridad en línea, el procesamiento de lenguaje natural ha transformado los filtros de correo electrónico, haciendo que los filtros de spam sean más efectivos. Esto se logra al clasificar correos electrónicos en categorías como primarios, sociales o promocionales, facilitando el control de la bandeja de entrada y detectando características propias del correo no deseado, como el phishing, lo que mejora la seguridad de las comunicaciones.

En el análisis y generación de texto, tiene aplicaciones clave. Se utiliza para corregir errores gramaticales en el texto, resumir textos de manera concisa, ofrecer traducciones precisas entre idiomas, analizar opiniones en textos y predecir el texto que un usuario podría escribir. También facilita la visualización de datos a través de interfaces de lenguaje natural y permite extraer información valiosa de comentarios y reseñas para mejorar la experiencia del cliente y comprender mejor la percepción de una marca.

A pesar de los notables avances en el procesamiento del lenguaje natural, todavía se enfrentan desafíos significativos que pueden afectar la precisión y calidad de los modelos.

Entre estos desafíos se encuentran los problemas éticos derivados, el sesgo en los datos y la falta de interpretación contextual. No obstante, con el constante desarrollo de nuevas técnicas y algoritmos, se espera que el campo del procesamiento del lenguaje natural continue evolucionando [22] y se convierta en un futuro cercano en una herramienta aún más poderosa.

(34)

18 En el ámbito del procesamiento del lenguaje natural, se observan varias tendencias, avances y desafíos de gran relevancia en la actualidad. Uno de los aspectos más notables es el constante crecimiento de su aplicación en diversas industrias, como se mencionó anteriormente. Esta expansión ha llevado a mejoras significativas en la capacidad de incorporar el procesamiento del lenguaje natural en dispositivos y aplicaciones cotidianas, proporcionando a los usuarios una experiencia más fluida e intuitiva. Además, las tendencias actuales se enfocan en comprender el contexto y la coherencia en el lenguaje, permitiendo así una interpretación más precisa y relevante. Estos avances se deben en gran medida al entrenamiento con grandes cantidades de datos, lo que mejora la precisión y calidad en tareas como la clasificación de texto, generación de resúmenes y respuesta a preguntas. A pesar de estos avances, los modelos aún enfrentan dificultades para captar el contexto adecuado en ciertas situaciones, lo que resulta en respuestas incorrectas o incoherentes, que pueden llegar a tener implicaciones económicas y de reputación para las organizaciones que dependen de estos sistemas.

Es importante destacar que estos procesos de entrenamiento consumen una cantidad significativa de energía, lo que plantea preocupaciones medioambientales relacionadas con la huella de carbono. Otro aspecto crítico es el coste económico asociado con dichos procesos de entrenamiento para grandes modelos de lenguaje. La capacitación de estos modelos requiere una inversión sustancial en recursos computacionales, que abarca desde potentes unidades de procesamiento gráfico hasta costosos sistemas de almacenamiento de datos. Además, el mantenimiento de grandes conjuntos de datos de lenguaje natural también conlleva gastos significativos en términos de tiempo y recursos humanos.

Otro tema importante ya mencionado, es el sesgo presente en los conjuntos de datos utilizados para entrenar los grandes modelos lingüísticos. Estos datos a menudo reflejan prejuicios sociales y culturales, lo que puede influir en las respuestas y decisiones generadas por los modelos, afectando así la objetividad y equidad. Abordar este sesgo requiere una inversión adicional en el tratamiento de los datos, que aumenta los costes tanto en términos de tiempo como de recursos. Finalmente, la privacidad y seguridad de los datos en el procesamiento del lenguaje natural son consideraciones cruciales. Dado que implica el manejo de información personal y confidencial, es esencial garantizar la protección y confidencialidad de la información para mantener la confianza de los usuarios. Lo cual conlleva inversiones adicionales en las medidas de seguridad de datos y los protocolos de privacidad.

(35)

19 2.1.3. Sistemas de diálogo

Respecto a los sistemas de diálogo entre humano-robot [23], pueden clasificarse en dos categorías principales según su estructura y dinámica de interacción [24].

En primer lugar, sistemas de diálogo basados en pregunta-respuesta, estos sistemas se caracterizan por tener una dinámica de interacción en la que el sistema dirige el diálogo, basándose únicamente en una pregunta realizada por el usuario y una respuesta generada por el sistema. En este tipo de sistemas, el usuario tiene un papel pasivo y solo puede realizar preguntas o solicitar información específica al robot. A lo largo del tiempo, se han desarrollado diversos modelos de diálogo basados en pregunta-respuesta para numerosas aplicaciones, como es el caso de asistentes virtuales, chatbots y sistemas de soporte al cliente. En segundo lugar, sistemas de diálogo intencionales, en estos sistemas tanto los usuarios como el robot tienen la facultad de guiar el diálogo y pueden intercambiar información de manera bidireccional con la intención de alcanzar metas específicas. En este tipo de sistemas, la interacción es más dinámica y colaborativa, permitiendo una mayor flexibilidad en las conversaciones y una adaptación más cercana a las necesidades del usuario. Los sistemas de diálogo intencionales pueden utilizarse en diversas aplicaciones, como en los sistemas de aprendizaje, juegos interactivos y asistentes personales avanzados.

A nivel histórico, los modelos de diálogo entre usuario y máquina han ido evolucionando y mejorando significativamente a lo largo del tiempo. A continuación, se presenta en la Tabla 1 algunos de los modelos de diálago más destacados, ordenados cronológicamente, indicando su presencia total, presencia limitada o ausencia; de ciertas características y atributos relevantes.

Tabla 1: Modelos de diálogo más importantes

(36)

20 En la tabla presentada se muestra la evolución de los modelos que representan diferentes sistemas de diálogo entre humanos y robots a lo largo del tiempo. Inicialmente, se observan modelos con patrones preestablecidos y una capacidad conversacional limitada, utilizado para simular la función de un psicoterapeuta. Con el tiempo, se mantuvieron los patrones preestablecidos, pero mejoraron notablemente las habilidades conversacionales, aunque aún carecían de comprensión profunda del lenguaje y el contexto.

La transición hacia un mayor entendimiento y capacidad de aprendizaje a inicios de la década de los 90, donde comenzaron a incorporarse capacidades de aprendizaje, aunque aún limitadas. La entrada de empresas como IBM en 2010 marcó un hito al enfocarse en la comprensión del lenguaje natural y la respuesta a preguntas cortas con una base de datos local. Este progreso también se refleja en la transición de autores individuales a empresas conjuntas, lo que contribuyó al impulso en el desarrollo de sistemas de diálogo más sofisticados y versátiles en la interacción humano-robot.

Finalmente, con modelos fundacionales como GPT-3, se observa un salto significativo en la capacidad de comprensión del lenguaje, el procesamiento contextual y la generación avanzada del lenguaje, lo que ha permitido una amplia gama de aplicaciones, desde la mejora de la clasificación de texto hasta la generación coherente y contextualmente relevante en diversas áreas.

En cuanto a las tendencias, avances y desafíos en función del tipo de sistema de diálogo, cabe destacar las siguientes características. Por un lado, los sistemas de diálogo basados en pregunta-respuesta continúan evolucionando hacia una mayor precisión en la comprensión del lenguaje humano. Estos avances permiten una respuesta más contextual y adaptada a las necesidades del usuario, mejorando la experiencia de interacción. Sin embargo, la generación de respuestas coherentes y la interpretación precisa de las intenciones del usuario siguen siendo desafíos clave.

Por otro lado, en el caso de los sistemas de diálogo intencionales, se aprecia una creciente integración de técnicas como la planificación y la toma de decisiones, para facilitar una interacción más fluida y una comprensión más profunda de los objetivos del usuario. Esto se traduce en un aumento de la versatilidad de estos sistemas, por lo que la adaptación a contextos altamente variables y la garantía de la privacidad de los datos del usuario son áreas que requieren atención continua.

(37)

21 2.1.4. Uso de redes sociales

En cuanto al el uso de las redes sociales en las aplicaciones de robótica social, existen proyectos en donde se aborda el desafío de facilitar la comunicación para las personas de avanzada edad [25], que no están familiarizadas con las nuevas tecnologías. Para ello, se propone una aplicación de comunicación accesible e intuitiva implementada en el robot.

Por ejemplo, a través de una interfaz gráfica, los usuarios mantienen conversaciones, llamadas y videollamadas de forma guiada utilizando la plataforma de comunicación WhatsApp [26]. Mediante esta solución, se busca eliminar la fricción que estas personas enfrentan al interactuar con sus seres queridos de manera natural a través de medios tecnológicos.

El uso de las redes sociales, dentro de la robótica social, brinda una herramienta efectiva para facilitar el cuidado y bienestar de la tercera edad, permitiéndoles mantenerse conectados y comunicarse con sus seres queridos de una manera sencilla y accesible gracias a la asistencia proporcionada por el robot.

Se observan tendencias significativas que apuntan hacia una mejora en la integración de estas tecnologías para abordar desafíos específicos. En este contexto, se establece un enfoque en proyectos que buscan proporcionar soluciones de comunicación accesibles y fáciles de usar a través de los robots sociales. Los avances se centran en la mejora de la interfaz de usuario de los robots, la integración de sistemas de reconocimiento de voz y gestos, y la capacidad de los robots para facilitar la interacción en línea de dichas redes sociales, de manera intuitiva. No obstante, persisten desafíos importantes, nuevamente, garantizar la seguridad y la privacidad de los datos de los usuarios es imprescindible; así como abordar las preocupaciones éticas relacionadas con el uso de las redes sociales a través de un robot social.

2.2. Marco de trabajo

El marco de trabajo del proyecto se enmarca en una colaboración interdisciplinaria entre el Laboratorio de Robótica Social y el Grupo de Sistemas Interactivos. Esta sinergia entre dos áreas de investigación distintas, robótica social e interacción humano-computadora, permite abordar de manera integral el desarrollo de una nueva funcionalidad para el robot social Mini, con el objetivo de utilizar la tecnología para mantener a las personas mayores informadas, como usuarios objetivo en última instancia, y conectadas con la actualidad.

(38)

22 El Laboratorio de Robótica Social, es un grupo de investigación líder en el campo de la robótica social, tanto a nivel nacional, como a escala internacional. El grupo investigador ha desarrollado proyectos de investigación y desarrollo en colaboración con empresas e instituciones nacionales y europeas, destacando por su elevado nivel científico y su gran proyección. Dentro del grupo de investigación Robotics Lab, Mini, el robot social que sirve como base para este proyecto, destaca por estar dirigido principalmente a personas de avanzada edad, particularmente aquellas con un cierto grado de deterioro cognitivo.

Mini se ha diseñado con un cuerpo que ofrece una apariencia amigable al usuario y posee capacidades de interacción multimodal, gracias a la incorporación de una tableta digital que permite establecer comunicación tanto verbal como visual. Esta capacidad de actuar multimodalmente es fundamental para proporcionar información de manera accesible y efectiva.

Por otro lado, el Grupo de Sistemas Interactivos se especializa en tecnologías como la computación social y colaborativa, la computación ubicua (incluyendo la computación móvil, realidad virtual, aumentada y mixta), la interacción natural y multisensorial, las ecologías de interacción multidispositivo y la visualización avanzada de la información.

Su enfoque multidisciplinario y orientado a la investigación se centra en la integración del usuario final con el propósito de facilitarle la adopción de la tecnología. Esto resulta fundamental durante la fase de procesamiento del contenido de las noticias provenientes de las redes sociales. En esta etapa, se conciben interfaces intuitivas y altamente efectivas para facilitar la comunicación entre Mini y los usuarios objetivo. Además, se desarrollan y perfeccionan diversos sistemas de diálogo que complementan la experiencia de usuario.

La base tecnológica utilizada en este proyecto incluye el Robot Operating System (ROS), un marco de trabajo ampliamente reconocido en el campo de la robótica. La utilización de ROS ha facilitado la integración fluida de componentes necesarios como la obtención de información de redes sociales, uso de grandes modelos de lenguaje e interacción con los usuarios. La interdisciplinariedad de este enfoque se manifiesta en varios aspectos. La combinación de conocimientos en robótica social y sistemas interactivos permite abordar no solo la tecnología subyacente, sino también la experiencia del usuario, asegurando que la nueva funcionalidad de Mini sea accesible y útil para su público objetivo. Además, así se favorece la capacidad de integrar los grandes modelos de lenguaje con una interacción en tiempo real dentro de un entorno robótico, resultado directo de la colaboración entre ambas especialidades.

(39)

23

3. DISEÑO Y DESARROLLO DE LA SOLUCIÓN

3.1. Ideación del flujo de comportamiento general

En este epígrafe se explicará el comportamiento general ideado, que debe seguir el robot durante la interacción correcta con el usuario. En último lugar, se detallarán los posibles fallos que son contemplados. El flujo de interacción se desarrolla de la siguiente manera:

En primer lugar, el robot da la bienvenida de manera amigable y cortés, estableciendo un tono cordial para la interacción. A continuación, procede a indagar sobre el tema de interés del usuario. El usuario tiene la opción de responder verbalmente o seleccionar uno de los temas presentados en la pantalla del dispositivo. Una vez que el usuario ha expresado su elección, el robot informa que comenzará la búsqueda de noticias relacionadas con el tema seleccionado. Utiliza diversas fuentes disponibles y selecciona una noticia relevante de entre todas las opciones encontradas. Este proceso de búsqueda puede llevar algo de tiempo, por lo que el robot avisa al usuario que se encuentra en proceso de búsqueda. Una vez que el robot ha obtenido la información necesaria sobre el tema, procede a elaborar un resumen de esta.

Este resumen se presentará al usuario a través de la voz del robot, de manera clara y concisa. El robot busca brindar al usuario una visión general de la noticia y destacar los puntos clave. Después de proporcionar el resumen, el robot invita al usuario a plantear cualquier pregunta relacionada con la noticia. El usuario puede responder verbalmente o seleccionar la opción correspondiente en la pantalla del dispositivo. En caso de que el usuario no tenga ninguna pregunta, el robot se despide amablemente y da por concluida la interacción.

Si el usuario plantea una pregunta, el robot procede a responder de acuerdo con la pregunta y la información contenida en el artículo mencionado. El objetivo del robot es brindar respuestas precisas y fundamentadas para satisfacer las inquietudes del usuario.

A continuación, el robot vuelve a preguntar si el usuario tiene alguna otra pregunta relacionada con la noticia en discusión. El usuario tiene la opción de seleccionar la respuesta deseada en la pantalla del dispositivo. Esta pregunta se repite en un bucle, lo que permite al usuario plantear varias preguntas sucesivas sobre la noticia. El robot está preparado para responder a cada una de estas preguntas y proporcionar información adicional según sea necesario.

(40)

24 El bucle de preguntas y respuestas puede continuar hasta que el usuario decida finalizar la interacción. En cualquier momento, el usuario tiene la libertad de detener el proceso cuando considere que ya no tiene más preguntas por realizar. En ese caso, el robot se despide cordialmente y da por concluida la interacción. En la Figura 2 se puede observar el diagrama de transiciones que se ha explicado.

Figura 2: Transiciones de la interacción ideada

Durante la ejecución del flujo de interacción, es importante tener en cuenta los posibles fallos externos, errores de código o excepciones que pueden surgir. Estos casos se abordan de manera anticipada para garantizar una experiencia fluida y satisfactoria para el usuario.

En primer lugar, en caso de no encontrarse noticias relacionadas con el tema solicitado por el usuario, se le solicitará amablemente que seleccione otro tema. Esto puede ocurrir debido a la falta de información disponible en las fuentes consultadas o un error externo.