• No se han encontrado resultados

Contribución teórico-práctica en el modelado lingüístico de fenómenos complejos

N/A
N/A
Protected

Academic year: 2021

Share "Contribución teórico-práctica en el modelado lingüístico de fenómenos complejos"

Copied!
182
0
0

Texto completo

(1)UNIVERSIDAD DE OVIEDO. PROGRAMA DE DOCTORADO EN ´ INGENIER´IA INFORMATICA. ´ CONTRIBUCION ´ ´ TEORICO-PR ACTICA EN EL ¨ ´ISTICO DE MODELADO LINGU ´ FENOMENOS COMPLEJOS Daniel S´ anchez Vald´ es.

(2)

(3) UNIVERSIDAD DE OVIEDO. PROGRAMA DE DOCTORADO EN ´ INGENIER´IA INFORMATICA. ´ CONTRIBUCION ´ ´ TEORICO-PR ACTICA EN EL ¨ ´ISTICO DE MODELADO LINGU ´ FENOMENOS COMPLEJOS Daniel S´ anchez Vald´ es Director: Graci´ an Trivi˜ no Barros Julio 2015.

(4) RESUMEN DEL CONTENIDO DE TESIS DOCTORAL 1.- Título de la Tesis Español: Contribución teórico-práctica en el modelado lingüístico de fenómenos complejos. 2.- Autor Nombre: Daniel Sánchez Valdés. Inglés: Theoretical and practical contribution to the linguistic modeling of complex phenomena. DNI/Pasaporte/NIE:. FOR-MAT-VOA-010-BIS. Programa de Doctorado: Ingeniería Informática Órgano responsable: Comisión Académica del Programa de Doctorado. RESUMEN (en español) Las nuevas tecnologías permiten adquirir y almacenar grandes volúmenes de datos de distinta naturaleza. Con el objetivo de transformar estos datos en información, deben ser analizados y explicados de la manera más comprensible e interpretable posible, empleando para ello todo el conocimiento que se posea sobre el fenómeno estudiado. Gracias al lenguaje natural podemos construir sistemas computacionales que interpreten y describan las características más relevantes de un fenómeno imitando la forma que tienen los seres humanos de percibir e interpretar la información. Esta descripción se realiza recopilando las expresiones lingüísticas que se emplean comúnmente para definir el fenómeno, y escogiendo en cada momento la expresión o expresiones que mejor definan la situación, esto es, que presenten el mayor grado de validez. El objetivo principal de esta tesis es extender la Teoría Computacional de Percepciones, introducida por Lotfi Zadeh en 1999. La idea consiste en utilizar la Lógica Difusa para crear modelos basados en la forma que tienen los seres humanos de hacer descripciones a través del lenguaje natural. El objetivo es utilizar las estructuras del lenguaje para hacer modelos precisos y robustos que manejen la imprecisión inherente de los fenómenos complejos. Durante los últimos años, la unidad de Computación con Percepciones del European Centre for Soft Computing ha desarrollado sistemas computaciones que utilizan el lenguaje natural para describir lingüísticamente los datos recogidos de un fenómeno. Su principal contribución en este campo de investigación consiste en la creación del denominado Granular Linguistic Model of a Phenomenon, que analiza los datos de entrada, combina diferentes fuentes de conocimiento y genera informes sobre los aspectos más relevantes del fenómeno estudiado, adaptando el contenido al receptor final del mensaje. Esta tesis recoge como testigo los primeros resultados obtenidos en esta dirección, incorporando mejoras y nuevos elementos en la arquitectura general de modelado lingüístico. La metodología llevada a cabo ha consistido en el desarrollo e incorporación de nuevos conceptos teóricos, como son el “desconocimiento” y la “relevancia”, dos características intrínsecas en el modelado de fenómenos complejos, que hasta la actualidad no se habían tenido en cuenta. Además, se ha ampliado y evolucionado el concepto de Fuzzy Finite State Machine, un paradigma para modelar aquellos fenómenos que evolucionan en el tiempo, generalmente de manera quasi-periódica. Por otra parte, el empleo de emociones en el desarrollo de sistemas computacionales juega un papel fundamental en los procesos de toma de decisiones. La sensibilidad emocional y la expresividad son muy importantes en la interacción humana y transmiten información valiosa. Dado que la descripción lingüística de datos está especialmente pensada, en general, para aplicaciones en las que existe una fuerte interacción hombre-máquina, esta tesis se ha adentrado en el mundo del Affective Computing, modelando emocionalmente un agente virtual cuyo carácter (gestos faciales y expresiones lingüísticas) evolucionan de acuerdo al grado con el que se alcanza el objetivo perseguido..

(5) Cada contribución teórica se ha respaldado con la resolución de problemas prácticos con aplicación en el mundo real. De este modo, se ha creado un modelo de la marcha humana más completo y robusto, diseñando y elaborando una aplicación capaz de describir la calidad de nuestra forma de caminar. Asimismo, se ha creado un modelo que analiza las principales actividades del ser humano, con el objetivo de proporcionar una herramienta de autoseguimiento de la actividad diaria. Finalmente, se han aplicado estas técnicas para modelar fenómenos de otros campos como la astronomía, el transporte o el consumo eléctrico.. RESUMEN (en Inglés) New technologies allow us to acquire and store big amounts of data from very different fields. With the aim of transform these data into information, they must be analyzed and explained in an interpretable and understandable way, using for this purpose the available knowledge about the phenomenon. Thanks to the natural language, we can build computational systems that interpret and describe the more relevant characteristics of the phenomenon, in the same way human beings perceive and interpret the information. This description is done by taking the most commonly expressions used to define the phenomenon, choosing the expression or expressions that better define the situation, i.e., those which have the highest validity degree. The main goal of this Ph.D. thesis is to extend the Computational Theory of Perceptions, introduced by Lotfi Zadeh in 1999. The idea consists in using Fuzzy Logic to create models based in the way human beings make descriptions by means of natural language. The goal is to use the language structures to design precise and robust models that deals with the imprecision inherent in complex phenomena. During the last years, the research unit “Computing with Perceptions” of the European Centre for Soft Computing, has developed computational systems that use natural language to linguistically describe the data acquired from a phenomenon. Its main contribution in this field is the so called “Granular Linguistic Model of a Phenomenon”, that analyzes the input data, combines different knowledge sources and generates reports about the relevant aspects of the studied phenomenon, adapting the content to the final receptor of the message. This Ph.D. thesis takes the first results obtained in this direction, providing new advances and new elements to the general architecture of linguistic modeling. Methodology followed has consisted in developing and incorporating new theoretical concepts, as the “ignorance” and the “relevance”. In addition, the paradigm of Fuzzy Finite State Machine has been improved, in order to model those phenomena that evolve in time, generally in a quasi-periodic way. By other hand, the use of emotions in the development of computational systems plays a fundamental role in decision-making processes. The emotional sensibility and expressivity are very important in the human interaction and transmit valuable information. Since the linguistic description of data is specially thought, in general, for those applications with a strong humancomputer interaction, this Ph.D. thesis has deepened in the field of Affective Computing, emotionally modeling a virtual agent which mood (facial and linguistic expressions) evolve according to the objectives fulfillment. Each theoretical contribution has been supported by the resolution of practical problems with real demand. In this way, a more complete and robust model of human gait has been developed, designing an application able to describe the gait quality. Also, a new model has been created to analyze the main activities of humans, with the aim of providing a self-tracking tool for physical activity. Finally, these techniques have been applied to model phenomena of other fields, such as astronomy, transport or electricity consumption. SR. DIRECTOR DE DEPARTAMENTO DE INFORMÁTICA SR. PRESIDENTE DE LA COMISIÓN ACADÉMICA DEL PROGRAMA DE DOCTORADO EN INGENIERÍA INFORMÁTICA.

(6)

(7) Agradecimientos Esta tesis doctoral no habr´ıa sido posible sin la ayuda y el apoyo de muchas personas. A todas y cada una de ellas les quiero agradecer de coraz´on que me hayan ayudado a lo largo del camino. En particular, quiero agradecer a mi director Graci´an Trivi˜ no por ofrecerme la posibilidad de realizar el doctorado bajo su direcci´on, por todos sus consejos y ense˜ nanzas, tanto a nivel cient´ıfico como a nivel personal, as´ı como por su apoyo y dedicaci´on durante todos estos a˜ nos. De igual modo, quiero agradecer al European Centre for Soft Computing haberme ofrecido la oportunidad de realizar esta tesis doctoral bajo su cobijo, as´ı como a todos los compa˜ neros que d´ıa a d´ıa me han respaldado y acompa˜ nado, contribuyendo sin lugar a dudas al desarrollo de este trabajo. Finalmente, agradecer a mi familia todo su apoyo y comprensi´on durante estos a˜ nos de investigaci´on. Con ellos he compartido todas las penas y alegr´ıas del camino. Parte de este trabajo es suyo, pues han sido mis ojos, mis o´ıdos y mi aliento en los momentos en los que m´as lo necesitaba. Es necesario resaltar que gran parte del trabajo presentado en esta tesis doctoral ha sido financiado por el proyecto del Ministerio de Ciencia e Innovaci´on bajo el proyecto “Descripci´on Ling¨ u´ıstica de Fen´omenos Complejos” (TIN2011-29827-C02-01) y por la Consejer´ıa de Econom´ıa y Empleo del Principado de Asturias bajo el proyecto “Descripci´on Ling¨ u´ıstica de Fen´omenos Complejos” (COF13-054)..

(8)

(9) Nunca consideres el estudio como una obligaci´on, sino como una oportunidad para penetrar en el bello y maravilloso mundo del saber. Albert Einstein (1879 - 1955).

(10)

(11) ´Indice general Resumen. I. I. Memoria. 1. 1. Introducci´ on. 3. 1.1. Punto de partida de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . .. 5. 1.1.1. Computational Perception . . . . . . . . . . . . . . . . . . . . . . .. 6. 1.1.2. Perception Mapping . . . . . . . . . . . . . . . . . . . . . . . . . .. 6. 1.1.3. Granular Linguistic Model of a Phenomenon . . . . . . . . . . . . .. 7. 1.1.4. Fuzzy Finite State Machine . . . . . . . . . . . . . . . . . . . . . .. 8. 1.1.5. Arquitectura general . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.2. Trayectoria y contribuci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2. Objetivos. 13. 3. Discusi´ on de los resultados. 15. 3.1. Introducci´on de nuevos conceptos en los distintos elementos que participan en el modelado de fen´omenos complejos . . . . . . . . . . . . . . . . . . . . 15 3.2. Ampliaci´on de la arquitectura general del modelado ling¨ u´ıstico . . . . . . . 17 3.3. Evoluci´on en el modelado de las FFSMs . . . . . . . . . . . . . . . . . . . 20 3.4. Resoluci´on de casos pr´acticos que validen las contribuciones te´oricas . . . . 22 3.4.1. An´alisis de las estructuras circulares presentes en la superficie de Marte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.4.2. An´alisis de la actividad humana . . . . . . . . . . . . . . . . . . . . 23 3.4.3. An´alisis de la marcha humana . . . . . . . . . . . . . . . . . . . . . 26 3.5. Difusi´on de los resultados. . . . . . . . . . . . . . . . . . . . . . . . . . . . 30. 4. Conclusiones y trabajo futuro. 33. Bibliograf´ıa. 35.

(12) II. Publicaciones. 5. Compendio de publicaciones 5.1. Linguistic description about circular structures of the Mars’ surface . 5.2. Computational Perceptions of uninterpretable data. A case study on linguistic modeling of human gait as a quasi-periodic phenomenon . . 5.3. Walking pattern classification using a granular linguistic analysis . . .. 43 45 . . . 46 the . . . 59 . . . 81. 6. Factor de impacto 101 6.1. JCR de Applied Soft Computing . . . . . . . . . . . . . . . . . . . . . . . 102 6.2. JCR de Fuzzy Sets and Systems . . . . . . . . . . . . . . . . . . . . . . . . 103 7. Publicaciones adicionales 7.1. Linguistic Description of Human Activity Based on Mobile Phone’s Accelerometers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.2. Increasing the Granularity Degree in Linguistic Descriptions of Quasiperiodic Phenomena . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3. Dynamic linguistic descriptions of time series applied to self-track the physical activity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.4. Linguistic and emotional feedback for self-tracking physical activity . . .. 105 . 106 . 115 . 128 . 150.

(13) Resumen Las nuevas tecnolog´ıas permiten adquirir y almacenar grandes vol´ umenes de datos de distinta naturaleza. Con el objetivo de transformar estos datos en informaci´on, deben ser analizados y explicados de la manera m´as comprensible e interpretable posible, empleando para ello todo el conocimiento que se posea sobre el fen´omeno estudiado. Gracias al lenguaje natural podemos construir sistemas computacionales que interpreten y describan las caracter´ısticas m´as relevantes de un fen´omeno imitando la forma que tienen los seres humanos de percibir e interpretar la informaci´on. Esta descripci´on se realiza recopilando las expresiones ling¨ u´ısticas que se emplean com´ unmente para definir el fen´omeno, y escogiendo en cada momento la expresi´on o expresiones que mejor definan la situaci´on, esto es, que presenten el mayor grado de validez. El objetivo principal de esta tesis es extender la Teor´ıa Computacional de Percepciones, introducida por Lotfi Zadeh en 1999. La idea consiste en utilizar la L´ogica Difusa para crear modelos basados en la forma que tienen los seres humanos de hacer descripciones a trav´es del lenguaje natural. El objetivo es utilizar las estructuras del lenguaje para hacer modelos precisos y robustos que manejen la imprecisi´on inherente de los fen´omenos complejos. Durante los u ´ltimos a˜ nos, la unidad de Computaci´on con Percepciones del European Centre for Soft Computing ha desarrollado sistemas computaciones que utilizan el lenguaje natural para describir ling¨ u´ısticamente los datos recogidos de un fen´omeno. Su principal contribuci´on en este campo de investigaci´on consiste en la creaci´on del denominado Granular Linguistic Model of a Phenomenon (Modelo Ling¨ u´ıstico Granular de un Fen´omeno), que analiza los datos de entrada, combina diferentes fuentes de conocimiento y genera informes sobre los aspectos m´as relevantes del fen´omeno estudiado, adaptando el contenido al receptor final del mensaje. Esta tesis recoge como testigo los primeros resultados obtenidos en esta direcci´on, incorporando mejoras y nuevos elementos en la arquitectura general de modelado ling¨ u´ıstico. La metodolog´ıa llevada a cabo ha consistido en el desarrollo e incorporaci´on de nuevos conceptos te´oricos, como son el “desconocimiento” y la “relevancia”, dos caracter´ısticas intr´ınsecas en el modelado de fen´omenos complejos, que hasta la actualidad no se hab´ıan tenido en cuenta. Adem´as, se ha ampliado y evolucionado el concepto de Fuzzy Finite State Machine (M´aquina de Estados Difusos Finitos), un paradigma para modelar aquellos fen´omenos que evolucionan en el tiempo, generalmente de manera quasi-peri´odica. Por otra parte, el empleo de emociones en el desarrollo de sistemas computacionai.

(14) ii. Resumen. les juega un papel fundamental en los procesos de toma de decisiones. La sensibilidad emocional y la expresividad son muy importantes en la interacci´on humana y transmiten informaci´on valiosa. Dado que la descripci´on ling¨ u´ıstica de datos est´a especialmente pensada, en general, para aplicaciones en las que existe una fuerte interacci´on hombrem´aquina, esta tesis se ha adentrado en el mundo del Affective Computing, modelando emocionalmente un agente virtual cuyo car´acter (gestos faciales y expresiones ling¨ u´ısticas) evolucionan de acuerdo al grado con el que se alcanza el objetivo perseguido. Cada contribuci´on te´orica se ha respaldado con la resoluci´on de problemas pr´acticos con aplicaci´on en el mundo real. De este modo, se ha creado un modelo de la marcha humana m´as completo y robusto, dise˜ nando y elaborando una aplicaci´on capaz de describir la calidad de nuestra forma de caminar. Asimismo, se ha creado un modelo que analiza las principales actividades del ser humano, con el objetivo de proporcionar una herramienta de auto-seguimiento de la actividad diaria. Finalmente, se han aplicado estas t´ecnicas para modelar fen´omenos de otros campos como la astronom´ıa, el transporte o el consumo el´ectrico..

(15) Parte I Memoria. 1.

(16)

(17) Cap´ıtulo 1 Introducci´ on Entendemos por “fen´omeno” cualquier manifestaci´on f´ısica que pueda contrastarse por observaci´on directa o medici´on indirecta (fen´omenos geol´ogicos, el´ectricos, qu´ımicos, biol´ogicos, ...), as´ı como cualquier situaci´on constatable mediante la recopilaci´on de informes o encuestas (fen´omenos psicol´ogicos, sociol´ogicos o econ´omicos). Las nuevas tecnolog´ıas permiten adquirir y almacenar grandes vol´ umenes de datos de diferente naturaleza. Con el objetivo de transformar estos datos en informaci´on, deben ser analizados y explicados de la manera m´as comprensible e interpretable posible, empleando para ello todo el conocimiento que se posea sobre el fen´omeno estudiado. Sin embargo, la relaci´on entre la cantidad de informaci´on disponible y el n´ umero de expertos capaces de analizar dicha informaci´on crece dram´aticamente, siendo de vital importancia desarrollar sistemas computacionales capaces de interpretar y describir los datos m´as relevantes. La tarea de modelar fen´omenos complejos se conoce como Identificaci´on de Sistemas (IS) [Sod 94, Lju 98]. Tanto el concepto de IS como su definici´on formal fueron introducidos por Lotfi Zadeh en 1956 [Zad 56]. De acuerdo a la definici´on que dio Zadeh [Zad 62], dada una clase de modelos, la IS requiere encontrar un modelo que pueda considerarse equivalente al sistema objetivo con respecto a los datos de entrada/salida. La IS emplea m´etodos estad´ısticos para construir modelos matem´aticos de sistemas din´amicos a partir de los datos medidos. Un modelo matem´atico din´amico en este contexto es una descripci´on matem´atica del comportamiento din´amico de un sistema o proceso, tanto en el dominio de la frecuencia como en el del tiempo. Tradicionalmente en IS, los ingenieros emplean ecuaciones diferenciales para construir modelos de “caja blanca” basados en el principio de modelar el comportamiento de sistemas del mundo real [Oga 67, Lju 98, Nel 00, Ise 09]. Desafortunadamente, la mayor´ıa de los sistemas de nuestro entorno son complejos y no es posible, o es muy costoso, obtener y resolver estas ecuaciones. Por lo tanto, cuando el sistema modelado crece en complejidad, el n´ umero de variables y ecuaciones necesarias se vuelve inmanejable y no existe otra opci´on que trabajar con modelos alternativos. Esta situaci´on la describe Zadeh en su Principio de Incompatibilidad: “cuanto m´as se incremente la complejidad de un sistema, nuestra habilidad para hacer declaraciones precisas sobre su comportamiento disminuye 3.

(18) 4. Cap´ıtulo 1. Introducci´ on. hasta que se alcanza un umbral m´as all´a del cual la precisi´on y la importancia (o relevancia) se vuelven casi caracter´ısticas mutuamente excluyentes” [Zad 73]. Una alternativa posible consiste en analizar el comportamiento del sistema y sus influencias externas (entradas del sistema) y tratar de determinar una relaci´on matem´atica entre ellas sin tener en cuenta su funcionamiento interno. Estos modelos se conocen como modelos de “caja negra”. En otras palabras, en un modelo de “caja negra” nos interesa su forma de interactuar con el entorno que lo rodea entendiendo qu´e es lo que hace pero no c´omo lo hace. Algunos ejemplos de este tipo de modelos son las redes neuronales [Hay 94] o los modelos lineales autoregresivos [Sea 97, Sta 09]. Debido a que existen gran cantidad de aplicaciones que requieren un conocimiento exhaustivo del modelo, este tipo de soluciones generan cierta desconfiaza y se buscan alternativas intermedias, como son los modelos de “caja gris”. En estos modelos se combinan algunos detalles sobre el comportamiento interno del sistema con la experiencia y el conocimiento extra´ıdos de los datos de entrada. En 1965, Zadeh introdujo el concepto de conjunto difuso y, algunos a˜ nos m´as tarde, estableci´o lo que hoy conocemos como L´ogica Difusa o Fuzzy Logic, que naci´o con el objetivo de manejar la imprecisi´on y la variabilidad inherente a los datos que manejamos, as´ı como modelar aquellos sistemas en los cuales obtener y resolver apropiadamente las ecuaciones de estado resulta una tarea dif´ıcil o imposible de realizar. Pero en algunos sistemas, el n´ umero de variables y de reglas necesarias para crear modelos difusos crec´ıa hasta volverse pr´acticamente incomprensibles y, en consecuencia, dif´ıcilmente aplicables. Para solucionar este problema, Zadeh propuso el uso de variables ling¨ u´ısticas [Zad 75] en vez de, o adem´as de, valores num´ericos, as´ı como la caracterizaci´on de las relaciones entre las variables a trav´es de declaraciones difusas condicionales. El modelado difuso es uno de los asuntos m´as importantes dentro de la L´ogica Difusa y se utiliza para describir el comportamiento de un sistema mediante el uso del lenguaje natural. El empleo de variables ling¨ u´ısticas y reglas en lenguaje natural [Mam 74, Mam 75, Mam 77] reduce notablemente el esfuerzo existente a la hora de extraer conocimiento experto. Por otra parte, siendo aproximadores universales [Buc 93, Cas 95], los sistemas de inferencia difusa son capaces de realizar mapeos lineales entre las entradas y las salidas. Gracias al lenguaje natural podemos construir sistemas computacionales que interpreten y describan las caracter´ısticas m´as relevantes de un fen´omeno imitando la forma que tienen los seres humanos de percibir e interpretar la informaci´on. La descripci´on ling¨ u´ıstica de datos est´a especialmente dise˜ nada para aquellas aplicaciones en las que existe una fuerte interacci´on entre las personas y las m´aquinas, cuando deben interpretarse grandes vol´ umenes de datos, a priori, dif´ıciles de comprender. Aunque el concepto b´asico de “res´ umenes ling¨ u´ısticos difusos” se estableci´o en 1982 por Ronald Yager, fue Zadeh quien en 1999 estableci´o la Teor´ıa Computacional de Percepciones con su art´ıculo “From computing with numbers to computing with words - from manipulation of measurements to manipulation of perceptions”, ampliada en sus art´ıculos posteriores. De acuerdo con la Gram´atica Sist´emica Funcional, el lenguaje natural es un.

(19) Contribuci´ on te´ orico-pr´ actica en el modelado ling¨ u´ıstico de fen´ omenos complejos. 5. sistema que se organiza en cuatro capas o estratos, conocidos como Contexto, Sem´antica, L´exico-gram´atica y Expresi´on. Los trabajos m´as recientes sobre el procesamiento del lenguaje natural, incluyendo aquellos basados en L´ogica Difusa, se centran en la capa L´exico-gramatical. El enfoque de la unidad de Computaci´on con Percepciones del European Centre for Soft Computing (ECSC) se centra especialmente en el modelado del Contexto y la Sem´antica. El dise˜ nador debe realizar un estudio sobre el uso que se hace del lenguaje natural en el contexto espec´ıfico de cada aplicaci´on, de lo cual se extraer´a un corpus con todas las posibles expresiones utilizadas com´ unmente para describir el fen´omeno monitorizado. Este corpus de expresiones ling¨ u´ısticas cubre el uso del lenguaje natural en todo el conjunto posible de situaciones (Contexto) y en el conjunto completo de percepciones relevantes (Sem´antica). A lo largo de los a˜ nos, los modelos basados en L´ogica Difusa han crecido en complejidad como consecuencia de los requisitos de modelado en t´erminos de precisi´on e interpretabilidad. Actualmente existen numerosas investigaciones en esta direcci´on, trabajando por establecer un formalismo que permita que los modelos difusos dise˜ nados sean lo m´as comprensibles por el ser humano [Cas 03b, Cas 03a, Alo 07, Alo 08, Alo 11a, Alo 11b].. 1.1.. Punto de partida de la tesis. ´ ´ Esta tesis contin´ ua la l´ınea investigadora desarrollada por Alberto Alvarez Alvarez en su tesis doctoral titulada “Linguistic modeling of complex phenomena”. En esta secci´on se presentan brevemente los elementos que componen la arquitectura general del modelado ling¨ u´ıstico, con el objetivo de que el lector comprenda mejor las contribuciones, tanto te´oricas como pr´acticas, desarrolladas. De acuerdo con Zadeh, el objeto de las percepciones no son solo los atributos de los objetos, como la distancia, la velocidad o el ´angulo, sino que pueden ser los sistemas completos, por ejemplo, una persona aparcando su coche o el tr´afico en una rotonda, lo cual es percibido por un entorno informatizado. Los fen´omenos pertenencen a un determinado contexto y evolucionan a lo largo del tiempo entre los distintos tipos de situaciones. El Modelo Ling¨ u´ıstico Granular de un Fen´omeno se basa en las percepciones subjetivas de un dominio experto que podemos denominar dise˜ nador. Cuanta m´as experiencia posea el dise˜ nador, mejor comprensi´on y mayor uso del lenguaje natural, m´as rico ser´a el modelo y m´as posibilidades de conseguir satisfacer las necesidades del usuario final, as´ı como de responder a sus expectativas. Para ello, el dise˜ nador emplea los recursos disponibles, por ejemplo los sensores, para adquirir datos sobre el fen´omeno monitorizado, y utiliza su propia experiencia para interpretar estos datos y crear el modelo. Luego, utiliza los recursos computacionales para producir las expresiones ling¨ u´ısticas que describan lo que est´a ocurriendo en cada instante de tiempo. En las subsecciones siguientes, se introducen los principales elementos de la arquitectura desarrollada para describir ling¨ u´ısticamente fen´omenos complejos..

(20) 6. 1.1.1.. Cap´ıtulo 1. Introducci´ on. Computational Perception. Una Computational Perception (CP) es el modelo computacional de una unidad de informaci´on adquirida por el dise˜ nador sobre el fen´omeno que quiere modelar. Est´a basada en el concepto de variable ling¨ u´ıstica de Zadeh [Zad 75]. En general, las CPs recogen aspectos particulares del fen´omeno con distintos niveles de granularidad. Una CP est´a formada por la tupla (A, W ), cuyos componentes se describen de la siguiente manera: A = (a1 , a2 , . . . , an ) es un vector de expresiones ling¨ u´ısticas (palabras y sentencias en lenguaje natural) que representan el dominio ling¨ u´ıstico completo de una CP. Los componentes de A est´an definidos por el dise˜ nador de acuerdo con las expresiones m´as apropiadas de entre las utilizadas t´ıpicamente en el dominio del lenguaje de la aplicaci´on. De este modo, cada componente ai corresponde con el valor ling¨ u´ıstico de CP m´as adecuado para cada situaci´on con una granularidad espec´ıfica. Cuanto mayor sea el n´ umero de expresiones, mayor ser´an la granularidad y la precisi´on obtenidas. Estas expresiones pueden ser tan simples como, por ejemplo, ai =“La temperatura es bastante alta”, o complejas, ai =“Hoy el tiempo est´a mejor que durante los u ´ltimos d´ıas”. Las expresiones ling¨ u´ısticas ai se utilizan para generar informes ling¨ u´ısticos sobre el fen´omeno monitorizado. W = (w1 , w2 , . . . , wn ) es un vector de grados de validez wi ∈ [0, 1] asignados a cada ai . En el contexto de aplicaci´on, wi representa la idoneidad de ai para describir la percepci´on actual. El dise˜ nador escoge los componentes de A para tratar de cubrir todos los posibles valores del CP, es decir, la validez total debe ser distribuida entre todas las etiquetas ling¨ u´ısticas. Por lo tanto, t´ıpicamente, los componentes de A est´an sujetos a conjuntos difusos que forman particiones difusas fuertes [Rus 69] en P el universo del discurso del CP, es decir, ni=1 wi = 1.. 1.1.2.. Perception Mapping. Un Perception Mapping (PM) se utiliza para combinar o agregar CPs. Est´a formado por la tupla (U, y, g, T ), en la cual: U es un vector de valores num´ericos o CPs de entrada. En el primer caso, las entradas al modelo U = (z1 , z2 , . . . , zm ) son valores num´ericos zi ∈ R adquiridos mediante sensores o extra´ıdos de una base de datos, y se les conoce como PMs de primer orden (1-P M s). En el segundo caso, las entradas al modelo U = (u1 , u2 , . . . , um ) son CPs, donde ui son tuplas (Ai , Wi ) y m representa el n´ umero de CPs de entrada. A este tipo de PMs se les conoce como PMs de segundo orden (2-P M s). y = (Ay , Wy ) es la CP de salida. De este modo, PM: u1 × u2 × · · · × um −→ y. Llamamos CPs de primer orden (1-CP s) a las salidas de las 1-P M s, y CPs de segundo orden (2-CP s) a las salidas de las 2-P M s..

(21) Contribuci´ on te´ orico-pr´ actica en el modelado ling¨ u´ıstico de fen´ omenos complejos. 7. g es una funci´on de agregaci´on Wy = g(W1 , W2 , . . . , Wm ), donde Wi son los vectores de los grados de validez de las m CPs de entrada. En L´ogica Difusa se han desarrollado muchos tipos distintos de funciones de agregaci´on. Por ejemplo, g puede ser implementado usando un conjunto de reglas difusas. En el caso de 1-P M s, g se construye usando un conjunto de funciones de pertenencia µai (z) de la siguiente manera: Wy = (µa1 (z), µa2 (z), . . . , µan (z)) = (w1 , w2 , . . . , wn ) T es un algoritmo de generaci´on de texto que permite generar las sentencias recogidas en Ay . T es habitualmente una plantilla ling¨ u´ıstica sencilla, como por ejemplo, “La temperatura de esta habitaci´on es {baja | media | alta}”.. 1.1.3.. Granular Linguistic Model of a Phenomenon. Un Granular Linguistic Model of a Phenomenon (GLMP) es una red de PMs encargados de combinar o agregar CPs. Se define como un paradigma utilizado para desarrollar sistemas computacionales capaces de generar descripciones ling¨ u´ısticas a partir de los datos de entrada. La eficiencia energética es {alta|media|baja}. 2-CP5. 2-PM5. El confort es {bueno|medio|malo}. 2-CP4. 2-PM4. La temperatura es {muy alta|alta|media| |baja|muy baja}. 1-CP1. La humedad es {alta|media|baja}. 1-CP2. El consumo eléctrico es {alto|normal|bajo}. 1-CP3. 1-PM1. 1-PM2. 1-PM3. z1. z2. z3. Figura 1.1: Ejemplo de un GLMP sencillo que modela la eficiencia energ´etica. A ra´ız de utilizar distintas funciones de agregaci´on y distintas expresiones ling¨ u´ısticas, el paradigma del GLMP permite al dise˜ nador modelar computacionalmente sus percepciones. Es importante destacar que, despu´es de ser instanciado con un conjunto de datos.

(22) 8. Cap´ıtulo 1. Introducci´ on. de entrada, el GLMP proporciona una estructura que, en aplicaciones de tama˜ no medio, podr´ıa incluir cientos de sentencias v´alidas. La Fig. 1.1 muestra un sencillo GLMP que modela la eficiencia energ´etica de la climatizaci´on de una habitaci´on, en base a percepciones como el confort, la temperatura, la humedad y el consumo el´ectrico. En este ejemplo, las variables de entrada proporcionan en cada instante de tiempo los valores z1 , z2 , y z3 . Estas variables se introducen en 1-P M1 , 1-P M2 y 1-P M3 , proporcionando 1-CP1 , 1-CP2 y 1-CP3 . Bas´andonos en 1-CP1 y 1-CP2 usamos 2-P M4 para explicar 2-CP4 . Finalmente, se proporciona una descripci´on del fen´omeno en el nivel m´as alto de abstracci´on, gracias a 2-CP5 , la cual es explicada por 2-P M5 a partir de 1-CP3 y 2-CP4 . Notar que, utilizando esta estructura no solo se puede proporcionar una descripci´on ling¨ u´ıstica del fen´omeno a cierto nivel, sino una explicaci´on en terminos ling¨ u´ısticos al nivel m´as bajo.. 1.1.4.. Fuzzy Finite State Machine. En Identificaci´on de Sistemas los dise˜ nadores deciden qu´e paradigma utilizan para representar los modelos del sistema. La representaci´on de espacios de estados es una de las estructuras de modelos m´as expresivas, donde el dise˜ nador utiliza su creatividad y su experiencia personal para escoger el conjunto de variables de estado suficientes y necesarias que representen el sistema en cada instante de tiempo [Oga 67]. Cuando el sistema evoluciona en el tiempo, el estado actual sigue una trayectoria en el espacio de estado. Dentro de este contexto, una Fuzzy Finite State Machine (FFSM) puede ser considerada como un caso particular de un modelo de espacio de estado, que es especialmente u ´til cuando se modelan fen´omenos que evolucionan en el tiempo mediante un n´ umero limitado de estados difusos. El concepto inicial de FFSM fue introducido por Santos [San 68] y posteriormente desarrollado por diferentes autores (por ejemplo, [Mor 02]). Esta familia de FFSMs se caracterizaba por tener estados difusos pero entradas crisps. M´as tarde, el modelo inicial se extendi´o para introducir entradas difusas [Yin 02], [Cao 07]. Sin embargo, el concepto de FFSM desarrollado en esta l´ınea de investigaci´on se inspira en los conceptos de estado difuso y sistema difuso desarrollados por Zadeh [Zad 62], [Zad 96]. M´as concretamente, se puede considerar como una implementaci´on de la idea general de “modelos difusos entrada-salida de sistemas din´amicos” propuesta por Yager [Yag 94]. Las FFSMs presentadas se utilizan en el modelado de sistemas para permitir a los expertos construir modelos ling¨ u´ısticos difusos comprensibles de una manera sencilla. Una FFSM es una tupla {Q, U , f , Y , g}, donde: Q es el vector de estados del sistema, que se define como una variable ling¨ u´ıstica que toma valores dentro del conjunto de etiquetas (q1 , q2 , . . . , qn ), siendo n el n´ umero de estados. Cada uno de los estados representa el patr´on de una situaci´on repetitiva dentro del sistema..

(23) Contribuci´ on te´ orico-pr´ actica en el modelado ling¨ u´ıstico de fen´ omenos complejos. 9. R22 R12 R11. q2. q3. q1 R41. R23. q4. R33. R34. R44. Figura 1.2: Ejemplo de un diagrama de estados. U es el vector de entrada del sistema (u1 , u2 , ..., unu ), siendo nu el n´ umero de variables de entrada. Estas variables de entrada pueden ser directamente valores num´ericos proporcionados por sensores o extra´ıdos de una base de datos, as´ı como CPs provenientes de la agregaci´on o combinaci´on de informaci´on en las capas inferiores de modelado. Esta situaci´on es habitual cuando la FFSM act´ ua como la funci´on de agregaci´on g de un PM dentro de un GLMP. f es la funci´on de transici´on que calcula en cada instante t el valor que tiene cada estado perteneciente a Q. Esta funci´on es implementada a partir de una base de conocimiento difusa. Una vez que el experto ha identificado cu´al es el vector de estados Q, se deben definir las reglas difusas que gobiernan la evoluci´on temporal del sistema por los estados. Podemos encontrar reglas para permanecer en un estado qi (Rii ) y reglas para cambiar de un estado qi a un estado qj (Rij ). El diagrama de estados es el encargado de establecer qu´e transiciones est´an permitidas y, por lo tanto, tendr´an asociada una regla de transici´on. Si una transici´on no figura en el diagrama de estados, no tendr´a ninguna regla asociada. La Fig. 1.2 muestra como ejemplo el diagrama de estados de un sistema con cuatro posibles estados de salida. La expresi´on gen´erica de una regla Rij es la siguiente: Rij : IF (State[t] is qi ) AND Cij THEN (State[t + 1] is qj ). (1.1). donde: 1. El primer t´ermino del antecedente (State[t] is qi ) representa el grado de activaci´on del estado qi en el instante de tiempo t. 2. El segundo t´ermino del antecedente (Cij ) describe las condiciones impuestas sobre las variables de entrada para que se produzca un cambio del estado qi al.

(24) 10. Cap´ıtulo 1. Introducci´ on. estado qj . 3. Finalmente, el consecuente (State[t + 1] is qj ) representa el grado de activaci´on del estado qj asociado a esta regla en el instante de tiempo t + 1. Y es el vector de salida del sistema (y1 , y2 , ..., yny ), siendo ny el n´ umero de variables de salida. g es la funci´on de salida que calcula el vector de salida del sistema.. 1.1.5.. Arquitectura general. La Fig. 1.3 muestra la arquitectura b´asica necesaria para generar informes. Los principales m´odulos de procesamiento de este sistema computacional son el m´odulo de adquisici´on de datos, el m´odulo de validaci´on y el m´odulo de expresi´on, los cuales se describen brevemente a continuaci´on: M´odulo de adquisici´on de datos: este m´odulo de procesamineto proporciona los datos necesarios para alimentar las 1-CP s. Adem´as, proporciona el interfaz con el entorno f´ısico de la aplicaci´on. Este m´odulo puede emplear sensores o bien alimentarse de la informaci´on contenida en una base de datos. M´odulo de validaci´on: una vez que los datos de entrada est´an disponibles, el m´odulo de validaci´on usa las funciones de agregaci´on del GLMP para calcular los grados de validez de cada CP. Por lo tanto, este m´odulo proporciona como salida una colecci´on de expresiones ling¨ u´ısticas con sus respectivos grados de validez asociados. M´odulo de expresi´on: proporcionadas un conjunto de expresiones ling¨ u´ısticas, el objetivo es combinar esta informaci´on para construir un informe ling¨ u´ıstico. Este m´odulo se encarga de generar el informe ling¨ u´ıstico m´as relevante, escogiendo las expresiones m´as adecuadas y bas´andose en la estructura fijada por el Report Template.. Informe. Módulo de adquisición de datos. Módulo de validación. Módulo de expresión. Fenómeno. GLMP. Report Template. Figura 1.3: Componentes principales de la arquitectura general..

(25) Contribuci´ on te´ orico-pr´ actica en el modelado ling¨ u´ıstico de fen´ omenos complejos. 1.2.. 11. Trayectoria y contribuci´ on. La Fig. 1.4 representa gr´aficamente la influencia que han tenido las diferentes disciplinas de la Ciencia Cognitiva en el dise˜ no de la arquitectura general para la descripci´on ling¨ u´ıstica de fen´omenos complejos, presentada en la secci´on anterior. En letra azul est´an reflejados algunos de los trabajos m´as relevantes de cada una de estas disciplinas; en verde las principales contribuciones realizadas durante los u ´ltimos a˜ nos desde la unidad de Computaci´on con Percepciones del ECSC; y finalmente, en rojo, las contribuciones desarrolladas durante la presente tesis doctoral, presentadas algunas de ellas en la Parte II. Publicaciones..

(26) Emotions [Pic00]. Theory of mind [Gom81]. Gait quality [Tri10b,Alv12c,Alv13, San13b,San14b,San14c]. Ontology. Activity recognition [Alv10a,Alv10b, Alv11b,Alv12a, San12, San14a,San14d,Gon14]. Traffic [Tri10a, Alv12b]. Description with emotion [Hei10a,Hei10b, Men14,San14d]. Simulators [Eci11a,Eci11b, Eci13]. FFSM [Bai10,Alv12c, San13b,San14b]. Astronomy [Alv11a,Tri12a]. Linguistic Description of Complex Phenomena. GLMP. CTP [Zad99,Zad01,Zad02, Men07,Zad08]. (linguistic variables). Fuzzy Constraints. Fuzzy Logic [Zad75]. Sociology. Quality assessment [Per12]. CPA7L [Tri09]. Philosophy [Pop77]. Machine Learning. Education. Fuzzy Systems [Zad62,Zad65]. Artificial Intelligence [Rus03]. Fuzzy Summaries [Yag82,Zad83,Yag95,Del00,Kac00, Kac01,Kac08,Kac10,Yag11]. Systemic Functional Linguistics [Hal04,Los04,Hal06a, Hal06b,Rei00,Tri12b]. Text Generation Algorithm [Men10,Mar12]. Linguistics. Psychology. Anthropology [Tom99]. Cognitive Science [How83]. Energy [Men14]. Neuro science. 12 Cap´ıtulo 1. Introducci´ on. Figura 1.4: Representaci´on gr´afica de la influencia que tienen las diferentes disciplinas de la Ciencia Cognitiva en la descripci´on ling¨ u´ıstica de fen´omenos complejos..

(27) Cap´ıtulo 2 Objetivos El objetivo principal de esta tesis es el desarrollo de nuevos modelos computacionales que interpreten y describan ling¨ u´ısticamente un fen´omeno, de la misma manera que lo har´ıa un ser humano. Este objetivo supone continuar con la l´ınea de investigaci´on iniciada en la unidad de Computaci´on con Percepciones del ECSC, centrada en el modelado ling¨ u´ıstico de fen´omenos complejos. El reto m´as importante consiste en el desarrollo de nuevos conceptos te´oricos avalados por la introducci´on de mejoras en la resoluci´on de problemas pr´acticos de diferente naturaleza. La siguiente enumeraci´on recoge los objetivos establecidos en el plan de investigaci´on al comienzo de la tesis, cuyo cumplimiento fue necesario para considerar satisfactoria su finalizaci´on: O1. Introducir nuevos conceptos en los distintos elementos que participan en el modelado ling¨ u´ıstico de fen´omenos complejos (CP, PM, GLMP). Estos nuevos conceptos permiten modelar de manera m´as eficaz el “desconocimiento” o “no interpretabilidad” de los datos, as´ı como recoger la informaci´on m´as relevante que debe aparecer en el informe final. O2. Ampliar la arquitectura general del modelado ling¨ u´ıstico, contribuyendo de esta manera al desarrollo de la Teor´ıa Computacional de Percepciones. O3. Mejorar y evolucionar el modelado de las FFSMs con el prop´osito de abordar de manera m´as eficiente el tratamiento de fen´omenos que evolucionan a lo largo del tiempo de forma quasi-peri´odica. O4. Resolver experimentos pr´ acticos que resuelvan problemas reales y permitan validar las contribuciones te´oricas presentadas en O1, O2 y O3. O5. Difundir la labor investigadora a trav´es de la asistencia a congresos y conferencias, as´ı como mediante la publicaci´on de, al menos, tres art´ıculos en revistas internacionales incluidas en el Science Citation Index.. 13.

(28) 14. Cap´ıtulo 2. Objetivos.

(29) Cap´ıtulo 3 Discusi´ on de los resultados En este cap´ıtulo se explican los resultados obtenidos durante el desarrollo de la tesis, demostrando que se han cumplido todos los objetivos expuestos en el Cap´ıtulo 2. Puesto que esta tesis doctoral se ha desarrollado bajo la modalidad de compendio de publicaciones, este cap´ıtulo recorre brevemente cada una de las contribuciones realizadas en los art´ıculos publicados. Para obtener una informaci´on m´as detallada sobre cada una de ellas, recomendamos al lector que acuda a los art´ıculos referenciados, recogidos todos ellos en la Parte II. Publicaciones.. 3.1.. Introducci´ on de nuevos conceptos en los distintos elementos que participan en el modelado de fen´ omenos complejos. a) La definici´on presentada en el apartado 1.1.1 define los elementos de una CP como un vector de expresiones ling¨ u´ısticas (A) y un vector de grados de validez (W ) asociados a cada una de esas expresiones ling¨ u´ısticas, respectivamente. En esta tesis introducimos la multidimensionalidad del dominio de la existencia de una CP, definiendo cada uno de sus elementos como matrices multidimensionales, y entendiendo la definici´on existente hasta el momento como un caso particular de la misma. La arquitectura general presentada en el apartado 1.1.5 muestra el sistema computacional propuesto para la generaci´on autom´atica de descripciones ling¨ u´ısticas de datos. Existen gran cantidad de aplicaciones en las que el contenido de estas descripciones o informes finales var´ıan en funci´on de los propios datos analizados, de los objetivos perseguidos y/o del receptor del informe. De esta forma, presentamos y desarrollamos el concepto de “relevancia” como un componente m´as de las CPs, que se utiliza para escoger las expresiones ling¨ u´ısticas m´as relevantes que describen el fen´omeno analizado. Tanto la multidimensionalidad de los elementos de las CPs, como el concepto de “relevancia” (R) como un elemento m´as de ´estas, se introducen en [San 13a]. A partir de ese trabajo, una CP se presenta como una tupla de tres componentes (A, W, R), en donde A 15.

(30) 16. Cap´ıtulo 3. Discusi´ on de los resultados. y W son dos componentes que se han explicado en el apartado 1.1.1 y R consiste en una matriz multidimensional de grados de relevancia asignados a cada elemento de A, cuyos valores est´an en el intervalo [0, 1]. Estos valores de R representan la importancia relativa de cada expresi´on ling¨ u´ıstica en el informe final y los establece el dise˜ nador en la fase de construcci´on del GLMP. Gracias a la multidimensionalidad de las CPs podemos elaborar expresiones ling¨ u´ısticas m´as complejas que describan cada percepci´on. En [San 13a] se definen percepciones cuya plantilla ling¨ u´ıstica T es, por ejemplo, “The image contains {zero | one | two | three | four | various | many} {small | medium | big} circles”. b) Por otra parte, existen muchas situaciones en las que, debido a la limitada experiencia personal, el dise˜ nador no dispone de todos los recursos necesarios para reconocer y describir los detalles m´as relevantes de un fen´omeno. Para comunicar esa incertidumbre producida por la falta de experiencia, los seres humanos empleamos expresiones como “por lo que yo s´e, ...”, “parece que...”, “puede ser debido a...”, etc., destacando as´ı la falta de un conocimiento completo sobre el significado de los datos analizados. En general, cuando monitorizamos un fen´omeno complejo, solo podemos reconocer los datos de entrada con un determinado grado de certeza. Como contribuci´on en este campo, hemos enriquecido la descripci´on ling¨ u´ıstica de fen´omenos para superar esta limitaci´on. Para ello, hemos creado las CPs de datos no interpretables. Entendemos por datos no interpretables aquellos que no se adaptan perfectamente al modelo disponible del fen´omeno. Esta falta de conocimiento completo es una caracter´ıstica t´ıpica de los sistemas basados en conocimiento experto, incluyendo los sistemas basados en reglas que combinan conocimiento experto con conocimiento inducido. En aplicaciones autom´aticas, como son los controladores fuzzy, el sistema de reglas ha de ser completo y cubrir todo el ´ambito de aplicaci´on. Sin embargo, en aplicaciones que contemplan la interacci´on con humanos, la interpretabilidad se aprecia m´as que la completitud. En este sentido, cuanto mayor sea la complejidad del sistema, es decir, cuantas m´as reglas tenga, menor ser´a la interpretabilidad del mismo. El concepto de CPs de datos no interpretables se introduce en [San 14]. Para ello, extendemos su definici´on a˜ nadiendo la expresi´on ling¨ u´ıstica a0 en el vector A, en caso de que sea una matriz unidimensional. Esta expresi´on a0 refleja aquellas situaciones en las que la percepci´on no se ajusta perfectamente a ninguna de las otras expresiones disponibles (a1 , a2 , . . . , an ). Un ejemplo de expresi´on ling¨ u´ıstica a0 podr´ıa ser “El modelo disponible no puede explicar completamente la situaci´on actual”. Su objetivo es modelar la falta de una interpretabilidad completa del fen´omeno, proporcionando informaci´on de aquellas partes de la se˜ nal que no pueden ser explicadas por el modelo. Cuando el dominio completo que recoge una CP est´a bien definido, no nos preocupamos por los datos no interpretables, ya que no existen. Sin embargo, en la mayor´ıa de las aplicaciones reales no es habitual tener un conocimiento completo del fen´omeno, por lo que modelar la no interpretabilidad es esencial. Adem´as, en muchas situaciones, este desconocimiento o “no interpretabilidad” de los datos de entrada se debe a anomal´ıas o fallos externos al funcionamiento normal.

(31) Contribuci´ on te´ orico-pr´ actica en el modelado ling¨ u´ıstico de fen´ omenos complejos. 17. del sistema, como por ejemplo, fallos en un sensor que deja de capturar datos o su lectura es err´onea. Por supuesto, la expresi´on ling¨ u´ıstica a0 tiene asociado un grado de validez w0 dentro de la matriz W y un grado de relevancia r0 dentro de la matriz R.. 3.2.. Ampliaci´ on de la arquitectura general del modelado ling¨ u´ıstico. a) La arquitectura inicial de un sistema computacional para la generaci´on de descripciones ling¨ u´ısticas de datos se present´o en el apartado 1.1.5. Durante el desarrollo de esta tesis doctoral se avanz´o en el dise˜ no de dicha arquitectura, redefiniendo sus etapas principales y ampliando su contenido con nuevos m´odulos y estructuras de datos. En [San 13a] podemos ver una primera identificaci´on de las dos etapas principales que encontramos en el proceso de generaci´on de texto, llamadas “Proceso de construcci´on offline” y “Proceso de instanciaci´on on-line” (Fig. 3.1). Durante el proceso de construcci´on off-line, tras analizar el dominio de la aplicaci´on y los requisitos del usuario, el dise˜ nador recoge el conjunto de expresiones en lenguaje natural (corpus) que se utilizan t´ıpicamente para describir las caracter´ısticas m´as relevantes del fen´omeno estudiado. Asimismo, analiza el significado particular de cada expresi´on ling¨ u´ıstica en cada tipo de situaci´on y dise˜ na tanto el GLMP como el Report Template. Por otra parte, durante el proceso de instanciaci´on on-line, el sistema instancia los datos de entrada obtenidos por el m´odulo de adquisici´on de datos para generar el informe ling¨ u´ıstico final. Proceso de instanciación on-line. Dominio de la aplicación. Módulo de adquisición de datos. Módulo de validación. Módulo de expresión. Fase de análisis. GLMP. Report Template. Informe lingüístico. Proceso de construcción off-line. Figura 3.1: Arquitectura general propuesta en [San 13a]. b) En [San 15a] ampliamos la arquitectura a˜ nadiendo dos m´odulos nuevos de procesamiento: el m´odulo de relevancia y el m´odulo de expresi´on din´amico (Fig. 3.2). A continuaci´on se explican en detalle las funciones de cada uno de ellos: El m´odulo de relevancia distingue autom´aticamente la informaci´on relevante y la irrelevante de acuerdo a las necesidades del usuario. En el apartado anterior (3.1), explicamos c´omo el dise˜ nador establece los valores de R durante el proceso off-line o construcci´on del GLMP. En este caso, se amplia la definici´on de PM, defini´endolo como una tupla (U, y, f, g, T ) donde la funci´on f es implementada por el m´odulo de.

(32) 18. Cap´ıtulo 3. Discusi´ on de los resultados. validaci´on (en el apartado 1.1.2 estaba representada como g) y la nueva funci´on g, que calcula autom´aticamente la relevancia de cada expresi´on ling¨ u´ıstica, es implementada por el m´odulo de relevancia. De esta manera, en funci´on de la aplicaci´on y de su complejidad, existir´an expresiones ling¨ u´ısticas cuya relevancia se pueda definir a priori durante el proceso off-line y otras cuya relevancia dependa de los resultados obtenidos. En [San 15a] se combinan ambos tipos de casos, presentando un conjunto de CPs cuyas matrices de relevancia R vienen definidas de antemano por el dise˜ nador y otras cuyos valores dependen de los grados de validez calculados en W . El m´odulo de expresi´on din´amico genera los informes de manera din´amica, ajust´andose en cada situaci´on particular a los grados de validez y relevancia de las expresiones que describen el fen´omeno. De acuerdo con las cuatro m´aximas de Grice, un informe de calidad debe contener informaci´on verdadera y relevante, expresada de manera clara y con la extensi´on adecuada. El objetivo perseguido con el m´odulo de expresi´on din´amico es abordar el u ´ltimo de esos cuatro requisitos, incorporando u ´nicamente la informaci´on que sea cierta y relevante, ofreciendo al lector diferentes niveles de detalle y ajustando, de esta manera, la extensi´on del informe final.. Proceso de instanciación on-line. Módulo de adquisición de datos. Módulo de validación. Módulo de relevancia. Módulo de expresión dinámica. Informe lingüístico. Serie temporal GLM de la serie temporal. Report Template. Proceso de diseño off-line. Figura 3.2: Arquitectura general propuesta en [San 15a]. c) En aquellas aplicaciones en las que se pretende conseguir un cambio de conducta o influir en el comportamiento del usuario, es importante expresar los resultados con la emoci´on adecuada, aportando algo m´as que una descripci´on de los resultados. En [San 15c] se ampl´ıa la arquitectura para dotar de contenido emocional el informe final. Para ello, de acuerdo con los requisitos espec´ıficos del usuario, el dise˜ nador modela el estado emocional de un avatar, o ser virtual, por medio de un GLMP emocional (Fig. 3.3). Este nuevo GLMP recibe como entrada la salida del GLMP cl´asico que, en este art´ıculo, describe la actividad f´ısica del usuario en el instante actual, a lo largo del d´ıa o durante la semana. El avatar es el encargado de comunicar el contenido del informe final. Su estado emocional, reflejado en las expresiones ling¨ u´ısticas que emplea y en sus gestos faciales, cambia dependiendo de los datos de entrada. El GLMP que modela las emociones del avatar se dise˜ no´ bas´andose en algunos de los modelos existentes en la literatura, como son la rueda de Plutchik, el modelo circumplejo de Russell o el modelo de Whissell. El modelo.

(33) Contribuci´ on te´ orico-pr´ actica en el modelado ling¨ u´ıstico de fen´ omenos complejos. 19. On-line instantiation process. Aceleraciones del teléfono móvil. Dominio de aplicación y requisitos del usuario. Módulo de adquisición de datos. Módulo de validación. Fase de análisis de la actividad física. GLMPActivity. Fase de análisis emocional. GLMPEmotion. Módulo de expresión. Informe lingüístico. Report Template. Off-line building process. Figura 3.3: Arquitectura general propuesta en [San 15c]. dise˜ nado selecciona una de entre nueve emociones situadas de forma circular alrededor de un punto central, que representa el estado neutral, bas´andose en la evaluaci´on y la activaci´on de los datos de entrada (Fig. 3.4). En nuestro modelo, la evaluaci´on representa la desviaci´on de los datos analizados con respecto al objetivo establecido. Planteamos tres posibilidades: que el objetivo se cumpla (evaluaci´on positiva), que no se cumpla pero la desviaci´on sea razonable (evaluaci´on cero) o que no se cumpla ampliamente (evaluaci´on negativa). Por su parte, la activaci´on representa la intensidad con la que el avatar expresar´a los resultados, bas´andose en su tendencia. De este modo, con independencia de si se cumple el objetivo o no, si los resultados han mejorado la activaci´on ser´a pasiva (actitud del avatar m´as relajada), si se mantienen la activaci´on ser´a cero y si han empeorado la activaci´on ser´a activa (actitud del avatar m´as en´ergica). Para m´as informaci´on sobre el modelo emocional propuesto, recomendamos al lector acudir al Cap´ıtulo 7.4.. Figura 3.4: Estados emocionales propuestos en [San 15c]..

(34) 20. 3.3.. Cap´ıtulo 3. Discusi´ on de los resultados. Evoluci´ on en el modelado de las FFSMs. a) En lo referente a las FFSM, como un caso particular de PM de agregaci´on, la “no interpretabilidad de los datos” presentada en el apartado 3.1 se refleja en la aparici´on del estado q0 dentro del vector de estados Q, siendo el estado inicial del sistema. La Fig. 3.5 muestra un ejemplo de diagrama de estados que incorpora el estado q0 . R22. q2. R12. R11. q1. R01. q0. R10 R04. R41. R23 R02. R20. R00 R30 R03. q3. R33. R40. q4. R34. R44. Figura 3.5: Diagrama de estados con q0 . b) Entendemos por fen´omenos quasi-peri´odicos aquellos cuyas se˜ nales est´an formadas por patrones que se repiten en el tiempo, pero que pueden presentar variaciones en el periodo y en la amplitud. Dos ejemplos de este tipo de fen´omenos son los electrocardiogramas y las vibraciones producidas por los instrumentos musicales a la hora de generar sonido. En [San 13b] y [San 15b] se extiende el modelado de las se˜ nales quasi-peri´odicas con FFSMs, aumentando el nivel de granularidad de las descripciones ling¨ u´ısticas obtenidas. El principal objetivo consiste en proporcionar un informe m´as detallado sobre el fen´omeno quasi-peri´odico monitorizado, que permita entender con m´as claridad su comportamiento a lo largo del tiempo. Con el modelo propuesto, podemos describir ling¨ u´ısticamente la evoluci´on temporal de este tipo de se˜ nales, siendo esta descripci´on especialmente interesante en aquellos instantes en los que el modelo no se ajusta completamente al fen´omeno. En estos casos, el sistema computacional desarrollado describe las razones que provocan esa situaci´on, proporcionando una valiosa herramienta para monitorizar de manera m´as precisa la se˜ nal de entrada. As´ı, por ejemplo, el modelo puede devolver descripciones como “Actualmente el modelo no reconoce la se˜ nal de entrada. La amplitud es positiva, est´a incrementando, y el tiempo que lleva en el estado q1 es demasiado largo para permanecer en ´el, por lo que deber´ıa haber cambiado al estado q2 ”. Este an´alisis resulta adecuado cuando se trabaja en procesamiento de se˜ nales, control predictivo o tareas de monitorizaci´on. El aumento del nivel de granularidad se consigue analizando en detalle el funcionamiento interno de la FFSM empleada para monitorizar la se˜ nal, proporcionando un modelo altamente interpretable, comprensible y eficiente..

(35) 21. Contribuci´ on te´ orico-pr´ actica en el modelado ling¨ u´ıstico de fen´ omenos complejos. 2. Gracias a la incorporaci´on del estado q0 en la monitorizaci´on de fen´omenos quasiperi´odicos, podemos conocer el grado de similitud existente entre la se˜ nal analizada y la esperada por el modelo. De esta manera, definimos el concepto de matching degree (µU ), que se calcula como: n P wq0 [t] t=1 (3.1) µU = 1 − n donde wq0 representa los grados de validez del estado q0 a lo largo de un periodo de n muestras. El coeficiente µU toma valores en el rango [0,1], siendo igual a uno si el estado “no interpretable” no se ha activado, cero cuando ha estado activado durante todo el tiempo y un n´ umero real entre cero y uno para el resto de casos. Por ejemplo, si monitorizamos el comportamiento de la se˜ nal senoidal u(t) = sin(10t) a lo largo del tiempo, podemos identificar los cuatro estados q1 , q2 , q3 y q4 representados en la Fig. 3.6. VP. P. 0. q2. −1. Amplitude. 1. q1. q4. Z. N. q3. −2. VN. 0.0. 0.5. 1.0. 1.5. 2.0. 2.5. Time (s). Figura 3.6: Se˜ nal senoidal con cinco etiquetas ling¨ u´ısticas en amplitud, que definen los estados q1 , q2 , q3 y q4 . Las Figs. 3.7, 3.8, 3.9 y 3.10 muestran la evoluci´on de estos estados, adem´as del estado q0 , conforme la se˜ nal se aleja o se asemeja al modelo previsto. Cuanto m´as interpretable sea la se˜ nal, mayor ser´a el matching degree, y viceversa. Matching degree = 1. Matching degree = 0.93. −1. 0. 1. ωq4 ωq3 ωq2 ωq1 ωq0. 0. ω qi. 1. Amplitude. 0 −1 0. ω qi. 1. Amplitude. 1. ωq4 ωq3 ωq2 ωq1 ωq0. 10. 11. 12. Time (s). 13. 14. 10. 11. 12. 13. 14. Time (s). Figura 3.7: Estados y µU cuando la se˜ nal Figura 3.8: Estados y µU cuando la se˜ nal es exactamente la esperada. es ligeramente diferente de la esperada..

(36) 22. Cap´ıtulo 3. Discusi´ on de los resultados. Matching degree = 0.77. Matching degree = 0.51. 1 0 −1. Amplitude. 1 0 −1. ωq4 ωq3 ωq2 ωq1 ωq0. ωqi 0. 1 0. ωqi. 1. −2. Amplitude. 2. ωq4 ωq3 ωq2 ωq1 ωq0. 0. 2. 4. 6. 8. 10. 12. Time (s). 0. 10. 20. 30. 40. Time (s). Figura 3.9: Estados y µU cuando la se˜ nal Figura 3.10: Estados y µU cuando la se˜ nal var´ıa su amplitud a lo largo del tiempo. var´ıa su periodo a lo largo del tiempo.. 3.4.. Resoluci´ on de casos pr´ acticos que validen las contribuciones te´ oricas. Cada una de las contribuciones te´oricas presentadas en 3.1, 3.2 y 3.3 han sido validadas a partir de la resoluci´on pr´actica de problemas reales. Estos casos pr´acticos se han dividido en los tres campos de aplicaci´on que se describen a continuaci´on:. 3.4.1.. An´ alisis de las estructuras circulares presentes en la superficie de Marte. Fruto de la colaboraci´on con el Instituto Nacional de Tecnolog´ıa Aeroespacial (INTA), en [San 13a] se desarroll´o un sistema computacional que describe ling¨ u´ısticamente las estructuras circulares presentes en la superficie de Marte (Fig. 3.11).. Figura 3.11: Ejemplo de la detecci´on de c´ırculos en una imagen. Los sat´elites que orbitan sobre Marte capturan diariamente un gran vol´ umen de im´agenes de su superficie, y proporcionan a los expertos informaci´on geol´ogica importante. Entre otros, el hallazgo y an´alisis de estructuras con forma circular resulta interesante puesto que su origen se puede relacionar con la presencia de actividad volc´anica, aunque tambi´en con simples impactos de meteoritos. El principal problema reside en la incapacidad huma-.

(37) Contribuci´ on te´ orico-pr´ actica en el modelado ling¨ u´ıstico de fen´ omenos complejos. 23. na para analizar las miles de im´agenes que se capturan cada d´ıa, por lo que es necesario dise˜ nar un sistema que autom´aticamente analice y describa la informaci´on m´as relevante encontrada, omitiendo la irrelevante. Los informes generados son estudiados en detalle por los expertos, que ven como se reduce de manera importante el estudio total de casos a los m´as relevantes. Algunos ejemplos de las descripciones obtenidas para dos im´agenes diferentes son: “La imagen contiene dos c´ırculos grandes y dos medianos. Los dos c´ırculos grandes est´an ubicados en la parte central inferior y superior de la imagen” “La imagen no contiene ning´ un c´ırculo grande pero s´ı uno mediano” Tal y como puede observarse en los ejemplos anteriores, el contenido y extensi´on de las descripciones var´ıan en funci´on del resultado obtenido en el an´alisis de la imagen, seg´ un la teor´ıa presentada en el apartado 3.2. As´ı, en este caso pr´actico, cuando se detecta la presencia de alg´ un c´ırculo grande es relevante incluir en el informe su posici´on. Esta selecci´on de informaci´on la realiza el m´odulo de expresi´on a partir de un Fuzzy tree of choices y de la combinaci´on de los grados de validez y relevancia de cada sentencia (para una informaci´on m´as detallada recomendamos acudir al Cap´ıtulo 5.1).. 3.4.2.. An´ alisis de la actividad humana. Una de las principales l´ıneas de investigaci´on de esta tesis doctoral se basa en el desarrollo de un sistema computacional que analiza las actividades f´ısicas m´as comunes de una persona. La monitorizaci´on de la actividad f´ısica es especialmente u ´til en el ´ambito de la asistencia m´edica personalizada, tanto para la identificaci´on de potenciales patrones patol´ogicos en personas con tendencia a padecer trastornos mentales (depresi´on o trastorno bipolar), como en la detecci´on del grado de inactividad, siendo ´esta una de las causas que producen o agravan enfermedades cardiovasculares, o´seas, cr´onicas, etc. Su estudio resulta de gran ayuda para profesionales (endocrinos, psic´ologos, cardi´ologos, ...) que pretenden ajustar tratamientos y analizar la evoluci´on f´ısica de sus pacientes. Nuestra primera contribuci´on en este campo de investigaci´on se centra en el proceso de captura de los datos. Hasta hace poco, la manera que ten´ıa un m´edico para evaluar la actividad f´ısica de un paciente era realizarle cuestionarios que estaban condicionados por su memoria y tambi´en por su subjetividad a la hora de sincerarse. Para resolver este problema y proporcionar un m´etodo de captura de informaci´on m´as objetivo, durante los u ´ltimos a˜ nos han ido apareciendo gran cantidad de sistemas de reconocimiento de la actividad que recogen y analizan las aceleraciones producidas durante el movimiento. Algunas de estas soluciones requieren la colocaci´on de diferentes sensores distribuidos por el cuerpo del usuario, resultando inc´omodo e impr´acticable a la hora de realizar una monitorizaci´on continua. Otras soluciones m´as sofisticadas se centran en colocar un u ´nico sensor, y gracias al potencial de las nuevas tecnolog´ıas, durante los u ´ltimos a˜ nos se est´an.

(38) 24. Cap´ıtulo 3. Discusi´ on de los resultados. aprovechando los aceler´ometros incorporados en los actuales tel´efonos m´oviles para capturar las aceleraciones producidas por el movimiento. En [San 12] se propone un modelo que describe ling¨ u´ısticamente las principales actividades de una persona (estar parado, sentado, caminando, corriendo, subiendo y bajando escaleras...) mediante el an´alisis de las aceleraciones producidas en su tel´efono m´ovil mientras se lleva en el bolsillo del pantal´on. La Fig. 3.12 muestra las aceleraciones recogidas por el tel´efono m´ovil durante un periodo de grabaci´on diaria y la Fig. 3.13 muestra la secuencia de actividades identificadas tras analizar su evoluci´on.. Figura 3.12: Aceleraciones en los ejes x, y, Figura 3.13: Identificaci´on de las actividaz durante un periodo de tiempo. des f´ısicas de una persona. Con el objetivo de facilitar lo m´aximo posible la captura de datos, en [San 15a] se da un paso m´as, permitiendo que el tel´efono m´ovil se lleve donde el propio usuario estime oportuno, incluso en un bolso de mano o mochila. Con este avance se reduce el n´ umero de actividades reconocidas pero, a cambio, conseguimos eliminar la gran limitaci´on de los modelos existentes de exigir una ubicaci´on fija del dispositivo. El modelo propuesto es capaz de reconocer cuando el usuario no lleva el tel´efono m´ovil encima, teniendo en cuenta esta informaci´on a la hora de estimar el nivel de actividad f´ısica diario. Para ello, el m´odulo de adquisici´on de datos recoge como entrada las aceleraciones ax , ay y az producidas en el tel´efono m´ovil (Fig. 3.12). Estas aceleraciones se procesan para obtener su m´odulo (ρ) y su desviaci´on t´ıpica (σ) en ventanas temporales de 20 segundos. Es importante destacar que ρ y σ son dos medidas invariantes con respecto de la orientaci´on y posici´on del tel´efono m´ovil. En este sentido, la evoluci´on de ax , ay y az por separado no resulta interesante, pero s´ı la magnitud y variabilidad de su combinaci´on, lo cual est´a representado por ρ y σ. La forma de calcularlas es la siguiente: q ρ = a2x + a2y + a2z σ=. s. PN. − ρ¯)2 N −1. i=1 (ρi. (3.2). (3.3).

(39) Contribuci´ on te´ orico-pr´ actica en el modelado ling¨ u´ıstico de fen´ omenos complejos. 25. Otra de las aportaciones importantes de este trabajo hace relaci´on a las contribuciones te´oricas presentadas en los apartados 3.1 y 3.2. Por una parte, el modelo de la actividad f´ısica propuesto tiene en cuenta aquellos instantes en los que no se reconoce la se˜ nal de entrada, trat´andolo como informaci´on “no interpretable”. Este dato tambi´en ser´a importante a la hora de estimar el nivel de actividad f´ısica diario. La Fig. 3.14 muestra el diagrama de estados de la FFSM que reconoce las actividades del usuario. R11. Out (q1). R31 R12 R21. R13. R22. Stopped (q2) R02. R01 R10. R23 R32. R33. Walking (q3). R20 R30. Unknown (q0). R03. R44 R34 R43. Running (q4) R04. R40. R00. Figura 3.14: Diagrama de estados propuesto en [San 15a]. Por otra parte, con el objetivo de generar informes de calidad que cumplan las cuatro m´aximas de Grice, la arquitectura de este trabajo incluye el m´odulo de relevancia y el m´odulo de expresi´on din´amico. De esta manera, el modelo es capaz de generar informes con tres niveles de granularidad: instant´anea, diaria y semanal. El contenido de estos informes se ajustar´a a los resultados obtenidos y su relevancia en cada contexto espec´ıfico. Por u ´ltimo, en [San 15c] se ampl´ıa el modelo de la actividad f´ısica, proporcionando al usuario informaci´on acerca de los requisitos energ´eticos diarios que necesita en funci´on de su nivel de actividad f´ısica y su ´ındice de masa corporal. La Fig. 3.15 muestra el GLMP dise˜ nado para modelar la actividad f´ısica de una persona y sus requisitos energ´eticos. Si nos fijamos en el ejemplo de GLMP presentado en el Cap´ıtulo 1.1.3 podemos ver un cambio en la notaci´on utilizada para designar las CPs y las PMs. La distinci´on entre percepciones de primer y segundo orden se pierde, y los sub´ındices empleados corresponden a alguna caracter´ıstica de la propia percepci´on (ρ, σ, etc.), en lugar de utilizar ´ındices num´ericos. Para una informaci´on m´as detallada acudir al Cap´ıtulo 7.4. Con el objetivo de promover el self-tracking o auto-seguimiento de la actividad f´ısica, dotamos el informe final de contenido emocional. A la hora de motivar al usuario para que alcance el nivel de actividad f´ısica establecido por un experto o por ´el mismo, es imprescindible interactuar y comunicar la informaci´on relevante de manera efectiva, estableciendo un v´ınculo afectivo con ´el. Por esta raz´on, decidimos incluir t´ecnicas de Affective Computing en nuestra arquitectura general (Fig. 3.3), a˜ nadiendo un GLMP que modela las emociones de un ser virtual. Este ser virtual ser´a el encargado de comunicar los resultados de la manera m´as adecuada en cada situaci´on. Por ejemplo, si los resultados son negativos, el avatar se mostrar´a preocupado, triste o incluso enfadado; si estos persisten en el tiempo.

Referencias

Documento similar