Fundamentos de control cognitivo aplicado a sistemas de iluminación pública

(1)

Presentado a

LA UNIVERSIDAD DE LOS ANDES

FACULTAD DE INGENIER´IA

DEPARTAMENTO DE INGENIER´IA EL´

ECTRICA Y ELECTR ´

ONICA

Para obtener el t´ıtulo de

INGENIERO ELECTR ´

ONICO

por

Rafael Felipe Sosa P´

erez

FUNDAMENTOS DE CONTROL COGNITIVO APLICADO A

SISTEMAS DE ILUMINACI ´

ON P ´

UBLICA

Sustentado el 09 de Diciembre de 2014 frente al jurado:

Composici´

on del jurado

- Asesor: Nicanor Quijano Silva PhD, Profesor Asociado, Universidad de Los Andes

(2)

(3)

Agradecimientos

En la vida no ser´ıa nada ni nadie sin los principios que me fueron inculcados. Es por eso que luego de Dios, el mayor agradecimiento y reconocimiento va para mis padres. Quienes fueron los art´ıfices de mis logros, los pilares de mi integridad y los gu´ıas de mis sue˜nos. El apoyo y amor incondicional por parte de ellos ayud´o de manera trascendental el desarrollo no solo de este proyecto, sino de mi vida.

A mis hermanos con quienes compart´ı y aprend´ı tanto en las situaciones placenteras como en las situa-ciones precarias de la vida. El compartir con ellos, con su amor y con su tolerancia me hizo evolucionar d´ıa a d´ıa como persona. Adem´as, a la pareja de ´angeles que Dios puso en mi camino, aquellos que me dieron un hogar y me trataron como uno de los suyos, les reservo un especial, grato y sincero agradecimiento en este espacio

´

Ultimamente, agradezco a mis familiares. Primos, t´ıos, sobrinos y amigos, por aportar con infinitos granitos de arena para mi vida y a quienes espero tambi´en les haya aportado positivamente. Pero el indispensable aporte del t´ıo Daniel merece mi eterno agradecimiento y deuda, donde mi vida no ser´a suficiente tiempo para pagar.

(4)

Tabla de contenido

1 Introducci´on 1

1.1 Descripción de la problemática y justificación del trabajo . . . 1

1.2 Alcance y productos finales . . . 2

1.3 Objetivos . . . 2

1.3.1 Objetivo General . . . 2

1.3.2 Objetivos Espec´ıficos . . . 2

2 Marco teórico, conceptual e histórico 3 2.1 Marco Teórico . . . 3

2.1.1 Programaci´on Din´amica de Bellman . . . 3

2.1.2 Q-Learning . . . 4

2.1.3 Cálculo de Iluminancia según el Método de los Lúmenes . . . 5

2.2 Marco Conceptual . . . 6

2.2.1 Conceptos de Cognici´on . . . 6

2.2.2 Conceptos de Alumbrado P´ublico . . . 6

2.3 Marco Hist´orico . . . 7

2.3.1 A Bottom-Up Approach for Cognitive Control . . . 7

2.3.2 Cognitive control architecture for an artificial creature using episodic memory . 8 2.3.3 An introduction of cognition information: From form aspect to semantic aspect . 9 2.3.4 Autonomic fault management based on cognitive control loops . . . 9

2.3.5 Cognitive Computation: A case study in cognitive control of autonomous systems and some future directions . . . 10

2.3.6 Cognitive control architecture for autonomous marine vehicles . . . 11

2.3.7 Cognitive control for robot task execution . . . 11

2.3.8 Cognitive control in cognitive robotics: Attentional executive control . . . 11

2.3.9 Cognitive control initiative . . . 12

2.3.10 Cognitive control of quadrocopter using supervisor . . . 12

2.3.11 Cognitive supervision and control of robotic inspection-intervention system using qualitative spatio-temporal representation and reasoning . . . 12

2.3.12 Coordinating cognitive assistance with cognitive engagement control approaches in human–machine collaboration . . . 12

2.3.13 CORBYS cognitive control architecture for robotic follower . . . 13

2.3.14 From intelligent control to cognitive control . . . 13

2.3.15 From Low to High Level Approach to Cognitive Control . . . 13

2.3.16 How to assess team performance in terms of control: a protocol based on cogni-tive systems engineering . . . 14

2.3.17 Learning the dynamic process of inhibition and task switching in robotics cog-nitive control . . . 14

2.3.18 Multivariate Bayesian cognitive modeling for unsupervised quality control of baked pizzas . . . 14

(5)

3 Definici´on y especificaci´on del trabajo 16

3.1 Definici´on . . . 16

3.2 Especificaciones . . . 17

4 Metodolog´ıa del trabajo 18 4.1 Plan de trabajo . . . 18

4.2 B´usqueda de informaci´on . . . 19

4.3 Alternativas de desarrollo . . . 19

5 Trabajo realizado 20 5.1 Aprendizaje . . . 21

5.2 Planificaci´on . . . 23

5.3 Atenci´on . . . 24

5.4 Descripci´on del Resultado Final . . . 24

5.5 Trabajo computacional . . . 26

6 Validaci´on del trabajo 27 6.1 Metodolog´ıa de prueba . . . 27

6.1.1 Modelo del Sistema . . . 27

6.2 Validaci´on de los resultados del trabajo . . . 28

6.2.1 Sintonizaci´on Algoritmo . . . 28

6.2.2 Aplicaci´on al Parque . . . 33

7 Discusi´on 35 8 Conclusiones 37 Referencias 37 A Resumen Ejecutivo 41 B Propuesta inicial 51 B.1 Justificaci´on . . . 51

B.2 Marco Te´orico . . . 51

B.3 Caracterizaci´on del Proyecto . . . 52

B.3.1 Objetivo General: . . . 52

B.3.2 Objetivos Espec´ıficos: . . . 52

B.4 Contexto del proyecto y tratamientos . . . 52

B.5 Entregables . . . 53

B.6 Recursos . . . 53

B.7 Bibliograf´ıa . . . 53

C C´odigo MATLAB 54 C.1 Script Principal . . . 54

C.2 Funci´on Learning . . . 55

(6)

´Indice de figuras

5.1 Modelo dependiente de estado (izq) y Modelo libre de estado (der) [7]. . . 21

6.1 Zona Esquina Suroriental . . . 28

6.2 Zona Camino Occidental . . . 29

6.3 Zona Central . . . 30

6.4 Zona Calle 85 . . . 30

6.5 Desempe˜no Control Cognitivo Zona Camino Occidental . . . 32

6.6 Desempe˜no Control Cognitivo con Ruido Gaussiano . . . 32

6.7 Desempe˜no Control Cognitivo con Ruido Sinusoidal . . . 32

6.8 Desempe˜no Control Cognitivo Zona Calle 85. . . 33

6.9 Desempe˜no Control Cognitivo Zona Esquina Suroriental . . . 33

6.10 Desempe˜no Control Cognitivo Zona Central . . . 34

B.1 Entragables . . . 53

(7)

´Indice de tablas

6.1 Comparaci´on entre Par´ametros de Cognitive Control . . . 31

7.1 Consumo de Energ´ıa Diario del Parque Le´on de Greiff usando Control Cognitivo . . . . 35 7.2 Comparaci´on Control Cognitivo vs. Control Fotocelda . . . 35

(8)

Cap´ıtulo 1

Introducci´

on

1.1 Descripci´

on de la problem´

atica y justificaci´

on del trabajo

Actualmente, los sistemas de control tanto en el ámbito nacional como internacional funcionan bajo condiciones y ambientes predefinidos o predecibles. La robustez del sistema se ve definida y limitada hasta donde llegue la etapa de diseño. Sin embargo, frente a eventualidades no cubiertas por el diseño el sistema tiende a fallar o a no funcionar correctamente. Un claro ejemplo de lo mencionado anteri-ormente se presenta en las fallas en el sistema eléctrico, cuando por un evento no esperado se genera un colapso en el servicio, dejando en manos humanas decisiones complejas en un corto periodo de tiempo, a veces segundos nada más. Por lo tanto, sistemas autónomos, robustos y adaptables son una necesidad urgente para la sociedad. Un sistema capaz de tener en cuenta el estado y relevancia de las caracter´ısticas del ambiente que lo rodea para la toma de acciones, es accesible mediante una técnica de control apropiada.

Con el fin de dar solución a los inconvenientes mencionados, han sido creadas técnicas de control como las redes neuronales [1] y el control difuso [2]. Sin embargo dichas técnicas, a pesar de tener un desempeño y resultados prometedores, requieren de tiempos considerables de entrenamiento lo que limita su aplicación en ciertos sistemas reales. Surge entonces, una propuesta denominada “Cognitive Control” [3], [4], [5], donde se busca que los sistemas de control lleven a cabo caracter´ısticas propias de la cognición. Dichos sistemas deben poder superar los nombrados inconvenientes imprevistos o inalcanzables en el diseño, además de disminuir la interacción humana con dichos sistemas con el fin de minimizar posibles errores.

Con base en lo anterior, se formula un fundamento teórico básico en forma de algoritmo para imple-mentar los conceptos de aprendizaje, planificación y atención, los cuales son parte determinante en la cognición [6]. A fin de usar el control cognitivo en una aplicación que haga ver sus caracter´ısticas (robustez y adaptabilidad), se dirige la atención hacia el sistema de alumbrado público. Esta prob-lemática es de gran interés para el campo de los sistemas de control, puesto que es un servicio vital e irreemplazable para cualquier cuidad. Sin embargo, los sistemas de alumbrado existentes son bastante primitivos, en el hecho que no tienen en cuenta las incidencias del ambiente y en ocasiones, ni siquiera se tiene en cuenta la presencia de luz natural. Aparte, el principal inconveniente radica en que estos sistemas permanecen funcionando tiempos predeterminados a su máxima capacidad, lo que representa un significante gasto de energ´ıa eléctrica lo que repercute en innecesarios costos (e.g. económicos, in-fraestructura y ambientales). Por ende, un sistema de alumbrado que sea capaz de regular sus acciones con el fin de reducir dichos gastos es altamente deseable.

(9)

1.2 Alcance y productos finales

El proyecto presenta un desarrollo conceptual, diseño y simulación de la técnica Cognitive Control, o Control Cognitivo, haciendo énfasis en la caracterización de los componentes de aprendizaje, planifi-cación y atención. Dicho desarrollo se condensa a manera de algoritmo con el objetivo de implementarlo al sistema de alumbrado público del parque León de Greiff de la cuidad de Bogotá D.C.. El desempeño del producto es evaluado mediante simulación para obtener resultados de la estrategia, el cumplimiento de los requerimientos normativos y posteriormente, mediante la comparación con la técnica de control actualmente implementada en el parque. De acuerdo a los datos obtenidos se discute acerca de la conveniencia, ventajas y desventajas económicas y ambientales de la implementación del producto.

1.3 Objetivos

1.3.1 Objetivo General

Desarrollar una base bibliográfica dotada de una fundamentación teórica suficiente para la comprensión, desarrollo y aplicación del control cognitivo.

1.3.2 Objetivos Espec´ıficos

• Comprobar la viabilidad de la incorporación de propiedades usualmente asociadas con los proce-sos de cognición, como la atención, la planificación y el aprendizaje, en el ejercicio de la ingenier´ıa de control.

• Buscar potenciales aplicaciones de las t´ecnicas del control cognitivo en procesos, problemas, sistemas y/o industria, principalmente en el contexto local.

• Implementar un ejemplo que ilustre el trabajo metodol´ogico desarrollado.

• Identificar posibles aportes relevantes al desarrollo del control cognitivo por parte de disciplinas transversales.

(10)

Cap´ıtulo 2

Marco te´

orico, conceptual e

hist´

orico

Para lograr los objetivos propuestos, se recurre a algoritmos de aprendizaje y programación dinámica con el fin de dar forma al términocognitivode la técnica de control. Además, puesto que la aplicación y simulación se dirige a sistemas locales de iluminación pública se recurre a las normas, definiciones y prácticas pertinentes de este campo. Por último, se lleva a cabo una profunda revisión del estado y contexto que se le ha dado al Control Cognitivo a lo largo de los últimos años.

2.1 Marco Te´

orico

2.1.1 Programaci´

on Din´

amica de Bellman

De acuerdo a como lo presenta Simon Haykin en [7], el algoritmo de programación dinámica, también conocido como la Ecuación de Bellman [8], es un algoritmo convergente y óptimo [9], [10] el cual busca maximizar una función objetivo a largo plazo. Dicha función se define a lo largo del tiempo en términos de recompensas inmediatas. En su forma básica, la programación dinámica de Bellman se aplica a problemas de horizonte finito. Sin embargo, desde una perspectiva anal´ıtica, la aproximación matemática es usada en problemas con horizonte infinito, con recompensas definidas sobre un número infinito de ciclos.

En programación dinámica, un sistema se define por su conjunto de estadosSy su conjunto de acciones A. En una base de ciclo a ciclo, el sistema tiene una transición del estados_∈S en el ciclokal estado s0 _∈S en el ciclok+ 1 como resultado de la accióna_∈A. Dicha transición genera una recompensa rk+1∈R. La función objetivo se define en términos del estado y de la acción por la fórmula:

J(s, a) =Eπ[rk+1+γrk+2+γ2rk+3+· · · |sk =s, ak=a] (2.1)

donde,πk(s, a) =P[ak+1=a|sk=s, ak =a] es la pol´ıtica de selecci´on de acciones cuando el sistema se

encuentra en el estadosyγes un factor positivo menor a 1 que disminuye el efecto de las recompensas futuras. Cabe aclarar que Pdenota una distribuci´on de probabilidad y Eπ denota el valor esperado

respecto a la pol´ıticaπ. La función objetivo obedece la forma de programación dinámica de la siguiente manera:

J(s, a) = X

s0_∈_S

T_ssa0[Ra_ss0+γ

X

a0_∈_A

πk(s, a0)J(s0, a0)] (2.2)

donde la probabilidad de transici´onTa

ss0 y la recompensa inmediata esperadaRa_ss0 son defnidas por las

ecuaciones:

(11)

Ta

ss0 =_P[sk+1=s0|sk=s, ak=a],

Ra

ss0 =_Eπ[rk+1|sk+1=s0, sk =s, ak =a] (2.3)

La función objetivo óptima, representada como J∗, se obtiene al maximizar la suma de todos los términos existentes en 2.2 con respecto a una acción a, as´ı para todas las acciones existentes. La implementación a forma a forma sistemática se presenta en el Algoritmo 1.

Algorithm 1Actualización de la Función Objetivo para Programación Dinámica

1: Variables:

2: J:=funci´on objetivo

3: γ:=factor de descuento,γ_∈[0,1)

4: α:=par´ametro de aprendizaje,α >0

5: Entradas: 6: Ta

ss0:=probabilidad de transici´on

7: Ra

ss0:=recompensa esperada

8: π:=pol´ıtica de selecci´on

9: Actualizaci´on:

10: fortodos los estadoss_∈S do

11: fortodas las accionesa_∈A do

12: J(s, a)+

←J(s, a) +αP_s0_∈_ST_ssa0[Ra_ss0+γ

P

a0_∈_Aπk(s, a0)J(s0, a0)−J(s, a)

13: end for

14: end for

Sin embargo, el resultado final de esta maximizaci´on es un crecimiento exponencial en la complejidad computacional, conocido comocurse of dminsionality (maldici´on de la dimensionalidad).

2.1.2 Q-Learning

Es una técnica basada en la metodolog´ıa de aprendizaje por refuerzo [10]. El objetivo es lograr que el agente resuelva o aprenda algo, únicamente con la información que obtiene de forma sensorial del ambiente [11]. El refuerzo se denota como un sistema de recompensas, positivas o castigos, por sobre las acciones que el agente aplique, basándose en los resultados consecuentes.

A diferencia de un aprendizaje supervisado [1], [8], el agente no tiene ning´un tipo de conocimiento previo sobre como responde el ambiente en el que este se encuentra. Por ende, con el fin se reunir la informaci´on necesaria para interactuar de manera funcional con el ambiente se recurren a cuatro aspectos componentes del Q-Learning.

• Ambiente: Corresponde al sistema que rodea y afecta al agente. Dicho sistema del ambiente posee un estado, el cual cambia dependiendo de las acciones que se lleven a cabo en este. El agente recibe la información proveniente del estado del ambiente con el fin de evaluar el impacto de las acciones que se aplican. Dicha información pueden ser variables de distinta naturaleza, e.g. temperatura, radiación, presión, entre otras.

• Función de Refuerzo: Es una función escalar la cual relaciona de manera numérica la retroal-imentación del ambiente y la acción aplicada. Dicha función se traduce en las recompensas o castigos que obtiene el agente.

• Función de Valor: De igual manera que en la programación dinámica, es la función a maxi-mizar para obtener los resultados más funcionales a partir de las acciones que se tomen sobre el ambiente. Funciona mediante obtener una relación entre estados y acciones, de tal forma que se llegue a conocer que acción se debe tomar en cada estado.

(12)

• Pol´ıtica: Corresponde al componente encargado de seleccionar las acciones a tomar de acuerdo al estado percibido del ambiente. De cierta forma, representa como es la conducta del agente dada una situaci´on.

Recursivamente, el objetivo de la técnica es encontrar una pol´ıtica óptimaπ_∗, la cual indique la mejor acción a tomar para cada estado en el que pueda encontrarse el agente, con el fin de cumplir un objetivo espec´ıfico. Lo anterior, se encuentra en concordancia con lo enunciado de pólitca para la programación dinámica.

El algoritmo Q-Learning, genera una relación numérica entre los estados posibles y las acciones que es capaz de tomar. Dichos valores se conocen como Q-valores. Dichos valores se traducen de forma matricial con los estados correspondiendo a las filas y las acciones a las columnas. Por lo tanto, para cada estado existe un Q-valor que lo asocia con cada acción posible.

A forma de implementación, lo primero es la inicialización de estos valores, la cual puede ser preferi-blemente cero debido a temas de convergencia y desempeño del algoritmo [11]. La obtención de los Q-valores se lleva a cabo mediante la función de valor, también conocida como la Q-función, la cual se traduce en la acción a tomar. Con la ejecución de cada acción, los Q-valores respectivos a la misma y al estado correspondiente son actualizados. La función de actualización del algoritmo es la sigiuente:

Q(s, a)+₌_{Q(s, a) +}_α(R₊_γmaxQ(s0_{, a}0₎

−Q(s, a)) (2.4) Cabe recalcar que la gran similitud de 2.4 con el Algoritmo 1, es debido a que le objetivo es el mismo: actualizar una función de valor. Sin embargo, en el caso de 2.4 se hace explicita la recursividad del Q-valor máximo, donde dicho parámetro reemplaza aP_a0_∈_Aπk(s, a0)J(s0, a0) en el Algoritmo 1. El

parámetro αrepresenta la taza de aprendizaje, la cual determina la magnitud de la influencia de la nueva información sobre la información previa. Un factor de 0 repercute en que el agente no aprenda nada, mientras que un valor de 1 significa que el agente tendrá únicamente la información reciente en consideración, un valor negativo es contraproducente. El parámetro γ corresponde al factor de descuento (al igual que en programación dinámica), este determina la importancia de las recompensas futuras. Un factor de 0 genera que el agente tenga visión a corto plazo, i.e. tiene únicamente en cuenta las recompensas presentes, mientras que un factor cercano a 1 produce un agente en constante búsqueda de altas recompensas a largo plazo, para valores distintos al intervalo anterior se produce divergencia del algoritmo [12]. El factor R simboliza la recompensa o retroalimentación obtenida por la aplicación de la acción en el estado pertinente.

2.1.3 C´

alculo de Iluminancia seg´

un el M´

etodo de los L´

umenes

Con el fin de aplicar el control cognitivo a un sistema con problemática en el marco local como lo es la iluminación pública, se hace necesario conocer el método de calculo deiluminanciade una zona pública determinada. Para tal objetivo, existen múltiples métodos de cálculo de la calidad de iluminación de una zona. Los métodos var´ıan mayormente debido a si la zona a iluminar se encuentra en el exterior o en el interior. En este caso, la atención se dirige a los métodos pertinentes a la iluminación exterior, entre los que se encuentra el método de europeo de los 9 puntos [13] (usado principalmente para ilu-minación de v´ıas y carreteras), el método punto a punto [14] (da a conocer los valores de iluminancia en puntos concretos) y, para este caso de aplicación en espec´ıfico, se tiene el método de los lúmenes [15] (las razones del porqué se escogió este método se presentan en la sección de trabajo realizado).

El método tiene por objetivo conseguir un nivel de iluminación apropiado para un determinado espacio. Los resultados arrojados por el método corresponden concretamente al nivel medio de iluminanciaEm

sobre un área de una instalación de alumbrado general. Dicha iluminancia media es proporcionada con un error de_±5% lo que repercute en información sobre la necesidad lum´ınica del área en cuestión. El método se basa entonces en el cálculo de la siguiente ecuación [15]:

(13)

Φ = Em·S Cu

(2.5)

donde, Φ es flujo luminoso proporcionado por la fuente luminosa, en este caso, las luminarias de la zona, se encuentra en l´umenes (lm). Como se mencion´o anteriormente, Em corresponde al nivel

de iluminanc´ıa medio, su unidad es el l´ux (lx). El ´area a iluminar se representa con S, la unidad a expresarla es m2 _{debido a que [lm/m}2_{] = [lx]. Por ´}_{ultimo, el factor adimensional} _C

u denota al

coeficiente de utilizaci´on, el cual relaciona el flujo luminoso recibido por un cuerpo, el flujo emitido por la fuente luminosa, y la distancia entre el cuerpo y la fuente. Cabe aclarar que tanto el factor de utilizaci´on como el flujo luminoso emitido, son datos proporcionados por el fabricante de la luminaria.

2.2 Marco Conceptual

Con fin de dar forma y sentido al trabajo realizado, se tienen en cuenta las definiciones pertinentes al mismo. Las definiciones se divididas en aquellas correspondientes a la cognición, y en aquellas relacionadas a la iluminación pública.

2.2.1 Conceptos de Cognici´

on

Las definiciones presentadas buscan establecer el contexto sobre el cual se basan los planteamientos te´oricos de control cognitivo que se desarrollan m´as adelante.

• Cognición: Palabra originaria del antiguo sustantivo griegoγνωσζ que significaconocimiento y del verboγνωσκωque significaaprender.En este proyecto se entiende por cognición al paradigma llevado a cabo generalmente en el cerebro de los mam´ıferos de forma ya sea consciente o incon-sciente, basado en como se interactúa con el mundo exterior, en la solución de problemas y en la consecución y cumplimiento de obligaciones. Los componentes principales de la cognición son los ciclos de percepción y acción, memoria, atención, inteligencia, aprendizaje, planificación y lenguaje. En este proyecto se hace énfasis en los elementos de aprendizaje, planificación y atención.

• Aprendizaje: Proceso por el cual se obtienen habilidades o conocimiento, con base en experi-encias previas o por enseñanzas predefinidas. En este contexto, se enfoca al aprendizaje como la información obtenida, y almacenada, por una especie de retroalimentación lograda a partir de la interacción con el ambiente.

• Planificación: Uso de conocimiento previo respecto a algún fenómeno de interés con el fin de predecir el comportamiento de dicho fenómeno, y con base a esto decidir sobre las acciones a tomar o sobre los riesgos a correr. En otras palabras, sopesar las consecuencias de las posibles acciones a tomar antes de llevarlas a cabo.

• Atención: Se refiere a que tan activamente se procesa la información que se percibe del ambiente. Sin embargo, en este contexto, el concepto se enfoca a que tanta importancia se le da a los conocimientos previamente adquiridos por sobre la realización de nuevas acciones con el fin de obtener información nueva.

2.2.2 Conceptos de Alumbrado P´

ublico

Con base en el Reglamento Técnico de Iluminación y Alumbrado Público (RETILAP) de Ministerio de Minas y Energ´ıa de Colombia [13], se enuncian las siguientes definiciones. Dichas definiciones son pertinentes para el desarrollo e interpretación del trabajo realizado en el proyecto.

(14)

• Alcance: Caracter´ıstica de una luminaria que indica la extensi´on que alcanza la luz en la direcci´on longitudinal del camino. Las luminarias se clasifican en: de alcance corto, medio o largo.

• Bombilla o Lámpara: Término genérico para denominar una fuente de luz fabricada artifi-cialmente.

• Coeficiente de Utilización: Relación entre el flujo luminoso incidente sobre una superficie a iluminar (flujo útil) y el flujo total emitido por una luminaria. Usualmente aplicado en referencia a sistemas de iluminación pública.

• Fotocontrol: Dispositivo utilizado, normalmente, para conectar y desconectar en forma au-tomática luminarias de alumbrado público en función de la variación del nivel luminoso (at-mosférico).

• Flujo Luminoso: Cantidad de luz emitida por una fuente luminosa en todas las direcciones por unidad de tiempo. Su unidad es el l´umen (lm)

• Iluminancia: Densidad del flujo luminoso que incide sobre una superficie. La unidad de ilumi-nancia es el lux (lx).

• Iluminancia Promedio Horizontal Mantenida: Valor por debajo del cual no debe descender la iluminancia promedio en el ´area especificada.

2.3 Marco Hist´

orico

La técnica de Control Cognitivo tiene un desarrollo y entendimiento puede decirse prematuro. A lo largo de los últimos años, se ha prestado especial atención a la aplicación de comportamientos bio-inspirados a sistemas de control. Sin embargo, a diferencia de técnicas como las redes neuronales artificiales [1] o el control difuso [2], el control cognitivo no tiene una definición o concepto fijo y suficiente sobre el cual basarse para llevar a cabo desarrollo de sistemas. Por tales motivos, a con-tinuación se muestra los distintos controles cognitivos que han sido desarrollados durante los últimos años en la literatura especializada. Esto con el fin de plantear una base para el control cognitivo a desarrollar, mediante el análisis de las principales caracter´ısticas de cada referencia encontrada. Las etapas de comparación, evaluación y aplicación de los aspectos encontrados se encuentran desarrollas en la sección de trabajo realizado, puesto que el objetivo del proyecto es obtener una base bibliográfica sobre la cual basarse para aplicar Control Cognitivo.

2.3.1 A Bottom-Up Approach for Cognitive Control

El texto [16] argumenta que las habilidades cognitivas para la planificación requieren de representa-ciones del sujeto mismo y del ambiente que lo rodea. As´ı, el enfoque se dirige en una aproximación de Verschure [17]: “El sistema de control se construye de abajo hacia arriba, creciendo hacia niveles más altos y hacia tareas más complejas”, i.e. una estructura por capas.

El concepto de control cognitivo es: la idea de simulación mental. La simulación mental ve la plan-ificación como el manejo de pruebas, i.e. esta noción de intentar un movimiento mediante simularlo mentalmente sin llevar a cabo la acción f´ısica. Lo anterior, depende fuertemente en el conocimiento de un modelo interno. Las caráteristicas son:

• Construir un modelo interno del propio sistema o cuerpo. El anterior puede ser luego usado como base para expandirse hacia modelos del ambiente.

• Dirigir el proceso de usar comportamientos aprendidos para controlar el cuerpo o modular estos comportamientos en el control del cuerpo o del modelo interno.

(15)

• Gestionar el desacople entre el cuerpo y las estructuras de control, con el fin de llevar a cabo la simulaci´on.

• Llevar a cabo la invención de nuevos modelos de simulación y tomar la decisión de cuando construir modelos nuevos.

A groso modo, la implementación de la idea de memoria se compone de varios modelos de situación que consisten en redes neuronales. Además, la selección de las conexiones es aleatoria, de esta manera introduciendo una especie de aspecto evolutivo. As´ı, se propone una estructura de memoria que usa neuronas análogas sencillas y se concentra en el aspecto de cuantas situaciones diferentes pueden ser almacenadas. La estructura es pensada con el fin de representar un concepto más general de como los recuerdos pueden ser organizados. Puesto que la aproximación basada en comportamiento depende bastante en la encarnación o personificación, se usa como ejemplo un caminador hexápodo, el cual posee varios grados de libertad.

Se investiga como el controlador reactivo para el caminador hexápodo puede ser mejorado mediante el uso de un modelo interno del cuerpo. Donde este modelo puede ser usado en el control cognitivo en el sentido de la planificación. Sin embargo, existe el problema de que para encontrar una interpretación funcional se tiene un gran número de unidades neuronales junto con un gran número de grados de libertad no especificados derivando en que los modelos resultantes no son adecuados para el control de sistemas autónomos.

No obstante, una restricción cr´ıtica para la arquitectura implementada es la utilización de estructuras basadas en neuronas. Por consiguiente, se intenta suavizar el inconveniente con la introducción de varios tipos de red neuronal, las cuales pueden ser entrenadas con simples reglas de aprendizaje. Como objetivo, se debe llegar a un sistema con la habilidad de almacenar información, encontrar la infor-mación en la memoria, recuperar inforinfor-mación espec´ıfica y ser capaz de planificar a futuro.

A pesar de lo anterior, surgen interrogantes acerca de los métodos de sintonización de los pesos en las redes neuronales, como estos pesos pueden ser aprendidos, como se interconectan modelos de situación relacionados de un mismo contexto. Para la corrección y aclaración de dichos inconvenientes la capacidad de planificación debe acarrear a invenciones comportamientos robustos. El texto sugiere usar una modelo manipulable interno de la red neuronal, dando lugar a mayor complejidad y a un sistema de encarnación o personificación de segundo orden.

2.3.2 Cognitive control architecture for an artificial creature using episodic

memory

El texto [18] describe una arquitectura de control cognitivo con la incorporación de memoria episódica para la criatura artificial RITY. RITY es software que compone un sistema robótico ubicuo. Define la memoria episódica como una estructura escalable que almacena las capturas instantáneas realizadas perceptualmente de episodios a medida que la experiencia de RITY aumenta. Además, el sistema utiliza un mapa de espacio variante temporal para almacenar información espacial y una memoria de procedimiento de alto nivel usando máquinas de estado finito. El sistema es diseñado para permitir a RITY ser cognitivo al aproximarse a la selección de tareas a través del proceso dual de aprendizaje por experiencia y por espacio. Los módulos componentes para llevar a cabo dicha cognición son: módulo de percepción, de estado interno, de selección de comportamiento, de aprendizaje interactivo, de memoria y módulo motriz.

Experimentos sobre el comportamiento del software, con la inclusión de la cognición, con respecto a la finalización de tareas y el mantenimiento de un estado interno ideal muestran que la criatura artificial de mejorar su desempeño a lo que su experiencia aumenta.

(16)

La focalización del texto es darle a RITY la posibilidad de lidiar con las incertidumbres del ambiente. As´ı, se recurre a la memoria permitir a un sistema aprender del ambiente y de las experiencias pasadas. Al añadir el concepto de episódico, se permite la inclusión de registros de secuencias temporales de eventos espec´ıficos ocurridos al agente cognitivo. La arquitectura se compone de los módulos nom-brados anteriormente, sin embargo se hace un énfasis especial en el módulo de memoria para hacerlo escalable, modular y que exhiba capacidades cognitivas.

Sin embargo, la aplicación de la memoria episódica acarrea una fuerte carga computacional, la cual es cr´ıtica en aplicaciones en tiempo real. Se hace necesario un gran espacio de almacenamiento para no solo guardar capturas sino para identificar la secuencia y relación que esta tiene con las demás capturas. Por último, el texto tan solo expone el caso y los prometedores resultados del mismo, en un sistema netamente virtual, y se limita a dar arquitecturas y esquemas generales de la implementación.

2.3.3 An introduction of cognition information: From form aspect to

se-mantic aspect

Primero, [19] se enfoca en el componente de la cognición que es la lingü´ıstica, i.e. la intercomunicación entre los distintos entes cognitivos para construir una cognición distribuida e intercomunicada. As´ı entonces, la teor´ıa de la información clásica se enfoca en la forma de la comunicación sin tener en cuenta el aspecto semántico, y la causa es la falta de habilidad de cognición por las limitaciones de instrumentos matemáticos. Por lo tanto, el texto define la información de cognición como la información mutua semántica obtenida en un proceso de cognición semántico. Para lograr lo anterior se expone la necesidad de proveer a las maquinas con la habilidad de deducir la semántica deseada de la gran cantidad de formas en las que puede llegar (tal como datos o mensajes) y as´ı poder trascender la teor´ıa de probabilidad y la estad´ıstica para medir la información. En conclusión, el art´ıculo expone los obstáculos con la teor´ıa de la información actual, señala la arquitectura para implementar una cognición semántica en la comunicación, todo lo anterior con el fin de lograr un servicio que facilite la toma de decisiones.

2.3.4 Autonomic fault management based on cognitive control loops

El art´ıculo [20] presenta una aproximación del manejo de fallas con base en lazos de control cogni-tivo con el fin de mantener gestión autónoma de la red para internet. Concibe el lazo de control cognitivo como el elemento que determina la urgencia de las alarmas de la red, que procesa dichas alarmas urgentes de manera más rápida y que luego determina las causas de dichos problemas basado en aprendizaje y razonamiento.

Define el modelo cognitivo como un conjunto de procesos, lo cuales interactúan de acuerdo a tres capas: la capa reactiva, deliberativa y reflexiva. Supone que todos los procesos usan una máquina de estado finito y un razonador, as´ı el sistema puede reconocer cuando un evento o un conjunto de eventos han ocurrido con anterioridad. Dichos resultados se almacenan en una memoria de corto plazo. El mecan-ismo reactivo habilita de la porciones computacionalmente intensivas del lazo de control para que ser evitadas, produciendo as´ı dos atajos denominados alta prioridad y urgente. El proceso deliberativo recorre la secuencia de observar, normalizar, comparar, planificar, decidir y actuar. Lo anterior, usa memoria de largo plazo para almacenar como se lograr los objetivos con base en un contexto espec´ıfico. El proceso reflexivo, examina las conclusiones llevadas a cabo por el conjunto de procesos deliberativos usados, y trata de predecir el mejor conjunto de acciones que maximizaran las metas perseguidas por el sistema. Los procesos usan análisis semántico para entender el por qué un contexto particular fue ingresado y por qué un cambio en el contexto ayuda a predecir cómo cambiar contextos más fácil y eficientemente en el futuro. Estos resultados también son almacenados en la memoria a largo plazo, tal que el sistema entienda mejor los cambios contextuales y llegue a un razonamiento para ayudar a

(17)

la depuraci´on.

En si el art´ıculo, muestra una manera eficiente de gestionar y manejar las fallas de un sistema de comunicaciones, e.g. el denominado internet futuro. Sin embargo, la cognición se basa ampliamente en la utilización eficiente de la memoria de eventos o contextos pasados, a lo que denomina razon-amiento. Además, su implementación es altamente influenciada hacia las aplicaciones en redes de comunicaciones. Pero, el manejo de fallas que sugiere puede ser útil para aplicaciones fuera de las comunicaciones. No sale del paradigma de que para que el sistema aprenda tiene que primero ocurrir los problemas y ser solucionados con anterioridad, lo cual le da poca robustez.

2.3.5 Cognitive Computation: A case study in cognitive control of

au-tonomous systems and some future directions

El art´ıculo [21] define los alcances de la cognición como la capacidad de pensar por s´ı mismo, tomar decisiones sobre acciones en una variedad de formas, ser flexible, robusto, adaptativo y ser capaz de aprender de tanto experiencias previas propias como de las de semejantes. El alcance del texto llega a proponer una metodolog´ıa de control cognitivo multimodal, i.e. que lo compone más de uno de los elementos mencionados anteriormente, donde se obtiene un diagrama en bloques general y culmina con una amplia sección de sugerencias para trabajo futuro. Sin embargo, pruebas, simulaciones y algoritmos no se encuentran presentes expl´ıcitamente.

La metodolog´ıa consiste en una analog´ıa con los ganglios basales. En el cerebro vertebrado, la se-lección de acciones, se supone, es mediada por un conjunto de estructuras sub corticales conocidas como los ganglios basales. Estos ganglios actúan como un interruptor central, reciben peticiones de accionamiento para la expresión conductual de subsistemas a los largo del cerebro, y luego selectiva-mente permite que estos tomen control de sus recursos cognitivos. La fuerza de la petición reside en su nivel general de señal o su prominencia. Además, las peticiones son más o menos escuchadas por los ganglios de acuerdo a que tan bien los perfiles de la actividad en los aferentes de las neuronas de entrada de los ganglios coincidan con los patrones correspondientes de los pesos sinápticos. As´ı, una coincidencia de plantilla entre ambos resultará en una acción del ganglio que es sensible a la petición de accionamiento. Luego, sale de las compuertas del ganglio la selección de acciones por la remoción selectiva de la inhibición. Las acciones son seleccionadas cuando los procesos competidores entre los canales de acción en el ganglio resultan en un levantamiento de la inhibición desde el subsistema obje-tivo. Una petición se entonces exitosa si su prominencia es lo suficientemente alta, y si hay una entrada de canal de acción receptivo en el ganglio. En el marco del control cognitivo, estas ideas básicas son usadas para suavizar la selección entre controladores convencionales.

Introduce el concepto de procesamiento controlado y procesamiento automático. El primero está bajo el control directo y activo del sujeto, es lento y deliberativo, y requiere atención serial a las sub tareas. El segundo, por otro lado, requiere menos esfuerzo, es manejado ampliamente por el est´ımulo actual y puede involucrar la ejecución de grandes pedazos de comportamiento. Siempre, un ser cognitivo se encuentra cambiando entre estos dos modos con base en un monitoreo del error. Para el caso de un veh´ıculo autónomo, si una trayectoria ha sido bien aprendida, este será capaz de andar con solo un simple camino planeado especificado una vez con pocos puntos. Si no, el camino tendrá que ser divido en varios sub trayectorias o pedazos. La idea es monitorear los errores en el andar y cambiar a hori-zontes de movimiento más cortos si es necesario. Si los errores son pocos, el horizonte de planificación es alargado según corresponda.

La planificación de movimiento, para una aplicación de seguir la trayectoria, fue realizada usando planificación diferencial de trayectoria basada en llanura y una aproximación polinomial para lograr una trayectoria de espacio de estados factible, dados los estados inicial, final e intermedio. El contro-lador cognitivo basado en ganglios basales propuesto es visto para superar un controcontro-lador no lineal convencional. En conclusión, la metodolog´ıa basada en ganglios basales puede ser adaptada para una

(18)

mayor cantidad de aplicaciones en tiempo real. Sin embargo, una arquitectura m´as detallada y los algoritmos pertinentes tienen que ser formulados o buscados, puesto que el art´ıculo no los muestra.

2.3.6 Cognitive control architecture for autonomous marine vehicles

El art´ıculo [22] propone una arquitectura de control inteligente (ICA) para hacer posible colaboración múltiple entre veh´ıculos marinos para llevar a cabo misiones de intervención submarinas de manera autónoma. El fundamento de la arquitectura de la ICA yace en la flexibilidad de la computación orientada al servicio. Una base de datos basada en conocimiento captura las habilidades del operador, las capacidades de la plataforma y los cambios en el ambiente. La información capturada permite a los agentes razonadores planificar misiones basadas en la situación actual. Se busca como objetivo diseñar y construir un sistema con la capacidad de lidiar con fallas internas y cambios en el ambiente, también como su impacto en los resultados de los sensores usados en la fase de planificación.

Cada módulo vehicular provee servicios básicos los cuales anuncian sus capacidades al sistema. El servicio también publica actualizaciones regulares de su estado actual. En adición, se tiene la previa-mente explicada base de datos basada en conocimientos. Cada veh´ıculo está especializado en diferentes disciplinas, y provee diferentes capacidades disponibles como servicios de la plataforma para el sistema en general.

En general, el texto se adjudica a tener una base de datos previa sobre la cual se basa la cognición de varios agentes. Dichos agentes tienen por objetivo trabajar juntos de manera efectiva y óptima para mejorar la realización de ciertas tareas espec´ıficas. La arquitectura se dirige a coordinar espec´ıficamente a un grupo variado de elementos o agentes. La ICA se basa en las caracter´ısticas de servicio, i.e. descubrimiento de las capacidades de un sistema, reconfiguración dinámica del sistema e interacción desacoplada entre aplicaciones.

2.3.7 Cognitive control for robot task execution

Para mejorar el desempeño de la inteligencia artificial (AI) de un robot humanoide ISAC, se adaptan habilidades cognitivas humanas para la ejecución de tareas y el control del robot [23]. En vez de usar conocimiento pre-programado tal como en sistemas basados en reglas, el robot adquiere su conocimiento a través del aprendizaje y la experiencia pasada. El conocimiento y la experiencia son almacenados dentro de estructuras de memoria y son recobrados durante la ejecución de las tareas. El control cognitivo es aplicado al robot usando un mecanismo de control llamado agente ejecutivo central CEA junto con un área para almacenamiento temporal de información espec´ıfica para la tarea denominado sistema de memoria de trabajo WMS. El CEA selecciona apropiadamente acciones para la ejecución de una tarea basado en experiencias pasadas. La emoción es también utilizada como retroalimentación del sistema y puede también ser usada como selecciones de acción parcial. El robot e capaz de adaptar su conocimiento aprendido, parcializado por la emoción, para ayudar a la toma de decisiones en situaciones conflictivas.

2.3.8 Cognitive control in cognitive robotics: Attentional executive control

En [24] se presenta una arquitectura h´ıbrida de control sobre el nivel de atención, donde mecanismos de atención son usados en un diferente nivel de abstracción. Se explora un modelo de atención ejecutiva basado en frecuencia para regular y coordinar comportamientos reactivos, monitoreo de ejecución y planificación dinámica. El sistema ejecutivo supervisa las ejecuciones de comportamiento e integra un control de arriba hacia abajo adaptando su latencia de sentir planificar y actuar hacia el nivel de activación/excitación conductual. Además, la duración del ciclo de sentir-planificar-actuar regula la longitud de horizonte de planificación. Esto permite adaptar la deliberación y reacción a un estado de atención del sistema a través de la ejecución. En suma, el sistema acopla la cognición bajo la atención

(19)

dedicada a los sensores del ambiente. Y cuantifica la atenci´on como la frecuencia con la cual actualiza el dato de entrada de un sensor en espec´ıfico.

2.3.9 Cognitive control initiative

El texto [3] funciona como un desarrollo conceptual de la idea del control cognitivo, da pautas sobre el potencial de la metodolog´ıa más no propone una arquitectura para su implementación. Inicia dando una definición general respecto del control cognitivo. Saca a colación una discusión con temas sobre la modelación de lo consciente, desarrollo de lo consciente e implicaciones para con la tecnolog´ıa de control. Enumera luego las caracter´ısticas generales del control cognitivo, haciendo claro énfasis en su papel en procesos con ambientes altamente variables. Concluye diciendo que el control cognitivo es una propuesta para la aplicación sistemática de los elementos de esta clasificación para solucionar problemas prácticos de control en donde hay pocas posibilidades de obtener modelos completos. Donde también existan limitadas posibilidades de observación y medición de variables y además limitación en la realización de acciones (actuadores).

2.3.10 Cognitive control of quadrocopter using supervisor

En el art´ıculo [25] se presenta el modelo matemático de un cuadri-cóptero, junto con una solución de supervisor para la planificación de ruta para cubrir un área definida. Este supervisor es capaz de optimizar y recalibrar la ruta en caso de eventos inesperados durante el vuelo. Presenta un algoritmo para sobrellevar las perturbaciones del ambiente de una manera matemática e implementada a través de SIMULINK. Muestra como el veh´ıculo es capaz de seguir una trayectoria y crear un camino para cubrir un área determinada.Sin embargo, el texto hace alusión a los cognitivo con el hecho de superar perturbaciones. Pero dichas perturbaciones las supera con un PD convencional, una red neuronal, y un escasamente explicado control genético cognitivo.

2.3.11 Cognitive supervision and control of robotic inspection-intervention

system using qualitative spatio-temporal representation and

reason-ing

En el art´ıculo [26] se muestra un sistema de intervención e inspección robótica de control y supervisión cognitivos. Se tiene como contribución un prototipo de MSAS (sistema de asistencia espacial móvil) que es capaz de proveer una representación cualitativa del ambiente interior. Dicha representación es usada para un razonamiento cualitativo llevado a cabo por un modelo cognitivo de un supervisor humano para prevenir una crisis en el sistema. Un modelo semántico es construido en un ambiente interno desconocido basado en las observaciones del robot (MSAS).

La cognición en el sistema consta de simular y entrenar un robot para que sea capaz de reemplazar a un supervisor humano. Con el tal fin se desarrolla un mapa cognitivo que sirve de gu´ıa para las decisiones tomadas por el robot. Se propone una jerarquización de tres capaz para distribuir la robótica cognitiva del sistema. El pilar de la cognición para este art´ıculo se encuentra en un buen manejo y captación en la fase de percepción.

2.3.12 Coordinating cognitive assistance with cognitive engagement

con-trol approaches in human–machine collaboration

El texto [27] se centra en el problema de coordinación de asistencia en un nivel cognitivo, en rubros como cuando dar asistencia y que asistencia proporcionar. Es as´ı que el nivel central de apoyo del texto es una maquina cognitiva que en vez de reemplazar al humano, lo asista. En un simulador de conducción se coordinan varios niveles de intrusión con asistencia cognitiva dentro de una asistencia adaptativa para hacerlos servir a un procesamiento cognitivo humano en una manera apropiada. La

(20)

cognición tiene que ver con la mejora del desempeño de tareas y la impresión subjetiva confirma los beneficios de la coordinación de asistencia cognitiva en interacciones humano máquina, en las cuales el nivel de compromiso cognitivo de los operadores es dinámicamente ajustado para alcanzar la demanda de mantener el desempeño de la tarea.

2.3.13 CORBYS cognitive control architecture for robotic follower

En [28] se presenta la arquitectura de control del robot genérico cognitivo CORBY. El objetivo de dicha arquitectura es la integración de módulos cognitivos de alto nivel para apoyar el funcionamiento del robot en ambientes dinámicos incluyendo la interacción con humanos. El robot con mencionados módulos entiende el estado actual tanto del sistema como del ambiente y del humano. Se usa una aplicación en la que el robot tiene que seguir la trayectoria de un operario humano. La arquitectura se compone de cuatro capas: la capa cognitiva, la capa ejecutiva, la capa de control y la capa f´ısica.

2.3.14 From intelligent control to cognitive control

Aplicación y metodolog´ıa muy similar a [23], fuera del hecho que se trabaja con el mismo robot hu-manoide ISAC. El control [29] se basa en tres memorias distintas. Memoria de corto plazo, almacena información sensorial del ambiente actual. Memoria de largo plazo, almacena comportamientos apren-didos, conocimiento de semántica y experiencias pasadas. Y la memoria de trabajo WMS, encargada de almacenar información espec´ıfica de tareas y coordina el flujo de información a los procesos cogni-tivos durante la ejecución de tareas. Da una pauta interesante sobre la aplicación de memoria de corto plazo en robótica denominada la ego esfera sensorial SES, la cual dota información de espacio y tiempo al robot. Define el control cognitivo como la habilidad de conscientemente manipular pensamientos y comportamientos mediante la atención para lidiar con metas y demandas. El control cognitivo debe ser capaz de cambiar entre el estado de reacción y el estado de deliberación, con el fin de lograr metas en especial bajo situaciones nuevas. El enfoque del control se atribuye a funcionamiento de la memoria de trabajo WMS.

Como experimento se le dan tareas sencillas al brazo del humanoide. Se da primero un nivel de enseñanza a cerca de las tareas. Luego se le dan comandos y un tiempo de aprendizaje. Una vez aprendido se le hace enfrentar al robot situaciones alteradas para probar su conocimiento. Se usa también una abstracción de atención para saber qué información tener en cuenta sin embargo para la elección adecuada de esta información el sistema tiene que explorar todas las posibilidades durante el entrenamiento.

2.3.15 From Low to High Level Approach to Cognitive Control

En [30] se estipula que los elementos básicos de una arquitectura cognitiva son los comportamientos reactivos, activados por est´ımulos externos. El texto presenta una técnica denominada técnica de control de caos débil, la cual es usada para implementar la capa reactiva de un esquema de detección-percepción-acción. Los mecanismos de control son inspirados por la formación de perceptores en el bulbo olfatorio de los conejos.

Todo se centra hacia la implementaci´on de una red de neuronas terminales para un control de nave-gaci´on de un veh´ıculo. Se asume que el robot sabe previamente una respuesta a sensores de bajo nivel y este tiene que aprender la respuesta a est´ımulos de alto nivel. Para el aprendizaje del sistema de Spike-Timing-Dependent-Plasticity STDP.

En detalle, la dinámica del bulbo olfatorio se caracteriza por un atractor caótico de alta dimensión con múltiples alas. Las alas se consideran como rastros de memoria potenciales formados por el apren-dizaje del animal a lo largo de su vida. En la ausencia de un est´ımulo sensorial, el sistema está en un

(21)

modo de una búsqueda iterada de alto nivel, visitando varias alas. En respuesta a un est´ımulo dado, la dinámica del sistema se restringe a oscilaciones en una de las alas. Una vez la entrada es removida, el sistema regresa a el modo iterativo fundamental de alta dimensión.

El papel del caos es fundamental para proveer la sensibilidad y robustez necesarias por un sistema durante la migración de diferentes estados perceptuales. Se tiene que un modelo denominado conjunto K, el cual representa los comportamientos caóticos y oscilatorios. Se implementa el modelo K al control de navegación de agentes autónomos. Los parámetros han sido aprendidos a través de una aproximación de evolución y también, usando estrategias de aprendizaje no supervisado. Se usa un sistema dinámico con caracter´ısticas ajustables que pueden simular funcionalmente la creación de patrones perceptuales. La etapa de percepción se representa por un atractor caótico ajustable, controlado por las señales entrantes de los sensores. En particular, una estrategia de control de retroalimentación de estado es implementada.

2.3.16 How to assess team performance in terms of control: a protocol

based on cognitive systems engineering

Tal y como lo anuncia su nombre, el art´ıculo [31] presenta un protocola para evaluar el desempeño de equipo en términos de control basado en la teor´ıa de sistemas cognitivos. El protocolo cambia el enfoque de la evaluación de equipo de comportamientos buenos o malos hacia la actividad del equipo. Los datos se reúnen a través de la observación y cuestionarios, y es analizada in intervalos de tiempo. A cada intervalo de tiempo se le asigna un modo de control. Con base en cómo cambia el modo de control a lo largo del tiempo, el desempeño del equipo puede ser evaluado. La metodolog´ıa anterior, puede llegar a ser útil al momento de lidiar con redes de elementos controlados por control cognitivo. Con lo anterior en cuenta se puede dar un valor de desempeño a control cognitivo en s´ı, comparándolo con otras metodolog´ıas de control.

2.3.17 Learning the dynamic process of inhibition and task switching in

robotics cognitive control

El texto [32] se centra, en definir como pilar crucial para el control cognitivo, la capacidad de modificar la ejecución de tareas en tiempo real bajo condiciones dadas. Esto significa que hay que decidir cuándo una tarea no puede salir bien y una nueva tarea tiene que ser iniciada. Estas decisiones son inducidas por la entrada de est´ımulos que alertan de eventos que ocurren mientras el robot realiza sus funciones. Para lograr el aprendizaje se usan los conceptos de cambio e inhibición. La cognición se muestra a cómo los conceptos se dan frente a la aparición de est´ımulos, i.e. cambiar de una actividad a otra más competente, o inhibir impulsos inapropiados y reservar la concentración en la tarea actual. En el texto se ilustran un método desarrollado para aprender a cambiar e inhibir, basado en procesos Gaussianos.

2.3.18 Multivariate Bayesian cognitive modeling for unsupervised quality

control of baked pizzas

El art´ıculo [33] describe una metodolog´ıa Bayesiana multivariable desarrollada para un control de calidad no supervisado sobre pizzas basado en atributos de color RGB. Se acude a un censo para determinar el punto de disposición del producto. Se toman fotograf´ıas de las pizzas cada cierto in-tervalo de tiempo y se comparan estad´ısticamente con los datos deseados. La metodolog´ıa permite una cognición hacia como el resultado de la pizza se da a juzgar nuevamente por los participantes del sensor y as´ı se modifican los parámetros de calidad.

Teniendo en cuenta todos las referencias anteriores, se eval´uan y analizan con el fin de que contribuyan al desarrollo final del control cognitivo de este proyecto. Dicho Control de este proyecto se encuentra ampliamente basado en las ideas presentadas por Haykin [7], sin embargo, se hacen modificaciones con

(22)

el fin de adaptar al algoritmo para que se desempeñe de manera funcional en la aplicación y simulación de un sistema de alumbrado público.

(23)

Cap´ıtulo 3

Definici´

on y especificaci´

on del

trabajo

3.1 Definici´

on

Actualmente la mayor´ıa de sistemas de control presentan serios problemas de funcionamiento frente a fenómenos o circunstancias para las cuales no fueron diseñados en su momento de concepción. Dichas limitaciones producen un nivel de riesgo e incertidumbre durante el funcionamiento de los procesos lo que puede poner en riesgo los componentes del sistema, e incluso el bienestar de los operarios humanos.

Los mam´ıferos, en especial los seres humanos, afrontan los nuevos retos y las situaciones no exper-imentadas anteriormente mediante la cognición. Los principales componentes de la cognición son el aprendizaje, planificación y atención [34]. El aprendizaje permite al individuo cognitivo generar ha-bilidades y conocimiento basado en información instruida por el ambiente que rodea al mencionado individuo. Los fenómenos y circunstancias mencionados anteriormente son generados, o tienen lugar, en el ambiente del cual aprende el individuo, as´ı una vez estos ocurren el individuo tiene el potencial de poderlos afrontar funcionalmente la próxima ocasión que se presenten. La planificación puede ser vista como el proceso se usar las habilidades obtenidas, mediante el aprendizaje, para llevar a cabo un análisis de las consecuencias causadas por la hipotética realización de una acción que afecte al ambiente que rodea al individuo. De acuerdo a la información obtenida por las suposiciones en el proceso de planificación se puede llevar, o no, a cabo una acción o procedimiento sobre el ambiente, tal que se minimicen los riesgos asociados. Por último, la atención que en este contexto se le puede dar una definición de razonamiento por sobre como se atiende o interpreta la información que se obtiene del ambiente.

Como se puede ver, el uso de procesos pertenecientes a la cognición tiene el potencial de solventar los inconvenientes de robustez y adaptabilidad presentes en la mayor´ıa de técnicas de control moderno. As´ı, un sistema capaz de aprender, o ser enseñado, otorga un nivel de suficiencia y robustez al proceso y ambiente sobre el cual este se encuentra implementado. El componente de planificación se encargar´ıa de disminuir y mitigar las consecuencias de las decisiones posibles de tomar, en otras palabras, dis-minuye el riesgo de afectación sobre los componentes del sistema. Por último, el razonamiento es una propiedad idónea para lograr una nivel mayor de autonom´ıa en los sistemas.De acuerdo a lo anterior, surge la técnica del Control Cognitivo. Esta técnica busca implementar los componentes mencionados, en un sistema de control tal que se mejoren sus caracter´ısticas y desempeño.

El objetivo del trabajo es tomar como base los avances realizados en el tema de control cognitivo (Marco Histórico), y formalizar una manera recursiva de implementar la cognición, tomando como inspiración

(24)

la forma en cómo funcionan dichas propiedades en el mundo natural. Luego, se implementa el resultado en un sistema real, con altos ´ındices de impredecibilidad del ambiente. Se analizan los resultados en temas de desempeño y en base a una relación económica, para determinar el atractivo de implementar el resultado en la práctica.

3.2 Especificaciones

El resultado obtenido con el trabajo realizado debe cumplir con los siguientes lineamientos:

• Aplicar el resultado sobre un sistema en el marco local donde exista una alta variaci´on de las variables incidentes del ambiente.

• La forma de presentaci´on del resultado deber ser recursiva. De tal manera que pueda ser adapt-able ´optimamente a cualquier sistema de control.

• El desempe˜no y funcionamiento del sistema sobre el cual se aplica el resultado no debe verse afectado frente a variaciones o indeterminaciones que se presenten el ambiente que lo rodea.

• Las normas, leyes y restricciones que est´en presentes en el sistema a probar el resultado, deben ser respetadas con el fin dar al resultado el potencial de ser aplicado en la pr´actica.

• El cargo computacional demandado por el resultado debe ser lo suficientemente funcional, tal que se pueda desempe˜nar en aplicaciones reales cuyo tiempo de muestreo lo permita.

(25)

Cap´ıtulo 4

Metodolog´ıa del trabajo

Teniendo en cuenta los objetivos del proyecto y las especificaciones establecidas, se describe los hitos y etapas de desarrollo del trabajo realizado. Primero, se expone el plan de trabajo llevado a cabo junto con las respectivas etapas. Segundo, se hace una descripción de las principales fuentes de información tenidas en cuenta para construir la base del proyecto. Por último, se presentan las alternativas que se presentaron durante la realización del trabajo.

4.1 Plan de trabajo

El desarrollo del proyecto tuvo un desarrollo en etapas secuenciales. Esto se debe a la reducida base bibliogr´afica que existe al respecto, y al objetivo de exponer la t´ecnica de una forma fundamental.

• Revisión Bibliográfica: Con el objetivo de construir una base bibliográfica de los desarrollos existentes a fines o relacionados con la técnica de Control Cognitivo, se recurre a bases de datos especializadas. Los principales aportes se obtienen de IEEEXplore, Springer Link y Science Direct. El tiempo dedicado a la etapa fue de cuatro semanas, debido a la importancia de conocer los desarrollos existes y extraer lo más útil de cada uno para obtener un producto funcional.

• Construcción Marco Teórico: Una vez obtenida una base de referencias sobre la cual soportar la esencia del Control Cognitivo, se procede a generar una forma sistemática de condensar los puntos en común de lo entendido por Control Cognitivo de manera tal que el producto cumpla con las restricciones establecidas. Dicha forma sistemática derivó en un Control Cognitivo a forma de algoritmo. El proceso de generación del algoritmo tuvo una duración de cuatro semanas.

• Simulación: Una vez obtenido el algoritmo de Control Cognitivo, se procede a buscar una aplicación idónea para probar sus propiedades por medio de simulación. La aplicación elegida fue el sistema de iluminación pública. Dicha aplicación presenta elevadas indeterminaciones y ruido en el ambiente sobre el cual funciona, lo cual puede ser usado para mejorar el desempeño y eficiencia del sistema. Se investigó sobre la información técnica de un parque público, es decir, infraestructura eléctrica, control del parque, y reglamentaciones pertinentes. Además, se puso a prueba el desempeño del algoritmo al variar los parámetros sintonizables presentes en este. Esta etapa tuvo una duración de cuatro semanas.

• Análisis de Resultados: Tomando como base los datos obtenidos por las simulaciones, se lleva a cabo una comparación directa con el funcionamiento del parque en el d´ıa a d´ıa. La comparación se enfoca hacia los elementos de consumo eléctrico y cumplimiento de las normas administrativas. Esta tarea se realizó durante 2 semanas.

(26)

• Detalles, Conclusiones y Documento: Particularidades como pulir el algoritmo, declarar las conclusiones y escribir el documento, tuvieron lugar en las dos ´ultimas semanas de desarrollo del proyecto.

Se mantuvieron reuniones regulares con el asesor para presentar y evaluar el estado de desarrollo del proyecto. Al final de cada reunión se determinaban conjuntamente los pasos a seguir para darle continuidad al proyecto. Se tuvieron entregas puntuales con la presentación del estado del arte, con los primeros resultados de simulación y con la presentación de la información técnica obtenida acerca del sistema de iluminación pública objetivo.

4.2 B´

usqueda de informaci´

on

Como se mencionó anteriormente, se recurre principalmente a bases de datos especializadas en cien-cias e ingenier´ıa donde el pricipal recurso fueron art´ıculos cient´ıficos. La fuente IEEEXplore funcionó como la base principal de referencias para los últimos desarrollos y teor´ıa existente respecto a Control Cognitivo. Mientras que Springer Link y Science Direct, fueron fuentes donde la mayor´ıa de trabajos hac´ıan referencia hacia aplicaciones implementadas con Control Cognitivo.

Además, materias como Análisis de Sistemas de Control y Control Predictivo (MPC) fueron bases de conocimiento indispensables y determinantes al momento de desarrollar al algoritmo de implementación de Control Cognitivo. El modelamiento del sistema a simular, la sintonización de los parámetros del algoritmo y la evaluación del desempeño del resultado fue ampliamente influenciado por la preparación académica obtenida de Análisis de Sistemas de Control. Además, especialmente, lo que concierne al desarrollo de la parte de planificación del algoritmo fue influenciada y guiada por lo instruido en Control Predictivo (MPC).

4.3 Alternativas de desarrollo

Las referencias encontradas y expuestas en el marco histórico de este documento hacen ver la variedad de concepciones e interpretaciones que se tienen en el medio respecto al Control Cognitivo. Además, se muestra la ausencia de trabajos relacionados al Control Cognitivo aplicado a la ingenier´ıa el en marco nacional. As´ı que, de cierta manera se llevó a cabo un análisis de todas las alternativas existentes de Control Cognitivo. De cada alternativa se tomo lo útil para cumplir con los lineamientos propuestos, e.g. relevancia en cuanto a la aplicabilidad a sistemas existentes en el ámbito local, infraestructura necesaria para implementación, entre otras. As´ı que, finalmente se llega a un algoritmo compuesto e influenciado por lo estipulado en el marco histórico.

Sin embargo, en cuanto a la aplicación y su respectiva simulación se encuentra una amplia gama de sistemas de iluminación pública a nivel local, más espec´ıficamente en Bogotá D.C. Desde un comienzo se decide trabajar e implementar el resultado sobre un modelo del Parque de la 93, puesto que la iluminación combinada de edificios alrededor del parque junto con la proveniente de los automóviles circulantes provee un ambiente con altas interferencias lum´ınicas, lo cual crea un entorno propicio para la aplicación de Control Cognitivo. Pero, una vez obtenido un algoritmo de implementación, se recurre a la Unidad Administrativa Especial de Servicios Públicos (UAESP) con el fin de obtener información técnica pertinente para adaptar el Control Cognitivo al sistema y se decide cambiar el sistema objetivo al Parque León de Greiff. Dado que el Parque de la 93 cuenta con luminarias incandescentes, más del 50% de las cuales se encuentra en la parte central del parque (donde no hay incidencia considerable del ambiente) y la cantidad de luminarias es elevada (posteriormente se expone el porqué esto representa un inconveniente) se cambia a la otra alternativa puesto que esta se encuentra dotada de iluminación LED, el número de luminarias es menor, el método de cálculo de iluminancia está bien definido y la mayor´ıa de las zonas del parque se ven alteradas lum´ınicamente por fenómenos externos.

(27)

Cap´ıtulo 5

Trabajo realizado

El objetivo principal del proyecto es generar un algoritmo para la implementación de la técnica de Con-trol Cognitivo y con base a esto obtener un fundamento para el futuro desarrollo de esta técnica. As´ı ppues, se llevó a cabo una profunda revisión bibliográfica con el fin de plantar las bases del proyecto. El resultado fue la consecución de una fuerte base teórica y procedimental a partir de los desarrollos de Simon Haykin [7], [35], [36], [37], [38].

A diferencia de las demás técnicas y concepciones resumidas en la sección de marco histórico donde la mayor´ıa usa modelos preestablecidos del ambiente, usa tablas donde los agentes comparan que tan s´ımil es la situación que están experimentando con los datos de las tablas, se enfocan en la semántica de la comunicación entre agentes, propone topolog´ıas para el control cognitivo mas no desarrollan el concepto, entre otras razones. Los anteriores elementos van en contra de objetivos básicos del proyecto como lo son la robustez frente a cualquier indeterminación no tenida en cuenta en la etapa de diseño, la adaptabilidad del controlador a sistemas y ambientes de toda ´ındole y, sobre todo, la meta de explicar la técnica de manera implementable. Sin embargo, el control cognitivo de Haykin [7] expone la técnica de manera sistemática, y lo hace mediante un algoritmo generalizado. Además, ofrece una explicación minuciosa y concisa de los términos de aprendizaje, planificación y atención.

No obstante, los trabajos de Hakyn están ampliamente dirigidos hacia sistemas de radares [37], [38] y radios cognitivos [36], las cuales son aplicaciones poco desarrolladas en el contexto local. Por ende, fueron necesarios ajustes y reformulaciones para poder implementar el control cognitivo al sistema de iluminación pública del parque León de Greiff. El aspecto más significativo tuvo que ver con lo que Haykin denomina elEstado Entrópico del sistema. Dicho estado hace referencia a la forma de cuantificar la brecha de incertidumbre presente en las mediciones obtenidas por los sensores de las variables del ambiente. As´ı pues, este control cognitivo se enfoca en el paradigma de reducir elestado entrópicodel sistema con el fin de mitigar el riesgo e incertidumbre existentes en el ambiente que rodea, especialmente, a los radares y a los radios. Elestado entrópicose obtiene a partir de lo que él denom-ina como un perceptor basado en funciones de densidad de probabilidad. En otras palabras, Haykin intenta controlar la interpretación que da el sistema a la información de entrada con el fin de disminuir las incertidumbres debidas a las constantes señales de ruido que afectan los sistemas de comunicaciones.

Por lo tanto, se decide cambiar el objetivo de control de Haykin de manera tal que el control cognitivo pueda ser usado en una mayor variedad de aplicaciones de un rango más cotidiano y concerniente al contexto local. Por ende, los lineamientos de aprendizaje, planificación y atención cambian el propósito de reducir el estado entrópico del sistema por el objetivo de llevar el sistema a un estado deseado. Es as´ı como el proyecto dirige el control hacia conducir y mantener el sistema en un estado deseado, velando por reducir la diferencia entre el estado deseado y el estado actual (error), y por la robustez y adaptabilidad frente a fenómenos presentes e inevitables del ambiente. Esto se logra mediante la