Presentado a
LA UNIVERSIDAD DE LOS ANDES
FACULTAD DE INGENIER´IA
DEPARTAMENTO DE INGENIER´IA EL´
ECTRICA Y ELECTR ´
ONICA
Para obtener el t´ıtulo de
INGENIERO ELECTR ´
ONICO
por
Rafael Felipe Sosa P´
erez
FUNDAMENTOS DE CONTROL COGNITIVO APLICADO A
SISTEMAS DE ILUMINACI ´
ON P ´
UBLICA
Sustentado el 09 de Diciembre de 2014 frente al jurado:
Composici´
on del jurado
- Asesor: Nicanor Quijano Silva PhD, Profesor Asociado, Universidad de Los Andes
Agradecimientos
En la vida no ser´ıa nada ni nadie sin los principios que me fueron inculcados. Es por eso que luego de Dios, el mayor agradecimiento y reconocimiento va para mis padres. Quienes fueron los art´ıfices de mis logros, los pilares de mi integridad y los gu´ıas de mis sue˜nos. El apoyo y amor incondicional por parte de ellos ayud´o de manera trascendental el desarrollo no solo de este proyecto, sino de mi vida.
A mis hermanos con quienes compart´ı y aprend´ı tanto en las situaciones placenteras como en las situa-ciones precarias de la vida. El compartir con ellos, con su amor y con su tolerancia me hizo evolucionar d´ıa a d´ıa como persona. Adem´as, a la pareja de ´angeles que Dios puso en mi camino, aquellos que me dieron un hogar y me trataron como uno de los suyos, les reservo un especial, grato y sincero agradecimiento en este espacio
´
Ultimamente, agradezco a mis familiares. Primos, t´ıos, sobrinos y amigos, por aportar con infinitos granitos de arena para mi vida y a quienes espero tambi´en les haya aportado positivamente. Pero el indispensable aporte del t´ıo Daniel merece mi eterno agradecimiento y deuda, donde mi vida no ser´a suficiente tiempo para pagar.
Tabla de contenido
1 Introducci´on 1
1.1 Descripci´on de la problem´atica y justificaci´on del trabajo . . . 1
1.2 Alcance y productos finales . . . 2
1.3 Objetivos . . . 2
1.3.1 Objetivo General . . . 2
1.3.2 Objetivos Espec´ıficos . . . 2
2 Marco te´orico, conceptual e hist´orico 3 2.1 Marco Te´orico . . . 3
2.1.1 Programaci´on Din´amica de Bellman . . . 3
2.1.2 Q-Learning . . . 4
2.1.3 C´alculo de Iluminancia seg´un el M´etodo de los L´umenes . . . 5
2.2 Marco Conceptual . . . 6
2.2.1 Conceptos de Cognici´on . . . 6
2.2.2 Conceptos de Alumbrado P´ublico . . . 6
2.3 Marco Hist´orico . . . 7
2.3.1 A Bottom-Up Approach for Cognitive Control . . . 7
2.3.2 Cognitive control architecture for an artificial creature using episodic memory . 8 2.3.3 An introduction of cognition information: From form aspect to semantic aspect . 9 2.3.4 Autonomic fault management based on cognitive control loops . . . 9
2.3.5 Cognitive Computation: A case study in cognitive control of autonomous systems and some future directions . . . 10
2.3.6 Cognitive control architecture for autonomous marine vehicles . . . 11
2.3.7 Cognitive control for robot task execution . . . 11
2.3.8 Cognitive control in cognitive robotics: Attentional executive control . . . 11
2.3.9 Cognitive control initiative . . . 12
2.3.10 Cognitive control of quadrocopter using supervisor . . . 12
2.3.11 Cognitive supervision and control of robotic inspection-intervention system using qualitative spatio-temporal representation and reasoning . . . 12
2.3.12 Coordinating cognitive assistance with cognitive engagement control approaches in human–machine collaboration . . . 12
2.3.13 CORBYS cognitive control architecture for robotic follower . . . 13
2.3.14 From intelligent control to cognitive control . . . 13
2.3.15 From Low to High Level Approach to Cognitive Control . . . 13
2.3.16 How to assess team performance in terms of control: a protocol based on cogni-tive systems engineering . . . 14
2.3.17 Learning the dynamic process of inhibition and task switching in robotics cog-nitive control . . . 14
2.3.18 Multivariate Bayesian cognitive modeling for unsupervised quality control of baked pizzas . . . 14
3 Definici´on y especificaci´on del trabajo 16
3.1 Definici´on . . . 16
3.2 Especificaciones . . . 17
4 Metodolog´ıa del trabajo 18 4.1 Plan de trabajo . . . 18
4.2 B´usqueda de informaci´on . . . 19
4.3 Alternativas de desarrollo . . . 19
5 Trabajo realizado 20 5.1 Aprendizaje . . . 21
5.2 Planificaci´on . . . 23
5.3 Atenci´on . . . 24
5.4 Descripci´on del Resultado Final . . . 24
5.5 Trabajo computacional . . . 26
6 Validaci´on del trabajo 27 6.1 Metodolog´ıa de prueba . . . 27
6.1.1 Modelo del Sistema . . . 27
6.2 Validaci´on de los resultados del trabajo . . . 28
6.2.1 Sintonizaci´on Algoritmo . . . 28
6.2.2 Aplicaci´on al Parque . . . 33
7 Discusi´on 35 8 Conclusiones 37 Referencias 37 A Resumen Ejecutivo 41 B Propuesta inicial 51 B.1 Justificaci´on . . . 51
B.2 Marco Te´orico . . . 51
B.3 Caracterizaci´on del Proyecto . . . 52
B.3.1 Objetivo General: . . . 52
B.3.2 Objetivos Espec´ıficos: . . . 52
B.4 Contexto del proyecto y tratamientos . . . 52
B.5 Entregables . . . 53
B.6 Recursos . . . 53
B.7 Bibliograf´ıa . . . 53
C C´odigo MATLAB 54 C.1 Script Principal . . . 54
C.2 Funci´on Learning . . . 55
´Indice de figuras
5.1 Modelo dependiente de estado (izq) y Modelo libre de estado (der) [7]. . . 21
6.1 Zona Esquina Suroriental . . . 28
6.2 Zona Camino Occidental . . . 29
6.3 Zona Central . . . 30
6.4 Zona Calle 85 . . . 30
6.5 Desempe˜no Control Cognitivo Zona Camino Occidental . . . 32
6.6 Desempe˜no Control Cognitivo con Ruido Gaussiano . . . 32
6.7 Desempe˜no Control Cognitivo con Ruido Sinusoidal . . . 32
6.8 Desempe˜no Control Cognitivo Zona Calle 85. . . 33
6.9 Desempe˜no Control Cognitivo Zona Esquina Suroriental . . . 33
6.10 Desempe˜no Control Cognitivo Zona Central . . . 34
B.1 Entragables . . . 53
´Indice de tablas
6.1 Comparaci´on entre Par´ametros de Cognitive Control . . . 31
7.1 Consumo de Energ´ıa Diario del Parque Le´on de Greiff usando Control Cognitivo . . . . 35 7.2 Comparaci´on Control Cognitivo vs. Control Fotocelda . . . 35
Cap´ıtulo 1
Introducci´
on
1.1
Descripci´
on de la problem´
atica y justificaci´
on del trabajo
Actualmente, los sistemas de control tanto en el ´ambito nacional como internacional funcionan bajo condiciones y ambientes predefinidos o predecibles. La robustez del sistema se ve definida y limitada hasta donde llegue la etapa de dise˜no. Sin embargo, frente a eventualidades no cubiertas por el dise˜no el sistema tiende a fallar o a no funcionar correctamente. Un claro ejemplo de lo mencionado anteri-ormente se presenta en las fallas en el sistema el´ectrico, cuando por un evento no esperado se genera un colapso en el servicio, dejando en manos humanas decisiones complejas en un corto periodo de tiempo, a veces segundos nada m´as. Por lo tanto, sistemas aut´onomos, robustos y adaptables son una necesidad urgente para la sociedad. Un sistema capaz de tener en cuenta el estado y relevancia de las caracter´ısticas del ambiente que lo rodea para la toma de acciones, es accesible mediante una t´ecnica de control apropiada.
Con el fin de dar soluci´on a los inconvenientes mencionados, han sido creadas t´ecnicas de control como las redes neuronales [1] y el control difuso [2]. Sin embargo dichas t´ecnicas, a pesar de tener un desempe˜no y resultados prometedores, requieren de tiempos considerables de entrenamiento lo que limita su aplicaci´on en ciertos sistemas reales. Surge entonces, una propuesta denominada “Cognitive Control” [3], [4], [5], donde se busca que los sistemas de control lleven a cabo caracter´ısticas propias de la cognici´on. Dichos sistemas deben poder superar los nombrados inconvenientes imprevistos o inalcanzables en el dise˜no, adem´as de disminuir la interacci´on humana con dichos sistemas con el fin de minimizar posibles errores.
Con base en lo anterior, se formula un fundamento te´orico b´asico en forma de algoritmo para imple-mentar los conceptos de aprendizaje, planificaci´on y atenci´on, los cuales son parte determinante en la cognici´on [6]. A fin de usar el control cognitivo en una aplicaci´on que haga ver sus caracter´ısticas (robustez y adaptabilidad), se dirige la atenci´on hacia el sistema de alumbrado p´ublico. Esta prob-lem´atica es de gran inter´es para el campo de los sistemas de control, puesto que es un servicio vital e irreemplazable para cualquier cuidad. Sin embargo, los sistemas de alumbrado existentes son bastante primitivos, en el hecho que no tienen en cuenta las incidencias del ambiente y en ocasiones, ni siquiera se tiene en cuenta la presencia de luz natural. Aparte, el principal inconveniente radica en que estos sistemas permanecen funcionando tiempos predeterminados a su m´axima capacidad, lo que representa un significante gasto de energ´ıa el´ectrica lo que repercute en innecesarios costos (e.g. econ´omicos, in-fraestructura y ambientales). Por ende, un sistema de alumbrado que sea capaz de regular sus acciones con el fin de reducir dichos gastos es altamente deseable.
1.2
Alcance y productos finales
El proyecto presenta un desarrollo conceptual, dise˜no y simulaci´on de la t´ecnica Cognitive Control, o Control Cognitivo, haciendo ´enfasis en la caracterizaci´on de los componentes de aprendizaje, planifi-caci´on y atenci´on. Dicho desarrollo se condensa a manera de algoritmo con el objetivo de implementarlo al sistema de alumbrado p´ublico del parque Le´on de Greiff de la cuidad de Bogot´a D.C.. El desempe˜no del producto es evaluado mediante simulaci´on para obtener resultados de la estrategia, el cumplimiento de los requerimientos normativos y posteriormente, mediante la comparaci´on con la t´ecnica de control actualmente implementada en el parque. De acuerdo a los datos obtenidos se discute acerca de la conveniencia, ventajas y desventajas econ´omicas y ambientales de la implementaci´on del producto.
1.3
Objetivos
1.3.1
Objetivo General
Desarrollar una base bibliogr´afica dotada de una fundamentaci´on te´orica suficiente para la comprensi´on, desarrollo y aplicaci´on del control cognitivo.
1.3.2
Objetivos Espec´ıficos
• Comprobar la viabilidad de la incorporaci´on de propiedades usualmente asociadas con los proce-sos de cognici´on, como la atenci´on, la planificaci´on y el aprendizaje, en el ejercicio de la ingenier´ıa de control.
• Buscar potenciales aplicaciones de las t´ecnicas del control cognitivo en procesos, problemas, sistemas y/o industria, principalmente en el contexto local.
• Implementar un ejemplo que ilustre el trabajo metodol´ogico desarrollado.
• Identificar posibles aportes relevantes al desarrollo del control cognitivo por parte de disciplinas transversales.
Cap´ıtulo 2
Marco te´
orico, conceptual e
hist´
orico
Para lograr los objetivos propuestos, se recurre a algoritmos de aprendizaje y programaci´on din´amica con el fin de dar forma al t´erminocognitivode la t´ecnica de control. Adem´as, puesto que la aplicaci´on y simulaci´on se dirige a sistemas locales de iluminaci´on p´ublica se recurre a las normas, definiciones y pr´acticas pertinentes de este campo. Por ´ultimo, se lleva a cabo una profunda revisi´on del estado y contexto que se le ha dado al Control Cognitivo a lo largo de los ´ultimos a˜nos.
2.1
Marco Te´
orico
2.1.1
Programaci´
on Din´
amica de Bellman
De acuerdo a como lo presenta Simon Haykin en [7], el algoritmo de programaci´on din´amica, tambi´en conocido como la Ecuaci´on de Bellman [8], es un algoritmo convergente y ´optimo [9], [10] el cual busca maximizar una funci´on objetivo a largo plazo. Dicha funci´on se define a lo largo del tiempo en t´erminos de recompensas inmediatas. En su forma b´asica, la programaci´on din´amica de Bellman se aplica a problemas de horizonte finito. Sin embargo, desde una perspectiva anal´ıtica, la aproximaci´on matem´atica es usada en problemas con horizonte infinito, con recompensas definidas sobre un n´umero infinito de ciclos.
En programaci´on din´amica, un sistema se define por su conjunto de estadosSy su conjunto de acciones A. En una base de ciclo a ciclo, el sistema tiene una transici´on del estados∈S en el ciclokal estado s0 ∈S en el ciclok+ 1 como resultado de la acci´ona∈A. Dicha transici´on genera una recompensa rk+1∈R. La funci´on objetivo se define en t´erminos del estado y de la acci´on por la f´ormula:
J(s, a) =Eπ[rk+1+γrk+2+γ2rk+3+· · · |sk =s, ak=a] (2.1)
donde,πk(s, a) =P[ak+1=a|sk=s, ak =a] es la pol´ıtica de selecci´on de acciones cuando el sistema se
encuentra en el estadosyγes un factor positivo menor a 1 que disminuye el efecto de las recompensas futuras. Cabe aclarar que Pdenota una distribuci´on de probabilidad y Eπ denota el valor esperado
respecto a la pol´ıticaπ. La funci´on objetivo obedece la forma de programaci´on din´amica de la siguiente manera:
J(s, a) = X
s0∈S
Tssa0[Rass0+γ
X
a0∈A
πk(s, a0)J(s0, a0)] (2.2)
donde la probabilidad de transici´onTa
ss0 y la recompensa inmediata esperadaRass0 son defnidas por las
ecuaciones:
Ta
ss0 =P[sk+1=s0|sk=s, ak=a],
Ra
ss0 =Eπ[rk+1|sk+1=s0, sk =s, ak =a] (2.3)
La funci´on objetivo ´optima, representada como J∗, se obtiene al maximizar la suma de todos los t´erminos existentes en 2.2 con respecto a una acci´on a, as´ı para todas las acciones existentes. La implementaci´on a forma a forma sistem´atica se presenta en el Algoritmo 1.
Algorithm 1Actualizaci´on de la Funci´on Objetivo para Programaci´on Din´amica
1: Variables:
2: J:=funci´on objetivo
3: γ:=factor de descuento,γ∈[0,1)
4: α:=par´ametro de aprendizaje,α >0
5: Entradas: 6: Ta
ss0:=probabilidad de transici´on
7: Ra
ss0:=recompensa esperada
8: π:=pol´ıtica de selecci´on
9: Actualizaci´on:
10: fortodos los estadoss∈S do
11: fortodas las accionesa∈A do
12: J(s, a)+
←J(s, a) +αPs0∈STssa0[Rass0+γ
P
a0∈Aπk(s, a0)J(s0, a0)−J(s, a)
13: end for
14: end for
Sin embargo, el resultado final de esta maximizaci´on es un crecimiento exponencial en la complejidad computacional, conocido comocurse of dminsionality (maldici´on de la dimensionalidad).
2.1.2
Q-Learning
Es una t´ecnica basada en la metodolog´ıa de aprendizaje por refuerzo [10]. El objetivo es lograr que el agente resuelva o aprenda algo, ´unicamente con la informaci´on que obtiene de forma sensorial del ambiente [11]. El refuerzo se denota como un sistema de recompensas, positivas o castigos, por sobre las acciones que el agente aplique, bas´andose en los resultados consecuentes.
A diferencia de un aprendizaje supervisado [1], [8], el agente no tiene ning´un tipo de conocimiento previo sobre como responde el ambiente en el que este se encuentra. Por ende, con el fin se reunir la informaci´on necesaria para interactuar de manera funcional con el ambiente se recurren a cuatro aspectos componentes del Q-Learning.
• Ambiente: Corresponde al sistema que rodea y afecta al agente. Dicho sistema del ambiente posee un estado, el cual cambia dependiendo de las acciones que se lleven a cabo en este. El agente recibe la informaci´on proveniente del estado del ambiente con el fin de evaluar el impacto de las acciones que se aplican. Dicha informaci´on pueden ser variables de distinta naturaleza, e.g. temperatura, radiaci´on, presi´on, entre otras.
• Funci´on de Refuerzo: Es una funci´on escalar la cual relaciona de manera num´erica la retroal-imentaci´on del ambiente y la acci´on aplicada. Dicha funci´on se traduce en las recompensas o castigos que obtiene el agente.
• Funci´on de Valor: De igual manera que en la programaci´on din´amica, es la funci´on a maxi-mizar para obtener los resultados m´as funcionales a partir de las acciones que se tomen sobre el ambiente. Funciona mediante obtener una relaci´on entre estados y acciones, de tal forma que se llegue a conocer que acci´on se debe tomar en cada estado.
• Pol´ıtica: Corresponde al componente encargado de seleccionar las acciones a tomar de acuerdo al estado percibido del ambiente. De cierta forma, representa como es la conducta del agente dada una situaci´on.
Recursivamente, el objetivo de la t´ecnica es encontrar una pol´ıtica ´optimaπ∗, la cual indique la mejor acci´on a tomar para cada estado en el que pueda encontrarse el agente, con el fin de cumplir un objetivo espec´ıfico. Lo anterior, se encuentra en concordancia con lo enunciado de p´olitca para la programaci´on din´amica.
El algoritmo Q-Learning, genera una relaci´on num´erica entre los estados posibles y las acciones que es capaz de tomar. Dichos valores se conocen como Q-valores. Dichos valores se traducen de forma matricial con los estados correspondiendo a las filas y las acciones a las columnas. Por lo tanto, para cada estado existe un Q-valor que lo asocia con cada acci´on posible.
A forma de implementaci´on, lo primero es la inicializaci´on de estos valores, la cual puede ser preferi-blemente cero debido a temas de convergencia y desempe˜no del algoritmo [11]. La obtenci´on de los Q-valores se lleva a cabo mediante la funci´on de valor, tambi´en conocida como la Q-funci´on, la cual se traduce en la acci´on a tomar. Con la ejecuci´on de cada acci´on, los Q-valores respectivos a la misma y al estado correspondiente son actualizados. La funci´on de actualizaci´on del algoritmo es la sigiuente:
Q(s, a)+=Q(s, a) +α(R+γmaxQ(s0, a0)
−Q(s, a)) (2.4) Cabe recalcar que la gran similitud de 2.4 con el Algoritmo 1, es debido a que le objetivo es el mismo: actualizar una funci´on de valor. Sin embargo, en el caso de 2.4 se hace explicita la recursividad del Q-valor m´aximo, donde dicho par´ametro reemplaza aPa0∈Aπk(s, a0)J(s0, a0) en el Algoritmo 1. El
par´ametro αrepresenta la taza de aprendizaje, la cual determina la magnitud de la influencia de la nueva informaci´on sobre la informaci´on previa. Un factor de 0 repercute en que el agente no aprenda nada, mientras que un valor de 1 significa que el agente tendr´a ´unicamente la informaci´on reciente en consideraci´on, un valor negativo es contraproducente. El par´ametro γ corresponde al factor de descuento (al igual que en programaci´on din´amica), este determina la importancia de las recompensas futuras. Un factor de 0 genera que el agente tenga visi´on a corto plazo, i.e. tiene ´unicamente en cuenta las recompensas presentes, mientras que un factor cercano a 1 produce un agente en constante b´usqueda de altas recompensas a largo plazo, para valores distintos al intervalo anterior se produce divergencia del algoritmo [12]. El factor R simboliza la recompensa o retroalimentaci´on obtenida por la aplicaci´on de la acci´on en el estado pertinente.
2.1.3
C´
alculo de Iluminancia seg´
un el M´
etodo de los L´
umenes
Con el fin de aplicar el control cognitivo a un sistema con problem´atica en el marco local como lo es la iluminaci´on p´ublica, se hace necesario conocer el m´etodo de calculo deiluminanciade una zona p´ublica determinada. Para tal objetivo, existen m´ultiples m´etodos de c´alculo de la calidad de iluminaci´on de una zona. Los m´etodos var´ıan mayormente debido a si la zona a iluminar se encuentra en el exterior o en el interior. En este caso, la atenci´on se dirige a los m´etodos pertinentes a la iluminaci´on exterior, entre los que se encuentra el m´etodo de europeo de los 9 puntos [13] (usado principalmente para ilu-minaci´on de v´ıas y carreteras), el m´etodo punto a punto [14] (da a conocer los valores de iluminancia en puntos concretos) y, para este caso de aplicaci´on en espec´ıfico, se tiene el m´etodo de los l´umenes [15] (las razones del porqu´e se escogi´o este m´etodo se presentan en la secci´on de trabajo realizado).
El m´etodo tiene por objetivo conseguir un nivel de iluminaci´on apropiado para un determinado espacio. Los resultados arrojados por el m´etodo corresponden concretamente al nivel medio de iluminanciaEm
sobre un ´area de una instalaci´on de alumbrado general. Dicha iluminancia media es proporcionada con un error de±5% lo que repercute en informaci´on sobre la necesidad lum´ınica del ´area en cuesti´on. El m´etodo se basa entonces en el c´alculo de la siguiente ecuaci´on [15]:
Φ = Em·S Cu
(2.5)
donde, Φ es flujo luminoso proporcionado por la fuente luminosa, en este caso, las luminarias de la zona, se encuentra en l´umenes (lm). Como se mencion´o anteriormente, Em corresponde al nivel
de iluminanc´ıa medio, su unidad es el l´ux (lx). El ´area a iluminar se representa con S, la unidad a expresarla es m2 debido a que [lm/m2] = [lx]. Por ´ultimo, el factor adimensional C
u denota al
coeficiente de utilizaci´on, el cual relaciona el flujo luminoso recibido por un cuerpo, el flujo emitido por la fuente luminosa, y la distancia entre el cuerpo y la fuente. Cabe aclarar que tanto el factor de utilizaci´on como el flujo luminoso emitido, son datos proporcionados por el fabricante de la luminaria.
2.2
Marco Conceptual
Con fin de dar forma y sentido al trabajo realizado, se tienen en cuenta las definiciones pertinentes al mismo. Las definiciones se divididas en aquellas correspondientes a la cognici´on, y en aquellas relacionadas a la iluminaci´on p´ublica.
2.2.1
Conceptos de Cognici´
on
Las definiciones presentadas buscan establecer el contexto sobre el cual se basan los planteamientos te´oricos de control cognitivo que se desarrollan m´as adelante.
• Cognici´on: Palabra originaria del antiguo sustantivo griegoγνωσζ que significaconocimiento y del verboγνωσκωque significaaprender.En este proyecto se entiende por cognici´on al paradigma llevado a cabo generalmente en el cerebro de los mam´ıferos de forma ya sea consciente o incon-sciente, basado en como se interact´ua con el mundo exterior, en la soluci´on de problemas y en la consecuci´on y cumplimiento de obligaciones. Los componentes principales de la cognici´on son los ciclos de percepci´on y acci´on, memoria, atenci´on, inteligencia, aprendizaje, planificaci´on y lenguaje. En este proyecto se hace ´enfasis en los elementos de aprendizaje, planificaci´on y atenci´on.
• Aprendizaje: Proceso por el cual se obtienen habilidades o conocimiento, con base en experi-encias previas o por ense˜nanzas predefinidas. En este contexto, se enfoca al aprendizaje como la informaci´on obtenida, y almacenada, por una especie de retroalimentaci´on lograda a partir de la interacci´on con el ambiente.
• Planificaci´on: Uso de conocimiento previo respecto a alg´un fen´omeno de inter´es con el fin de predecir el comportamiento de dicho fen´omeno, y con base a esto decidir sobre las acciones a tomar o sobre los riesgos a correr. En otras palabras, sopesar las consecuencias de las posibles acciones a tomar antes de llevarlas a cabo.
• Atenci´on: Se refiere a que tan activamente se procesa la informaci´on que se percibe del ambiente. Sin embargo, en este contexto, el concepto se enfoca a que tanta importancia se le da a los conocimientos previamente adquiridos por sobre la realizaci´on de nuevas acciones con el fin de obtener informaci´on nueva.
2.2.2
Conceptos de Alumbrado P´
ublico
Con base en el Reglamento T´ecnico de Iluminaci´on y Alumbrado P´ublico (RETILAP) de Ministerio de Minas y Energ´ıa de Colombia [13], se enuncian las siguientes definiciones. Dichas definiciones son pertinentes para el desarrollo e interpretaci´on del trabajo realizado en el proyecto.
• Alcance: Caracter´ıstica de una luminaria que indica la extensi´on que alcanza la luz en la direcci´on longitudinal del camino. Las luminarias se clasifican en: de alcance corto, medio o largo.
• Bombilla o L´ampara: T´ermino gen´erico para denominar una fuente de luz fabricada artifi-cialmente.
• Coeficiente de Utilizaci´on: Relaci´on entre el flujo luminoso incidente sobre una superficie a iluminar (flujo ´util) y el flujo total emitido por una luminaria. Usualmente aplicado en referencia a sistemas de iluminaci´on p´ublica.
• Fotocontrol: Dispositivo utilizado, normalmente, para conectar y desconectar en forma au-tom´atica luminarias de alumbrado p´ublico en funci´on de la variaci´on del nivel luminoso (at-mosf´erico).
• Flujo Luminoso: Cantidad de luz emitida por una fuente luminosa en todas las direcciones por unidad de tiempo. Su unidad es el l´umen (lm)
• Iluminancia: Densidad del flujo luminoso que incide sobre una superficie. La unidad de ilumi-nancia es el lux (lx).
• Iluminancia Promedio Horizontal Mantenida: Valor por debajo del cual no debe descender la iluminancia promedio en el ´area especificada.
2.3
Marco Hist´
orico
La t´ecnica de Control Cognitivo tiene un desarrollo y entendimiento puede decirse prematuro. A lo largo de los ´ultimos a˜nos, se ha prestado especial atenci´on a la aplicaci´on de comportamientos bio-inspirados a sistemas de control. Sin embargo, a diferencia de t´ecnicas como las redes neuronales artificiales [1] o el control difuso [2], el control cognitivo no tiene una definici´on o concepto fijo y suficiente sobre el cual basarse para llevar a cabo desarrollo de sistemas. Por tales motivos, a con-tinuaci´on se muestra los distintos controles cognitivos que han sido desarrollados durante los ´ultimos a˜nos en la literatura especializada. Esto con el fin de plantear una base para el control cognitivo a desarrollar, mediante el an´alisis de las principales caracter´ısticas de cada referencia encontrada. Las etapas de comparaci´on, evaluaci´on y aplicaci´on de los aspectos encontrados se encuentran desarrollas en la secci´on de trabajo realizado, puesto que el objetivo del proyecto es obtener una base bibliogr´afica sobre la cual basarse para aplicar Control Cognitivo.
2.3.1
A Bottom-Up Approach for Cognitive Control
El texto [16] argumenta que las habilidades cognitivas para la planificaci´on requieren de representa-ciones del sujeto mismo y del ambiente que lo rodea. As´ı, el enfoque se dirige en una aproximaci´on de Verschure [17]: “El sistema de control se construye de abajo hacia arriba, creciendo hacia niveles m´as altos y hacia tareas m´as complejas”, i.e. una estructura por capas.
El concepto de control cognitivo es: la idea de simulaci´on mental. La simulaci´on mental ve la plan-ificaci´on como el manejo de pruebas, i.e. esta noci´on de intentar un movimiento mediante simularlo mentalmente sin llevar a cabo la acci´on f´ısica. Lo anterior, depende fuertemente en el conocimiento de un modelo interno. Las car´ateristicas son:
• Construir un modelo interno del propio sistema o cuerpo. El anterior puede ser luego usado como base para expandirse hacia modelos del ambiente.
• Dirigir el proceso de usar comportamientos aprendidos para controlar el cuerpo o modular estos comportamientos en el control del cuerpo o del modelo interno.
• Gestionar el desacople entre el cuerpo y las estructuras de control, con el fin de llevar a cabo la simulaci´on.
• Llevar a cabo la invenci´on de nuevos modelos de simulaci´on y tomar la decisi´on de cuando construir modelos nuevos.
A groso modo, la implementaci´on de la idea de memoria se compone de varios modelos de situaci´on que consisten en redes neuronales. Adem´as, la selecci´on de las conexiones es aleatoria, de esta manera introduciendo una especie de aspecto evolutivo. As´ı, se propone una estructura de memoria que usa neuronas an´alogas sencillas y se concentra en el aspecto de cuantas situaciones diferentes pueden ser almacenadas. La estructura es pensada con el fin de representar un concepto m´as general de como los recuerdos pueden ser organizados. Puesto que la aproximaci´on basada en comportamiento depende bastante en la encarnaci´on o personificaci´on, se usa como ejemplo un caminador hex´apodo, el cual posee varios grados de libertad.
Se investiga como el controlador reactivo para el caminador hex´apodo puede ser mejorado mediante el uso de un modelo interno del cuerpo. Donde este modelo puede ser usado en el control cognitivo en el sentido de la planificaci´on. Sin embargo, existe el problema de que para encontrar una interpretaci´on funcional se tiene un gran n´umero de unidades neuronales junto con un gran n´umero de grados de libertad no especificados derivando en que los modelos resultantes no son adecuados para el control de sistemas aut´onomos.
No obstante, una restricci´on cr´ıtica para la arquitectura implementada es la utilizaci´on de estructuras basadas en neuronas. Por consiguiente, se intenta suavizar el inconveniente con la introducci´on de varios tipos de red neuronal, las cuales pueden ser entrenadas con simples reglas de aprendizaje. Como objetivo, se debe llegar a un sistema con la habilidad de almacenar informaci´on, encontrar la infor-maci´on en la memoria, recuperar inforinfor-maci´on espec´ıfica y ser capaz de planificar a futuro.
A pesar de lo anterior, surgen interrogantes acerca de los m´etodos de sintonizaci´on de los pesos en las redes neuronales, como estos pesos pueden ser aprendidos, como se interconectan modelos de situaci´on relacionados de un mismo contexto. Para la correcci´on y aclaraci´on de dichos inconvenientes la capacidad de planificaci´on debe acarrear a invenciones comportamientos robustos. El texto sugiere usar una modelo manipulable interno de la red neuronal, dando lugar a mayor complejidad y a un sistema de encarnaci´on o personificaci´on de segundo orden.
2.3.2
Cognitive control architecture for an artificial creature using episodic
memory
El texto [18] describe una arquitectura de control cognitivo con la incorporaci´on de memoria epis´odica para la criatura artificial RITY. RITY es software que compone un sistema rob´otico ubicuo. Define la memoria epis´odica como una estructura escalable que almacena las capturas instant´aneas realizadas perceptualmente de episodios a medida que la experiencia de RITY aumenta. Adem´as, el sistema utiliza un mapa de espacio variante temporal para almacenar informaci´on espacial y una memoria de procedimiento de alto nivel usando m´aquinas de estado finito. El sistema es dise˜nado para permitir a RITY ser cognitivo al aproximarse a la selecci´on de tareas a trav´es del proceso dual de aprendizaje por experiencia y por espacio. Los m´odulos componentes para llevar a cabo dicha cognici´on son: m´odulo de percepci´on, de estado interno, de selecci´on de comportamiento, de aprendizaje interactivo, de memoria y m´odulo motriz.
Experimentos sobre el comportamiento del software, con la inclusi´on de la cognici´on, con respecto a la finalizaci´on de tareas y el mantenimiento de un estado interno ideal muestran que la criatura artificial de mejorar su desempe˜no a lo que su experiencia aumenta.
La focalizaci´on del texto es darle a RITY la posibilidad de lidiar con las incertidumbres del ambiente. As´ı, se recurre a la memoria permitir a un sistema aprender del ambiente y de las experiencias pasadas. Al a˜nadir el concepto de epis´odico, se permite la inclusi´on de registros de secuencias temporales de eventos espec´ıficos ocurridos al agente cognitivo. La arquitectura se compone de los m´odulos nom-brados anteriormente, sin embargo se hace un ´enfasis especial en el m´odulo de memoria para hacerlo escalable, modular y que exhiba capacidades cognitivas.
Sin embargo, la aplicaci´on de la memoria epis´odica acarrea una fuerte carga computacional, la cual es cr´ıtica en aplicaciones en tiempo real. Se hace necesario un gran espacio de almacenamiento para no solo guardar capturas sino para identificar la secuencia y relaci´on que esta tiene con las dem´as capturas. Por ´ultimo, el texto tan solo expone el caso y los prometedores resultados del mismo, en un sistema netamente virtual, y se limita a dar arquitecturas y esquemas generales de la implementaci´on.
2.3.3
An introduction of cognition information: From form aspect to
se-mantic aspect
Primero, [19] se enfoca en el componente de la cognici´on que es la ling¨u´ıstica, i.e. la intercomunicaci´on entre los distintos entes cognitivos para construir una cognici´on distribuida e intercomunicada. As´ı entonces, la teor´ıa de la informaci´on cl´asica se enfoca en la forma de la comunicaci´on sin tener en cuenta el aspecto sem´antico, y la causa es la falta de habilidad de cognici´on por las limitaciones de instrumentos matem´aticos. Por lo tanto, el texto define la informaci´on de cognici´on como la informaci´on mutua sem´antica obtenida en un proceso de cognici´on sem´antico. Para lograr lo anterior se expone la necesidad de proveer a las maquinas con la habilidad de deducir la sem´antica deseada de la gran cantidad de formas en las que puede llegar (tal como datos o mensajes) y as´ı poder trascender la teor´ıa de probabilidad y la estad´ıstica para medir la informaci´on. En conclusi´on, el art´ıculo expone los obst´aculos con la teor´ıa de la informaci´on actual, se˜nala la arquitectura para implementar una cognici´on sem´antica en la comunicaci´on, todo lo anterior con el fin de lograr un servicio que facilite la toma de decisiones.
2.3.4
Autonomic fault management based on cognitive control loops
El art´ıculo [20] presenta una aproximaci´on del manejo de fallas con base en lazos de control cogni-tivo con el fin de mantener gesti´on aut´onoma de la red para internet. Concibe el lazo de control cognitivo como el elemento que determina la urgencia de las alarmas de la red, que procesa dichas alarmas urgentes de manera m´as r´apida y que luego determina las causas de dichos problemas basado en aprendizaje y razonamiento.
Define el modelo cognitivo como un conjunto de procesos, lo cuales interact´uan de acuerdo a tres capas: la capa reactiva, deliberativa y reflexiva. Supone que todos los procesos usan una m´aquina de estado finito y un razonador, as´ı el sistema puede reconocer cuando un evento o un conjunto de eventos han ocurrido con anterioridad. Dichos resultados se almacenan en una memoria de corto plazo. El mecan-ismo reactivo habilita de la porciones computacionalmente intensivas del lazo de control para que ser evitadas, produciendo as´ı dos atajos denominados alta prioridad y urgente. El proceso deliberativo recorre la secuencia de observar, normalizar, comparar, planificar, decidir y actuar. Lo anterior, usa memoria de largo plazo para almacenar como se lograr los objetivos con base en un contexto espec´ıfico. El proceso reflexivo, examina las conclusiones llevadas a cabo por el conjunto de procesos deliberativos usados, y trata de predecir el mejor conjunto de acciones que maximizaran las metas perseguidas por el sistema. Los procesos usan an´alisis sem´antico para entender el por qu´e un contexto particular fue ingresado y por qu´e un cambio en el contexto ayuda a predecir c´omo cambiar contextos m´as f´acil y eficientemente en el futuro. Estos resultados tambi´en son almacenados en la memoria a largo plazo, tal que el sistema entienda mejor los cambios contextuales y llegue a un razonamiento para ayudar a
la depuraci´on.
En si el art´ıculo, muestra una manera eficiente de gestionar y manejar las fallas de un sistema de comunicaciones, e.g. el denominado internet futuro. Sin embargo, la cognici´on se basa ampliamente en la utilizaci´on eficiente de la memoria de eventos o contextos pasados, a lo que denomina razon-amiento. Adem´as, su implementaci´on es altamente influenciada hacia las aplicaciones en redes de comunicaciones. Pero, el manejo de fallas que sugiere puede ser ´util para aplicaciones fuera de las comunicaciones. No sale del paradigma de que para que el sistema aprenda tiene que primero ocurrir los problemas y ser solucionados con anterioridad, lo cual le da poca robustez.
2.3.5
Cognitive Computation: A case study in cognitive control of
au-tonomous systems and some future directions
El art´ıculo [21] define los alcances de la cognici´on como la capacidad de pensar por s´ı mismo, tomar decisiones sobre acciones en una variedad de formas, ser flexible, robusto, adaptativo y ser capaz de aprender de tanto experiencias previas propias como de las de semejantes. El alcance del texto llega a proponer una metodolog´ıa de control cognitivo multimodal, i.e. que lo compone m´as de uno de los elementos mencionados anteriormente, donde se obtiene un diagrama en bloques general y culmina con una amplia secci´on de sugerencias para trabajo futuro. Sin embargo, pruebas, simulaciones y algoritmos no se encuentran presentes expl´ıcitamente.
La metodolog´ıa consiste en una analog´ıa con los ganglios basales. En el cerebro vertebrado, la se-lecci´on de acciones, se supone, es mediada por un conjunto de estructuras sub corticales conocidas como los ganglios basales. Estos ganglios act´uan como un interruptor central, reciben peticiones de accionamiento para la expresi´on conductual de subsistemas a los largo del cerebro, y luego selectiva-mente permite que estos tomen control de sus recursos cognitivos. La fuerza de la petici´on reside en su nivel general de se˜nal o su prominencia. Adem´as, las peticiones son m´as o menos escuchadas por los ganglios de acuerdo a que tan bien los perfiles de la actividad en los aferentes de las neuronas de entrada de los ganglios coincidan con los patrones correspondientes de los pesos sin´apticos. As´ı, una coincidencia de plantilla entre ambos resultar´a en una acci´on del ganglio que es sensible a la petici´on de accionamiento. Luego, sale de las compuertas del ganglio la selecci´on de acciones por la remoci´on selectiva de la inhibici´on. Las acciones son seleccionadas cuando los procesos competidores entre los canales de acci´on en el ganglio resultan en un levantamiento de la inhibici´on desde el subsistema obje-tivo. Una petici´on se entonces exitosa si su prominencia es lo suficientemente alta, y si hay una entrada de canal de acci´on receptivo en el ganglio. En el marco del control cognitivo, estas ideas b´asicas son usadas para suavizar la selecci´on entre controladores convencionales.
Introduce el concepto de procesamiento controlado y procesamiento autom´atico. El primero est´a bajo el control directo y activo del sujeto, es lento y deliberativo, y requiere atenci´on serial a las sub tareas. El segundo, por otro lado, requiere menos esfuerzo, es manejado ampliamente por el est´ımulo actual y puede involucrar la ejecuci´on de grandes pedazos de comportamiento. Siempre, un ser cognitivo se encuentra cambiando entre estos dos modos con base en un monitoreo del error. Para el caso de un veh´ıculo aut´onomo, si una trayectoria ha sido bien aprendida, este ser´a capaz de andar con solo un simple camino planeado especificado una vez con pocos puntos. Si no, el camino tendr´a que ser divido en varios sub trayectorias o pedazos. La idea es monitorear los errores en el andar y cambiar a hori-zontes de movimiento m´as cortos si es necesario. Si los errores son pocos, el horizonte de planificaci´on es alargado seg´un corresponda.
La planificaci´on de movimiento, para una aplicaci´on de seguir la trayectoria, fue realizada usando planificaci´on diferencial de trayectoria basada en llanura y una aproximaci´on polinomial para lograr una trayectoria de espacio de estados factible, dados los estados inicial, final e intermedio. El contro-lador cognitivo basado en ganglios basales propuesto es visto para superar un controcontro-lador no lineal convencional. En conclusi´on, la metodolog´ıa basada en ganglios basales puede ser adaptada para una
mayor cantidad de aplicaciones en tiempo real. Sin embargo, una arquitectura m´as detallada y los algoritmos pertinentes tienen que ser formulados o buscados, puesto que el art´ıculo no los muestra.
2.3.6
Cognitive control architecture for autonomous marine vehicles
El art´ıculo [22] propone una arquitectura de control inteligente (ICA) para hacer posible colaboraci´on m´ultiple entre veh´ıculos marinos para llevar a cabo misiones de intervenci´on submarinas de manera aut´onoma. El fundamento de la arquitectura de la ICA yace en la flexibilidad de la computaci´on orientada al servicio. Una base de datos basada en conocimiento captura las habilidades del operador, las capacidades de la plataforma y los cambios en el ambiente. La informaci´on capturada permite a los agentes razonadores planificar misiones basadas en la situaci´on actual. Se busca como objetivo dise˜nar y construir un sistema con la capacidad de lidiar con fallas internas y cambios en el ambiente, tambi´en como su impacto en los resultados de los sensores usados en la fase de planificaci´on.
Cada m´odulo vehicular provee servicios b´asicos los cuales anuncian sus capacidades al sistema. El servicio tambi´en publica actualizaciones regulares de su estado actual. En adici´on, se tiene la previa-mente explicada base de datos basada en conocimientos. Cada veh´ıculo est´a especializado en diferentes disciplinas, y provee diferentes capacidades disponibles como servicios de la plataforma para el sistema en general.
En general, el texto se adjudica a tener una base de datos previa sobre la cual se basa la cognici´on de varios agentes. Dichos agentes tienen por objetivo trabajar juntos de manera efectiva y ´optima para mejorar la realizaci´on de ciertas tareas espec´ıficas. La arquitectura se dirige a coordinar espec´ıficamente a un grupo variado de elementos o agentes. La ICA se basa en las caracter´ısticas de servicio, i.e. descubrimiento de las capacidades de un sistema, reconfiguraci´on din´amica del sistema e interacci´on desacoplada entre aplicaciones.
2.3.7
Cognitive control for robot task execution
Para mejorar el desempe˜no de la inteligencia artificial (AI) de un robot humanoide ISAC, se adaptan habilidades cognitivas humanas para la ejecuci´on de tareas y el control del robot [23]. En vez de usar conocimiento pre-programado tal como en sistemas basados en reglas, el robot adquiere su conocimiento a trav´es del aprendizaje y la experiencia pasada. El conocimiento y la experiencia son almacenados dentro de estructuras de memoria y son recobrados durante la ejecuci´on de las tareas. El control cognitivo es aplicado al robot usando un mecanismo de control llamado agente ejecutivo central CEA junto con un ´area para almacenamiento temporal de informaci´on espec´ıfica para la tarea denominado sistema de memoria de trabajo WMS. El CEA selecciona apropiadamente acciones para la ejecuci´on de una tarea basado en experiencias pasadas. La emoci´on es tambi´en utilizada como retroalimentaci´on del sistema y puede tambi´en ser usada como selecciones de acci´on parcial. El robot e capaz de adaptar su conocimiento aprendido, parcializado por la emoci´on, para ayudar a la toma de decisiones en situaciones conflictivas.
2.3.8
Cognitive control in cognitive robotics: Attentional executive control
En [24] se presenta una arquitectura h´ıbrida de control sobre el nivel de atenci´on, donde mecanismos de atenci´on son usados en un diferente nivel de abstracci´on. Se explora un modelo de atenci´on ejecutiva basado en frecuencia para regular y coordinar comportamientos reactivos, monitoreo de ejecuci´on y planificaci´on din´amica. El sistema ejecutivo supervisa las ejecuciones de comportamiento e integra un control de arriba hacia abajo adaptando su latencia de sentir planificar y actuar hacia el nivel de activaci´on/excitaci´on conductual. Adem´as, la duraci´on del ciclo de sentir-planificar-actuar regula la longitud de horizonte de planificaci´on. Esto permite adaptar la deliberaci´on y reacci´on a un estado de atenci´on del sistema a trav´es de la ejecuci´on. En suma, el sistema acopla la cognici´on bajo la atenci´on
dedicada a los sensores del ambiente. Y cuantifica la atenci´on como la frecuencia con la cual actualiza el dato de entrada de un sensor en espec´ıfico.
2.3.9
Cognitive control initiative
El texto [3] funciona como un desarrollo conceptual de la idea del control cognitivo, da pautas sobre el potencial de la metodolog´ıa m´as no propone una arquitectura para su implementaci´on. Inicia dando una definici´on general respecto del control cognitivo. Saca a colaci´on una discusi´on con temas sobre la modelaci´on de lo consciente, desarrollo de lo consciente e implicaciones para con la tecnolog´ıa de control. Enumera luego las caracter´ısticas generales del control cognitivo, haciendo claro ´enfasis en su papel en procesos con ambientes altamente variables. Concluye diciendo que el control cognitivo es una propuesta para la aplicaci´on sistem´atica de los elementos de esta clasificaci´on para solucionar problemas pr´acticos de control en donde hay pocas posibilidades de obtener modelos completos. Donde tambi´en existan limitadas posibilidades de observaci´on y medici´on de variables y adem´as limitaci´on en la realizaci´on de acciones (actuadores).
2.3.10
Cognitive control of quadrocopter using supervisor
En el art´ıculo [25] se presenta el modelo matem´atico de un cuadri-c´optero, junto con una soluci´on de supervisor para la planificaci´on de ruta para cubrir un ´area definida. Este supervisor es capaz de optimizar y recalibrar la ruta en caso de eventos inesperados durante el vuelo. Presenta un algoritmo para sobrellevar las perturbaciones del ambiente de una manera matem´atica e implementada a trav´es de SIMULINK. Muestra como el veh´ıculo es capaz de seguir una trayectoria y crear un camino para cubrir un ´area determinada.Sin embargo, el texto hace alusi´on a los cognitivo con el hecho de superar perturbaciones. Pero dichas perturbaciones las supera con un PD convencional, una red neuronal, y un escasamente explicado control gen´etico cognitivo.
2.3.11
Cognitive supervision and control of robotic inspection-intervention
system using qualitative spatio-temporal representation and
reason-ing
En el art´ıculo [26] se muestra un sistema de intervenci´on e inspecci´on rob´otica de control y supervisi´on cognitivos. Se tiene como contribuci´on un prototipo de MSAS (sistema de asistencia espacial m´ovil) que es capaz de proveer una representaci´on cualitativa del ambiente interior. Dicha representaci´on es usada para un razonamiento cualitativo llevado a cabo por un modelo cognitivo de un supervisor humano para prevenir una crisis en el sistema. Un modelo sem´antico es construido en un ambiente interno desconocido basado en las observaciones del robot (MSAS).
La cognici´on en el sistema consta de simular y entrenar un robot para que sea capaz de reemplazar a un supervisor humano. Con el tal fin se desarrolla un mapa cognitivo que sirve de gu´ıa para las decisiones tomadas por el robot. Se propone una jerarquizaci´on de tres capaz para distribuir la rob´otica cognitiva del sistema. El pilar de la cognici´on para este art´ıculo se encuentra en un buen manejo y captaci´on en la fase de percepci´on.
2.3.12
Coordinating cognitive assistance with cognitive engagement
con-trol approaches in human–machine collaboration
El texto [27] se centra en el problema de coordinaci´on de asistencia en un nivel cognitivo, en rubros como cuando dar asistencia y que asistencia proporcionar. Es as´ı que el nivel central de apoyo del texto es una maquina cognitiva que en vez de reemplazar al humano, lo asista. En un simulador de conducci´on se coordinan varios niveles de intrusi´on con asistencia cognitiva dentro de una asistencia adaptativa para hacerlos servir a un procesamiento cognitivo humano en una manera apropiada. La
cognici´on tiene que ver con la mejora del desempe˜no de tareas y la impresi´on subjetiva confirma los beneficios de la coordinaci´on de asistencia cognitiva en interacciones humano m´aquina, en las cuales el nivel de compromiso cognitivo de los operadores es din´amicamente ajustado para alcanzar la demanda de mantener el desempe˜no de la tarea.
2.3.13
CORBYS cognitive control architecture for robotic follower
En [28] se presenta la arquitectura de control del robot gen´erico cognitivo CORBY. El objetivo de dicha arquitectura es la integraci´on de m´odulos cognitivos de alto nivel para apoyar el funcionamiento del robot en ambientes din´amicos incluyendo la interacci´on con humanos. El robot con mencionados m´odulos entiende el estado actual tanto del sistema como del ambiente y del humano. Se usa una aplicaci´on en la que el robot tiene que seguir la trayectoria de un operario humano. La arquitectura se compone de cuatro capas: la capa cognitiva, la capa ejecutiva, la capa de control y la capa f´ısica.
2.3.14
From intelligent control to cognitive control
Aplicaci´on y metodolog´ıa muy similar a [23], fuera del hecho que se trabaja con el mismo robot hu-manoide ISAC. El control [29] se basa en tres memorias distintas. Memoria de corto plazo, almacena informaci´on sensorial del ambiente actual. Memoria de largo plazo, almacena comportamientos apren-didos, conocimiento de sem´antica y experiencias pasadas. Y la memoria de trabajo WMS, encargada de almacenar informaci´on espec´ıfica de tareas y coordina el flujo de informaci´on a los procesos cogni-tivos durante la ejecuci´on de tareas. Da una pauta interesante sobre la aplicaci´on de memoria de corto plazo en rob´otica denominada la ego esfera sensorial SES, la cual dota informaci´on de espacio y tiempo al robot. Define el control cognitivo como la habilidad de conscientemente manipular pensamientos y comportamientos mediante la atenci´on para lidiar con metas y demandas. El control cognitivo debe ser capaz de cambiar entre el estado de reacci´on y el estado de deliberaci´on, con el fin de lograr metas en especial bajo situaciones nuevas. El enfoque del control se atribuye a funcionamiento de la memoria de trabajo WMS.
Como experimento se le dan tareas sencillas al brazo del humanoide. Se da primero un nivel de ense˜nanza a cerca de las tareas. Luego se le dan comandos y un tiempo de aprendizaje. Una vez aprendido se le hace enfrentar al robot situaciones alteradas para probar su conocimiento. Se usa tambi´en una abstracci´on de atenci´on para saber qu´e informaci´on tener en cuenta sin embargo para la elecci´on adecuada de esta informaci´on el sistema tiene que explorar todas las posibilidades durante el entrenamiento.
2.3.15
From Low to High Level Approach to Cognitive Control
En [30] se estipula que los elementos b´asicos de una arquitectura cognitiva son los comportamientos reactivos, activados por est´ımulos externos. El texto presenta una t´ecnica denominada t´ecnica de control de caos d´ebil, la cual es usada para implementar la capa reactiva de un esquema de detecci´on-percepci´on-acci´on. Los mecanismos de control son inspirados por la formaci´on de perceptores en el bulbo olfatorio de los conejos.
Todo se centra hacia la implementaci´on de una red de neuronas terminales para un control de nave-gaci´on de un veh´ıculo. Se asume que el robot sabe previamente una respuesta a sensores de bajo nivel y este tiene que aprender la respuesta a est´ımulos de alto nivel. Para el aprendizaje del sistema de Spike-Timing-Dependent-Plasticity STDP.
En detalle, la din´amica del bulbo olfatorio se caracteriza por un atractor ca´otico de alta dimensi´on con m´ultiples alas. Las alas se consideran como rastros de memoria potenciales formados por el apren-dizaje del animal a lo largo de su vida. En la ausencia de un est´ımulo sensorial, el sistema est´a en un
modo de una b´usqueda iterada de alto nivel, visitando varias alas. En respuesta a un est´ımulo dado, la din´amica del sistema se restringe a oscilaciones en una de las alas. Una vez la entrada es removida, el sistema regresa a el modo iterativo fundamental de alta dimensi´on.
El papel del caos es fundamental para proveer la sensibilidad y robustez necesarias por un sistema durante la migraci´on de diferentes estados perceptuales. Se tiene que un modelo denominado conjunto K, el cual representa los comportamientos ca´oticos y oscilatorios. Se implementa el modelo K al control de navegaci´on de agentes aut´onomos. Los par´ametros han sido aprendidos a trav´es de una aproximaci´on de evoluci´on y tambi´en, usando estrategias de aprendizaje no supervisado. Se usa un sistema din´amico con caracter´ısticas ajustables que pueden simular funcionalmente la creaci´on de patrones perceptuales. La etapa de percepci´on se representa por un atractor ca´otico ajustable, controlado por las se˜nales entrantes de los sensores. En particular, una estrategia de control de retroalimentaci´on de estado es implementada.
2.3.16
How to assess team performance in terms of control: a protocol
based on cognitive systems engineering
Tal y como lo anuncia su nombre, el art´ıculo [31] presenta un protocola para evaluar el desempe˜no de equipo en t´erminos de control basado en la teor´ıa de sistemas cognitivos. El protocolo cambia el enfoque de la evaluaci´on de equipo de comportamientos buenos o malos hacia la actividad del equipo. Los datos se re´unen a trav´es de la observaci´on y cuestionarios, y es analizada in intervalos de tiempo. A cada intervalo de tiempo se le asigna un modo de control. Con base en c´omo cambia el modo de control a lo largo del tiempo, el desempe˜no del equipo puede ser evaluado. La metodolog´ıa anterior, puede llegar a ser ´util al momento de lidiar con redes de elementos controlados por control cognitivo. Con lo anterior en cuenta se puede dar un valor de desempe˜no a control cognitivo en s´ı, compar´andolo con otras metodolog´ıas de control.
2.3.17
Learning the dynamic process of inhibition and task switching in
robotics cognitive control
El texto [32] se centra, en definir como pilar crucial para el control cognitivo, la capacidad de modificar la ejecuci´on de tareas en tiempo real bajo condiciones dadas. Esto significa que hay que decidir cu´ando una tarea no puede salir bien y una nueva tarea tiene que ser iniciada. Estas decisiones son inducidas por la entrada de est´ımulos que alertan de eventos que ocurren mientras el robot realiza sus funciones. Para lograr el aprendizaje se usan los conceptos de cambio e inhibici´on. La cognici´on se muestra a c´omo los conceptos se dan frente a la aparici´on de est´ımulos, i.e. cambiar de una actividad a otra m´as competente, o inhibir impulsos inapropiados y reservar la concentraci´on en la tarea actual. En el texto se ilustran un m´etodo desarrollado para aprender a cambiar e inhibir, basado en procesos Gaussianos.
2.3.18
Multivariate Bayesian cognitive modeling for unsupervised quality
control of baked pizzas
El art´ıculo [33] describe una metodolog´ıa Bayesiana multivariable desarrollada para un control de calidad no supervisado sobre pizzas basado en atributos de color RGB. Se acude a un censo para determinar el punto de disposici´on del producto. Se toman fotograf´ıas de las pizzas cada cierto in-tervalo de tiempo y se comparan estad´ısticamente con los datos deseados. La metodolog´ıa permite una cognici´on hacia como el resultado de la pizza se da a juzgar nuevamente por los participantes del sensor y as´ı se modifican los par´ametros de calidad.
Teniendo en cuenta todos las referencias anteriores, se eval´uan y analizan con el fin de que contribuyan al desarrollo final del control cognitivo de este proyecto. Dicho Control de este proyecto se encuentra ampliamente basado en las ideas presentadas por Haykin [7], sin embargo, se hacen modificaciones con
el fin de adaptar al algoritmo para que se desempe˜ne de manera funcional en la aplicaci´on y simulaci´on de un sistema de alumbrado p´ublico.
Cap´ıtulo 3
Definici´
on y especificaci´
on del
trabajo
3.1
Definici´
on
Actualmente la mayor´ıa de sistemas de control presentan serios problemas de funcionamiento frente a fen´omenos o circunstancias para las cuales no fueron dise˜nados en su momento de concepci´on. Dichas limitaciones producen un nivel de riesgo e incertidumbre durante el funcionamiento de los procesos lo que puede poner en riesgo los componentes del sistema, e incluso el bienestar de los operarios humanos.
Los mam´ıferos, en especial los seres humanos, afrontan los nuevos retos y las situaciones no exper-imentadas anteriormente mediante la cognici´on. Los principales componentes de la cognici´on son el aprendizaje, planificaci´on y atenci´on [34]. El aprendizaje permite al individuo cognitivo generar ha-bilidades y conocimiento basado en informaci´on instruida por el ambiente que rodea al mencionado individuo. Los fen´omenos y circunstancias mencionados anteriormente son generados, o tienen lugar, en el ambiente del cual aprende el individuo, as´ı una vez estos ocurren el individuo tiene el potencial de poderlos afrontar funcionalmente la pr´oxima ocasi´on que se presenten. La planificaci´on puede ser vista como el proceso se usar las habilidades obtenidas, mediante el aprendizaje, para llevar a cabo un an´alisis de las consecuencias causadas por la hipot´etica realizaci´on de una acci´on que afecte al ambiente que rodea al individuo. De acuerdo a la informaci´on obtenida por las suposiciones en el proceso de planificaci´on se puede llevar, o no, a cabo una acci´on o procedimiento sobre el ambiente, tal que se minimicen los riesgos asociados. Por ´ultimo, la atenci´on que en este contexto se le puede dar una definici´on de razonamiento por sobre como se atiende o interpreta la informaci´on que se obtiene del ambiente.
Como se puede ver, el uso de procesos pertenecientes a la cognici´on tiene el potencial de solventar los inconvenientes de robustez y adaptabilidad presentes en la mayor´ıa de t´ecnicas de control moderno. As´ı, un sistema capaz de aprender, o ser ense˜nado, otorga un nivel de suficiencia y robustez al proceso y ambiente sobre el cual este se encuentra implementado. El componente de planificaci´on se encargar´ıa de disminuir y mitigar las consecuencias de las decisiones posibles de tomar, en otras palabras, dis-minuye el riesgo de afectaci´on sobre los componentes del sistema. Por ´ultimo, el razonamiento es una propiedad id´onea para lograr una nivel mayor de autonom´ıa en los sistemas.De acuerdo a lo anterior, surge la t´ecnica del Control Cognitivo. Esta t´ecnica busca implementar los componentes mencionados, en un sistema de control tal que se mejoren sus caracter´ısticas y desempe˜no.
El objetivo del trabajo es tomar como base los avances realizados en el tema de control cognitivo (Marco Hist´orico), y formalizar una manera recursiva de implementar la cognici´on, tomando como inspiraci´on
la forma en c´omo funcionan dichas propiedades en el mundo natural. Luego, se implementa el resultado en un sistema real, con altos ´ındices de impredecibilidad del ambiente. Se analizan los resultados en temas de desempe˜no y en base a una relaci´on econ´omica, para determinar el atractivo de implementar el resultado en la pr´actica.
3.2
Especificaciones
El resultado obtenido con el trabajo realizado debe cumplir con los siguientes lineamientos:
• Aplicar el resultado sobre un sistema en el marco local donde exista una alta variaci´on de las variables incidentes del ambiente.
• La forma de presentaci´on del resultado deber ser recursiva. De tal manera que pueda ser adapt-able ´optimamente a cualquier sistema de control.
• El desempe˜no y funcionamiento del sistema sobre el cual se aplica el resultado no debe verse afectado frente a variaciones o indeterminaciones que se presenten el ambiente que lo rodea.
• Las normas, leyes y restricciones que est´en presentes en el sistema a probar el resultado, deben ser respetadas con el fin dar al resultado el potencial de ser aplicado en la pr´actica.
• El cargo computacional demandado por el resultado debe ser lo suficientemente funcional, tal que se pueda desempe˜nar en aplicaciones reales cuyo tiempo de muestreo lo permita.
Cap´ıtulo 4
Metodolog´ıa del trabajo
Teniendo en cuenta los objetivos del proyecto y las especificaciones establecidas, se describe los hitos y etapas de desarrollo del trabajo realizado. Primero, se expone el plan de trabajo llevado a cabo junto con las respectivas etapas. Segundo, se hace una descripci´on de las principales fuentes de informaci´on tenidas en cuenta para construir la base del proyecto. Por ´ultimo, se presentan las alternativas que se presentaron durante la realizaci´on del trabajo.
4.1
Plan de trabajo
El desarrollo del proyecto tuvo un desarrollo en etapas secuenciales. Esto se debe a la reducida base bibliogr´afica que existe al respecto, y al objetivo de exponer la t´ecnica de una forma fundamental.
• Revisi´on Bibliogr´afica: Con el objetivo de construir una base bibliogr´afica de los desarrollos existentes a fines o relacionados con la t´ecnica de Control Cognitivo, se recurre a bases de datos especializadas. Los principales aportes se obtienen de IEEEXplore, Springer Link y Science Direct. El tiempo dedicado a la etapa fue de cuatro semanas, debido a la importancia de conocer los desarrollos existes y extraer lo m´as ´util de cada uno para obtener un producto funcional.
• Construcci´on Marco Te´orico: Una vez obtenida una base de referencias sobre la cual soportar la esencia del Control Cognitivo, se procede a generar una forma sistem´atica de condensar los puntos en com´un de lo entendido por Control Cognitivo de manera tal que el producto cumpla con las restricciones establecidas. Dicha forma sistem´atica deriv´o en un Control Cognitivo a forma de algoritmo. El proceso de generaci´on del algoritmo tuvo una duraci´on de cuatro semanas.
• Simulaci´on: Una vez obtenido el algoritmo de Control Cognitivo, se procede a buscar una aplicaci´on id´onea para probar sus propiedades por medio de simulaci´on. La aplicaci´on elegida fue el sistema de iluminaci´on p´ublica. Dicha aplicaci´on presenta elevadas indeterminaciones y ruido en el ambiente sobre el cual funciona, lo cual puede ser usado para mejorar el desempe˜no y eficiencia del sistema. Se investig´o sobre la informaci´on t´ecnica de un parque p´ublico, es decir, infraestructura el´ectrica, control del parque, y reglamentaciones pertinentes. Adem´as, se puso a prueba el desempe˜no del algoritmo al variar los par´ametros sintonizables presentes en este. Esta etapa tuvo una duraci´on de cuatro semanas.
• An´alisis de Resultados: Tomando como base los datos obtenidos por las simulaciones, se lleva a cabo una comparaci´on directa con el funcionamiento del parque en el d´ıa a d´ıa. La comparaci´on se enfoca hacia los elementos de consumo el´ectrico y cumplimiento de las normas administrativas. Esta tarea se realiz´o durante 2 semanas.
• Detalles, Conclusiones y Documento: Particularidades como pulir el algoritmo, declarar las conclusiones y escribir el documento, tuvieron lugar en las dos ´ultimas semanas de desarrollo del proyecto.
Se mantuvieron reuniones regulares con el asesor para presentar y evaluar el estado de desarrollo del proyecto. Al final de cada reuni´on se determinaban conjuntamente los pasos a seguir para darle continuidad al proyecto. Se tuvieron entregas puntuales con la presentaci´on del estado del arte, con los primeros resultados de simulaci´on y con la presentaci´on de la informaci´on t´ecnica obtenida acerca del sistema de iluminaci´on p´ublica objetivo.
4.2
B´
usqueda de informaci´
on
Como se mencion´o anteriormente, se recurre principalmente a bases de datos especializadas en cien-cias e ingenier´ıa donde el pricipal recurso fueron art´ıculos cient´ıficos. La fuente IEEEXplore funcion´o como la base principal de referencias para los ´ultimos desarrollos y teor´ıa existente respecto a Control Cognitivo. Mientras que Springer Link y Science Direct, fueron fuentes donde la mayor´ıa de trabajos hac´ıan referencia hacia aplicaciones implementadas con Control Cognitivo.
Adem´as, materias como An´alisis de Sistemas de Control y Control Predictivo (MPC) fueron bases de conocimiento indispensables y determinantes al momento de desarrollar al algoritmo de implementaci´on de Control Cognitivo. El modelamiento del sistema a simular, la sintonizaci´on de los par´ametros del algoritmo y la evaluaci´on del desempe˜no del resultado fue ampliamente influenciado por la preparaci´on acad´emica obtenida de An´alisis de Sistemas de Control. Adem´as, especialmente, lo que concierne al desarrollo de la parte de planificaci´on del algoritmo fue influenciada y guiada por lo instruido en Control Predictivo (MPC).
4.3
Alternativas de desarrollo
Las referencias encontradas y expuestas en el marco hist´orico de este documento hacen ver la variedad de concepciones e interpretaciones que se tienen en el medio respecto al Control Cognitivo. Adem´as, se muestra la ausencia de trabajos relacionados al Control Cognitivo aplicado a la ingenier´ıa el en marco nacional. As´ı que, de cierta manera se llev´o a cabo un an´alisis de todas las alternativas existentes de Control Cognitivo. De cada alternativa se tomo lo ´util para cumplir con los lineamientos propuestos, e.g. relevancia en cuanto a la aplicabilidad a sistemas existentes en el ´ambito local, infraestructura necesaria para implementaci´on, entre otras. As´ı que, finalmente se llega a un algoritmo compuesto e influenciado por lo estipulado en el marco hist´orico.
Sin embargo, en cuanto a la aplicaci´on y su respectiva simulaci´on se encuentra una amplia gama de sistemas de iluminaci´on p´ublica a nivel local, m´as espec´ıficamente en Bogot´a D.C. Desde un comienzo se decide trabajar e implementar el resultado sobre un modelo del Parque de la 93, puesto que la iluminaci´on combinada de edificios alrededor del parque junto con la proveniente de los autom´oviles circulantes provee un ambiente con altas interferencias lum´ınicas, lo cual crea un entorno propicio para la aplicaci´on de Control Cognitivo. Pero, una vez obtenido un algoritmo de implementaci´on, se recurre a la Unidad Administrativa Especial de Servicios P´ublicos (UAESP) con el fin de obtener informaci´on t´ecnica pertinente para adaptar el Control Cognitivo al sistema y se decide cambiar el sistema objetivo al Parque Le´on de Greiff. Dado que el Parque de la 93 cuenta con luminarias incandescentes, m´as del 50% de las cuales se encuentra en la parte central del parque (donde no hay incidencia considerable del ambiente) y la cantidad de luminarias es elevada (posteriormente se expone el porqu´e esto representa un inconveniente) se cambia a la otra alternativa puesto que esta se encuentra dotada de iluminaci´on LED, el n´umero de luminarias es menor, el m´etodo de c´alculo de iluminancia est´a bien definido y la mayor´ıa de las zonas del parque se ven alteradas lum´ınicamente por fen´omenos externos.
Cap´ıtulo 5
Trabajo realizado
El objetivo principal del proyecto es generar un algoritmo para la implementaci´on de la t´ecnica de Con-trol Cognitivo y con base a esto obtener un fundamento para el futuro desarrollo de esta t´ecnica. As´ı ppues, se llev´o a cabo una profunda revisi´on bibliogr´afica con el fin de plantar las bases del proyecto. El resultado fue la consecuci´on de una fuerte base te´orica y procedimental a partir de los desarrollos de Simon Haykin [7], [35], [36], [37], [38].
A diferencia de las dem´as t´ecnicas y concepciones resumidas en la secci´on de marco hist´orico donde la mayor´ıa usa modelos preestablecidos del ambiente, usa tablas donde los agentes comparan que tan s´ımil es la situaci´on que est´an experimentando con los datos de las tablas, se enfocan en la sem´antica de la comunicaci´on entre agentes, propone topolog´ıas para el control cognitivo mas no desarrollan el concepto, entre otras razones. Los anteriores elementos van en contra de objetivos b´asicos del proyecto como lo son la robustez frente a cualquier indeterminaci´on no tenida en cuenta en la etapa de dise˜no, la adaptabilidad del controlador a sistemas y ambientes de toda ´ındole y, sobre todo, la meta de explicar la t´ecnica de manera implementable. Sin embargo, el control cognitivo de Haykin [7] expone la t´ecnica de manera sistem´atica, y lo hace mediante un algoritmo generalizado. Adem´as, ofrece una explicaci´on minuciosa y concisa de los t´erminos de aprendizaje, planificaci´on y atenci´on.
No obstante, los trabajos de Hakyn est´an ampliamente dirigidos hacia sistemas de radares [37], [38] y radios cognitivos [36], las cuales son aplicaciones poco desarrolladas en el contexto local. Por ende, fueron necesarios ajustes y reformulaciones para poder implementar el control cognitivo al sistema de iluminaci´on p´ublica del parque Le´on de Greiff. El aspecto m´as significativo tuvo que ver con lo que Haykin denomina elEstado Entr´opico del sistema. Dicho estado hace referencia a la forma de cuantificar la brecha de incertidumbre presente en las mediciones obtenidas por los sensores de las variables del ambiente. As´ı pues, este control cognitivo se enfoca en el paradigma de reducir elestado entr´opicodel sistema con el fin de mitigar el riesgo e incertidumbre existentes en el ambiente que rodea, especialmente, a los radares y a los radios. Elestado entr´opicose obtiene a partir de lo que ´el denom-ina como un perceptor basado en funciones de densidad de probabilidad. En otras palabras, Haykin intenta controlar la interpretaci´on que da el sistema a la informaci´on de entrada con el fin de disminuir las incertidumbres debidas a las constantes se˜nales de ruido que afectan los sistemas de comunicaciones.
Por lo tanto, se decide cambiar el objetivo de control de Haykin de manera tal que el control cognitivo pueda ser usado en una mayor variedad de aplicaciones de un rango m´as cotidiano y concerniente al contexto local. Por ende, los lineamientos de aprendizaje, planificaci´on y atenci´on cambian el prop´osito de reducir el estado entr´opico del sistema por el objetivo de llevar el sistema a un estado deseado. Es as´ı como el proyecto dirige el control hacia conducir y mantener el sistema en un estado deseado, velando por reducir la diferencia entre el estado deseado y el estado actual (error), y por la robustez y adaptabilidad frente a fen´omenos presentes e inevitables del ambiente. Esto se logra mediante la