3. Estado del Arte
3.2. Arquitecturas Cognitivas Artificiales
3.2.2. Arquitecturas de Aproximaci´on Emergente
3.2.2.1. Arquitectura AAR y Arquitectura de Subsumci´on
La arquitectura ARR (Vernon et al., 2007) (por su acr´onimo en ingl´es de Autonomous Agent Robotics), as´ı como los sistemas cognitivos basados en comportamientos, repre- sentan una alternativa emergente a las aproximaciones cognitivistas. En lugar de definir una descomposici´on funcional de los procesos de la arquitectura (e.g., la representaci´on de conocimiento, la formaci´on de conceptos, el razonamiento, etc.), la arquitectura ARR se basa en la interacci´on de m´ultiples sistemas independientes. Inicialmente, la arquitec- tura define una estructura que le permite al agente actuar efectivamente en situaciones simples; luego, son agregadas incrementalmente nuevas capas que incorporan sistemas m´as sofisticados, cada una con la capacidad de subsumir las capas inferiores. Este prin- cipio de dise˜no se basa en la arquitectura de subsumci´on propuesta por Brooks (Brooks, 1986).
De acuerdo con Brooks, la Arquitectura de subsumci´on est´a construida por capas de comportamientos d´ebilmente acoplados entre s´ı, que operan de forma local y as´ıncrona, donde las capas de niveles superiores se apoyan en las inferiores para crear comporta- mientos m´as complejos: el comportamiento del sistema se contempla como un todo que emerge de la interacci´on de m´ultiples comportamientos simples. Por otro lado, Brooks propone (Brooks, 1991) que cada capa o comportamiento de la arquitectura es controla- da por una M´aquina de Estado Finita Aumentada (MEFA) (v´ease la figura 3.15). Cada MEFA define un conjunto de se˜nales entrada y de salida que se conectan directamente con los respectivos sensores y actuadores del agente. Cuando la entrada de una MEFA excede un umbral predeterminado, el comportamiento de esa MEFA es activado. Adicio- nalmente, a trav´es de se˜nales de supresi´on o de inhibici´on, una MEFA puede subsumir la acci´on de otras a fin de que el sistema exhiba un comportamiento coherente. Dentro de las debilidades principales de la arquitectura de subsumci´on se pueden mencionar:
La Arquitectura presenta un alto acoplamiento entre la percepci´on y la actuaci´on, lo que permite un comportamiento reactivo, aunque una capacidad limitada de de- liberaci´on.
Debido a la ausencia de una representaci´on interna del mundo y a la necesidad de definir a priori la conexi´on entre los comportamientos, la arquitectura tiene capa- cidades muy limitadas de aprendizaje y de adaptabilidad a nuevos entornos. Varias extensiones del modelo de subsumci´on han intentado incorporar ciertas caracter´ısticas de representaci´on interna y de arbitraje de comportamientos, co- mo la Arquitectura de Control Basada en Comportamientos (Mataric, 1992) y los Sistemas de Activaci´on Hormonal (Brooks, 1991), sin embargo, la necesidad de pre-conectar los comportamientos y la ausencia de aprendizaje se mantienen a´un persistentes, constri˜nendo la arquitectura a solamente entornos espec´ıficos y pre- configurados, donde priman las conductas reactivas en lugar de las deliberativas.
Cap´ıtulo 3. Estado del Arte
Figura 3.15: Arquitectura de Subsumci´on. Procesos de Inhibici´on y Supresi´on. Adaptada de (Brooks, 1986).
En cuanto a la arquitectura ARR, ´esta se basa esencialmente en los principios del modelo de subsumci´on, aunque propone la sustituci´on de los m´odulos MEFA por sub- sistemas de procesamiento m´as complejos. Pese a las mejoras que supone la inclusi´on de estos sub-sistemas, AAR continua heredando algunas de las debilidades del modelo original de subsumci´on. Una de las limitaciones propias de ARR, que se debe a la gran explosi´on de estados que resultan de la integraci´on incremental de los sub-sistemas, es la dificultad de que emerja un dise˜no bien estructurado que produzca una actividad coordi- nada. Esto a su vez impone la necesidad de crear alg´un tipo de auto-gesti´on, algo que no se concibe en la Arquitectura de Subsumci´on original ni tampoco en ARR.
Una segunda limitaci´on es que la arquitectura con el tiempo empieza a presentar pro- blemas en la identificaci´on de las se˜nales ambientales y en la producci´on de secuencias correctas de acciones o actividades, lo que produce un aumento en la complejidad del de- sarrollo de la tarea. Por otro lado, AAR no expone adecuadamente una teor´ıa comprehen- sible sobre la cognici´on: debido a que el modelo de subsumci´on define una escalabilidad limitada del sistema, resulta dif´ıcil que la arquitectura exhiba facultades cognitivas de orden superior (i.e., el agente no puede explicar el funcionamiento del comportamiento auto-dirigido que emplea), lo que convierte a la arquitectura en un sistema que integra comportamientos complejos pero que s´olo presenta cualidades de un sistema reactivo t´ıpico.
3.2.2.2. Arquitectura GWM: Competencia y Simulaci´on
Shanahan (Shanahan, 2006) propone una arquitectura cognitiva llamada GWM (por su acr´onimo en ingl´es de Global Workspace Model), que es biol´ogicamente plausible e inspirada en el funcionamiento del cerebro humano a nivel neuronal. En GWM, las fun- ciones cognitivas relacionadas con la anticipaci´on y la planificaci´on son llevadas a ca-
3.2. Arquitecturas Cognitivas Artificiales
bo mediante un mecanismo que simula internamente las interacciones con el ambiente, mientras que la selecci´on de acciones (tanto externas como internas), es mediada por un mecanismo afectivo.
En contraste con la manipulaci´on de representaciones simb´olicas y declarativas que realizan habitualmente las arquitecturas de enfoque cognitivista, GWM representa el co- nocimiento (de forma sub-simb´olica) a trav´es de mapas neuronales organizados topo- gr´aficamente, donde la selecci´on de acciones resulta de la activaci´on de pautas que co- rrelacionan entradas sensoriales del sistema con salidas efectoras espec´ıficas. Shanahan argumenta que tales representaciones sub-simb´olicas resultan particularmente apropiadas para la cognici´on espacial (Shanahan, 2006), la cual resulta ser una capacidad cognitiva crucial, aunque significativamente compleja cuando se emplean aproximaciones tradicio- nales basadas solamente en la l´ogica.
Shanahan propone, en su arquitectura, un modelo deArea de Trabajo Global´ basado en la teor´ıa de Baars (Baars, 2002), a partir del cual emergen una secuencia de estados que proceden de la interacci´on de m´ultiples procesos que operan de forma aislada y en paralelo, como se observa en la figura 3.16.a. Estos procesos especializados cooperan y compiten entre s´ı a fin de obtener el acceso al ´area de trabajo global. El (los) ganador(es) de la competici´on se hace(n) con el control consciente del agente y puede(n) difundir informaci´on hacia otros procesos especializados quienes contin´uan compitiendo por ser los ganadores en el siguiente ciclo de ejecuci´on.
a) b)
Figura 3.16: Arquitectura de ´Area de Trabajo Global. a) Coordinaci´on de procesos con- currentes. b) Mecanismo de prospecci´on que emplea la simulaci´on sensoriomotriz. SC: Corteza Sensorial, MC: Corteza Motriz, BG: Ganglios Basales (selecci´on de acciones), AC: Corteza de Asociaci´on, Am: Am´ıgdala (emociones). Adaptada de (Shanahan, 2006).
La arquitectura GWM se compone de dos bucles principales: un bucle sensoriomo- triz de primer orden asociado con el mundo externo, y un bucle sensoriomotriz de orden superior conectado internamente con las memorias asociativas, como se observa en la Figura 3.16.b. El bucle de primer orden emula las funciones de la corteza sensorial y del ganglio basal (que controla la corteza motriz), provocando asimismo un arco reflejo de acci´on-percepci´on. El bucle de segundo orden comprende dos elementos corticales aso- ciativos los cuales llevan a cabo simulacionesoffline (es decir, durante un proceso fuera de l´ınea) de las interacciones entre el sistema sensorial y la correspondiente respuesta motriz. La primera corteza asociativa simula una salida motriz, mientras que la segunda
Cap´ıtulo 3. Estado del Arte
simula los est´ımulos sensoriales esperados que dan lugar a la siguiente respuesta motriz, y as´ı sucesivamente. Posteriormente, el bucle de mayor orden modula efectivamente la selecci´on de acciones producida por el ganglio basal del bucle de primer orden a trav´es de un componente influido por emociones que simula la funci´on de la am´ıgdala del cerebro. La arquitectura es capaz de anticipar y planificar los comportamientos futuros a trav´es de un proceso similar al de la “imaginaci´on” (e.g., la simulaci´on asociativa interna de los mecanismos sensoriomotrices del agente). Sin embargo, el modelo de ´area de trabajo global no corresponde con una ´area particular de la zona cortical cerebral sino que, por el contrario, presenta las caracter´ısticas t´ıpicas de una red global de comunicaciones. En la Figura 3.16.b se ilustra grosso modo la manera en que la arquitectura logra coordi- nar los procesos de prospecci´on y anticipaci´on a trav´es de la simulaci´on sensoriomotriz. Por ´ultimo, en cuanto a los m´odulos de memoria, la arquitectura est´a implementada co- mo un sistema conexionista que emplea grupos de componentes denominadosG-RAMs:
Memorias Generalizadas de Acceso Aleatorio(Aleksander, 1990).
3.2.2.3. Arquitectura SASE: simulando niveles de consciencia
Weng (Weng, 2004) propone una arquitectura cognitiva emergente llamada SASE (por su acr´onimo en ingl´es deSelf-Aware Self-Effecting), la cual concibe la cognici´on como un proceso de “desarrollo evolutivo”, esto es, que tanto el conocimiento como las facultades cognitivas no son aspectos que se especifican (o programan) a priori, sino que son el resultado de la interacci´on en tiempo real del agente con el ambiente, con otros agentes, y con humanos. Por tanto, la arquitectura no posee un dise˜no pre-definido que determine la manera de realizar ciertas tareas, sino que el sistema est´a dotado con capacidades para adaptarse a las necesidades ambientales y aprender la forma en que debe lograr dichas tareas.
Weng se refiere a su arquitectura como un sistema auto-consciente y auto-consecuente (Weng, 2004). Esto supone dos distinciones importantes en la arquitectura: (1) existe un conjunto de sensores y efectores que est´an acoplados con el ambiente mediante un me- canismo sensorial proprioceptivo, y (2) existe un conjunto de sensores y efectores que est´an asociados con el cerebro y con el sistema nervioso central (SNC) del agente. Seg´un Wengs, s´olo aquellos sistemas que definen mecanismos expl´ıcitos para percibir y afectar el SNC califican como arquitecturas SASE.
Algunas de las implicaciones asociadas a la construcci´on de agentes cognitivos que emplean la arquitectura SASE son: el sistema es configurado sin un conocimiento pre- vio acerca de las tareas que tendr´a que desempe˜nar el agente, el SNC del agente no es accesible directamente por los dise˜nadores (humanos) una vez est´a en ejecuci´on y, co- mo consecuencia, la ´unica manera que un humano puede afectar el comportamiento del agente es a trav´es de sensores y efectores externos. En la figura 3.17 se observa la manera en que interact´uan los componentes internos de la arquitectura con el ambiente a trav´es de los sensores y efectores.
La arquitectura SASE es muy fiel al paradigma de cognici´on emergente, en especial a la aproximaci´on enactiva: su filogenia es inmutable y es s´olo a trav´es del desarrollo ontogen´etico que el sistema puede aprender a operar efectivamente en su ambiente. El
3.2. Arquitecturas Cognitivas Artificiales
Figura 3.17: Arquitectura SASE. Adaptada de (Weng, 2004).
concepto de operaci´on de SASE es similar al nivel dos de los principios organizaciona- les autopoi´eticos introducidos por Maturana y Varela (Maturana y Varela, 1987) (como ejemplo, la auto-producci´on y el auto-desarrollo descritos en la secci´on 2.1.1).
Los procesos cognitivos en SASE se basan en procesos de decisi´on markovianos (PDM), espec´ıficamente, en procesos markovianos orientados a la observaci´on auto- consciente y auto-consecuente (PDM-OOACAC). En un espectro de PDMs donde var´ıan los grados de complejidad cognitiva y conductual, Weng situ´o esta particular arquitectura en un primer tipo de sistemas cuya principal caracter´ıstica es la capacidad de desarrollar evolutivamente sus propias estructuras cognitivas (Weng, 2004).
En cuanto al sistema sensoriomotriz de PDM-OOACAC, ´este define tres tipos de car- tografiado neuronal para los flujos de informaci´on internos: un cartografiado sensorial, un cartografiado cognitivo, y un cartografiado motriz. La raz´on para que exista m´as de una ruta cognitiva entre el cartografiado sensorial y el cartografiado motriz posee una motiva- ci´on neuro-biol´ogica: una ruta encapsula los comportamientos innatos (y las capacidades filogen´eticas que posee el sistema), mientras que las otras encapsulan los comportamien- tos aprendidos (y las capacidades ontog´enicas del sistema). Estas rutas son mediadas por un motor de conversi´on basado en el modelo de subsumci´on, el cual confiere una prioridad m´as alta a la ruta de desarrollo ontog´enica.
La principal aplicaci´on de esta arquitectura ha sido en plataformas rob´oticas. En estas implementaciones, el sistema sensoriomotriz ejecuta en cascada los tres tipos de carto- grafiado: el sistema de cartografiado sensorial imita la distribuci´on neuronal jer´arquica de las cortezas visuales del cerebro, el cartografiado cognitivo controla los comportamien- tos innatos y aprendidos, y el cartografiado motriz, a trav´es del modelo de subsumci´on, arbitra los comportamientos producidos por el cartografiado cognitivo. Las implementa- ciones de SASE se basan en aproximaciones evolucionistas (en ingl´es, developmental ap- proaches) enfocadas hacia tareas tales como el reconocimiento de objetos, la navegaci´on guiada por el sistema de visi´on, el aprendizaje del habla, el aprendizaje comunicativo, y la adquisici´on de nuevas destrezas (empleando o no un profesor que gu´ıa el aprendizaje).
Cap´ıtulo 3. Estado del Arte
3.2.2.4. Arquitectura DARWIN: Dispositivos basados en cerebros rob´oticos neuro- mim´eticos
Kirchmar (Krichmar y Edelman, 2006) ha desarrollado en la ´ultima d´ecada una serie de plataformas rob´oticas bajo el nombre de DARWIN, mediante las cuales es posible ex- perimentar con agentes evolutivos. Estos sistemas se componen de “dispositivos basados en el cerebro” (DBC), los cuales incorporan un sistema nervioso artificial mediante el cual el agente puede desarrollar tanto una memoria espacial y epis´odica, como ciertas capacidades de reconocimiento de patrones. Como tal, los DBCs son una aproximaci´on neuro-mim´etica del paradigma emergente que emplean principalmente modelos enacti- vos y conexionistas.
Darwin difiere de la mayor´ıa de aproximaciones conexionistas en que el modelado de la arquitectura se ci˜ne mucho m´as en la estructura y organizaci´on que tiene el cere- bro humano. Por ejemplo, los DBCs definen un sistema nervioso central basado en redes neuronales artificiales, el cual act´ua como un todo en lugar de definir una implemen- taci´on neuronal que controle independientemente las funciones de control, memoria, o reconocimiento de patrones, como suele definirse en la mayor´ıa de arquitecturas basadas en modelos conexionistas. Los principales mecanismos neuronales de la aproximaci´on DBC son: un sistema de refuerzo, un conjunto de procesos de conectividad re-entrante, un mecanismo de sincronizaci´on din´amica de la actividad neuronal, un proceso que con- trola la plasticidad sin´aptica, y un conjunto de unidades neuronales con propiedades de respuesta espacio-temporal.
La versi´on de Darwin VIII es capaz de discriminar objetivos visuales simples (formas geom´etricas con colores) mediante la asociaci´on de una se˜nal auditiva innata. Este siste- ma nervioso simulado contiene 28 ´areas neuronales, aproximadamente 54.000 unidades neuronales, y alrededor de 1.7 millones de conexiones sin´apticas. Desde la perspectiva de comportamiento, Darwin VIII est´a condicionado para seleccionar preferentemente un ob- jetivo sobre otros, mediante la asociaci´on de una se˜nal auditiva o visual, lo que demuestra su capacidad para orientar el foco de atenci´on hacia un objetivo espec´ıfico.
Darwin IX puede navegar y categorizar texturas empleando para ello una especie de bigotes artificiales basados en la neuro-anatom´ıa simulada de un sistema somatosenso- rial9de una rata, y cuyo sistema nervioso comprende 17 ´areas neuronales, 1.101 unidades neuronales, y aproximadamente 8.400 conexiones sin´apticas.
Por ´ultimo, Darwin X es capaz de desarrollar una memoria espacial y epis´odica ba- sada en un modelo del hipocampo y de las regiones circundantes del cerebro. Su sistema nervioso simulado contiene 50 ´areas neuronales, 90.000 unidades neuronales, y 1.4 mi- llones de conexiones sin´apticas. Esta configuraci´on incluye un sistema visual, un sistema de direcci´on de la cabeza, una formaci´on hipoc´ampica, un cerebro basal, un sistema de refuerzo basado en una funci´on del sistema dopamin´ergico10, y un sistema de selecci´on
9
El sistema somatosensorial o sensorial som´atico permite al ser vivo experimentar sensaciones en las distintas partes del cuerpo. Pueden ser sensaciones del tacto, temperatura, de la posici´on de las partes del cuerpo o del dolor. Los receptores del sistema somatosensorial se encuentran repartidos por todo el cuerpo y sirven para detectar los est´ımulos mec´anicos, qu´ımicos y f´ısicos (Kandel et al., 1991).
10Se trata de un sistema qu´ımico de gran importancia en la transmisi´on de impulsos en el cerebro, el cual
3.2. Arquitecturas Cognitivas Artificiales
de acciones. Finalmente, el sistema de visi´on es usado para reconocer objetos y luego estimar su posici´on, de tal manera que el agente luego puede desempe˜nar actividades de navegaci´on y exploraci´on.