Arquitecturas de Aproximaci´on Emergente - Arquitecturas Cognitivas Artificiales

3. Estado del Arte

3.2. Arquitecturas Cognitivas Artificiales

3.2.2. Arquitecturas de Aproximaci´on Emergente

3.2.2.1. Arquitectura AAR y Arquitectura de Subsumci´on

La arquitectura ARR (Vernon et al., 2007) (por su acrónimo en inglés de Autonomous Agent Robotics), as´ı como los sistemas cognitivos basados en comportamientos, repre- sentan una alternativa emergente a las aproximaciones cognitivistas. En lugar de definir una descomposición funcional de los procesos de la arquitectura (e.g., la representación de conocimiento, la formación de conceptos, el razonamiento, etc.), la arquitectura ARR se basa en la interacción de múltiples sistemas independientes. Inicialmente, la arquitectura define una estructura que le permite al agente actuar efectivamente en situaciones simples; luego, son agregadas incrementalmente nuevas capas que incorporan sistemas más sofisticados, cada una con la capacidad de subsumir las capas inferiores. Este prin- cipio de diseño se basa en la arquitectura de subsumción propuesta por Brooks (Brooks, 1986).

De acuerdo con Brooks, la Arquitectura de subsumción está construida por capas de comportamientos débilmente acoplados entre s´ı, que operan de forma local y as´ıncrona, donde las capas de niveles superiores se apoyan en las inferiores para crear comportamientos más complejos: el comportamiento del sistema se contempla como un todo que emerge de la interacción de múltiples comportamientos simples. Por otro lado, Brooks propone (Brooks, 1991) que cada capa o comportamiento de la arquitectura es controla- da por una Máquina de Estado Finita Aumentada (MEFA) (véase la figura 3.15). Cada MEFA define un conjunto de señales entrada y de salida que se conectan directamente con los respectivos sensores y actuadores del agente. Cuando la entrada de una MEFA excede un umbral predeterminado, el comportamiento de esa MEFA es activado. Adicio- nalmente, a través de señales de supresión o de inhibición, una MEFA puede subsumir la acción de otras a fin de que el sistema exhiba un comportamiento coherente. Dentro de las debilidades principales de la arquitectura de subsumción se pueden mencionar:

La Arquitectura presenta un alto acoplamiento entre la percepción y la actuación, lo que permite un comportamiento reactivo, aunque una capacidad limitada de de- liberación.

Debido a la ausencia de una representación interna del mundo y a la necesidad de definir a priori la conexión entre los comportamientos, la arquitectura tiene capacidades muy limitadas de aprendizaje y de adaptabilidad a nuevos entornos. Varias extensiones del modelo de subsumción han intentado incorporar ciertas caracter´ısticas de representación interna y de arbitraje de comportamientos, como la Arquitectura de Control Basada en Comportamientos (Mataric, 1992) y los Sistemas de Activación Hormonal (Brooks, 1991), sin embargo, la necesidad de pre-conectar los comportamientos y la ausencia de aprendizaje se mantienen aún persistentes, constriñendo la arquitectura a solamente entornos espec´ıficos y pre- configurados, donde priman las conductas reactivas en lugar de las deliberativas.

 Cap´ıtulo 3. Estado del Arte

Figura 3.15: Arquitectura de Subsumción. Procesos de Inhibición y Supresión. Adaptada de (Brooks, 1986).

En cuanto a la arquitectura ARR, ésta se basa esencialmente en los principios del modelo de subsumción, aunque propone la sustitución de los módulos MEFA por sub- sistemas de procesamiento más complejos. Pese a las mejoras que supone la inclusión de estos sub-sistemas, AAR continua heredando algunas de las debilidades del modelo original de subsumción. Una de las limitaciones propias de ARR, que se debe a la gran explosión de estados que resultan de la integración incremental de los sub-sistemas, es la dificultad de que emerja un diseño bien estructurado que produzca una actividad coordi- nada. Esto a su vez impone la necesidad de crear algún tipo de auto-gestión, algo que no se concibe en la Arquitectura de Subsumción original ni tampoco en ARR.

Una segunda limitación es que la arquitectura con el tiempo empieza a presentar pro- blemas en la identificación de las señales ambientales y en la producción de secuencias correctas de acciones o actividades, lo que produce un aumento en la complejidad del desarrollo de la tarea. Por otro lado, AAR no expone adecuadamente una teor´ıa comprehen- sible sobre la cognición: debido a que el modelo de subsumción define una escalabilidad limitada del sistema, resulta dif´ıcil que la arquitectura exhiba facultades cognitivas de orden superior (i.e., el agente no puede explicar el funcionamiento del comportamiento auto-dirigido que emplea), lo que convierte a la arquitectura en un sistema que integra comportamientos complejos pero que sólo presenta cualidades de un sistema reactivo t´ıpico.

3.2.2.2. Arquitectura GWM: Competencia y Simulaci´on

Shanahan (Shanahan, 2006) propone una arquitectura cognitiva llamada GWM (por su acrónimo en inglés de Global Workspace Model), que es biológicamente plausible e inspirada en el funcionamiento del cerebro humano a nivel neuronal. En GWM, las funciones cognitivas relacionadas con la anticipación y la planificación son llevadas a ca-

3.2. Arquitecturas Cognitivas Artificiales 

bo mediante un mecanismo que simula internamente las interacciones con el ambiente, mientras que la selecci´on de acciones (tanto externas como internas), es mediada por un mecanismo afectivo.

En contraste con la manipulación de representaciones simbólicas y declarativas que realizan habitualmente las arquitecturas de enfoque cognitivista, GWM representa el conocimiento (de forma sub-simbólica) a través de mapas neuronales organizados topo- gráficamente, donde la selección de acciones resulta de la activación de pautas que co- rrelacionan entradas sensoriales del sistema con salidas efectoras espec´ıficas. Shanahan argumenta que tales representaciones sub-simbólicas resultan particularmente apropiadas para la cognición espacial (Shanahan, 2006), la cual resulta ser una capacidad cognitiva crucial, aunque significativamente compleja cuando se emplean aproximaciones tradicio- nales basadas solamente en la lógica.

Shanahan propone, en su arquitectura, un modelo deArea de Trabajo Global´ basado en la teor´ıa de Baars (Baars, 2002), a partir del cual emergen una secuencia de estados que proceden de la interacción de múltiples procesos que operan de forma aislada y en paralelo, como se observa en la figura 3.16.a. Estos procesos especializados cooperan y compiten entre s´ı a fin de obtener el acceso al área de trabajo global. El (los) ganador(es) de la competición se hace(n) con el control consciente del agente y puede(n) difundir información hacia otros procesos especializados quienes continúan compitiendo por ser los ganadores en el siguiente ciclo de ejecución.

a) b)

Figura 3.16: Arquitectura de Área de Trabajo Global. a) Coordinación de procesos con- currentes. b) Mecanismo de prospección que emplea la simulación sensoriomotriz. SC: Corteza Sensorial, MC: Corteza Motriz, BG: Ganglios Basales (selección de acciones), AC: Corteza de Asociación, Am: Am´ıgdala (emociones). Adaptada de (Shanahan, 2006).

La arquitectura GWM se compone de dos bucles principales: un bucle sensoriomotriz de primer orden asociado con el mundo externo, y un bucle sensoriomotriz de orden superior conectado internamente con las memorias asociativas, como se observa en la Figura 3.16.b. El bucle de primer orden emula las funciones de la corteza sensorial y del ganglio basal (que controla la corteza motriz), provocando asimismo un arco reflejo de acci´on-percepci´on. El bucle de segundo orden comprende dos elementos corticales aso- ciativos los cuales llevan a cabo simulacionesoffline (es decir, durante un proceso fuera de l´ınea) de las interacciones entre el sistema sensorial y la correspondiente respuesta motriz. La primera corteza asociativa simula una salida motriz, mientras que la segunda

 Cap´ıtulo 3. Estado del Arte

simula los est´ımulos sensoriales esperados que dan lugar a la siguiente respuesta motriz, y as´ı sucesivamente. Posteriormente, el bucle de mayor orden modula efectivamente la selección de acciones producida por el ganglio basal del bucle de primer orden a través de un componente influido por emociones que simula la función de la am´ıgdala del cerebro. La arquitectura es capaz de anticipar y planificar los comportamientos futuros a través de un proceso similar al de la “imaginación” (e.g., la simulación asociativa interna de los mecanismos sensoriomotrices del agente). Sin embargo, el modelo de área de trabajo global no corresponde con una área particular de la zona cortical cerebral sino que, por el contrario, presenta las caracter´ısticas t´ıpicas de una red global de comunicaciones. En la Figura 3.16.b se ilustra grosso modo la manera en que la arquitectura logra coordi- nar los procesos de prospección y anticipación a través de la simulación sensoriomotriz. Por último, en cuanto a los módulos de memoria, la arquitectura está implementada como un sistema conexionista que emplea grupos de componentes denominadosG-RAMs:

Memorias Generalizadas de Acceso Aleatorio(Aleksander, 1990).

3.2.2.3. Arquitectura SASE: simulando niveles de consciencia

Weng (Weng, 2004) propone una arquitectura cognitiva emergente llamada SASE (por su acrónimo en inglés deSelf-Aware Self-Effecting), la cual concibe la cognición como un proceso de “desarrollo evolutivo”, esto es, que tanto el conocimiento como las facultades cognitivas no son aspectos que se especifican (o programan) a priori, sino que son el resultado de la interacción en tiempo real del agente con el ambiente, con otros agentes, y con humanos. Por tanto, la arquitectura no posee un diseño pre-definido que determine la manera de realizar ciertas tareas, sino que el sistema está dotado con capacidades para adaptarse a las necesidades ambientales y aprender la forma en que debe lograr dichas tareas.

Weng se refiere a su arquitectura como un sistema auto-consciente y auto-consecuente (Weng, 2004). Esto supone dos distinciones importantes en la arquitectura: (1) existe un conjunto de sensores y efectores que están acoplados con el ambiente mediante un mecanismo sensorial proprioceptivo, y (2) existe un conjunto de sensores y efectores que están asociados con el cerebro y con el sistema nervioso central (SNC) del agente. Según Wengs, sólo aquellos sistemas que definen mecanismos expl´ıcitos para percibir y afectar el SNC califican como arquitecturas SASE.

Algunas de las implicaciones asociadas a la construcción de agentes cognitivos que emplean la arquitectura SASE son: el sistema es configurado sin un conocimiento pre- vio acerca de las tareas que tendrá que desempeñar el agente, el SNC del agente no es accesible directamente por los diseñadores (humanos) una vez está en ejecución y, como consecuencia, la única manera que un humano puede afectar el comportamiento del agente es a través de sensores y efectores externos. En la figura 3.17 se observa la manera en que interactúan los componentes internos de la arquitectura con el ambiente a través de los sensores y efectores.

La arquitectura SASE es muy fiel al paradigma de cognición emergente, en especial a la aproximación enactiva: su filogenia es inmutable y es sólo a través del desarrollo ontogenético que el sistema puede aprender a operar efectivamente en su ambiente. El

3.2. Arquitecturas Cognitivas Artificiales 

Figura 3.17: Arquitectura SASE. Adaptada de (Weng, 2004).

concepto de operación de SASE es similar al nivel dos de los principios organizaciona- les autopoiéticos introducidos por Maturana y Varela (Maturana y Varela, 1987) (como ejemplo, la auto-producción y el auto-desarrollo descritos en la sección 2.1.1).

Los procesos cognitivos en SASE se basan en procesos de decisión markovianos (PDM), espec´ıficamente, en procesos markovianos orientados a la observación auto- consciente y auto-consecuente (PDM-OOACAC). En un espectro de PDMs donde var´ıan los grados de complejidad cognitiva y conductual, Weng situó esta particular arquitectura en un primer tipo de sistemas cuya principal caracter´ıstica es la capacidad de desarrollar evolutivamente sus propias estructuras cognitivas (Weng, 2004).

En cuanto al sistema sensoriomotriz de PDM-OOACAC, éste define tres tipos de cartografiado neuronal para los flujos de información internos: un cartografiado sensorial, un cartografiado cognitivo, y un cartografiado motriz. La razón para que exista más de una ruta cognitiva entre el cartografiado sensorial y el cartografiado motriz posee una motiva- ción neuro-biológica: una ruta encapsula los comportamientos innatos (y las capacidades filogenéticas que posee el sistema), mientras que las otras encapsulan los comportamientos aprendidos (y las capacidades ontogénicas del sistema). Estas rutas son mediadas por un motor de conversión basado en el modelo de subsumción, el cual confiere una prioridad más alta a la ruta de desarrollo ontogénica.

La principal aplicación de esta arquitectura ha sido en plataformas robóticas. En estas implementaciones, el sistema sensoriomotriz ejecuta en cascada los tres tipos de cartografiado: el sistema de cartografiado sensorial imita la distribución neuronal jerárquica de las cortezas visuales del cerebro, el cartografiado cognitivo controla los comportamientos innatos y aprendidos, y el cartografiado motriz, a través del modelo de subsumción, arbitra los comportamientos producidos por el cartografiado cognitivo. Las implementaciones de SASE se basan en aproximaciones evolucionistas (en inglés, developmental ap- proaches) enfocadas hacia tareas tales como el reconocimiento de objetos, la navegación guiada por el sistema de visión, el aprendizaje del habla, el aprendizaje comunicativo, y la adquisición de nuevas destrezas (empleando o no un profesor que gu´ıa el aprendizaje).

 Cap´ıtulo 3. Estado del Arte

3.2.2.4. Arquitectura DARWIN: Dispositivos basados en cerebros rob´oticos neuro- mim´eticos

Kirchmar (Krichmar y Edelman, 2006) ha desarrollado en la última década una serie de plataformas robóticas bajo el nombre de DARWIN, mediante las cuales es posible experimentar con agentes evolutivos. Estos sistemas se componen de “dispositivos basados en el cerebro” (DBC), los cuales incorporan un sistema nervioso artificial mediante el cual el agente puede desarrollar tanto una memoria espacial y episódica, como ciertas capacidades de reconocimiento de patrones. Como tal, los DBCs son una aproximación neuro-mimética del paradigma emergente que emplean principalmente modelos enacti- vos y conexionistas.

Darwin difiere de la mayor´ıa de aproximaciones conexionistas en que el modelado de la arquitectura se ciñe mucho más en la estructura y organización que tiene el cerebro humano. Por ejemplo, los DBCs definen un sistema nervioso central basado en redes neuronales artificiales, el cual actúa como un todo en lugar de definir una implemen- tación neuronal que controle independientemente las funciones de control, memoria, o reconocimiento de patrones, como suele definirse en la mayor´ıa de arquitecturas basadas en modelos conexionistas. Los principales mecanismos neuronales de la aproximación DBC son: un sistema de refuerzo, un conjunto de procesos de conectividad re-entrante, un mecanismo de sincronización dinámica de la actividad neuronal, un proceso que controla la plasticidad sináptica, y un conjunto de unidades neuronales con propiedades de respuesta espacio-temporal.

La versión de Darwin VIII es capaz de discriminar objetivos visuales simples (formas geométricas con colores) mediante la asociación de una señal auditiva innata. Este sistema nervioso simulado contiene 28 áreas neuronales, aproximadamente 54.000 unidades neuronales, y alrededor de 1.7 millones de conexiones sinápticas. Desde la perspectiva de comportamiento, Darwin VIII está condicionado para seleccionar preferentemente un objetivo sobre otros, mediante la asociación de una señal auditiva o visual, lo que demuestra su capacidad para orientar el foco de atención hacia un objetivo espec´ıfico.

Darwin IX puede navegar y categorizar texturas empleando para ello una especie de bigotes artificiales basados en la neuro-anatom´ıa simulada de un sistema somatosenso- rial9de una rata, y cuyo sistema nervioso comprende 17 ´areas neuronales, 1.101 unidades neuronales, y aproximadamente 8.400 conexiones sin´apticas.

Por último, Darwin X es capaz de desarrollar una memoria espacial y episódica basada en un modelo del hipocampo y de las regiones circundantes del cerebro. Su sistema nervioso simulado contiene 50 áreas neuronales, 90.000 unidades neuronales, y 1.4 millones de conexiones sinápticas. Esta configuración incluye un sistema visual, un sistema de dirección de la cabeza, una formación hipocámpica, un cerebro basal, un sistema de refuerzo basado en una función del sistema dopaminérgico10, y un sistema de selección

El sistema somatosensorial o sensorial somático permite al ser vivo experimentar sensaciones en las distintas partes del cuerpo. Pueden ser sensaciones del tacto, temperatura, de la posición de las partes del cuerpo o del dolor. Los receptores del sistema somatosensorial se encuentran repartidos por todo el cuerpo y sirven para detectar los est´ımulos mecánicos, qu´ımicos y f´ısicos (Kandel et al., 1991).

10_{Se trata de un sistema qu´ımico de gran importancia en la transmisi´on de impulsos en el cerebro, el cual}

3.2. Arquitecturas Cognitivas Artificiales 

de acciones. Finalmente, el sistema de visión es usado para reconocer objetos y luego estimar su posición, de tal manera que el agente luego puede desempeñar actividades de navegación y exploración.

In document Arquitectura Híbrida para Sistemas Cognitivos Artificiales Con Comportamiento Emergente, Adaptativo y Auto-organizado (página 99-105)