Los algoritmos desarrollados están inspirados en los recientes descubrimientos sobre el papel de células gliales denominadas astrocitos en el procesamiento de la información. En concreto, el concepto de la sinapsis tripartita fue el que asentó las bases de esta tesis. Los algoritmos desarrollados representan una simulación adaptada de astrocitos artificiales para interactuar con neuronas artificiales y funcionar en los sistemas conexionistas.
En la primera fase del estudio de los algoritmos gliales, se han desarrollado diferentes comportamientos biológicos de los astrocitos sobre cómo modifican las conexiones de las neuronas. Los algoritmos desarrollados se han probado por primera vez sobre dos tipos diferentes de problemas, dando lugar a una experimentación en 3 problemas de clasificación y 3 problemas de regresión. El análisis de los resultados de este estudio ha permitido extraer las siguientes conclusiones:
• Se ha demostrado que la eficiencia de las redes de neuronas artificiales, en arquitecturas multicapa conectadas totalmente hacia delante y entrenadas con algoritmos genéticos, aumenta al introducir en ellas los astrocitos artificiales, lo que refuerza los descubrimientos que indican que existe un rol crucial de los astrocitos en el procesamiento de la información en el cerebro mediante la sinapsis tripartita donde existe una comunicación bidireccional entre las neuronas y los astrocitos.
• Se ha podido comprobar que dependiendo del tipo del problema, es decir, si es de clasificación o de regresión, algunos algoritmos gliales funcionan mejor que otros. El algoritmo de efecto de atenuación astrocítico, es de los que mejor funciona en problemas de clasificación, mientras que en regresión hay otros algoritmos, como los que excitan una respuesta por parte de los astrocitos únicamente si las activaciones neuronales se producen de manera consecutiva, que tienen mejor desempeño. Esto se ha observado en el cerebro donde en los procesos cognitivos de aprendizaje y de memoria, unos caminos sinápticos se ven afectados por distintos procesos modulatorios y se desconoce bajo qué condiciones tienen lugar los posibles efectos modulatorios.
• Además, se ha comprobado que dependiendo del tipo de salida del problema puede ocurrir que un algoritmo no funcione de una manera óptima, como es el caso del algoritmo de receptores de endocannabinoides en el caso de los problemas de regresión, es necesario ajustar el tipo de algoritmo glial a cada problema específico.
• En los problemas de clasificación se puede ver fácilmente que cuando más compleja y grande es la red, mejores resultados logran los algoritmos gliales. En el caso de regresión, debido a que la RNA consigue errores muy bajos, se ve que la tendencia es que en una y dos capas ocultas los algoritmos gliales también tienen buenos resultados. En regresión también se puede ver, aunque menos que en clasificación, que la complejidad de la red es un factor que beneficia a los algoritmos gliales, ya que los resultados obtenidos en regresión con RNGA de dos capas ocultas son mejores que los de una capa oculta. Esta observación tiene una explicación biológica, ya que la actuación de los astrocitos tiene lugar en los procesos cognitivos más complejos.
• La evolución de los errores de entrenamiento muestra que las redes con los algoritmos astrocíticos tienen un aprendizaje más reforzado ya que, a pesar de que los procesos de iteración en las redes neurogliales artificiales las hace más lentas, aprenden en menor tiempo y cometiendo menor error. Esto reafirma que los astrocitos están involucrados en los procesos de aprendizaje y, aunque en algún problema de regresión parezca que empieza generar overfitting por la especialización en el entrenamiento realmente no hay problemas de sobreentrenamiento al analizar los resultados y la evolución de los errores de entrenamiento y validación. Esta cuestión lleva a pensar que, aunque aprenda muy rápido la red aún necesita tiempo para poder generalizar los conceptos específicos del problema, haciendo que, después, del “aprendizaje” los altos procesos cognitivos sean necesarios para generalizar los conceptos en los problemas realmente complejos.
• Se observa que al modificar los parámetros de la relación astrocito- neurona, los valores de activación-iteración, se puede lograr mejor rendimiento de la RNGA que al establecer unos valores fijos. Esto indica que las propiedades de la interacción entre neurona y astrocito en la sinapsis tripartita son extremadamente relevantes y se corresponde a las observaciones vistas biológicamente entre neurona y astrocito. En los resultados se puede observar que los datos de la columna “mejor” se consiguen mejores resultados que la RNA en el 60% de los casos mostrados en las tablas. Sin embargo, al analizar los datos obtenidos el uso de una única combinación neuroglial, por ejemplo, la combinación de activación- iteración 3-6, no siempre obtiene datos superiores en todos los problemas. Esto muestra que, al igual que sucede biológicamente, los parámetros adecuados de activación-iteración dependen del problema analizado y de las condiciones de partida (conjuntos de datos y configuraciones iniciales de la red).
Conclusiones
99
• Mientras que los modelos más complejos necesitan muchos datos en la fase de entrenamiento para empezar a aprender y no tener problemas de sobreentrenamiento, como es el ejemplo de las redes de Deep learning que son devoradores de datos de entrenamiento, los problemas que se han usado aquí no contienen una gran cantidad de datos. Además el uso de los algoritmos gliales que añaden más complejidad a la red les permiten aprender fácilmente ya que solo se les pasaba una cuarta parte de los datos disponibles en entrenamiento. Probablemente el uso de más datos durante la fase de aprendizaje haría que las redes pudiesen generalizar mucho mejor los conceptos y tendrían mejores resultados.
La siguiente fase de estudio de los algoritmos gliales, se basó en usar una técnica de IA que buscase a la vez los valores adecuados de las conexiones de la red y los parámetros gliales. Para ello se ha empleado la técnica de aprendizaje cooperativo del cual se ha extraído las siguientes conclusiones:
• El uso de un AGCC teóricamente se ajusta al problema que busca simultáneamente las conexiones de la red y la configuración glial de una red. Ya que se cumplen las cuatro condiciones necesarias, un espacio de búsqueda complejo, el problema se puede separar por definición, se usan diferentes tipos de valores y conceptos, existe una fuerte interconexión entre los componentes de la solución. Esto hace pensar que, al usar esta aproximación, los resultados de la RNGA tienen que ser mejores que los obtenidos con una red cuya configuración glial se ha establecido de antemano. Sin embargo, no siempre se obtienen mejores resultados. Al analizar la evolución de las redes se ha podido ver que buscar todos los parámetros gliales no es simple usando la estrategia de un algoritmo de estado estable en la población que contiene la configuración glial. Esto se debe porque al poner el algoritmo glial como un parámetro de búsqueda hace que los demás valores de búsqueda sean sensibles al algoritmo glial seleccionado, de tal manera que de dos buenos individuos que tienen algoritmos gliales diferentes tengan posibilidades de generar descendientes con malos ajustes, donde la única forma que tiene el algoritmo genético de salir es converger primero hacia un algoritmo glial, que no tiene por qué ser el adecuado, y después ajustar el resto de parámetros gliales. Por esta razón la aproximación coevolutiva no siempre obtiene mejor rendimiento que la preestablecida de antemano.
• El uso de la computación coevolutiva reflejó que la modificación astrocítica que realiza en la red funciona mejor con una restricción y es que el porcentaje de incremento sobre las conexiones no puede ser
superior al de decremento. De hecho, cuando el algoritmo genético no tiene puesta esa restricción en la codificación de sus individuos las soluciones resultantes tras varias iteraciones cumplen la condición de restricción, siendo el único caso donde no se cumple en los problemas de regresión con una configuración diferente por cada capa de la red donde en la primera capa el incremento que realizan los astrocitos sobre las conexiones son superiores al decremento que inducen. Que los astrocitos tengan la restricción de que el incremento sea inferior tiene una justificación biológica ya que si el incremento por refuerzo es menor que el decremento cuando no hay actividad constante solamente permanecerían reforzadas las conexiones neuronales que tienen actividad constante(Haydon & Araque, 2002).
• El uso de la computación coevolutiva también mostró que dentro de una red se pueden emplear diferentes combinaciones gliales. De hecho, reveló que para problemas de clasificación es excelente tener diferentes algoritmos gliales por capas y, que en regresión el uso de diferentes parámetros gliales para una red aprenda muy rápido en la fase de entrenamiento, lo que con un 25% de datos de entrenamiento son muy pocos datos para poder generalizar bien los modelos. El uso de diferentes comportamientos astrocitos está en consonancia con los observado biológicamente en el cerebro.
Las conclusiones obtenidas son coherentes y acordes con los descubrimientos biológicos expuestos en el apartado de antecedentes y sirven para ayudar a consolidar más el rol de las Redes NeuroGliales Artificiales en el campo de la IA.
Por último, mencionar la importancia de haber desarrollado una herramienta de código abierto que se pondrá a disposición de toda la comunidad. Ha permitido la experimentación así como analizar cómo se ejecutan las aplicaciones, ya que gracias a ello se obtuvo una medida de cuánto tiempo se emplea en la ejecución de las redes en la simulación. Esto llevo a centrarse en el funcionamiento interno de la red haciendo posible la creación de una nueva implementación en las RNA y RNGAs, donde el ahorro de memoria que se consigue es muy notable ya que solo se almacena lo estrictamente necesario, pasando a tener un modelo que se centra en las conexiones de las neuronas y no en el número de elementos. Además de este ahorro de memoria, y del orden que se sigue para calcular la salida de la red se ha conseguido incrementar la velocidad de la red de manera considerable con respecto a las implementaciones existentes hasta ahora para comparar RNGA
Conclusiones
101 con RNA. Se ha observado que cuanto más compleja y grande es la red más rápido se ejecuta comparado con el método tradicional.