CONTROL DE UN ROBOT CON UNA RED NEURONAL

(1)

Casa abierta al tiempo _CIENCIAS

_BASICAS

_{E INGENIERÍA}

PROYECTO DE INVESTIGACI~N LICENCIATURA EN COMPUTACIóN

CONTROL DE UN ROBOT

CON UNA RED NEURONAL

Responsables del proyecto:

Ángel Hernandez Rivera

92223742

Gustavo Silva Santos

93222201

Asesor:

M.C. Joel Ricardo Jiménez Cruz

IZTAPALAPA, DISTRITO FEDERAL, A 09 DE FEBRERO DE 1999

(2)

111)

Introducción

...

1

Redes neuronales artificiales

...

5

o La neurona y la sinapsis

...

5

El simulador Khepera versión 2.0

...

8

0 El simulador

...

8

0 Red neuronal utilizada en el ejemplo 2 del simulador ... 16

0 Contenido archivo Robot (file.robot) ... 28

Redes de retropropagación

...

30

0 Algoritmo de retropropagación

...

30

Obtención de patrones de entrada y salida

...

33

Código de la red de retropropagación en lenguaje ANSI C

...

36

Implantación del código de la red en el simulador

...

S O Resultados y conclusiones

...

52

(3)

Introducción

El hombre siempre ha tenido interés por conocerse a sí mismo y al mundo que lo rodea y este interés ha sido uno de los motores que le ha permitido, en su estancia relativamente corta sobre la tierra, lograr una transformación tan grande del mundo. Esta transformación se ha llevado a cabo primero muy lentamente, a lo largo de miles de años, y después, de una forma cada vez más acelerada. Así, tenemos que durante este siglo se ha logrado un gran avance en el conocimiento de la naturaleza fundamental de la materia, y por otro, la ciencia se ha involucrado, muy profundamente, con la industria y la agricultura. Algunas de las características que describen el desarrollo científico

-

técnico del presente siglo son el inicio de la producción en serie, el control automático de los procesos industriales, la disponibilidad y control de la energía, la aparición de los medios de comunicación masiva y la substitución del hombre en la ejecución de ciertos trabajos por máquinas o dispositivos electrónicos.

Uno de los desarrollos más sobresalientes del siglo XX es el de las computadoras. Estos han sido tan importantes que a menudo nuestra época se denomina “la era de las computadoras”. Las computadoras han sido, por un lado, un logro técnico de primera línea, y por otro han desempeñado un papel muy importante por sí mismas. Primero, en el avance de la ciencia, ya que constituyen una herramienta muy útil en la investigación científica. Segundo, en el desarrollo tecnológico, ya que han contribuido como herramienta de diseño e instrumento de control en los procesos industriales. Y tercero, han contribuido como medio para el manejo y almacenamiento de la información.

El uso de las computadoras no ha quedado restringido a los ámbitos técnico, científico y administrativo. En los últimos años su existencia ha cambiado radicalmente nuestras vidas, pues ahora forman parte esencial de la mayoría de los aspectos del quehacer humano.

En la actualidad, una computadora pequeña es capaz de efectuar, en cuestión de segundos, una cantidad tal de operaciones matemáticas, que a un hombre le tomaría meses o años realizarlas. Sin embargo, hay otro tipo de trabajos para los cuales las computadoras están claramente en desventaja. Estas tareas suponen la solución de problemas que se caracterizan por tener un gran número de soluciones, y por no ser posible dar instrucciones concretas para encontrarlas. En lo sucesivo denominaremos a estos problemas complejos’.

Entre los problemas complejos, tenemos los de optimización o toma de decisiones, de reconocimiento, etcétera. Por ejemplo, “un niño de tres años es mucho más eficiente reconociendo imágenes como caras de personas, que una poderosa computadora que trabaja con los programas más elaborados. Asimismo, un niño es capaz de efectuar generalizaciones y clasificar imágenes que nunca ha visto, mediante el uso de elementos extraídos de la experiencia previa, es decir, haciendo comparaciones y analogías entre el

I

(4)

contenido de una imagen nueva que se presenta y el contenido de las imágenes que ha visto en el pasado2.

El origen de esta diferencia de eficacia radica en que los procedimientos utilizados por los humanos y las computadoras son en esencia de carácter diferente. Las computadoras trabajan ejecutando instrucciones precisas. Las cuales pueden definirse de una manera sucinta en un algoritmo o receta del procedimiento a seguir. Una computadora puede ser programada para hacer comparaciones, pero es necesario que el programador defina, de manera concisa y exhaustiva, todos los criterios necesarios para efectuar dichas comparaciones.

Muy recientemente ha regresado con mucha fuerza una disciplina llamada

inteligencia artzjkial. La inteligencia artificial es el estudio de los problemas complejos de procesamiento de información que a menudo tienen sus raíces en algún aspecto del procesamiento biológico de la información. El objetivo de esta disciplina es identificar problemas interesantes y resolubles del procesamiento de información para solucionarlos.

El campo de la inteligencia artificial se divide actualmente en lo que parecen ser varios paradigmas en contienda. Los contendientes actuales difieren en lo que respecta a las formas que se necesitan para capturar todas las formas de inteligencia. Existen en general 2 visiones opuestas, cada una con su programa de investigación correlativo. Una fracción ve a las computadoras como sistemas para manipular símbolos mentales, ésta busca usar las computadoras para instanciar una representación formal del mundo y toma la resolución de problemas como su paradigma de inteligencia. La otra, ve a las computadoras como un medio para modelar el cerebro, para simular las interacciones de las neuronas, utilizando la estadística como su paradigma de inteligencia.

El hombre se ha caracterizado siempre por una búsqueda constante de nuevas vías para mejorar sus condiciones de vida. Estos esfuerzos le han servido para reducir el trabajo en aquellas operaciones en las que la fuerza juega un papel primordial. Los progresos obtenidos han permitido dirigir estos esfuerzos a otros campos, como por ejemplo a la construcción de máquinas calculadoras que ayuden a resolver de forma automática y rápida determinadas operaciones que resultan tediosas cuando se realizan a mano.

Uno de los primeros en acometer esta empresa fue Charles Babbage, quien trató infructuosamente de construir una máquina capaz de resolver problemas matemáticos. Posteriormente otros tantos intentaron construir máquinas similares, pero no fue hasta la segunda guerra mundial, cuando ya se disponía de instrumentos electrónicos, que empezaron a recoger los primeros frutos. En 1946 se construyó la primera computadora electrónica, ENIAC. Desde entonces los desarrollos en este campo han tenido un auge espectacular.

Estas máquinas permiten implementar fácilmente algoritmos para resolver multitud de problemas que antes resultaban engorrosos de resolver. Sin embargo, se observa una limitación importante: ¿qué ocurre cuando el problema que se quiere resolver no admite un

(5)

tratamiento algorítmico, como es el caso, por ejemplo, de la clasificación de objetos por rasgos comunes?. Este ejemplo demuestra que la construcción de nuevas máquinas más versátiles requiere un enfoque del problema desde otro punto de vista. Los desarrollos actuales de los científicos se dirigen hacia el estudio de las capacidades humanas como una fuente de nuevas ideas para el desarrollo de estas máquinas, Así, la inteligencia artificial es un intento por descubrir aspectos de la inteligencia humana que pueden ser simulados mediante máquinas. Esta disciplina se ha desarrollado fuertemente en los últimos años teniendo aplicación en algunos campos como visión artificial, demostración de teoremas, procesamiento de información expresada mediante lenguajes humanos, etcétera.

Uno de los paradigmas de la inteligencia artificial se ve concretado en los llamados sistemas expertos. Un sistema experto es un método para capturar la experiencia humana el cual consiste en tres subsistemas interconectados.

1. Una base de datos de conocimientos, que comprende hechos, supuestos, creencias,

heurísticas3 y métodos para tratar con la base de datos para alcanzar los resultados deseados, tales como un diagnóstico, una interpretación o una solución a un problema. 2. Una base de datos, una colección de datos sobre objetos y sucesos sobre la cual la base

de conocimientos ha de operar para alcanzar los resultados deseados.

3 . Una máquina de inferencia, que permite trazar inferencias a partir de las interacciones entre el conocimiento y las bases de datos.

El modo de operación es el siguiente: se presenta un problema al sistema, que solicita datos de quien efectúa la consulta, y eventualmente, ofrece consejos para llegar a la solución. A veces se puede preguntar al sistema en lenguaje natural, lo que hace que sea no solamente valioso para profesionales ocupados, sino que lo torna en un perfecto dispositivo de instrucción para novatos.

Una ley cualitativa de la inteligencia artificial que se ve resuelta por los sistemas expertos es que resuelven problemas generando soluciones potenciales y las prueban mediante una búsqueda. Las soluciones se buscan por lo general creando soluciones simbólicas y modificándolas secuencialmente hasta que satisfagan las condiciones de una solución. Así, los sistemas de símbolos resuelven problemas a través de una búsqueda. Sin embargo, como los problemas tienen recursos finitos, la búsqueda no puede efectuarse de una sola vez, debe ser secuencial. Deja tras de sí una sola trayectoria a partir del punto de inicio hasta la meta o, si se requieren correcciones y sustituciones, todo un árbol de esas trayectorias.

Objetivo de este proyecto.

L a finalidad que nos hemos propuesto en este proyecto es la de llevar acabo la implantación de una red neuronal de retropropagación para el control de un pequeño robot

(6)

llamado Khepera. El cual cuenta con un simulador4 que muestra el ambiente en el que se desenvuelve el robot y los datos que tiene en cada instante del robot. El simulador funciona bajo el ambiente Linux. Este simulador está escrito en lengaje C estándar. El código de la red neuronal también será escrito en este lenguaje.

Dicha red neuronal se implanta en el código del simulador, el cual por la manera en que está diseñado permite la manipulación del robot de manera fácil con solo introducir código en algunas funciones.

La red neuronal de retropropagación que se implantará tiene por objetivo hacer que el robot Khepera evite obstáculos, en los diferentes ambientes que se le presenten.

(7)

11)

Redes neuronales artificiales.

Las redes neuronales artificiales son una forma de emular otra de las características propias de los humanos: la capacidad de memorizar y asociar hechos. Si examinamos con atención aquellos problemas que no pueden expresarse a través de un algoritmo nos daremos cuenta que todos ellos tienen una característica común: la experiencia. El hombre es capaz de resolver estas situaciones acudiendo a la experiencia acumulada. Así, parece claro que una forma de aproximarse al problema consista en la construcción de sistemas que sean capaces de reproducir esta característica humana. En definitiva, las redes

neuronales no son mas que un modelo artificial y simplificado del cerebro humano, que es el ejemplo más perfecto del que disponemos de sistema que es capaz de adquirir

conocimiento a través de la experiencia. Una red neuronal es “un nuevo sistema para el tratamiento de la información cuya unidad básica de procesamiento está inspirada en la célula fundamental del sistema nervioso humano, la neurona”.

La neurona y la sinapsis.

(8)

La sinapsis consta de un extremo presináptico de un axón conectado a un extremo postsináptico de una dendrita, existiendo normalmente entre estos un espacio denominado espacio sináptico.

Las neuronas son eléctricamente activas e interactúan entre ellas mediante un flujo de corrientes eléctricas locales. Estas corrientes se deben a diferencias de potencial entre las membranas celulares de las neuronas. Un impulso nervioso es un cambio de voltaje que ocurre en una zona localizada de la membrana celular. El impulso se transmite a través del axón hasta llegar a la sinapsis, produciendo la liberación de una sustancia química denominada neurotransmisor que se esparce por el fluido existente en el espacio sináptico. Cuando este fluido alcanza el otro extremo transmite la señal a la dendrita. Los impulsos recibidos desde la sinapsis se suman o restan a la magnitud de las variaciones del potencial de la membrana. Si las contribuciones totales alcanzan un valor determinado (alrededor de

10 milivoltios) se disparan uno o más impulsos que se propagarán a lo largo del axón.

Aunque todavía no está del todo claro, parece que este impulso se inicia en la conexión entre el axón y la membrana. Su amplitud y velocidad dependen del diámetro del axón y su frecuencia del número de disparos que se efectúen.

Las redes neuronales artificiales basan su funcionamiento en las redes neuronales reales, estando formadas por un conjunto de unidades de procesamiento conectadas entre sí. Por analogía con el cerebro humano se denomina “neurona” a cada una de estas unidades de procesamiento. Cada neurona recibe muchas señales de entrada y envía una única señal de salida (como ocurre en las neuronas reales).

Uno de los primeros modelos matemáticos de una neurona fue el propuesto por McCulloch y Pitts en 1943 y es en el que se basan las redes neuronales actuales.

Las redes neuronales tiene dos faces:

Aprendizaje: Se utiliza un conjunto de patrones de entrenamiento para determinar

Prueba: Ya que está entrenada, se hace la prueba de la red en la que se presentan los pesos de las sinapsis.

los patrones y se analiza el funcionamiento de la red.

El aprendizaje de una red se puede producir de tres formas:

Aprendizaje supervisado: Consiste en introducir una serie de patrones de entrada a la red y a su vez mostrar la salida que se quiere tener. La red es capaz de ajustar los pesos de las neuronas de forma que a la presentación posterior de esos patrones de entrada la red responde con salida memorizada.

Aprendizaje no supervisado: Se presentan los patrones de entrada a la red y esta los clasifica en categorías según sus rasgos más sobresalientes.

(9)

Una de las primeras reglas de aprendizaje fue propuesta por Donald Hebb en 1949, y se basa en un hecho biológico constatado: cuando dos neuronas se activan simultáneamente su conexión se refberza. Esta idea se expresa matemáticamente como:

En una red neuronal existen tres tipos de capas de neuronas: La de entrada, la oculta y la de salida. También hay modelos que constan de una sola capa. Entre dos capas hay una serie de conexiones (sinapsis), como se mencionó anteriormente, que pueden ser total o parcialmente conectadas. También es posible conectar varias redes neuronales entre sí.

Las conexiones pueden ser hacia adelante, hacia atrás y de retardo.

O

Capa de entrada

Capa intermedia

n

Capa de entrada

Capa intermedia

Capa de salida

Red neuronal totalmente concectada.

(10)

111)

El Simulador Khepera versión 2.0

El Simulador del robot khepera es un software de dominio público escrito por Oliver Michel en la Universidad de Nice Sophia-Antipolis.

Este software permite escribir algoritmos de control de cualquier tipo (redes neuronales, clasificadores, o cualquier otro que se pueda imaginar) utilizando los lenguajes

c

o

c++.

El simulador provee una librería de hnciones que permite manejar al robot, además de mostrar sus resultados.

El simulador.

El diagrama general de operación nos muestra una secuencia de instrucciones que realiza el simulador desde que arranca hasta el momento en que pulsamos el botón de salida.

Q

Principal

1 Leer Archivo configuración

I

1 Abrir Programa

I

Inicio usuario

I

F

VI

I

botón

=

Presionar Botón

1 I

Realiza Acción (botón)

I

(11)

La función ‘‘Abrir programa ”, muestra el proceso de inicialización del simulador, el cual implica desde la generación de botones, el robot básico, etc.

Crear Mundo Vacio

I

Leer Mundo (WORLD/home.world)l

I

Crear Robot Default

I

Crear Botones Del Simulador

1

Inicializar Sensores

Los siguientes diagramas nos muestran el proceso de creación del robot básico, el cual siempre es seguido por la función de inicio del usuario.

1 Crear Robot Default

I

Crear Robot

+

I

4 I

Activa Sensores Distancia1

+

I

Activa Valores Motores

I

(12)

9 Crear

Robot

Robot.X=500 Robot.Y=500 Robot.Alpha=Pi/2 Robot.State=O

1

Asigna Valores a Motores Motor.X=PosicionX

Motor.Y=PosicionY Motor.Alpha=Angulo Motor.Valoi.0

Asigna Valores a Sensores Sensor.X=PosicionX

Sensor.Y=PosicionY

Una vez que el simulador se haya inicializado, prosigue el rastreo de los botones del simulador.

La pantalla del simulador está dividida en dos partes: la parte del mundo situada en la parte izquierda y la parte del robot encontrada al lado derecho. En la parte del mundo se puede observar el desenvolvimiento del robot en su ambiente, mientras que en el área del robot se puede observar lo que ocurre dentro del mismo (sensores, motores y controlador).

(13)

El área del mundo representa en escala un mundo de l m x lm.

Para insertar un objeto, se debe seleccionar el tipo de objeto que se desea insertar utilizando para ello los botones

“+”

y

“-“.

Si se desea girar el objeto sobre sí mismo se debe presionar el botón “turn” las veces que sea necesario. A continuación, para insertar el objeto en algún lugar del mundo se debe presionar el botón “add” y arrastrar el objeto hasta el lugar deseado, presionando finalmente el botón add para terminar. Si se desea borrar algún objeto del mundo, se presiona el botón “remove” y se hace click en los objetos que se desea remover, y para salir del modo de borrado debe presionar nuevamente el botón

“remove

”.

Una vez que los objetos se hayan colocado, es necesario presionar el botón

“sca~y1” antes de que el robot pueda percibirlos. Es posible checar que es lo que percibe el robot presionando el botón “ !

”.

Para situar al robot en algún lugar específico del mundo se debe presionar el botón

“set robot ”, y a continuación se debe hacer click en el lugar en donde se desee localizar al robot.

La parte del robot contiene los botones que controlan la operación del mismo. Cada botón realiza una serie de acciones descritas con los siguientes diagramas.

%

Boton

Nuevo Robot

+

I

+

I

Mostrar Sensores IR

1

1 Mostrar Efectores

I

I I

I

& - -

I

Leer Nombre Robot

I

Mostrar Robot

I

I I

I

lnicializar Sensores

(14)

I

Leer robot

7

1 Leer Colocacion Robot

1

I

1 Leer Colocacion Motores

1

I 1

1 Leer Colocacion Sensores

i

(FIN)

3 Boton Guardar Robot

I

Leer Nombre

Robot

1

1 Escribir Robot En Archivo

I

ribir Robot En

A

I

1

I

Escribir Robot

1 I

Grabar Robot

7

I

+

I

Guardar Colocación Robot

1

I

+

1 Guardar Colocación Motores

(15)

a

Boton Paso Robot

/I

Inicia Corrida Robot

11

1 I

Corre Robot

1

11 Termina Corrida Robot

11

2

C o r r e R o b o t

v

M o s t r a r E f e c t o r e s R o b o t

M o s t a r R o b o t P e q u e ñ o

F I N

X=Sensor[i].PosicionX

Y=Sensor[i].PosicionY

Alpha=Sensor[i].Alpha

I

Sensor[i].ValorDistancia= lRSensorValorDistancia(X,Y,Alpha)

Sensor[i].ValorLuz=

lRSensorValorDistancia(X,Y,Alpha)

Calcular NuevoAngulo

con

5 5% error

(16)

a

Boton Corre Robot

I I 1 I

Corre Robot

I I

I

c

I

Robot.ValorMotores=O

-1

c

Gen

Reset R o b k

I

Inicializa Robot

1 Mostrar Sensores IR

1 I

1 Mostrar Efectores Robot

I

Inicializar

Robot

1 Robot.ValorMotores=O

1 Reset Robot

Lsz-

Boton Comando Leer Comando

I

Comando de usuario

Robot.Angulo=Radianes(Angulo)

(17)

Q

Boton

Ayuda

L

Boton Presionado

L

Inicializa Sensores

1

Mostrar Sensores IR

1 /

B o t o n S i g u i e n t e I n f o

-

Seleccionar Siguiente Tipo Informacion

i

Mostrar Inform acion

>

Salir=Verdadero

i

Cerrar de usuario

Liberar Robot

I

i

I

Liberar Mundo

I

4

I

Liberar Botones

I

4

I

Liberar Contexto

1 I

Cerrar Graficos

1

I I

En estos diagramas podemos encontrar

tanto la descripción de los procesos de los botones, como descripciones de los procesos auxiliares más importantes para la comprensión de la operación del robot.

Los procesos que fueron encerrados en

cajas de doble raya indican las funciones que el usuario del simulador puede

(18)

Red neuronal utilizada en el ejemplo 2 del simulador.

La red neuronal encontrada en este ejemplo consta de una estructura conformada por una tabla, la cual contiene 3 diferentes tipos de estructuras que representan los diferentes componentes de la red. Estas estructuras están representadas en el esquema siguiente:

ESTRUCTURAS DE LA RED NEURONAL

NEURONA

RED NEURONAL

SlNAPSlS

La Estructura “RED NEURONAL” es la principal, ya que ella contiene los datos generales de la red, así como los apuntadores a las diversas capas que conforman a la red.

El “Número de sinapsis” y el “Número de neuronas” indican la cantidad total de estos elementos que posee la red. Los datos correspondientes a las tres diferentes capas de neuronas contienen un apuntador a la primer neurona de la capa especificada, a partir de ahí se genera una lista ligada de elementos “neurona”, lo cual permite una gran libertad en la cantidad de neuronas que pueden ser incluidas en cada capa, teniendo como Única restricción la cantidad de memoria del sistema en donde será implantada la red.

Para nuestro caso de estudio se tienen 2 restricciones. Una capa de entrada de no

(19)

La estructura “NEURONA” contiene los datos referentes al “Tipo” de neurona (el cual no es utilizado en el ejemplo), la “Posición X e Y en la gráfica de la red” que se muestra en la pantalla de información del simulador, el “valor de salida” que representa el valor a pasar como información de propagación a la siguiente neurona, el “valor

acumulado”, que es el que se incrementa con la propagación de las neuronas que comparten una sinapsis con esta neurona receptora, el

“Ax&”

que es un apuntador a la primer sinapsis de salida de esta neurona, de la cual se genera una lista ligada de elementos sinapsis hasta obtener todos los elementos de conexión sináptica de la neurona, y “Siguiente” que es un apuntador a neurona, necesario para la construcción de la lista ligada de neuronas que constituyen la capa a la cual pertenece la neurona mencionada.

La estructura “SINAPSIS” contiene los datos referentes al tipo de sinapsis, el cual tiene una relación directa con el peso asociado con esta sinapsis. El peso indica la fuerza de esta conexión sináptica entre neuronas. “Dirigida a” es un apuntador a neurona que indica hacia cual neurona se tiene la conexión sináptica, y “Siguiente” es un apuntador a sinapsis necesario para la construcción de la lista ligada de sinapsis relacionadas con el axón del cual surge esta sinapsis.

En la siguiente figura se muestra un pequeño esquema de posibles conexiones en la construcción de una red neuronal.

Esquema General

Red Neuronal

CAPA DE ENTRADA CAPA DE SALIDA

I

RED NEURONAL

I

NULO NULO NULO

En este esquema se puede apreciar como la capa de neuronas de entrada es

(20)

estas neuronas también sean alimentadas por información de sinapsis provenientes de neuronas de su misma capa o de capas inferiores.

La parte correspondiente a la forma de la red neuronal se muestra con un poco más de detalle en la siguiente figura.

Red Neuronal

¡=Número de neuronas de Entrada h=Número de neuronas Ocultas o=Número de neuronas de Salida

Aquí se muestra la forma en que están construidas las capas de la red neuronal y como se tiene una lista ligada asociada a cada una de ellas.

La figura nos muestra la forma en que los apuntadores contenidos en la estructura de la red neuronal solo apuntan al primer elemento de “neurona” y como a través del uso del apuntador “siguiente” de la neurona se forma la capa correspondiente. El apuntador “Axon”

(21)

La lista ligada de neuronas correspondientes a cualquiera de las capas de la red tendrá una estructura como la representada en la siguiente figura.

Neuronas

. . .

I

. . .

(22)

Finalmente se tiene el elemento faltante para la descripción de la red, la sinapsis, la cual está representada en la siguiente figura.

Sinapsis

[

M

-

1”l-

Siguiente (Neurona) _...

Tipo

I

Peso

Tipo

Neurona

Sinapsis

Dirigida a Siguiente

Peso

-

En este esquema podemos ver como la construcción de la lista ligada de sinapsis parte del axón de un elemento “neurona”. A continuación se tiene la unión de los elementos de la lista a través del uso del apuntador “siguiente” del elemento “sinapsis”. Observamos como cada sinapsis tiene dentro de su estructura su peso y su tipo asociado, así como el apuntador “Dirigida a”. Aquí podemos ver como una neurona puede recibir información de dos o más sinapsis, sin embargo en este caso es dificil que se tengan asociadas más de una sinapsis por cada axón dirigidas a una sola neurona, ya que esto podría representarse con una sola sinapsis en donde su peso asociado fuera la suma de los pesos de las sinapsis.

Para llevar a cabo la implantación de este modelo de redes el simulador, es necesario modificar las fimciones contenidas en el archivo user.c.

(23)

I

_*

Crear Red Neural Loca

1 Abrir Archivo Ploteo

1 b

Inicializa Red Neuronal

I

Apuntadores Capas=NULL

1 I

Numero Neuronas=O

1 Numero Sinapsis=O

1 +

[Capa Entrada=Crear Neurona(9)

I

Capa Oculta=Crear N e u r m

~~~

I

Capa Salida=Crear Neurona(2)

ICrear Sinapsis(Capalni,CapaFin,Neu,Tipo)

I

+

Actualiza Red Neural

+

I

FIN

I

1

Actualizar Num Neuronas Actualizar Num Sinapsis

Actualizar Pesos(Capas)

1

Actualizar Coordenadas

(24)

La función “Nuevo Robot” es llamada al presionar el botón “nuevo robot”. Esta función abre un archivo que únicamente contiene una configuración de red, sin contener ningún dato adicional acerca del robot. A continuación se libera la memoria que utiliza la configuración de red que estaba cargada y finalmente se leen los datos del archivo y se carga en memoria la nueva configuración de red.

Cabe resaltar que el archivo “NEURAL/neural.network” es en particular diferente a los archivos grabados con la función de grabar robot, ya que está función graba además de la configuración de red, la configuración del robot en el momento en que se grabó.

Leer Red Neuronal

>

1 Leer Red

Neuronal

1 I

Mostrar

lnformacion Usuario(

I

,I)

1

Abrir Archivo(“Neural/neuraI.netword”)

1

ILeer de Archivo(n_entrada,n-oculta,n_salidal

I

v

ICapa Entrada=Crear Neurona(n-entrada)]

4

1

Capa Oculta=Crear Neuronah oculta)

1

Capa Salida=Crear Neuronah salida)”\

I

Generar Sinapsis Neuronas Entrada

I

+

i

1

Generar Sinapsis Neuronas Oculta

1

Generar Sinapsis Neuronas Salida

1

Actualizar Red Neural

I

(25)

Estas hnciones accesan a archivos con un formato de grabación preestablecido por el simulador para la parte del robot, y con formato a elección del usuario en la parte del archivo que contiene los datos del estado del controlador.

1

Mostrar lnformacion Usuario(1 ,I)

1

Escribir Red Neural A Archivo

e c r i b i r Red Neural A A r c h 3

1

Crear Arreglo Neuronas(Tota1 Neuronas)

I

Asinar Sinapsis al Arreglo

I

Escribir A Archivo(Capa Entrada)

I

t

1

Escribir A Archivo(Capa Oculta)

I

+

I

Escribir A Archivo(Capa Salida)

I

t

+

t

1

Escribir A Archivo(Sinapsis Neuronas Entrada)

1 I

Escribir A Archivo(Sinapsis Neuronas Ocultas)

1 I

Escribir A Archivo(Sinapsis Neuronas Salida)

1

(26)

La función “Paso Robot” es la más importante ya que en ella se encuentra el código que controla la evolución del robot en el mundo imaginario.

Para el ejemplo analizado encontramos que esta función permite asignar los valores de los sensores de luz y de distancia a cada una de las neuronas de la capa de entrada.

Posteriormente se realiza la propagación de los datos de entrada y finalmente se calculan los valores de salida de las capas oculta y de salida.

fi

lnicializar Neuronas Entrada

t

lnicializar Neuronas Distancia

I

lnicializar Neuronas Luz

1 Mostar Actividades Capa Entrada

I

.c

I

Pienso

7 t

I

Mostar Actividad Capa Oculta

I

1 Inicializar Efectores

I

Mostar Actividades Capa Salida

I

Actualizar Archivo P l o a

Q

Piensa

t

Propagar(Capa Entrada)

4

1 Propagar (Capa Oculta)

Propagar(Capa Salida)

4

4 Calcular salida(Capa Oculta)

Calcular salida(Capa Salida)

(27)

t

ra Cada Neurona

c

Sinapsis.Tipo=2

Sinapsis.Peso+= 0.05*Sinapsis.Hacia.Salida *(Neurona.Salida-Sinapsis.Peso)

4

Sinapsis.Hacia.Suma+=

Sinapsis.Peso*Neurona.Salida

ular Salida(C

4

4 i

1 Para Cada Neurona

Normalizar(Neurona.Suma)

Neurona.Salida=Neurona.Suma

(28)

Las funciones “Inicia Corrida Robot ” y “Termina Corrida Robot ” preparan al simulador para comenzar y terminar la ejecución del controlador del usuario.

Para este caso en particular sólo se prepara y se cierra el archivo de ploteo, el cual permite tener un seguimiento de la evolución del robot en el medio ambiente.

1

lnicializar Archivo Ploteo

1

Mostrar lnformacion Usuario(1 ,I)

1 I

Cerrar Archivo

Plote/

1

La función de “Reset robot” permite realizar las acciones necesarias para que el robot quede en un estado parecido al de un nuevo robot.

orrar Archivo Ploteo

I

Reset+Red Neural

1

4 Mostrar lnformacion Usuario(

I

,I

)

1

1 Reset Red Neuronal

(29)

El simulador da la opción de tener funciones adicionales a las que é1 ofrece. La manera de implementar estas funciones es a través de la función “Comando de Usuario”. En esta función se tiene un case que evalua los diferentes comandos implementados. Para el caso particular de la red analizada se tienen 2 comandos adicionales: “print network” (imprime la configuración de la red en un archivo de texto) y “plot” (muestra en pantalla el recorrido del robot en esa ejecución).

F

+

Mostrar Camino Ploteado

=

“Comando Desconocido”

(30)

Contenido del archivo Robot (file.robot)

El archivo robot es generado por el simulador al presionar el botón de salvar robot. Este archivo contiene los datos necesarios para reconstruir el estado del robot al momento de ser salvado.

Para el caso del ejemplo 2, el archivo guarda dentro de sí los datos necesarios para la reconstrucción de la red neuronal, teniendo así la posibilidad de conservar el estado de la red neuronal en un momento determinado.

Dentro del archivo se guardan como mínimo los siguientes datos :

Datos de posición y estado del robot.

0 robot --> x 0 robot --> y 0 robot --> Alpha

robot --> Diameter robot --> State

Datos de sus efectores.

robot -->Motor[i].x robot -->Motor[i].y robot -->Motor[i].Alpha robot -->Motor[i].Value

para i=l,2

Datos de los sensores.

robot -->IRSensor[i].x robot -->IRSensor[i].y robot -->IRSensor[i].Alpha

robot -->IRSensor[i].DistanceValue

para i=1,2,

...,

8

Los datos asociados a la posición del robot son relativos con la esquina superior izquierda de la pantalla de mundo virtual, mientras el ángulo del robot (Alpha) es relativo a el eje X en su región positiva.

(31)

Para el ejemplo de la red neuronal, el archivo robot contiene además de los datos anteriores los siguientes datos relacionados con la reconstrucción de la red neuronal:

Datos generales de la red :

0 n input 0 nhidden 0 n output 0 n synapse

-

Estos datos corresponden a los números de neuronas de cada una de las capas, además del número total de sinapsis contenidos en la red.

Datos de las neuronas

0 Tipo de neurona 0 Salida de neurona

o Posición en arreglo de sinapsis axón 0 Posición en arreglo de neurona siguiente.

Estos datos serán guardados por cada una de las (n-input

+

n - hidden

+

n - output)

neuronas.

Datos de las sinapsis

0 Tipo de sinapsis 0 Peso

(32)

IV)

Redes de Retropropagación.

Rumenlhart, Hinton y Willian en año de 1986, realizaron un método para que una red neuronal aprendiera a relacionar los patrones de entrada con sus respectivas reacciones. Utilizando más capas ocultas, a este método se le conoce como retropropagación, el cual es un método supervisado.

El aprendizaje de retropropagación consiste en dos fases: Primero se aplica un patrón de entrada a la primera capa de la red, el cual se va propagando por las demás capas hasta la capa de salida. Esta salida se compara con la reacción correspondiente al patrón presentado. Después se calcula el grado de error que existe entre la salida y el patrón deseado, estos errores se retransmiten hacia las capas intermedias. Una vez obtenidos los grados de error de las capas intermedias y de salida se procede a reajustar los pesos de las sinapsis. Así la próxima vez que se presente este patrón el grado de error será menor que el actual y podrá reconocer más fácil el patrón.

La gran ventaja de este método es la capacidad de reajustar los pesos para poder aprender la relación entre el patrón presentado y su respectiva reacción.

Algoritmo de retropropagación.

A continuación se presenta el algoritmo de entrenamiento de la red de retropropagación que se implantó en lenguaje ANCI C (Algoritmo de aprendizaje).

a) Se debe iniciliazar los pesos de la red con valores aleatorios entre uno y cero

b) Una vez inicializados los pesos de la red, se dede cargar un patrón en la capa de c) Obtener los valores de la actividad de cada neurona de todas las capas.

(procedimiento InicializaArray y create-in-out-links)

incio ( procedimiento init input-units).

El nivel de activación de las neuronas de la primera capa es el valor de los patrones que se cargaron (inciso b). El nivel de activación de las neuronas de la capa intermedia y de salida se calcula con la hnción sigmoidal ( función out-f)de la siguiente manera:

1

(33)

sj es la suma de todos los niveles de activación de las unidades “k“ que entran hacia la unidad “ i

“,

multiplicados por el peso de cada sinapsis que une la neurona

“ k ” con la neurona “ i

”.

No necesariamente para obtener el nivel de activación tiene que ser la hnción sigmoidal, sino que puede ser cualquier función que cumpla con tres requisitos: derivable, continua y acotada.

d) Una vez obtenidos los niveles de activación de la última capa o capa de salida, éste se compara con el patrón deseado y se obtiene el grado de error.

El grado de error “ 6i ” para las neuronas de la capa de salida se obtiene con la siguiente fórmula( función delta-f-out):

4.

= U j ( l - U j ) ( P j - U j )

Donde uj es el nivel de activación de la j-ésima neurona de la capa de salida y Pj

es el j-ésimo patrón a comparar con la j-ésima neurona o unidad.

Si la neurona pertenece a alguna capa intermedia el nivel de activación se calcula de la siguiente forma (función delta-f-hid):

r

1

6i es la suma de todas las deltas “ sk ‘S ” de las unidades que reciben entrada de neurona

‘3’’

multiplicadas por el peso correspondiente de la unidad “k” a la “j”. A esta suma se le multiplica por la derivada de la función sigmoidal, esto para escalar el error y forzar a una mejor corrección.

e) El reajuste de los pesos se calcula de la siguiente manera (procedimiento bp-adjust-weights):

w..(t

Y

+

1)

=

w q ( t )

+

aSiui

+

P ( w q ( t )

-

w q ( t

-

1))

Donde Wij(t+l) es el nuevo peso entre la unidad “i” la unidad “j”,

Wíj(t) es el peso actual entre las unidades “i” y

‘3”

a es factor de aprendizaje los valores que puede tomar están entre 0.25 y 0.75. Este valor se elige antes de comenzar cualquier aprendizaje.

s j es el grado de error de la unidad “j”

.

Ui

es el nivel de activación de la unidad ‘Y.

p

es un factor de caída exponencial para determinar la contribución del gradiente. Este factor toma valores entre O y l .

(34)

g) Por último ya que se presentaron todos los patrones se calcula el error cuadrático

“E” para poder decidir si se detiene el aprendizaje o se continúa hasta obtener el error deseado (función pattern-error). Se dice que cuando “E” está próximo al cero el algoritmo a convergido para los patrones que se presentaron, es decir, que la red neuronal podrá reconocer cualquiera de los patrones y tener una reacción correcta.

Donde ‘ Y ’ es el i-ésima unidad y “j“ el j-ésimo patrón, “y”es el valor del patrón y

(35)

V)

Obtención de los patrones de entrada y de salida.

Los patrones de entrada son aquellos que se cargan en la capa de inicio para que cada uno de estos se propague calculando los niveles de activación de cada neurona de la capa oculta y la de salida.

Los patrones de salida son aquellos que se comparan con los niveles de activación de la capa de salida para poder obtener el grado de error (delta) y realizar los cambios necesarios en los pesos (retropropagación).

El robot Kheperu consta de 8 sensores de luz y 8 sensores de distancia. Como nuestro objetivo es hacer que el robot evite obstáculos, tomamos los valores de los sensores de distancia en diferentes puntos de choque y las respectivas reacciones que debe tener el robot ante tal circunstancia como patrones de entrada y de salida respectivamente.

Los patrones de entrada se obtienen de la siguiente manera:

2 3

1

O

4

5

7 6

En la figura anterior se puede observar el robot y sus ocho sensores de distancia los cuales regresan un valor entre O y 1023. Se considera a 1023 como contacto directo con un obstáculo, aunque no necesariamente este chocando sino que este muy cerca del obstáculo.

Contactos Reacciones Descripción

-+

Contacto frontal y su respectiva reacción (Un giro hacia la derecha)

4."

Contacto lado izquierdo. (Gira hacia la izquierda)

(36)

Contactos Reacciones Descripción

t

Contacto del lado derecho e izquierdo.

+

Contacto fi-ontal y por ambos lados.

+

Contacto frontal y lateral izquierdo.

Contacto frontal y lateral derecho.

t"

Contacto superior izquierdo.

111,

Contacto superior derecho.

Contacto inferior derecho.

-

8 t

(37)

Tomando nota de los valores de los sensores en cada contacto se forman los patrones de inicio y sus respectivas reacciones ejemplo:

Con el contacto frontal los valores de los sensores son los siguientes:

Sensor O: 0050 Sensor 1: 1000

Sensor 4: 1 O00

Sensor 5: 0050 Sensor 2: 1023

Sensor 3: 1023

Sensor 6: 0002 Sensor 7 : 0002

Por lo tanto nuestro patrón de entrada queda de la siguiente manera:

{ 0050, 1000, 1023, 1023, 1000,0050, 0002, 0002) Contactofrontal.

Y el patrón de salida (la reacción) debe ser hacia la derecha, es decir, el motor de la rueda derecha cambia de sentido (hacia atrás) y el motor de la rueda izquierda se le asigna un valor positivo (hacia adelante), para poder provocar el giro hacia la derecha.

111,

Reacción

Giro hacia la derecha

La reacción hacia adelante se considera como 0.9. Y la reacción hacia atrás se considera como O. 1. Por lo tanto el patrón de salida queda de la siguiente manera:

(0.9,O. 1 } Vuelta hacia la derecha.

Este es el valor a comparar con la salida de la red.

(38)

Código de la red de retropropagacion

en lenguaje

ANSI

C.

#include <math.h> #include <stdio.h> #include <ctype.h>

#define NUM-IN 8 Número de unidades en la capa de entrada #define NUM-HID 5 Número de unidades en la capa oculta #define NUM-OUT 2 Número de unidades en la capa de salida

#define TOTAL (NUM-IN + NUM-HID + NUM-OUT) Total de neuronas

#define BIAS-UID (TOTAL) Posición de la unidad bias dentro del arreglo Macros para obtener indices

#define IN-UID(X) (X>

#define HIDUID(X) _(NUM-IN₊X)

#define OUT-UID(X) (NUM-IN + NUM-HID

+

X) #define TARGET-INDEX(X) (X - (NUM-IN + NUM-HID)) #define PATRONES 11 Número de patrones a reconocer

#define ERROR-TOLERABLE 0.001 Error máximo esperado para cada reconocimiento #define ON-TOLERANCE 0.75 Valor a comparar para las reacciones

#define NOTIFICAR 10 Cada 10 iteraciones se notifica el aprendizaje #define DEFAULT-ITER 15800 Iteraciones por default

#define TOTAL-LIGAS ( NUM-IN+l)*NUM-HID+(NUM-HID+l)*NUM-OUT

struct unit { Declaración de la estructura de cada unidad o neurona int uid; Identificador de la unidad

char *label;

double output; Nivel de activación

double (*unit-out-f)(); Apuntador a la función de activación double delta; Valor delta para cada unidad

double (*unit-delta-f)(); Apuntador a la función para calcular delta struct link *inlinks; Para la propagación

struct link *outlinks; Para la retropropagación } *pu[TOTAL+l];

Cada UNIDAD contiene los siguientes datos

LABEL OUTPUT

LABEL OUTPUT *(UNIT-OUT-FO)

DELTA

[

*UNIT-DELTA-FO

(39)

struct link ( Declaración de cada liga o sinapsis entre dos unidades char *label;

double weight; Peso de la liga

double data; Diferencia de pesos entre el peso actual y anterior int from-unit; Ident. de donde proviene la liga

int to-unit; Ident. a donde se dirige la liga

struct link *nextpinlink; Apuntadores para el ligado entre las sinapsis struct link *next-outlink;

Cada LIGA contiene los siguientes

I LABEL WEIGHT DATA FROM-UNIT *NEXT-INLINK *NEXT-OUTLINK

int iteraciones =( DEFAULT-ITER);

double learning-rate = 0.2; Grado de aprendizaje

double momentum = 0.9; Variable para escalar el grado de error (delta)

double pattern-en[PATRONES]; Arreglo para guardar los errores de reconocimiento (delta) PATRONES DE ENTRADA

{Sensor O, Sensor 1, Sensor 2, Sensor 3, Sensor 4, Sensor 5, Sensor 6, Sensor 7) double inputqat[PATRONES][NUM-IN] = (

(0.0 , 100.0, 850.0, 850.0, 100.0,O.O , 0.0 , 30.0 }, (850.0,200.0, 850.0, 850.0, 100.0,O.O ,O.O , 30.0 }, (0.0 , 100.0, 850.0, 850.0, 200.0, 850.0, 30.0 , 0.0

1,

(850.0, 100.0, 10.0 , 10.0 , 100.0, 850.0, 30.0 , 30.0 }, (850.0, 100.0, 10.0 ,O.O , 0.0 ,O.O , 850.0,850.0), (0.0 ,O.O , 0.0 , 30.0 ,200.0, 850.0, 850.0, 850.0},

(850.0, 100.0,30.0 ,O.O ,O.O ,O.O , 10.0 , 50.0 }, (0.0 , 0.0 , 0.0 , 10.0 , 100.0, 850.0, 30.0 , 0.0 }, (500.0, 850.0,200.0, 100.0,O.O ,O.O ,O.O ,O.O }, (0.0 , 0.0 , 100.0, 200.0, 850.0, 500.0,O.O , 0.0 }

1;

PATRONES DE SALIDA (Motor izquierdo, Motor derecho}

double targetqat[PATRONES][UM-OUT] = { (0.9,O. 1 },

(0.9,O. 1 }, {0.1,0.9}, {0.9,0.9), (0.9,0.9}, {0.9,0.9}, {0.9,0.9}, (0.1,0.9}, (0.9,0.1}, {0.1,0.9} 1;

(40)

double out-f(), delta-f-out(), delta-f-hid(), randomso, pattern-error(); long double unidad[TOTAL+2][2],1igas[TOTAL-LIGAS][2]; void main(void) Función principal

{

char ch; int res;

extern struct unit *pu[];

FILE *fp; Apuntador al arreglo que contendrá la red

InicializaArray(unidad,ligas); Valores iniciales para las unidades y las ligas

actpatron(); Se escala el patrón de entrada

do {

printf("Qué desea hacer? h");

printf("0->Aprender, 1 ->Reconocer:"); scanf("%d",&res);

if(res==O)

fp=fopen("RedNeuronal","w"); else

{

fp=fopen("RedNeuronal","r");

LeerRedNeural(unidad,ligas,fp);

I

createqrocessing-units(pu,unidad); Se crean las unidades

create-in-out-links(pu,ligas); Se crean las ligas

if(res==O) {

learn(pu); Se aprenden los patrones

GuardaRedNeural(pu,fp); fclose(Ep);

I

else { fclose(fp); reconocer(pu); }

}while(res!=2);

I

El procedimiento createqrocesing-units crea las neuronas de la capa de entrada, oculta y de salida y también crea la neurona bias. Todas la direcciones a las neuronas quedan en el arreglo "pu". Primero se guardan las direcciones de las neuronas de entrada, luego las neuronas de la capa oculta , después las neuronas de la capa de salida y por último se guarda la dirección de la capa de salida. Cada valor de las neurona es inicializado con números por default, como se muestra en la siguiuente figura.

"pu" es el arreglo donde se colocan los apuntadores a las unidades.

(41)

39

Pu(0)

-

Pu(1)

-

Pu(2)

-

Pu(3)

-

Pu( 15)"

Pu( 16)-b

createqrocessing-units(pu,unidad)

struct unit *pu[]; double unidad[][2];

{ int id;

struct unit *create-unit();

for (id = IN-UID(0); id < IN-UID(NUM-IN); id++) Se crean la neuronas de entrada for (id = HID-UID(0); id < HID-UID(NU"H1D); id++)

for (id = OUT-UID(0); id < OUT-UID(NUM-OUT); id++)

pu[BIASUID] = create-unit(BIASUID, "bias",unidad[id][O], NULL, unidad[id][ 13, NULL); pu[id] = create-unit(id, "input", unidad[id][O], NULL,unidad[id][ 11, NULL);

pu[id] = create-unit(id, "hidden",unidad[id][O], out-f,unidad[id][ 11, delta-f-hid); pu[id] = create-unit(id, lloutput't, unidad[id][O], out-f, unidad[id][ 11, delta f-out);

Procedimiento create-in-out-links crea el ligado total de las capas como se muestra en la figura que sigue. Cada valor de los pesos son números aleatorios. Las ligas de cada neurona de la capa inferior con la capa superior quedan ligados entre sí, en una lista como se muestra en la figura 3. El apuntador outlinks de cada neurona al final queda apuntando al principio de cada lista, para tener acceso a las ligas.

"pu" es el arreglo que contiene apuntadores a las unidades.

"ligas" arreglo con los valores iniciales de las ligas (sinapsis).

(42)

Creación de la red neuronal en memoria.

._._. _._..

O

O O O

create-in-out-links(pu,liga)

struct unit *pu[]; double liga[][2];

{

int i, j,l; struct link *create-link();

for (i = HIDUID(0); i < HID-UID(NU"H1D); i++) { Ligas de la capa oculta

1=0; Indice para la lectura de los arreglos pu[BIAS-UD]->outlinks =

pu[i]->inlinks = create-link(pu[i]->inlinks, i, pu[BIAS-UIDI->outlinks, BIAS-UID,(char *)NULL, liga[ll[ol,liga[ll[ll);

1++;

for (i = IN-UID(0); j < IN-UID(NUM-IN); j++,l++) pub]-Boutlinks =

pu[i]->inlinks = create link(pu[i]->inlinks, i, puljl->outlinks, j , (char *)NULL,liga[l][O],liga[l][ 13);

1

-

for (i = OUTUID(0); i < OUT-UID(NUM-OUT); i++) { Ligas de la capa de salida

pu[BIAS-UD]->outlinks =

pu[i]->inlinks = create-link(pu[i]->inlinks, i,pu[BIAS-UIDI->outlinks, BIAS-UID,(char *)NULL, liga[ll[ol,liga[ll[ll);

1++;

for (i = HID-UID(0); j < HID-UID(NUM HID); j++,l++) pub]->outlinks =

-

pu[i]->inlinks = create-link(pu[i]->inlinks, i, pu~]->outlinks, j,(char *)NULL,liga[l][O],liga[l][ 11 );

1

(43)

Al terminar, el ligado total de la red neuronal queda como muentra la siguiente figura.

INLINK Ligas entre la capa de inicio y la capa oculta

INLINK

Ligas entre la capa oculta y la de salida

0 O .

(44)

La función randoms calcula un número aleatorio entre O y 1 double

randomso {

I return((rand() % 327278) / 327378.0);

La función create-unit crea la unidad solicitando memoria al procesador e inicializa los valores de la unidad.

“uid” : identificador de la unidad.

“label” : etiqueta de la liga

“output” : variable para contener el valor de activación.

“out-f’ : apuntador a la función para calcular el nivel de activación

“delta” : variable que para contener el error entre el patrón deseado y el valor obtenido.

“delta-f ’: apuntador a la función que calcula el valor delta. struct unit *create-unit(uid, label, output, out-f, delta, delta-f) int uid;

char *label;

double output, delta; double (*out-f)(), (*delta-f)();

{

struct unit *unitptr;

if (!(unitptr = (struct unit *)calloc(sizeof(struct unit), 1))) { fprintf(stderr, “Error de memoria al crear la unidad h”); exit( 1);

1

unitptr->uid = uid; unitptr->label = label; unitptr->output = output; unitptr->unit-out-f = 0ut-C unitptr->delta = delta; unitptr->unit-delta-f = delta-C unitptr->inlinks=NULL; unitptr->outlinks=NULL; return (unitptr);

}

La función create-link crea la liga pidiendo memoria al procesador e inicializa los valores de ésta.

“start-inlist” : apuntador a la liga de entrada de la primera neurona

“to-uid” : identificador de la segunda neurona.

“start-outlist” : apuntador a la liga de salida de la segunda neurona

“from-uid” : identificador de la primera neurona.

“label” : etiqueta de la liga.

“data” : dierencia de pesos entre el actual y el peso anterior.

“wt” : peso de la liga.

struct link *create-link(start-inlist, to-uid, start-outlist, from-uid, label, wt, data) struct link *start-inlist, *start-outlist;

int to-uid, from-uid; char

*

label; double wt, data;

(45)

struct link *linkptr;

if (!(linkptr = (struct link *)calloc(sizeof(stmct link),l))) { fprintf(stderr, "Error de memoria al crear la liga W'); exit( 1);

I

Valores iniciales de las ligas

linkptr->label = label;

linkptr->from-unit = from-uid; linkptr->to-unit = to-uid; linkptr->weight = wt; linkptr->data = data;

linkptr->next-inlink = start-inlist; linkptr->next-outlink = start-outlist; return(1inkptr);

1

La función learn llama a la función bp-learn dentro de un ciclo el número de iteraciones por default. Y

también presenta el grado de error en el reconocimiento de cada patrón.

"pu" arreglo con los apuntadores a las unidades. learn(pu)

struct unit *pu[]; register i, temp; char tempstr[TAM]; extern int iteraciones;

extern double learning-rate, momentum; printf("h4prendiendo ");

for (i = O; i < iteraciones; i++) { if ((i % NOTIFICAR) == O ) { {

printf("."); fflush(stdout);

1

bp-leam(pu, (i >= iteraciones-(PATRONES- 1)));

1

printf("\n");

for(i=O;i<PATRONES;i++) printf(" Hecho\n\n");

printf("error :%If \n",pattern-err[i]);

1

La función bp-learn realiza la propagación del patrón presentado, hace el reajuste de pesos si aún no se ha obtenido el grado de error máximo para el reconocimiento de los patrones de entrada. Todo esto se realiza con todos los patrones de entrada. En esta parte se realiza el aprendizaje.

''PU" : arreglo con los apuntadores a las unidades.

"save-error" : variable boleana que es verdadero en las últimas PATRONES iteraciones. bp-learn(pu, save-error)

struct unit *pu[]; int save-error; {

static int count = O; static int pattern = O;

(46)

init-input-unitstpu, pattern); Carga el patrón en las unidades de entrada

propagate(pu); Calcula la salida de las neuronas de salida

if (save-error)

bp-adjust-weightsbattern, pu); Se reajustan los pesos

if (pattern < PATRONES - 1) else

count++;

patternerr[pattern] = pattern-errorbattern, pu);

pattern++; pattern = O;

}

El procedimiento init-input-units se encarga de cargar el patrón de entrada en la capa de inicio. Este patrón es el que se analizará en la función bp-learn.

“PU” : arreglo de apuntadores a las neuronas.

“pattern” : número del patrón a cargar. init-input-units(pu, pattern)

struct unit *pu[]; int pattern; {

int id;

for (id = IN-UID(0); id < IN-UID(NUMIN); id++) pu[id]->output = inputqat[pattern][id];

1

El procedimiento propagate llama a una función para calcular el nivel de activación de las capas oculta y de salida, propagando así el patrón de entrada por toda la red.

for (id = HID-UID(0); id < HID-UID(NU”H1D); id++) for (id = OUT-UID(0); id < OUT-UID(NUM-OUT); id++)

(*(pu[id]->unit-out-f))bu[id], pu);

(*(pu[id]->unit-out-f))(pu[id], pu);

1

La hnción out-f calcula el nivel de activación de las capas oculta y de salida. El nivel de activación se obtiene con la función sigmoidal.

‘‘pugrt” apuntador a la neurona que se le calcula el nivel de activación. double out-f(puqtr, pu)

struct unit *puqtr, *pu[];

(47)

double sum = 0.0 , expo; struct link *tmpqtr; t m p q t r = puqtr->idinks; while (tmpqtr) {

sum += pu[tmpgtr->from-unit]->output

*

tmpqtr->weight; t m p q t r = tmpgtr->next-inlink;

I

puqtr->output = 1 .O/( 1 .O

+

exp(-sum)); Implantación de la función sigmoidal

La función pattern-error calcula el error cuadrático medio para los patrones de salida como se indicó en el algoritmo.

double pattemerror(pat-num, pu) int pat-num; Número de patrón

struct unit *pu[]; {

int 1;

double temp, sum = 0.0;

for (i = OUTUID(0); i < OUT-UID(NU"0UT); i++) {

temp = targetqat[pat-num][TARGET-INDEX(i)] - pu[i]->output; sum += temp

*

temp;

1

retum (sud2.0);

I

El procedimiento bp-adjust-weights hace el ajuste necesario en los pesos de la red .Primero se calculan los grados de error, es decir los deltas de cada neurona de la capa de salida y después de la capa oculta tomando en cuenta el patrón analizado y su reacción respectiva. Segundo se reajustan los pesos utilizando la función que se mostró en el algoritmo.

bp-adjust-weights(pat-num, pu) int pat-num; Número de patrón

struct unit *pu[]; {

int 1;

double temp 1, temp2, delta, error-sum; struct link *inlinkqtr, *outlinkqtr;

Cálculo de las deltas

for (i = OUT-UID(0); i < OUT-UID(NUM-OUT); i++) Para cada unidad de salida

for (i = HID-UID(0); i < HIDUID(NU"H1D); i++) Para cada unidad oculta Se calculan los pesos

for (i = OUT-UID(0); i < OUT-UID(NUM-OUT); i++) { para las unidades de salida

(*(pu[i]->unit-delta-f)(pu, i, pat-num);

(*(pu[i]->unit-delta-f))(pu, i); Cálculo de delta

inlinkqtr = pu[i]->idinks;

while (inlinkqtr) { Para cada inlink de la unidad de salida

temp 1 = learning-rate

*

pu[i]->delta *pu[inlinkqtr->from-unit]->output; temp2 = momentum

*

inlinkqtr->data;

(48)

inlinkqtr = inlinkqtr->next-inlink;

1

for (i = HID-UID(0); i < HID-UID(NU”H1D); i++) { Para cada unidad Oculta

inlinkqtr = pu[i]->idinks; while (inlinkqtr) {

temp1 = learning-rate * pu[i]->delta

*

pu[inlinkqtr->from-unit]->output;

temp2 = momentum

*

inlinkqtr->data; inlinkqtr->data = temp 1 + temp2; inli&qtr->weight += inlinkqtr->data;

inlinkqtr = inlinkqtr->next-inlink;

1

I

}

La función delta-f-out calcula el delta para cada unidad o neurona de salida, ésta se calcula como se indicó en el algoritmo.

“uid”: identifícador de el número de entrada del patrón , es decir, es el número de unidad de la capa de salida.

“pat-num”: número de patrón. double delta-f-out(pu, uid, pat-num) struct unit *pu[];

int uid, pat-num; {

double temp1 , temp2, delta;

temp1 = (targetqat[pat-num][TARGET-lNDEX(uid)] - pu[uid]->output); temp2 = (1 .O - pu[uid]->output);

delta = temp1

*

pu[uid]->output

*

temp2; Se obtiene el valor de delta

pu[uid]->delta = delta;

1

La función delta-f-hid calcula la delta para la capa oculta como se indicó en el algoritmo. Double delta-f-hidhu, uid)

struct unit *pu[]; int uid;

{

“uid”: identificador de el número de unidad de la capa de oculta.

double templ, temp2, delta, error-sum; struct link *inlinkqtr, *outlinkqtr; outlinkqtr = pu[uid]->outlinks; error-sum = 0.0;

while (outlinkqtr) {

error-sum

+=

pu[outlinkqtr->to-unit]->delta

*

outlinkqtr->weight; outlinkqtr = outlinkqtr->next_outlink;

I

delta = pu[uid]->output

*

(1 .O - pu[uid]->output)

*

error-sum; pu[uid]->delta = delta;

1

El procedimiento GuardaRedNeural como su nombre lo indica guarda la estructura de la red neuronal en un archivo de tal manera que se pueda cargar desde el archivo con las funciones creategrocessing-units y

(49)

"pu": Arreglo de apuntadores para acceder a la red.

"fp": apuntador al archivo donde se guardarán el nivel de activación y el delta de cada neurona , y el peso y el data de cada liga.

GuardaRedNeural(pu,fp) struct unit *pu[]; FILE *fp;

{ int i,j,k;

struct link *ligas[TOTAL-LIGAS],*ligtemp;

Se guarda el nivel de activación (output) y delta de cada neurona o unidad

for(i=IN-UID(O);i<Ib-UID(NUM-IN);i++) Capa de entrada

for(i=HID~UID(O);i<HlD~UID(NUM~HID);i++) Capa oculta

for(i=OUT-UID(O);i<OUT-UID(NUM-OUT)$++) Capa de salida

fprintf(fp,"%lf,%lf\n",pu[i]-~output,pu[i]-~delta); fprintf(fp,"%lf,%lf\n",pu[i]->output,pu[i]-~delta); fprintf(fp,"%lf,%lf\n",pu[i]->output,pu[i]->delta);

fprintf(fp,"%lf,%If\n",pu[i]->output,pu[i]->delta); Se guardan los datos de la neurona BIAS

k = N U M N ;

Por la forma en que fue construida la red se guardan los valores de las ligas en un arreglo temporal para después vaciar estos datos en el archivo.

for(i=HID-UID(O);i<HID-UID(NUM_HID);i++) { ligtemp=pu[i]->inlinks;

j=O;

while(1igtemp) { ligas[k-j]=ligtemp;

ligtemp=ligtemp->next-inlink;

j

++;

1

k=k+(NUM-IN)+ 1 ;

1

k=k+(NUM-HID)-(NUM-IN);

for(i=OUT-UID(O);i<OUT-UID(NUM - OUT)$++) { ligtemp=pu[i]->idinks;

j=O;

while(1igtemp) { ligas[k-j]=ligtemp;

ligtemp=ligtemp->next-inlink;

j++;

1

k=k+NUM-HID+ 1 ;

1

for(i=O;i<TOTALLIGAS;i++)

fprintf(fp,"%lf,%lf\n",ligas[i]->weight,ligas[i]->data); I