Resultados experimentales y an´ alisis - Propuesta de modelo generador de modos de caminado

5.2 Propuesta de modelo generador de modos de caminado

5.2.4 Resultados experimentales y an´ alisis

La primera prueba efectuada fue la generación de perfiles de trayectorias mediante redes neuronales. Se entrenó un total de 5 redes, con diferentes números de neuronas en la capa escondida, as´ı como diferentes números de iteraciones de entrenamiento. La trayectoria de entrenamiento se mantuvo constante para todas. El perfil de movimiento de la pata empleado como ejemplo en el entrenamiento se muestra en la Figura 5.19. En la misma se observa una vista en el plano Y-Z, y los valores de los parámetros son: L = 50mm, H = 120mm y DH = 15mm.

Las redes neuronales fueron entrenadas con las configuraciones de número de neuronas en capa escondida (K) e iteraciones de entrenamiento mostradas en la Tabla 5.2.4. Cada una de las redes neuronales fue utilizada para la sección de transformación de los vectores de estado provenientes del ACPO. El modo generador de referencias de fases con

Figura 5.19: Trayectoria de ejemplo para entrenamiento.

el ACPO se mantuvo con las fases correspondientes al modo de locomoci´on caminado (ver Tabla 4.6(a)). K No de iteraciones NN1 6 2 millones NN2 8 2 millones NN3 18 2 millones NN4 25 2 millones NN5 25 8 millones

Tabla 5.1: Redes neuronales entrenadas

Las salidas obtenidas para cada una de las redes neuronales al aplicarles los vectores de ACPO a la entrada, fueron convertidas del espacio de ángulos a trayectorias de referencia en el espacio cartesiano, mediante la cinemática directa de la pata. De tales trayectorias solo son de interés las componentes de movimiento que generan un movimiento de locomoción en el robot. Para el sistema de referencia mostrado en la Figura 5.18 se puede observar que el movimiento principal de locomoción para las patas se efectúa sobre el plano Y − Z. Las gráficas de las trayectorias resultantes para cada una de las redes neuronales se muestran en la Figura 5.20.

(a) Red NN1 (b) Red NN2

(e) Red NN5

neuronales son todas de tipo cerrada, con presencia de rizos u oscilaciones de frecuencia mayor al ciclo principal de locomoción. Tales oscilaciones son consecuencia del uso de redes neuronales como aproximadores de funciones; ya que las mismas tratan de converger a los puntos empleados como ejemplos de entrenamiento, sin embargo en aquellos puntos donde no se les provee información alguna de la salida deseada las redes pueden no converger. La solución inmediata a esta situación es el aumento de puntos de ejemplo extraidos de la trayectoria de referencia.

Las amplitudes de las oscilaciones var´ıan para las distintas redes neuronales, llegan- do al caso de la red NN3 donde las mismas son de amplitud comparables con el ciclo de locomoción. Este ejemplo ilustra un problema que es consecuencia de la técnica empleada en el entrenamiento de la red neuronal. En el entrenamiento por backpropagation existe el riesgo de que la solución que se alcance durante un punto del proceso de entrenamiento sea un m´ınimo local en la superficie de error, ya que la minimización del mismo se hace por gradiente. Una forma de reducir este problema es mediante la adici´on de momento en el algoritmo de correción de los pesos a partir de los gradientes, tal como se hizo durante el entrenamiento de la red neuronal mostrada en la sección anterior, utilizando la herramienta NNTOOL de Matlab.

Se puede observar que para las 4 redes restantes la trayectoria no presenta oscilación alguna en el segmento de trayectoria que corresponde a la fase de apoyo, consecuencia de la selección de los puntos de la trayectoria original empleados en el entrenamiento de las redes neuronales. Este comportamiento es deseable ya que se traduce en un movimiento más suave durante el caminado del robot. En las trayectorias resultantes también se puede observar que las oscilaciones previamente mencionadas no desaparecen totalmente sino que se concentran en el segmento de trayectoria correspondiente a la fase de transferencia, donde la densidad de puntos empleados como ejemplos de entrenamiento era menor.

También es posible apreciar la incidencia del número de neuronas en el número de oscilaciones. Se puede observar que conforme aumenta el número de neuronas (K), hay

mayor cantidad de oscilaciones sobre la trayectoria de caminado. Otro fenómeno observable en las gráficas de trayectoria es el impacto del número de iteraciones de entrenamiento sobre la salida obtenida en las redes neuronales. Para las redes NN1, NN2 y NN4, las cuales fueron entrenadas 2 millones de iteraciones la amplitud de las oscilaciones es mayor que en el caso de la red NN5, que fue la única entrenada un total de 8 millones de iteraciones. Esto concuerda con los resultados obtenidos para la red neuronal empleada en la sección 5.1.4, donde el aumento del número de iteraciones de entrenamiento se traduc´ıan en un menor error de aproximación a la forma de onda de referencia. Es importante recordar que esta mejora en la aproximación estaba también asociada a la perdida de capacidad de inferir de la red neuronal, debido al sobreentrenamiento.

Posteriormente, durante el experimento de locomoción de la plataforma robótica utilizando cada una de las redes neuronales entrenadas se midieron los valores de acele- ración que se muestran en las Figuras 5.2.4,5.2.4,5.2.4 y 5.2.4 . Cabe destacar que consecuencia de las oscilaciones presentes en la trayectoria generada con la red neuronal NN3, la secuencia de caminado obtenida fue inoperante ya con la misma el robot era totalmente inestable. Las gráficas mostradas corresponden a las salidas para las redes NN1, NN2, NN4 y NN5.

(a) Aceler´ometros en ejes X-Y

(b) Aceler´ometros en eje Z

Figura 5.21: La secuencia de locomoción obtenida con la red neuronal NN1 era marginalmente estable, es decir que cuando se aumentaba el valor de frecuencia de oscilación del ACPO (ω) lo que incrementaba la velocidad de paso, el robot era inestable. Los puntos de inestabilidad corresponden a picos en los valores de aceleraciones identificados como A.

(a) Aceler´ometros en ejes X-Y

(b) Aceler´ometros en eje Z

Figura 5.22: Para la secuencia obtenida con esta red neuronal, el comportamiento obser- vado durante la locomoción fue muy semejante al correspondiente a la red NN1. También era marginalmente estable, y se pudo observar que cualitativamente las vibraciones en la plataforma robótica eran más perceptibles.

(a) Aceler´ometros en ejes X-Y

(b) Aceler´ometros en eje Z

Figura 5.23: Al igual que para las redes NN1 y NN2, la secuencia de caminado obtenida no era absolutamente estable, por el contrario, el caminado del robot era mucho más inestable que en para las dos redes anteriores. Ésto se puede apreciar en las gráficas de aceleración en el plano X-Y, en las cuales se observan mayor cantidad de picos de aceleraciones asociados con movimientos más bruscos de la plataforma.

(a) Aceler´ometros en ejes X-Y

(b) Aceler´ometros en eje Z

Figura 5.24: Para esta última red neuronal se obtuvo un caminado apenas mejor que para las redes NN1, NN2, y NN5. La mejora más notable es en las aceleraciones en el eje Z (perpendicular al piso), ya que las amplitudes de las registradas para esta red son menores. La causa de ello es que las oscilaciones del perfil de trayectoria en el plano (Y-Z) son de menor amplitud, como se indicó oportunamente al presentar las gráficas 5.20

Principales aportes, conclusiones y lineas de

investigaci´on futuras

En este breve cap´ıtulo se presentan los principales aportes en el área de modelado del sistema de locomoción utilizando principios neurofisiológicos, fruto del trabajo de investigación efectuado a lo largo del presente trabajo de grado; también se indican las conclusiones obtenidas al término del mismo. Por último, se mencionan un conjunto de trabajos de investigación que pertenecen o están directamente asociados al campo de locomoción en robots con patas, los cuales surgieron durante el desarrollo de esta tesis y sirven para complementar y ampliar el trabajo desarrollado durante la misma.

6.1 Principales aportes y conclusiones

En el presente trabajo de investigación se han estudiado diferentes aspectos del modelado del sistema de locomoción en robots cuadrúpedos, haciendo énfasis en las técnicas basadas en principios neurofisiológicos. Sobre las mismas se aplicaron distintos métodos de análisis desarrollados a lo largo de la presente tesis, conformes a los requerimientos que fueron surgiendo durante las investigaciones y pruebas efectuadas. A continuación se presentan los principales aportes efectuados en el área de locomoción en robots cuadrúpedos utilizando modelos neurofisiológicos.

• Se realizó una revisión del estado del arte en modelos neurofisiológicos del siste- ma locomotor en distintos robots con patas, tales como cuadrúpedos y hexápodos,

as´ı como también en robots con otras estructuras mecánicas de locomoción como ser- pientes. En dicha revisión se identificaron los componentes más relevantes, as´ı como las ventajas y desventajas de cada uno de los modelos citados.

• Se identificaron coincidencias en la problemática asociada al modelado del sistema de locomoción, tanto al utilizar el modelo geométrico convencional como bajo el enfoque neurofisiológico. En ambos casos el modelado se basa en dos sistemas: uno de coordinación temporal entre las patas y otro de control de trayectoria para cada pata.

• Se evaluó un modelo de caminado basado en redes neuronales recurrentes (CTRNN), sintetizadas mediante algoritmos genéticos (AGs). Se propuso una funci´on de fitness para los AGs la cual se basó en el análisis espacial de las formas de onda de salida. • Para el análisis del comportamiento de las CTRNN utilizadas como generadores

central de patrones (CPG), se desarrolló una técnica basada en la visualización sobre un plano de la intensidad del campo atractor, el cual está descrito por las ecuaciones diferenciales que controlan la evolución temporal de la red CTRNN.

• Se propuso una implementación del sistema locomotor basado en el concepto de redes neuronales dinámicas (DNN), lo cual representa una nueva aplicación a este tipo de redes originalmente introducidas como sistemas de generación de trayectorias dinámicas.

• El problema de modelado del sistema de caminado utilizando ACPO, donde perma- nec´ıa sin soluci´on la coordinaci´on del movimiento dentro de una pata, fue resuelto mediante la utilizaci´on de una red neuronal tipo feedforward a la salida de los vec- tores de estado de los osciladores acoplados.

• Se propuso y se evaluó la utilización de redes neuronales feedforward para dos fun- ciones: la transición entre distintos perfiles de trayectorias para las patas, y para la transformación de espacio de las referencias temporales en referencias espaciales.

• Fue posible incorporar en un modelo basado en principios neurofisiológicos el paráme- tro denominado factor de apoyo (β) perteneciente al modelo geométrico convencional de caminado, aqu´ı representado mediante una curva de compansión de la fase del vector de referencia temporal de cada pata.

• Se evaluó la utilización de simples señales oscilatorias como referencias temporales del sistema de locomoción.

• Se observ´o una dependencia en la convergencia a un comportamiento oscilatorio del sistema temporal implementado con ACPO, en funci´on del par´ametro g que controla la magnitud de la componente tangencial del campo atractor oscilatorio.

• Mediante la incorporación de las redes neuronales feedforward, fue posible obtener un modelo cuya estructura principal es independiente a la cinemática espec´ıfica de las patas del robot.

• Se logró desarrollar un modelo del sistema de caminado basado en el concepto de generador central de patrones, utilizando para ello osciladores acoplados y redes neuronales. Dicho modelo permite el control de manera expl´ıcita de la velocidad de caminado, modo de locomoción en función de las relaciones de fase entre las patas, control del factor de apoyo de cada pata, as´ı como el control de la trayectoria espacial descrita por la punta de cada una de las patas.

Cabe destacar que el trabajo asociado a la primera propuesta de modelo para el sistema de locomoción (Sección 5.1), basada en referencias temporales simples y redes neuronales feedforward dió pie a una publicaci´on [45] en los Lecture Notes in Computer Science publicado por Springer Berlin/Heidelberg; en la misma el principal aporte reside en el uso de redes neuronales feedforward para efectuar transiciones suaves entre perfiles de trayectorias espaciales para las patas de un robot cuadrúpedo de 3 GDL, as´ı como la comparación entre diferentes señales de referencia temporal.

Por otra parte, se tiene que la segunda propuesta de modelo de locomoción aqu´ı desa- rrollada (Sección 5.2) fué presentada en el marco de la Conferencia Internacional de Robots Caminantes y Escaladores (CLAWAR 2006), y publicada en las actas de dicha conferencia [46]; siendo el principal aporte de la misma la resolución de la coordinación entre las patas mediante ACPO a la vez que se coordina el movimiento de cada pata mediante redes neuronales feedforward, y el control directo del factor de apoyo de cada pata mediante una curva de compansión.

Producto del proceso de investigación efectuado en la revisión del estado del arte en modelado neurofisiológico del sistema locomotor en animales y robots, as´ı como de las pruebas y observaciones efectuadas durante el desarrollo del presente trabajo se obtuvo un conjunto de resultados a partir de los cuales se desprende una serie de conclusiones. Estas pueden ser resumidas de la siguiente manera:

• Es posible modelar el sistema de locomoción en robots cuadrúpedos mediante el uso de principios neurofisiológicos. Mediante la debida modificación del sistema generador de referencias temporales, debe ser posible extender éste enfoque a otros tipos de máquinas caminantes.

• La separación del problema de locomoción en dos problemas, como son la coordi- nación de las relaciones de fase entre las patas y el movimiento controlado de las articulaciones de cada pata, simplifica notablemente el diseño e implementación del sistema completo.

• Las redes neuronales recurrentes (CTRNN) pueden modelar al sistema locomotor como un generador central de patrones, pero las técnicas existentes tanto para la s´ıntesis como análisis de los parámetros de las mismas dificultan la implementación directa de un sistema de control de caminado.

• El uso de CTRNN para locomoción de robots con patas se complica conforme au- menta el numero de patas en la plataforma robótica, o el número de articulaciones

actuadas en cada pata.

• La s´ıntesis de los parámetros de un CPG descrito mediante CTRNN, utilizando para ello AGs con una función de fitness basada en el análisis de las formas de onda de salida de la red no aseguran la convergencia a una solución aceptable como secuencia de caminado. En general uso de AGs no asegura convergencia absoluta al minimo local de un problema.

• El uso de AGs para la s´ıntesis de una CTRNN oscilatoria a utilizar como sistema de referencia temporal resulta poco pr´actico ya que no provee un m´etodo anal´ıtico para el control directo del comportamiento temporal del sistema de caminado. • El uso de una red neurona tipo feedforward en el modelo aqu´ı propuesto para lo-

comoción, exhibe el problema de sobreentrenamiento asociado con el proceso de entrenamiento y la estructura de la capa escondida de la red (número de neuronas escondidas). Consecuencia de este fenómeno, a nivel de la salida del generador de referencias se observan oscilaciones que pueden llegar a reducir la estabilidad del robot durante el caminado.

• La implementación del factor de apoyo (β) como una compansión de la fase de la referencia temporal permite controlar de manera directa dicho parámetro, control del cual no se dispone en los modelos neurofisiológicos propuestos hasta ahora por otros autores.

• En el modelo de caminado propuesto basado en ACPO, las funciones de transici´on suave entre las relaciones de fase de los distintos modos de caminado son redundantes, debido a que el sistema oscilatorio est´a descrito por ecuaciones diferenciales acopladas con las cuales los vectores de estado del sistema evolucionan de manera continua hasta converger a un comportamiento oscilatorio

In document UNIVERSIDAD SIMÓN BOLÍVAR Decanato de Estudios de Postgrado. Magíster en Ingeniería Electrónica (página 112-126)