• No se han encontrado resultados

5.2 Propuesta de modelo generador de modos de caminado

5.2.4 Resultados experimentales y an´ alisis

La primera prueba efectuada fue la generaci´on de perfiles de trayectorias mediante redes neuronales. Se entren´o un total de 5 redes, con diferentes n´umeros de neuronas en la capa escondida, as´ı como diferentes n´umeros de iteraciones de entrenamiento. La trayectoria de entrenamiento se mantuvo constante para todas. El perfil de movimiento de la pata empleado como ejemplo en el entrenamiento se muestra en la Figura 5.19. En la misma se observa una vista en el plano Y-Z, y los valores de los par´ametros son: L = 50mm, H = 120mm y DH = 15mm.

Las redes neuronales fueron entrenadas con las configuraciones de n´umero de neu- ronas en capa escondida (K) e iteraciones de entrenamiento mostradas en la Tabla 5.2.4. Cada una de las redes neuronales fue utilizada para la secci´on de transformaci´on de los vectores de estado provenientes del ACPO. El modo generador de referencias de fases con

Figura 5.19: Trayectoria de ejemplo para entrenamiento.

el ACPO se mantuvo con las fases correspondientes al modo de locomoci´on caminado (ver Tabla 4.6(a)). K No de iteraciones NN1 6 2 millones NN2 8 2 millones NN3 18 2 millones NN4 25 2 millones NN5 25 8 millones

Tabla 5.1: Redes neuronales entrenadas

Las salidas obtenidas para cada una de las redes neuronales al aplicarles los vec- tores de ACPO a la entrada, fueron convertidas del espacio de ´angulos a trayectorias de referencia en el espacio cartesiano, mediante la cinem´atica directa de la pata. De tales tra- yectorias solo son de inter´es las componentes de movimiento que generan un movimiento de locomoci´on en el robot. Para el sistema de referencia mostrado en la Figura 5.18 se puede observar que el movimiento principal de locomoci´on para las patas se efect´ua sobre el plano Y − Z. Las gr´aficas de las trayectorias resultantes para cada una de las redes neuronales se muestran en la Figura 5.20.

(a) Red NN1 (b) Red NN2

(c) Red NN3 (d) Red NN4

(e) Red NN5

neuronales son todas de tipo cerrada, con presencia de rizos u oscilaciones de frecuencia mayor al ciclo principal de locomoci´on. Tales oscilaciones son consecuencia del uso de redes neuronales como aproximadores de funciones; ya que las mismas tratan de converger a los puntos empleados como ejemplos de entrenamiento, sin embargo en aquellos puntos donde no se les provee informaci´on alguna de la salida deseada las redes pueden no converger. La soluci´on inmediata a esta situaci´on es el aumento de puntos de ejemplo extraidos de la trayectoria de referencia.

Las amplitudes de las oscilaciones var´ıan para las distintas redes neuronales, llegan- do al caso de la red NN3 donde las mismas son de amplitud comparables con el ciclo de locomoci´on. Este ejemplo ilustra un problema que es consecuencia de la t´ecnica empleada en el entrenamiento de la red neuronal. En el entrenamiento por backpropagation existe el riesgo de que la soluci´on que se alcance durante un punto del proceso de entrenamiento sea un m´ınimo local en la superficie de error, ya que la minimizaci´on del mismo se hace por gradiente. Una forma de reducir este problema es mediante la adici´on de momento en el algoritmo de correci´on de los pesos a partir de los gradientes, tal como se hizo du- rante el entrenamiento de la red neuronal mostrada en la secci´on anterior, utilizando la herramienta NNTOOL de Matlab.

Se puede observar que para las 4 redes restantes la trayectoria no presenta oscilaci´on alguna en el segmento de trayectoria que corresponde a la fase de apoyo, consecuencia de la selecci´on de los puntos de la trayectoria original empleados en el entrenamiento de las redes neuronales. Este comportamiento es deseable ya que se traduce en un movimiento m´as suave durante el caminado del robot. En las trayectorias resultantes tambi´en se puede observar que las oscilaciones previamente mencionadas no desaparecen totalmente sino que se concentran en el segmento de trayectoria correspondiente a la fase de transferencia, donde la densidad de puntos empleados como ejemplos de entrenamiento era menor.

Tambi´en es posible apreciar la incidencia del n´umero de neuronas en el n´umero de oscilaciones. Se puede observar que conforme aumenta el n´umero de neuronas (K), hay

mayor cantidad de oscilaciones sobre la trayectoria de caminado. Otro fen´omeno observable en las gr´aficas de trayectoria es el impacto del n´umero de iteraciones de entrenamiento sobre la salida obtenida en las redes neuronales. Para las redes NN1, NN2 y NN4, las cuales fueron entrenadas 2 millones de iteraciones la amplitud de las oscilaciones es mayor que en el caso de la red NN5, que fue la ´unica entrenada un total de 8 millones de iteraciones. Esto concuerda con los resultados obtenidos para la red neuronal empleada en la secci´on 5.1.4, donde el aumento del n´umero de iteraciones de entrenamiento se traduc´ıan en un menor error de aproximaci´on a la forma de onda de referencia. Es importante recordar que esta mejora en la aproximaci´on estaba tambi´en asociada a la perdida de capacidad de inferir de la red neuronal, debido al sobreentrenamiento.

Posteriormente, durante el experimento de locomoci´on de la plataforma rob´otica utilizando cada una de las redes neuronales entrenadas se midieron los valores de acele- raci´on que se muestran en las Figuras 5.2.4,5.2.4,5.2.4 y 5.2.4 . Cabe destacar que conse- cuencia de las oscilaciones presentes en la trayectoria generada con la red neuronal NN3, la secuencia de caminado obtenida fue inoperante ya con la misma el robot era totalmente inestable. Las gr´aficas mostradas corresponden a las salidas para las redes NN1, NN2, NN4 y NN5.

(a) Aceler´ometros en ejes X-Y

(b) Aceler´ometros en eje Z

Figura 5.21: La secuencia de locomoci´on obtenida con la red neuronal NN1 era marginal- mente estable, es decir que cuando se aumentaba el valor de frecuencia de oscilaci´on del ACPO (ω) lo que incrementaba la velocidad de paso, el robot era inestable. Los puntos de inestabilidad corresponden a picos en los valores de aceleraciones identificados como A.

(a) Aceler´ometros en ejes X-Y

(b) Aceler´ometros en eje Z

Figura 5.22: Para la secuencia obtenida con esta red neuronal, el comportamiento obser- vado durante la locomoci´on fue muy semejante al correspondiente a la red NN1. Tambi´en era marginalmente estable, y se pudo observar que cualitativamente las vibraciones en la plataforma rob´otica eran m´as perceptibles.

(a) Aceler´ometros en ejes X-Y

(b) Aceler´ometros en eje Z

Figura 5.23: Al igual que para las redes NN1 y NN2, la secuencia de caminado obtenida no era absolutamente estable, por el contrario, el caminado del robot era mucho m´as inestable que en para las dos redes anteriores. ´Esto se puede apreciar en las gr´aficas de aceleraci´on en el plano X-Y, en las cuales se observan mayor cantidad de picos de aceleraciones asociados con movimientos m´as bruscos de la plataforma.

(a) Aceler´ometros en ejes X-Y

(b) Aceler´ometros en eje Z

Figura 5.24: Para esta ´ultima red neuronal se obtuvo un caminado apenas mejor que para las redes NN1, NN2, y NN5. La mejora m´as notable es en las aceleraciones en el eje Z (perpendicular al piso), ya que las amplitudes de las registradas para esta red son menores. La causa de ello es que las oscilaciones del perfil de trayectoria en el plano (Y-Z) son de menor amplitud, como se indic´o oportunamente al presentar las gr´aficas 5.20

Principales aportes, conclusiones y lineas de

investigaci´on futuras

En este breve cap´ıtulo se presentan los principales aportes en el ´area de mode- lado del sistema de locomoci´on utilizando principios neurofisiol´ogicos, fruto del trabajo de investigaci´on efectuado a lo largo del presente trabajo de grado; tambi´en se indican las conclusiones obtenidas al t´ermino del mismo. Por ´ultimo, se mencionan un conjunto de trabajos de investigaci´on que pertenecen o est´an directamente asociados al campo de locomoci´on en robots con patas, los cuales surgieron durante el desarrollo de esta tesis y sirven para complementar y ampliar el trabajo desarrollado durante la misma.

6.1

Principales aportes y conclusiones

En el presente trabajo de investigaci´on se han estudiado diferentes aspectos del mo- delado del sistema de locomoci´on en robots cuadr´upedos, haciendo ´enfasis en las t´ecnicas basadas en principios neurofisiol´ogicos. Sobre las mismas se aplicaron distintos m´etodos de an´alisis desarrollados a lo largo de la presente tesis, conformes a los requerimientos que fueron surgiendo durante las investigaciones y pruebas efectuadas. A continuaci´on se pre- sentan los principales aportes efectuados en el ´area de locomoci´on en robots cuadr´upedos utilizando modelos neurofisiol´ogicos.

• Se realiz´o una revisi´on del estado del arte en modelos neurofisiol´ogicos del siste- ma locomotor en distintos robots con patas, tales como cuadr´upedos y hex´apodos,

as´ı como tambi´en en robots con otras estructuras mec´anicas de locomoci´on como ser- pientes. En dicha revisi´on se identificaron los componentes m´as relevantes, as´ı como las ventajas y desventajas de cada uno de los modelos citados.

• Se identificaron coincidencias en la problem´atica asociada al modelado del sistema de locomoci´on, tanto al utilizar el modelo geom´etrico convencional como bajo el enfoque neurofisiol´ogico. En ambos casos el modelado se basa en dos sistemas: uno de coordinaci´on temporal entre las patas y otro de control de trayectoria para cada pata.

• Se evalu´o un modelo de caminado basado en redes neuronales recurrentes (CTRNN), sintetizadas mediante algoritmos gen´eticos (AGs). Se propuso una funci´on de fitness para los AGs la cual se bas´o en el an´alisis espacial de las formas de onda de salida. • Para el an´alisis del comportamiento de las CTRNN utilizadas como generadores

central de patrones (CPG), se desarroll´o una t´ecnica basada en la visualizaci´on sobre un plano de la intensidad del campo atractor, el cual est´a descrito por las ecuaciones diferenciales que controlan la evoluci´on temporal de la red CTRNN.

• Se propuso una implementaci´on del sistema locomotor basado en el concepto de redes neuronales din´amicas (DNN), lo cual representa una nueva aplicaci´on a este tipo de redes originalmente introducidas como sistemas de generaci´on de trayectorias din´amicas.

• El problema de modelado del sistema de caminado utilizando ACPO, donde perma- nec´ıa sin soluci´on la coordinaci´on del movimiento dentro de una pata, fue resuelto mediante la utilizaci´on de una red neuronal tipo feedforward a la salida de los vec- tores de estado de los osciladores acoplados.

• Se propuso y se evalu´o la utilizaci´on de redes neuronales feedforward para dos fun- ciones: la transici´on entre distintos perfiles de trayectorias para las patas, y para la transformaci´on de espacio de las referencias temporales en referencias espaciales.

• Fue posible incorporar en un modelo basado en principios neurofisiol´ogicos el par´ame- tro denominado factor de apoyo (β) perteneciente al modelo geom´etrico convencional de caminado, aqu´ı representado mediante una curva de compansi´on de la fase del vector de referencia temporal de cada pata.

• Se evalu´o la utilizaci´on de simples se˜nales oscilatorias como referencias temporales del sistema de locomoci´on.

• Se observ´o una dependencia en la convergencia a un comportamiento oscilatorio del sistema temporal implementado con ACPO, en funci´on del par´ametro g que controla la magnitud de la componente tangencial del campo atractor oscilatorio.

• Mediante la incorporaci´on de las redes neuronales feedforward, fue posible obtener un modelo cuya estructura principal es independiente a la cinem´atica espec´ıfica de las patas del robot.

• Se logr´o desarrollar un modelo del sistema de caminado basado en el concepto de generador central de patrones, utilizando para ello osciladores acoplados y redes neuronales. Dicho modelo permite el control de manera expl´ıcita de la velocidad de caminado, modo de locomoci´on en funci´on de las relaciones de fase entre las patas, control del factor de apoyo de cada pata, as´ı como el control de la trayectoria espacial descrita por la punta de cada una de las patas.

Cabe destacar que el trabajo asociado a la primera propuesta de modelo para el sistema de locomoci´on (Secci´on 5.1), basada en referencias temporales simples y redes neuronales feedforward di´o pie a una publicaci´on [45] en los Lecture Notes in Computer Science publicado por Springer Berlin/Heidelberg; en la misma el principal aporte reside en el uso de redes neuronales feedforward para efectuar transiciones suaves entre perfiles de trayectorias espaciales para las patas de un robot cuadr´upedo de 3 GDL, as´ı como la comparaci´on entre diferentes se˜nales de referencia temporal.

Por otra parte, se tiene que la segunda propuesta de modelo de locomoci´on aqu´ı desa- rrollada (Secci´on 5.2) fu´e presentada en el marco de la Conferencia Internacional de Robots Caminantes y Escaladores (CLAWAR 2006), y publicada en las actas de dicha conferencia [46]; siendo el principal aporte de la misma la resoluci´on de la coordinaci´on entre las patas mediante ACPO a la vez que se coordina el movimiento de cada pata mediante redes neuronales feedforward, y el control directo del factor de apoyo de cada pata mediante una curva de compansi´on.

Producto del proceso de investigaci´on efectuado en la revisi´on del estado del arte en modelado neurofisiol´ogico del sistema locomotor en animales y robots, as´ı como de las pruebas y observaciones efectuadas durante el desarrollo del presente trabajo se obtuvo un conjunto de resultados a partir de los cuales se desprende una serie de conclusiones. Estas pueden ser resumidas de la siguiente manera:

• Es posible modelar el sistema de locomoci´on en robots cuadr´upedos mediante el uso de principios neurofisiol´ogicos. Mediante la debida modificaci´on del sistema genera- dor de referencias temporales, debe ser posible extender ´este enfoque a otros tipos de m´aquinas caminantes.

• La separaci´on del problema de locomoci´on en dos problemas, como son la coordi- naci´on de las relaciones de fase entre las patas y el movimiento controlado de las articulaciones de cada pata, simplifica notablemente el dise˜no e implementaci´on del sistema completo.

• Las redes neuronales recurrentes (CTRNN) pueden modelar al sistema locomotor como un generador central de patrones, pero las t´ecnicas existentes tanto para la s´ıntesis como an´alisis de los par´ametros de las mismas dificultan la implementaci´on directa de un sistema de control de caminado.

• El uso de CTRNN para locomoci´on de robots con patas se complica conforme au- menta el numero de patas en la plataforma rob´otica, o el n´umero de articulaciones

actuadas en cada pata.

• La s´ıntesis de los par´ametros de un CPG descrito mediante CTRNN, utilizando para ello AGs con una funci´on de fitness basada en el an´alisis de las formas de onda de salida de la red no aseguran la convergencia a una soluci´on aceptable como secuencia de caminado. En general uso de AGs no asegura convergencia absoluta al minimo local de un problema.

• El uso de AGs para la s´ıntesis de una CTRNN oscilatoria a utilizar como sistema de referencia temporal resulta poco pr´actico ya que no provee un m´etodo anal´ıtico para el control directo del comportamiento temporal del sistema de caminado. • El uso de una red neurona tipo feedforward en el modelo aqu´ı propuesto para lo-

comoci´on, exhibe el problema de sobreentrenamiento asociado con el proceso de entrenamiento y la estructura de la capa escondida de la red (n´umero de neuronas escondidas). Consecuencia de este fen´omeno, a nivel de la salida del generador de referencias se observan oscilaciones que pueden llegar a reducir la estabilidad del robot durante el caminado.

• La implementaci´on del factor de apoyo (β) como una compansi´on de la fase de la referencia temporal permite controlar de manera directa dicho par´ametro, control del cual no se dispone en los modelos neurofisiol´ogicos propuestos hasta ahora por otros autores.

• En el modelo de caminado propuesto basado en ACPO, las funciones de transici´on suave entre las relaciones de fase de los distintos modos de caminado son redundantes, debido a que el sistema oscilatorio est´a descrito por ecuaciones diferenciales acopladas con las cuales los vectores de estado del sistema evolucionan de manera continua hasta converger a un comportamiento oscilatorio

Documento similar