CENTRO DE INVESTIGACI ´ ON Y DESARROLLO DE TECNOLOG´ IA DIGITAL
DOCTORADO EN CIENCIAS EN SISTEMAS DIGITALES
“CONTROL NO LINEAL DE ROBOTS M ´OVILES TIPO UNICICLO
USANDO LA TEOR´IA DE LYAPUNOV”
TESIS
QUE PARA OBTENER EL GRADO DE
DOCTORADO EN CIENCIAS EN SISTEMAS DIGITALES
PRESENTA
M. C. LUIS GONZALO MONTOYA VILLEGAS
BAJO LA DIRECCI ´ON DE
DR. RICARDO RAM ´ON P´EREZ ALCOCER DR. EDUARDO JAVIER MORENO VALENZUELA
MAYO 2021 TIJUANA, B.C., M´EXICO.
CARTA CESIÓN DE DERECHOS
En la Ciudad de Tijuana, Baja California. el día 25 del mes de mayo del año 2021, el que suscribe Luis Gonzalo Montoya Villegas, alumno del Programa de DOCTORADO EN CIENCIAS EN SISTEMAS DIGITALES, con número de registro B170664, adscrito(a) al CENTRO DE INVESTIGACIÓN Y DESARROLLO DE TECNOLOGÍA DIGITAL, manifiesta que es el autor intelectual del presente trabajo de Tesis bajo la dirección de Dr.
Eduardo Javier Moreno Valenzuela y de Dr. Ricardo Ramón Pérez Alcocer y cede los derechos del trabajo titulado Control No Lineal de Robots Móviles Tipo Uniciclo Usando La Teoría de Lyapunov, al Instituto Politécnico Nacional para su difusión, con fines académicos y de investigación.
Los usuarios de la información no deben reproducir el contenido textual, gráficas o datos del trabajo sin el permiso expreso del (de la) autor(a) y/o director(es) del trabajo. Este puede ser obtenido escribiendo a las siguientes direcciones Av. Instituto Politécnico Nacional No.
1310 Col Nueva Tijuana, Tijuana, Baja California, México, correo electrónico de contacto:
[email protected]. Si el permiso se otorga, el usuario deberá dar el agradecimiento correspondiente y citar la fuente del mismo.
Luis Gonzalo Montoya Villegas
SECRETARÍA DE INVESTIGACIÓN Y POSGRADO
A mi familia.
Debo agradecer a mis padres y hermanas por todo su apoyo econ´omico y moral a lo largo de mi formaci´on acad´emica que me condujeron a la finalizaci´on de mi investigaci´on de tesis doctoral.
Por otra parte, quiero agradecer a mis asesores de tesis el Dr. Eduardo Javier Moreno Valenzue- la y al Dr. Ricardo Ram´on P´erez Alcocer por toda la ayuda, consejos, conocimientos y motivaci´on que me brindaron en mis estudios de posgrado.
Adem´as, quiero dar un especial agradecimiento al Dr. V´ıctor Hugo D´ıaz Ram´ırez, al Dr. Juan Jos´e Tapia Armenta y al Dr. Jes´us Alberto Sandoval Galarza por formar parte de mi comit´e tuto- rial, por sus cuestionamientos, reflexiones, orientaci´on y critica constructiva sobre mi investigaci´on.
De la misma manera, agradezco al CITEDI-IPN por brindarme la oportunidad de realizar en el mi trabajo de tesis y por darme todas las facilidades administrativas y de infraestructura para poder realizar mi investigaci´on de inicio a fin.
Por otro lado, agradezco a todas las amistades que hice en el CITEDI por su apoyo indirecto con su motivaci´on y por todos los buenos momentos.
Por ´ultimo, pero no menos importante, agradezco el apoyo econ´omico recibido de parte de CONACYT y del Instituto Polit´ecnico Nacional para realizar este trabajo de tesis doctoral.
Tipo Uniciclo Usando La Teor´ıa de Lyapunov
Resumen
En este trabajo de tesis se presentan los resultados principales obtenidos de el control no lineal de robots m´oviles de tipo uniciclo, donde la estabilidad te´orica del equilibrio cero del sistema es probada mediante la teor´ıa de Lyapunov para cada controlador dise˜nado. El primer controlador desarrollado en este trabajo presenta una ley de control basada en linealizaci´on por retroalimen- taci´on para seguimiento de trayectorias la cual no toma en cuenta el efecto de saturaci´on presente en los actuadores del robot. La validaci´on experimental es llevada a cabo mediante una trayectoria circular y lemniscata, adem´as, es comparado el desempe˜no con tres controladores publicados en la literatura, obteni´endose mejores resultados con el controlador propuesto.
Por otra parte, se presenta una familia de controladores para seguimiento de trayectorias que toma en cuenta el efecto de saturaci´on de la acci´on de control. Cinco dise˜nos de controladores son presentados y evaluados experimentalmente, mostrando la ventaja de esta familia con respecto a una versi´on no saturada. Adem´as, un controlador saturado para seguimiento de trayectorias con estructura tipo proporcional-integral (PI) es dise˜nado y evaluado experimentalmente en compa- raci´on con cuatro esquemas de control saturado reportados en la literatura, mostrando una mejor robustez y desempe˜no ante una trayectoria circular.
Por ´ultimo, en relaci´on a tareas coordinadas, una metodolog´ıa de consenso es dise˜nada con base en una propuesta introducida en la literatura donde se relajan las condiciones del controlador de regulaci´on de posici´on necesario para los agentes. M´as a´un, se presenta un nuevo controlador de regulaci´on saturado que asegura estabilidad asint´otica. Esta metodolog´ıa de consenso es evaluada experimentalmente y comparada con la metodolog´ıa original, presentando mejoras en tiempo de alcance del consenso, la suavidad de movimiento y la precisi´on que proporciona el controlador en relaci´on a la reducci´on de los errores de posici´on y de consenso.
Palabras clave: Robot m´ovil, saturaci´on de la entrada, control no lineal, seguimiento de trayectoria, regulaci´on de posici´on, consenso.
Mobile Robots Using Lyapunov’s Theory
Abstract
In this thesis, the main results obtained from the non-linear control of unicycle-type mobile robots are presented, where the theoretical stability of the zero equilibrium of the system is tested by using Lyapunov’s theory for each designed controller. The first controller developed in this work presents a control law based on feedback linearization for trajectory tracking which does not take into account the saturation effect present in the robot’s actuators. The experimental validation is carried out following a circular and lemniscate trajectory, besides, the performance is compared with three controllers from the literature, obtaining the best results with the proposed controller.
On the other hand, a family of controllers for trajectory tracking is presented that takes into account the saturation effect of the control action. Five controller designs are presented and expe- rimentally evaluated, showing the advantage of this family against an unsaturated version. Also, a saturated controller for tracking trajectories with a proportional-integral (PI)-type structure is experimentally designed and evaluated in comparison with four saturated control schemes from the literature, showing better robustness and performance following a circular trajectory.
Finally, concerning coordinated tasks, a consensus methodology is designed based on one from the literature where the conditions of the position regulation controller necessary for the agents are relaxed. Therefore, besides, a new saturated regulation controller is presented that ensures asym- ptotic stability. This consensus methodology is experimentally evaluated and compared with the original methodology, showing improvements in the time to reach the consensus, the smoothness of movement, and the precision provided by the controller concerning the reduction of position and consensus errors.
Keywords: Mobile robot, input saturation, nonlinear control, trajectory tracking, position regulation, consensus.
´Indice i
Lista de figuras iii
Lista de tablas v
1. Introducci´on 1
1.1. Justificaci´on . . . 4
1.2. Objetivos . . . 4
1.2.1. Objetivo general . . . 4
1.2.2. Objetivos espec´ıficos . . . 4
1.3. Organizaci´on del documento . . . 5
2. Control No Lineal de Robots M´oviles Tipo Uniciclo 6 2.1. Controlador de seguimiento de trayectorias basado en linealizaci´on por retroalimen- taci´on . . . 6
2.1.1. Modelo cinem´atico . . . 6
2.1.2. Formulaci´on del problema de control . . . 7
2.1.3. Din´amica del error en lazo abierto . . . 7
2.1.4. Dise˜no del controlador basado en linealizaci´on por retroalimentaci´on . . . . 8
2.1.5. Validaci´on experimental . . . 12
2.1.5.1. Controladores para comparaci´on . . . 12
2.1.5.2. Comparaci´on experimental usando una trayectoria circular . . . . 13
2.1.5.3. Comparaci´on experimental usando una trayectoria lemniscata . . 17
2.1.6. Discusiones . . . 20
3. Control No Lineal de Robots M´oviles Tipo Uniciclo con Saturaci´on de La En- trada de Control 21 3.1. Familia de controladores de entradas saturadas . . . 21
3.1.1. Preliminares . . . 21
3.1.2. Problema de control . . . 21
3.1.3. Dise˜no de la familia de controladores de entradas saturadas . . . 22
3.1.4. Dise˜nos de funciones . . . 25
3.1.4.1. Dise˜no 1 . . . 25
3.1.4.2. Dise˜no 2 . . . 27
3.1.4.3. Dise˜no 3 . . . 28
3.1.4.4. Dise˜no 4 . . . 30
3.1.4.5. Dise˜no 5 . . . 33
3.1.5. Validaci´on experimental . . . 35
3.1.5.1. Resultados obtenidos con una trayectoria circular . . . 35
3.1.5.2. Resultados obtenidos con una trayectoria lemniscata . . . 38
3.1.6. Discusiones . . . 40
3.2. Controlador de seguimiento tipo PI con entradas saturadas . . . 40
3.2.1. Modelo cinem´atico y objetivo de control . . . 40
3.2.2. Controlador saturado tipo proporcional-integral . . . 42
3.2.3. Estabilidad del sistema en lazo cerrado . . . 42
3.2.4. Discusi´on sobre la robustez . . . 45
3.2.4.1. Simulaciones num´ericas del robot m´ovil con perturbaciones . . . . 47
3.2.5. Evaluaci´on experimental . . . 48
3.2.5.1. Controladores para comparaci´on . . . 49
3.2.5.1.1. Controladores saturados para el modelo cinem´atico (3.42) 49 3.2.5.1.2. Controladores saturados para el modelo cinem´atico con el punto de inter´es desplazado . . . 49
3.2.5.2. Plataforma experimental . . . 51
3.2.5.3. Resultados experimentales . . . 51
4. Control No Lineal de Robots M´oviles Tipo Uniciclo con Saturaci´on de La En- trada de Control en Tareas Coordinadas 56 4.1. Tarea de consenso . . . 56
4.1.1. Teor´ıa de grafos . . . 56
4.1.2. Dise˜no del protocolo de consenso . . . 57
4.1.3. Controlador saturado propuesto para regulaci´on . . . 59
4.1.4. Evaluaci´on experimental . . . 62
4.1.4.1. Controlador basado en LQR de rotar y avanzar . . . 63
4.1.4.2. Plataforma experimental real-virtual . . . 64
4.1.4.3. Configuraci´on del consenso . . . 64
4.1.4.4. Resultados experimentales . . . 65
5. Conclusiones 73 5.1. Conclusi´on . . . 73
5.2. Contribuciones . . . 73
5.3. Trabajo futuro . . . 74
Bibliograf´ıa 75
2.1. Representaci´on cinem´atica del robot m´ovil. . . 6 2.2. Configuraci´on de la plataforma experimental. . . 12 2.3. Resultados experimentales: rutas trazadas por el robot m´ovil P3-DX. El punto
de inicio es mostrado por (o, o,o y o), y la posici´on final por (, , y ). . . 15 2.4. Resultados experimentales: (izquierda) evoluci´on en el tiempo de x(t), y(t) y
θ(t); (derecha) evoluci´on en el tiempo de los errores de posici´on ˜x(t), ˜y(t) y ˜θ(t). . 16 2.5. Resultados experimentales: (izquierda) evoluci´on en el tiempo de las entradas
de control demandadas; (derecha) errores de la acci´on de control. . . 16 2.6. Resultados experimentales: rutas trazadas por el robot m´ovil P3-DX. El punto
de inicio es mostrado por (o, o,o y o), y la posici´on final por (, , y ). . . 18 2.7. Resultados experimentales: (izquierda) evoluci´on en el tiempo de x(t), y(t) y
θ(t); (derecha) evoluci´on en el tiempo de los errores de posici´on ˜x(t), ˜y(t) y ˜θ(t). . 19 2.8. Resultados experimentales: (izquierda) evoluci´on en el tiempo de las entradas
de control demandadas; (derecha) errores de la acci´on de control. . . 19 3.1. Resultados experimentales: trayectoria circular trazada por el robot. El punto
de partida est´a representado por (o,o, o,o, oy o) y la posici´on final est´a indicada por (, , ,, y ). . . 36 3.2. Resultados experimentales: evoluci´on temporal de la postura y sus errores ante
una trayectoria circular de referencia. . . 37 3.3. Resultados experimentales: entradas de control de velocidad saturadas para
una trayectoria circular de referencia. . . 37 3.4. Resultados experimentales: ruta lemniscata trazada por el robot. El punto de
partida est´a representado por (o, o, o,o,o yo) y la posici´on final est´a indicada por (,, , , y ). . . 39 3.5. Resultados experimentales: evoluci´on temporal de la postura y sus errores ante
una trayectoria circular de referencia. . . 39 3.6. Resultados experimentales: entradas de control saturadas para seguimiento de
la trayectoria lemniscata. . . 40 3.7. Robot m´ovil tipo uniciclo con dos ubicaciones diferentes del punto de inter´es (x, y). 41 3.8. Resultados de la simulaci´on: evoluci´on en el tiempo de los errores e1(t), e2(t)
y e3(t), para los sistemas en lazo cerrado linealizados y no lineales utilizando el controlador JLN y el controlador tipo PI propuesto sometido a perturbaciones. . . 48 3.9. Configuraci´on de la plataforma experimental para el control del robot m´ovil Qbot 2. 51 3.10. Resultados experimentales: rutas trazadas por los controladores 1, 2, 3, 4 y el
controlador PI propuesto. El punto de partida est´a representado por (o, o, o, o y o) y la posici´on final est´a indicada por (,, , y ). . . 53 3.11. Resultados experimentales: evoluci´on en el tiempo de x(t), y(t), y θ(t). . . 54
3.12. Resultados experimentales: evoluci´on en el tiempo de la velocidad lineal V (t) y la velocidad angular W (t). Tambi´en se ilustran los l´ımites de saturaci´on Vmax y Wmax (l´ınea morada). . . 54 4.1. Plataforma experimental real-virtual. . . 64 4.2. Topolog´ıa de interacci´on din´amica para experimentos de consenso. . . 65 4.3. Formaci´on final del sistema multiagente con zona segura libre de colisiones dentro
de un c´ırculo virtual de radio r. . . 65 4.4. Resultados experimentales: rutas trazadas por los robots m´oviles. El punto de
partida est´a representado por (o, o, o y o) y la posici´on final est´a indicada por (,
, y ). . . 67 4.5. Resultados experimentales: evoluci´on en el tiempo de la postura de los robots
moviles. . . 68 4.6. Resultados experimentales: evoluci´on en el tiempo del error de postura de los
robots moviles. . . 69 4.7. Resultados experimentales: velocidad lineal saturada comandada. . . 70 4.8. Resultados experimentales: velocidad angular saturada comandada. . . 71 4.9. Resultados experimentales: evoluci´on en el tiempo del error de consenso. . . . 72
2.1. Trayectoria circular: ganancias seleccionadas para cada controlador . . . 14
2.2. Resultados experimentales para la trayectoria circular: valores RMS para la comparaci´on de los controladores DDZB (2.37), CKSS (2.38), PLLN (2.39) y el controlador propuesto (2.16) . . . 15
2.3. Trayectoria lemniscata: ganancias seleccionadas para cada controlador . . . 17
2.4. Resultados experimentales para la trayectoria lemniscata: valores RMS para la comparaci´on de los controladores DDZB (2.37), CKSS (2.38), PLLN (2.39) y el controlador propuesto (2.16) . . . 18
2.5. Porcentaje de mejora del controlador propuesto con respecto a los controladores DDZB, CKSS y PLLN, calculados a partir de los valores RMS para las implemen- taciones de las trayectorias circular y lemniscata . . . 20
3.1. Par´ametros de los controladores. . . 35
3.2. Trayectoria circular: valores RMS para los errores de posici´on y orientaci´on y las entradas de control. . . 36
3.3. Trayectoria lemniscata: valores RMS para los errores de posici´on y orientaci´on y las entradas de control. . . 38
3.4. Resultados experimentales: valores RMS de los errores de seguimiento y de las entradas de control obtenidos en las pruebas en tiempo real para el intervalo de tiempo 60 [s] ≤ t ≤ 80 [s] (estado estacionario). . . 54
3.5. Resultados experimentales: porcentaje de mejora con base en los valores RMS obtenidos con el controlador PI propuesto contra los controladores 1 a 4. . . 55
4.1. Configuraci´on inicial para los dos experimentos de consenso. . . 65
4.2. Par´ametros del nuevo controlador. . . 66
4.3. Par´ametros del controlador basado en LQR rotar y avanzar. . . 66
4.4. Resultados experimentales: valores RMS de los errores de posici´on y de consenso en el intervalo de tiempo 40 [s] ≤ t ≤ 50 [s]. . . 72
Cap´ıtulo 1 Introducci´ on
El inter´es en el control de veh´ıculos m´oviles ha crecido en la comunidad de control en las ´ulti- mas d´ecadas. Debido a que los robots m´oviles cuentan con caracter´ısticas especiales a diferencia de otros tipos de veh´ıculos, como lo es el contar con dos ruedas de tracci´on independiente y una o dos ruedas de apoyo para lograr estabilidad. As´ı mismo, estos veh´ıculos son de f´acil construcci´on y como la mayor´ıa de los veh´ıculos con ruedas son no holon´omicos, es decir el robot no puede cambiar la direcci´on de movimiento de forma perpendicular al sentido de movimiento de las rue- das de forma instant´anea.
El reto de control consiste en conducir el veh´ıculo en un plano 2D, controlando la posici´on en coordenadas x, y y su orientaci´on, teniendo entonces tres grados de libertad y solo dos entradas de control, lo cual lo clasifica como un problema de control de robots subactuados con restricciones no holon´omicas.
La mayor´ıa de trabajos en control de robots m´oviles tipo uniciclo toman en cuenta solo el modelo cinem´atico, el cual se describe por su postura y velocidades [1, 2, 3, 4, 5].
En la actualidad no es pr´actico el control de robots m´oviles tipo uniciclo sin considerar su saturaci´on de velocidad o el comportamiento din´amico debido a la respuesta no instant´anea de los actuadores, con el prop´osito de tener seguridad y evitar derrapes. Por tanto, algunos investigado- res han tomado en cuenta el hecho que los actuadores no pueden seguir comandos de velocidad que cambien r´apidamente, por consiguiente, se ha prestado atenci´on a la din´amica de los robots m´oviles con ruedas [6, 7].
Por otra parte, el problema de estabilizaci´on y seguimiento de trayectorias para sistemas m´ovi- les no holon´omicos con entradas saturadas ha sido estudiado raras veces en la literatura. Existen algunos registros a partir de 2001 donde presentan esquemas de control para resolver el problema de estabilizaci´on y seguimiento. Por ejemplo, los autores en [1] ofrecen soluciones basadas en t´ecni- cas de backstepping y la funci´on de saturaci´on de forma expl´ıcita, mientras en [2] propusieron un par de controladores tanto para estabilizaci´on y para seguimiento de trayectorias usando t´ecnicas basadas en pasividad y normalizaci´on usando funciones de saturaci´on suaves como la tangente hiperb´olica (tanh).
El inter´es en esta ´area de investigaci´on parece haber decrecido despu´es de la aparici´on de los controladores mencionados en el p´arrafo anterior hasta cinco a˜nos despu´es donde se propuso en [3] una t´ecnica llamada control h´ıbrido. Esta t´ecnica permite dise˜nar un controlador con dos par-
tes separadas: una primera parte del algoritmo responsable de posicionar al robot y la segunda parte capaz de estabilizarlo. Adem´as, este controlador utiliza la funci´on de saturaci´on discontinua (funci´on signo, abreviado como sign). Un a˜no despu´es de despertar el inter´es en el ´area apareci´o la primera aportaci´on de soluciones basadas en el control difuso como se reporta en [4] donde esta t´ecnica es utilizada en conjunto con la funci´on de saturaci´on discontinua (sign). En ese mismo a˜no de 2007 y continuando con la tendencia de aquella ´epoca, el control discontinuo tendr´ıa su auge con la aparici´on del primer controlador por modos deslizantes [5], el cual usa el controlador introducido en [2] para tomar en cuenta la saturaci´on de los actuadores.
En 2008 el control adaptable aparece en [7] donde se dise˜n´o un controlador cinem´atico con la funci´on de saturaci´on suave (tanh) en combinaci´on con un controlador adaptable para intentar reducir el error provocado por los par´ametros din´amicos del robot. M´as tarde, Wang [8] present´o un controlador para estabilizaci´on mediante una transformaci´on de los estados del sistema y la utilizaci´on de la funci´on de saturaci´on discontinua (sign). Un a˜no despu´es, en 2009 y como con- tribuci´on adicional al control de m´ultiples robots m´oviles se introdujo una nueva t´ecnica llamada
“comportamiento basado en el espacio nulo” en los trabajos [9, 10, 11] donde utilizan una funci´on de saturaci´on discontinua propia llamada “Capacidad”.
En el a˜no 2010 son revisitados los controladores introducidos en [2], los cuales son modifica- dos realizando una diferente transformaci´on de coordenadas involucrada en muchos trabajos en rob´otica m´ovil, con el fin de hacer m´as r´apida su respuesta. Dos a˜nos m´as tarde en 2012 los autores de [13] presentaron nuevamente la t´ecnica de backstepping y control en tiempo finito haciendo uso de la funci´on suave tangente hiperb´olica (tanh) para la limitaci´on de las velocidades y la funci´on discontinua (sign) para limitar los pares. En ese mismo a˜no de 2012 el control servovisual apareci´o por primera vez en este campo, siendo en [14, 15] donde se report´o la t´ecnica de control en tiempo finito y control robusto el cual hace uso de funciones de saturaci´on y discontinua (sat y sign, respectivamente).
Nuevamente, Huang et al. [16] revisitaron el control adaptable para resolver los problemas de estabilizaci´on y seguimiento, mediante el uso de un controlador virtual cinem´atico y un control adaptable, que permiti´o limitar los pares usando la funci´on de saturaci´on explicita sat y someti- do a perturbaciones externas. En ese mismo a˜no 2013 el control difuso volvi´o a ser abordado en [17] donde un controlador de seguimiento fue dise˜nado sin hacer uso de funciones de saturaci´on,
´
unicamente haciendo uso de un controlador basado en la cinem´atica inversa y las funciones de pertenencia propias del control difuso. Al mismo tiempo, se present´o un controlador por conmuta- ci´on en [18] el cual fue sometido a perturbaciones e incertidumbres param´etricas usando la funci´on de saturaci´on suave tanh. Un a˜no despu´es en 2014, el trabajo presentado por Chen y Jia en [19], correspondi´o al primer controlador que utiliz´o un par de filtros de primer orden para saturar las velocidades e incorpor´o las funciones discontinuas sat y sign para limitar los pares de entrada. A su vez en [20] se present´o un control por realimentaci´on din´amica, que consisti´o en un par de con- troladores: un control cinem´atico y un segundo control tomado del trabajo previo [13] desarrollado por el mismo autor. En [21] los autores extienden el m´etodo de conmutaci´on propuesto en [18]
agregando mejoras. Tambi´en, Chen et al. [22] hicieron uso de la retroalimentaci´on servovisual para un control de estabilizaci´on, el cual utiliza la t´ecnica del control por conmutaci´on en un control discontinuo.
M´as tarde, en 2015 se abord´o nuevamente el control adaptable en [23] el cual no posee medi- ci´on de la velocidad y para ello el autor dise˜n´o un esquema de control-observador en combinaci´on
con una ley de control de retroalimentaci´on de salida saturada. En [24] se present´o un esquema de control para estabilizaci´on usando retroalimentaci´on de estados el cual utiliza funciones de saturaci´on discontinuas. Shojaei [25] present´o un enfoque de control robusto, el cual usa un con- trolador saturado por la funci´on tanh, un observador para la estimaci´on de la velocidad, un control de superficie din´amica para los actuadores, adem´as de que cuenta con redes neuronales y t´ecni- cas adaptables robustas para reducir los errores provocados por incertidumbres no lineales y por par´ametros desconocidos. Al final del a˜no 2015 se present´o despu´es de muchos a˜nos un controlador basado en la t´ecnica pasividad [26], el cual combina un control adaptable y un control-observador para compensar los par´ametros desconocidos y la no medici´on de la velocidad.
En el 2016 se volvi´o a prestar atenci´on a los problemas de control coordinado y en [27] se propone un control de formaci´on sujeto a restricciones de velocidad, el cual emplea observadores y controladores dise˜nados con la funci´on de saturaci´on sat. Serrano et al. [28] presentaron un con- trolador trapezoidal, el cual es una modificaci´on del modelo cinem´atico, este controlador limita la acci´on de control mediante la regulaci´on de par´ametros del controlador.
Para el a˜no 2017 algunos avances se han dado mediante t´ecnicas basadas en algebra lineal como en [29] donde adem´as los autores siguen utilizando la aproximaci´on trapezoidal del modelo cinem´atico y la actualizaci´on de par´ametros del control para limitar la acci´on de control. Otra t´ecnica reciente fue presentada en [30] donde adem´as de tomar en cuenta las limitaciones de las se˜nales de control se estudia el caso de control coordinado mediante el problema de formaci´on utilizando una ley de control din´amica que utiliza la funci´on de saturaci´on sat para limitar la acci´on de control. En [31, 32] se utiliz´o la t´ecnica del control neuronal adaptable para el problema de formaci´on en control coordinado. Liu y Gao [33] dise˜naron un controlador predictivo basado en Lyapunov, el cual utiliza una funci´on de saturaci´on suave como lo es la tanh cl´asica.
Por ´ultimo, desde entonces hasta la fecha han surgido una gran cantidad de trabajos tanto para control saturado de un robot como para m´ultiples agentes en tareas coordinadas. Por mencio- nar algunos ejemplos, en [34], se propuso un controlador distribuido acotado para el problema de consenso global de seguimiento de l´ıder. Un controlador robusto basado en redes neuronales para el seguimiento de la trayectoria y la estabilizaci´on con par´ametros desconocidos, perturbaciones externas y saturaci´on de entrada fue presentado en [35]. Liu et al. [36] dise˜n´o un controlador de seguimiento de modo deslizante adaptable considerando la saturaci´on de entrada, incertidumbres y las perturbaciones externas. Los autores de [37] presentaron un esquema de control de trayecto- rias no lineal en cascada adaptable con saturaci´on de entrada. Yin et al. [38] abordan el problema del consenso para un sistema heterog´eneo de segundo orden considerando la saturaci´on de entra- da. Los autores de [39] propusieron controladores distribuidos basados en observadores de modo deslizante para lograr un seguimiento de consenso global en tiempo finito con entradas de control acotadas. Los autores de [40] utilizaron controladores saturados distribuidos en el problema de consenso global. En [41], se propuso un controlador neuronal adaptable sujetos a saturaci´on y perturbaciones del actuador.
Luego de revisar en la literatura el estado actual del control de veh´ıculos m´oviles, se concluye que en los ´ultimos a˜nos se ha estado trabajando de forma rigurosa el fen´omeno de la saturaci´on y se est´a tratando de extrapolar hacia aquellos problemas relacionados al control coordinado.
En resumen, puede concluirse que las t´ecnicas m´as usadas para dise˜nar controladores saturados utilizan funciones de saturaci´on suaves y discontinuas, siendo la tanh la m´as utilizada en diferentes esquemas de control. Adem´as, el problema de consenso est´a recibiendo mucha atenci´on, debido
a su escalabilidad con otras tareas coordinadas y se comienzan a publicar cada vez m´as trabajos donde se toman en cuenta los l´ımites de velocidad presentes para los agentes.
1.1. Justificaci´ on
El control de robots m´oviles tipo uniciclo es un tema interesante desde el punto de vista pr´acti- co. La configuraci´on uniciclo es la base de las distintas configuraciones existentes de robots m´oviles o veh´ıculos. Por tanto, el dise˜no de leyes de control para esta clase de robots m´oviles que permiten dirigir o llevar a cabo una tarea se facilita de gran medida y pueden ser extrapolados a alguna configuraci´on espec´ıfica. Aunque en la literatura ya se encuentran numerosas aportaciones en este tema, poca importancia se le ha dado al fen´omeno de saturaci´on presente en los actuadores en la pr´actica. Este fen´omeno restringe la velocidad que puede entregar el robot y provoca que no sea capaz de realizar la tarea programada, debido a que la velocidad comandada o requerida es imposible de ejecutar f´ısicamente. Por ello, surge la necesidad de dise˜nar acciones de control que est´en limitadas y que adem´as se asegure que la tarea a desempe˜nar pueda ser lograda.
Por otro lado, la interacci´on de m´ultiples veh´ıculos es una tendencia en la actualidad. Cada vez es m´as com´un ver robots colaborando con otros para lograr una tarea espec´ıfica en diferentes campos para incrementar su eficiencia. En particular, la tarea de consenso es la base de m´ultiples tareas coordinadas como el control de formaci´on y el control l´ıder-seguidor. El consenso consiste en que los agentes involucrados alcancen un estado en com´un mediante la informaci´on disponible de los agentes vecinos. Por tanto, las contribuciones en esta ´area resultan valiosas si adem´as se toma en cuenta el fen´omeno presente previamente descrito de la saturaci´on.
1.2. Objetivos
1.2.1. Objetivo general
Analizar, dise˜nar y validar por medio de simulaciones y experimentos esquemas de control no lineal para robots m´oviles tipo uniciclo. Se presta particular atenci´on a los problemas de saturaci´on de la entrada de control y al control coordinado de dos robots.
1.2.2. Objetivos espec´ıficos
Mantener actualizado el estado del arte sobre control no lineal saturado en robots m´oviles tipo uniciclo.
Habilitar la operaci´on del robot m´ovil Qbot 2 y Pionner P3-DX.
Estudiar, dise˜nar, realizar simulaciones y comparaciones experimentales de distintas t´ecnicas de control no lineal que contemplen saturaci´on en la entrada de control.
Estudiar, dise˜nar, realizar simulaciones y comparaciones experimentales de distintas t´ecnicas de control no lineal coordinado para robots tipo uniciclo.
1.3. Organizaci´ on del documento
El documento se encuentra organizado de la siguiente forma: en el Cap´ıtulo 2 se presenta el trabajo realizado sobre control no lineal para veh´ıculos con ruedas tipo uniciclo, donde se pro- pone un controlador para seguimiento de trayectorias basado en la t´ecnica de linealizaci´on por retroalimentaci´on y se muestra la validaci´on experimental mediante una comparaci´on con tres con- troladores ya reportados en la literatura. El Cap´ıtulo 3 est´a dedicado al control no lineal saturado en robots m´oviles tipo uniciclo. Se incluye el desarrollo de una familia de controladores saturados de seguimiento de trayectorias, as´ı como una comparaci´on experimental de cinco diferentes con- troladores dise˜nados. Por otra parte, se describe un controlador tipo PI (Proporcional-Integral) propuesto para seguimiento de trayectorias donde se compara con cuatro controladores publica- dos en la literatura. El Cap´ıtulo 4 est´a orientado al trabajo realizado sobre control coordinado saturado en robots m´oviles tipo uniciclo, donde se presenta una nueva metodolog´ıa de consenso que est´a inspirada y comparada con una propuesta en la literatura. En el Cap´ıtulo 5 se presentan las conclusiones principales, as´ı como las contribuciones derivadas del trabajo de tesis y el posible trabajo futuro.
Cap´ıtulo 2
Control No Lineal de Robots M´ oviles Tipo Uniciclo
2.1. Controlador de seguimiento de trayectorias basado en linealizaci´ on por retroalimentaci´ on
2.1.1. Modelo cinem´ atico
El modelo cinem´atico general para robots m´oviles tipo uniciclo, donde el punto de inter´es coincide con el centro del eje virtual de las ruedas y su centro de masa, se presenta en [42] como
˙x
˙ y θ˙
=
cos(θ) 0 sen(θ) 0
0 1
V W
, (2.1)
donde x(t) y y(t) representan las coordenadas de la posici´on del punto de inter´es del robot m´ovil, θ(t) representa su orientaci´on, V (t) y W (t) son las entradas de control de velocidad lineal y angular, respectivamente.
La informaci´on sobre la geometr´ıa necesaria para establecer el modelo cinem´atico de un robot m´ovil tipo uniciclo, se muestra en la figura 2.1.
Figura 2.1. Representaci´on cinem´atica del robot m´ovil.
2.1.2. Formulaci´ on del problema de control
Para garantizar el seguimiento de la trayectoria deseada, es necesario que la trayectoria de referencia sea definida con base en el siguiente modelo de referencia virtual de un robot m´ovil tipo uniciclo, es decir, que siga una trayectoria cuyos movimientos puedan ser replicados por esta clase de robots
˙ xr
˙ yr θ˙r
=
cos(θr) 0 sen(θr) 0
0 1
Vr Wr
, (2.2)
donde xr(t), yr(t) y θr(t) representan la posici´on y orientaci´on en el plano cartesiano de la referencia variante en el tiempo y Vr y Wr son las velocidades de referencia lineal y angular, las cuales se asumen acotadas junto con sus derivadas.
Por tanto, el problema de control de seguimiento de trayectorias consiste en dise˜nar un contro- lador de velocidad [V W ]T ∈ IR2 tal que la posici´on y orientaci´on en el plano cartesiano del robot m´ovil tienda asint´oticamente a las trayectorias de referencia variantes en el tiempo, es decir, que se cumpla
t→∞l´ım
xr(t) − x(t) yr(t) − y(t) θr(t) − θ(t)
=
0 0 0
. (2.3)
2.1.3. Din´ amica del error en lazo abierto
El error de seguimiento es definido como
˜ x
˜ y θ˜
=
xr(t) − x(t) yr(t) − y(t) θr(t) − θ(t)
. (2.4)
Para obtener la representaci´on del error en lazo abierto se aplica una transformaci´on global invertible reportada en [42], con la finalidad de obtener las coordenadas del error con respecto al marco de referencia del robot m´ovil. Bajo esta representaci´on, el error de postura (posici´on y orientaci´on) puede ser establecido como:
e1
e2 e3
=
cos(θ) sen(θ) 0
− sen(θ) cos(θ) 0
0 0 1
˜ x
˜ y θ˜
, (2.5)
Tomando en cuenta la derivada temporal de (2.5), la sustituci´on del modelo cinem´atico (2.1), el modelo cinem´atico de referencia virtual (2.2), y algunas identidades trigonom´etricas se obtiene la din´amica de los errores de seguimiento de (2.5) como
˙e1
˙e2
˙e3
=
˙˜x cos(θ) − ˜x sen(θ) ˙θ + ˙˜y sen(θ) + ˜y cos(θ) ˙θ
˙˜y cos(θ) − ˜y sen(θ) ˙θ − ˙˜x sen(θ) − ˜x cos(θ) ˙θ θ˙˜
=
Vr(cos(θ) cos(θr) + sen(θ) sen(θr)) − (cos2(θ) + sen2(θ))V + W (˜y cos(θ) − ˜x sen(θ)) (cos(θr) sen(θ) − sen(θr) cos(θ))Vr− W (˜x cos(θ) + ˜y sen(θ))
Wr− W
=
Vrcos(e3) − V + W e2 Vrsen(e3) − W e1
Wr− W
. (2.6)
donde se puede establecer que si
t→∞l´ım
e1(t) e2(t) e3(t)
=
0 0 0
, (2.7)
entonces
t→∞l´ım
˜ x(t)
˜ y(t) θ(t)˜
=
0 0 0
, (2.8)
dado que la matriz del lado derecho de (2.5) es invertible para todo θ ∈ IR.
2.1.4. Dise˜ no del controlador basado en linealizaci´ on por retroalimen- taci´ on
Reescribiendo el error en lazo abierto mostrado en la ecuaci´on (2.6), se obtiene
˙e =
Vrcos (e3) Vrsen (e3) − W e1
Wr
| {z }
f
+
−1 e2
0 0
0 −1
| {z }
G
V W
, (2.9)
el cual tiene la estructura
˙e = f (t, e) + G(e)v, (2.10)
donde f (t, e) ∈ IR3, G(e) ∈ IR3×2 es la matriz de entradas, y v = [V W ] ∈ IR2 es la entrada de control.
Definiendo los vectores variantes en el tiempo
kα(t) =
α1(t) α2(t) α3(t)
, kβ(t) =
β1(t) β2(t) β3(t)
, (2.11)
se propone la funci´on de salida
y =y1 y2
=kα(t)Te kβ(t)Te
, (2.12)
cuya derivada con respecto al tiempo es
y =˙ kTαf kTβf
+kTαGv kTβGv
+" ˙kTαe k˙Tβe
#
, (2.13)
donde en la ecuaci´on (2.13) se ha omitido la dependencia del tiempo de los vectores kα(t), kβ(t), k˙α(t), ˙kβ(t). La ecuaci´on (2.13) se puede reescribir en forma alterna como
y =˙ kTαf kTβf
+ E (t, e) V W
+" ˙kTαe k˙Tβe
#
, (2.14)
donde
E (t, e) =−α1(t) α1(t)e2− α3(t)
−β1(t) β1(t)e2− β3(t)
. (2.15)
La entrada de control que linealiza el sistema (2.14) es dada por
V W
= E (t, e)−1
"
−kTαf kTβf
−" ˙kTαe k˙Tβe
#
− Kpy
#
. (2.16)
Sustituyendo la entrada de control (2.16) en (2.14) se obtiene la din´amica externa
˙
y = −Kpy, (2.17)
la cual es lineal y estable exponencialmente bajo la condici´on de que la matriz Kp ∈ IR2×2 sea sim´etrica y positiva definida.
Por otra lado, n´otese que la inversa de E(t, e) est´a dada por E (t, e)−1 = 1
det(E)
β1(t)e2− β3(t) α3(t)−α1(t)e2 β1(t) −α1(t)
, (2.18)
donde el determinante de la matriz E (t, e)−1 es abreviado por det(E) y es expresado como det(E) = α1(t)β3(t) − β1(t)α3(t). (2.19) Para evitar una singularidad en (2.18) y por tanto tambi´en en la acci´on de control (2.16) es necesario que det(E) 6= 0. Con el fin de garantizar un valor distinto de cero de E(t, e) y facilitar el an´alisis, a continuaci´on se presentan algunos puntos a tomar en cuenta para la selecci´on de ganancias kα(t) y kβ(t):
Seleccionar las ganancias αi, βi (i = 1, 2) como soluciones de la siguiente ecuaci´on:
− β1α2 + α1β2 = 0, (2.20)
ya que es necesario para cancelar un par de t´erminos que contienen a f2 (ver ecuaci´on (2.9) para la definici´on del vector f ). Note que la se˜nal f2 contiene la velocidad angular W , lo que una selecci´on de ganancias βi, αi (i = 1, 2) que no cumple (2.20) produce que (2.16) sea una funci´on impl´ıcita de W .
Definir
α1, β1, β3 > 0, (2.21)
como ganancias constantes donde α1 y β1 son las soluciones de (2.20).
Seleccionar en (2.20) la ganancia α2 como la soluci´on de la siguiente ecuaci´on:
α2(t) = −k0Wr(t), (2.22)
con k0 > 0 siendo constante, lo cual asegura que la soluci´on de la din´amica interna converge asint´oticamente a cero.
Definir
α3 = 0, (2.23)
lo cual asegura de acuerdo a (2.21) que el determinante de la matriz E resulte:
det(E) = α1β3 > 0. (2.24)
Finalmente, y de acuerdo a la ecuaci´on (2.20), seleccionar la ganancia β2(t) como:
β2(t) = α2(t)β1 α1
= −k0Wr(t)β1 α1
. (2.25)
Bajo las condiciones previas (2.21)-(2.25) se obtienen los siguientes vectores de ganancias asociados a la ecuaci´on de salida y en (2.12):
kα(t) =
α1 α2(t)
0
, kβ(t) =
β1 β2(t)
β3
=
β1 α2(t)β1/α1
β3
. (2.26)
Por tanto, la entrada de control en la (2.16) se escribe como:
V = 1
det(E)(β1e2− β3) (−α1f1− α2f2− ˙α2e2− kp1y1)
− 1
det(E)(α1e2) (−β1f1− β2f2− β3f3− ˙β2e2− kp2y2),
(2.27)
W = 1
det(E) h
β1(−α3f3− ˙α2e2− kp1y1) − α1(−β3f3− ˙β2e2− kp2y2)i
, (2.28)
donde f1, f2 y f3 son las componentes del vector f in (2.9).
N´otese de (2.9) que f2 = Vrsen(e3) − W e1, donde en la implementaci´on computacional, la ve- locidad angular W se debe calcular primero. Por tanto, la se˜nal f2 y la velocidad lineal V pueden ser calculadas posteriormente.
Siguiendo el procedimiento de linealizaci´on por retroalimentaci´on de salida [48, 45], se considera el siguiente cambio de variable:
z =
η y1 y2
, (2.29)
donde η satisface
∂η
∂eG(t, e) = 0, (2.30)
con G(t, e) definida en (2.9). Proponiendo η = e2, la ecuaci´on (2.30) se reescribe como
∂η
∂eG(t, e) =0 1 0
−1 e2
0 0
0 −1
=
0 0 0 0 0 0
.
Por tanto, el cambio de coordenadas (2.29) se reescribe en t´erminos del error e de la siguiente manera:
z =
η y1 y2
=
0 1 0
α1 α2 0 β1 β2 β3
| {z }
H
e1 e2 e3
, (2.31)
donde (2.23) fue considerada. La inversa de la matriz H en (2.31) existe si (2.24) se satisface.
N´otese que el sistema en lazo abierto (2.9) puede ser escrito con una diferente parametrizaci´on de f y G. Especificamente, el t´ermino de entrada W e1 puede ser incluido dentro del t´ermino G V
W
. Sin embargo, la condici´on (2.30) se convierte en un sistema de ecuaciones diferenciales parciales m´as dif´ıcil de resolver que el m´etodo propuesto. En otras palabras, la representaci´on en (2.9) facilita la obtenci´on de la din´amica interna.
Usando (2.31), su inversa y la definici´on (2.24), la din´amica interna puede ser calculada como:
d
dtη = ˙e2 = −W e1+ Vrsen(e3)
= −[det (E) Wr− β1kp1y1+ α1kp2y2]
det (E)2 [− (α2β3) η + β3y1] + Vrsen
1
α1β3[−β1y1+ α1y2]
,
(2.32)
y la din´amica externa (2.17) es reescrita nuevamente de modo de referencia:
d
dty = −Kpy. (2.33)
Las ecuaciones (2.32) y (2.33) son consideradas como el sistema en lazo cerrado.
Proposici´on 1. Si las condiciones (2.21), (2.23), y (2.25) se cumplen y seleccionando
α2(t) = −k0Wr(t), (2.34)
con Wr(t) como una se˜nal de excitaci´on persistente, entonces el equilibrio z = 0 del sistema en lazo cerrado (2.32)–(2.33) es localmente asint´oticamente estable.
Demostraci´on. Suponiendo que y = 0 en la din´amica interna (2.32), es posible reescribirla como d
dtη = Wr
det (E)[α2β3] η = Wrα2
α1η. (2.35)
El sistema (2.35) representa la din´amica interna no perturbada por la din´amica externa (2.33).
Si seleccionamos α2(t) de acuerdo a (2.34), entonces d
dtη = −k0
Wr2(t)
α1 η. (2.36)
Si Wr(t) es de excitaci´on persistente, η(t) → 0 cuando t → ∞ con una velocidad de conver- gencia exponencial (Ver Teorema 2.5.1 en [43], p´ag. 73). Por otro lado, la din´amica externa (2.33) es un estado exponencialmente estable.
El sistema en lazo cerrado (2.32)-(2.33) tiene una estructura de sistema en cascada, en la que el sistema imperturbable (2.32) es asint´oticamente estable (ver la ecuaci´on (2.36)) y el sistema independiente (2.33) es exponencialmente estable. Por lo tanto, hay condiciones suficientes para probar que el origen del espacio de estado de (2.32)-(2.33) es localmente asint´oticamente estable;
ver [44].
Proposici´on 2. Debido a que las soluciones z(t) = [η(t) y(t)]T ∈ IR3 convergen a cero de manera asint´otica, las soluciones de la din´amica del error e(t) = [e1(t) e2(t) e3(t)]T ∈ IR3 tambi´en convergen a cero de manera asint´otica.
Demostraci´on. Debido a que e(t) = H−1z(t), la cota superior del vector de estado e(t) puede ser expresada como ke(t)k ≤ kH−1k kz(t)k. Por lo tanto, e(t) converge a cero de manera asint´otica.
Las Proposiciones 1 y 2 y el hecho de que (2.5) es invertible globalmente implica que el objetivo de control en la ecuaci´on (2.8) es asegurado con el controlador propuesto (2.16).
2.1.5. Validaci´ on experimental
Con el fin de verificar la efectividad y la eficiencia del controlador propuesto dos conjuntos de experimentos fueron llevados a cabo. La plataforma integra al robot m´ovil Pionner P3-DX, el cual es fabricado por MobileRobots Inc. El robot m´ovil es controlado mediante entradas de control de velocidad lineal y angular. Adem´as, cuenta con una PC abordo, operando bajo el sistema operativo Ubuntu GNU/Linux 12.04 LTS, y mediante ROS Indigo Igloo (Robot Operating System) recibe las entradas de control. La adquisici´on de las se˜nales de retroalimentaci´on es recibida con una frecuencia de 100 [Hz] usando el sistema de visi´on OptiTrack. La acci´on de control es calculada a trav´es de Matlab-Simulink (R2015a) el cual incluye un toolbox para habilitar la interfaz con ROS as´ı como permitir la conexi´on con la red de ROS y poder enviar la acci´on de control requerida.
En la figura 2.2 se muestra la configuraci´on de la plataforma experimental utilizada.
Figura 2.2. Configuraci´on de la plataforma experimental.
2.1.5.1. Controladores para comparaci´on
En esta subsecci´on, se describen tres controladores seleccionados para la comparaci´on de rendi- miento. Para referirse a los controladores, se ha considerado un acr´onimo o abreviaci´on compuesta con la primera letra del apellido de cada autor. Dichos controladores seleccionados poseen dife- rentes estructuras de control, lo cual es ´util para comparar su desempe˜no con respecto al esquema
propuesto.
Controlador DDZB [42]
El controlador reportado por Dixon et al. [42], fue desarrollado usando t´ecnicas similares a la de Lyapunov, y es definido como
V W
=
k1e1+ Vrcos(e3) Vrsen(e3)e
3 e2+ k2e3+ Wr
, (2.37)
donde k1, k2 ∈ IR son constantes positivas.
Controlador CKSS [46]
El controlador reportado por Canudas de Wit et al. [46], fue desarrollado usando un modelo cinem´atico linealizado, y est´a dado por
V W
=
Vrcos(e3) + k1e1 Wr+ k2sign(Vr)e2+ k3e3
, (2.38)
con k1 = 2ζa, k2 = a2|V−Wr2
r| , y k3 = 2ζa, donde ζ y a ∈ IR son constantes positivas y con Vr 6= 0 ∀ t.
Controlador PLLN [47]
El controlador reportado por Panteley et al. [47] tiene la siguiente estructura en cascada:
V W
= Vr+ c2e1
Wr+ c1e3
, (2.39)
donde c1 y c2 ∈ IR son constantes positivas.
2.1.5.2. Comparaci´on experimental usando una trayectoria circular
La trayectoria de referencia circular utilizada para el experimento se define por la siguiente posici´on y orientaci´on deseadas:
xr(t) = 0.5 sen(0.4t) [m], (2.40)
yr(t) = 0.5 − 0.5 cos(0.4t) [m], (2.41)
θr(t) = 0.4t [rad], (2.42)
Estas ecuaciones cumplen con el modelo de referencia virtual dado en (2.2), con las velocidades lineal y angular correspondientes
Vr = 0.2 [m/s], (2.43)
Wr = 0.4 [rad/s]. (2.44)
Las condiciones iniciales del robot m´ovil Pioneer P3-DX para todos los experimentos con la trayectoria circular son las siguientes:
x(0) = 0.00 [m], (2.45)
y(0) = 0.50 [m], (2.46)
θ(0) = −0.50 [rad]. (2.47)
Las ganancias seleccionadas para el controlador propuesto cumplen las condiciones dadas en (2.21), (2.23), (2.25) y (2.34).
Las ganancias para cada controlador se seleccionaron mediante un proceso de prueba y error, de manera que no hubiera variaci´on fuera de un rango de ±5 % del valor RMS (Root Mean Square, por sus siglas en ingl´es) de V y W de un controlador con respecto a los otros en el intervalo de tiempo 20 [s] ≤ t ≤ 40 [s] donde la respuesta transitoria ya se ha desvanecido. El valor RMS est´a dado por
RM S(X(n)) = v u u t
1 Nf − Ni
Nf
X
i=Ni
|x(n)|2, (2.48)
donde x(n) es la se˜nal por procesar para la obtenci´on del valor RMS, Nies el n´umero de la muestra inicial y Nf es el numero de la muestra final, Nf > Ni. Las ganancias obtenidas se muestran en la tabla 2.1.
Tabla 2.1. Trayectoria circular: ganancias seleccionadas para cada controlador DDZB [42] CKSS [46] PLLN [47] Controlador propuesto
k1 = 0.50 k2 = 0.16
α = 1.000 ζ = 0.075
c1 = 0.4 c2 = 1.0
α1 = 0.7 α2 = −0.8 α3 = 0.0 kp1= 0.4 kp2= 0.394
β1 = 0.05 β2 = −0.57 β3 = 0.02 k0 = 2.0
Los resultados de los experimentos en tiempo real se muestran en las figuras 2.3–2.5. Las l´ıneas verde, azul y amarilla identifican a los controladores DDZB, CKSS y PLLN, respectivamente, y las l´ıneas rojas corresponden a los resultados del esquema propuesto en (2.16). Las rutas descri- tas con los cuatro controladores se muestran en la figura 2.3. El lado izquierdo de la figura 2.4 presenta la evoluci´on temporal de la postura del robot x(t), y(t) y θ(t) en comparaci´on con la configuraci´on deseada xr(t), yr(t) y θr(t). La evoluci´on temporal de los errores de posici´on ˜x(t),
˜
y(t) y orientaci´on ˜θ(t) tambi´en se muestran en el lado derecho de la figura 2.4.
La evoluci´on temporal de las entradas de control V (t) y W (t) se presenta en la figura 2.5. La diferencia entre las entradas de control de referencia y las entradas de control producidas por cada uno de los controladores son definidas como
V˜ = Vr− V, (2.49)
W˜ = Wr− W, (2.50)
dichas se˜nales de error tambi´en se muestran en la figura 2.5.
Se observa un desempe˜no similar para todos los controladores, diferenci´andose en la respuesta transitoria.
Para comparar el desempe˜no de los controladores, los valores RMS de ˜x(t), ˜y(t), ˜θ(t), ˜V (t), W (t), V (t) y W (t) se calcularon en el intervalo de tiempo de 20 [s] ≤ t ≤ 40 [s], periodo donde˜ se asume que la respuesta transitoria ya se desvaneci´o y se considera como criterio de equidad para todos los controladores la respuesta en estado estacionario. La tabla 2.2 presenta los valores RMS obtenidos con cada controlador. El controlador propuesto muestra el mejor desempe˜no con los valores RMS m´as peque˜nos para las se˜nales de error de postura. Adem´as, los valores RMS de
las entradas de control para todos los controladores no difieren en m´as de ±5 %. Por lo tanto, con un consumo de energ´ıa similar, el nuevo controlador funciona mejor.
Tabla 2.2. Resultados experimentales para la trayectoria circular: valores RMS para la comparaci´on de los controladores DDZB (2.37), CKSS (2.38), PLLN (2.39) y el controlador pro- puesto (2.16)
20 [s] ≤ t ≤ 40 [s]
RMS x [m]˜ y [m]˜ θ [rad]˜ V [m/s]˜ W [rad/s]˜ V [m/s] W [rad/s]
DDZB 0.0130 0.0102 0.0228 0.0055 0.0060 0.1948 0.3942 CKSS 0.0076 0.0082 0.0232 0.0016 0.0077 0.2008 0.3980 PLLN 0.0167 0.0163 0.0149 0.0092 0.0060 0.2088 0.3946 Controlador
propuesto 0.0030 0.0034 0.0147 0.0031 0.0057 0.2026 0.3949
Figura 2.3. Resultados experimentales: rutas trazadas por el robot m´ovil P3-DX. El punto de inicio es mostrado por (o, o, o y o), y la posici´on final por (, , y ).
Figura 2.4. Resultados experimentales: (izquierda) evoluci´on en el tiempo de x(t), y(t) y θ(t);
(derecha) evoluci´on en el tiempo de los errores de posici´on ˜x(t), ˜y(t) y ˜θ(t).
Figura 2.5. Resultados experimentales: (izquierda) evoluci´on en el tiempo de las entradas de control demandadas; (derecha) errores de la acci´on de control.
2.1.5.3. Comparaci´on experimental usando una trayectoria lemniscata
Se us´o una trayectoria de referencia lemniscada para llevar a cabo otro conjunto de experi- mentos en tiempo real. Esta trayectoria est´a definida por las se˜nales de posici´on de referencia y orientaci´on:
xr(t) = 1.1 + 0.7 sen 2πt 30
[m], (2.51)
yr(t) = 0.9 + 0.7 sen 4πt 30
[m], (2.52)
θr(t) = atan2 ( ˙yr, ˙xr) [rad]. (2.53) Estas ecuaciones cumplen con el modelo de referencia virtual dado en (2.2), con las velocidades lineal y angular calculadas mediante
Vr =p
˙x2r + ˙y2r, (2.54)
y
Wr = ˙xry¨r− ¨xry˙r
˙x2r+ ˙yr2 . (2.55)
La configuraci´on inicial del robot m´ovil Pioneer P3-DX para todos los experimentos con la trayectoria circular es:
x(0) = 1.2 [m], (2.56)
y(0) = 0.9 [m], (2.57)
θ(0) = 0.7854 [rad]. (2.58)
Al igual que en el conjunto de experimentos anterior, las ganancias para cada controlador se seleccionaron de tal manera que la diferencia de los valores RMS de las se˜nales de entrada V y W se mantuvieran dentro de un rango de variaci´on ±5 % de un controlador con respecto a los dem´as. Los valores de ganancia obtenidos se muestran en la tabla 2.3. Adem´as, las ganancias del controlador propuesto satisfacen las condiciones (2.21), (2.23), (2.25) y (2.34).
Tabla 2.3. Trayectoria lemniscata: ganancias seleccionadas para cada controlador DDZB [42] CKSS [46] PLLN [47] Controlador propuesto
k1 = 0.45 k2 = 0.90
α = 1.107 ζ = 0.300
c1 = 0.5 c2 = 1.0
α1 = 0.9
α2 = −1.3 × Wr(t) α3 = 0.0
kp1 = 1.6 kp2 = 1.3
β1 = 1.0
β2 = −1.44 × Wr(t) β3 = 10.0
k0 = 1.3
Los resultados de los experimentos en tiempo real se muestran en las figuras 2.6–2.8. Las rutas descritas con cada controlador se muestran en la figura 2.6. La evoluci´on temporal de los estados del robot x(t), y(t) y θ(t) y sus valores deseados xr(t), yr(t) y θr(t) se presentan en la figura 2.7.
Las se˜nales de error ˜x(t), ˜y(t) y ˜θ(t) tambi´en se muestran en la figura 2.7. La figura 2.8 muestra la evoluci´on temporal de las entradas de control V (t) y W (t) y la diferencia entre la entrada de control deseada y la entrada de control real dada en (2.49) - (2.50).
Para evaluar el rendimiento de los controladores probados, los valores RMS de los errores y las se˜nales de entrada de control se calcularon en el intervalo de tiempo 40 [s] ≤ t ≤ 80 [s], donde los transitorios han desaparecido. La tabla 2.4 presenta los resultados para los cuatro controladores.
El controlador propuesto muestra el mejor rendimiento con los valores RMS m´as bajos para las se˜nales de error de postura. De manera similar, los valores RMS de las entradas de control para todos los controladores no difieren en m´as de ±5 %.
Tabla 2.4. Resultados experimentales para la trayectoria lemniscata: valores RMS para la comparaci´on de los controladores DDZB (2.37), CKSS (2.38), PLLN (2.39) y el controlador propuesto (2.16)
40[s] ≤ t ≤ 80[s]
RMS x[m]˜ y[m]˜ θ[rad]˜ V [m/s]˜ W [rad/s]˜ V [m/s] W [rad/s]
DDZB 0.0237 0.0351 0.0605 0.0130 0.0553 0.2372 0.5601 CKSS 0.0205 0.0236 0.0993 0.0127 0.1120 0.2350 0.5625 PLLN 0.0192 0.0328 0.0653 0.0211 0.0327 0.2377 0.5509 Controlador
propuesto 0.0132 0.0106 0.0425 0.0263 0.0552 0.2319 0.5570
Figura 2.6. Resultados experimentales: rutas trazadas por el robot m´ovil P3-DX. El punto de inicio es mostrado por (o, o, o y o), y la posici´on final por (, , y ).
Figura 2.7. Resultados experimentales: (izquierda) evoluci´on en el tiempo de x(t), y(t) y θ(t);
(derecha) evoluci´on en el tiempo de los errores de posici´on ˜x(t), ˜y(t) y ˜θ(t).
Figura 2.8. Resultados experimentales: (izquierda) evoluci´on en el tiempo de las entradas de control demandadas; (derecha) errores de la acci´on de control.
2.1.6. Discusiones
En ambos conjuntos de experimentos, el controlador de linealizaci´on por retroalimentaci´on introducido muestra la mejor precisi´on de seguimiento con un consumo de energ´ıa id´entico al de los otros controladores. Para complementar el estudio experimental, la tabla 3.5 muestra el porcentaje de mejora del controlador propuesto con respecto a los controladores DDZB, CKSS y PLLN, que se calcularon a partir de los valores RMS del error de seguimiento de la trayectoria y la acci´on de control para las trayectorias circulares y lemniscatas. Los errores de seguimiento siempre se mejoran con el controlador propuesto. Adem´as, la mejora relativa de los valores RMS de las acciones de control V y W est´a siempre en el rango de ±5 %, seg´un lo establecido en el criterio de ajuste de ganancias.
El controlador propuesto tiene t´erminos cuadrados en los errores de seguimiento e1, e2 y e3, co- mo se demuestra al expandir las ecuaciones (2.27) y (2.28), lo que lo convierte en un controlador local de alta ganancia. Esta caracter´ıstica mejora la atenuaci´on de los efectos de las perturba- ciones que var´ıan lentamente, como retrasos de comunicaci´on y fricci´on, presentes en el sistema experimental.
Tabla 2.5. Porcentaje de mejora del controlador propuesto con respecto a los controladores DDZB, CKSS y PLLN, calculados a partir de los valores RMS para las implementaciones de las trayectorias circular y lemniscata
DDZB CKSS PLLN
Se˜nal Trayectoria circular
Trayectoria lemniscata
Trayectoria circular
Trayectoria lemniscata
Trayectoria circular
Trayectoria lemniscata
˜
x 76.92 % 44.3 % 60.53 % 35.61 % 82.04 % 31.25 %
˜
y 66.67 % 69.8 % 58.54 % 55.08 % 79.14 % 67.68 %
θ˜ 35.53 % 29.75 % 36.64 % 57.2 % 1.34 % 34.92 %
V -4.00 % 2.23 % -0.9 % 1.32 % 2.97 % 2.44 %
W -0.18 % 0.55 % 0.78 % 0.98 % -0.08 % -1.11 %
Cap´ıtulo 3
Control No Lineal de Robots M´ oviles Tipo Uniciclo con Saturaci´ on de La Entrada de Control
3.1. Familia de controladores de entradas saturadas
En esta secci´on se presenta una familia de controladores saturados para robots m´oviles tipo uniciclo, la cual es propuesta para seguimiento de trayectorias basado en el modelo cinem´atico donde el punto de inter´es coincide con el centro del eje virtual de las ruedas (2.1). Ademas, se pre- sentan las condiciones necesarias para probar estabilidad global de forma asint´otica del equilibrio cero del sistema en lazo cerrado mediante la teor´ıa de Lyapunov.
3.1.1. Preliminares
La familia de controladores con entradas saturadas propuesta es dise˜nada para robots m´oviles tipo uniciclo descritos con el modelo cinem´atico (2.1). Por otra parte, se considera que la trayectoria de referencia satisface el modelo de referencia virtual visto en la ecuaci´on (2.2) con velocidades de referencia acotadas como
|Vr(t)| ≤ |Vr|max,
|Wr(t)| ≤ |Wr|max, para todo t ≥ 0. Por otra parte, el l´ımite
t→∞l´ım Vr(t) 6= 0 (3.1)
debe satisfacerse, es decir, que no se requiera que el robot m´ovil se detenga en su desplazamiento lineal.
3.1.2. Problema de control
El problema de control es tomado de [2] y consiste en encontrar una ley de control de reali- mentaci´on de estados variante en el tiempo de la forma
V (t, θ, x, y), W (t, θ, x, y), (3.2)