INSTITUTO POLITÉCNICO NACIONAL

(1)

CENTRO DE INVESTIGACI ´ ON Y DESARROLLO DE TECNOLOG´ IA DIGITAL

DOCTORADO EN CIENCIAS EN SISTEMAS DIGITALES

“CONTROL NO LINEAL DE ROBOTS M ´OVILES TIPO UNICICLO

USANDO LA TEOR´IA DE LYAPUNOV”

TESIS

QUE PARA OBTENER EL GRADO DE

DOCTORADO EN CIENCIAS EN SISTEMAS DIGITALES

PRESENTA

M. C. LUIS GONZALO MONTOYA VILLEGAS

BAJO LA DIRECCI ´ON DE

DR. RICARDO RAM ´ON P´EREZ ALCOCER DR. EDUARDO JAVIER MORENO VALENZUELA

MAYO 2021 TIJUANA, B.C., M´EXICO.

(2)

(3)

(4)

CARTA CESIÓN DE DERECHOS

En la Ciudad de Tijuana, Baja California. el día 25 del mes de mayo del año 2021, el que suscribe Luis Gonzalo Montoya Villegas, alumno del Programa de DOCTORADO EN CIENCIAS EN SISTEMAS DIGITALES, con número de registro B170664, adscrito(a) al CENTRO DE INVESTIGACIÓN Y DESARROLLO DE TECNOLOGÍA DIGITAL, manifiesta que es el autor intelectual del presente trabajo de Tesis bajo la dirección de Dr.

Eduardo Javier Moreno Valenzuela y de Dr. Ricardo Ramón Pérez Alcocer y cede los derechos del trabajo titulado Control No Lineal de Robots Móviles Tipo Uniciclo Usando La Teoría de Lyapunov, al Instituto Politécnico Nacional para su difusión, con fines académicos y de investigación.

Los usuarios de la información no deben reproducir el contenido textual, gráficas o datos del trabajo sin el permiso expreso del (de la) autor(a) y/o director(es) del trabajo. Este puede ser obtenido escribiendo a las siguientes direcciones Av. Instituto Politécnico Nacional No.

1310 Col Nueva Tijuana, Tijuana, Baja California, México, correo electrónico de contacto:

[email protected]. Si el permiso se otorga, el usuario deberá dar el agradecimiento correspondiente y citar la fuente del mismo.

Luis Gonzalo Montoya Villegas

SECRETARÍA DE INVESTIGACIÓN Y POSGRADO

(5)

A mi familia.

(6)

Debo agradecer a mis padres y hermanas por todo su apoyo económico y moral a lo largo de mi formación académica que me condujeron a la finalización de mi investigación de tesis doctoral.

Por otra parte, quiero agradecer a mis asesores de tesis el Dr. Eduardo Javier Moreno Valenzue- la y al Dr. Ricardo Ramón Pérez Alcocer por toda la ayuda, consejos, conocimientos y motivación que me brindaron en mis estudios de posgrado.

Además, quiero dar un especial agradecimiento al Dr. V´ıctor Hugo D´ıaz Ram´ırez, al Dr. Juan José Tapia Armenta y al Dr. Jesús Alberto Sandoval Galarza por formar parte de mi comité tuto- rial, por sus cuestionamientos, reflexiones, orientación y critica constructiva sobre mi investigación.

De la misma manera, agradezco al CITEDI-IPN por brindarme la oportunidad de realizar en el mi trabajo de tesis y por darme todas las facilidades administrativas y de infraestructura para poder realizar mi investigaci´on de inicio a fin.

Por otro lado, agradezco a todas las amistades que hice en el CITEDI por su apoyo indirecto con su motivaci´on y por todos los buenos momentos.

Por último, pero no menos importante, agradezco el apoyo económico recibido de parte de CONACYT y del Instituto Politécnico Nacional para realizar este trabajo de tesis doctoral.

(7)

Tipo Uniciclo Usando La Teor´ıa de Lyapunov

Resumen

En este trabajo de tesis se presentan los resultados principales obtenidos de el control no lineal de robots móviles de tipo uniciclo, donde la estabilidad teórica del equilibrio cero del sistema es probada mediante la teor´ıa de Lyapunov para cada controlador diseñado. El primer controlador desarrollado en este trabajo presenta una ley de control basada en linealización por retroalimen- tación para seguimiento de trayectorias la cual no toma en cuenta el efecto de saturación presente en los actuadores del robot. La validación experimental es llevada a cabo mediante una trayectoria circular y lemniscata, además, es comparado el desempeño con tres controladores publicados en la literatura, obteniéndose mejores resultados con el controlador propuesto.

Por otra parte, se presenta una familia de controladores para seguimiento de trayectorias que toma en cuenta el efecto de saturación de la acción de control. Cinco diseños de controladores son presentados y evaluados experimentalmente, mostrando la ventaja de esta familia con respecto a una versión no saturada. Además, un controlador saturado para seguimiento de trayectorias con estructura tipo proporcional-integral (PI) es diseñado y evaluado experimentalmente en compa- ración con cuatro esquemas de control saturado reportados en la literatura, mostrando una mejor robustez y desempeño ante una trayectoria circular.

Por último, en relación a tareas coordinadas, una metodolog´ıa de consenso es diseñada con base en una propuesta introducida en la literatura donde se relajan las condiciones del controlador de regulación de posición necesario para los agentes. Más aún, se presenta un nuevo controlador de regulación saturado que asegura estabilidad asintótica. Esta metodolog´ıa de consenso es evaluada experimentalmente y comparada con la metodolog´ıa original, presentando mejoras en tiempo de alcance del consenso, la suavidad de movimiento y la precisión que proporciona el controlador en relación a la reducción de los errores de posición y de consenso.

Palabras clave: Robot móvil, saturación de la entrada, control no lineal, seguimiento de trayectoria, regulación de posición, consenso.

(8)

Mobile Robots Using Lyapunov’s Theory

Abstract

In this thesis, the main results obtained from the non-linear control of unicycle-type mobile robots are presented, where the theoretical stability of the zero equilibrium of the system is tested by using Lyapunov’s theory for each designed controller. The first controller developed in this work presents a control law based on feedback linearization for trajectory tracking which does not take into account the saturation effect present in the robot’s actuators. The experimental validation is carried out following a circular and lemniscate trajectory, besides, the performance is compared with three controllers from the literature, obtaining the best results with the proposed controller.

On the other hand, a family of controllers for trajectory tracking is presented that takes into account the saturation effect of the control action. Five controller designs are presented and experimentally evaluated, showing the advantage of this family against an unsaturated version. Also, a saturated controller for tracking trajectories with a proportional-integral (PI)-type structure is experimentally designed and evaluated in comparison with four saturated control schemes from the literature, showing better robustness and performance following a circular trajectory.

Finally, concerning coordinated tasks, a consensus methodology is designed based on one from the literature where the conditions of the position regulation controller necessary for the agents are relaxed. Therefore, besides, a new saturated regulation controller is presented that ensures asym- ptotic stability. This consensus methodology is experimentally evaluated and compared with the original methodology, showing improvements in the time to reach the consensus, the smoothness of movement, and the precision provided by the controller concerning the reduction of position and consensus errors.

Keywords: Mobile robot, input saturation, nonlinear control, trajectory tracking, position regulation, consensus.

(9)

´Indice i

Lista de figuras iii

Lista de tablas v

1. Introducci´on 1

1.1. Justificaci´on . . . 4

1.2. Objetivos . . . 4

1.2.1. Objetivo general . . . 4

1.2.2. Objetivos espec´ıficos . . . 4

1.3. Organizaci´on del documento . . . 5

2. Control No Lineal de Robots Móviles Tipo Uniciclo 6 2.1. Controlador de seguimiento de trayectorias basado en linealización por retroalimen- tación . . . 6

2.1.1. Modelo cinem´atico . . . 6

2.1.2. Formulaci´on del problema de control . . . 7

2.1.3. Din´amica del error en lazo abierto . . . 7

2.1.4. Diseño del controlador basado en linealización por retroalimentación . . . . 8

2.1.5. Validaci´on experimental . . . 12

2.1.5.1. Controladores para comparaci´on . . . 12

2.1.5.2. Comparaci´on experimental usando una trayectoria circular . . . . 13

2.1.5.3. Comparaci´on experimental usando una trayectoria lemniscata . . 17

2.1.6. Discusiones . . . 20

3. Control No Lineal de Robots M´oviles Tipo Uniciclo con Saturaci´on de La En- trada de Control 21 3.1. Familia de controladores de entradas saturadas . . . 21

3.1.1. Preliminares . . . 21

3.1.2. Problema de control . . . 21

3.1.3. Dise˜no de la familia de controladores de entradas saturadas . . . 22

3.1.4. Dise˜nos de funciones . . . 25

3.1.4.1. Dise˜no 1 . . . 25

3.1.4.2. Dise˜no 2 . . . 27

3.1.4.3. Dise˜no 3 . . . 28

3.1.4.4. Dise˜no 4 . . . 30

3.1.4.5. Dise˜no 5 . . . 33

3.1.5. Validaci´on experimental . . . 35

(10)

3.1.5.1. Resultados obtenidos con una trayectoria circular . . . 35

3.1.5.2. Resultados obtenidos con una trayectoria lemniscata . . . 38

3.1.6. Discusiones . . . 40

3.2. Controlador de seguimiento tipo PI con entradas saturadas . . . 40

3.2.1. Modelo cinem´atico y objetivo de control . . . 40

3.2.2. Controlador saturado tipo proporcional-integral . . . 42

3.2.3. Estabilidad del sistema en lazo cerrado . . . 42

3.2.4. Discusi´on sobre la robustez . . . 45

3.2.4.1. Simulaciones num´ericas del robot m´ovil con perturbaciones . . . . 47

3.2.5. Evaluaci´on experimental . . . 48

3.2.5.1. Controladores para comparaci´on . . . 49

3.2.5.1.1. Controladores saturados para el modelo cinemático (3.42) 49 3.2.5.1.2. Controladores saturados para el modelo cinemático con el punto de interés desplazado . . . 49

3.2.5.2. Plataforma experimental . . . 51

3.2.5.3. Resultados experimentales . . . 51

4. Control No Lineal de Robots M´oviles Tipo Uniciclo con Saturaci´on de La En- trada de Control en Tareas Coordinadas 56 4.1. Tarea de consenso . . . 56

4.1.1. Teor´ıa de grafos . . . 56

4.1.2. Dise˜no del protocolo de consenso . . . 57

4.1.3. Controlador saturado propuesto para regulaci´on . . . 59

4.1.4. Evaluaci´on experimental . . . 62

4.1.4.1. Controlador basado en LQR de rotar y avanzar . . . 63

4.1.4.2. Plataforma experimental real-virtual . . . 64

4.1.4.3. Configuraci´on del consenso . . . 64

4.1.4.4. Resultados experimentales . . . 65

5. Conclusiones 73 5.1. Conclusi´on . . . 73

5.2. Contribuciones . . . 73

5.3. Trabajo futuro . . . 74

Bibliograf´ıa 75

(11)

2.1. Representación cinemática del robot móvil. . . 6 2.2. Configuración de la plataforma experimental. . . 12 2.3. Resultados experimentales: rutas trazadas por el robot móvil P3-DX. El punto

de inicio es mostrado por (o, o,o y o), y la posici´on final por (, , y ). . . 15 2.4. Resultados experimentales: (izquierda) evoluci´on en el tiempo de x(t), y(t) y

θ(t); (derecha) evolución en el tiempo de los errores de posición ˜x(t), ˜y(t) y ˜θ(t). . 16 2.5. Resultados experimentales: (izquierda) evolución en el tiempo de las entradas

de control demandadas; (derecha) errores de la acci´on de control. . . 16 2.6. Resultados experimentales: rutas trazadas por el robot m´ovil P3-DX. El punto

de inicio es mostrado por (o, o,o y o), y la posici´on final por (, , y ). . . 18 2.7. Resultados experimentales: (izquierda) evoluci´on en el tiempo de x(t), y(t) y

θ(t); (derecha) evolución en el tiempo de los errores de posición ˜x(t), ˜y(t) y ˜θ(t). . 19 2.8. Resultados experimentales: (izquierda) evolución en el tiempo de las entradas

de control demandadas; (derecha) errores de la acci´on de control. . . 19 3.1. Resultados experimentales: trayectoria circular trazada por el robot. El punto

de partida está representado por (o,o, o,o, oy o) y la posición final está indicada por (, , ,, y ). . . 36 3.2. Resultados experimentales: evolución temporal de la postura y sus errores ante

una trayectoria circular de referencia. . . 37 3.3. Resultados experimentales: entradas de control de velocidad saturadas para

una trayectoria circular de referencia. . . 37 3.4. Resultados experimentales: ruta lemniscata trazada por el robot. El punto de

partida está representado por (o, o, o,o,o yo) y la posición final está indicada por (,, , , y ). . . 39 3.5. Resultados experimentales: evolución temporal de la postura y sus errores ante

una trayectoria circular de referencia. . . 39 3.6. Resultados experimentales: entradas de control saturadas para seguimiento de

la trayectoria lemniscata. . . 40 3.7. Robot móvil tipo uniciclo con dos ubicaciones diferentes del punto de interés (x, y). 41 3.8. Resultados de la simulación: evolución en el tiempo de los errores e₁(t), e₂(t)

y e₃(t), para los sistemas en lazo cerrado linealizados y no lineales utilizando el controlador JLN y el controlador tipo PI propuesto sometido a perturbaciones. . . 48 3.9. Configuraci´on de la plataforma experimental para el control del robot m´ovil Qbot 2. 51 3.10. Resultados experimentales: rutas trazadas por los controladores 1, 2, 3, 4 y el

controlador PI propuesto. El punto de partida está representado por (o, o, o, o y o) y la posición final está indicada por (,, , y ). . . 53 3.11. Resultados experimentales: evolución en el tiempo de x(t), y(t), y θ(t). . . 54

(12)

3.12. Resultados experimentales: evolución en el tiempo de la velocidad lineal V (t) y la velocidad angular W (t). También se ilustran los l´ımites de saturación Vmax y W_max (l´ınea morada). . . 54 4.1. Plataforma experimental real-virtual. . . 64 4.2. Topolog´ıa de interacción dinámica para experimentos de consenso. . . 65 4.3. Formación final del sistema multiagente con zona segura libre de colisiones dentro

de un c´ırculo virtual de radio r. . . 65 4.4. Resultados experimentales: rutas trazadas por los robots m´oviles. El punto de

partida está representado por (o, o, o y o) y la posición final está indicada por (,

, y ). . . 67 4.5. Resultados experimentales: evoluci´on en el tiempo de la postura de los robots

moviles. . . 68 4.6. Resultados experimentales: evoluci´on en el tiempo del error de postura de los

robots moviles. . . 69 4.7. Resultados experimentales: velocidad lineal saturada comandada. . . 70 4.8. Resultados experimentales: velocidad angular saturada comandada. . . 71 4.9. Resultados experimentales: evoluci´on en el tiempo del error de consenso. . . . 72

(13)

2.1. Trayectoria circular: ganancias seleccionadas para cada controlador . . . 14

2.2. Resultados experimentales para la trayectoria circular: valores RMS para la comparaci´on de los controladores DDZB (2.37), CKSS (2.38), PLLN (2.39) y el controlador propuesto (2.16) . . . 15

2.3. Trayectoria lemniscata: ganancias seleccionadas para cada controlador . . . 17

2.4. Resultados experimentales para la trayectoria lemniscata: valores RMS para la comparaci´on de los controladores DDZB (2.37), CKSS (2.38), PLLN (2.39) y el controlador propuesto (2.16) . . . 18

2.5. Porcentaje de mejora del controlador propuesto con respecto a los controladores DDZB, CKSS y PLLN, calculados a partir de los valores RMS para las implementaciones de las trayectorias circular y lemniscata . . . 20

3.1. Par´ametros de los controladores. . . 35

3.2. Trayectoria circular: valores RMS para los errores de posici´on y orientaci´on y las entradas de control. . . 36

3.3. Trayectoria lemniscata: valores RMS para los errores de posici´on y orientaci´on y las entradas de control. . . 38

3.4. Resultados experimentales: valores RMS de los errores de seguimiento y de las entradas de control obtenidos en las pruebas en tiempo real para el intervalo de tiempo 60 [s] ≤ t ≤ 80 [s] (estado estacionario). . . 54

3.5. Resultados experimentales: porcentaje de mejora con base en los valores RMS obtenidos con el controlador PI propuesto contra los controladores 1 a 4. . . 55

4.1. Configuraci´on inicial para los dos experimentos de consenso. . . 65

4.2. Par´ametros del nuevo controlador. . . 66

4.3. Par´ametros del controlador basado en LQR rotar y avanzar. . . 66

4.4. Resultados experimentales: valores RMS de los errores de posici´on y de consenso en el intervalo de tiempo 40 [s] ≤ t ≤ 50 [s]. . . 72

(14)

Cap´ıtulo 1 Introducci´ on

El interés en el control de veh´ıculos móviles ha crecido en la comunidad de control en las últi- mas décadas. Debido a que los robots móviles cuentan con caracter´ısticas especiales a diferencia de otros tipos de veh´ıculos, como lo es el contar con dos ruedas de tracción independiente y una o dos ruedas de apoyo para lograr estabilidad. As´ı mismo, estos veh´ıculos son de fácil construcción y como la mayor´ıa de los veh´ıculos con ruedas son no holonómicos, es decir el robot no puede cambiar la dirección de movimiento de forma perpendicular al sentido de movimiento de las ruedas de forma instantánea.

El reto de control consiste en conducir el veh´ıculo en un plano 2D, controlando la posición en coordenadas x, y y su orientación, teniendo entonces tres grados de libertad y solo dos entradas de control, lo cual lo clasifica como un problema de control de robots subactuados con restricciones no holonómicas.

La mayor´ıa de trabajos en control de robots m´oviles tipo uniciclo toman en cuenta solo el modelo cinem´atico, el cual se describe por su postura y velocidades [1, 2, 3, 4, 5].

En la actualidad no es práctico el control de robots móviles tipo uniciclo sin considerar su saturación de velocidad o el comportamiento dinámico debido a la respuesta no instantánea de los actuadores, con el propósito de tener seguridad y evitar derrapes. Por tanto, algunos investigado- res han tomado en cuenta el hecho que los actuadores no pueden seguir comandos de velocidad que cambien rápidamente, por consiguiente, se ha prestado atención a la dinámica de los robots móviles con ruedas [6, 7].

Por otra parte, el problema de estabilización y seguimiento de trayectorias para sistemas móvi- les no holonómicos con entradas saturadas ha sido estudiado raras veces en la literatura. Existen algunos registros a partir de 2001 donde presentan esquemas de control para resolver el problema de estabilización y seguimiento. Por ejemplo, los autores en [1] ofrecen soluciones basadas en técni- cas de backstepping y la función de saturación de forma expl´ıcita, mientras en [2] propusieron un par de controladores tanto para estabilización y para seguimiento de trayectorias usando técnicas basadas en pasividad y normalización usando funciones de saturación suaves como la tangente hiperbólica (tanh).

El interés en esta área de investigación parece haber decrecido después de la aparición de los controladores mencionados en el párrafo anterior hasta cinco años después donde se propuso en [3] una técnica llamada control h´ıbrido. Esta técnica permite diseñar un controlador con dos par-

(15)

tes separadas: una primera parte del algoritmo responsable de posicionar al robot y la segunda parte capaz de estabilizarlo. Además, este controlador utiliza la función de saturación discontinua (función signo, abreviado como sign). Un año después de despertar el interés en el área apareció la primera aportación de soluciones basadas en el control difuso como se reporta en [4] donde esta técnica es utilizada en conjunto con la función de saturación discontinua (sign). En ese mismo año de 2007 y continuando con la tendencia de aquella época, el control discontinuo tendr´ıa su auge con la aparición del primer controlador por modos deslizantes [5], el cual usa el controlador introducido en [2] para tomar en cuenta la saturación de los actuadores.

En 2008 el control adaptable aparece en [7] donde se diseñó un controlador cinemático con la función de saturación suave (tanh) en combinación con un controlador adaptable para intentar reducir el error provocado por los parámetros dinámicos del robot. Más tarde, Wang [8] presentó un controlador para estabilización mediante una transformación de los estados del sistema y la utilización de la función de saturación discontinua (sign). Un año después, en 2009 y como con- tribución adicional al control de múltiples robots móviles se introdujo una nueva técnica llamada

“comportamiento basado en el espacio nulo” en los trabajos [9, 10, 11] donde utilizan una funci´on de saturaci´on discontinua propia llamada “Capacidad”.

En el año 2010 son revisitados los controladores introducidos en [2], los cuales son modifica- dos realizando una diferente transformación de coordenadas involucrada en muchos trabajos en robótica móvil, con el fin de hacer más rápida su respuesta. Dos años más tarde en 2012 los autores de [13] presentaron nuevamente la técnica de backstepping y control en tiempo finito haciendo uso de la función suave tangente hiperbólica (tanh) para la limitación de las velocidades y la función discontinua (sign) para limitar los pares. En ese mismo año de 2012 el control servovisual apareció por primera vez en este campo, siendo en [14, 15] donde se reportó la técnica de control en tiempo finito y control robusto el cual hace uso de funciones de saturación y discontinua (sat y sign, respectivamente).

Nuevamente, Huang et al. [16] revisitaron el control adaptable para resolver los problemas de estabilización y seguimiento, mediante el uso de un controlador virtual cinemático y un control adaptable, que permitió limitar los pares usando la función de saturación explicita sat y sometido a perturbaciones externas. En ese mismo año 2013 el control difuso volvió a ser abordado en [17] donde un controlador de seguimiento fue diseñado sin hacer uso de funciones de saturación,

´

unicamente haciendo uso de un controlador basado en la cinemática inversa y las funciones de pertenencia propias del control difuso. Al mismo tiempo, se presentó un controlador por conmuta- ción en [18] el cual fue sometido a perturbaciones e incertidumbres paramétricas usando la función de saturación suave tanh. Un año después en 2014, el trabajo presentado por Chen y Jia en [19], correspondió al primer controlador que utilizó un par de filtros de primer orden para saturar las velocidades e incorporó las funciones discontinuas sat y sign para limitar los pares de entrada. A su vez en [20] se presentó un control por realimentación dinámica, que consistió en un par de controladores: un control cinemático y un segundo control tomado del trabajo previo [13] desarrollado por el mismo autor. En [21] los autores extienden el método de conmutación propuesto en [18]

agregando mejoras. También, Chen et al. [22] hicieron uso de la retroalimentación servovisual para un control de estabilización, el cual utiliza la técnica del control por conmutación en un control discontinuo.

Más tarde, en 2015 se abordó nuevamente el control adaptable en [23] el cual no posee medi- ción de la velocidad y para ello el autor diseñó un esquema de control-observador en combinación

(16)

con una ley de control de retroalimentación de salida saturada. En [24] se presentó un esquema de control para estabilización usando retroalimentación de estados el cual utiliza funciones de saturación discontinuas. Shojaei [25] presentó un enfoque de control robusto, el cual usa un controlador saturado por la función tanh, un observador para la estimación de la velocidad, un control de superficie dinámica para los actuadores, además de que cuenta con redes neuronales y técni- cas adaptables robustas para reducir los errores provocados por incertidumbres no lineales y por parámetros desconocidos. Al final del año 2015 se presentó después de muchos años un controlador basado en la técnica pasividad [26], el cual combina un control adaptable y un control-observador para compensar los parámetros desconocidos y la no medición de la velocidad.

En el 2016 se volvió a prestar atención a los problemas de control coordinado y en [27] se propone un control de formación sujeto a restricciones de velocidad, el cual emplea observadores y controladores diseñados con la función de saturación sat. Serrano et al. [28] presentaron un controlador trapezoidal, el cual es una modificación del modelo cinemático, este controlador limita la acción de control mediante la regulación de parámetros del controlador.

Para el año 2017 algunos avances se han dado mediante técnicas basadas en algebra lineal como en [29] donde además los autores siguen utilizando la aproximación trapezoidal del modelo cinemático y la actualización de parámetros del control para limitar la acción de control. Otra técnica reciente fue presentada en [30] donde además de tomar en cuenta las limitaciones de las señales de control se estudia el caso de control coordinado mediante el problema de formación utilizando una ley de control dinámica que utiliza la función de saturación sat para limitar la acción de control. En [31, 32] se utilizó la técnica del control neuronal adaptable para el problema de formación en control coordinado. Liu y Gao [33] diseñaron un controlador predictivo basado en Lyapunov, el cual utiliza una función de saturación suave como lo es la tanh clásica.

Por último, desde entonces hasta la fecha han surgido una gran cantidad de trabajos tanto para control saturado de un robot como para múltiples agentes en tareas coordinadas. Por mencio- nar algunos ejemplos, en [34], se propuso un controlador distribuido acotado para el problema de consenso global de seguimiento de l´ıder. Un controlador robusto basado en redes neuronales para el seguimiento de la trayectoria y la estabilización con parámetros desconocidos, perturbaciones externas y saturación de entrada fue presentado en [35]. Liu et al. [36] diseñó un controlador de seguimiento de modo deslizante adaptable considerando la saturación de entrada, incertidumbres y las perturbaciones externas. Los autores de [37] presentaron un esquema de control de trayectorias no lineal en cascada adaptable con saturación de entrada. Yin et al. [38] abordan el problema del consenso para un sistema heterogéneo de segundo orden considerando la saturación de entrada. Los autores de [39] propusieron controladores distribuidos basados en observadores de modo deslizante para lograr un seguimiento de consenso global en tiempo finito con entradas de control acotadas. Los autores de [40] utilizaron controladores saturados distribuidos en el problema de consenso global. En [41], se propuso un controlador neuronal adaptable sujetos a saturación y perturbaciones del actuador.

Luego de revisar en la literatura el estado actual del control de veh´ıculos móviles, se concluye que en los últimos años se ha estado trabajando de forma rigurosa el fenómeno de la saturación y se está tratando de extrapolar hacia aquellos problemas relacionados al control coordinado.

En resumen, puede concluirse que las técnicas más usadas para diseñar controladores saturados utilizan funciones de saturación suaves y discontinuas, siendo la tanh la más utilizada en diferentes esquemas de control. Además, el problema de consenso está recibiendo mucha atención, debido

(17)

a su escalabilidad con otras tareas coordinadas y se comienzan a publicar cada vez m´as trabajos donde se toman en cuenta los l´ımites de velocidad presentes para los agentes.

1.1. Justificaci´ on

El control de robots móviles tipo uniciclo es un tema interesante desde el punto de vista prácti- co. La configuración uniciclo es la base de las distintas configuraciones existentes de robots móviles o veh´ıculos. Por tanto, el diseño de leyes de control para esta clase de robots móviles que permiten dirigir o llevar a cabo una tarea se facilita de gran medida y pueden ser extrapolados a alguna configuración espec´ıfica. Aunque en la literatura ya se encuentran numerosas aportaciones en este tema, poca importancia se le ha dado al fenómeno de saturación presente en los actuadores en la práctica. Este fenómeno restringe la velocidad que puede entregar el robot y provoca que no sea capaz de realizar la tarea programada, debido a que la velocidad comandada o requerida es imposible de ejecutar f´ısicamente. Por ello, surge la necesidad de diseñar acciones de control que estén limitadas y que además se asegure que la tarea a desempeñar pueda ser lograda.

Por otro lado, la interacción de múltiples veh´ıculos es una tendencia en la actualidad. Cada vez es más común ver robots colaborando con otros para lograr una tarea espec´ıfica en diferentes campos para incrementar su eficiencia. En particular, la tarea de consenso es la base de múltiples tareas coordinadas como el control de formación y el control l´ıder-seguidor. El consenso consiste en que los agentes involucrados alcancen un estado en común mediante la información disponible de los agentes vecinos. Por tanto, las contribuciones en esta área resultan valiosas si además se toma en cuenta el fenómeno presente previamente descrito de la saturación.

1.2. Objetivos

1.2.1. Objetivo general

Analizar, diseñar y validar por medio de simulaciones y experimentos esquemas de control no lineal para robots móviles tipo uniciclo. Se presta particular atención a los problemas de saturación de la entrada de control y al control coordinado de dos robots.

1.2.2. Objetivos espec´ıficos

Mantener actualizado el estado del arte sobre control no lineal saturado en robots m´oviles tipo uniciclo.

Habilitar la operaci´on del robot m´ovil Qbot 2 y Pionner P3-DX.

Estudiar, diseñar, realizar simulaciones y comparaciones experimentales de distintas técnicas de control no lineal que contemplen saturación en la entrada de control.

Estudiar, dise˜nar, realizar simulaciones y comparaciones experimentales de distintas t´ecnicas de control no lineal coordinado para robots tipo uniciclo.

(18)

1.3. Organizaci´ on del documento

El documento se encuentra organizado de la siguiente forma: en el Cap´ıtulo 2 se presenta el trabajo realizado sobre control no lineal para veh´ıculos con ruedas tipo uniciclo, donde se propone un controlador para seguimiento de trayectorias basado en la técnica de linealización por retroalimentación y se muestra la validación experimental mediante una comparación con tres controladores ya reportados en la literatura. El Cap´ıtulo 3 está dedicado al control no lineal saturado en robots móviles tipo uniciclo. Se incluye el desarrollo de una familia de controladores saturados de seguimiento de trayectorias, as´ı como una comparación experimental de cinco diferentes controladores diseñados. Por otra parte, se describe un controlador tipo PI (Proporcional-Integral) propuesto para seguimiento de trayectorias donde se compara con cuatro controladores publicados en la literatura. El Cap´ıtulo 4 está orientado al trabajo realizado sobre control coordinado saturado en robots móviles tipo uniciclo, donde se presenta una nueva metodolog´ıa de consenso que está inspirada y comparada con una propuesta en la literatura. En el Cap´ıtulo 5 se presentan las conclusiones principales, as´ı como las contribuciones derivadas del trabajo de tesis y el posible trabajo futuro.

(19)

Cap´ıtulo 2

Control No Lineal de Robots M´ oviles Tipo Uniciclo

2.1. Controlador de seguimiento de trayectorias basado en linealizaci´ on por retroalimentaci´ on

2.1.1. Modelo cinem´ atico

El modelo cinemático general para robots móviles tipo uniciclo, donde el punto de interés coincide con el centro del eje virtual de las ruedas y su centro de masa, se presenta en [42] como





˙x

˙ y θ˙



=





cos(θ) 0 sen(θ) 0

0 1





V W

, (2.1)

donde x(t) y y(t) representan las coordenadas de la posición del punto de interés del robot móvil, θ(t) representa su orientación, V (t) y W (t) son las entradas de control de velocidad lineal y angular, respectivamente.

La información sobre la geometr´ıa necesaria para establecer el modelo cinemático de un robot móvil tipo uniciclo, se muestra en la figura 2.1.

Figura 2.1. Representación cinemática del robot móvil.

(20)

2.1.2. Formulaci´ on del problema de control

Para garantizar el seguimiento de la trayectoria deseada, es necesario que la trayectoria de referencia sea definida con base en el siguiente modelo de referencia virtual de un robot m´ovil tipo uniciclo, es decir, que siga una trayectoria cuyos movimientos puedan ser replicados por esta clase de robots





˙ x_r

˙ y_r θ˙r



=





cos(θ_r) 0 sen(θ_r) 0

0 1





V_r W_r

, (2.2)

donde x_r(t), y_r(t) y θ_r(t) representan la posici´on y orientaci´on en el plano cartesiano de la referencia variante en el tiempo y Vr y Wr son las velocidades de referencia lineal y angular, las cuales se asumen acotadas junto con sus derivadas.

Por tanto, el problema de control de seguimiento de trayectorias consiste en diseñar un controlador de velocidad [V W ]^T ∈ IR² tal que la posición y orientación en el plano cartesiano del robot móvil tienda asintóticamente a las trayectorias de referencia variantes en el tiempo, es decir, que se cumpla

t→∞l´ım





x_r(t) − x(t) y_r(t) − y(t) θ_r(t) − θ(t)



=



 0 0 0



. (2.3)

2.1.3. Din´ amica del error en lazo abierto

El error de seguimiento es definido como





˜ x

˜ y θ˜



=





x_r(t) − x(t) y_r(t) − y(t) θr(t) − θ(t)



. (2.4)

Para obtener la representación del error en lazo abierto se aplica una transformación global invertible reportada en [42], con la finalidad de obtener las coordenadas del error con respecto al marco de referencia del robot móvil. Bajo esta representación, el error de postura (posición y orientación) puede ser establecido como:



 e1

e₂ e₃



=





cos(θ) sen(θ) 0

− sen(θ) cos(θ) 0

0 0 1









˜ x

˜ y θ˜



, (2.5)

Tomando en cuenta la derivada temporal de (2.5), la sustitución del modelo cinemático (2.1), el modelo cinemático de referencia virtual (2.2), y algunas identidades trigonométricas se obtiene la dinámica de los errores de seguimiento de (2.5) como





˙e₁

˙e₂

˙e₃



 =







˙˜x cos(θ) − ˜x sen(θ) ˙θ + ˙˜y sen(θ) + ˜y cos(θ) ˙θ

˙˜y cos(θ) − ˜y sen(θ) ˙θ − ˙˜x sen(θ) − ˜x cos(θ) ˙θ θ˙˜







=





V_r(cos(θ) cos(θ_r) + sen(θ) sen(θ_r)) − (cos²(θ) + sen²(θ))V + W (˜y cos(θ) − ˜x sen(θ)) (cos(θr) sen(θ) − sen(θr) cos(θ))Vr− W (˜x cos(θ) + ˜y sen(θ))

W_r− W





=





V_rcos(e₃) − V + W e₂ Vrsen(e3) − W e1

W_r− W



. (2.6)

(21)

donde se puede establecer que si

t→∞l´ım



 e₁(t) e₂(t) e₃(t)



=



 0 0 0



, (2.7)

entonces

t→∞l´ım





˜ x(t)

˜ y(t) θ(t)˜



=



 0 0 0



, (2.8)

dado que la matriz del lado derecho de (2.5) es invertible para todo θ ∈ IR.

2.1.4. Dise˜ no del controlador basado en linealizaci´ on por retroalimen- taci´ on

Reescribiendo el error en lazo abierto mostrado en la ecuaci´on (2.6), se obtiene

˙e =





V_rcos (e₃) Vrsen (e3) − W e1

W_r





| {z }

f

+





−1 e₂

0 0

0 −1





| {z }

G

V W

, (2.9)

el cual tiene la estructura

˙e = f (t, e) + G(e)v, (2.10)

donde f (t, e) ∈ IR³, G(e) ∈ IR^3×2 es la matriz de entradas, y v = [V W ] ∈ IR² es la entrada de control.

Definiendo los vectores variantes en el tiempo

k_α(t) =



 α₁(t) α₂(t) α3(t)



, k_β(t) =



 β₁(t) β₂(t) β3(t)



, (2.11)

se propone la funci´on de salida

y =y₁ y2

=k_α(t)^Te k_β(t)^Te

, (2.12)

cuya derivada con respecto al tiempo es

y =˙ k^T_αf k^T_βf

+k^T_αGv k^T_βGv

+" ˙k^T_αe k˙^T_βe

#

, (2.13)

donde en la ecuaci´on (2.13) se ha omitido la dependencia del tiempo de los vectores k_α(t), k_β(t), k˙_α(t), ˙k_β(t). La ecuaci´on (2.13) se puede reescribir en forma alterna como

y =˙ k^T_αf k^T_βf

+ E (t, e) V W

+" ˙k^T_αe k˙^T_βe

#

, (2.14)

donde

E (t, e) =−α₁(t) α₁(t)e₂− α₃(t)

−β₁(t) β₁(t)e₂− β₃(t)

. (2.15)

(22)

La entrada de control que linealiza el sistema (2.14) es dada por

V W

= E (t, e)⁻¹

"

−k^T_αf k^Tβf

−" ˙k^T_αe k˙^T_βe

#

− K_py

#

. (2.16)

Sustituyendo la entrada de control (2.16) en (2.14) se obtiene la din´amica externa

˙

y = −K_py, (2.17)

la cual es lineal y estable exponencialmente bajo la condici´on de que la matriz K_p ∈ IR^2×2 sea sim´etrica y positiva definida.

Por otra lado, n´otese que la inversa de E(t, e) est´a dada por E (t, e)⁻¹ = 1

det(E)

β₁(t)e₂− β₃(t) α₃(t)−α₁(t)e₂ β₁(t) −α₁(t)

, (2.18)

donde el determinante de la matriz E (t, e)⁻¹ es abreviado por det(E) y es expresado como det(E) = α₁(t)β₃(t) − β₁(t)α₃(t). (2.19) Para evitar una singularidad en (2.18) y por tanto también en la acción de control (2.16) es necesario que det(E) 6= 0. Con el fin de garantizar un valor distinto de cero de E(t, e) y facilitar el análisis, a continuación se presentan algunos puntos a tomar en cuenta para la selección de ganancias k_α(t) y k_β(t):

Seleccionar las ganancias α_i, β_i (i = 1, 2) como soluciones de la siguiente ecuaci´on:

− β1α2 + α1β2 = 0, (2.20)

ya que es necesario para cancelar un par de términos que contienen a f₂ (ver ecuación (2.9) para la definición del vector f ). Note que la señal f₂ contiene la velocidad angular W , lo que una selección de ganancias β_i, α_i (i = 1, 2) que no cumple (2.20) produce que (2.16) sea una función impl´ıcita de W .

Definir

α₁, β₁, β₃ > 0, (2.21)

como ganancias constantes donde α₁ y β₁ son las soluciones de (2.20).

Seleccionar en (2.20) la ganancia α₂ como la soluci´on de la siguiente ecuaci´on:

α₂(t) = −k₀W_r(t), (2.22)

con k0 > 0 siendo constante, lo cual asegura que la solución de la dinámica interna converge asintóticamente a cero.

Definir

α3 = 0, (2.23)

lo cual asegura de acuerdo a (2.21) que el determinante de la matriz E resulte:

det(E) = α1β3 > 0. (2.24)

(23)

Finalmente, y de acuerdo a la ecuaci´on (2.20), seleccionar la ganancia β₂(t) como:

β₂(t) = α₂(t)β₁ α1

= −k₀W_r(t)β₁ α1

. (2.25)

Bajo las condiciones previas (2.21)-(2.25) se obtienen los siguientes vectores de ganancias asociados a la ecuaci´on de salida y en (2.12):

k_α(t) =



 α₁ α₂(t)

0



, k_β(t) =



 β₁ β₂(t)

β3



=



 β₁ α₂(t)β₁/α₁

β3



. (2.26)

Por tanto, la entrada de control en la (2.16) se escribe como:

V = 1

det(E)(β₁e₂− β₃) (−α₁f₁− α₂f₂− ˙α₂e₂− k_p1y₁)

− 1

det(E)(α₁e₂) (−β₁f₁− β₂f₂− β₃f₃− ˙β₂e₂− k_p2y₂),

(2.27)

W = 1

det(E) h

β₁(−α₃f₃− ˙α₂e₂− k_p1y₁) − α₁(−β₃f₃− ˙β₂e₂− k_p2y₂)i

, (2.28)

donde f₁, f₂ y f₃ son las componentes del vector f in (2.9).

Nótese de (2.9) que f₂ = V_rsen(e₃) − W e₁, donde en la implementación computacional, la velocidad angular W se debe calcular primero. Por tanto, la señal f₂ y la velocidad lineal V pueden ser calculadas posteriormente.

Siguiendo el procedimiento de linealizaci´on por retroalimentaci´on de salida [48, 45], se considera el siguiente cambio de variable:

z =



 η y₁ y₂



, (2.29)

donde η satisface

∂η

∂eG(t, e) = 0, (2.30)

con G(t, e) definida en (2.9). Proponiendo η = e₂, la ecuaci´on (2.30) se reescribe como

∂η

∂eG(t, e) =0 1 0





−1 e₂

0 0

0 −1



=



 0 0 0 0 0 0



.

Por tanto, el cambio de coordenadas (2.29) se reescribe en t´erminos del error e de la siguiente manera:

z =



 η y₁ y₂



=





0 1 0

α₁ α₂ 0 β₁ β₂ β₃





| {z }

H



 e₁ e₂ e₃



, (2.31)

donde (2.23) fue considerada. La inversa de la matriz H en (2.31) existe si (2.24) se satisface.

(24)

Nótese que el sistema en lazo abierto (2.9) puede ser escrito con una diferente parametrización de f y G. Especificamente, el término de entrada W e1 puede ser incluido dentro del término G V

W

. Sin embargo, la condición (2.30) se convierte en un sistema de ecuaciones diferenciales parciales más dif´ıcil de resolver que el método propuesto. En otras palabras, la representación en (2.9) facilita la obtención de la dinámica interna.

Usando (2.31), su inversa y la definici´on (2.24), la din´amica interna puede ser calculada como:

d

dtη = ˙e₂ = −W e₁+ V_rsen(e₃)

= −[det (E) W_r− β₁k_p1y₁+ α₁k_p2y₂]

det (E)² [− (α₂β₃) η + β₃y₁] + V_rsen

1

α₁β₃[−β₁y₁+ α₁y₂]

,

(2.32)

y la din´amica externa (2.17) es reescrita nuevamente de modo de referencia:

d

dty = −Kpy. (2.33)

Las ecuaciones (2.32) y (2.33) son consideradas como el sistema en lazo cerrado.

Proposici´on 1. Si las condiciones (2.21), (2.23), y (2.25) se cumplen y seleccionando

α2(t) = −k0Wr(t), (2.34)

con W_r(t) como una señal de excitación persistente, entonces el equilibrio z = 0 del sistema en lazo cerrado (2.32)–(2.33) es localmente asintóticamente estable.

Demostraci´on. Suponiendo que y = 0 en la din´amica interna (2.32), es posible reescribirla como d

dtη = W_r

det (E)[α₂β₃] η = W_rα₂

α₁η. (2.35)

El sistema (2.35) representa la din´amica interna no perturbada por la din´amica externa (2.33).

Si seleccionamos α₂(t) de acuerdo a (2.34), entonces d

dtη = −k0

W_r²(t)

α₁ η. (2.36)

Si W_r(t) es de excitación persistente, η(t) → 0 cuando t → ∞ con una velocidad de conver- gencia exponencial (Ver Teorema 2.5.1 en [43], pág. 73). Por otro lado, la dinámica externa (2.33) es un estado exponencialmente estable.

El sistema en lazo cerrado (2.32)-(2.33) tiene una estructura de sistema en cascada, en la que el sistema imperturbable (2.32) es asintóticamente estable (ver la ecuación (2.36)) y el sistema independiente (2.33) es exponencialmente estable. Por lo tanto, hay condiciones suficientes para probar que el origen del espacio de estado de (2.32)-(2.33) es localmente asintóticamente estable;

ver [44].

(25)

Proposición 2. Debido a que las soluciones z(t) = [η(t) y(t)]^T ∈ IR³ convergen a cero de manera asintótica, las soluciones de la dinámica del error e(t) = [e1(t) e2(t) e3(t)]^T ∈ IR³ también convergen a cero de manera asintótica.

Demostraci´on. Debido a que e(t) = H⁻¹z(t), la cota superior del vector de estado e(t) puede ser expresada como ke(t)k ≤ kH⁻¹k kz(t)k. Por lo tanto, e(t) converge a cero de manera asint´otica.

Las Proposiciones 1 y 2 y el hecho de que (2.5) es invertible globalmente implica que el objetivo de control en la ecuaci´on (2.8) es asegurado con el controlador propuesto (2.16).

2.1.5. Validaci´ on experimental

Con el fin de verificar la efectividad y la eficiencia del controlador propuesto dos conjuntos de experimentos fueron llevados a cabo. La plataforma integra al robot móvil Pionner P3-DX, el cual es fabricado por MobileRobots Inc. El robot móvil es controlado mediante entradas de control de velocidad lineal y angular. Además, cuenta con una PC abordo, operando bajo el sistema operativo Ubuntu GNU/Linux 12.04 LTS, y mediante ROS Indigo Igloo (Robot Operating System) recibe las entradas de control. La adquisición de las señales de retroalimentación es recibida con una frecuencia de 100 [Hz] usando el sistema de visión OptiTrack. La acción de control es calculada a través de Matlab-Simulink (R2015a) el cual incluye un toolbox para habilitar la interfaz con ROS as´ı como permitir la conexión con la red de ROS y poder enviar la acción de control requerida.

En la figura 2.2 se muestra la configuraci´on de la plataforma experimental utilizada.

Figura 2.2. Configuraci´on de la plataforma experimental.

2.1.5.1. Controladores para comparaci´on

En esta subsección, se describen tres controladores seleccionados para la comparación de rendimiento. Para referirse a los controladores, se ha considerado un acrónimo o abreviación compuesta con la primera letra del apellido de cada autor. Dichos controladores seleccionados poseen diferentes estructuras de control, lo cual es útil para comparar su desempeño con respecto al esquema

(26)

propuesto.

Controlador DDZB [42]

El controlador reportado por Dixon et al. [42], fue desarrollado usando t´ecnicas similares a la de Lyapunov, y es definido como

V W

=

k₁e₁+ V_rcos(e₃) V_r^sen(e3)_e

3 e₂+ k₂e₃+ W_r

, (2.37)

donde k₁, k₂ ∈ IR son constantes positivas.

Controlador CKSS [46]

El controlador reportado por Canudas de Wit et al. [46], fue desarrollado usando un modelo cinem´atico linealizado, y est´a dado por

V W

=

V_rcos(e₃) + k₁e₁ W_r+ k₂sign(V_r)e₂+ k₃e₃

, (2.38)

con k₁ = 2ζa, k₂ = ^a²_|V^−W^r²

r| , y k₃ = 2ζa, donde ζ y a ∈ IR son constantes positivas y con V_r 6= 0 ∀ t.

Controlador PLLN [47]

El controlador reportado por Panteley et al. [47] tiene la siguiente estructura en cascada:

V W

= V_r+ c2e1

W_r+ c₁e₃

, (2.39)

donde c1 y c2 ∈ IR son constantes positivas.

2.1.5.2. Comparaci´on experimental usando una trayectoria circular

La trayectoria de referencia circular utilizada para el experimento se define por la siguiente posici´on y orientaci´on deseadas:

x_r(t) = 0.5 sen(0.4t) [m], (2.40)

y_r(t) = 0.5 − 0.5 cos(0.4t) [m], (2.41)

θ_r(t) = 0.4t [rad], (2.42)

Estas ecuaciones cumplen con el modelo de referencia virtual dado en (2.2), con las velocidades lineal y angular correspondientes

V_r = 0.2 [m/s], (2.43)

W_r = 0.4 [rad/s]. (2.44)

Las condiciones iniciales del robot m´ovil Pioneer P3-DX para todos los experimentos con la trayectoria circular son las siguientes:

x(0) = 0.00 [m], (2.45)

y(0) = 0.50 [m], (2.46)

θ(0) = −0.50 [rad]. (2.47)

(27)

Las ganancias seleccionadas para el controlador propuesto cumplen las condiciones dadas en (2.21), (2.23), (2.25) y (2.34).

Las ganancias para cada controlador se seleccionaron mediante un proceso de prueba y error, de manera que no hubiera variación fuera de un rango de ±5 % del valor RMS (Root Mean Square, por sus siglas en inglés) de V y W de un controlador con respecto a los otros en el intervalo de tiempo 20 [s] ≤ t ≤ 40 [s] donde la respuesta transitoria ya se ha desvanecido. El valor RMS está dado por

RM S(X(n)) = v u u t

1 N_f − N_i

Nf

X

i=Ni

|x(n)|², (2.48)

donde x(n) es la señal por procesar para la obtención del valor RMS, N_ies el número de la muestra inicial y N_f es el numero de la muestra final, N_f > N_i. Las ganancias obtenidas se muestran en la tabla 2.1.

Tabla 2.1. Trayectoria circular: ganancias seleccionadas para cada controlador DDZB [42] CKSS [46] PLLN [47] Controlador propuesto

k₁ = 0.50 k₂ = 0.16

α = 1.000 ζ = 0.075

c₁ = 0.4 c₂ = 1.0

α₁ = 0.7 α2 = −0.8 α₃ = 0.0 k_p1= 0.4 k_p2= 0.394

β₁ = 0.05 β₂ = −0.57 β₃ = 0.02 k₀ = 2.0

Los resultados de los experimentos en tiempo real se muestran en las figuras 2.3–2.5. Las l´ıneas verde, azul y amarilla identifican a los controladores DDZB, CKSS y PLLN, respectivamente, y las l´ıneas rojas corresponden a los resultados del esquema propuesto en (2.16). Las rutas descritas con los cuatro controladores se muestran en la figura 2.3. El lado izquierdo de la figura 2.4 presenta la evolución temporal de la postura del robot x(t), y(t) y θ(t) en comparación con la configuración deseada x_r(t), y_r(t) y θ_r(t). La evolución temporal de los errores de posición ˜x(t),

˜

y(t) y orientaci´on ˜θ(t) tambi´en se muestran en el lado derecho de la figura 2.4.

La evoluci´on temporal de las entradas de control V (t) y W (t) se presenta en la figura 2.5. La diferencia entre las entradas de control de referencia y las entradas de control producidas por cada uno de los controladores son definidas como

V˜ = Vr− V, (2.49)

W˜ = W_r− W, (2.50)

dichas se˜nales de error tambi´en se muestran en la figura 2.5.

Se observa un desempe˜no similar para todos los controladores, diferenci´andose en la respuesta transitoria.

Para comparar el desempeño de los controladores, los valores RMS de ˜x(t), ˜y(t), ˜θ(t), ˜V (t), W (t), V (t) y W (t) se calcularon en el intervalo de tiempo de 20 [s] ≤ t ≤ 40 [s], periodo donde˜ se asume que la respuesta transitoria ya se desvaneció y se considera como criterio de equidad para todos los controladores la respuesta en estado estacionario. La tabla 2.2 presenta los valores RMS obtenidos con cada controlador. El controlador propuesto muestra el mejor desempeño con los valores RMS más pequeños para las señales de error de postura. Además, los valores RMS de

(28)

las entradas de control para todos los controladores no difieren en m´as de ±5 %. Por lo tanto, con un consumo de energ´ıa similar, el nuevo controlador funciona mejor.

Tabla 2.2. Resultados experimentales para la trayectoria circular: valores RMS para la comparaci´on de los controladores DDZB (2.37), CKSS (2.38), PLLN (2.39) y el controlador propuesto (2.16)

20 [s] ≤ t ≤ 40 [s]

RMS x [m]˜ y [m]˜ θ [rad]˜ V [m/s]˜ W [rad/s]˜ V [m/s] W [rad/s]

DDZB 0.0130 0.0102 0.0228 0.0055 0.0060 0.1948 0.3942 CKSS 0.0076 0.0082 0.0232 0.0016 0.0077 0.2008 0.3980 PLLN 0.0167 0.0163 0.0149 0.0092 0.0060 0.2088 0.3946 Controlador

propuesto 0.0030 0.0034 0.0147 0.0031 0.0057 0.2026 0.3949

Figura 2.3. Resultados experimentales: rutas trazadas por el robot m´ovil P3-DX. El punto de inicio es mostrado por (o, o, o y o), y la posici´on final por (, , y ).

(29)

Figura 2.4. Resultados experimentales: (izquierda) evoluci´on en el tiempo de x(t), y(t) y θ(t);

(derecha) evoluci´on en el tiempo de los errores de posici´on ˜x(t), ˜y(t) y ˜θ(t).

Figura 2.5. Resultados experimentales: (izquierda) evoluci´on en el tiempo de las entradas de control demandadas; (derecha) errores de la acci´on de control.

(30)

2.1.5.3. Comparaci´on experimental usando una trayectoria lemniscata

Se usó una trayectoria de referencia lemniscada para llevar a cabo otro conjunto de experimentos en tiempo real. Esta trayectoria está definida por las señales de posición de referencia y orientación:

x_r(t) = 1.1 + 0.7 sen 2πt 30

[m], (2.51)

y_r(t) = 0.9 + 0.7 sen 4πt 30

[m], (2.52)

θr(t) = atan2 ( ˙yr, ˙xr) [rad]. (2.53) Estas ecuaciones cumplen con el modelo de referencia virtual dado en (2.2), con las velocidades lineal y angular calculadas mediante

V_r =p

˙x²_r + ˙y²_r, (2.54)

y

W_r = ˙x_ry¨_r− ¨x_ry˙_r

˙x²_r+ ˙y_r² . (2.55)

La configuraci´on inicial del robot m´ovil Pioneer P3-DX para todos los experimentos con la trayectoria circular es:

x(0) = 1.2 [m], (2.56)

y(0) = 0.9 [m], (2.57)

θ(0) = 0.7854 [rad]. (2.58)

Al igual que en el conjunto de experimentos anterior, las ganancias para cada controlador se seleccionaron de tal manera que la diferencia de los valores RMS de las señales de entrada V y W se mantuvieran dentro de un rango de variación ±5 % de un controlador con respecto a los demás. Los valores de ganancia obtenidos se muestran en la tabla 2.3. Además, las ganancias del controlador propuesto satisfacen las condiciones (2.21), (2.23), (2.25) y (2.34).

Tabla 2.3. Trayectoria lemniscata: ganancias seleccionadas para cada controlador DDZB [42] CKSS [46] PLLN [47] Controlador propuesto

k₁ = 0.45 k2 = 0.90

α = 1.107 ζ = 0.300

c₁ = 0.5 c2 = 1.0

α₁ = 0.9

α₂ = −1.3 × W_r(t) α₃ = 0.0

k_p1 = 1.6 k_p2 = 1.3

β₁ = 1.0

β₂ = −1.44 × W_r(t) β3 = 10.0

k₀ = 1.3

Los resultados de los experimentos en tiempo real se muestran en las figuras 2.6–2.8. Las rutas descritas con cada controlador se muestran en la figura 2.6. La evoluci´on temporal de los estados del robot x(t), y(t) y θ(t) y sus valores deseados x_r(t), y_r(t) y θ_r(t) se presentan en la figura 2.7.

Las señales de error ˜x(t), ˜y(t) y ˜θ(t) también se muestran en la figura 2.7. La figura 2.8 muestra la evolución temporal de las entradas de control V (t) y W (t) y la diferencia entre la entrada de control deseada y la entrada de control real dada en (2.49) - (2.50).

(31)

Para evaluar el rendimiento de los controladores probados, los valores RMS de los errores y las se˜nales de entrada de control se calcularon en el intervalo de tiempo 40 [s] ≤ t ≤ 80 [s], donde los transitorios han desaparecido. La tabla 2.4 presenta los resultados para los cuatro controladores.

El controlador propuesto muestra el mejor rendimiento con los valores RMS más bajos para las señales de error de postura. De manera similar, los valores RMS de las entradas de control para todos los controladores no difieren en más de ±5 %.

Tabla 2.4. Resultados experimentales para la trayectoria lemniscata: valores RMS para la comparaci´on de los controladores DDZB (2.37), CKSS (2.38), PLLN (2.39) y el controlador propuesto (2.16)

40[s] ≤ t ≤ 80[s]

RMS x[m]˜ y[m]˜ θ[rad]˜ V [m/s]˜ W [rad/s]˜ V [m/s] W [rad/s]

DDZB 0.0237 0.0351 0.0605 0.0130 0.0553 0.2372 0.5601 CKSS 0.0205 0.0236 0.0993 0.0127 0.1120 0.2350 0.5625 PLLN 0.0192 0.0328 0.0653 0.0211 0.0327 0.2377 0.5509 Controlador

propuesto 0.0132 0.0106 0.0425 0.0263 0.0552 0.2319 0.5570

Figura 2.6. Resultados experimentales: rutas trazadas por el robot m´ovil P3-DX. El punto de inicio es mostrado por (o, o, o y o), y la posici´on final por (, , y ).

(32)

Figura 2.7. Resultados experimentales: (izquierda) evoluci´on en el tiempo de x(t), y(t) y θ(t);

(derecha) evoluci´on en el tiempo de los errores de posici´on ˜x(t), ˜y(t) y ˜θ(t).

Figura 2.8. Resultados experimentales: (izquierda) evoluci´on en el tiempo de las entradas de control demandadas; (derecha) errores de la acci´on de control.

(33)

2.1.6. Discusiones

En ambos conjuntos de experimentos, el controlador de linealización por retroalimentación introducido muestra la mejor precisión de seguimiento con un consumo de energ´ıa idéntico al de los otros controladores. Para complementar el estudio experimental, la tabla 3.5 muestra el porcentaje de mejora del controlador propuesto con respecto a los controladores DDZB, CKSS y PLLN, que se calcularon a partir de los valores RMS del error de seguimiento de la trayectoria y la acción de control para las trayectorias circulares y lemniscatas. Los errores de seguimiento siempre se mejoran con el controlador propuesto. Además, la mejora relativa de los valores RMS de las acciones de control V y W está siempre en el rango de ±5 %, según lo establecido en el criterio de ajuste de ganancias.

El controlador propuesto tiene términos cuadrados en los errores de seguimiento e₁, e₂ y e₃, como se demuestra al expandir las ecuaciones (2.27) y (2.28), lo que lo convierte en un controlador local de alta ganancia. Esta caracter´ıstica mejora la atenuación de los efectos de las perturbaciones que var´ıan lentamente, como retrasos de comunicación y fricción, presentes en el sistema experimental.

Tabla 2.5. Porcentaje de mejora del controlador propuesto con respecto a los controladores DDZB, CKSS y PLLN, calculados a partir de los valores RMS para las implementaciones de las trayectorias circular y lemniscata

DDZB CKSS PLLN

Se˜nal Trayectoria circular

Trayectoria lemniscata

Trayectoria circular

˜

x 76.92 % 44.3 % 60.53 % 35.61 % 82.04 % 31.25 %

˜

y 66.67 % 69.8 % 58.54 % 55.08 % 79.14 % 67.68 %

θ˜ 35.53 % 29.75 % 36.64 % 57.2 % 1.34 % 34.92 %

V -4.00 % 2.23 % -0.9 % 1.32 % 2.97 % 2.44 %

W -0.18 % 0.55 % 0.78 % 0.98 % -0.08 % -1.11 %

(34)

Cap´ıtulo 3

Control No Lineal de Robots M´ oviles Tipo Uniciclo con Saturaci´ on de La Entrada de Control

3.1. Familia de controladores de entradas saturadas

En esta sección se presenta una familia de controladores saturados para robots móviles tipo uniciclo, la cual es propuesta para seguimiento de trayectorias basado en el modelo cinemático donde el punto de interés coincide con el centro del eje virtual de las ruedas (2.1). Ademas, se presentan las condiciones necesarias para probar estabilidad global de forma asintótica del equilibrio cero del sistema en lazo cerrado mediante la teor´ıa de Lyapunov.

3.1.1. Preliminares

La familia de controladores con entradas saturadas propuesta es diseñada para robots móviles tipo uniciclo descritos con el modelo cinemático (2.1). Por otra parte, se considera que la trayectoria de referencia satisface el modelo de referencia virtual visto en la ecuación (2.2) con velocidades de referencia acotadas como

|Vr(t)| ≤ |Vr|max,

|Wr(t)| ≤ |Wr|max, para todo t ≥ 0. Por otra parte, el l´ımite

t→∞l´ım V_r(t) 6= 0 (3.1)

debe satisfacerse, es decir, que no se requiera que el robot m´ovil se detenga en su desplazamiento lineal.

3.1.2. Problema de control

El problema de control es tomado de [2] y consiste en encontrar una ley de control de realimentaci´on de estados variante en el tiempo de la forma

V (t, θ, x, y), W (t, θ, x, y), (3.2)