• No se han encontrado resultados

INSTITUTO POLITÉCNICO NACIONAL

N/A
N/A
Protected

Academic year: 2022

Share "INSTITUTO POLITÉCNICO NACIONAL"

Copied!
78
0
0

Texto completo

(1)

INSTITUTO POLIT´ ECNICO NACIONAL

CENTRO DE INVESTIGACI ´ ON Y DESARROLLO DE TECNOLOG´ IA DIGITAL

CONTROL DE VEH´ICULOS AUT ´ONOMOS EN TAREAS COORDINADAS

TESIS

QUE PARA OBTENER EL GRADO DE:

MAESTR´IA EN CIENCIAS EN SISTEMAS DIGITALES

PRESENTA:

ING. DANIEL URESTI MORALES BAJO LA DIRECCI ´ON DE:

DR. EDUARDO JAVIER MORENO VALENZUELA DR. RICARDO RAM ´ON P´EREZ ALCOCER

NOVIEMBRE 2019 TIJUANA, B.C., M´EXICO.

(2)
(3)
(4)
(5)

Dedicatoria

A mis padres, Sotero Uresti Tagar y Marina Morales Vera, a mi esposa Nora Liliana Vazquez Talamantes, a toda mi familia que tanto amo.

(6)

Agradecimientos

A Dios por el diario aliento de vida.

Agradezco a mi familia por la educaci´on y el apoyo durante toda mi vida, que ha dado como resultado lo que realmente soy..

Tambi´en agradezco al Dr. Ricardo Ram´on P´erez Alcocer por dirigir este traba- jo, por compartir su conocimiento, su dedicaci´on, empe˜no y sobre todo paciencia.

As´ı mismo le agradezco al Dr. Eduardo Javier Moreno Valenzuela por asesorar este trabajo, anexarme a su equipo y proporcionar consejos.

Por sus comentarios, su disposici´on y tiempo brindados a la atenci´on en este trabajo, le agradezco a los miembros del comit´e tutorial, el Dr. V´ıctor Hugo D´ıaz Ram´ırez, el Dr. Rigoberto Juar´ez Salazar y el Dr. Kostantin Starkov.

Un profundo agradecimiento a mis Ex-compa˜neros, en especial al M. en C. Ale- jandro Vergudo por siempre ayudarme y darme ´animos cuando todo parec´ıa gris.

Al equipo de trabajo con el colabor´e, el M. en C. Luis Gonzalo Montoya Villegas, el M. en C. Iv´an Alonso L´opez S´anchez, M. en C. Jorge Alberto Montoya Chairez y al Ing. Luis Javier Quijada Rocha por brindarme su apoyo an´ımico, experiencia, y conocimiento. Al M. en C. Octavio Augusto Garc´ıa Alarc´on por sus consejos y apoyo en todos los sentidos.

A mis compa˜neros, el Ing. Antonio Ortega, Ing. Israel Dominguez y Ing. Ricardo por siempre creer en mi y apoyarme moralmente para seguir adelante.

Al CONACyT y al IPN, por el apoyo econ´omico y la infraestructura brindados para la realizaci´on de este trabajo.

(7)

Control de veh´ıculos aut´ onomos en tareas coordinadas

Resumen

En esta tesis se aborda el problema de consenso de un sistema multi-agente hete- rog´eneo. En particular, se analizan distintas t´ecnicas de control aplicadas a veh´ıculos terrestres con dos ruedas y quadrotores. Los controladores aplicados al veh´ıculo te- rrestre y uno implementado en el quadrotor fueron tomados de la literatura. Adicio- nalmente se propone un nuevo control no lineal con compensaci´on del modelo para el quadrotor el cual es validado tanto te´orica como experimentalmente. Por otra parte, se detalla una estrategia de control de consenso que garantiza el cumplimiento del mismo siempre que los controladores aplicados a cada agente del sistema aseguren estabilidad asint´otica en la tarea de regulaci´on. De manera experimental se analiza y compara el desempe˜no del esquema de consenso usando controladores ´optimos li- neales y algoritmos de control no lineales para cada uno de los veh´ıculos del sistema de prueba. De esta comparaci´on, los resultados muestran un mejor desempe˜no por parte del sistema multi-agente usando los controladores no lineales.

(8)

Control of autonomous vehicles in coor- dinated tasks

Abstrac

The problem of consensus of a heterogeneous multi-agent system is addressed in this thesis. In particular, different control techniques applied to ground two wheels vehi- cles and quadrotors are analyzed. The controllers applied to the ground vehicle and one implemented in the quadrotor were taken from the literature. Additionally, for the quadrotor, a non-linear control with dynamic model compensation is proposed.

This scheme is validated both theoretically and experimentally. On the other hand, a consensus control strategy is discussed. This methodology guarantees the consen- sus task when the controllers applied to each agent of the system ensure asymptotic stability for the regulation task. Experimentally, the performance of the consensus scheme is analyzed and compared using optimal linear controllers and non-linear control algorithms for each of the vehicles in the test system. From this comparison, the results show a better performance by the multi-agent system using the non-linear controllers.

(9)

´ Indice general

1. Introducci´on 1

1.1. Antecedentes . . . 2

1.2. Objetivos . . . 4

1.2.1. Objetivo general . . . 4

1.2.2. Objetivos espec´ıficos . . . 4

1.3. Motivaci´on . . . 4

1.4. Planteamiento del problema . . . 5

1.5. Metodolog´ıa . . . 5

1.6. Estructura de la tesis . . . 5

2. Veh´ıculo terrestre de dos ruedas 7 2.1. Modelo cinem´atico . . . 7

2.2. Controladores para el veh´ıculo terrestre de dos ruedas . . . 8

2.2.1. Control rotar y avanzar basado en LQR . . . 8

2.2.2. Control de Dixon, Dawson, Zergeroglu y Behal . . . 11

2.3. Resultados de control para regulaci´on . . . 13

2.3.1. Resultados de simulaci´on num´erica . . . 13

2.3.2. Resultados experimentales . . . 14

3. Quadrotor 19 3.1. Modelo din´amico . . . 19

3.2. Control LQR . . . 21

3.3. Control no lineal con compensaci´on del modelo . . . 24

3.4. Resultados de control para regulaci´on . . . 31

3.4.1. Resultados de simulaci´on num´erica . . . 31

3.4.2. Resultados experimentales . . . 34

4. Consenso del sistema multi-agente heterog´eneo 45 4.1. Teor´ıa de grafos . . . 45 4.2. Estrategia de consenso para un sistemas multi-agentes heterog´eneos . 47

(10)

4.3. Resultados del consenso de un sistema multi-agente heterog´eneo . . . 50 4.3.1. Resultados de simulaci´on num´erica . . . 50 4.3.2. Resultados experimentales . . . 51

5. Conclusiones 59

5.1. Conclusi´on . . . 59 5.2. Trabajo Futuro . . . 60

(11)

´ Indice de figuras

2.1. Vista superior del veh´ıculo terrestre de dos ruedas en la que se inclu- ye los marcos de referencia inercial y del cuerpo y las variables que definen su pose. . . 8 2.2. Resultados de simulaci´on: Evoluci´on temporal de la posici´on x(t)

y y(t) y el error de posici´on ˜x(t) y ˜y(t) empleando los controladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) en la tarea de regulaci´on. . 14 2.3. Resultados de simulaci´on: Evoluci´on temporal de la orientaci´on

θ(t) y error de orientaci´on ˜θ(t) empleando los controladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) en la tarea de regulaci´on. . . 15 2.4. Resultados de simulaci´on: Velocidad lineal V (t) y angular W (t)

obtenidas con los controladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) durante la tarea de regulaci´on. . . 15 2.5. Configuraci´on del sistema experimental para el control del veh´ıculo

terrestre de dos ruedas. . . 16 2.6. Resultados de experimento en tiempo real: Evoluci´on temporal

de la posici´on x(t) y y(t) y el error de posici´on ˜x(t) y ˜y(t) empleando los controladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) en la tarea de regulaci´on. . . 17 2.7. Resultados de experimento en tiempo real: Evoluci´on temporal

de la orientaci´on θ(t) y error de orientaci´on ˜θ(t) empleando los con- troladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) en la tarea de regulaci´on. . . 18 2.8. Resultados de experimento en tiempo real: Velocidad lineal

V (t) y angular W (t) obtenidas con los controladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) durante la tarea de regulaci´on. . . 18 3.1. Representaci´on del quadrotor incluyendo el marco de referencia iner-

cial I y el marco de referencia del cuerpo del veh´ıculo B. . . 20 3.2. Diagrama de bloques de la implementaci´on del controlador No lineal

con compensaci´on del modelo. . . 22

(12)

3.3. Diagrama de bloques de la implementaci´on del controlador no lineal con compensaci´on del modelo. . . 25 3.4. Resultados de simulaci´on: Ruta descrita por el quadrotor en el

espacio tridimensional en la tarea de regulaci´on aplicando los contro- ladores CQ1 (l´ınea roja) y CQ2 (l´ınea azul). . . 33 3.5. Resultados de simulaci´on: Evoluci´on temporal de la posici´on p(t)

y el ´angulo de gui˜nada ψ(t) empleando los controladores CQ1 (l´ınea roja) y CQ2 (l´ınea azul) en la tarea de regulaci´on. . . 34 3.6. Resultados de simulaci´on: Gr´aficas de error de posici´on ˜p y orien-

taci´on ˜η obtenidos con el controlador CQ1 (l´ınea roja) y controlador CQ2 (l´ınea azul). . . 35 3.7. Resultados de simulaci´on: Empuje total y momentos obtenidos

con los controladores durante la tarea de regulaci´on. . . 36 3.8. Configuraci´on del sistema experimental para el control del veh´ıculo

a´ereo. . . 37 3.9. Resultados de experimento en tiempo real: Ruta descrita por el

quadrotor en el espacio tridimensional durante la tarea de regulaci´on aplicando el control CQ1 (l´ınea roja) y el control CQ2 (l´ınea azul). . 38 3.10. Resultados de experimento en tiempo real: Evoluci´on temporal

de la posici´on p(t) y el ´angulo de gui˜nada ψ(t) empleando los con- troladores CQ1 (l´ınea roja) y CQ2 (l´ınea azul) durante la tarea de regulaci´on. . . 38 3.11. Resultados de experimento en tiempo real: Gr´aficas de error

de posici´on ˜p(t) y orientaci´on ˜η(t) obtenidos con el controlador CQ1 (l´ınea roja) y controlador CQ2 (l´ınea azul). . . 39 3.12. Resultados de experimento en tiempo real: Empuje total fpz(t)

y momentos τ (t) obtenidos con los controladores CQ1 (l´ınea roja) y CQ2 (l´ınea azul) en la tarea de regulaci´on. . . 40 3.13. Resultados de experimento en tiempo real: Ruta descrita por

el quadrotor Qball 2 en el espacio tridimensional durante la tarea de seguimiento de trayectorias usando el controlador CQ2. . . 41 3.14. Resultados de experimento en tiempo real: Evoluci´on temporal

de las se˜nales de posici´on p(t) y orientaci´on η(t) del quadrotor durante la tarea de seguimiento de trayectorias empleando el controlador CQ2. 42 3.15. Resultados de experimento en tiempo real: Gr´aficas de error

de posici´on p(t) y orientaci´on η(t) obtenidos con el controlador CQ2 durante la tarea de seguimiento de trayectorias. . . 43 3.16. Resultados de experimento en tiempo real: Evoluci´on temporal

de las se˜nales del empuje total fpz(t) y momentos τ (t) calculados en el experimento de seguimiento de trayectorias con el controlador CQ2. 44

(13)

4.1. Representaci´on de un grafo. . . 46 4.2. Grafo de interacci´on del sistema multi-agente constituido por un veh´ıcu-

lo terrestre y un quadrotor. . . 50 4.3. Resultados de simulaci´on: Rutas descritas por el sistema multi-

agente en el plano xy y en el espacio tridimensional durante la tarea de consenso aplicando CLQR y CCNL. . . 52 4.4. Resultados de simulaci´on: Evoluci´on temporal de la posici´on x(t)

y y(t) del sistema multi-agente aplicando CLQR y CCNL durante la tarea de consenso. . . 53 4.5. Resultados de simulaci´on: Error de consenso de posici´on del siste-

ma multi-agente en los ejes x y y, obtenidos aplicando CLQR y CCNL en la tarea de consenso. . . 53 4.6. Resultados de simulaci´on: Velocidad lineal y velocidad angular

obtenidos aplicando CLQR y CCNL en la tarea de consenso. . . 54 4.7. Resultados de simulaci´on: Empuje total y momentos de fuerza

obtenidos aplicando CLQR y CCNL en la tarea de consenso . . . 54 4.8. Configuraci´on experimental del sistema multi-agente heterog´eneo. . . 55 4.9. Resultados de experimento en tiempo real: Rutas descritas por

el sistema multiagente en el plano xy y en el espacio tridimensional durante la tarea de consenso aplicando CLQR y CCNL. . . 56 4.10. Real-time experiment results: Evoluci´on temporal de la posici´on

x(t) and y(t) del sistema multi-agente aplicando CLQR y CCNL. . . 57 4.11. Resultados de experimento en tiempo real: Error de consenso

del sistema multi-agente en los ejes x y y. . . 57 4.12. Resultados de experimento en tiempo real: Velocidad lineal y

velocidad angular obtenidos con CLQR y CCNL en la tarea de consenso. 58 4.13. Resultados de experimento en tiempo real: Empuje total y mo-

mentos de fuerza obtenidos con CLQR y CCLN en la tarea de consenso. 58

(14)
(15)

´ Indice de tablas

2.1. Valores RMS de los errores de postura del Qbot en el experimento de regulaci´on para la comparaci´on de los controladores CVTR1 y CVTR2. Estos valores fueron calculados para 20 [s] ≤ t ≤ 30 [s]. . . . 18 3.1. Valores RMS de los errores de postura del Qball en el experimento de

regulaci´on para la comparaci´on de CQ1 y CQ2, para 15 ≤ t ≤ 50. . . 37 4.1. Valor promedio de las se˜nales del error de consenso de posici´on en el

intervalo de tiempo 25 [s] ≤ t ≤ 45 [s]. . . 55

(16)

Cap´ıtulo 1 Introducci´ on

El uso de los veh´ıculos no tripulados, sean terrestres, a´ereos o acu´aticos, ha cre- cido considerablemente en diversos ´ambitos como lo son la exploraci´on, vigilancia, trasporte, entretenimiento, por mencionar algunos ejemplos. Por tal motivo, es de in- ter´es lograr que estos sistemas sean lo m´as aut´onomos posible; esto implica el dise˜no y validaci´on de distintos algoritmos que permitan la reducci´on de la intervenci´on de un piloto y tambi´en garanticen el cumplimiento de las tareas asignadas al sistema.

En la actualidad se ha alcanzado grandes avances en cuesti´on de los sistemas no tripulados, en el ´area de dise˜no, tecnolog´ıa de adquisici´on de datos, hasta control que es donde se aloja este trabajo.

Este trabajo se enfoca en torno al control de dos de estos tipos de veh´ıculos no tripulados, el veh´ıculo terrestre de dos ruedas y el veh´ıculo a´ereo llamado quadrotor.

El veh´ıculo terrestre de dos ruedas posee como principal caracter´ıstica que su des- plazamiento en el plano horizontal se lleva a cabo por medio de la variaci´on de las velocidades de sus dos ruedas, el dise˜no de esquemas de control para esta plataforma presenta dificultades debido a las restricciones no hol´onomicas propias de su modelo cinem´atico [1]-[4].

Por otra parte, los quadrotores son veh´ıculos a´ereos con una estructura en forma de x cual cuentan con cuatro motores alimentados por energ´ıa el´ectrica a los cuales se les acoplan h´elices que generan las fuerzas y momentos necesarios para que realicen la tarea de vuelo asignada. Con estos actuadores el veh´ıculo puede desplazarse, mantenerse en el aire y cambiar su orientaci´on. El control de estos dispositivos resulta complejo por ser un sistema sub-actuado, debido a que posee seis grados libertad y s´olo cuatro actuadores [5]-[8].

Si bien estos veh´ıculos brindan utilidad en sus tareas asignadas, el uso de un gru- po de estos trabajando en conjunto incrementa sus capacidades y su funcionalidad,

(17)

pudiendo realizar tareas complejas m´as all´a de la capacidad de un veh´ıculo indivi- dual. Este enfoque de un grupo de veh´ıculos realizando tareas en conjunto requiere de estrategias de control cooperativo que garanticen el cumplimiento de la misma [11]-[20]. Russell y Norving en [9] definen a un agente como una entidad aut´onoma capaz de percibir mediante sensores e interactuar por medio de actuadores con el ambiente. Adem´as, si un grupo de veh´ıculos aut´onomos posee una red de trabajo donde tienen la capacidad de trasmitir informaci´on entre si, puede identificarse como un sistema multi-agente.

El problema de control cooperativo de veh´ıculos no tripulados que aborda este trabajo es el consenso en sistemas multi-agente. El principal objetivo del consenso es que los agentes concuerden en un valor com´un como posici´on, velocidad o postura por medio de interacciones entre si. Por lo tanto es necesario implementar esquemas de control a cada uno de los agentes, de tal modo que puedan realizar la tarea indi- vidual asignada y alcanzar el objetivo conjunto. alcanzar dicho objetivo en conjunto.

Este problema de consenso, es fundamental para la coordinaci´on distribuida en los sistemas multi-agente [10].

1.1. Antecedentes

Los sistemas no tripulados han ocupado un sitio importante en el ´ambito civil y militar, y cada d´ıa surgen m´as aplicaciones para estos dispositivos. Estos sistemas poseen ventajas en su dise˜no que permite la realizaci´on de tareas complejas sin necesidad de poner en peligro a un piloto. Hoy en d´ıa se busca que estos sistemas realicen tareas cada vez m´as complejas sin la necesidad de un operador y all´ı radica el inter´es de dise˜nar controladores eficientes. El dise˜no de controladores para que estos sistemas realicen su tarea a pesar de distintas condiciones ha impulsado a la comunidad cient´ıfica a realizar contribuciones en este campo de estudio.

Esquemas de control no lineal para seguimiento de trayectorias para el veh´ıculo terrestre de dos ruedas se presentaron en [1]-[2]. De igual manera en [3] se introdujo un controlador para seguimiento de trayectorias con entradas saturadas. En [4], los autores presentaron un controlador dise˜nado con base la teor´ıa de Lyapunov para estabilizaci´on y seguimiento de trayectorias.

Controladores LQR y PID lineal para un quadrotor, el cual realiza la tarea de regulaci´on, son presentados y validados experimentalmente en [6]. Un control backs- tepping fue mostrado en [5] para seguimiento de trayectorias evaluado en simulaci´on num´erica su desempe˜no. Los autores en [7] desarrollaron un control adaptable pro- bado con resultados en simulaciones num´ericas y en experimentos. El controlador tipo PID no lineal para seguimiento de trayectorias fue presentado en [8] obteniendo

(18)

mejores resultados en la comparaci´on experimental con un controlador por modos deslizantes.

Por otro lado, el trabajo presentado por Dong et. al. [11]-[12] se propusieron con- diciones necesarias y suficientes para que los sistemas multi-agente con topolog´ıas de interacci´on cambiantes alcancen formaciones variantes en el tiempo. Esta meto- dolog´ıa se basa en la soluci´on de la ecuaci´on algebraica de Riccati para determinar las matrices de ganancias del control de formaci´on y en la teor´ıa de estabilidad de Lyapunov para validar te´oricamente dicha ley de control.

En [13] presentaron los resultados experimentales del seguimiento de una trayec- toria circular de un quadrotor alrededor de un veh´ıculo terrestre el cual sigue una trayectoria lineal. Para ello se propuso un controlador por modos deslizantes para mitigar las perturbaciones ambientales en el quadrotor. En [14], los autores desarro- llaron un algoritmo para un sistema constituido por un equipo de robots con ruedas que permite la cobertura de un ´area predefinida. En [15] se introdujo las extensiones de un algoritmo de consenso para sistemas de segundo orden.

La implementaci´on del control de 2 manipuladores a´ereos cooperativos, para llevar un objeto desconocido en conjunto (transportaci´on cooperativa a´erea segura), cada uno con un brazo rob´otico de 2 grados de libertad se present´o en [16]. El algoritmo de estimaci´on param´etrica en l´ınea fue dise˜nado para estimar con ayuda de senso- res multi-eje fuerza-(momento), los par´ametros f´ısicos desconocidos de la carga en com´un, tales como masa y momento de inercia. Bas´andose en un control por mo- dos deslizantes adaptativo, es generada la trayectoria deseada de cada manipulador a´ereo para seguimiento de las referencias del correspondiente efector final.

El consenso robusto de m´ultiples quadrotores para formaci´on de vuelo como una soluci´on para el problema de sistemas multi-agentes se present´o en [17]. Se propuso un algoritmo de control super twisting para las din´amicas traslacional y rotacional de cada agente tal que este algoritmo de control lo conduzca a la superficie deslizante para navegaci´on de cada agente.

En [18] se present´o un novedoso control por modos deslizantes integral para segui- miento de trayectoria de un quadrotor aplicado para resolver el problema de consenso de un sistema multi-agente heterog´eneo el cual est´a constituido por el quadrotor y tres veh´ıculos terrestres de dos ruedas. Los autores en [19] muestran un algoritmo de control para veh´ıculos terrestres de dos ruedas denominado rotar y avanzar basado en el control ´optimo LQR, como soluci´on del problema de consenso para un sistema multi-agente constituido por cinco de estos veh´ıculos, sincroniz´andose no uniforme- mente en el tiempo. En [20] fue investigado el problema de consenso para sistemas multi-agente heterog´eneo con topolog´ıas de interacci´on cambiantes, implementando un control ´optimo LQR para regulaci´on de un quadrotor y un algoritmo de control

(19)

para rotar y avanzar basado en LQR para tres veh´ıculos terrestres de dos ruedas.

1.2. Objetivos

1.2.1. Objetivo general

Estudiar y validar te´orica y experimentalmente esquemas de control que garanti- cen estabilidad a un conjunto de veh´ıculos aut´onomos al realizar tareas coordinadas.

1.2.2. Objetivos espec´ıficos

Revisar el estado del arte en control coordinado de veh´ıculos aut´onomos.

Estudiar el modelo cinem´atico del robot m´ovil con dos ruedas.

Estudiar estrategias de control coordinado de veh´ıculos aut´onomos.

Familiarizarse con las plataformas experimentales.

Realizar simulaciones num´ericas de los controles estudiados.

Realizar experimentos de tiempo real y evaluar los resultados.

1.3. Motivaci´ on

Los veh´ıculos no tripulados como el quadrotor, y los m´oviles terrestres cada vez son utilizados con mayor frecuencia en tareas espec´ıficas como lo son:

Vigilancia y reconocimiento.

Rescate y protecci´on civil.

Trasporte.

Uno de los objetivos principales que se busca en estos dispositivos es que realicen cada una de sus tareas de forma aut´onoma, efectiva, y con la menor participaci´on de un piloto. El uso de un grupo de estos veh´ıculos trabajando en conjunto incrementa sus capacidades y su funcionalidad, permitiendo as´ı, realizar tareas complejas m´as all´a de la capacidad de un veh´ıculo individual. Para lograr este objetivo es necesario implementar controladores que permitan realizar las tareas asignadas tanto indi- vidual como en un grupo coordinado de veh´ıculos. Adicionalmente, la naturaleza sub-actuada y la din´amica no lineal altamente acoplada complican el dise˜no de di- chos controladores por lo que a´un resulta un reto importante desarrollar estrategias altamente eficientes tanto para los veh´ıculos individualmente como para el conjunto.

(20)

1.4. Planteamiento del problema

Considerando un conjunto de veh´ıculos aut´onomos con distintas caracter´ısticas cinem´aticas y din´amicas, se establece la tarea de que todos ellos alcancen una misma posici´on en el plano horizontal. A esta problem´atica se le conoce como tarea de consenso de posici´on de un sistema multi-agente heterog´eneo. Para resolver esta asignaci´on existen distintas t´ecnicas que permiten dise˜nar esquemas de control que analizan el sistema como uno solo, o algunos otros que lo hacen por separado. En este

´

ultimo enfoque es en el que se centra este trabajo en el cual se toma como hip´otesis que es posible asegurar que el consenso de posici´on se cumple cuando los algoritmos de control dise˜nados para cada uno de los agentes garantizan estabilidad asint´otica al realizar la tarea de regulaci´on de posici´on, y que el grafo de interacci´on asociado al sistema tiene un ´arbol de expansi´on dirigido para cada instante de tiempo.

1.5. Metodolog´ıa

Las actividades en el presente trabajo se distribuyeron y estructuraron de tal ma- nera que cada una contribuyera a cumplir cada uno de los objetivos espec´ıficos, y as´ı llevar a la investigaci´on al cumplimiento del objetivo general. Como primera acti- vidad, se estudi´o tanto el modelo din´amico del quadrotor, como el modelo cinem´atico del robot m´ovil con dos ruedas. Posteriormente, se utilizaron las representaciones matem´aticas del robot m´ovil con dos ruedas y el quadrotor, para realizar simulacio- nes num´ericas donde se implementaron controladores lineales y no lineales. Despu´es, se estudiaron distintos tipos de controladores para realizar la tarea de consenso de un sistema multi-agente. A continuaci´on, por medio de las plataformas, Qball 2 y Qbot se evaluaron experimentalmente los controladores estudiados. M´as adelante, se realizaron simulaciones num´ericas de la tarea de consenso utilizando los esque- mas de control estudiados. Finalmente, de forma experimental se implementaron los controladores en la tarea de consenso del sistema multi-agente constituido por el veh´ıculo terrestre de dos ruedas y el quadrotor y se evaluaron los resultados. De esta manera se cumpli´o el objetivo general.

1.6. Estructura de la tesis

Este documento se encuentra estructurado como sigue: El cap´ıtulo 2 describe el modelo cinem´atico del veh´ıculo terrestre de dos ruedas, y dos esquemas de control tomados de la literatura que resuelven el problema de regulaci´on de posici´on. El pri- mero de ellos es conocido como control de rotar y avanzar mientras que el segundo es un controlador no lineal propuesto por Dixon, Dawson, Zergeroglu y Behal. Los

(21)

controles antes mencionados son analizados y su desempe˜no es comparado tanto en simulaci´on como experimentalmente. El modelo din´amico del quadrotor, y las leyes de control ´optimo LQR y control no lineal con compensaci´on del modelo se abordan en el cap´ıtulo 3. Del mismo modo se presentan los resultados de simulaci´on num´erica e implementaci´on experimental. El cap´ıtulo 4 presenta conceptos b´asicos relaciona- dos con la teor´ıa de grafos que son necesarios para abordar el problema de consenso de sistemas multi-agentes. Un protocolo de consenso es propuesto empleando contro- ladores que garantizan estabilidad asint´otica y la eficiencia del m´etodo desarrollado es validado tanto te´orica como experimentalmente. Finalmente, en el cap´ıtulo 5 se exponen las conclusiones obtenidas de este trabajo de tesis.

(22)

Cap´ıtulo 2

Veh´ıculo terrestre de dos ruedas

Uno de los agentes que conforman el sistema estudiado en este trabajo de tesis es el veh´ıculo terrestre de dos ruedas. Este veh´ıculo consta de tres ruedas, dos de ellas acopladas a un actuador independiente y una tercera que se mueve libremente y sirve como soporte. El desplazamiento en el plano horizontal xy se produce haciendo girar las dos ruedas actuadas a distintas velocidades. En este cap´ıtulo se estudia el comportamiento del veh´ıculo terrestre de dos ruedas aplicando dos controladores que resuelven el problema de regulaci´on de posici´on, los cuales fueron dise˜nados considerando el modelo cinem´atico de dicho veh´ıculo. Esto con el objetivo de que posteriormente los esquemas de control sean aplicados en la soluci´on del problema de consenso.

2.1. Modelo cinem´ atico

El modelo cinem´atico del veh´ıculo terrestre de dos ruedas, en el cual la posici´on del centro de rotaci´on del veh´ıculo y el origen del marco de referencia del cuerpo coinciden [1]-[4], est´a dado por

˙q = S(q)v, (2.1)

donde q(t), ˙q(t) ∈ R3 se definen como

q =x y θT , (2.2)

˙q =  ˙x ˙y ˙θT , (2.3)

adem´as, x(t) y y(t) denotan la posici´on del centro de masa del veh´ıculo en el marco de referencia inercial y θ(t) representa la orientaci´on del veh´ıculo. En la figura 2.1 se muestran la vista superior del veh´ıculo terrestre junto con las variables que determi- nan su pose. Adicionalmente, ˙x(t) y ˙y(t) expresan las componentes cartesianas de la

(23)

velocidad lineal denotada por V (t) ∈ R, ˙θ(t) representa la velocidad angular tam- bi´en denotada por W (t). Finalmente, S(q) ∈ R3×2 es la matriz de transformaci´on definida como

S(q) =

cos(θ) 0 sen(θ) 0

0 1

, (2.4)

y v ∈ R2es el vector de entradas constituido por la velocidad lineal y angular v = V WT

. (2.5)

Figura 2.1: Vista superior del veh´ıculo terrestre de dos ruedas en la que se incluye los marcos de referencia inercial y del cuerpo y las variables que definen su pose.

2.2. Controladores para el veh´ıculo terrestre de dos ruedas

En esta secci´on se presentan dos esquemas de control para el veh´ıculo terrestre de dos ruedas los cuales permiten alcanzar posiciones deseadas en el plano horizontal.

El primero de ellos es un controlador de rotar y avanzar basado en la teor´ıa de control ´optimo LQR propuesto en [20] y el segundo es un control de regulaci´on de posici´on y orientaci´on introducido en [2].

2.2.1. Control rotar y avanzar basado en LQR

El regulador cuadr´atico lineal (LQR por sus siglas en ingl´es) es un m´etodo bien conocido que proporciona ganancias ´optimas al controlador por realimentaci´on de

(24)

estados. Considerando el sistema lineal invariante en el tiempo dado por la ecuaci´on

x = Ax + Bu,˙ (2.6)

donde las matrices A ∈ Rn×n y B ∈ Rn×m son constantes, el control LQR permite obtener las ganancias del control por realimentaci´on de estados denotado por

u(t) = −Kx(t), (2.7)

tal que minimizan la funci´on de costo dada por J =

Z 0

(xTQx + uTRu) dt, (2.8)

donde las matrices Q ∈ Rn×n y R ∈ Rm×m son no negativa y definida positiva, respectivamente. Note que el segundo t´ermino de (2.8) considera el costo de energ´ıa de las se˜nales de control.

Asumiendo que el sistema es completamente controlable, el ´ındice de desempe˜no se minimiza cuando

K = R−1BTP. (2.9)

siendo la matriz P ∈ Rn×n la soluci´on de

ATP + AP − P BR−1BTP + Q = 0. (2.10) La ecuaci´on (2.10) se denomina com´unmente ecuaci´on matricial de Riccati. Basado en la teor´ıa anterior, en [20] se propuso un controlador de posici´on para veh´ıculos terrestres de dos ruedas bajo la suposici´on de que el movimiento del veh´ıculo a lo largo de los ejes x , y es independiente. De este modo, la din´amica desacoplada del veh´ıculo est´a dada por

˙

x1(t) = A1x1(t) + B1ux(t), (2.11) y˙1(t) = A1y1(t) + B1uy(t), (2.12) donde x1(t) = [x(t) vx(t)]T y y1(t) = [y(t) vy(t)]T, son los estados del sistema, x(t) y y(t) representan la posici´on del veh´ıculo en el plano, vx(t) y vy(t) son las velocidades lineales a lo largo del eje x y y, respectivamente, ux(t) y uy(t) ∈ R, son las entradas de control y las matrices A1 y B1 est´an dadas por

A1 =0 1 0 0



, B1 =0 1



. (2.13)

(25)

Considerando este modelo din´amico es posible desarrollar un esquema de regula- ci´on de posici´on del robot m´ovil en el plano xy basado en t´ecnicas de control ´optimo LQR. Para ello se definen los vectores de error como

1 = x1d− x1, (2.14)

1 = y1d− y1, (2.15)

donde x1d = [xd vxd]T y y1d = [xd vyd]T son vectores de los estados deseados. Note que como el objetivo de control es regulaci´on de posici´on, las velocidades lineales vx

y vy son nulas. Por lo tanto, las din´amicas del error de posici´on quedan expresadas como

˙˜x1(t) = Ae11(t) + Be1ux(t), (2.16)

˙˜y1(t) = Ae11(t) + Be1uy(t) (2.17) donde

Ae1 =0 1 0 0



, Be1 = 0

−1



. (2.18)

De este modo, se establece la ley de control ux(t) y uy(t) como

ux(t) = −K1x1(t), (2.19) uy(t) = −K1y1(t), (2.20) donde las ganancias de realimentaci´on K1x, K1y ∈ R1×2 son matrices constantes calculadas de la siguiente manera

K1x= K1y= R−11 Be1TP1, (2.21) obteniendo P de la soluci´on de la ecuaci´on de Riccati dada en (2.10).

Establecidas las entradas de control para las din´amicas de posici´on es necesario definir como son empleadas en el esquema de control rotar y avanzar. De inicio hay que hacer notar que el algoritmo de control incluye un conjunto de pasos que se realizan de manera secuencial en un intervalo de tiempo [tk, tk+ ∆t), donde tk≥ 0 y

∆t > 0 define la duraci´on. Una vez establecido el valor de ∆t se procede a obtener la direcci´on de giro del veh´ıculo que har´a que el marco de referencia del cuerpo apunte hacia la posici´on objetivo, posteriormente se comanda una velocidad angular Wc constante hasta que el ´angulo formado entre el vector generado con la posici´on del robot y el punto objetivo y el eje x del marco de referencia en el cuerpo sea menor que un valor . Observe que el robot m´ovil de dos ruedas no posee entradas de control de fuerza o torque por lo que no es posible aplicar directamente los controles presentados

(26)

en (2.19)-(2.20), por lo tanto se integran dichas se˜nales de entrada obteniendo vx(t) y vy(t) para despu´es calcular la velocidad lineal que se aplica al robot usando la siguiente ecuaci´on

V = q

v2x(t) + v2y(t). (2.22)

Algoritmo 1 Algoritmo de rotar y avanzar Entrada: x1d(tk), y1d(tk), x1(tk), y1(tk), θ(tk).

Salida: V (t), W (t).

1: si t = tk entonces

2: θT = atan2(y1d(tk) − y1(tk), x1d(tk) − x1(tk));

3: si (x1d(tk),y1d(tk)) est´a en el quadrante I, entonces

4: Rd= 1, Md = 1, θd= θT;

5: si no, si (x1d(tk),y1d(tk)) est´a en el quadrante II, entonces

6: Rd= −1, Md = −1, θd= θT − π;

7: si no, si (x1d(tk),y1d(tk)) est´a en el quadrante III, entonces

8: Rd= 1, Md = −1, θd= θT;

9: si no, si (x1d(tk),y1d(tk)) est´a en el quadrante IV, entonces

10: Rd= −1, Md = 1, θd= θT + π;

11: fin si

12: fin si

13: mientras tk≤ t ≤ tk+ ∆t hacer

14: si |θd(tk) − θ(t)| >  entonces

15: W (t) = RdWc;

16: si no

17: V (t) =q

v2x(t) + v2y(t);

18: V (t) = MdV (t);

19: fin si

20: fin mientras

Finalmente, al alcanzar el instante de tiempo t = tk + ∆t se asigna el tiempo actual a tk y se repite el proceso. En el algoritmo 1 se presenta este metodolog´ıa de manera detallada. En el resto de este documento este controlador ser´a identificado como CVTR1, acr´onimo de Control del Veh´ıculo Terrestre con Ruedas 1.

2.2.2. Control de Dixon, Dawson, Zergeroglu y Behal

El segundo esquema de control para el veh´ıculo terrestre de dos ruedas que se estudi´o en este trabajo de tesis fue el propuesto por Dixon y otros en [2]. El objetivo de control consiste en obtener las entradas de velocidad lineal V (t) y angular W (t)

(27)

tales que los errores de posici´on ˜x(t), ˜y(t), y de orientaci´on ˜θ(t) definidos como

˜

x = xd− x (2.23)

˜

y = yd− y (2.24)

θ˜ = θd− θ (2.25)

tiendan a cero cuando el tiempo tiende a infinito.

El dise˜no del controlador se realiza sobre el error expresado en el marco de refe- rencia del veh´ıculo el cual se obtiene al aplicar la siguiente transformaci´on lineal

 e1 e2 e3

=

cos(θ) sen(θ) 0

− sen(θ) cos(θ) 0

0 0 1

˜ x

˜ y θ˜

. (2.26)

De este modo, la din´amica del error expresado en el marco de referencia del cuerpo se obtiene calculando la derivada de (2.26) y usando el modelo cinem´atico en (2.1).

As´ı, la din´amica del error en lazo abierto se expresa como

˙e1

˙e2

˙e3

=

−V + W e2

−W e1

−W

. (2.27)

Para esta din´amica los autores propusieron la siguiente ley de control

 V W



=

 k1e1 k2e3+ e22sen(t)



, (2.28)

donde k1, k2 ∈ R son ganancias constantes positivas. Sustituyendo (2.28) en (2.27) se obtiene la din´amica del error en lazo cerrado dada por

˙e1

˙e2

˙e3

=

−k1e1+ W e2

−W e1

−k2e3+ e22sen(t)

. (2.29)

La prueba de estabilidad presentada por los autores garantiza que el vector de erro- res expresados en el marco de referencia del veh´ıculo converge a cero de manera asint´otica globalmente, y como consecuencia tambi´en lo hacen los errores de pose

˜

x(t), ˜y(t) y ˜θ(t). En el resto de este documento este controlador ser´a denotado como CVTR2.

(28)

2.3. Resultados de control para regulaci´ on

2.3.1. Resultados de simulaci´ on num´ erica

Con el objetivo de estudiar y validar los esquemas CVTR1 y CVTR2 se realizaron simulaciones num´ericas. Para tal estudio se emple´o el modelo cinem´atico presentado en (2.1) y se program´o el algoritmo de control en Matlab-Simulink.

El tiempo que determina el intervalo de actualizaci´on ∆t se defini´o en 5 [s], y las matrices de pesos del control CVTR1 se establecieron en Q = diag{1, 0} y R = 1, para ambas din´amicas de posici´on. As´ı, las ganancias obtenidas para K1x y K1y fueron

K1x= K1y = −1 −1.4142  . (2.30) Por otra parte, las ganancias del controlador CVTR2 se eligieron como sigue:

k1 = 2.2, k2 = 1. (2.31)

La orientaci´on deseada θd para el controlador CVTR2 es calculada mediante los pasos 1-15 del algoritmo 1.

La duraci´on de la simulaci´on fue de 30 segundos y las condiciones iniciales de posici´on y velocidad del veh´ıculo se definieron en x(0) = 0 [m], y(0) = 0 [m] y θ(0) = 0 [rad]. Finalmente, los valores deseados de posici´on se eligieron como

xd(t) = 0.75 [m], yd(t) = 0.75 [m]. (2.32) Los resultados obtenidos se muestran en las figuras 2.2-2.4. En el lado derecho de la figura 2.2 se presenta las gr´aficas con las trayectorias descritas por el veh´ıculo terrestre de dos ruedas en x(t) y y(t) as´ı como el valor de referencia y de lado iz- quierdo se presenta las gr´aficas del error de posici´on ˜x(t) y ˜y(t) obtenidas durante la simulaci´on aplicando ambos controladores. Se presentan las se˜nales de orienta- ci´on θ(t) y error de orientaci´on ˜θ(t) obtenidos en la figura 2.3. Note que en ambos controladores el valor deseado de orientaci´on se genera en tiempo de ejecuci´on de- pendiendo de la posici´on inicial del veh´ıculo y la referencia deseada. Por otra parte, las se˜nales de velocidad lineal V (t) y angular W (t) aplicadas con los controladores CVTR1 y CVTR2 se muestran en la figura 2.4. En estos resultados se puede ob- servar como el veh´ıculo alcanza la posici´on deseada empleando un s´olo intervalo de actualizaci´on con el control CVTR1, esto debido a que la simulaci´on no considera los efectos din´amicos del sistema incluidos la inercia, de modo que el veh´ıculo se detiene instant´aneamente al dejar de aplicar la entrada de velocidad angular. Esto permite que que el valor de velocidad angula W se pueda seleccionar tan grande como se desee mientras que el valor del par´ametro  se puede seleccionar tan peque˜no como

(29)

se quiera. En particular para esta simulaci´on se seleccion´o W = 0.5 y  = 0.005 [rad].

Por otra parte, se observa que al emplear el control CVTR2 la orientaci´on converge al valor deseado mientras la posici´on se mantiene cercana al valor de referencia con errores menores a 0.1 [m] despu´es de 25 [s] de simulaci´on.

0 10 20 30

0 0.5 1 1.5

(a)

Tiempo [s]

x(t)[m]

0 10 20 30

−0.5 0 0.5

(b)

t [s]

˜x(t)[m]

0 10 20 30

0 0.5 1 1.5

(c)

t [s]

y(t)[m]

0 10 20 30

−0.5 0 0.5

(d)

t [s]

˜y(t)[m]

CVTR1 CVTR2

xd CVTR1

CVTR2

CVTR1 CVTR2 yd

CVTR1 CVTR2

Figura 2.2: Resultados de simulaci´on: Evoluci´on temporal de la posici´on x(t) y y(t) y el error de posici´on ˜x(t) y ˜y(t) empleando los controladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) en la tarea de regulaci´on.

2.3.2. Resultados experimentales

Con el fin de comparar el desempe˜no de los dos esquemas de control estudiados se realizaron experimentos en tiempo real con la plataforma Qbot de Quanser, el cual se integr´o con el sistema de visi´on Optitrack para realizar la realimentaci´on visual de la posici´on en el espacio tridimensional.

El veh´ıculo Qbot de Quanser es un sistema rob´otico aut´onomo terrestre. Este dis- positivo est´a constituido de una plataforma Yujn Robot Kobuki, una c´amara Kinect RGB de Microsoft y un sensor de profundidad. El sistema inform´atico integrado en el veh´ıculo usa una computadora Gumstix DuoVero para ejecutar el software de con- trol en tiempo real. La programaci´on de las estrategias de control en esta plataforma se realiza en Matlab-Simulink, en la computadora de mando, y posteriormente con las bibliotecas QUARC de Quanser, estos modelos son compilados y descargados en la computadora embebida Gumstix del veh´ıculo. Por otra parte, el sistema de

(30)

0 10 20 30

−1

−0.5 0 0.5 1

(a)

t [s]

θ(t)[rad]

0 10 20 30

−1 0 1

(b)

t [s]

˜ θ(

t)[rad]

0 10 20 30

−2

−1 0 1 2

(c)

t [s]

θ(t)[m]

0 10 20 30

−2

−1 0 1 2

(d)

t [s]

˜ θ(t)[rad]

CVTR1

θd CVTR1

CVTR2

θd CVTR2

Figura 2.3: Resultados de simulaci´on: Evoluci´on temporal de la orientaci´on θ(t) y error de orientaci´on ˜θ(t) empleando los controladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) en la tarea de regulaci´on.

0 10 20 30

−1 0 1

(a)

t[s]

V(t)[m s]

0 10 20 30

−5 0 5

(b)

t[s]

W(t)[rad s]

CVTR1

CVTR2 CVTR1

CVTR2

Figura 2.4: Resultados de simulaci´on: Velocidad lineal V (t) y angular W (t) ob- tenidas con los controladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) durante la tarea de regulaci´on.

visi´on Optitrack permite estimar la posici´on y orientaci´on de distintos objetos en el espacio tridimensional. Este sistema consta de un arreglo de 6 c´amaras modelo

“flex 3 ” conectadas a una computadora de mando, la cual procesa las im´agenes en el software “Motive” y proporciona estimados de pose de los objetos de inter´es. Para determinar la pose de un objeto como m´ınimo deben colocarse 3 marcadores que reflejan la luz ultravioleta emitida por las c´amaras. Finalmente, la interacci´on entre

(31)

la computadora y el robot se realiza a trav´es de una comunicaci´on inal´ambrica v´ıa ethernet. En la figura 2.5 se muestra un diagrama del sistema de prueba.

Figura 2.5: Configuraci´on del sistema experimental para el control del veh´ıculo te- rrestre de dos ruedas.

La tarea establecida para el veh´ıculo terrestre consisti´o en ir de un punto inicial a una posici´on final para lo cual se defini´o el tiempo del experimento en 30 segundos.

Note que el control rotar y avanzar (CVTR1) requiere actualizar el ´angulo deseado θden cada intervalo de tiempo definido por ∆t, por lo tanto para la implementaci´on se uso un valor 5 segundos para este par´ametro. De manera similar, el controlador de Dixon y otros (CVTR2) tambi´en se implement´o actualizando el valor deseado del

´

angulo de la misma manera que en el algoritmo 1 de rotar y avanzar lo hace y con la misma frecuencia.

Las ganancias del controlador rotar y avanzar se establecieron con los valores usados en la simulaci´on mientras que en el caso del control de Dixon y otros se obtu- vieron a partir de un proceso de prueba y error dando como resultado los siguientes valores

k1 = 4.5, k2 = 2.5. (2.33)

Los resultados obtenidos se muestran en las gr´aficas de las figuras 2.6- 2.8. En la figuras 2.6 se presenta la evoluci´on temporal de la pose del robot m´ovil as´ı como el valor de referencia establecido. De igual forma se presentan las se˜nales de error

(32)

obtenidas con ambos controladores. El comportamiento de la orientaci´on del veh´ıculo terrestre se muestra en la figura 2.7. Adicionalmente, en la figura 2.8 se proporcionan las entradas de control entregadas por los controles. Como se puede observar, el control CVTR2 proporciona un mejor desempe˜no en la tarea asignada, esto debido a que el control de CVTR1 emplea una estrategia precaria para regular la orientaci´on.

0 10 20 30

0 0.5 1 1.5

(a)

Tiempo [s]

x(t)[m]

0 10 20 30

−0.5 0 0.5

(b)

t [s]

˜x(t)[m]

0 10 20 30

0 0.5 1 1.5

(c)

t [s]

y(t)[m]

0 10 20 30

−0.5 0 0.5

(d)

t [s]

˜y(t)[m]

CVTR1 CVTR2 xd

CVTR1 CVTR2

CVTR1 CVTR2 yd

CVTR1 CVTR2

Figura 2.6: Resultados de experimento en tiempo real: Evoluci´on temporal de la posici´on x(t) y y(t) y el error de posici´on ˜x(t) y ˜y(t) empleando los controladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) en la tarea de regulaci´on.

Por ´ultimo, con el objetivo de obtener una m´etrica cuantitativa del desempe˜no de los controladores se calcularon valores RMS (Root Mean Square, por sus siglas en ingl´es) de las se˜nales del error de posici´on ˜x(t) y ˜y(t) que resultaron de los experimentos en el intervalo de tiempo dado por 20 [s] ≤ t ≤ 30[s]. En la tabla 2.1 se puede observar que el controlador CVTR2 presenta los mejores resultados en cuanto a la disminuci´on del error, ya que muestra los valores m´as peque˜nos, los cuales han sido resaltados en negritas.

(33)

0 10 20 30 0

0.5 1 1.5 2

(a)

t [s]

θ(t)[rad]

0 10 20 30

−1

−0.5 0 0.5 1

(b)

t [s]

˜ θ(t)[rad]

0 10 20 30

−2 0 2

(c)

t [s]

θ(t)[m]

0 10 20 30

−2

−1 0 1 2

(d)

t [s]

˜ θ(t)[rad]

CVTR1

θd CVTR1

CVTR2

θd CVTR2

Figura 2.7: Resultados de experimento en tiempo real: Evoluci´on temporal de la orientaci´on θ(t) y error de orientaci´on ˜θ(t) empleando los controladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) en la tarea de regulaci´on.

0 10 20 30

−0.5 0 0.5

(a)

t[s]

V(t)[m s]

0 10 20 30

−5 0 5

(b)

t[s]

W(t)[rad s]

CVTR1 CVTR2 CVTR1 CVTR2

Figura 2.8: Resultados de experimento en tiempo real: Velocidad lineal V (t) y angular W (t) obtenidas con los controladores CVTR1 (l´ınea roja) y CVTR2 (l´ınea azul) durante la tarea de regulaci´on.

CVTR1 CVTR2

˜

x 0.0118 0.0087

˜

y 0.0314 0.0138

Tabla 2.1: Valores RMS de los errores de postura del Qbot en el experimento de regulaci´on para la comparaci´on de los controladores CVTR1 y CVTR2. Estos valores fueron calculados para 20 [s] ≤ t ≤ 30 [s].

(34)

Cap´ıtulo 3 Quadrotor

El segundo tipo de veh´ıculo aut´onomo que se ha considerado en este trabajo pa- ra formar parte del sistema multi-agente heterog´eneo es el quadrotor. ´El quadrotor es un dispositivo el cual por medio cuatro rotores puede moverse en el espacio tri- dimensional. Este es un sistema sub-actuado, posee ´unicamente cuatro actuadores para controlar seis grados de libertad, lo cual agrega complejidad el dise˜nar leyes de control eficientes que permitan realizar tareas de regulaci´on as´ı como de segui- miento de trayectoria. En este cap´ıtulo se estudia el desempe˜no de dos estrategias de control aplicadas al quadrotor, las cuales garantizan el cumplimiento de la tarea de regulaci´on de posici´on. Adem´as, uno de los esquemas es una propuesta original que garantiza seguimiento de trayectorias.

3.1. Modelo din´ amico

El modelo din´amico del quadrotor que se presenta en este trabajo se obtiene consi- derado la aeronave como un cuerpo r´ıgido que se mueve en un espacio tridimensional, [7]-[8], [22]-[24]. Este volumen se somete una fuerza de empuje generada por los roto- res dando lugar al desplazamiento del quadrotor en el espacio, as´ı como tambi´en los momentos de fuerza que producen los movimientos de cabeceo, balanceo y gui˜nada.

La figura 3.1 muestra la representaci´on de los marcos de referencia y los movimientos que puede realizar el quadrotor. Las ecuaciones de movimiento que representan la din´amica del quadrotor est´an dadas por

m¨p + mgez = R(η)ezuT, (3.1) H(η)¨η + C(η, ˙η) ˙η = W (η)Tτ , (3.2) donde

(35)

Figura 3.1: Representaci´on del quadrotor incluyendo el marco de referencia inercial I y el marco de referencia del cuerpo del veh´ıculo B.

p = [x y z]T es el vector de posici´on del centro de masa del veh´ıculo respecto al marco de referencia inercial.

η = [φ θ ψ]T es la representaci´on de los ´angulos de Euler definidos por el balanceo φ, que es el giro sobre el eje x, cabeceo θ que el giro sobre el eje y, y finalmente la gui˜nada ψ que es el giro realizado sobre el eje z.

H(η) = W (η)−TIoW (η)−1, es la matriz de inercia rotacional,

C(η, ˙η) = W (η)−T[S(W )Io−IoW (η)−1W (η)]W (η)˙ −1, es la matriz de Coriolis la cual contiene los elementos centr´ıfugos y girosc´opicos del sistema.

m es la masa del quadrotor, g es la constante gravitacional.

ez es el vector unitario que apunta en direcci´on del eje z, en el marco de referencia inercial.

uT es el empuje total generado por los rotores.

τ = [τφ τθ τψ]T es el vector de momentos de gui˜nada, balanceo y cabeceo expresado en el marco de referencia del cuerpo.

R(η) es una matriz de rotaci´on que relaciona el marco de referencia inercial con el cuerpo y que est´a dada por

R(η) =

CθSψ SθCψSφ− SψCφ SθCψCφ+ SψSφ CθCψ SθSψSφ+ CψCφ SθSψCφ− CψSφ

−Sφ CθSφ CθCφ

.

(36)

Io representa el tensor de inercia.

W (η) es una matriz de transformaci´on que relaciona la velocidad angular con la raz´on de cambio del vector η la cual se define como

W (η) =

1 Sφtθ CφTθ

0 Cφ −Sφ

0 Sφ/Cθ Cφ/Cθ

,

donde Sx, Cx y Tx representan las funciones sen(x), cos(x) y tan(x), respecti- vamente.

Las din´amicas del quadrotor (3.1) y (3.2) satisfacen las siguientes propiedades, Propiedad 1 La La matriz H(η) es sim´etrica y positiva definida,

H(η) = HT(η),

λmax{H(η)}kxk2 > xTH(η)x > λmin{H(η)}kxk2 > 0, (3.3) para todo x, η ∈ R3, x 6= 0, donde dada una matriz M ∈ Rn×n, λmin{M } y λmax{M } representan el m´ınimo y m´aximo eigenvalor de la matriz, respectivamente.

Propiedad 2 La matriz 12H(η) − C(η, ˙˙ η) es una matriz anti-sim´etrica, es decir, xT  1

2

H(η) − C(η, ˙˙ η)



x = 0, ∀x, η, ˙η ∈ R3. (3.4)

3.2. Control LQR

En esta secci´on se presenta el controlador LQR dise˜nado para tarea de regulaci´on de posici´on de un quadrotor, el cual fue presentado en [20]. El esquema de control es representado mediante diagrama de bloques en la figura 3.2. El dise˜no de la ley de control se realiza sobre un versi´on simplificada de la din´amica del veh´ıculo presentada en (3.1)-(3.2) la cual es el resultado de considerar las siguientes suposiciones:

Los ´angulos φ, θ y ψ son peque˜nos durante el vuelo as´ı que la orientaci´on de los marcos de referencia inercial y del veh´ıculo coincide.

El quadrotor es sim´etrico en los tres ejes, por lo cual la matriz de inercia Io est´a dada por Io = diag{Ixx, Iyy, Izz}.

Las fuerzas centr´ıfugas y centr´ıpetas son peque˜nas y por lo tanto se omiten.

El empuje de cada rotor est´a representado por la din´amica de primer orden siguiente

fi = Kwv = Kw ω s + ωui,

(37)

Figura 3.2: Diagrama de bloques de la implementaci´on del controlador No lineal con compensaci´on del modelo.

donde ui es la entrada PWM del actuador, ω denota el ancho de banda del actuador y Kw es una ganancia positiva.

Adicionalmente, para el dise˜no del controlador se definen cuatro entradas de control para el sistema denotadas por uth, uφ, uθ y uψ que mantienen la siguiente relaci´on con las entradas del sistema

uT = 4Kws+ωω uth, τφ= 2Kwls+ωω uφ,

τθ = 2Kwls+ωω uθ, τψ = Knuψ, (3.5) donde Kn es una ganancia positiva y l es la distancia entre el centro de masa del veh´ıculo y el rotor.

Considerando las suposiciones antes mencionadas la din´amica del quadrotor en los ejes x y y se linealiza como sigue

2(t) = Ax2x2(t) + B2uθ(t), (3.6)

˙

y2(t) = Ay2y2(t) + B2uφ(t), (3.7) las matrices de estado Ax2, Ay2 ∈ R5×5 est´an dadas por

Ax2=

0 1 0 0 0

0 0 g 0 0

0 0 0 1 0

0 0 0 0 2KIwl

xx

0 0 0 0 −w

, Ay2=

0 1 0 0 0

0 0 −g 0 0

0 0 0 1 0

0 0 0 0 2KIwl

xx

0 0 0 0 −w

, (3.8)

la matriz de entrada B2 ∈ R5×1 se define como B2 = [0 0 0 0 w]T, y los vectores de estado x2, y2 ∈ R5 se expresan como x2(t) = [x(t) ˙x(t) θ(t) ˙θ(t) p(t)]T y y2(t) =

(38)

[y(t) ˙y(t) φ(t) ˙φ(t) q(t)]T . Note que los pares (Ax2, Bx2) y (Ay2, By2) son ambos controlables.

Por otra parte, la din´amica de altura del quadrotor afectada por el empuje total y por la gravedad est´a dada por

m¨z =

4

X

i=1

ficos(θ) cos(φ) − mg. (3.9)

Considerando (3.6) y (3.7) es posible desarrollar un esquema de regulaci´on de posici´on del quadrotor en el plano xy basado en t´ecnicas de control ´optimo LQR.

Considerando los vectores de estado deseados x2d = [xd ˙xd φd φ˙d 0]T y y2d = [ydd θd θ˙d 0]T donde las posiciones deseadas xd y yd son constantes y los ´angulos de orientaci´on φd y θd son nulos, los vectores de error de estado se definen como

˜

xx =x2d− x2, (3.10)

˜

xy =y2d− y2. (3.11)

Note que como el objetivo de control es regulaci´on de posici´on, los estados ˙x2 y ˙y2 son nulos. Por lo tanto las din´amicas del error de posici´on quedan expresadas como

˙˜x2(t) = Aex22(t) + Be2ux(t), (3.12)

˙˜y2(t) = Aey22(t) + Be2uy(t) (3.13) donde

Aex2 =

0 1 0 0 0

0 0 g 0 0

0 0 0 1 0

0 0 0 0 2KI wl

xx

0 0 0 0 w

, Aey2 =

0 1 0 0 0

0 0 −g 0 0

0 0 0 1 0

0 0 0 0 2KIwl

xx

0 0 0 0 w

. (3.14)

Be2 = [0 0 0 0 − w]T, y los vectores de estado ˜x2(t) = [˜x2(t) ˙˜x2(t) ˜θ2(t)θ˙˜2(t) − p(t)]T y ˜y2(t) = [˜y2(t) ˙˜y2(t) ˜φ2(t)φ˙˜2(t) − q(t)]T. As´ı las entradas de control en el plano xy para el sistema se establecen como

uθ(t) = −Kx22(t), (3.15)

uφ(t) = −Ky22(t), (3.16)

donde las ganancias de realimentaci´on Kx2, Ky2 ∈ R1×5 son matrices constantes calculadas como

Kx2 = R−1Be2TPx2˜ , (3.17) Ky2 = R−1Be2TPy2˜ , (3.18) (3.19)

Referencias

Documento similar

Pero cuando vio a Mar sacar el fuego de bajo su ala, voló de vuelta a su tribu a contarles lo que había visto.... Justo antes de que el sol saliera, Tatkanna se despertó y comenzó

1. LAS GARANTÍAS CONSTITUCIONALES.—2. C) La reforma constitucional de 1994. D) Las tres etapas del amparo argentino. F) Las vías previas al amparo. H) La acción es judicial en

¿Cómo se traduce la incorporación de ésta en la idea de museo?; ¿Es útil un museo si no puede concebirse como un proyecto cultural colectivo?; ¿Cómo puede ayudar el procomún

Este parón o bloqueo de las ventas españolas al resto de la Comunidad contrasta sin em- bargo con la evolución interior de ese mismo mercado en cuan- to a la demanda de hortalizas.

Porcentaje de radiación solar interceptada (RSI; 0,35 - 2,5 µm) y de radiación fotosintéticamente activa interceptada (RFAI) a lo largo del ciclo de cultivo para las

El tercero tiene notas bajas pero la mayor es estadística, una de las temáticas trabajadas de forma más mecánica, asimismo el último arquetipo muestra que, aun con notas buenas,

A medida que las organizaciones evolucionan para responder a los cambios del ambiente tanto para sobrevivir como para crecer a partir de la innovación (Stacey, 1996), los

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones