CENTRO DE INVESTIGACIÓN Y DESARROLLO DE TECNOLOGÍA DIGITAL
MAESTRÍA EN CIENCIAS CON
ESPECIALIDAD EN SISTEMAS DIGITALES
“DISEÑO DE CONTROLADORES ROBUSTOS PARA SISTEMAS MECÁNICOS SUBACTUADOS”
TESIS
QUE PARA OBTENER EL GRADO DE MAESTRO EN CIENCIAS
P R E S E N T A:
SERGIO ALBERTO PUGA GUZMÁN
BAJO LA DIRECCIÓN DE:
DR. LUIS TUPAK AGUILAR BUSTOS
AGOSTO, 2005
TIJUANA, B.C., MÉXICO
A mis ´unicos hijos que adoro: Sergio Alberto, Francisco Miguel, Grecia Karime y Javier por haberles robado un poco de su tiempo para la teminaci´on de esta tesis y tambi´en como una fuente de motivaci´on para sus estudios.
A mis padres: Francisco Javier y Graciela Esperanza por ser los mejores padres y por guiarme por el camino de la verdad y contar siempre con ellos, en los tiempos buenos y malos en la salud y la enfermedad.
A mi esposa Carmen por ser la mejor madre de mis hijos y la mujer de mis tiempos, que me apoy´o con su paciencia y comprenci´on en la terminaci´on de esta tesis.
A mis hermanos: Javier, Alma, Alba, J. Francisca por creer siempre en mi y porque despues de ellos nunca desee tener mejores hermanos.
Agradecimientos
Agradezco a las instituciones IPN y CITEDI por darme la oportunidad de cursar y terminar esta maestr´ıa, a la DGIT y al I.T.T por apoyarme plenamente desde el inicio hasta la conclusi´on de la misma, a la Comisi´on revisora de esta tesis, a los maestros miembros de la Academia de electr´onica del I.T.T a la cual pertenezco, a mis maestros Dr. Luis Gonz´alez H., Dr. Leonardo Acho Zuppa, Dr. Yuri Orlov, Dr. Konstanstin Starkov, Dr. Juan Garc´ıa, M.C. Oscar Montiel R., M.C. Julio Rol´on y sobre todo al Dr. Luis Tupak Aguilar Bustos director de esta tesis por toda su ayuda y paciencia que me brind´o hasta el t´ermino de la misma, al Director del I.T.T Ing. Rafael Quevedo Camacho y a todas las persona que de alguna manera obraron de buena voluntad en el ejercicio de sus funciones para que la realizaci´on y terminaci´on de ´esta tesis fuera posible, a todos, muchas gracias por creer en mi.
Lista de Figuras iv
Lista de Tablas vi
Lista de S´ımbolos y Acr´onimos viii
Resumen ix
Abstract x
I Introducci´on 1
I.1 Antecedentes . . . 1
I.2 Definici´on del problema . . . 3
I.3 Organizaci´on del trabajo . . . 3
II Preliminares te´oricos 5 II.1 Controladores de estructura variable . . . 5
II.1.1 Introducci´on . . . 5
II.1.2 Control tipo twisting . . . 8
II.1.3 Control homog´eneo . . . 9
II.1.4 Consideraciones de robustez usando controladores VSS . . . 10
II.2 Sistemas subactuados . . . 12
II.3 Ejemplo de sistemas subactuados . . . 14
II.3.1 Carro-p´endulo invertido . . . 14
II.3.2 P´endulo de rotaci´on . . . 15
II.3.3 P´endulo de reacci´on de disco . . . 16
II.3.4 Sistema Bola-viga . . . 17
II.3.5 Robot planar de uniones el´asticas . . . 18
II.4 Comentarios . . . 20
ii
III Control de sistemas con uniones el´asticas 21
III.1 Introducci´on . . . 21
III.2 Modelo din´amico . . . 23
III.2.1 Objetivo de control . . . 25
III.3 Estabilizaci´on de la posici´on de la carga con fricci´on . . . 25
III.4 Resultados de simulaci´on . . . 28
III.5 Resultados experimentales . . . 31
III.5.1 Descripci´on de la base experimental . . . 31
III.5.2 Resultados . . . 32
III.6 Comentarios . . . 33
IV Control de Pendubot 36 IV.1 Introducci´on . . . 36
IV.2 Modelo din´amico . . . 37
IV.2.1 Objetivo de control . . . 38
IV.3 Soluci´on al problema de estabilizaci´on . . . 38
IV.4 Simulaci´on num´erica . . . 45
IV.4.1 Controlador twisting . . . 45
IV.4.2 Controlador homog´eneo . . . 47
IV.4.3 Controlador no lineal tanh(x) . . . . 48
IV.5 Comentarios . . . 49
V Control del Acrobot 53 V.1 Introducci´on . . . 53
V.2 Modelo din´amico . . . 54
V.3 Objetivo de control . . . 55
V.4 Metodolog´ıa de control . . . 56
V.5 Swing up (ρ = 1) . . . . 57
V.6 Soluci´on al problema de estabilizaci´on (ρ = 0) . . . 61
V.7 Soluci´on al problema de seguimiento de trayectorias (ρ = 0) . . . . 63
V.8 Resultados de la simulaci´on . . . 67
V.9 Comentarios . . . 69
Conclusiones y recomendaciones 74 A Conceptos b´asicos 78 A.1 Transformaci´on de coordenadas de un sistema . . . 78
A.2 Conceptos b´asicos de estabilidad en el sentido de Lyapunov. . . 80
A.2.1 Equil´ıbrio. . . 80
A.2.2 Estabilidad. . . 81
A.2.3 Estabilidad asint´otica. . . 81
A.2.4 Estabilidad asint´otica global. . . 81
A.2.5 Funci´on definida positiva. . . 81
A.2.6 Funci´on candidata de Lyapunov. . . 82
A.2.7 Funci´on de Lyapunov. . . 82
A.2.8 Teorema de invarianza. . . 82
A.2.9 Teorema de contracci´on de mapas. . . 83
Bibliograf´ıa y referencias 84
II.1 (a) Elipse k1 =0.5 (b) Elipse k2 =1.5 (c) Convergencia asint´otica al origen. . . 6
II.2 (a) Plano de fase usando ley de control twisting (b) La se˜nal u(t). . . . 9
II.3 (a) Plano de fase usando ley de control homog´eneo (b) La se˜nal u(t). . . . 10
II.4 Carro-p´endulo invertido. . . 15
II.5 P´endulo de rotaci´on. . . 16
II.6 P´endulo de disco. . . 17
II.7 Bola sobre una viga. . . 18
II.8 Brazo manipulador de uni´on flexible. . . 19
III.1 Diagrama esquem´atico de servomecanismo con uni´on flexible. . . 23
III.2 (a) Estabilizaci´on del sistema con k = 25 (b) Estabilizaci´on del sistema con k = 100. . . . 30
III.3 Error (e1 y e2) con control (τ ) sin conmutaci´on (α2 = 0 y β2 = 0.) . . . 31
III.4 Error (e1 y e2) con perturbaci´on constante (kωk =1.3 Nm.) . . . . 32
III.5 Error (e1 y e2) con perturbaci´on constante (kωk =1.4 Nm.) . . . . 33
III.6 Base experimental de control. . . 34
III.7 Resultado experimental de estabilizaci´on de la posici´on angular de la carga y error de posici´on angular de la carga. . . 35
III.8 Entrada de control. . . 35
IV.1 Diagrama esquem´atico del Pendubot. . . 37
IV.2 Estabilizaci´on del eslab´on 1 usando control twisting. . . 46
IV.3 Estabilizaci´on del eslab´on 2 usando control twisting. . . 47
IV.4 Entrada de control τ usando control twisting. . . . 48
IV.5 Estabilizaci´on del eslab´on 1 usando control homog´eneo. . . 49
IV.6 Estabilizaci´on del eslab´on 2 usando control homog´eneo. . . 50
IV.7 Entrada de control τ usando control homog´eneo. . . . 50
IV.8 Estabilizaci´on del eslab´on 1 usando control tanh(x). . . . 51
IV.9 Estabilizaci´on del eslab´on 2 usando control tanh(x). . . . 51 v
IV.10 Entrada de control τ usando control tanh(x). . . . 52
V.1 Diagrama esquem´atico del Acrobot. . . 56
V.2 Trayectoria de q1 y q2 sujeto a la ley de control τ . . . 68
V.3 Estabilizaci´on del eslab´on 1 usando t´ecnica Swing up. . . 69
V.4 Estabilizaci´on del eslab´on 2 usando t´ecnica Swing up. . . 70
V.5 Entrada de control τ usando t´ecnica Swing up. . . . 71
V.6 Error de posici´on e1(eslab´on 1) y e2(eslab´on 2). . . 71
V.7 Seguimiento de trayectoria de q1 centrado en π y error de posici´on e1. . . 72
V.8 Seguimiento de trayectoria de q2 centrado en π y error de posici´on e2. . . 72
V.9 Entrada de control τ para seguimiento de trayectoria centrada en π. . . . 73
III.1 Par´ametros del sistema uni´on el´astica. . . 29 IV.1 Par´ametros del sistema Pendubot. . . 46 V.1 Par´ametros del sistema Acrobot. . . 57
vii
λmin: Valor propio m´ınimo.
λmax: Valor propio m´aximo.
| · |: Valor absoluto.
k · k1: Norma uno.
k · k: Norma Euclidiana.
∈: Pertenece.
∃: Existe.
∀: Para todo.
⇒: Implica.
→: Se aproxima a.
∞: Infinito.
⊂: Subconjunto.
i.e: Esto es.
e.g: Por ejemplo.
PI: Proporcional integral.
PD: Proporcional derivativo.
PID: Proporcional integral derivativo.
CD: Corriente directa.
viii
Resumen
En la presente tesis se dise˜nan controladores robustos para sistemas mec´anicos subactuados.
Los sistemas mec´anicos subactuados presentan un reto en ingenier´ıa porque tienen menos actu- adores que grados de libertad. Esta caracter´ıstica no permite que controladores dise˜nados para mecanismos completamente actuados funcionen adecuadamente. Sin embargo hay un gran in- ter´es en el estudio del control de estos mecanismos por la gran cantidad de aplicaciones que existen: robots b´ıpedos, mecanismos subacuaticos, cohetes, plataformas marinas, barcos, es- tabilidad de edificios, entre otros. Los problemas a resolver son regulaci´on y seguimiento de trayectorias de una clase de sistemas subactuados sujetos a perturbaciones. En ´esta tesis se usar´an controladores de estructura variable de segundo orden para controlar los mecanismos de uniones el´asticas, Pendubot y Acrobot. Para el an´alisis de estabilidad se usa la teor´ıa de Lyapunov. Se complementa el estudio con simulaciones num´ericas y algunos experimentos.
Abstract
The purpose of the present thesis is to design robust controllers for underactuated mechanical systems. These systems represent a challenge in control theory because they can not be sta- bilized under control design strategies for fully-actuated systems. Motivation of the study of underactuated systems are the great collection of these mechanisms such as walking robots, underwater mechanisms, rockets, marine platforms, boats, buildings stability, among others.
The aim of this thesis is to extend the arsenal of variable structure controllers to solve the reg- ulation and tracking control problems of some classes of perturbed underactuated mechanical systems. The developed controllers are applied to stabilize elastic joints mechanisms, Pendubot and Acrobot. Stability analysis was performed within the framework of Lyapunov functions.
Numerical simulations and some experiments complement this study.
Introducci´on
I.1 Antecedentes
El desarrollo de sistemas de control para sistemas mec´anicos asi como otros sistemas, siem- pre ha sido un reto para los investigadores. En el transcurso de los a˜nos el hombre ha creado sistemas m´as sofisticados con el fin de cubrir sus necesidades, por ejemplo: La producci´on de un tel´efono celular donde se usan microcomponentes para disminuir peso y tama˜no del mismo, la perforaci´on de posos petroleros a profundidades de cientos de metros bajo la superficie del mar, la alimentaci´on de combustible de un avi´on en pleno vuelo, el transporte de carga con rapidez y seguridad, los proyectiles y cohetes espaciales, la exploraci´on espacial y submarina, la demanda de energ´ıa el´ectrica cada vez m´as grande con la m´as alta eficiencia empleando diferentes medios en su generaci´on, las comunicaciones. Estas y otras aplicaciones han moti- vado al desarrollo de las t´ecnicas de control de mecanismos. El estudio de estos mecanismos a mostrado que la din´amica que caracteriza a un sistema mec´anico se puede comprender como un conjunto de movimientos independientes y sincronizados de cada una de sus partes que in- tegran el mecanismo. A cada uno de estos movimientos se le conoce como grado de libertad.
El movimiento de cada parte o componente del sistema puede generarse por la acci´on directa
1
de un actuador o a trav´es de otros componentes al cual se encuentra interconectado. La clasi- ficaci´on de los mecanismos de acuerdo a la relaci´on de grados de libertad y actuadores es de dos tipos: Los mecanismos completamente actuados, que son los que tienen igual n´umero de grados de libertad que actuadores en el sistema y los mecanismos subactuados, que son los que tienen menos actuadores que grados de libertad. Esta tesis esta enfocada a resolver el problema de control de algunos mecanismos subactuados. La motivaci´on del estudio radica principal- mente al amplio espectro de aplicaciones como: helic´opteros, aviones de despegue vertical, cohetes espaciales, proyectiles, submarinos, barcos, robots caminantes, mecanismos espaciales entre otros. Es claro que la din´amica de estos mecanismos es muy compleja y su control no es f´acil de derivar, es por eso que es conveniente primero tener un conocimiento previo de otros tipos de mecanismos subactuados did´acticos como el Carro-p´endulo invertido, Pendubot, P´endulo de rotaci´on, P´endulo de reacci´on de disco, Acrobot, Robot planar de uni´on flexible o floja, Sistema Bola-Viga, Helic´optero. Para la comprensi´on del material incluido en esta tesis se requiere el conocimiento de ecuaciones diferenciales, algebra lineal, modelado de sistemas por medio de ecuaciones Euler-Lagrange, y concepto de estabilidad. El modelado de sistemas mec´anicos por medio de las ecuaciones Euler-Lagrange, conceptos de estabilidad, y din´amica cero se encuentran en el ap´endice A, pero informaci´on m´as amplia del tema se puede encontrar en [17],[18]. Los controladores usados en los mecanismos subactuados est´an: Controladores H∞, Controladores basados en la energ´ıa (Pasivos), Controladores adaptivos, Controladores lineales ´optimos y Controladores de estructura variable (VSS) entre otros. Los controladores usados en esta tesis son los llamados de Estructura variable [34] ya que son controladores ro- bustos porque pueden hacer converger las trayectorias del sistema al origen de forma exacta a´un cuando el sistema a controlar est´a sujeto a perturbaciones e incertidumbres.
I.2 Definici´on del problema
Los sistemas subactuados tienen menos actuadores que grados de libertad, ´esto significa que algunos elementos del sistema no est´an sujetos a la acci´on directa de un actuador por lo tanto las leyes de control derivadas para sistemas completamente actuadas no funcionan para sis- temas subactuados. La manipulaci´on de las articulaciones no actuadas se hace aprovechando el acoplamiento que existe con las articulaciones actuadas. Los problemas a resolver en esta tesis son:
• Encontrar una ley de control que garantice que el origen del sistema subactuado en lazo cerrado sea un punto de equil´ıbrio estable o asint´oticamente estable.
• Resolver el problema de regulaci´on para mecanismos con uniones el´asticas.
• Resolver el problema de regulaci´on para el Pendubot.
• Resolver el problema de regulaci´on y seguimiento de trayectorias para el Acrobot.
La herramienta de control empleada sera siguiendo los procedimientos de dise˜no para con- troladores de estructura variable [13, 14]. A pesar de las ventajas presentadas por estos con- troladores [26], aparecen oscilaci´ones de alta frecuencia en el par de entrada una vez que las trayectorias llegan al equil´ıbrio.
I.3 Organizaci´on del trabajo
La presente tesis se forma de seis cap´ıtulos y un ap´endice. En el segundo cap´ıtulo se presenta una introducci´on a los sistemas subactuados y algunos ejemplos de ellos. El servomecanismo con uniones el´asticas se presenta en el cap´ıtulo tres. En el cap´ıtulo cuatro se analiza el Pendubot para resolver el problema de regulaci´on de posici´on a trav´es de controlador tipo twisting, ho- mog´eneo (twisting suavizado) y tangente hiperb´olico, los controladores homog´eneo y tangente
hiperb´olico se usan para el´ıminar el inconveniente de oscilaci´on de alta frecuencia que presenta el controlador twisting en el equil´ıbrio. El cap´ıtulo cinco trata el problema de regulaci´on y de seguimiento de trayectorias para el Acrobot usando controladores twisting. Finalmente se complementa el trabajo con conclusiones en el cap´ıtulo seis.
Preliminares te´oricos
II.1 Controladores de estructura variable
II.1.1 Introducci´on
Los sistemas de control de estructura variable tienen su origen en Rusia en los a˜nos 60’s por Emelyanov y Barbashin, mientras que los conceptos fueron divulgados en los a˜nos 70’s fuera de Rusia por Itkis y Utkin [11]. Los conceptos se han aplicado con ´exito en problemas tan diversos como controladores autom´aticos de vuelo, control el´ectrico de motores, procesos qu´ımicos, control de estabilidad de helic´opteros, sistemas espaciales y robots. En los controladores de estructura variable la ley de control cambia de acuerdo algunas reglas definidas que dependen de los estados del sistema.
Ejemplo 1 Por ejemplo el sistema:
¨
y = u(t) (II.1)
si se considera una ley de control del tipo u(t) = −ky(t), la soluci´on del sistema es ˙y2+ky2 = c donde k, c son estrictamente positivos, entonces tenemos en el plano de fase un c´ırculo si k = 1,
5
−5 0 5
−8
−6
−4
−2 0 2 4 6 8
−5 0 5
−8
−6
−4
−2 0 2 4 6 8
−5 0 5
−4
−3
−2
−1 0 1 2 3
(a) (b) (c)
dy/dt
y
dy/dt dy/dt
y
y
I
II
III IV
I
II III
IV
Figura II.1: (a) Elipse k1 =0.5 (b) Elipse k2 =1.5 (c) Convergencia asint´otica al origen.
una elipse si k 6= 1 (ver Figura II.1(a) y II.1(b)). Si el sistema (II.1) est´a gobernado por:
u(t) =
−k1y(t), si y ˙y > 0;
−k2y(t), si y ˙y < 0.
(II.2)
entonces el sistema se estabiliza asint´oticamente como se muestra en la Figura II.1(c). Esto se demuestra si se considera a c2(y, ˙y) = y2 + ˙y2 donde c(y, ˙y) es la distancia del origen a cualquier punto de la trayectoria. Entonces derivando respecto al tiempo
2c ˙c(y, ˙y) = 2y ˙y + 2 ˙y¨y (II.3)
usando la ecuaci´on de lazo cerrado (II.2) en (II.1) y sustituyendo en (II.3) se tiene
˙c(y, ˙y) = 1
c˙y(y + u) =
1
cy ˙y(1 − k1), si y ˙y < 0
1
cy ˙y(1 − k2), si y ˙y > 0
(II.4)
Para los valores de k1 y k2 asignados y c > 0 entonces ˙c(y, ˙y) < 0, demostrando que la distancia est´a siempre disminuyendo.
Generalizando para un sistema no lineal de una entrada y una salida
˙x = f (x) + g(x)u (II.5)
y = h(x)
donde x ∈ IRn son los estados del sistema, u ∈ IR la entrada de control, y ∈ IR la salida del sistema; f (x), g(x), h(x) son funciones vectoriales suaves de dimensi´on apropiada. Entonces si el sistema (II.5) posee un grado relativo r [17, p. 560] globalmente definido, la din´amica entrada-salida del sistema se expresa como [14]:
y(r)= Lrfh(x) + LgLr−1f h(x)u (II.6)
donde Lg y Lf son las derivadas de Lie [17, p. 559]. Si la condici´on LgLr−1f h(x) 6= 0 se cumple, entonces la derivada yr est´a definida, . Si se define el vector ξ = [y, ˙y, ¨y, . . . , yr−1] y el vector η ∈ IRn−r entonces el mapeo x = φ(ξ, η) es un diffeomorfismo en IRn y ˙η = χ(ξ, η) es la din´amica interna [17, p. 541] donde η es el vector de estados de ´esta din´amica. N´otese que si r = n entonces no existe din´amica interna y el sistema es completamente linealizable.
Def´ınase el error e = ξ − ξR y ξR = [yR, ˙yR, ¨yR, . . . , yRr−1] donde yR es la respuesta de salida deseada, entonces la din´amica del error es:
er= Lrfh(x) + LgLr−1f h(x)u − yRr (II.7)
Entonces se asume que la din´amica interna ˙η = χ(ξ, η) es estable si para cualquier ξ(t) acotado, los estados internos de η(t) permanecen acotados para cualquier condici´on inicial.
El problema de control de seguimiento de retroalimentaci´on de salida se resuelve en dos pasos.
1. Identificar una funci´on s = s(e, ˙e, ¨e, . . . , ep), p ≤ r − 1 llamada deslizante, tal que
cualquier movimiento del sistema dentro de la variedad s = 0, existe una tendencia de convergencia asint´otica del vector (e, ˙e, ¨e, . . . , ep) al origen[14].
2. Encontrar una entrada de control u la cual estabilice el sistema din´amico.
sr−p = ∂sr−p−1
∂er−1
£Lrfh(x) + LgLr−1f h(x)u − yrR¤
= ϕ(ξ, ξR, η) + γ(ξ, η)u (II.8)
considerando que las funciones que aparecen en (II.8) est´an acotadas sin necesidad de conocer o estimar s, ˙s, ¨s, . . . , sr−p−1. Se supone que las funciones γ y φ globalmente satisface las condiciones:
|ϕ(ξ, ξR, η)| ≤ F (ξ, ξR) 0 < Γ1≤ γ(ξ, η) ≤ Γ2
donde F : IRr × IRr → IR es una funci´on positiva conocida y Γ1 y Γ2 son constantes conocidas.
II.1.2 Control tipo twisting
El sistema (II.1) sujeto a la ley de control discontinua de la forma:
u = −k1sign(y) − k2sign( ˙y), k1 > k2 > 0 (II.9)
converge al origen en tiempo finito [13], como se muestra en la Figura II.2. El tiempo de convergencia depende de la selecci´on de k [13, 14] y es dado por:
T =(1 +√
k)2| ˙y(0)|
k1− k2
X∞ i=1
ki−1
−2 −1 0 1 2 3 4 5
−4
−3
−2
−1 0 1 2
y − (rad)
dy/dt − (rad/seg)
(a)
0 2 4 6 8 10
−6
−4
−2 0 2 4 6
(seg)
u(t)
(b)
Figura II.2: (a) Plano de fase usando ley de control twisting (b) La se˜nal u(t).
donde k = kk1−k2
1+k2 tal que para k < 1 la serie es convergente.
II.1.3 Control homog´eneo
El sistema (II.1) con la ley de control homog´enea [27] dada por:
u = −k1p
|y|sign(y) − k2p
| ˙y|sign( ˙y), k1 > k2 > 0 (II.10)
converge en tiempo finito al origen [27], como se muestra en la Figura II.3. El tiempo de convergencia de las trayectorias del sistema es finito y esta demostrado en [27].
Los sistemas homog´eneos se definen como:
• Para una funci´on vectorial: Un campo de vectores ϕ : IRn 7→ IRn se dice que es ho- mog´eneo de grado η ∈ IR con respecto a la dilataci´on (r1, . . . , rn) donde ri > 0, i = 1, . . . , n si existe una constante c > 0, tal que ∀i, ∀x 6= 0 y ∀c > 0, ϕi(cr1x1, . . . , crnxn) = cη+riϕi(x) [27].
• Para una funci´on escalar: Una funci´on V : IRn 7→ IR se dice que es homog´enea de grado η ∈ IR con respecto a la dilataci´on (r1, . . . , rn) done ri > 0, i = 1, . . . , n si existe una constante c > 0, tal que V (cr1x1, . . . , crnxn) = cη+riV (x) [27].
−2 0 2 4 6
−4
−3
−2
−1 0 1 2 3
y − (rad)
dy/dt − (rad/seg)
0 5 10 15
−5
−4
−3
−2
−1 0 1 2 3 4
(seg)
u(t)
(a) (b)
Figura II.3: (a) Plano de fase usando ley de control homog´eneo (b) La se˜nal u(t).
Por ejemplo, las siguientes funciones son homog´eneas:
1. f (y) = |y|, porque si y1 = cy entontes f (y1) = |y1| = |cy| = |c||y| = c|y| = cf (y) = f (cy) como la costante c > 0 y cη+r = c entonces (η + r) = 1 si η = 0 y r = 1, entonces es una funci´on homog´enea de grado cero y dilataci´on uno.
2. f (y) = sign(y), es homogenea (f (cy) = csign(y)) si si la funci´on tiene grado η = −1 y dilataci´on r = 1 (cη+r, con (η + r) = 0).
3. f (y) = −k1p
|y|sign(y) − k2p
| ˙y|sign( ˙y) es homog´enea si el grado es η = −1 y r1 = r2 = 2, entonces f(cr1y, cr2˙y) = cη+r1f (y, ˙y) = cη+r2f (y, ˙y) (ver [4]).
Una importante caracter´ıstica de (II.10) es que la oscilaci´on de alta frecuencia debida a los t´erminos sign(·) cuando el sistema converge al origen es atenuada considerablemente, esto no sucede con la ley de control twisting (II.9).
II.1.4 Consideraciones de robustez usando controladores VSS
La robustez de un sistema din´amico usando control de lazo cerrado es tal que pese a pertuba- ciones o incertidumbres param´etricas del sistema, el objetivo de control se cumple. Un con- trolador es robusto si hace cumplir el objetivo de control bajo perturbaciones o incertidumbres
del modelo del sistema. Algunos controladores como el H∞, Pasivo, Adaptivo son consid- erados robustos [32]. Por ejemplo los controladores basados en H∞ ajustan la ganacia L2 (L2 = R∞
t=0kf (t)k2dt < ∞) del sistema en lazo cerrado (considerando el peor caso de la relaci´on entrada-salida con respecto a la norma L2) llevando al sistema a ser L2estable, si existe perturbaci´on sobre el sistema las desviaciones originadas son corregidas y el sistema permanece estable en la posici´on deseada, dando como consecuencia propiedad de robustez al sistema. Los controladores basados en pasividad aprovechan la pasividad de los sistemas din´amicos, esto es que la relaci´on entrada-salida de los sistemas est´an relacionadas con la conservaci´on, disipaci´on y transporte de energ´ıa. Los controladores basados en pasividad no cancelan las no linealidades del sistema, como consecuencia, tienen buenas propiedades de robustez. Los controladores adaptivos consideran los cambios param´etricos del sistema (masas, longitudes, inercias, etc.), estimando los cambios de los par´ametros hasta que el error param´etrico sea cero, por lo tanto, el sistema se estabiliza en el valor deseado, dando por consecuencia propiedades de robustez al sistema.
En los controladores de estructura variable la principal idea es encontrar una superficie deslizante que no dependa de los par´ametros del sistema en lo posible y adem´as que las trayec- torias del sistema en lazo cerrado lleguen o corten la superficie deslizante. Sobre ´esta superficie el comportamiento del sistema se espera como se desea. La ventaja es que el sistema din´amico es insensible a incertidumbre del modelo empleado y a perturbaciones cuando las trayectorias del sistema se deslizan sobre la ´esta superficie hasta llegar al origen, dando como consecuencia buenas propiedades de robustez [11, 13, 28, 34]. Por ejemplo un sistema din´amico representado por la ecuaci´on diferencial:
¨
y = −kpx1− kdx2− kαsign(x1) − kβsign(x2) + w,
donde w es una perturbaci´on acotada (kwk < M ), donde M es una constante positiva. Entonces
el sistema en lazo cerrado usando la entrada de control es
x˙1
˙ x2
=
x2
−kpx1− kdx2− kαsign(x1) − kβsign(x2) + w
Entonces para el an´alisis de robustez se propone la funci´on de Lyapunov:
V = 1
2x21 +1
2x22+ kα|x1|
tal que la derivada respecto al tiempo sea:
V = −k˙ dx22− kβ|x2| + kwk|x2|
= − kdx22− (kβ − M)|x2|
entonces ˙V es semidefinida negativa si y solo si:
kβ > M. (II.11)
II.2 Sistemas subactuados
En la mayor´ıa de los sistemas mec´anicos, como en robots articulados de enlaces r´ıgidos, se asume que existe una fuerza independiente actuando sobre cada articulaci´on. Esta clase de sistemas din´amicos son f´acil de analizar y diferentes metodolog´ıas de dise˜no de control lin- eal y no lineal se pueden aplicar de manera sencilla, por ejemplo, control PI, PID, modos deslizantes, entre otros [11, 13, 28, 34, 32, 20]. Existen una clase de sistemas, donde una fuerza independiente (actuador) est´a ausente de por lo menos una de las articulaciones, a este tipo de sistemas se le conoce como subactuados. Debido a la naturaleza de estos sistemas, existe siempre un acoplamiento entre los enlaces que son interesantes de analizar, ya que una
linealizaci´on (entrada-salida) genera una din´amica interna que depende s´olo de los estados del sistema. Dise˜no de controladores que operen de manera adecuada para sistemas subactuados han sido objeto de estudios desde hace varios a˜nos. Diversas metodolog´ıas como PI, PID, H∞, control adaptivo, control basado en pasividad, control deslizante entre otros, han sido extendi- das para tratar este problema [15]. Particularmente esta tesis trata el estudio de algunos sistemas subactuados usando controladores de estructura variable.
Los sistemas mec´anicos subactuados se representan mediante la formulaci´on Euler-Lagrange [30, p. 142]:
M(q)¨q + C(q, ˙q) ˙q + g(q) + F (q, ˙q) = B(q, ˙q)τ (II.12)
donde q ∈ IRn es el vector de coordenadas generalizadas, τ ∈ IRm con (n > m) es el vector de torques aplicados a las uniones, ˙q y ¨q son los vectores de velocidad y aceleraci´on, respecti- vamente; M (q) ∈ IRn×nes la matriz de inercia; C(q, ˙q) es la matriz de Coriolis; el vector g(q) representa los pares gravitacionales; F (q, ˙q) es un vector que representa las fuerzas no conser- vativas y el vector B representa la cantidad y posici´on de los pares aplicados al sistema. Si la cantidad de pares aplicados al sistema es menor a los grados de libertad entonces el sistema es llamado subactuado (rango{B} = m, ∀(q, ˙q)) de lo contrario es completamente actuado (rango{B} = n).
Desde el punto de vista f´ısico los mecanismos subactuados son aquellos que por dise˜no o por fallas t´ecnicas presentan menos actuadores que grados de libertad. Es importante se˜nalar que las t´ecnicas de control aplicadas a mecanismos completamente actuados no son aplicables a los mecanismos subactuados haci´endolos un interesante reto en ingenier´ıa de control.
Los sistemas subactuados se pueden transformar a una forma regular (ver ap´endice A) para facilitar el an´alisis del mismo. Por ejemplo, consider´ese un sistema subactuado representado por
˙x = f (x) + g(x)u
donde x ∈ IRn, u ∈ IRm, f (x) y g(x) son funciones continuas, con rango{g} = m. As´umase que existe un diffeomorfismo (z, y) = T (x) para todo x ∈ IRntal que el sistema transformando se pueda representar en la forma regular [17, p. 541]
˙z = η(z, y) (II.13)
˙y = ξ(z, y) + γ(z, y)u (II.14)
donde z ∈ IRn−m, y ∈ IRm y rango{γ} = m. La din´amica (II.13) es la parte interna que no depende del vector de control y la din´amica (II.14) es la parte externa. Si existe una entrada de control u tal que la din´amica externa tenga un punto de equil´ıbrio asint´oticamente estable (i.e.
y ≡ 0) entonces la din´amica interna
˙z = η(z, 0)
se le conoce como din´amica cero [17, p. 541]. Si el comportamiento de esta din´amica cero es estable entonces el sistema es llamado de fase m´ınima y en caso contrario es de fase no m´ınima.
En esta tesis consideraremos ambos casos.
II.3 Ejemplo de sistemas subactuados
A continuaci´on se dar´an algunos ejemplos de sistemas subactuados.
II.3.1 Carro-p´endulo invertido
Este sistema es motivado por aplicaciones tales como el control de misiles y sistemas de control antisismos en edificios. El sistema consiste de una varilla usada como p´endulo, cuyo extremo se une a un eje montado en una plataforma m´ovil, la varilla se balancea libremente y solamente hay una fuerza que actua sobre el carro (ver Figura II.4). El reto de control es mantener en posici´on vertical la varilla a trav´es del movimiento del carro. N´otese que s´olo hay una fuerza
Péndulo
z θθθθ
F
M Carro
mg l
y
Figura II.4: Carro-p´endulo invertido.
F para estabilizar la posici´on del carro x y la posici´on del p´endulo θ, por lo tanto es un sistema subactuado.
El modelo din´amico est´a gobernado por (II.12) donde [15]
M(q) =
M + m ml cos θ ml cos θ ml2
, C(q, ˙q) =
0 −ml ˙θ sin θ
0 0
, g(q) =
0
−mgl sin θ
donde q = [z θ]T, B = [1 0]T, τ = F es la fuerza aplicada al carro, M es la masa del carro, m es la masa del p´endulo, l es la distancia desde la posici´on del pivote al centro de gravedad del p´endulo, I es la inercia del p´endulo alrededor de su centro de gravedad y g es la aceleraci´on de gravedad.
II.3.2 P´endulo de rotaci´on
El P´endulo de rotaci´on es similar al Carro-p´endulo invertido, s´olo que a trav´es de un movimiento angular, el p´endulo unido al brazo, gira libremente. El brazo est´a r´ıgidamente unido al eje del motor (ver Figura II.5). El reto es mantener verticalmente estable al p´endulo. Aqu´ı el sistema cuenta con un actuador τ y dos grados de libertad: La posici´on del extremo de rotaci´on debida
θθθθ0
ττττ Motor
Pendulo
I0 L0
m1g θθθθ1
J1
Brazo
l1
Figura II.5: P´endulo de rotaci´on.
al motor θ0y la posici´on del pendulo θ1. El modelo din´amico est´a gobernada por (II.12) donde [15]
M(q) =
I0+ m1(L20+ l21sin2θ1) m1l1L0cos θ1 m1l1L0cos θ1 J1+ m1l12
, g(q) =
0
−m1gl1sin θ1
C(q, ˙q) =
1
2m1l21˙θ1sin(2θ1) −m1l1L0˙θ1sin θ1+ 12m1l21˙θ0sin(2θ1)
−12m1l12˙θ0sin(2θ1) 0
con F (q, ˙q) = 0, q = [θ0 θ1]T es el vector de posiciones articulares, B = [1 0]T, τ es el par aplicado al brazo, I0 es la inercia del brazo, m1 es la masa del p´endulo, L0 es la longitud total del brazo, l1es la distancia al centro de gravedad del p´endulo, J1 es la inercia del p´endulo alrededor de su centro de gravedad.
II.3.3 P´endulo de reacci´on de disco
Este sistema se compone de una varilla usada como p´endulo con un disco rotatorio en el ex- tremo final de la varilla, el disco gira actuado directamente por un motor de corriente directa, la varilla del p´endulo se balancea sobre su pivote debido al torque de acoplaciento generado por la aceleraci´on angular del disco (ver Figura II.6). El objetivo es mantener en posici´on vertical
w q1
ττττ
Disco Péndulo
x y
l1 m1g lc1
I1
m2 I2
Figura II.6: P´endulo de disco.
al p´endulo. Mediante la entrada τ se debe estabilizar la posici´on angular del p´endulo q1 y la velocidad angular del disco w = ˙q2. El modelo din´amico est´a dado por (II.12) donde [15]
M(q) =
m1l2c1+ m2l21+ I1+ I2 I2
I2 I2
, g(q) =
−(m1lc1+ m2l1)g sin q1 0
,
C(q, ˙q) = F (q, ˙q) = 0 donde q = [q1 q2]T es el vector de posici´on angular, B = [0 1]T, τ es el torque aplicado al disco, m1 es la masa del p´endulo, m2 es la masa del disco, l1 es la longitud del p´endulo, lc1 es la distancia al centro de masa del p´endulo, I1 es la inercia del p´endulo y I2 es la inercia del disco.
II.3.4 Sistema Bola-viga
Este sistema consiste en una bola que se mueve a lo largo de la viga debido a una fuerza fb aplicada directamente a la bola. La viga est´a sobre un par de resortes id´enticos con constante de deformaci´on k (ver Figura II.7). La finalidad es mantener estable la bola sobre la viga
aplicando solamente la fuerza fb. El estudio de este sistema es motivado por el control de peque˜nas oscilaciones en plataformas y veh´ıculos en suspensi´on. El modelo din´amico es dado
Bola
Viga q2
fb
q1 m1I1
I2 k
l
k
Figura II.7: Bola sobre una viga.
por (II.12) donde [15]
M(q) =
m1 0
0 m1q21+ I1+ I2
, C(q, ˙q) =
0 −m1q1˙q2 m1q1˙q2 m1q1˙q1
,
g(q) =
m1g sin q2
m1gq1cos q2
, F (q) =
0
2kl2cos q2sin q2
.
con q = [q1 q2]T es el vector de posici´on, B = [1 0]T, y F (q) es la fuerza ejercida por los resortes, m1 es la masa de la bola, I1 es la inercia de la bola, I2 es la inercia de la viga, l es la distancia de la posici´on de los resortes al pivote de la viga y k es la constante el´astica del resorte.
II.3.5 Robot planar de uniones el´asticas
Este sistema consiste en un brazo con dos eslabones que se mueven en un plano horizontal x − y perpendicular a la fuerza de gravedad, el primer eslab´on est´a unido a un eje sobre el cual rota libremente al aplicarle directamente un par y un segundo eslab´on esta unido al primero
q2
q1
Eslabón 2 Eslabón 1
Unión Flexible
ττττ x
y m1I1
m2I2
l1
l2 k
Figura II.8: Brazo manipulador de uni´on flexible.
por una uni´on el´astica como un resorte o un hule pl´astico, (ver Figura II.8). Este sistema es tambi´en subactuado considerando que es de dos grados de libertad, dados por los movimientos de los eslabones 1 y 2 representado por las posiciones angulares q1 y q2 con s´olo una entrada de control dado por τ . El objetivo es llevar la posici´on angular de los eslabones al equil´ıbrio en alg´un punto particular del espacio del sistema. La motivaci´on del estudio de este sistema es por las aplicaciones espaciales de robots de menos masa y volumen, en donde no sea afectado por la gravedad. El modelo din´amico es dado por (II.12) donde [15]
M(q) =
θ1+ θ2+ 2θ3cos q2 θ2+ θ3cos q2 θ2+ θ3cos q2 θ2
, F (q, ˙q) =
0 kq2
,
C(q, ˙q) =
−θ3˙q2sin q2 −θ3˙q2sin q2− θ3˙q1sin q2 θ3˙q1sin q2 0
,
con
θ1 = m1l2c1+ m2l21+ I1, θ2 = m2l2c2+ I2, θ3 = m2l1lc2
donde q = [q1 q2]T, B = [1 0]T, m1 es la masa del eslab´on 1, m2 es la masa del eslab´on 2, l1 es la longitud del eslab´on 1, l2 es la longitud del eslab´on 2, lc1es la distancia al centro de masa del eslab´on 1, lc2 es la distancia al centro de masa del eslab´on 2, I1 es la inercia del eslab´on 1 respecto a su centro de masa, I2es la inercia del eslab´on 2 respecto a su centro de masa, g es la aceleraci´on de graveded y k es la constante de rig´ıdez del resorte.
II.4 Comentarios
El sistema mec´anico robot planar con uni´on el´astica ser´a tratado con detalle en el cap´ıtulo III asumiendo que solo se tiene acceso a la posici´on del lado del motor. Los sistemas Pendubot y Acrobot son mecanismos muy similares, de 2 grados de libertad con un actuador, la difer- encia entre ellos es la colocaci´on del actuador, para el Pendubot el actuador esta en el primer eslab´on y para el Acrobot esta en el segundo eslab´on, se tratar´an con detalle en los cap´ıtulos IV y V, respectivamente. Tambi´en es importante se˜nalar que la mayoria de los mecanismos men- cionados excepto el robot planar con uni´on flexible y floja, son inestables en cualquier posici´on excepto la posici´on de reposo, cuando la entrada de control es nula, por lo tanto estos mecanis- mos son considerados de fase no m´ınima. Los sistemas de fase no m´ınima por naturaleza son complicados para controlar y el dise˜no de controladores para estos sistemas es un reto para los dise˜nadores de control.
Control de sistemas con uniones el´asticas
III.1 Introducci´on
La mayor parte de los robots operativos son utilizados para aplicaciones industriales. Un gran porcentaje realizan actividades que requieren de precisi´on en sus movimientos o realizan tar- eas repetitivas. Los sistemas de control retroalimentado permiten al manipulador realizar sus movimientos de manera apropiada.
El an´alisis de leyes de control se facilita si se asume que el acoplamiento entre el actuador y la articulaci´on de un robot manipulador es r´ıgida, pero se sabe que una gran variedad de mecanismos usan acoplamiento mec´anicos no r´ıgidos (el´asticos) para transmisi´on de par, tales como engranes, poleas y acopladores mec´anicos de resorte y variedades de pl´astico, por lo que en sus articulaciones hay deformaciones que deben ser tomadas en cuenta con el objetivo de mejorar el desempe˜no del mecanismo. Al considerar una uni´on el´astica, aumentamos en un grado de libertad el sistema y por lo tanto se hace m´as complejo.
Este cap´ıtulo se centra en resolver el problema de regulaci´on de posici´on de una carga sujeta a fricci´on y acoplada a un motor de corriente directa por medio de una uni´on el´astica. Para fines de an´alisis, se presenta un sistema de acoplamiento actuador-carga introducido en Merzouki et
21
al. [22] y Utkin et al. [35] usando fricci´on de Coulomb y viscosa en el extremo de la carga, se le incluye tambi´en un cierto nivel de incertidumbre en la transmisi´on del par que ser´a tomado en cuenta durante el dise˜no con el objetivo de conocer la robustes del sistema en lazo cerrado sujeto a perturbaci´on usando un controlador VSS.
El controlador propuesto se le conoce de casta˜neteo (chattering [26, 27]) formado por una parte proporcional-derivativa y un t´ermino discontinuo. El controlador se caracteriza por generar oscilaciones en alta frecuencia una vez que las trayectorias del sistema con fricci´on convergen, en tiempo finito, al punto de equil´ıbrio. La particularidad de este controlador, a diferencia de los modos deslizantes ([12, 34]), es que las trayectorias cruzan las superficies de discontinuidad.
El problema de la clase de sistema estudiado aqu´ı es que la ecuaci´on de lazo cerrado presenta discontinuidades debido a la presencia de la funci´on signo del controlador discontinuo y la fricci´on de Coulomb. Entonces, las estrategias de control propuestas por ([10, 16, 19, 24, 31]) no son apropiadas ya que se asume en ´estos que el sistema debe ser diferenciable.
El presente trabajo tiene la siguiente estructura: En la secci´on III.2 se presenta el modelo din´amico utilizado en el an´alisis. En la secci´on III.3 se estudia la estabilizaci´on de la posici´on de la carga con un controlador tipo chattering [3, 26] para resolver el problema de regulaci´on. La prueba de estabilidad se basa en la teor´ıa de estabilidad de Lyapunov. Para mostrar el desempe˜no del controlador se realizan simulaciones num´ericas en la secci´on III.4. En la secci´on III.5 se hace un estudio experimental del controlador propuesto. Finalmente los comentarios en la secci´on III.6.
Se utiliza la siguiente notaci´on en el documento: Los valores propios m´ınimos y m´aximos de una matriz cuadrada A se denotan por λmin{A} y λmax{A} respectivamente, y k · k denota la norma Euclideana.
Mg k l
J2 J1
FlcFlv
Motor Unión Carga
Elástica
q2 q1
Figura III.1: Diagrama esquem´atico de servomecanismo con uni´on flexible.
III.2 Modelo din´amico
Consid´erese el siguiente modelo din´amico de un servomecanismo acoplado a una carga, afec- tado por fricci´on de Coulomb y viscosa ([22, 35]) de la Figura III.1:
M(q1)¨q1+ C(q1, ˙q1) ˙q1+ g(q1) + F ( ˙q1) = k(q2− q1) (III.1) J2q¨2+ k(q2− q1) = τ + ω(q1, q2) (III.2)
con
M(q1) = J1, g(q1) = Mgl sin(q1), C(q1, ˙q1) = 0,
F ( ˙q1) = Flcsign( ˙q1) + Flv˙q1 (III.3)
donde q1, q2 ∈ IR son la posici´on angular de la carga y del motor respectivamente, ˙q1, ¨q1, ˙q2 q¨2 corresponden a la velocidad y aceleraci´on angular de la carga y del motor, τ ∈ IR es la entrada de control, M (q1) es la matriz de inercia del robot y J2 es la inercia del motor, k > 0 es el coeficiente de rigidez, F ( ˙q1) corresponde a los t´erminos de fricci´on de Coulomb y viscosa de la carga y Flc, Flv son los par´ametros de fricci´on. La funci´on signo se define como
sign(z) =
1 si z > 0 [-1,1] si z = 0
−1 si z < 0.
(III.4)
La definici´on de la funci´on signo (III.4) en z = 0 tiene sentido f´ısico porque refleja el efecto de la fricci´on de Coulomb a bajas velocidades (e.g., error en estado estable).
Propiedad 1 ([33]) El torque gravitacional g(q) es Lipschitz, esto significa que existe una constante positiva kg tal que,
kg(x) − g(y)k ≤ kgkx − yk
para toda x,y ∈ IRn. La constante kg satisface la siguiente relaci´on
kg ≥
°°
°°∂g(q)
∂q
°°
°° .
Se considera un cierto grado de incertidumbre ω(q1, q2) en el modelo de la uni´on el´astica debido a imperfecciones de acoplamiento y caracteristicas diversas de los materiales usados que son dif´ıciles de modelar y se asume que est´a superiormente acotada por una constante M > 0:
kω(q1, q2)k ≤ M ∀ t. (III.5)
Comentario 1 N´otese que el sistema (III.1)-(III.2) tiene dos grados de libertad (q1, q2) y una entrada de control τ por lo tanto es subactuado.
III.2.1 Objetivo de control
Para el sistema no lineal (III.1)-(III.2) se especifica el siguiente objetivo de control: Considerar el sistema din´amico (III.1)-(III.2), suponiendo que las posiciones y velocidades del actuador est´an disponibles. El problema es encontrar una ley de control τ tal que el desplazamiento angular de la carga q1 converja asint´oticamente a la posici´on deseada qd1 ∈ IR y q2 converja asint´oticamente a la posici´on deseada qd2 ∈ IR, que se asumen constantes para todo t:
t→∞lim q1(t) = qd1. (III.6)
t→∞lim q2(t) = qd2. (III.7)
III.3 Estabilizaci´on de la posici´on de la carga con fricci´on
Primeramente, consid´erese los siguientes cambios de variables,
e1= q1− qd1 (III.8)
e2= q2− qd2 (III.9)
donde e1, e2son los errores de posici´on angular de la carga y el motor, qd1= cte para todo t ≥ 0 es la posici´on angular deseada de la carga; qd2 es la posici´on deseada del motor y se propone como una funci´on de qd1[33] de la forma:
qd2 = qd1+ k−1g(qd1) (III.10)
donde g(qd1) es un valor constante dado por el par gravitacional en la posici´on deseada qd1.
Teorema 1 Consid´erese el sistema en lazo abierto (III.1) y (III.2) con la condici´on (III.10) y
sujeto a la ley de control:
τ2 = g(qd1) − kpe2− kd˙e2− α2sign(e2) − β2sign( ˙e2) (III.11)
donde α2 > (Flc+ β2) (ver [28]). Entonces el origen del sistema en lazo cerrado (e, ˙e) = (0, 0) es asint´oticamente estable si λmin{Ku} > kg > k∂(g(q∂q11)k donde la matriz Ku es:
Ku =
k −k
−k k + kp
y kg es definido en la propiedad 1, cumpliendose por tanto el objetivo de control (III.6, III.7).
Prueba. El sistema en lazo cerrado sujeto al teorema 1 es
d dt
e1
˙e1 e2
˙e2
=
˙e1
M−1(q1)[k(e2− e1) − g(q1) + g(qd1) − F ( ˙q1) − C(q1, ˙e1) ˙e1]
˙e2
J2−1[ke1− (kp+ k)e2− kd˙e2− α2sign(e2) − β2sign( ˙e2) + ω]
(III.12)
Analizando los equil´ıbrios del sistema ˙q1∗ = ˙q2∗ ≡ 0, y
k(e2− e1) − g(e1+ qd1) + g(qd1) − Flcsign(0) = 0 (III.13)
−k(e2− e1) + kpe2− α2sign(e2) − β2sign(0) + ω = 0 (III.14)
entonces (e∗1, e∗2) = (0, 0) es soluci´on de (III.13 y III.14). Para el an´alisis de estabilidad, consid´erese la funci´on Lyapunov:
V =1
2M(e1+ qd1) ˙e21+1
2J2˙e22+ U(e1+ qd1) − U(qd1) + g(qd1)(e1+ qd1)