Y APROBADA POR EL SIGUIENTE COMITÉ
Dr. Joaquín Álvarez Gallegos Director del Comité
Dr. Iouri Orlov Kuchina Dr. Luis Alejandro Marquez Martínez Miembro del Comité Miembro del Comité
Dr. Jaime Álvarez Gallegos Dr. Luis Tupak Aguilar Bustos Miembro del Comité Miembro del Comité
Dr. Luis Alejandro Marquez Martínez Dr. David Hilario Covarrubias Rosales Coordinador del programa de posgrado
en Electrónica y Telecomunicaciones
Encargado del Despacho de la Dirección de Estudios de Posgrado
PROGRAMA DE POSGRADOEN CIENCIAS EN ELECTRÓNICAY TELECOMUNICACIONES
CONTROL DE SISTEMAS MECÁNICOS SUBACTUADOS CON FRICCIÓN DISCONTINUA
TESIS
que para ubrir parialmente losrequisitos neesariospara obtenerelgrado de DOCTOREN CIENCIAS
Presenta:
ROQUE MARTÍNEZORTIZ
Ensenada, Baja California, México. Diciembre de 2007.
CONTROL DE SISTEMAS MECÁNICOS SUBACTUADOS CON FRICCIÓN DISCONTINUA
Resumen aprobado por:
__________________________ Dr. Joaquín Álvarez Gallegos
Director de tesis
Es frecuente que en el diseño de controladores para sistemas mecánicos subactuados se considere despreciable un fenómeno físico no lineal y no suave o duro: la fricción. La presencia de este fenómeno puede producir comportamientos dinámicos no tradicionales como intervalos de equilibrios, variedades deslizantes, ciclos límite, bifurcaciones y caos.
En años recientes, algunos trabajos en el campo del control de sistemas subactuados se han dirigido al problema de la fricción en las articulaciones. Sin embargo, estos esfuerzos se han concentrado en el problema de fricción viscosa.
En esta tesis proponemos controladores para sistemas mecánicos subactuados de 2 g.d.l. con fricción discontinua. Los controladores llevan la articulación no actuada a la posición deseada sin cancelar directamente este fenómeno físico, y son robustos con respecto a algunas incertidumbres en los coeficientes de los términos discontinuos. Los controladores son diseñados utilizando la técnica de control por modos deslizantes, algunos resultados que extienden la teoría de estabilidad de Lyapunov y las condiciones para tener estabilidad en tiempo finito de una clase de sistemas discontinuos con incertidumbres presentadas recientemente. Las leyes de control obtenidas son discontinuas o híbridas.
Otra aportación es un control continuo para sistemas mecánicos con fricción discontinua y control pleno obtenido utilizando los resultados anteriores.
Ilustramos estos procedimientos con ejemplos numéricos y físicos.
CONTROL. Ensenada, Baja California, México. December 2007.
CONTROL OF UNDERACTUATED MECHANICAL SYSTEMS WITH DISCONTINUOUS FRICTION
Works in the field of underactuated mechanical control have commonly neglected a nonlinear and nonsmooth, physical phenomenon: friction. This phenomenon may produce nontraditional dynamics as equilibrium intervals, sliding modes, limit cycles, bifurcations, and chaos.
In recent years, several works have addressed the problem of friction in the underactuated mechanical systems. However, these efforts have been concentrated to cope only with viscous friction.
In this thesis, we propose controllers for 2-DOF underactuated mechanical systems with discontinuous friction. The control objetive is that of steering the unactuated joint to a desired position. The proposed controllers do not cancel this physical phenomenon directly, and they are robust with respect to some uncertainty in the discontinuous friction coefficients. The controllers are designed using the classic technique of sliding modes, some results that extend the Lyapunov stability, and the conditions to have finite time stability of a class of uncertain switched systems presented recently. The control laws are discontinuous or hybrid.
Another contribution is the design of a continuous control for a class of mechanical systems with discontinuous friction and full control using the results mentioned before.
We illustrate these procedures with numerical and physical examples.
A mi familia, como siempre.
Al Dr. Joaquín Álvarez Gallegos por todo.
A los Doctores Iouri Orlov Kuchina, Luis Alejandro Márquez Martínez, Jaime Álvarez Gallegos y Luis Tupak Aguilar Bustos.
Al Centro de Investigación Científica y de Educación Superior de Ensenada.
Página
I. Introducción . . . .1
I.1 Antecedentes . . . 3
I.2 Objetivos . . . 5
I.3 Contenido de la tesis . . . 6
II. Preliminares matemáticos . . . 7
II.1 Definición del convexo más simple . . . .8
II.2 Estabilidad en el sentido de Lyapunov . . . .11
II.3 Estabilidad equiuniforme . . . .14
II.4 Sistemas mecánicos subactuados . . . .17
III. Control de un manipulador planar subactuado con fricción . . . 18
III.1 Diseño de la ley de control . . . .18
III.2 Aplicación . . . 22
III.3 Conclusiones del capítulo . . . .23
IV. Control de sistemas subactuados con fricción discontinua I . . . .25
IV.1 Planteamiento de problema . . . 25
IV.2 Resultado principal . . . .29
IV.3 Aplicaciones . . . .34
IV.4 Conclusiones del capítulo . . . .39
V. Control continuo de sistemas discontinuos . . . .41
V.1 Diseño de la ley de control . . . .42
V.2 Aplicaciones . . . .45
Página
VI. Control de sistemas subactuados con fricción discontinua II . . . .49
VI.1 Planteamiento del problema . . . .49
VI.2 Resultado principal . . . .51
VI.3 Aplicación . . . 54
VI.4 Conclusiones del capítulo . . . .58
VII. Conclusiones . . . 59
VII.1 Trabajo futuro . . . .60
Figura Página
1. Interpretación geométrica de la definición de solución del convexo más simple. . . . 10
2. Intersección de superficies de discontinuidad. . . 11
3. Manipulador planar subactuado. . . 19
4. Posiciones y ley de control del manipulador.. . . 24
5. Sistema masa-resorte-amortiguador. . . 35
6. Posiciones y velocidades del sistema masa-resorte-amortiguador. . . 36
7. Ley de control y funciónV para el sistema masa-resorte-amortiguador. . . 37
8. Sistema masa y viga. . . 37
9. Posiciones y velocidades del sistema masa y viga. . . 39
10. Ley de control y funciónV del sistema masa y viga. . . 40
11. Oscilador mecánico. . . 45
12. La posición y velocidad del oscilador mecánico. . . 46
13. Entrada de control y funciónV para el oscilador mecánico. . . 47
14. Posiciones y velocidades del sistema masa-resorte-amortiguador. . . 48
15. Péndulo horizontal. . . 55
16. Posiciones y control del péndulo horizontal. . . 56
Aunque la mecánica es un tema clásico cuyo estudio data desde la antigüedad,
mu-chos problemas, viejos y nuevos, siguen atrayendo la atención. En años recientes, muchas
aplicaciones en el control de sistemas mecánicos acentúan cuestiones que fueron ignoradas
en planteamientos clásicos, como son: dinámica elástica, fuerzas de fricción, etc.
De manera simple, un sistema mecánico es una colección de elementos materiales
formalmente organizados interactuando a través de fuerzas que producen varios
movimien-tos en respuesta a fuerzas y pares de torsión externos diferentes. Así, un sistema mecánico
se puede ver como un sistema de control con las fuerzas externas como las entradas, las
variables que describen los movimientos de los elementos del sistema como los estados, y
las dinámicas que son determinadas por la interacción de fuerzas actúan como puentes entre
variables y entradas. Las salidas de un sistema mecánico son funciones de sus estados.
En Seto y Baillieul (1994), dependiendo del número de entradas y el número de los
grados de libertad del sistema mecánico, se define el llamado sistema mecánico subactuado
o superarticulado como un sistema mecánico controlado en el cual la dimensión del espacio
de configuración excede la dimensión del espacio de la entrada de control.
El problema del control de sistemas subactuados está motivado por numerosas
apli-caciones prácticas. En primer lugar se esgrime el sólido argumento de la economía de
diseño; por ejemplo, un avión es un sistema subactuado. Otras aplicaciones surgen por la
propia disposición física del sistema; por ejemplo, en el diseño de vehículos submarinos,
En general, un sistema mecánico subactuado presenta desafíos que no se encuentran
en un sistema con control pleno en el cual la dimensión del espacio de configuración es
igual a la dimensión del espacio de la entrada de control. La controlabilidad, por ejemplo,
que es normalmente implícita en un sistema con control pleno, al menos localmente, no es
determinada fácilmente en un sistema subactuado. La síntesis del control para un sistema
subactuado también es más compleja que para un sistema con control pleno.
Las dinámicas bajo restricción constituyen una propiedad interesante de los sistemas
mecánicos subactuados. Las restricciones pueden ser expresadas como ecuaciones
diferen-ciales con las coordenadas generalizadas y sus derivadas con respecto al tiempo
(veloci-dades y/o aceleraciones). Si la restricción es no integrable es llamada no holonómica.
Las restricciones no holonómicas son clasificadas como cinemáticas y dinámicas.
Las cinemáticas restringen geométricamente la dirección de movilidad del sistema,
mien-tras que las dinámicas son debidas al equilibrio dinámico en el grado de libertad pasivo
donde no es aplicada una fuerza o par de torsión (Arai et al., 1998).
El péndulo invertido, el sistema bola y viga y el manipulador con articulación
elás-tica, que son sistemas mecánicos subactuados clásicos, son sistemas holonómicos (Seto y
Baillieul, 1994).
Un simple disco sobre una superficie (Török, 2000), robots móviles (Kolmanovsky y
McClamroch, 1995) y vehículos articulados (Jiang y Nijmeijer, 1999) son sistemas
mecáni-cos que tienen restricciones no holonómicas cinemáticas. Ejemplos de sistemas
inte-grables (Reyhanoglu et al., 1999) incluyen robots manipuladores subactuados (Oriolo y
Nakamura, 1991), vehículos marinos subactuados (Do et al., 2002) y el Acrobot (Spong,
1995).
Es frecuente que en el diseño de controladores para sistemas mecánicos se
con-sidere despreciable un fenómeno físico no lineal y no suave o duro: la fricción. En
tri-bología, la fricción seca (fricción discontinua) es definida como una fuerza que se opone
al movimiento relativo entre dos superficies de diferentes cuerpos en contacto. Los
cuer-pos se “atascan” (“stick”) cuando la velocidad relativa entre las superficies en contacto es
cero. Si los cuerpos se deslizan con velocidad relativa no cero, decimos que se “resbalan”
(“slip”). Un modelo de fricción seca debe describir la fase de stick y slip (Leine, 2000).
La acción de la fricción discontinua puede ser descrito por medio de inclusiones
diferen-ciales o ecuaciones diferendiferen-ciales ordinarias con lado derecho discontinuo (Utkin, 1992),
(Filippov, 1988).
La presencia de discontinuidades en sistemas mecánicos pueden producir
compor-tamientos dinámicos no tradicionales como intervalos de equilibrios, variedades deslizantes,
ciclos límite, bifurcaciones y caos (Armstrong y Amin, 1996). Por lo tanto, surge la
necesi-dad de analizar la varienecesi-dad de estados estacionarios que pueden presentar y diseñar
estrate-gias de control que corrijan el comportamiento no deseado.
I.1 Antecedentes
Algunos artículos representativos que analizan algunos problemas acerca de sistemas
equilibrio por medio de técnicas de pasividad (Ortega et al., 2002) y moldeo de energía
(Bloch et al., 2000), estabilización y seguimiento de trayectorias por medio de control
“backstepping” (Seto y Baillieul, 1994), el uso de restricciones virtuales para producir
os-cilaciones estables (Shiriaev et al., 2005), planificación de trayectorias (Bullo y Lynch,
2001), y control de sistemas mecánicos con una variable no actuada cíclica (Grizzle et
al., 2005), entre otros.
Comúnmente los trabajos en el campo del control de sistemas mecánicos
subactua-dos ignoran el efecto de la fricción. Los términos de fricción no son modelasubactua-dos y los
algoritmos se reducen a resolver el problema de control para un modelo en lazo abierto sin
fricción, esperando que la disipación física ayude, de alguna manera, a alcanzar el punto
de equilibrio deseado. Sin embargo, en años recientes algunos trabajos se han dirigido al
problema de la fricción. En Gómez-Estern y van der Shaft (2004), Woolsey et al. (2001),
Woolsey et al. (2004) se considera fricción lineal (fricción viscosa) en las articulaciones de
sistemas subactuados.
En Woolsey et al. (2001) se describe el efecto de la disipación física en la
estabi-lidad de un equilibrio, estable en ausencia de la fricción, con el método de lagrangianos
controlados. En ese trabajo se sugiere el uso de retroalimentación de amortiguamiento para
estabilizar exponencial y localmente una clase de sistemas lagrangianos controlados. En
Gómez-Estern y van der Shaft (2004) fue extendida la técnica (IDA-PBC) para sistema
mecánicos subactuados para incorporar amortiguamiento en lazo abierto. Además, en este
de amortiguamiento en presencia de aproximaciones suaves de los efectos de la fricción de
Coulomb.
Para sistemas mecánicos subactuados con fricción discontinua sólo en las
articula-ciones actuadas, el problema de compensación, en algunos casos, puede ser resuelto
u-sando control discontinuo (Riachy et al., 2006). Sin embargo, el problema importante de
control de sistemas mecánicos subactuados con fricción discontinua en las articulaciones
no actuadas aún sigue abierto.
En este trabajo de tesis se proponen varias técnicas para controlar sistemas mecánicos
de esta clase.
I.2 Objetivos
El objetivo general de este trabajo es contribuir a resolver el problema de control de
sis-temas mecánicos subactuados que presentan fricción discontinua en las articulaciones no
actuadas.
Los objetivos particulares de este trabajo son:
• Diseñar leyes de control para regular la articulación no actuada de un manipulador
planar subactuado de 2 grados de libertad (g.d.l.), cuando éste presenta fricción
viscosa y de Coulomb en las dos articulaciones.
• Diseñar leyes de control para regular la articulación no actuada, para algunas
clases de sistemas mecánicos subactuados de 2 g.d.l. con fricción discontinua en la
Consideramos que éstos son dos casos típicos encontrados en prototipos mecánicos
(los cuales exhiben un comportamiento dinámico desplegado por mecanismos más
compli-cados). En esta tesis, los sistemas considerados son prototipos mecánicos.
I.3 Contenido de la tesis
Puesto que en esta tesis se considerarán sistemas mecánicos subactuados con fricción
dis-continua, en el Capítulo II se da la definición de solución para ecuaciones diferenciales
ordinarias con términos discontinuos en el lado derecho y de algunos conceptos de
estabi-lidad utilizados a lo largo de la tesis. Además, se presenta la definición formal de sistema
mecánico subactuado considerada en esta tesis.
En el Capítulo III proponemos un primer controlador para un sistema mecánico
sub-actuado de 2 g.d.l. con fricción viscosa y de Coulomb en las dos articulaciones. Este
sistema es un manipulador planar. El controlador es diseñado utilizando la técnica de
con-trol por modos deslizantes.
Un procedimiento de diseño de controladores para una clase de sistemas
mecáni-cos subactuados con fricción discontinua en la articulación no actuada se presentan en los
capítulos IV y V. Además, en el Capítulo V se propone un control continuo para sistemas
mecánicos con fricción discontinua y control pleno.
Resultados recientes en sistemas discontinuos con incertidumbres son utilizados en el
Capítulo VI, para diseñar un controlador para otra clase de sistemas mecánicos subactuados
con fricción discontinua.
Muchos sistemas físicos pueden ser descritos por la ecuación de estado
˙
x=f(t, x), (1)
dondex ∈ Rn es el vector de estado con la condición inicial x(t0) = x0, x˙ = dx/dt y
f :R×Rn
→Rnes un campo vectorial.
La existencia y unicidad de las soluciones de (1) son esenciales para que esta ecuación
sea un modelo matemático útil de un sistema físico. A continuación se presentan las
condi-ciones para garantizar la existencia y unicidad de solucondi-ciones de (1) en el sentido usual.
Teorema 1 (Existencia y unicidad de solución local)(Khalil, 2002) Seaf(t, x)una
fun-ción continua a tramos enty que satisface la condición de Lipschitz
kf(t, x)−f(t, y)k≤Lkx−yk (2)
∀x, y ∈ B = {x∈Rn|kx−yk< r},∀t ∈ [t0, t1]. Entonces existe algunaδ > 0tal que la ecuaciónx˙ =f(t, x)conx(t0) =x0 tiene solución única sobre[t0, t0+δ].
Teorema 2 (Existencia y unicidad de solución global) (Khalil, 2002) Sea f(t, x) una
función continua por tramos ent que satisface (2)∀x, y ∈ Rn,∀t ∈ [t0, t1]. Entonces la
ecuaciónx˙ =f(t, x)conx(t0) =x0tiene solución única sobre[t0, t1].
Los sistemas bajo estudio en esta tesis se pueden describir por medio de la ecuación
(1) donde ahoraf es una función continua a tramos en un dominioG;x ∈ RnyM es un
Para analizar esta ecuación es necesario investigar la existencia y unicidad de sus
soluciones. A continuación se presenta una definición de solución más general, presentada
en (Filippov, 1988), y que será utilizada a lo largo de esta tesis.
II.1 Definición del convexo más simple
Considérese que para cada punto (t, x) ∈ G, el conjunto F(t, x) es el conjunto
cerra-do convexo más simple conteniencerra-do tocerra-dos los valores límite de la función f(t, x∗) para
(t, x∗)∈/ M,x∗ →x,t =const.
Entonces, una solución de la ecuación (1) es llamada una solución de la inclusión
diferencial
˙
x∈F(t, x), (3)
es decir, una función absolutamente continuax(t)definida en un intervalo o en un segmento
I para el cual x˙(t) ∈ F (t, x(t)) casi donde sea en I. Puesto que M es un conjunto de
medida cero, entonces para casi todot∈Ila medida de la sección transversal del conjunto
M por el plano t =const es igual a cero. Para tal t el conjunto F(t, x) es definido para
todo(t, x)∈G.
En puntos de continuidad de la funciónfel conjuntoF consiste de un puntof(t, x), y
la solución satisface la ecuación (1) en el sentido usual. Si el punto(t, x)∈Mse encuentra
en la frontera de la sección transversal de dos o varios dominiosG1, ..., Gkintersectada por
con vérticesfi(t, x), i≤k,donde
fi(t, x) = lim (t,x∗)∈Gi,x∗→x
f(t, x∗). (4)
Todos los puntosfi(t, x) (i= 1, ..., k)están contenidos enF(t, x), pero no es
nece-sario que todos ellos sean vértices.
Considérese el caso donde la función f(t, x)es discontinua en una superficie suave
Sdefinida por la ecuaciónϕ(x) = 0. La superficieSdivide su vecindad en el espacioxen
los dominiosG− yG+. Para t =const y para el puntox∗ aproximándose al puntox ∈ S
desde los dominiosG−yG+, definimos los valores límite de la funciónf(t, x∗)como
f−(t, x) = lim
x∗∈G−,x∗→xf(t, x
∗), f+(t, x) = lim
x∗∈G+,x∗→xf(t, x
∗). (5)
Entonces el conjuntoF(t, x)es un segmento lineal que une los puntosfinales de los
vectoresf−(t, x)yf+(t, x)que inician en el puntox.
Si parat1 < t < t2 este segmento se encuentra en un lado del planoP tangente a la
superficie en el puntox, las soluciones para estostpasan de un lado de la superficieS al
otro (Figura 1(a)).
Si este segmento intersecta el planoP, el punto de intersección es el puntofinal del
vector f0(t, x) que determina la velocidad de movimiento x˙ = f0(t, x) a lo largo de la
superficieSen el espaciox(figura 1(b)). Esto significa que la funciónx(t)que satisface la
ecuación
˙
x=f0(t, x) (6)
es una solución de la ecuación (1) por la definición (3). Sif0
6
=f−,f0
6
Figura 1. Interpretación geométrica de la definición de solución del convexo más simple.
intervalo de tiempo bajo consideración se encuentra en el dominioG− (o enG+)
satisfa-ciendo la ecuación (1), y en el resto del intervalo se encuentra en la superficieS
satisfacien-do la ecuación (6) es, desde luego, también una solución de la ecuación (1) en el sentisatisfacien-do de
la definición (3).
Si todo el segmento con los puntosfinales def−yf+se encuentra en el planoP,la
velocidadf0,del movimiento a lo largo de la superficieS,no es única.
Con base en la definición (3), podemos encontrar también la velocidad de movimiento
a lo largo de la intersección de superficies de discontinuidad (Figura 2). Esta velocidad
puede ser única o no, dependiendo de si el conjunto F(t, x) tiene uno o más puntos
co-munes con la tangente a esta intersección.
A continuación presentamos los conceptos de estabilidad manejados en esta tesis,
definidos con respecto a los puntos de equilibrio establecidos por esta definición de
Figura 2. Intersección de superficies de discontinuidad.
II.2 Estabilidad en el sentido de Lyapunov
El método directo de Lyapunov, que prueba si un punto de equilibrio es estable en el sentido
de Lyapunov, se presenta de la siguiente manera (Qu, 1998), (Khalil, 2002).
Considere que el sistema (1) tiene como equilibrio al origenxe= 0 ∈Rn.
Definición 3 El punto de equilibrioxe = 0de (1) es:
• Estable al tiempo t0 si, para cadaε > 0, existe una constanteδ > 0que puede depender det0 yεtal que
kx(t0)k<δ(t0,ε) =⇒kx(t)k≤ε, ∀t≥t0.
Es uniformemente estable en [t0,∞) si, para cada ε > 0, el valor de δ es
independiente del tiempo inicialt0.
• Inestable si no es estable.
Definición 4 El punto de equilibrio xe = 0 se dice ser atractivo al tiempo t0 si, para
algunaδ>0y cadaε>0, existe un intervalo de tiempofinitoT(t0,δ,ε)tal que
Es uniformemente atractivo en[t0,∞)si para todoε, que satisface0<ε<δ, el intervalo
de tiempofinito es independiente del tiempo inicialt0.
Definición 5 Un punto de equilibrioxe = 0es asintóticamente estable al tiempot0 si es
estable al tiempot0 y si es atractivo, o equivalentemente si existe algunaδ > 0 tal que
kx(t0)k < δ implica quex(t) → 0 cuandot → ∞. Es uniformemente asintóticamente estable en[t0,∞)si éste es uniformemente estable en[t0,∞)y six= 0es uniformemente
atractivo.
Definición 6 El punto de equilibrioxe= 0al tiempot0 es exponencialmente atractivo si,
para algunaδ >0existen constantesα(δ)>0yβ >0tal que
kx(t0)k<δ=⇒kx(t)k≤α(δ)e−β(t−t0).
Es exponencialmente estable si, para alguna δ > 0 existen dos números estrictamente
positivosαyβ tales que
kx(t0)k<δ =⇒kx(t)k≤α(δ)kx(t0)ke−β(t−t0).
Definición 7 Una función continuaγ0 :R+
→R+es una función de claseksiγ
0(0) = 0 y si es estrictamente monótona creciente. Se dice que es de clasek∞siγ0(p)→ ∞cuando
p→ ∞.
Definición 8 Una funciónV(t, x) : R×Rn → Rse llama localmente definida positiva
si existe una función de clasek,γ1 : R+
→ R+, tal que para alguna vecindad del origen
Ω⊂Rnse cumple que
La función V(t, x) se dice localmente decreciente si existe una función de clase k, γ2 :
R+
→R+tal que, para alguna vecindad alrededor del origenΩ
⊂Rnse satisface
V(t, x)≤γ2(kx(t)k), ∀(t, x)∈Ω×R +
.
La palabra “localmente” es reemplazada por “globalmente” si Ω = Rn. La función
V(t, x)es radialmente no acotada siγ1es una función de clasek∞.
Definición 9 Una funciónV(t, x(t)) : R×Rn → R es una función candidata de
Lya-punov si es continuamente diferenciable y si
• Para concluir estabilidad,V(t, x(t))debe ser definida positiva.
• Para concluir estabilidad asintótica o estabilidad exponencial,V(t, x(t))debe ser
definida positiva y decreciente.
• Para concluir estabilidad global,V(t, x(t))debe ser globalmente definida positiva
y radialmente no acotada.
• Para concluir estabilidad asintótica uniforme y global o estabilidad exponencial
global,V(t, x(t))debe ser globalmente definida positiva, globalmente decreciente y
radialmente no acotada.
Teorema 10 Considere la ecuación (1) tal que, para cualquier conjunto acotadoD⊂Rn
la función f(·) mapea D×R+ a conjuntos acotados en
Rn. Suponga que la derivada
(t, x(t))∈R+×Ωse tiene que
˙
V(t, x(t))≤ −γ3(kx(t)k),
dondeγ3(·)es continua y no negativa, conγ3(0) = 0. Entonces el equilibrioxedel sistema
tiene las siguientes propiedades de estabilidad:
• Es global o localmente uniformemente estable siγ3 es semidefinida positiva.
• Es uniforme y asintóticamente estable en forma global o local si γ3 es definida
positiva.
• Es exponencialmente estable en forma local o global siγ3(kx(t)k)≥λV(t, x)para alguna constanteλ > 0o si γi(kx(t)k) = λikx(t)k
2
parai = 1,2,3y algunas
constantes positivasλi.
• Es exponencialmente estable en forma global o local con convergencia en tiempo
finito siγ3(kx(t)k)≥λV(t, x)P para constantesλ>0y0< p <1.
II.3 Estabilidad equiuniforme
En esta tesis, además de la ecuación (1) consideraremos su versión perturbada
˙
x=f(t, x) +ψ(t, x), (7)
dondeψes una función continua a tramos cuyos componentesψi, ...,ψnson acotados local
y uniformemente dentro de una bolaBδ, con centro en el origen con radioδ; es decir,
para casi todo(t, x) ∈ Bδ ×Ry algunas constantesMi ≥ 0. A continuación se presenta
un concepto de solución para esta ecuación diferencial con incertidumbres (Orlov, 2005).
Definición 11 Una función absolutamente continua x(·), definida en un intervalo I, es
una solución de la ecuación diferencial con incertidumbres (7)-(8) si y sólo si es una
solu-ción de (7) en el intervalo I en el sentido de Filippov para alguna función continua a
tramosψsujeta a (8).
Se debe señalar que el sistema con incertidumbres (7)-(8) puede ser representado
como una inclusión diferencial de la forma
˙
x∈F(t, x) +Ψ, (9)
dondeF(t, x)es la construida de acuerdo a la definición de solución de Filippov, Ψes el
producto Cartesiano de los intervalosΨi = [−Mi, Mi], i= 1, ..., n, y el conjunto
F(t, x) +Ψ={f+ψ:f ∈F(t, x),ψ∈Ψ}.
Ahora se presenta el concepto de estabilidad equiuniforme (Orlov, 2005).
Definición 12 El punto de equilibrio x = 0 del sistema con incertidumbres (7)-(8) es
equiuniformemente estable si y sólo si para cada t0 ∈ R,ε > 0, existe δ = δ(ε) > 0,
dependiendo deε e independiente det0 yψ, tal que cada soluciónxψ(·, t0, x0)de (7)-(8)
con el dato inicialx0 =x(t0)∈Bδ existe en el intervalo de tiempo semi-infinito[t0,∞)y
satisface la desigualdad
°
Definición 13 El punto de equilibrio x = 0 del sistema con incertidumbres (7)-(8) es
equiuniforme y asintóticamente estable si es equiuniformemente estable y la convergencia
lim
t→∞ °
°xψ¡t, t0, x0¢°°= 0 (10)
se cumple para toda soluciones de (7)-(8) iniciando dentro de algunaBδ, uniformemente en
el dato inicialt0yx0, y todas las solucionesxψ(·, t0, x0). Si esta convergencia permanece
en vigor para cadaδ>0, el punto de equilibrio es global, equiuniforme y asintóticamente
estable.
Definición 14 El punto de equilibrio x = 0 del sistema con incertidumbres (7)-(8) es
global, equiuniformemente estable en tiempo finito si, además de la estabilidad global,
equiuniforme y asintótica, la relación límite
xψ¡t, t0, x0 ¢
= 0 (11)
se cumple para cada soluciónxψ(·, t0, x0)y todat ≥t0+T(t0, x0), donde la función de
ajuste de tiempo
T(t0, x0) = sup xψ(·,t0,x0)
inf©T ≥0 :xψ¡t, t0, x0 ¢
= 0 para todot ≥t0+T
ª
(12)
es tal que
T(Bδ) = sup
t0∈R,x0∈Bδ
T(t0, x0)<∞ paraδ >0.
En la siguiente sección se presenta la definición formal de sistema mecánico
II.4 Sistemas mecánicos subactuados
La comunidad de control de sistemas mecánicos ha dividido sus líneas de trabajo en dos
enfoques con un alto grado de paralelismo: los sistemas lagrangianos y los sistemas
hamil-tonianos. Pese existir una equivalencia entre ambos enfoques y poder expresar el modelo
lagrangiano en forma hamiltoniana, las formulaciones han sido generalizadas hasta el punto
en que no es evidente su equivalencia, y por lo tanto tampoco son intercambiables las
téc-nicas de control desarrolladas en uno u otro enfoque.
En esta tesis se propondrán controladores para sistemas mecánicos subactuados
la-grangianos de 2 grados de libertad con fricción discontinua en las articulaciones.
Formal-mente se dice que son subactuados los sistemas dengrados de libertad yr < nactuadores
cuyas ecuaciones de Lagrange toman la forma
d dt
µ
∂L ∂qi˙
¶
− ∂∂qiL +ff i = ui, i= 1, ..., r (13)
d dt
µ
∂L ∂qi˙
¶
− ∂∂qiL +ff i = 0, i=r+ 1, ..., n (14)
con
L=T(q1, ..., qn,q˙1, ...,qn˙ )−V(q1, ..., qn)
dondeqi,i = 1, ..., n, son las coordenadas generalizadas del sistema,ff i,i = 1, ..., nson
términos discontinuos debidos a las fricciones discontinuas,Les la función de Lagrange,
T(q,q˙)yV(q)es la energía cinética y potencial respectivamente.
En el siguiente capítulo, se presenta un controlador para un manipulador planar
fricción
En este capítulo proponemos un controlador para un manipulador planar subactuado
de 2 g.d.l., con movimiento sólo en el plano horizontal, con fricción viscosa y de Coulomb
en las dos articulaciones. El controlador no cancela directamente este fenómeno físico ni
requiere los valores exactos de los coeficientes de fricción de Coulomb. La articulación
no actuada es llevada a la posición deseada mientras que la actuada terminará en una
posi-ción desconocida. El controlador es diseñado utilizando la técnica de control por modos
deslizantes y se concluye estabilidad asintótica local del punto de equilibrio deseado.
III.1 Diseño de la ley de control
Considere el manipulador planar subactuado de 2 eslabones (Figura 3) con movimiento
sólo en el plano horizontal, con fricción viscosa y de Coulomb en las dos articulaciones.
Las ecuaciones dinámicas que modelan el sistema pueden presentarse como:
M(q)¨q+C(q,q˙) ˙q+ff( ˙q) =u (15)
donde
q =
· q1 q2
¸
, u=
· u1
0
¸ ,
M(q) =
·
θ1+θ2+ 2θ3cos(q2) θ2+θ3cos(q2)
θ2+θ3cos(q2) θ2
¸ ,
C(q,q˙) =θ3sen(q2) ·
−q˙2 −q˙2−q˙1 ˙
q1 0
Figura 3. Manipulador planar subactuado.
ff( ˙q) =
·
ff1( ˙q1) ff2( ˙q2)
¸
=
·
fv1q˙1+fc1sgn( ˙q1) fv2q˙2+fc2sgn( ˙q2)
¸ ,
sgn(z) =
1 , paraz >0,
[−1,1], paraz = 0, −1 , paraz <0;
(16)
con
θ1 = m1l2c1+m2l21+I1 θ2 =m2lc22+I2 θ3 =m2l1lc2
θ4 = m1lc1+m2l1 θ5 =m2lc2
yfvi >0,fci >0,parai = 1,2,son los coeficientes de la fricción viscosa y.de Coulomb
presente en la articulación 1 y 2, respectivamente.
El objetivo de control es regular la posición del eslabón2para quesen(q1 +q2) = 1
El controlu1será diseñado usando la técnica de control por modos deslizantes clásica.
Note que si sen(q1 +q2) = 1 y q˙1 = ˙q2 = 0, entoncescos (q1+q2) = ˙q1 = 0y,
puesto que−sen(q1 +q2)( ˙q1+ ˙q2) = 0,q˙2 = 0.
Si la superficie deslizante tiene la forma
s= ˙q1−k1cos (q1+q2), (17)
dondek1 es una constante positiva, entonces la ecuación de la articulación no actuada del
sistema, en el estadox = (x1, x2)
T, donde
x1 =q1+q2 yx2 = ˙q1 + ˙q2, se puede escribir como
˙
x1 = x2,
˙
x2 =
1
m2lc22+I2
[m2l1lc2k1cos (q2) sen (x1)x2
−m2l1lc2k1sen (q2) cos (x1) ˙q1−fv2x2
+fv2k1cos (x1)−fc2sgn (x2−k1cos (x1))]. (18)
Note que sisen(x1)tiende a 1 yx2a cero cuandottiende a infinito, entoncesq˙1yq˙2tienden
a cero.
Por lo tanto, el objetivo de control se cumple si encontramos una constante k1, tal
que el punto de equilibrio(sen (x1), x2) = (1,0)de (18) sea asintóticamente estable.
Considere el sistema (18) descrito como
˙
x1 = x2,
˙
x2 =
1
m2l2c2+I2
[−m2l1lc2k1sen (q2) cos (x1) ˙q1
dondef1 =fv2−m2l1lc2k1cos (q2) sen (x1).
Teorema 15 Suponga quek1,para una constante0<γ <2/π2,satisface
fv2 > m2l1lc2k1, (20)
fv2 > k1 ¡
m2l2c2 +I2 ¢
/(2γ), (21)
fv22 > k1 £
2m2l1lc2fv2+ ¡
m2l2c2+I2 ¢
fv2 −m22l 2 1l
2 c2k1 −¡m2l2c2+I2
¢
m2l1lc2k1+ (fv2+ 2m2l1lc2k1) 2
/4¤. (22)
Entonces(sen(x1), x2) = (1,0)es un punto de equilibrio asintóticamente estable de (19)
en forma local.
Demostración Para el análisis de estabilidad, considérese la siguiente función
V1(x1, x2) = 1 2
¡
m2l2c2+I2 ¢
x22−fv2k1sen (x1) +fv2k1+k2sen (x1 −π/2)x2 (23)
dondek2 =k1(m2l2c2+I2).
Para mostrar que esta función es definida positiva y radialmente desacotada en
−π/2 + 2πi≤x1 ≤3π/2 + 2πiparai∈Z, obsérvese que
1−sen (x1)≥γ(x1−π/2−2πi)2 (24)
y
sen (x1−π/2)x2 ≥ −|x1−π/2−2πi| |x2|. (25)
Entonces,
V1(x1, x2)≥ 1 2
·
|x1−π/2−2πi| |x2|
¸T D1
·
|x1−π/2−2πi| |x2|
¸
donde
D1 = ·
2γfv2k1 −k2 −k2 m2l2c2 +I2
¸ .
Por lo tanto, si (21) se satisface, entonces la función (23) es definida positiva y radialmente
desacotada en−π/2 + 2πi≤x1 ≤3π/2 + 2πiparai∈Z.
La derivada temporal de la función (23) a lo largo de las trayectorias del sistema
(19) se puede escribir como
˙
V1(x1, x2) =− ·
˙
q1 x2
¸T ·
d211 d212 d212 d222
¸ ·
˙
q1 x2
¸
−fc2|x2−q˙1| (27)
donde
d211 = fv2−m2l1lc2k1sen (q2) cos (x1),
d212 = (m2l1lc2k1sen (q2) cos (x1)−f1)/2,
d222 = f1−k2cos (x1−π/2).
Por lo tanto, si (20) y (22) se satisfacen, entonces concluimos que el punto de equilibrio
(sen (x1), x2) = (1,0)es asintóticamente estable en forma local.
En la siguiente sección presentamos la ley de control propuesta y un ejemplo numérico
para mostrar el desempeño del sistema en lazo cerrado.
III.2 Aplicación
La ley de controlu1se obtiene usando la técnica de modos deslizantes clásica. Por lo tanto,
si proponemos la función
V2(s) = 1 2s
la ley de controlu1 que nos conduce a
˙
V2(s)≤²|s|, (29)
donde² >0es una constante, es
u1 = 1
θ2 £
−θ2θ3sen (q2) ( ˙q1+ ˙q2)2−θ23cos (q2) sen (q2) ˙q12
+θ2fv1q˙1−(θ2+θ3cos (q2))fv2q˙2
−¡θ1θ2−θ23cos 2(q
2) ¢
(ksgn (s) +k1sen (q1+q2) ( ˙q1 + ˙q2)) ¤
(30)
donde
k >(θ2fc1+ (θ2+θ3)fc2)/ ¡
θ1θ2−θ23 ¢
.
La Figura 4 muestra los resultados numéricos para los parámetros de un Pendubot
presentado en (Block, 1996), es decir, θ1 = 0.08925 kg · m2, θ2 = 0.02763 kg ·m2,
θ3 = 0.0235kg ·m2,θ4 = 0.0112 kg·m, θ5 = 0.00294kg·m. Además, tenemos que
fv1 = fv2 = 0.2kg·m2/s,fc1 = fc2 = 0.005 N ·m,γ = 0.20,k = 0.21y, para que se cumplan las condiciones del Teorema 15,k1 = 1.
III.3 Conclusiones del capítulo
Proponemos una ley de control discontinua para un manipulador planar subactuado con
movimiento sólo en el plano horizontal, con fricción viscosa y de Coulomb en las
articu-laciones. Para el diseño del controlador usamos la técnica de modos deslizantes clásica y
concluimos estabilidad asintótica local del punto de equilibrio deseado. Esta ley de
con-trol no cancela directamente la fricción de Coulomb. Además, puesto que el coeficiente de
0 2 4 6 8 10 -2 -1 0 1 2 3
0 2 4 6 8 10 -0.2 -0.1 0 0.1 0.2 0.3
0 2 4 6 8 10 -2 -1 0 1 2 3
0 2 4 6 8 10 -1 -0.5 0 0.5 1 1.5
q q
u
1 2
t s rad
N m rad
t s
t s t s
1 q +q 1 2
rad
a)
b)
c)
d)
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )Figura 4. Posiciones y ley de control del manipulador.
Si el movimiento del sistema es en un plano vertical (Pendubot) la presencia de los
pares gravitacionales en el modelo del sistema causa una condición adicional parafv2.
El análisis y diseño de este primer controlador nos motiva a proponer leyes de
con-trol para sistemas subactuados de 2 g.d.l., que si bien no logren la regulación en ambas
articulaciones, logren la regulación en la articulación no actuada.
En el siguiente capítulo presentamos un algoritmo de control para una clase de
tinua
I
En este capítulo proponemos un controlador para una clase de sistemas mecánicos
subactuados de 2 grados de libertad con fricción discontinua en la articulación no actuada.
El objetivo de control es la regulación de la articulación no actuada mientras que la posición
y la velocidad de la actuada permanecen acotadas. Puesto que la articulación no actuada
es accionada solamente por la posición y velocidad de la actuada, las cuales son
conside-radas continuas, la primera articulación puede ser considerada como un sistema mecánico
con fricción discontinua pero con una entrada de control artificial continua dada por un
término dependiendo de la posición y velocidad de la actuada. Este “control” no puede ser
estático si pretendemos eliminar el error en estado estacionario. Por lo tanto, proponemos
un procedimiento para el diseño de un control ideal virtual y dinámico que garantice un
error en estado estacionario igual a cero, posteriormente se calculará la entrada de control
física en la articulación actuada que lleve el control virtual a su valor ideal en tiempofinito.
Finalmente ilustraremos este procedimiento con dos ejemplos numéricos.
IV.1 Planteamiento de problema
Considere un sistema mecánico subactuado representado por
¨
q1 = f0(q1,q˙1, q2,q˙2) +g0(q1,q˙1, q2,q˙2)u1,
¨
dondeq1 ∈ R, q2 ∈ R,f0, g0, f1 son funciones suaves, g0 6= 0, y u1 es una entrada de
control. C2( ˙q2) es el módulo de los términos de fricción, que en general depende de los
estados del sistema y de acciones externas, supuesto, junto con sus derivadas temporales,
acotado. Aquí, de acuerdo a modelos propuestos en algunos trabajos (Bartolini y Punta,
2000b),C2( ˙q2)puede ser expresado como
C2( ˙q2) =C2c+ (C2s−C2c) exp µ
−q˙ 2 2 v2 2s
¶
, (32)
dondeC2c yC2s son los niveles de fricción de Coulomb y el nivel de fricción estática que
pueden estar divididos por una masa constante, con 0 ≤ C2c ≤ C2s, y v2s es la
veloci-dad de Stribeck. Note que C2c ≤ C2( ˙q2) ≤ C2s. También suponemos que la función
f2(q2,q˙2,q¨2) = df1(q2,q˙2)/dt es continua en sus argumentos, y que g1 y g2 son cons-tantes. Además, suponemos queg1 6= 0y, sig2 6= 0, entonces sgn(g1) =sgn(g2).
El objetivo de control es la regulación de la variable no actuada mientras que la
posición y velocidad de la articulación actuada permanecen acotadas.
Si definimosy1 =q2−q2d, dondeq2d es la posición constante deseada,y2 = ˙q2, y
σ =g1q1+g2q˙1, (33)
entonces la articulación no actuada es descrita por la ecuación
˙
y1 = y2,
˙
Note que (34) puede ser descrito como un sistema mecánico con fricción discontinua,
una superficie de discontinuidadS caracterizada pory2 = 0, y un control virtualσ(q1,q˙1)
que es continuo por naturaleza (excepto posiblemente cuando señales impulsivas son
per-mitidas en el control u1, un caso no considerado en la tesis). Por lo tanto, si deseamos
reducir el errory= (y1, y2) T
a cero, entonces una ley dinámica paraσpuede ser adecuada.
Por lo tanto, primero diseñaremos un control “ideal”, continuo dinámico σ∗(y, t)
para el sistema (34) que asegure la convergencia del estado y al origen, luego
propon-dremos un control discontinuo u1 para el sistema (31) que haga el control virtual σ
con-verja en tiempofinito a σ∗. Denotamos este tiempofinito como t
1. Note que si el estado y(t)y la aceleracióny˙2(t)son acotados, entoncesσ∗ también será acotada (esto puede ser concluido porquef1es suave) y, de (33), la posición y velocidad de la articulación actuada
permanecen acotadas.
Considere una ley de control virtualσ∗con una dinámica dada por
˙
σ∗ =ϕ(y,σ∗). (35)
Esto es equivalente a definir un controlador dinámicoσ∗ = ψ(w, y), w˙ = χ(w, y), con
ψ(·) =wyχ(w, y) =ϕ(y, w). Note queσ∗ debe ser continua, pero no necesariamenteϕ.
El sistema (34)-(35), conσ =σ∗, es un sistema de tercer orden con estado(y
1, y2,σ∗)∈R3 el cual, debido a la presencia del término discontinuo, puede tener un conjunto no contable
y compacto como equilibrio (ver (Alvarez et al., 2000)), según la definición de punto de
equilibrio de un sistema discontinuo en el sentido de Filippov (Filippov, 1988). Bajo estas
Lema 16 Para cualquier σ∗ = ¯σ∗ ∈ R, defínase ϕ(¯σ∗,0)(y1) = ϕ(y,σ¯∗), con y =
(y1,0)T, como la restricción de ϕpara σ∗ = ¯σ∗, y2 = 0. Por lo tanto, si y1 = 0 es la única raíz deϕ(¯σ∗,0) = 0, entonces todos los puntos de equilibrios del sistema (34)-(35) se
proyectan en el punto únicoy= 0en el plano(y1, y2).
Demostración Un punto de equilibrio del sistema (34)-(35) es dado por
¯
y2 = 0, f1(¯y1+q2d,0)−C2(0) sgn(0) + ¯σ∗ = 0, ϕ(¯y,σ¯∗) = 0,
lo cual implica quey¯1 = 0. Note que, de (32), tenemosC2(0) = C2s, por lo tanto
f1(q2d,0)−C2(0) sgn(0) + ¯σ∗ = 0, (36)
y siempre existe un valor realσ¯∗tal que, para cualquierq
2d∈R, satisfaceσ¯∗+f1(q2d,0)∈ [−C2s, C2s].
Note que el resultado previo significa que, en caso de que el sistema (34)-(35) exhiba
un modo deslizante en la superficieSfuera del origeny= 0, entonces en un tiempofinito
el sistema abandonará esta superficie. Este tiempo puede ser de cualquier tamaño, incluso
cero o muy largo, perofinito.
Defínase ahorax1 = y1, x2 = y2,yx3 = f1(y1+q2d, y2)−C2(y2) sgn (y2) +σ∗.
Entonces el sistema (34), con el control artificial (35), es descrito parax2 6= 0, por
˙
x=
x2 x3 f2(x1+q2d, x2, x3) +2(C2vs2−C2c)
2s |x2|exp
³ −x22
v2 2s
´
x3+ ˙σ∗
=g(t, x), (37)
dondex = (x1, x2, x3)
T. Note que el punto de equilibrio
(0,0,σ¯∗)del sistema (34)-(35)
Denotamos como tak elk-ésimo tiempo de llegada de la solución del sistema
(34)-(35) a la superficie S, y por tbk ≥ tak,k ∈ K = {1,2, ...}, el tiempo de salida de esta
solución de esta superficie justo después de la k-ésima llegada. Entonces tenemos una
secuencia ordenada de tiempos
t1 ≤ta1 ≤tb1 ≤· · ·≤tak ≤tbk ≤· · ·.
Cuando t1 < tak y tbk < ∞, defínase ∆xk = x ¡
t+bk¢− x¡tak−¢, dondex¡t+bk¢ =
limh→0x(tbk +h) yx ¡
t−ak¢ = limh→0x(tak −h), h > 0. Entonces el sistema (34)-(35) puede ser representado por
˙
x = g(t, x),
x¡t+bk¢ = x¡t−ak¢+∆xk, k∈K. (38)
Puesto que el objetivo de control es la regulación de la variable no actuada mientras la
posi-ción y velocidad de la variable actuada de (31) permanece acotadas, entonces el objetivo de
control es el de conducir a cero el estadox(t)del sistema (38) con un “control” continuo
σ∗.
IV.2 Resultado principal
En esta sección diseñamos un control ideal continuoσ∗para el sistema (34), para
posterior-mente diseñar el control real del sistema (31) tal queσ(ver (33)) converga aσ∗ en tiempo
Suposición 17 Existe una función continuaf3(t, x1, x2)tal que, si el control artificial es
dado por
σ∗ =f3(t, x1, x2), (39)
entonces (37) con (39) puede ser transformado a
˙
x=
x2, x3, −k1x1−k2x2−k3x3+ 2(C2vs2−C2c)
2s |x2|exp
³ −x22
v2 2s
´ x3,
=g(t, x), (40)
dondek1,k2 yk3son coeficientes reales, yσ˙∗ =ϕ(y,σ∗)satisface el Lema 16.
Note quex¯= 0del sistema (40) es un punto de equilibrio. Por lo tanto, si es posible
encontrar una funciónf3 y valoresk1,k2 yk3, que lleven el estado de (38)-(40) ax¯ = 0,
entonces el objetivo de control será alcanzado. Así pues, en el siguiente teorema
establece-mos algunas condiciones sobre estos coeficientes para conseguir quelimt→∞kx(t)k = 0.
Para esto mostraremos que cualquier trayectoria del sistema (38)-(40) que llega al conjunto
S = {x∈R3 :x1 6= 0, x2 = 0}, saldrá de este en un punto más cercano al origen. Note que, de (40), no se puede llegar aS con la coordenadax3igual a cero.
Considere las matricesP yQ(x)dadas por
P =
pp1112 pp1222 pp1323 p13 p23 p33
, Q(x2) = ·
kq22 kq23 kq23 kq33
¸
, (41)
donde
kq22 = −2p12+ 2p23k2,
kq23 = −p22+p23 ·
k3−
2(C2s−C2c) v2
2s
|x2|e− ³x
2
v2s
´2¸
+p33k2, (42)
kq33 = −2p23+ 2p33 ·
k3−
2(C2s−C2c) v2
2s
|x2|e− ³x
2
v2s
´2¸
Teorema 18 Si la Suposición 17 se satisface, la matriz Qes definida positiva para toda
x2 ∈R, la matrizP es también definida positiva y satisface
p13 = 0, p11 p23
= p12
p33
=k1, (43)
entonces x = 0 es un punto de equilibrio estable asintótica y globalmente del sistema
(38)-(40).
Demostración Primero mostraremos que, cuando el sistema (38)-(40) llega al
con-juntoS en tiempotak, entonces sale de este conjunto en tiempotbk ≥ tak desde un punto
más cercano al origen. Note que
∆x1k = x1(tbk+)−x1(t−ak) = 0,
∆x2k = x2(tbk+)−x2(t−ak) = 0.
Por lo tanto, para probar esta parte basta mostrar que¯¯x3(t+bk) ¯
¯ < ¯¯x3(t−ak) ¯
¯. Note
tam-bién que (40) describe la dinámica del sistema (38) fuera de la superficie de
discon-tinuidad S = {x∈R3 :x
2 = 0}, la cual divide el espacio de estado en dos dominios, G±={x∈R3 :x
2 ≷0}. Lo que es más, la tercera coordenadax3está dada por
x3(t) = ˙x2(t) =− Z t
t1
[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ−C2(x2) sgn (x2)+c1 ,φ(t), (44)
dondec1es una constantefinita. Entonces tenemos
φ+(tak) = −
Z tak
t1
[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ − lim x∗
2∈G+,
x∗2→0
[C2(x∗2) sgn (x∗2)] +c1
= −
Z tak
t1
y
φ−(tak) = −
Z tak
t1
[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ− lim x∗
2∈G−,
x∗
2→0
[C2(x∗2)] sgn (x∗2) +c1
= −
Z tak
t1
[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ+C2s+c1. (46)
Suponga primero que un modo deslizante no ocurre en la superficieS, entoncestbk =
tak y las trayectorias del sistema cruzan la superficie. Para esto, los campos vectoriales en
tiempot+bk yt−ak debe tener una componente en la misma dirección en el ejex2; así ¯
¯ ¯ ¯−
Z tak
t1
[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ+c1 ¯ ¯ ¯
¯> C2s (47)
se debe satisfacer. Esto implica que ¯
¯ ¯ ¯ ¯−
Z t−ak
t1
[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ +c1 ¯ ¯ ¯ ¯
¯> C2s, (48) ¯
¯ ¯ ¯ ¯−
Z t+bk
t1
[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ+c1 ¯ ¯ ¯ ¯
¯> C2s, (49) y porque la trayectoria llega a la superficie de discontinuidad en el tiempot−ak debemos
tener
sgn
" −
Z t−ak
t1
[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ +c1 #
=−sgn£x2 ¡
t−ak¢¤. (50)
Por lo tanto, de (44), (48), (49) y (50),
¯ ¯x3
¡
t−ak¢¯¯ =
¯ ¯ ¯ ¯ ¯−
Z t−ak
t1
[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ +c1 ¯ ¯ ¯ ¯
¯+C2s (51)
y
¯ ¯x3
¡
t+bk¢¯¯=
¯ ¯ ¯ ¯ ¯−
Z t+bk
t1
[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ +c1 ¯ ¯ ¯ ¯
En el segundo caso, es decir, cuando existe un modo deslizante, la condiciónx˙2(t) =
0debe de cumplirse parat∈[tak, tbk]. Entonces, de (44),
|x3(tbk)| = |x˙2(tbk)|= ¯
¯φ±(tbk)¯¯
=
¯ ¯ ¯ ¯−
Z tbk
t1
[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ∓C2s+c1 ¯ ¯ ¯
¯= 0. (53)
Lo que es más, porque la trayectoria llegan a la superficie de discontinuidad en tiempotak,
la siguiente condición se debe cumplir,
¯ ¯x3
¡
t−ak¢¯¯=¯¯x˙2 ¡
t−ak¢¯¯ >0. (54)
Por lo tanto, podemos concluir, de (51) a (54), que
¯ ¯x3
¡
t+bk¢¯¯<¯¯x3 ¡
t−ak¢¯¯. (55)
Ahora analicemos el caso donde el sistema no está en la superficie de discontinuidad
S. Considere la función candidata de LyapunovV (x) =xTP x, dondeP es dada por (41).
EntoncesV (x)puede ser escrita como
V (x) =p11x21+ 2p12x1x2+p22x22+ 2p23x2x3+p33x23. (56)
Note quex1 ¡
t−ak¢=x1(t+bk)yx2(t−ak) =x2(t+bk) = 0. Entonces tenemos, de (55), que
V ¡x¡t−ak¢¢=p11x21 ¡
t−ak¢+p33x23 ¡
t−ak¢> p11x21 ¡
t+bk¢+p33x23 ¡
t+bk¢=V ¡x¡t+bk¢¢, (57)
y existirá una reducción deV (x)cuando las trayectorias del sistema (38)-(40) crucen la
superficieS. Lo que es más, la derivada temporal deV a lo largo de las trayectorias de
(40) es dada por
˙
V (x) =−(x2, x3)Q(x2) (x2, x3) T
Por lo tanto, el sistema converge al conjunto {x∈R3 : (x2, x3) = (0,0)} y concluimos
estabilidad asintótica global del origen, porque si el origen no ha sido alcanzado entonces
las trayectorias de (34)-(39) saldrán de la superficie de discontinuidad S en un tiempo
finito, y la funciónV decrece fuera de esta superficie.
Una vez obtenida una expresión para σ∗ y los coeficienteski, pij satisfaciendo las
previas condiciones, podemos diseñar una ley de control discontinua parau1que haga que
el control artificial σ (ver (33)) converja al control ideal σ∗ en tiempo finito. Podemos
usar, por ejemplo, una técnica de modo deslizante para lograr este objetivo. En la siguiente
sección se describe la aplicación de este procedimiento a dos sistemas.
IV.3 Aplicaciones
Ejemplo 1.Considere el sistema mostrado en la Figura 5, descrito por
¨
q1+ ka m1
q1 + kb m1
(q1−q2) + fb m1
( ˙q1−q˙2) = 1
m1 u1,
¨
q2− kb m2
(q1−q2)− fb m2
( ˙q1−q˙2) +C2( ˙q2) sgn ( ˙q2) = 0, (59)
dondeqi son las posiciones de las masas,qi˙ las velocidades,mi las masas, para i = 1,2;
Figura 5. Sistema masa-resorte-amortiguador.
El objetivo es diseñar un ley de controlu1para que la posición de la masam2converja
a un valor constanteq2ddado, con la posición y velocidad de la masam1 acotadas.
Para este sistema, tenemos
f1(x1+q2d, x2) = − kb m2
(x1+q2d)− fb m2
x2,
σ(q1,q˙1) = kb m2
q1+ fb m2
˙
q1,
dondex1 =q2−q2d,x2 = ˙q2. Si
σ∗ =−k1 Z t
t0
x1(τ)dτ − µ
k2− kb m2
¶ x1−
µ k3−
fb m2
¶ x2+
kb m2
q2d, (60)
dondet0 es el tiempo inicial, entonces llegamos a la forma deseada del Teorema 18.
El controlu1puede ser diseñado usando la técnica clásica de modos deslizantes. Por
ejemplo, si la superficie deslizante tiene la formas=σ−σ∗, entoncesses dada por
s= fb
m2 ˙
q1+ kb m2
q1+k1 Z t
t0
(q2(τ)−q2d)dτ+k2(q2−q2d) +kc3q˙2− kb m2
q2, (61)
dondekc3 =k3−fb/m2. Podemos proponeru1 como
u1 =m1 µ
ka m1
q1+ kb m1
(q1 −q2) + fb m1
( ˙q1 −q˙2) +τ1 ¶
donde
τ1 =− m2 fb · kb m2 ˙
q1+ µ
k2− kb m2
¶
˙
q2− fbkc3
m2
( ˙q2−q˙1)− kbkc3
m2
(q2−q1) +τ2 ¸
(63)
conτ2 =ksgn (s) +k1(q2−q2d)yk >|kc3|C2s.
Finalmente, si encontramos constantesp11,p12,p22,p23,p33,k1,k2 yk3, que
satisfa-gan el Teorema 18, entonces el objetivo de control será alcanzado.
Lasfiguras 6 y 7 muestran algunos resultados numéricos, donde tenemos que ka =
kb = 1 N/m,fb = 1 N/(m/s), m1 = m2 = 1 kg, C2s = 1N/kg, C2c = 0.75N/kg,
|v2s| = 0.143m/s,k1 = 0.5,k2 = 1.5, ykc3 = 2, conq1(t0) = −1m,q˙1(t0) = 0m/s,
q2(t0) = 2m,q˙2(t0) = 2m/s, yq2d= 0m.
0 10 20 30 -2 -1 0 1 2 3
0 10 20 30 -2 -1 0 1 2 3
0 10 20 30 -2 -1 0 1 2 3
0 10 20 30 -2 -1 0 1 2 3
q q
q
1 1
t s
m m/s
t s
t s t s
m
a)
b)
c)
d)
( ) ( ) ( ) ( ) ( ) ( ) ( )q 2 2
.
.
m/s ( )
0 10 20 30 -6
-4 -2 0 2 4
0 10 20 30 0
20 40 60 80 100
V
t s t s
N
a)
b)
( )
( ) ( )
u 1
Figura 7. Ley de control y funciónV para el sistema masa-resorte-amortiguador.
Ejemplo 2. Consideremos ahora el sistema masa y viga mostrada en la Figura 8.
Este sistema es modelado por las ecuaciones
¡
J +mq22¢q¨1+ 2mq2q˙1q˙2−mgq2cos (q1) = u1,
¨
q2−q2q˙21−gsen (q1) +fv2q˙2+C2( ˙q2) sgn ( ˙q2) = 0, (64)
donde q1 es la posición angular de la viga, q2 la posición lineal de la masa, q˙1 y q˙2 las
respectivas velocidades,mla masa;C2( ˙q2)es dada por (32),C2c,C2s, yfv2son los niveles
de la fricción de Coulomb, estática, y viscosa divididas porm,J es el momento de inercia
de la viga,g la aceleración gravitacional, yu1 la entrada de control.
Se desea obtener una ley de controlu1para que la masamsea regulada alrededor del
valorq2d, con la posición y velocidad de la viga acotadas.
Para poder aplicar el resultado previo debemos simplificar el modelo, suponiendo
que el ángulo y velocidad de la viga son pequeños. Bajo esta condición, el sistema (64)
puede simplificarse a
¡
J+mq22 ¢
¨
q1+ 2mq2q˙1q˙2−mgq2cos (q1) = u1,
¨
q2−gq1+fv2q˙2+C2( ˙q2) sgn ( ˙q2) = 0.
En este caso tenemosσ =gq1 y el controlu1 es
u1 = 2mq2q˙1q˙2−mgq2cos (q1) + ¡
J+mq22¢τ1, (65)
dondeτ1es un nuevo control. Si proponemos un control artificial
σ∗ =−
Z t
t1
[k1x1(τ) +k2x2(τ)]dτ +c, (66)
dondex1 = q2 −q2d,x2 = ˙q2, concuna constante real, y una superficie deslizante para
diseñar el controlu1comos =gq˙1+k1x1+k2x2, una técnica clásica de modo deslizantes
produce el control
τ1 =− 1
g [k1q˙2+k2(gq1−fv2q˙2) +ksgn (s)], (67)
con k > k2C2s. Finalmente, si encontramos constantes p11, p12, p22, p23, p33, k1, k2, y
k3 =fv2que satisfagan el Teorema 18, entonces el objetivo de control será alcanzado. Lasfiguras 9 y 10 muestran algunos resultados numéricos, param= 1kg,g = 9.81
0 10 20 30 -0.4 -0.2 0 0.2 0.4 0.6
0 10 20 30 -0.4 -0.2 0 0.2 0.4 0.6
0 10 20 30 -0.5 0 0.5 1 1.5 2
0 10 20 30 -0.5 0 0.5 1 1.5 2
q q
q
1 1
t s
rad rad/s
t s
t s t s
m a) b) c) d) ( ) ( ) ( ) ( ) ( ) ( ) ( )
q 2 2
.
.
m/s ( )
Figura 9. Posiciones y velocidades del sistema masa y viga.
k2 = 1.5, yfv2 = 3N/(kg·m/s), conq1(t0) = 0.3rad,q˙1(t0) = 0rad/s,q2(t0) = 0.3 m,q˙2(t0) = 0m/s, yq2d= 0m.
IV.4 Conclusiones del capítulo
En este capítulo proponemos un controlador discontinuo para una clase de sistemas
mecáni-cos subactuados de 2 grados de libertad con fricción discontinua en la articulación no
ac-tuada. El objetivo de control es regular la variable no actuada mientras la posición y
veloci-dad de la articulación actuada permanecen acotadas. El controlador propuesto es obtenido
usando la técnica clásica de modos deslizantes, garantiza la convergencia del error de
posi-ción de la variable no actuada a cero, y es robusto con respecto a algunas incertidumbres
0 10 20 30 -20
-15 -10 -5 0 5
0 10 20 30 0
4 8 12 16 20
V
t s t s
N m
a) b)
( )
( ) ( )
u 1
Figura 10. Ley de control y funciónV del sistema masa y viga.
Como se observa en las gráficas las respuestas de los sistemas en lazo cerrado pueden
exhibir fases de “atascamiento”, debido a esto el desempeño del sistema puede ser afectado
negativamente. Sin embargo, en el siguiente capítulo se presenta una extensión de nuestros
resultados para proponer, primero, un control continuo para un sistema con fricción
discon-tinua y control pleno, y luego su aplicación al control de sistemas subactuados con fricción
Desde el punto de vista de control de sistemas mecánicos con control pleno, la
téc-nica más sencilla para contrarrestar el fenómeno de la fricción discontinua es el control
de modos deslizantes de primer orden; la fricción discontinua es considerada como una
pertubación acotada de signo impredecible y por lo tanto contrarrestada con una amplitud
adecuada del control. Sin embargo, esta clase de algoritmos de control requieren a menudo
un alto esfuerzo de control para contrarrestar este fenómeno físico, y requieren señales de
control que conmuten, teóricamente, con frecuencia infinita, por lo tanto, en general es
imposible su implementación (Boiko et al., 2004).
Se han propuesto varias técnicas para eliminar el efecto del “chaterring” (conmutación
de alta frecuencia), por ejemplo los algoritmos de control de modos deslizantes de orden
superior. Sin embargo, los procedimientos “anti-chattering”, que intentan obtener leyes de
control continuas, están en conflicto con el problema de garantizar exactitud en presencia
de fricción discontinua.
Un resultado hacia la solución de este problema fue presentado en (Bartolini y Punta,
2000a), (Bartolini y Punta, 2000b). En estos trabajos se prueba que, con una ligera
mo-dificación, un algoritmo de segundo orden en un sistema mecánico, hace que la posición y
la velocidad convergan a una posición deseada, iniciando desde cualquier punto de
“atas-camiento”. En estos artículos se considera un sistema mecánico con fricción estática y de
En este capítulo proponemos un controlador continuo para la regulación de un
sis-tema mecánico de 1 grado de libertad con fricción discontinua. El control es dinámico y
es diseñado usando el Teorema 18 del capítulo anterior (presentado también en (Martinez
y Alvarez, 2007)). Además, utilizando este control, diseñamos un controlador para un
sis-tema subactuado con fricción discontinua en la articulación no actuada. Este controlador
puede verse como una extensión de los presentados en el capítulo anterior.
V.1 Diseño de la ley control
Considere un sistema mecánico representado por
˙
y1 = y2,
˙
y2 = f1(y1+q2d, y2)−C2(y2) sgn (y2) +u, (68)
dondey1 ∈R,y2 ∈R,f1es una función suave,q2des una constante yues una entrada de
control. C2(·)es el módulo de los términos de la fricción definido por (32). Suponga que
la funciónf2(y1, y2,y˙2) =df1(y1 +q2d, y2)/dtes continua en sus argumentos.
El objetivo de control es el de conduciry1(t)yy2(t)a cero por medio de un control
continuou(t).
Note que (68) tiene la misma forma que (34). Por lo tanto, consideramos una ley de
controlucon una dinámica dada por
˙
u=ϕ(y, u). (69)
Se propone encontrarϕdiscontinua. Para esto, presentamos el siguiente lema.
Lema 19 Defínaseϕ(u,0)(y1) =ϕ(y, u), cony= (y1,0)
T, como la restricción de
ϕpara
y2 = 0. Suponga quey1 6= 0implica queϕ(u,0)(y1)6= 0. Por lo tanto, si (68)-(69) exhibe un modo deslizante en la superficieS caracterizada por y2 = 0 fuera del origeny = 0,
entonces el sistema saldrá de esta superficie en un tiempofinito.
Demostración Cuando el sistema (68) está en modo deslizante en la superficie S
fuera del origeny = 0, es descrito por
y2 = 0, f1(y1+q2d,0)−C2(0) sgn(0) +u= 0.
Bajo esta condición,u˙ = ϕ(¯y, u), cony¯= (y1,0),y1 6= 0, es diferente de cero. De (32),
C2(0) =C2s, por lo tanto
u+f1(y1+q2d,0)∈/ [−C2s, C2s], f1(y1+q2d,0)−C2(0) sgn(0) +u6= 0. (70)
en un tiempofinito.
Si definimos x1 = y1, x2 = y2 y x3 = f1(y1+q2d, y2) −C2(y2) sgn (y2) + u,
entonces el sistema (68)-(69) puede ser representado por
˙
x = g(t, x),
x¡t+bk¢ = x¡t−ak¢+∆xk, k∈K, (71)
dondex= (x1, x2, x3)T,
g(t, x) =
x2 x3 f2(x1, x2, x3) + 2(C2vs−2C2c)
2s |x2|exp
³ −x22
v2 2s
´
x3+ ˙u
, (72)