Control of underactuated mechanical systems with discontinuous frictionControl de sistemas mecánicos subactuados con fricción discontinua

(1)

Y APROBADA POR EL SIGUIENTE COMITÉ

Dr. Joaquín Álvarez Gallegos Director del Comité

Dr. Iouri Orlov Kuchina Dr. Luis Alejandro Marquez Martínez Miembro del Comité Miembro del Comité

Dr. Jaime Álvarez Gallegos Dr. Luis Tupak Aguilar Bustos Miembro del Comité Miembro del Comité

Dr. Luis Alejandro Marquez Martínez Dr. David Hilario Covarrubias Rosales Coordinador del programa de posgrado

en Electrónica y Telecomunicaciones

Encargado del Despacho de la Dirección de Estudios de Posgrado

(2)

PROGRAMA DE POSGRADOEN CIENCIAS EN ELECTRÓNICAY TELECOMUNICACIONES

CONTROL DE SISTEMAS MECÁNICOS SUBACTUADOS CON FRICCIÓN DISCONTINUA

TESIS

que para ubrir parialmente losrequisitos neesariospara obtenerelgrado de DOCTOREN CIENCIAS

Presenta:

ROQUE MARTÍNEZORTIZ

(3)

Ensenada, Baja California, México. Diciembre de 2007.

CONTROL DE SISTEMAS MECÁNICOS SUBACTUADOS CON FRICCIÓN DISCONTINUA

Resumen aprobado por:

__________________________ Dr. Joaquín Álvarez Gallegos

Director de tesis

Es frecuente que en el diseño de controladores para sistemas mecánicos subactuados se considere despreciable un fenómeno físico no lineal y no suave o duro: la fricción. La presencia de este fenómeno puede producir comportamientos dinámicos no tradicionales como intervalos de equilibrios, variedades deslizantes, ciclos límite, bifurcaciones y caos.

En años recientes, algunos trabajos en el campo del control de sistemas subactuados se han dirigido al problema de la fricción en las articulaciones. Sin embargo, estos esfuerzos se han concentrado en el problema de fricción viscosa.

En esta tesis proponemos controladores para sistemas mecánicos subactuados de 2 g.d.l. con fricción discontinua. Los controladores llevan la articulación no actuada a la posición deseada sin cancelar directamente este fenómeno físico, y son robustos con respecto a algunas incertidumbres en los coeficientes de los términos discontinuos. Los controladores son diseñados utilizando la técnica de control por modos deslizantes, algunos resultados que extienden la teoría de estabilidad de Lyapunov y las condiciones para tener estabilidad en tiempo finito de una clase de sistemas discontinuos con incertidumbres presentadas recientemente. Las leyes de control obtenidas son discontinuas o híbridas.

Otra aportación es un control continuo para sistemas mecánicos con fricción discontinua y control pleno obtenido utilizando los resultados anteriores.

Ilustramos estos procedimientos con ejemplos numéricos y físicos.

(4)

CONTROL. Ensenada, Baja California, México. December 2007.

CONTROL OF UNDERACTUATED MECHANICAL SYSTEMS WITH DISCONTINUOUS FRICTION

Works in the field of underactuated mechanical control have commonly neglected a nonlinear and nonsmooth, physical phenomenon: friction. This phenomenon may produce nontraditional dynamics as equilibrium intervals, sliding modes, limit cycles, bifurcations, and chaos.

In recent years, several works have addressed the problem of friction in the underactuated mechanical systems. However, these efforts have been concentrated to cope only with viscous friction.

In this thesis, we propose controllers for 2-DOF underactuated mechanical systems with discontinuous friction. The control objetive is that of steering the unactuated joint to a desired position. The proposed controllers do not cancel this physical phenomenon directly, and they are robust with respect to some uncertainty in the discontinuous friction coefficients. The controllers are designed using the classic technique of sliding modes, some results that extend the Lyapunov stability, and the conditions to have finite time stability of a class of uncertain switched systems presented recently. The control laws are discontinuous or hybrid.

Another contribution is the design of a continuous control for a class of mechanical systems with discontinuous friction and full control using the results mentioned before.

We illustrate these procedures with numerical and physical examples.

(5)

(6)

A mi familia, como siempre.

Al Dr. Joaquín Álvarez Gallegos por todo.

A los Doctores Iouri Orlov Kuchina, Luis Alejandro Márquez Martínez, Jaime Álvarez Gallegos y Luis Tupak Aguilar Bustos.

Al Centro de Investigación Científica y de Educación Superior de Ensenada.

(7)

Página

I. Introducción . . . .1

I.1 Antecedentes . . . 3

I.2 Objetivos . . . 5

I.3 Contenido de la tesis . . . 6

II. Preliminares matemáticos . . . 7

II.1 Definición del convexo más simple . . . .8

II.2 Estabilidad en el sentido de Lyapunov . . . .11

II.3 Estabilidad equiuniforme . . . .14

II.4 Sistemas mecánicos subactuados . . . .17

III. Control de un manipulador planar subactuado con fricción . . . 18

III.1 Diseño de la ley de control . . . .18

III.2 Aplicación . . . 22

III.3 Conclusiones del capítulo . . . .23

IV. Control de sistemas subactuados con fricción discontinua I . . . .25

IV.1 Planteamiento de problema . . . 25

IV.2 Resultado principal . . . .29

IV.3 Aplicaciones . . . .34

IV.4 Conclusiones del capítulo . . . .39

V. Control continuo de sistemas discontinuos . . . .41

V.1 Diseño de la ley de control . . . .42

V.2 Aplicaciones . . . .45

(8)

Página

VI. Control de sistemas subactuados con fricción discontinua II . . . .49

VI.1 Planteamiento del problema . . . .49

VI.2 Resultado principal . . . .51

VI.3 Aplicación . . . 54

VI.4 Conclusiones del capítulo . . . .58

VII. Conclusiones . . . 59

VII.1 Trabajo futuro . . . .60

(9)

Figura Página

1. Interpretación geométrica de la definición de solución del convexo más simple. . . . 10

2. Intersección de superficies de discontinuidad. . . 11

3. Manipulador planar subactuado. . . 19

4. Posiciones y ley de control del manipulador.. . . 24

5. Sistema masa-resorte-amortiguador. . . 35

6. Posiciones y velocidades del sistema masa-resorte-amortiguador. . . 36

7. Ley de control y funciónV para el sistema masa-resorte-amortiguador. . . 37

8. Sistema masa y viga. . . 37

9. Posiciones y velocidades del sistema masa y viga. . . 39

10. Ley de control y funciónV del sistema masa y viga. . . 40

11. Oscilador mecánico. . . 45

12. La posición y velocidad del oscilador mecánico. . . 46

13. Entrada de control y funciónV para el oscilador mecánico. . . 47

14. Posiciones y velocidades del sistema masa-resorte-amortiguador. . . 48

15. Péndulo horizontal. . . 55

16. Posiciones y control del péndulo horizontal. . . 56

(10)

Aunque la mecánica es un tema clásico cuyo estudio data desde la antigüedad,

mu-chos problemas, viejos y nuevos, siguen atrayendo la atención. En años recientes, muchas

aplicaciones en el control de sistemas mecánicos acentúan cuestiones que fueron ignoradas

en planteamientos clásicos, como son: dinámica elástica, fuerzas de fricción, etc.

De manera simple, un sistema mecánico es una colección de elementos materiales

formalmente organizados interactuando a través de fuerzas que producen varios

movimien-tos en respuesta a fuerzas y pares de torsión externos diferentes. Así, un sistema mecánico

se puede ver como un sistema de control con las fuerzas externas como las entradas, las

variables que describen los movimientos de los elementos del sistema como los estados, y

las dinámicas que son determinadas por la interacción de fuerzas actúan como puentes entre

variables y entradas. Las salidas de un sistema mecánico son funciones de sus estados.

En Seto y Baillieul (1994), dependiendo del número de entradas y el número de los

grados de libertad del sistema mecánico, se define el llamado sistema mecánico subactuado

o superarticulado como un sistema mecánico controlado en el cual la dimensión del espacio

de configuración excede la dimensión del espacio de la entrada de control.

El problema del control de sistemas subactuados está motivado por numerosas

apli-caciones prácticas. En primer lugar se esgrime el sólido argumento de la economía de

diseño; por ejemplo, un avión es un sistema subactuado. Otras aplicaciones surgen por la

propia disposición física del sistema; por ejemplo, en el diseño de vehículos submarinos,

(11)

En general, un sistema mecánico subactuado presenta desafíos que no se encuentran

en un sistema con control pleno en el cual la dimensión del espacio de configuración es

igual a la dimensión del espacio de la entrada de control. La controlabilidad, por ejemplo,

que es normalmente implícita en un sistema con control pleno, al menos localmente, no es

determinada fácilmente en un sistema subactuado. La síntesis del control para un sistema

subactuado también es más compleja que para un sistema con control pleno.

Las dinámicas bajo restricción constituyen una propiedad interesante de los sistemas

mecánicos subactuados. Las restricciones pueden ser expresadas como ecuaciones

diferen-ciales con las coordenadas generalizadas y sus derivadas con respecto al tiempo

(veloci-dades y/o aceleraciones). Si la restricción es no integrable es llamada no holonómica.

Las restricciones no holonómicas son clasificadas como cinemáticas y dinámicas.

Las cinemáticas restringen geométricamente la dirección de movilidad del sistema,

mien-tras que las dinámicas son debidas al equilibrio dinámico en el grado de libertad pasivo

donde no es aplicada una fuerza o par de torsión (Arai et al., 1998).

El péndulo invertido, el sistema bola y viga y el manipulador con articulación

elás-tica, que son sistemas mecánicos subactuados clásicos, son sistemas holonómicos (Seto y

Baillieul, 1994).

Un simple disco sobre una superficie (Török, 2000), robots móviles (Kolmanovsky y

McClamroch, 1995) y vehículos articulados (Jiang y Nijmeijer, 1999) son sistemas

mecáni-cos que tienen restricciones no holonómicas cinemáticas. Ejemplos de sistemas

(12)

inte-grables (Reyhanoglu et al., 1999) incluyen robots manipuladores subactuados (Oriolo y

Nakamura, 1991), vehículos marinos subactuados (Do et al., 2002) y el Acrobot (Spong,

1995).

Es frecuente que en el diseño de controladores para sistemas mecánicos se

con-sidere despreciable un fenómeno físico no lineal y no suave o duro: la fricción. En

tri-bología, la fricción seca (fricción discontinua) es definida como una fuerza que se opone

al movimiento relativo entre dos superficies de diferentes cuerpos en contacto. Los

cuer-pos se “atascan” (“stick”) cuando la velocidad relativa entre las superficies en contacto es

cero. Si los cuerpos se deslizan con velocidad relativa no cero, decimos que se “resbalan”

(“slip”). Un modelo de fricción seca debe describir la fase de stick y slip (Leine, 2000).

La acción de la fricción discontinua puede ser descrito por medio de inclusiones

diferen-ciales o ecuaciones diferendiferen-ciales ordinarias con lado derecho discontinuo (Utkin, 1992),

(Filippov, 1988).

La presencia de discontinuidades en sistemas mecánicos pueden producir

compor-tamientos dinámicos no tradicionales como intervalos de equilibrios, variedades deslizantes,

ciclos límite, bifurcaciones y caos (Armstrong y Amin, 1996). Por lo tanto, surge la

necesi-dad de analizar la varienecesi-dad de estados estacionarios que pueden presentar y diseñar

estrate-gias de control que corrijan el comportamiento no deseado.

I.1 Antecedentes

Algunos artículos representativos que analizan algunos problemas acerca de sistemas

(13)

equilibrio por medio de técnicas de pasividad (Ortega et al., 2002) y moldeo de energía

(Bloch et al., 2000), estabilización y seguimiento de trayectorias por medio de control

“backstepping” (Seto y Baillieul, 1994), el uso de restricciones virtuales para producir

os-cilaciones estables (Shiriaev et al., 2005), planificación de trayectorias (Bullo y Lynch,

2001), y control de sistemas mecánicos con una variable no actuada cíclica (Grizzle et

al., 2005), entre otros.

Comúnmente los trabajos en el campo del control de sistemas mecánicos

subactua-dos ignoran el efecto de la fricción. Los términos de fricción no son modelasubactua-dos y los

algoritmos se reducen a resolver el problema de control para un modelo en lazo abierto sin

fricción, esperando que la disipación física ayude, de alguna manera, a alcanzar el punto

de equilibrio deseado. Sin embargo, en años recientes algunos trabajos se han dirigido al

problema de la fricción. En Gómez-Estern y van der Shaft (2004), Woolsey et al. (2001),

Woolsey et al. (2004) se considera fricción lineal (fricción viscosa) en las articulaciones de

sistemas subactuados.

En Woolsey et al. (2001) se describe el efecto de la disipación física en la

estabi-lidad de un equilibrio, estable en ausencia de la fricción, con el método de lagrangianos

controlados. En ese trabajo se sugiere el uso de retroalimentación de amortiguamiento para

estabilizar exponencial y localmente una clase de sistemas lagrangianos controlados. En

Gómez-Estern y van der Shaft (2004) fue extendida la técnica (IDA-PBC) para sistema

mecánicos subactuados para incorporar amortiguamiento en lazo abierto. Además, en este

(14)

de amortiguamiento en presencia de aproximaciones suaves de los efectos de la fricción de

Coulomb.

Para sistemas mecánicos subactuados con fricción discontinua sólo en las

articula-ciones actuadas, el problema de compensación, en algunos casos, puede ser resuelto

u-sando control discontinuo (Riachy et al., 2006). Sin embargo, el problema importante de

control de sistemas mecánicos subactuados con fricción discontinua en las articulaciones

no actuadas aún sigue abierto.

En este trabajo de tesis se proponen varias técnicas para controlar sistemas mecánicos

de esta clase.

I.2 Objetivos

El objetivo general de este trabajo es contribuir a resolver el problema de control de

sis-temas mecánicos subactuados que presentan fricción discontinua en las articulaciones no

actuadas.

Los objetivos particulares de este trabajo son:

• Diseñar leyes de control para regular la articulación no actuada de un manipulador

planar subactuado de 2 grados de libertad (g.d.l.), cuando éste presenta fricción

viscosa y de Coulomb en las dos articulaciones.

• Diseñar leyes de control para regular la articulación no actuada, para algunas

clases de sistemas mecánicos subactuados de 2 g.d.l. con fricción discontinua en la

(15)

Consideramos que éstos son dos casos típicos encontrados en prototipos mecánicos

(los cuales exhiben un comportamiento dinámico desplegado por mecanismos más

compli-cados). En esta tesis, los sistemas considerados son prototipos mecánicos.

I.3 Contenido de la tesis

Puesto que en esta tesis se considerarán sistemas mecánicos subactuados con fricción

dis-continua, en el Capítulo II se da la definición de solución para ecuaciones diferenciales

ordinarias con términos discontinuos en el lado derecho y de algunos conceptos de

estabi-lidad utilizados a lo largo de la tesis. Además, se presenta la definición formal de sistema

mecánico subactuado considerada en esta tesis.

En el Capítulo III proponemos un primer controlador para un sistema mecánico

sub-actuado de 2 g.d.l. con fricción viscosa y de Coulomb en las dos articulaciones. Este

sistema es un manipulador planar. El controlador es diseñado utilizando la técnica de

con-trol por modos deslizantes.

Un procedimiento de diseño de controladores para una clase de sistemas

mecáni-cos subactuados con fricción discontinua en la articulación no actuada se presentan en los

capítulos IV y V. Además, en el Capítulo V se propone un control continuo para sistemas

mecánicos con fricción discontinua y control pleno.

Resultados recientes en sistemas discontinuos con incertidumbres son utilizados en el

Capítulo VI, para diseñar un controlador para otra clase de sistemas mecánicos subactuados

con fricción discontinua.

(16)

Muchos sistemas físicos pueden ser descritos por la ecuación de estado

˙

x=f(t, x), (1)

dondex ∈ Rn es el vector de estado con la condición inicial x(t0) = x0, x˙ = dx/dt y

f :_R_×_Rn

→Rn_{es un campo vectorial.}

La existencia y unicidad de las soluciones de (1) son esenciales para que esta ecuación

sea un modelo matemático útil de un sistema físico. A continuación se presentan las

condi-ciones para garantizar la existencia y unicidad de solucondi-ciones de (1) en el sentido usual.

Teorema 1 (Existencia y unicidad de solución local)(Khalil, 2002) Seaf(t, x)una

fun-ción continua a tramos enty que satisface la condición de Lipschitz

kf(t, x)₋f(t, y)_k_≤L_kx₋y_k (2)

∀x, y _∈ B = _{x_∈_Rn_|kx₋y_k< r_},_∀t _∈ [t0, t1]. Entonces existe algunaδ > 0tal que la ecuaciónx˙ =f(t, x)conx(t0) =x0 tiene solución única sobre[t0, t0+δ].

Teorema 2 (Existencia y unicidad de solución global) (Khalil, 2002) Sea f(t, x) una

función continua por tramos ent que satisface (2)_∀x, y _∈ _Rn,_∀t _∈ [t0, t1]. Entonces la

ecuaciónx˙ =f(t, x)conx(t0) =x0tiene solución única sobre[t0, t1].

Los sistemas bajo estudio en esta tesis se pueden describir por medio de la ecuación

(1) donde ahoraf es una función continua a tramos en un dominioG;x _∈ _Rn_y_M _{es un}

(17)

Para analizar esta ecuación es necesario investigar la existencia y unicidad de sus

soluciones. A continuación se presenta una definición de solución más general, presentada

en (Filippov, 1988), y que será utilizada a lo largo de esta tesis.

II.1 Definición del convexo más simple

Considérese que para cada punto (t, x) _∈ G, el conjunto F(t, x) es el conjunto

cerra-do convexo más simple conteniencerra-do tocerra-dos los valores límite de la función f(t, x∗) para

(t, x∗₎_∈_/ _M,_x∗ _→_x,_t ₌_const.

Entonces, una solución de la ecuación (1) es llamada una solución de la inclusión

diferencial

˙

x_∈F(t, x), (3)

es decir, una función absolutamente continuax(t)definida en un intervalo o en un segmento

I para el cual x˙(t) _∈ F (t, x(t)) casi donde sea en I. Puesto que M es un conjunto de

medida cero, entonces para casi todot_∈Ila medida de la sección transversal del conjunto

M por el plano t =const es igual a cero. Para tal t el conjunto F(t, x) es definido para

todo(t, x)_∈G.

En puntos de continuidad de la funciónfel conjuntoF consiste de un puntof(t, x), y

la solución satisface la ecuación (1) en el sentido usual. Si el punto(t, x)_∈Mse encuentra

en la frontera de la sección transversal de dos o varios dominiosG1, ..., Gkintersectada por

(18)

con vérticesfi(t, x), i_≤k,donde

fi(t, x) = lim (t,x∗)∈Gi,x∗→x

f(t, x∗). (4)

Todos los puntosfi(t, x) (i= 1, ..., k)están contenidos enF(t, x), pero no es

nece-sario que todos ellos sean vértices.

Considérese el caso donde la función f(t, x)es discontinua en una superficie suave

Sdefinida por la ecuaciónϕ(x) = 0. La superficieSdivide su vecindad en el espacioxen

los dominiosG− _y_G+_{. Para} _t ₌_{const y para el punto}_x∗ _{aproximándose al punto}_x _∈ _S

desde los dominiosG−yG+, definimos los valores límite de la funciónf(t, x∗)como

f−(t, x) = lim

x∗_∈_G−_,x∗_→_xf(t, x

∗₎_, _f+₍_{t, x}_{) =} _lim

x∗_∈_G+_,x∗_→_xf(t, x

∗₎_. ₍₅₎

Entonces el conjuntoF(t, x)es un segmento lineal que une los puntosfinales de los

vectoresf−(t, x)yf+(t, x)que inician en el puntox.

Si parat1 < t < t2 este segmento se encuentra en un lado del planoP tangente a la

superficie en el puntox, las soluciones para estostpasan de un lado de la superficieS al

otro (Figura 1(a)).

Si este segmento intersecta el planoP, el punto de intersección es el puntofinal del

vector f0₍_{t, x}₎ _{que determina la velocidad de movimiento} _x_˙ ₌ _f0₍_{t, x}₎ _{a lo largo de la}

superficieSen el espaciox(figura 1(b)). Esto significa que la funciónx(t)que satisface la

ecuación

˙

x=f0(t, x) (6)

es una solución de la ecuación (1) por la definición (3). Sif0

6

=f−_,_f0

6

(19)

Figura 1. Interpretación geométrica de la definición de solución del convexo más simple.

intervalo de tiempo bajo consideración se encuentra en el dominioG− _{(o en}_G+₎

satisfa-ciendo la ecuación (1), y en el resto del intervalo se encuentra en la superficieS

satisfacien-do la ecuación (6) es, desde luego, también una solución de la ecuación (1) en el sentisatisfacien-do de

la definición (3).

Si todo el segmento con los puntosfinales def−_y_f+_{se encuentra en el plano}_P,_la

velocidadf0_,_{del movimiento a lo largo de la super}_fi_cie_S,_{no es única.}

Con base en la definición (3), podemos encontrar también la velocidad de movimiento

a lo largo de la intersección de superficies de discontinuidad (Figura 2). Esta velocidad

puede ser única o no, dependiendo de si el conjunto F(t, x) tiene uno o más puntos

co-munes con la tangente a esta intersección.

A continuación presentamos los conceptos de estabilidad manejados en esta tesis,

definidos con respecto a los puntos de equilibrio establecidos por esta definición de

(20)

Figura 2. Intersección de superficies de discontinuidad.

II.2 Estabilidad en el sentido de Lyapunov

El método directo de Lyapunov, que prueba si un punto de equilibrio es estable en el sentido

de Lyapunov, se presenta de la siguiente manera (Qu, 1998), (Khalil, 2002).

Considere que el sistema (1) tiene como equilibrio al origenxe= 0 _∈_Rn_.

Definición 3 El punto de equilibrioxe = 0de (1) es:

• Estable al tiempo t0 si, para cadaε > 0, existe una constanteδ > 0que puede depender det0 yεtal que

kx(t0)k<δ(t0,ε) =⇒kx(t)k≤ε, ∀t≥t0.

Es uniformemente estable en [t0,∞) si, para cada ε > 0, el valor de δ es

independiente del tiempo inicialt0.

• Inestable si no es estable.

Definición 4 El punto de equilibrio xe = 0 se dice ser atractivo al tiempo t0 si, para

algunaδ>0y cadaε>0, existe un intervalo de tiempofinitoT(t0,δ,ε)tal que

(21)

Es uniformemente atractivo en[t0,∞)si para todoε, que satisface0<ε<δ, el intervalo

de tiempofinito es independiente del tiempo inicialt0.

Definición 5 Un punto de equilibrioxe = 0es asintóticamente estable al tiempot0 si es

estable al tiempot0 y si es atractivo, o equivalentemente si existe algunaδ > 0 tal que

kx(t0)k < δ implica quex(t) → 0 cuandot → ∞. Es uniformemente asintóticamente estable en[t0,∞)si éste es uniformemente estable en[t0,∞)y six= 0es uniformemente

atractivo.

Definición 6 El punto de equilibrioxe= 0al tiempot0 es exponencialmente atractivo si,

para algunaδ >0existen constantesα(δ)>0yβ >0tal que

kx(t0)k<δ=⇒kx(t)k≤α(δ)e−β(t−t0).

Es exponencialmente estable si, para alguna δ > 0 existen dos números estrictamente

positivosαyβ tales que

kx(t0)k<δ =⇒kx(t)k≤α(δ)kx(t0)ke−β(t−t0).

Definición 7 Una función continuaγ₀ :_R+

→R+_{es una función de clase}_k_si_γ

0(0) = 0 y si es estrictamente monótona creciente. Se dice que es de clasek_∞siγ₀(p)_{→ ∞}cuando

p_{→ ∞}.

Definición 8 Una funciónV(t, x) : _R_×_Rn _→ _Rse llama localmente definida positiva

si existe una función de clasek,γ₁ : _R+

→ R+_{, tal que para alguna vecindad del origen}

Ω_⊂_Rn_{se cumple que}

(22)

La función V(t, x) se dice localmente decreciente si existe una función de clase k, γ2 :

R+

→R+_{tal que, para alguna vecindad alrededor del origen}_Ω

⊂Rn_{se satisface}

V(t, x)_≤γ2(kx(t)k), ∀(t, x)∈Ω×R +

.

La palabra “localmente” es reemplazada por “globalmente” si Ω = _Rn_{. La función}

V(t, x)es radialmente no acotada siγ1es una función de clasek∞.

Definición 9 Una funciónV(t, x(t)) : _R_×_Rn _→ _R es una función candidata de

Lya-punov si es continuamente diferenciable y si

• Para concluir estabilidad,V(t, x(t))debe ser definida positiva.

• Para concluir estabilidad asintótica o estabilidad exponencial,V(t, x(t))debe ser

definida positiva y decreciente.

• Para concluir estabilidad global,V(t, x(t))debe ser globalmente definida positiva

y radialmente no acotada.

• Para concluir estabilidad asintótica uniforme y global o estabilidad exponencial

global,V(t, x(t))debe ser globalmente definida positiva, globalmente decreciente y

radialmente no acotada.

Teorema 10 Considere la ecuación (1) tal que, para cualquier conjunto acotado_D_⊂Rn

la función f(_·) mapea _D×_R+ _{a conjuntos acotados en}

Rn_{. Suponga que la derivada}

(23)

(t, x(t))_∈_R+_×Ωse tiene que

˙

V(t, x(t))_{≤ −}γ₃(_kx(t)_k),

dondeγ3(·)es continua y no negativa, conγ3(0) = 0. Entonces el equilibrioxedel sistema

tiene las siguientes propiedades de estabilidad:

• Es global o localmente uniformemente estable siγ3 es semidefinida positiva.

• Es uniforme y asintóticamente estable en forma global o local si γ₃ es definida

positiva.

• Es exponencialmente estable en forma local o global siγ₃(_kx(t)_k)_≥λV(t, x)para alguna constanteλ > 0o si γi(kx(t)k) = λikx(t)k

2

parai = 1,2,3y algunas

constantes positivasλi.

• Es exponencialmente estable en forma global o local con convergencia en tiempo

finito siγ₃(_kx(t)_k)_≥λV(t, x)P _{para constantes}_λ_>₀_y₀_{< p <}₁_.

II.3 Estabilidad equiuniforme

En esta tesis, además de la ecuación (1) consideraremos su versión perturbada

˙

x=f(t, x) +ψ(t, x), (7)

dondeψes una función continua a tramos cuyos componentesψ_i, ...,ψ_nson acotados local

y uniformemente dentro de una bolaBδ, con centro en el origen con radioδ; es decir,

(24)

para casi todo(t, x) _∈ Bδ _×_Ry algunas constantesMi _≥ 0. A continuación se presenta

un concepto de solución para esta ecuación diferencial con incertidumbres (Orlov, 2005).

Definición 11 Una función absolutamente continua x(_·), definida en un intervalo I, es

una solución de la ecuación diferencial con incertidumbres (7)-(8) si y sólo si es una

solu-ción de (7) en el intervalo I en el sentido de Filippov para alguna función continua a

tramosψsujeta a (8).

Se debe señalar que el sistema con incertidumbres (7)-(8) puede ser representado

como una inclusión diferencial de la forma

˙

x_∈F(t, x) +Ψ, (9)

dondeF(t, x)es la construida de acuerdo a la definición de solución de Filippov, Ψes el

producto Cartesiano de los intervalosΨi = [−Mi, Mi], i= 1, ..., n, y el conjunto

F(t, x) +Ψ=_{f+ψ:f _∈F(t, x),ψ_∈Ψ_}.

Ahora se presenta el concepto de estabilidad equiuniforme (Orlov, 2005).

Definición 12 El punto de equilibrio x = 0 del sistema con incertidumbres (7)-(8) es

equiuniformemente estable si y sólo si para cada t0 ∈ R,ε > 0, existe δ = δ(ε) > 0,

dependiendo deε e independiente det0 yψ, tal que cada soluciónxψ(·, t0, x0)de (7)-(8)

con el dato inicialx0 =x(t0)∈Bδ existe en el intervalo de tiempo semi-infinito[t0,∞)y

satisface la desigualdad

°

(25)

equiuniforme y asintóticamente estable si es equiuniformemente estable y la convergencia

lim

t→∞ °

°xψ¡t, t0, x0¢°°= 0 (10)

se cumple para toda soluciones de (7)-(8) iniciando dentro de algunaBδ, uniformemente en

el dato inicialt0yx0, y todas las solucionesxψ(·, t0, x0). Si esta convergencia permanece

en vigor para cadaδ>0, el punto de equilibrio es global, equiuniforme y asintóticamente

estable.

global, equiuniformemente estable en tiempo finito si, además de la estabilidad global,

equiuniforme y asintótica, la relación límite

xψ¡t, t0, x0 ¢

= 0 (11)

se cumple para cada soluciónxψ(·, t0, x0)y todat ≥t0+T(t0, x0), donde la función de

ajuste de tiempo

T(t0, x0) = sup xψ(·,t0,x0)

inf©T _≥0 :xψ¡t, t0, x0 ¢

= 0 para todot _≥t0+T

ª

(12)

es tal que

T(Bδ) = sup

t0∈R,x0∈Bδ

T(t0, x0)<∞ paraδ >0.

En la siguiente sección se presenta la definición formal de sistema mecánico

(26)

II.4 Sistemas mecánicos subactuados

La comunidad de control de sistemas mecánicos ha dividido sus líneas de trabajo en dos

enfoques con un alto grado de paralelismo: los sistemas lagrangianos y los sistemas

hamil-tonianos. Pese existir una equivalencia entre ambos enfoques y poder expresar el modelo

lagrangiano en forma hamiltoniana, las formulaciones han sido generalizadas hasta el punto

en que no es evidente su equivalencia, y por lo tanto tampoco son intercambiables las

téc-nicas de control desarrolladas en uno u otro enfoque.

En esta tesis se propondrán controladores para sistemas mecánicos subactuados

la-grangianos de 2 grados de libertad con fricción discontinua en las articulaciones.

Formal-mente se dice que son subactuados los sistemas dengrados de libertad yr < nactuadores

cuyas ecuaciones de Lagrange toman la forma

d dt

µ

∂_L ∂qi˙

¶

− ∂_∂_qiL +ff i = ui, i= 1, ..., r (13)

d dt

µ

∂_L ∂qi˙

¶

− ∂_∂_qiL +ff i = 0, i=r+ 1, ..., n (14)

con

L=T(q1, ..., qn,q˙1, ...,qn˙ )−V(q1, ..., qn)

dondeqi,i = 1, ..., n, son las coordenadas generalizadas del sistema,ff i,i = 1, ..., nson

términos discontinuos debidos a las fricciones discontinuas,_Les la función de Lagrange,

T(q,q˙)yV(q)es la energía cinética y potencial respectivamente.

En el siguiente capítulo, se presenta un controlador para un manipulador planar

(27)

fricción

En este capítulo proponemos un controlador para un manipulador planar subactuado

de 2 g.d.l., con movimiento sólo en el plano horizontal, con fricción viscosa y de Coulomb

en las dos articulaciones. El controlador no cancela directamente este fenómeno físico ni

requiere los valores exactos de los coeficientes de fricción de Coulomb. La articulación

no actuada es llevada a la posición deseada mientras que la actuada terminará en una

posi-ción desconocida. El controlador es diseñado utilizando la técnica de control por modos

deslizantes y se concluye estabilidad asintótica local del punto de equilibrio deseado.

III.1 Diseño de la ley de control

Considere el manipulador planar subactuado de 2 eslabones (Figura 3) con movimiento

sólo en el plano horizontal, con fricción viscosa y de Coulomb en las dos articulaciones.

Las ecuaciones dinámicas que modelan el sistema pueden presentarse como:

M(q)¨q+C(q,q˙) ˙q+ff( ˙q) =u (15)

donde

q =

· q1 q2

¸

, u=

· u1

0

¸ ,

M(q) =

·

θ1+θ2+ 2θ3cos(q2) θ2+θ3cos(q2)

θ2+θ3cos(q2) θ2

¸ ,

C(q,q˙) =θ3sen(q2) ·

−q˙2 −q˙2−q˙1 ˙

q1 0

(28)

Figura 3. Manipulador planar subactuado.

ff( ˙q) =

·

ff1( ˙q1) ff2( ˙q2)

¸

=

·

fv1q˙1+fc1sgn( ˙q1) fv2q˙2+fc2sgn( ˙q2)

¸ ,

sgn(z) =

  

1 , paraz >0,

[₋1,1], paraz = 0, −1 , paraz <0;

(16)

con

θ1 = m1l2c1+m2l21+I1 θ2 =m2lc22+I2 θ3 =m2l1lc2

θ4 = m1lc1+m2l1 θ5 =m2lc2

yfvi >0,fci >0,parai = 1,2,son los coeficientes de la fricción viscosa y.de Coulomb

presente en la articulación 1 y 2, respectivamente.

El objetivo de control es regular la posición del eslabón2para quesen(q1 +q2) = 1

(29)

El controlu1será diseñado usando la técnica de control por modos deslizantes clásica.

Note que si sen(q1 +q2) = 1 y q˙1 = ˙q2 = 0, entoncescos (q1+q2) = ˙q1 = 0y,

puesto que₋sen(q1 +q2)( ˙q1+ ˙q2) = 0,q˙2 = 0.

Si la superficie deslizante tiene la forma

s= ˙q1−k1cos (q1+q2), (17)

dondek1 es una constante positiva, entonces la ecuación de la articulación no actuada del

sistema, en el estadox = (x1, x2)

T_{, donde}

x1 =q1+q2 yx2 = ˙q1 + ˙q2, se puede escribir como

˙

x1 = x2,

˙

x2 =

1

m2lc22+I2

[m2l1lc2k1cos (q2) sen (x1)x2

−m2l1lc2k1sen (q2) cos (x1) ˙q1−fv2x2

+fv2k1cos (x1)−fc2sgn (x2−k1cos (x1))]. (18)

Note que sisen(x1)tiende a 1 yx2a cero cuandottiende a infinito, entoncesq˙1yq˙2tienden

a cero.

Por lo tanto, el objetivo de control se cumple si encontramos una constante k1, tal

que el punto de equilibrio(sen (x1), x2) = (1,0)de (18) sea asintóticamente estable.

Considere el sistema (18) descrito como

˙

x1 = x2,

˙

x2 =

1

m2l2c2+I2

[₋m2l1lc2k1sen (q2) cos (x1) ˙q1

(30)

dondef1 =fv2−m2l1lc2k1cos (q2) sen (x1).

Teorema 15 Suponga quek1,para una constante0<γ <2/π2,satisface

fv2 > m2l1lc2k1, (20)

fv2 > k1 ¡

m2l2c2 +I2 ¢

/(2γ), (21)

f_v2₂ > k1 £

2m2l1lc2fv2+ ¡

m2l2c2+I2 ¢

fv2 −m22l 2 1l

2 c2k1 −¡m2l2c2+I2

¢

m2l1lc2k1+ (fv2+ 2m2l1lc2k1) 2

/4¤. (22)

Entonces(sen(x1), x2) = (1,0)es un punto de equilibrio asintóticamente estable de (19)

en forma local.

Demostración Para el análisis de estabilidad, considérese la siguiente función

V1(x1, x2) = 1 2

¡

m2l2c2+I2 ¢

x2₂₋fv2k1sen (x1) +fv2k1+k2sen (x1 −π/2)x2 (23)

dondek2 =k1(m2l2c2+I2).

Para mostrar que esta función es definida positiva y radialmente desacotada en

−π/2 + 2πi_≤x1 ≤3π/2 + 2πiparai∈Z, obsérvese que

1₋sen (x1)≥γ(x1−π/2−2πi)2 (24)

y

sen (x1−π/2)x2 ≥ −|x1−π/2−2πi| |x2|. (25)

Entonces,

V1(x1, x2)≥ 1 2

·

|x1−π/2−2πi| |x2|

¸T D1

·

|x1−π/2−2πi| |x2|

¸

(31)

donde

D1 = ·

2γfv2k1 −k2 −k2 m2l2c2 +I2

¸ .

Por lo tanto, si (21) se satisface, entonces la función (23) es definida positiva y radialmente

desacotada en₋π/2 + 2πi_≤x1 ≤3π/2 + 2πiparai∈Z.

La derivada temporal de la función (23) a lo largo de las trayectorias del sistema

(19) se puede escribir como

˙

V1(x1, x2) =− ·

˙

q1 x2

¸T ·

d211 d212 d212 d222

¸ ·

˙

q1 x2

¸

−fc2|x2−q˙1| (27)

donde

d211 = fv2−m2l1lc2k1sen (q2) cos (x1),

d212 = (m2l1lc2k1sen (q2) cos (x1)−f1)/2,

d222 = f1−k2cos (x1−π/2).

Por lo tanto, si (20) y (22) se satisfacen, entonces concluimos que el punto de equilibrio

(sen (x1), x2) = (1,0)es asintóticamente estable en forma local.

En la siguiente sección presentamos la ley de control propuesta y un ejemplo numérico

para mostrar el desempeño del sistema en lazo cerrado.

III.2 Aplicación

La ley de controlu1se obtiene usando la técnica de modos deslizantes clásica. Por lo tanto,

si proponemos la función

V2(s) = 1 2s

(32)

la ley de controlu1 que nos conduce a

˙

V2(s)≤²|s|, (29)

donde² >0es una constante, es

u1 = 1

θ2 £

−θ2θ3sen (q2) ( ˙q1+ ˙q2)2−θ23cos (q2) sen (q2) ˙q12

+θ2fv1q˙1−(θ2+θ3cos (q2))fv2q˙2

−¡θ1θ2−θ23cos 2₍_q

2) ¢

(ksgn (s) +k1sen (q1+q2) ( ˙q1 + ˙q2)) ¤

(30)

donde

k >(θ2fc1+ (θ2+θ3)fc2)/ ¡

θ1θ2−θ23 ¢

.

La Figura 4 muestra los resultados numéricos para los parámetros de un Pendubot

presentado en (Block, 1996), es decir, θ1 = 0.08925 kg · m2, θ2 = 0.02763 kg ·m2,

θ3 = 0.0235kg ·m2,θ4 = 0.0112 kg·m, θ5 = 0.00294kg·m. Además, tenemos que

fv1 = fv2 = 0.2kg·m2/s,fc1 = fc2 = 0.005 N ·m,γ = 0.20,k = 0.21y, para que se cumplan las condiciones del Teorema 15,k1 = 1.

III.3 Conclusiones del capítulo

Proponemos una ley de control discontinua para un manipulador planar subactuado con

movimiento sólo en el plano horizontal, con fricción viscosa y de Coulomb en las

articu-laciones. Para el diseño del controlador usamos la técnica de modos deslizantes clásica y

concluimos estabilidad asintótica local del punto de equilibrio deseado. Esta ley de

con-trol no cancela directamente la fricción de Coulomb. Además, puesto que el coeficiente de

(33)

0 2 4 6 8 10 -2 -1 0 1 2 3

0 2 4 6 8 10 -0.2 -0.1 0 0.1 0.2 0.3

0 2 4 6 8 10 -2 -1 0 1 2 3

0 2 4 6 8 10 -1 -0.5 0 0.5 1 1.5

q q

u

1 2

t s rad

N m rad

t s

t s t s

1 q +q 1 2

rad

a)

b)

c)

d)

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

Figura 4. Posiciones y ley de control del manipulador.

Si el movimiento del sistema es en un plano vertical (Pendubot) la presencia de los

pares gravitacionales en el modelo del sistema causa una condición adicional parafv2.

El análisis y diseño de este primer controlador nos motiva a proponer leyes de

con-trol para sistemas subactuados de 2 g.d.l., que si bien no logren la regulación en ambas

articulaciones, logren la regulación en la articulación no actuada.

En el siguiente capítulo presentamos un algoritmo de control para una clase de

(34)

tinua

I

En este capítulo proponemos un controlador para una clase de sistemas mecánicos

subactuados de 2 grados de libertad con fricción discontinua en la articulación no actuada.

El objetivo de control es la regulación de la articulación no actuada mientras que la posición

y la velocidad de la actuada permanecen acotadas. Puesto que la articulación no actuada

es accionada solamente por la posición y velocidad de la actuada, las cuales son

conside-radas continuas, la primera articulación puede ser considerada como un sistema mecánico

con fricción discontinua pero con una entrada de control artificial continua dada por un

término dependiendo de la posición y velocidad de la actuada. Este “control” no puede ser

estático si pretendemos eliminar el error en estado estacionario. Por lo tanto, proponemos

un procedimiento para el diseño de un control ideal virtual y dinámico que garantice un

error en estado estacionario igual a cero, posteriormente se calculará la entrada de control

física en la articulación actuada que lleve el control virtual a su valor ideal en tiempofinito.

Finalmente ilustraremos este procedimiento con dos ejemplos numéricos.

IV.1 Planteamiento de problema

Considere un sistema mecánico subactuado representado por

¨

q1 = f0(q1,q˙1, q2,q˙2) +g0(q1,q˙1, q2,q˙2)u1,

¨

(35)

dondeq1 ∈ R, q2 ∈ R,f0, g0, f1 son funciones suaves, g0 6= 0, y u1 es una entrada de

control. C2( ˙q2) es el módulo de los términos de fricción, que en general depende de los

estados del sistema y de acciones externas, supuesto, junto con sus derivadas temporales,

acotado. Aquí, de acuerdo a modelos propuestos en algunos trabajos (Bartolini y Punta,

2000b),C2( ˙q2)puede ser expresado como

C2( ˙q2) =C2c+ (C2s−C2c) exp µ

−q˙ 2 2 v2 2s

¶

, (32)

dondeC2c yC2s son los niveles de fricción de Coulomb y el nivel de fricción estática que

pueden estar divididos por una masa constante, con 0 _≤ C2c ≤ C2s, y v2s es la

veloci-dad de Stribeck. Note que C2c ≤ C2( ˙q2) ≤ C2s. También suponemos que la función

f2(q2,q˙2,q¨2) = df1(q2,q˙2)/dt es continua en sus argumentos, y que g1 y g2 son cons-tantes. Además, suponemos queg1 6= 0y, sig2 6= 0, entonces sgn(g1) =sgn(g2).

El objetivo de control es la regulación de la variable no actuada mientras que la

posición y velocidad de la articulación actuada permanecen acotadas.

Si definimosy1 =q2−q2d, dondeq2d es la posición constante deseada,y2 = ˙q2, y

σ =g1q1+g2q˙1, (33)

entonces la articulación no actuada es descrita por la ecuación

˙

y1 = y2,

˙

(36)

Note que (34) puede ser descrito como un sistema mecánico con fricción discontinua,

una superficie de discontinuidad_S caracterizada pory2 = 0, y un control virtualσ(q1,q˙1)

que es continuo por naturaleza (excepto posiblemente cuando señales impulsivas son

per-mitidas en el control u1, un caso no considerado en la tesis). Por lo tanto, si deseamos

reducir el errory= (y1, y2) T

a cero, entonces una ley dinámica paraσpuede ser adecuada.

Por lo tanto, primero diseñaremos un control “ideal”, continuo dinámico σ∗₍_{y, t}₎

para el sistema (34) que asegure la convergencia del estado y al origen, luego

propon-dremos un control discontinuo u1 para el sistema (31) que haga el control virtual σ

con-verja en tiempofinito a σ∗_{. Denotamos este tiempo}_fi_{nito como} _t

1. Note que si el estado y(t)y la aceleracióny˙2(t)son acotados, entoncesσ∗ también será acotada (esto puede ser concluido porquef1es suave) y, de (33), la posición y velocidad de la articulación actuada

permanecen acotadas.

Considere una ley de control virtualσ∗con una dinámica dada por

˙

σ∗ =ϕ(y,σ∗). (35)

Esto es equivalente a definir un controlador dinámicoσ∗ ₌ _ψ₍_{w, y}₎_, _w_˙ ₌ _χ₍_{w, y}₎_{, con}

ψ(_·) =wyχ(w, y) =ϕ(y, w). Note queσ∗ debe ser continua, pero no necesariamenteϕ.

El sistema (34)-(35), conσ =σ∗_{, es un sistema de tercer orden con estado}₍_y

1, y2,σ∗)∈R3 el cual, debido a la presencia del término discontinuo, puede tener un conjunto no contable

y compacto como equilibrio (ver (Alvarez et al., 2000)), según la definición de punto de

equilibrio de un sistema discontinuo en el sentido de Filippov (Filippov, 1988). Bajo estas

(37)

Lema 16 Para cualquier σ∗ = ¯σ∗ _∈ _R, defínase ϕ(¯σ∗,0)(y1) = ϕ(y,σ¯∗), con y =

(y1,0)T, como la restricción de ϕpara σ∗ = ¯σ∗, y2 = 0. Por lo tanto, si y1 = 0 es la única raíz deϕ_(¯_σ∗_,₀₎ = 0, entonces todos los puntos de equilibrios del sistema (34)-(35) se

proyectan en el punto únicoy= 0en el plano(y1, y2).

Demostración Un punto de equilibrio del sistema (34)-(35) es dado por

¯

y2 = 0, f1(¯y1+q2d,0)−C2(0) sgn(0) + ¯σ∗ = 0, ϕ(¯y,σ¯∗) = 0,

lo cual implica quey¯1 = 0. Note que, de (32), tenemosC2(0) = C2s, por lo tanto

f1(q2d,0)−C2(0) sgn(0) + ¯σ∗ = 0, (36)

y siempre existe un valor realσ¯∗_{tal que, para cualquier}_q

2d∈R, satisfaceσ¯∗+f1(q2d,0)∈ [₋C2s, C2s].

Note que el resultado previo significa que, en caso de que el sistema (34)-(35) exhiba

un modo deslizante en la superficie_Sfuera del origeny= 0, entonces en un tiempofinito

el sistema abandonará esta superficie. Este tiempo puede ser de cualquier tamaño, incluso

cero o muy largo, perofinito.

Defínase ahorax1 = y1, x2 = y2,yx3 = f1(y1+q2d, y2)−C2(y2) sgn (y2) +σ∗.

Entonces el sistema (34), con el control artificial (35), es descrito parax2 6= 0, por

˙

x=

  

x2 x3 f2(x1+q2d, x2, x3) +2(C2_vs2−C2c)

2s |x2|exp

³ −x22

v2 2s

´

x3+ ˙σ∗

 

=g(t, x), (37)

dondex = (x1, x2, x3)

T_{. Note que el punto de equilibrio}

(0,0,σ¯∗₎_{del sistema (34)-(35)}

(38)

Denotamos como tak elk-ésimo tiempo de llegada de la solución del sistema

(34)-(35) a la superficie _S, y por tbk _≥ tak,k _∈ K = _{1,2, ..._}, el tiempo de salida de esta

solución de esta superficie justo después de la k-ésima llegada. Entonces tenemos una

secuencia ordenada de tiempos

t1 ≤ta1 ≤tb1 ≤· · ·≤tak ≤tbk ≤· · ·.

Cuando t1 < tak y tbk < ∞, defínase ∆xk = x ¡

t+_bk¢₋ x¡t_ak−¢, dondex¡t+_bk¢ =

limh→0x(tbk +h) yx ¡

t−_ak¢ = limh→0x(tak −h), h > 0. Entonces el sistema (34)-(35) puede ser representado por

˙

x = g(t, x),

x¡t+_bk¢ = x¡t−_ak¢+∆xk, k_∈K. (38)

Puesto que el objetivo de control es la regulación de la variable no actuada mientras la

posi-ción y velocidad de la variable actuada de (31) permanece acotadas, entonces el objetivo de

control es el de conducir a cero el estadox(t)del sistema (38) con un “control” continuo

σ∗_.

IV.2 Resultado principal

En esta sección diseñamos un control ideal continuoσ∗_{para el sistema (34), para}

posterior-mente diseñar el control real del sistema (31) tal queσ(ver (33)) converga aσ∗ en tiempo

(39)

Suposición 17 Existe una función continuaf3(t, x1, x2)tal que, si el control artificial es

dado por

σ∗ =f3(t, x1, x2), (39)

entonces (37) con (39) puede ser transformado a

˙

x=

  

x2, x3, −k1x1−k2x2−k3x3+ 2(C2_vs2−C2c)

2s |x2|exp

³ −x22

v2 2s

´ x3,

 

=g(t, x), (40)

dondek1,k2 yk3son coeficientes reales, yσ˙∗ =ϕ(y,σ∗)satisface el Lema 16.

Note quex¯= 0del sistema (40) es un punto de equilibrio. Por lo tanto, si es posible

encontrar una funciónf3 y valoresk1,k2 yk3, que lleven el estado de (38)-(40) ax¯ = 0,

entonces el objetivo de control será alcanzado. Así pues, en el siguiente teorema

establece-mos algunas condiciones sobre estos coeficientes para conseguir quelimt→∞kx(t)k = 0.

Para esto mostraremos que cualquier trayectoria del sistema (38)-(40) que llega al conjunto

S = _{x_∈_R3 :x1 6= 0, x2 = 0}, saldrá de este en un punto más cercano al origen. Note que, de (40), no se puede llegar aS con la coordenadax3igual a cero.

Considere las matricesP yQ(x)dadas por

P =



 pp1112 pp1222 pp1323 p13 p23 p33



, Q(x2) = ·

kq22 kq23 kq23 kq33

¸

, (41)

donde

kq22 = −2p12+ 2p23k2,

kq23 = −p22+p23 ·

k3−

2(C2s−C2c) v2

2s

|x2|e− ³_x

2

v₂_s

´2¸

+p33k2, (42)

kq33 = −2p23+ 2p33 ·

k3−

2(C2s−C2c) v2

2s

|x2|e− ³_x

2

v₂_s

´2¸

(40)

Teorema 18 Si la Suposición 17 se satisface, la matriz Qes definida positiva para toda

x2 ∈R, la matrizP es también definida positiva y satisface

p13 = 0, p11 p23

= p12

p33

=k1, (43)

entonces x = 0 es un punto de equilibrio estable asintótica y globalmente del sistema

(38)-(40).

Demostración Primero mostraremos que, cuando el sistema (38)-(40) llega al

con-juntoS en tiempotak, entonces sale de este conjunto en tiempotbk _≥ tak desde un punto

más cercano al origen. Note que

∆x1k = x1(tbk+)−x1(t−ak) = 0,

∆x2k = x2(t_bk+)−x2(t−_ak) = 0.

Por lo tanto, para probar esta parte basta mostrar que¯¯x3(t+_bk) ¯

¯ < ¯¯x3(t−_ak) ¯

¯. Note

tam-bién que (40) describe la dinámica del sistema (38) fuera de la superficie de

discon-tinuidad _S = _{x_∈_R3 _:_x

2 = 0}, la cual divide el espacio de estado en dos dominios, G±₌_{_x_∈_R3 _:_x

2 ≷0}. Lo que es más, la tercera coordenadax3está dada por

x3(t) = ˙x2(t) =− Z t

t1

[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ−C2(x2) sgn (x2)+c1 ,φ(t), (44)

dondec1es una constantefinita. Entonces tenemos

φ+(tak) = ₋

Z tak

t1

[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ − lim x∗

2∈G+,

x∗2→0

[C2(x∗2) sgn (x∗2)] +c1

= ₋

Z tak

t1

(41)

y

φ−(tak) = ₋

Z tak

t1

[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ− lim x∗

2∈G−,

x∗

2→0

[C2(x∗2)] sgn (x∗2) +c1

= ₋

Z tak

t1

[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ+C2s+c1. (46)

Suponga primero que un modo deslizante no ocurre en la superficie_S, entoncestbk =

tak y las trayectorias del sistema cruzan la superficie. Para esto, los campos vectoriales en

tiempot+_bk yt−_ak debe tener una componente en la misma dirección en el ejex2; así ¯

¯ ¯ ¯−

Z tak

t1

[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ+c1 ¯ ¯ ¯

¯> C2s (47)

se debe satisfacer. Esto implica que ¯

¯ ¯ ¯ ¯−

Z t−_ak

t1

[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ +c1 ¯ ¯ ¯ ¯

¯> C2s, (48) ¯

¯ ¯ ¯ ¯−

Z t+_bk

t1

[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ+c1 ¯ ¯ ¯ ¯

¯> C2s, (49) y porque la trayectoria llega a la superficie de discontinuidad en el tiempot−_ak debemos

tener

sgn

" −

Z t−_ak

t1

[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ +c1 #

=₋sgn£x2 ¡

t−_ak¢¤. (50)

Por lo tanto, de (44), (48), (49) y (50),

¯ ¯x3

¡

t−_ak¢¯¯ =

¯ ¯ ¯ ¯ ¯−

Z t−_ak

t1

[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ +c1 ¯ ¯ ¯ ¯

¯+C2s (51)

y

¯ ¯x3

¡

t+_bk¢¯¯=

¯ ¯ ¯ ¯ ¯−

Z t+_bk

t1

[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ +c1 ¯ ¯ ¯ ¯

(42)

En el segundo caso, es decir, cuando existe un modo deslizante, la condiciónx˙2(t) =

0debe de cumplirse parat_∈[tak, tbk]. Entonces, de (44),

|x3(tbk)| = |x˙2(tbk)|= ¯

¯φ±(tbk)¯¯

=

¯ ¯ ¯ ¯−

Z tbk

t1

[k1x1(τ) +k2x2(τ) +k3x3(τ)]dτ∓C2s+c1 ¯ ¯ ¯

¯= 0. (53)

Lo que es más, porque la trayectoria llegan a la superficie de discontinuidad en tiempotak,

la siguiente condición se debe cumplir,

¯ ¯x3

¡

t−_ak¢¯¯=¯¯x˙2 ¡

t−_ak¢¯¯ >0. (54)

Por lo tanto, podemos concluir, de (51) a (54), que

¯ ¯x3

¡

t+_bk¢¯¯<¯¯x3 ¡

t−_ak¢¯¯. (55)

Ahora analicemos el caso donde el sistema no está en la superficie de discontinuidad

S. Considere la función candidata de LyapunovV (x) =xT_{P x}_{, donde}_P _{es dada por (41).}

EntoncesV (x)puede ser escrita como

V (x) =p11x21+ 2p12x1x2+p22x22+ 2p23x2x3+p33x23. (56)

Note quex1 ¡

t−_ak¢=x1(t+bk)yx2(t−ak) =x2(t+bk) = 0. Entonces tenemos, de (55), que

V ¡x¡t−_ak¢¢=p11x21 ¡

t−_ak¢+p33x23 ¡

t−_ak¢> p11x21 ¡

t+_bk¢+p33x23 ¡

t+_bk¢=V ¡x¡t+_bk¢¢, (57)

y existirá una reducción deV (x)cuando las trayectorias del sistema (38)-(40) crucen la

superficie_S. Lo que es más, la derivada temporal deV a lo largo de las trayectorias de

(40) es dada por

˙

V (x) =₋(x2, x3)Q(x2) (x2, x3) T

(43)

Por lo tanto, el sistema converge al conjunto _{x_∈_R3 : (x2, x3) = (0,0)} y concluimos

estabilidad asintótica global del origen, porque si el origen no ha sido alcanzado entonces

las trayectorias de (34)-(39) saldrán de la superficie de discontinuidad _S en un tiempo

finito, y la funciónV decrece fuera de esta superficie.

Una vez obtenida una expresión para σ∗ _{y los coe}_fi_cientes_ki, _pij _{satisfaciendo las}

previas condiciones, podemos diseñar una ley de control discontinua parau1que haga que

el control artificial σ (ver (33)) converja al control ideal σ∗ _{en tiempo} _fi_{nito. Podemos}

usar, por ejemplo, una técnica de modo deslizante para lograr este objetivo. En la siguiente

sección se describe la aplicación de este procedimiento a dos sistemas.

IV.3 Aplicaciones

Ejemplo 1.Considere el sistema mostrado en la Figura 5, descrito por

¨

q1+ ka m1

q1 + kb m1

(q1−q2) + fb m1

( ˙q1−q˙2) = 1

m1 u1,

¨

q2− kb m2

(q1−q2)− fb m2

( ˙q1−q˙2) +C2( ˙q2) sgn ( ˙q2) = 0, (59)

dondeqi son las posiciones de las masas,qi˙ las velocidades,mi las masas, para i = 1,2;

(44)

Figura 5. Sistema masa-resorte-amortiguador.

El objetivo es diseñar un ley de controlu1para que la posición de la masam2converja

a un valor constanteq2ddado, con la posición y velocidad de la masam1 acotadas.

Para este sistema, tenemos

f1(x1+q2d, x2) = − kb m2

(x1+q2d)− fb m2

x2,

σ(q1,q˙1) = kb m2

q1+ fb m2

˙

q1,

dondex1 =q2−q2d,x2 = ˙q2. Si

σ∗ =₋k1 Z t

t0

x1(τ)dτ − µ

k2− kb m2

¶ x1−

µ k3−

fb m2

¶ x2+

kb m2

q2d, (60)

dondet0 es el tiempo inicial, entonces llegamos a la forma deseada del Teorema 18.

El controlu1puede ser diseñado usando la técnica clásica de modos deslizantes. Por

ejemplo, si la superficie deslizante tiene la formas=σ₋σ∗_{, entonces}_s_{es dada por}

s= fb

m2 ˙

q1+ kb m2

q1+k1 Z t

t0

(q2(τ)−q2d)dτ+k2(q2−q2d) +kc3q˙2− kb m2

q2, (61)

dondekc3 =k3−fb/m2. Podemos proponeru1 como

u1 =m1 µ

ka m1

q1+ kb m1

(q1 −q2) + fb m1

( ˙q1 −q˙2) +τ1 ¶

(45)

donde

τ1 =− m2 fb · kb m2 ˙

q1+ µ

k2− kb m2

¶

˙

q2− fbkc3

m2

( ˙q2−q˙1)− kbkc3

m2

(q2−q1) +τ2 ¸

(63)

conτ2 =ksgn (s) +k1(q2−q2d)yk >|kc3|C2s.

Finalmente, si encontramos constantesp11,p12,p22,p23,p33,k1,k2 yk3, que

satisfa-gan el Teorema 18, entonces el objetivo de control será alcanzado.

Lasfiguras 6 y 7 muestran algunos resultados numéricos, donde tenemos que ka =

kb = 1 N/m,fb = 1 N/(m/s), m1 = m2 = 1 kg, C2s = 1N/kg, C2c = 0.75N/kg,

|v2s| = 0.143m/s,k1 = 0.5,k2 = 1.5, ykc3 = 2, conq1(t0) = −1m,q˙1(t0) = 0m/s,

q2(t0) = 2m,q˙2(t0) = 2m/s, yq2d= 0m.

0 10 20 30 -2 -1 0 1 2 3

q q

q

1 1

t s

m m/s

t s

t s t s

m

a)

b)

c)

d)

( ) ( ) ( ) ( ) ( ) ( ) ( )

q 2 2

.

m/s ( )

(46)

0 10 20 30 -6

-4 -2 0 2 4

0 10 20 30 0

20 40 60 80 100

V

t s t s

N

a)

b)

( )

( ) ( )

u 1

Figura 7. Ley de control y funciónV para el sistema masa-resorte-amortiguador.

Ejemplo 2. Consideremos ahora el sistema masa y viga mostrada en la Figura 8.

Este sistema es modelado por las ecuaciones

¡

J +mq₂2¢q¨1+ 2mq2q˙1q˙2−mgq2cos (q1) = u1,

¨

q2−q2q˙21−gsen (q1) +fv2q˙2+C2( ˙q2) sgn ( ˙q2) = 0, (64)

donde q1 es la posición angular de la viga, q2 la posición lineal de la masa, q˙1 y q˙2 las

respectivas velocidades,mla masa;C2( ˙q2)es dada por (32),C2c,C2s, yfv2son los niveles

de la fricción de Coulomb, estática, y viscosa divididas porm,J es el momento de inercia

de la viga,g la aceleración gravitacional, yu1 la entrada de control.

(47)

Se desea obtener una ley de controlu1para que la masamsea regulada alrededor del

valorq2d, con la posición y velocidad de la viga acotadas.

Para poder aplicar el resultado previo debemos simplificar el modelo, suponiendo

que el ángulo y velocidad de la viga son pequeños. Bajo esta condición, el sistema (64)

puede simplificarse a

¡

J+mq22 ¢

¨

q1+ 2mq2q˙1q˙2−mgq2cos (q1) = u1,

¨

q2−gq1+fv2q˙2+C2( ˙q2) sgn ( ˙q2) = 0.

En este caso tenemosσ =gq1 y el controlu1 es

u1 = 2mq2q˙1q˙2−mgq2cos (q1) + ¡

J+mq2₂¢τ1, (65)

dondeτ1es un nuevo control. Si proponemos un control artificial

σ∗ =₋

Z t

t1

[k1x1(τ) +k2x2(τ)]dτ +c, (66)

dondex1 = q2 −q2d,x2 = ˙q2, concuna constante real, y una superficie deslizante para

diseñar el controlu1comos =gq˙1+k1x1+k2x2, una técnica clásica de modo deslizantes

produce el control

τ1 =− 1

g [k1q˙2+k2(gq1−fv2q˙2) +ksgn (s)], (67)

con k > k2C2s. Finalmente, si encontramos constantes p11, p12, p22, p23, p33, k1, k2, y

k3 =fv2que satisfagan el Teorema 18, entonces el objetivo de control será alcanzado. Lasfiguras 9 y 10 muestran algunos resultados numéricos, param= 1kg,g = 9.81

(48)

0 10 20 30 -0.4 -0.2 0 0.2 0.4 0.6

0 10 20 30 -0.5 0 0.5 1 1.5 2

q q

q

1 1

t s

rad _rad/s

t s

t s t s

m a) b) c) d) ( ) ( ) ( ) ( ) ( ) ( ) ( )

q ₂ ₂

.

m/s ( )

Figura 9. Posiciones y velocidades del sistema masa y viga.

k2 = 1.5, yfv2 = 3N/(kg·m/s), conq1(t0) = 0.3rad,q˙1(t0) = 0rad/s,q2(t0) = 0.3 m,q˙2(t0) = 0m/s, yq2d= 0m.

IV.4 Conclusiones del capítulo

En este capítulo proponemos un controlador discontinuo para una clase de sistemas

mecáni-cos subactuados de 2 grados de libertad con fricción discontinua en la articulación no

ac-tuada. El objetivo de control es regular la variable no actuada mientras la posición y

veloci-dad de la articulación actuada permanecen acotadas. El controlador propuesto es obtenido

usando la técnica clásica de modos deslizantes, garantiza la convergencia del error de

posi-ción de la variable no actuada a cero, y es robusto con respecto a algunas incertidumbres

(49)

0 10 20 30 -20

-15 -10 -5 0 5

0 10 20 30 0

4 8 12 16 20

V

t s t s

N m

a) b)

( )

( ) ( )

u 1

Figura 10. Ley de control y funciónV del sistema masa y viga.

Como se observa en las gráficas las respuestas de los sistemas en lazo cerrado pueden

exhibir fases de “atascamiento”, debido a esto el desempeño del sistema puede ser afectado

negativamente. Sin embargo, en el siguiente capítulo se presenta una extensión de nuestros

resultados para proponer, primero, un control continuo para un sistema con fricción

discon-tinua y control pleno, y luego su aplicación al control de sistemas subactuados con fricción

(50)

Desde el punto de vista de control de sistemas mecánicos con control pleno, la

téc-nica más sencilla para contrarrestar el fenómeno de la fricción discontinua es el control

de modos deslizantes de primer orden; la fricción discontinua es considerada como una

pertubación acotada de signo impredecible y por lo tanto contrarrestada con una amplitud

adecuada del control. Sin embargo, esta clase de algoritmos de control requieren a menudo

un alto esfuerzo de control para contrarrestar este fenómeno físico, y requieren señales de

control que conmuten, teóricamente, con frecuencia infinita, por lo tanto, en general es

imposible su implementación (Boiko et al., 2004).

Se han propuesto varias técnicas para eliminar el efecto del “chaterring” (conmutación

de alta frecuencia), por ejemplo los algoritmos de control de modos deslizantes de orden

superior. Sin embargo, los procedimientos “anti-chattering”, que intentan obtener leyes de

control continuas, están en conflicto con el problema de garantizar exactitud en presencia

de fricción discontinua.

Un resultado hacia la solución de este problema fue presentado en (Bartolini y Punta,

2000a), (Bartolini y Punta, 2000b). En estos trabajos se prueba que, con una ligera

mo-dificación, un algoritmo de segundo orden en un sistema mecánico, hace que la posición y

la velocidad convergan a una posición deseada, iniciando desde cualquier punto de

“atas-camiento”. En estos artículos se considera un sistema mecánico con fricción estática y de

(51)

En este capítulo proponemos un controlador continuo para la regulación de un

sis-tema mecánico de 1 grado de libertad con fricción discontinua. El control es dinámico y

es diseñado usando el Teorema 18 del capítulo anterior (presentado también en (Martinez

y Alvarez, 2007)). Además, utilizando este control, diseñamos un controlador para un

sis-tema subactuado con fricción discontinua en la articulación no actuada. Este controlador

puede verse como una extensión de los presentados en el capítulo anterior.

V.1 Diseño de la ley control

Considere un sistema mecánico representado por

˙

y1 = y2,

˙

y2 = f1(y1+q2d, y2)−C2(y2) sgn (y2) +u, (68)

dondey1 ∈R,y2 ∈R,f1es una función suave,q2des una constante yues una entrada de

control. C2(·)es el módulo de los términos de la fricción definido por (32). Suponga que

la funciónf2(y1, y2,y˙2) =df1(y1 +q2d, y2)/dtes continua en sus argumentos.

El objetivo de control es el de conduciry1(t)yy2(t)a cero por medio de un control

continuou(t).

Note que (68) tiene la misma forma que (34). Por lo tanto, consideramos una ley de

controlucon una dinámica dada por

˙

u=ϕ(y, u). (69)

(52)

Se propone encontrarϕdiscontinua. Para esto, presentamos el siguiente lema.

Lema 19 Defínaseϕ(u,0)(y1) =ϕ(y, u), cony= (y1,0)

T_{, como la restricción de}

ϕpara

y2 = 0. Suponga quey1 6= 0implica queϕ(u,0)(y1)6= 0. Por lo tanto, si (68)-(69) exhibe un modo deslizante en la superficie_S caracterizada por y2 = 0 fuera del origeny = 0,

entonces el sistema saldrá de esta superficie en un tiempofinito.

Demostración Cuando el sistema (68) está en modo deslizante en la superficie _S

fuera del origeny = 0, es descrito por

y2 = 0, f1(y1+q2d,0)−C2(0) sgn(0) +u= 0.

Bajo esta condición,u˙ = ϕ(¯y, u), cony¯= (y1,0),y1 6= 0, es diferente de cero. De (32),

C2(0) =C2s, por lo tanto

u+f1(y1+q2d,0)∈/ [−C2s, C2s], f1(y1+q2d,0)−C2(0) sgn(0) +u6= 0. (70)

en un tiempofinito.

Si definimos x1 = y1, x2 = y2 y x3 = f1(y1+q2d, y2) −C2(y2) sgn (y2) + u,

entonces el sistema (68)-(69) puede ser representado por

˙

x = g(t, x),

x¡t+_bk¢ = x¡t−_ak¢+∆xk, k_∈K, (71)

dondex= (x1, x2, x3)T,

g(t, x) =

  

x2 x3 f2(x1, x2, x3) + 2(C2_vs−2C2c)

2s |x2|exp

³ −x22

v2 2s

´

x3+ ˙u

 

, (72)