Nuevo problema de control para el seguimiento de trayectorias en el péndulo con rueda inercial

(1)

AMRob Journal, Robotics: Theory and Applications

Asociación Mexicana de Robótica e Industria, A. C.

Nuevo problema de control para el

seguimiento de trayectorias en el

péndulo con rueda inercial

Regular Paper

Carlos Aguilar-Avelar, Javier Moreno-Valenzuela

?*

?_{Corresponding author E-mail: [email protected]}

Received: 12 july 2016; Available online: 15 october 2016

© 2016 ; licensee AMRob. This is an article distributed under the terms of the Instituto Nacional del Derecho de Autor (www.indautor.gob.mx), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.

Abstract En este artículo se presenta un algoritmo de control para un nuevo problema de seguimiento de trayectorias en el péndulo con rueda inercial. El objetivo de control es mantener el péndulo regulado alrededor de la posición superior inestable, mientras que la posición de la rueda sigue una trayectoria deseada variante en

el tiempo. Se propone un controlador basado en la

técnica de linealización por retroalimentación, el cual es diseñado a partir de una función de salida que depende del vector de error completo. Los resultados teóricos y de simulación del sistema de lazo cerrado muestran la convergencia asintótica de las trayectorias de error en el caso de regulación y el acotamiento de las trayectorias de error en el caso de seguimiento de trayectorias.

Keywords Inertia wheel pendulum, trajectory tracking, feedback linearization control, numerical simulations.

1. Introducción

El péndulo con rueda inercial es un sistema mecánico subactuado con dos grados de libertad y cuyo modelo dinámico es no lineal. Este sistema consiste en un péndulo que tiene unido una rueda o disco rotatorio simétrico al extremo opuesto de su eje de rotación. Los planos de rotación del péndulo y la rueda son paralelos. La única

*_{C. Aguilar-Avelar,} _{J. Moreno-Valenzuela,} _{Instituto Politécnico}

Nacional-CITEDI, Tijuana, B. C., 22435, [email protected], [email protected]

entrada de control es el torque aplicado por un motor de corriente directa en el eje de rotación de la rueda, lo cual revela las características subactuadas del sistema. La figura 1 muestra un dibujo de un péndulo con rueda

inercial. En años recientes ha sido una plataforma de

pruebas muy popular, usada para probar técnicas control lineal, no lineal, de estructura variable y algoritmos de control inteligente [1–11].

Los objetivos de control que son comúnmente abordados en este sistema son el de swing-up [1–3], el de regulación del péndulo alrededor de la posición superior inestable [4– 8], seguimiento de trayectorias variantes con el tiempo en la posición del péndulo [9] y la generación de oscilaciones estables alrededor del punto de equilibrio inestable [10, 11]. Estos enfoques se centran en controlar la posición del péndulo, algunos de ellos ignorando por completo la posición de la rueda.

Es posible introducir un nuevo objetivo en el control del péndulo con rueda inercial, el cual consiste en el seguimiento de trayectorias variantes con el tiempo en la articulación actuada (rueda), mientras que la articulación no actuada (péndulo) permanece regulada alrededor de la posición vertical superior. En la literatura se ha estudiado un problema análogo para otro sistemas de tipo péndulo, por ejemplo, el péndulo rotacional invertido [12, 13], el sistema carro-péndulo [14] y péndulo invertido móvil [15]. Sin embargo, no se encontraron estudios previos en la

(2)

literatura para este problema en el péndulo con rueda inercial.

La técnica de linealización entrada-salida es una metodología de control usada en sistema no lineales [16, 17]. Esta técnica consiste en la cancelación de los términos no lineales del modelo dinámico mediante una transformación de entrada que depende de los estados del sistema. De tal manera que si se define la salida del sistema en función de su vector de estados y se calcula las derivadas respecto al tiempo hasta obtener una relación directa entre la entrada de control y la salida propuesta, es posible definir un controlador a modo de que la dinámica de salida en lazo cerrado sea un sistema lineal e invariante con el tiempo. Sin embargo, dependiendo de la selección de la función de salida, la dinámica interna resultante puede ser inestable.

Este artículo propone un nuevo algoritmo de

control derivado de la técnica de linealización por retroalimentación para resolver un nuevo problema de seguimiento de trayectorias en el péndulo con rueda

inercial. En este caso se deben cumplir dos objetivos

de control de manera simultánea: i) La regulación

del péndulo al rededor de la posición superior. ii) El

seguimiento de una trayectoria deseada variante con

el tiempo en la posición de la rueda. El controlador

es diseñado a partir de una nueva función de salida propuesta, la cual depende del vector de error. La función de salida se inspira en la que fue propuesta en [13] para un problema análogo en el péndulo rotacional invertido y en la función de salida propuesta en [3], la cual es ponderada por algunos de los parámetros del modelo dinámico del sistema, de tal manera que se asegura que las dinámicas externa e interna sean lineales. Los resultados teóricos presentados, así como los de simulación, muestran el acotamiento último uniforme de las trayectorias de error. Lo que resta de este documento está organizado de la siguiente manera: la sección 2 se dedica a la descripción del modelo dinámico del péndulo con rueda inercial y a establecer de manera formal el problema de control. La sección 3 muestra el procedimiento de diseño del nuevo algoritmo de control. En la sección 4 se dan las expresiones explícitas de las dinámicas externa e interna del sistema, se muestra la convergencia exponencial de las trayectorias del sistema trasformado y se lleva a cabo el análisis de acotamiento de las trayectorias de error. En la sección 5 se muestran los resultados de las simulaciones numéricas realizadas. Finalmente, en la sección 6 se dan algunos comentarios finales.

2. Modelo dinámico y problema de control

El modelo dinámico del péndulo con rueda inercial puede escribirse como D ¨q+G(q) =u, (1) con D=d11 d12 d21 d22 , G= ₋ ¯ mg0sin(q1) 0 , u= 0 τ , q=q1 q2 , donde q1(t) es la posición angular del péndulo, q2(t)

es la posición angular de la rueda, τ(t) es la entrada

de control que se aplica en la rueda, los parámetros ¯m,

Figure 1. Péndulo con rueda inercial.

d11, d12, d21, d22 son constantes positivas relacionadas

con las propiedades físicas del sistema y g0 representa la

constante de aceleración gravitacional. La figura 1 muestra la convención para mediciones relativas de posición y la aplicación de torque.

El objetivo es diseñar la señal de control τ(t)de tal manera

que la posición de la rueda q2(t) siga una trayectoria

deseada qd(t), mientras que la posición del péndulo q1(t)

permanece regulada alrededor de la posición vertical superior.

Si se define el error de regulación para la posición del

péndulo como e1 = −q1 y el error de seguimiento de

trayectoria para la posición de la rueda como e2=qd−q2,

entonces el vector de error puede ser definido como

x=e1, e2, ˙e1, ˙e2

>

, (2)

donde qd(t)es una función variante con el tiempo, suave,

acotada y cuatro veces diferenciable que representa la trayectoria deseada para la posición de la rueda.

De manera formal, el problema de control consiste en diseñar la entrada de control τ(t)tal que las trayectorias

de error x(t) ∈ IR4 sean señales acotadas últimamente

uniformemente, es decir, el controlador debe garantizar que

kx(t0)k ≤a ⇒ kx(t)k ≤b ∀t≥t0+T, (3)

con T=T(a, b) ≥0.

3. Diseño del algoritmo de control

El sistema de lazo abierto mostrado en la ecuación (1) puede ser reescrito en forma de espacio de estados en términos del vector de error x definido en la ecuación (2) como d dtx=f(t, x) +gτ, (4) donde f(t, x) =     ˙e1 ˙e2 d22det(D)−1mg¯ 0sin(e1) ¨qd−d12det(D)−1mg¯ 0sin(e1)     , (5) g=h0, 0, d12det(D)−1,−d11det(D)−1 i> . (6)

(3)

Con el fin de aplicar la técnica de linealización por retroalimentación se propone la siguiente función de salida:

y=d11∆pe1+d12∆pe2+d11∆d˙e1+d12∆d˙e2, (7)

donde ∆p y ∆d son constantes positivas. Calculando la

derivada respecto al tiempo de la función de salida en la ecuación (7) hasta obtener una expresión que relacione directamente la entrada de control τ con la dinámica de salida se obtiene

˙y=d11∆p˙e1+d12∆p˙e2+d12∆d¨qd+∆dmg¯ 0sin(e1), (8)

¨y=d12∆p¨qd+∆pmg¯ 0sin(e1) +d12∆d ... q_d +∆_dmg¯ 0cos(e1)˙e1, (9) ... y=d12∆p ... q_d+d12∆d .... q_d+∆_pmg¯ 0cos(e1)˙e1

−∆dmg¯ 0sin(e1)˙e12+∆dm¯2g20d22sin(e1)cos(e1)det(D)−1 +∆_dmg¯ 0d12cos(e1)det(D)−1τ. (10)

Como se puede apreciar, la entrada de control τ aparece después de la tercera derivada de la funciona de salida a lo largo de las trayectorias del sistema dado en la ecuación (4), lo que significa que el grado relativo del sistema con la salida propuesta en la ecuación (7) es 3.

Tomando en cuenta la relación entrada-salida en la ecuación (10), se tiene que la transformación de entrada dada por τ= [∆dmg¯ 0d12cos(e1)det(D)−1]−1[u− (d12∆p ... q_d +d12∆d ....

q_d+∆pmg¯ 0cos(e1)˙e1−∆dmg¯ 0sin(e1)˙e21 +∆_dm¯2g2₀d22sin(e1)cos(e1)det(D)−1)], (11)

con la entrada de control auxiliar u definida como

u= −k3¨y−k2˙y−k1y, (12)

donde k1, k2 y k3 son constantes positivas, resulta en la

siguiente dinámica de salida: d

dt¨y= −k3¨y−k2˙y−k1y. (13)

Aplicando el criterio de estabilidad de Routh-Hurwitz se puede verificar que

lim

t→∞y(t) =0, (14)

de forma exponencial, si las constantes k1, k2 y k3

satisfacen

k2>

k1

k3

. (15)

El comportamiento de las trayectorias de salida es conocido como dinámica externa, que en este caso está descrito por la ecuación (13). El sistema de lazo cerrado completo está compuesto por la dinámica externa y la llamada dinámica interna, es decir, la parte del sistema que es inobservable a través de la dinámica de salida.

4. Análisis de las trayectorias de lazo cerrado

Para obtener la dinámica interna, es necesario definir una

transformación de coordenadas z = Φ(t, x) con z =

[η1, ξ1, ξ2, ξ3]> ∈ IR4, donde ξ1 = y, ξ2 = ˙y y

ξ3 = ¨y son los estados de la dinámica externa definidos

en las ecuaciones (7)-(9), respectivamente, y el estado de la

dinámica interna η1debe ser propuesto tal que se satisfaga

la ecuación diferencia parcial

∂η1

∂x g

=0, (16)

con g definido en la ecuación (6). Tomando en cuenta la condición dada en la ecuación (16), se propone el estado

de la dinámica interna η1como

η1=∆p∆dd11˙e1+∆p∆dd12˙e2. (17)

Por lo tanto, la transformación z=Φ(t, x)resulta ser

Φ=     ∆p∆dd11˙e1+∆p∆dd12˙e2 d11∆pe1+d12∆pe2+d11∆d˙e1+d12∆d˙e2 d11∆p˙e1+d12∆p˙e2+d12∆d¨qd+∆dmg0¯ sin(e1) d12∆p¨qd+∆pmg0¯ sin(e1) +d12∆d ... q_d+∆dmg0¯ cos(e1)˙e1     (18)

El sistema de lazo cerrado en términos de la

transformación de coordenadas es dado por la derivada de z respecto al tiempo, el cual queda expresado como

d dt     η1 ξ1 ξ2 ξ3     =     ∆pξ2−∆_∆p_dη1 ξ2 ξ3 −k3ξ3−k2ξ2−k1ξ1     . (19)

Dado que anteriormente se mostró que las trayectorias de la dinámica externa ξ1(t), ξ2(t) y ξ3(t) convergen a

cero cuando el tiempo t tiende a infinito, siempre que las ganancias de control k1, k2y k3satisfagan la condición en

(15), es fácil probar mediante el criterio de Routh-Hurwitz que el origen del sistema de lazo cerrado en (19) es exponencialmente estable.

4.1. Acotamiento de las Trayectorias de Error

Proposición 1. Dado que las trayectorias z(t) = [η1(t), ξ(t)>]> ∈ IR4 convergen al origen de

manera exponencial, entonces las soluciones de la

dinámica de error del péndulo con rueda inercial

x(t) = [e1(t), e2(t), ˙e1(t), ˙e2(t)]> ∈ IR4 son acotadas

últimamente uniformemente.

Proof. La transformaciónΦ(_{t, x})en (18) puede ser reescrita como z=Φ_x+Φ_t, (20) donde Φx=     ∆p∆dd11˙e1+∆p∆dd12˙e2 d11∆pe1+d12∆pe2+d11∆d˙e1+d12∆d˙e2

d11∆p˙e1+d12∆p˙e2+∆dmg¯ 0sin(e1)

∆pmg¯ 0sin(e1) +∆dmg¯ 0cos(e1)˙e1



  

(4)

0 2 4 6 8 10 12 14 16 18 20 −0.1 −0.05 0 0.05 0.1 0.15 0.2 P o s ic i´o n [r a d ] q1(t) Ref. 0 2 4 6 8 10 12 14 16 18 20 0 50 100 150 200 250 P o s ic i´o n [r a d ] T iempo[s] q2(t) qd(t)

Figure 2. Regulación: evolución temporal de las trayectorias de

posición del péndulo q1(t) (superior) y de posición de la rueda q2(t)

(inferior). y Φt=     0 0 d12∆d¨qd d12∆p¨qd+d12∆d ... q_d     .

Se tiene que la matriz jacobiana deΦxevaluada en x=0

H= ∂Φx ∂x _x=0 =     0 0 ∆p∆dd11 ∆p∆dd12 ∆pd11 ∆pd12 ∆dd11 ∆dd12 ∆dmg¯ 0 0 ∆pd11 ∆pd12 ∆pmg¯ 0 0 ∆dmg¯ 0 0     , (21) es no singular y por lo tanto califica como una transformación de coordenadas local en el vecindario del origen [18].

Definiendo la función Ψ(x) = [Φx(x) −Hx], que

es localmente Lipschitz, la transformación dada en la ecuación (20) puede ser reescrita como

z=Hx+Ψ(x) +Φ_t(t)

donde, tomando en cuenta que kΨ(x)k ≤ e1kxk en el

vecindario del origen, se puede escribir una cota superior parakx(t)kcomo sigue:

kxk ≤ [kHk +e1]−1[kzk + kΦt(t)k]. (22)

Por lo tanto, es posible concluir que el vector de error

x(t) = [e1(t), e2(t), ˙e1(t), ˙e2(t)]>es acotado últimamente

uniformemente. Además, este resultado nos permite

también establecer que, en el caso de que la trayectoria deseada sea constante, las trayectorias de error convergen al origen de forma exponencial. Este resultado se puede

inferir del hecho de que la función Φt = 0 para una

trayectoria deseada qd constante, de tal manera que la

desigualdad en la ecuación (22) describe la convergencia

asintótica de las trayectorias de error.

0 2 4 6 8 10 12 14 16 18 20 −0.05 0 0.05 T o r q u e [Nm ] τ(t) 0 2 4 6 8 10 12 14 16 18 20 −0.2 −0.1 0 0.1 0.2 T iempo[s] y(t)

Figure 3. Regulación: evoluación temporal de la señal de

control τ(t) (superior) y de la función de salida y(t) (inferior). 5. Resultados de simulación

En esta sección se presentan los resultados de las simulaciones numéricas para los casos de regulación y seguimiento de trayectorias en la posición de la rueda, realizadas utilizando el algoritmo de control propuesto en la ecuación (11) aplicado al modelo del péndulo con rueda inercial dado en la ecuación (1). Los valores numéricos

de los parámetros del modelo dinámico fueron d11 =

0.0462 [Kg m2/rad], d12 = d21 = d22 = 6.2814×

10−4 [Kg m2_/rad_] _{y ¯}_m ₌ _0.2359 _[_{Kg m}2_/rad_]_{, que de}

hecho corresponden a los valores de una plataforma experimental de este sistema. La constante de aceleración

gravitacional fue considerada como g0 = 9.81 [m/s2].

Las ganancias de control para el algoritmo en (11) fueron k1=2, k2=4, k3=2,∆p =1 y∆d=0.2. Finalmente, las

condiciones iniciales para todos los casos fueron q1(0) =

0.2 [rad], q2(0) =0 [rad], ˙q1(0) =0 [rad] y ˙q2(0) =0 [rad].

5.1. Caso de Regulación

Los resultados en el caso de regulación para qd = 0,

son mostrados en las figuras 2-3. Específicamente para la figura 2, la gráfica superior muestra la evolución temporal

de la posición del péndulo q1(t) y la gráfica inferior

muestra la evolución temporal de la posición de la rueda q2(t). Para la figura 3, la gráfica superior muestra la señal

de control aplicada τ(t) y la gráfica inferior muestra la

evolución temporal de la señal de salida y(t)definida en

la ecuación (7).

Como se puede observar, los resultados teóricos sobre la estabilidad asintótica del origen del sistema (4) con el controlador propuesto en (11) son verificados por los resultados mostrados.

5.2. Caso de Seguimiento de Trayectoria

Para el caso de seguimiento de trayectoria, la trayectoria deseada qd(t)fue seleccionada como

qd= −a sin(ωt)(e−bt

3

−1) [rad], (23)

(5)

0 2 4 6 8 10 12 14 16 18 20 −0.1 −0.05 0 0.05 0.1 0.15 0.2 P o s ic i´o n [r a d ] q1(t) Ref. 0 2 4 6 8 10 12 14 16 18 20 −100 −50 0 50 100 150 200 250 P o s ic i´o n [r a d ] T iempo[s] q2(t) qd(t)

Figure 4. Seguimiento de trayectoria: evolución temporal

de las trayectorias de posición del péndulo q1(t) (superior) y de

posición de la rueda q2(t) (inferior).

0 2 4 6 8 10 12 14 16 18 20 −0.05 0 0.05 T o r q u e [Nm ] τ(t) 0 2 4 6 8 10 12 14 16 18 20 −0.2 −0.1 0 0.1 0.2 T iempo[s] y(t)

Figure 5. Seguimiento de trayectoria: evolución temporal

de la señal de control τ(t) (superior) y de la función de salida y(t) (inferior).

Los resultados para este caso son mostrados en las figuras 4-5. Específicamente para la figura 4, la gráfica superior muestra la evolución temporal de la posición del péndulo q1(t) y la gráfica inferior muestra la evolución temporal

de la posición de la rueda q2(t)con la trayectoria deseada

qd(t)en (23). Para la figura 5, la gráfica superior muestra la

señal de control aplicada τ(t)y la gráfica inferior muestra la evolución temporal de la señal de salida y(t).

De los resultados presentados puede corroborarse que los errores de regulación e1(t)y de seguimiento de trayectoria

e2(t) permanecen acotados alrededor del origen después

de un tiempo finito T>0, lo que confirma el acotamiento

último uniforme de las trayectorias de error.

6. Conclusiones

En este documento se propuso un nuevo algoritmo de control derivado de la técnica de linealización por retroalimentación para un nuevo problema de seguimiento de trayectorias en el péndulo con rueda

inercial. En nuevo problema de control consiste en

el seguimiento de trayectorias variantes con el tiempo en la posición de la rueda, al mismo tiempo que el péndulo se mantiene regulado alrededor de la posición

vertical superior. El controlador es diseñado a partir

de una función de salida que depende del vector de error, inspirado de trabajos previamente publicados en

la literatura. Los resultados teóricos y de simulación

confirman la convergencia asintótica de las trayectorias de error para el caso de regulación y el acotamiento último uniforme de las trayectorias de error para el caso de seguimiento.

Agradecimientos

Se agradece a la Secretaria de Investigación y Posgrado del Instituto Politécnico Nacional (SIP-IPN) y al Consejo Nacional de Ciencia y Tecnología (CONACYT) por el apoyo económico brindado a través del proyecto SIP 20160748 y el proyecto CONACYT 176587.

7. References

[1] Andrievsky, B. R., 2011, “Global Stabilization of the Unstable Reaction-Wheel Pendulum,” Automation and Remote Control, 72(9), pp. 1981-1993.

[2] Srinivasa, K. N., and Behera, L., 2008, “Swing-up Control Strategies for a Reaction Wheel Pendulum,” Int. J. of Systems Science, 39(12), pp. 1165-1177. [3] Spong, M. W., Corke, P., and Lozano R., 2001,

“Nonlinear Control of the Reaction Wheel

Pendulum,” Automatica, 37(11), pp. 1845-1851. [4] Owczarkowski, A., Lis, M., and Kozierski, P., 2014,

“Tracking Control of an Inertial Wheel Pendulum by LQR Regulation,” Proc. 19th Int. Conf. On Methods and Models in Aut. and Rob., Miedzyzdroje, PL, pp. 384-388.

[5] Khalid, N., and Memon, A. Y., 2014, “Output

Feedback Stabilization of an Inertia Wheel

Pendulum Using Sliding Mode Control,” Proc. 2014 UKACC Int. Conf. on Control, Loughborough, UK, pp. 157-162.

[6] Rudra, S., Barai, R. K., et al., 2013 “Global Stabilization of a Flat Underactuated Inertia Wheel: A Block Backstepping Approach,” Proc. 2013 Int. Conf. on Computer Communication and Informatics, Coimbatore, IN, pp.1-4

[7] Martinez-Soto, R., Rodriguez, A., Castillo, O., and Aguilar, L. T., 2012, “Gain Optimization for Inertia Wheel Pendulum Stabilization Using Particle Swarm Optimization and Genetic algorithms,” Int. J. of Innovative Computing, Information and Control,

8(6) pp. 4421-4430.

[8] Huber, J., Gruber, C., and Hofbaur, M., 2013, “Online Trajectory Optimization for Nonlinear Systems by

the Concept of a Model Control Loop â ˘AˇT Applied

to the Reaction Wheel Pendulum,” Proc. 2013 IEEE Int. Conf. on Control Applications, Hyderabad, IN, pp. 935-940.

[9] Moreno-Valenzuela, J., Aguilar-Avelar, C., and Puga-Guzman, S., 2014, “On Trajectory Tracking Control of the Inertia Wheel Pendulum,” Proc. Int.

(6)

Conf. on Control, Decision and Inf. Tech., Metz, FR, pp. 572-577.

[10] Iriarte, R., Aguilar, L. T., and Fridman, L., 2013, “Second Order Sliding Mode Tracking Controller for Inertia Wheel Pendulum,” J. of the Franklin Institute

350(1), pp. 92-106.

[11] Andary, S., Chemori, A., Benoit, M., and Sallantin, J., 2012, “A Dual Model-free Control of Underactuated Mechanical Systems, Application to the Inertia Wheel Inverted Pendulum,” Proc. American Control Conference, Montreal, CA, pp. 1029-1034.

[12] Aguilar-Avelar, C., and Moreno-Valenzuela, J., 2015 “A Composite Controller for Trajectory Tracking Applied to the Furuta Pendulum,” ISA Transactions,

57(2015), pp. 286-294.

[13] Aguilar-Avelar, C., and Moreno-Valenzuela, J., 2014, “A Feedback Linearization Controller for Trajectory Tracking of the Furuta Pendulum,” Proc. American Control Conference, Portland, USA, pp. 4543-4548.

[14] Jung, S., and Kim, S. S., 2007, “Hardware

Implementation of a Real-Time Neural Network Controller With a DSP and an FPGA for Nonlinear Systems,” IEEE Trans. on Industrial Electronics,

54(1), pp. 265-271.

[15] Jung, S., and Kim, S. S., 2008, “Control Experiment of a Wheel-Driven Mobile Inverted Pendulum Using Neural Network,” IEEE Trans. on Control Systems Technology, 16(2), pp. 297-303.

[16] Khalil, H.K., 1996, Nonlinear Systems, Prentice Hall, Upper Saddle River, 2nd ed.

[17] Slotine, J.-J. E., and Li, W., 1991, Applied Nonlinear Control, Prentice Hall, New Jersey.

[18] Isidori, A., Nonlinear Control Systems,