AMRob Journal, Robotics: Theory and Applications
Asociación Mexicana de Robótica e Industria, A. C.
Nuevo problema de control para el
seguimiento de trayectorias en el
péndulo con rueda inercial
Regular Paper
Carlos Aguilar-Avelar, Javier Moreno-Valenzuela
?*?Corresponding author E-mail: [email protected]
Received: 12 july 2016; Available online: 15 october 2016
© 2016 ; licensee AMRob. This is an article distributed under the terms of the Instituto Nacional del Derecho de Autor (www.indautor.gob.mx), which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.
Abstract En este artículo se presenta un algoritmo de control para un nuevo problema de seguimiento de trayectorias en el péndulo con rueda inercial. El objetivo de control es mantener el péndulo regulado alrededor de la posición superior inestable, mientras que la posición de la rueda sigue una trayectoria deseada variante en
el tiempo. Se propone un controlador basado en la
técnica de linealización por retroalimentación, el cual es diseñado a partir de una función de salida que depende del vector de error completo. Los resultados teóricos y de simulación del sistema de lazo cerrado muestran la convergencia asintótica de las trayectorias de error en el caso de regulación y el acotamiento de las trayectorias de error en el caso de seguimiento de trayectorias.
Keywords Inertia wheel pendulum, trajectory tracking, feedback linearization control, numerical simulations.
1. Introducción
El péndulo con rueda inercial es un sistema mecánico subactuado con dos grados de libertad y cuyo modelo dinámico es no lineal. Este sistema consiste en un péndulo que tiene unido una rueda o disco rotatorio simétrico al extremo opuesto de su eje de rotación. Los planos de rotación del péndulo y la rueda son paralelos. La única
*C. Aguilar-Avelar, J. Moreno-Valenzuela, Instituto Politécnico
Nacional-CITEDI, Tijuana, B. C., 22435, [email protected], [email protected]
entrada de control es el torque aplicado por un motor de corriente directa en el eje de rotación de la rueda, lo cual revela las características subactuadas del sistema. La figura 1 muestra un dibujo de un péndulo con rueda
inercial. En años recientes ha sido una plataforma de
pruebas muy popular, usada para probar técnicas control lineal, no lineal, de estructura variable y algoritmos de control inteligente [1–11].
Los objetivos de control que son comúnmente abordados en este sistema son el de swing-up [1–3], el de regulación del péndulo alrededor de la posición superior inestable [4– 8], seguimiento de trayectorias variantes con el tiempo en la posición del péndulo [9] y la generación de oscilaciones estables alrededor del punto de equilibrio inestable [10, 11]. Estos enfoques se centran en controlar la posición del péndulo, algunos de ellos ignorando por completo la posición de la rueda.
Es posible introducir un nuevo objetivo en el control del péndulo con rueda inercial, el cual consiste en el seguimiento de trayectorias variantes con el tiempo en la articulación actuada (rueda), mientras que la articulación no actuada (péndulo) permanece regulada alrededor de la posición vertical superior. En la literatura se ha estudiado un problema análogo para otro sistemas de tipo péndulo, por ejemplo, el péndulo rotacional invertido [12, 13], el sistema carro-péndulo [14] y péndulo invertido móvil [15]. Sin embargo, no se encontraron estudios previos en la
literatura para este problema en el péndulo con rueda inercial.
La técnica de linealización entrada-salida es una metodología de control usada en sistema no lineales [16, 17]. Esta técnica consiste en la cancelación de los términos no lineales del modelo dinámico mediante una transformación de entrada que depende de los estados del sistema. De tal manera que si se define la salida del sistema en función de su vector de estados y se calcula las derivadas respecto al tiempo hasta obtener una relación directa entre la entrada de control y la salida propuesta, es posible definir un controlador a modo de que la dinámica de salida en lazo cerrado sea un sistema lineal e invariante con el tiempo. Sin embargo, dependiendo de la selección de la función de salida, la dinámica interna resultante puede ser inestable.
Este artículo propone un nuevo algoritmo de
control derivado de la técnica de linealización por retroalimentación para resolver un nuevo problema de seguimiento de trayectorias en el péndulo con rueda
inercial. En este caso se deben cumplir dos objetivos
de control de manera simultánea: i) La regulación
del péndulo al rededor de la posición superior. ii) El
seguimiento de una trayectoria deseada variante con
el tiempo en la posición de la rueda. El controlador
es diseñado a partir de una nueva función de salida propuesta, la cual depende del vector de error. La función de salida se inspira en la que fue propuesta en [13] para un problema análogo en el péndulo rotacional invertido y en la función de salida propuesta en [3], la cual es ponderada por algunos de los parámetros del modelo dinámico del sistema, de tal manera que se asegura que las dinámicas externa e interna sean lineales. Los resultados teóricos presentados, así como los de simulación, muestran el acotamiento último uniforme de las trayectorias de error. Lo que resta de este documento está organizado de la siguiente manera: la sección 2 se dedica a la descripción del modelo dinámico del péndulo con rueda inercial y a establecer de manera formal el problema de control. La sección 3 muestra el procedimiento de diseño del nuevo algoritmo de control. En la sección 4 se dan las expresiones explícitas de las dinámicas externa e interna del sistema, se muestra la convergencia exponencial de las trayectorias del sistema trasformado y se lleva a cabo el análisis de acotamiento de las trayectorias de error. En la sección 5 se muestran los resultados de las simulaciones numéricas realizadas. Finalmente, en la sección 6 se dan algunos comentarios finales.
2. Modelo dinámico y problema de control
El modelo dinámico del péndulo con rueda inercial puede escribirse como D ¨q+G(q) =u, (1) con D=d11 d12 d21 d22 , G= − ¯ mg0sin(q1) 0 , u= 0 τ , q=q1 q2 , donde q1(t) es la posición angular del péndulo, q2(t)
es la posición angular de la rueda, τ(t) es la entrada
de control que se aplica en la rueda, los parámetros ¯m,
Figure 1. Péndulo con rueda inercial.
d11, d12, d21, d22 son constantes positivas relacionadas
con las propiedades físicas del sistema y g0 representa la
constante de aceleración gravitacional. La figura 1 muestra la convención para mediciones relativas de posición y la aplicación de torque.
El objetivo es diseñar la señal de control τ(t)de tal manera
que la posición de la rueda q2(t) siga una trayectoria
deseada qd(t), mientras que la posición del péndulo q1(t)
permanece regulada alrededor de la posición vertical superior.
Si se define el error de regulación para la posición del
péndulo como e1 = −q1 y el error de seguimiento de
trayectoria para la posición de la rueda como e2=qd−q2,
entonces el vector de error puede ser definido como
x=e1, e2, ˙e1, ˙e2
>
, (2)
donde qd(t)es una función variante con el tiempo, suave,
acotada y cuatro veces diferenciable que representa la trayectoria deseada para la posición de la rueda.
De manera formal, el problema de control consiste en diseñar la entrada de control τ(t)tal que las trayectorias
de error x(t) ∈ IR4 sean señales acotadas últimamente
uniformemente, es decir, el controlador debe garantizar que
kx(t0)k ≤a ⇒ kx(t)k ≤b ∀t≥t0+T, (3)
con T=T(a, b) ≥0.
3. Diseño del algoritmo de control
El sistema de lazo abierto mostrado en la ecuación (1) puede ser reescrito en forma de espacio de estados en términos del vector de error x definido en la ecuación (2) como d dtx=f(t, x) +gτ, (4) donde f(t, x) = ˙e1 ˙e2 d22det(D)−1mg¯ 0sin(e1) ¨qd−d12det(D)−1mg¯ 0sin(e1) , (5) g=h0, 0, d12det(D)−1,−d11det(D)−1 i> . (6)
Con el fin de aplicar la técnica de linealización por retroalimentación se propone la siguiente función de salida:
y=d11∆pe1+d12∆pe2+d11∆d˙e1+d12∆d˙e2, (7)
donde ∆p y ∆d son constantes positivas. Calculando la
derivada respecto al tiempo de la función de salida en la ecuación (7) hasta obtener una expresión que relacione directamente la entrada de control τ con la dinámica de salida se obtiene
˙y=d11∆p˙e1+d12∆p˙e2+d12∆d¨qd+∆dmg¯ 0sin(e1), (8)
¨y=d12∆p¨qd+∆pmg¯ 0sin(e1) +d12∆d ... qd +∆dmg¯ 0cos(e1)˙e1, (9) ... y=d12∆p ... qd+d12∆d .... qd+∆pmg¯ 0cos(e1)˙e1
−∆dmg¯ 0sin(e1)˙e12+∆dm¯2g20d22sin(e1)cos(e1)det(D)−1 +∆dmg¯ 0d12cos(e1)det(D)−1τ. (10)
Como se puede apreciar, la entrada de control τ aparece después de la tercera derivada de la funciona de salida a lo largo de las trayectorias del sistema dado en la ecuación (4), lo que significa que el grado relativo del sistema con la salida propuesta en la ecuación (7) es 3.
Tomando en cuenta la relación entrada-salida en la ecuación (10), se tiene que la transformación de entrada dada por τ= [∆dmg¯ 0d12cos(e1)det(D)−1]−1[u− (d12∆p ... qd +d12∆d ....
qd+∆pmg¯ 0cos(e1)˙e1−∆dmg¯ 0sin(e1)˙e21 +∆dm¯2g20d22sin(e1)cos(e1)det(D)−1)], (11)
con la entrada de control auxiliar u definida como
u= −k3¨y−k2˙y−k1y, (12)
donde k1, k2 y k3 son constantes positivas, resulta en la
siguiente dinámica de salida: d
dt¨y= −k3¨y−k2˙y−k1y. (13)
Aplicando el criterio de estabilidad de Routh-Hurwitz se puede verificar que
lim
t→∞y(t) =0, (14)
de forma exponencial, si las constantes k1, k2 y k3
satisfacen
k2>
k1
k3
. (15)
El comportamiento de las trayectorias de salida es conocido como dinámica externa, que en este caso está descrito por la ecuación (13). El sistema de lazo cerrado completo está compuesto por la dinámica externa y la llamada dinámica interna, es decir, la parte del sistema que es inobservable a través de la dinámica de salida.
4. Análisis de las trayectorias de lazo cerrado
Para obtener la dinámica interna, es necesario definir una
transformación de coordenadas z = Φ(t, x) con z =
[η1, ξ1, ξ2, ξ3]> ∈ IR4, donde ξ1 = y, ξ2 = ˙y y
ξ3 = ¨y son los estados de la dinámica externa definidos
en las ecuaciones (7)-(9), respectivamente, y el estado de la
dinámica interna η1debe ser propuesto tal que se satisfaga
la ecuación diferencia parcial
∂η1
∂x g
=0, (16)
con g definido en la ecuación (6). Tomando en cuenta la condición dada en la ecuación (16), se propone el estado
de la dinámica interna η1como
η1=∆p∆dd11˙e1+∆p∆dd12˙e2. (17)
Por lo tanto, la transformación z=Φ(t, x)resulta ser
Φ= ∆p∆dd11˙e1+∆p∆dd12˙e2 d11∆pe1+d12∆pe2+d11∆d˙e1+d12∆d˙e2 d11∆p˙e1+d12∆p˙e2+d12∆d¨qd+∆dmg0¯ sin(e1) d12∆p¨qd+∆pmg0¯ sin(e1) +d12∆d ... qd+∆dmg0¯ cos(e1)˙e1 (18)
El sistema de lazo cerrado en términos de la
transformación de coordenadas es dado por la derivada de z respecto al tiempo, el cual queda expresado como
d dt η1 ξ1 ξ2 ξ3 = ∆pξ2−∆∆pdη1 ξ2 ξ3 −k3ξ3−k2ξ2−k1ξ1 . (19)
Dado que anteriormente se mostró que las trayectorias de la dinámica externa ξ1(t), ξ2(t) y ξ3(t) convergen a
cero cuando el tiempo t tiende a infinito, siempre que las ganancias de control k1, k2y k3satisfagan la condición en
(15), es fácil probar mediante el criterio de Routh-Hurwitz que el origen del sistema de lazo cerrado en (19) es exponencialmente estable.
4.1. Acotamiento de las Trayectorias de Error
Proposición 1. Dado que las trayectorias z(t) = [η1(t), ξ(t)>]> ∈ IR4 convergen al origen de
manera exponencial, entonces las soluciones de la
dinámica de error del péndulo con rueda inercial
x(t) = [e1(t), e2(t), ˙e1(t), ˙e2(t)]> ∈ IR4 son acotadas
últimamente uniformemente.
Proof. La transformaciónΦ(t, x)en (18) puede ser reescrita como z=Φx+Φt, (20) donde Φx= ∆p∆dd11˙e1+∆p∆dd12˙e2 d11∆pe1+d12∆pe2+d11∆d˙e1+d12∆d˙e2
d11∆p˙e1+d12∆p˙e2+∆dmg¯ 0sin(e1)
∆pmg¯ 0sin(e1) +∆dmg¯ 0cos(e1)˙e1
0 2 4 6 8 10 12 14 16 18 20 −0.1 −0.05 0 0.05 0.1 0.15 0.2 P o s ic i´o n [r a d ] q1(t) Ref. 0 2 4 6 8 10 12 14 16 18 20 0 50 100 150 200 250 P o s ic i´o n [r a d ] T iempo[s] q2(t) qd(t)
Figure 2. Regulación: evolución temporal de las trayectorias de
posición del péndulo q1(t) (superior) y de posición de la rueda q2(t)
(inferior). y Φt= 0 0 d12∆d¨qd d12∆p¨qd+d12∆d ... qd .
Se tiene que la matriz jacobiana deΦxevaluada en x=0
H= ∂Φx ∂x x=0 = 0 0 ∆p∆dd11 ∆p∆dd12 ∆pd11 ∆pd12 ∆dd11 ∆dd12 ∆dmg¯ 0 0 ∆pd11 ∆pd12 ∆pmg¯ 0 0 ∆dmg¯ 0 0 , (21) es no singular y por lo tanto califica como una transformación de coordenadas local en el vecindario del origen [18].
Definiendo la función Ψ(x) = [Φx(x) −Hx], que
es localmente Lipschitz, la transformación dada en la ecuación (20) puede ser reescrita como
z=Hx+Ψ(x) +Φt(t)
donde, tomando en cuenta que kΨ(x)k ≤ e1kxk en el
vecindario del origen, se puede escribir una cota superior parakx(t)kcomo sigue:
kxk ≤ [kHk +e1]−1[kzk + kΦt(t)k]. (22)
Por lo tanto, es posible concluir que el vector de error
x(t) = [e1(t), e2(t), ˙e1(t), ˙e2(t)]>es acotado últimamente
uniformemente. Además, este resultado nos permite
también establecer que, en el caso de que la trayectoria deseada sea constante, las trayectorias de error convergen al origen de forma exponencial. Este resultado se puede
inferir del hecho de que la función Φt = 0 para una
trayectoria deseada qd constante, de tal manera que la
desigualdad en la ecuación (22) describe la convergencia
asintótica de las trayectorias de error.
0 2 4 6 8 10 12 14 16 18 20 −0.05 0 0.05 T o r q u e [Nm ] τ(t) 0 2 4 6 8 10 12 14 16 18 20 −0.2 −0.1 0 0.1 0.2 T iempo[s] y(t)
Figure 3. Regulación: evoluación temporal de la señal de
control τ(t) (superior) y de la función de salida y(t) (inferior). 5. Resultados de simulación
En esta sección se presentan los resultados de las simulaciones numéricas para los casos de regulación y seguimiento de trayectorias en la posición de la rueda, realizadas utilizando el algoritmo de control propuesto en la ecuación (11) aplicado al modelo del péndulo con rueda inercial dado en la ecuación (1). Los valores numéricos
de los parámetros del modelo dinámico fueron d11 =
0.0462 [Kg m2/rad], d12 = d21 = d22 = 6.2814×
10−4 [Kg m2/rad] y ¯m = 0.2359 [Kg m2/rad], que de
hecho corresponden a los valores de una plataforma experimental de este sistema. La constante de aceleración
gravitacional fue considerada como g0 = 9.81 [m/s2].
Las ganancias de control para el algoritmo en (11) fueron k1=2, k2=4, k3=2,∆p =1 y∆d=0.2. Finalmente, las
condiciones iniciales para todos los casos fueron q1(0) =
0.2 [rad], q2(0) =0 [rad], ˙q1(0) =0 [rad] y ˙q2(0) =0 [rad].
5.1. Caso de Regulación
Los resultados en el caso de regulación para qd = 0,
son mostrados en las figuras 2-3. Específicamente para la figura 2, la gráfica superior muestra la evolución temporal
de la posición del péndulo q1(t) y la gráfica inferior
muestra la evolución temporal de la posición de la rueda q2(t). Para la figura 3, la gráfica superior muestra la señal
de control aplicada τ(t) y la gráfica inferior muestra la
evolución temporal de la señal de salida y(t)definida en
la ecuación (7).
Como se puede observar, los resultados teóricos sobre la estabilidad asintótica del origen del sistema (4) con el controlador propuesto en (11) son verificados por los resultados mostrados.
5.2. Caso de Seguimiento de Trayectoria
Para el caso de seguimiento de trayectoria, la trayectoria deseada qd(t)fue seleccionada como
qd= −a sin(ωt)(e−bt
3
−1) [rad], (23)
0 2 4 6 8 10 12 14 16 18 20 −0.1 −0.05 0 0.05 0.1 0.15 0.2 P o s ic i´o n [r a d ] q1(t) Ref. 0 2 4 6 8 10 12 14 16 18 20 −100 −50 0 50 100 150 200 250 P o s ic i´o n [r a d ] T iempo[s] q2(t) qd(t)
Figure 4. Seguimiento de trayectoria: evolución temporal
de las trayectorias de posición del péndulo q1(t) (superior) y de
posición de la rueda q2(t) (inferior).
0 2 4 6 8 10 12 14 16 18 20 −0.05 0 0.05 T o r q u e [Nm ] τ(t) 0 2 4 6 8 10 12 14 16 18 20 −0.2 −0.1 0 0.1 0.2 T iempo[s] y(t)
Figure 5. Seguimiento de trayectoria: evolución temporal
de la señal de control τ(t) (superior) y de la función de salida y(t) (inferior).
Los resultados para este caso son mostrados en las figuras 4-5. Específicamente para la figura 4, la gráfica superior muestra la evolución temporal de la posición del péndulo q1(t) y la gráfica inferior muestra la evolución temporal
de la posición de la rueda q2(t)con la trayectoria deseada
qd(t)en (23). Para la figura 5, la gráfica superior muestra la
señal de control aplicada τ(t)y la gráfica inferior muestra la evolución temporal de la señal de salida y(t).
De los resultados presentados puede corroborarse que los errores de regulación e1(t)y de seguimiento de trayectoria
e2(t) permanecen acotados alrededor del origen después
de un tiempo finito T>0, lo que confirma el acotamiento
último uniforme de las trayectorias de error.
6. Conclusiones
En este documento se propuso un nuevo algoritmo de control derivado de la técnica de linealización por retroalimentación para un nuevo problema de seguimiento de trayectorias en el péndulo con rueda
inercial. En nuevo problema de control consiste en
el seguimiento de trayectorias variantes con el tiempo en la posición de la rueda, al mismo tiempo que el péndulo se mantiene regulado alrededor de la posición
vertical superior. El controlador es diseñado a partir
de una función de salida que depende del vector de error, inspirado de trabajos previamente publicados en
la literatura. Los resultados teóricos y de simulación
confirman la convergencia asintótica de las trayectorias de error para el caso de regulación y el acotamiento último uniforme de las trayectorias de error para el caso de seguimiento.
Agradecimientos
Se agradece a la Secretaria de Investigación y Posgrado del Instituto Politécnico Nacional (SIP-IPN) y al Consejo Nacional de Ciencia y Tecnología (CONACYT) por el apoyo económico brindado a través del proyecto SIP 20160748 y el proyecto CONACYT 176587.
7. References
[1] Andrievsky, B. R., 2011, “Global Stabilization of the Unstable Reaction-Wheel Pendulum,” Automation and Remote Control, 72(9), pp. 1981-1993.
[2] Srinivasa, K. N., and Behera, L., 2008, “Swing-up Control Strategies for a Reaction Wheel Pendulum,” Int. J. of Systems Science, 39(12), pp. 1165-1177. [3] Spong, M. W., Corke, P., and Lozano R., 2001,
“Nonlinear Control of the Reaction Wheel
Pendulum,” Automatica, 37(11), pp. 1845-1851. [4] Owczarkowski, A., Lis, M., and Kozierski, P., 2014,
“Tracking Control of an Inertial Wheel Pendulum by LQR Regulation,” Proc. 19th Int. Conf. On Methods and Models in Aut. and Rob., Miedzyzdroje, PL, pp. 384-388.
[5] Khalid, N., and Memon, A. Y., 2014, “Output
Feedback Stabilization of an Inertia Wheel
Pendulum Using Sliding Mode Control,” Proc. 2014 UKACC Int. Conf. on Control, Loughborough, UK, pp. 157-162.
[6] Rudra, S., Barai, R. K., et al., 2013 “Global Stabilization of a Flat Underactuated Inertia Wheel: A Block Backstepping Approach,” Proc. 2013 Int. Conf. on Computer Communication and Informatics, Coimbatore, IN, pp.1-4
[7] Martinez-Soto, R., Rodriguez, A., Castillo, O., and Aguilar, L. T., 2012, “Gain Optimization for Inertia Wheel Pendulum Stabilization Using Particle Swarm Optimization and Genetic algorithms,” Int. J. of Innovative Computing, Information and Control,
8(6) pp. 4421-4430.
[8] Huber, J., Gruber, C., and Hofbaur, M., 2013, “Online Trajectory Optimization for Nonlinear Systems by
the Concept of a Model Control Loop â ˘AˇT Applied
to the Reaction Wheel Pendulum,” Proc. 2013 IEEE Int. Conf. on Control Applications, Hyderabad, IN, pp. 935-940.
[9] Moreno-Valenzuela, J., Aguilar-Avelar, C., and Puga-Guzman, S., 2014, “On Trajectory Tracking Control of the Inertia Wheel Pendulum,” Proc. Int.
Conf. on Control, Decision and Inf. Tech., Metz, FR, pp. 572-577.
[10] Iriarte, R., Aguilar, L. T., and Fridman, L., 2013, “Second Order Sliding Mode Tracking Controller for Inertia Wheel Pendulum,” J. of the Franklin Institute
350(1), pp. 92-106.
[11] Andary, S., Chemori, A., Benoit, M., and Sallantin, J., 2012, “A Dual Model-free Control of Underactuated Mechanical Systems, Application to the Inertia Wheel Inverted Pendulum,” Proc. American Control Conference, Montreal, CA, pp. 1029-1034.
[12] Aguilar-Avelar, C., and Moreno-Valenzuela, J., 2015 “A Composite Controller for Trajectory Tracking Applied to the Furuta Pendulum,” ISA Transactions,
57(2015), pp. 286-294.
[13] Aguilar-Avelar, C., and Moreno-Valenzuela, J., 2014, “A Feedback Linearization Controller for Trajectory Tracking of the Furuta Pendulum,” Proc. American Control Conference, Portland, USA, pp. 4543-4548.
[14] Jung, S., and Kim, S. S., 2007, “Hardware
Implementation of a Real-Time Neural Network Controller With a DSP and an FPGA for Nonlinear Systems,” IEEE Trans. on Industrial Electronics,
54(1), pp. 265-271.
[15] Jung, S., and Kim, S. S., 2008, “Control Experiment of a Wheel-Driven Mobile Inverted Pendulum Using Neural Network,” IEEE Trans. on Control Systems Technology, 16(2), pp. 297-303.
[16] Khalil, H.K., 1996, Nonlinear Systems, Prentice Hall, Upper Saddle River, 2nd ed.
[17] Slotine, J.-J. E., and Li, W., 1991, Applied Nonlinear Control, Prentice Hall, New Jersey.
[18] Isidori, A., Nonlinear Control Systems,