Figura 5-6.: Colisi´on de puntos de tangencia cuando u= 2.3816.
Figura 5-7.: Comportamiento de los puntos de tangencia al variar el par´ametrou.
5.2.
Discusi´
on
Los resultados presentados en la secci´on anterior avalan el an´alisis realizado sobre el modelo matem´atico del p´endulo f´ısico. Para empezar, el an´alisis de las zonas de cruce que se hizo en la secci´on4.3.1, se valida con la Figura 5-1, donde se muestra que las ´orbitas siempre cruzan la frontera de conmutaci´on cuando u toma valores por fuera del intervalo [−2.3816,2.3816]. Los resultados de la respuesta natural del sistema presentados en la Figura 5.1 muestran que para el caso5.2(a), el CPE se comporta como un sumidero de las ´orbitas que lo rodean. Por otra parte, la Figura 5.2(b) muestra que el CPE, al menos para una peque˜na zona en su vecindad, es estable. En este caso, los puntos de tangencia se comportan como equlibrios
5.2 Discusi´on 29 de tipo silla. En este sentido, la cuenca de atracci´on del CPE resultante depende de la varie-dad estable de este comportamiento. As´ı, cuando se considera un modelo simplificado donde ´
unicamente se tome en cuenta la fricci´on viscosa, solamente se puede diferenciar entre dos tipos de equilibrios, los focos y las sillas; no obstante, si tambi´en se asumen los efectos de la fricci´on seca, dos espacios estables aparecen en torno a (0,0) y (π,0), aunque la cuenca de atracci´on de la segunda, es m´as peque˜na en comparaci´on con la primera.
En lo que respecta a la asignaci´on u = 1.4946, los resultados presentados en la Figura 5.1, muestran que el retrato de fase es topol´ogicamente equivalente en comparaci´on con el caso de la respuesta natural; lo que diferencia a ambos casos, es que la posici´on de los CPEs, en general, cambian de φ1 = 0 y φ1 = π, a la posici´on mostrada en la Figura 4-4; y en
adici´on a ello, la extensi´on de los CPEs sobre Σ, para u= 1.4946 es ligeramente superior en comparaci´on con el caso de la respuesta natural. En particular, esta diferencia en el tama˜no de los CPEs se debe al torque del peso.
Por otra parte, de acuerdo a la secci´on4.3.3, la primera colisi´on entre dos puntos de tipofold ocurre cuando se fija u= 2.1596. En este caso, la Figura 5-4 muestra la din´amica alrededor de esta colisi´on. Como se puede observar, la bifurcaci´on toma lugar en el punto (π/2,0), lo que da paso a la uni´on de los CPEs, la cual abarca la regi´on de estabilidad m´as ancha sobre Σ, debido a que el torque del peso toma su m´aximo valor en φ1 =π/2. Luego, conforme el
par´ametrouaumenta, se inicia un proceso de superposici´on entre los subespacios de pseudo-equilibrios. La consecuencia de este fen´omeno es la reducci´on de la zona que abarca la uni´on de los CPEs, como se puede comprobar en la Figura 5-5, donde se muestra la din´amica del sistema cuando u= 2.3042. Finalmente, el incremento continuo de la fuerza externa aplica-da al p´endulo induce la colisi´on entre las tangencias restantes, que en este caso, se sucede cuandou= 2.3816 (ver Figura5-6). A partir de este punto, la din´amica del p´endulo se rige de acuerdo al an´alisis realizado para los casos de cruce en la secci´on 4.3.1.
Por ´ultimo, todo el proceso descrito anteriormente se puede resumir en el diagrama de bifur-caciones de la Figura 5-7. En particular, el camino de las tangencias se observa variando el par´ametrou entre−2.3816 y 2.3816. Adem´as, se puede ver que el proceso de bifurcaci´on es sim´etrico en los casos en que el p´endulo gira tanto a favor como en contra de las manecillas del reloj; lo que implica que el orden de las colisiones entre tangencias, depende directamen-te de la direcci´on de la fuerza externa. Este diagrama de bifurcaciones tambi´en muestra la variaci´on en los tama˜nos de las CPEs, como consecuencia de la variaci´on en u. Como caso especial, se puede ver que el tama˜no m´aximo de estos continuos de pseudo-equilibrios, para ambos casos, ocurre en la primera colisi´on de tangencias.
Estrategia de Control ZAD: Dise˜
no y
6. Aplicaci´
on de la Estrategia ZAD al
P´
endulo F´ısico
El p´endulo f´ısico invertido es un sistema que demanda un modelado preciso y sofisticadas estrategias de control [34]. En efecto, dentro de la teor´ıa de control, el p´endulo invertido representa un desaf´ıo porque es una fuente rica de din´amica no lineal que demanda robus-tez, estabilidad y eficiencia para ser controlado. Por esta raz´on, muchos m´etodos de control tales como el control por deslizamiento, el control difuso, control mediante redes neuronales, control adaptativo, control H∞, control cl´asico, entre otros, se presentan como alternativas de control en [33]. Sin embargo, aunque algunas de las t´ecnicas previamente mencionadas tienen la capacidad de controlar satisfactoriamente al p´endulo, otras presentan sus propias limitaciones.
En particular, el control basado en modos deslizantes [40], se caracteriza por ser altamente robusto ante las condiciones iniciales, no obstante, debido a la acci´on discontinua del con-trolador, se generan fen´omenos propios de los sistemas conmutados, como por ejemplo, el chattering. Ahora, en lo que respecta a la estrategia de din´amica de promediado cero, o por sus siglas en ingl´es (ZAD), se debe decir que es una t´ecnica de control basada en modos deslizantes orientada a los convertidores de potencias [25, 26]. La ventaja que ofrece esta t´ecnica de control, es que preserva la robustez de los controladores basados en el desliza-miento, mientras reduce los efectos negativos del chattering al fijar una ´unica frecuencia de conmutaci´on.
Por otra parte, dentro del campo de los sistemas mec´anicos, cuando se introduce un control basado en deslizamiento, la ausencia de una frecuencia de conmutaci´on fija puede ocasionar una acci´on de control insatisfactoria o la destrucci´on del sistema; lo anterior como conse-cuencia del chattering y la susceptibilidad de los sistemas de naturaleza mec´anica ante las frecuencias altas de conmutaci´on. Debido a que la estrategia ZAD hace uso de una frecuencia de conmutaci´on fija, y adem´as es robusta ante las condiciones iniciales, se la considera como una estrategia id´onea para ejercer control en los sistemas mec´anicos. De este modo, se propo-ne al p´endulo f´ısico analizado en el cap´ıtulo 3como objeto de control de la ley ZAD, porque es un sistema mec´anico y su din´amica representa un reto para cualquier estrategia de control. A continuaci´on se aplica la estrategia ZAD al p´endulo f´ısico analizado en el cap´ıtulo 3. Para
este caso, la acci´on de control se hace mediante la aplicaci´on de dos torques, lo que impli-ca que el p´endulo se pueda analizar como un sistema de estructura variable. Luego, la ley de control permite definir la superficie de deslizamiento en funci´on del error que tienen la posici´on y velocidad del p´endulo con respecto a la referencia; adicional a ello, se calcula la expresi´on algebraica del ciclo de trabajo, y as´ı se puede establecer el tiempo en que cada una de las estructuras del sistema se habilita dentro de un periodo. Por ´ultimo, se fijan los valores de cada uno de los par´ametros que permiten ejercer la acci´on de control y se presentan los resultados a manera de simulaciones.
6.1.
Estrategia de Din´
amica de Promediado Cero (ZAD)
En lo que respecta a esta investigaci´on, el objetivo de control se establece como la necesidad de invertir la posici´on vertical del p´endulo y mantenerla. Debido a que el espacio de estados abarca todo R2, el conjunto de puntos ((n+ 1)π,0) ∀ n ∈ Z satisfacen el objetivo de con-trol. Sin embargo, fijandon = 0, se tomar´a al punto (π,0) como la ´unica referencia sobre el espacio de estados.
Para este caso en particular, el control del p´endulo f´ısico se hace a partir de la aplicaci´on adecuada en la juntura O de dos torques de igual magnitud, pero de direcci´on totalmente opuesta. En la Figura 6-1, estos torques se denotan como +q y −q. Cuando se aplica el torque +q, el p´endulo gira en contra de las manecillas del reloj, y se considera que tanto la posici´on como la velocidad crecen positivamente en el espacio de estados. Por el contrario, el torque −q hace que el p´endulo gire a favor de las manecillas del reloj y el crecimiento de la posici´on y de la velocidad se toma como negativo. Adem´as, es necesario resaltar que +qy−q
son fuerzas que la variable u puede tomar; en este sentido, el sistema puede alternar entre las topolog´ıas (6-1) y (6-2) a lo largo del tiempo, y por lo tanto se puede considerar que el sistema tiene estructura variable [39]. Es precisamente esta variaci´on en la estructura la que permite definir una l´ogica de conmutaci´on, que a su vez puede ser utilizada para manipular la din´amica del sistema y as´ı obtener una respuesta deseada [29].
f(+q, φ1, φ2) = ˙ φ1 =φ2 ˙ φ2 = 19.7393 (+q)−44.8065·sin (φ1)−0.0315φ2−2.1969·sgn (φ2) , (6-1) f(−q, φ1, φ2) = ˙ φ1 =φ2 ˙ φ2 = 19.7393 (−q)−44.8065·sin (φ1)−0.0315φ2 −2.1969·sgn (φ2) . (6-2)
6.1 Estrategia de Din´amica de Promediado Cero (ZAD) 33 +q -q O u Φ1 Φ1 = 0 rad
Figura 6-1.: Aplicaci´on de los torques +q y −q al p´endulo.
Dentro de los procesos de control, el control por modo deslizante se vale de la estructura variable de los sistemas para imponer una conducta en la din´amica, a trav´es de una l´ogica de conmutaci´on. De este modo, para que el sistema entre en un r´egimen de deslizamiento, es necesario definir una superficie de conmutaci´on, la cual permite rastrear el objetivo de control dentro del espacio de estados; adicional a ello, se debe establecer una ley de con-trol basada en la estructura cambiante del sistema [9, 16, 29, 40]. En lo que respecta a la superficie de deslizamiento del p´endulo, primero se hace necesario introducir la subvariedad
A={(φ1, φ2)∈R2 :s(φ1, φ2) = 0} tal que A6= 0, dondes es la superficie de deslizamiento,
definida como la funci´on escalar s : R2 → R sujeta a ∇s(φ1, φ2) 6= 0 ∀ (φ1, φ2) ∈ R2; as´ı,
la din´amica de la posici´on y velocidad del p´endulo se restringe a A [35]. Por otra parte, la ley de control se puede definir a partir del torque u, el cual tomar´a los valores +q o −q de acuerdo al signo de la superficie s(φ1, φ2) [35].
Ahora, es en este punto donde se hace necesario introducir el concepto de la estrategia de control ZAD. B´asicamente, lo que hace esta estrategia es imponer una restricci´on sobre la variable u, de tal manera que el error en estado estacionario con respecto a la superficie de deslizamiento, en promedio, sea cero, es decir
(k+1)T
Z
kT
s(φ1, φ2)dt = 0, (6-3)
donde T es el periodo de muestreo y k determina la periodicidad de la restricci´on hasta alcanzar un tiempo t. De esta manera, la estrategia ZAD se puede entender como una va-riaci´on d´ebil del control basado en deslizamiento, lo cual resulta favorable a la hora ejercer control sobre un sistema de naturaleza mec´anica, tal como el p´endulo f´ısico, debido a que la
frecuencia de conmutaci´on es ´unica, y el error con respecto a la referencia en estado estacio-nario es bajo [25, 26].
En resumen, para rastrear la referencia dentro del espacio de estados, la estrategia ZAD obliga a que la din´amica del error con respecto a una superficie de deslizamiento s(φ1, φ2),
en promedio, sea cero [25,26]. Para este caso en particular, la superficie de deslizamiento se construye como una combinaci´on lineal de los errores de posici´on y velocidad. En efecto, para mantenerse cerca a la superficies(φ1, φ2), la estrategia ZAD conmuta entre las topolog´ıas del
sistema a lo largo de un periodoT, el cual ha sido fijado previamente; adem´as, este proceso se ejecuta en repetidas ocasiones hasta minimizar la din´amica del error. Dicho proceso inicia con el c´alculo del tiempoDsujeto a D∈[0, T], que es el tiempo en que la primera topolog´ıa es habilitada; por otra parte, para el tiempo restante, es decir T −D, el sistema conmuta a la segunda topolog´ıa. As´ı, se fija el ciclo de trabajod=D/T, donde 0≤d ≤1. En la Figura
6-2 se presenta el funcionamiento de la estrategia ZAD cuando se aplica al p´endulo f´ısico, en particular, el sistema se rige por la topolog´ıa (6-1) durante el tiempo dT, mientras que durante el tiempo (1−d)T, la topolog´ıa que rige al sistema es (6-2).
-q
+q
t uT
dT (1-d)TFigura 6-2.: Esquema de la estrategia ZAD. En cada ciclo T, la variable de control u es igual a +q durante el tiempo dT. Por otra parte, u es igual a -q en el tiempo restante (1-d)T.
6.2.
C´
alculo del Ciclo de Trabajo
d
De acuerdo a la secci´on anterior, la aplicaci´on de la estrategia ZAD al p´endulo f´ısico se reduce al calculo del ciclo de trabajodpara cada periodoT. Lo anterior, equivale a encontrar la so-luci´on de la Ecuaci´on (6-3), la cual no es posible establecer anal´ıticamente porque trasciende los l´ımites del ´algebra. En particular, en [2] se estudian diferentes maneras de aproximar la
6.2 C´alculo del Ciclo de Trabajo d 35 soluci´on de (6-3), de las cuales se destacan la integraci´on num´erica y la construcci´on de la superficies(φ1, φ2) mediante rectas a tramos. Debido a que el m´etodo de las rectas a tramos
facilita considerablemente el calculo de d, y adem´as el error con respecto a la superficie de deslizamiento es bajo, se considera adecuado utilizar este m´etodo en la aplicaci´on de la es-trategia ZAD al p´endulo f´ısico. Sin embargo, de acuerdo a [27], si lo que se busca es estudiar curvas de bifurcaci´on y caos, resulta m´as conveniente utilizar la integraci´on num´erica. Antes de calcular el par´ametro d mediante el uso de rectas a tramos que aproximan la superficie de conmutaci´on, lo primero que se hace es definir dicha superficie. En efecto, considerando al punto (π,0) como la referencia del sistema y siguiendo a [20], la superficie de conmutaci´on s(φ1, φ2) se define como
s(φ1, φ2) = (φ1−π) +ksφ2, (6-4)
donde ks es la constante de tiempo asociada a la din´amica de primer orden dada por la
superficie, y que corresponde a la din´amica que se quiere siga el error. De este modo, se puede aproximar el par´ametrod al tener en cuenta las siguientes consideraciones [2]:
La din´amica del error o superficie de deslizamiento se comporta como una recta a tramos.
Las pendientes de la din´amica del error en cada tramo est´an determinadas por las pendientes al momento de la conmutaci´on.
As´ı, definiendo al punto (φ1(0), φ2(0)) como los valores de la posici´on y velocidad del p´endulo
al inicio de cada periodo, para calcular la integral de la superficie de deslizamiento (6-4) en cada periodo de muestreo T, se usa la siguiente expresi´on
T Z 0 s(φ1, φ2)dt∼= dT Z 0 s0+ts+ dt+ T Z dT s0+s+dT + (t−dT)s−dt, (6-5) dondes0 equivale al valor de la superficie de deslizamiento en el punto (φ1(0), φ2(0)), s+ es
el valor de la pendiente cuando u = +q, y s− la pendiente de la superficie cuando u= −q. A partir de la Ecuaci´on (6-4) y de su primera derivada con respecto al tiempo, se fija a s0,
s+ y s− como en las Ecuaciones (6-6), (6-7) y (6-8), respectivamente.
s0 = (φ1(0)−π) +ksφ2(0), (6-6)
s+=φ2(0) +ks(19.7393 (+q)−44.8065·sin (φ1(0))−0.0315φ2(0)−2.1969·sgn (φ2(0))),
s− =φ2(0) +ks(19.7393 (−q)−44.8065·sin (φ1(0))−0.0315φ2(0)−2.1969·sgn (φ2(0))).
(6-8) Al resolver la Ecuaci´on (6-5) se obtiene la siguiente ecuaci´on cuadr´atica en funci´on del ciclo de trabajod
d2−2d− s
−T −2s
0
T (s+−s−) ∼= 0. (6-9)
De este modo, al despejar el ciclo d a partir de la Ecuaci´on (6-9), finalmente se obtiene
d= 1−
s
s++ 2s0
T
(s+−s−). (6-10)
Debido a que el ciclo de trabajo se restringe mediante la desigualdad 0≤d ≤1, esto implica que para la Ecuaci´on (6-10), sea necesario tener en cuenta las siguientes consideraciones
Se debe establecer el valor ded cuando la expresi´on dentro del radical en la Ecuaci´on (6-10) es menor a cero, es decir
s++2s0
T
(s+−s−) <0, (6-11)
por lo tanto, de acuerdo a las Ecuaciones (6-7) y (6-8), la expresi´ons+−s−en la Ecua-ci´on (6-11) siempre es positiva, y en consecuencia, cuando se satisface la desigualdad −T s+>2s0, la ra´ız no tiene soluci´on en los n´umeros reales. No obstante, la
desigual-dad anterior se puede tornar falsa si s0 toma un valor lo suficientemente grande al
instante de muestreo, mediante el crecimiento positivo de las variables de estado φ1 y
φ2; en este sentido, el ciclo de trabajo se satura comod= 1, lo que asegura que uvalga
+q a lo largo deT.
En lo que respecta a la aparici´on de un ciclo negativo, se deben estudiar los casos para los cuales la ra´ız de la Ecuaci´on (6-10) es mayor a uno; esto equivale a hacer el an´alisis de la siguiente desigualdad
s++2s0
T
(s+−s−) >1. (6-12)
La condici´on presentada en la Ecuaci´on (6-12) se puede reducir a la expresi´on −s− <
2s0/T. De este modo, la condici´on anterior se puede romper, si se hace que el valor de
s0 sea lo suficientemente peque˜no a partir del crecimiento negativo de las variables de
estadoφ1 y φ2. En efecto, el ciclo de trabajo se satura comod= 0, lo que implica que
6.2 C´alculo del Ciclo de Trabajo d 37 A continuaci´on, luego de haber establecido y analizado el modelo matem´atico que aproxima la din´amica del p´endulo, y en base a este modelo haber dise˜nado la estrategia ZAD orien-tada al control de este sistema mec´anico, finalmente, mediante la cuidadosa selecci´on en los valores de un conjunto de par´ametros que permiten ejercer la acci´on de control, se pre-sentan los resultados a manera de simulaci´on de la estrategia ZAD aplicada al p´endulo f´ısico.
7.1.
Selecci´
on de Par´
ametros
Antes de presentar los resultados mediante simulaciones, en donde se muestra el desempe˜no de la estrategia ZAD al ejercer control sobre p´endulo f´ısico, se considera necesario describir brevemente la manera en que se fijaron los valores de los par´ametros T, u y ks. Para
ha-cerlo, se tuvieron en cuenta factores como: las caracter´ısticas f´ısicas que limitan al sistema, el an´alisis del modelo matem´atico presentado en los primeros cap´ıtulos del documento, y el comportamiento deseado en la din´amica del error.
La elecci´on de un valor adecuado para el periodo de muestreo T se considera una tarea dif´ıcil, debido a que no se cuenta con una base te´orica para hacerlo. Sin embargo, a partir de las caracter´ısticas intr´ınsecas del sistema, es posible establecer que si se fija un valor lo suficientemente peque˜no, se incrementa el n´umero de conmutaciones entre +q y −q en un tiempo espec´ıfico, y por lo tanto se mejora la precisi´on del controlador en estado estable; sin embargo, no es recomendable reducir el valor deT tanto como sea posible, porque el sistema tiene una naturaleza mec´anica, y las frecuencias de conmutaci´on altas pueden ocasionar su colapso. De este modo, buscando equilibrio entre la precisi´on del controlador y una frecuen-cia de conmutaci´on baja, para nuestro experimento se fija T = 0.155 s.
Ahora, a partir del an´alisis presentado en la secci´on4.3.1, si la magnitud del torqueu perte-nece al intervalo [−2.3816,2.3816], entonces, debido a la falta de energ´ıa mec´anica aplicada al sistema, el p´endulo f´ısico puede quedar atrapado dentro de un continuo de pseudo-equilibrios (ver secci´on4.3.2). Por esta raz´on, para ejecutar adecuadamente la acci´on de control median-te la estramedian-tegia ZAD, dentro de nuestro experimento, el torqueutoma su valor entre una de las asignaciones−q=−2.4 Nm y +q= 2.4 Nm, dependiendo del valor del ciclo de trabajod. Finalmente, la estimaci´on del valor de ks parte de la definici´on de la superficie s(φ1, φ2),
es decir, la Ecuaci´on (6-4). De esta manera, se puede inferir que la elecci´on de un ks lo
suficientemente peque˜no, contribuye a la reducci´on del error en estado estable. No obstante, si el valor deks se reduce demasiado, esto hace que el crecimiento positivo o negativo de las
variables de estado se haga lento. Por lo tanto, teniendo en cuenta el orden de magnitud de
φ1 y φ2 para esta aplicaci´on, el valor de ks se toma del intervalo [0.01,1]. As´ı, mediante la
7.2 Simulaciones 39 de los torques +q y −q, es decir, d = 0.5 ∀ T cuando se alcanza el estado estable, fijando
T = 0.155 s, +q = 2.4 Nm y −q = −2.4 Nm; el algoritmo determina que ks debe valer
0.6595.
7.2.
Simulaciones
La presentaci´on de los resultados inicia con la Figura7-1, donde se muestra un diagrama de bifurcaciones que se construye a partir de los valores que toma el ciclo de trabajo d, cuando la constante ks varia en el intervalo [0.01,1]; adem´as, para cada uno de los valores que toma
ks, los par´ametros T = 0.155 s, +q = 2.4 Nm y −q = −2.4 Nm, se mantienen fijos. As´ı, se
permite que el sistema evolucione durante un tiempo igual a 7000T por cada variaci´on de
ks, y se representa gr´aficamente el resultado del ciclo de trabajo d calculado para cada uno
de los ´ultimos 100T.
Figura 7-1.: Diagrama de bifurcaci´on paraksvsd. Los puntos de color azul son las muestras
de d cuando ks incrementa su valor. Por el contrario, los puntos rojos son las
muestras cuando el valor deksdecrece. La variaci´on deksse hace en el intervalo
[0.01,1].
Adem´as, en la Figura 7-2 se presenta la ´orbita en el espacio de estados cuando el sistema alcanza el estado estable; para este experimento, la constante ks se fija en 0.6595 y se
Figura 7-2.: ´Orbita de periodo T inducida por la estrategia ZAD.
Ahora, con la misma configuraci´on de par´ametros utilizada en la Figura 7-2, fijando las condiciones iniciales (t= 0, φ1 = 0, φ2 = 0), en la Figura7-3 se presenta la evoluci´on de las
variables de estado φ1 y φ2 a lo largo de un tiempo igual a 500T. Adicional a esto, en las
Figuras 7-4 y 7-5 se muestran las respuestas transitorias de la posici´on y velocidad del p´endulo, junto a su comportamiento en estado estable.
7.3.
Discusi´
on
Con base al planteamiento utilizado para generar el diagrama de bifurcaciones presentado en la Figura 7-1, donde el par´ametro ks var´ıa en el intervalo [0.01,1], se puede inferir que
hay una coexistencia de comportamientos dentro de la din´amica del ciclo de trabajo d. No obstante, los puntos de color azul usados para denotar el crecimiento de ks, y los de color
rojo que denotan el decrecimiento de esta constante, muestran dos zonas donde la din´amica del ciclo de trabajo dentro del intervalo analizado, tienen caracter´ısticas iguales. La primera zona, corresponde al camino que sigue el par´ametro d, tanto hacia la entrada como hacia la salida de una regi´on ca´otica ubicada aproximadamente entre ks= 0.01 yks = 0.28. Por otra
parte, la otra zona se ubica en las inmediaciones de ks = 0.6 y ks = 0.75; lo que distingue
a esta regi´on, es que los valores del par´ametro d est´an pr´oximos a 0.5 y como caso especial, se corrobora que para el valor de ks = 0.6595, el ciclo de trabajo cumple con la condici´on
d = 0.5 ∀ T cuando el sistema ha alcanzado el estado estable. De esta manera, las fuerzas +q y −q son aplicadas por igual a lo largo de T, haciendo que la din´amica entre φ1 y φ2
7.3 Discusi´on 41
Figura 7-3.: Evoluci´on de las variables de estado durante 500T fijando las condiciones ini-ciales (t= 0, φ1 = 0, φ2 = 0).
(a) Respuesta transitoria deφ1. (b) Comportamiento en estado estable deφ1.
Figura 7-4.: Evoluci´on de la posici´on del p´endulo fijando las condiciones iniciales (t= 0, φ1 = 0, φ2 = 0).
se comporte como una ´orbita que rodea a la referencia despu´es de que el sistema supera el transitorio; en particular, esta ´orbita se presenta en la Figura 7-2, donde se hace evidente la conmutaci´on entre +q y −q alrededor de (π,0), adem´as, es necesario agregar que la con-secuencia de la conmutaci´on entre torques es un error en estado estable, que para este caso, se puede entender como el tama˜no de la ´orbita alrededor de la referencia; en este sentido, si la frecuencia de conmutaci´on es baja, el per´ımetro de la ´orbita aumenta, y el error en estado
(a) Respuesta transitoria deφ2. (b) Comportamiento en estado estable deφ2.
Figura 7-5.: Evoluci´on de la velocidad del p´endulo fijando las condiciones iniciales (t= 0, φ1 = 0, φ2 = 0).
estable es mayor; por el contrario, teniendo en cuenta la naturaleza mec´anica del sistema, si se fija una frecuencia de conmutaci´on alta, el error en estado estable disminuye debido a la reducci´on del per´ımetro de la ´orbita.
Con lo que respecta a la robustez de la estrategia ZAD ante las condiciones iniciales, esta caracter´ıstica se evidencia en la Figura 7-3. De este modo, fijando las condiciones (t= 0, φ1 = 0, φ2 = 0), se puede apreciar el efecto de la acci´on de control sobre el sistema,
al llevar al p´endulo a la referencia despu´es de haber iniciado en una posici´on diagonalmente opuesta. En caso de tomar condiciones iniciales diferentes, se considera que la acci´on de control ser´a ejercida satisfactoriamente, dado que los valores fijados en la secci´on 7.1 para los par´ametros +q, −q y ks, permiten que el sistema cuente con la energ´ıa suficiente para
seguir la superficie de deslizamiento hasta alcanzar la referencia y establecer la din´amica presentada en la Figura7-2. Adem´as, en la misma Figura7-3, a partir de los colores usados para diferenciar el tiempo en que se aplican los torques +q y −q, se puede ver que durante el estado transitorio del sistema, las condiciones de saturaci´on definidas para el par´ametro
d en la secci´on 6.2 son v´alidas, en este sentido, cuando la din´amica del sistema arranca en las condiciones iniciales ya definidas, se observa como la fuerza +q se aplica continuamente hasta que la trayectoria empieza a alejarse deφ2 = 0, y la naturaleza derivativa de la
estra-tegia ZAD provoque la primera conmutaci´on, haciendo que el valor de la fuerza pase a ser−q. Por otra parte, en la Figura7-4se presenta la respuesta de la posici´on del p´endulo en funci´on del tiempo; en el caso de la Figura 7.4(a) se presenta la respuesta transitoria de φ1, donde
se puede observar que el sistema llega suavemente a la referencia, como consecuencia de la restricci´on que impone la superficie de deslizamiento s(φ1, φ2) para la velocidad. Adem´as,
7.3 Discusi´on 43 tiempo, debido a que esta fuerza se opone al torque generado por el peso; esto se hace evi-dente cuando la posici´on del p´endulo se acerca a π/2, en donde la ley de control ZAD satura por m´as tiempo al sistema con la fuerza +q, mientras el torque del peso limita la velocidad del p´endulo; sin embargo, de acuerdo a la gr´afica, cabe agregar que existen momentos en que la l´ogica de control activa la fuerza −q, pero los tiempos en que se activa son menores en comparaci´on con los tiempos de +q, como consecuencia de la aplicaci´on de un torque en la misma direcci´on del peso. Finalmente, la din´amica de la posici´on en estado estable se presenta en la Figura 7.4(b), donde el sistema sigue a la referencia con un error en estado estable inherente a la conmutaci´on, pero manteniendo una frecuencia fija.
Por ´ultimo, la respuesta de la velocidad en funci´on del tiempo se muestra en la Figura 7-5, donde el transitorio y el comportamiento en estado estable de φ2 se analizan en la parte
7.5(a) y 7.5(b), respectivamente. En el caso transitorio, se puede observar que la pendiente de la velocidad cuando se aplica +q, es menos pronunciada en comparaci´on a la pendiente de la velocidad en el caso−q, debido a la incidencia que tiene el torque del peso en la din´amica del sistema; en este sentido, dentro del intervalo de tiempo [0.8,1.7], lo anterior se evidencia en el crecimiento lento que tiene φ2, en comparaci´on con la dr´astica disminuci´on que sufre
cuando el sistema conmuta. Adem´as, analizando la Figura 7.4(a), se puede ver que dentro del intervalo de tiempo [0.8,1.7], la variable φ1 pasa por π/2, es decir, el punto donde el
torque del peso es m´aximo, lo cual explica el crecimiento lento de la velocidad. No obstante, a partir de la Figura7.5(b), las pendientes de la velocidad para el torque +q y−qse igualan cuando el sistema alcanza el estado estable.
8. Conclusiones
A partir del estudio realizado a lo largo de esta investigaci´on, tanto en la din´amica del p´endulo como en el dise˜no y aplicaci´on de la estrategia ZAD, se presentan a continuaci´on las principales contribuciones que deja el desarrollo de este proyecto.
En primer lugar, en los cap´ıtulos 3 a 5 se realiza el modelado, an´alisis y simulaci´on del p´endulo f´ısico. En efecto, la inclusi´on de la fricci´on dentro del modelo matem´atico, y como caso especial, la fricci´on seca, alteran significativamente la din´amica del p´endulo. De este modo, la principal consecuencia que crea este tipo de fricci´on en el an´alisis, es la necesidad de utilizar diferentes campos vectoriales en distintos dominios no solapados dentro del es-pacio de estados, y poder as´ı describir satisfactoriamente la din´amica del sistema; es decir, el an´alisis se hizo considerando al p´endulo como un sistema suave a trozos. Posteriormente, se utiliz´o la teor´ıa de Filippov para construir el campo vectorial que aproxima la din´amica sobre la frontera de conmutaci´on; adem´as, a partir de esta teor´ıa se deduce la existencia de los continuos de pseudo-equilibrios (CPEs), y se induce la colisi´on de estos mediante la variaci´on del par´ametro u. Esta colisi´on inicia con el encuentro entre dos de las tangencias que acotan los lados de los CPEs, continua con el solapamiento de los pseudo-equilibrios que contienen y termina con la colisi´on entre las tangencias restantes de los CPEs originales; cabe decir tambi´en, que el orden de colisi´on entre los puntos de tangencia depende del sentido en que var´ıe el torque u, el cual puede ser positivo o negativo. Asimismo, se debe resaltar que el anterior an´alisis permiti´o definir los valores de u cuando el sistema se controla con la estrategia ZAD, y en consecuencia, asegurar que el sistema reciba la suficiente energ´ıa para ejercer una adecuada acci´on de control. En este sentido, se concluye que la fricci´on fue estudiada haciendo uso de la teor´ıa de los sistemas no suaves, y como resultado, se mostraron los cambios significativos que produce este fen´omeno f´ısico dentro de la din´amica del sistema. Por otra parte, en los cap´ıtulos 6 y 7 se dise˜n´o y aplic´o la estrategia ZAD al p´endulo f´ısico. En primera instancia, se explic´o de manera conceptual la forma en que el ZAD se puede utilizar como la ley de control del p´endulo, a trav´es de la aplicaci´on de dos torques en la juntura de apoyo del sistema. La particularidad que presentan estos torques es que compar-ten la misma magnitud, pero se aplican en direcciones totalmente opuestas. De esta manera, la ley ZAD calcula el ciclo de trabajo para cada una de las fuerzas dentro de un periodo de tiempo. Para hacer este c´alculo, el control ZAD requiere de una superficie de conmutaci´on en funci´on de la magnitud del error que tengan las variables de estado con respecto a la
referencia, e impone la restricci´on de que la din´amica del error para cada periodo de tiempo, en promedio sea cero. Luego, el siguiente paso que se di´o en el dise˜no del control aplicado al p´endulo, fue establecer las expresiones anal´ıticas de la superficie de deslizamiento y del ciclo de trabajo. Asimismo, se fijaron los valores de los par´ametros tales como la magnitud de los torques, el periodo de conmutaci´on, y la constante asociada a la din´amica del error, teniendo en cuenta el an´alisis hecho sobre el modelo matem´atico, la naturaleza mec´anica del sistema, y el comportamiento en estado estable del p´endulo. De este modo, con base a los elementos mencionados anteriormente, se realizaron las simulaciones del p´endulo cuando es controlado con la estrategia ZAD. En particular, los resultados muestran que el sistema converge a una ´
orbita de frecuencia fija que rodea a la referencia, la cual es alcanzada despu´es de tomar la condici´on inicial de la simulaci´on, en el origen del espacio de estados. Por lo tanto, se puede establecer que la estrategia ZAD, a pesar de ser una ley de control basada en modos desli-zantes, puede ser aplicada satisfactoriamente al p´endulo f´ısico debido a su robustez ante las condiciones iniciales, mientras preserva la integridad del sistema a trav´es de una frecuencia de conmutaci´on fija.
Finalmente, se puede concluir que a partir del esquema propuesto para el an´alisis del p´endulo f´ısico y su control mediante la estrategia ZAD, y de acuerdo a los resultados presentados en las simulaciones, el presente trabajo de investigaci´on representa un marco experimental que sirve como punto de partida pensando en la posible implementaci´on de la estrategia ZAD en un p´endulo f´ısico.
8.1.
Discusi´
on Acad´
emica
Art´ıculos y Conferencias Internacionales:
C. A. Castillo-Benavides, G. Olivar-Tost, and F. Angulo-Garc´ıa. Zero-Average Dyna-mics strategy control applied to physical pendulum. Proceedings of the Institution of Mechanical Engineers, Part K: Journal of Multi-Body Dynamics. 2012. (En revisi´on). C. A. Castillo-Benavides, G. Olivar-Tost, and F. Angulo-Garc´ıa. Zero-Average Dyna-mics strategy control applied to physical pendulum. 11th conferencia on Dynamical
9. Trabajo Futuro
Siguiendo la l´ınea de investigaci´on descrita en esta tesis, a continuaci´on se presentan algunos temas de tipo te´orico y pr´actico, que podr´ıan llevarse a cabo m´as adelante.
En lo que respecta al p´endulo f´ısico simple, debido a que esta investigaci´on, en parte se bas´o en el proyecto desarrollado en [14], donde el p´endulo f´ısico triple que se imple-ment´o se construy´o en base a m´odulos, lo cual implica que el sistema se pueda reducir a sus versiones doble y simple. Ser´ıa interesante probar el desempe˜no de la estrategia ZAD en la modalidad simple, basando los experimentos en el estudio presentado a lo largo de este trabajo.
Por otra parte, a partir de las herramientas anal´ıticas desarrolladas en este proyecto, el p´endulo f´ısico doble representa el siguiente eslab´on dentro de la cadena de estudio, debido a que la complejidad que existe dentro de su din´amica, lo convierten en un escenario de aplicaci´on id´oneo, para probar las bondades del ZAD como estrategia de control.
Por ´ultimo, partiendo de la metodolog´ıa desarrollada en esta investigaci´on, donde con-siderando las limitaciones que posee el p´endulo f´ısico simple, se di´o a conocer la aplica-bilidad de la ley ZAD en este tipo de sistemas; con el fin de ampliar el campo de estudio de esta estrategia de control m´as all´a de los convertidores de potencia electr´onicos, se podr´ıa analizar la respuesta de otros sistemas mec´anicos cuando se obliga a la din´amica de cada uno de ellos, a seguir una respuesta deseada a trav´es del ZAD.