Control de la posicin angular de un motor de corriente continua para el manejo de una carga robtica empleando redes neuronales

(1)

ANALES UU

de la Universidad Metropolitana

71 Control de la posición angular de un motor

de corriente continua para el manejo de una carga

robótica empleando redes neuronales

ENID ZAMBRANO (1), JOSÉ J. FERRER S. (2) Y PEDRO A. TEPPA G. (3)

(1)Gerencia de Telecomunicaciones. Telcel.

(2)Departamento de Procesos y Sistemas. USB.

(3)Departamento de Procesos y Sistemas. USB. Escuela de Ingeniería Eléctrica. UNIMET

Dos técnicas, en las cuales participan redes neuronales multicapas, han sido empleadas en la identificación y control de una planta dinámica no lineal, como es un motor de de escobillas que comanda la articulación de un robot. La primera técnica es control por modelo interno (IMC) mientras que la segunda es un método de control por modelo de referencia. Ambas se validaron a través de su capacidad de seguimiento de una referencia variable y en su habilidad en el rechazo de perturbaciones. Los resultados demuestran la efectividad de ambas técnicas.

Introducción

Desde la perspectiva de la teoría de control, la habilidad de las redes neuronales de representar sistemas no lineales es quizá, su atributo más sig-nificativo. La amplia diversidad de sistemas no lineales es la razón principal del porqué una teoría sistemática y general aplicable al control no lineal no ha fructificado. Diversos métodos tradicionales para el análisis y síntesis de controladores no lineales para clases específicas de sistemas no lineales existen actualmente y se pueden enumerar: los procedimientos del plano de fase, las técnicas de linealización y las funciones descriptivas [1]. Sin embargo, no exis-te una exis-teoría general para el control de sisexis-temas no lineales. El exis-teorema de Stone-Weierstrass [2] demuetra que las redes neuronales multicapas pueden representar relaciones no lineales arbitrarias con bastante precisión, por con-siguiente, puede pensarse en ellas como componentes de un modelo de iden-tificación. Narendra y Parthasarathy [3, 4] proponen varios modelos para la

identificación de sistemas dinámicos no lineales, los mismos están compues-tos por filtros transversales y redes neuronales multicapas como subsistemas, de forma que la relación entrada-salida puede caracterizarse a través de ecuaciones diferencias no lineales de parámetros desconocidos. La parametrización del modelo de identificación es tal, que permite la aplicación de leyes de actualización de pesos del tipo de gradiente (algoritmo

(2)

71 ANALES

backpropagation). Las redes neuronales por sus características de aproxima- ción son útiles en estrategias de control basadas en modelos que emulen las características dinámicas de la planta.

En el presente trabajo una estrategia de control por modelo de referencia [5] proveniente del área de control adaptativo y la estructura de control IMC, del área de control robusto [6, 7, 8] son implementadas empleando redes neuronales multicapas y aplicadas al control de un motor DC de escobillas para el manejo de un brazo robot, ambas estructuras son estudiadas mediante su capacidad de seguimiento de una referencia variable y su habilidad en el rechazo a perturbaciones.

Arquitectura de la red neuronal

Una red neuronal artificial (RNA) [6, 9, 10, 11] está formada por múltiples unidades de procesamiento elementales denominadas neuronas, donde cada una posee varias entradas y una sola salida que se expande a fin de servir como entrada a otras neuronas. El diagrama de bloques de una neurona típica se muestra en la figura 1. La salida de cada neurona es una función no lineal de la suma pesada de las entradas. Las RNA poseen la ventaja de mejorar su desempeño mediante el aprendizaje.

Figura 1. Neurona artificial típica.

Este último consiste en el ajuste de los pesos (ver W en la figura 1) de las neuronas para alcanzar una relación entrada-salida deseada. Las característi-cas de cualquier RNA son definidas por la función de activación no lineal esco-gida para las neuronas (ver h(.) en la figura 1) así como la arquitectura de interconexión. En este trabajo se emplean redes neuronales del tipo multicapas. Estas consisten en capas de neuronas cuyas salidas neuronales se conectan

(3)

ANALES

L.J

71

a través de enlaces pesados con las entradas de la capa siguiente. La función de activación no lineal es usualmente escogida de la clase sigmoidal.

Descripción de la planta

La planta consiste en un sistema electromecánico [12] compuesto por un motor de de escobillas y un brazo robot. El motor de corriente continua está incorporado en un circuito como ilustra la figura 2. El mismo acciona un eje apoyado sobre cojinetes, cuyo extremo se encuentra unido a un brazo que es el responsable de sujetar la masa (carga).

(1)

(2)

(3)

VE

Figura 2. Planta.

El movimiento descrito por la masa está determinado por el desplazamien-to angular del brazo, que a su vez es el mismo que describe el eje del modesplazamien-tor. Las ecuaciones fundamentales del sistema se presentan a continuación:

d

t

2

2 d

M q(t) +

B —

d

q(t) +

N sen q(t) = I(t),

(t > O)

dt

L —

d

I(t) = VE

(t) -

RI(t) - K

B —d

q(t),

(t > O)

dt

j mL M L

_o

_{o o}

2 2M R

_{o o}

2 M =

+

K 3K T

K T

5K

(4)

r

ü

T

ANALES

I I de la Universidad Metropolitana

N =

mL o G M o L o G

(4)

2K

T

K T

B= B o

( 5 ) K

Tabla 1. Descripción de los parámetros del modelo de la planta

SIMBOLO VALOR NUMERICO _{-> U} DESCRIPCION

l

o j

tze

.J

1.625 10-3 Kg.m2 Inercia del motor 0.506 Kg Masa del brazo

0.434 Kg Masa

0.305 m Longitud del brazo

0.023 m Radio

9.8 m/s2 Constante de aceleración de la gravedad 16.25 10 -3 N.m.s/rad Coeficiente de fricción viscosa

0.90 N.m/A Constante de torque 25 10 -3 Hy Inductancia de armadura

0.90 N.m/A Constante de fuerza contraelectromotriz 1.5 12 Resistencia de armadura

VE Voltaje de control

q Posición angular del eje del motor I Corriente de armadura del motor

La representación en espacio de estado por variables físicas es la siguiente:

-d

dt x

1 (t) = x 2 (t)

x 2 (t)

35.5391

sen x1(0 -

0.2812 x, (t) +15.5764 x 3 (t)

dt

x 3 (t) = - 36 x, (t) — 200 x 3 (0 + 40 u(t)

y(t) = x1 (t)

(5)

d

131

P

ANALES

m

donde: x i = q , = dq/dt , = I y u = V E .

Control por modelo interno

La estructura IMC [8] se ilustra en la figura 3. Los operadores no lineales P, M y C representan la planta, el modelo de la planta y el controlador, respecti-vamente. El operador F representa un filtro cuya función se discutirá posterior-mente. Las dobles lineas de los bloques enfatizan la naturaleza no lineal del sistema.

ym

Figura 3. Estructura IMC.

Las propiedades principales de la estructura IMC son las siguientes:

Pro-piedad 1: Si el modelo (M) es una representación perfecta de la planta

enton-ces el sistema de control IMC es estable en el sentido BIBO si y sólo si la planta (P) y el controlador (C) son estables en el sentido BIBO. Entendiéndose por un sistema estable en el sentido BIBO, aquel que ante entradas acotadas,

uM1 < co, produce salidas acotadas, 1 yl 5, M2 < co. Propiedad 2: Si la inversa del operador que describe el modelo de la planta existe y ésta se emplea como controlador entonces el control es perfecto. Donde el control perfecto se define como sigue (ver figura 4 ): Sea una planta caracterizada por el operador P entonces:

(i) Dada la salida deseada del sistema, yd ¿Cuál debe ser u*? (ii) u* = yd.

P

Figura 4. Control perfecto.

(6)

u yp

p

Red (M)

Neuronal

•

y

ANALES

I de la Universidad Metropolitana

Un controlador que genere la señal de control u*, proporcionará un control perfecto, sin embargo, lo anterior requerirá una ganancia infinita. La situación ideal de modelo perfecto que conlleva a control perfecto no se encuentra en la práctica ya que no existe el modelo perfecto. Además la ganancia infinita re-querida para el control perfecto traería problemas de sensibilidad. El filtro F se incorpora para atenuar estos inconvenientes, pues él permite reducir la ga-nancia del sistema realimentado y de esta forma alejarse de la zona del con-trolador perfecto con la consiguiente introducción de robustez en la estructura IMC. Además otra tarea del filtro es proyectar la señal de error en el espacio de entrada del controlador. Según Morari y Zafiriou [8 ] la función de transfe-rencia del filtro es de la forma:

F(s)=

1

fie R y rieZ±.

Ges+lr ( 7 )

Control por modelo interno empleando redes neuronales

multicapas

La implementación de la estructura IMC a través de redes neuronales multicapas consiste en un procedimiento de dos pasos [6, 7, 13 ]: (1) Entrenar una red neuronal de forma que represente la característica dinámica directa de la planta. Esta red será empleada como el modelo de la planta (M) dentro de la estructura IMC. (Ver figura 5.a). (2) Entrenar una segunda red neuronal de manera que represente la característica dinámica inversa de la planta. La misma se utilizará como el controlador (C) en la arquitectura IMC. (Ver figura 5. b).

yp Red (C)

Neuronal u

Algoritmo de Aprendizaje Algoritmo de

Aprendizaje

(7)

ANALES

71

Finalmente se incorporan las redes entrenadas en los bloques C y M de la figura 5. El objetivo del entrenamiento de las redes neuronales en las dos situaciones descritas en la figura 5 es lograr que

lim e(k) =O

,k E

Z+= {O, 1, 2,

...}

donde:

k —> 00

e(k) = y(k) - y m(k), ( 8 )

para el modelaje directo, y:

e(k) = r(k) - y p(k), ( 9 )

para el modelaje inverso. La condición de límite anterior se cumple resolviendo los problemas:

(1) Modelaje directo.

N

minimizar J =

e"

(k)

2N

k = O

sujeto a y p (k) = P[u(k)]

y m (k) = N[u(k)],

(10)

donde N es un operador que caracteriza a la red neuronal.

(2) Modelaje inverso.

N

minimizar J =

2N

E

(k)

k = O

sujeto a y p (k) = P[u(k)]

(8)

71 ANALES

Los pesos de las redes W(k) son ajustados observando el gradiente pro- medio. Por lo que se obtienen los siguientes esquemas de actualización de pesos:

W(ko + N) = W(ko ) -

a

W(ko ) -

1 N , aym(k)

N

_, e(k) aw (12)

k = O _{ij _}

aw

para el modelaje directo y:

W(ko + N) = W(ko ) -

1

L e(k)

,N a {P[N(r(k))]}

(13)

N

k = O awisi

donde p es el tamaño de paso en el procedimiento de gradiente y las deriva-das parciales:

ay

m

(k)

a

{P[N(r(k))]}

aw.. Y

u

(14)

dependen de la función de activación no lineal empleada y de la arquitectura de la red neuronal. Cuando la red neuronal es del tipo multicapas lo anterior se

reduce al método backpropagatíon.

La selección de la señal de entrenamiento, no fue un procedimiento senci-llo; después de estudiar el comportamiento de la planta y de su inversa, ante varias señales de referencia, se escogió como señal de entrenamiento una

f

sinusoide con un período de 18 segundos ( r = sen t ) , y valores de salida

9

de la planta y de su inversa, donde los pesos de la red cambian significativa-mente. Se emplea una RNA de tres capas como modelo de la planta (dos nodos en la primera y segunda capas escondidas y el nodo de salida); el controlador (modelo inverso) es una RNA de tres capas (tres nodos en la primera capa, dos nodos en la segunda, y el de salida).

(9)

ANALES

de la Universidad Metropolitana r

Control por modelo de referencia

El diagrama esquemático del método [5] se ilustra en la figura 6 y la

des-cripción de sus elementos se hace en la tabla 2.

r

Ti

B

Figura 6. Control por modelo de referencia.

El método asegura regulación y seguimiento y los operadores A, B y G pueden diseñarse a fin de producir las respuestas deseadas B y T1. El opera-dor B es el modelo de referencia empleado para alcanzar la respuesta desea-da.

Tabla 2. Descripción de los elementos para el control por modelo de referencia.

ELEMENTO DESCRIPCION

(.7

a H

>;-•

Controlador Prealimentado Modelo de referencia Controlador Realimentado Planta

Respuesta seleccionada del lazo realimentado Señal de Referencia

Entrada deseada de la Planta Salida deseada de la Planta Entrada Actual de la Planta Salida Actual de la Planta

(10)

r

Ti

ANALES

■ I de la Universidad Metropolitana

La función de transferencia a lazo cerrado es:

B = y = PA,

Y la función de transferencia del lazo realimentado es:

Y

— = PG(I + PG) -1 =TI

PG = T1 (I - T1) - 1

Yr

Por lo que especificando B y T1, las ecuaciones de diseño resultan ser:

PA = B, PG = T1 (I - T1)

- 1

, (17)

Y si P es invertible

A = P -1 B,

G = 1

3-1

T1(I - T1) -1.

(18)

Control por modelo de referencia empleando redes neuronales

multicapas

La implementación de la estrategia de control por modelo de referencia a través de redes neuronales se logra aproximando P-1 por una red neuronal multicapas a la vez que se emplea un observador de estado de orden comple-to combinado con una realimentación lineal de las variables de estado como controlador realimentado G. La función del operador L es normalizar la entra-da de las redes neuronales multicapas, cuando éstas se encuentren fuera del rango de la función de activación no lineal utilizada para el entrenamiento de las redes. Ver figura 7. En el diagrama aparecen las operaciones de muestreo y retención debido a la naturaleza discreta de los modelos de las redes neuro-nales multicapas.

(15)

(11)

B.

I,

Red (esclava) [ Neuronal 4E- 4-1154

_/_>1

Red (Maestra) Neuronal

P

r

Algoritmo de adaptación Z.O.H.

2 a w_n

Ís2 +4wns + wn2\ + a) s3 +202s2 + 402s + 400

B(s) = 400 • (19)

ANALES UU

M

Figura 7. Control por modelo de referencia empleando redes neuronales.

Aplicación del control por modelo de referencia empleando re-des neuronales

El modelo de referencia B se elige de modo que = 0.707 y el tiempo de establecimiento según el criterio del 2 % sea ts= 4 seg. De lo último se obtiene w= 1.41, finalmente a = 200 para permitir que el término de segundo orden sea dominante.

La realización en espacio de estado del estimador de orden completo y la ley de control lineal es:

—d z(t) = (A - LC) z(t) - Lq(t) + Bv(t) dt

v(t) = - Kz(t)

(20)

siendo q(t) la entrada y v(t) la salida. Los autovalores deseados para la ley lineal de control son X1= —100, X 23 = —1 ± j0.75, de donde se obtiene: K = [-2.4331, — 0.6794, — 2.4570]. Ajustando la dinámica del estimador para que sea más rápida que la del sistema con realimentación lineal; se seleccionan los autovalores del estimador como: 1.1., = —200, 112 = — 4.5 + j3.5 y 11. 3 = —4.5 - j3.5, obteniendo L = [8.72 -566.24 6886.121T. Para la identificación del modelo inverso de la planta se utilizan dos redes neuronales de tres capas cada una; la primera capa escondida consta de tres nodos, la segunda capa escondida

(12)

L.J

_T

_ANALES

de dos y un nodo de la capa de salida, con sus correspondientes pesos de umbrales en cada nodo. La primera de estas redes constituye la red maestra, la cual modela la inversa de la planta mediante la adaptación continua de los pesos para todo t E

11+,

la red esclava sigue a la red maestra y forma parte del control prealimentado junto con la respuesta transitoria de la planta.

Resultados

Ambas estructuras fueron sometidas a perturbaciones tipo escalón y a una referencia variable. El resultado de ambas técnicas se ilustra mediante las figuras 8 y 9.

3.5

2.5

3 cr, ca c 2

o

o 1.5

0.5

0 2 4 6 8 10 12 14 16 18 20

Tiempo [seg]

(13)

4.5

3.5 -I- - 4-

17:

E2.5

•0

5 2-

(.0

o

o-

1.5

0.5

L

J

1 ANALES

71

2 4 6 8 10 12 14 16 18 20 Tiempo [seg]

Figura 9. Control por modelo de referencia empleando redes neuronales multicapas.

Las técnicas implementadas mostraron unos resultados bastante satisfac-torios en cuanto a su capacidad de regulación y seguimiento. La estructura IMC no presenta un comportamiento tan errático al inicio de la simulación como es el caso de la estrategia por modelo de referencia, esto se debe a que la segunda estrategia emplea una adaptación continua de los pesos y en esa fase preliminar se está inicializando el algoritmo con unos pesos aleatorios para los nodos de las redes multicapas. Situación que no existe en la primera debido a que se trabaja con las redes entrenadas (congeladas).

Conclusiones

La estructura de control IMC proporciona un excelente seguimiento de cual-quier señal de referencia y un buen rechazo a perturbaciones, con variaciones de importancia en el tiempo de establecimiento del sistema. Asimismo, la es-trategia requiere del entrenamiento previo, de dos RNA, situación que exige un tiempo bastante prolongado, aunado al hecho de que la selección de la señal de entrenamiento no es un procedimiento sencillo, pues descansa en una intensa experimentación. Cabe destacar, que la introducción del filtro (basta uno lineal de segundo orden) en la estructura IMC, incrementa su robustez.

(14)

ANALES

I de la Universidad Metropolitana

En cuanto a la estrategia de control por modelo de referencia, también se obtienen excelentes resultados, con la ventaja de que se sustituye el as-pecto artesanal del entrenamiento de la red. Sin embargo, el esquema es bastante CPU intensivo, pues los pesos de la RNA se ajustan continuamente.

(15)

ANALES

71 Referencias bibliográficas

1. BROGAN W.: Modern control theory, Prentice-Hall, 3rd Edition, New Jersey,

1991.

2. COTTER N.: The Stone-WeierstrassTheorem and its Application to Neural Networks, IEEE Transactions on Neural Networks, Vol. 1, No 4, (Dec 1990), pp.

290-295.

3. NARENDRA K. And Parthasarathy K.: Neural Networks and Dynamical

Systems using Neural Networks. Part II: Identification, Technical Report 8902

for Systems Science, Department of Electrical Engineering, Yale University, (1989).

4. NARENDRA K. And Parthasarathy K. : Identification and Control of

Dynamical Systems using Neural Networks, IEEE Transactions on Neural

Networks, Vol.1, No 1, (March 1990), pp. 4-27.

5. KUSCHEWSKI J., Hui S. And Zak S.: Application of Feedforward Neural

Networks to Dynamical Systems Identification and Control, IEEE

Transactions on Control Systems Technology, Vol. 1, No 1, (March 1993), pp. 37- 49.

6. HUNT K. , Sbarbaro D. , Zbikowsky R. And Gawthrop P.: Neural Networks for

Control Systems — A Survey, Automatica, Vol. 28, No 6, (1992), pp.1083-1112.

7. HUNT K. and Sbarbaro D.: Neural Networks for Nonlinear Interna! Model

Control, IEE Proceedings — D, Vol. 138, No 5, (Sept. 1991), pp. 431 — 438.

8. MORARI M. and Zafiriou E.: Robust Process Control, Prentice-Hall, New

Jersey, (1989).

9. LIPPMANN R.: An Introduction to Computing with Neural Nets, IEEE ASSP

Magazine, (April 1987).

10. HUSH D and Horne B.: Progress in Supervised Neural Networks —What's New Since Lippmann?, IEEE Signal Processing Magazine, (Jan 1993), pp.

8-39.

11. WIDROW B. and Lehr M. : 30 years of Adaptive Neural Networks:

Perceptron, Madaline and Backpropagation, Proceedings of the IEEE, Vol.

78, N° 9, (Sept 1990).

12. DAWSON D., Carrol J. and Schneider, Integrator Backstepping Control of

a Brush DC Motor Turning a Robotic Load, IEEE Transactions on Control

Systems Technology, Vol. 2, No 3, (Sept. 1994).

PSALTIS D. , Sideris A. And Yamamura A.: A Multilayered Neural Network Controller, IEEE Control Systems Magazine, (Apr. 1988), pp 17-21.