• No se han encontrado resultados

Observabilidad en Grupos de Matrices

N/A
N/A
Protected

Academic year: 2020

Share "Observabilidad en Grupos de Matrices"

Copied!
59
0
0

Texto completo

(1)UNIVERSIDAD NACIONAL DE SAN AGUSTIN FACULTAD DE CIENCIAS NATURALES Y FORMALES ESCUELA PROFESIONAL DE MATEMÁTICAS. OBSERVABILIDAD EN GRUPOS DE MATRICES. Tesis presentada por: Bachiller Erika Andrea Zapana Zapana Para optar el Tı́tulo de Licenciada en Matemáticas Asesores: Dra. Marı́a L. Torreblanca Todco Dr. Vı́ctor Ayala Bravo. AREQUIPA - PERÚ 2018.

(2) Agradecimiento. Agradezco a mi asesora de tesis, Dra. Marı́a Luisa Torreblanca Todco, por su tiempo y dedicación, quien con sus conocimientos, paciencia y motivación ha logrado en mı́ que pueda terminar la tesis. Agradezco al Dr. Vı́ctor Ayala Bravo mentor del proyecto de investigación “Sistemas de control sobre grupos de matrices” (IBA 2-2016-Ciencia Activa), por su disposición y apoyo en el asesoramiento del presente trabajo de tesis. Ası́ mismo a todos los profesores de la Escuela Profesional de Matemáticas de la Facultad de Ciencias Naturales y Formales de la Universidad Nacional de San Agustı́n de Arequipa quienes han hecho posible mi capacitación profesional en ésta área de las ciencias.. La Autora.. I.

(3) Resumen. En este trabajo de tesis, caracterizamos la propiedad de observabilidad en dos casos. Primero para sistemas lineales de control sobre espacios Euclideanos Rn introduciendo una función de observación h, este problema se analiza considerando la propiedad de indistinguibilidad y el rango de la matriz de observabilidad. En el caso de grupos de matrices caracterizamos la observabilidad local mediante el Teorema 4.2 y la observabilidad global en el Teorema 4.3. Se usa un algoritmo para encontrar el álgebra de Lie I de la clase de indistinguibilidad I, esto para determinar si el sistema es localmente observable y más aún globalmente observable. Palabras clave: Sistemas de control lineales, espacio Euclideano, grupo de matrices, observabilidad local y observabilidad global..

(4) Abstract. In this thesis work, we characterize the property of observability in two cases. First for linear systems of control over Euclidean spaces Rn introducing an observation function h, this problem is analyzed considering the property of indistinguishability and the range of the observability matrix. In the case of groups of matrices we characterize the local observability by Theorem 4.2 and the global observability in Theorem 4.3. An algorithm is used to find the Lie algebra I of the indistinguishability class I, this to determine if the system is locally observable and even more globally observable. Keywords: Linear control systems, Euclidean spaces, groups of matrices, local observable and global observable.

(5) Índice general. Introducción. II. 1 DINÁMICA SOBRE EL ESPACIO EUCLIDIANO Rn. 1. 1.1 Un problema de tiempo optimal . . . . . . . . . . . . . . . . . . . . . . . .. 1. 1.1.1 El ejemplo del tren. Observabilidad . . . . . . . . . . . . . . . . . .. 7. 1.2 Dinámica sobre el espacio Euclidiano Rn . . . . . . . . . . . . . . . . . .. 9. 1.2.1 Campos de Vectores sobre Rn . . . . . . . . . . . . . . . . . . . .. 10. 2 OBSERVABILIDAD SOBRE ESPACIOS EUCLIDEANOS. 14. 2.1 Sistemas lineales con observación . . . . . . . . . . . . . . . . . . . . . .. 14. 2.2 Teorema de observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . .. 18. 2.3 La observabilidad en la dinámica del tren . . . . . . . . . . . . . . . . . .. 22. 3 DINÁMICA SOBRE GRUPOS DE MATRICES. 24. 3.1 Corchete de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 24. 3.2 Grupos y Álgebras de matrices . . . . . . . . . . . . . . . . . . . . . . . .. 25. 3.3 Dinámica sobre grupo de matrices . . . . . . . . . . . . . . . . . . . . . .. 30. 4 OBSERVABILIDAD SOBRE GRUPOS DE MATRICES. 33. 4.1 Observabilidad en grupos de matrices . . . . . . . . . . . . . . . . . . . .. 33. 4.2 Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 37. 4.3 Observabilidad local y global . . . . . . . . . . . . . . . . . . . . . . . . .. 39. I.

(6) 4.4 Algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 44. 4.4.1 Ejemplo de observabilidad en Rn . . . . . . . . . . . . . . . . . . .. 44. 4.4.2 Ejemplo de observabilidad en el grupo de Heisenberg . . . . . . .. 45. I.

(7) Introducción Esta obra contiene aspectos especı́ficos de la teorı́a geométrica de los sistemas de control sobre Espacios Euclideanos y sobre Grupos de Matrices. Aborda la propiedad de observabilidad de un sistema de control, que consiste en la posibilidad de recuperar toda la dinámica del sistema a través de una información parcial del mismo, como sucede por ejemplo, cuando queremos controlar desde la tierra la altitud de un satélite en órbita, del cual solo se recibe apenas una señal. Otra forma de interpretación de esta noción, corresponde a identificar aquellas variables del sistema que son esenciales respecto de otras. También involucra un aspecto económico, al conseguir describir completamente un sistema dinámico con un número menor de variables que las necesarias para definirlo. El objetivo principal de este trabajo de tesis consiste en caracterizar la propiedad de observabilidad global y observabilidad local para sistemas de control lineal en grupos de matrices, la caracterización algebraica y dinámica de este problema aparece en la referencia Ayala y Hacibekiroglu [4]. Recientemente, Ayala y Román-Flores en [6], examinan la teorı́a de controlabilidad y observabilidad en espacios Euclideanos a través de un problema de optimización, explicando cómo resolver dicho problema utilizando para ello propiedades algebraicas y topológicas, entre otras, el Principio del Máximo de Pontryagin [12]. El teorema de Pontryagin recibió el premio Lenin en Rusia por su inmensa contribución, tanto a la disciplina matemática como a las innumerables aplicaciones en practicamente todos los ámbitos de la ciencia, medicina, ingenierı́a, etc. No enunciamos este principio en su forma general, presentando una versión geométrica suficiente para nuestros propósitos motivacionales.. Un sistema de control lineal Σ con observación es determinado por: Σ = (Rn , D, h, Rs ),. II.

(8) donde D es la familia de campos de vectores provenientes de las ecuaciones diferenciales controladas, determinadas por D = {ẋ(t) = Ax(t) + Bu(t),. u ∈ U}. y la función observación del sistema h : Rn → Rs , s < n, en donde x ∈ Rn , A ∈ Mn (R) es una matriz real de orden n, B ∈ Mn×p (R) es una matriz real de orden n × p y U = L1loc (R, Ω) es la familia de controles admisibles, esto es, funciones medibles del tipo u : [0, Tu ] ∈ R → Ω ⊂ Rp localmente integrables y Ω es un conjunto cerrado y con 0 ∈ int(Ω). La función h : Rn → Rs es una transformación lineal con matriz C en la base canónica, es decir h(x) = Cx ∈ Rs . Los preliminares para esta sección se encuentran en el Capı́tulo 1. El Capı́tulo 2 incluye material de un nivel matemático que corresponde a una tesis de pregrado. Sin embargo la tesis incluye en el Capı́tulo 4 el estudio de la observabilidad y observabilidad local sobre grupos de matrices generalizando completamente el caso Euclideano. Los preliminares para esta sección se encuentran en el Capı́tulo 3. A continuación describimos brevemente los contenidos de los capı́tulos que componen ésta tesis. Iniciamos este trabajo en el Capı́tulo 1 de manera informal, a través de un ejemplo motivacional que permite introducir nociones fundamentales de la teorı́a geométrica de los sistemas de control y en particular la noción de controlabilidad, observabilidad y optimalidad. Incluimos aquı́ tres resultados fundamentales de la teorı́a, pertinentes a ésta tesis y sin demostración. En forma precisa, se refieren a la propiedad de controlabilidad y optimalidad a través del teorema de Kalman [9], Teorema de Colonius y Klieman [9] y el Principio del Máximo de Pontryagin [12]. El ejemplo motivacional corresponde a un problema de optimización de tiempo mı́nimo. Para poder aplicar este Principio se debe estudiar primeramente la propiedad de controlabilidad, que significa la posibilidad de conectar un estado inicial x0 ∈ Rn con un estado final deseado x1 ∈ Rn , a través de un control u ∈ U y en tiempo positivo. Entonces, este principio selecciona el control optimal III.

(9) entre todos los controles que transfieren x0 a x1 . En el Capı́tulo 2, analizamos el problema de la observabilidad para un sistema de control lineal sobre el espacio Euclideano Rn . Para este análisis introducimos la relación de equivalencia “indistinguibilidad” entre dos estados. Describı́mos algebraicamente la clase de indistinguibilidad del origen en Rn como un subespacio del Ker(h). Con esta información caracterizamos la propiedad observabilidad del sistema a través de la matriz de observabilidad. En el Capı́tulo 3, describimos a través de ejemplos, nociones fundamentales de la teorı́a de grupos y álgebras de Lie. Damos enfásis a los conceptos de campos de vectores sobre grupos de matrices. Especialmente, los campos invariantes y los campos lineales. Los cuales permiten definir el concepto de sistemas de control lineal sobre grupos de matrices, como una perfecta generalización del caso Euclideano. En el Capı́tulo 4, introducimos la noción de observabilidad y observabilidad local para la clase de los sistemas de control lineales sobre grupos de matrices. Establecemos y demostramos los resultados desarrollados en el artı́culo [4] ver también [2]. Para finalizar, queremos observar lo siguiente. En el caso Euclidiano el espacio tangente a un subespacio es el propio subespacio. Esta situación cambia drásticamente para grupos de matrices. Por ejemplo, TId SL(n, R) = sl(n, R) lo que significa que el espacio tangente en el elemento identidad del grupo SL(n, R) = {P : P matriz real de orden n y det(P ) = 1} viene dado por el espacio vectorial sl(n, R) = {Q : Q matriz de orden n y T r(Q) = 0}, que en realidad es una álgebra de Lie con el corchete usual [P, Q] = P Q − QP. De modo que esta última sección de la tesis es bastante más compleja que el caso Euclidiano.. IV.

(10) Capı́tulo 1 DINÁMICA SOBRE EL ESPACIO EUCLIDIANO Rn 1.1. Un problema de tiempo optimal. Imaginemos que dirigimos un tren por una lı́nea férrea y necesitamos detenerlo en la próxima estación en tiempo mı́nimo. Este problema nos conduce a las siguientes preguntas: ¿Existe solución?, y en el caso afirmativo ¿cómo probar su existencia?, o mejor aún, ¿cómo calcular la solución optimal?. Este es un problema tı́pico de la teorı́a de control optimal. En esta tesis, estamos interesados en el estudio de la observabilidad del sistema de control, esto es, la capacidad intrı́nseca del sistema de poder reconstruir toda su dinámica (todas sus soluciones), a través de una información parcial. Por ejemplo, en el caso del tren, ¿podemos reconstruir la dinámica a través de conocer solo las distancias al origen en cada tiempo? o ¿conociendo solo las velocidades involucradas?. Para el planteamiento del problema, considere el caso ideal de una lı́nea férrea recta sin roce y denotemos por x(t) la distancia del tren a la estación en el instante t, consideramos la estación en el origen de R2 . De acuerdo a la Ley de Newton, la fuerza del sistema viene dada por F = ma(t), donde m es la masa y a la aceleración. Sin pérdida de generalidad en este estudio cualitativo, podemos considerar la masa como m = 1. Se obtiene entonces un sistema de ecuaciones controladas por los distintos tipos de combinaciones a(t) entre aceleración y freno. Siguiendo la notación usual de la teorı́a de control reemplazamos a(t) por la variable de control u(t) y obtenemos ·. ·. x(t) = y(t), y(t) = u(t), u ∈ U 1. (1.1).

(11) en donde x(t) es la distancia, la derivada de la distancia es la velocidad denotada por y(t) y la derivada de la velocidad es la aceleración denotada por u(t), además U es una familia de funciones que llamamos admisibles, dependiendo de las distintas posibles estrategias consideradas para las funciones de control u : [0, Tu ] → Ω = [−1,1] ⊂ R en donde u es la aceleración del tren y 1 representa su aceleración máxima. Ahora bien, ¿qué clase de funciones U podrı́amos considerar admisibles? Por ejemplo, el espacio de las funciones medibles localmente integrables, el espacio de funciones continuas o incluso funciones constantes por pedazos con valores en Ω. Estas tres clases de funciones garantizan la existencia y unicidad de la solución asociada a cada estado inicial (x0 , y0 ) y para cada estrategia u ∈ U. En primer lugar, observamos que es posible describir Σ de una manera matricial en el plano. De hecho, el sistema de control lineal restricto, esto es, aquel conjunto en el cual los valores de los controles están acotados sobre R quedarı́a representado de la siguiente manera:  Σ:. ẋ(t) ẏ(t). .  =. 0 1 0 0. . x(t) y(t). .  +. 0 1.  u(t),. u ∈ U, |u(t)| ≤ 1. (1.2). que representa las mismas ecuaciones dadas en (1.1) pero escritas de manera más estructurada. Una generalización viene dada por Definición 1.1 Un sistema de control lineal es determinado por la data Σ = (Rn , D) donde D es definido por la familia de campos de vectores provenientes de las ecuaciones diferenciales D = {ẋ(t) = Ax(t) + Bu(t), u ∈ U} donde u : [0, Tu ] → Ω ⊂ Rp : Ω es cerrado y 0 ∈ int(Ω), U = L1loc (R, Ω) • Σ se dice irrestricto si Ω = Rp . • Σ se dice restricto si Ω ( Rp es compacto. Geométricamente, el problema de accesibilidad se traduce entonces en transferir el tren desde el estado inicial (x0 , y0 ) al origen (0, 0) del plano. Si por ejemplo y0 > 0, se entiende que al pasar por x0 el tren se mueve con velocidad y0 y en dirección a la estación. Si y0 < 0, el tren se mueve en la dirección contraria a la estación, situación que es perfectamente posible si, por ejemplo, han llamado al conductor para volver a la estación. 2.

(12) Ası́, es necesario saber si el sistema de control lineal restricto (1.2) ¿es controlable o no?, esto es, ¿si dos estados cualesquiera pueden ser conectados a través de una solución del sistema en tiempo no negativo?. Para dar respuesta a estas preguntas, utilizamos dos teoremas que enunciaremos sin demostración dado que el problema de controlabilidad caso restricto o irrestricto no se enmarcan en los objetivos de este trabajo de tesis, pero se necesitan, cuya demostración se puede ver en el libro (Colonius y Kliemann, 2000) [9]. Teorema 1.1 (Kalman) Sea Σ un sistema lineal irrestricto sobre Rn . Entonces, Σ es controlable ⇔ rank(B AB ... An−1 B) = n Esencialmente C es un conjunto de control para Σ si el sistema es controlable en el int(C). Dada una matriz A de orden n, el espectro Spec(A) = {λ \ λ es autovalor de A} Denotemos SpecLy (A) el espectro de Lyapunov de A definido por: SpecLy (A) = {Re(λ) : λ ∈ Spec(A)} Teorema 1.2 (Colonius - Kliemann) Sea Σ un sistema de control lineal restricto sobre Rn . Suponga que la condición de Kalman está satisfecha. En estas condiciones existe un único conjunto de control C con interior no vacı́o conteniendo el origen 0. Explı́citamente, el conjunto de control viene dado por C = cl(S(0)) ∩ S− (0), donde S− (0) es el conjunto de estados que pueden ser transferidos al origen en tiempo no negativo. Además, el sistema es controlable si y solo si SpecLy (A) ∩ R = {0} En el ejemplo del tren Ω = [−1, 1] es compacto. Entonces, para determinar si el sistema (1.2) es controlable, utilizamos el Teorema de Colonius-Kliemann [9] obtenemos, rank(B AB) = 2 y SpecLy (A) = {0} , es decir, se cumple la condición del rango de Kalman y el espectro de la matriz A solo posee autovalores con parte real cero respectivamente. Ası́, el sistema restricto (1.2) es controlable. En particular, cualquier condición inicial puede ser trasladada al origen y el problema de optimalidad tiene perfecto sentido.. 3.

(13) Podemos fácilmente imaginar que existen muchas formas distintas de transferir la condición inicial al origen. Sin embargo, desde el punto de vista de optimización, se necesita encontrar un control optimal u∗ que transporte (x0 , y0 ) al origen en tiempo mı́nimo. Es importante destacar que las transferencias entre estados no se realiza a través de curvas arbitrarias, sino, solo a través de aquellas que satisfacen las ecuaciones diferenciales asociadas al sistema de control Σ. Teorema 1.3 (Principio del Máximo de Pontryagin) Sea Σ un sistema de control lineal restricto sobre el espacio Euclideano Rn . Para cada x ∈ Rn y T > 0, el conjunto de accesibilidad desde el estado inicial x hasta el tiempo T definido por  R S(x, T ) = φ(x, u, t) = etA (x + 0t e−τ A Bu(τ )dτ ) : 0 ≤ t ≤ T, u ∈ U es compacto, convexo y se deforma continuamente con la métrica de Hausdorff. Observe que φ(x, u, t) es solución de la ecuación diferencial ẋ = Ax + Bu. Esto es φ̇(x, u, t) = Aφ(x, u, t) + Bu. Observación 1.1 De acuerdo al Principio del Máximo de Pontryagin [12], las únicas estrategias optimales posibles para nuestro problema se encuentran en la frontera del conjunto de los estados accesibles. Esta información crucial, trasladada a los controles se reduce a dos posibilidades a considerar u = 1 ∨ u = −1. Obviamente, el traslado de esta información desde la frontera de los conjuntos de accesibilidad a la frontera del conjunto de llegada de los controles Ω, no es inmediato. Se deduce de las ecuaciones diferenciales parciales asociadas al sistema Hamiltoniano del Principio del Máximo de Pontryagin, que escapan a las posibilidades de desarrollar en este estudio inicial. El mismo Principio establece que el control optimal u∗ es una combinación adecuada de estos dos controles, entrega la curva optimal. Para el caso n = 2, se necesita a lo más un cambio de control: de u = 1 a u = −1 o recı́procamente. Observe que este principio reduce a priori y de manera notable, la búsqueda de una solución óptima desde un universo infinito de posibilidades contenidas en U = L1loc (R, Ω), a una combinación reducida de controles constantes por pedazos. Con esta información, ¿cómo obtener la solución óptima? en primer lugar, debemos calcular las soluciones de la dinámicas asociadas a los controles optimales. 4.

(14) Para u = 1, obtenemos el sistema de ecuaciones diferenciales        ẋ(t) 0 1 x(t) 0 = + ẏ(t) 0 0 y(t) 1 i) Calculemos la solución del sistema homogéneo: .  0 1 Primero hallamos los autovalores de la matriz A = 0 0 Como A es una matriz triangular superior sus autovalores están en la diagonal, en este caso λ = 0 y de multiplicidad algebraica 2. Ahora hallamos     losautovectores  0 1 x 0 = 0 0 y 0 y = 0, ∀x     x x 1 = =x y  0 0 1 v1 = 0 Generalizando el autovector v1 para obtener v̂1 , se procede de la siguiente manera:      0 1 x̂ 1 = 0 0 ŷ 0 ŷ = 1, ∀x̂     x̂ x̂ 1 = = x̂ ŷ   1 1 1 v̂1 = 1. X h = c1 X 1 + c2 X 2        1 1 1 −0t −0t −0t X h = c1 e + c2 te + e 0 0 1     1 t+1 X h = c1 + c2 0 1 . ii) Calculemos la solución del sistema particular: Para obtener la solución particular Z. t. Xp = Φ(t). Φ−1 (t).F (t)dt. 0.  creamos la matriz fundamental Φ(t) =. 1 t+1 0 1. . con Φ−1 (t) =. entonces tenemos  Xp =. Z t   1 t+1 1 −(t + 1) 0 dt 0 1 0 1 1 0     −t2 1 t+1 − t 2 Xp = 0 1 t 5. . 1 −(t + 1) 0 1. .

(15)  Xp =. t2 2. . t. Ası́, la solución del sistema de ecuaciones es:      t2  1 t+1 2 X g = c1 + c2 + 0 1 t cuyas soluciones son parábolas centradas en el eje x abriéndose hacia la derecha. En forma precisa, convexas respecto del eje y.. Figura 1.1: Solución para u = 1. Por otra parte, para el control u = −1 obtenemos el sistema de ecuaciones diferenciales. . ẋ(t) ẏ(t). .  =. 0 1 0 0. . x(t) y(t). .  −. 0 1. . cuyas soluciones son parábolas centradas en el eje x, abriéndose hacia la izquierda, esto es, cóncavas respecto del eje y.. Figura 1.2: Solución para u = -1. Entre estas dos familias de curvas, existen dos que son esenciales, aquellas que nos trasladan al origen. Denotemos por u− la intersección de la curva que nos traslada al origen con control u = −1, con el semiplano y > 0, y por u+ la intersección de la curva que nos traslada al origen con control u = 1, con el semiplano y < 0. Entonces, la concatenación a través del origen de las semi curvas u− con u+ que denotamos por α, 6.

(16) es una curva continua que divide al plano en dos componentes conexas: (R2 )− y (R2 )+ a la izquierda y derecha de α respectivamente.. Figura 1.3: Curva de cambio.. Considere por ejemplo, un estado inicial (x0 , y0 ) ∈ (R2 )− con y0 > 0. Entonces, usted se dirige hacia la estación con una velocidad positiva y0 desde una distancia x0 . Según el principio, deberá acelerar al máximo siguiendo la trayectoria optimal determinada por el control u = 1. Geométricamente, Ud. viajará por la única parábola que pasa por (x0 , y0 ) y que se dirige al encuentro de la semi parábola u− . En el punto de intersección de ambas parábolas Ud. debe cambiar de estrategia y se trasladará al origen en tiempo mı́nimo vı́a u− . En otras palabras, siguiendo la estrategia optimal, Ud. acelerará al máximo durante un perı́odo de tiempo para después frenar al máximo durante otro perı́odo de tiempo. ¿Cómo saber en que momento cambiar de estrategia?. Esto es equivalente a preguntar, ¿cómo calcular el punto de intersección en donde debo cambiar de control? El principio entrega esta información de manera automática. En realidad las curvas u− y u+ son conocidas, y dada cualquier condición inicial las trayectorias de los sistemas con u = 1 y u = −1 también. Matemáticamente se obtiene la intersección de estas trayectorias, lo que traducido en el ordenador incorporado al tren, entregarı́a de inmediato el momento donde el maquinista debe acelerar o aplicar el freno. La estrategia optimal para (x0 , y0 ) ∈ (R2 )+ con y0 > 0 es análoga, recordando que el tren posee marcha reversa.. 1.1.1. El ejemplo del tren. Observabilidad. Informalmente el concepto de observabilidad de un sistema de control lineal, significa la posibilidad de reconstruir a partir de una cierta información parcial lo que está sucediendo en el sistema completamente, o sea, a través de una función de observación reconstruir toda la curva completa del sistema lo cual es bastante complejo, pero exis7.

(17) ten unas condiciones matemáticas que se verán más adelante, de momento haremos el análisis sin utilizar ese resultado, entonces vamos a considerar el sistema del tren con dos curvas que son las curvas que minimizan el tiempo, que son para el control u = 1 y u = −1 que en cada caso son familias de parábolas. Vamos a utilizar en el primer caso la proyección π1 , (x, y) es un punto del plano, donde x es la distancia e y la velocidad, se toma un punto (x0 , y0 ) entonces la distinguibilidad significa que si se toma otro punto (x1 , y1 ), para que esos dos puntos sean distinguibles, cualquiera que sea la trayectoria que se utilice simúltaneamente a través de ambos puntos iniciales y se proyectan sobre el eje x tendrı́amos que ser capaz de distinguirlos, si no se les puede distinguir con ninguna trayectoria quiere decir que esos dos puntos son indistinguibles, esto es, que están en la misma clase de indistinguibilidad y eso significa en concreto que cuando se mire la curva proyectada desde (x0 , y0 ) o desde (x1 , y1 ) se ve la misma curva, entonces nunca seremos capaces de recontruir el sistema en el plano porque no se sabe si parte de (x0 , y0 ) o parte de (x1 , y1 ) porque la información que nos entrega es insuficiente. Analicemos el caso π1 , consideremos el sistema lineal del tren  ΣO1 = R2 , D, π1 , R         ẋ(t) 0 1 x(t) 0 donde D = = + u(t), u ∈ U, |u(t)| ≤ 1 ẏ(t) 0 0 y(t) 1 y π1 : R2 → R es la proyección en la primera variable, π1 (x, y) = x.. (1.3). Se toman dos puntos (x0 , y0 ), (x1 , y1 ) y se proyectan sobre el eje x de inmediato se ve que con solo la proyección estos dos puntos se distinguen, el problema estarı́a si se toman dos puntos cualesquiera en la recta del eje y y se proyectan sobre el eje x, estos dos puntos se proyectan simultáneamente en el origen, entonces el eje y es bastante representativo de lo que pasa en cualquier recta paralela al eje y, esto quiere decir que estos dos puntos no se consiguen distinguir a través de la proyección. Lo que se necesita ahora es saber si hay un control que los pueda distinguir, entonces se toma el control u = −1 los puntos p = (x0 , y0 ) y (0, 0) (ver Figura (1.4)), para el punto p la curva que se proyecta es la de color morado y si se hace la proyección tomando el mismo control para el punto (0, 0) nos da la curva de color verde luego se observa que estas dos curvas son distintas entonces se dice que estos dos puntos se distinguen, esto significa que el sistema es observable. Sin embargo, si se hace la proyección con π2 (x, y) = y como en la Figura 1.5 y se toman dos puntos cualesquiera del eje x vemos que si se proyectan estos dos puntos tomando tanto el control u = 1 como u = −1 las curvas proyectadas son las mismas por tanto estos dos puntos no se distinguen eso quiere que el sistema no es observable. 8.

(18) En concreto, esto significa que para determinar la observabilidad del sistema solo es necesario conocer su proyección sobre el eje x. En otras palabras, conociendo las distancias podemos conocer las velocidades. Más adelante estudiaremos condiciones algebraicas para determinar la observabilidad de los sistemas lineales de control sobre espacios Euclideanos.. Figura 1.4: Sistema observable.. Figura 1.5: Sistema no observable.. 1.2. Dinámica sobre el espacio Euclidiano Rn. En esta sección, introducimos algunas nociones básicas respecto de cierto tipo de dinámica sobre espacios Euclideanos. Ası́, establecemos algunos aspectos fundamentales de los espacios de estado y de las ecuaciones diferenciales que intervienen en los diferentes tipos de sistemas de control en Rn ha ser considerados. En la medida de lo posible, se introducen los conceptos desde un punto de vista geométrico.. 9.

(19) 1.2.1. Campos de Vectores sobre Rn. Primeramente, observamos que el espacio Euclidiano real n-dimensional Rn posee un sistema de coordenadas canónico, donde cada elemento x ∈ Rn se escribe como   x = (x1 , x2 , ..., xn ). Denotemos por ei = ∂x∂ i el i-ésimo elemento de la base canónica 0. de Rn , i = 1, 2, ..., n. El espacio tangente a Rn en x denotado por Tx Rn se define como el espacio de todos los vectores que se inician en x. Esto es:    ∂ n Tx R = Span | i = 1, 2, ..., n ∂xi x En efecto, Tx Rn es un espacio vectorial de dimensión n que se obtiene trasladando el propio Rn ≈ T0 Rn desde el origen al estado x o sea para cada i = 1, 2, ..., n el vector     ∂ ∂ denota el vector trasladado al punto x. Esta notación puede ser justificada ∂xi ∂xi x. 0. de la siguiente manera: sea V una vecindad de x, a cada vector v ∈ Tx Rn le asociamos una clase de equivalencia de curvas [γ], con γ : (−; ) → V continua en su dominio y diferenciable en t = 0. Esta clase es caracterizada por las siguientes dos condiciones γ(0) = x y la derivada de γ en t = 0 coincide con el vector v, esto es γ̇(0) = v. A continuación, introduciremos el concepto de fibrado tangente el cual está naturalmente asociado a problemas de la mecánica clásica: posición y velocidad. Para el caso particular de Rn el fibrado lo denotaremos por T Rn el cual se define como la unión disjunta de los espacios vectoriales tangentes a los elementos de Rn , esto es, T Rn = ∪x∈Rn Tx Rn . Este concepto, permite también obtener una visión geométrica de las ecuaciones diferenciales. En efecto, por definición, un campo de vectores X sobre Rn es una aplicación X : Rn −→ T Rn determinada por la elección de un vector tangente iniciándose en x, X(x) ∈ Tx Rn para cada x ∈ Rn . Observamos de inmediato, que existe un isomorfismo entre el espacio vectorial de los campos de vectores X(Rn ) sobre Rn y el espacio F(Rn ) de las aplicaciones de Rn en sı́ mismo. En efecto, cada f : Rn −→ Rn induce un campo X f ∈ X(Rn ) definido para cada x ∈ Rn por. f. X (x) =. n X.  fi (x). i=1. ∂ ∂xi. . ∈ Tx Rn ,. x. en donde f = (f1 , f2 , ..., fn ). Geométricamente, la correspondencia f → X f se establece trasladando el vector f (x) al punto x, para cada x ∈ Rn . Recı́procamente, sea X   un campo de vectores sobre Rn y x ∈ Rn . Los vectores ∂x∂ i , i = 1, 2, ..., n generan x. 10.

(20) Tx Rn , en particular, existen n funciones reales fi : Rn → R tales que X(x) =. n X.  fi (x). i=1. ∂ ∂xi.  . x. Ası́, cada campo X en Rn induce f X = (f1 , f2 , ..., fn ) ∈ F(Rn ). Ejemplo 1.1 La aplicación constante e1 : Rn → Rn definida por e1 (x) = e1 , determina el   campo de vectores X e1 definido por X e1 (x) = ∂x∂ 1 . Más generalmente, sea b ∈ Rn x. y denote por b : Rn → Rn la aplicación constante igual a b. Entonces, el campo X b asocia a cada x ∈ Rn el propio vector b trasladado al espacio tangente Tx Rn . Esto es,   P X b (x) = ni=1 bi ∂x∂ i . x. 2 Ejemplo 1.2 tal que su matriz en la base canóni Considere  la aplicación lineal sobre R     0 1 ∂ A ca es A = . Entonces, X (x1 , x2 ) = x2 ∂x1 − x1 ∂x∂ 2 . Este campo no es −1 0 x x invariante por traslación en R2 . En efecto, el vector X A (x1 , x2 ) depende linealmente del. par (x1 , x2 ). Observe que h(x1 , x2 ), (x2 , −x1 )i = 0. Esto es, X A actúa en forma ortogonal respecto de los elementos de su dominio. .  0 0 0 Ejemplo 1.3 Considere la matriz A =  u 0 b  , con (u, v) ∈ R2 y b ∈ R. Esta v −b 0 matriz está asociada a un tı́pico elemento del grupo de movimientos del plano: rotación-traslación. El campo correspondiente, evaluado en x = (x1 , x2 , x3 ) viene dado por     ∂ A X (x) = (ux1 + bx3 ) ∂x2 + (vx1 − bx2 ) ∂x∂ 3 . Si u = v = 0, nos encontramos esenx. x. cialmente en el ejemplo anterior. Ahora bien, cada campo de vectores X ∈ X ∞ (Rn ), X(x) =. Pn. i=1 fi (x). . ∂ ∂xi. . , induce x. la ecuación diferencial: ẋ(t) = X(x(t)) =. n X.  fi (x). i=1. ∂ ∂xi. . ∈ Tx Rn , x(t). sobre Rn . Obteniéndose, un sistema ordinario de ecuaciones diferenciales de primer orden: ẋ(t) = fi (x(t)) ∈ R, i = 1, 2, ..., n. El Teorema de existencia y unicidad de ecuaciones diferenciales garantiza que dada una condición inicial x0 ∈ Rn existe una única solución γ(x0 , ·) : I(x0 ) → Rn γ(x0 , t) = (γ1 (x0 , t), γ2 (x0 , t), ..., γn (x0 , t)), tal que 11.

(21) γ̇(x0 , t) = fi (γ(x0 , t)), i = 1, 2, ..., n,. t ∈ I(x0 ),. con γ(x0 , 0) = x0. En este contexto, I(x0 ) es un intervalo de la recta real conteniendo el origen y es topológicamente conexo- maximal respecto de la propiedad anterior. Además, la dependencia diferenciable de las condiciones iniciales, garantiza que el flujo Xt del campo X, a saber Xt : Dom(Xt ) ⊂ Rn → Rn , definido para cada condición inicial x0 y t ∈ I(x0 ) por Xt (x0 ) = γ(x0 , t), sea un difeomorfismo local. En particular, para obtener la curva integral de la ecuación diferencial a través de x0 , esto es, la única curva solución que pasa por la condición inicial x0 en t = 0 basta aplicar el flujo Xt en x0 , obteniéndose la curva diferenciable {Xt (x0 ) : t ∈ R} de Rn . Por otra parte, las clases de sistemas de control que serán analizadas en este trabajo consideran campos de vectores completos y globalmente definidos en sus espacios de estados. Es decir, para cada condición inicial x0 , I(x0 ) = R y Dom(Xt ) = Rn para cada t ∈ R. Notemos las siguientes propiedades evidentes del flujo: X0 = Id, Xt ◦Xs = Xt+s y (Xt )−1 = X−t . La ecuación diferencial inducida por el campo X sobre Rn , posee la siguiente interpretación geométrica: la derivada de cada curva integral Xt (x) en cualquier instante t coincide con el valor del campo X en el punto Xt (x). En otras palabras, Ẋt (x) = X(Xt (x)). Entonces, si entendemos un campo de vectores como una familia de flechas parametrizada por los elementos de Rn , se concluye que integrar la ecuación diferencial asociada al campo X nada más es, encontrar una descomposición (partición) de Rn en curvas diferenciables, tal que la derivada de cada una de esas curvas, corresponde en cada punto, a la flecha predeterminada por el campo en ese punto. A continuación, establecemos las ecuaciones diferenciales y calculamos los flujos asociados a los campos de vectores de los ejemplos anteriores. Ejemplo 1.4 El campo de vectores X e1 (x) = ( ∂x∂ 1 )x en Rn , induce la ecuación diferencial ẋ1 (t) = 1, ẋ2 (t) = ... = ẋn (t) = 0. Para cada x0 = (x01 , x02 , ..., x0n ), se tiene Xte1 (x0 ) = (x01 + t, x02 , ..., x0n ) = x0 + te1 . Análogamente, el flujo del campo X v es Xtv (x0 ) = x0 + tv. La descomposición de Rn en las curvas integrales del sistema, corresponde a la partición de Rn en las rectas paralelas al subespacio generado por v. Ejemplo 1.5 El campo X A (x1 , x2 ) = x2 ( ∂x∂ 1 )x − x1 ( ∂x∂ 2 )x induce sobre R2 el sistema ẋ1 (t) = x2 (t), ẋ2 (t) = −x1 (t) con flujo XtA (x01 , x02 ) = (x01 cost + x02 sent, −x01 sent + x02 cost). En este caso, R2 se descompone en la familia de cı́rculos con centro en el origen y de radios no negativos arbitrarios. 12.

(22) Ejemplo 1.6 El campo X A (x) = (ux1 + bx3 )( ∂x∂ 2 )x + (vx1 − bx2 )( ∂x∂ 3 )x sobre R3 , induce el sistema ẋ1 (t) = 0, ẋ2 (t) = ux1 (t) + bx3 (t), ẋ3 (t) = vx1 (t) − bx2 (t), con flujo XtA (x1 , x2 , x3 ) = (α, β, γ) donde (α, β, γ) estan dados por: α = x1 β= γ=. usen(tb)+v−vcos(tb)x1 b vsen(tb)−u+ucos(tb)x1 b. + cos(tb)x2 + sen(tb)x3 − sen(tb)x2 + cos(tb)x3 .. 13.

(23) Capı́tulo 2 OBSERVABILIDAD SOBRE ESPACIOS EUCLIDEANOS 2.1. Sistemas lineales con observación. La observabilidad es la capacidad de reconstruir la dinámica completa de un sistema de control, con una información parcial del mismo. En el ejemplo del tren nos podemos hacer dos preguntas 1. ¿Es posible reconstruir un estado inicial y la trayectoria observando sólo la información de las distancias recorridas? 2. ¿Es posible reconstruir un estado inicial y la trayectoria a partir de este punto observando sólo la información de las velocidades involucradas en el movimiento?. Si consideramos a π como la función observación, el sistema de control inducido por el tren considerando solo estrategias optimales serı́a: Σ = (R2 , D, π, R) D = {ẋ(t) = Ax(t) + Bu(t), u ∈ U} para controles u = 1 y u = −1 donde π : R2 → R. Para responder estas preguntas debemos considerar en cada caso la función de observación π como la proyección sobre el eje correspondiente. Veremos que la respuesta a la pregunta 1 es afirmativa y la respuesta a la pregunta 2 es negativa. El desarrollo de la presente sección esta basada en el artı́culo de Ayala, V. y Román Flores, H.(2017)[6], de aquı́ en adelante un sistema con observación será denotado por ΣO . 14.

(24) Definición 2.1 Un sistema de control lineal con observación ΣO está determinado por la siguiente información ΣO = (Rn , D, h, Rs ). (2.1). Donde D es la familia de campos de vectores provenientes de las ecuaciones diferenciales controladas D = {ẋ(t) = Ax(t) + Bu(t),. u ∈ U}. (2.2). en donde, Rn es el espacio de estados, x ∈ Rn , A ∈ Mn (R) es una matriz real de orden n, B ∈ Mn×p (R) es una matriz real de orden n × p y U = L1loc (R, Ω) es la familia de controles admisibles, esto es, funciones medibles del tipo u : [0, Tu ] ∈ R → Ω ⊂ Rp localmente integrables y Ω es un conjunto cerrado y con 0 ∈ int(Ω). Además h : Rn → Rs es una transformación lineal cuya matriz asociada en la base canónica la denotamos por C. Dada una condición inicial x0 ∈ R y un control u ∈ U, la solución del sistema para esta ecuación diferencial particular esta dada por: Z t u tA φt (x0 ) = e (x0 + e−τ A Bu(τ )dτ ). (2.3). 0. la cual satisface el problema de Cauchy con valores iniciales ; ẋ = Ax + Bu,. x(0) = x0 ,. A continuación daremos el concepto de indistinguibilidad, que permite descomponer el espacio de estados en clases de equivalencia, las que contienen toda la información de aquellos elementos que no pueden ser distinguidos entre si por la función de observación h a través de la dinámica del sistema. Definición 2.2 Dos estados x0 , x1 ∈ Rn se dicen indistinguibles por ΣO , denotado por x0 Ix1 , si x1 − x0 ∈ Ker(CetA ), ∀t ≥ 0. Por definición del Ker(CetA ) observe que , si x0 Ix1 entonces CetA (x1 − x0 ) = 0, ∀t ≥ 0. Observación 2.1 El hecho de que la función observación h no distingue los estados x0 , x1 a través del sistema se traduce en que para cada control u ∈ U y para cada t > 0     Z t Z t tA −τ A tA −τ A C e (x0 + e Bu(τ )dτ ) = C e (x1 + e Bu(τ )dτ ) 0. 0. 15.

(25) luego,. Cet x0 = Cet x1. de donde se desprende la definición de indistinguibilidad. De la definición anterior obtenemos la siguiente proposición: Proposición 2.1 Sea ΣO un sistema lineal con observación. Entonces, 1. I es una relación de equivalencia. 2. Si I(x) denota la clase de equivalencia de x por la relación I, entonces a) I(0) =. T. t≥0. Ker(CetA ). b) I(x) = {x} + I(0). Demostración 1. Demostraremos que I es una relación de equivalencia. En efecto, para cada t ≥ 0, Ker(CetA ) es un espacio vectorial. Entonces, la relación I es: a) Reflexiva xIx ⇔ x − x ∈ Ker(CetA ), ∀t ≥ 0 ⇔ 0 ∈ Ker(CetA ), ∀t ≥ 0 ∴ I es reflexiva. b) Simétrica x0 Ix1 ⇔ x1 Ix0 , suponga que CetA (x1 − x0 ) = 0, ∀t ≥ 0, como el Ker(CetA ) es un subespacio vectorial entonces C(etA )(x0 − x1 ) = 0, ∀t ≥ 0 ∴ I es simétrica. c) Transitiva Queremos demostrar x0 Ix1 ∧ x1 Ix2 ⇒ x0 Ix2 x0 Ix1 ⇔ CetA (x1 − x0 ) = 0, ∀t ≥ 0 x1 Ix2 ⇔ C(etA )(x2 − x1 ) = 0, ∀t ≥ 0 C(etA )(x1 − x0 ) + C(etA )(x2 − x1 ) = 0 C(etA )[(x1 − x0 ) + (x2 − x1 )] = 0 C(etA )[(x2 − x0 )] = 0, ∀t ≥ 0 Ası́ x0 Ix2 ∴ I es transitiva. 16.

(26) Ası́ I es una relación de equivalencia. 2.. a) Considere x ∈ I(0) por la definición (2.2) tenemos γ(t) = CetA x = 0 para cada t ≥ 0 Calculando la primera derivada de γ(t) obtenemos γ̇(t) = CAetA x = 0 y en t = 0 tenemos γ̇(0) = CAx = 0, de aquı́ x ∈ Ker(CA) Derivando por segunda vez tenemos γ̈(t) = CA2 etA x = 0 y en t = 0 γ̈(0) = CA2 x = 0, esto es x ∈ Ker(CA2 ) y ası́ derivando sucesivamente la curva γ(t) = C(etA x), t ≥ 0 y por el Teorema de Cayley-Hamilton se obtiene x∈. n−1 \. Ker(CAj ). j=0. y como consecuencia I(0) =. n−1 \. Ker(CAj ). j=0. b) Seguidamente probaremos que I(x) = x + I(0), en efecto: Sea x ∈ Rn e y ∈ I(x),. (y − x) ∈ Ker(CetA ), ∀t ≥ 0. Ası́ CetA (y − x) = 0 y−x∈. n−1 \. ∀t ≥ 0. Ker(CAj ). j=0. luego y − x ∈ I(0) de donde se obtiene y = x + I(0) Definición 2.3 Dado un sistema de control lineal con observación ΣO : 1. ΣO es observable si es observable desde x0 , esto es I(x0 ) = {x0 }, ∀x0 ∈ Rn 2. ΣO es localmente observable desde x0 si existe una vecindad V = V (x0 ) de x0 V = V (x0 ) tal que I(x0 ) ∩ V = {x0 } Observación 2.2 La definición anterior es válida para una base amplia de sistemas de control. En el caso de sistemas lineales en espacios Euclidianos la Proposición 2.1 muestra que, el estudio de observabilidad puede ser reducido a la clase de indistinguibilidad del origen. 17.

(27) En efecto, el siguiente teorema garantiza el resultado expuesto anteriormente. Teorema 2.1 Un sistema lineal con observación ΣO es observable si y solo si I(0) = {0}. Demostración ⇒) Por la Definición (2.3) si ΣO es observable en x ∈ Rn entonces I(x) = {x}, ası́ para x = 0 entonces I(0) = {0}. ⇐) Por la Proposición (2.1) tenemos I(x) = {x} + I(0) por hipótesis I(0) = {0} luego I(x) = {x}, lo que significa que ΣO es observable para cada x ∈ Rn .. 2.2. Teorema de observabilidad. A continuación daremos otra interpretación de la clase de indistinguibilidad en el origen. En primer lugar, consideremos para cada T > 0, la matriz de observabilidad de Gramian Z G0 (T ) =. T. ∗. eτ A C ∗ Ceτ A dτ. 0 ∗. La notación C indica la traspuesta de la matriz C, ası́ G0 (T ) es una matriz simétrica. Teorema 2.2 Sea ΣO un sistema lineal con observación como en (2.1), para cada T > 0 I(0) = Ker(G0 (T )) Demostración La prueba es independiente de T a) Ker(G0 ) ⊂ I(0) Sea x ∈ Ker(G0 ) entonces G0 x = 0, multiplicando por la izquierda x∗ a ambos lados de la ecuación tenemos x∗ G0 x = 0, ası́ Z T ∗ ∗ x( eτ A C ∗ Ceτ A dτ )x = 0 0 T. Z. ∗. x∗ eτ A C ∗ Ceτ A xdτ = 0. 0. Z. T. ∗. (Ceτ A x) (Ceτ A x)dτ = 0. 0. 18.

(28) T. Z. h(Ceτ A x), (Ceτ A x)idτ = 0. 0. Z. T. kCeτ A xk2 dτ = 0. 0. y por el argumento de continuidad de la aplicación Ceτ A x, el integrando debe anularse en todo el intervalo, esto es γ(τ ) = Ceτ A x = 0,. 0≤τ ≤T. γ es una función analı́tica cuya imagen está en Rs y se anula en el abierto (0, T ), γ debe ser nula, esto es, γ(R) = 0. En particular, CetA x = 0, para cada t ∈ R entonces x ∈ Ker(CetA ) por lo tanto x ∈ I(0). b) I(0) ⊂ Ker(G0 ) Sabemos que x ∈ I(0) ⇔ x ∈ Ker(CetA ), ∀t > 0; luego CetA x = 0, ∀t ≥ 0. De aqui Z. T. ∗. eτ A C ∗ Ceτ A xdτ. G0 x = 0. Z G0 x =. T. ∗. eτ A C ∗ 0dτ. 0. G0 x = 0 por lo tanto x ∈ KerG0. . El uso de la matriz de Gramian para el estudio de observabilidad, requiere el cómputo de una integral. Una manera de evitar este cálculo es dada por la siguiente caracterización. Teorema 2.3 Sea ΣO un sistema de control lineal con observación como en (2.1). Denote por O ∈ Msn×n (R) la matriz O=. C CA CA2 · · · CAn−1. ∗. Entonces, I(0) = Ker(O) Demostración =⇒) Sea x ∈ I(0), esto es, x es indistinguible del origen. Entonces, γ(t) = CetA x = 0, ∀t > 0, donde la curva en t = 0 es γ(0) = Cx = 0. Calculando la primera derivada tenemos γ̇(t) = CAetA x = 0 en t = 0, γ̇(0) = CAx = 0. Calculando la segunda derivada γ̈(t) = CA2 etA x = 0 en t = 0, γ̈(0) = CA2 x = 0. Ası́ derivando sucesivamente en t = 0 obtenemos CAk x = 0, para k = 0, 1, .., n−1. En particular, x es ortogonal a las filas de C, CA, CA2 , ..., CAn−1 19.

(29)     O=  . C CA CA2 .. . CAn−1.       . por lo tanto x ∈ Ker(O) ⇐=) Sea x ∈ Ker(O), luego x ∈ Ker(C), Cx = 0, x ∈ Ker(CA), CAx = 0 entonces T j x ∈ Ker n−1 j=0 (CA ). Ası́ CAk x = 0, ∀k = 0, 1, 2, ..., n − 1. De la definición de exponencial de una matriz y del Teorema de Cayley-Hamilton, tenemos que: P (A) = An + an−1 An−1 + ... + a1 A + a0 I = 0 de donde P i 0 An = − n−1 i=0 ai A , A = Id luego Ak ∈ Span{A1 , A2 , ..., An−1 } , ∀k ≥ n T j ası́ x ∈ n−1 j=0 Ker(CA ) de donde x ∈ I(0). El siguiente resultado es consecuencia directa del análisis anterior. Teorema 2.4 Sea ΣO un sistema de control lineal con observación sobre Rn como en (2.1). Entonces, ΣO es observable ⇔ rank(O) = n. Demostración ΣO es observable entonces I(0) = {0} por el Teorema (2.1) de la Proposición 2.1 y el Teorema de Cayley-Hamilton tenemos. I(0) =. \. tA. Ker(Ce ) =. n−1 \. KerCAj. j=0. t≥0. Por el Teorema (2.3) I(0) = ker(O) = {0} esto significa que la matriz O tiene rango máximo, esto es rank(O) = n. La recı́proca es inmediata . 20.

(30) Ejemplo 2.1 Los ejemplos a continuación corresponden a linealizaciones de un sistema de control que modela un satélite en órbita terrestre. 1. Considere el sistema lineal ΣO definido por ΣO : ẋ = Ax + Bu en donde  0 1  3r2 0 A=  0 0 0 −2r.  0 0 0 2r  , 0 1  0 0. . 0  1 B =  0 0. y.  1 0  , 0  1. h(x) = Cx.  C =. C es la matriz de h en la base canónica. Entonces,  1 0 0 0  0 0 1 0   0 1 0 0   0 0 0 1 O=  3r2 0 0 2r   0 −2r 0 0   0 −r2 0 0 3 −6r 0 0 −4r2. 1 0 0 0 0 0 1 0.  ,. r 6= 0 y.            . Claramente O tiene rango 4 por el Teorema (2.4) el sistema ΣO es observable. 2. Considere ΣO como en el ejemplo 1, en los siguientes dos casos • a) Si C =. . : R4 → R el sistema no es observable. En efecto,   1 0 0 0  0 1 0 0   no es invertible. O= 2  3r 0 0 2r  0 −r2 0 0. 1 0 0 0. lo que quiere decir que conociendo solo la variable x1 no es posible reconstruir la dinámica del sistema.  • b) Si C = 0 0 1 0 : R4 → R el sistema es observable. De hecho,   0 0 1 0  0 0 0 1   posee rango máximo. O=  0 −2r 0 0  −6r3 0 0 −4r2 Ası́, la variable x3 contiene la información necesaria para reconstruir la dinámica completa del sistema. 21.

(31) 2.3. La observabilidad en la dinámica del tren. En este ejemplo veremos si la dinámica del sistema es observable ó no es observable usando el Teorema (2.4), a través de las funciones proyección desde el plano hacia el eje x y hacia el eje y. Sea ΣO = (R2 , D, π, R) donde.  D:. ẋ ẏ. .  =. 0 1 0 0. . x y. .  +. 0 1. .  u : u ∈ {−1, 1} ∈ U. (x, y) ∈ R2 y π : R2 → R es la función de observación.. Analizaremos la observabilidad de la dinámica del con π1 (x, y) = x, cuya matriz  tren    0 1 asociada a la base canónica es C = 1 0 , A = y CA = 0 1 0 0   1 0 rank(O) = rank = 2. Ası́ el sistema es observable. 0 1 De otro lado, si analizamos la observabilidad de la dinámica del tren a través de la  función observación π2 (x, y) = y, donde C = 0 1 es la matriz asociada a π2 en la  base canónica y CA = 0 0 , entonces   0 1 rank(O) = rank = 1 < 2. Ası́ el sistema no es observable. 0 0 Ahora bien, geométricamente podemos analizar la indistinguibilidad de cualquiera dos estados en el plano R2 , para esto tenemos las soluciones de las ecuaciones diferenciales del sistema para u = 1 y para u = −1.. Figura 2.1: Curvas solución.. 22.

(32) Figura 2.2: Curva de cambio.. Figura 2.3: Analizando la indistinguibilidad de la dinámica del tren a través de la proyección π1 .. Figura 2.4: Analizando la indistinguibilidad de la dinámica del tren a través de la proyección π2 .. 23.

(33) Capı́tulo 3 DINÁMICA SOBRE GRUPOS DE MATRICES En esta sección introduciremos algunos conceptos relacionados con los grupos y álgebras de Lie. En base a este conjunto de matrices desarrollaremos la dinámica sobre los grupos de matrices, daremos la definición de la exponencial de una matriz, de la traslación izquierda y derecha, de la invarianza y mencionaremos un grupo de referencias (Curtis, 2012)[11], (San Martı́n, 2010)[14](Warner, 2013)[15], que nos servirán de base para el desarrollo de la teorı́a necesaria en este capı́tulo.. 3.1. Corchete de Lie. Una noción particularmente importante en teorı́a de control es el corchete de Lie de campos de vectores. Definición 3.1 Si X = X f y Y = Y g ∈ X ∞ (Rn ) se define el corchete de Lie de X e Y , por [X, Y ](x) = Df (x)(g(x)) − Dg(x)(f (x)) x ∈ Rn Denotemos por X ∞ (Rn ) el conjunto de C ∞ − campos de vectores de clase C ∞ sobre Rn . Ejemplo 3.1 Sea A una matriz de orden n, X = X A el campo lineal asociado y considere el campo constante Y = Y b ; esto es, cuando la aplicación b : Rn → Rn es constante igual a b. Entonces, [X, Y ](x) = [Ax, b] = Ab.. 24.

(34) Ejemplo 3.2 Considere los campos lineales X = X A e Y = Y B . Entonces, [X, Y ](x) = AB − BA. Desde un punto de vista geométrico, el corchete de Lie entre dos campos cualquiera X e Y puede ser definido en término de sus flujos, como:   √ d [X, Y ](x) = αx ( t), en donde, αx (t) = Y−t ◦ X−t ◦ Yt ◦ Xt dt t=0+ Este concepto, que utiliza tanto tiempos positivos como negativos, es una medida de la no conmutatividad, (abertura), entre dos campos arbitrarios. Observe el siguiente ejemplo: considere sobre la esfera S 2 ⊂ R3 ; el campo X cuyas curvas integrales “nacen en el polo sur ” y caminan a través de los meridianos en dirección del polo norte, y el campo Y : cuyas curvas integrales recorren los paralelos. Entonces, si x es un elemento de la esfera , α(t) no regresa necesariamente a x. En otras palabras, αx (t) no es constante. En particular, los campos X e Y no conmutan. A continuación, estudiaremos la ecuación diferencial lineal ẋ = Ax con x(0) = x0 en Rn donde A es una matriz real de orden n. Recordemos que la aplicación exponencial de matrices exp : Mn (R) → GLn (R) es definida mediante la serie convergente: X 1 1 1 exp(A) = Ak = Id + A + A2 + ... + Ak + ..., con A0 = Id k! 2! k! k≥0 Existe en algunos casos, un algoritmo computable para encontrar los flujos asociados a campos de vectores lineales, esto es, que provienen de transformaciones lineales. Sea A ∈ Mn (R), la ecuación diferencial asociada al campo X A no es otra cosa que la ecuación diferencial lineal ẋ(t) = Ax(t), que como sabemos, su solución con condición inicial x, viene dada por la expresión XtA (x) = exp(tA)x. De hecho, exp(0) = Id y la serie exp(tA) converge uniformemente en R. En particular, su derivada en t = 0, la cual puede ser calculada término a término, es. d dt t=0. exp(tA) = A. De esta manera, pueden. ser calculados los flujos de los campos de los ejemplos anteriores.. 3.2. Grupos y Álgebras de matrices. Definición 3.2 Un grupo de matrices G es una variedad analı́tica, tal que las operaciones de grupo µ : G × G → G,. i:G→G. (g, h) → gh. g → g −1. son analı́ticas. 25.

(35) Ejemplo 3.3 Los siguientes conjuntos son grupos de matrices bajo la multiplicación. 1. El espacio Euclidiano Rn . 2. El conjunto GL(n, R) = [det−1 (0)]c y GL+ (n, R) el cual contiene la Id. 3. El toro T n = S 1 × . . . × S 1 .. (n-veces el cı́rculo). 4. El grupo ortogonal O(n) = {A ∈ GL(n, R)/AAt = Id}, 5. El grupo especial ortogonal SO(n) = {A ∈ O(n)/detA = 1}. 6. El grupo especial lineal SL(n, R) = {A ∈ GL(n, R)/detA = 1}. 7. En particular GL(3, R), O(3) y SO(3) son grupos de matrices 8. El grupo de Heisenberg (R3 , ∗), con (x, y, z) ∗ (a, b, c) = (x + a, y + b, z + c + xb).. Para definir el campo de vectores invariante necesitamos dar la definición de traslación izquierda y derecha. Definición 3.3 La aplicación Lg : G → G definida por Lg (x) = gx es llamada traslación a izquierda sobre G. La aplicación Rg : G → G definida por Rg (x) = xg es llamada traslación a derecha sobre G.. Observación 3.1 Las traslación a izquierda y a derecha sobre G son difeomorfismos.. El álgebra de Lie de G proviene de la noción de campos de vectores invariantes como sigue. Denotemos por X ∞ (G) el conjunto de C ∞ − campos de vectores de clase C ∞ sobre G. Definición 3.4 Decimos que X ∈ X ∞ (G) es un campo de vector invariante a derecha, si X ◦ Rg = (Rg )∗ (X) para cada g ∈ G. Aquı́, (Rg )∗ o (dRg )e denota la diferencial de Rg en la identidad e = Id. En otras palabras, para definir un campo de vectores invariante a derecha X lo único que necesitamos es definir un vector tangente en la identidad Xe . En efecto, el valor del 26.

(36) campo Xg en cada punto g será definido por (dRg )e (Xe ), esto es, esta definido por la derivada en la identidad de la traslación a derecha Rg . En forma precisa (dRg )e : Te G → Tg G. con. Xg = (dRg )e (Xe ). Observación 3.2 En particular las traslaciones Lg : G −→ G. Rg : G −→ G. x −→ gx. x −→ xg. son difeomorfismos, luego (dLg )h : Th G −→ Tgh G. (dRg )h : Th G −→ Thg G. son isomorfismos, en particular (dLg )e : Te G −→ Tg G. (dRg )e : Te G −→ Tg G. son difeomorfismos.. Observación 3.3 Dados dos campos de vectores invariantes a derecha X, Y el corchete de Lie [X, Y ] es también un campo de vector invariante a derecha. Además observe que X ∈ g está determinado por su valor en la identidad, es decir g es isomorfo al espacio tangente Te G. El conjunto de campos de vectores invariantes a derecha (o izquierda) en G, es llamado el álgebra de Lie g de G Definición 3.5 Un álgebra de Lie consiste de un espacio vestorial g provisto de un producto (corchete) [., .] : g × g → g que satisface las propiedades: i. El corchete [., .] es bilineal, esto es, lineal en cada una de las variables. ii. Anti- simétrica, esto es, [X, Y ] = −[Y, X], para X, Y ∈ g iii. Identidad de Jacobi: para X, Y, Z ∈ g, [X, [Y, Z]] = [[X, Y ], Z] + [Y, [X, Z]] = 0. Un subespacio V ⊂ g es un subálgebra si [V, V ] ⊂ V y este es un ideal si [V, g] ⊂ V. 27.

(37) Ejemplo 3.4 Mencionaremos algunos ejemplos de las álgebras de Lie correspondientes a algunos grupos de matrices. Recordemos que el álgebra de Lie g de un grupo de Lie es isomorfo a su espacio tangente Te G en la identidad. 1. T0 Rn = Rn . 2. TId GL+ (n, R) = gl(n, R) el conjunto de matrices reales de orden n. 3. TId S n = Rn . 4. TId O(n, R) = o(n) = {A ∈ GL(n, R)/A + At = 0}, las matrices anti-simétricas. 5. TId SO(n, R) = so(n) = o(n) 6. Las matrices de traza cero sl(n, R) = {A ∈ gl(n, R)/tr(A) = 0} 7. El álgebra de Lie del grupo de Heisenberg (R3 , +, [, ]) tiene la base {X 1 , X 2 , X 3 } tal que [X 1 , X 3 ] = 0, [X 2 , X 3 ] = 0 y [X 1 , X 2 ] = X 3 . En efecto, el grupo de Heisenberg tiene la representación matricial     1 x1 x3   G = g =  0 1 x2  : x1 , x2 , x3 ∈ R   0 0 1 φ : g → (x1 , x2 , x3 ) ∈ R3 La derivada de γi : R → R3 , γi (t) = φ−1 (tei ) en t = 0, determina X i . Observación 3.4 La aplicación exponencial es: exp : gl(d, R) → GL+ (d, R), expA =. ∞ X 1 k A con A0 = Id. k! k=0. Como d(exp)0 = Id existe una vecindad V ⊂ G de e tal que exp es un difeomorfismo local. Además para un grupo de Lie nilpotente y simplemente conexo la exp es un difeomorfismo global, lo que significa V = G. Un C ∞ homomorfismo entre dos grupos de Lie G y H es llamado un homomorfismo de grupo de Lie. Un homomorfismo de grupo de Lie biyectivo de G consigo mismo es llamado un automorfimo de grupo de Lie. Si G es conexo, el conjunto Aut(G) de G− automorfismos es un grupo de Lie con álgebra de Lie aut(G),(Warner, 2013) [15]. Observación 3.5 Una relación importante entre un homomorfismo de grupo de Lie ϕ : G → H y su derivada (dϕ)e : TeG → TeH es dada por ϕ(expX) = exp(dϕ(X)) el cual proviene del diagrama conmutativo 28.

(38) g expg. (dϕ)e. . G. ϕ. /. /. h . exph. H. Como (d det)e = tr sigue que etrA = det(expA), A ∈ gl(n, R) gl(n, R) exp. /. tr. R e. . GL+ (n, R). det. /. . R. Definición 3.6 Un álgebra de Lie g es: 1. Abeliana, si para cualquier X, Y ∈ g el corchete [X, Y ]es cero. 2. Nilpotente, si existe k ≥ 1; tal que su descendente serie central se estabiliza en el origen. 0 = adk (g) = [ad(k−1) (g), ad1 (g)] ⊂ . . . ⊂ ad1 (g) 3. Soluble, si existe k ≥ 1 tal que su serie derivada se estabiliza en el origen. 0 = adk (g) = [ad(k−1) (g), ad(k−1) (g)] ⊂ . . . ⊂ ad1 (g) 4. Simple, si g no es Abeliano y no contiene ideales propios. 5. Semisimple, si la subálgebra soluble mas grande r(g) de g es nula.. Un grupo de Lie se dice Abeliano, nilpotente, soluble, simple y semi simple, si su álgebra de Lie es Abeliana, nilpotente, soluble, simple y semi simple respectivamente. Ejemplo 3.5 Aqui, mencionaremos los tipos de algunos grupos de Lie. 1. El espacio Euclideano Rn es Abeliano. 2. El toro T m = S 1 × . . . × S 1 (m − veces) es Abeliano y compacto, por otro lado cualquier grupo Abeliano tiene la forma Rn × T m para algún n, m ∈ N. 3. El grupo de Heisenberg (R3 , ∗) es nilpotente   A y 4. El grupo Afı́n { : A ∈ GL(n, R), y ∈ Rn } es soluble. 0 1 29.

(39) 5. El grupo ortogonal SO(n, R) es compacto y simple para n 6= 4 SO(n, R) = {A ∈ GL(n, R)/AAt = Id} 6. El grupo ortogonal SO(4, R) es compacto y semi simple. 7. El grupo especial lineal SL(n, R) es no acotado y semi simple SL(n, R) = {A ∈ GL(n, R)/detA = 1}. Teorema 3.1 Sean G y H grupos de Lie y ϕ : G → H homomorfismo. Entonces, el siguiente diagrama conmuta g expg. (dϕ)e. . G. ϕ. (dϕ)e. Y ∈g. /. /. /. h . exph. H. h = (dϕ)e (Y ). expg. . expg Y ∈ G. ϕ. /. exph. . H 3 exph (dϕ)e (Y ). ϕ(expg Y ) = exph (dϕ)e (Y ) Ejemplo 3.6 Sea SL(n, R) = {A ∈ GL(n, R)/ det A = 1} el grupo especial lineal gl(n, R) exp. /. tr. R e. . GL+ (n, R). det. /. . H. det(eA )|A=θ = etrA = etrθ = 1 TId SL(n, R) = sl(n, R) matrices de traza cero.. 3.3. Dinámica sobre grupo de matrices. Nuestro ambiente será el espacio vectorial de las matrices de orden n, el cual es 2. isomorfo al espacio Euclideano Rn . En particular, la topologı́a y la estructura diferenciable de los objetos a ser considerados provendrá de este isomorfismo. En forma más precisa, consideremos la aplicación determinante det : Mn (R) → R y denotemos por 30.

(40) GLn (R) = [det−1 (0)]c el grupo multiplicativo de las matrices invertibles de orden n. To2. pológicamente, GLn (R) se identifica con un subconjunto abierto de Rn y posee dos componentes conexas. De hecho, la aplicación det es un polinomio en las entradas de una matriz y por lo tanto es una aplicación continua. Además det(GLn (R)) ⊂ R − {0}, si trA denota la traza de A, es entonces posible probar que el siguiente diagrama conmuta: Mn (R) exp. /. tr. . GL+ n (R) det. /. R . e. R+. En particular, etrA = det(expA), ∀A ∈ Mn (R). En realidad, lo que se prueba es que la derivada de la aplicación determinante en el elemento identidad es la traza, es decir: D(det)(Id) = tr. Ahora bien, el hecho de que GLn (R) es un conjunto abierto en Mn (R), significa en particular que es posible “moverse en todas las direcciones del espacio ambiente, en una vecindad de cada elemento de este grupo”. Ası́, el espacio tangente a GLn (R) en cada matriz invertible P , coincide con el espacio vectorial Mn (R) trasladado al estado P . En realidad, sabemos que para cualquier matriz A ∈ Mn (R) la curva exp(tA) está contenida en GL+ n (R), pasa por la identidad en t = 0 y su derivada es A. Esto es, el espacio tangente a GLn (R) en el elemento identidad es exactamente el espacio vectorial Mn (R) trasladado a Id. Ejemplo 3.7 El grupo afı́n. Considere el grupo de matrices     X x n Afn (R) = = , X ∈ GLn (R), x ∈ R ⊂ GLn+1 (R). 0 1    Id x n n n Observe que R es un subgrupo de Afn (R). En efecto: R = ,x ∈ R 0 1 Ejemplo 3.8 El grupo especial general, SLn (R) = {P ∈ GLn (R)/det(P ) = 1}, es cerrado pero no es compacto ni simplemente conexo. Observe que, diag(k, k1 ) ∈ SL2 (R), para cada k ∈ N. Ejemplo 3.9 El grupo ortogonal, On (R) = {P ∈ GLn (R)/P P T = Id}, es compacto. √ Observe que una cota es n. En efecto, cada columna de una matriz ortogonal tiene norma 1. Además, posee dos componentes conexas: rotaciones y reflexiones. Ejemplo 3.10 El grupo ortogonal especial, SOn (R) = {P ∈ On (R)/det(P ) = 1}, corresponde a la componente conexa de la identidad en On (R), esto es, al grupo de las 31.

(41)   cosθ senθ rotaciones de R : Si n = 2, SO2 (R) = , 0 ≤ θ2π , en donde, θ de−senθ cosθ nota el ángulo de rotación en el sentido horario. Observe que SO2 (R) se identifica al n. . cı́rculo unitario S 1 . Ejemplo 3.11 El toro n - dimensional T n es un subgrupo compacto, Abeliano pero no simplemente conexo de GL2n (R). De hecho,  x1      ·  · T n = S1 × · · · × S1 =      ·   . . xn.      .    , xi ∈ SO2 (R), i = 1, 2, ..., n       . Ejemplo  de dimensión tres,  3.12 El grupo  de Heisenberg   1 x1 x3 G =  0 1 x2  , x1 , x2 , x3 ∈ Rn , es difeomorfo a R3 .   0 0 1 En particular, es cerrado simplemente conexo y no compacto.     1 0 0  Ejemplo 3.13 El grupo Euclideano, E3 (R) =  x α β  (x, y) ∈ R2 , α2 + β 2 = 1   y −β α es el grupo de movimientos del plano. Cerrado, pero no es compacto ni simplemente conexo.. 32.

(42) Capı́tulo 4 OBSERVABILIDAD SOBRE GRUPOS DE MATRICES 4.1. Observabilidad en grupos de matrices. Iniciamos la sección extendiendo el concepto de sistema de control lineal con observación desde un espacio Euclidiano a un grupo de matrices [8]. Una generalización de la noción de un sistema lineal del espacio Euclideano Rn a un grupo especı́fico de matrices fue dado por (Markus, 1980)[13]. Posteriormente (Ayala y Tirao, 1999)[7] dieron una definición definitiva para un grupo de Lie G conexo arbitrario. Esta sección esta basada en el artı́culo (Ayala y Hacibekiroglu, 1995)[2] y (Ayala, Hacibekiroglu y Kizil, 2000) [4] Definición 4.1 Un sistema de control lineal con observación Σ es determinado por la siguiente data Σ = (G, D, h, V ) donde. ( D=. ġ(t) = X (g(t)) +. m X. (4.1) ). j. uj (t)Y (g(t)), g(t) ∈ G, u ∈ U. (4.2). j=1. Aqui, X es un campo de vector lineal, por definición, esto es, el flujo Xt ∈ Aut(G), t ∈ R, además, Y j ∈ g y U = L1loc (R, Ω ⊂ Rm ) donde Ω es un subconjunto cerrado de Rm con 0 ∈ int(Ω). La aplicación h : G → V es un homomorfismo de grupos. En este caso particular, Σ es una generalización perfecta del sistema de control lineal con observación Σ = (Rn , D, h, V ) sobre un grupo Abeliano Rn tal que ( D=. ẋ(t) = Ax(t) + Bu(t) = Ax(t) +. m X j=1. 33. ) uj (t)bj , x ∈ Rn , u ∈ U.

(43) En efecto, el grupo a 1-parámetro etA ∈ Aut(Rn ), t ∈ R, es el flujo del drift A, una matriz real de orden n. La matriz de costos B determina m campos de vectores invariantes inducidos por sus vectores columna bj ∈ Rn . Además, h : Rn → V es una transformación lineal. En el caso que no se considere la función de observación, obtenemos el sistema Σ = (G, D) llamado un sistema de control lineal sobre el grupo de Lie de matrices G. Sea Σ = (G, D, h, V ) un sistema de control lineal Σ induce un grupo. GΣ = {Zt11 ◦ Zt22 ◦ ... ◦ Ztkk /Z i ∈ D, ti ∈ R} y un semigrupo SΣ = {Zt11 ◦ Zt22 ◦ ... ◦ Ztkk /Z i ∈ D, ti ≥ 0} de difeomorfismos globales sobre G. Aquı́, Zt representa el flujo generado por el campo del vector Z. Dado un g ∈ G la órbita de g por Σ es la acción de GΣ sobre g esto es GΣ (g) = {ϕ(g) : ϕ ∈ GΣ }. El siguiente resultado se encuentra en la referencia Ayala, Tirao (1999)[7] Teorema 4.1 Sea Σ = (G, D) un sistema de control lineal sobre G. Entonces tenemos: 1) El álgebra de Lie L(Σ) de Σ determinada por la dinámica D y dado por L(Σ) = SpanL.A (D) es un subálgebra de X (G), el álgebra de Lie de todo vector analı́tico sobre G con el corchete usual. 2) H el subálgebra de Lie de g generado por los vectores de control de Σ, esto es, H = SpanL.A {Y 1 , ..., Y m } entonces existe hX \Hi, la subálgebra X − invariante más pequeña de X (G) que contiene H esto es: adi (X )(Y ) ∈ hX \Hi,. ∀Y ∈ H, ∀i ≥ 0.. 3) H y hX \Hi los subgrupos de Lie de G con las álgebras de Lie H y hX \Hi respectivamente, entonces hX \Hi es el subgrupo de Lie T − invariante mas pequeño de G que contiene H esto es Xt ∈ Aut(hX \Hi), ∀t ∈ R. 34.

(44) 4) La órbita del elemento identidad es GΣ (e) = hX \Hi 5) Para cada control admisible u ∈ U, la solución γ(t) de la ecuación diferencial D : ġ(t) = X (g(t)) +. m X. uj (t)Y j (g(t)). j=1. con la condición inicial γ(0) = g es dado por γ(t) = φt,u .ϕt (g) donde φt,u = φt,u (e) la solución de D desde el origen e ∈ G. Entonces, la solución de D desde g ∈ G satisface: φ(t, g, u) = φt,u .ϕ(g) = Lφt,u (ϕt (g)) Demostración Sea Σ = (G, D) un sistema de control lineal con automorfismo infinitesimal X . Asociado con Σ, existen varios subespacios de g 1. El álgebra de Lie L(Σ) del sistema, el cual es generado por su dinámica, L(Σ) = SpanLA = {X , Y 1 , Y 2 , ..., Y m }. Sea X (G) el álgebra de Lie de todos los campos de vectores analı́ticos sobre el grupo de Lie G. L(Σ) es el conjunto de vectores generados por la familia de ecuaciones diferenciales de la dinámica D y además L(Σ) ⊂ X (G). L(Σ) satisface las propiedades de álgebra de Lie de X (G), incluyendo las propiedades de corchete de Lie. 2. Sea H un subgrupo de Lie conexo de G, entonces cada h ∈ H es el producto finito de elementos de la forma exp(tY ) donde Y pertenece al álgebra de Lie H de H y t ∈ R. Denotemos por H la subálgebra de Lie de g generada por los vectores de Σ, esto es: H = SpanL.A {Y 1 , ..., Y m } Como X es un automorfismo infinitesimal y normX (G) (g) = {X ∈ X (G)/[X , Y ] ∈ g, ∀Y ∈ g} se sigue que X ∈ normX (G) (g). Ası́ por definición g es una subálgebra ad(X ) invariante de X (G) y hX \Hi es la menor subálgebra ad(X ) invariante de g y que contiene a H. 35.

(45) 3. < X | H >, es definido como el menor subgrupo T -invariante que contiene al subgrupo H. En efecto, como por definición < X | H > es ad(X )-invariante, esto implica (por argumentos estándares) que para cada t ∈ R, el flujo del campo Xt deja invariante el grupo < X | H > que integra la subálgebra < X | H > . En otras palabras, Xt : < X | H > → < X | H > . Además, como Xt es invertible con inversa X−t , se tiene que Xt ∈ Aut(< X | H >), para cada t ∈ R. 4. Sea Σ un sistema de control lineal sobre G. Entonces, Σ es transitiva si y solo si la condición del rango del álgebra de Lie es satisfecha, esto es, dim SpanLA {Y j , adi (X )(Y j ) | 1 ≤ j ≤ m y 0 ≤ i ≤ dim(G)} = dim(G) Como Xt (e) = e se concluye que Xe = 0. O sea, el elemento identidad del grupo es una singularidad del campo lineal X . Como L(Σ) ∼ = < X | H > ⊗ RX a evaluar en la identidad se obtiene L(Σ)(e) ∼ = <X |H>. En particular, la órbita del sistema a partir de la identidad GΣ (e) (esto es, la subvariedad de G cuyo tangente en e coincide con L(Σ)(e)) es el grupo < X | H >. Luego, GΣ (e) = < X | H > Además, si se asume LARC, es to es, si se asume L(Σ)(g) = Tg G, entonces. GΣ (e) = < X | H > = G. en otras palabras siempre se puede asumir que el sistema es transitivo, por que si no lo es, se restringe el sistema a la órbita del elemento identidad. 5. Consideremos la curva γ(t) dada por γ(t) = φt,u .ϕt (g) Por tanto, γ(0) = g y. γ̇(t) = (dLφt,u )ϕt (g). d d ϕt (g) + (dRϕt (g) )φt,u φt,u = dt dt 36.

(46) ( = (dLφt,u )ϕt (g) X (ϕt (g)) + (dRϕt (g) )φt,u. X (φt,u ) +. m X. ) uj (t)Y j (φt,u ). j=1. como los campos Y j son invariantes, entonces para cada j (dRϕt (g) )φt,u Y j (φt,u ) = Y j (γ(t)) porque γ(t) = φt,u ϕt (g) . = (dLφt,u )ϕt (g) X (ϕt (g)) + (dRϕt (g) )φt,u X φt,u +. m X. uj (t)Y j (γ(t)). j=1. como X es un automorfismo infinitesimal = (dLφt,u )ϕt (g) X (ϕt (g))+(dRϕt (g) )φt,u X φt,u. m X = X (φt,u ϕt (g)) = X (γ(t))+ uj (t)Y j (γ(t)) j=1. consecuentemente γ̇(t) = X (γ(t)) +. m X. uj (t)Y j (γ(t)). j=1 . 4.2. Observabilidad. Considere un sistema de control lineal con observación como en (4.1) Definición 4.2 Dos elementos g1 , g2 ∈ G son indistinguibles por Σ si: Xt (g1 g2−1 ) ∈ Ker(h) ∀t ≥ 0 Observación 4.1 La definición 4.2 se obtiene después de realizar el siguiente cálculo:. g1 ∼ g2 ⇔ h(Xt (g1 )) = h(Xt (g2 )),. ∀t ≥ 0. ⇔ h(Xt (g1 )Xt (g2 )−1 ) = 0 ⇔ h(Xt (g1 · g2−1 )) = 0 luego Xt (g1 · g2−1 ) ∈ Ker(h),. ∀t ≥ 0.. En particular, obtenemos Ie = {g ∈ G/Xt (g) ∈ Ker(h),. 37. ∀t ≥ 0}..

(47) Además, para cada g ∈ G. ge = Ig. En efecto g1 ∼ g2 ⇔ g2 ∈ Ig1 .. Los conceptos de observabilidad local y observabilidad para un sistema de control lineal son independientes de los vectores de control Y 1 , ..., Y m . Esto permite concentrar el estudio en X . Desde ahora, un sistema de control lineal será denotado por Σ = (G, X , h, V ) y también llamaremos a Σ un sistema de control lineal sobre G. Remarcaremos que si G es conexo, entonces el grupo de automorfismo de G, Aut(G) tiene una estructura de grupo de Lie. Proposición 4.1 Sea Σ = (G, X , h, V ) un sistema de control lineal sobre el grupo de Lie G. Entonces: a) I es un subgrupo de Lie normal cerrado de Ker(h). b) I es GΣ − invariante. Demostración a) Si g1 , g2 ∈ G, g1 ∼ e ∼ g2 ⇒ g1 · g2−1 ∈ I por tanto I es un subgrupo de G. Para cada g ∈ G, l ∈ I y t ≥ 0, tenemos Xt (g · l · g −1 ) ∈ Ker(h). Entonces g · l · g −1 ∈ I, lo cual implica que I es un subgrupo normal de G. I es cerrado, en efecto para cualquier sucesión (gn ) en I la cual converge a g tenemos : Para cada t fijo, por continuidad de Xt tenemos que Xt (gn ) −→ Xt (g).Como el núcleo de h es cerrado, Xt (g) ∈ Ker(h), entonces g ∈ I. En particular, I es un subgrupo de Lie de G. b) Tenemos que probar que: g ∼ e ⇒ ϕ(g) ∼ e,. ∀ϕ ∈ GΣ. Por definición, I es SΣ -invariante es suficiente mostrar: g ∼ e ⇒ Xt (g) ∈ Ker(h), 38. ∀t ∈ R.

(48) Tenemos Xt ∈ Aut(I),. ∀t ≥ 0. la curva analı́tica α : R −→ Aut(G) definida por α(t) = Xt satisface α(R+ ) ⊂ Aut(I). Como R+ es un subconjunto abierto de R, por argumentos estándares de analiticidad obtenemos α(R) ⊂ Aut(I) Ası́ I es GΣ - invariante . 4.3. Observabilidad local y global. A continuación analizaremos la observabilidad para un sistema de control lineal Σ sobre un grupo de Lie G El drift (parte sin control del sistema) del campo de vectores de Σ es un automorfismo infinitesimal de G y los vectores de control son elementos en el álgebra de Lie de G. Estableceremos condiciones algebraicas que caracterizan la observabilidad local y global de Σ. Como en el caso lineal sobre Rn , estas condiciones son independientes de los vectores de control. Usaremos la estructura de subgrupo cerrado de la indistinguibilidad de la clase de equivalencia I del elemento neutro e de G. Definimos la distribución invariante a la derecha. ∆:g∈G. ∆(g) = (Rg )∗ I. Donde: • I es el álgebra de Lie de I. • Rg es la traslación a la derecha por g en G. Ahora daremos una versión algebraica de la Proposición 4.1 Denotaremos por I y K las álgebras de Lie de I y del Ker(h) respectivamente. Proposición 4.2 Sea Σ = (G, X , h, V ) un sistema de control lineal. Entonces I es una subálgebra ad(X )- invariante de g, esto es: adi (X )(I) ⊂ I 39. ∀i ≥ 0.. (4.3).

(49) Demostración Por definición, ad0 (X ) es el aplicación identidad sobre g. ad1 (X )(Y ) = [X , Y ] y para i > 1 adi (X )(Y ) = adi−1 (X )([X , Y ]) Por inducción, es suficiente probar para i = 1. Empezamos por la siguiente observación Y ∈ g ⇒ [X , Y ] ∈ g En efecto, sobre el álgebra de Lie X (G) tenemos: [X , Y ] = X Y − Y X ∈ X (G) En particular, como X es un automorfismo infinitesimal [X , Y ](e) = −Ye X = −. d ds. Xexp(sY ) . s=0. De otro lado, d dt. [X , Y ](g) = = =. d dt. d dt. t=0. t=0. =−. d ds. d ds d ds. (X−t )∗ (YXt (g) ) t=0. X−t ◦ Ys ◦ Xt (g) s=0. Rg ◦ X−t (exp(sY )) s=0. (Rg )∗ ◦ Xexp(sY ) s=0. = (Rg )∗ [X , Y ](e) Ası́ [X , Y ] es un campo de vectores invariante a la derecha en X (G), consecuentemente [X , Y ] ∈ g. Por otro lado, hemos probado que I es T - invariante esto es, Xt : I −→ I. ∀t ∈ R. Además, si Y ∈ g sabemos que [X , Y ] ∈ g y para cada Y ∈ I y s ∈ R, exp(sY ) ∈ I. Ahora, Xexp(sY ) =. d dt. (Xt (exp(sY )) ∈ (Rexp(sY ) )∗ (I) ∀s ∈ R t=0. de la fórmula anterior se sigue que [X , Y ]e ∈ I Repitiendo la aplicación de este proceso es posible escribir adi (X )(Y ) ∈ I,. ∀i ∈ Z, 40. i≥0.

(50) lo cual completa la prueba. El siguiente paso es caracterizar el álgebra de Lie de I. En efecto, como veremos I es la mayor subálgebra ad(X )- invariante contenida en K (álgebra del Ker(h)) Proposición 4.3 Sea Σ = (G, X , h, V ) un sistema de control lineal y sea n la dimensión de G. Entonces I=. n−1 \. ad−i (X )(K). i=0. Demostración Si h es inyectiva, entonces {e} = Ker(h). Ası́ podemos asumir K 6= 0 . Los nuevos elementos de g generados por adi (X )- acción sobre K son posibles solo hasta el paso i = n − 1. Como I ⊂ K, por la Proposición (4.2) es suficiente probar que F=. n−1 \. ad−i (X )(K) ⊂ K. i=0. Para cada t ∈ R el siguiente diagrama conmuta. g exp. (Xt )∗. . G. Xt. /g /. . exp. G. Ası́, si Y ∈ F para cada s ∈ R tenemos exp(Xt )∗ (sY ) = Xt (exp(sY )) Por la expansión estándar de la serie de Lie: (Xt )∗ (sY ) =. ∞ X tk i=1. k!. adi (X )(sY ). De acuerdo a la hipótesis Y ∈ F, tenemos adi (X )(Y ) ∈ F. ∀i ≥ 0. En particular (Xt )∗ (sY ) ∈ F entonces, para cada par de números reales t y s tenemos: Xt (exp(sY )) ∈ Ker(h) 41.

Figure

Figura 1.1: Soluci ´on para u = 1.
Figura 1.3: Curva de cambio.
Figura 1.5: Sistema no observable.
Figura 2.1: Curvas soluci ´on.
+2

Referencias

Documento similar