Observabilidad en Grupos de Matrices

Texto completo

(1)UNIVERSIDAD NACIONAL DE SAN AGUSTIN FACULTAD DE CIENCIAS NATURALES Y FORMALES ESCUELA PROFESIONAL DE MATEMÁTICAS. OBSERVABILIDAD EN GRUPOS DE MATRICES. Tesis presentada por: Bachiller Erika Andrea Zapana Zapana Para optar el Tı́tulo de Licenciada en Matemáticas Asesores: Dra. Marı́a L. Torreblanca Todco Dr. Vı́ctor Ayala Bravo. AREQUIPA - PERÚ 2018.

(2) Agradecimiento. Agradezco a mi asesora de tesis, Dra. Marı́a Luisa Torreblanca Todco, por su tiempo y dedicación, quien con sus conocimientos, paciencia y motivación ha logrado en mı́ que pueda terminar la tesis. Agradezco al Dr. Vı́ctor Ayala Bravo mentor del proyecto de investigación “Sistemas de control sobre grupos de matrices” (IBA 2-2016-Ciencia Activa), por su disposición y apoyo en el asesoramiento del presente trabajo de tesis. Ası́ mismo a todos los profesores de la Escuela Profesional de Matemáticas de la Facultad de Ciencias Naturales y Formales de la Universidad Nacional de San Agustı́n de Arequipa quienes han hecho posible mi capacitación profesional en ésta área de las ciencias.. La Autora.. I.

(3) Resumen. En este trabajo de tesis, caracterizamos la propiedad de observabilidad en dos casos. Primero para sistemas lineales de control sobre espacios Euclideanos Rn introduciendo una función de observación h, este problema se analiza considerando la propiedad de indistinguibilidad y el rango de la matriz de observabilidad. En el caso de grupos de matrices caracterizamos la observabilidad local mediante el Teorema 4.2 y la observabilidad global en el Teorema 4.3. Se usa un algoritmo para encontrar el álgebra de Lie I de la clase de indistinguibilidad I, esto para determinar si el sistema es localmente observable y más aún globalmente observable. Palabras clave: Sistemas de control lineales, espacio Euclideano, grupo de matrices, observabilidad local y observabilidad global..

(4) Abstract. In this thesis work, we characterize the property of observability in two cases. First for linear systems of control over Euclidean spaces Rn introducing an observation function h, this problem is analyzed considering the property of indistinguishability and the range of the observability matrix. In the case of groups of matrices we characterize the local observability by Theorem 4.2 and the global observability in Theorem 4.3. An algorithm is used to find the Lie algebra I of the indistinguishability class I, this to determine if the system is locally observable and even more globally observable. Keywords: Linear control systems, Euclidean spaces, groups of matrices, local observable and global observable.

(5) Índice general. Introducción. II. 1 DINÁMICA SOBRE EL ESPACIO EUCLIDIANO Rn. 1. 1.1 Un problema de tiempo optimal . . . . . . . . . . . . . . . . . . . . . . . .. 1. 1.1.1 El ejemplo del tren. Observabilidad . . . . . . . . . . . . . . . . . .. 7. 1.2 Dinámica sobre el espacio Euclidiano Rn . . . . . . . . . . . . . . . . . .. 9. 1.2.1 Campos de Vectores sobre Rn . . . . . . . . . . . . . . . . . . . .. 10. 2 OBSERVABILIDAD SOBRE ESPACIOS EUCLIDEANOS. 14. 2.1 Sistemas lineales con observación . . . . . . . . . . . . . . . . . . . . . .. 14. 2.2 Teorema de observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . .. 18. 2.3 La observabilidad en la dinámica del tren . . . . . . . . . . . . . . . . . .. 22. 3 DINÁMICA SOBRE GRUPOS DE MATRICES. 24. 3.1 Corchete de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 24. 3.2 Grupos y Álgebras de matrices . . . . . . . . . . . . . . . . . . . . . . . .. 25. 3.3 Dinámica sobre grupo de matrices . . . . . . . . . . . . . . . . . . . . . .. 30. 4 OBSERVABILIDAD SOBRE GRUPOS DE MATRICES. 33. 4.1 Observabilidad en grupos de matrices . . . . . . . . . . . . . . . . . . . .. 33. 4.2 Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 37. 4.3 Observabilidad local y global . . . . . . . . . . . . . . . . . . . . . . . . .. 39. I.

(6) 4.4 Algoritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 44. 4.4.1 Ejemplo de observabilidad en Rn . . . . . . . . . . . . . . . . . . .. 44. 4.4.2 Ejemplo de observabilidad en el grupo de Heisenberg . . . . . . .. 45. I.

(7) Introducción Esta obra contiene aspectos especı́ficos de la teorı́a geométrica de los sistemas de control sobre Espacios Euclideanos y sobre Grupos de Matrices. Aborda la propiedad de observabilidad de un sistema de control, que consiste en la posibilidad de recuperar toda la dinámica del sistema a través de una información parcial del mismo, como sucede por ejemplo, cuando queremos controlar desde la tierra la altitud de un satélite en órbita, del cual solo se recibe apenas una señal. Otra forma de interpretación de esta noción, corresponde a identificar aquellas variables del sistema que son esenciales respecto de otras. También involucra un aspecto económico, al conseguir describir completamente un sistema dinámico con un número menor de variables que las necesarias para definirlo. El objetivo principal de este trabajo de tesis consiste en caracterizar la propiedad de observabilidad global y observabilidad local para sistemas de control lineal en grupos de matrices, la caracterización algebraica y dinámica de este problema aparece en la referencia Ayala y Hacibekiroglu [4]. Recientemente, Ayala y Román-Flores en [6], examinan la teorı́a de controlabilidad y observabilidad en espacios Euclideanos a través de un problema de optimización, explicando cómo resolver dicho problema utilizando para ello propiedades algebraicas y topológicas, entre otras, el Principio del Máximo de Pontryagin [12]. El teorema de Pontryagin recibió el premio Lenin en Rusia por su inmensa contribución, tanto a la disciplina matemática como a las innumerables aplicaciones en practicamente todos los ámbitos de la ciencia, medicina, ingenierı́a, etc. No enunciamos este principio en su forma general, presentando una versión geométrica suficiente para nuestros propósitos motivacionales.. Un sistema de control lineal Σ con observación es determinado por: Σ = (Rn , D, h, Rs ),. II.

(8) donde D es la familia de campos de vectores provenientes de las ecuaciones diferenciales controladas, determinadas por D = {ẋ(t) = Ax(t) + Bu(t),. u ∈ U}. y la función observación del sistema h : Rn → Rs , s < n, en donde x ∈ Rn , A ∈ Mn (R) es una matriz real de orden n, B ∈ Mn×p (R) es una matriz real de orden n × p y U = L1loc (R, Ω) es la familia de controles admisibles, esto es, funciones medibles del tipo u : [0, Tu ] ∈ R → Ω ⊂ Rp localmente integrables y Ω es un conjunto cerrado y con 0 ∈ int(Ω). La función h : Rn → Rs es una transformación lineal con matriz C en la base canónica, es decir h(x) = Cx ∈ Rs . Los preliminares para esta sección se encuentran en el Capı́tulo 1. El Capı́tulo 2 incluye material de un nivel matemático que corresponde a una tesis de pregrado. Sin embargo la tesis incluye en el Capı́tulo 4 el estudio de la observabilidad y observabilidad local sobre grupos de matrices generalizando completamente el caso Euclideano. Los preliminares para esta sección se encuentran en el Capı́tulo 3. A continuación describimos brevemente los contenidos de los capı́tulos que componen ésta tesis. Iniciamos este trabajo en el Capı́tulo 1 de manera informal, a través de un ejemplo motivacional que permite introducir nociones fundamentales de la teorı́a geométrica de los sistemas de control y en particular la noción de controlabilidad, observabilidad y optimalidad. Incluimos aquı́ tres resultados fundamentales de la teorı́a, pertinentes a ésta tesis y sin demostración. En forma precisa, se refieren a la propiedad de controlabilidad y optimalidad a través del teorema de Kalman [9], Teorema de Colonius y Klieman [9] y el Principio del Máximo de Pontryagin [12]. El ejemplo motivacional corresponde a un problema de optimización de tiempo mı́nimo. Para poder aplicar este Principio se debe estudiar primeramente la propiedad de controlabilidad, que significa la posibilidad de conectar un estado inicial x0 ∈ Rn con un estado final deseado x1 ∈ Rn , a través de un control u ∈ U y en tiempo positivo. Entonces, este principio selecciona el control optimal III.

(9) entre todos los controles que transfieren x0 a x1 . En el Capı́tulo 2, analizamos el problema de la observabilidad para un sistema de control lineal sobre el espacio Euclideano Rn . Para este análisis introducimos la relación de equivalencia “indistinguibilidad” entre dos estados. Describı́mos algebraicamente la clase de indistinguibilidad del origen en Rn como un subespacio del Ker(h). Con esta información caracterizamos la propiedad observabilidad del sistema a través de la matriz de observabilidad. En el Capı́tulo 3, describimos a través de ejemplos, nociones fundamentales de la teorı́a de grupos y álgebras de Lie. Damos enfásis a los conceptos de campos de vectores sobre grupos de matrices. Especialmente, los campos invariantes y los campos lineales. Los cuales permiten definir el concepto de sistemas de control lineal sobre grupos de matrices, como una perfecta generalización del caso Euclideano. En el Capı́tulo 4, introducimos la noción de observabilidad y observabilidad local para la clase de los sistemas de control lineales sobre grupos de matrices. Establecemos y demostramos los resultados desarrollados en el artı́culo [4] ver también [2]. Para finalizar, queremos observar lo siguiente. En el caso Euclidiano el espacio tangente a un subespacio es el propio subespacio. Esta situación cambia drásticamente para grupos de matrices. Por ejemplo, TId SL(n, R) = sl(n, R) lo que significa que el espacio tangente en el elemento identidad del grupo SL(n, R) = {P : P matriz real de orden n y det(P ) = 1} viene dado por el espacio vectorial sl(n, R) = {Q : Q matriz de orden n y T r(Q) = 0}, que en realidad es una álgebra de Lie con el corchete usual [P, Q] = P Q − QP. De modo que esta última sección de la tesis es bastante más compleja que el caso Euclidiano.. IV.

(10) Capı́tulo 1 DINÁMICA SOBRE EL ESPACIO EUCLIDIANO Rn 1.1. Un problema de tiempo optimal. Imaginemos que dirigimos un tren por una lı́nea férrea y necesitamos detenerlo en la próxima estación en tiempo mı́nimo. Este problema nos conduce a las siguientes preguntas: ¿Existe solución?, y en el caso afirmativo ¿cómo probar su existencia?, o mejor aún, ¿cómo calcular la solución optimal?. Este es un problema tı́pico de la teorı́a de control optimal. En esta tesis, estamos interesados en el estudio de la observabilidad del sistema de control, esto es, la capacidad intrı́nseca del sistema de poder reconstruir toda su dinámica (todas sus soluciones), a través de una información parcial. Por ejemplo, en el caso del tren, ¿podemos reconstruir la dinámica a través de conocer solo las distancias al origen en cada tiempo? o ¿conociendo solo las velocidades involucradas?. Para el planteamiento del problema, considere el caso ideal de una lı́nea férrea recta sin roce y denotemos por x(t) la distancia del tren a la estación en el instante t, consideramos la estación en el origen de R2 . De acuerdo a la Ley de Newton, la fuerza del sistema viene dada por F = ma(t), donde m es la masa y a la aceleración. Sin pérdida de generalidad en este estudio cualitativo, podemos considerar la masa como m = 1. Se obtiene entonces un sistema de ecuaciones controladas por los distintos tipos de combinaciones a(t) entre aceleración y freno. Siguiendo la notación usual de la teorı́a de control reemplazamos a(t) por la variable de control u(t) y obtenemos ·. ·. x(t) = y(t), y(t) = u(t), u ∈ U 1. (1.1).

(11) en donde x(t) es la distancia, la derivada de la distancia es la velocidad denotada por y(t) y la derivada de la velocidad es la aceleración denotada por u(t), además U es una familia de funciones que llamamos admisibles, dependiendo de las distintas posibles estrategias consideradas para las funciones de control u : [0, Tu ] → Ω = [−1,1] ⊂ R en donde u es la aceleración del tren y 1 representa su aceleración máxima. Ahora bien, ¿qué clase de funciones U podrı́amos considerar admisibles? Por ejemplo, el espacio de las funciones medibles localmente integrables, el espacio de funciones continuas o incluso funciones constantes por pedazos con valores en Ω. Estas tres clases de funciones garantizan la existencia y unicidad de la solución asociada a cada estado inicial (x0 , y0 ) y para cada estrategia u ∈ U. En primer lugar, observamos que es posible describir Σ de una manera matricial en el plano. De hecho, el sistema de control lineal restricto, esto es, aquel conjunto en el cual los valores de los controles están acotados sobre R quedarı́a representado de la siguiente manera: Σ:. ẋ(t) ẏ(t). . =. 0 1 0 0. . x(t) y(t). . +. 0 1. u(t),. u ∈ U, |u(t)| ≤ 1. (1.2). que representa las mismas ecuaciones dadas en (1.1) pero escritas de manera más estructurada. Una generalización viene dada por Definición 1.1 Un sistema de control lineal es determinado por la data Σ = (Rn , D) donde D es definido por la familia de campos de vectores provenientes de las ecuaciones diferenciales D = {ẋ(t) = Ax(t) + Bu(t), u ∈ U} donde u : [0, Tu ] → Ω ⊂ Rp : Ω es cerrado y 0 ∈ int(Ω), U = L1loc (R, Ω) • Σ se dice irrestricto si Ω = Rp . • Σ se dice restricto si Ω ( Rp es compacto. Geométricamente, el problema de accesibilidad se traduce entonces en transferir el tren desde el estado inicial (x0 , y0 ) al origen (0, 0) del plano. Si por ejemplo y0 > 0, se entiende que al pasar por x0 el tren se mueve con velocidad y0 y en dirección a la estación. Si y0 < 0, el tren se mueve en la dirección contraria a la estación, situación que es perfectamente posible si, por ejemplo, han llamado al conductor para volver a la estación. 2.

(12) Ası́, es necesario saber si el sistema de control lineal restricto (1.2) ¿es controlable o no?, esto es, ¿si dos estados cualesquiera pueden ser conectados a través de una solución del sistema en tiempo no negativo?. Para dar respuesta a estas preguntas, utilizamos dos teoremas que enunciaremos sin demostración dado que el problema de controlabilidad caso restricto o irrestricto no se enmarcan en los objetivos de este trabajo de tesis, pero se necesitan, cuya demostración se puede ver en el libro (Colonius y Kliemann, 2000) [9]. Teorema 1.1 (Kalman) Sea Σ un sistema lineal irrestricto sobre Rn . Entonces, Σ es controlable ⇔ rank(B AB ... An−1 B) = n Esencialmente C es un conjunto de control para Σ si el sistema es controlable en el int(C). Dada una matriz A de orden n, el espectro Spec(A) = {λ \ λ es autovalor de A} Denotemos SpecLy (A) el espectro de Lyapunov de A definido por: SpecLy (A) = {Re(λ) : λ ∈ Spec(A)} Teorema 1.2 (Colonius - Kliemann) Sea Σ un sistema de control lineal restricto sobre Rn . Suponga que la condición de Kalman está satisfecha. En estas condiciones existe un único conjunto de control C con interior no vacı́o conteniendo el origen 0. Explı́citamente, el conjunto de control viene dado por C = cl(S(0)) ∩ S− (0), donde S− (0) es el conjunto de estados que pueden ser transferidos al origen en tiempo no negativo. Además, el sistema es controlable si y solo si SpecLy (A) ∩ R = {0} En el ejemplo del tren Ω = [−1, 1] es compacto. Entonces, para determinar si el sistema (1.2) es controlable, utilizamos el Teorema de Colonius-Kliemann [9] obtenemos, rank(B AB) = 2 y SpecLy (A) = {0} , es decir, se cumple la condición del rango de Kalman y el espectro de la matriz A solo posee autovalores con parte real cero respectivamente. Ası́, el sistema restricto (1.2) es controlable. En particular, cualquier condición inicial puede ser trasladada al origen y el problema de optimalidad tiene perfecto sentido.. 3.

(13) Podemos fácilmente imaginar que existen muchas formas distintas de transferir la condición inicial al origen. Sin embargo, desde el punto de vista de optimización, se necesita encontrar un control optimal u∗ que transporte (x0 , y0 ) al origen en tiempo mı́nimo. Es importante destacar que las transferencias entre estados no se realiza a través de curvas arbitrarias, sino, solo a través de aquellas que satisfacen las ecuaciones diferenciales asociadas al sistema de control Σ. Teorema 1.3 (Principio del Máximo de Pontryagin) Sea Σ un sistema de control lineal restricto sobre el espacio Euclideano Rn . Para cada x ∈ Rn y T > 0, el conjunto de accesibilidad desde el estado inicial x hasta el tiempo T definido por R S(x, T ) = φ(x, u, t) = etA (x + 0t e−τ A Bu(τ )dτ ) : 0 ≤ t ≤ T, u ∈ U es compacto, convexo y se deforma continuamente con la métrica de Hausdorff. Observe que φ(x, u, t) es solución de la ecuación diferencial ẋ = Ax + Bu. Esto es φ̇(x, u, t) = Aφ(x, u, t) + Bu. Observación 1.1 De acuerdo al Principio del Máximo de Pontryagin [12], las únicas estrategias optimales posibles para nuestro problema se encuentran en la frontera del conjunto de los estados accesibles. Esta información crucial, trasladada a los controles se reduce a dos posibilidades a considerar u = 1 ∨ u = −1. Obviamente, el traslado de esta información desde la frontera de los conjuntos de accesibilidad a la frontera del conjunto de llegada de los controles Ω, no es inmediato. Se deduce de las ecuaciones diferenciales parciales asociadas al sistema Hamiltoniano del Principio del Máximo de Pontryagin, que escapan a las posibilidades de desarrollar en este estudio inicial. El mismo Principio establece que el control optimal u∗ es una combinación adecuada de estos dos controles, entrega la curva optimal. Para el caso n = 2, se necesita a lo más un cambio de control: de u = 1 a u = −1 o recı́procamente. Observe que este principio reduce a priori y de manera notable, la búsqueda de una solución óptima desde un universo infinito de posibilidades contenidas en U = L1loc (R, Ω), a una combinación reducida de controles constantes por pedazos. Con esta información, ¿cómo obtener la solución óptima? en primer lugar, debemos calcular las soluciones de la dinámicas asociadas a los controles optimales. 4.

(14) Para u = 1, obtenemos el sistema de ecuaciones diferenciales ẋ(t) 0 1 x(t) 0 = + ẏ(t) 0 0 y(t) 1 i) Calculemos la solución del sistema homogéneo: . 0 1 Primero hallamos los autovalores de la matriz A = 0 0 Como A es una matriz triangular superior sus autovalores están en la diagonal, en este caso λ = 0 y de multiplicidad algebraica 2. Ahora hallamos losautovectores 0 1 x 0 = 0 0 y 0 y = 0, ∀x x x 1 = =x y 0 0 1 v1 = 0 Generalizando el autovector v1 para obtener v̂1 , se procede de la siguiente manera: 0 1 x̂ 1 = 0 0 ŷ 0 ŷ = 1, ∀x̂ x̂ x̂ 1 = = x̂ ŷ 1 1 1 v̂1 = 1. X h = c1 X 1 + c2 X 2 1 1 1 −0t −0t −0t X h = c1 e + c2 te + e 0 0 1 1 t+1 X h = c1 + c2 0 1 . ii) Calculemos la solución del sistema particular: Para obtener la solución particular Z. t. Xp = Φ(t). Φ−1 (t).F (t)dt. 0. creamos la matriz fundamental Φ(t) =. 1 t+1 0 1. . con Φ−1 (t) =. entonces tenemos Xp =. Z t 1 t+1 1 −(t + 1) 0 dt 0 1 0 1 1 0 −t2 1 t+1 − t 2 Xp = 0 1 t 5. . 1 −(t + 1) 0 1. .

(15) Xp =. t2 2. . t. Ası́, la solución del sistema de ecuaciones es: t2 1 t+1 2 X g = c1 + c2 + 0 1 t cuyas soluciones son parábolas centradas en el eje x abriéndose hacia la derecha. En forma precisa, convexas respecto del eje y.. Figura 1.1: Solución para u = 1. Por otra parte, para el control u = −1 obtenemos el sistema de ecuaciones diferenciales. . ẋ(t) ẏ(t). . =. 0 1 0 0. . x(t) y(t). . −. 0 1. . cuyas soluciones son parábolas centradas en el eje x, abriéndose hacia la izquierda, esto es, cóncavas respecto del eje y.. Figura 1.2: Solución para u = -1. Entre estas dos familias de curvas, existen dos que son esenciales, aquellas que nos trasladan al origen. Denotemos por u− la intersección de la curva que nos traslada al origen con control u = −1, con el semiplano y > 0, y por u+ la intersección de la curva que nos traslada al origen con control u = 1, con el semiplano y < 0. Entonces, la concatenación a través del origen de las semi curvas u− con u+ que denotamos por α, 6.

(16) es una curva continua que divide al plano en dos componentes conexas: (R2 )− y (R2 )+ a la izquierda y derecha de α respectivamente.. Figura 1.3: Curva de cambio.. Considere por ejemplo, un estado inicial (x0 , y0 ) ∈ (R2 )− con y0 > 0. Entonces, usted se dirige hacia la estación con una velocidad positiva y0 desde una distancia x0 . Según el principio, deberá acelerar al máximo siguiendo la trayectoria optimal determinada por el control u = 1. Geométricamente, Ud. viajará por la única parábola que pasa por (x0 , y0 ) y que se dirige al encuentro de la semi parábola u− . En el punto de intersección de ambas parábolas Ud. debe cambiar de estrategia y se trasladará al origen en tiempo mı́nimo vı́a u− . En otras palabras, siguiendo la estrategia optimal, Ud. acelerará al máximo durante un perı́odo de tiempo para después frenar al máximo durante otro perı́odo de tiempo. ¿Cómo saber en que momento cambiar de estrategia?. Esto es equivalente a preguntar, ¿cómo calcular el punto de intersección en donde debo cambiar de control? El principio entrega esta información de manera automática. En realidad las curvas u− y u+ son conocidas, y dada cualquier condición inicial las trayectorias de los sistemas con u = 1 y u = −1 también. Matemáticamente se obtiene la intersección de estas trayectorias, lo que traducido en el ordenador incorporado al tren, entregarı́a de inmediato el momento donde el maquinista debe acelerar o aplicar el freno. La estrategia optimal para (x0 , y0 ) ∈ (R2 )+ con y0 > 0 es análoga, recordando que el tren posee marcha reversa.. 1.1.1. El ejemplo del tren. Observabilidad. Informalmente el concepto de observabilidad de un sistema de control lineal, significa la posibilidad de reconstruir a partir de una cierta información parcial lo que está sucediendo en el sistema completamente, o sea, a través de una función de observación reconstruir toda la curva completa del sistema lo cual es bastante complejo, pero exis7.

(17) ten unas condiciones matemáticas que se verán más adelante, de momento haremos el análisis sin utilizar ese resultado, entonces vamos a considerar el sistema del tren con dos curvas que son las curvas que minimizan el tiempo, que son para el control u = 1 y u = −1 que en cada caso son familias de parábolas. Vamos a utilizar en el primer caso la proyección π1 , (x, y) es un punto del plano, donde x es la distancia e y la velocidad, se toma un punto (x0 , y0 ) entonces la distinguibilidad significa que si se toma otro punto (x1 , y1 ), para que esos dos puntos sean distinguibles, cualquiera que sea la trayectoria que se utilice simúltaneamente a través de ambos puntos iniciales y se proyectan sobre el eje x tendrı́amos que ser capaz de distinguirlos, si no se les puede distinguir con ninguna trayectoria quiere decir que esos dos puntos son indistinguibles, esto es, que están en la misma clase de indistinguibilidad y eso significa en concreto que cuando se mire la curva proyectada desde (x0 , y0 ) o desde (x1 , y1 ) se ve la misma curva, entonces nunca seremos capaces de recontruir el sistema en el plano porque no se sabe si parte de (x0 , y0 ) o parte de (x1 , y1 ) porque la información que nos entrega es insuficiente. Analicemos el caso π1 , consideremos el sistema lineal del tren ΣO1 = R2 , D, π1 , R ẋ(t) 0 1 x(t) 0 donde D = = + u(t), u ∈ U, |u(t)| ≤ 1 ẏ(t) 0 0 y(t) 1 y π1 : R2 → R es la proyección en la primera variable, π1 (x, y) = x.. (1.3). Se toman dos puntos (x0 , y0 ), (x1 , y1 ) y se proyectan sobre el eje x de inmediato se ve que con solo la proyección estos dos puntos se distinguen, el problema estarı́a si se toman dos puntos cualesquiera en la recta del eje y y se proyectan sobre el eje x, estos dos puntos se proyectan simultáneamente en el origen, entonces el eje y es bastante representativo de lo que pasa en cualquier recta paralela al eje y, esto quiere decir que estos dos puntos no se consiguen distinguir a través de la proyección. Lo que se necesita ahora es saber si hay un control que los pueda distinguir, entonces se toma el control u = −1 los puntos p = (x0 , y0 ) y (0, 0) (ver Figura (1.4)), para el punto p la curva que se proyecta es la de color morado y si se hace la proyección tomando el mismo control para el punto (0, 0) nos da la curva de color verde luego se observa que estas dos curvas son distintas entonces se dice que estos dos puntos se distinguen, esto significa que el sistema es observable. Sin embargo, si se hace la proyección con π2 (x, y) = y como en la Figura 1.5 y se toman dos puntos cualesquiera del eje x vemos que si se proyectan estos dos puntos tomando tanto el control u = 1 como u = −1 las curvas proyectadas son las mismas por tanto estos dos puntos no se distinguen eso quiere que el sistema no es observable. 8.

(18) En concreto, esto significa que para determinar la observabilidad del sistema solo es necesario conocer su proyección sobre el eje x. En otras palabras, conociendo las distancias podemos conocer las velocidades. Más adelante estudiaremos condiciones algebraicas para determinar la observabilidad de los sistemas lineales de control sobre espacios Euclideanos.. Figura 1.4: Sistema observable.. Figura 1.5: Sistema no observable.. 1.2. Dinámica sobre el espacio Euclidiano Rn. En esta sección, introducimos algunas nociones básicas respecto de cierto tipo de dinámica sobre espacios Euclideanos. Ası́, establecemos algunos aspectos fundamentales de los espacios de estado y de las ecuaciones diferenciales que intervienen en los diferentes tipos de sistemas de control en Rn ha ser considerados. En la medida de lo posible, se introducen los conceptos desde un punto de vista geométrico.. 9.

(19) 1.2.1. Campos de Vectores sobre Rn. Primeramente, observamos que el espacio Euclidiano real n-dimensional Rn posee un sistema de coordenadas canónico, donde cada elemento x ∈ Rn se escribe como x = (x1 , x2 , ..., xn ). Denotemos por ei = ∂x∂ i el i-ésimo elemento de la base canónica 0. de Rn , i = 1, 2, ..., n. El espacio tangente a Rn en x denotado por Tx Rn se define como el espacio de todos los vectores que se inician en x. Esto es: ∂ n Tx R = Span | i = 1, 2, ..., n ∂xi x En efecto, Tx Rn es un espacio vectorial de dimensión n que se obtiene trasladando el propio Rn ≈ T0 Rn desde el origen al estado x o sea para cada i = 1, 2, ..., n el vector ∂ ∂ denota el vector trasladado al punto x. Esta notación puede ser justificada ∂xi ∂xi x. 0. de la siguiente manera: sea V una vecindad de x, a cada vector v ∈ Tx Rn le asociamos una clase de equivalencia de curvas [γ], con γ : (−; ) → V continua en su dominio y diferenciable en t = 0. Esta clase es caracterizada por las siguientes dos condiciones γ(0) = x y la derivada de γ en t = 0 coincide con el vector v, esto es γ̇(0) = v. A continuación, introduciremos el concepto de fibrado tangente el cual está naturalmente asociado a problemas de la mecánica clásica: posición y velocidad. Para el caso particular de Rn el fibrado lo denotaremos por T Rn el cual se define como la unión disjunta de los espacios vectoriales tangentes a los elementos de Rn , esto es, T Rn = ∪x∈Rn Tx Rn . Este concepto, permite también obtener una visión geométrica de las ecuaciones diferenciales. En efecto, por definición, un campo de vectores X sobre Rn es una aplicación X : Rn −→ T Rn determinada por la elección de un vector tangente iniciándose en x, X(x) ∈ Tx Rn para cada x ∈ Rn . Observamos de inmediato, que existe un isomorfismo entre el espacio vectorial de los campos de vectores X(Rn ) sobre Rn y el espacio F(Rn ) de las aplicaciones de Rn en sı́ mismo. En efecto, cada f : Rn −→ Rn induce un campo X f ∈ X(Rn ) definido para cada x ∈ Rn por. f. X (x) =. n X. fi (x). i=1. ∂ ∂xi. . ∈ Tx Rn ,. x. en donde f = (f1 , f2 , ..., fn ). Geométricamente, la correspondencia f → X f se establece trasladando el vector f (x) al punto x, para cada x ∈ Rn . Recı́procamente, sea X un campo de vectores sobre Rn y x ∈ Rn . Los vectores ∂x∂ i , i = 1, 2, ..., n generan x. 10.

(20) Tx Rn , en particular, existen n funciones reales fi : Rn → R tales que X(x) =. n X. fi (x). i=1. ∂ ∂xi. . x. Ası́, cada campo X en Rn induce f X = (f1 , f2 , ..., fn ) ∈ F(Rn ). Ejemplo 1.1 La aplicación constante e1 : Rn → Rn definida por e1 (x) = e1 , determina el campo de vectores X e1 definido por X e1 (x) = ∂x∂ 1 . Más generalmente, sea b ∈ Rn x. y denote por b : Rn → Rn la aplicación constante igual a b. Entonces, el campo X b asocia a cada x ∈ Rn el propio vector b trasladado al espacio tangente Tx Rn . Esto es, P X b (x) = ni=1 bi ∂x∂ i . x. 2 Ejemplo 1.2 tal que su matriz en la base canóni Considere la aplicación lineal sobre R 0 1 ∂ A ca es A = . Entonces, X (x1 , x2 ) = x2 ∂x1 − x1 ∂x∂ 2 . Este campo no es −1 0 x x invariante por traslación en R2 . En efecto, el vector X A (x1 , x2 ) depende linealmente del. par (x1 , x2 ). Observe que h(x1 , x2 ), (x2 , −x1 )i = 0. Esto es, X A actúa en forma ortogonal respecto de los elementos de su dominio. .  0 0 0 Ejemplo 1.3 Considere la matriz A =  u 0 b  , con (u, v) ∈ R2 y b ∈ R. Esta v −b 0 matriz está asociada a un tı́pico elemento del grupo de movimientos del plano: rotación-traslación. El campo correspondiente, evaluado en x = (x1 , x2 , x3 ) viene dado por ∂ A X (x) = (ux1 + bx3 ) ∂x2 + (vx1 − bx2 ) ∂x∂ 3 . Si u = v = 0, nos encontramos esenx. x. cialmente en el ejemplo anterior. Ahora bien, cada campo de vectores X ∈ X ∞ (Rn ), X(x) =. Pn. i=1 fi (x). . ∂ ∂xi. . , induce x. la ecuación diferencial: ẋ(t) = X(x(t)) =. n X. fi (x). i=1. ∂ ∂xi. . ∈ Tx Rn , x(t). sobre Rn . Obteniéndose, un sistema ordinario de ecuaciones diferenciales de primer orden: ẋ(t) = fi (x(t)) ∈ R, i = 1, 2, ..., n. El Teorema de existencia y unicidad de ecuaciones diferenciales garantiza que dada una condición inicial x0 ∈ Rn existe una única solución γ(x0 , ·) : I(x0 ) → Rn γ(x0 , t) = (γ1 (x0 , t), γ2 (x0 , t), ..., γn (x0 , t)), tal que 11.

(21) γ̇(x0 , t) = fi (γ(x0 , t)), i = 1, 2, ..., n,. t ∈ I(x0 ),. con γ(x0 , 0) = x0. En este contexto, I(x0 ) es un intervalo de la recta real conteniendo el origen y es topológicamente conexo- maximal respecto de la propiedad anterior. Además, la dependencia diferenciable de las condiciones iniciales, garantiza que el flujo Xt del campo X, a saber Xt : Dom(Xt ) ⊂ Rn → Rn , definido para cada condición inicial x0 y t ∈ I(x0 ) por Xt (x0 ) = γ(x0 , t), sea un difeomorfismo local. En particular, para obtener la curva integral de la ecuación diferencial a través de x0 , esto es, la única curva solución que pasa por la condición inicial x0 en t = 0 basta aplicar el flujo Xt en x0 , obteniéndose la curva diferenciable {Xt (x0 ) : t ∈ R} de Rn . Por otra parte, las clases de sistemas de control que serán analizadas en este trabajo consideran campos de vectores completos y globalmente definidos en sus espacios de estados. Es decir, para cada condición inicial x0 , I(x0 ) = R y Dom(Xt ) = Rn para cada t ∈ R. Notemos las siguientes propiedades evidentes del flujo: X0 = Id, Xt ◦Xs = Xt+s y (Xt )−1 = X−t . La ecuación diferencial inducida por el campo X sobre Rn , posee la siguiente interpretación geométrica: la derivada de cada curva integral Xt (x) en cualquier instante t coincide con el valor del campo X en el punto Xt (x). En otras palabras, Ẋt (x) = X(Xt (x)). Entonces, si entendemos un campo de vectores como una familia de flechas parametrizada por los elementos de Rn , se concluye que integrar la ecuación diferencial asociada al campo X nada más es, encontrar una descomposición (partición) de Rn en curvas diferenciables, tal que la derivada de cada una de esas curvas, corresponde en cada punto, a la flecha predeterminada por el campo en ese punto. A continuación, establecemos las ecuaciones diferenciales y calculamos los flujos asociados a los campos de vectores de los ejemplos anteriores. Ejemplo 1.4 El campo de vectores X e1 (x) = ( ∂x∂ 1 )x en Rn , induce la ecuación diferencial ẋ1 (t) = 1, ẋ2 (t) = ... = ẋn (t) = 0. Para cada x0 = (x01 , x02 , ..., x0n ), se tiene Xte1 (x0 ) = (x01 + t, x02 , ..., x0n ) = x0 + te1 . Análogamente, el flujo del campo X v es Xtv (x0 ) = x0 + tv. La descomposición de Rn en las curvas integrales del sistema, corresponde a la partición de Rn en las rectas paralelas al subespacio generado por v. Ejemplo 1.5 El campo X A (x1 , x2 ) = x2 ( ∂x∂ 1 )x − x1 ( ∂x∂ 2 )x induce sobre R2 el sistema ẋ1 (t) = x2 (t), ẋ2 (t) = −x1 (t) con flujo XtA (x01 , x02 ) = (x01 cost + x02 sent, −x01 sent + x02 cost). En este caso, R2 se descompone en la familia de cı́rculos con centro en el origen y de radios no negativos arbitrarios. 12.

(22) Ejemplo 1.6 El campo X A (x) = (ux1 + bx3 )( ∂x∂ 2 )x + (vx1 − bx2 )( ∂x∂ 3 )x sobre R3 , induce el sistema ẋ1 (t) = 0, ẋ2 (t) = ux1 (t) + bx3 (t), ẋ3 (t) = vx1 (t) − bx2 (t), con flujo XtA (x1 , x2 , x3 ) = (α, β, γ) donde (α, β, γ) estan dados por: α = x1 β= γ=. usen(tb)+v−vcos(tb)x1 b vsen(tb)−u+ucos(tb)x1 b. + cos(tb)x2 + sen(tb)x3 − sen(tb)x2 + cos(tb)x3 .. 13.

(23) Capı́tulo 2 OBSERVABILIDAD SOBRE ESPACIOS EUCLIDEANOS 2.1. Sistemas lineales con observación. La observabilidad es la capacidad de reconstruir la dinámica completa de un sistema de control, con una información parcial del mismo. En el ejemplo del tren nos podemos hacer dos preguntas 1. ¿Es posible reconstruir un estado inicial y la trayectoria observando sólo la información de las distancias recorridas? 2. ¿Es posible reconstruir un estado inicial y la trayectoria a partir de este punto observando sólo la información de las velocidades involucradas en el movimiento?. Si consideramos a π como la función observación, el sistema de control inducido por el tren considerando solo estrategias optimales serı́a: Σ = (R2 , D, π, R) D = {ẋ(t) = Ax(t) + Bu(t), u ∈ U} para controles u = 1 y u = −1 donde π : R2 → R. Para responder estas preguntas debemos considerar en cada caso la función de observación π como la proyección sobre el eje correspondiente. Veremos que la respuesta a la pregunta 1 es afirmativa y la respuesta a la pregunta 2 es negativa. El desarrollo de la presente sección esta basada en el artı́culo de Ayala, V. y Román Flores, H.(2017)[6], de aquı́ en adelante un sistema con observación será denotado por ΣO . 14.

(24) Definición 2.1 Un sistema de control lineal con observación ΣO está determinado por la siguiente información ΣO = (Rn , D, h, Rs ). (2.1). Donde D es la familia de campos de vectores provenientes de las ecuaciones diferenciales controladas D = {ẋ(t) = Ax(t) + Bu(t),. u ∈ U}. (2.2). en donde, Rn es el espacio de estados, x ∈ Rn , A ∈ Mn (R) es una matriz real de orden n, B ∈ Mn×p (R) es una matriz real de orden n × p y U = L1loc (R, Ω) es la familia de controles admisibles, esto es, funciones medibles del tipo u : [0, Tu ] ∈ R → Ω ⊂ Rp localmente integrables y Ω es un conjunto cerrado y con 0 ∈ int(Ω). Además h : Rn → Rs es una transformación lineal cuya matriz asociada en la base canónica la denotamos por C. Dada una condición inicial x0 ∈ R y un control u ∈ U, la solución del sistema para esta ecuación diferencial particular esta dada por: Z t u tA φt (x0 ) = e (x0 + e−τ A Bu(τ )dτ ). (2.3). 0. la cual satisface el problema de Cauchy con valores iniciales ; ẋ = Ax + Bu,. x(0) = x0 ,. A continuación daremos el concepto de indistinguibilidad, que permite descomponer el espacio de estados en clases de equivalencia, las que contienen toda la información de aquellos elementos que no pueden ser distinguidos entre si por la función de observación h a través de la dinámica del sistema. Definición 2.2 Dos estados x0 , x1 ∈ Rn se dicen indistinguibles por ΣO , denotado por x0 Ix1 , si x1 − x0 ∈ Ker(CetA ), ∀t ≥ 0. Por definición del Ker(CetA ) observe que , si x0 Ix1 entonces CetA (x1 − x0 ) = 0, ∀t ≥ 0. Observación 2.1 El hecho de que la función observación h no distingue los estados x0 , x1 a través del sistema se traduce en que para cada control u ∈ U y para cada t > 0 Z t Z t tA −τ A tA −τ A C e (x0 + e Bu(τ )dτ ) = C e (x1 + e Bu(τ )dτ ) 0. 0. 15.

(25) luego,. Cet x0 = Cet x1. de donde se desprende la definición de indistinguibilidad. De la definición anterior obtenemos la siguiente proposición: Proposición 2.1 Sea ΣO un sistema lineal con observación. Entonces, 1. I es una relación de equivalencia. 2. Si I(x) denota la clase de equivalencia de x por la relación I, entonces a) I(0) =. T. t≥0. Ker(CetA ). b) I(x) = {x} + I(0). Demostración 1. Demostraremos que I es una relación de equivalencia. En efecto, para cada t ≥ 0, Ker(CetA ) es un espacio vectorial. Entonces, la relación I es: a) Reflexiva xIx ⇔ x − x ∈ Ker(CetA ), ∀t ≥ 0 ⇔ 0 ∈ Ker(CetA ), ∀t ≥ 0 ∴ I es reflexiva. b) Simétrica x0 Ix1 ⇔ x1 Ix0 , suponga que CetA (x1 − x0 ) = 0, ∀t ≥ 0, como el Ker(CetA ) es un subespacio vectorial entonces C(etA )(x0 − x1 ) = 0, ∀t ≥ 0 ∴ I es simétrica. c) Transitiva Queremos demostrar x0 Ix1 ∧ x1 Ix2 ⇒ x0 Ix2 x0 Ix1 ⇔ CetA (x1 − x0 ) = 0, ∀t ≥ 0 x1 Ix2 ⇔ C(etA )(x2 − x1 ) = 0, ∀t ≥ 0 C(etA )(x1 − x0 ) + C(etA )(x2 − x1 ) = 0 C(etA )[(x1 − x0 ) + (x2 − x1 )] = 0 C(etA )[(x2 − x0 )] = 0, ∀t ≥ 0 Ası́ x0 Ix2 ∴ I es transitiva. 16.

(26) Ası́ I es una relación de equivalencia. 2.. a) Considere x ∈ I(0) por la definición (2.2) tenemos γ(t) = CetA x = 0 para cada t ≥ 0 Calculando la primera derivada de γ(t) obtenemos γ̇(t) = CAetA x = 0 y en t = 0 tenemos γ̇(0) = CAx = 0, de aquı́ x ∈ Ker(CA) Derivando por segunda vez tenemos γ̈(t) = CA2 etA x = 0 y en t = 0 γ̈(0) = CA2 x = 0, esto es x ∈ Ker(CA2 ) y ası́ derivando sucesivamente la curva γ(t) = C(etA x), t ≥ 0 y por el Teorema de Cayley-Hamilton se obtiene x∈. n−1 \. Ker(CAj ). j=0. y como consecuencia I(0) =. n−1 \. Ker(CAj ). j=0. b) Seguidamente probaremos que I(x) = x + I(0), en efecto: Sea x ∈ Rn e y ∈ I(x),. (y − x) ∈ Ker(CetA ), ∀t ≥ 0. Ası́ CetA (y − x) = 0 y−x∈. n−1 \. ∀t ≥ 0. Ker(CAj ). j=0. luego y − x ∈ I(0) de donde se obtiene y = x + I(0) Definición 2.3 Dado un sistema de control lineal con observación ΣO : 1. ΣO es observable si es observable desde x0 , esto es I(x0 ) = {x0 }, ∀x0 ∈ Rn 2. ΣO es localmente observable desde x0 si existe una vecindad V = V (x0 ) de x0 V = V (x0 ) tal que I(x0 ) ∩ V = {x0 } Observación 2.2 La definición anterior es válida para una base amplia de sistemas de control. En el caso de sistemas lineales en espacios Euclidianos la Proposición 2.1 muestra que, el estudio de observabilidad puede ser reducido a la clase de indistinguibilidad del origen. 17.

(27) En efecto, el siguiente teorema garantiza el resultado expuesto anteriormente. Teorema 2.1 Un sistema lineal con observación ΣO es observable si y solo si I(0) = {0}. Demostración ⇒) Por la Definición (2.3) si ΣO es observable en x ∈ Rn entonces I(x) = {x}, ası́ para x = 0 entonces I(0) = {0}. ⇐) Por la Proposición (2.1) tenemos I(x) = {x} + I(0) por hipótesis I(0) = {0} luego I(x) = {x}, lo que significa que ΣO es observable para cada x ∈ Rn .. 2.2. Teorema de observabilidad. A continuación daremos otra interpretación de la clase de indistinguibilidad en el origen. En primer lugar, consideremos para cada T > 0, la matriz de observabilidad de Gramian Z G0 (T ) =. T. ∗. eτ A C ∗ Ceτ A dτ. 0 ∗. La notación C indica la traspuesta de la matriz C, ası́ G0 (T ) es una matriz simétrica. Teorema 2.2 Sea ΣO un sistema lineal con observación como en (2.1), para cada T > 0 I(0) = Ker(G0 (T )) Demostración La prueba es independiente de T a) Ker(G0 ) ⊂ I(0) Sea x ∈ Ker(G0 ) entonces G0 x = 0, multiplicando por la izquierda x∗ a ambos lados de la ecuación tenemos x∗ G0 x = 0, ası́ Z T ∗ ∗ x( eτ A C ∗ Ceτ A dτ )x = 0 0 T. Z. ∗. x∗ eτ A C ∗ Ceτ A xdτ = 0. 0. Z. T. ∗. (Ceτ A x) (Ceτ A x)dτ = 0. 0. 18.

(28) T. Z. h(Ceτ A x), (Ceτ A x)idτ = 0. 0. Z. T. kCeτ A xk2 dτ = 0. 0. y por el argumento de continuidad de la aplicación Ceτ A x, el integrando debe anularse en todo el intervalo, esto es γ(τ ) = Ceτ A x = 0,. 0≤τ ≤T. γ es una función analı́tica cuya imagen está en Rs y se anula en el abierto (0, T ), γ debe ser nula, esto es, γ(R) = 0. En particular, CetA x = 0, para cada t ∈ R entonces x ∈ Ker(CetA ) por lo tanto x ∈ I(0). b) I(0) ⊂ Ker(G0 ) Sabemos que x ∈ I(0) ⇔ x ∈ Ker(CetA ), ∀t > 0; luego CetA x = 0, ∀t ≥ 0. De aqui Z. T. ∗. eτ A C ∗ Ceτ A xdτ. G0 x = 0. Z G0 x =. T. ∗. eτ A C ∗ 0dτ. 0. G0 x = 0 por lo tanto x ∈ KerG0. . El uso de la matriz de Gramian para el estudio de observabilidad, requiere el cómputo de una integral. Una manera de evitar este cálculo es dada por la siguiente caracterización. Teorema 2.3 Sea ΣO un sistema de control lineal con observación como en (2.1). Denote por O ∈ Msn×n (R) la matriz O=. C CA CA2 · · · CAn−1. ∗. Entonces, I(0) = Ker(O) Demostración =⇒) Sea x ∈ I(0), esto es, x es indistinguible del origen. Entonces, γ(t) = CetA x = 0, ∀t > 0, donde la curva en t = 0 es γ(0) = Cx = 0. Calculando la primera derivada tenemos γ̇(t) = CAetA x = 0 en t = 0, γ̇(0) = CAx = 0. Calculando la segunda derivada γ̈(t) = CA2 etA x = 0 en t = 0, γ̈(0) = CA2 x = 0. Ası́ derivando sucesivamente en t = 0 obtenemos CAk x = 0, para k = 0, 1, .., n−1. En particular, x es ortogonal a las filas de C, CA, CA2 , ..., CAn−1 19.

(29)     O=  . C CA CA2 .. . CAn−1.       . por lo tanto x ∈ Ker(O) ⇐=) Sea x ∈ Ker(O), luego x ∈ Ker(C), Cx = 0, x ∈ Ker(CA), CAx = 0 entonces T j x ∈ Ker n−1 j=0 (CA ). Ası́ CAk x = 0, ∀k = 0, 1, 2, ..., n − 1. De la definición de exponencial de una matriz y del Teorema de Cayley-Hamilton, tenemos que: P (A) = An + an−1 An−1 + ... + a1 A + a0 I = 0 de donde P i 0 An = − n−1 i=0 ai A , A = Id luego Ak ∈ Span{A1 , A2 , ..., An−1 } , ∀k ≥ n T j ası́ x ∈ n−1 j=0 Ker(CA ) de donde x ∈ I(0). El siguiente resultado es consecuencia directa del análisis anterior. Teorema 2.4 Sea ΣO un sistema de control lineal con observación sobre Rn como en (2.1). Entonces, ΣO es observable ⇔ rank(O) = n. Demostración ΣO es observable entonces I(0) = {0} por el Teorema (2.1) de la Proposición 2.1 y el Teorema de Cayley-Hamilton tenemos. I(0) =. \. tA. Ker(Ce ) =. n−1 \. KerCAj. j=0. t≥0. Por el Teorema (2.3) I(0) = ker(O) = {0} esto significa que la matriz O tiene rango máximo, esto es rank(O) = n. La recı́proca es inmediata . 20.

(30) Ejemplo 2.1 Los ejemplos a continuación corresponden a linealizaciones de un sistema de control que modela un satélite en órbita terrestre. 1. Considere el sistema lineal ΣO definido por ΣO : ẋ = Ax + Bu en donde  0 1  3r2 0 A=  0 0 0 −2r.  0 0 0 2r  , 0 1  0 0. . 0  1 B =  0 0. y.  1 0  , 0  1. h(x) = Cx. C =. C es la matriz de h en la base canónica. Entonces,  1 0 0 0  0 0 1 0   0 1 0 0   0 0 0 1 O=  3r2 0 0 2r   0 −2r 0 0   0 −r2 0 0 3 −6r 0 0 −4r2. 1 0 0 0 0 0 1 0. ,. r 6= 0 y.            . Claramente O tiene rango 4 por el Teorema (2.4) el sistema ΣO es observable. 2. Considere ΣO como en el ejemplo 1, en los siguientes dos casos • a) Si C =. . : R4 → R el sistema no es observable. En efecto,   1 0 0 0  0 1 0 0   no es invertible. O= 2  3r 0 0 2r  0 −r2 0 0. 1 0 0 0. lo que quiere decir que conociendo solo la variable x1 no es posible reconstruir la dinámica del sistema. • b) Si C = 0 0 1 0 : R4 → R el sistema es observable. De hecho,   0 0 1 0  0 0 0 1   posee rango máximo. O=  0 −2r 0 0  −6r3 0 0 −4r2 Ası́, la variable x3 contiene la información necesaria para reconstruir la dinámica completa del sistema. 21.

(31) 2.3. La observabilidad en la dinámica del tren. En este ejemplo veremos si la dinámica del sistema es observable ó no es observable usando el Teorema (2.4), a través de las funciones proyección desde el plano hacia el eje x y hacia el eje y. Sea ΣO = (R2 , D, π, R) donde. D:. ẋ ẏ. . =. 0 1 0 0. . x y. . +. 0 1. . u : u ∈ {−1, 1} ∈ U. (x, y) ∈ R2 y π : R2 → R es la función de observación.. Analizaremos la observabilidad de la dinámica del con π1 (x, y) = x, cuya matriz tren 0 1 asociada a la base canónica es C = 1 0 , A = y CA = 0 1 0 0 1 0 rank(O) = rank = 2. Ası́ el sistema es observable. 0 1 De otro lado, si analizamos la observabilidad de la dinámica del tren a través de la función observación π2 (x, y) = y, donde C = 0 1 es la matriz asociada a π2 en la base canónica y CA = 0 0 , entonces 0 1 rank(O) = rank = 1 < 2. Ası́ el sistema no es observable. 0 0 Ahora bien, geométricamente podemos analizar la indistinguibilidad de cualquiera dos estados en el plano R2 , para esto tenemos las soluciones de las ecuaciones diferenciales del sistema para u = 1 y para u = −1.. Figura 2.1: Curvas solución.. 22.

(32) Figura 2.2: Curva de cambio.. Figura 2.3: Analizando la indistinguibilidad de la dinámica del tren a través de la proyección π1 .. Figura 2.4: Analizando la indistinguibilidad de la dinámica del tren a través de la proyección π2 .. 23.

(33) Capı́tulo 3 DINÁMICA SOBRE GRUPOS DE MATRICES En esta sección introduciremos algunos conceptos relacionados con los grupos y álgebras de Lie. En base a este conjunto de matrices desarrollaremos la dinámica sobre los grupos de matrices, daremos la definición de la exponencial de una matriz, de la traslación izquierda y derecha, de la invarianza y mencionaremos un grupo de referencias (Curtis, 2012)[11], (San Martı́n, 2010)[14](Warner, 2013)[15], que nos servirán de base para el desarrollo de la teorı́a necesaria en este capı́tulo.. 3.1. Corchete de Lie. Una noción particularmente importante en teorı́a de control es el corchete de Lie de campos de vectores. Definición 3.1 Si X = X f y Y = Y g ∈ X ∞ (Rn ) se define el corchete de Lie de X e Y , por [X, Y ](x) = Df (x)(g(x)) − Dg(x)(f (x)) x ∈ Rn Denotemos por X ∞ (Rn ) el conjunto de C ∞ − campos de vectores de clase C ∞ sobre Rn . Ejemplo 3.1 Sea A una matriz de orden n, X = X A el campo lineal asociado y considere el campo constante Y = Y b ; esto es, cuando la aplicación b : Rn → Rn es constante igual a b. Entonces, [X, Y ](x) = [Ax, b] = Ab.. 24.

(34) Ejemplo 3.2 Considere los campos lineales X = X A e Y = Y B . Entonces, [X, Y ](x) = AB − BA. Desde un punto de vista geométrico, el corchete de Lie entre dos campos cualquiera X e Y puede ser definido en término de sus flujos, como: √ d [X, Y ](x) = αx ( t), en donde, αx (t) = Y−t ◦ X−t ◦ Yt ◦ Xt dt t=0+ Este concepto, que utiliza tanto tiempos positivos como negativos, es una medida de la no conmutatividad, (abertura), entre dos campos arbitrarios. Observe el siguiente ejemplo: considere sobre la esfera S 2 ⊂ R3 ; el campo X cuyas curvas integrales “nacen en el polo sur ” y caminan a través de los meridianos en dirección del polo norte, y el campo Y : cuyas curvas integrales recorren los paralelos. Entonces, si x es un elemento de la esfera , α(t) no regresa necesariamente a x. En otras palabras, αx (t) no es constante. En particular, los campos X e Y no conmutan. A continuación, estudiaremos la ecuación diferencial lineal ẋ = Ax con x(0) = x0 en Rn donde A es una matriz real de orden n. Recordemos que la aplicación exponencial de matrices exp : Mn (R) → GLn (R) es definida mediante la serie convergente: X 1 1 1 exp(A) = Ak = Id + A + A2 + ... + Ak + ..., con A0 = Id k! 2! k! k≥0 Existe en algunos casos, un algoritmo computable para encontrar los flujos asociados a campos de vectores lineales, esto es, que provienen de transformaciones lineales. Sea A ∈ Mn (R), la ecuación diferencial asociada al campo X A no es otra cosa que la ecuación diferencial lineal ẋ(t) = Ax(t), que como sabemos, su solución con condición inicial x, viene dada por la expresión XtA (x) = exp(tA)x. De hecho, exp(0) = Id y la serie exp(tA) converge uniformemente en R. En particular, su derivada en t = 0, la cual puede ser calculada término a término, es. d dt t=0. exp(tA) = A. De esta manera, pueden. ser calculados los flujos de los campos de los ejemplos anteriores.. 3.2. Grupos y Álgebras de matrices. Definición 3.2 Un grupo de matrices G es una variedad analı́tica, tal que las operaciones de grupo µ : G × G → G,. i:G→G. (g, h) → gh. g → g −1. son analı́ticas. 25.

(35) Ejemplo 3.3 Los siguientes conjuntos son grupos de matrices bajo la multiplicación. 1. El espacio Euclidiano Rn . 2. El conjunto GL(n, R) = [det−1 (0)]c y GL+ (n, R) el cual contiene la Id. 3. El toro T n = S 1 × . . . × S 1 .. (n-veces el cı́rculo). 4. El grupo ortogonal O(n) = {A ∈ GL(n, R)/AAt = Id}, 5. El grupo especial ortogonal SO(n) = {A ∈ O(n)/detA = 1}. 6. El grupo especial lineal SL(n, R) = {A ∈ GL(n, R)/detA = 1}. 7. En particular GL(3, R), O(3) y SO(3) son grupos de matrices 8. El grupo de Heisenberg (R3 , ∗), con (x, y, z) ∗ (a, b, c) = (x + a, y + b, z + c + xb).. Para definir el campo de vectores invariante necesitamos dar la definición de traslación izquierda y derecha. Definición 3.3 La aplicación Lg : G → G definida por Lg (x) = gx es llamada traslación a izquierda sobre G. La aplicación Rg : G → G definida por Rg (x) = xg es llamada traslación a derecha sobre G.. Observación 3.1 Las traslación a izquierda y a derecha sobre G son difeomorfismos.. El álgebra de Lie de G proviene de la noción de campos de vectores invariantes como sigue. Denotemos por X ∞ (G) el conjunto de C ∞ − campos de vectores de clase C ∞ sobre G. Definición 3.4 Decimos que X ∈ X ∞ (G) es un campo de vector invariante a derecha, si X ◦ Rg = (Rg )∗ (X) para cada g ∈ G. Aquı́, (Rg )∗ o (dRg )e denota la diferencial de Rg en la identidad e = Id. En otras palabras, para definir un campo de vectores invariante a derecha X lo único que necesitamos es definir un vector tangente en la identidad Xe . En efecto, el valor del 26.

(36) campo Xg en cada punto g será definido por (dRg )e (Xe ), esto es, esta definido por la derivada en la identidad de la traslación a derecha Rg . En forma precisa (dRg )e : Te G → Tg G. con. Xg = (dRg )e (Xe ). Observación 3.2 En particular las traslaciones Lg : G −→ G. Rg : G −→ G. x −→ gx. x −→ xg. son difeomorfismos, luego (dLg )h : Th G −→ Tgh G. (dRg )h : Th G −→ Thg G. son isomorfismos, en particular (dLg )e : Te G −→ Tg G. (dRg )e : Te G −→ Tg G. son difeomorfismos.. Observación 3.3 Dados dos campos de vectores invariantes a derecha X, Y el corchete de Lie [X, Y ] es también un campo de vector invariante a derecha. Además observe que X ∈ g está determinado por su valor en la identidad, es decir g es isomorfo al espacio tangente Te G. El conjunto de campos de vectores invariantes a derecha (o izquierda) en G, es llamado el álgebra de Lie g de G Definición 3.5 Un álgebra de Lie consiste de un espacio vestorial g provisto de un producto (corchete) [., .] : g × g → g que satisface las propiedades: i. El corchete [., .] es bilineal, esto es, lineal en cada una de las variables. ii. Anti- simétrica, esto es, [X, Y ] = −[Y, X], para X, Y ∈ g iii. Identidad de Jacobi: para X, Y, Z ∈ g, [X, [Y, Z]] = [[X, Y ], Z] + [Y, [X, Z]] = 0. Un subespacio V ⊂ g es un subálgebra si [V, V ] ⊂ V y este es un ideal si [V, g] ⊂ V. 27.

(37) Ejemplo 3.4 Mencionaremos algunos ejemplos de las álgebras de Lie correspondientes a algunos grupos de matrices. Recordemos que el álgebra de Lie g de un grupo de Lie es isomorfo a su espacio tangente Te G en la identidad. 1. T0 Rn = Rn . 2. TId GL+ (n, R) = gl(n, R) el conjunto de matrices reales de orden n. 3. TId S n = Rn . 4. TId O(n, R) = o(n) = {A ∈ GL(n, R)/A + At = 0}, las matrices anti-simétricas. 5. TId SO(n, R) = so(n) = o(n) 6. Las matrices de traza cero sl(n, R) = {A ∈ gl(n, R)/tr(A) = 0} 7. El álgebra de Lie del grupo de Heisenberg (R3 , +, [, ]) tiene la base {X 1 , X 2 , X 3 } tal que [X 1 , X 3 ] = 0, [X 2 , X 3 ] = 0 y [X 1 , X 2 ] = X 3 . En efecto, el grupo de Heisenberg tiene la representación matricial     1 x1 x3   G = g =  0 1 x2  : x1 , x2 , x3 ∈ R   0 0 1 φ : g → (x1 , x2 , x3 ) ∈ R3 La derivada de γi : R → R3 , γi (t) = φ−1 (tei ) en t = 0, determina X i . Observación 3.4 La aplicación exponencial es: exp : gl(d, R) → GL+ (d, R), expA =. ∞ X 1 k A con A0 = Id. k! k=0. Como d(exp)0 = Id existe una vecindad V ⊂ G de e tal que exp es un difeomorfismo local. Además para un grupo de Lie nilpotente y simplemente conexo la exp es un difeomorfismo global, lo que significa V = G. Un C ∞ homomorfismo entre dos grupos de Lie G y H es llamado un homomorfismo de grupo de Lie. Un homomorfismo de grupo de Lie biyectivo de G consigo mismo es llamado un automorfimo de grupo de Lie. Si G es conexo, el conjunto Aut(G) de G− automorfismos es un grupo de Lie con álgebra de Lie aut(G),(Warner, 2013) [15]. Observación 3.5 Una relación importante entre un homomorfismo de grupo de Lie ϕ : G → H y su derivada (dϕ)e : TeG → TeH es dada por ϕ(expX) = exp(dϕ(X)) el cual proviene del diagrama conmutativo 28.

(38) g expg. (dϕ)e. . G. ϕ. /. /. h . exph. H. Como (d det)e = tr sigue que etrA = det(expA), A ∈ gl(n, R) gl(n, R) exp. /. tr. R e. . GL+ (n, R). det. /. . R. Definición 3.6 Un álgebra de Lie g es: 1. Abeliana, si para cualquier X, Y ∈ g el corchete [X, Y ]es cero. 2. Nilpotente, si existe k ≥ 1; tal que su descendente serie central se estabiliza en el origen. 0 = adk (g) = [ad(k−1) (g), ad1 (g)] ⊂ . . . ⊂ ad1 (g) 3. Soluble, si existe k ≥ 1 tal que su serie derivada se estabiliza en el origen. 0 = adk (g) = [ad(k−1) (g), ad(k−1) (g)] ⊂ . . . ⊂ ad1 (g) 4. Simple, si g no es Abeliano y no contiene ideales propios. 5. Semisimple, si la subálgebra soluble mas grande r(g) de g es nula.. Un grupo de Lie se dice Abeliano, nilpotente, soluble, simple y semi simple, si su álgebra de Lie es Abeliana, nilpotente, soluble, simple y semi simple respectivamente. Ejemplo 3.5 Aqui, mencionaremos los tipos de algunos grupos de Lie. 1. El espacio Euclideano Rn es Abeliano. 2. El toro T m = S 1 × . . . × S 1 (m − veces) es Abeliano y compacto, por otro lado cualquier grupo Abeliano tiene la forma Rn × T m para algún n, m ∈ N. 3. El grupo de Heisenberg (R3 , ∗) es nilpotente A y 4. El grupo Afı́n { : A ∈ GL(n, R), y ∈ Rn } es soluble. 0 1 29.

(39) 5. El grupo ortogonal SO(n, R) es compacto y simple para n 6= 4 SO(n, R) = {A ∈ GL(n, R)/AAt = Id} 6. El grupo ortogonal SO(4, R) es compacto y semi simple. 7. El grupo especial lineal SL(n, R) es no acotado y semi simple SL(n, R) = {A ∈ GL(n, R)/detA = 1}. Teorema 3.1 Sean G y H grupos de Lie y ϕ : G → H homomorfismo. Entonces, el siguiente diagrama conmuta g expg. (dϕ)e. . G. ϕ. (dϕ)e. Y ∈g. /. /. /. h . exph. H. h = (dϕ)e (Y ). expg. . expg Y ∈ G. ϕ. /. exph. . H 3 exph (dϕ)e (Y ). ϕ(expg Y ) = exph (dϕ)e (Y ) Ejemplo 3.6 Sea SL(n, R) = {A ∈ GL(n, R)/ det A = 1} el grupo especial lineal gl(n, R) exp. /. tr. R e. . GL+ (n, R). det. /. . H. det(eA )|A=θ = etrA = etrθ = 1 TId SL(n, R) = sl(n, R) matrices de traza cero.. 3.3. Dinámica sobre grupo de matrices. Nuestro ambiente será el espacio vectorial de las matrices de orden n, el cual es 2. isomorfo al espacio Euclideano Rn . En particular, la topologı́a y la estructura diferenciable de los objetos a ser considerados provendrá de este isomorfismo. En forma más precisa, consideremos la aplicación determinante det : Mn (R) → R y denotemos por 30.

(40) GLn (R) = [det−1 (0)]c el grupo multiplicativo de las matrices invertibles de orden n. To2. pológicamente, GLn (R) se identifica con un subconjunto abierto de Rn y posee dos componentes conexas. De hecho, la aplicación det es un polinomio en las entradas de una matriz y por lo tanto es una aplicación continua. Además det(GLn (R)) ⊂ R − {0}, si trA denota la traza de A, es entonces posible probar que el siguiente diagrama conmuta: Mn (R) exp. /. tr. . GL+ n (R) det. /. R . e. R+. En particular, etrA = det(expA), ∀A ∈ Mn (R). En realidad, lo que se prueba es que la derivada de la aplicación determinante en el elemento identidad es la traza, es decir: D(det)(Id) = tr. Ahora bien, el hecho de que GLn (R) es un conjunto abierto en Mn (R), significa en particular que es posible “moverse en todas las direcciones del espacio ambiente, en una vecindad de cada elemento de este grupo”. Ası́, el espacio tangente a GLn (R) en cada matriz invertible P , coincide con el espacio vectorial Mn (R) trasladado al estado P . En realidad, sabemos que para cualquier matriz A ∈ Mn (R) la curva exp(tA) está contenida en GL+ n (R), pasa por la identidad en t = 0 y su derivada es A. Esto es, el espacio tangente a GLn (R) en el elemento identidad es exactamente el espacio vectorial Mn (R) trasladado a Id. Ejemplo 3.7 El grupo afı́n. Considere el grupo de matrices X x n Afn (R) = = , X ∈ GLn (R), x ∈ R ⊂ GLn+1 (R). 0 1 Id x n n n Observe que R es un subgrupo de Afn (R). En efecto: R = ,x ∈ R 0 1 Ejemplo 3.8 El grupo especial general, SLn (R) = {P ∈ GLn (R)/det(P ) = 1}, es cerrado pero no es compacto ni simplemente conexo. Observe que, diag(k, k1 ) ∈ SL2 (R), para cada k ∈ N. Ejemplo 3.9 El grupo ortogonal, On (R) = {P ∈ GLn (R)/P P T = Id}, es compacto. √ Observe que una cota es n. En efecto, cada columna de una matriz ortogonal tiene norma 1. Además, posee dos componentes conexas: rotaciones y reflexiones. Ejemplo 3.10 El grupo ortogonal especial, SOn (R) = {P ∈ On (R)/det(P ) = 1}, corresponde a la componente conexa de la identidad en On (R), esto es, al grupo de las 31.

(41) cosθ senθ rotaciones de R : Si n = 2, SO2 (R) = , 0 ≤ θ2π , en donde, θ de−senθ cosθ nota el ángulo de rotación en el sentido horario. Observe que SO2 (R) se identifica al n. . cı́rculo unitario S 1 . Ejemplo 3.11 El toro n - dimensional T n es un subgrupo compacto, Abeliano pero no simplemente conexo de GL2n (R). De hecho,  x1      ·  · T n = S1 × · · · × S1 =      ·   . . xn.      .    , xi ∈ SO2 (R), i = 1, 2, ..., n       . Ejemplo  de dimensión tres,  3.12 El grupo  de Heisenberg   1 x1 x3 G =  0 1 x2  , x1 , x2 , x3 ∈ Rn , es difeomorfo a R3 .   0 0 1 En particular, es cerrado simplemente conexo y no compacto.     1 0 0  Ejemplo 3.13 El grupo Euclideano, E3 (R) =  x α β  (x, y) ∈ R2 , α2 + β 2 = 1   y −β α es el grupo de movimientos del plano. Cerrado, pero no es compacto ni simplemente conexo.. 32.

(42) Capı́tulo 4 OBSERVABILIDAD SOBRE GRUPOS DE MATRICES 4.1. Observabilidad en grupos de matrices. Iniciamos la sección extendiendo el concepto de sistema de control lineal con observación desde un espacio Euclidiano a un grupo de matrices [8]. Una generalización de la noción de un sistema lineal del espacio Euclideano Rn a un grupo especı́fico de matrices fue dado por (Markus, 1980)[13]. Posteriormente (Ayala y Tirao, 1999)[7] dieron una definición definitiva para un grupo de Lie G conexo arbitrario. Esta sección esta basada en el artı́culo (Ayala y Hacibekiroglu, 1995)[2] y (Ayala, Hacibekiroglu y Kizil, 2000) [4] Definición 4.1 Un sistema de control lineal con observación Σ es determinado por la siguiente data Σ = (G, D, h, V ) donde. ( D=. ġ(t) = X (g(t)) +. m X. (4.1) ). j. uj (t)Y (g(t)), g(t) ∈ G, u ∈ U. (4.2). j=1. Aqui, X es un campo de vector lineal, por definición, esto es, el flujo Xt ∈ Aut(G), t ∈ R, además, Y j ∈ g y U = L1loc (R, Ω ⊂ Rm ) donde Ω es un subconjunto cerrado de Rm con 0 ∈ int(Ω). La aplicación h : G → V es un homomorfismo de grupos. En este caso particular, Σ es una generalización perfecta del sistema de control lineal con observación Σ = (Rn , D, h, V ) sobre un grupo Abeliano Rn tal que ( D=. ẋ(t) = Ax(t) + Bu(t) = Ax(t) +. m X j=1. 33. ) uj (t)bj , x ∈ Rn , u ∈ U.

(43) En efecto, el grupo a 1-parámetro etA ∈ Aut(Rn ), t ∈ R, es el flujo del drift A, una matriz real de orden n. La matriz de costos B determina m campos de vectores invariantes inducidos por sus vectores columna bj ∈ Rn . Además, h : Rn → V es una transformación lineal. En el caso que no se considere la función de observación, obtenemos el sistema Σ = (G, D) llamado un sistema de control lineal sobre el grupo de Lie de matrices G. Sea Σ = (G, D, h, V ) un sistema de control lineal Σ induce un grupo. GΣ = {Zt11 ◦ Zt22 ◦ ... ◦ Ztkk /Z i ∈ D, ti ∈ R} y un semigrupo SΣ = {Zt11 ◦ Zt22 ◦ ... ◦ Ztkk /Z i ∈ D, ti ≥ 0} de difeomorfismos globales sobre G. Aquı́, Zt representa el flujo generado por el campo del vector Z. Dado un g ∈ G la órbita de g por Σ es la acción de GΣ sobre g esto es GΣ (g) = {ϕ(g) : ϕ ∈ GΣ }. El siguiente resultado se encuentra en la referencia Ayala, Tirao (1999)[7] Teorema 4.1 Sea Σ = (G, D) un sistema de control lineal sobre G. Entonces tenemos: 1) El álgebra de Lie L(Σ) de Σ determinada por la dinámica D y dado por L(Σ) = SpanL.A (D) es un subálgebra de X (G), el álgebra de Lie de todo vector analı́tico sobre G con el corchete usual. 2) H el subálgebra de Lie de g generado por los vectores de control de Σ, esto es, H = SpanL.A {Y 1 , ..., Y m } entonces existe hX \Hi, la subálgebra X − invariante más pequeña de X (G) que contiene H esto es: adi (X )(Y ) ∈ hX \Hi,. ∀Y ∈ H, ∀i ≥ 0.. 3) H y hX \Hi los subgrupos de Lie de G con las álgebras de Lie H y hX \Hi respectivamente, entonces hX \Hi es el subgrupo de Lie T − invariante mas pequeño de G que contiene H esto es Xt ∈ Aut(hX \Hi), ∀t ∈ R. 34.

(44) 4) La órbita del elemento identidad es GΣ (e) = hX \Hi 5) Para cada control admisible u ∈ U, la solución γ(t) de la ecuación diferencial D : ġ(t) = X (g(t)) +. m X. uj (t)Y j (g(t)). j=1. con la condición inicial γ(0) = g es dado por γ(t) = φt,u .ϕt (g) donde φt,u = φt,u (e) la solución de D desde el origen e ∈ G. Entonces, la solución de D desde g ∈ G satisface: φ(t, g, u) = φt,u .ϕ(g) = Lφt,u (ϕt (g)) Demostración Sea Σ = (G, D) un sistema de control lineal con automorfismo infinitesimal X . Asociado con Σ, existen varios subespacios de g 1. El álgebra de Lie L(Σ) del sistema, el cual es generado por su dinámica, L(Σ) = SpanLA = {X , Y 1 , Y 2 , ..., Y m }. Sea X (G) el álgebra de Lie de todos los campos de vectores analı́ticos sobre el grupo de Lie G. L(Σ) es el conjunto de vectores generados por la familia de ecuaciones diferenciales de la dinámica D y además L(Σ) ⊂ X (G). L(Σ) satisface las propiedades de álgebra de Lie de X (G), incluyendo las propiedades de corchete de Lie. 2. Sea H un subgrupo de Lie conexo de G, entonces cada h ∈ H es el producto finito de elementos de la forma exp(tY ) donde Y pertenece al álgebra de Lie H de H y t ∈ R. Denotemos por H la subálgebra de Lie de g generada por los vectores de Σ, esto es: H = SpanL.A {Y 1 , ..., Y m } Como X es un automorfismo infinitesimal y normX (G) (g) = {X ∈ X (G)/[X , Y ] ∈ g, ∀Y ∈ g} se sigue que X ∈ normX (G) (g). Ası́ por definición g es una subálgebra ad(X ) invariante de X (G) y hX \Hi es la menor subálgebra ad(X ) invariante de g y que contiene a H. 35.

(45) 3. < X | H >, es definido como el menor subgrupo T -invariante que contiene al subgrupo H. En efecto, como por definición < X | H > es ad(X )-invariante, esto implica (por argumentos estándares) que para cada t ∈ R, el flujo del campo Xt deja invariante el grupo < X | H > que integra la subálgebra < X | H > . En otras palabras, Xt : < X | H > → < X | H > . Además, como Xt es invertible con inversa X−t , se tiene que Xt ∈ Aut(< X | H >), para cada t ∈ R. 4. Sea Σ un sistema de control lineal sobre G. Entonces, Σ es transitiva si y solo si la condición del rango del álgebra de Lie es satisfecha, esto es, dim SpanLA {Y j , adi (X )(Y j ) | 1 ≤ j ≤ m y 0 ≤ i ≤ dim(G)} = dim(G) Como Xt (e) = e se concluye que Xe = 0. O sea, el elemento identidad del grupo es una singularidad del campo lineal X . Como L(Σ) ∼ = < X | H > ⊗ RX a evaluar en la identidad se obtiene L(Σ)(e) ∼ = <X |H>. En particular, la órbita del sistema a partir de la identidad GΣ (e) (esto es, la subvariedad de G cuyo tangente en e coincide con L(Σ)(e)) es el grupo < X | H >. Luego, GΣ (e) = < X | H > Además, si se asume LARC, es to es, si se asume L(Σ)(g) = Tg G, entonces. GΣ (e) = < X | H > = G. en otras palabras siempre se puede asumir que el sistema es transitivo, por que si no lo es, se restringe el sistema a la órbita del elemento identidad. 5. Consideremos la curva γ(t) dada por γ(t) = φt,u .ϕt (g) Por tanto, γ(0) = g y. γ̇(t) = (dLφt,u )ϕt (g). d d ϕt (g) + (dRϕt (g) )φt,u φt,u = dt dt 36.

(46) ( = (dLφt,u )ϕt (g) X (ϕt (g)) + (dRϕt (g) )φt,u. X (φt,u ) +. m X. ) uj (t)Y j (φt,u ). j=1. como los campos Y j son invariantes, entonces para cada j (dRϕt (g) )φt,u Y j (φt,u ) = Y j (γ(t)) porque γ(t) = φt,u ϕt (g) . = (dLφt,u )ϕt (g) X (ϕt (g)) + (dRϕt (g) )φt,u X φt,u +. m X. uj (t)Y j (γ(t)). j=1. como X es un automorfismo infinitesimal = (dLφt,u )ϕt (g) X (ϕt (g))+(dRϕt (g) )φt,u X φt,u. m X = X (φt,u ϕt (g)) = X (γ(t))+ uj (t)Y j (γ(t)) j=1. consecuentemente γ̇(t) = X (γ(t)) +. m X. uj (t)Y j (γ(t)). j=1 . 4.2. Observabilidad. Considere un sistema de control lineal con observación como en (4.1) Definición 4.2 Dos elementos g1 , g2 ∈ G son indistinguibles por Σ si: Xt (g1 g2−1 ) ∈ Ker(h) ∀t ≥ 0 Observación 4.1 La definición 4.2 se obtiene después de realizar el siguiente cálculo:. g1 ∼ g2 ⇔ h(Xt (g1 )) = h(Xt (g2 )),. ∀t ≥ 0. ⇔ h(Xt (g1 )Xt (g2 )−1 ) = 0 ⇔ h(Xt (g1 · g2−1 )) = 0 luego Xt (g1 · g2−1 ) ∈ Ker(h),. ∀t ≥ 0.. En particular, obtenemos Ie = {g ∈ G/Xt (g) ∈ Ker(h),. 37. ∀t ≥ 0}..

(47) Además, para cada g ∈ G. ge = Ig. En efecto g1 ∼ g2 ⇔ g2 ∈ Ig1 .. Los conceptos de observabilidad local y observabilidad para un sistema de control lineal son independientes de los vectores de control Y 1 , ..., Y m . Esto permite concentrar el estudio en X . Desde ahora, un sistema de control lineal será denotado por Σ = (G, X , h, V ) y también llamaremos a Σ un sistema de control lineal sobre G. Remarcaremos que si G es conexo, entonces el grupo de automorfismo de G, Aut(G) tiene una estructura de grupo de Lie. Proposición 4.1 Sea Σ = (G, X , h, V ) un sistema de control lineal sobre el grupo de Lie G. Entonces: a) I es un subgrupo de Lie normal cerrado de Ker(h). b) I es GΣ − invariante. Demostración a) Si g1 , g2 ∈ G, g1 ∼ e ∼ g2 ⇒ g1 · g2−1 ∈ I por tanto I es un subgrupo de G. Para cada g ∈ G, l ∈ I y t ≥ 0, tenemos Xt (g · l · g −1 ) ∈ Ker(h). Entonces g · l · g −1 ∈ I, lo cual implica que I es un subgrupo normal de G. I es cerrado, en efecto para cualquier sucesión (gn ) en I la cual converge a g tenemos : Para cada t fijo, por continuidad de Xt tenemos que Xt (gn ) −→ Xt (g).Como el núcleo de h es cerrado, Xt (g) ∈ Ker(h), entonces g ∈ I. En particular, I es un subgrupo de Lie de G. b) Tenemos que probar que: g ∼ e ⇒ ϕ(g) ∼ e,. ∀ϕ ∈ GΣ. Por definición, I es SΣ -invariante es suficiente mostrar: g ∼ e ⇒ Xt (g) ∈ Ker(h), 38. ∀t ∈ R.

(48) Tenemos Xt ∈ Aut(I),. ∀t ≥ 0. la curva analı́tica α : R −→ Aut(G) definida por α(t) = Xt satisface α(R+ ) ⊂ Aut(I). Como R+ es un subconjunto abierto de R, por argumentos estándares de analiticidad obtenemos α(R) ⊂ Aut(I) Ası́ I es GΣ - invariante . 4.3. Observabilidad local y global. A continuación analizaremos la observabilidad para un sistema de control lineal Σ sobre un grupo de Lie G El drift (parte sin control del sistema) del campo de vectores de Σ es un automorfismo infinitesimal de G y los vectores de control son elementos en el álgebra de Lie de G. Estableceremos condiciones algebraicas que caracterizan la observabilidad local y global de Σ. Como en el caso lineal sobre Rn , estas condiciones son independientes de los vectores de control. Usaremos la estructura de subgrupo cerrado de la indistinguibilidad de la clase de equivalencia I del elemento neutro e de G. Definimos la distribución invariante a la derecha. ∆:g∈G. ∆(g) = (Rg )∗ I. Donde: • I es el álgebra de Lie de I. • Rg es la traslación a la derecha por g en G. Ahora daremos una versión algebraica de la Proposición 4.1 Denotaremos por I y K las álgebras de Lie de I y del Ker(h) respectivamente. Proposición 4.2 Sea Σ = (G, X , h, V ) un sistema de control lineal. Entonces I es una subálgebra ad(X )- invariante de g, esto es: adi (X )(I) ⊂ I 39. ∀i ≥ 0.. (4.3).

(49) Demostración Por definición, ad0 (X ) es el aplicación identidad sobre g. ad1 (X )(Y ) = [X , Y ] y para i > 1 adi (X )(Y ) = adi−1 (X )([X , Y ]) Por inducción, es suficiente probar para i = 1. Empezamos por la siguiente observación Y ∈ g ⇒ [X , Y ] ∈ g En efecto, sobre el álgebra de Lie X (G) tenemos: [X , Y ] = X Y − Y X ∈ X (G) En particular, como X es un automorfismo infinitesimal [X , Y ](e) = −Ye X = −. d ds. Xexp(sY ) . s=0. De otro lado, d dt. [X , Y ](g) = = =. d dt. d dt. t=0. t=0. =−. d ds. d ds d ds. (X−t )∗ (YXt (g) ) t=0. X−t ◦ Ys ◦ Xt (g) s=0. Rg ◦ X−t (exp(sY )) s=0. (Rg )∗ ◦ Xexp(sY ) s=0. = (Rg )∗ [X , Y ](e) Ası́ [X , Y ] es un campo de vectores invariante a la derecha en X (G), consecuentemente [X , Y ] ∈ g. Por otro lado, hemos probado que I es T - invariante esto es, Xt : I −→ I. ∀t ∈ R. Además, si Y ∈ g sabemos que [X , Y ] ∈ g y para cada Y ∈ I y s ∈ R, exp(sY ) ∈ I. Ahora, Xexp(sY ) =. d dt. (Xt (exp(sY )) ∈ (Rexp(sY ) )∗ (I) ∀s ∈ R t=0. de la fórmula anterior se sigue que [X , Y ]e ∈ I Repitiendo la aplicación de este proceso es posible escribir adi (X )(Y ) ∈ I,. ∀i ∈ Z, 40. i≥0.

(50) lo cual completa la prueba. El siguiente paso es caracterizar el álgebra de Lie de I. En efecto, como veremos I es la mayor subálgebra ad(X )- invariante contenida en K (álgebra del Ker(h)) Proposición 4.3 Sea Σ = (G, X , h, V ) un sistema de control lineal y sea n la dimensión de G. Entonces I=. n−1 \. ad−i (X )(K). i=0. Demostración Si h es inyectiva, entonces {e} = Ker(h). Ası́ podemos asumir K 6= 0 . Los nuevos elementos de g generados por adi (X )- acción sobre K son posibles solo hasta el paso i = n − 1. Como I ⊂ K, por la Proposición (4.2) es suficiente probar que F=. n−1 \. ad−i (X )(K) ⊂ K. i=0. Para cada t ∈ R el siguiente diagrama conmuta. g exp. (Xt )∗. . G. Xt. /g /. . exp. G. Ası́, si Y ∈ F para cada s ∈ R tenemos exp(Xt )∗ (sY ) = Xt (exp(sY )) Por la expansión estándar de la serie de Lie: (Xt )∗ (sY ) =. ∞ X tk i=1. k!. adi (X )(sY ). De acuerdo a la hipótesis Y ∈ F, tenemos adi (X )(Y ) ∈ F. ∀i ≥ 0. En particular (Xt )∗ (sY ) ∈ F entonces, para cada par de números reales t y s tenemos: Xt (exp(sY )) ∈ Ker(h) 41.