Descomposici´
on Fundamental de Matrices y
Equivalencia entre Representaciones
Carlos Andr´
es Hern´
andez G´
omez
Dirigido por el profesor Alexander Cardona del departamento de
matem´
aticas de la universidad de los Andes, Bogot´
a D.C., 2017.
´
Indice general
Introducci´on 3
1. Descomposiciones matriciales 6
1.1. Forma can´onica de Jordan . . . 6
1.2. Valores singulares y forma polar . . . 8
2. Descomposiciones matriciales y par´ametros fundamentales 11 2.1. Algunos hechos elementales y descomposiciones en dimensi´on dos . . . 12
2.2. Descomposiciones y par´ametros fundamentales en dimensi´on dos . . . 14
2.2.1. Par´ametros de semejanza y clasificaci´on de tri´angulos semejantes . . 15
2.2.2. Descomposici´on Fundamental para matrices en dimensi´on dos . . . 17
2.2.3. Dominio fundamental expandido . . . 24
2.3. Descomposici´on Fundamental para matrices en dimensi´on tres . . . 28
2.4. Descomposici´on Fundamental para matrices en dimensi´on n . . . 29
3. Perspectivas de investigaci´on 37 3.1. Teor´ıa de Lie . . . 37
3.1.1. Descomposici´on de Cartan . . . 40
3.1.2. Descomposici´on de Jordan-Chevalley . . . 42
3.2. El dominio fundamental y sl(2, R) . . . 43
3.3. Par´ametros fundamentales y polinomio caracter´ıstico . . . 44
Introducci´
on
En el contexto del ´algebra lineal aprendemos a diagonalizar matrices cuadradas, proce-so que de poder llevarse a cabo conduce a una manera de representar la matriz en t´erminos de otras matrices y cuyo significado geom´etrico, permite identificar la acci´on de una tras-formaci´on lineal asociada a dicha matriz sobre un espacio euclidiano, al descomponerla en homotecias que act´uan sobre espacios propios. Mientras algunas matrices reales s´olo pueden diagonalizarce empleando n´umeros complejos, como aquellas que corresponden con rotaciones, otras nunca se pueden diagonalizar, como es el caso de las matrices nilpo-tentes. Aunque esta representaci´on no siempre exista, a partir de esta podemos obtener otras dos que se pueden definir siempre.
La forma can´onica de Jordan es la manera m´as directa de generalizar el proceso de diagonalizaci´on de una matriz. Al trabajar con matrices reales podr´ıamos tener que usar coeficientes complejos, pues s´olo en los complejos podemos garantizar que el polinomio caracter´ıstico se factorice completamente. Adem´as de factorizar el polinomio caracter´ısti-co necesitamos obtener una base de vectores propios, cuando una matriz A no puede diagonalizarce ni siquiera al emplear complejos es porque la base de vectores propios est´a incompleta, en tal caso debemos completar la base de vectores propios empleando vectores propios generalizados para construir la forma can´onica de Jordan. En este sen-tido, al construir la forma can´onica de Jordan ampliamos el concepto de espacio propio para sustituirlo por aquel de espacio invariante E de A, es decir tal que A(E) ⊆ E.
Ahora consideramos el hecho de que el producto de cualquier matriz real (o compleja) por su transpuesta (o su adjunta) es sim´etrico (o autoadjunto) y que adem´as es semidefini-do positivo, es decir que dicho producto de matrices es ortogonalmente (o unitariamente) diagonalizable y tiene valores propios reales no negativos. Los valores singulares de una matriz A se definen como las ra´ıces cuadradas (no negativas) de los valores propios (reales no negativos) de ATA. Si A es una matriz cuadrada, es posible representarla empleando
dos matrices ortogonales (o unitarias) O y ˜O y una matriz diagonal de valores singulares Σ mediante el producto A = OΣ ˜O gracias a la descomposici´on en valores singulares. A diferencia de lo que ocurre en la forma can´onica de Jordan O y ˜O no tienen que ser in-versas una de la otra.
La forma can´onica de Jordan es ideal para calcular potencias de matrices, ya que las matrices de cambio de base a los lados son inversas una de la otra de modo que se can-celan al multiplicar la matriz con sigo misma, esto en cambio luce muy mal al emplear la descomposici´on en valores singulares. La descomposici´on en valores singulares sin embar-go no requiere emplear coeficientes complejos para representar matrices reales, mientras emplea siempre bases ortonormales y una matriz completamente diagonal con entradas reales no negativas.
Es posible interpretar, tanto la forma can´onica de Jordan como la descomposici´on en valores singulares para una misma matriz cuadrada A, c´omo descripciones geom´etricas acerca de c´omo actu´a la transformaci´on lineal representada por dicha matriz. Estas dos descripciones, pese a relatar lo mismo, lo hacen de manera esencialmente diferente. Como contamos con ambas representaciones para cualquier matriz cuadrada (real o compleja), podemos compararlas. Las matrices sim´etricas semidefinidas positivas ejemplifican co-mo ambas representaciones pueden coincidir por completo, m´as a´un, en el caso general abr´ıa de existir alg´un criterio algebraico o geom´etrico (o ambos) que permita establecer la correspondencia entre estas dos representaciones. Este trabajo pretende descubrir di-chos criterios y propone que estos sean un puente para expandir nuestro entendimiento del ´algebra y la geometr´ıa paralelamente; proponiendo un contexto geom´etrico apropiado para relacionar diferentes descomposiciones matriciales, al cual hemos llamado Dominio Fundamental.
En el primer cap´ıtulo haremos un repaso de la teor´ıa concerniente respecto la for-ma can´onica de Jordan y la descomposici´on en valores singulares. Posteriormente, en el segundo cap´ıtulo, se expondr´an los primeros intentos de responder la pregunta sobre la correspondencia entre la forma can´onica de Jordan y la descomposici´on en valores singu-lares a partir del estudio de casos muy particusingu-lares. Luego se avanzar´a hacia un enfoque m´as general, que nos dar´a una respuesta explicita en dimensi´on dos (teoremas 2.2.1 y 2.2.2) e impl´ıcita en dimensiones superiores (teorema 2.4.1), mediante una perspectiva equivalente a la noci´on de espacios modulares, la cual se ejemplificar´a primero de forma sencilla empleando tri´angulos en lugar de matrices.
Un espacio modular es un espacio geom´etrico cuyos puntos representan objetos matem´ ati-cos o clases de equivalencia de dichos objetos. Son ejemplos de espacios modulares, los espacios proyectivos donde se parametrizan los subespacios unidimensionales, el Grass-maniano Gr(k, V ) de un espacio vectorial V que corresponde con los subespacios de V de dimensi´on k, la variedad de Chow, el esquema de Hilbert y el dominio fundamental (definici´on 2.2.1) que describe las clases equivalentes de matrices ortogonalmente similares.
En el capitulo final introduciremos la teor´ıa de grupos y ´algebras de Lie para estudiar sus descomposiciones y relacionarlas con nuestro objeto de estudio y a la vez se expondr´an ciertas expectativas frente al potencial a futuro y posibles aplicaciones de esta investiga-ci´on.
Cap´ıtulo 1
Descomposiciones matriciales
El prop´osito investigativo de esta tesis es comprender, desde una perspectiva geom´ etri-ca, la acci´on de una transformaci´on lineal en Rn por medio de su descomposici´on en valo-res singulavalo-res y su forma can´onica de Jordan, simult´aneamente. Concretamente, se quiere buscar un algoritmo que nos permita pasar de una descomposici´on a la otra para enten-der como se presentan ambas simult´anemente, estableciendo relaciones entre los valores propios, los valores singulares y las bases asociadas correspondientes.
1.1.
Forma can´
onica de Jordan
Para entender c´omo se construyen estas dos representaciones debemos empezar por recordar el proceso de diagonalizaci´on de una matriz. Sea Mn(F) el espacio vectorial de
matrices n×n con entradas en F = R o F = C. Para diagonalizar una matriz M ∈ Mn×n(F)
se debe construir una matriz D, similar a M y diagonal, a partir de las ra´ıces del poli-nomio caracter´ıstico de M . Dicho polipoli-nomio es simplemente el determinante de la matriz M − λI donde λ es la inc´ognita y las ra´ıces de dicho polinomio, que reciben el nombre de valores propios de M , son los coeficientes que definen la matriz diagonal D. Para que M resulte ser de hecho diagonalizable es necesario establecer que las matrices M y D sean similares, es decir hay que hallar una matriz invertible C tal que M = C−1DC.
Esta matriz C puede entenderse como la matriz de cambio de la base can´onica a una base de vectores propios de M . Para construir dicha base de vectores propios basta con hallar bases para los n´ucleos de las matrices singulares de la forma M − λI y unirlas para formar la base deseada, estos n´ucleos son los espacios propios de M asociados a sus respectivos valores propios λ. Cabe alcarar que para obtener la igualdad M = C−1DC se deben ordenar los valores propios y la base de vectores propios de M de forma correspon-diente.
Cuando una raiz λ0 del polinomio caracter´ıstico de M est´a repetida, puede ocurrir que
la dimensi´on del n´ucleo de M − λ0I, llamada multiplicidad geom´etrica de λ0 como valor
propio de M , sea menor al n´umero de veces que λ − λ0 divide al polinomio caracter´ıstico
de M , llamada multiplicidad algebr´aica de λ0 como valor propio de M . Cuando ocurre
lo anteriormente mencionado, es decir, cuando la multiplicidad algebr´aica y geom´etrica de alg´un valor propio no coinciden, la base de vectores propios estar´a incompleta y por consiguiente no resultar´a posible diagonalizar la matriz M .
Tampoco es posible diagonalizar una matriz cuando su polinomio caracter´ıstico no se fac-toriza completamente, ya que el conjunto de valores propios queda imcompleto, problema que se resuelve f´acilmente (al trabajar con matrices reales) gracias al teorema fundamental del ´algebra (ver [5, teorema 31.18, p´agina 288]), admitiendo coeficientes complejos para poder llevar a cabo la diagonalizaci´on.
Sin embargo, a´un cuando una matriz no pueda diagonalizarse debido a la dispari-dad entre las multiplicidispari-dades geom´etricas y algebr´aicas de uno o varios de sus valores propios, se puede en todo caso obtener la forma can´onica de Jordan de M mediante un procedimiento m´as general que consiste en hallar preim´agenes de algunos elementos de los n´ucleos de las matrices M − λI para remplazar los vectores propios faltantes, estos nuevos elementos que completan la base de vectores propios se llaman vectores propios generalizados. Mientras los vectores propios ~v de A son aquellos tales que A~v = λ~v, los vectores propios generalizados ~w son aquellos tales que A ~w = ~v + λ ~w donde ~v es un vector propio (o un vector propio generalizado) asociado al valor propio λ.
Tras completar la base de vectores propios con los vectores propios generalizados co-rrespondientes que satisfacen la relaci´on A ~w = ~v + λ ~w, los ordenamos de forma corres-pondiente empezando por los vectores propios. As´ı, podemos completar la forma can´onica de Jordan como si estuvi´eramos diagonalizando, pero no sin antes ajustar la matriz dia-gonal, convirtiendo en unos los ceros ubicados directamente encima de los valores propios que corresponden con vectores propios generalizados. En este caso m´as general, la matriz M no resulta siendo siempre similar a una matriz diagonal D, sino a una matriz J que se parece mucho a D, salvo por aquellas entradas arriba de la diagonal que son unos en lugar de ceros, asociados a los vectores propios generalizados, y que siempre est´an dentro de bloques asociados a un mismo valor propio, llamados bloques de Jordan.
La existencia de la forma can´onica de Jordan para matrices cuadradas est´a garantiza-da por el siguiente teorema (tomado de [11, teorema 2.5.5, p´agina 36]).
Teorema 1.1.1. Sea V un espacio vectorial (sobre C) y sea T : V → V una transfor-maci´on lineal. Entonces existe una base β para V , en la cual A = [T ]β es una matriz en
forma can´onica de Jordan.
Como ejemplo pensemos en una matriz M con un ´unico valor propio λ0, si M fuera
diagonalizable tendr´ıa que ser una matriz escalar, que por conmutar siempre es similar solamente a ella misma, as´ı que no hay nada que hacer pues ya est´a diagonalizada ba-jo cualquier base. Entonces supongamos meba-jor que no es diagonalizable, en tal caso la matriz M − λ0I no resulta ser nula pero si resulta ser nilpotente, esto significa que los
elementos que no estan en el n´ucleo son preim´agenes del n´ucleo directa o indirectamente de tal manera que al componer M − λ0I a lo sumo n veces se anula por completo, donde
n es la dimensi´on del espacio.
En conclusi´on, si admitimos coeficientes complejos vemos que podemos representar cual-quier matriz real cuadrada mediante su forma can´onica de Jordan M = C−1J C, la cual es ´
util para calcular potencias de M , pues las matrices que aparecen a ambos lados en la re-presentaci´on son inversas y se cancelan al componer M , de tal manera que Mk = C−1JkC.
Observaci´on 1.1.1. Vemos que los espacios propios que se emplean para diagonalizar una matriz a menudo se expanden a espacios invariantes al emplear vectores propios generalizados en la forma can´onica de Jordan. En este sentido, resulta similar a la forma can´onica racional, donde se emplean bases c´ıclicas para los espacios invariantes de la forma β = {v, M v, M2v, ..., Mkv}, que al unirse forman una base para todo el espacio. En lugar de los bloques de Jordan, en la forma can´onica racional se utilizan bloques con ceros salvo debajo de la diagonal, donde hay unos, y en la ´ultima columna, donde aparecen con signo opuesto los coeficientes del polinomio m´onico asociado al espacio invariante generado por β y el cual divide al polinomio caracter´ıstico de M (ver [6, teorema 7.22, secci´on 7.4]).
1.2.
Valores singulares y forma polar
Pese a la practicidad de la forma can´onica de Jordan para calcular potencias de ma-trices, para lograr esta representaci´on tenemos que admitir un cambio de base arbitrario, obteniendo una representaci´on que no siempre es diagonal y mediante valores propios que pueden ser negativos e incluso complejos a´un para matrices reales.
Pensemos en el caso de las matrices sim´etricas. Las matrices sim´etricas se pueden dia-gonalizar siempre, adem´as la base de vectores propios se puede escoger ortonormal y los valores propios son reales. Esto se puede evidenciar a partir de dos hechos, el primero es que al sumarle o restarle una matriz escalar, digamos λI, a una matriz sim´etrica M , la nueva matriz M − λI podr´a tener valores propios distintos a los de M , no obstante,
que el n´ucleo de una matriz es el complemento ortogonal de las im´agenes de su traspuesta.
A partir de lo anterior, considerando la matriz sim´etrica con valores propios no negativos MTM , podemos obtener una elegante descomposici´on para cualquier matriz cuadrada M ,
de la forma M = OΣ ˜O, llamada descomposici´on en valores singulares, donde aparece una matriz diagonal Σ con valores reales no negativos acompa˜nada a lado y lado de matrices ortogonales. Dichas matrices ortogonales no tienen por qu´e ser inversas una de la otra, y esta es la desventaja respecto a la forma can´onica de Jordan.
Al ver que tanto la descomposici´on en valores singulares como la forma can´onica de Jordan con coeficientes complejos existen siempre para matrices reales n × n, puede resultar llamativa la idea de buscar una manera natural de relacionar ambas a la vez que se tiene en mente la intuici´on detr´as de su significado geom´etrico. El siguiente teorema (tomado de [6, teorema 6.26, p´agina 406]) muestra c´omo describir una transformaci´on lineal a partir de sus valores singulares, aqu´ı no se hace menci´on de las matrices, pero la relaci´on est´a impl´ıcita.
Teorema 1.2.1. Sean V y W espacios con producto interno de dimensi´on finita, y sea T : V → W una transformaci´on lineal con rango r. Entonces existen bases ortonormales {v1, v2, ..., vn} para V y {w1, w2, ..., wn} para W y escalares positivos σ1 ≥ σ2 ≥ ... ≥ σr
tales que: T (vi) = σiwi si 1 ≤ i ≤ r, 0 si i > r.
As´ı mismo, supongamos que se satisfacen las condiciones anteriores. Entonces para 1 ≤ i ≤ n, vi es un vector propio de T∗T correspondiente al valor propio σi2 si 1 ≤ i ≤ r o
cero si i > r. Por lo tanto los escalares σi est´an determinados de forma ´unica por T .
Para obtener la descomposici´on en valores singulares de una matriz M = OΣ ˜O, basta con considerar la matriz sim´etrica MTM , que adem´as es semidefinida positiva y por lo
tanto ortogonalmente diagonalizable con valores propios reales no negativos. Los valores singulares de M son las ra´ıces cuadradas positivas de los valores propios de MTM , con
los valores singulares se construye la matriz diagonal de la descomposici´on Σ. La matriz ortogonal ˜O es aquella que realiza el cambio de base, de la base can´onica a una base ortonormal de vectores propios de MTM , mientras que las columnas de la matriz orto-gonal O se deducen al observar las im´agenes mediante M de los elementos de dicha base ortonormal de vectores propios de MTM .
Observaci´on 1.2.1. Existe otra descomposici´on llamada descomposici´on polar, donde M se expresa como el producto de una matriz ortogonal W y una matriz sim´etrica semidefini-da positiva P , se obtiene directamente a partir de la descomposici´on en valores singulares
donde M = OD ˜O = (O ˜O)( ˜OTD ˜O) = W P , W = O ˜O y P = ˜OTD ˜O. En un caso m´as
general podemos pensar en matrices unitarias y autoadjuntas en lugar de ortogonales y sim´etricas.
Cap´ıtulo 2
Descomposiciones matriciales y
par´
ametros fundamentales
Al comenzar a buscar una manera de evidenciar la conexi´on entre la descomposici´on en valores singulares y la forma can´onica de Jordan, primero se tomaron en consideraci´on casos particulares muy sencillos y espec´ıficos. Estudiando caso por caso distintos tipos de matrices 2 × 2 definidas en t´erminos simples mediante algunos par´ametros apropiados, para a partir de estos calcular los valores singulares y los valores propios, y as´ı compararlos.
Al comienzo de esta secci´on se presentan los primeros intentos menos generales, en los que a´un no hab´ıan sido identificados los par´ametros m´as apropiados para abordar el pro-blema de forma general. M´as adelante veremos que, mediante una escogencia acertada de los par´ametros, podemos responder la pregunta y hacer varias observaciones de manera general para todas las matrices 2 × 2.
En ciertos casos, la forma can´onica de Jordan y la descomposici´on en valores singulares resultan id´enticas (si se realizan debidamente, pues no son ´unicas), se trata del caso particular de las matrices sim´etricas semidefinidas positivas.
Definici´on 2.0.1. Una matriz sim´etrica M con entradas reales es llamada semidefinida positiva si ~x · M~x ≥ 0, ∀~x ∈ Rn.
Lema 2.0.1. Si M es una matriz sim´etrica, es ortogonalmente diagonalizable con valores propios reales, dicha forma diagonal corresponde con la forma can´onica de Jordan. Para convertirla en la descomposici´on en valores singulares basta factorizar una matriz diagonal y ortogonal, para retirar los menos de la matriz diagonal y multiplicarla a alguna de las matrices ortogonales a los lados. As´ı se convierte la forma can´onica de Jordan en la descomposici´on en valores singulares en el caso de las matrices sim´etricas.
2.1.
Algunos hechos elementales y descomposiciones
en dimensi´
on dos
Definici´on 2.1.1. Sea M una matriz 2 × 2 con entradas reales. Llamaremos M sesqui-sim´etrica si es la suma de una matriz antisim´etrica y una matriz escalar. Una matriz es escalar si es un m´ultiplo de la matriz identidad.
En particular, si consideramos una matriz normal, es decir tal que M MT = MTM ,
vemos que la forma can´onica de Jordan es diagonal pero puede incluir valores propios complejos y matrices unitarias. Analiz´andolo por bloques, vemos que podemos construir una matriz sesquisim´etrica usando una matriz unitaria, su adjunta y una matriz diagonal de vectores propios conjugados, obteniendo el siguiente resultado:
Teorema 2.1.1. Sea M una matriz normal (i.e. MTM = M MT) con entradas reales
2 × 2 que no es sim´etrica. Entonces M tiene una descomposici´on en valores singulares de la forma M = a b −b a ! = Θ √ a2+ b2 0 0 √a2 + b2 ! ,
donde Θ denota una matriz ortogonal. Adem´as, su descomposici´on en bloques de Jordan (diagonal en este caso) est´a dada por
M = a b −b a ! = 1 √ 2 1 √ 2 i √ 2 − i √ 2 a + ib 0 0 a − ib ! 1 √ 2 − i √ 2 1 √ 2 i √ 2 .
Demostraci´on. La primera identidad se sigue al considerar Θ =
a √ a2+b2 b √ a2+b2 −b √ a2+b2 a √ a2+b2 ! y observar que sus columnas son ortonormales. La segunda se sigue directamente, al efectuar el producto matricial de las tres matrices al lado derecho. El hecho de que toda matriz normal 2 × 2 que no sea sim´etrica sea sesquisim´etrica es algo que se evidenciar´a en los cap´ıtulos siguientes.
La matriz sesquisim´etrica en cuesti´on es igual al producto de una matriz escalar y una matriz ortogonal y por esta via se puede establecer la conexi´on entre la forma can´onica de Jordan y la descomposici´on en valores singulares para matrices normales.
Observaci´on 2.1.1. Si M es una matriz normal 2 × 2 con entradas reales y determi-nante negativo, entonces es ortogonalmente diagonalizable, por lo tanto M es una matriz sim´etrica. Esto puede evidenciarse ya que un determinante negativo no puede corresponder con el producto de dos valores propios complejos conjugados.
Para poder ir m´as all´a vemos que nos falta abordar dos casos particulares m´as, para luego pensar en la forma de combinarlos y unificarlos. Nos falta resolver el problema en particular para una matriz ortogonalmente similar a un bloque de Jordan y por otra parte, tenemos que ocuparnos de las matrices cuyos espacios propios no son ortogonales entre s´ı. En ambas direcciones ya se ha logrado alg´un grado de progreso.
Ejemplo 2.1.1. Consideremos ahora el caso de matrices cuyos espacios propios no son ortogonales entre si. En particular, si M es una matriz de la forma:
M = sin θ cos θ
0 1
! .
Se puede comprobar que los valores propios de M son 1 y sin θ, mientras que sus vectores propios, (1, 0) y (cos θ, 1 − sin θ) no son ortogonales, salvo que θ sea π
2 ´o 3π
2 . En este caso, los valores singulares de M son σ = √1 ± cos θ, a su vez, los vectores propios de MTM que se utilizan en la descomposici´on en valores singulares, en este caso son de la forma v = (cos θ ∓ 1, − sin θ) que ya siendo ortogonales s´olo falta normalizarlos. As´ı, la descomposici´on en valores singulares corresponde a:
M = −1 √ 2 1 √ 2 1 √ 2 1 √ 2 √ 1 − cos θ 0 0 √1 + cos θ ! − sin θ p2(1 − cos θ) r 1 − cos θ 2 sin θ p2(1 + cos θ) r 1 + cos θ 2 .
Mientras, la descomposici´on en bloques de Jordan (diagonal en este caso) est´a dada por:
M = sin θ cos θ 0 1 ! = 1 cos θ 0 1 − sin θ ! sin θ 0 0 1 ! 1 cos θ sin θ − 1 0 1 1 − sin θ .
Esto podr´ıa contribuir a responder a la pregunta central de esta tesis, en particular, cuando los espacios propios no son ortogonales. En el caso de bloques de Jordan tenemos el siguiente resultado sobre sus valores singulares.
Teorema 2.1.2. Sea M = a 1 0 a
!
, entonces sus valores singulares est´an dados por
σ = s a2+1 2 ± r a2+1
4. A su vez, la base ortogonal de vectores propios de M
TM que
se emplea en la descomposici´on en valores singulares, en este caso viene dada por los vectores v = 1 2± r a2+ 1 4, −a !
Demostraci´on. Vemos que MTM = a
2 a
a a2+ 1 !
, de modo que los valores singula-res de M son justamente las ra´ıces cuadradas de las ra´ıces del polinomio caracter´ıstico
MTM − λI
= λ2−(2a2+1)λ+a4, lo cual permite verificar la primera parte del teorema. El resto se sigue al reemplazar los valores de λ y resolver el sistema homog´eneo asociado a la matriz MTM − λI.
En este caso es evidente que el vector propio y el vector propio generalizado son (1, 0) y (0, 1) respectivamente. Con base en esto se aspira llegar a entender c´omo relacionar la forma can´onica de Jordan con la descomposici´on en valores singulares en particular cuando la matriz M no es diagonalizable.
2.2.
Descomposiciones y par´
ametros fundamentales
en dimensi´
on dos
Si contemplamos la manera en que se obtiene la forma polar a partir de la descompo-sici´on en valores singulares, vemos cuan r´apido y sencillo resulta, y sin embargo, tal vez podamos percibir que hay algo que se pasa por alto. Esta vaga idea nos conducir´a a los par´ametros adecuados para empezar a entender la relaci´on entre la forma de Jordan y los valores singulares en R2.
Antes de entrar en materia, vamos a realizar un simple ejercicio de visualizaci´on, que ocurre en un contexto mucho m´as sencillo, pero que nos servir´a para ejemplificar la ma-nera en que hemos de abordar el problema de la tesis posteriormente. El ejercicio consiste en representar clases de equivalencia de objetos matem´aticos por medio de puntos en un espacio euclidiano de manera natural, para as´ı contemplarlos simult´aneamente, organiza-dos naturalmente en forma de una figura geom´etrica. En contextos m´as generales, estos objetos son conocidos como espacios modulares.
Un espacio modular es un espacio geom´etrico cuyos puntos representan objetos matem´ ati-cos o clases de equivalencia de dichos objetos. Si estamos interesados en estudiar ciertos objetos matem´aticos que corresponden con un espacio modular, al tener tal corresponden-cia podemos usar un sistema de coordenadas para describir dicho espacio y de esta manera parametrizar la clase de objetos que estamos estudiando. Los espacios modulares pueden considerarse como espacios de par´ametros a la vez que espacios de objetos matem´aticos.
Para ejemplificar la idea de forma elemental, las clases de equivalencia ser´an primero las de tri´angulos semejantes; y m´as adelante, sacaremos verdadero provecho de esta idea
al aplicarla a matrices similares, de ese modo contribuir´a ampliamente a la interpretaci´on de las respuestas que estamos buscando.
2.2.1.
Par´
ametros de semejanza y clasificaci´
on de tri´
angulos
se-mejantes
Podemos contemplar de forma simult´anea todas las clases de equivalencia de tri´ angu-los semejantes en el plano, representadas mediante puntos de una manera natural, para as´ı identificar una forma de ordenarlos espacialmente. Fijando dos puntos en el plano po-demos identificar cualquier otro punto del plano con la clase de equivalencia del tri´angulo que forman estos tres puntos. As´ı mismo queremos identificar ciertas regiones del plano que corresponden con cierto tipo de tri´angulos en particular, como los rect´angulos o los is´osceles.
Primero imaginemos dos ejes de coordenadas perpendiculares en el plano, identifique-mos uno de los ejes como aquel que se encuentra en posici´on horizontal, sobre dicho eje ubiquemos los dos puntos de referencia P1 y P2 sim´etricamente con respecto al otro eje,
vertical.
Figura 1.
Los puntos sobre el eje horizontal no corresponde con ning´un tri´angulo, ya que son colineales con los dos puntos escogidos. En el eje vertical se ubican los tri´angulos is´osceles,
pero estos tambi´en est´an presentes en las dos circunferencias que se hallan centradas en uno de los puntos escogidos Pi y que pasan por el otro. Los tri´angulos rect´angulos se
encuentran en las dos rectas paralelas al eje vertical que pasan por los puntos escogidos Pi pero de nuevo se hallan en la circunferencia centrada en el origen que pasa por ambos
puntos Pi (ver figura 1).
Es f´acil intuir que esta relaci´on no es inyectiva, hay varios puntos asociados a una misma clase de equivalencia. La pregunta que surge naturalmente es, c´omo restringir el plano para hallar un dominio donde est´en todas las clases de equivalencia sin repetici´on. Esto nos lleva a dividir el plano en doce regiones.
Lo primero que notamos es que unas clases se repiten m´as que otras. La que menos se repite es la del tri´angulo equil´atero, que s´olo corresponde con dos puntos, las intersec-ciones de las circunferencias asociadas a los tri´angulos is´osceles, y estan ubicados sobre el eje horizontal. Esta es la ´unica clase tan infrecuente. Todas las otras clases aparecen seis o doce veces representadas. Por la simetr´ıa del asunto, es f´acil ver que podemos restringir nuestro an´alisis un s´olo cuadrante.
En adelante, nos restringimos al primer cuadrante. Sobre el semieje vertical, debajo del punto asociado al tri´angulo equil´atero, se encuentran representados los tri´angulos is´osceles tales que el lado desigual es m´as grande, y por encima de este punto est´an representado los tri´angulos is´osceles donde el lado desigual es m´as peque˜no. An´alogamente, el segmento de la circunferencia centrada en el punto fijo P2, ubicado en el otro semiplano, representa
a los tri´angulos is´osceles donde el lado desigual es m´as peque˜no, y el segmento de la cir-cunferencia centrada en el punto fijo P1 represente a los tri´angulos is´osceles donde el lado
desigual es m´as grande.
La semirrecta que representa a los tri´angulos rect´angulos (ver figura 2) se intersecta con la circunferencia centrada en el punto fijo P1. Dicha intersecci´on corresponde con la clase
de tri´angulos que son rect´angulos e is´osceles a la vez. Si consideramos la semirrecta y descartamos los puntos que est´an arriba, o los que est´an abajo de dicho punto de intersec-ci´on, los puntos restantes ser´an suficientes para representar todas las clases de tri´angulos rect´angulos sin repetici´on. Estas mismas clases tambi´en est´an representadas todas sin re-petici´on en el segmento de la circunferencia centrada en el origen que corresponde con el primer cuadrante.
A partir de estas explicaciones resulta sencillo reconocer las doce regiones. Nos limita-remos obviamente a se˜nalar cuales son las tres que se encuentran en el primer cuadrante. La primera regi´on est´a limitada por los dos ejes y el segmento de la circunferencia centra-da en el otro semiplano (en P2). La segunda regi´on est´a limitada por los dos segmentos de
las circunferencias centradas en los puntos escogidos y por el eje horizontal. Y la tercera regi´on, que a diferencia de las dos primeras no es acotada, est´a limitada por los ejes y por el segmento de la circunferencia centrada en el propio semiplano (en P1).
En cada regi´on los tri´angulos rect´angulos est´an ubicados en la frontera entre los tri´angulos agudos y los tri´angulos obtusos (ver figura 2).
Para concluir esta secci´on, falta se˜nalar que las identificaciones que hemos hecho nos permiten definir biyecciones naturales entre las doce regiones del plano ya descritas. La identificaci´on de puntos ubicados en los distintos cuadrantes se logra reflejando el plano con respecto a los ejes. La identificaci´on de los puntos en un mismo cuadrante se obtiene cambiando el lado del tri´angulo que se encuentra sobre el eje horizontal y variando la escala de manera conveniente, puede que al final haya que reflejar para volver al mismo cuadrante.
2.2.2.
Descomposici´
on Fundamental para matrices en dimensi´
on
dos
En esta secci´on se har´a una propuesta frente a c´omo estudiar las matrices mediante par´ametros, de manera similar a c´omo procedimos en el ejemplo de la secci´on anterior, para as´ı poder determinar los par´ametros que definen la forma can´onica de Jordan de una matriz 2 × 2 a partir de sus valores singulares. Al considerar casos muy espec´ıficos, como en la secci´on 2.1, empleando en cada caso par´ametros diferentes, no parece ser evidente c´omo deducir el caso general de los particulares. Tambi´en fue inadecuado insistir en defi-nir los valores singulares a partir de los valores propios y no al rev´es, pues en el enfoque que se plantea a continuaci´on los valores singulares (sus ra´ıces en realidad) resultan ser
par´ametros mucho m´as apropiados.
A partir de la descomposici´on en valores singlares resulta evidente que:
Proposici´on 2.2.1. Toda matriz real 2 × 2 con determinante no negativo es ortogonal-mente similar a una matriz de la forma:
M = cos θ − sin θ sin θ cos θ ! σ1 0 0 σ2 ! = σ1cos θ −σ2sin θ σ1sin θ σ2cos θ ! .
donde σ1 y σ2 son los valores singulares de M .
Demostraci´on. La proposici´on se sigue directamente de la descomposici´on en valores singulares. Digamos que dicha descomposici´on para M corresponde a M = OΣ ˜O =
˜
OT( ˜OO)Σ ˜O, ya que M y Σ tienen determinante no negativo, es v´alido asumir que ( ˜OO) es una rotaci´on, demostrando as´ı la proposici´on.
Las clases de equivalencia que estudiaremos esta vez son, por lo tanto, las de matrices ortogonalmente similares, representadas en alg´un dominio por los par´ametros (σ1, σ2, θ).
M´as adelante resultar´a evidente la conveniencia de ajustar un poco los par´ametros, rem-plazando los valores singulares por sus ra´ıces cuadradas y permitir que tengan signo, positivo o negativo, esto nos permitir´a tambi´en considerar las matrices con determinante negativo. Lo cual nos conduce a la siguiente definici´on.
Definici´on 2.2.1. Sea M una matriz 2 × 2 con entradas reales. Entonces M puede des-componerse como: M = Φ cos θ − sin θ sin θ cos θ ! z1|z1| 0 0 z22 ! Φ−1,
donde Φ es una matriz ortogonal con determinante positivo. A esta expresi´on la llamamos descomposici´on fundamental de M . Llamamos valores fundamentales a los par´ametros zi ∈ R (donde zi2 = σi son los valores singulares de M ) y a θ lo llamamos ´angulo
fundamental. Estos tres son los par´ametros fundamentales y pertenecen al dominio:
D = {(z1, z2, θ) | z2 ≥ |z1| , θ ∈ (−π, π]},
el cual recibir´a el nombre de dominio fundamental. Si no exigimos Det(Φ) = 1, el ´angulo fundamental no estar´ıa bien definido, pero no por mucho, s´olo habr´ıa que remplazar θ 7→ −θ en caso de que Det(Φ) = −1.
Proposici´on 2.2.2. Las matrices reales 2 × 2 que son ortogonalmente similares poseen los mismos parametros fundamentales, salvo tal vez por el signo del ´angulo fundamental
Para establecer relaciones entre la descomposici´on fundamental y los valores propios, procedemos en primera instancia calculando los valores propios de una matriz en t´ ermi-nos de los par´ametros (σ1, σ2, θ), posteriormente justificaremos la escogencia de los otros
par´ametros y del dominio. Es clave resaltar que las caracter´ısticas geom´etricas de una transformaci´on lineal en las que estamos interesados, tales como los valores propios, los valores singulares y la correspondencia entre las bases relacionadas, son invariantes para transformaciones ortogonalmente similares, al igual que las relaciones entre ellas, ya que este tipo de conjugaci´on es simplemente relativa a la escogencia de los ejes de coordenadas (dado que sean perpendiculares y con una escala fija). La expresi´on que obtenemos para los valores propios no est´a restringida a casos particulares:
|M − λI| = λ2− (σ 1+ σ2)cosθλ + σ1σ2 ⇒ λ = 1 2 h (σ1+ σ2)cosθ ± p (σ1+ σ2)2cos2θ − 4σ1σ2 i .
Esta f´ormula, que acabamos de demostrar, puede reescribirse en t´erminos de los par´ ame-tros fundamentales:
Teorema 2.2.1. Los valores propios de una matriz real M de tama˜no 2 × 2 pueden obtenerse a partir de los par´ametros fundamentales mediante la f´ormula:
λ = 1 2 (z1|z1| + z22) cos θ ± q (z1|z1| + z22)2cos2θ − 4z1|z1| z22 .
M´as importante a´un que esta f´ormula es la interpretaci´on que le demos. Para in-terpretarla aplicaremos precisamente el m´etodo que empleamos anteriormente con las clases de tri´angulos semejantes. Es posible identificar de inmediato las regiones del espa-cio (σ1, σ2, θ) que corresponden con ciertos tipos de matrices, por ejemplo las matrices
singulares corresponden con las superficies σ1 = 0 y σ2 = 0.
Corolario 2.2.1. En el espacio (σ1, σ2, θ) las matrices sim´etricas corresponden con las
superficies θ = nπ con n ∈ Z y con la superficie σ1 = −σ2, mientras las dem´as matrices
normales est´an representadas en la superficie σ1 = σ2. Las matrices antisim´etricas
corres-ponden con las rectas z1 = z2 cuando θ = (n +
1
2)π con n ∈ Z. Las matrices ortogonales se identifican con las rectas σ1 = ±σ2 = ±1 y las matrices escalares se encuentran en las
rectas σ1 = σ2 para θ = nπ con n ∈ Z. Observe que cuando σ1 = σ2 = σ la f´ormula para
los valores propios se convierte en λ = σ cos θ ± iσ sin θ.
Menos evidente pero m´as reveladora, es la ubicaci´on de las matrices tipo Jordan, que podemos hallar mediante el discriminante del valor propio (σ1 + σ2)2cos2θ − 4σ1σ2 (lo
llamo as´ı pues aparece como el discriminante del polinomio |M − λI|). De hecho, si el discriminante es positivo la matriz se diagonaliza en los reales, si es negativo s´olo puede ser diagonalizada en los complejos, pero si el discriminante es cero no se diagonaliza y es
semejante a un bloque de Jordan. El siguiente corolario justifica la escogencia de nuevos par´ametros.
Corolario 2.2.2. Dentro del dominio fundamental, para un valor fijo del par´ametro θ, las matrices tipo Jordan corresponden con rectas en el plano (z1, z2). De este modo, las
matrices tipo Jordan corresponden con una superficie reglada dentro del dominio funda-mental.
Demostraci´on. Primero evidenciemos cual es el rol del discriminante del valor propio, si el discriminante es cero los dos valores propios son iguales a 1
2(σ1+ σ2) cos θ, y por lo tanto, si la matriz no es escalar no puede diagonalizarce, pues si fuera diagonal ser´ıa escalar e invariante por conjugaci´on. Por lo tanto, en este caso, las matrices tipo Jordan pueden ser vistas como la frontera entre las matrices de valores propios reales y las de valores propios complejos. Es crucial determinar bien esta frontera:
λ1 = λ2 → (σ1+ σ2)2cos2θ = 4σ1σ2 → cos θ = ±
2√σ1σ2
σ1+ σ2
,
sea σ1 = z12, σ2 = z22, z1 = r cos α y z2 = r sin α, entonces:
cos θ = ± 2z1z2 z2 1 + z22 = ± sin 2α → α = 1 2sin −1 (± cos θ) = 1 2 hπ 2 ± θ i .
Al cambiar de dominio podemos incluir los semiejes negativos, lo cual no era posible al trabajar con valores singulares. Gracias a esto no estamos limitados a considerar matrices con determinante no negativo ´unicamente.
Figura 3.
fun-donde est´en representadas todas las clases de matrices de forma inyectiva, tanto como sea posible, pues hay siertas singularidades, por ejemplo cuando z1 = z2 = 0 el ´angulo
fundamental se hace irrelebante.
Primero, respecto a z1 y z2, hay que notar que intercambiar los valores singulares
co-rresponde con cierto tipo de conjugaci´on ortogonal (intercambiar los ejes invirtiendo uno de ellos), por lo tanto s´olo nos vamos a interesar en el semiplano z2 ≥ z1. Adem´as
mul-tiplicar una matriz por menos uno es equivalente a remplazar θ 7→ θ + π, es este caso podr´ıamos restringir el par´ametro θ al dominio [0, π), pero en cambio preferimos restringir m´as zi mediante |z1| ≤ z2 y tomar θ ∈ (−π, π].
Por supuesto que hay muchas otras formas de definir este dominio que funcionan igual de bien. Escogimos este por consideraciones e interpretaciones de tipo geom´etrico que se dar´an a conocer al momento de emplear un cuarto par´ametro φ para identificar las distintas matrices que se producen por conjugaci´on dentro de cada clase de equivalencia.
Note que al restringir θ = 0, toda pareja (z1, z2) en el dominio fundamental
correspon-de con una matriz que se diagonaliza con valores propios reales, iguales a zi|zi|. Mientras
que cuando restringimos θ = π
2, por el contrario, s´olo es posible diagonalizar con reales en los casos donde z1 < 0, ya que en otro caso λ = ±iz1z2, a su vez, en este caso las matrices
tipo Jordan se halla sobre el eje z1 = 0 y corresponden con todas las matrices nilpotentes.
Debido a la simetr´ıa del coseno al cuadrado, lo que ocurre con el discriminante de los valores propios entre θ = π
2 y θ = π, es un reflejo de lo que ocurre entre θ = 0 y θ = π 2. Por ´ultimo, vemos que si z1 < 0, el discriminante del valor propio es siempre positivo
y por lo tanto en R2 toda matriz con determinante negativo se puede diagonalizar con
reales, lo que es consistente con el hecho de que, en R2, una inversi´on compuesta con una
rotaci´on produce otra inversi´on.
Observaci´on 2.2.1. Toda matriz 2 × 2 de entradas reales con determinante negativo se puede diagonalizar con reales.
Ya viene siendo hora de decir alguna cosa sobre los vectores propios; antes podr´ıamos comentar algo sobre la tentaci´on de cambiar de orden la matriz diagonal y la matriz de rotaci´on (fundamental) que aparecen en la descomposici´on fundamental.
Sin duda poner la matriz diagonal a la derecha es algo arbitrario, pero no demasiado, ya que las clases de equivalencia quedan definidas exactamente igual, pues pasar la ma-triz de rotaci´on fundamental de un lado al otro es algo que puede lograrse mediante conjugaci´on, sencillamente tomando Φ igual a la matriz inversa de la matriz de rotaci´on.
Otra forma de cambiar el orden de las matrices es trasponer, pero el ´angulo fundamental tambi´en cambia al hacer esto, basta multiplicarlo por menos uno, siempre que esto no nos deje fuera del dominio fundamental, como cuando θ = π o si escogi´eramos otro dominio.
Aqu´ı se evidencia lo favorable de trabajar en el dominio θ ∈ (−π, π), donde basta mul-tiplicar θ por menos uno y adherir, multiplicada por la derecha, la matriz de rotaci´on fundamental a la matriz de conjugaci´on Φ a la hora de transponer. En particular, cuando el ´angulo fundamental es igual a cero o a π, este no cambia al transponer, tampoco es necesario cambiar la matriz Φ de conjugaci´on, es decir, ning´un par´ametro cambia.
Si en lugar de trasponer quisi´eramos invertir una matriz, lo que ocurre con los par´ametros fundamentales y con Φ es casi lo mismo, la ´unica diferencia es que hay que cambiar los valores fundamentales por sus inversos multiplicativos. Lo ´unico que resta decir en esta l´ınea de pensamiento es que al multiplicar una matriz por su transpuesta lo que ocurre es que el ´angulo fundamental se vuelve cero, los valores fundamentales quedan elevados al cuadrado y la matriz Φ de conjugaci´on, dependiendo del orden del los factores, o bien permanece id´entica, o se le adhiere, multiplicada por derecha, la matriz de rotaci´on fun-damental.
Ahora s´ı, hablemos de los vectores propios. Tambi´en para estos tenemos f´ormulas explicitas a partir de los par´ametros fundamentales, pero conviene verlas primero en t´erminos de los valores singulares asumiendo que la matriz tiene determinante positivo, pues lucen mejor as´ı. En realidad aparecen dos formulas, ya que para hallar una soluci´on del sistema homog´eneo asociado a la matriz singular M − λI podemos considerar el vector dado por una de las dos filas de la matriz en cuesti´on, cambiar el orden de las coordenadas y multiplicar una de ellas por menos uno para obtener un vector perpendicular es decir, que pertenece al n´ucleo de M − λI, por ello hay dos formulas, una asociada a cada fila de la matriz M − λI; una de estas f´ormulas es (las coordenadas de los vectores propios en esta secci´on corresponden siempre con la base ortonormal dada por las columnas de Φ):
~ v = σ2sin θ, σ1− σ2 2 cos θ ∓ 1 2 p (σ1 + σ2)2cos2θ − 4σ2σ2 .
El hecho de que aparezca el seno del ´angulo fundamental, nos muestra que no en vano incluimos los valores θ ∈ (−π, 0) en el dominio fundamental, a´un cuando los valores propios, que s´olo dependen del coseno, tengan en este sentido un comportamiento sim´etrico al rededor del cero. Ahora veamos como luce esta f´ormula en t´erminos de los par´ametros fundamentales:
de los par´ametros fundamentales mediante la f´ormula: ~ v = z22sin θ,z1|z1| − z 2 2 2 cos θ ∓ 1 2 q (z1|z1| + z22)2cos2θ − 4z1|z1| z22 .
Para ilustrar en forma breve este aspecto, por el momento, no se har´a un an´alisis muy detallado de estas f´ormulas y nos limitaremos a se˜nalar unos pocos casos particulares.
Observe que cuando z1 = 0:
~ v = z22sin θ,−z 2 2 ∓ z22 2 cos θ . A su vez θ = π 2 implica: ~v = z22, ∓ q −z1|z1| z22 . Y si z1 = z2 = z tenemos:
~v =z2sin θ, ∓iz2sin θ .
En el caso de las matrices tipo Jordan el discriminante del valor propio es cero y por lo tanto, podemos trabajar directamente con los valores singulares, dado que z1 ≥ 0:
~v = σ2sin θ, σ1− σ2 2 cos θ .
En breve realizaremos los c´alculos para hallar el vector propio generalizado. Otro caso particular que es f´acil de observar es θ = 0. En general, estos ejemplos nos est´an sugiriendo algo, como se menciono antes existe otra f´ormula, la cual debemos usar cuando con la primera obtenemos vectores nulos o paralelos. La segunda f´ormula es:
~v = z1|z1| − z 2 2 2 cos θ ± 1 2 q (z1|z1| + z22)2cos2θ − 4z1|z1| z22, z1|z1| sin θ .
Ahora, para hallar el vector propio generalizado en t´erminos de los par´ametros funda-mentales, de forma general para todas las matrices tipo Jordan, tenemos que resolver el sistema:
(M − λI) ~w = ~v. Esto nos conduce al siguiente corolario:
Corolario 2.2.3. Es posible asociar a todas las matrices tipo Jordan en el dominio fun-damental un mismo vector propio generalizado ~w = h0, −1i.
Demostraci´on. Asumiendo que el discriminante del valor propio es igual a cero, que ~v es un vector propio, λ el valor propio, que σ1 6= σ2 y que M viene dada en t´erminos de sus
valores fundamentales. Seg´un las f´ormulas que hemos obtenido, este sistema corresponde a: σ1− σ2 2 cos θ −σ2sin θ σ1sin θ σ2− σ1 2 cos θ x y ! = σ2sin θ σ1− σ2 2 sin θ ,
donde ~w = hx, yi. Es posible verificar que la matriz en efecto es singular y que el sistema es consistente como se supone que sea. Este sistema se reduce a:
σ1− σ2
2 cos θ
x + (−σ2sin θ)y = σ2sin θ.
Y en conclusi´on, ~w = h0, −1i es el vector propio generalizado, curiosamente resulta sien-do el mismo para todas las matrices tipo Jordan en el escenario de la descomposici´on fundamental.
En la primera etapa de la investigaci´on, obtuvimos f´ormulas sencillas para los valores singulares y los vectores asociados, a partir del valor propio en el caso particular de los bloques de Jordan (Teorema 2.1.2). Como las nuevas f´ormulas describen los valores y vectores propios a partir de los par´ametros fundamentales, en el caso de las matrices tipo Jordan, podr´ıa ser interesante comparar las f´ormulas de esta secci´on con las que obtuvimos en la etapa cero, pues de alg´un modo son inversas entre s´ı.
Corolario 2.2.4. Tambi´en podemos calcular f´acilmente la traza y el determinante de una matriz M ∈ M2×2(R) a partir de los par´ametros fundamentales, mediante las f´ormulas
tr(M ) = (z1|z1| + z22) cos θ y det(M ) = z1|z1| z22.
Las f´ormulas que dan los vectores y los valores propios en t´erminos de los par´ ame-tros fundamentales, tan estrechamente ligados a la descomposici´on en valores singulares, pueden ser consideradas como una respuesta satisfactoria a la pregunta de esta tesis para matrices 2 × 2.
2.2.3.
Dominio fundamental expandido
Ahora nos damos a la tarea de hallar un cuarto par´ametro para distinguir todas las matrices y no s´olo las clases de equivalencia, y as´ı expandir el dominio fundamental. Co-mo antes, voy a ejemplificar la idea de incluir nuevos par´ametros con el ejemplo de los tri´angulos. Teniendo representadas todas las clases de equivalencia de tri´angulos semejan-tes en una regi´on dada, de forma ´unica como se plante´o; para describir ahora todos los tri´angulos, nos preguntamos cu´antos par´ametros nos faltan y como definirlos de manera natural.
coor-necesitan dos coordenadas para describir al punto que representa la clase de equivalen-cia del tri´angulo en la regi´on dada, significa que nos faltan cuatro par´ametros m´as para determinar un tri´angulo en particular, hay una forma muy natural de escoger los nuevos par´ametros.
El primero ser´a un par´ametro de escala, y se emplea para definir una homotecia que reescale el tri´angulo representante de la clase de equivalencia al tama˜no que corresponda, este primer par´ametro podr´ıa ser negativo, por convenci´on, si fuera necesario invertir el tri´angulo; una mejor opci´on es pedir que el par´ametro de escala sea estrictamente posi-tivo e incluir en la regi´on de clases equivalentes una contraparte sim´etrica. El segundo par´ametro ser´ıa un ´angulo, para rotar el tri´angulo hasta la posici´on adecuada y los ´ ulti-mos dos par´ametros, las coordenadas de un v´ertice del tri´angulo para trasladarlo hasta la ubicaci´on correcta.
Del mismo modo, en el caso de las matrices, que poseen cuatro coordenadas, como ya estamos trabajando con tres par´ametros fundamentales, s´olo nos falta incluir uno, as´ı que de hecho esta parte es m´as f´acil que con los tri´angulos.
Lema 2.2.1. Si el ´angulo fundamental es cero, las siguientes cuatro matrices Φ producen exactamente el mismo efecto al conjugar:
cos φ − sin φ sin φ cos φ ! , cos φ sin φ sin φ − cos φ ! , − cos φ − sin φ − sin φ cos φ ! , − cos φ sin φ − sin φ − cos φ ! .
Si el ´angulo fundamental no es cero, las dos matrices de determinante negativo s´olo le cambian el signo.
Demostraci´on. Estas cuatro matrices pueden obtenerse unas a partir de las otras mul-tiplic´andoles a la derecha matrices diagonales y ortogonales (es decir con unos y menos unos en la diagonal), las cuales son sus propias inversas y conmutan con cualquier otra matriz diagonal, en particular, con la matriz diagonal de la descomposici´on fundamental. Si el ´angulo fundamental no es cero y Φ tiene determinante negativo, es necesario multi-plicar el ´angulo fundamental por menos uno si queremos conmutar la matriz de rotaci´on fundamental con alguna matriz diagonal y ortogonal con determinante negativo.
Como ya dijimos que Φ debe tener determinante positivo, escojemos trabajar siempre con la primera matriz, y de gratis tenemos el dominio del nuevo par´ametro φ ∈ [0, π). Esto significa que en la descomposici´on fundamental, el ´unico factor que podr´ıa realizar una inversi´on del espacio, es la matriz diagonal, dependiendo del signo del primer par´ametro fundamental.
Como los elementos en la regi´on z1 = z2 del dominio fundamental, son los ´unicos
in-variantes ante este tipo de conjugaciones (ortogonales), tiene perfecto sentido geom´etrico colapsar el eje θ en el dominio fundamental e imaginar que el cuadrante |z1| ≤ z2 gira en
torno a la semirrecta z1 = z2 al variar el nuevo par´ametro φ, hasta caer en el cuadrante
opuesto, al pasar de φ = 0 a φ = π
2. Lo anterior es consistente con el hecho de que la conjugaci´on que corresponde al ´angulo φ = π
2, equivale a intercambiar los valores funda-mentales.
Mientras intercambiar los valores fundamentales es equivalente a reflejar sobre la semirrec-ta z1 = z2, multiplicarlos ambos por menos uno en principio significa rotar un ´angulo π,
pero debido a la identificaci´on de los dos semiplanos mediante φ, al ignorar este par´ametro vemos que multiplicar por menos uno a la larga puede entenderse como reflejar sobre la semirrecta z1 = −z2, desde el punto de vista de las clases de equivalencia. Lo anterior nos
lleva a contemplar un hecho muy intrigante.
En general, y a´un cuando colapsamos el eje θ, la conjugaci´on deja quietos a los ele-mentos en las clases donde z1 = z2. Si en cambio ignoramos el par´ametro φ y variamos θ
(desde cero), podemos imaginarnos que estamos rotando el cuadrante |z1| ≤ z2 sobre la
semirrecta z1 = −z2 (cuando llegamos a π el cuadrante se halla reflejado en el cuadrante
opuesto), pues las clases en dicha semirrecta no est´an cambiando al variar θ, ya que no dependen de θ, los elementos dentro de las clases sin embargo, si se est´an reordenando entre tanto, a diferencia del caso anterior, como lo ilustra el siguiente lema.
Lema 2.2.2. Para las matrices cuyos valores fundamentales satisfacen z1 = −z2, la acci´on
de θ puede ser sustituida plenamente por la acci´on de φ (y viceversa), de la siguiente forma: cos θ − sin θ sin θ cos θ ! −σ 0 0 σ ! = Φ −σ 0 0 σ ! Φ−1, donde φ = θ 2 y Φ = cos θ 2 − sin θ 2 sin θ 2 cos θ 2 .
Demostraci´on. Para conmutar el producto de la matriz diagonal con la matriz Φ−1, que est´a a la derecha de la igualdad, el menos de la matriz diagonal que est´a a la izquierda actu´a sobre la primera fila de Φ−1, pero para pasar la matriz diagonal a la derecha el menos debe extraerse de la primera columna de Φ−1, por las propiedades de simetr´ıa y antisimetr´ıa del coseno y del seno, esto es equivalente a invertir la matriz Φ−1 al momento
En este sentido, notamos que las clases de equivalencia en el dominio fundamental no siempre est´an representadas de manera ´unica.
Seg´un lo que hemos visto, existen muchas posibilidades para definir el domino fun-damental expandido, restringiendo en mayor o menor medida los ´angulos y en forma contraria los valores fundamentales. Por ejemplo podemos restringir al m´aximo los ´ angu-los y no restringir angu-los valores fundamentales en lo absoluto, as´ı el dominio fundamental expandido ser´ıa: ˜ E = {(z1, z2, θ, φ) | θ ∈ h −π 2, π 2 , φ ∈h0,π 2 , (z1, z2) ∈ R2}.
En cambio, resulta conveniente definir el dominio fundamental expandido restringiendo al m´aximo los valores fundamentales, al restringir los ´angulos lo menos posible:
E = {(z1, z2, θ, φ) | θ ∈ (−π, π] , φ ∈ [0, π) , |z1| ≤ z2}.
El segundo dominio parece m´as apropiado para ser interpretado geometricamente.
Para tratar de entender la geometr´ıa del dominio fundamental expandido empezamos considerando el cuadrante |z1| ≤ z2 del plano θ = φ = 0, imaginemos entonces que al
variar φ desde cero hasta π estamos rotando dicho cuadrante al rededor de la semirrecta z1 = z2 hasta que regresa a su sitio, as´ı describe una figura Ω que corresponde con la
mitad de R3 limitada por el plano z1 = −z2 donde θ = 0.
Ahora consideremos esta figura Ω como la mitad de un subespacio tridimensional in-merso en R4, la acci´on de θ puede verse entonces como una doble rotaci´on, que deja invariante el plano {z1 = −z2} ⊂ Ω mientras lo rota un ´angulo −θ; entre tanto Ω hace un
barrido dentro de la cuarta dimensi´on, de modo que cuando θ = π, Ω se ha convertido en el medio subespacio opuesto (la mitad opuesta de Ω).
Esto luce un poco como las coordenadas esf´ericas en el espacio tridimensional, pero al fijar los ´angulos, en lugar de obtener semirrectas obtenemos cuadrantes, por lo cual esta-mos parametrizando a R4 y no a R3. Esta interpretaci´on sobre la geometr´ıa del dominio
est´a contenida en el siguiente teorema.
Teorema 2.2.3. El dominio fundamental expandido:
E = {(z1, z2, θ, φ) | θ ∈ (−π, π] , φ ∈ [0, π) , |z1| ≤ z2},
puede identificarse con una parametrizaci´on de R4, donde la acci´on de φ fija el plano
{z1 = z2} ⊂ E mientras hace invariante al plano {z1 = −z2} ⊂ E. La acci´on de θ
Demostraci´on. Es f´acil notar que las matrices cuyos valores fundamentales son iguales, son invariantes por conjugaci´on, de modo que φ fija el plano {z1 = z2} ⊂ E. Aplicando
el lema 2.2.2 vemos a la vez que φ y θ hacen invariante al plano {z1 = −z2} ⊂ E. Por
´
ultimo, como φ fija el plano {z1 = z2} ⊂ E, los ´unicos grados de libertad que quedan son
z1 y θ, de modo que la acci´on de θ tambi´en hace invariante a este plano.
El nuevo par´ametro podr´ıa llamarse ´angulo de conjugaci´on o ´angulo de base, ya que es el ´unico que depende por completo de la escogencia de los ejes de coordenadas (con la condici´on de que sean perpendiculares entre si y con una escala fija) y en este sentido es relativo al punto de vista del observador. Queda sin embargo mucho por interpretar, para entender mejor la geometr´ıa de este dominio fundamental expandido.
2.3.
Descomposici´
on Fundamental para matrices en
dimensi´
on tres
Es f´acil darse cuenta que el m´etodo que usamos para responder la pregunta en R2 no
puede generalizarse demasiado, ya que los polinomios de grado cinco o mayor no pueden resolverse por radicales (ver [5, secci´on 56, capitulo 10]) y esto implica que, en dimen-siones superiores, n´unca vamos a tener f´ormulas expl´ıcitas para factorizar el polinomio caracter´ıstico. Puede ser que logremos definir el dominio fundamental, pero en general, resultar´a imposible dar f´ormulas para los valores propios directamente a partir de los par´ametros fundamentales.
Este rev´es en la investigaci´on puede verse de forma contraria como una gran esperan-za, si le damos la vuelta al problema y encontramos otro camino para resolver nuestras inquietudes de ´ındole geom´etrico, tal vez podamos a la larga deducir algo sobre la fac-torizaci´on del polinomio asociado. Y pese a que no podamos ir mucho m´as all´a por este rumbo, a´un existe la esperanza de que podamos trabajar con la descomposici´on funda-mental y usarla directamente para revelar la relaci´on que existe entre la forma can´onica de Jordan y la descomposici´on en valores singulares, al menos en R3, generalizando un
poco lo que hicimos en R2.
Algo que podemos y debemos calcular de forma general, para cualquier dimensi´on, es el n´umero de valores y ´angulos fundamentales. Es claro que una matriz n × n debe tener n valores fundamentales, uno por cada valor singular. La matriz depende de n2 par´ametros, y ya tenemos n; de los n(n − 1) par´ametros restantes s´olo la mitad corresponde con la rotaci´on fundamental, pues la otra mitad son para definir la matriz de conjugaci´on.
Una posible forma de definir la matriz de rotaci´on fundamental en R3 a partir de tres
par´ametros ser´ıa:
Θ = cos θ − sin θ 0 sin θ cos θ 0 0 0 1 cos φ 0 − sin φ 0 1 0 sin φ 0 cos φ 1 0 0 0 cos ψ − sin ψ 0 sin ψ cos ψ ,
el dominio fundamental podr´ıa estar dado por |z1| ≤ z2 ≤ z3y tres ´angulos fundamentales
(θ, φ, ψ), dos de ellos en el intervalo (−π, π], y uno en el intervalo −π 2,
π 2 i
.
Otra opci´on es definir un ´unico ´angulo fundamental y utilizar dos par´ametros adi-cionales para determinar el eje de la rotaci´on. Esta idea tiene perfecto sentido, pues los polinomios reales de grado tres tienen siempre una ra´ız real, si se trata del polinomio caracter´ıstico de una matriz tres por tres de determinante positivo, tenemos que una de sus ra´ıces tiene que ser uno y el espacio propio asociado ser´ıa entonces el eje de rotaci´on fundamental.
Se espera poder obtener con la f´ormula c´ubica, f´ormulas para responder de manera expl´ıcita a la pregunta de esta tesis en R3, sin embargo, resulta pertinente hacer a un lado
este aspecto de la investigaci´on para introducir y dar prioridad a un enfoque m´as general, el cual nos conduce a una respuesta que, a cambio de ser muy general, no es para nada expl´ıcita.
2.4.
Descomposici´
on Fundamental para matrices en
dimensi´
on n
Podemos definir la descomposici´on fundamental para una matriz real M de tama˜no n × n mediante la f´ormula:
M = ΦΘΣΦT,
donde Φ y Θ son matrices ortogonales con determinante positivo y Σ es la matriz diagonal:
Σ = z1|z1| 0 0 ... 0 0 z2 2 0 ... 0 0 0 z2 3 ... 0 .. . ... ... ... ... 0 0 0 ... z2 n ,
definiendo los valores fundamentales zi a partir de los valores singulares σi mediante
z2
Un toro maximal en un grupo de Lie compacto es un subgrupo de Lie conexo, com-pacto y abeliano maximal (ver [3, p´agina 152]). En el caso de las matrices ortogonales de dimensi´on par, el toro maximal corresponde (o es isomorfo) con las matrices de la forma:
Rθ1 0 0 ... 0 0 Rθ2 0 ... 0 0 0 Rθ3 ... 0 .. . ... ... ... ... 0 0 0 ... Rθn , donde Rθi = cos θi − sin θi sin θi cos θi ! .
En el caso de las matrices ortogonales de dimensi´on impar, las matrices del toro maximal son pr´acticamente iguales:
Rθ1 0 0 ... 0 0 0 Rθ2 0 ... 0 0 0 0 Rθ3 ... 0 0 .. . ... ... ... ... ... 0 0 0 ... Rθn 0 0 0 0 ... 0 1 .
No es dif´ıcil notar que toda matriz ortogonal con determinante positivo es ortogonalmente similar a una matriz del toro maximal, ´unica si ordenamos los ´angulos de menor a mayor. De este modo podemos definir n/2 ´angulos fundamentales en el caso par y (n − 1)/2 en el caso impar. Como sabemos que Θ depende de n(n − 1)/2 par´ametros, los par´ametros restantes, servir´an para definir un espacio invariante de dimensi´on n − 2 asociado a cada ´
angulo fundamental.
No obstante, a continuaci´on se presenta un enfoque donde no ser´a necesario definir la matriz de rotaci´on fundamental expl´ıcitamente a partir de par´ametros. Lo primero que haremos, es volver a darle un vistazo a los resultados expl´ıcitos que obtuvimos en R2 y profundizar a´un m´as en el an´alisis.
Ejemplo 2.4.1. Consideremos las descomposiciones fundamentales asociada a la matriz diagonal:
Σ = 1 0 0 σ
! .
dimen-n × dimen-n reales sobre el espacio proyectivo Pn(R). Supongamos adem´as que σ > 1.
Considere-mos el subespacio unidimensional definido a partir de un par´ametro t ∈ R y un par´ametro fijo α > σ como hαt, ti (es decir, conformado por los puntos hx, yi) = hαt, ti.
En este caso estamos suponiendo que z1 = 1. El caso general se reduce a este
median-te σ = σ2 z1|z1|
, cambiando proporcionalmente la escala de los valores propios y singulares pero no las caracter´ısticas geom´etricas de los espacios propios en el escenario de la des-composici´on fundamental.
Lema 2.4.1. En el ejemplo anterior, el ´angulo entre las rectas hαt, ti y hαt, σti coincide con el ´angulo entre hσt, αti y ht, αti, pues cada pareja es el reflejo de la otra sobre la recta ht, ti. Esto a su vez implica que la acci´on inducida por Σ preserva el ´angulo entre hαt, ti y hσt, αti, pues es igual al ´angulo entre sus im´agenes hαt, σti y ht, αti.
Demostraci´on. Al aplicar la acci´on inducida por Σ a la recta hαt, ti, esta se convierte en hαt, σti, si reflejamos esta imagen sobre la recta parametrizada por ht, ti obtenemos la recta hσt, αti. Si ahora aplicamos la acci´on inducida por Σ a la recta hσt, αti obtenemos la recta ht, αti y si la reflejamos sobre la recta ht, ti volvemos a obtener el subespacio original hαt, ti.
Figura 4.
Esto revela claramente la naturaleza de la correspondencia que existe entre la descom-posici´on en valores singulares y la forma can´onica de Jordan a un nivel muy general.
Teorema 2.4.1. Para cada matriz Σ, diagonal no singular de tama˜no n×n, consideremos todas la tuplas maximales de subespacios unidimensionales, linealmente independientes, tales que los ´angulos entre ellos permanezcan invariantes mediante la acci´on inducida por Σ, si la tupla tiene n elementos, la acci´on inducida debe preservar tambi´en la orientaci´on de cualquier base asociada a la tupla.
Para cada una de estas tuplas, existe al menos una rotaci´on fundamental Θ que lleva a las im´agenes mediante Σ de estos espacios de regreso a sus preim´agenes, convirti´endolos, mediante la descomposici´on fundamental, en espacios propios. El n´umero de rotaciones fundamentales asociadas a una tupla es finito cuando esta tiene al menos n − 1 elementos. Adem´as todas las tuplas con menos de n elementos corresponden, mediante la descompo-sici´on fundamental, con matrices que no se pueden diagonalizar, ya que tienen asocia-dos bloques de Jordan no triviales. Por otra parte, las rotaciones fundamentales que no corresponden de manera precisa con alguna tupla, definen matrices con valores propios complejos, mediante la descomposici´on fundamental.
Demostraci´on. Buena o mala, una caracter´ıstica de este teorema es que no hay mucho que probar, pues el enunciado es bastante auto explicativo. Evidentemente, si Σ preserva los ´angulos entre ciertos subespacios (y la orientaci´on), es posible rotarlos de vuelta a su lugar y sin duda esto los convierte en espacios propios.
Ahora consideremos una tupla con n−1 elementos. Sea Ω el subespacio de dimensi´on n−1 que contiene a todos los elementos de la tupla, y sea Γ el subespacio de dimensi´on n − 1 que contiene a todas las im´agenes mediante Σ de los elementos de la tupla. Cualquier ro-taci´on fundamental asociada a dicha tupla tiene que mandar a Γ en Ω a la vez que lleva las im´agenes mediante Σ de los elementos de la tupla de regreso a sus preim´agenes, por ello, si los signos de los valores propios estuvieran predeterminados (por ejemplo si tuvieran que ser todo positivos) no podr´ıa existir m´as de una rotaci´on fundamental correspondien-te. En efecto, supongamos que los signos de los valores propios est´an predeterminados, consideremos una base ortonormal para Γ e incluyamos, de ´ultimo, un elemento m´as para convertirla en una base ortonormal de todo el espacio.
En tal caso, como la matriz de rotaci´on fundamental siempre tiene determinante positivo, la acci´on inducida por esta matriz no cambia la orientaci´on de la base, y las im´agenes de los primeros n − 1 elementos de la base ya est´an determinadas por asumir que los signos de los valores propios est´an predeterminados. El ´ultimo elemento de la baso tiene que tener una imagen perpendicular a todas las dem´as, de magnitud uno y que preserve la orientaci´on de la base, lo que nos deja con una ´unica posibilidad. Por lo tanto, en este caso, s´olo puede existir una rotaci´on fundamental Θ0. En general s´olo existen un n´umero
Por ´ultimo, como las tuplas son maximales, aquellas que tienen menos de n elemen-tos corresponden con casos degenerados, donde dos o m´as de los elementos de la tupla se encuentran colapsados, lo que da lugar a los bloques de Jordan. Si en cambio consideramos una matriz de rotaci´on fundamental que no corresponde de manera precisa con ninguna tupla, no ser´a posible hallar una base de vectores propios reales, para diagonalizar la matriz correspondiente mediante la descomposici´on fundamental, sin usar complejos.
Este teorema responde a la pregunta de la tesis de manera muy general, pero nada explicita. El teorema muestra que el problema en cuesti´on se reduce a identificar las tuplas asociadas a una matriz diagonal dada, lo cual pudimos hacer en R2 sin darnos ni cuenta,
pero en R3 este problema es mucho m´as complicado.
Algunos casos particulares en R3, sin embargo, pueden reducirse al caso de R2, esto ocurre cuando el eje de la rotaci´on fundamental coincide con uno de los ejes coordenados, pues dicho eje es invariante mediante la rotaci´on y la acci´on de la matriz diagonal Σ, definiendo un espacio propio, mientras que lo que ocurre en el complemento ortogonal de dicho eje, el cual tambi´en es invariante bajo la rotaci´on y la acci´on de Σ, luce exactamente como el caso que ya resolvimos expl´ıcitamente en R2. Esto nos permite identificar una
gran cantidad de tuplas en R3 con la caracter´ıstica de que un elemento es perpendicular
a los otros dos.
Consideremos ahora otros casos particulares de R3 que podemos entender desde R2.
Retomemos el ejemplo que dio pie al lema. Anteriormente asumimos α > σ y vimos que ten´ıamos un par de elementos distintos del espacio proyectivo asociados a este valor α, y hay otro par de elementos, las im´agenes del par anterior mediante Σ, donde el ´angulo entre las rectas se preserva. Si en cambio suponemos α = σ no tenemos dos paras de rectas, pues la imagen de una coincide con la otra, que es justamente la diagonal ht, ti, por lo cual en este caso s´olo hay tres rectas.
Si en cambio tomamos α = √σ, tampoco tenemos dos pares de rectas, pero en este caso, no coinciden una imagen con una preimagen, sino que coinciden las dos im´agenes y las dos preim´agenes, as´ı que ahora s´olo tenemos dos rectas que son, un elemento y su imagen mediante Σ, y cada una coincide con la otra al reflejarlas sobre ht, ti. Este es el caso degenerado donde los espacios propios se colapsan, las rotaciones fundamentales que van m´as all´a de este punto corresponden con valores propios complejos mediante la descomposici´on fundamental.
Figura 5.
A partir de este caso podemos encontrar por construcci´on nuevas tuplas, para otros casos particulares de R3, pues habiendo colapsado dos espacios propios, podemos tomar como
eje de rotaci´on aquel que es perpendicular a los dos espacios propios que quedan y reducir este caso a R2. De este modo podemos conocer muchas otras tuplas con la caracter´ıstica
de no tener m´as de dos elementos. Ahora nos enfocamos en estudiar el caso doblemente degenerado donde se colapsan los tres espacios propios.
Corolario 2.4.1. En el contexto del lema 2.4.1, donde las rectas hαt, ti y hσt, αti se convierten simult´aneamente en espacios propios mediante la rotaci´on fundamental que les corresponde, es posible calcular los valores propios correspondientes en t´erminos de los par´ametros α y σ mediante las f´ormulas:
λ1 = s α2+ σ2 α2+ 1 , y λ2 = s α2σ2+ σ2 α2+ σ2 .
En particular, α =√σ corresponde con un ´unico valor propio λ =√σ y podemos verificar que en este caso ambas f´ormulas coinciden.
Demostraci´on. Calculemos los valores propios en t´erminos de los par´ametros α y σ de manera general. Al hacerlo obtenemos:
λ khα, 1ik = khα, σik ⇒ λ = s
α2+ σ2
y
λ2khσ, αik = khσ, ασik ⇒ λ2 =
s
α2σ2+ σ2 α2+ σ2 .
Ahora sabemos que α =√σ corresponde con un ´unico valor propio λ =√σ. Ejemplo 2.4.2. Consideremos la matriz (donde 1 < a < b):
Σ = 1 0 0 0 a 0 0 0 b .
Consideremos tambi´en una rotaci´on fundamental que se pueda descomponer en dos, la primara rotaci´on que sea aquella que fija el eje z y que corresponde con el caso donde los otros dos espacios propios se colapsan; y la segunda rotaci´on, que sea una que fije el eje perpendicular, tanto al eje z como al otro espacio propio colapsado, y tal que colapse todos los espacios propios en uno. Para entender como actu´a la segunda rotaci´on, debemos considerar la matriz: √ a 0 0 b ! =√a 1 0 0 c ! , donde c = √b
a. Debemos tener presente que la ´ultima matriz no corresponde con la base can´onica, sino con la base {√ 1
a + 1h1, √
a, 0i , h0, 0, 1i}. Aplicando el mismo razonamiento de antes encontramos el espacio propio tres veces colapsado, es decir, la tupla de un s´olo elemento; este es el espacio generado por el vector:
√ b,√ab, b q√ a +√a−1 .
Como esta f´ormula no luce del todo sim´etrica, con respecto a los par´ametros a y b, queremos observar que pasa si incluimos el tercer par´ametro que obviamos, sustituyendo la matriz diagonal.
Corolario 2.4.2. En el escenario del teorema 2.4.1, la matriz diagonal (donde 0 < a < b < c): Σ = a 0 0 0 b 0 0 0 c ,
tiene asociada una tupla con un ´unico elemento, el cual es el espacio generado por el vector: * √ a,√b, v u u tc r a b + r b a !+ .