Descomposición Fundamental de Matrices y Equivalencia entre Representaciones

(1)

Descomposici´

on Fundamental de Matrices y

Equivalencia entre Representaciones

Carlos Andr´

es Hern´

andez G´

omez

Dirigido por el profesor Alexander Cardona del departamento de

matem´

aticas de la universidad de los Andes, Bogot´

a D.C., 2017.

(2)

(3)

´

_{Indice general}

Introducci´on 3

1. Descomposiciones matriciales 6

1.1. Forma can´onica de Jordan . . . 6

1.2. Valores singulares y forma polar . . . 8

2. Descomposiciones matriciales y par´ametros fundamentales 11 2.1. Algunos hechos elementales y descomposiciones en dimensi´on dos . . . 12

2.2. Descomposiciones y par´ametros fundamentales en dimensi´on dos . . . 14

2.2.1. Parámetros de semejanza y clasificación de triángulos semejantes . . 15

2.2.2. Descomposici´on Fundamental para matrices en dimensi´on dos . . . 17

2.2.3. Dominio fundamental expandido . . . 24

2.3. Descomposici´on Fundamental para matrices en dimensi´on tres . . . 28

2.4. Descomposici´on Fundamental para matrices en dimensi´on n . . . 29

3. Perspectivas de investigaci´on 37 3.1. Teor´ıa de Lie . . . 37

3.1.1. Descomposici´on de Cartan . . . 40

3.1.2. Descomposici´on de Jordan-Chevalley . . . 42

3.2. El dominio fundamental y sl(2, R) . . . 43

3.3. Par´ametros fundamentales y polinomio caracter´ıstico . . . 44

(4)

Introducci´

on

En el contexto del álgebra lineal aprendemos a diagonalizar matrices cuadradas, proce-so que de poder llevarse a cabo conduce a una manera de representar la matriz en términos de otras matrices y cuyo significado geométrico, permite identificar la acción de una tras-formación lineal asociada a dicha matriz sobre un espacio euclidiano, al descomponerla en homotecias que actúan sobre espacios propios. Mientras algunas matrices reales sólo pueden diagonalizarce empleando números complejos, como aquellas que corresponden con rotaciones, otras nunca se pueden diagonalizar, como es el caso de las matrices nilpo-tentes. Aunque esta representación no siempre exista, a partir de esta podemos obtener otras dos que se pueden definir siempre.

La forma canónica de Jordan es la manera más directa de generalizar el proceso de diagonalización de una matriz. Al trabajar con matrices reales podr´ıamos tener que usar coeficientes complejos, pues sólo en los complejos podemos garantizar que el polinomio caracter´ıstico se factorice completamente. Además de factorizar el polinomio caracter´ısti-co necesitamos obtener una base de vectores propios, cuando una matriz A no puede diagonalizarce ni siquiera al emplear complejos es porque la base de vectores propios está incompleta, en tal caso debemos completar la base de vectores propios empleando vectores propios generalizados para construir la forma canónica de Jordan. En este sen-tido, al construir la forma canónica de Jordan ampliamos el concepto de espacio propio para sustituirlo por aquel de espacio invariante E de A, es decir tal que A(E) ⊆ E.

Ahora consideramos el hecho de que el producto de cualquier matriz real (o compleja) por su transpuesta (o su adjunta) es sim´etrico (o autoadjunto) y que adem´as es semidefini-do positivo, es decir que dicho producto de matrices es ortogonalmente (o unitariamente) diagonalizable y tiene valores propios reales no negativos. Los valores singulares de una matriz A se definen como las ra´ıces cuadradas (no negativas) de los valores propios (reales no negativos) de AT_{A. Si A es una matriz cuadrada, es posible representarla empleando}

dos matrices ortogonales (o unitarias) O y Õ y una matriz diagonal de valores singulares Σ mediante el producto A = OΣ Õ gracias a la descomposición en valores singulares. A diferencia de lo que ocurre en la forma canónica de Jordan O y Õ no tienen que ser in-versas una de la otra.

(5)

La forma canónica de Jordan es ideal para calcular potencias de matrices, ya que las matrices de cambio de base a los lados son inversas una de la otra de modo que se can-celan al multiplicar la matriz con sigo misma, esto en cambio luce muy mal al emplear la descomposición en valores singulares. La descomposición en valores singulares sin embar-go no requiere emplear coeficientes complejos para representar matrices reales, mientras emplea siempre bases ortonormales y una matriz completamente diagonal con entradas reales no negativas.

Es posible interpretar, tanto la forma canónica de Jordan como la descomposición en valores singulares para una misma matriz cuadrada A, cómo descripciones geométricas acerca de cómo actuá la transformación lineal representada por dicha matriz. Estas dos descripciones, pese a relatar lo mismo, lo hacen de manera esencialmente diferente. Como contamos con ambas representaciones para cualquier matriz cuadrada (real o compleja), podemos compararlas. Las matrices simétricas semidefinidas positivas ejemplifican co-mo ambas representaciones pueden coincidir por completo, más aún, en el caso general abr´ıa de existir algún criterio algebraico o geométrico (o ambos) que permita establecer la correspondencia entre estas dos representaciones. Este trabajo pretende descubrir di-chos criterios y propone que estos sean un puente para expandir nuestro entendimiento del álgebra y la geometr´ıa paralelamente; proponiendo un contexto geométrico apropiado para relacionar diferentes descomposiciones matriciales, al cual hemos llamado Dominio Fundamental.

En el primer cap´ıtulo haremos un repaso de la teor´ıa concerniente respecto la for-ma canónica de Jordan y la descomposición en valores singulares. Posteriormente, en el segundo cap´ıtulo, se expondrán los primeros intentos de responder la pregunta sobre la correspondencia entre la forma canónica de Jordan y la descomposición en valores singu-lares a partir del estudio de casos muy particusingu-lares. Luego se avanzará hacia un enfoque más general, que nos dará una respuesta explicita en dimensión dos (teoremas 2.2.1 y 2.2.2) e impl´ıcita en dimensiones superiores (teorema 2.4.1), mediante una perspectiva equivalente a la noción de espacios modulares, la cual se ejemplificará primero de forma sencilla empleando triángulos en lugar de matrices.

Un espacio modular es un espacio geométrico cuyos puntos representan objetos matem´ ati-cos o clases de equivalencia de dichos objetos. Son ejemplos de espacios modulares, los espacios proyectivos donde se parametrizan los subespacios unidimensionales, el Grass-maniano Gr(k, V ) de un espacio vectorial V que corresponde con los subespacios de V de dimensión k, la variedad de Chow, el esquema de Hilbert y el dominio fundamental (definición 2.2.1) que describe las clases equivalentes de matrices ortogonalmente similares.

(6)

En el capitulo final introduciremos la teor´ıa de grupos y álgebras de Lie para estudiar sus descomposiciones y relacionarlas con nuestro objeto de estudio y a la vez se expondrán ciertas expectativas frente al potencial a futuro y posibles aplicaciones de esta investiga-ción.

(7)

Cap´ıtulo 1

Descomposiciones matriciales

El propósito investigativo de esta tesis es comprender, desde una perspectiva geom´ etri-ca, la acción de una transformaci´_{on lineal en R}n por medio de su descomposición en valo-res singulavalo-res y su forma canónica de Jordan, simultáneamente. Concretamente, se quiere buscar un algoritmo que nos permita pasar de una descomposición a la otra para enten-der como se presentan ambas simultánemente, estableciendo relaciones entre los valores propios, los valores singulares y las bases asociadas correspondientes.

1.1. Forma can´

onica de Jordan

Para entender c´omo se construyen estas dos representaciones debemos empezar por recordar el proceso de diagonalizaci´on de una matriz. Sea Mn(F) el espacio vectorial de

matrices n×n con entradas en F = R o F = C. Para diagonalizar una matriz M ∈ Mn×n(F)

se debe construir una matriz D, similar a M y diagonal, a partir de las ra´ıces del poli-nomio caracter´ıstico de M . Dicho polipoli-nomio es simplemente el determinante de la matriz M − λI donde λ es la inc´ognita y las ra´ıces de dicho polinomio, que reciben el nombre de valores propios de M , son los coeficientes que definen la matriz diagonal D. Para que M resulte ser de hecho diagonalizable es necesario establecer que las matrices M y D sean similares, es decir hay que hallar una matriz invertible C tal que M = C−1DC.

Esta matriz C puede entenderse como la matriz de cambio de la base canónica a una base de vectores propios de M . Para construir dicha base de vectores propios basta con hallar bases para los núcleos de las matrices singulares de la forma M − λI y unirlas para formar la base deseada, estos núcleos son los espacios propios de M asociados a sus respectivos valores propios λ. Cabe alcarar que para obtener la igualdad M = C−1DC se deben ordenar los valores propios y la base de vectores propios de M de forma correspon-diente.

(8)

Cuando una raiz λ0 del polinomio caracter´ıstico de M est´a repetida, puede ocurrir que

la dimensión del núcleo de M − λ0I, llamada multiplicidad geométrica de λ0 como valor

propio de M , sea menor al n´umero de veces que λ − λ0 divide al polinomio caracter´ıstico

de M , llamada multiplicidad algebr´aica de λ0 como valor propio de M . Cuando ocurre

lo anteriormente mencionado, es decir, cuando la multiplicidad algebráica y geométrica de algún valor propio no coinciden, la base de vectores propios estará incompleta y por consiguiente no resultará posible diagonalizar la matriz M .

Tampoco es posible diagonalizar una matriz cuando su polinomio caracter´ıstico no se fac-toriza completamente, ya que el conjunto de valores propios queda imcompleto, problema que se resuelve fácilmente (al trabajar con matrices reales) gracias al teorema fundamental del álgebra (ver [5, teorema 31.18, página 288]), admitiendo coeficientes complejos para poder llevar a cabo la diagonalización.

Sin embargo, aún cuando una matriz no pueda diagonalizarse debido a la dispari-dad entre las multiplicidispari-dades geométricas y algebráicas de uno o varios de sus valores propios, se puede en todo caso obtener la forma canónica de Jordan de M mediante un procedimiento más general que consiste en hallar preimágenes de algunos elementos de los núcleos de las matrices M − λI para remplazar los vectores propios faltantes, estos nuevos elementos que completan la base de vectores propios se llaman vectores propios generalizados. Mientras los vectores propios ~v de A son aquellos tales que A~v = λ~v, los vectores propios generalizados ~w son aquellos tales que A ~w = ~v + λ ~w donde ~v es un vector propio (o un vector propio generalizado) asociado al valor propio λ.

Tras completar la base de vectores propios con los vectores propios generalizados co-rrespondientes que satisfacen la relación A ~w = ~v + λ ~w, los ordenamos de forma corres-pondiente empezando por los vectores propios. As´ı, podemos completar la forma canónica de Jordan como si estuviéramos diagonalizando, pero no sin antes ajustar la matriz dia-gonal, convirtiendo en unos los ceros ubicados directamente encima de los valores propios que corresponden con vectores propios generalizados. En este caso más general, la matriz M no resulta siendo siempre similar a una matriz diagonal D, sino a una matriz J que se parece mucho a D, salvo por aquellas entradas arriba de la diagonal que son unos en lugar de ceros, asociados a los vectores propios generalizados, y que siempre están dentro de bloques asociados a un mismo valor propio, llamados bloques de Jordan.

La existencia de la forma canónica de Jordan para matrices cuadradas está garantiza-da por el siguiente teorema (tomado de [11, teorema 2.5.5, página 36]).

Teorema 1.1.1. Sea V un espacio vectorial (sobre C) y sea T : V → V una transfor-maci´on lineal. Entonces existe una base β para V , en la cual A = [T ]β es una matriz en

(9)

forma can´onica de Jordan.

Como ejemplo pensemos en una matriz M con un ´unico valor propio λ0, si M fuera

diagonalizable tendr´ıa que ser una matriz escalar, que por conmutar siempre es similar solamente a ella misma, as´ı que no hay nada que hacer pues ya est´a diagonalizada ba-jo cualquier base. Entonces supongamos meba-jor que no es diagonalizable, en tal caso la matriz M − λ0I no resulta ser nula pero si resulta ser nilpotente, esto significa que los

elementos que no estan en el núcleo son preimágenes del núcleo directa o indirectamente de tal manera que al componer M − λ0I a lo sumo n veces se anula por completo, donde

n es la dimensi´on del espacio.

En conclusi´on, si admitimos coeficientes complejos vemos que podemos representar cual-quier matriz real cuadrada mediante su forma can´onica de Jordan M = C−1J C, la cual es ´

util para calcular potencias de M , pues las matrices que aparecen a ambos lados en la re-presentaci´on son inversas y se cancelan al componer M , de tal manera que Mk _{= C}−1_Jk_C.

Observación 1.1.1. Vemos que los espacios propios que se emplean para diagonalizar una matriz a menudo se expanden a espacios invariantes al emplear vectores propios generalizados en la forma canónica de Jordan. En este sentido, resulta similar a la forma canónica racional, donde se emplean bases c´ıclicas para los espacios invariantes de la forma β = {v, M v, M2v, ..., Mkv}, que al unirse forman una base para todo el espacio. En lugar de los bloques de Jordan, en la forma canónica racional se utilizan bloques con ceros salvo debajo de la diagonal, donde hay unos, y en la última columna, donde aparecen con signo opuesto los coeficientes del polinomio mónico asociado al espacio invariante generado por β y el cual divide al polinomio caracter´ıstico de M (ver [6, teorema 7.22, sección 7.4]).

1.2. Valores singulares y forma polar

Pese a la practicidad de la forma canónica de Jordan para calcular potencias de ma-trices, para lograr esta representación tenemos que admitir un cambio de base arbitrario, obteniendo una representación que no siempre es diagonal y mediante valores propios que pueden ser negativos e incluso complejos aún para matrices reales.

Pensemos en el caso de las matrices simétricas. Las matrices simétricas se pueden dia-gonalizar siempre, además la base de vectores propios se puede escoger ortonormal y los valores propios son reales. Esto se puede evidenciar a partir de dos hechos, el primero es que al sumarle o restarle una matriz escalar, digamos λI, a una matriz simétrica M , la nueva matriz M − λI podrá tener valores propios distintos a los de M , no obstante,

(10)

que el n´ucleo de una matriz es el complemento ortogonal de las im´agenes de su traspuesta.

A partir de lo anterior, considerando la matriz sim´etrica con valores propios no negativos MT_{M , podemos obtener una elegante descomposici´}_{on para cualquier matriz cuadrada M ,}

de la forma M = OΣ Õ, llamada descomposición en valores singulares, donde aparece una matriz diagonal Σ con valores reales no negativos acompañada a lado y lado de matrices ortogonales. Dichas matrices ortogonales no tienen por qué ser inversas una de la otra, y esta es la desventaja respecto a la forma canónica de Jordan.

Al ver que tanto la descomposición en valores singulares como la forma canónica de Jordan con coeficientes complejos existen siempre para matrices reales n × n, puede resultar llamativa la idea de buscar una manera natural de relacionar ambas a la vez que se tiene en mente la intuición detrás de su significado geométrico. El siguiente teorema (tomado de [6, teorema 6.26, página 406]) muestra cómo describir una transformación lineal a partir de sus valores singulares, aqu´ı no se hace mención de las matrices, pero la relación está impl´ıcita.

Teorema 1.2.1. Sean V y W espacios con producto interno de dimensi´on finita, y sea T : V → W una transformaci´on lineal con rango r. Entonces existen bases ortonormales {v1, v2, ..., vn} para V y {w1, w2, ..., wn} para W y escalares positivos σ1 ≥ σ2 ≥ ... ≥ σr

tales que: T (vi) =    σiwi si 1 ≤ i ≤ r, 0 si i > r.

As´ı mismo, supongamos que se satisfacen las condiciones anteriores. Entonces para 1 ≤ i ≤ n, vi es un vector propio de T∗T correspondiente al valor propio σi2 si 1 ≤ i ≤ r o

cero si i > r. Por lo tanto los escalares σi est´an determinados de forma ´unica por T .

Para obtener la descomposición en valores singulares de una matriz M = OΣ Õ, basta con considerar la matriz simétrica MT_{M , que adem´}_{as es semidefinida positiva y por lo}

tanto ortogonalmente diagonalizable con valores propios reales no negativos. Los valores singulares de M son las ra´ıces cuadradas positivas de los valores propios de MT_{M , con}

los valores singulares se construye la matriz diagonal de la descomposición Σ. La matriz ortogonal Õ es aquella que realiza el cambio de base, de la base canónica a una base ortonormal de vectores propios de MTM , mientras que las columnas de la matriz orto-gonal O se deducen al observar las imágenes mediante M de los elementos de dicha base ortonormal de vectores propios de MTM .

Observación 1.2.1. Existe otra descomposición llamada descomposición polar, donde M se expresa como el producto de una matriz ortogonal W y una matriz simétrica semidefini-da positiva P , se obtiene directamente a partir de la descomposición en valores singulares

(11)

donde M = OD Õ = (O Õ)( ÕT_{D ˜}_{O) = W P , W = O ˜}_{O y P = ˜}_OT_{D ˜}_{O. En un caso m´}_as

general podemos pensar en matrices unitarias y autoadjuntas en lugar de ortogonales y sim´etricas.

(12)

Cap´ıtulo 2

Descomposiciones matriciales y

par´

ametros fundamentales

Al comenzar a buscar una manera de evidenciar la conexión entre la descomposición en valores singulares y la forma canónica de Jordan, primero se tomaron en consideración casos particulares muy sencillos y espec´ıficos. Estudiando caso por caso distintos tipos de matrices 2 × 2 definidas en términos simples mediante algunos parámetros apropiados, para a partir de estos calcular los valores singulares y los valores propios, y as´ı compararlos.

Al comienzo de esta sección se presentan los primeros intentos menos generales, en los que aún no hab´ıan sido identificados los parámetros más apropiados para abordar el pro-blema de forma general. Más adelante veremos que, mediante una escogencia acertada de los parámetros, podemos responder la pregunta y hacer varias observaciones de manera general para todas las matrices 2 × 2.

En ciertos casos, la forma canónica de Jordan y la descomposición en valores singulares resultan idénticas (si se realizan debidamente, pues no son únicas), se trata del caso particular de las matrices simétricas semidefinidas positivas.

Definici´on 2.0.1. Una matriz sim´etrica M con entradas reales es llamada semidefinida positiva si ~x · M~x ≥ 0, ∀~_{x ∈ R}n_.

Lema 2.0.1. Si M es una matriz simétrica, es ortogonalmente diagonalizable con valores propios reales, dicha forma diagonal corresponde con la forma canónica de Jordan. Para convertirla en la descomposición en valores singulares basta factorizar una matriz diagonal y ortogonal, para retirar los menos de la matriz diagonal y multiplicarla a alguna de las matrices ortogonales a los lados. As´ı se convierte la forma canónica de Jordan en la descomposición en valores singulares en el caso de las matrices simétricas.

(13)

2.1. Algunos hechos elementales y descomposiciones

en dimensi´

on dos

Definición 2.1.1. Sea M una matriz 2 × 2 con entradas reales. Llamaremos M sesqui-simétrica si es la suma de una matriz antisimétrica y una matriz escalar. Una matriz es escalar si es un múltiplo de la matriz identidad.

En particular, si consideramos una matriz normal, es decir tal que M MT _{= M}T_{M ,}

vemos que la forma canónica de Jordan es diagonal pero puede incluir valores propios complejos y matrices unitarias. Analizándolo por bloques, vemos que podemos construir una matriz sesquisimétrica usando una matriz unitaria, su adjunta y una matriz diagonal de vectores propios conjugados, obteniendo el siguiente resultado:

Teorema 2.1.1. Sea M una matriz normal (i.e. MT_{M = M M}T_{) con entradas reales}

2 × 2 que no es sim´etrica. Entonces M tiene una descomposici´on en valores singulares de la forma M = a b −b a ! = Θ √ a2_{+ b}2 ₀ 0 √a2 _{+ b}2 ! ,

donde Θ denota una matriz ortogonal. Además, su descomposición en bloques de Jordan (diagonal en este caso) está dada por

M = a b −b a ! =    1 √ 2 1 √ 2 i √ 2 − i √ 2    a + ib 0 0 a − ib !    1 √ 2 − i √ 2 1 √ 2 i √ 2   .

Demostraci´on. La primera identidad se sigue al considerar Θ =

a √ a2_+b2 b √ a2_+b2 −b √ a2_+b2 a √ a2_+b2 ! y observar que sus columnas son ortonormales. La segunda se sigue directamente, al efectuar el producto matricial de las tres matrices al lado derecho. El hecho de que toda matriz normal 2 × 2 que no sea simétrica sea sesquisimétrica es algo que se evidenciará en los cap´ıtulos siguientes.

La matriz sesquisimétrica en cuestión es igual al producto de una matriz escalar y una matriz ortogonal y por esta via se puede establecer la conexión entre la forma canónica de Jordan y la descomposición en valores singulares para matrices normales.

Observaci´on 2.1.1. Si M es una matriz normal 2 × 2 con entradas reales y determi-nante negativo, entonces es ortogonalmente diagonalizable, por lo tanto M es una matriz sim´etrica. Esto puede evidenciarse ya que un determinante negativo no puede corresponder con el producto de dos valores propios complejos conjugados.

(14)

Para poder ir más allá vemos que nos falta abordar dos casos particulares más, para luego pensar en la forma de combinarlos y unificarlos. Nos falta resolver el problema en particular para una matriz ortogonalmente similar a un bloque de Jordan y por otra parte, tenemos que ocuparnos de las matrices cuyos espacios propios no son ortogonales entre s´ı. En ambas direcciones ya se ha logrado algún grado de progreso.

Ejemplo 2.1.1. Consideremos ahora el caso de matrices cuyos espacios propios no son ortogonales entre si. En particular, si M es una matriz de la forma:

M = sin θ cos θ

0 1

! .

Se puede comprobar que los valores propios de M son 1 y sin θ, mientras que sus vectores propios, (1, 0) y (cos θ, 1 − sin θ) no son ortogonales, salvo que θ sea π

2 ´o 3π

2 . En este caso, los valores singulares de M son σ = √1 ± cos θ, a su vez, los vectores propios de MTM que se utilizan en la descomposición en valores singulares, en este caso son de la forma v = (cos θ ∓ 1, − sin θ) que ya siendo ortogonales sólo falta normalizarlos. As´ı, la descomposición en valores singulares corresponde a:

M =    −1 √ 2 1 √ 2 1 √ 2 1 √ 2    √ 1 − cos θ 0 0 √1 + cos θ !      − sin θ p2(1 − cos θ) r 1 − cos θ 2 sin θ p2(1 + cos θ) r 1 + cos θ 2      .

Mientras, la descomposici´on en bloques de Jordan (diagonal en este caso) est´a dada por:

M = sin θ cos θ 0 1 ! = 1 cos θ 0 1 − sin θ ! sin θ 0 0 1 !    1 cos θ sin θ − 1 0 1 1 − sin θ   .

Esto podr´ıa contribuir a responder a la pregunta central de esta tesis, en particular, cuando los espacios propios no son ortogonales. En el caso de bloques de Jordan tenemos el siguiente resultado sobre sus valores singulares.

Teorema 2.1.2. Sea M = a 1 0 a

!

, entonces sus valores singulares est´an dados por

σ = s a2₊1 2 ± r a2₊1

4. A su vez, la base ortogonal de vectores propios de M

T_{M que}

se emplea en la descomposici´on en valores singulares, en este caso viene dada por los vectores v = 1 2± r a2₊ 1 4, −a !

(15)

Demostraci´on. Vemos que MTM = a

2 _a

a a2+ 1 !

, de modo que los valores singula-res de M son justamente las ra´ıces cuadradas de las ra´ıces del polinomio caracter´ıstico

MT_{M − λI}

= λ2−(2a2+1)λ+a4, lo cual permite verificar la primera parte del teorema. El resto se sigue al reemplazar los valores de λ y resolver el sistema homog´eneo asociado a la matriz MTM − λI.

En este caso es evidente que el vector propio y el vector propio generalizado son (1, 0) y (0, 1) respectivamente. Con base en esto se aspira llegar a entender cómo relacionar la forma canónica de Jordan con la descomposición en valores singulares en particular cuando la matriz M no es diagonalizable.

2.2. Descomposiciones y par´

ametros fundamentales

en dimensi´

on dos

Si contemplamos la manera en que se obtiene la forma polar a partir de la descompo-sición en valores singulares, vemos cuan rápido y sencillo resulta, y sin embargo, tal vez podamos percibir que hay algo que se pasa por alto. Esta vaga idea nos conducirá a los parámetros adecuados para empezar a entender la relación entre la forma de Jordan y los valores singulares en R2_.

Antes de entrar en materia, vamos a realizar un simple ejercicio de visualización, que ocurre en un contexto mucho más sencillo, pero que nos servirá para ejemplificar la ma-nera en que hemos de abordar el problema de la tesis posteriormente. El ejercicio consiste en representar clases de equivalencia de objetos matemáticos por medio de puntos en un espacio euclidiano de manera natural, para as´ı contemplarlos simultáneamente, organiza-dos naturalmente en forma de una figura geométrica. En contextos más generales, estos objetos son conocidos como espacios modulares.

Un espacio modular es un espacio geométrico cuyos puntos representan objetos matem´ ati-cos o clases de equivalencia de dichos objetos. Si estamos interesados en estudiar ciertos objetos matemáticos que corresponden con un espacio modular, al tener tal corresponden-cia podemos usar un sistema de coordenadas para describir dicho espacio y de esta manera parametrizar la clase de objetos que estamos estudiando. Los espacios modulares pueden considerarse como espacios de parámetros a la vez que espacios de objetos matemáticos.

Para ejemplificar la idea de forma elemental, las clases de equivalencia serán primero las de triángulos semejantes; y más adelante, sacaremos verdadero provecho de esta idea

(16)

al aplicarla a matrices similares, de ese modo contribuir´a ampliamente a la interpretaci´on de las respuestas que estamos buscando.

2.2.1. Par´

ametros de semejanza y clasificaci´

on de tri´

angulos

se-mejantes

Podemos contemplar de forma simultánea todas las clases de equivalencia de tri´ angu-los semejantes en el plano, representadas mediante puntos de una manera natural, para as´ı identificar una forma de ordenarlos espacialmente. Fijando dos puntos en el plano po-demos identificar cualquier otro punto del plano con la clase de equivalencia del triángulo que forman estos tres puntos. As´ı mismo queremos identificar ciertas regiones del plano que corresponden con cierto tipo de triángulos en particular, como los rectángulos o los isósceles.

Primero imaginemos dos ejes de coordenadas perpendiculares en el plano, identifique-mos uno de los ejes como aquel que se encuentra en posici´on horizontal, sobre dicho eje ubiquemos los dos puntos de referencia P1 y P2 sim´etricamente con respecto al otro eje,

vertical.

Figura 1.

Los puntos sobre el eje horizontal no corresponde con ningún triángulo, ya que son colineales con los dos puntos escogidos. En el eje vertical se ubican los triángulos isósceles,

(17)

pero estos también están presentes en las dos circunferencias que se hallan centradas en uno de los puntos escogidos Pi y que pasan por el otro. Los triángulos rectángulos se

encuentran en las dos rectas paralelas al eje vertical que pasan por los puntos escogidos Pi pero de nuevo se hallan en la circunferencia centrada en el origen que pasa por ambos

puntos Pi (ver figura 1).

Es fácil intuir que esta relación no es inyectiva, hay varios puntos asociados a una misma clase de equivalencia. La pregunta que surge naturalmente es, cómo restringir el plano para hallar un dominio donde estén todas las clases de equivalencia sin repetición. Esto nos lleva a dividir el plano en doce regiones.

Lo primero que notamos es que unas clases se repiten más que otras. La que menos se repite es la del triángulo equilátero, que sólo corresponde con dos puntos, las intersec-ciones de las circunferencias asociadas a los triángulos isósceles, y estan ubicados sobre el eje horizontal. Esta es la única clase tan infrecuente. Todas las otras clases aparecen seis o doce veces representadas. Por la simetr´ıa del asunto, es fácil ver que podemos restringir nuestro análisis un sólo cuadrante.

En adelante, nos restringimos al primer cuadrante. Sobre el semieje vertical, debajo del punto asociado al triángulo equilátero, se encuentran representados los triángulos isósceles tales que el lado desigual es más grande, y por encima de este punto están representado los triángulos isósceles donde el lado desigual es más pequeño. Análogamente, el segmento de la circunferencia centrada en el punto fijo P2, ubicado en el otro semiplano, representa

a los triángulos isósceles donde el lado desigual es más pequeño, y el segmento de la cir-cunferencia centrada en el punto fijo P1 represente a los triángulos isósceles donde el lado

desigual es m´as grande.

(18)

La semirrecta que representa a los triángulos rectángulos (ver figura 2) se intersecta con la circunferencia centrada en el punto fijo P1. Dicha intersección corresponde con la clase

de triángulos que son rectángulos e isósceles a la vez. Si consideramos la semirrecta y descartamos los puntos que están arriba, o los que están abajo de dicho punto de intersec-ción, los puntos restantes serán suficientes para representar todas las clases de triángulos rectángulos sin repetición. Estas mismas clases también están representadas todas sin re-petición en el segmento de la circunferencia centrada en el origen que corresponde con el primer cuadrante.

A partir de estas explicaciones resulta sencillo reconocer las doce regiones. Nos limita-remos obviamente a señalar cuales son las tres que se encuentran en el primer cuadrante. La primera región está limitada por los dos ejes y el segmento de la circunferencia centra-da en el otro semiplano (en P2). La segunda región está limitada por los dos segmentos de

las circunferencias centradas en los puntos escogidos y por el eje horizontal. Y la tercera regi´on, que a diferencia de las dos primeras no es acotada, est´a limitada por los ejes y por el segmento de la circunferencia centrada en el propio semiplano (en P1).

En cada región los triángulos rectángulos están ubicados en la frontera entre los triángulos agudos y los triángulos obtusos (ver figura 2).

Para concluir esta sección, falta señalar que las identificaciones que hemos hecho nos permiten definir biyecciones naturales entre las doce regiones del plano ya descritas. La identificación de puntos ubicados en los distintos cuadrantes se logra reflejando el plano con respecto a los ejes. La identificación de los puntos en un mismo cuadrante se obtiene cambiando el lado del triángulo que se encuentra sobre el eje horizontal y variando la escala de manera conveniente, puede que al final haya que reflejar para volver al mismo cuadrante.

2.2.2. Descomposici´

on Fundamental para matrices en dimensi´

on

dos

En esta sección se hará una propuesta frente a cómo estudiar las matrices mediante parámetros, de manera similar a cómo procedimos en el ejemplo de la sección anterior, para as´ı poder determinar los parámetros que definen la forma canónica de Jordan de una matriz 2 × 2 a partir de sus valores singulares. Al considerar casos muy espec´ıficos, como en la sección 2.1, empleando en cada caso parámetros diferentes, no parece ser evidente cómo deducir el caso general de los particulares. También fue inadecuado insistir en defi-nir los valores singulares a partir de los valores propios y no al revés, pues en el enfoque que se plantea a continuación los valores singulares (sus ra´ıces en realidad) resultan ser

(19)

par´ametros mucho m´as apropiados.

A partir de la descomposici´on en valores singlares resulta evidente que:

Proposici´on 2.2.1. Toda matriz real 2 × 2 con determinante no negativo es ortogonal-mente similar a una matriz de la forma:

M = cos θ − sin θ sin θ cos θ ! σ1 0 0 σ2 ! = σ1cos θ −σ2sin θ σ1sin θ σ2cos θ ! .

donde σ1 y σ2 son los valores singulares de M .

Demostración. La proposición se sigue directamente de la descomposición en valores singulares. Digamos que dicha descomposición para M corresponde a M = OΣ Õ =

˜

OT( ÕO)Σ Õ, ya que M y Σ tienen determinante no negativo, es válido asumir que ( ÕO) es una rotación, demostrando as´ı la proposición.

Las clases de equivalencia que estudiaremos esta vez son, por lo tanto, las de matrices ortogonalmente similares, representadas en alg´un dominio por los par´ametros (σ1, σ2, θ).

Más adelante resultará evidente la conveniencia de ajustar un poco los parámetros, rem-plazando los valores singulares por sus ra´ıces cuadradas y permitir que tengan signo, positivo o negativo, esto nos permitirá también considerar las matrices con determinante negativo. Lo cual nos conduce a la siguiente definición.

Definici´on 2.2.1. Sea M una matriz 2 × 2 con entradas reales. Entonces M puede des-componerse como: M = Φ cos θ − sin θ sin θ cos θ ! z1|z1| 0 0 z₂2 ! Φ−1,

donde Φ es una matriz ortogonal con determinante positivo. A esta expresión la llamamos descomposición fundamental de M . Llamamos valores fundamentales a los parámetros zi ∈ R (donde zi2 = σi son los valores singulares de M ) y a θ lo llamamos ángulo

fundamental. Estos tres son los par´ametros fundamentales y pertenecen al dominio:

D = {(z1, z2, θ) | z2 ≥ |z1| , θ ∈ (−π, π]},

el cual recibirá el nombre de dominio fundamental. Si no exigimos Det(Φ) = 1, el ángulo fundamental no estar´ıa bien definido, pero no por mucho, sólo habr´ıa que remplazar θ 7→ −θ en caso de que Det(Φ) = −1.

Proposici´on 2.2.2. Las matrices reales 2 × 2 que son ortogonalmente similares poseen los mismos parametros fundamentales, salvo tal vez por el signo del ´angulo fundamental

(20)

Para establecer relaciones entre la descomposici´on fundamental y los valores propios, procedemos en primera instancia calculando los valores propios de una matriz en t´ ermi-nos de los par´ametros (σ1, σ2, θ), posteriormente justificaremos la escogencia de los otros

parámetros y del dominio. Es clave resaltar que las caracter´ısticas geométricas de una transformación lineal en las que estamos interesados, tales como los valores propios, los valores singulares y la correspondencia entre las bases relacionadas, son invariantes para transformaciones ortogonalmente similares, al igual que las relaciones entre ellas, ya que este tipo de conjugación es simplemente relativa a la escogencia de los ejes de coordenadas (dado que sean perpendiculares y con una escala fija). La expresión que obtenemos para los valores propios no está restringida a casos particulares:

|M − λI| = λ2_{− (σ} 1+ σ2)cosθλ + σ1σ2 ⇒ λ = 1 2 h (σ1+ σ2)cosθ ± p (σ1+ σ2)2cos2θ − 4σ1σ2 i .

Esta f´ormula, que acabamos de demostrar, puede reescribirse en t´erminos de los par´ ame-tros fundamentales:

Teorema 2.2.1. Los valores propios de una matriz real M de tamaño 2 × 2 pueden obtenerse a partir de los parámetros fundamentales mediante la fórmula:

λ = 1 2 (z1|z1| + z22) cos θ ± q (z1|z1| + z22)2cos2θ − 4z1|z1| z22 .

Más importante aún que esta fórmula es la interpretación que le demos. Para in-terpretarla aplicaremos precisamente el método que empleamos anteriormente con las clases de triángulos semejantes. Es posible identificar de inmediato las regiones del espa-cio (σ1, σ2, θ) que corresponden con ciertos tipos de matrices, por ejemplo las matrices

singulares corresponden con las superficies σ1 = 0 y σ2 = 0.

Corolario 2.2.1. En el espacio (σ1, σ2, θ) las matrices sim´etricas corresponden con las

superficies θ = nπ con n ∈ Z y con la superficie σ1 = −σ2, mientras las dem´as matrices

normales est´an representadas en la superficie σ1 = σ2. Las matrices antisim´etricas

corres-ponden con las rectas z1 = z2 cuando θ = (n +

1

2)π con n ∈ Z. Las matrices ortogonales se identifican con las rectas σ1 = ±σ2 = ±1 y las matrices escalares se encuentran en las

rectas σ1 = σ2 para θ = nπ con n ∈ Z. Observe que cuando σ1 = σ2 = σ la f´ormula para

los valores propios se convierte en λ = σ cos θ ± iσ sin θ.

Menos evidente pero m´as reveladora, es la ubicaci´on de las matrices tipo Jordan, que podemos hallar mediante el discriminante del valor propio (σ1 + σ2)2cos2θ − 4σ1σ2 (lo

llamo as´ı pues aparece como el discriminante del polinomio |M − λI|). De hecho, si el discriminante es positivo la matriz se diagonaliza en los reales, si es negativo s´olo puede ser diagonalizada en los complejos, pero si el discriminante es cero no se diagonaliza y es

(21)

semejante a un bloque de Jordan. El siguiente corolario justifica la escogencia de nuevos par´ametros.

Corolario 2.2.2. Dentro del dominio fundamental, para un valor fijo del par´ametro θ, las matrices tipo Jordan corresponden con rectas en el plano (z1, z2). De este modo, las

matrices tipo Jordan corresponden con una superficie reglada dentro del dominio funda-mental.

Demostraci´on. Primero evidenciemos cual es el rol del discriminante del valor propio, si el discriminante es cero los dos valores propios son iguales a 1

2(σ1+ σ2) cos θ, y por lo tanto, si la matriz no es escalar no puede diagonalizarce, pues si fuera diagonal ser´ıa escalar e invariante por conjugaci´on. Por lo tanto, en este caso, las matrices tipo Jordan pueden ser vistas como la frontera entre las matrices de valores propios reales y las de valores propios complejos. Es crucial determinar bien esta frontera:

λ1 = λ2 → (σ1+ σ2)2cos2θ = 4σ1σ2 → cos θ = ±

2√σ1σ2

σ1+ σ2

,

sea σ1 = z12, σ2 = z22, z1 = r cos α y z2 = r sin α, entonces:

cos θ = ± 2z1z2 z2 1 + z22 = ± sin 2α → α = 1 2sin −1 (± cos θ) = 1 2 hπ 2 ± θ i .

Al cambiar de dominio podemos incluir los semiejes negativos, lo cual no era posible al trabajar con valores singulares. Gracias a esto no estamos limitados a considerar matrices con determinante no negativo ´unicamente.

Figura 3.

(22)

fun-donde est´en representadas todas las clases de matrices de forma inyectiva, tanto como sea posible, pues hay siertas singularidades, por ejemplo cuando z1 = z2 = 0 el ´angulo

fundamental se hace irrelebante.

Primero, respecto a z1 y z2, hay que notar que intercambiar los valores singulares

co-rresponde con cierto tipo de conjugación ortogonal (intercambiar los ejes invirtiendo uno de ellos), por lo tanto sólo nos vamos a interesar en el semiplano z2 ≥ z1. Además

mul-tiplicar una matriz por menos uno es equivalente a remplazar θ 7→ θ + π, es este caso podr´ıamos restringir el par´ametro θ al dominio [0, π), pero en cambio preferimos restringir m´as zi mediante |z1| ≤ z2 y tomar θ ∈ (−π, π].

Por supuesto que hay muchas otras formas de definir este dominio que funcionan igual de bien. Escogimos este por consideraciones e interpretaciones de tipo geométrico que se darán a conocer al momento de emplear un cuarto parámetro φ para identificar las distintas matrices que se producen por conjugación dentro de cada clase de equivalencia.

Note que al restringir θ = 0, toda pareja (z1, z2) en el dominio fundamental

correspon-de con una matriz que se diagonaliza con valores propios reales, iguales a zi|zi|. Mientras

que cuando restringimos θ = π

2, por el contrario, s´olo es posible diagonalizar con reales en los casos donde z1 < 0, ya que en otro caso λ = ±iz1z2, a su vez, en este caso las matrices

tipo Jordan se halla sobre el eje z1 = 0 y corresponden con todas las matrices nilpotentes.

Debido a la simetr´ıa del coseno al cuadrado, lo que ocurre con el discriminante de los valores propios entre θ = π

2 y θ = π, es un reflejo de lo que ocurre entre θ = 0 y θ = π 2. Por ´ultimo, vemos que si z1 < 0, el discriminante del valor propio es siempre positivo

y por lo tanto en R2 _{toda matriz con determinante negativo se puede diagonalizar con}

reales, lo que es consistente con el hecho de que, en R2_{, una inversi´}_{on compuesta con una}

rotaci´on produce otra inversi´on.

Observaci´on 2.2.1. Toda matriz 2 × 2 de entradas reales con determinante negativo se puede diagonalizar con reales.

Ya viene siendo hora de decir alguna cosa sobre los vectores propios; antes podr´ıamos comentar algo sobre la tentación de cambiar de orden la matriz diagonal y la matriz de rotación (fundamental) que aparecen en la descomposición fundamental.

Sin duda poner la matriz diagonal a la derecha es algo arbitrario, pero no demasiado, ya que las clases de equivalencia quedan definidas exactamente igual, pues pasar la ma-triz de rotación fundamental de un lado al otro es algo que puede lograrse mediante conjugación, sencillamente tomando Φ igual a la matriz inversa de la matriz de rotación.

(23)

Otra forma de cambiar el orden de las matrices es trasponer, pero el ángulo fundamental también cambia al hacer esto, basta multiplicarlo por menos uno, siempre que esto no nos deje fuera del dominio fundamental, como cuando θ = π o si escogiéramos otro dominio.

Aqu´ı se evidencia lo favorable de trabajar en el dominio θ ∈ (−π, π), donde basta mul-tiplicar θ por menos uno y adherir, multiplicada por la derecha, la matriz de rotación fundamental a la matriz de conjugación Φ a la hora de transponer. En particular, cuando el ángulo fundamental es igual a cero o a π, este no cambia al transponer, tampoco es necesario cambiar la matriz Φ de conjugación, es decir, ningún parámetro cambia.

Si en lugar de trasponer quisiéramos invertir una matriz, lo que ocurre con los parámetros fundamentales y con Φ es casi lo mismo, la única diferencia es que hay que cambiar los valores fundamentales por sus inversos multiplicativos. Lo único que resta decir en esta l´ınea de pensamiento es que al multiplicar una matriz por su transpuesta lo que ocurre es que el ángulo fundamental se vuelve cero, los valores fundamentales quedan elevados al cuadrado y la matriz Φ de conjugación, dependiendo del orden del los factores, o bien permanece idéntica, o se le adhiere, multiplicada por derecha, la matriz de rotación fun-damental.

Ahora s´ı, hablemos de los vectores propios. También para estos tenemos fórmulas explicitas a partir de los parámetros fundamentales, pero conviene verlas primero en términos de los valores singulares asumiendo que la matriz tiene determinante positivo, pues lucen mejor as´ı. En realidad aparecen dos formulas, ya que para hallar una solución del sistema homogéneo asociado a la matriz singular M − λI podemos considerar el vector dado por una de las dos filas de la matriz en cuestión, cambiar el orden de las coordenadas y multiplicar una de ellas por menos uno para obtener un vector perpendicular es decir, que pertenece al núcleo de M − λI, por ello hay dos formulas, una asociada a cada fila de la matriz M − λI; una de estas fórmulas es (las coordenadas de los vectores propios en esta sección corresponden siempre con la base ortonormal dada por las columnas de Φ):

~ v = σ2sin θ, σ1− σ2 2 cos θ ∓ 1 2 p (σ1 + σ2)2cos2θ − 4σ2σ2 .

El hecho de que aparezca el seno del ángulo fundamental, nos muestra que no en vano incluimos los valores θ ∈ (−π, 0) en el dominio fundamental, aún cuando los valores propios, que sólo dependen del coseno, tengan en este sentido un comportamiento simétrico al rededor del cero. Ahora veamos como luce esta fórmula en términos de los parámetros fundamentales:

(24)

de los par´ametros fundamentales mediante la f´ormula: ~ v = z2₂sin θ,z1|z1| − z 2 2 2 cos θ ∓ 1 2 q (z1|z1| + z22)2cos2θ − 4z1|z1| z22 .

Para ilustrar en forma breve este aspecto, por el momento, no se hará un análisis muy detallado de estas fórmulas y nos limitaremos a señalar unos pocos casos particulares.

Observe que cuando z1 = 0:

~ v = z2₂sin θ,−z 2 2 ∓ z22 2 cos θ . A su vez θ = π 2 implica: ~v = z₂2, ∓ q −z1|z1| z22 . Y si z1 = z2 = z tenemos:

~v =z2sin θ, ∓iz2sin θ .

En el caso de las matrices tipo Jordan el discriminante del valor propio es cero y por lo tanto, podemos trabajar directamente con los valores singulares, dado que z1 ≥ 0:

~v = σ2sin θ, σ1− σ2 2 cos θ .

En breve realizaremos los cálculos para hallar el vector propio generalizado. Otro caso particular que es fácil de observar es θ = 0. En general, estos ejemplos nos están sugiriendo algo, como se menciono antes existe otra fórmula, la cual debemos usar cuando con la primera obtenemos vectores nulos o paralelos. La segunda fórmula es:

~v = z1|z1| − z 2 2 2 cos θ ± 1 2 q (z1|z1| + z22)2cos2θ − 4z1|z1| z22, z1|z1| sin θ .

Ahora, para hallar el vector propio generalizado en t´erminos de los par´ametros funda-mentales, de forma general para todas las matrices tipo Jordan, tenemos que resolver el sistema:

(M − λI) ~w = ~v. Esto nos conduce al siguiente corolario:

Corolario 2.2.3. Es posible asociar a todas las matrices tipo Jordan en el dominio fun-damental un mismo vector propio generalizado ~w = h0, −1i.

Demostraci´on. Asumiendo que el discriminante del valor propio es igual a cero, que ~v es un vector propio, λ el valor propio, que σ1 6= σ2 y que M viene dada en t´erminos de sus

(25)

valores fundamentales. Seg´un las f´ormulas que hemos obtenido, este sistema corresponde a:   σ1− σ2 2 cos θ −σ2sin θ σ1sin θ σ2− σ1 2 cos θ   x y ! =   σ2sin θ σ1− σ2 2 sin θ  ,

donde ~w = hx, yi. Es posible verificar que la matriz en efecto es singular y que el sistema es consistente como se supone que sea. Este sistema se reduce a:

σ1− σ2

2 cos θ

x + (−σ2sin θ)y = σ2sin θ.

Y en conclusi´on, ~w = h0, −1i es el vector propio generalizado, curiosamente resulta sien-do el mismo para todas las matrices tipo Jordan en el escenario de la descomposici´on fundamental.

En la primera etapa de la investigación, obtuvimos fórmulas sencillas para los valores singulares y los vectores asociados, a partir del valor propio en el caso particular de los bloques de Jordan (Teorema 2.1.2). Como las nuevas fórmulas describen los valores y vectores propios a partir de los parámetros fundamentales, en el caso de las matrices tipo Jordan, podr´ıa ser interesante comparar las fórmulas de esta sección con las que obtuvimos en la etapa cero, pues de algún modo son inversas entre s´ı.

Corolario 2.2.4. También podemos calcular fácilmente la traza y el determinante de una matriz M ∈ M2×2(R) a partir de los parámetros fundamentales, mediante las fórmulas

tr(M ) = (z1|z1| + z22) cos θ y det(M ) = z1|z1| z22.

Las fórmulas que dan los vectores y los valores propios en términos de los par´ ame-tros fundamentales, tan estrechamente ligados a la descomposición en valores singulares, pueden ser consideradas como una respuesta satisfactoria a la pregunta de esta tesis para matrices 2 × 2.

2.2.3. Dominio fundamental expandido

Ahora nos damos a la tarea de hallar un cuarto parámetro para distinguir todas las matrices y no sólo las clases de equivalencia, y as´ı expandir el dominio fundamental. Co-mo antes, voy a ejemplificar la idea de incluir nuevos parámetros con el ejemplo de los triángulos. Teniendo representadas todas las clases de equivalencia de triángulos semejan-tes en una región dada, de forma única como se planteó; para describir ahora todos los triángulos, nos preguntamos cuántos parámetros nos faltan y como definirlos de manera natural.

(26)

coor-necesitan dos coordenadas para describir al punto que representa la clase de equivalen-cia del triángulo en la región dada, significa que nos faltan cuatro parámetros más para determinar un triángulo en particular, hay una forma muy natural de escoger los nuevos parámetros.

El primero será un parámetro de escala, y se emplea para definir una homotecia que reescale el triángulo representante de la clase de equivalencia al tamaño que corresponda, este primer parámetro podr´ıa ser negativo, por convención, si fuera necesario invertir el triángulo; una mejor opción es pedir que el parámetro de escala sea estrictamente posi-tivo e incluir en la región de clases equivalentes una contraparte simétrica. El segundo parámetro ser´ıa un ángulo, para rotar el triángulo hasta la posición adecuada y los ´ ulti-mos dos parámetros, las coordenadas de un vértice del triángulo para trasladarlo hasta la ubicación correcta.

Del mismo modo, en el caso de las matrices, que poseen cuatro coordenadas, como ya estamos trabajando con tres parámetros fundamentales, sólo nos falta incluir uno, as´ı que de hecho esta parte es más fácil que con los triángulos.

Lema 2.2.1. Si el ´angulo fundamental es cero, las siguientes cuatro matrices Φ producen exactamente el mismo efecto al conjugar:

cos φ − sin φ sin φ cos φ ! , cos φ sin φ sin φ − cos φ ! , − cos φ − sin φ − sin φ cos φ ! , − cos φ sin φ − sin φ − cos φ ! .

Si el ´angulo fundamental no es cero, las dos matrices de determinante negativo s´olo le cambian el signo.

Demostración. Estas cuatro matrices pueden obtenerse unas a partir de las otras mul-tiplicándoles a la derecha matrices diagonales y ortogonales (es decir con unos y menos unos en la diagonal), las cuales son sus propias inversas y conmutan con cualquier otra matriz diagonal, en particular, con la matriz diagonal de la descomposición fundamental. Si el ángulo fundamental no es cero y Φ tiene determinante negativo, es necesario multi-plicar el ángulo fundamental por menos uno si queremos conmutar la matriz de rotación fundamental con alguna matriz diagonal y ortogonal con determinante negativo.

Como ya dijimos que Φ debe tener determinante positivo, escojemos trabajar siempre con la primera matriz, y de gratis tenemos el dominio del nuevo parámetro φ ∈ [0, π). Esto significa que en la descomposición fundamental, el único factor que podr´ıa realizar una inversión del espacio, es la matriz diagonal, dependiendo del signo del primer parámetro fundamental.

(27)

Como los elementos en la regi´on z1 = z2 del dominio fundamental, son los ´unicos

in-variantes ante este tipo de conjugaciones (ortogonales), tiene perfecto sentido geom´etrico colapsar el eje θ en el dominio fundamental e imaginar que el cuadrante |z1| ≤ z2 gira en

torno a la semirrecta z1 = z2 al variar el nuevo par´ametro φ, hasta caer en el cuadrante

opuesto, al pasar de φ = 0 a φ = π

2. Lo anterior es consistente con el hecho de que la conjugaci´on que corresponde al ´angulo φ = π

2, equivale a intercambiar los valores funda-mentales.

Mientras intercambiar los valores fundamentales es equivalente a reflejar sobre la semirrec-ta z1 = z2, multiplicarlos ambos por menos uno en principio significa rotar un ´angulo π,

pero debido a la identificaci´on de los dos semiplanos mediante φ, al ignorar este par´ametro vemos que multiplicar por menos uno a la larga puede entenderse como reflejar sobre la semirrecta z1 = −z2, desde el punto de vista de las clases de equivalencia. Lo anterior nos

lleva a contemplar un hecho muy intrigante.

En general, y aún cuando colapsamos el eje θ, la conjugación deja quietos a los ele-mentos en las clases donde z1 = z2. Si en cambio ignoramos el parámetro φ y variamos θ

(desde cero), podemos imaginarnos que estamos rotando el cuadrante |z1| ≤ z2 sobre la

semirrecta z1 = −z2 (cuando llegamos a π el cuadrante se halla reflejado en el cuadrante

opuesto), pues las clases en dicha semirrecta no est´an cambiando al variar θ, ya que no dependen de θ, los elementos dentro de las clases sin embargo, si se est´an reordenando entre tanto, a diferencia del caso anterior, como lo ilustra el siguiente lema.

Lema 2.2.2. Para las matrices cuyos valores fundamentales satisfacen z1 = −z2, la acci´on

de θ puede ser sustituida plenamente por la acci´on de φ (y viceversa), de la siguiente forma: cos θ − sin θ sin θ cos θ ! −σ 0 0 σ ! = Φ −σ 0 0 σ ! Φ−1, donde φ = θ 2 y Φ =     cos θ 2 − sin θ 2 sin θ 2 cos θ 2     .

Demostración. Para conmutar el producto de la matriz diagonal con la matriz Φ−1, que está a la derecha de la igualdad, el menos de la matriz diagonal que está a la izquierda actuá sobre la primera fila de Φ−1, pero para pasar la matriz diagonal a la derecha el menos debe extraerse de la primera columna de Φ−1, por las propiedades de simetr´ıa y antisimetr´ıa del coseno y del seno, esto es equivalente a invertir la matriz Φ−1 al momento

(28)

En este sentido, notamos que las clases de equivalencia en el dominio fundamental no siempre est´an representadas de manera ´unica.

Según lo que hemos visto, existen muchas posibilidades para definir el domino fun-damental expandido, restringiendo en mayor o menor medida los ángulos y en forma contraria los valores fundamentales. Por ejemplo podemos restringir al máximo los ´ angu-los y no restringir angu-los valores fundamentales en lo absoluto, as´ı el dominio fundamental expandido ser´ıa: ˜ E = {(z1, z2, θ, φ) | θ ∈ h −π 2, π 2 , φ ∈h0,π 2 , (z1, z2) ∈ R2}.

En cambio, resulta conveniente definir el dominio fundamental expandido restringiendo al m´aximo los valores fundamentales, al restringir los ´angulos lo menos posible:

E = {(z1, z2, θ, φ) | θ ∈ (−π, π] , φ ∈ [0, π) , |z1| ≤ z2}.

El segundo dominio parece m´as apropiado para ser interpretado geometricamente.

Para tratar de entender la geometr´ıa del dominio fundamental expandido empezamos considerando el cuadrante |z1| ≤ z2 del plano θ = φ = 0, imaginemos entonces que al

variar φ desde cero hasta π estamos rotando dicho cuadrante al rededor de la semirrecta z1 = z2 hasta que regresa a su sitio, as´ı describe una figura Ω que corresponde con la

mitad de R3 limitada por el plano z1 = −z2 donde θ = 0.

Ahora consideremos esta figura Ω como la mitad de un subespacio tridimensional in-merso en R4, la acción de θ puede verse entonces como una doble rotación, que deja invariante el plano {z1 = −z2} ⊂ Ω mientras lo rota un ángulo −θ; entre tanto Ω hace un

barrido dentro de la cuarta dimensi´on, de modo que cuando θ = π, Ω se ha convertido en el medio subespacio opuesto (la mitad opuesta de Ω).

Esto luce un poco como las coordenadas esf´ericas en el espacio tridimensional, pero al fijar los ´angulos, en lugar de obtener semirrectas obtenemos cuadrantes, por lo cual esta-mos parametrizando a R4 _{y no a R}3_{. Esta interpretaci´}_{on sobre la geometr´ıa del dominio}

est´a contenida en el siguiente teorema.

Teorema 2.2.3. El dominio fundamental expandido:

E = {(z1, z2, θ, φ) | θ ∈ (−π, π] , φ ∈ [0, π) , |z1| ≤ z2},

puede identificarse con una parametrizaci´_{on de R}4_{, donde la acci´}_{on de φ fija el plano}

{z1 = z2} ⊂ E mientras hace invariante al plano {z1 = −z2} ⊂ E. La acci´on de θ

(29)

Demostración. Es fácil notar que las matrices cuyos valores fundamentales son iguales, son invariantes por conjugación, de modo que φ fija el plano {z1 = z2} ⊂ E. Aplicando

el lema 2.2.2 vemos a la vez que φ y θ hacen invariante al plano {z1 = −z2} ⊂ E. Por

´

ultimo, como φ fija el plano {z1 = z2} ⊂ E, los ´unicos grados de libertad que quedan son

z1 y θ, de modo que la acci´on de θ tambi´en hace invariante a este plano.

El nuevo parámetro podr´ıa llamarse ángulo de conjugación o ángulo de base, ya que es el único que depende por completo de la escogencia de los ejes de coordenadas (con la condición de que sean perpendiculares entre si y con una escala fija) y en este sentido es relativo al punto de vista del observador. Queda sin embargo mucho por interpretar, para entender mejor la geometr´ıa de este dominio fundamental expandido.

2.3. Descomposici´

on Fundamental para matrices en

dimensi´

on tres

Es f´acil darse cuenta que el m´_{etodo que usamos para responder la pregunta en R}2 _no

puede generalizarse demasiado, ya que los polinomios de grado cinco o mayor no pueden resolverse por radicales (ver [5, sección 56, capitulo 10]) y esto implica que, en dimen-siones superiores, núnca vamos a tener fórmulas expl´ıcitas para factorizar el polinomio caracter´ıstico. Puede ser que logremos definir el dominio fundamental, pero en general, resultará imposible dar fórmulas para los valores propios directamente a partir de los parámetros fundamentales.

Este revés en la investigación puede verse de forma contraria como una gran esperan-za, si le damos la vuelta al problema y encontramos otro camino para resolver nuestras inquietudes de ´ındole geométrico, tal vez podamos a la larga deducir algo sobre la fac-torización del polinomio asociado. Y pese a que no podamos ir mucho más allá por este rumbo, aún existe la esperanza de que podamos trabajar con la descomposición funda-mental y usarla directamente para revelar la relación que existe entre la forma canónica de Jordan y la descomposici´_{on en valores singulares, al menos en R}3_{, generalizando un}

poco lo que hicimos en R2_.

Algo que podemos y debemos calcular de forma general, para cualquier dimensión, es el número de valores y ángulos fundamentales. Es claro que una matriz n × n debe tener n valores fundamentales, uno por cada valor singular. La matriz depende de n2 parámetros, y ya tenemos n; de los n(n − 1) parámetros restantes sólo la mitad corresponde con la rotación fundamental, pues la otra mitad son para definir la matriz de conjugación.

(30)

Una posible forma de definir la matriz de rotaci´_{on fundamental en R}3 _{a partir de tres}

par´ametros ser´ıa:

Θ =    cos θ − sin θ 0 sin θ cos θ 0 0 0 1       cos φ 0 − sin φ 0 1 0 sin φ 0 cos φ       1 0 0 0 cos ψ − sin ψ 0 sin ψ cos ψ   ,

el dominio fundamental podr´ıa estar dado por |z1| ≤ z2 ≤ z3y tres ´angulos fundamentales

(θ, φ, ψ), dos de ellos en el intervalo (−π, π], y uno en el intervalo −π 2,

π 2 i

.

Otra opción es definir un único ángulo fundamental y utilizar dos parámetros adi-cionales para determinar el eje de la rotación. Esta idea tiene perfecto sentido, pues los polinomios reales de grado tres tienen siempre una ra´ız real, si se trata del polinomio caracter´ıstico de una matriz tres por tres de determinante positivo, tenemos que una de sus ra´ıces tiene que ser uno y el espacio propio asociado ser´ıa entonces el eje de rotación fundamental.

Se espera poder obtener con la fórmula cúbica, fórmulas para responder de manera expl´ıcita a la pregunta de esta tesis en R3_{, sin embargo, resulta pertinente hacer a un lado}

este aspecto de la investigaci´on para introducir y dar prioridad a un enfoque m´as general, el cual nos conduce a una respuesta que, a cambio de ser muy general, no es para nada expl´ıcita.

2.4. Descomposici´

on Fundamental para matrices en

dimensi´

on n

Podemos definir la descomposición fundamental para una matriz real M de tamaño n × n mediante la fórmula:

M = ΦΘΣΦT,

donde Φ y Θ son matrices ortogonales con determinante positivo y Σ es la matriz diagonal:

Σ =         z1|z1| 0 0 ... 0 0 z2 2 0 ... 0 0 0 z2 3 ... 0 .. . ... ... ... ... 0 0 0 ... z2 n         ,

definiendo los valores fundamentales zi a partir de los valores singulares σi mediante

z2

(31)

Un toro maximal en un grupo de Lie compacto es un subgrupo de Lie conexo, com-pacto y abeliano maximal (ver [3, p´agina 152]). En el caso de las matrices ortogonales de dimensi´on par, el toro maximal corresponde (o es isomorfo) con las matrices de la forma:

        Rθ1 0 0 ... 0 0 Rθ2 0 ... 0 0 0 Rθ3 ... 0 .. . ... ... ... ... 0 0 0 ... Rθn         , donde Rθi = cos θi − sin θi sin θi cos θi ! .

En el caso de las matrices ortogonales de dimensi´on impar, las matrices del toro maximal son pr´acticamente iguales:

          Rθ1 0 0 ... 0 0 0 Rθ2 0 ... 0 0 0 0 Rθ3 ... 0 0 .. . ... ... ... ... ... 0 0 0 ... Rθn 0 0 0 0 ... 0 1           .

No es dif´ıcil notar que toda matriz ortogonal con determinante positivo es ortogonalmente similar a una matriz del toro maximal, única si ordenamos los ángulos de menor a mayor. De este modo podemos definir n/2 ángulos fundamentales en el caso par y (n − 1)/2 en el caso impar. Como sabemos que Θ depende de n(n − 1)/2 parámetros, los parámetros restantes, servirán para definir un espacio invariante de dimensión n − 2 asociado a cada ´

angulo fundamental.

No obstante, a continuación se presenta un enfoque donde no será necesario definir la matriz de rotación fundamental expl´ıcitamente a partir de parámetros. Lo primero que haremos, es volver a darle un vistazo a los resultados expl´ıcitos que obtuvimos en R2 y profundizar aún más en el análisis.

Ejemplo 2.4.1. Consideremos las descomposiciones fundamentales asociada a la matriz diagonal:

Σ = 1 0 0 σ

! .

(32)

dimen-n × dimen-n reales sobre el espacio proyectivo Pn(R). Supongamos adem´as que σ > 1.

Considere-mos el subespacio unidimensional definido a partir de un par´_{ametro t ∈ R y un par´ametro} fijo α > σ como hαt, ti (es decir, conformado por los puntos hx, yi) = hαt, ti.

En este caso estamos suponiendo que z1 = 1. El caso general se reduce a este

median-te σ = σ2 z1|z1|

, cambiando proporcionalmente la escala de los valores propios y singulares pero no las caracter´ısticas geom´etricas de los espacios propios en el escenario de la des-composici´on fundamental.

Lema 2.4.1. En el ejemplo anterior, el ángulo entre las rectas hαt, ti y hαt, σti coincide con el ángulo entre hσt, αti y ht, αti, pues cada pareja es el reflejo de la otra sobre la recta ht, ti. Esto a su vez implica que la acción inducida por Σ preserva el ángulo entre hαt, ti y hσt, αti, pues es igual al ángulo entre sus imágenes hαt, σti y ht, αti.

Demostración. Al aplicar la acción inducida por Σ a la recta hαt, ti, esta se convierte en hαt, σti, si reflejamos esta imagen sobre la recta parametrizada por ht, ti obtenemos la recta hσt, αti. Si ahora aplicamos la acción inducida por Σ a la recta hσt, αti obtenemos la recta ht, αti y si la reflejamos sobre la recta ht, ti volvemos a obtener el subespacio original hαt, ti.

Figura 4.

Esto revela claramente la naturaleza de la correspondencia que existe entre la descom-posici´on en valores singulares y la forma can´onica de Jordan a un nivel muy general.

(33)

Teorema 2.4.1. Para cada matriz Σ, diagonal no singular de tamaño n×n, consideremos todas la tuplas maximales de subespacios unidimensionales, linealmente independientes, tales que los ángulos entre ellos permanezcan invariantes mediante la acción inducida por Σ, si la tupla tiene n elementos, la acción inducida debe preservar también la orientación de cualquier base asociada a la tupla.

Para cada una de estas tuplas, existe al menos una rotación fundamental Θ que lleva a las imágenes mediante Σ de estos espacios de regreso a sus preimágenes, convirtiéndolos, mediante la descomposición fundamental, en espacios propios. El número de rotaciones fundamentales asociadas a una tupla es finito cuando esta tiene al menos n − 1 elementos. Además todas las tuplas con menos de n elementos corresponden, mediante la descompo-sición fundamental, con matrices que no se pueden diagonalizar, ya que tienen asocia-dos bloques de Jordan no triviales. Por otra parte, las rotaciones fundamentales que no corresponden de manera precisa con alguna tupla, definen matrices con valores propios complejos, mediante la descomposición fundamental.

Demostración. Buena o mala, una caracter´ıstica de este teorema es que no hay mucho que probar, pues el enunciado es bastante auto explicativo. Evidentemente, si Σ preserva los ángulos entre ciertos subespacios (y la orientación), es posible rotarlos de vuelta a su lugar y sin duda esto los convierte en espacios propios.

Ahora consideremos una tupla con n−1 elementos. Sea Ω el subespacio de dimensión n−1 que contiene a todos los elementos de la tupla, y sea Γ el subespacio de dimensión n − 1 que contiene a todas las imágenes mediante Σ de los elementos de la tupla. Cualquier ro-tación fundamental asociada a dicha tupla tiene que mandar a Γ en Ω a la vez que lleva las imágenes mediante Σ de los elementos de la tupla de regreso a sus preimágenes, por ello, si los signos de los valores propios estuvieran predeterminados (por ejemplo si tuvieran que ser todo positivos) no podr´ıa existir más de una rotación fundamental correspondien-te. En efecto, supongamos que los signos de los valores propios están predeterminados, consideremos una base ortonormal para Γ e incluyamos, de último, un elemento más para convertirla en una base ortonormal de todo el espacio.

En tal caso, como la matriz de rotación fundamental siempre tiene determinante positivo, la acción inducida por esta matriz no cambia la orientación de la base, y las imágenes de los primeros n − 1 elementos de la base ya están determinadas por asumir que los signos de los valores propios están predeterminados. El último elemento de la baso tiene que tener una imagen perpendicular a todas las demás, de magnitud uno y que preserve la orientación de la base, lo que nos deja con una única posibilidad. Por lo tanto, en este caso, sólo puede existir una rotación fundamental Θ0. En general sólo existen un número

(34)

Por último, como las tuplas son maximales, aquellas que tienen menos de n elemen-tos corresponden con casos degenerados, donde dos o más de los elementos de la tupla se encuentran colapsados, lo que da lugar a los bloques de Jordan. Si en cambio consideramos una matriz de rotación fundamental que no corresponde de manera precisa con ninguna tupla, no será posible hallar una base de vectores propios reales, para diagonalizar la matriz correspondiente mediante la descomposición fundamental, sin usar complejos.

Este teorema responde a la pregunta de la tesis de manera muy general, pero nada explicita. El teorema muestra que el problema en cuesti´on se reduce a identificar las tuplas asociadas a una matriz diagonal dada, lo cual pudimos hacer en R2 _{sin darnos ni cuenta,}

pero en R3 _{este problema es mucho m´}_{as complicado.}

Algunos casos particulares en R3, sin embargo, pueden reducirse al caso de R2, esto ocurre cuando el eje de la rotación fundamental coincide con uno de los ejes coordenados, pues dicho eje es invariante mediante la rotación y la acción de la matriz diagonal Σ, definiendo un espacio propio, mientras que lo que ocurre en el complemento ortogonal de dicho eje, el cual también es invariante bajo la rotación y la acción de Σ, luce exactamente como el caso que ya resolvimos expl´ıcitamente en R2_{. Esto nos permite identificar una}

gran cantidad de tuplas en R3 _{con la caracter´ıstica de que un elemento es perpendicular}

a los otros dos.

Consideremos ahora otros casos particulares de R3 _{que podemos entender desde R}2_.

Retomemos el ejemplo que dio pie al lema. Anteriormente asumimos α > σ y vimos que ten´ıamos un par de elementos distintos del espacio proyectivo asociados a este valor α, y hay otro par de elementos, las imágenes del par anterior mediante Σ, donde el ángulo entre las rectas se preserva. Si en cambio suponemos α = σ no tenemos dos paras de rectas, pues la imagen de una coincide con la otra, que es justamente la diagonal ht, ti, por lo cual en este caso sólo hay tres rectas.

Si en cambio tomamos α = √σ, tampoco tenemos dos pares de rectas, pero en este caso, no coinciden una imagen con una preimagen, sino que coinciden las dos imágenes y las dos preimágenes, as´ı que ahora sólo tenemos dos rectas que son, un elemento y su imagen mediante Σ, y cada una coincide con la otra al reflejarlas sobre ht, ti. Este es el caso degenerado donde los espacios propios se colapsan, las rotaciones fundamentales que van más allá de este punto corresponden con valores propios complejos mediante la descomposición fundamental.

(35)

Figura 5.

A partir de este caso podemos encontrar por construcci´on nuevas tuplas, para otros casos particulares de R3_{, pues habiendo colapsado dos espacios propios, podemos tomar como}

eje de rotaci´on aquel que es perpendicular a los dos espacios propios que quedan y reducir este caso a R2_{. De este modo podemos conocer muchas otras tuplas con la caracter´ıstica}

de no tener m´as de dos elementos. Ahora nos enfocamos en estudiar el caso doblemente degenerado donde se colapsan los tres espacios propios.

Corolario 2.4.1. En el contexto del lema 2.4.1, donde las rectas hαt, ti y hσt, αti se convierten simultáneamente en espacios propios mediante la rotación fundamental que les corresponde, es posible calcular los valores propios correspondientes en términos de los parámetros α y σ mediante las fórmulas:

λ1 = s α2+ σ2 α2_{+ 1} , y λ2 = s α2σ2+ σ2 α2_{+ σ}2 .

En particular, α =√σ corresponde con un ´unico valor propio λ =√σ y podemos verificar que en este caso ambas f´ormulas coinciden.

Demostración. Calculemos los valores propios en términos de los parámetros α y σ de manera general. Al hacerlo obtenemos:

λ khα, 1ik = khα, σik ⇒ λ = s

α2_{+ σ}2

(36)

y

λ2khσ, αik = khσ, ασik ⇒ λ2 =

s

α2σ2+ σ2 α2_{+ σ}2 .

Ahora sabemos que α =√σ corresponde con un ´unico valor propio λ =√σ. Ejemplo 2.4.2. Consideremos la matriz (donde 1 < a < b):

Σ =    1 0 0 0 a 0 0 0 b   .

Consideremos también una rotación fundamental que se pueda descomponer en dos, la primara rotación que sea aquella que fija el eje z y que corresponde con el caso donde los otros dos espacios propios se colapsan; y la segunda rotación, que sea una que fije el eje perpendicular, tanto al eje z como al otro espacio propio colapsado, y tal que colapse todos los espacios propios en uno. Para entender como actuá la segunda rotación, debemos considerar la matriz: _√ a 0 0 b ! =√a 1 0 0 c ! , donde c = √b

a. Debemos tener presente que la ´ultima matriz no corresponde con la base can´onica, sino con la base {√ 1

a + 1h1, √

a, 0i , h0, 0, 1i}. Aplicando el mismo razonamiento de antes encontramos el espacio propio tres veces colapsado, es decir, la tupla de un s´olo elemento; este es el espacio generado por el vector:

√ b,√ab, b q√ a +√a−1 .

Como esta fórmula no luce del todo simétrica, con respecto a los parámetros a y b, queremos observar que pasa si incluimos el tercer parámetro que obviamos, sustituyendo la matriz diagonal.

Corolario 2.4.2. En el escenario del teorema 2.4.1, la matriz diagonal (donde 0 < a < b < c): Σ =    a 0 0 0 b 0 0 0 c   ,

tiene asociada una tupla con un ´unico elemento, el cual es el espacio generado por el vector: * √ a,√b, v u u tc r a b + r b a !+ .