Apuntes de Álgebra lineal

(1)

Apuntes elaborados por

Juan Gonz´

alez-Meneses L´

opez.

Curso 2008/2009

Departamento de ´

Algebra.

(2)

(3)

Tema 1. Matrices. Determinantes. Sistemas de ecuaciones lineales. . . 1

1.1. Matrices: definici´on, operaciones y propiedades b´asicas. . . 1

1.2. Transformaciones elementales de filas: matrices escalonadas y redu-cidas. . . 8

1.3. Dependencia lineal y rango. . . 11

1.4. Matrices elementales. . . 14

1.5. Matrices invertibles. . . 18

1.6. Transformaciones elementales de columnas. . . 21

1.7. Determinantes:definici´on y propiedades. Teorema de Cauchy-Binet. 23 1.8. Desarrollo por filas y columnas. Adjunta e inversa. . . 30

1.9. C´alculo de determinantes. . . 33

1.10. Rango y menores. M´etodo del orlado. . . 35

1.11. Sistemas de ecuaciones lineales. . . 38

1.12. M´etodo de eliminaci´on de Gauss. . . 40

1.13. M´etodo de Gauss-Jordan. Teorema de Rouch´e-Frobenius. . . 45

1.14. Regla de Cramer. . . 47

(4)

Tema 2. Espacios vectoriales . . . 49

2.1. Estructuras algebraicas. . . 49

2.2. Dependencia lineal. . . 54

2.3. Sistemas de generadores y bases. . . 57

2.4. Teorema de la base. Dimensi´on. . . 59

2.5. Dimensi´on y sistemas de vectores. Coordenadas. . . 61

2.6. Cambio de base. . . 63

Tema 3. Variedades lineales . . . 66

3.1. Definici´on y propiedades b´asicas. . . 66

3.2. Ecuaciones param´etricas e impl´ıcitas. . . 69

3.3. Ecuaciones y dimensi´on. . . 71

3.4. Intersecci´on y suma de variedades. . . 74

3.5. Propiedades de la suma de variedades. F´ormula de la dimensi´on. . . 76

3.6. Descomposici´on de variedades. Espacio producto y cociente. . . 78

3.7. Propiedades de la suma directa. Espacio producto. . . 81

3.8. Espacio cociente. . . 82

Tema 4. Aplicaciones lineales . . . 87

4.1. Definici´on y propiedades. . . 87

4.2. Imagen y n´ucleo. . . 89

4.3. Imagen e imagen inversa de variedades lineales. Aplicaciones inyectivas. 91 4.4. Isomorfismos. . . 93

(5)

4.6. Aplicaciones lineales y matrices II. . . 98

4.7. Primer teorema de isomorf´ıa. . . 100

4.8. Cambio de base. Matrices equivalentes. . . 102

4.9. Endomorfismos. Matrices semejantes. . . 104

4.10. El espacio vectorial Hom(V, V0). . . 106

Tema 5. Endomorfismos . . . 109

5.1. Autovalores y autovectores. . . 109

5.2. Multiplicidad algebraica y geom´etrica. Diagonalizaci´on. . . 113

5.3. Forma can´onica de Jordan. Subespacios propios generalizados. . . . 116

5.4. C´alculo de la base de Jordan. . . 119

5.5. Base de Jordan y forma can´onica de Jordan. . . 122

5.6. Teorema de Jordan. . . 125

Tema 6. Espacios vectoriales eucl´ıdeos . . . 128

6.1. Formas bilineales. . . 128

6.2. Ortogonalidad. . . 130

6.3. Diagonalizaci´on de formas bilineales sim´etricas. . . 133

6.4. Teorema de Sylvester. . . 134

6.5. Espacios vectoriales eucl´ıdeos. . . 137

(6)

Tema 1.

Matrices. Determinantes. Sistemas de

ecua-ciones lineales

1.1. Matrices: definici´

on, operaciones y propiedades b´

asicas.

En este tema estudiaremos las matrices como objeto matemático y su aplicación al estudio de los sistemas de ecuaciones lineales. Veremos sus propiedades fundamentales, las operaciones básicas, y una aplicación importante de estos conceptos: el Teorema de Rouché-Frobenius.

A partir de ahora fijaremos un cuerpo de escalares, que llamaremosK. La definición de cuerpo se dará en el Tema 2. Por ahora es suficiente pensar que K es el conjunto de los números racionales, reales o complejos, y que unescalar es uno de estos números.

Una matriz m×n es una tabla de m filas y n columnas de escalares. Es decir, un objeto de la forma

    

a11 a12 · · · a1n

a21 a22 · · · a2n ..

. ... ...

am1 am2 · · · amn

    

,

donde cada aij es un escalar.

Una vez vista la definici´on de matriz, fijaremos algunas notaciones:

DenotaremosMm×n(K) al conjunto de matricesm×n, cuyo cuerpo de escalares es

K. Si no nos interesa especificar el cuerpo de escalares, escribiremos simplemente Mm×n.

Normalmente usaremos una letra may´uscula para denotar una matriz, y la misma letra en min´uscula, con los sub´ındices correspondientes, para denotar suselementos oentradas. Por ejemplo, escribiremos una matriz A∈ Mm×n como sigue:

A =

    

a11 a12 · · · a1n

a21 a22 · · · a2n ..

. ... ...

    

(7)

Si queremos especificar la letra que usaremos para los elementos de una matriz, escribiremos

A= (aij).

Comencemos a estudiar las propiedades de las matrices.

Diremos que dos matrices A y B son iguales si ambas tienen las mismas dimen-siones (es decir, A, B ∈ Mm×n), y adem´as aij =bij para todo i, j 1≤ i≤m, 1≤j ≤n.

Dadas dos matrices A, B ∈ Mm×n, definimos su suma, A+B, como la matriz C ∈ Mm×n tal que

cij =aij +bij.

Dada una matriz A ∈ Mm×n(K) y un escalar α ∈ K, definimos su producto,

αA, como la matrizD∈ Mm×n(K) tal que

dij =α aij

Es decir, dos matrices de las mismas dimensiones se pueden sumar, término a término, dando lugar a otra matriz de la misma dimensión. Y también podemos multiplicar una matriz por un escalar, dando lugar a otra matriz de las mismas dimensiones donde cada término se ha multiplicado por el escalar.

Un ejemplo importante de matrices son los vectores:

Unvectores una matrizm×1. Las entradas de un vector se llamancoordenadas.

Aunque sean un caso particular de matrices, trataremos a los vectores de forma especial. Los denotaremos en negrita, y como s´olo tienen una columna, no escribiremos el segundo ´ındice de cada t´ermino. Por ejemplo, escribiremos:

v=

    

v1

v2

.. .

vm

    

(8)

Tambi´en nos referiremos comovectores filaa las matrices 1×n. As´ı, un vector fila podr´ıa ser:

v= (v1, v2, . . . , vn).

En los vectores fila, las coordenadas se suelen escribir separadas por comas. Pero recordemos que, si no se especifica lo contrario, un vector consta de una columna.

Los vectores suelen resultar familiares, ya que se usan para representar los puntos de los espacios geom´etricos. Por ejemplo, los puntos del plano_R2 _{se corresponden con los vectores}

de dos coordenadas: M2×1. Los puntos del espacio R3 se corresponden con los vectores

de tres coordenadas: M3×1. Y as´ı se puede continuar con los espacios de dimensiones

superiores.

Ahora estudiaremos la operación más importante con matrices: la multiplicación. Comen-zaremos con un caso particular:

Dadas dos matrices

A= (a1 a2 · · · an)∈ M1×n, B =

    

b1

b2

.. .

bn

    

∈ Mn×1,

se define su producto, AB, como la matrizC ∈ M1×1 cuya ´unica entrada es:

a1b1+a2b2+· · ·+anbn.

Nota: Si se consideran las dos matrices A y B como vectores (un vector fila y un vector columna), el producto que acabamos de definir se llama producto escalarde A y B. Lo estudiaremos m´as a fondo en temas posteriores.

Para extender esta definici´on a matrices con m´as de una fila o columna, llamaremos fila i de una matriz A = (aij) ∈ Mm×n, al vector fila (ai1 ai2 · · · ain) ∈ M1×n, y llamaremos columna jal vector columna

    

a1j

a2j .. .

amj

    

∈ Mm×1.

(9)

Dadas dos matrices A∈ Mm×n y B ∈ Mn×p, se define su producto, AB, como la matriz C∈ Mm×p, donde el elemento cij es el producto de la fila ideA por la columna j deB. Es decir,

cij =ai1b1j +ai2b2j+· · ·+ainbnj.

Nota: Es importante darse cuenta que no se pueden multiplicar dos matrices de cualquier dimensión. Sólo se pueden multiplicar A y B si el tamaño de las filas de

A es igual al tamaño de las columnas de B. El resultado de la multiplicación será una matriz C con el mismo número de filas que A y el mismo número de columnas que B. Esquemáticamente:       

a11 a12 · · · a1n ..

. ... ...

ai1 ai2 · · · ain ..

. ... ...

           

b11 · · · b1j · · · b1p

b21 · · · b2j · · · b2p ..

. ... ...

bn1 · · · bnj · · · bnp

     =        

c11 · · · c1j · · · c1p ..

. ... ...

ci1 · · · cij · · · cip ..

. ... ...

cm1 · · · cmj · · · cmp

       

m×n n×p m×p

Nota: esta definición del producto de matrices puede resultar extraña. ¿Por qué no mul-tiplicar matrices simplemente multiplicando sus entradas correspondientes? La respuesta proviene de los sistemas lineales. Arthur Cayley (1821-1895) estudiaba los sistemas de dos ecuaciones con dos incógnitas

ax+by =x0 cx+dy=y0

como transformaciones del plano, que a cada punto (x, y) le hacen corresponder el punto

(x0, y0). Por tanto, podemos decir que la matriz

a b c d

transforma el plano, moviendo

cada punto (x, y) a la posici´on (x0, y0). Si consideramos ahora otra matriz

e f g h

,

tam-bién transformará el plano, moviendo el punto (x0, y0) a la posición (x00, y00), mediante las ecuaciones:

ex0+f y0 =x00 gx0+hy0 =y00

Por tanto, si hacemos actuar estas dos transformaciones, una detrás de otra, el punto (x, y) irá a la posición (x00, y00), donde estas coordenadas verifican:

(10)

y por otro lado:

y00 =gx0+hy0 =g(ax+by) +h(cx+dy) = (ag+ch)x+ (bg+dh)y.

Por tanto, la composici´on de las dos transformaciones tiene por ecuaci´on:

(ae+cf)x+ (be+df)y=x00

(ag+ch)x+ (bg+ch)y =y00

Si observamos la matriz de esta transformaci´on, vemos que es elproducto de las matrices anteriores, ya que:

e f g h

a b c d

=

ae+cf be+df ag+ch bg+ch

.

Luego el producto de matrices corresponde a la composición de transformacio-nes. Estas definiciones de Cayley se generalizaron a cualquier dimensión. Más adelante estudiaremos las transformaciones lineales en general, y veremos cómo el producto de matrices corresponde a la composición de transformaciones lineales.

Hemos definido tres operaciones con matrices: la suma y el producto de matrices, y el producto de una matriz por un escalar. Veamos cu´ales son las principales propiedades de estas operaciones.

Propiedades de la suma de matrices: En Mm×n se tienen las siguientes propiedades:

1. Propiedad conmutativa: A+B =B+A.

2. Propiedad asociativa: (A+B) +C =A+ (B+C).

3. Elemento neutro: Existe una ´unica matriz O ∈ Mm×n, llamada matriz

nula, tal que A+O =O+A, para toda matriz A∈ Mm×n.

4. Elemento opuesto: Dada una matriz A∈ Mm×n, existe otra matriz B ∈

Mm×n, llamada opuesta de A, tal que A+B =O.

La matriz nula est´a formada por ceros. Por otro lado, si B es la matriz opuesta de A, se tiene bij =−aij.

(11)

Propiedades del producto de matrices: Si A, B y C son matrices, de las dimensiones adecuadas para que se puedan multiplicar o sumar (en cada caso), se tiene

1. Propiedad asociativa: (AB)C=A(BC).

2. Propiedades distributivas:

a) (A+B)C =AC+BC.

b) A(B+C) = AB+AC.

3. Elemento neutro (a izquierda y derecha): Existe una ´unica matriz

I ∈ Mn×n tal que:

a) AI =A para todaA∈ Mm×n. b) IB =B para todaB ∈ Mn×p.

Nota: El producto de matrices no es conmutativo en general. Es decir, normalmente

AB 6= BA, incluso cuando los dos productos estén bien definidos. Además, no siempre existe el elemento inverso: dada una matriz cuadrada A, no tiene por qué existir otra matriz B tal que AB=I.

Por otra parte, la matriz neutra I = (δij) se llama matriz identidad, y es una matriz cuadrada definida por: δij = 0 si i 6= j, y δii = 1 para todo i. Por ejemplo, la matriz identidad de dimensi´on 3 es:

I =

 

1 0 0 0 1 0 0 0 1

 .

Propiedades del producto de matrices y escalares: SiA yB son matrices, de las dimensiones adecuadas para que se puedan sumar o multiplicar (en cada caso), y si α y β son escalares, se tiene

1. α(βA) = (αβ)A.

2. α(AB) = (αA)B =A(αB).

3. (α+β)A=αA+βA.

(12)

Terminaremos esta sección estudiando una última operación de matrices, llamada trasposición.

Dada una matrizA∈ Mm×n, llamamostraspuestadeAa la matrizAt∈ Mn×m, definida de forma que las filas deAsean las columnas de At_{, y viceversa. Es decir,} si At= (bij), se tiene bij =aji para todo i, j.

Ejemplo 1.1 Si A=

1 2 3 4 5 6

, entonces At₌

 

1 4 2 5 3 6

 .

Utilizaremos la traspuesta de una matriz en temas posteriores. Por ahora nos limitaremos a ver algunas propiedades:

Propiedades de la trasposici´on: Sean A y B matrices de las dimensiones adecuadas. Se tiene:

1. (A+B)t=At+Bt.

2. (AB)t₌_Bt_At_.

3. (At₎t ₌_A_.

Por último, hay un tipo especial de matriz que será importante más adelante:

Una matriz A es sim´etrica siAt=A.

(13)

1.2. Transformaciones elementales de filas: matrices escalonadas

y reducidas.

A la hora de aplicar las matrices al estudio de los sistemas de ecuaciones lineales, y para estudiar las propiedades de los determinantes, una herramienta esencial consiste en las llamadas transformaciones elementales de matrices, que se definen como sigue.

Lastransformaciones elementales de filasque se pueden aplicar a una matriz, son las siguientes:

1. Intercambiar dos filas.

2. Multiplicar una fila por un escalar no nulo.

3. A˜nadir a una fila un m´ultiplo no nulo de otra.

A partir de esta definici´on, se obtiene el siguiente concepto:

Diremos que dos matrices son equivalentes por filas si podemos obtener una, a partir de la otra, mediante transformaciones elementales de filas.

Gracias a las transformaciones elementales de filas, podremos siempre transformar cual-quier matriz en otra, equivalente por filas, que es más sencilla desde un punto de vista que veremos más adelante. Estas matrices sencillasvienen definidas a continuación.

Diremos que una matriz es escalonada por filas si cumple lo siguiente:

1. Todas las filas de ceros (si las hay) est´an en la parte inferior de la matriz.

(14)

Ejemplo 1.2 La siguiente matriz es escalonada por filas:

     

2 −1 0 3 4 0 3 −2 1 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0

     

.

Un m´etodo para transformar cualquier matriz en una escalonada por filas es el siguiente:

El m´etodo de eliminaci´on de Gauss aplicado a una matriz, la transforma en una matriz equivalente que es escalonada por filas. Consiste en los siguientes pasos:

Paso 1: Si es necesario, intercambiar la primera fila con otra, para que la primera columna que no sea de ceros tenga un elemento no nulo en la primera posici´on.

Paso 2:Sumar a cada fila un m´ultiplo adecuado de la primera, de manera que la primera columna que no sea de ceros tenga s´olo un elemento no nulo: el de la primera fila.

Paso 3: Ignorando temporalmente la primera fila, repetir todo el proceso con las restantes filas.

Como este proceso da lugar, claramente, a una matriz escalonada por filas, hemos demos-trado el siguiente resultado:

Proposici´on 1.3 Toda matrizm×nes equivalente por filas a otra matrizm×nescalonada por filas.

Demostración: Sólo hay que aplicar a la matriz inicial el método de eliminación de Gauss.

(15)

Diremos que una matriz es reducida por filas si cumple lo siguiente:

1. Es escalonada por filas.

2. El primer elemento no nulo de cada fila, llamado pivote, es 1.

3. Encima (y debajo) de cada pivote s´olo hay ceros.

Ejemplo 1.4 La siguiente matriz es reducida por filas:

     

1 0 4 3 0 0 1 −1 2 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0

     

.

Se tiene entonces:

M´etodo de eliminaci´on de Gauss-Jordan para transformar una matriz en otra equivalente por filas, que sea reducida por filas:

Paso 1: Aplicar a la matriz el m´etodo de Gauss.

Paso 2:Multiplicar cada fila no nula por un escalar conveniente, de manera que todos los pivotes sean 1.

Paso 3: Comenzando por el pivote más a la derecha, eliminar todos los elementos no nulos que tenga encima, sumándole a cada fila un múltiplo conveniente de la fila de este pivote. Realizar la misma operación con todos los pivotes, de derecha a izquierda.

Después de aplicar este método a una matriz, se obtiene claramente otra matriz equivalente (puesto que se han aplicado transformaciones elementales de filas) que es reducida por filas (por construcción). Hemos probado por tanto el siguiente resultado:

Teorema 1.5 Toda matrizm×n es equivalente por filas a otra matriz m×n reducida por filas.

(16)

Una propiedad importante de la forma reducida por filas equivalente a una matriz dada es que es ´unica. Pero a´un no tenemos las herramientas suficientes para demostrar esto.

1.3. Dependencia lineal y rango.

El concepto dedependencia linealde vectores es fundamental para el estudio de matri-ces, sistemas lineales y, como veremos en temas posteriores, espacios vectoriales.

Geom´etricamente, un vector de n coordenadas se representa, en el espacio de dimensi´on

n, como una flecha que parte del origen y termina en el punto que tiene esas coordenadas. Las operaciones b´asicas de matrices, aplicadas a vectores, se ven geom´etricamente como sigue:

Multiplicar un vector por un escalar (digamos, un n´umero real), equivale a multiplicar la longitud del vector por ese escalar.

Sumar dos vectores v1 y v2 corresponde al siguiente procedimiento: Si se traslada

el vector v2, sin cambiar su direcci´on ni su tama˜no, hasta hacer que su comienzo

coincida con el final del vector v1, entonces vectorv1+v2 es el que une el origen de

coordenadas con el final de este nuevo vectorv2.

Dados r vectores v1, . . . ,vr de la misma dimensión, llamamos combinación li-neal de estos vectores a cualquier expresión de la forma:

α1v1+α2v2 +· · ·+αrvr,

donde α1, . . . , αr son escalares cualesquiera.

Es decir, una combinaci´on lineal de r vectores es otro vector, que resulta de cambiar el tama˜no de cada uno de los vectores iniciales, y sumar los resultados (haciendo comenzar cada vector en el final del vector precedente).

Ejemplo 1.6 Una combinación lineal de un sólo vector, v, tiene la forma αv, donde α es un escalar. Por tanto es otro vector con la misma dirección que v, y cuyo tamaño es α veces el tamaño de v. Por tanto, αv está en la recta deter-minada por v.

(17)

Diremos que un vector v depende linealmente de un conjunto de vectores {v1, . . . ,vr} siv se puede escribir como combinaci´on lineal de v1, . . . ,vr.

Ejemplo 1.8 El vector (3,−2,2) depende linealmente de los vectores (1,0,2) y

(−1,2,2), ya que se tiene la combinaci´on lineal:

  3 −2 2  = 2

  1 0 2 

+ (−1)   −1 2 2  .

Ejemplo 1.9 El vector 0, con todas sus coordenadas nulas, depende linealmen-te de cualquier conjunto de vectores. Basta tomar todos los coeficienlinealmen-tes 0 en la combinaci´on lineal.

Ejemplo 1.10 Cualquier vector depende linealmente de un conjunto de vectores que lo contenga. Basta tomar su coeficiente1, y todos los dem´as 0.

Hay otra forma de ver la dependencia lineal:

Diremos que un sistema (o conjunto) de vectores de la misma dimensi´on S = {v1, . . . ,vr} es linealmente dependiente, si existen r escalares α1, . . . , αr,

no todos nulos, tales que

α1v1+α2v2+· · ·+αrvr=0.

En caso contrario, es decir, si la ´unica forma de escribir el vector 0 como combi-naci´on lineal de estos vectores es tomando α1 =α2 =· · ·= αr = 0, diremos que el sistema S es linealmente independienteo libre.

La relaci´on entre esta definici´on de dependencia lineal y la anterior viene dada por el siguiente resultado.

Lema 1.11 Un sistema de vectores {v1, . . . ,vr} es linealmente dependiente si y s´olo si

uno de ellos es combinaci´on lineal de los dem´as.

Demostraci´on: Directa.

(18)

de vectores que se puede definir como combinación lineal de los vectores del sistema sigue siendo el mismo. Podr´ıamos, por tanto, ir eliminando vectores del sistema, hasta que no pudiéramos eliminar más; es decir, hasta que el sistema fuera linealmente independiente. En efecto, se tiene:

Teorema 1.12 Dado un sistema de r vectores S ={v1, . . . ,vr}, no todos nulos, se

veri-fica:

1. Existe al menos un sistema S0 ⊂ S linealmente independiente; y todos los dem´as

vectores de S dependen linealmente de los de S0.

2. Todos los sistemas S0 que satisfacen la condici´on anterior tienen el mismo n´umero

de elementos. A este n´umero lo llamamos rango de S.

Demostración: La demostración de 1 ya está esbozada arriba. Para demostrar 2, se supone que se tienen dos subsistemas libres, S1 y S2, con distinto número de vectores. Si

S2 tiene m´as vectores que S1, se demuestra que 0 puede escribirse como una combinaci´on

lineal no trivial de los elementos de S2, escribiendo ´estos como combinaci´on lineal de los

de S1, y usando que un sistema homog´eneo con menos ecuaciones que inc´ognitas tiene

soluciones no triviales, como veremos en el teorema de Rouch´e-Frobenius.

El rango de un sistema de vectores se puede tambi´en definir como sigue:

El rango de un sistema de vectores S es el tama˜no del mayor sistema libre que se puede formar con los vectores de S.

Ahora relacionaremos, de forma muy sencilla, los sistemas de vectores con las matrices. Simplemente, a un sistema dem vectores de dimensi´onn, le asociamos una matriz m×n, donde cada fila es un vector del sistema. As´ı, podemos definir:

Elrango de una matriz es el rango del sistema de vectores formado por sus filas.

Al rango de una matriz A lo denotaremos rg(A).

(19)

Lema 1.13 Las transformaciones elementales de filas no alteran del rango de una matriz.

Demostraci´on: Directa, usando la definici´on de rango de un sistema de vectores.

Gracias a este resultado, podremos calcular f´acilmente el rango de una matriz:

Teorema 1.14 Consideremos una matriz A∈ Mm×n, y sea A0 una matriz reducida

equi-valente por filas a A. Entonces, el rango de A es igual al n´umero de filas no nulas de A0.

Demostración: Sólo hay que ver que las filas no nulas de A0 forman un sistema libre. Se forma una combinación lineal igualada a cero, y se ve que las coordenadas de los pivotes sólo se pueden anular si el coeficiente de esa fila es nulo.

Nota: Acabamos de probar que el número de filas no nulas de la forma reducida por filas de una matriz, está determinado por la matriz. Además, cualquier forma escalonada de la misma matriz debe también tener el mismo número de filas no nulas.

1.4. Matrices elementales.

Una vez estudiadas las transformaciones elementales de filas de una matriz, y cómo se pueden utilizar para calcular el rango, veamos la relación entre estas transformaciones y la multiplicación de matrices.

Comenzamos definiendo tres tipos de matrices, que llamaremos matrices elementales, y que son el resultado de aplicar a la matriz identidad los tres tipos de transformaciones elementales. Definiremos matrices cuadradasn×n, luegoI ∈ Mn×nser´a la matriz identidad de dimensi´onn.

(20)

I al intercambiar sus filas iy j.

Tij =

                     1 . .. 1

0 · · · 1 ..

. 1 ...

..

. . .. ... ..

. 1 ...

1 · · · 0 1 . .. 1                      fila i fila j

A continuaci´on, dado i, 1 ≤ i≤ n, y un escalar α ∈K, definimos Mi(α) como la matriz que se obtiene de I al multiplicar su fila i porα.

Mi(α) =

           1 . .. 1 α 1 . .. 1            fila i

Finalmente, dados i, j (1≤i, j ≤n, i6=j), y un escalar α∈K, definimosPij(α) como la matriz que se obtiene de I al sumarle a la fila ila fila j multiplicada por α.

Pij(α) =

                     1 . .. 1

1 · · · α

..

. 1 ...

..

. . .. ... ..

. 1 ...

(21)

Podemos describir estos tres tipos de matrices de otra manera:

Tij coincide conI, salvo en los t´erminos: tii=tjj = 0, tij =tji = 1.

Mi(α) coincide con I salvo el el t´ermino: mii=α.

Pij(α) coincide con I salvo en el t´ermino: pij =α.

La relaci´on entre las transformaciones elementales de filas y el producto de matrices viene dada por el siguiente resultado:

Lema 1.15 Sea A∈ Mn×p. Se tiene:

1. TijA es la matriz que resulta al intercambiar las filas i yj de A.

2. Mi(α)A es la matriz que resulta al multiplicar por α la fila i de A.

3. Pij(α)A es la matriz que resulta al sumar a la fila i de A, la fila j multiplicada por

α.

Es decir, aplicar una transformaci´on elemental de filas a una matriz equivale a multiplicarla, a la izquierda, por la matriz elemental correspondiente.

Si seguimos aplicando transformaciones elementales, estaremos multiplicando m´as matrices elementales a la izquierda. As´ı podremos llegar hasta una forma reducida, equivalente por filas a la matriz A. Por tanto, se tiene:

Proposici´on 1.16 Sea A∈ Mm×n y sea A0 una forma reducida por filas de A. Entonces

existe una matriz P ∈ Mm×m, producto de matrices elementales, tal que A0 =P A.

Este resultado tiene varias aplicaciones. En primer lugar, podemos ya probar que la forma reducida por filas de una matriz es ´unica.

Lema 1.17 Si A, B ∈ Mm×n son dos matrices reducidas por filas, que son equivalentes

(22)

Demostración: Ya sabemos que las transformaciones elementales por filas no var´ıan el rango de una matriz, y que si una matriz es reducida por filas, entonces su rango es el número de filas distintas de cero que tiene. Por tanto, el número de filas distintas de cero de A y B es el mismo. Se demuestra entonces el resultado por inducción en n, el número de columnas. Sin = 1, entonces o bienA=B = 0, o bien a11 =b11= 1 y todas las demás

entradas son cero. En cualquier caso, A=B.

Supongamos el resultado cierto para menos de n columnas, con n > 1. Sean A0 y B0 las matrices formadas por las n−1 primeras columnas de A yB respectivamente. Ambas son reducidas por filas, pero además son equivalentes por filas, usando las mismas transforma-ciones que convierten A en B. Por tanto, por hipótesis de inducción, A0 =B0.

Sólo queda demostrar que la última columna deA y deB son iguales. Sear= rg(A0). Hay dos posiblidades: si la última columna deAcontiene un pivote, entoncesar+1,n = 1 y todas las demás entradas de la última columna son ceros. Pero en este caso rg(A) = rg(B) =r+1, luego la última columna de B también tiene un pivote en la misma posición, y por tanto

A=B.

Si, por contra, rg(A) = rg(B) =r, entonces la última columna de A y de B podrá tener sus r primeras entradas no nulas, y el resto deberán ser nulas. Llamemos An y Bn a la ´

ultima columna de A y B, respectivamente. Como A y B son equivalentes por filas, se tiene B =P A, donde P es producto de matrices elementales. M´as a´un, como A0 =B0, las columnas de los r pivotes de A y B coinciden. Pero al multiplicar P por la columna del primer pivote de A, obtenemos la columna del primer pivote de B. Es decir:

  

p11 · · · p1m ..

. ...

pm1 · · · pmm

        1 0 .. . 0      =      1 0 .. . 0      ⇒      p11 p21 .. .

pm1

     =      1 0 .. . 0      .

Lo mismo ocurre con la segunda columna de P (usando el segundo pivote), y as´ı sucesi-vamente, hasta usar los r pivotes. Por tanto, las r primeras columnas de P son iguales a las de la matriz identidad. Pero entonces, como P An =Bn, donde An y Bn s´olo tienen r entradas no nulas, un c´alculo directo muestra que An=Bn, y por tantoA =B.

Teorema 1.18 La forma reducida por filas de una matriz es ´unica.

(23)

1.5. Matrices invertibles.

Existe un tipo importante de matricescuadradas: aquellas que admiten una matriz inversa. La definici´on es la siguiente.

Sea A ∈ Mn×n. Se dice que A es invertible si existe otra matriz A−1 ∈ Mn×n tal que AA−1 =A−1A=I. En este caso, A−1 se llama la inversadeA.

Algunas propiedades de las matrices invertibles son las siguientes:

Teorema 1.19 Sean A, B ∈ Mn×n. Se verifica:

1. La inversa de A, si existe, es ´unica.

2. Si A y B son invertibles, entonces (AB)−1 =B−1A−1.

3. Si A es invertible, entonces At _tambi´_{en es invertible, y se tiene:} ₍_At₎−1 _{= (}_A−1₎t_.

4. Si A tiene una fila o una columna de ceros, entonces no es invertible.

Demostraci´on:

1. Si A0 y A00 son dos inversas deA, se tiene A0 =A0I =A0(AA00) = (A0A)A00 =IA00 =

A00.

2. Si multiplicamos AB, ya sea a la izquierda o a la derecha, por B−1_A−1_{, se obtiene}_I_,

luego esta matriz es la inversa de AB.

3. Se tiene (A−1₎t_At_{= (}_{A A}−1₎t ₌_It₌_I_{. La multiplicaci´}_{on por la derecha es an´}_aloga.

4. Si la fila i de A es de ceros, al multiplicarla a la derecha por cualquier matriz, ´esta tendr´a la fila i de ceros. Lo mismo ocurre con las columnas, multiplicando a la izquierda.

(24)

1. Si A1, A2,· · · , Ar ∈ Mn×n son invertibles, entonces su producto es invertible, y la

inversa es: (A1A2· · ·Ar)−1 =A−r1· · ·A

−1

2 A

−1 1 .

2. Si una matriz P es producto de matrices elementales, entonces P es invertible.

Demostraci´on: La primera propiedad se demuestra igual que la propiedad 2 del teorema anterior. La segunda, demostrando que las matrices elementales son invertibles, y aplicando la propiedad 1. De hecho, se tiene:

(Ti,j)−1 =Ti,j, (Mi(α))−1 =Mi(α−1), (Pi,j(α))−1 =Pi,j(−α).

Veamos ahora c´omo es la forma reducida por filas de una matriz invertible:

Teorema 1.21 Si A ∈ Mn×n es una matriz invertible, su forma reducida por filas es la

matriz identidad I.

Demostración: Si usamos el método de Gauss-Jordan para hallarA0, la forma reducida por filas deA, tenemos queA0 =P A, dondeP es producto de matrices elementales. Por el resultado anterior,P es invertible, peroA también lo es, por tantoA0 es invertible. Ahora bien, A0 no puede tener una fila de ceros, ya que en ese caso no ser´ıa invertible. Por tanto, en A0 hay n pivotes, y la única matriz n×n reducida por filas que puede tener n pivotes es I. Es decir, A0 =I.

Corolario 1.22 Una matriz A∈ Mn×n es invertible si y s´olo si rg(A) = n.

Demostraci´on: Si A es invertible, el teorema anterior nos dice que su forma reducida por filas esI, que tiene n filas no nulas, luego rg(A) =n.

Si rg(A) < n, entonces A0, la forma reducida por filas de A, tiene una fila de ceros, luego no es invertible. Pero sabemos que A0 =P A, por lo que, siA fuera invertible, A0 tambi´en lo ser´ıa.

(25)

producto de todas estas matrices, en orden inverso, forma la matriz P, tal que P A = I. Es decir, A−1 ₌ _P_{. Para calcular} _P _{(es decir,} _A−1_{), podemos multiplicar todas las}

ma-trices elementales utilizadas, o mejor a´un, ir aplicando a la matriz identidad las mismas operaciones elementales que le apliquemos a A. Por tanto tenemos:

M´etodo para calcular la inversade una matriz, usando matrices elementales:

A−1 es la matriz resultante de aplicar aI las mismas operaciones elementales que se le apliquen a A, para hallar su forma reducida por filas (usando el m´etodo de Gauss-Jordan).

Una forma sencilla de aplicar este método es el siguiente. Dada la matriz A ∈ Mn×n, se considera la matriz (A|I) ∈ Mn×2n que consiste en yuxtaponer la matriz A y la matriz identidad I ∈ Mn×n. A continuación, se le aplican a esta matriz las transformaciones elementales que transforman Aen I, y obtendremos, en las últimasn columnas, la matriz

A−1. Es decir, habremos transformado (A|I) en (I|A−1).

A continuaci´on mostraremos dos caracterizaciones m´as de las matrices invertibles, con ayuda de las transformaciones elementales:

Teorema 1.23 Una matriz A ∈ Mn×n es invertible si y s´olo si existe una matriz B ∈ Mn×n tal que AB =I.

Demostraci´on: SiA es invertible, basta tomar B =A−1.

Supongamos que existeBtal queAB=I. SiAno es invertible, entonces su forma reducida por filas, A0, tiene una fila de ceros. Adem´as,A0 =P A, donde P es producto de matrices elementales, y por tanto invertible. Pero entonces tendr´ıamos:

A0B = (P A)B =P(AB) = P I =P,

donde A0B tiene una fila de ceros (al tenerla A0), y P no tiene una fila de ceros (por ser invertible). Contradicci´on.

Teorema 1.24 Una matriz A ∈ Mn×n es invertible si y s´olo si es producto de matrices

(26)

Demostraci´on: Si A es invertible, entonces A−1 tambi´en lo es. Por lo tanto existe una matriz P, producto de matrices elementales, tal que P A−1 ₌ _I _{(ya que} _I _{es la forma}

reducida por filas de A−1_{). Pero entonces} _P _{es la inversa de} _A−1_{, es decir,} _P ₌_A_.

Corolario 1.25 Si A∈ Mm×n, y P ∈ Mn×n es una matriz invertible, entonces rg(A) =

rg(P A).

Demostraci´on: Como P es invertible, es producto de matrices elementales. Por tanto,

P A se obtiene de A al aplicarle una serie de transformaciones elementales, y por tanto deben tener el mismo rango.

1.6. Transformaciones elementales de columnas.

En esta sección veremos que todas las propiedades que hemos estudiado sobre las filas de una matriz, son también ciertas para sus columnas. Basta trasponer todas las matrices que encontremos. As´ı, se definen las transformaciones elementales de columnas de forma análoga a las de filas, y se definen las matrices escalonadas o reducidas por columnas, como las traspuestas de las escalonadas o reducidas por filas.

Tambi´en se tienen las matrices elementales por columnas que, curiosamente, son las mismas que las de filas, ya que la traspuesta de una matriz elemental es otra matriz elemental. La correspondencia de transformaciones y matrices es la siguiente:

1. Matriz que resulta de I al intercambiar las columnasi y j: Ti,j.

2. Matriz que resulta de I al multiplicar porα la columna i: Mi(α).

3. Matriz que resulta de I al sumarle a la columna i la columna j multiplicada por α:

Pj,i(α).

Hay que tener cuidado con la última matriz, que es la única que cambia al hablar de colum-nas en vez de filas. Esto es debido a que (Pi,j(α))t =Pj,i(α), mientras que las traspuestas de las demás no cambian.

(27)

elemental correspondiente. Esto es debido a la propiedad (AB)t=BtAt, con lo que, cuando antes multiplic´abamos a izquierda, ahora hay que hacerlo a derecha.

Por lo dem´as, todas las propiedades anteriores se verifican, cambiando filas por columnas. El ´unico problema que tenemos es que hemos definido elrangode una matriz usando filas. Veamos que, si lo definimos usando columnas, el rango sigue siendo el mismo.

Lema 1.26 Si A ∈ Mm×n, y Q ∈ Mn×n es una matriz invertible, entonces rg(A) =

rg(AQ).

Demostración: Sea r el rango de A, y sea A0 la forma reducida por filas de A. Existe entonces una matriz invertible P tal que A0 = P A. Por otra parte, se tiene rg(A0) ≥ rg(A0Q), ya que las últimasm−r filas de A0 son nulas, y por tanto también lo son las de

A0Q. Pero entonces:

rg(A) = rg(A0)≥rg(A0Q) = rg(P AQ) = rg(AQ).

La ´ultima igualdad se tiene por el corolario 1.25. Tenemos entonces rg(A) ≥ rg(AQ). La desigualdad opuesta se obtiene f´acilmente, aplicando el mismo razonamiento a las matrices

AQ y Q−1_{. Es decir, se tiene rg(}_AQ₎_≥_rg(_AQQ−1_{) = rg(}_A_).

Corolario 1.27 Si dos matrices A y B son equivalentes por columnas, entonces rg(A) =

rg(B).

Teorema 1.28 El rango de una matriz es el n´umero de columnas de su forma reducida por columnas.

Demostración: Sea A ∈ Mm×n, y A0 su forma reducida por columnas. Sabemos que existe una matriz invertibleQtal queA0 =AQ, y por el corolario anterior: rg(A) = rg(A0). Tenemos que probar entonces que el rango deA0 es igual al número de columnas no nulas que tiene, digamosr. Para ello, hallaremos la forma reducida por filas deA0. Cada columna no nula deA0contiene un pivote. Mediante transformaciones de filas, llevamos estos pivotes a las posiciones (1,1),(2,2), . . . ,(r, r). Encima de estos pivotes sólo hay ceros, por tanto, las transformaciones de filas que anulan las entradas inferiores, no alteran estos pivotes. En conclusión, la forma reducida por filas de A0 es exactamente:

Ir 0 0 0

(28)

donde Ir es la matriz identidad de tama˜nor. Por tanto, rg(A) = rg(A0) = r.

Ahora ya podemos enunciar, usando columnas, todos los resultados que vimos por filas. Las demostraciones son totalmente an´alogas al caso de filas.

Teorema 1.29 El rango de una matriz es el rango del sistema de vectores formado por sus columnas.

Teorema 1.30 La forma reducida por columnas de una matriz es ´unica.

Teorema 1.31 Si A ∈ Mn×n es una matriz invertible, su forma reducida por columnas

es la matriz identidad I.

En definitiva, da igual usar filas o columnas para estudiar el rango o la invertibilidad de una matriz. Una ´ultima consecuencia de esto es el siguiente resultado:

Teorema 1.32 Dada A ∈ Mm×n, se tiene rg(At) = rg(A).

Demostración: La forma reducida por columnas de At es la traspuesta de la forma reducida por filas de A. Por tanto, el número de columnas no nulas una (el rango de At) es igual al número de filas no nulas de la otra (el rango deA).

1.7. Determinantes:

definici´

on

y

propiedades.

Teorema

de

Cauchy-Binet.

Para saber lo que son los determinantes, volvamos a estudiar vectores en el plano. Su-pongamos que tenemos dos vectores v1 = (a, b) y v2 = (c, d). Estos vectores definen un

paralelogramo, cuyos v´ertices son los puntos (0,0), (a, b), (c, d) y (a+c, b+d). Pues bien, el´areade este paralelogramo es:

A=ad−bc.

(29)

La base de este rectángulo es a. Por tanto, para hallar su área sólo hay que conocer su altura. Pero la altura nos la da el punto de corte, con el eje y, de la recta que une (c, d) con (a+c, b+d). O más fácilmente, de la recta que pasa por (c, d) con dirección (a, b). La ecuación de esta recta es:

y−d= b

a(x−c).

Como buscamos el punto de corte con el eje y, imponemos que x = 0, y obtenemos la altura:

y=d−bc

a.

Por tanto, el ´area del paralelep´ıpedo original es:

A=a(d−bc

a) = ad−bc.

Podemos entonces definir el determinantede una matriz 2×2, como el ´area del parale-logramo definido por sus vectores fila. El determinante de una matrizA se denota detA, o bien cambiando los par´entesis que delimitan la matriz por segmentos verticales. Es decir:

detA=

a b c d

=ad−bc.

Esta definición se puede extender a matrices de tamaño mayor. Por ejemplo, el determi-nante de una matriz 3×3 es el volumen del paralelep´ıpedo determinado por sus vectores filas. En este caso, se tiene la conocida fórmula:

a1 b1 c1

a2 b2 c2

a3 b3 c3

=a1b2c3+a2b3c1+a3b1c2−a3b2c1−a2b1c3−a1b3c2.

Si agrupamos estos sumandos, sacando factor com´un las variables a1, b1, c1, obtenemos lo

a2 b2 c2

a3 b3 c3

=a1

b2 c2

b3 c3

−b1

a2 c2

a3 c3

+c1

a2 b2

a3 b3

(30)

Es decir, podemos definir los determinantes de matrices 3× 3 usando los determinan-tes de matrices 2×2. Este proceso se puede generalizar, dando lugar a la definici´on del determinante de una matriz n×n. Primero hay que definir lo siguiente:

Dada una matriz cuadrada A ∈ Mn×n, llamamos submatriz complementaria de aij, y la denotamos Mij, a la matriz que se obtiene de A al eliminar su fila i y su columna j.

Llamamos menor-(i,j) deA al determinante det(Mij).

Usando estos menores, podemos definir el determinante de una matriz 3×3 como:

det(A) =

a11 a12 a13

a21 a22 a23

a31 a32 a33

=a11det(M11)−a12det(M12) +a13det(M13).

Para ahorrarnos notaci´on y problemas de signos, definimos lo siguiente:

Dada una matriz cuadrada A ∈ Mn×n, llamamos adjunto o cofactor del ele-mento aij al escalar Aij = (−1)i+jdet(Mij).

El factor (−1)i+j _{simplemente nos da un signo, que var´ıa si se aumenta}_i_o_j _{en una unidad.} Por tanto, podemos volver a definir el determinante de una matriz 3×3 como:

det(A) = a11A11+a12A12+a13A13.

Recordemos que, aunque usamos letras mayúsculas por ser la notación clásica, los adjun-tos son escalares.

Observemos que el adjunto no está bien definido, porque sólo sabemos la definición de los determinantes de matrices 2×2 o 3×3. Pero ahora ya podemos generalizar sin problemas el concepto de determinante:

Dada una matriz A = (a11) ∈ M1×1, se define el determinante de A como

det(A) = det(a11) =a11.

Dada una matriz cuadrada A∈ Mn×n, conn >1, se llama determinantedeA,

y se denota det(A) o |A|, al escalar definido por:

(31)

Esta forma de definir el determinante se llama desarrollo por la primera fila. Observe-mos que, ahora s´ı, tanto los determinantes como los adjuntos están bien definidos, ya que para definir el determinante de una matriz de ordenn(es decir,n×n), se necesitan adjuntos de ordenn−1. Para éstos, se necesitan determinantes de ordenn−1, y as´ı sucesivamente, hasta llegar a los determinantes de orden 1, que están bien definidos por s´ı mismos. Esto es lo que se llama una definiciónrecurrente.

En este tema veremos que los determinantes tienen muchas aplicaciones. Ya hemos visto, por ejemplo, que sirven para calcular áreas de trapecios y volúmenes de paralelep´ıpedos. Pero también se pueden usar para resolver sistemas lineales, comprobar si una matriz es invertible, e incluso calcular su inversa. Comencemos viendo algunas propiedades impor-tantes sobre las columnas de una matriz y su determinante.

Proposici´on 1.33 Sea A una matriz cuadrada n×n. Se tiene:

1. Si en A se intercambian dos columnas, el determinante cambia de signo.

2. Si en A se multiplica una columna por un escalar α, el determinante queda multipli-cado por α.

3. Si A tiene una columna de ceros, entonces det(A) = 0.

4. Si descomponemos la columna j de A en suma de dos vectores, v y w, y si llama-mos A0 y A00 a las matrices que resultan de A al sustituir la columna j por v y w, respectivamente, entonces det(A) = det(A0) + det(A00).

5. Si A tiene dos columnas iguales, entonces det(A) = 0.

6. Si a una columna deA le sumamos otra multiplicada por un escalar, su determinante no cambia.

Demostraci´on:

1. Esta propiedad se demuestra por inducci´on en n. Si n = 1 la propiedad no tiene sentido. Si n = 2, se verifica claramente. Supongamos que es cierta para n −1 y prob´emosla para n > 2. Supongamos, en primer lugar, que las columnas que se intercambian son consecutivas:j yj+1, y seaA0 la matriz resultante de intercambiar estas dos columnas. En ese caso, las submatrices complementarias M1k, con k 6=

(32)

Por otra parte, M1j resulta de eliminar la fila 1 y la columna j de A, que es lo mismo que eliminar la fila 1 y la columna j + 1 de A0. Es decir, M1j = M10j+1.

An´alogamente, M1j+1 =M10j. Pero entonces, como los ´ındices var´ıan en una unidad, se tiene: A1j = −A01j+1, y A1j+1 = −A01j. Adem´as, a1j = a01j+1 y a1j+1 = a01j. Por tanto,

det(A) = X k6=j,j+1

a1kA1k

!

+a1jA1j +a1j+1A1j+1 =

− X k6=j,j+1

a0₁_kA0₁_k

!

−a0₁_j₊₁A0₁_j₊₁−a0₁_jA0₁_j =−det(A0).

Si, por último, las dos columnas intercambiadas no son consecutivas, observemos que podemos intercambiarlas mediante una sucesión de intercambios de columnas consecutivas (que llamaremos trasposiciones). Sólo hay que ver que el número de estos intercambios es impar. Sean i y j, con i < j, las columnas intercambiadas. En primer lugar, llevamos la columnai a la posiciónj mediantej−itrasposiciones. La columnajhabrá quedado en la posiciónj−1, luego harán faltaj−1−itrasposiciones para llevarla a la posicióni. Una vez hecho esto, todas las columnas están en su lugar, salvo la i y la j que están intercambiadas. Hemos usado, 2i+ 2j −1 trasposiciones, luego hemos cambiado el signo de la matriz un número impar de veces. Por tanto, det(A) = −det(A0).

2. El resultado es evidente para n = 1. Supondremos que es cierto para n −1, y lo probaremos para n, con n > 1. Sea A0 la matriz que resulta al multiplicar por α la columna j de A. Se tiene a0₁_j = αa1j, mientras que M1j = M10j, donde esta ´ultima matriz es la submatriz complementaria dea1,j enA. Por otra parte, sik6=j, tenemos

a0₁_k =a1k, mientras queM10kse obtiene deM1kal multiplicar una de sus columnas por

α. Por hip´otesis de inducci´on, tenemos det(M₁0_k) =αdet(M1k), es decir,A01k =αA1k. Por tanto,

det(A0) =a0₁_jA0₁_j +X k6=j

a0₁_kA0₁_k =αa1jA1j +

X

k6=j

a1kαA1k =αdet(A).

3. SeaA0la matriz que resulta al multiplicar por 0 la columna de ceros deA. Obviamente

A0 =A, pero adem´as, al haber multiplicado por 0 una columna, tenemos det(A0) = 0 det(A) = 0. Es decir, det(A) = 0.

4. Seanv= (v1, . . . , vn) yw= (w1, . . . , wn). La propiedad es cierta paran = 1. Como de

costumbre usaremos la inducción, suponiendo que el resultado es cierto para n−1, con n > 1. Al descomponer la columna j, tenemos: a1j = v1 +w1 = a01j +a001j, y ademásM1j =M10j =M100j, donde estas dos últimas matrices son las correspondientes matrices complementarias de A0 y A00, respectivamente. Pero también, para k 6= j, se tiene a1k = a01k = a

00

1k, y adem´as M

0

1k y M

00

(33)

al descomponer en dos sumandos una columna de M1k. Por hip´otesis de inducci´on: det(M1k) = det(M10k) + det(M

00

1k), luegoA1k =A01k+A

00

1k. En resumen:

det(A) = a1jA1j +

X

k6=j

a1kA1k = (a01j+a

00

1j)A1j+

X

k6=j

a1k(A01k+A

00

1k)

= a0₁_jA0₁_j+X k6=j

a0₁_kA0₁_k

!

+ a00₁_jA00₁_j +X k6=j

a00₁_kA00₁_k

!

= det(A0) + det(A00).

5. Seg´un la propiedad 1, si intercambiamos las dos columnas iguales, obtenemos una matriz A0 tal que det(A0) =−det(A). Pero claramente A0 =A, por tanto det(A) = −det(A), luego det(A) = 0.

6. Sea B la matriz que resulta de A al sumarle, a su columna i, la columna j multi-plicada por α. Seg´un la propiedad 4, det(B) = det(A) + det(A0), donde la columna

i de A0 es igual a la columna j multiplicada por α. Pero entonces, por la propie-dad 2, det(A0) = αdet(A00), donde A00 tiene dos columnas iguales, es decir, por la propiedad 5, det(A00) = 0. Uniendo todo esto, se tiene:

det(B) = det(A) + det(A0) = det(A) +αdet(A00) = det(A) + 0 = det(A).

Gracias al resultado anterior, hemos visto cómo se comporta el determinante de una matriz si le aplicamos transformaciones elementales de columnas (propiedades 1, 2 y 6). Esto nos va a ayudar a obtener fácilmente muchas más propiedades de los determinantes.

Lema 1.34 Consideremos la matriz identidad I ∈ Mn×n. Se tiene: det(I) = 1.

Demostración: Directa, por inducción en n, a partir de la definición.

Una matriz A∈ Mn×n se dice singularsi det(A) = 0. En caso contrario se dice no singular.

Teorema 1.35 Una matriz A ∈ Mn×n es no singular si y s´olo si rg(A) = n, es decir, si

(34)

Demostraci´on: Si A es no singular, es decir, det(A) 6= 0, aplicar transformaciones elementales de columnas nunca puede anular el determinante, ya que, o bien cambia de signo, o bien se multiplica por un escalar no nulo, o bien se mantiene. Por tanto, la reducida por columnas de A tiene determinante no nulo. Pero esta reducida, o bien es la identidad, con lo que rg(A) =n y se tiene el resultado, o bien tiene una columna de ceros, con lo que su determinante ser´ıa cero, y llegar´ıamos a una contradicci´on.

Si, por otra parte, A tiene rango n, entonces su forma reducida por columnas es I. Por tanto, aplicando una serie de transformaciones elementales de columnas a A, obtenemos una matriz, I, cuyo determinante vale 1. Ahora bien, si A fuera singular, es decir, si det(A) = 0, al aplicar cualquier transformaci´on elemental el determinante seguir´ıa siendo cero, luego es imposible.

Ahora veamos c´omo se comporta el determinante con respecto al producto de matrices. Primero estudiaremos las matrices elementales:

Proposici´on 1.36 Los determinantes de las matrices elementales son los siguientes:

1. det(Tij) = −1.

2. det(Mi(α)) = α.

3. det(Pij(α)) = 1.

Demostraci´on: La matriz Tij se obtiene al permutar dos columnas de I, luego su de-terminante es el opuesto al de I, es decir, −1. La matriz Mi(α) se obtiene al multiplicar la columna i de I por α, luego su determinante es αdet(I) = α. Por ´ultimo, la matriz

Pij(α) resulta de sumarle, a la columna j deI, la columna i multiplicada por α, luego su determinante es igual al de I, es decir, 1.

Proposici´on 1.37 Si A ∈ Mn×n es una matriz cualquiera, y P1,· · ·, Pr ∈ Mn×n son

matrices elementales, entonces det(AP1· · ·Pr) = det(A) det(P1)· · ·det(Pr).

Demostraci´on: Lo haremos por inducci´on en r. Si r= 1, la matriz AP1 es el resultado

de aplicar a A la transformaci´on elemental de columnas correspondiente a P1. Por tanto,

el resultado se obtiene de las proposiciones 1.33 y 1.36.

Si r >2 y suponemos el resultado cierto para menos de r matrices elementales, sea P0 =

(35)

Pero, de nuevo por hip´otesis de inducci´on, det(AP0) = det(A) det(P1)· · ·det(Pr−1), de

donde se sigue el resultado.

Corolario 1.38 Si P ∈ Mn×n es producto de matrices elementales: P =P1· · ·Pr,

enton-ces det(P) = det(P1)· · ·det(Pr).

Demostraci´on: Este es un caso particular del resultado anterior, tomando A = I, y recordando que det(I) = 1.

Teorema 1.39 (Teorema de Cauchy-Binet) Dadas A, B ∈ Mn×n, se tiene:

det(AB) = det(A) det(B).

Demostraci´on: Supongamos primero que B es singular. En ese caso det(B) = 0, y B0, la forma reducida por columnas de B, tiene una columna de ceros. Pero B0 =BP, donde

P es producto de matrices elementales, luegoB =B0P−1_{, donde} _P−1 _tambi´_{en es producto}

de matrices elementales (recordemos que la inversa de una matriz elemental tambi´en es una matriz elemental). Por tanto, AB =AB0P−1. Como B0 tiene una columna de ceros,

AB0 tambi´en la tiene, por tanto det(AB0) = 0. Pero sabemos que, al ser P−1 _producto

de matrices elementales, det(AB) = det(AB0P−1_{) = det(}_AB0_{) det(}_P−1_{) = 0. Por tanto,}

det(AB) = 0, y el resultado es cierto en este caso.

Supongamos entonces que B es no singular. Entonces tiene rango n, luego es producto de matrices elementales:B =P1· · ·Pr. Pero en este caso, la proposici´on 1.37 y el corolario 1.38 nos dicen que det(AB) = det(A) det(P1)· · ·det(Pr) = det(A) det(B).

1.8. Desarrollo por filas y columnas. Adjunta e inversa.

Hasta ahora hemos visto una única definición del determinante de una matriz: su desarrollo por la primera fila. En esta sección veremos otras definiciones alternativas, desarrollando por cualquier fila o cualquier columna, y mostraremos que todas las propiedades que hemos visto para columnas se verifican también para filas. Para ello, vamos a empezar estudiando la trasposición de matrices.

(36)

Demostraci´on: Recordemos que (Tij)t=Tij y (Mi(α))t =Mi(α), luego para estos tipos de matrices, el resultado es evidente. Por otra parte, (Pij(α))t =Pji(α), pero det(Pij(α)) = det(Pji(α)) = 1, luego el resultado es cierto.

Teorema 1.41 Dada A ∈ Mn×n, se tiene det(At) = det(A).

Demostraci´on: Si A es singular, entonces rg(A) = rg(At) < n, por lo que At tambi´en es singular, es decir, det(A) = det(At_{) = 0.}

Si A es no singular, entonces es producto de matrices elementales: A = P1· · ·Pr. Pero entonces

det(At) = det((P1· · ·Pr)t) = det(Prt· · ·P t

1) = det(P

t

r)· · ·det(P t

1)

= det(Pr)· · ·det(P1) = det(P1)· · ·det(Pr) = det(A).

Este teorema nos permite volver a enunciar, para filas, todas las propiedades que vimos sobre columnas de una matriz. S´olo necesitamos darnos cuenta que, las propiedades de las columnas deA son las propiedades de las filas de At_{. As´ı, se demuestran de forma directa} las siguientes propiedades:

Proposici´on 1.42 Sea A una matriz cuadrada n×n. Se tiene:

1. Si en A se intercambian dos filas, el determinante cambia de signo.

2. Si en A se multiplica una fila por un escalar α, el determinante queda multiplicado por α.

3. Si A tiene una fila de ceros, entonces det(A) = 0.

4. Si descomponemos la fila ide A en suma de dos vectores, v yw, y si llamamos A0 y A00 a las matrices que resultan de A al sustituir la fila i por v y w, respectivamente, entonces det(A) = det(A0) + det(A00).

5. Si A tiene dos filas iguales, entonces det(A) = 0.

(37)

Por tanto, las transformaciones elementales de filas de una matriz act´uan sobre el determi-nante de forma an´aloga a las transformaciones de columnas. Ya podemos entonces definir el determinante de una matriz usando el desarrollo por cualquier fila o columna.

Teorema 1.43 Dada A ∈ Mn×n, se tiene, para cualesquiera i, j, (1≤i, j ≤n):

1. det(A) = ai1Ai1+ai2Ai2+· · ·+ainAin (desarrollo por la fila i).

2. det(A) = a1jA1j +a2jA2j +· · ·+anjAnj (desarrollo por la columna j).

Demostraci´on: Demostremos primero el desarrollo por la filai. SeaA0 la matriz que se obtiene de A al trasladar su fila i hasta la primera posici´on. Para ello, hay que usar i−1 trasposiciones de filas, por tanto: det(A) = (−1)i−1_det(_A0_{). Ahora bien,} _a0

1j = aij para todo j. Adem´as, M₁0_j = Mij, donde Mij0 es la matriz complementaria de a

0

i,j en A

0_{. Pero}

entonces

A0₁_j = (−1)1+j_det(_M0

1j) = (−1)

1+j_det(_M

ij) = (−1)1+j(−1)−i−jAij = (−1)1−iAij,

es decir,Aij = (−1)i−1A01j. De todos estos resultados, se obtiene:

det(A) = (−1)i−1_det(_A0

) = (−1)i−1₍_a0

11A

0

11+a

0

12A

0

12+· · ·+a

0

1nA

0

1n) = a0₁₁(−1)i−1_A0

11+a

0

12(−1)

i−1_A0

12+· · ·+a

0

1n(−1) i−1_A0

1n = ai1Ai1+ai2Ai2+· · ·+ainAin.

El desarrollo por columnas se demuestra simplemente usando traspuestas. Como se tiene

at

ij = aji, tambi´en Atij = Aji, y adem´as det(At) = det(A), el desarrollo por la columna j deA es equivalente al desarrollo por la fila j de At_.

Veamos ahora c´omo estas nuevas definiciones del determinante nos pueden dar otra forma de construir la matriz inversa.

DadaA ∈ Mn×n, se define la matriz adjuntadeA, adj(A), como la matriz cuya entrada (i, j) es el adjunto Ai,j.

Proposici´on 1.44 Dada A∈ Mn×n, se tiene A−1 = 1

(38)

Demostraci´on: Para ver que el resultado es cierto, calcularemos la matriz B =

A adj(A)t_{. Primero, para} _i _{= 1}_{. . . , n}_{, el elemento} _b

ii, de la diagonal principal de B, es el siguiente:

bii = (filai de A)(columna i de adj(A)t) =ai1Ai1+· · ·+ainAin.

Pero esto es el desarrollo, por la filai, del determinante deA. Por tanto, bii = det(A), para

i= 1, . . . , n.

Ahora, si i6=j, tenemos:

bij = (fila ide A)(columna j de adj(A)t) = ai1Aj1 +· · ·+ainAjn.

Ahora bien, seaA0 la matriz que se obtiene deAal sustituir su fila j por la filai. Es decir,

A0 tiene dos filas repetidas, la i y la j, por tanto det(A0) = 0. Pero el desarrollo de este determinante por la fila j es precisamente el que acabamos de obtener. Es decir, bij = 0. Por tanto, acabamos de demostrar que

B =Aadj(A)t =

    

det(A) 0

det(A) . ..

0 det(A)

    

Si dividimos esta matriz por det(A), obtenemos la matriz identidad. Por tanto,

1

det(A) Aadj(A)

t₌_I _⇒ _A−1 ₌ 1

det(A)adj(A) t_.

1.9. C´

alculo de determinantes.

Hasta ahora, las única manera que conocemos de calcular un determinante, consiste en desarrollarlo por una fila o una columna de la matriz. Sin embargo, este procedimiento de cálculo no es nada eficaz, ya que, para calcular el determinante de una matriz n×n, hay que calcular n determinantes de matrices (n−1)×(n−1), y para cada uno de estos, hay que calcular (n−1) determinantes de matrices (n−2)×(n−2), y as´ı sucesivamente. Por tanto, el número de operaciones que hay que efectuar es del orden de n!.

(39)

Se dice que A ∈ Mn×n estriangular inferior si aij = 0 para todo i < j. Se dice que A ∈ Mn×n estriangular superior si aij = 0 para todo i > j.

El siguiente resultado es evidente a partir de las definiciones:

Proposici´on 1.45 Se tiene:

Una matriz cuadrada escalonada por filas es triangular superior.

Una matriz cuadrada escalonada por columnas es triangular inferior.

La traspuesta de una matriz triangular superior es triangular inferior, y viceversa.

Calculemos ahora el determinante de las matrices triangulares:

Proposici´on 1.46 Si A ∈ Mn×n es triangular inferior o superior, entonces su

deter-minante es el producto de los elementos de su diagonal principal. Es decir, det(A) =

a11a22· · ·ann.

Demostraci´on: Procedemos por inducci´on en n. El resultado es claramente cierto si

n= 1 o n = 2. Supongamos entonces que n >2, y que el resultado es cierto paran−1.

Supongamos primero que A es triangular inferior. Entonces, todos los elementos de su primera fila son nulos salvo, a lo sumo,a11. Por tanto, det(A) = a11A11 =a11det(M11). Pero

M11es también triangular inferior, y los elementos de su diagonal principal sona22,· · · , ann. Por tanto, por hipótesis de inducción, det(M11) = a22· · ·ann, y el resultado es cierto.

Por ´ultimo, siAes triangular superior, la primera columna deM1j es una columna de ceros, para todoj = 2, . . . , n. Por tanto,A1j = 0 sij >1. Luego det(A) = a11A11 =a11det(M11).

Pero M11 es triangular superior, as´ı que podemos aplicar, igual que antes, la hip´otesis de

inducci´on para obtener el resultado.

(40)

M´etodo para calcular determinantes: Dada A ∈ Mn×n, usamos el m´ eto-do de eliminaci´on de Gauss para hallar una forma escalonada A0 de A. Vamos recordando, durante el proceso, las transformaciones elementales utilizadas. El determinante de A es el producto de los determinantes de las matrices elemen-tales correspondientes, multiplicado por los elementos de la diagonal principal de

A0.

Es decir, si A=P1· · ·PrA0, donde P1, . . . , Pr son las matrices elementales que se emplean en el m´etodo de Gauss, yA0 es escalonada por filas, se tiene:

det(A) = det(P1)· · ·det(Pr) det(A0),

pero los determinantes de cada Pi son conocidos y, como A0 es triangular superior, su determinante es muy f´acil de calcular. As´ı, tenemos:

det(A) = det(P1)· · ·det(Pr)a011· · ·a

0

nn.

Nota: En la práctica, el cálculo del determinante de A ∈ Mn×n se efectúa eligiendo una fila o columna, preferiblemente que tenga algún 0 o algún 1, y consiguiendo mediante transformaciones elementales que todas las entradas de esa fila o esa columna sean nulas, excepto una (como máximo). Entonces se desarrolla el determinante por esa fila o columna, con lo que el cálculo queda reducido a una matriz más pequeña que la anterior. Continuando este proceso, obteniendo a cada paso una matriz más pequeña, se termina simplemente calculando el determinante de una matriz 2×2.

1.10. Rango y menores. M´

etodo del orlado.

En esta sección daremos una nueva caracterización del rango de una matriz, utilizando los determinantes. Ya sabemos que, dada una matriz A ∈ Mn×n, det(A) 6= 0 si y sólo si rg(A) =n. Pero no sabemos nada sobre el rango de A si det(A) = 0, o si la matriz no es cuadrada. Para poder precisar más, definiremos los menores de una matriz, de los que ya vimos algunos ejemplos en secciones precedentes.

Dada A ∈ Mm×n, y dadas p filas 1 ≤ i1 < i2 < · · · < ip ≤ m y p columnas 1 ≤ j1 < j2 < · · · < jp ≤ n, se llama submatriz cuadrada de orden p de A, determinada por estas pfilas y pcolumnas, a la matriz M cuyas entradas son los elementos de A que pertenecen, a la vez, a una de estas filas y a una de estas columnas.

(41)

Aunque A no sea cuadrada, notemos que las submatrices cuadradas de orden p s´ı lo son, y por tanto se puede calcular su determinante. Podemos entonces definir el rango de una matriz en funci´on de sus menores.

Teorema 1.47 Dada A∈ Mm×n, entonces rg(A) =r si y s´olo si A tiene alg´un menor no

nulo de orden r, y todos los menores de A de orden mayor que r son nulos.

Demostraci´on: Supongamos que rg(A) = r. Entonces sabemos que tiene r filas lineal-mente independientes. Sean i1, . . . , ir dichas filas. La matriz A0 formada por estas r filas tiene, por tanto rango r. Pero eso quiere decir que A0 tiene r columnas linealmente inde-pendientes, digamos j1, . . . , jr. Por tanto, la matriz M formada por estas columnas de A0 tiene rango r. Pero adem´as, M es una submatriz cuadrada de A, de orden r, asociada a estas filas y estas columnas; y como tiene rango r, su determinante es no nulo. Por tanto, existe un menor no nulo de ordenr.

Si hubiera un menor no nulo de ordenp > r, las filas correspondientes a ese menor formar´ıan una matrizA0 ∈ Mp×n, que tendr´ıa una submatrizp×pde determinante no nulo. Es decir, A0 tendr´ıap columnas linealmente independientes. En ese caso, A0 tendr´ıa rango p, luego sus p filas ser´ıan linealmente independientes, y por tanto, habr´ıa p filas de A linealmente independientes. Esto contradice el hecho de que rg(A) = r.

Supongamos ahora que A tiene alg´un menor no nulo de orden r, y todos los menores de

A de orden mayor que r son nulos. Seg´un hemos demostrado antes, si rg(A) = p > r, entonces Atendr´ıa un menor no nulo de orden p, lo cual es imposible. Y si rg(A) =q < r, entonces todos los menores deA de orden mayor que q ser´ıan nulos. Pero esto tambi´en es imposible, ya que sabemos que tiene un menor no nulo de orden r.

(42)

M´etodo del orlado, para calcular el rango de una matrizA ∈ Mm×n.

1. Si A es una matriz de ceros, entonces rg(A) = 0.

2. Si no, elegimos un elementoai1j1 6= 0.

3. Buscamos otra filai2, y otra columnaj2, tal que el menor de orden 2

corres-pondiente a las filas i1, i2 y a las columnas j1, j2 sea no nulo. Si no existe,

entonces rg(A) = 1. Si existe, recordamos los datos (i1, i2; j1, j2).

4. Continuamos con el mismo proceso: si conocemos los ´ındices (i1,· · · , ip; j1,· · · , jp) tales que el menor correspondiente es no nulo, buscamos una fila ip+1, y una columna jp+1, tales que el menor asociado a

(i1,· · · , ip+1; j1,· · · , jp+1) sea no nulo. Si no existe, entonces rg(A) =p. Si

existe, repetimos este paso, para un orden mayor.

5. En alg´un momento no podremos seguir aumentando el orden, y habremos obtenido el rango de A.

Proposici´on 1.48 El m´etodo del orlado funciona.

Demostraci´on: No es evidente que este m´etodo funciona: Hay que demostrar que, dada una matriz A∈ Mm×n, si tenemos un menor no nulo de ordenp, y el rango de Aes mayor que p, entonces existe un menor no nulo de orden p+ 1 que contiene al anterior.

Supongamos entonces que rg(A)> p, y que tenemos un menor no nulo de ordenp. Laspfilas correspondientes a ese menor, digamos i1, . . . , ip, son entonces linealmente independientes, y tambi´en lo son las p columnas, j1, . . . , jp. Sea i /∈ {i1, . . . , ip}. Supongamos que la fila i depende linealmente de las filas i1, . . . , ip. Es decir, si llamamos fi al vector determinado

por la filai, tendremos:

fi =α1fi1 +· · ·+αpfip.

En ese caso, podemos transformar la filai, mediante transformaciones elementales de filas (rest´andole cada filafik multiplicada por αk), hasta convertirla en una fila de ceros. Si esto

ocurriera para todoi /∈ {i1, . . . , ip}, obtendr´ıamos una matriz A0, equivalente por filas aA

(luego rg(A0) = rg(A)), que s´olo tendr´ıa p filas distintas de cero. En ese caso tendr´ıamos rg(A) =p, lo que no es posible.

(43)

p columnas,j1, . . . , jp que son linealmente independientes. Ahora podemos proceder como antes: si una columnaj /∈ {j1, . . . , jp}depende linealmente de estas pcolumnas, podremos hacerla nula mediante transformaciones elementales por columnas. Si esto pasara para todo

j /∈ {j1, . . . , jp}, obtendr´ıamos una matriz A000 equivalente por columnas a A00, con rango

p. Como esto es imposible, existir´a una columna jp+1 que no dependa linealmente de la

columnas j1, . . . , jp, y por tanto el determinante de la submatriz cuadrada formada por las filas i1, . . . , ip+1, y las columnasj1, . . . , jp+1 deA, es no nulo.

1.11. Sistemas de ecuaciones lineales.

Comenzaremos viendo un ejemplo del tipo de ecuaciones que vamos a estudiar:

2x+y = 5

x−y= 1

Se trata de un sistema lineal de dos ecuaciones con dos inc´ognitas. Este sistema se puede ver desde varias perspectivas:

Desde el punto de vista geom´etrico, cada una de las dos ecuaciones representa una recta en el plano. Resolver el sistema consiste en hallar (si los hay) los puntos de corte de las dos rectas. Esa es la raz´on de que estos sistema se llamenlineales.

Desde el punto de vista algebraico, el problema consiste simplemente en hallar dos números,xey, que satisfagan las dos igualdades. Las ecuaciones son linealesporque cada término (excepto los términos independientes) tiene grado 1.

Si nos quedamos en el marco algebraico, nada nos impide generalizar el concepto de ecua-ción lineal a más de dos incógnitas, y el de sistema lineal a más de dos ecuaciones. As´ı, tenemos las siguientes definiciones:

Ecuaci´on lineal:Es una expresi´on de la forma

a1x1+a2x2+· · ·+anxn=b, (1)

(44)

Unasoluciónde la ecuación lineal (1) es una serie de númerosα1, . . . , αn,que la satisfagan, es decir, que verifiquen:

a1α1+a2α2+· · ·+anαn=b.

Sistema lineal: Un sistema lineal de m ecuaciones con n inc´ognitas es una ex-presi´on de la forma:

        

a11x1 + a12x2 + · · · + a1nxn =b1

a21x1 + a22x2 + · · · + a2nxn =b2

..

. ... ... ...

am1x1 + am2x2 + · · · +amnxn =bm,

(2)

donde cada fila es una ecuaci´on lineal diferente, aunque las n inc´ognitas,

x1, . . . , xn, son las mismas para todas ellas.

Unasoluci´on del sistema lineal (2) es una serie de n´umerosα1, . . . , αn,que satisfagan las

m ecuaciones, es decir, tales que

        

a11α1 + a12α2 + · · · + a1nαn =b1

a21α1 + a22α2 + · · · + a2nαn =b2

..

. ... ... ...

am1α1 +am2α2 + · · · +amnαn =bm.

Diremos que un sistema lineal es:

compatible: si admite alguna soluci´on,

incompatible: si no la admite.

Dado un sistema compatible, diremos que es

compatible determinado: si admite una ´unica soluci´on,

compatible indeterminado: si admite m´as de una.

En este ´ultimo caso veremos que admite infinitas soluciones.