Apuntes elaborados por
Juan Gonz´
alez-Meneses L´
opez.
Curso 2008/2009
Departamento de ´
Algebra.
Tema 1. Matrices. Determinantes. Sistemas de ecuaciones lineales. . . 1
1.1. Matrices: definici´on, operaciones y propiedades b´asicas. . . 1
1.2. Transformaciones elementales de filas: matrices escalonadas y redu-cidas. . . 8
1.3. Dependencia lineal y rango. . . 11
1.4. Matrices elementales. . . 14
1.5. Matrices invertibles. . . 18
1.6. Transformaciones elementales de columnas. . . 21
1.7. Determinantes:definici´on y propiedades. Teorema de Cauchy-Binet. 23 1.8. Desarrollo por filas y columnas. Adjunta e inversa. . . 30
1.9. C´alculo de determinantes. . . 33
1.10. Rango y menores. M´etodo del orlado. . . 35
1.11. Sistemas de ecuaciones lineales. . . 38
1.12. M´etodo de eliminaci´on de Gauss. . . 40
1.13. M´etodo de Gauss-Jordan. Teorema de Rouch´e-Frobenius. . . 45
1.14. Regla de Cramer. . . 47
Tema 2. Espacios vectoriales . . . 49
2.1. Estructuras algebraicas. . . 49
2.2. Dependencia lineal. . . 54
2.3. Sistemas de generadores y bases. . . 57
2.4. Teorema de la base. Dimensi´on. . . 59
2.5. Dimensi´on y sistemas de vectores. Coordenadas. . . 61
2.6. Cambio de base. . . 63
Tema 3. Variedades lineales . . . 66
3.1. Definici´on y propiedades b´asicas. . . 66
3.2. Ecuaciones param´etricas e impl´ıcitas. . . 69
3.3. Ecuaciones y dimensi´on. . . 71
3.4. Intersecci´on y suma de variedades. . . 74
3.5. Propiedades de la suma de variedades. F´ormula de la dimensi´on. . . 76
3.6. Descomposici´on de variedades. Espacio producto y cociente. . . 78
3.7. Propiedades de la suma directa. Espacio producto. . . 81
3.8. Espacio cociente. . . 82
Tema 4. Aplicaciones lineales . . . 87
4.1. Definici´on y propiedades. . . 87
4.2. Imagen y n´ucleo. . . 89
4.3. Imagen e imagen inversa de variedades lineales. Aplicaciones inyectivas. 91 4.4. Isomorfismos. . . 93
4.6. Aplicaciones lineales y matrices II. . . 98
4.7. Primer teorema de isomorf´ıa. . . 100
4.8. Cambio de base. Matrices equivalentes. . . 102
4.9. Endomorfismos. Matrices semejantes. . . 104
4.10. El espacio vectorial Hom(V, V0). . . 106
Tema 5. Endomorfismos . . . 109
5.1. Autovalores y autovectores. . . 109
5.2. Multiplicidad algebraica y geom´etrica. Diagonalizaci´on. . . 113
5.3. Forma can´onica de Jordan. Subespacios propios generalizados. . . . 116
5.4. C´alculo de la base de Jordan. . . 119
5.5. Base de Jordan y forma can´onica de Jordan. . . 122
5.6. Teorema de Jordan. . . 125
Tema 6. Espacios vectoriales eucl´ıdeos . . . 128
6.1. Formas bilineales. . . 128
6.2. Ortogonalidad. . . 130
6.3. Diagonalizaci´on de formas bilineales sim´etricas. . . 133
6.4. Teorema de Sylvester. . . 134
6.5. Espacios vectoriales eucl´ıdeos. . . 137
Tema 1.
Matrices. Determinantes. Sistemas de
ecua-ciones lineales
1.1.
Matrices: definici´
on, operaciones y propiedades b´
asicas.
En este tema estudiaremos las matrices como objeto matem´atico y su aplicaci´on al estudio de los sistemas de ecuaciones lineales. Veremos sus propiedades fundamentales, las operaciones b´asicas, y una aplicaci´on importante de estos conceptos: el Teorema de Rouch´e-Frobenius.
A partir de ahora fijaremos un cuerpo de escalares, que llamaremosK. La definici´on de cuerpo se dar´a en el Tema 2. Por ahora es suficiente pensar que K es el conjunto de los n´umeros racionales, reales o complejos, y que unescalar es uno de estos n´umeros.
Una matriz m×n es una tabla de m filas y n columnas de escalares. Es decir, un objeto de la forma
a11 a12 · · · a1n
a21 a22 · · · a2n ..
. ... ...
am1 am2 · · · amn
,
donde cada aij es un escalar.
Una vez vista la definici´on de matriz, fijaremos algunas notaciones:
DenotaremosMm×n(K) al conjunto de matricesm×n, cuyo cuerpo de escalares es
K. Si no nos interesa especificar el cuerpo de escalares, escribiremos simplemente Mm×n.
Normalmente usaremos una letra may´uscula para denotar una matriz, y la misma letra en min´uscula, con los sub´ındices correspondientes, para denotar suselementos oentradas. Por ejemplo, escribiremos una matriz A∈ Mm×n como sigue:
A =
a11 a12 · · · a1n
a21 a22 · · · a2n ..
. ... ...
am1 am2 · · · amn
Si queremos especificar la letra que usaremos para los elementos de una matriz, escribiremos
A= (aij).
Comencemos a estudiar las propiedades de las matrices.
Diremos que dos matrices A y B son iguales si ambas tienen las mismas dimen-siones (es decir, A, B ∈ Mm×n), y adem´as aij =bij para todo i, j 1≤ i≤m, 1≤j ≤n.
Dadas dos matrices A, B ∈ Mm×n, definimos su suma, A+B, como la matriz C ∈ Mm×n tal que
cij =aij +bij.
Dada una matriz A ∈ Mm×n(K) y un escalar α ∈ K, definimos su producto,
αA, como la matrizD∈ Mm×n(K) tal que
dij =α aij
Es decir, dos matrices de las mismas dimensiones se pueden sumar, t´ermino a t´ermino, dando lugar a otra matriz de la misma dimensi´on. Y tambi´en podemos multiplicar una matriz por un escalar, dando lugar a otra matriz de las mismas dimensiones donde cada t´ermino se ha multiplicado por el escalar.
Un ejemplo importante de matrices son los vectores:
Unvectores una matrizm×1. Las entradas de un vector se llamancoordenadas.
Aunque sean un caso particular de matrices, trataremos a los vectores de forma especial. Los denotaremos en negrita, y como s´olo tienen una columna, no escribiremos el segundo ´ındice de cada t´ermino. Por ejemplo, escribiremos:
v=
v1
v2
.. .
vm
Tambi´en nos referiremos comovectores filaa las matrices 1×n. As´ı, un vector fila podr´ıa ser:
v= (v1, v2, . . . , vn).
En los vectores fila, las coordenadas se suelen escribir separadas por comas. Pero recordemos que, si no se especifica lo contrario, un vector consta de una columna.
Los vectores suelen resultar familiares, ya que se usan para representar los puntos de los espacios geom´etricos. Por ejemplo, los puntos del planoR2 se corresponden con los vectores
de dos coordenadas: M2×1. Los puntos del espacio R3 se corresponden con los vectores
de tres coordenadas: M3×1. Y as´ı se puede continuar con los espacios de dimensiones
superiores.
Ahora estudiaremos la operaci´on m´as importante con matrices: la multiplicaci´on. Comen-zaremos con un caso particular:
Dadas dos matrices
A= (a1 a2 · · · an)∈ M1×n, B =
b1
b2
.. .
bn
∈ Mn×1,
se define su producto, AB, como la matrizC ∈ M1×1 cuya ´unica entrada es:
a1b1+a2b2+· · ·+anbn.
Nota: Si se consideran las dos matrices A y B como vectores (un vector fila y un vector columna), el producto que acabamos de definir se llama producto escalarde A y B. Lo estudiaremos m´as a fondo en temas posteriores.
Para extender esta definici´on a matrices con m´as de una fila o columna, llamaremos fila i de una matriz A = (aij) ∈ Mm×n, al vector fila (ai1 ai2 · · · ain) ∈ M1×n, y llamaremos columna jal vector columna
a1j
a2j .. .
amj
∈ Mm×1.
Dadas dos matrices A∈ Mm×n y B ∈ Mn×p, se define su producto, AB, como la matriz C∈ Mm×p, donde el elemento cij es el producto de la fila ideA por la columna j deB. Es decir,
cij =ai1b1j +ai2b2j+· · ·+ainbnj.
Nota: Es importante darse cuenta que no se pueden multiplicar dos matrices de cualquier dimensi´on. S´olo se pueden multiplicar A y B si el tama˜no de las filas de
A es igual al tama˜no de las columnas de B. El resultado de la multiplicaci´on ser´a una matriz C con el mismo n´umero de filas que A y el mismo n´umero de columnas que B. Esquem´aticamente:
a11 a12 · · · a1n ..
. ... ...
ai1 ai2 · · · ain ..
. ... ...
am1 am2 · · · amn
b11 · · · b1j · · · b1p
b21 · · · b2j · · · b2p ..
. ... ...
bn1 · · · bnj · · · bnp
=
c11 · · · c1j · · · c1p ..
. ... ...
ci1 · · · cij · · · cip ..
. ... ...
cm1 · · · cmj · · · cmp
m×n n×p m×p
Nota: esta definici´on del producto de matrices puede resultar extra˜na. ¿Por qu´e no mul-tiplicar matrices simplemente multiplicando sus entradas correspondientes? La respuesta proviene de los sistemas lineales. Arthur Cayley (1821-1895) estudiaba los sistemas de dos ecuaciones con dos inc´ognitas
ax+by =x0 cx+dy=y0
como transformaciones del plano, que a cada punto (x, y) le hacen corresponder el punto
(x0, y0). Por tanto, podemos decir que la matriz
a b c d
transforma el plano, moviendo
cada punto (x, y) a la posici´on (x0, y0). Si consideramos ahora otra matriz
e f g h
,
tam-bi´en transformar´a el plano, moviendo el punto (x0, y0) a la posici´on (x00, y00), mediante las ecuaciones:
ex0+f y0 =x00 gx0+hy0 =y00
Por tanto, si hacemos actuar estas dos transformaciones, una detr´as de otra, el punto (x, y) ir´a a la posici´on (x00, y00), donde estas coordenadas verifican:
y por otro lado:
y00 =gx0+hy0 =g(ax+by) +h(cx+dy) = (ag+ch)x+ (bg+dh)y.
Por tanto, la composici´on de las dos transformaciones tiene por ecuaci´on:
(ae+cf)x+ (be+df)y=x00
(ag+ch)x+ (bg+ch)y =y00
Si observamos la matriz de esta transformaci´on, vemos que es elproducto de las matrices anteriores, ya que:
e f g h
a b c d
=
ae+cf be+df ag+ch bg+ch
.
Luego el producto de matrices corresponde a la composici´on de transformacio-nes. Estas definiciones de Cayley se generalizaron a cualquier dimensi´on. M´as adelante estudiaremos las transformaciones lineales en general, y veremos c´omo el producto de matrices corresponde a la composici´on de transformaciones lineales.
Hemos definido tres operaciones con matrices: la suma y el producto de matrices, y el producto de una matriz por un escalar. Veamos cu´ales son las principales propiedades de estas operaciones.
Propiedades de la suma de matrices: En Mm×n se tienen las siguientes propiedades:
1. Propiedad conmutativa: A+B =B+A.
2. Propiedad asociativa: (A+B) +C =A+ (B+C).
3. Elemento neutro: Existe una ´unica matriz O ∈ Mm×n, llamada matriz
nula, tal que A+O =O+A, para toda matriz A∈ Mm×n.
4. Elemento opuesto: Dada una matriz A∈ Mm×n, existe otra matriz B ∈
Mm×n, llamada opuesta de A, tal que A+B =O.
La matriz nula est´a formada por ceros. Por otro lado, si B es la matriz opuesta de A, se tiene bij =−aij.
Propiedades del producto de matrices: Si A, B y C son matrices, de las dimensiones adecuadas para que se puedan multiplicar o sumar (en cada caso), se tiene
1. Propiedad asociativa: (AB)C=A(BC).
2. Propiedades distributivas:
a) (A+B)C =AC+BC.
b) A(B+C) = AB+AC.
3. Elemento neutro (a izquierda y derecha): Existe una ´unica matriz
I ∈ Mn×n tal que:
a) AI =A para todaA∈ Mm×n. b) IB =B para todaB ∈ Mn×p.
Nota: El producto de matrices no es conmutativo en general. Es decir, normalmente
AB 6= BA, incluso cuando los dos productos est´en bien definidos. Adem´as, no siempre existe el elemento inverso: dada una matriz cuadrada A, no tiene por qu´e existir otra matriz B tal que AB=I.
Por otra parte, la matriz neutra I = (δij) se llama matriz identidad, y es una matriz cuadrada definida por: δij = 0 si i 6= j, y δii = 1 para todo i. Por ejemplo, la matriz identidad de dimensi´on 3 es:
I =
1 0 0 0 1 0 0 0 1
.
Propiedades del producto de matrices y escalares: SiA yB son matrices, de las dimensiones adecuadas para que se puedan sumar o multiplicar (en cada caso), y si α y β son escalares, se tiene
1. α(βA) = (αβ)A.
2. α(AB) = (αA)B =A(αB).
3. (α+β)A=αA+βA.
Terminaremos esta secci´on estudiando una ´ultima operaci´on de matrices, llamada trasposici´on.
Dada una matrizA∈ Mm×n, llamamostraspuestadeAa la matrizAt∈ Mn×m, definida de forma que las filas deAsean las columnas de At, y viceversa. Es decir, si At= (bij), se tiene bij =aji para todo i, j.
Ejemplo 1.1 Si A=
1 2 3 4 5 6
, entonces At=
1 4 2 5 3 6
.
Utilizaremos la traspuesta de una matriz en temas posteriores. Por ahora nos limitaremos a ver algunas propiedades:
Propiedades de la trasposici´on: Sean A y B matrices de las dimensiones adecuadas. Se tiene:
1. (A+B)t=At+Bt.
2. (AB)t=BtAt.
3. (At)t =A.
Por ´ultimo, hay un tipo especial de matriz que ser´a importante m´as adelante:
Una matriz A es sim´etrica siAt=A.
1.2.
Transformaciones elementales de filas: matrices escalonadas
y reducidas.
A la hora de aplicar las matrices al estudio de los sistemas de ecuaciones lineales, y para estudiar las propiedades de los determinantes, una herramienta esencial consiste en las llamadas transformaciones elementales de matrices, que se definen como sigue.
Lastransformaciones elementales de filasque se pueden aplicar a una matriz, son las siguientes:
1. Intercambiar dos filas.
2. Multiplicar una fila por un escalar no nulo.
3. A˜nadir a una fila un m´ultiplo no nulo de otra.
A partir de esta definici´on, se obtiene el siguiente concepto:
Diremos que dos matrices son equivalentes por filas si podemos obtener una, a partir de la otra, mediante transformaciones elementales de filas.
Gracias a las transformaciones elementales de filas, podremos siempre transformar cual-quier matriz en otra, equivalente por filas, que es m´as sencilla desde un punto de vista que veremos m´as adelante. Estas matrices sencillasvienen definidas a continuaci´on.
Diremos que una matriz es escalonada por filas si cumple lo siguiente:
1. Todas las filas de ceros (si las hay) est´an en la parte inferior de la matriz.
Ejemplo 1.2 La siguiente matriz es escalonada por filas:
2 −1 0 3 4 0 3 −2 1 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0
.
Un m´etodo para transformar cualquier matriz en una escalonada por filas es el siguiente:
El m´etodo de eliminaci´on de Gauss aplicado a una matriz, la transforma en una matriz equivalente que es escalonada por filas. Consiste en los siguientes pasos:
Paso 1: Si es necesario, intercambiar la primera fila con otra, para que la primera columna que no sea de ceros tenga un elemento no nulo en la primera posici´on.
Paso 2:Sumar a cada fila un m´ultiplo adecuado de la primera, de manera que la primera columna que no sea de ceros tenga s´olo un elemento no nulo: el de la primera fila.
Paso 3: Ignorando temporalmente la primera fila, repetir todo el proceso con las restantes filas.
Como este proceso da lugar, claramente, a una matriz escalonada por filas, hemos demos-trado el siguiente resultado:
Proposici´on 1.3 Toda matrizm×nes equivalente por filas a otra matrizm×nescalonada por filas.
Demostraci´on: S´olo hay que aplicar a la matriz inicial el m´etodo de eliminaci´on de Gauss.
Diremos que una matriz es reducida por filas si cumple lo siguiente:
1. Es escalonada por filas.
2. El primer elemento no nulo de cada fila, llamado pivote, es 1.
3. Encima (y debajo) de cada pivote s´olo hay ceros.
Ejemplo 1.4 La siguiente matriz es reducida por filas:
1 0 4 3 0 0 1 −1 2 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
.
Se tiene entonces:
M´etodo de eliminaci´on de Gauss-Jordan para transformar una matriz en otra equivalente por filas, que sea reducida por filas:
Paso 1: Aplicar a la matriz el m´etodo de Gauss.
Paso 2:Multiplicar cada fila no nula por un escalar conveniente, de manera que todos los pivotes sean 1.
Paso 3: Comenzando por el pivote m´as a la derecha, eliminar todos los elementos no nulos que tenga encima, sum´andole a cada fila un m´ultiplo conveniente de la fila de este pivote. Realizar la misma operaci´on con todos los pivotes, de derecha a izquierda.
Despu´es de aplicar este m´etodo a una matriz, se obtiene claramente otra matriz equivalente (puesto que se han aplicado transformaciones elementales de filas) que es reducida por filas (por construcci´on). Hemos probado por tanto el siguiente resultado:
Teorema 1.5 Toda matrizm×n es equivalente por filas a otra matriz m×n reducida por filas.
Una propiedad importante de la forma reducida por filas equivalente a una matriz dada es que es ´unica. Pero a´un no tenemos las herramientas suficientes para demostrar esto.
1.3.
Dependencia lineal y rango.
El concepto dedependencia linealde vectores es fundamental para el estudio de matri-ces, sistemas lineales y, como veremos en temas posteriores, espacios vectoriales.
Geom´etricamente, un vector de n coordenadas se representa, en el espacio de dimensi´on
n, como una flecha que parte del origen y termina en el punto que tiene esas coordenadas. Las operaciones b´asicas de matrices, aplicadas a vectores, se ven geom´etricamente como sigue:
Multiplicar un vector por un escalar (digamos, un n´umero real), equivale a multiplicar la longitud del vector por ese escalar.
Sumar dos vectores v1 y v2 corresponde al siguiente procedimiento: Si se traslada
el vector v2, sin cambiar su direcci´on ni su tama˜no, hasta hacer que su comienzo
coincida con el final del vector v1, entonces vectorv1+v2 es el que une el origen de
coordenadas con el final de este nuevo vectorv2.
Dados r vectores v1, . . . ,vr de la misma dimensi´on, llamamos combinaci´on li-neal de estos vectores a cualquier expresi´on de la forma:
α1v1+α2v2 +· · ·+αrvr,
donde α1, . . . , αr son escalares cualesquiera.
Es decir, una combinaci´on lineal de r vectores es otro vector, que resulta de cambiar el tama˜no de cada uno de los vectores iniciales, y sumar los resultados (haciendo comenzar cada vector en el final del vector precedente).
Ejemplo 1.6 Una combinaci´on lineal de un s´olo vector, v, tiene la forma αv, donde α es un escalar. Por tanto es otro vector con la misma direcci´on que v, y cuyo tama˜no es α veces el tama˜no de v. Por tanto, αv est´a en la recta deter-minada por v.
Diremos que un vector v depende linealmente de un conjunto de vectores {v1, . . . ,vr} siv se puede escribir como combinaci´on lineal de v1, . . . ,vr.
Ejemplo 1.8 El vector (3,−2,2) depende linealmente de los vectores (1,0,2) y
(−1,2,2), ya que se tiene la combinaci´on lineal:
3 −2 2 = 2
1 0 2
+ (−1) −1 2 2 .
Ejemplo 1.9 El vector 0, con todas sus coordenadas nulas, depende linealmen-te de cualquier conjunto de vectores. Basta tomar todos los coeficienlinealmen-tes 0 en la combinaci´on lineal.
Ejemplo 1.10 Cualquier vector depende linealmente de un conjunto de vectores que lo contenga. Basta tomar su coeficiente1, y todos los dem´as 0.
Hay otra forma de ver la dependencia lineal:
Diremos que un sistema (o conjunto) de vectores de la misma dimensi´on S = {v1, . . . ,vr} es linealmente dependiente, si existen r escalares α1, . . . , αr,
no todos nulos, tales que
α1v1+α2v2+· · ·+αrvr=0.
En caso contrario, es decir, si la ´unica forma de escribir el vector 0 como combi-naci´on lineal de estos vectores es tomando α1 =α2 =· · ·= αr = 0, diremos que el sistema S es linealmente independienteo libre.
La relaci´on entre esta definici´on de dependencia lineal y la anterior viene dada por el siguiente resultado.
Lema 1.11 Un sistema de vectores {v1, . . . ,vr} es linealmente dependiente si y s´olo si
uno de ellos es combinaci´on lineal de los dem´as.
Demostraci´on: Directa.
de vectores que se puede definir como combinaci´on lineal de los vectores del sistema sigue siendo el mismo. Podr´ıamos, por tanto, ir eliminando vectores del sistema, hasta que no pudi´eramos eliminar m´as; es decir, hasta que el sistema fuera linealmente independiente. En efecto, se tiene:
Teorema 1.12 Dado un sistema de r vectores S ={v1, . . . ,vr}, no todos nulos, se
veri-fica:
1. Existe al menos un sistema S0 ⊂ S linealmente independiente; y todos los dem´as
vectores de S dependen linealmente de los de S0.
2. Todos los sistemas S0 que satisfacen la condici´on anterior tienen el mismo n´umero
de elementos. A este n´umero lo llamamos rango de S.
Demostraci´on: La demostraci´on de 1 ya est´a esbozada arriba. Para demostrar 2, se supone que se tienen dos subsistemas libres, S1 y S2, con distinto n´umero de vectores. Si
S2 tiene m´as vectores que S1, se demuestra que 0 puede escribirse como una combinaci´on
lineal no trivial de los elementos de S2, escribiendo ´estos como combinaci´on lineal de los
de S1, y usando que un sistema homog´eneo con menos ecuaciones que inc´ognitas tiene
soluciones no triviales, como veremos en el teorema de Rouch´e-Frobenius.
El rango de un sistema de vectores se puede tambi´en definir como sigue:
El rango de un sistema de vectores S es el tama˜no del mayor sistema libre que se puede formar con los vectores de S.
Ahora relacionaremos, de forma muy sencilla, los sistemas de vectores con las matrices. Simplemente, a un sistema dem vectores de dimensi´onn, le asociamos una matriz m×n, donde cada fila es un vector del sistema. As´ı, podemos definir:
Elrango de una matriz es el rango del sistema de vectores formado por sus filas.
Al rango de una matriz A lo denotaremos rg(A).
Lema 1.13 Las transformaciones elementales de filas no alteran del rango de una matriz.
Demostraci´on: Directa, usando la definici´on de rango de un sistema de vectores.
Gracias a este resultado, podremos calcular f´acilmente el rango de una matriz:
Teorema 1.14 Consideremos una matriz A∈ Mm×n, y sea A0 una matriz reducida
equi-valente por filas a A. Entonces, el rango de A es igual al n´umero de filas no nulas de A0.
Demostraci´on: S´olo hay que ver que las filas no nulas de A0 forman un sistema libre. Se forma una combinaci´on lineal igualada a cero, y se ve que las coordenadas de los pivotes s´olo se pueden anular si el coeficiente de esa fila es nulo.
Nota: Acabamos de probar que el n´umero de filas no nulas de la forma reducida por filas de una matriz, est´a determinado por la matriz. Adem´as, cualquier forma escalonada de la misma matriz debe tambi´en tener el mismo n´umero de filas no nulas.
1.4.
Matrices elementales.
Una vez estudiadas las transformaciones elementales de filas de una matriz, y c´omo se pueden utilizar para calcular el rango, veamos la relaci´on entre estas transformaciones y la multiplicaci´on de matrices.
Comenzamos definiendo tres tipos de matrices, que llamaremos matrices elementales, y que son el resultado de aplicar a la matriz identidad los tres tipos de transformaciones elementales. Definiremos matrices cuadradasn×n, luegoI ∈ Mn×nser´a la matriz identidad de dimensi´onn.
I al intercambiar sus filas iy j.
Tij =
1 . .. 1
0 · · · 1 ..
. 1 ...
..
. . .. ... ..
. 1 ...
1 · · · 0 1 . .. 1 fila i fila j
A continuaci´on, dado i, 1 ≤ i≤ n, y un escalar α ∈K, definimos Mi(α) como la matriz que se obtiene de I al multiplicar su fila i porα.
Mi(α) =
1 . .. 1 α 1 . .. 1 fila i
Finalmente, dados i, j (1≤i, j ≤n, i6=j), y un escalar α∈K, definimosPij(α) como la matriz que se obtiene de I al sumarle a la fila ila fila j multiplicada por α.
Pij(α) =
1 . .. 1
1 · · · α
..
. 1 ...
..
. . .. ... ..
. 1 ...
Podemos describir estos tres tipos de matrices de otra manera:
Tij coincide conI, salvo en los t´erminos: tii=tjj = 0, tij =tji = 1.
Mi(α) coincide con I salvo el el t´ermino: mii=α.
Pij(α) coincide con I salvo en el t´ermino: pij =α.
La relaci´on entre las transformaciones elementales de filas y el producto de matrices viene dada por el siguiente resultado:
Lema 1.15 Sea A∈ Mn×p. Se tiene:
1. TijA es la matriz que resulta al intercambiar las filas i yj de A.
2. Mi(α)A es la matriz que resulta al multiplicar por α la fila i de A.
3. Pij(α)A es la matriz que resulta al sumar a la fila i de A, la fila j multiplicada por
α.
Es decir, aplicar una transformaci´on elemental de filas a una matriz equivale a multiplicarla, a la izquierda, por la matriz elemental correspondiente.
Si seguimos aplicando transformaciones elementales, estaremos multiplicando m´as matrices elementales a la izquierda. As´ı podremos llegar hasta una forma reducida, equivalente por filas a la matriz A. Por tanto, se tiene:
Proposici´on 1.16 Sea A∈ Mm×n y sea A0 una forma reducida por filas de A. Entonces
existe una matriz P ∈ Mm×m, producto de matrices elementales, tal que A0 =P A.
Este resultado tiene varias aplicaciones. En primer lugar, podemos ya probar que la forma reducida por filas de una matriz es ´unica.
Lema 1.17 Si A, B ∈ Mm×n son dos matrices reducidas por filas, que son equivalentes
Demostraci´on: Ya sabemos que las transformaciones elementales por filas no var´ıan el rango de una matriz, y que si una matriz es reducida por filas, entonces su rango es el n´umero de filas distintas de cero que tiene. Por tanto, el n´umero de filas distintas de cero de A y B es el mismo. Se demuestra entonces el resultado por inducci´on en n, el n´umero de columnas. Sin = 1, entonces o bienA=B = 0, o bien a11 =b11= 1 y todas las dem´as
entradas son cero. En cualquier caso, A=B.
Supongamos el resultado cierto para menos de n columnas, con n > 1. Sean A0 y B0 las matrices formadas por las n−1 primeras columnas de A yB respectivamente. Ambas son reducidas por filas, pero adem´as son equivalentes por filas, usando las mismas transforma-ciones que convierten A en B. Por tanto, por hip´otesis de inducci´on, A0 =B0.
S´olo queda demostrar que la ´ultima columna deA y deB son iguales. Sear= rg(A0). Hay dos posiblidades: si la ´ultima columna deAcontiene un pivote, entoncesar+1,n = 1 y todas las dem´as entradas de la ´ultima columna son ceros. Pero en este caso rg(A) = rg(B) =r+1, luego la ´ultima columna de B tambi´en tiene un pivote en la misma posici´on, y por tanto
A=B.
Si, por contra, rg(A) = rg(B) =r, entonces la ´ultima columna de A y de B podr´a tener sus r primeras entradas no nulas, y el resto deber´an ser nulas. Llamemos An y Bn a la ´
ultima columna de A y B, respectivamente. Como A y B son equivalentes por filas, se tiene B =P A, donde P es producto de matrices elementales. M´as a´un, como A0 =B0, las columnas de los r pivotes de A y B coinciden. Pero al multiplicar P por la columna del primer pivote de A, obtenemos la columna del primer pivote de B. Es decir:
p11 · · · p1m ..
. ...
pm1 · · · pmm
1 0 .. . 0 = 1 0 .. . 0 ⇒ p11 p21 .. .
pm1
= 1 0 .. . 0 .
Lo mismo ocurre con la segunda columna de P (usando el segundo pivote), y as´ı sucesi-vamente, hasta usar los r pivotes. Por tanto, las r primeras columnas de P son iguales a las de la matriz identidad. Pero entonces, como P An =Bn, donde An y Bn s´olo tienen r entradas no nulas, un c´alculo directo muestra que An=Bn, y por tantoA =B.
Teorema 1.18 La forma reducida por filas de una matriz es ´unica.
1.5.
Matrices invertibles.
Existe un tipo importante de matricescuadradas: aquellas que admiten una matriz inversa. La definici´on es la siguiente.
Sea A ∈ Mn×n. Se dice que A es invertible si existe otra matriz A−1 ∈ Mn×n tal que AA−1 =A−1A=I. En este caso, A−1 se llama la inversadeA.
Algunas propiedades de las matrices invertibles son las siguientes:
Teorema 1.19 Sean A, B ∈ Mn×n. Se verifica:
1. La inversa de A, si existe, es ´unica.
2. Si A y B son invertibles, entonces (AB)−1 =B−1A−1.
3. Si A es invertible, entonces At tambi´en es invertible, y se tiene: (At)−1 = (A−1)t.
4. Si A tiene una fila o una columna de ceros, entonces no es invertible.
Demostraci´on:
1. Si A0 y A00 son dos inversas deA, se tiene A0 =A0I =A0(AA00) = (A0A)A00 =IA00 =
A00.
2. Si multiplicamos AB, ya sea a la izquierda o a la derecha, por B−1A−1, se obtieneI,
luego esta matriz es la inversa de AB.
3. Se tiene (A−1)tAt= (A A−1)t =It=I. La multiplicaci´on por la derecha es an´aloga.
4. Si la fila i de A es de ceros, al multiplicarla a la derecha por cualquier matriz, ´esta tendr´a la fila i de ceros. Lo mismo ocurre con las columnas, multiplicando a la izquierda.
1. Si A1, A2,· · · , Ar ∈ Mn×n son invertibles, entonces su producto es invertible, y la
inversa es: (A1A2· · ·Ar)−1 =A−r1· · ·A
−1
2 A
−1 1 .
2. Si una matriz P es producto de matrices elementales, entonces P es invertible.
Demostraci´on: La primera propiedad se demuestra igual que la propiedad 2 del teorema anterior. La segunda, demostrando que las matrices elementales son invertibles, y aplicando la propiedad 1. De hecho, se tiene:
(Ti,j)−1 =Ti,j, (Mi(α))−1 =Mi(α−1), (Pi,j(α))−1 =Pi,j(−α).
Veamos ahora c´omo es la forma reducida por filas de una matriz invertible:
Teorema 1.21 Si A ∈ Mn×n es una matriz invertible, su forma reducida por filas es la
matriz identidad I.
Demostraci´on: Si usamos el m´etodo de Gauss-Jordan para hallarA0, la forma reducida por filas deA, tenemos queA0 =P A, dondeP es producto de matrices elementales. Por el resultado anterior,P es invertible, peroA tambi´en lo es, por tantoA0 es invertible. Ahora bien, A0 no puede tener una fila de ceros, ya que en ese caso no ser´ıa invertible. Por tanto, en A0 hay n pivotes, y la ´unica matriz n×n reducida por filas que puede tener n pivotes es I. Es decir, A0 =I.
Corolario 1.22 Una matriz A∈ Mn×n es invertible si y s´olo si rg(A) = n.
Demostraci´on: Si A es invertible, el teorema anterior nos dice que su forma reducida por filas esI, que tiene n filas no nulas, luego rg(A) =n.
Si rg(A) < n, entonces A0, la forma reducida por filas de A, tiene una fila de ceros, luego no es invertible. Pero sabemos que A0 =P A, por lo que, siA fuera invertible, A0 tambi´en lo ser´ıa.
producto de todas estas matrices, en orden inverso, forma la matriz P, tal que P A = I. Es decir, A−1 = P. Para calcular P (es decir, A−1), podemos multiplicar todas las
ma-trices elementales utilizadas, o mejor a´un, ir aplicando a la matriz identidad las mismas operaciones elementales que le apliquemos a A. Por tanto tenemos:
M´etodo para calcular la inversade una matriz, usando matrices elementales:
A−1 es la matriz resultante de aplicar aI las mismas operaciones elementales que se le apliquen a A, para hallar su forma reducida por filas (usando el m´etodo de Gauss-Jordan).
Una forma sencilla de aplicar este m´etodo es el siguiente. Dada la matriz A ∈ Mn×n, se considera la matriz (A|I) ∈ Mn×2n que consiste en yuxtaponer la matriz A y la matriz identidad I ∈ Mn×n. A continuaci´on, se le aplican a esta matriz las transformaciones elementales que transforman Aen I, y obtendremos, en las ´ultimasn columnas, la matriz
A−1. Es decir, habremos transformado (A|I) en (I|A−1).
A continuaci´on mostraremos dos caracterizaciones m´as de las matrices invertibles, con ayuda de las transformaciones elementales:
Teorema 1.23 Una matriz A ∈ Mn×n es invertible si y s´olo si existe una matriz B ∈ Mn×n tal que AB =I.
Demostraci´on: SiA es invertible, basta tomar B =A−1.
Supongamos que existeBtal queAB=I. SiAno es invertible, entonces su forma reducida por filas, A0, tiene una fila de ceros. Adem´as,A0 =P A, donde P es producto de matrices elementales, y por tanto invertible. Pero entonces tendr´ıamos:
A0B = (P A)B =P(AB) = P I =P,
donde A0B tiene una fila de ceros (al tenerla A0), y P no tiene una fila de ceros (por ser invertible). Contradicci´on.
Teorema 1.24 Una matriz A ∈ Mn×n es invertible si y s´olo si es producto de matrices
Demostraci´on: Si A es invertible, entonces A−1 tambi´en lo es. Por lo tanto existe una matriz P, producto de matrices elementales, tal que P A−1 = I (ya que I es la forma
reducida por filas de A−1). Pero entonces P es la inversa de A−1, es decir, P =A.
Corolario 1.25 Si A∈ Mm×n, y P ∈ Mn×n es una matriz invertible, entonces rg(A) =
rg(P A).
Demostraci´on: Como P es invertible, es producto de matrices elementales. Por tanto,
P A se obtiene de A al aplicarle una serie de transformaciones elementales, y por tanto deben tener el mismo rango.
1.6.
Transformaciones elementales de columnas.
En esta secci´on veremos que todas las propiedades que hemos estudiado sobre las filas de una matriz, son tambi´en ciertas para sus columnas. Basta trasponer todas las matrices que encontremos. As´ı, se definen las transformaciones elementales de columnas de forma an´aloga a las de filas, y se definen las matrices escalonadas o reducidas por columnas, como las traspuestas de las escalonadas o reducidas por filas.
Tambi´en se tienen las matrices elementales por columnas que, curiosamente, son las mismas que las de filas, ya que la traspuesta de una matriz elemental es otra matriz elemental. La correspondencia de transformaciones y matrices es la siguiente:
1. Matriz que resulta de I al intercambiar las columnasi y j: Ti,j.
2. Matriz que resulta de I al multiplicar porα la columna i: Mi(α).
3. Matriz que resulta de I al sumarle a la columna i la columna j multiplicada por α:
Pj,i(α).
Hay que tener cuidado con la ´ultima matriz, que es la ´unica que cambia al hablar de colum-nas en vez de filas. Esto es debido a que (Pi,j(α))t =Pj,i(α), mientras que las traspuestas de las dem´as no cambian.
elemental correspondiente. Esto es debido a la propiedad (AB)t=BtAt, con lo que, cuando antes multiplic´abamos a izquierda, ahora hay que hacerlo a derecha.
Por lo dem´as, todas las propiedades anteriores se verifican, cambiando filas por columnas. El ´unico problema que tenemos es que hemos definido elrangode una matriz usando filas. Veamos que, si lo definimos usando columnas, el rango sigue siendo el mismo.
Lema 1.26 Si A ∈ Mm×n, y Q ∈ Mn×n es una matriz invertible, entonces rg(A) =
rg(AQ).
Demostraci´on: Sea r el rango de A, y sea A0 la forma reducida por filas de A. Existe entonces una matriz invertible P tal que A0 = P A. Por otra parte, se tiene rg(A0) ≥ rg(A0Q), ya que las ´ultimasm−r filas de A0 son nulas, y por tanto tambi´en lo son las de
A0Q. Pero entonces:
rg(A) = rg(A0)≥rg(A0Q) = rg(P AQ) = rg(AQ).
La ´ultima igualdad se tiene por el corolario 1.25. Tenemos entonces rg(A) ≥ rg(AQ). La desigualdad opuesta se obtiene f´acilmente, aplicando el mismo razonamiento a las matrices
AQ y Q−1. Es decir, se tiene rg(AQ)≥rg(AQQ−1) = rg(A).
Corolario 1.27 Si dos matrices A y B son equivalentes por columnas, entonces rg(A) =
rg(B).
Teorema 1.28 El rango de una matriz es el n´umero de columnas de su forma reducida por columnas.
Demostraci´on: Sea A ∈ Mm×n, y A0 su forma reducida por columnas. Sabemos que existe una matriz invertibleQtal queA0 =AQ, y por el corolario anterior: rg(A) = rg(A0). Tenemos que probar entonces que el rango deA0 es igual al n´umero de columnas no nulas que tiene, digamosr. Para ello, hallaremos la forma reducida por filas deA0. Cada columna no nula deA0contiene un pivote. Mediante transformaciones de filas, llevamos estos pivotes a las posiciones (1,1),(2,2), . . . ,(r, r). Encima de estos pivotes s´olo hay ceros, por tanto, las transformaciones de filas que anulan las entradas inferiores, no alteran estos pivotes. En conclusi´on, la forma reducida por filas de A0 es exactamente:
Ir 0 0 0
donde Ir es la matriz identidad de tama˜nor. Por tanto, rg(A) = rg(A0) = r.
Ahora ya podemos enunciar, usando columnas, todos los resultados que vimos por filas. Las demostraciones son totalmente an´alogas al caso de filas.
Teorema 1.29 El rango de una matriz es el rango del sistema de vectores formado por sus columnas.
Teorema 1.30 La forma reducida por columnas de una matriz es ´unica.
Teorema 1.31 Si A ∈ Mn×n es una matriz invertible, su forma reducida por columnas
es la matriz identidad I.
En definitiva, da igual usar filas o columnas para estudiar el rango o la invertibilidad de una matriz. Una ´ultima consecuencia de esto es el siguiente resultado:
Teorema 1.32 Dada A ∈ Mm×n, se tiene rg(At) = rg(A).
Demostraci´on: La forma reducida por columnas de At es la traspuesta de la forma reducida por filas de A. Por tanto, el n´umero de columnas no nulas una (el rango de At) es igual al n´umero de filas no nulas de la otra (el rango deA).
1.7.
Determinantes:
definici´
on
y
propiedades.
Teorema
de
Cauchy-Binet.
Para saber lo que son los determinantes, volvamos a estudiar vectores en el plano. Su-pongamos que tenemos dos vectores v1 = (a, b) y v2 = (c, d). Estos vectores definen un
paralelogramo, cuyos v´ertices son los puntos (0,0), (a, b), (c, d) y (a+c, b+d). Pues bien, el´areade este paralelogramo es:
A=ad−bc.
La base de este rect´angulo es a. Por tanto, para hallar su ´area s´olo hay que conocer su altura. Pero la altura nos la da el punto de corte, con el eje y, de la recta que une (c, d) con (a+c, b+d). O m´as f´acilmente, de la recta que pasa por (c, d) con direcci´on (a, b). La ecuaci´on de esta recta es:
y−d= b
a(x−c).
Como buscamos el punto de corte con el eje y, imponemos que x = 0, y obtenemos la altura:
y=d−bc
a.
Por tanto, el ´area del paralelep´ıpedo original es:
A=a(d−bc
a) = ad−bc.
Podemos entonces definir el determinantede una matriz 2×2, como el ´area del parale-logramo definido por sus vectores fila. El determinante de una matrizA se denota detA, o bien cambiando los par´entesis que delimitan la matriz por segmentos verticales. Es decir:
detA=
a b c d
=ad−bc.
Esta definici´on se puede extender a matrices de tama˜no mayor. Por ejemplo, el determi-nante de una matriz 3×3 es el volumen del paralelep´ıpedo determinado por sus vectores filas. En este caso, se tiene la conocida f´ormula:
a1 b1 c1
a2 b2 c2
a3 b3 c3
=a1b2c3+a2b3c1+a3b1c2−a3b2c1−a2b1c3−a1b3c2.
Si agrupamos estos sumandos, sacando factor com´un las variables a1, b1, c1, obtenemos lo
siguiente:
a1 b1 c1
a2 b2 c2
a3 b3 c3
=a1
b2 c2
b3 c3
−b1
a2 c2
a3 c3
+c1
a2 b2
a3 b3
Es decir, podemos definir los determinantes de matrices 3× 3 usando los determinan-tes de matrices 2×2. Este proceso se puede generalizar, dando lugar a la definici´on del determinante de una matriz n×n. Primero hay que definir lo siguiente:
Dada una matriz cuadrada A ∈ Mn×n, llamamos submatriz complementaria de aij, y la denotamos Mij, a la matriz que se obtiene de A al eliminar su fila i y su columna j.
Llamamos menor-(i,j) deA al determinante det(Mij).
Usando estos menores, podemos definir el determinante de una matriz 3×3 como:
det(A) =
a11 a12 a13
a21 a22 a23
a31 a32 a33
=a11det(M11)−a12det(M12) +a13det(M13).
Para ahorrarnos notaci´on y problemas de signos, definimos lo siguiente:
Dada una matriz cuadrada A ∈ Mn×n, llamamos adjunto o cofactor del ele-mento aij al escalar Aij = (−1)i+jdet(Mij).
El factor (−1)i+j simplemente nos da un signo, que var´ıa si se aumentaioj en una unidad. Por tanto, podemos volver a definir el determinante de una matriz 3×3 como:
det(A) = a11A11+a12A12+a13A13.
Recordemos que, aunque usamos letras may´usculas por ser la notaci´on cl´asica, los adjun-tos son escalares.
Observemos que el adjunto no est´a bien definido, porque s´olo sabemos la definici´on de los determinantes de matrices 2×2 o 3×3. Pero ahora ya podemos generalizar sin problemas el concepto de determinante:
Dada una matriz A = (a11) ∈ M1×1, se define el determinante de A como
det(A) = det(a11) =a11.
Dada una matriz cuadrada A∈ Mn×n, conn >1, se llama determinantedeA,
y se denota det(A) o |A|, al escalar definido por:
Esta forma de definir el determinante se llama desarrollo por la primera fila. Observe-mos que, ahora s´ı, tanto los determinantes como los adjuntos est´an bien definidos, ya que para definir el determinante de una matriz de ordenn(es decir,n×n), se necesitan adjuntos de ordenn−1. Para ´estos, se necesitan determinantes de ordenn−1, y as´ı sucesivamente, hasta llegar a los determinantes de orden 1, que est´an bien definidos por s´ı mismos. Esto es lo que se llama una definici´onrecurrente.
En este tema veremos que los determinantes tienen muchas aplicaciones. Ya hemos visto, por ejemplo, que sirven para calcular ´areas de trapecios y vol´umenes de paralelep´ıpedos. Pero tambi´en se pueden usar para resolver sistemas lineales, comprobar si una matriz es invertible, e incluso calcular su inversa. Comencemos viendo algunas propiedades impor-tantes sobre las columnas de una matriz y su determinante.
Proposici´on 1.33 Sea A una matriz cuadrada n×n. Se tiene:
1. Si en A se intercambian dos columnas, el determinante cambia de signo.
2. Si en A se multiplica una columna por un escalar α, el determinante queda multipli-cado por α.
3. Si A tiene una columna de ceros, entonces det(A) = 0.
4. Si descomponemos la columna j de A en suma de dos vectores, v y w, y si llama-mos A0 y A00 a las matrices que resultan de A al sustituir la columna j por v y w, respectivamente, entonces det(A) = det(A0) + det(A00).
5. Si A tiene dos columnas iguales, entonces det(A) = 0.
6. Si a una columna deA le sumamos otra multiplicada por un escalar, su determinante no cambia.
Demostraci´on:
1. Esta propiedad se demuestra por inducci´on en n. Si n = 1 la propiedad no tiene sentido. Si n = 2, se verifica claramente. Supongamos que es cierta para n −1 y prob´emosla para n > 2. Supongamos, en primer lugar, que las columnas que se intercambian son consecutivas:j yj+1, y seaA0 la matriz resultante de intercambiar estas dos columnas. En ese caso, las submatrices complementarias M1k, con k 6=
Por otra parte, M1j resulta de eliminar la fila 1 y la columna j de A, que es lo mismo que eliminar la fila 1 y la columna j + 1 de A0. Es decir, M1j = M10j+1.
An´alogamente, M1j+1 =M10j. Pero entonces, como los ´ındices var´ıan en una unidad, se tiene: A1j = −A01j+1, y A1j+1 = −A01j. Adem´as, a1j = a01j+1 y a1j+1 = a01j. Por tanto,
det(A) = X k6=j,j+1
a1kA1k
!
+a1jA1j +a1j+1A1j+1 =
− X k6=j,j+1
a01kA01k
!
−a01j+1A01j+1−a01jA01j =−det(A0).
Si, por ´ultimo, las dos columnas intercambiadas no son consecutivas, observemos que podemos intercambiarlas mediante una sucesi´on de intercambios de columnas consecutivas (que llamaremos trasposiciones). S´olo hay que ver que el n´umero de estos intercambios es impar. Sean i y j, con i < j, las columnas intercambiadas. En primer lugar, llevamos la columnai a la posici´onj mediantej−itrasposiciones. La columnajhabr´a quedado en la posici´onj−1, luego har´an faltaj−1−itrasposiciones para llevarla a la posici´oni. Una vez hecho esto, todas las columnas est´an en su lugar, salvo la i y la j que est´an intercambiadas. Hemos usado, 2i+ 2j −1 trasposiciones, luego hemos cambiado el signo de la matriz un n´umero impar de veces. Por tanto, det(A) = −det(A0).
2. El resultado es evidente para n = 1. Supondremos que es cierto para n −1, y lo probaremos para n, con n > 1. Sea A0 la matriz que resulta al multiplicar por α la columna j de A. Se tiene a01j = αa1j, mientras que M1j = M10j, donde esta ´ultima matriz es la submatriz complementaria dea1,j enA. Por otra parte, sik6=j, tenemos
a01k =a1k, mientras queM10kse obtiene deM1kal multiplicar una de sus columnas por
α. Por hip´otesis de inducci´on, tenemos det(M10k) =αdet(M1k), es decir,A01k =αA1k. Por tanto,
det(A0) =a01jA01j +X k6=j
a01kA01k =αa1jA1j +
X
k6=j
a1kαA1k =αdet(A).
3. SeaA0la matriz que resulta al multiplicar por 0 la columna de ceros deA. Obviamente
A0 =A, pero adem´as, al haber multiplicado por 0 una columna, tenemos det(A0) = 0 det(A) = 0. Es decir, det(A) = 0.
4. Seanv= (v1, . . . , vn) yw= (w1, . . . , wn). La propiedad es cierta paran = 1. Como de
costumbre usaremos la inducci´on, suponiendo que el resultado es cierto para n−1, con n > 1. Al descomponer la columna j, tenemos: a1j = v1 +w1 = a01j +a001j, y adem´asM1j =M10j =M100j, donde estas dos ´ultimas matrices son las correspondientes matrices complementarias de A0 y A00, respectivamente. Pero tambi´en, para k 6= j, se tiene a1k = a01k = a
00
1k, y adem´as M
0
1k y M
00
al descomponer en dos sumandos una columna de M1k. Por hip´otesis de inducci´on: det(M1k) = det(M10k) + det(M
00
1k), luegoA1k =A01k+A
00
1k. En resumen:
det(A) = a1jA1j +
X
k6=j
a1kA1k = (a01j+a
00
1j)A1j+
X
k6=j
a1k(A01k+A
00
1k)
= a01jA01j+X k6=j
a01kA01k
!
+ a001jA001j +X k6=j
a001kA001k
!
= det(A0) + det(A00).
5. Seg´un la propiedad 1, si intercambiamos las dos columnas iguales, obtenemos una matriz A0 tal que det(A0) =−det(A). Pero claramente A0 =A, por tanto det(A) = −det(A), luego det(A) = 0.
6. Sea B la matriz que resulta de A al sumarle, a su columna i, la columna j multi-plicada por α. Seg´un la propiedad 4, det(B) = det(A) + det(A0), donde la columna
i de A0 es igual a la columna j multiplicada por α. Pero entonces, por la propie-dad 2, det(A0) = αdet(A00), donde A00 tiene dos columnas iguales, es decir, por la propiedad 5, det(A00) = 0. Uniendo todo esto, se tiene:
det(B) = det(A) + det(A0) = det(A) +αdet(A00) = det(A) + 0 = det(A).
Gracias al resultado anterior, hemos visto c´omo se comporta el determinante de una matriz si le aplicamos transformaciones elementales de columnas (propiedades 1, 2 y 6). Esto nos va a ayudar a obtener f´acilmente muchas m´as propiedades de los determinantes.
Lema 1.34 Consideremos la matriz identidad I ∈ Mn×n. Se tiene: det(I) = 1.
Demostraci´on: Directa, por inducci´on en n, a partir de la definici´on.
Una matriz A∈ Mn×n se dice singularsi det(A) = 0. En caso contrario se dice no singular.
Teorema 1.35 Una matriz A ∈ Mn×n es no singular si y s´olo si rg(A) = n, es decir, si
Demostraci´on: Si A es no singular, es decir, det(A) 6= 0, aplicar transformaciones elementales de columnas nunca puede anular el determinante, ya que, o bien cambia de signo, o bien se multiplica por un escalar no nulo, o bien se mantiene. Por tanto, la reducida por columnas de A tiene determinante no nulo. Pero esta reducida, o bien es la identidad, con lo que rg(A) =n y se tiene el resultado, o bien tiene una columna de ceros, con lo que su determinante ser´ıa cero, y llegar´ıamos a una contradicci´on.
Si, por otra parte, A tiene rango n, entonces su forma reducida por columnas es I. Por tanto, aplicando una serie de transformaciones elementales de columnas a A, obtenemos una matriz, I, cuyo determinante vale 1. Ahora bien, si A fuera singular, es decir, si det(A) = 0, al aplicar cualquier transformaci´on elemental el determinante seguir´ıa siendo cero, luego es imposible.
Ahora veamos c´omo se comporta el determinante con respecto al producto de matrices. Primero estudiaremos las matrices elementales:
Proposici´on 1.36 Los determinantes de las matrices elementales son los siguientes:
1. det(Tij) = −1.
2. det(Mi(α)) = α.
3. det(Pij(α)) = 1.
Demostraci´on: La matriz Tij se obtiene al permutar dos columnas de I, luego su de-terminante es el opuesto al de I, es decir, −1. La matriz Mi(α) se obtiene al multiplicar la columna i de I por α, luego su determinante es αdet(I) = α. Por ´ultimo, la matriz
Pij(α) resulta de sumarle, a la columna j deI, la columna i multiplicada por α, luego su determinante es igual al de I, es decir, 1.
Proposici´on 1.37 Si A ∈ Mn×n es una matriz cualquiera, y P1,· · ·, Pr ∈ Mn×n son
matrices elementales, entonces det(AP1· · ·Pr) = det(A) det(P1)· · ·det(Pr).
Demostraci´on: Lo haremos por inducci´on en r. Si r= 1, la matriz AP1 es el resultado
de aplicar a A la transformaci´on elemental de columnas correspondiente a P1. Por tanto,
el resultado se obtiene de las proposiciones 1.33 y 1.36.
Si r >2 y suponemos el resultado cierto para menos de r matrices elementales, sea P0 =
Pero, de nuevo por hip´otesis de inducci´on, det(AP0) = det(A) det(P1)· · ·det(Pr−1), de
donde se sigue el resultado.
Corolario 1.38 Si P ∈ Mn×n es producto de matrices elementales: P =P1· · ·Pr,
enton-ces det(P) = det(P1)· · ·det(Pr).
Demostraci´on: Este es un caso particular del resultado anterior, tomando A = I, y recordando que det(I) = 1.
Teorema 1.39 (Teorema de Cauchy-Binet) Dadas A, B ∈ Mn×n, se tiene:
det(AB) = det(A) det(B).
Demostraci´on: Supongamos primero que B es singular. En ese caso det(B) = 0, y B0, la forma reducida por columnas de B, tiene una columna de ceros. Pero B0 =BP, donde
P es producto de matrices elementales, luegoB =B0P−1, donde P−1 tambi´en es producto
de matrices elementales (recordemos que la inversa de una matriz elemental tambi´en es una matriz elemental). Por tanto, AB =AB0P−1. Como B0 tiene una columna de ceros,
AB0 tambi´en la tiene, por tanto det(AB0) = 0. Pero sabemos que, al ser P−1 producto
de matrices elementales, det(AB) = det(AB0P−1) = det(AB0) det(P−1) = 0. Por tanto,
det(AB) = 0, y el resultado es cierto en este caso.
Supongamos entonces que B es no singular. Entonces tiene rango n, luego es producto de matrices elementales:B =P1· · ·Pr. Pero en este caso, la proposici´on 1.37 y el corolario 1.38 nos dicen que det(AB) = det(A) det(P1)· · ·det(Pr) = det(A) det(B).
1.8.
Desarrollo por filas y columnas. Adjunta e inversa.
Hasta ahora hemos visto una ´unica definici´on del determinante de una matriz: su desarrollo por la primera fila. En esta secci´on veremos otras definiciones alternativas, desarrollando por cualquier fila o cualquier columna, y mostraremos que todas las propiedades que hemos visto para columnas se verifican tambi´en para filas. Para ello, vamos a empezar estudiando la trasposici´on de matrices.
Demostraci´on: Recordemos que (Tij)t=Tij y (Mi(α))t =Mi(α), luego para estos tipos de matrices, el resultado es evidente. Por otra parte, (Pij(α))t =Pji(α), pero det(Pij(α)) = det(Pji(α)) = 1, luego el resultado es cierto.
Teorema 1.41 Dada A ∈ Mn×n, se tiene det(At) = det(A).
Demostraci´on: Si A es singular, entonces rg(A) = rg(At) < n, por lo que At tambi´en es singular, es decir, det(A) = det(At) = 0.
Si A es no singular, entonces es producto de matrices elementales: A = P1· · ·Pr. Pero entonces
det(At) = det((P1· · ·Pr)t) = det(Prt· · ·P t
1) = det(P
t
r)· · ·det(P t
1)
= det(Pr)· · ·det(P1) = det(P1)· · ·det(Pr) = det(A).
Este teorema nos permite volver a enunciar, para filas, todas las propiedades que vimos sobre columnas de una matriz. S´olo necesitamos darnos cuenta que, las propiedades de las columnas deA son las propiedades de las filas de At. As´ı, se demuestran de forma directa las siguientes propiedades:
Proposici´on 1.42 Sea A una matriz cuadrada n×n. Se tiene:
1. Si en A se intercambian dos filas, el determinante cambia de signo.
2. Si en A se multiplica una fila por un escalar α, el determinante queda multiplicado por α.
3. Si A tiene una fila de ceros, entonces det(A) = 0.
4. Si descomponemos la fila ide A en suma de dos vectores, v yw, y si llamamos A0 y A00 a las matrices que resultan de A al sustituir la fila i por v y w, respectivamente, entonces det(A) = det(A0) + det(A00).
5. Si A tiene dos filas iguales, entonces det(A) = 0.
Por tanto, las transformaciones elementales de filas de una matriz act´uan sobre el determi-nante de forma an´aloga a las transformaciones de columnas. Ya podemos entonces definir el determinante de una matriz usando el desarrollo por cualquier fila o columna.
Teorema 1.43 Dada A ∈ Mn×n, se tiene, para cualesquiera i, j, (1≤i, j ≤n):
1. det(A) = ai1Ai1+ai2Ai2+· · ·+ainAin (desarrollo por la fila i).
2. det(A) = a1jA1j +a2jA2j +· · ·+anjAnj (desarrollo por la columna j).
Demostraci´on: Demostremos primero el desarrollo por la filai. SeaA0 la matriz que se obtiene de A al trasladar su fila i hasta la primera posici´on. Para ello, hay que usar i−1 trasposiciones de filas, por tanto: det(A) = (−1)i−1det(A0). Ahora bien, a0
1j = aij para todo j. Adem´as, M10j = Mij, donde Mij0 es la matriz complementaria de a
0
i,j en A
0. Pero
entonces
A01j = (−1)1+jdet(M0
1j) = (−1)
1+jdet(M
ij) = (−1)1+j(−1)−i−jAij = (−1)1−iAij,
es decir,Aij = (−1)i−1A01j. De todos estos resultados, se obtiene:
det(A) = (−1)i−1det(A0
) = (−1)i−1(a0
11A
0
11+a
0
12A
0
12+· · ·+a
0
1nA
0
1n) = a011(−1)i−1A0
11+a
0
12(−1)
i−1A0
12+· · ·+a
0
1n(−1) i−1A0
1n = ai1Ai1+ai2Ai2+· · ·+ainAin.
El desarrollo por columnas se demuestra simplemente usando traspuestas. Como se tiene
at
ij = aji, tambi´en Atij = Aji, y adem´as det(At) = det(A), el desarrollo por la columna j deA es equivalente al desarrollo por la fila j de At.
Veamos ahora c´omo estas nuevas definiciones del determinante nos pueden dar otra forma de construir la matriz inversa.
DadaA ∈ Mn×n, se define la matriz adjuntadeA, adj(A), como la matriz cuya entrada (i, j) es el adjunto Ai,j.
Proposici´on 1.44 Dada A∈ Mn×n, se tiene A−1 = 1
Demostraci´on: Para ver que el resultado es cierto, calcularemos la matriz B =
A adj(A)t. Primero, para i = 1. . . , n, el elemento b
ii, de la diagonal principal de B, es el siguiente:
bii = (filai de A)(columna i de adj(A)t) =ai1Ai1+· · ·+ainAin.
Pero esto es el desarrollo, por la filai, del determinante deA. Por tanto, bii = det(A), para
i= 1, . . . , n.
Ahora, si i6=j, tenemos:
bij = (fila ide A)(columna j de adj(A)t) = ai1Aj1 +· · ·+ainAjn.
Ahora bien, seaA0 la matriz que se obtiene deAal sustituir su fila j por la filai. Es decir,
A0 tiene dos filas repetidas, la i y la j, por tanto det(A0) = 0. Pero el desarrollo de este determinante por la fila j es precisamente el que acabamos de obtener. Es decir, bij = 0. Por tanto, acabamos de demostrar que
B =Aadj(A)t =
det(A) 0
det(A) . ..
0 det(A)
Si dividimos esta matriz por det(A), obtenemos la matriz identidad. Por tanto,
1
det(A) Aadj(A)
t=I ⇒ A−1 = 1
det(A)adj(A) t.
1.9.
C´
alculo de determinantes.
Hasta ahora, las ´unica manera que conocemos de calcular un determinante, consiste en desarrollarlo por una fila o una columna de la matriz. Sin embargo, este procedimiento de c´alculo no es nada eficaz, ya que, para calcular el determinante de una matriz n×n, hay que calcular n determinantes de matrices (n−1)×(n−1), y para cada uno de estos, hay que calcular (n−1) determinantes de matrices (n−2)×(n−2), y as´ı sucesivamente. Por tanto, el n´umero de operaciones que hay que efectuar es del orden de n!.
Se dice que A ∈ Mn×n estriangular inferior si aij = 0 para todo i < j. Se dice que A ∈ Mn×n estriangular superior si aij = 0 para todo i > j.
El siguiente resultado es evidente a partir de las definiciones:
Proposici´on 1.45 Se tiene:
Una matriz cuadrada escalonada por filas es triangular superior.
Una matriz cuadrada escalonada por columnas es triangular inferior.
La traspuesta de una matriz triangular superior es triangular inferior, y viceversa.
Calculemos ahora el determinante de las matrices triangulares:
Proposici´on 1.46 Si A ∈ Mn×n es triangular inferior o superior, entonces su
deter-minante es el producto de los elementos de su diagonal principal. Es decir, det(A) =
a11a22· · ·ann.
Demostraci´on: Procedemos por inducci´on en n. El resultado es claramente cierto si
n= 1 o n = 2. Supongamos entonces que n >2, y que el resultado es cierto paran−1.
Supongamos primero que A es triangular inferior. Entonces, todos los elementos de su primera fila son nulos salvo, a lo sumo,a11. Por tanto, det(A) = a11A11 =a11det(M11). Pero
M11es tambi´en triangular inferior, y los elementos de su diagonal principal sona22,· · · , ann. Por tanto, por hip´otesis de inducci´on, det(M11) = a22· · ·ann, y el resultado es cierto.
Por ´ultimo, siAes triangular superior, la primera columna deM1j es una columna de ceros, para todoj = 2, . . . , n. Por tanto,A1j = 0 sij >1. Luego det(A) = a11A11 =a11det(M11).
Pero M11 es triangular superior, as´ı que podemos aplicar, igual que antes, la hip´otesis de
inducci´on para obtener el resultado.
M´etodo para calcular determinantes: Dada A ∈ Mn×n, usamos el m´ eto-do de eliminaci´on de Gauss para hallar una forma escalonada A0 de A. Vamos recordando, durante el proceso, las transformaciones elementales utilizadas. El determinante de A es el producto de los determinantes de las matrices elemen-tales correspondientes, multiplicado por los elementos de la diagonal principal de
A0.
Es decir, si A=P1· · ·PrA0, donde P1, . . . , Pr son las matrices elementales que se emplean en el m´etodo de Gauss, yA0 es escalonada por filas, se tiene:
det(A) = det(P1)· · ·det(Pr) det(A0),
pero los determinantes de cada Pi son conocidos y, como A0 es triangular superior, su determinante es muy f´acil de calcular. As´ı, tenemos:
det(A) = det(P1)· · ·det(Pr)a011· · ·a
0
nn.
Nota: En la pr´actica, el c´alculo del determinante de A ∈ Mn×n se efect´ua eligiendo una fila o columna, preferiblemente que tenga alg´un 0 o alg´un 1, y consiguiendo mediante transformaciones elementales que todas las entradas de esa fila o esa columna sean nulas, excepto una (como m´aximo). Entonces se desarrolla el determinante por esa fila o columna, con lo que el c´alculo queda reducido a una matriz m´as peque˜na que la anterior. Continuando este proceso, obteniendo a cada paso una matriz m´as peque˜na, se termina simplemente calculando el determinante de una matriz 2×2.
1.10.
Rango y menores. M´
etodo del orlado.
En esta secci´on daremos una nueva caracterizaci´on del rango de una matriz, utilizando los determinantes. Ya sabemos que, dada una matriz A ∈ Mn×n, det(A) 6= 0 si y s´olo si rg(A) =n. Pero no sabemos nada sobre el rango de A si det(A) = 0, o si la matriz no es cuadrada. Para poder precisar m´as, definiremos los menores de una matriz, de los que ya vimos algunos ejemplos en secciones precedentes.
Dada A ∈ Mm×n, y dadas p filas 1 ≤ i1 < i2 < · · · < ip ≤ m y p columnas 1 ≤ j1 < j2 < · · · < jp ≤ n, se llama submatriz cuadrada de orden p de A, determinada por estas pfilas y pcolumnas, a la matriz M cuyas entradas son los elementos de A que pertenecen, a la vez, a una de estas filas y a una de estas columnas.
Aunque A no sea cuadrada, notemos que las submatrices cuadradas de orden p s´ı lo son, y por tanto se puede calcular su determinante. Podemos entonces definir el rango de una matriz en funci´on de sus menores.
Teorema 1.47 Dada A∈ Mm×n, entonces rg(A) =r si y s´olo si A tiene alg´un menor no
nulo de orden r, y todos los menores de A de orden mayor que r son nulos.
Demostraci´on: Supongamos que rg(A) = r. Entonces sabemos que tiene r filas lineal-mente independientes. Sean i1, . . . , ir dichas filas. La matriz A0 formada por estas r filas tiene, por tanto rango r. Pero eso quiere decir que A0 tiene r columnas linealmente inde-pendientes, digamos j1, . . . , jr. Por tanto, la matriz M formada por estas columnas de A0 tiene rango r. Pero adem´as, M es una submatriz cuadrada de A, de orden r, asociada a estas filas y estas columnas; y como tiene rango r, su determinante es no nulo. Por tanto, existe un menor no nulo de ordenr.
Si hubiera un menor no nulo de ordenp > r, las filas correspondientes a ese menor formar´ıan una matrizA0 ∈ Mp×n, que tendr´ıa una submatrizp×pde determinante no nulo. Es decir, A0 tendr´ıap columnas linealmente independientes. En ese caso, A0 tendr´ıa rango p, luego sus p filas ser´ıan linealmente independientes, y por tanto, habr´ıa p filas de A linealmente independientes. Esto contradice el hecho de que rg(A) = r.
Supongamos ahora que A tiene alg´un menor no nulo de orden r, y todos los menores de
A de orden mayor que r son nulos. Seg´un hemos demostrado antes, si rg(A) = p > r, entonces Atendr´ıa un menor no nulo de orden p, lo cual es imposible. Y si rg(A) =q < r, entonces todos los menores deA de orden mayor que q ser´ıan nulos. Pero esto tambi´en es imposible, ya que sabemos que tiene un menor no nulo de orden r.
M´etodo del orlado, para calcular el rango de una matrizA ∈ Mm×n.
1. Si A es una matriz de ceros, entonces rg(A) = 0.
2. Si no, elegimos un elementoai1j1 6= 0.
3. Buscamos otra filai2, y otra columnaj2, tal que el menor de orden 2
corres-pondiente a las filas i1, i2 y a las columnas j1, j2 sea no nulo. Si no existe,
entonces rg(A) = 1. Si existe, recordamos los datos (i1, i2; j1, j2).
4. Continuamos con el mismo proceso: si conocemos los ´ındices (i1,· · · , ip; j1,· · · , jp) tales que el menor correspondiente es no nulo, buscamos una fila ip+1, y una columna jp+1, tales que el menor asociado a
(i1,· · · , ip+1; j1,· · · , jp+1) sea no nulo. Si no existe, entonces rg(A) =p. Si
existe, repetimos este paso, para un orden mayor.
5. En alg´un momento no podremos seguir aumentando el orden, y habremos obtenido el rango de A.
Proposici´on 1.48 El m´etodo del orlado funciona.
Demostraci´on: No es evidente que este m´etodo funciona: Hay que demostrar que, dada una matriz A∈ Mm×n, si tenemos un menor no nulo de ordenp, y el rango de Aes mayor que p, entonces existe un menor no nulo de orden p+ 1 que contiene al anterior.
Supongamos entonces que rg(A)> p, y que tenemos un menor no nulo de ordenp. Laspfilas correspondientes a ese menor, digamos i1, . . . , ip, son entonces linealmente independientes, y tambi´en lo son las p columnas, j1, . . . , jp. Sea i /∈ {i1, . . . , ip}. Supongamos que la fila i depende linealmente de las filas i1, . . . , ip. Es decir, si llamamos fi al vector determinado
por la filai, tendremos:
fi =α1fi1 +· · ·+αpfip.
En ese caso, podemos transformar la filai, mediante transformaciones elementales de filas (rest´andole cada filafik multiplicada por αk), hasta convertirla en una fila de ceros. Si esto
ocurriera para todoi /∈ {i1, . . . , ip}, obtendr´ıamos una matriz A0, equivalente por filas aA
(luego rg(A0) = rg(A)), que s´olo tendr´ıa p filas distintas de cero. En ese caso tendr´ıamos rg(A) =p, lo que no es posible.
p columnas,j1, . . . , jp que son linealmente independientes. Ahora podemos proceder como antes: si una columnaj /∈ {j1, . . . , jp}depende linealmente de estas pcolumnas, podremos hacerla nula mediante transformaciones elementales por columnas. Si esto pasara para todo
j /∈ {j1, . . . , jp}, obtendr´ıamos una matriz A000 equivalente por columnas a A00, con rango
p. Como esto es imposible, existir´a una columna jp+1 que no dependa linealmente de la
columnas j1, . . . , jp, y por tanto el determinante de la submatriz cuadrada formada por las filas i1, . . . , ip+1, y las columnasj1, . . . , jp+1 deA, es no nulo.
1.11.
Sistemas de ecuaciones lineales.
Comenzaremos viendo un ejemplo del tipo de ecuaciones que vamos a estudiar:
2x+y = 5
x−y= 1
Se trata de un sistema lineal de dos ecuaciones con dos inc´ognitas. Este sistema se puede ver desde varias perspectivas:
Desde el punto de vista geom´etrico, cada una de las dos ecuaciones representa una recta en el plano. Resolver el sistema consiste en hallar (si los hay) los puntos de corte de las dos rectas. Esa es la raz´on de que estos sistema se llamenlineales.
Desde el punto de vista algebraico, el problema consiste simplemente en hallar dos n´umeros,xey, que satisfagan las dos igualdades. Las ecuaciones son linealesporque cada t´ermino (excepto los t´erminos independientes) tiene grado 1.
Si nos quedamos en el marco algebraico, nada nos impide generalizar el concepto de ecua-ci´on lineal a m´as de dos inc´ognitas, y el de sistema lineal a m´as de dos ecuaciones. As´ı, tenemos las siguientes definiciones:
Ecuaci´on lineal:Es una expresi´on de la forma
a1x1+a2x2+· · ·+anxn=b, (1)
Unasoluci´onde la ecuaci´on lineal (1) es una serie de n´umerosα1, . . . , αn,que la satisfagan, es decir, que verifiquen:
a1α1+a2α2+· · ·+anαn=b.
Sistema lineal: Un sistema lineal de m ecuaciones con n inc´ognitas es una ex-presi´on de la forma:
a11x1 + a12x2 + · · · + a1nxn =b1
a21x1 + a22x2 + · · · + a2nxn =b2
..
. ... ... ...
am1x1 + am2x2 + · · · +amnxn =bm,
(2)
donde cada fila es una ecuaci´on lineal diferente, aunque las n inc´ognitas,
x1, . . . , xn, son las mismas para todas ellas.
Unasoluci´on del sistema lineal (2) es una serie de n´umerosα1, . . . , αn,que satisfagan las
m ecuaciones, es decir, tales que
a11α1 + a12α2 + · · · + a1nαn =b1
a21α1 + a22α2 + · · · + a2nαn =b2
..
. ... ... ...
am1α1 +am2α2 + · · · +amnαn =bm.
Diremos que un sistema lineal es:
compatible: si admite alguna soluci´on,
incompatible: si no la admite.
Dado un sistema compatible, diremos que es
compatible determinado: si admite una ´unica soluci´on,
compatible indeterminado: si admite m´as de una.
En este ´ultimo caso veremos que admite infinitas soluciones.