Texto3 Matrices pdf

(1)

(2)

MATRICES

Martínez Héctor Jairo

Sanabria Ana María

Semestre 02, 2.007

3.1. Introducción

En los capítulos anteriores, utilizando la noción de matriz, simplificamos la representación de problemas como los sistema de ecuaciones lineales y de conceptos como el de combinación lineal. De paso, esta representación también nos simplificó, el análisis y la solución de problemas que involucran un sistema de ecuaciones lineales como la determinación de independencia lineal de un conjunto de vectores y la decisión de si un vector es o no combinación lineal de un conjunto de vectores dado, tomando como herramienta de cálculo una versión matricial del algoritmo de Eliminación de Gauss (el cual calcula la forma escalonada equivalente de una matriz) presentado en el primer capítulo. Sin restarle importancia a todo lo anterior, debemos decir que las matrices son importantes en si mismas y el estudio detallado de sus propiedades algebraicas enriquece su aplicación tanto en la matemática misma como en las demás ciencias y profesiones del mundo actual. En este capítulo, retomaremos la definición dada de matriz para estudiar las operaciones algebraicas entre ellas (suma, multiplicación por escalar, producto, transpuesta y determinantes), sus propiedades básicas y los principales tipos de matrices que brindan las aplicaciones más comunes de este objeto matemático. Como una aplicación inmediata de la teoría de matrices, presentaremos otra formulación matricial del algoritmo de eliminación de Gauss y su estrecha relación con la factorización LU de una matriz, la cual es la base del desarrollo de los algoritmos computacionales modernos para resolver eficientemente un sistema de ecuaciones lineales y que son objeto de estudio en cursos como Análisis Numérico o Álgebra lineal Numérica.

3.2. Definición y Tipo de Matrices

Definición 1 [Matriz]. Una matriz es un arreglo rectangular de números reales, llamados componentes o elementos de la matriz, de la forma

A=



   

a11 a12 · · · a1n

a21 a22 · · · a2n

..

. ... . .. ...

am1 am2 · · · amn



   

.

Elorden o tamaño de la matriz se determina por el número de filas seguido del número de columnas. Así, se dice que el tamaño de una matriz esm×n, si tiene mfilas yn columnas. La componenteaij ((i, j)-ésima

(3)

componente) se encuentra en la filaiy columna jde la matrizA. Lai-ésima fila y laj-ésima columna de la matrizA son

¡

ai1 ai2 · · · ain

¢ y



   

a1j

a2j

.. .

amj



   

,

respectivamente. También podemos denotar la matrizAcomo£ a1 a2 · · · an

¤

, donde cadaai(columna

ide la matrizA) es un vector deRm_{ó como}₍_a

ij), dondeaij (componente(i, j)de la matrizA) es un número

real.

Ejemplo 1: Sean

A=





1 −1 1

5 2 −3

−2 0 1



, B= µ

1/3 −1 4 1 5 √2 −3 0

¶

, C=



    

4 5

−2 0 1



    

,

D=¡ 1 −1 1 ¢ y E= (eij), eij = (−1)i+j, i, j= 1,2, . . . n.

La matrizA es de orden3×3,B es una matriz2×4,C es una matriz5×1 (en general, un vector deRm

es una matrizm×1),Des una matriz1×31

yE es una matrizn×n. ¤

Ladiagonal de una matriz está formada por las componentesaij , coni=j; es decir, por las componentes

aii. Así, podemos ver que en el Ejemplo 1, las diagonales de las matrices A, B, C y D son

¡

1 2 1 ¢, ¡

1/3 √2 ¢,¡ 4 ¢y¡ 1 ¢, respectivamente.

Cuando las componentes arriba de la diagonal son ceros (aij= 0parai < j), tenemos una matriz triangular

inferior; si las componentes abajo de la diagonal son ceros (aij = 0 para i > j), tenemos una matriz

triangular superior. Ahora, si el número de filas de una matriz coincide con el número de columnas (m=n), tenemos una matriz cuadrada. De estas matrices cuadradas, si tanto los elementos arriba de la diagonal, como los elementos abajo de la diagonal son ceros (aij = 0parai6=j), tenemos unamatriz diagonal y si la

matriz diagonal tiene todos los elementos de la diagonal iguales (aij = 0parai6=j yaii =α), tenemos una

matriz escalar. La matriz escalar más importante es la que tiene todos los elementos de la diagonal iguales a 1 (aij = 0 para i 6= j y aii = 1). Por las propiedades que demostraremos más adelante en el producto

de matrices, a esta matriz la llamaremos matriz identidad o idéntica y la denotamos como I ó In cuando

queramos explicitar que su orden esn×n. Observemos que

In= [e1, e2, . . . , en],

donde losei son los vectores canónicos deRn definidos en el Ejemplo 2 del Capítulo 2.

Ejemplo 2: Sean

A=





1 0 0 0

5 2 0 0

−2 0 1 0



, B = 

    

1/3 −1 4 1

0 −1 4 0

0 0 0 1

0 0 0 4

0 0 0 0



    

, C=





0 0 0

0 −3 0

0 0 1



,

D=





−3 0 0

0 −3 0

0 0 −3



 e I = 



1 0 0

0 1 0

0 0 1



.

1

Algunos autores llamanvector filadeRn

(4)

Así, A,C, D eI son matrices triangulares inferiores;B, C, D eI son matrices triangulares superiores;C,

D eI son matrices diagonales;D eI son matrices escalares; eI es la matriz idéntica de orden3×3 oI3.¤

Otra matriz importante (por sus propiedades respecto de las operaciones que definiremos más adelante) es lamatriz cero o matriz nula, la cual tiene todas sus componentes iguales a cero y la denotaremos comoO ó

Om×n cuando queramos explicitar que su orden es m×n.

De otro lado, al igual que para vectores, diremos que dos matrices soniguales, cuando todas sus componentes respectivas son iguales.

Ejemplo 3: Consideremos las matrices

A=

µ

a b c

d e f

¶

y B=

µ

2 −1 3 0 −2 5

¶

.

Para que las matricesAyB sean iguales, se debe tenera= 2,b=−1,c= 3,d= 0, e=−2 yf = 5. ¤ Ejemplo 4: Consideremos las matrices

C=¡ −1 3 5 ¢ y D=



 −1

3 5



.

Estas matrices son diferentes, ya que sus tamaños son diferentes. ¤

3.3. Suma y Producto por escalar de Matrices

Al igual que con los escalares y los vectores, dadas unas matrices, es deseable obtener otras a partir de ellas y para esto, podemos generalizar las definiciones de la suma de vectores a la suma de matrices y del producto por escalar de vectores al producto por escalar de matrices.

Definición 2 [Suma de matrices]. Definimos lasuma entre dos matrices de igual tamaño A yB, como la matriz A+B, cuyas componentes son la suma de las componentes respectivas de las matricesA y B. En otras palabras, dadas las matrices

A=



   

a11 a12 · · · a1n

a21 a22 · · · a2n

..

. ... ... ...



   

y B=



   

b11 b12 · · · b1n

b21 b22 · · · b2n

..

. ... ... ...

bm1 bm2 · · · bmn



   

,

se define la suma deAyB por

A+B=



   

a11+b11 a12+b12 · · · a1n+b1n

a21+b21 a22+b22 · · · a2n+b2n

..

. ... . .. ...

am1+bm1 am2+bm2 · · · amn+bmn



   

.

Definición 3[Producto por escalar de matrices]. Definimos el producto de una matrizApor un número real

λ(escalar), como la matrizλA, cuyas componentes son el producto deλpor las componentes respectivas de

A. En otras palabras, dado el escalar λ∈Ry la matriz

A=



   

a11 a12 · · · a1n

a21 a22 · · · a2n

..

. ... . .. ...



   

(5)

definimos el producto deApor el escalarλpor

λA=



   

λa11 λa12 · · · λa1n

λa21 λa22 · · · λa2n

..

. ... ... ...

λam1 λam2 · · · λamn



   

.

Ejemplo 5: Dadas las matrices

A=

µ

1 2 −5

−1 −3 0

¶

y B=

µ

−3 2 1 0 1 −2

¶

,

tenemos que

A+B=

µ

−2 4 −4

−1 −2 −2

¶

y −2A=

µ

−2 −4 10

2 6 0

¶

.

¤ El producto por escalar(−1)A, lo denotamos simplemente como−Ay así, la restaA−B, la obtenemos de

A+ (−1)B.

Al igual que para vectores, la suma y el producto por escalar de matrices tienen propiedades muy similares a las que poseen los números reales. Veamos cuales son las propiedades que se satisfacen para estas dos operaciones entre matrices.

Teorema 1 [Propiedades algebraicas de la suma y la multiplicación por escalar de matrices].

SeanA,ByCmatrices de tamañom×ny seanαyβdos números reales. Entonces se cumplen las siguientes proposiciones:

1. A+B es de nuevo una matrizm×n.Ley clausurativa para la suma 2. A+B=B+A. Ley conmutativa para la suma

3. (A+B) +C=A+ (B+C).Ley asociativa para la suma

4. Existe una única matriz Z de tamañom×n tal queA+Z =Z+A =A(Z =O). Ley modulativa para la suma

5. Para cada matrizA, existe una única matrizPde tamañom×ntal queA+P =P+A=O(P=−A). Existencia del opuesto para la suma

6. λAes de nuevo una matrizm×n.Ley clausurativa para el producto por escalar

7. α(A+B) =αA+αB.Ley distributiva del producto por escalar respecto a la suma de matrices 8. (α+β)A=αA+βA.Ley distributiva del producto por escalar respecto a la suma de escalares 9. (αβ)A=α(βA) =β(αA).Ley asociativa respecto al producto por escalar

10. 1A=A.Ley modulativa para el producto por escalar 11. 0A=O.

12. αO=O.

(6)

La demostración de estas propiedades es muy similar a la de las propiedades de estas operaciones entre vectores (Teorema 1, Capítulo 2) y la dejamos como ejercicios para el lector. ¤ Estas propiedades nos permiten resolver ecuaciones sencillas entre matrices, simplificar expresiones matri-ciales y contar con diferentes formas para hacer un mismo cálculo y poder elegir la forma más eficiente de realizarlo.

Ejemplo 6: Dadas las matricesA=





0 −6

3 0

−1 3



yB=





−2 3

4 1

0 −1



,determine la matrizX tal que

3X−2A+B= 4B.

Sumando el opuesto de las matrices−2AyB en ambos lados de la ecuación, obtenemos

3X−2A+B+ 2A−B = 4B+ 2A−B

3X+ 2A−2A+B−B = 4B−B+ 2A Propiedad 2, Teorema 1.

3X+ (2A−2A) + (B−B) = (4B−B) + 2A Propiedad 3, Teorema 1.

3X+O+O = 3B+ 2A Propiedad 5, Teorema 1.

3X = 3B+ 2A Propiedad 4, Teorema 1. Multiplicando por el escalar 1

3 ambos lados de la última ecuación, tenemos 1

3(3X) = 1

3(3B+ 2A)

X = 1

33B+ 1 32A

X = B+2

3A.

Así que

X =





−2 3

4 1

0 −1



+2

3





0 −6

3 0

−1 3





=





−2 −1

6 1

−2/3 1



.

¤

3.4. Producto de Matrices

Otra operación que uno espera que se pueda definir entre matrices es la multiplicación o producto. Sin embargo, la definición no es la que, tal vez, uno se imagina; no porque no se cumpla una serie de propiedades, sino porque la definición que daremos tiene significado en la aplicación de la teoría de matrices a problemas reales.

Definición 4[Producto de matrices]. Dadas las matricesA, de tamañom×n, yB, de tamañon×k, se define el producto deA por B, como la matriz AB, cuyas columnas son Ab1 Ab2 · · · Abk, donde b1 b2 · · ·bk

son las columnas deB; en otras palabras, se define el producto deAporB = [b1b2 · · · bk]como la matriz

de ordenm×kdada por

(7)

Para enfatizar el orden de los factores en el producto AB, diremos que A pre-multiplica a B o que B

post-multiplica a A.

Ejemplo 7: Dadas las matricesA=





1 −2

3 0

−1 5



yB = µ

−2 3 4 1

¶

,calculemosABo pre-multiplequemos aB porA.

Usando la Definición 7 del Capítulo 2, tenemos

Ab1 =





1 −2

3 0

−1 5



 µ

−2 4

¶

= −2





1 3

−1



+ 4 

 −2

0 5



 = 

 −10

−6 22





Ab2 =





1 −2

3 0

−1 5



 µ

3 1

¶

= 3





1 3

−1



+ 1 

 −2

0 5



 = 



1 9 2



.

Así que,

AB=£ Ab1 Ab2 ¤=





−10 1

−6 9 22 2



.

¤ Observemos que el producto de matrices sólo es posible si el número de columnas de la primera matriz es igual al número de filas de la segunda matriz. De otro lado, no es difícil ver que la(i, j)−ésima componente de AB es lai-ésima componente del vector Abj, la cual es el resultado del producto escalar de lai-ésima

fila deA por laj-ésima columna deB. En efecto, volvamos sobre el ejemplo anterior y verifiquemos que la componente(3,1) del productoAB efectivamente es el producto escalar de la tercera fila de la matriz Ay la primera columna de la matrizB.

AB=





1 −2

3 0

-1 5 

 µ

-2 3

4 1

¶

=





−10 1

−6 9

22 2



.

Resumamos la observación anterior en el siguiente teorema. La demostración queda como ejercicio para el lector, no sin antes anotar que otros autores utilizan este resultado como definición del producto de matrices.

Teorema 2 [Componentes del producto de matrices].

Dadas las matricesA= (aij), de tamañom×n, yB = (bij), de tamañon×k, siC= (cij) =AB, entonces

cij =ai1b1j+ai2b2j+· · ·+ainbnj

parai= 1, 2, . . . myj= 1, 2, . . . k. ¤

Antes de presentar las propiedades algebraicas de esta nueva operación, veamos el significado de las opera-ciones entre matrices presentadas hasta ahora con una situación real en miniatura.

Ejemplo 8: Sean J y N las matrices que resumen la información de las ventas realizadas por Juliana y Nathalie, respectivamente, durante 1 mes.

Juliana (J) Nathalie (N)

Semana Semana

Producto a b c

1 2 3 4

17 3 10 0

4 5 8 2

25 15 30 10

1 2 3 4

40 13 17 23

8 2 5 0

(8)

SeaC la matriz que resume las comisiones (en efectivo y en especie) por artículo vendido durante cada una de las 4 semanas del mes.

Comisión por artículo vendido Semana

1 2 3 4

En efectivo En especie (Miles de $) ( No. de Unidades)

12,50 2

20,00 3

27,50 1

9,50 5.

1. El total de las ventas realizadas por las dos vendedoras estará dado por

J+N =





17 3 10 0

4 5 8 2

25 15 30 10



+ 



40 13 17 23

8 2 5 0

3 5 0 6



= 



57 16 27 23

12 7 13 2

28 20 30 16



,

por ejemplo, entre las dos, vendieron13 = 8 + 5artículos del Productobdurante la Semana 3. 2. Si Juliana repite su esquema de ventas durante 6 meses, el total de ventas de Juliana para este periodo

estará dado por

6J = 6





17 3 10 0

4 5 8 2

25 15 30 10



= 



102 18 60 0

24 30 48 12

150 90 180 60



,

por ejemplo, en las condiciones dadas, Juliana vendió 18 = 6×3artículos del Producto adurante las segundas semanas de estos 6 meses.

3. La distribución, por tipo de producto, de la comisión devengada por Nathalie durante 1 mes estará dado por

N C=





40 13 17 23

8 2 5 0

3 5 0 6



 

  

12,50 2

20,00 3

27,50 1

9,50 5



  =





1.436,50 251 277,50 27

194,50 51



,

por ejemplo, Nathalie obtuvo una comisión, en efectivo, de$194,500 = 3×$12,50 + 5×$20,00 + 0×

$27,50 + 6×$9,50por lo vendido del Productocdurante el mes en cuestión. ¤

En el siguiente teorema, se encuentra un resumen de las propiedades algebraicas del producto entre matrices.

Teorema 3 [Propiedades algebraicas del producto de matrices].

SeaAuna matriz de tamaño m×n,αun número real cualquiera yB yC matrices tales que los productos indicados se pueden efectuar. Entonces se cumplen las siguientes proposiciones:

1. (AB)C=A(BC).Ley asociativa para el producto

2. A(B +C) = AB+AC. Ley distributiva del producto de matrices a izquierda respecto la suma de matrices

3. (A+B)C=AC+BC.Ley distributiva del producto de matrices a derecha respecto la suma de matrices 4. α(AB) = (αA)B =A(αB).

5. Existe una única matriz P de orden m y una única matriz Q de orden n tales queP A =AQ= A. (P =Im yQ=In)Ley modulativa del producto

(9)

Demostración: Probemos las propiedades 1 y 4. Dejamos las demás como ejercicio para el lector. Supon-gamos que

C= [ c1 c2 · · · cp ] , B= [ b1 b2 · · · bk ] y ci=



   

c1i

c2i

.. .

cki



   

,

de modo que

AB= [ Ab1 Ab2 · · · Abk ].

1. Observemos que

(AB)ci = [ Ab1 Ab2 · · · Abk ]ci

= c1i(Ab1) +c2i(Ab2) +· · ·+cki(Abk)

= A(c1ib1) +A(c2ib2) +· · ·+A(ckibk)

= A(c1ib1+c2ib2+· · ·+ckibk)

= A(Bci).

Así que,

(AB)C = [ (AB)c1 (AB)c2 · · · (AB)cp ]

= [ A(Bc1) A(Bc2) · · · A(Bcp) ]

= A[ Bc1 Bc2 · · · Bcp ]

= A(BC).

4. Ahora,

α(AB) = α[ Ab1 Ab2 · · · Abk ]

= [ α(Ab1) α(Ab2) · · · α(Abk) ]

= [ (αA)b1 (αA)b2 · · · (αA)bk ]

= (αA)[ b1 b2 · · · bk ]

= (αA)B.

y de manera similar, podemos ver que α(AB) =A(αB) ¤

Estas propiedades permiten simplificar cálculos. Dos casos fundamentales son los siguientes.

1. El cálculo de An_{. Por ejemplo, para calcular} _A8_{, tendríamos que efectuar 7 multiplicaciones de}

matrices:

A8= ((((((AA)A)A)A)A)A)A

lo que, utilizando la propiedad asociativa de la multiplicación, lo podemos reducir a 3 multiplicaciones

A2=AA , A4=A2A2 y A8=A4A4,

al asociar el producto de las matrices de la siguiente manera

(10)

2. El cálculo de An_{x. Por ejemplo, para calcular}

A4x= (AAAA)x= [(AA)(AA)]x,

es más eficiente calcular

A(A(A(Ax)));

ya que hay que hacer menos operaciones al multiplicar una matriz por un vector, que al multiplicar dos matrices.

La propiedad asociativa del producto nos permite formular las siguientes propiedades y la utilidad de ellas en la simplificación de cálculos, como lo vimos en el primero de los anteriores casos fundamentales.

Teorema 4[Propiedades algebraicas de la potenciación de matrices].

SeanAyB matrices de ordenn×n, ym, r, snúmeros enteros no negativos, entonces 1. Ar_As₌_Ar+s_.

2. (Ar₎s₌_Ars_.

3. (AB)m₌_Am_Bm_{, cuando}_A_y_B _{conmutan (}_AB₌_BA_).

Demostración:La dejamos como ejercicio para el lector. ¤ Es importante que observemos que la propiedad conmutativa de la multiplicación no siempre se tiene:

1. El productoABpuede estar definido, mientras que BAno. Por ejemplo, si el tamaño de A esm×n

y el deB esn×pcon m6=p.

2. Los dos productos pueden estar bien definidos, pero ABtener un tamaño y BAotro. Por ejemplo, si el tamaño de Aesm×ny el deB esn×mconm6=n, el tamaño deABesm×my el de la matriz

BA esn×n.

3. SiA yB son matrices cuadradas de igual tamaño, tenemos queAB yBAestán bien definidas y son de igual tamaño, pero en generalAB6=BA.

Ejemplo 9: Observemos el producto de las siguientes matrices, en diferente orden.

AB=

µ

1 1 0 0

¶ µ

1 0

−1 0

¶

=

µ

0 0 0 0

¶

y

BA=

µ

1 0

−1 0

¶ µ

1 1 0 0

¶

=

µ

1 1

−1 −1

¶

.

¤

4. CuandoAB=BA, se dice que lasmatrices conmutan.

Igualmente hay otras propiedades del producto que tenemos en los números reales, que entre matrices no tenemos. Esto se debe fundamentalmente a la ausencia de lo que en los números reales sería el inverso multiplicativo. Veamos algunas de ellas:

1. AB=Ono implica queAoB sean la matrizO, como vimos en la primera parte del ejemplo anterior. 2. CA=CB (óAC=BC) no implica queA=B.

Ejemplo 10: Observemos que el producto de las siguientes matrices tienen el mismo resultado, y aunque una de ellas es la misma, las otras no son iguales.

µ

1 1 0 0

¶ µ

1 0

−1 0

¶

=

µ

0 0 0 0

¶

=

µ

1 1 0 0

¶ µ

0 −2

0 2

¶

.

(11)

3. A2₌_I _{no implica que}_A₌_±_I_.

Ejemplo 11: Observemos que el producto de una matriz por si misma da la matriz idéntica; sin embargo, la matriz no es la idéntica ni el opuesto de la idéntica

µ

2 1

−3 −2

¶ µ

2 1

−3 −2

¶

=

µ

1 0 0 1

¶

.

¤

3.5. Matrices invertibles

Volviendo sobre el comentario de la ausencia de inverso multiplicativo, podemos ver que no para todas las matricesAexiste otra matrizB tal queAB=I.

Ejemplo 12: Veamos que siA=

µ

1 −1

0 0

¶

, no existe una matrizB=

µ

a b

c d

¶

, tal queAB=I.

µ

1 −1

0 0

¶ µ

a b

c d

¶

=

µ

a−c b−d

0 0

¶

6

=

µ

1 0 0 1

¶

.

¤ A las matrices que tienen inverso multiplicativo, les llamamos de manera especial.

Definición 5[Matriz invertible]2

. Se dice que la matrizAde tamañon×nesinvertible ono singular, si y solo si existe una matrizB tal que

AB=BA=I.

A esta matrizB, la llamamos inversa deA.

Surgen, entonces, las siguientes preguntas. Es la matriz inversa única? Cómo determinar que una matriz es invertible? (es necesario encontrar explícitamente una inversa?), Cómo calcular una inversa de una matriz? Comencemos a contestar estas preguntas, suponiendo que existen dos matrices inversas de A. Sean B yC

matrices inversas deA. Así que

AB=BA=I y AC=CA=I

De modo que, si multiplicamos ambos lados de la igualdadAB=Ipor la matrizCy usamos las propiedades del producto de matrices, tenemos

C(AB) = CI (CA)B = C

IB = C

B = C.

De esta forma, hemos demostrado el siguiente teorema.

Teorema 5 [Unicidad de la inversa].

SiA es una matriz invertible, su inversa es única. ¤

Con este resultado, cuando la matrizAes invertible, podemos hablar dela inversa deAy la denotamos por

A−1_.

2

(12)

Ejemplo 13: Verifiquemos queB=





1 −1 0

2 0 −1

3 1 0



es la matriz inversa deA=1₄ 



1 0 1

−3 0 1 2 −4 2



.

Por multiplicación directa, podemos ver que

AB=1 4





1 0 1

−3 0 1 2 −4 2



 



1 −1 0

2 0 −1

3 1 0



= 1

4





4 0 0 0 4 0 0 0 4



= 



1 0 0

0 1 0

0 0 1



.

De la misma forma, podemos verificar queBA=I3, por lo tanto,B es la matriz inversa deA; es decir, B =A−1_.

¤ Veamos ahora, cómo determinar si una matriz es invertible. Sabemos que si una matrizA, de tamañon×n, es invertible, su inversa,A−1_{, también tiene tamaño}_n_×_n_.

Asi que debemos verificar si existe una matrizB= [ b1 b2 · · · bn ], tal que

AB= [ Ab1 Ab2 · · · Abn ] =I= [ e1 e2 · · · en ].

En otras palabras, tenemos que determinar si los sistemas

Ab1=e1, Ab2=e2, · · ·, Abn=en

tienen solución. Para esto, podemos escalonar las matrices

[A:e1] , [A:e2] ,· · ·, [A:en],

y determinar la consistencia de los sistemas de ecuaciones lineales asociados, lo que se garantiza si la forma escalonada de A tiene n pivotes [Observación 6, Capítulo 1]. Observemos que, para determinar si A es una matriz invertible, no es necesario resolver los anteriores sistemas de ecuaciones lineales. De ser necesario calcularA−1_{, podríamos resolver simultáneamente los anteriores sistemas mediante el Algoritmo}_Eliminación

de Gauss + Sustitución hacia atrás3

aplicado a la matriz aumentada conjunta

[A:e1 e2, · · ·, en] = [A:I],

como vimos al final del Capítulo 1.

Ejemplo 14: Determine siA=





0,25 −0,25 0 0,50 0 −0,25 0,75 0,25 0



es invertible.

Aplicando sucesivamente las operaciones elementalesR2−2R1→R2,R3−3R1→R3y R3−2R2→R3 a

la matrizA(Eliminación de Gauss), obtenemos la matriz escalonada equivalente 



0,25 −0,25 0 0 0,50 −0,25

0 0 0,50



.

Como tenemos 3 pivotes, la matriz inversa deAexiste, por lo tantoAes una matriz invertible. ¤ Ejemplo 15: Encuentre la inversa de la matrizAdel ejemplo anterior.

3

(13)

Como observamos antes, para calcularA−1_{, debemos resolver simultáneamente los sistemas de ecuaciones}

lineales

Ab1=e1, Ab2=e2, y Ab3=e3,

donde e1,e2 y e3 son los vectores canónicos de R3. Para ello, apliquemos el Algoritmo Eliminación de

Gauss + Sustitución hacia atrás, separando sus dos etapas. Primero, aplicando sucesivamente las mismas operaciones elementales que en el ejemplo anterior a la matriz aumentada conjunta[A:I3](Eliminación de Gauss), obtenemos





0,25 −0,25 0 1 0 0

0 0,50 −0,25 −2 1 0

0 0 0,50 1 −2 1



.

Segundo, apliquemos sucesivamente las operaciones elementales2R3→R3,R2+ 0,25R3 →R2,2R2→R2, R1+ 0,25R2→R1y4R1→R1 a la anterior matriz (Sustitución hacia atrás), para obtener





1 0 0 1 0 1

0 1 0 −3 0 1

0 0 1 2 −4 2



.

Como vimos al final del Capítulo 1, cada una de las tres columnas de la derecha en la matriz anterior es la solución de cada uno de los tres sistemas de ecuaciones lineales planteados, respectivamente; por lo tanto,

A−1₌





1 0 1

−3 0 1 2 −4 2



.

¤ Nuevamente, notemos que si se quiere calcular la inversa de una matrizA, generalmente, es necesario resolver los sistemas[A:e1], [A:e2], · · ·, [A:en]; y que para determinar si una matriz es invertible, no es necesario

calcular su inversa, puesto que es suficiente con saber que su inversa existe, para lo cual sólo se requiere escalonar la matriz y verificar que la matriz escalonada equivalente tienenpivotes.

Por suerte, lo que generalmente necesitamos es saber si una matriz es invertible y no saber cuál es su inversa. Incluso, si necesitamos calcular el vectorA−1_b_{para una matriz}_A_{y un vector}_b_{dados, es más fácil resolver}

el sistema de ecuaciones linealesAx=b, que calcular la matriz inversa deAy luego multiplicar el resultado por el vectorb.

Veamos algunas de las propiedades de las matrices invertibles y sus inversas, las cuales son muy importantes tanto en el desarrollo teórico como en la simplificación de expresiones matriciales.

Teorema 6 [Propiedades algebraicas de la inversa de una matriz].

Sean A y B matrices invertibles de tamaño n×n, λ un escalar diferente de 0 y m un número natural, entonces

1. A−1 _{también es invertible y}₍_A−1₎−1₌_A

2. λAtambién es invertible y(λA)−1₌ 1 λA

−1_.

3. AB también es invertible y(AB)−1₌_B−1_A−1_{(notemos el orden del producto de las inversas).}

4. Am_{también es invertible y}₍_Am₎−1_{= (}_A−1₎m_.

Demostración:

(14)

1. Para demostrar que A−1 _{es invertible, es suficiente con mostrar que existe una matriz} _C _{tal que} A−1_C₌_I_{. Pero es claro que si tomamos} _C ₌_A_{, tenemos} _A−1_A₌_I. _{Así que}_A−1 _{es invertible y su}

inversa (que es única) esA. En otras palabras,(A−1₎−1₌_A_.

2. Veamos que siC= 1 λA

−1_{, entonces, por el Teorema 2,}

C(λA) =

µ

1 λA

−1

¶

(λA) =

µ

1 λλ

¶

(A−1_A_{) =}_I.

Así queλAes invertible y (λA)−1₌_C₌ 1 λA

−1_.

3. De manera similar, vemos que

(AB)(B−1_A−1_{) =}_A₍_BB−1₎_A−1₌_AIA−1₌_AA−1₌_I.

Así queAB es invertible y(AB)−1₌_B−1_A−1_.

4. Igualmente, comoAyA−1 _{conmutan, por el Resultado 3 del Teorema 3,} Am(A−1₎m_{= (}_AA−1₎m₌_Im₌_I

Asi queAm_{también es invertible y}₍_Am₎−1_{= (}_A−1₎m_. _¤

Ahora estamos en capacidad de demostrar uno de los resultados más importantes del Álgebra Lineal relacio-nado con la caracterización de las matrices invertibles en término de la solución de sistemas de ecuaciones lineales y la independencia lineal de vectores.

Teorema 7 [Equivalencia de la invertibilidad].

SeaA una matriz de tamañon×n. Las siguientes proposiciones son equivalentes.

a) La matrizA es invertible.

b) La única solución deAx=besx=A−1_b. c) La única solución deAx=0esx=0.

d) Las columnas de la matriz Ason linealmente independientes (l.i.). Demostración:

Para demostrar estas equivalencias, demostremos las siguientes implicaciones

a) =⇒b) =⇒c) =⇒d) =⇒a)

[a) =⇒ b)] Supongamos que A es una matriz invertible. Veamos primero que x = A−1_b _{es solución del}

sistema Ax =by luego, que esta solución es la única. Para esto, verifiquemos que x= A−1_b_{satisface la}

ecuaciónAx=b.

A(A−1_b_{) = (}_AA−1₎_b₌_I_b₌_b_.

Ahora, supongamos que y es otra solución de Ax =b. Así, Ay= by al multiplicar ambos lados de esta igualdad porA−1_{, tenemos}

A−1₍_A_y_{) =} _A−1_b (A−1_A₎_y ₌ _A−1_b

(15)

[b) =⇒c)] Teniendo en cuenta que sihes solución del sistema homogéneoAx=0yx=A−1_b_{es solución}

del sistema Ax =b, por el Corolario 5.1 del Capítulo 2, x+h es también solución de Ax =b, como la solución es única, entonces x = x+h; por lo tanto, h = 0; es decir, el vector 0 es la única solución de

Ax=0.

[c) =⇒d)] SiAx=0tiene solución única, por el Teorema 6 del Capítulo 2, las columnas de la matrizAson l.i.

[d) =⇒ a)] Si las columnas de A son l.i., su forma escalonada equivalente tiene npivotes; es decir, todas sus filas tienen pivotes; por lo tanto, el sistema Ax=b tiene solución para cualquierb; en particular, los sistemas Ax =ei, para i= 1,2, . . . , n tienen solución. Como, por definición, la solución deAx=ei es la

columnaide la matriz inversa deA, concluimos que la inversa deA existe, por tantoAes invertible. ¤ Aunque suene repetitivo, es importante observar que la propiedadb)del Teorema 7 no se utiliza para calcular la solución de un sistema de ecuaciones lineales, pues para calcular la matriz inversa habría que resolvern

sistemas de ecuaciones de la formaAx=ei. Como dijimos antes, esta propiedad se debe utilizar en el sentido

contrario, si se necesita calcularA−1_{b, se resuelve el sistema} _A_x₌_{b, evitándose el cálculo de}_A−1_.

Observemos que el Resultado 3 del Teorema 6 nos da una condición suficiente para que el producto de matrices sea invertible. Veamos que la equivalencia entre las proposiciones a) y c) de Teorema 7 nos permite demostrar que la invertibilidad de los factores también es una condición necesaria para la invertibilidad del producto de matrices.

En efecto, supongamos que la matrizBno es invertible; por el Teorema 7, existex6=0tal queBx=0, por lo tanto, existex6=0tal queABx=0, y nuevamente, por el Teorema 7, podemos concluir que ABno es invertible.

De otro lado, si la matriz B es invertible y la matriz A no, entonces existe y 6= 0 tal que Ay = 0. Sea x = B−1_{y; como} _y ₆₌ _{0, entoncesx} ₆₌ _{0. Además,} _AB_x ₌ _AB₍_B−1_y_{) =} _A_y ₌ ₀ _{y por el Teorema 7,}

podemos concluir queABno es invertible. Asi, hemos demostrado el siguiente corolario.

Corolario 7.1

Si la matrizABes invertible y las matricesAyBson cuadradas, entonces las matricesAyBson invertibles.

3.6. Transposición de Matrices

Hasta aquí, las operaciones entre matrices son similares a las de los números reales. Introduzcamos una nueva operación que no tiene análoga en los números reales y se aplica a una sola matriz y que es de mucha utilidad tanto teórica como práctica.

Definición 6[Transpuesta de una matriz]. La transpuesta de una matrizA, de tamañom×n, es la matriz

AT_{, de tamaño}_n_×_m_{, que se obtiene tomando la}_i_{-ésima columna de}_AT _{como la}_i_{-ésima fila de}_A_{; es decir,}

siA= (aij), entonces AT = (aji).

Notemos que si las columnas deAT _{son las filas de}_A_{, las filas de} _AT _{son las columnas de}_A_.

Ejemplo 16: Encontremos las transpuestas de las siguientes matrices

A=

µ

1 3 −1

−2 0 5

¶

, B=





1 −2 3

3 0 −1

−1 5 7



, C= 



2 3

−5



 y D=¡ 3 −1 0 ¢.

Al transponer, obtenemos

AT =





1 −2

3 0

−1 5



, BT = 



1 3 −1

−2 0 5

3 −1 7



, CT =¡ 2 3 −5 ¢ y DT = 



3

−1 0



(16)

Observemos que, efectivamente, la segunda fila deA,¡ −2 0 5 ¢, es la segunda columna deAT_,



 −2

0 5



,

y que la segunda columna deA, µ

3 0

¶

, es la segunda fila deAT_,¡ ₃ ₀ ¢_. _¤

Notemos también que cuando los vectores son vistos como matrices, la transposición nos permite otra forma de interpretar o de expresar el producto punto entre dos vectores. Sean

u=



   

u1 u2

.. .

un



   

y v=



   

v1 v2

.. .

vn



   

vectores deRn_{, entonces}

u·v = u1v1+u2v2+· · ·+unvn

= ¡ u1 u2 · · · un

¢ 

   

v1 v2

.. .

vn



   

= uT_v_.

En forma similar, la transposición de matrices nos permite ver que eT

i A es la i-ésima fila de A y que

eT

iAej =aij, la(i, j)-componente de la matrizA. Su demostración la dejamos como ejercicio para el lector.

Veamos ahora, cuales son las relaciones entre las operaciones básicas y la transposición de matrices.

Teorema 8 [Propiedades algebraicas de la transpuesta de matrices].

SeanAy B matrices tales que las operaciones indicadas están bien definidas yλun número real (escalar). Entonces,

1. (AT₎T ₌_A_.

2. (A+B)T ₌_AT ₊_BT_.

3. (λA)T ₌_λAT_.

4. (AB)T ₌_BT_AT_{.(Notemos el orden del producto de las transpuestas)}

5. SiAes invertible,AT _{también es invertible y}₍_AT₎−1_{= (}_A−1₎T_.

Demostración: La demostración de las tres primeras propiedades es sencilla y directa, las cuales dejamos como ejercicio para el lector. Demostremos las dos últimas.

4. Para demostrar esta propiedad, en primer lugar, observemos que para que el producto AB esté bien definido, siAes una matrizm×n,B debe ser una matrizn×py entoncesABes una matrizm×p. Así, BT _{es una matriz}_p_×_n_y_AT _{es una matriz}_n_×_m_{, de tal forma que el producto}_BT_AT _{está bien}

definido y es una matrizp×m, al igual que(AB)T_{. Denotemos por}_{f il}

i(U)a lai-ésima fila deU, por

colj(U) a la j-ésima columna de U y por (U)ij a la componente (i, j) de U. Así, con esta notación,

tenemos

((AB)T)ij = (AB)ji

= f ilj(A)·coli(B)

= colj(AT)·f ili(BT)

= f ili(BT)·colj(AT)

(17)

En otras palabras, tenemos que la componente (i, j) de(AB)T _{es la componente} ₍_{i, j}₎_de _BT_AT_{. Y,}

puesto que esto se tiene para cualquier iyj , entonces(AB)T ₌_BT_AT_.

5. Puesto queA es invertible, existeA−1_{, tal que}_AA−1₌_I_{. Ahora, por la Propiedad 4,} AT₍_A−1₎T _{= (}_A−1_A₎T ₌_IT ₌_I.

Así, que AT _{es invertible y su inversa es} ₍_AT₎−1_{= (}_A−1₎T_. _¤

Las matrices que son iguales a sus transpuestas, juegan un papel fundamental en la teoría del álgebra lineal, como veremos en los siguientes capítulos. Ellas reciben un nombre especial derivado de la estructura de sus componentes.

Definición 7[Matriz simétrica]. Una MatrizA de tamañon×nes simétrica, si y solo si, es igual a su transpuesta. Es decir, si y solo si,

A=AT_.

Ejemplo 17: Determinemos cuáles de las siguientes matrices son simétricas

A=

µ

1 −3

−3 0

¶

, B =





1 0 0

0 1/2 0

0 0 −7



, C= 



0 1 4

−1 1 −2

−4 2 5



 y D= 



0 −1 4 −7

−1 1 −2 0

−4 −2 5 0,5



.

Es fácil ver queA=AT _y_B₌_BT_{, mientras que}_CT ₆₌_C_{, por tanto} _A_y_B _{son simétricas, mientras que}_C

no lo es. La matrizD, por no ser cuadrada, tampoco es simétrica. ¤

Ejemplo 18: Veamos que siA es una matriz de tamañom×n,AAT _{es una matriz simétrica.}

Por las Propiedades 1 y 4 del Teorema 8, tenemos que (AAT₎T _{= (}_AT₎T_AT ₌_AAT_{; por lo tanto,}_AAT _es

simétrica. ¤

3.7. Matrices Elementales

Recordemos que el método de eliminación de Gauss consiste en aplicar operaciones elementales entre filas a la matriz aumentada del sistema de ecuaciones lineales hasta obtener una forma escalonada de ella. Veremos que aplicar una operación elemental a una matriz A es equivalente a pre-multiplicar esta matriz por otra, llamada matriz elemental.

Definición 8[Matriz Elemental]. Llamamosmatriz elemental de tamañon×na una matriz que se obtiene de aplicar una operación elemental entre filas a la matriz identidadI, también de tamañon×n.

Como existen tres tipos de operaciones elementales entre filas (eliminación, escalamiento y permutación), existen tres tipos de matriz elemental que reciben los mismos nombres. La estructura de cada tipo de matriz elemental es muy especial como lo podemos ver en el siguiente ejemplo.

Ejemplo 19: Veamos que las siguientes matrices son elementales.

E1=





1 0 0 0 5 0 0 0 1



, E2=

µ

1 0

−3 1

¶

, E3=



  

0 0 1 0

0 1 0 0

1 0 0 0

0 0 0 1



  .

La matrizE1se obtiene de la matrizI3, al aplicarle la operación elemental de Tipo Escalamiento5F₂−→F₂,

por lo cual E1 es una matriz elemental de Tipo Escalamiento. Notemos que la única componente de E1

diferente a las de I3 está en la posición (2,2), que es5en lugar de 1, y que esta posición está relacionada

(18)

La matriz E2 se obtiene de la matriz I2, al aplicarle la operación elemental de Tipo Eliminación F₂+ (-3)F₁−→F₂, por lo cualE2 es una matriz elemental de Tipo Eliminación. Notemos que la única

compo-nente deE2 diferente a las deI2 está en la posición (2,1), que es-3en lugar de 0, y que esta posición está

relacionada con las filas1y2usadas en la operación elemental aplicada, y que -3es el escalar involucrado en dicha operación.

La matrizE3se obtiene de la matrizI4, al aplicarle la operación elemental de Tipo PermutaciónF₁←→F₃,

por lo cualE3 es una matriz elemental de Tipo Permutación. Notemos que las únicas componentes deE3

diferente a las deI4están en las posiciones(1,1),(1,3),(3,1)y(3,3), que donde había un cero quedó un 1 y

viceversa, y estas posiciones están relacionadas con las filas1y3usadas en la operación elemental aplicada.¤

En general, la matriz elemental (Tipo Eliminación) correspondiente a la operación elementalF_i+(c)F_j −→F_i

difiere de la matriz idéntica sólo en la posición (i,j), donde aparecec en lugar de un cero. Igualmente, la matriz elemental (Tipo Escalamiento) correspondiente a la operación elemental (c)F_i −→F_i difiere de la matriz idéntica sólo en la posición(i,i), donde aparececen lugar de uno. Y, de la misma forma, la matriz elemental (Tipo Permutación) correspondiente a la operación elemental F_i ←→ F_j difiere de la matriz idéntica en las posiciones(i,i), (i,j),(j,i)y(j,j), donde aparecen unos en lugar de ceros y viceversa. Ahora, observemos que pre-multiplicar por una de estas matrices elementales es equivalente a aplicar la operación elemental correspondiente.

Ejemplo 20: Sean las matrices

A=

µ

0 0 2

3 −1 0

¶

, B=





1 2 −1

0 −1 1

0 2 5



 y C= 

  

3/4 0 −1/2

−1 −1 3

1 2 −1

4 0 5



  .

Al aplicar la operación elemental entre filasF1←→F2a A, obtenemos

A1=

µ

3 −1 0

0 0 2

¶

,

y, al pre-multiplicar aAporE1, la correspondiente matriz elemental Tipo Permutación, obtenemos

E1A=

µ

0 1 1 0

¶ µ

0 0 2

3 −1 0

¶

=

µ

3 −1 0

0 0 2

¶

=A1.

De igual forma, al aplicar la operación elemental entre filasF3+ 2F2−→F3 aB, obtenemos

B1=





1 2 −1

0 −1 1

0 0 7



,

y, al pre-multiplicar aB porE2, la correspondiente matriz elemental Tipo Eliminación, obtenemos

E2B=





1 0 0

0 1 0

0 2 1



 



1 2 −1

0 −1 1

0 2 5



= 



1 2 −1

0 −1 1

0 0 7



=B1.

Y similarmente, al aplicar la operación elemental entre filas4F1−→F1 aC, obtenemos

C1=



  

3 0 −2

−1 −1 3

1 2 −1

4 0 5



(19)

y, al pre-multiplicar aCporE3, la correspondiente matriz elemental Tipo Escalamiento, obtenemos

E3C=



  

4 0 0 0

0 1 0 0

0 0 1 0

0 0 0 1



  



  

3/4 0 −1/2

−1 −1 3

1 2 −1

4 0 5



  =



  

3 0 −2

−1 −1 3

1 2 −1

4 0 5



  =C1.

¤ Observemos que el orden o tamaño de las matrices elementales esn×n, dondenes el número de filas de la matriz a la cual se le aplica la correspondiente operación elemental entre filas. Observemos también que las operaciones elementales entre filas son reversibles; es decir, que es posible recuperar la matriz a la cual se le ha aplicado una operación elemental entre filas, aplicando al resultado otra operación elemental entre filas. En efecto, siA1 se obtiene al aplicarle la operación elementalFi+cFj −→Fi a A, entonces Ase obtiene

al aplicarle la operación elemental Fi−cFj −→ Fi a A1. De igual forma, si B1 se obtiene de aplicarle la

operación elementalcFi −→Fi a B, entoncesB se obtiene de aplicarle la operación elemental 1_cFi−→Fi a

B1 y, finalmente, siC1se obtiene de aplicarle la operación elemental Fi ←→Fj a C, entoncesC se obtiene

de aplicarle la misma operación elemental Fi ←→ Fj a C1. Esto nos indica que las matrices elementales

son invertibles y, aún más, que sus inversas son matrices elementales del mismo tipo, como se resume en el siguiente teorema.

Teorema 9. [Inversa de las matrices elementales]

Las matrices elementales son invertibles y la inversa de una matriz elemental es a su vez una matriz elemental del mismo tipo; más exactamente,

1. La inversa de la matriz elemental correspondiente a la operación elementalFi+cFj −→Fies la matriz

elemental correspondiente a la operación elementalFi−cFj−→Fi.

2. La inversa de la matriz elemental correspondiente a la operación elemental cFi −→ Fi, c 6= 0 es la

matriz elemental correspondiente a la operación elemental 1

cFi−→Fi.

3. La inversa de la matriz elemental correspondiente a la operación elemental Fi ←→ Fj es la matriz

elemental correspondiente a la misma operación elementalFi←→Fj.

Demostración: Por cálculo directo, en cada uno de los tres casos, podemos verificar que al aplicar la operación elemental indicada a la matriz elemental correspondiente a la otra operación elemental, obtenemos

la matriz idéntica. ¤

Ejemplo 21: Veamos cuales son las inversas de cada una de las siguientes matrices elementales

E1=

µ

1 0

-3 1

¶

, E2=





1 0 0

0 5 0

0 0 1



, E3=



  

0 0 1 0

0 1 0 0

1 0 0 0

0 0 0 1



  .

Por el resultado anterior,

E−1

1 =

µ

1 0

3 1

¶

, E−1

2 =





1 0 0

0 1/5 0

0 0 1



, E₃−1= 

  

0 0 1 0

0 1 0 0

1 0 0 0

0 0 0 1



  =E3.

(20)

que, a partir de una matriz dadaA, es posible obtener una matriz triangular superior (o con forma escalonada)

U, pre-multiplicando sucesivamente por matrices elementales apropiadas de Tipo Eliminación y Permutación a la matrizA.

Ejemplo 22. (Parte A): Dada la matriz

A=





1 −1 2 3

1 2 −1 −3

0 2 −2 1



,

calculemos la matrizU, una forma escalonada deA, y las matrices elementalesE1,· · ·, Ek, tales que

Ek· · ·E1A=U.

Al aplicar operaciones elementales, tenemos que





1 −1 2 3

1 2 −1 −3

0 2 −2 1





F2−F1 −→ F2





1 −1 2 3

0 3 −3 −6

0 2 −2 1





F3−23F2 −→ F3





1 −1 2 3

0 3 −3 −6

0 0 0 5



.

Así que 



1 0 0

0 1 0

0 −2 3 1





| {z }

E2





1 0 0

−1 1 0

0 0 1





| {z }

E1





1 −1 2 3

1 2 −1 −3

0 2 −2 1





| {z }

A

=





1 −1 2 3

0 3 −3 −6

0 0 0 5





| {z }

U

.

¤ Si, a la matriz obtenida en el proceso de Eliminación de Gauss, continuamos aplicándole las operaciones elementales (Tipo Escalamiento y Tipo Eliminación) requeridas en el Método de Sustitución hacia atrás, obtenemos una matriz escalonada donde las columnas pivote son e1, e2, . . . , ek, los primeros vectores

canónicos deRn_{, como pudimos apreciar en el capítulo anterior e ilustramos en la parte B del Ejemplo 22}

que presentamos a continuación4_.

Ejemplo 22. (Parte B): A la matriz obtenida en la Parte A del Ejemplo 22, apliquémosle las operaciones elementales del Método de Sustitución hacia atrás para obtener su forma escalonada donde las columnas pivote son los primeros vectores canónicos deRn _{(matriz escalonada reducida).}

1

5F3 −→ F3 F2+ 6F3 −→ F2 F1−3F3 −→ F1





1 −1 2 0

0 3 −3 0

0 0 0 1





1

3F2 −→ F2 F1+F2 −→ F1





1 0 1 0

0 1 −1 0

0 0 0 1





4

(21)

Si llamamos E3 =





1 0 0

0 1 0

0 0 1

5



, E4 =





1 0 0

0 1 6

0 0 1



, E5 =





1 0 −3

0 1 0

0 0 1



, E6 =





1 0 0

0 1₃ 0

0 0 1



 y

E7 =





1 1 0

0 1 0

0 0 1



 las matrices elementales correspondientes a las anteriores operaciones elementales, podemos resumir la parte A y B de este ejemplo con la siguiente expresión

(E7 E6 E5E4) (E3E2 E1 A) =





1 0 1 0

0 1 −1 0

0 0 0 1



.

Observemos que las columnas pivotales en esta matriz (primera, segunda y cuarta) son precisamentee1,e2

ye3, los vectores canónicos de R3, en su orden. ¤

CuandoAes una matriz invertible de tamañon×n, cualquier matriz escalonada equivalente tienenpivotes (Teorema 6); por lo tanto, al continuar aplicando las operaciones elementales del Método de Sustitución hacia atrás, obtendremos como columnas pivote e1, e2, . . . , en, losn vectores canónicos de Rn; es decir,

obtendremos la matriz idéntica de tamaño n×n. Esta importante propiedad de las matrices invertibles la resumimos en el siguiente teorema.

Teorema 10.[Caracterización de la inversa en término de matrices elementales].

Una matrizAde tamañon×nes invertible, si y solo si, la matrizAes el producto de matrices elementales. Demostración:Si la matrizAes invertible, al aplicar sucesivamente los algoritmos de Eliminación de Gauss y Sustitución hacia atrás, como se describió previamente, obtendremos la matriz idéntica; es decir, existen matrices elementalesE1, E2, . . . , Ek, dondek≤n2, tales que

Ek· · ·E2E1A=I.

Pre-multiplicando por las matrices elementales inversas (en el orden apropiado) ambos lados de la expresión anterior, obtenemos

A=E−1 1 E

−1 2 · · ·E

−1

k I,

lo cual está expresando a la matrizAcomo el producto de matrices elementales, ya que la matriz inversa de una matriz elemental es también una matriz elemental.

En el otro sentido, es obvio que si la matrizAes el producto de matrices elementales, la matrizAes invertible, puesto que las matrices elementales son invertibles y, por el Teorema 6, el producto de matrices invertibles

es invertible. ¤

3.8. Factorización LU

Así como los números se pueden factorizar y de esta factorización se pueden determinar algunas propiedades de ellos, la factorización de matrices es de mucha utilidad tanto práctica como teórica. La que veremos en seguida es la llamada factorización LU, la cual se obtiene de una formulación matricial del algoritmo de eliminación de Gauss y nos proporciona una forma más eficiente de calcular la solución de un sistema de ecuaciones lineales.

En la Eliminación de Gauss, cuando no son necesarias las operaciones o matrices elementales de Tipo Permutación, como en el Ejemplo 22 (Parte A), obtenemos otro resultado importante5

. En efecto, al

pre-5

(22)

multiplicar por las matrices elementales inversas (en el orden apropiado) ambos lados de la expresión

Ek· · ·E1A=U,

obtenemos

A=E−1 1 · · ·E

−1

k U =LU,

dondeU es una matriz triangular superior yL=E−1 1 · · ·E

−1

k es una matriz triangular inferior, cuadrada e

invertible, con unos en la diagonal6

. Además, los elementos diferentes de cero de la matrizLson los opuestos de los escalares o multiplicadores involucrados en las operaciones elementales Tipo Eliminación usadas en la eliminación de Gauss.

En efecto, obtener la matrizLno requiere cálculo adicional como parece hacer ver la fórmula que la define. La matrizLes muy fácil de obtener gracias a que el producto de matrices elementales del Tipo Eliminación es prácticamente una superposición de escalares sobre una matriz idéntica cuando el factor izquierdo tiene su escalar en la misma columna o en una columna que antecede a la columna donde está el escalar del factor derecho. Observemos que las matrices elementales que definen a Ltienen esta propiedad (el opuesto de los escalares o multiplicadores aparece porque la matriz L está definida como producto de las inversas de las matrices elementales). Ilustremos estos hechos con un ejemplo.

Ejemplo 23: SeanE1,E2 yE3 las matrices elementales de orden4×4correspondientes a las operaciones

elementalesF3+ 2F2−→F3,F4+ (−3)F2−→F4yF4+ 5F3−→F3, respectivamente. Observemos la

super-posición, sobre una matriz idéntica, de los escalares (2, −3y5) involucrados en las operaciones elementales, al efectuar los productosE1E2,E2E3yE1E2E3, y que no se tiene en el productoE3E1.

E1E2=



  

1 0 0 0

0 1 0 0

0 2 1 0

0 0 0 1

       

1 0 0 0

0 1 0 0

0 0 1 0

0 -3 0 1

   =    

1 0 0 0

0 1 0 0

0 2 1 0

0 -3 0 1



  .

E2E3=



  

1 0 0 0

0 1 0 0

0 0 1 0

0 -3 0 1

       

1 0 0 0

0 1 0 0

0 0 1 0

0 0 5 1

   =    

1 0 0 0

0 1 0 0

0 0 1 0

0 -3 5 1



  .

E1E2E3=



  

1 0 0 0

0 1 0 0

0 2 1 0

0 0 0 1

       

1 0 0 0

0 1 0 0

0 0 1 0

0 -3 0 1

       

1 0 0 0

0 1 0 0

0 0 1 0

0 0 5 1

   =    

1 0 0 0

0 1 0 0

0 2 1 0

0 -3 5 1



  .

E3E1=



  

1 0 0 0

0 1 0 0

0 0 1 0

0 0 5 1

       

1 0 0 0

0 1 0 0

0 2 1 0

0 0 0 1

   =    

1 0 0 0

0 1 0 0

0 2 1 0

0 10 0 1



  .

Si estas tres operaciones elementales fuesen las requeridas para escalonar una matriz dada, la matriz L

mencionada anteriormente sería

L=E−1 1 E −1 2 E −1 3 =    

1 0 0 0

0 1 0 0

0 -2 1 0

0 0 0 1

       

1 0 0 0

0 1 0 0

0 0 1 0

0 3 0 1

       

1 0 0 0

0 1 0 0

0 0 1 0

0 0 -5 1

   =    

1 0 0 0

0 1 0 0

0 -2 1 0

0 3 -5 1

   . ¤ 6

(23)

Todo lo anterior lo podemos formalizar en el siguiente teorema.

Teorema 11 [Factorización o descomposiciónLU].

Sea Auna matriz de tamañom×nque puede reducirse a la matriz escalonadaU usando sólo operaciones elementales de Tipo Eliminación. Entonces, podemos factorizar aAcomo

A=LU,

dondeU es una matriz escalonadam×nequivalente a Ay Les una matriz triangular inferior unitaria de tamañom×m, cuya componente lij =−c parai > j, siendoc el escalar omultiplicador involucrado en la

operación elemental Tipo Eliminación Fi+cFj −→Fi, que utilizamos para escalonar la matrizA. A esta

factorización se le llamafactorizaciónLU odescomposición LU. ¤

Entre otros usos, esta factorización permite resolver el sistema de ecuaciones linealesAx=b, reduciendo su solución a la solución de dos sistemas de ecuaciones lineales que podemos resolver fácilmente. Sabiendo que

A=LU, el sistemaAx=bse convierte enLUx=b, lo cual es equivalente aLy=b, dondeUx=y; por lo tanto, para calcularx, primero resolvemos

Ly=b y a continuación resolvemos

Ux=y.

Observemos que los dos sistemas de ecuaciones lineales anteriores son fáciles de resolver. Por ser L una matriz triangular inferior, el primer sistema se resuelve mediante sustitución hacia adelante; además, por ser unitaria y cuadrada, es una matriz invertible; por lo tanto, su solución es única. Por ser U una matriz triangular superior, el segundo sistema, se resuelve mediante sustitución hacía atrás. Veamos un ejemplo.

Ejemplo 24: SeaA=





6 −3 0 3

−6 3 8 −3

4 −2 −6 3



yb= 

 −8

8

−5



. Encontremos la factorizaciónLU de Ay luego calculemos las soluciones deAx=b.

Aplicando sucesivamente las operaciones elementales entre filas a la matrizA F2+F1−→F2

F3−2₃F1−→F3 F3+6₈F2−→F3

obtenemos 



6 −3 0 3

0 0 8 0

0 0 0 1



=U.

Las matrices elementales utilizadas, en su orden, son

E1=





1 0 0

1 1 0

0 0 1



 E2=





1 0 0

0 1 0

−2/3 0 1



 E3=





1 0 0

0 1 0

0 3/4 1



;

por lo tanto,

L=E−1 1 E

−1 2 E

−1

3 =





1 0 0

−1 1 0

0 0 1



 



1 0 0

0 1 0

2/3 0 1



 



1 0 0

0 1 0

0 −3/4 1



= 



1 0 0

−1 1 0 2/3 −3/4 1



,

la cual, en la práctica, obtenemos directamente de los multiplicadores o escalares usados en las operaciones elementales, como se definió en el Teorema 11.

Ahora, utilicemos la factorización LU de A para resolver el sistema dado. Primero, resolvemos el sistema

Ly=bmediante sustitución hacia adelante, lo cual es equivalente a aplicar las operaciones elementales

F2+F1−→F2 F3−2₃F1−→F3 F3+3₄F2−→F3

a la matriz 



1 0 0 −8

−1 1 0 8

2/3 −3/4 1 −5



, obteniendo 



1 0 0 −8

0 1 0 0

0 0 1 1/3



(24)

es decir que y = (−8 0 1/3)T_{. Continuemos resolviendo el sistema}_U_x ₌ _y _{mediante sustitución hacia}

atrás, lo cual es equivalente a aplicar las operaciones elementales

F1−3F3−→F1 1

8F2−→F2 1

6F1−→F1

a la matriz 



6 −3 0 3 −8

0 0 8 0 0

0 0 0 1 1/3



, obteniendo 



1 −1/2 0 0 −3/2

0 0 1 0 0

0 0 0 1 1/3



 ;

de donde, concluimos que

x=     −3 2+ 1 2t t 0 1 3    =     −3 2 0 0 1 3    +t

    1 2 1 0 0   

, t∈R.

Supongamos que, posteriormente a lo anterior, necesitamos calcular las soluciones de Ax = c, para c = (−6 −2 2)T_{. Como ya tenemos la factorización}_LU _de_A_{, no necesitamos empezar de nuevo; solo necesitamos}

resolver los sistemas Ly =c y Ux =y, como en el caso anterior. Esto es, resolvemos el sistema Ly =c mediante sustitución hacia adelante, lo cual es equivalente a aplicar las operaciones elementales

F2+F1−→F2 F3−2₃F1−→F3 F3+3₄F2−→F3

a la matriz 



1 0 0 −6

−1 1 0 −2 2/3 −3/4 1 2



, obteniendo 



1 0 0 −6

0 1 0 −8

0 0 1 0



;

es decir que y = (−6 −8 0)T_{. Continuemos resolviendo el sistema} _U_x ₌ _y _{mediante sustitución hacia}

atrás, lo cual es equivalente a aplicar las operaciones elementales

F1−3F3−→F1 1

8F2−→F2 1

6F1−→F1

a la matriz 



6 −3 0 3 −6

0 0 8 0 −8

0 0 0 1 0



, obteniendo 



1 −1/2 0 0 −1

0 0 1 0 −1

0 0 0 1 0



;

de donde, concluimos que

x=



  

−1 +1 2t t −1 0    =     −1 0 −1 0    +t

    1 2 1 −0 0   

, t∈R.

¤ Para poder factorizar una matrizA, como vimos en el ejemplo anterior, es necesario conocer las operaciones elementales necesarias para encontrar una forma escalonada de ella, lo que usualmente se realiza cuando resolvemos un sistema de ecuaciones lineales con matriz de coeficientes A. Además, resolver el sistema

Ly=brequiere tantas operaciones como las requeridas al incluir el vectorben el proceso de reducción de

Aa su forma escalonada, como lo hicimos en el Capítulo 1 (proceso de Eliminación de Gauss aplicado a la matriz aumentada del sistema).

En otras palabras, es claro que la ventaja de la factorización no la apreciamos cuando se resuelve un sistema

(25)

Ejemplo 25: Encontremos dos vectoresxyzdeR4 _{tales que}_A_x₌_b_y_zT_A₌_cT_{, donde}

A=



  

2 −1 3 0

−2 4 −3 5

0 9 −1 18

4 −5 1 8



  , b=



  

−5 10 21 13



 

 y c= 

  

2

−4 1 5



  .

Observemos que para calcularz, debemos resolver el sistema de ecuaciones linealesAT_z₌_{c; por lo tanto,}

no es posible calcular axy azsimultáneamente.

Primero, resolvamos los dos sistemas,Ax=byAT_z₌_{c, utilizando, para cada uno de ellos, el algoritmo}

de eliminación de Gauss seguido del algoritmo de sustitución hacia atrás y luego los resolvemos utilizando la factorizaciónLU de la matrizA.

Para resolver el primer sistema, aplicamos sucesivamente las operaciones elementalesF2+F1 −→F2, F4− 2F1−→F4,F3−3F2−→F3,F4+F2−→F4 yF4−5F3−→F4a la matriz aumentada [A|b]y obtenemos

la matriz escalonada

[U|y] =



  

2 −1 3 0 −5

0 3 0 5 5

0 0 −1 3 6

0 0 0 −2 −2



  .

Finalmente, aplicando el algoritmo de sustitución hacia atrás, tenemos quex= (2,0,−3,1)T_.

Para resolver el segundo sistema, aplicamos sucesivamente las operaciones elementales F2+ 0,5F1 −→ F2, F3−1,5F1−→F3,F4−5₃F2−→F4yF4+ 3F3−→F4a la matriz aumentada[AT|c]y obtenemos la matriz

escalonada

[V|r] =



  

2 −2 0 4 2

0 3 9 −3 −3

0 0 −1 −5 −2

0 0 0 −2 4



  .

Finalmente, aplicando el algoritmo de sustitución hacia atrás, tenemos quez= (−30,39,12,−2)T_.

Ahora, resolvamos el mismo problema utilizando la factorizaciónLU deA, para lo cual, debemos encontrar una forma escalonada equivalente a la matrizA, utilizando el algoritmo de eliminación de Gauss. Aplicando sucesivamente las operaciones elementalesF2+F1−→F2,F4−2F1−→F4,F3−3F2−→F3,F4+F2−→F4

yF4−5F3−→F4 a la matrizA, obtenemos la matriz escalonada

U =



  

2 −1 3 0

0 3 0 5

0 0 −1 3

0 0 0 −2



  .

Teniendo en cuenta las operaciones elementales utilizadas y la definición de la matrizL, tenemos que

L=



  

1 0 0 0

−1 1 0 0

0 3 1 0

2 −1 5 1



  .

Como A = LU, para calcular x, resolvemos, mediante sustitución hacia adelante, el sistema Ly = b, de donde obtenemos que y = (−5,5,6,−2)T _{y, mediante sustitución hacia atrás, el sistema} _U_x ₌ _{y, para}

finalmente obtener quex= (2,0,−3,1)T_.

ComoAT ₌_UT_LT_{, para calcular} _z_{, resolvemos, mediante sustitución hacia adelante, el sistema} _UT_w₌_c,

de donde obtenemos quew= (1,−1,2,−2)T _{y, mediante sustitución hacia atrás, el sistema}_LT_z₌_{w, para}

(26)

De las dos formas presentadas para resolver el problema anterior, observemos que el cálculo del vector x es prácticamente idéntico en ambas. Efectivamente, en las dos formas, se aplican las mismas operaciones elementales para encontrar la matriz escalonada equivalente a Ay se resuelve el mismo sistema triangular

Ux= y usando el algoritmo de sustitución hacia atrás. La diferencia aparente está en que, en la primera forma, las operaciones elementales se aplican a la matriz aumentada para obtener el vectory, mientras que en la segunda, las operaciones elementales se aplican sólo a la matriz de coeficientes del sistema y luego, se resuelve el sistema triangularLy=busando el algoritmo de sustitución hacia adelante, procedimientos que requieren exactamente las mismas operaciones. La diferencia (ventaja) de calcular la factorización LU de la matrizA es que evita tener que utilizar el algoritmo de eliminación de Gauss para el cálculo del vector z, lo cual es importante si tenemos en cuenta que es precisamente este algoritmo la parte que más cálculos requiere en el proceso de resolver un sistema de ecuaciones lineales.

3.9. Determinantes

El concepto de determinante surgió independientemente del de matriz y su teoría fue desarrollada, hace casi dos siglos, para solucionar problemas prácticos. Hoy en día, ha perdido su importancia práctica por su costo en tiempo de cálculo y por el desarrollo de otras técnicas de computo que lo reemplazan. No obstante, por su importancia teórica, presentamos el concepto de determinante y sus propiedades más usadas.

Para empezar, digamos que el determinante de una matriz(cuadrada)es un número real, el cual definiremos en término de determinantes de matrices de tamaño menor, es decir, usaremos una definición recurrente de determinante. Antes de introducir esta definición, presentaremos el conceptos demenor de una matriz. Posteriormente, como una forma de simplificar la expresión que define un determinante, introduciremos la noción decofactor de una matriz. Este último concepto también será utilizado, al final de esta sección, para definir lamatriz adjunta.

Definición 9 [Menor] Dada una matriz Ade tamaño n×n, definimos Mij,el menor (i, j)deA, como la

matriz de tamaño(n−1)×(n−1)que resulta al eliminar la filaiy la columna j de la matrizA.

Ejemplo 26: Encuentre los menoresM23 yM32 de la matrizA=





1 1 1

2 3 1

1 −1 −2



.

Al eliminar la segunda fila y tercera columna deA, obtenemosM23, el menor(2,3)de la matrizA,

M23=

µ

1 1

1 −1

¶

y al eliminar la tercera fila y segunda columna deA, obtenemosM32, el menor(3,2)de la matrizA,

M32=

µ

1 1 2 1

¶

.

¤

Definición 10[Determinante]. SeaA= (aij)una matrizn×n. Definimosdet(α), el determinante de una

matriz 1×1, comoαpara todo α∈R ydetA, el determinante7

deA, como la suma de los productos de

a1j, laj-ésima componente de la primera fila de la matrizA, por detM1j, el determinante del menor(1, j)

deA, multiplicado por(−1)1+j_{; es decir,}

det(α) = α, α∈R

detA = a11detM11−a12detM12+. . .+ (−1)1+na1ndetM1n. (3.1) 7