An´alisis Num´erico II
Apuntes Curso C´odigo 525441
Raimund B¨ urger & Rommel Bustinza
Centro de Investigaci´on en Ingenier´ıa Matem´atica (CI
2MA)
& Departamento de Ingenier´ıa Matem´atica Facultad de Ciencias F´ısicas y Matem´aticas
Universidad de Concepci´on Casilla 160-C
Concepci´on, Chile
15 de abril de 2020
´Indice general
Cap´ıtulo 1. Conceptos b´asicos 5
Cap´ıtulo 2. M´etodos directos para la soluci´on de sistemas lineales (Parte I) 11 2.1. Sistemas lineales escalonados. Matrices triangulares y su inversi´on 12
2.2. El m´etodo de eliminaci´on de Gauss 13
2.3. Descripci´on matricial del algoritmo de Gauss y el teorema LR 19
2.4. La descomposici´on de Cholesky 29
2.5. Aplicaciones de la descomposici´on triangular y casos especiales 35 Cap´ıtulo 3. M´etodos directos para la soluci´on de sistemas lineales (Parte II) 37
3.1. Normas de vectores y matrices 37
3.2. El problema de la sensitividad para un sistema lineal 44 3.3. El m´etodo de cuadrados m´ınimos y la transformaci´on de una matriz n × n a una
matriz triangular superior 61
Cap´ıtulo 4. M´etodos iterativos para la soluci´on de sistemas de ecuaciones lineales 75
4.1. Un ejemplo 75
4.2. Metodolog´ıa general del desarrollo de m´etodos iterativos 76 4.3. Teoremas de convergencia para m´etodos iterativos 81
4.4. M´etodos de iteraci´on por bloque 100
4.5. El m´etodo de gradientes conjugados (cg) de Hestenes y Stiefel 101 Cap´ıtulo 5. El problema de valores propios de una matriz 113 5.1. La localizaci´on de valores propios y la sensitividad del problema 113 5.2. Transformaci´on de similaridad unitaria de una matriz n × n a una forma de
Hessenberg o tridiagonal 121
5.3. Computaci´on de los valores propios de una matriz tridiagonal hermitiana 124 5.4. Determinaci´on de los vectores propios de una matriz tridiagonal hermitiana 130 5.5. Valores propios de una matriz de tipo Hessenberg 132 5.6. La iteraci´on directa seg´ un von Mises y el m´etodo de Wielandt 133
5.7. El m´etodo QR 142
3
Cap´ıtulo 1
Conceptos b´ asicos
Designaremos por C
n×nel espacio de las matrices cuadradas de orden n en el cuerpo C , mientras que cuando los coeficientes pertenezcan al cuerpo R , usaremos la notaci´on R
n×n. Definici´ on 1.1. Para A ∈ C
n×nse definen la matriz transpuesta como la matriz B de elementos b
ij:= a
ji, y la matriz conjugada transpuesta de A como la matriz C de elementos c
ij:= ¯ a
ji. Notaci´ on: A
T:= B y A
∗:= C.
Definici´ on 1.2. Una matriz A ∈ C
n×nse dice sim´etrica si A = A
T, hermitiana si A = A
∗, ortogonal si AA
T= A
TA = I y unitaria si AA
∗= A
∗A = I.
Una manera de caracterizar la ortogonalidad, respectivamente la unitariedad, de una matriz A es a trav´es de las igualdades A
−1= A
Ty A
−1= A
∗, respectivamente.
Definici´ on 1.3. Un escalar λ ∈ C se dice un valor propio de una matriz A ∈ C
n×nsi existe x ∈ C
n, x 6 = 0 tal que Ax = λx. En tal caso, el vector x se llama vector propio de A asociado a λ.
Definici´ on 1.4. Sea λ ∈ C un valor propio de A. Se llama espacio propio asociado a λ al conjunto L(λ) := { x ∈ C
n| Ax = λx } .
Note que L(λ) contiene, adem´as del vector nulo, a todos los vectores propios asociados a λ. Se puede demostrar que L(λ) es un subespacio vectorial de C
ncon dimensi´ on %(λ) dada por %(λ) = n − rango(A − λI ). El n´ umero %(λ) se llama tambi´en multiplicidad geom´ etrica de λ.
Lema 1.1. Sea A ∈ C
n×n. Un escalar λ ∈ C es un valor propio de A si y s´ olo si det(A − λI ) = 0.
Demostraci´ on. De acuerdo a la Definici´on 1.3, un escalar λ ∈ C es un valor propio de A si y s´olo si existe x ∈ C
n, x 6 = 0 tal que Ax = λx, equivalentemente, si y s´olo si (A − λI )x = 0 con x 6 = 0. Esta ´ ultima relaci´on es un sistema lineal de ecuaciones lineales homog´eneo de n ecuaciones y n inc´ognitas. Para no obtener ´ unicamente la soluci´on trivial x = 0, que no nos interesa, imponemos la condici´on necesaria y suficiente det(A − λI ) = 0.
La expresi´on f
A(λ) := det(A − λI ) es un polinomio de grado n que se llama polinomio caracter´ıstico de A, y tiene la forma f
A(λ) = ( − 1)
n(λ
n+ α
n−1λ
n−1+ · · · + α
1λ + α
0). Si λ
1, λ
2, . . . , λ
kson los ceros del polinomio caracter´ıstico, entonces f
A(λ) puede factorizarse como
f
A(λ) = ( − 1)
n(λ − λ
1)
β1(λ − λ
2)
β2· . . . · (λ − λ
k)
βk,
5
donde β
1, . . . , β
kson n´ umeros naturales tales que β
1+ · · · +β
k= n. El n´ umero β
i, i = 1, . . . , k de veces que se repite el factor (λ − λ
i) se llama multiplicidad algebraica de λ
i. Al valor propio λ
ipueden corresponder a lo m´as β
ivectores propios linealmente independientes. El n´ umero de vectores propios de A asociados al valor propio λ
i, y que son linealmente independientes, es igual a %(λ
i). En otras palabras, se tiene que %(λ
i) 6 β
ipara i = 1, . . . , k.
Ejemplo 1.1. La matriz diagonal de orden n, D := µI con µ ∈ C , tiene el polinomio caracter´ıstico f
D(λ) = (µ − λ)
n. Luego λ = µ, ´ unico valor propio de D, tiene multiplicidad algebraica n y multiplicidad geom´ etrica n. Esto indica que L(µ) = C
n, es decir, todo vector x ∈ C
n, x 6 = 0 es vector propio de D asociado a µ.
Ejemplo 1.2. Consideremos la matriz A ∈ R
n×ndada por
A =
µ 1 0 . . . 0
0 µ 1 . .. ...
.. . . .. ... ... 0 .. . . .. µ 1 0 . . . . . . 0 µ
,
con µ ∈ C , que tiene el mismo polinmomio caracter´ıstico que la matriz del ejemplo anterior, en efecto,
f
A(λ) =
µ − λ 1 0 · · · 0 0 µ − λ 1 . .. .. . .. . . .. . .. . .. 0
.. . . .. µ − λ 1
0 · · · · · · 0 µ − λ
= (µ − λ)
n.
En este caso, el ´ unico valor propio de A, λ = µ, tiene multiplicidad algebraica n, mientras que su multiplicidad geom´ etrica es %(µ) = 1. En efecto, de la Definici´ on 1.4 tenemos
L(µ) =
x ∈ C
n| (A − µI)x = 0
=
x ∈ C
n
0 1 . . . 0
0 1
. .. ...
0 1
0 0
x
1x
2.. . x
n−1x
n
=
0 0 .. . 0 0
,
esto es,
L(µ) = { x ∈ C
n| x
2= 0, . . . , x
n= 0 } =
x = (x
1, 0, . . . , 0)
T| x
1∈ C . Lo anterior muestra que %(µ) = dim L(µ) = 1.
Definici´ on 1.5. Sean A y B ∈ C
n×n. Las matrices A y B se dicen similares si existe una matriz P ∈ C
n×ninvertible tal que
B = P
−1AP . (1.1)
1. CONCEPTOS B ´ASICOS 7
Lema 1.2. Sean A y B ∈ C
n×n. Si A y B son similares, entonces ellas tienen los mismos n valores propios, contando su multiplicidad algebraica. Adem´ as, si x es un vector propio de A, entonces P
−1x es vector propio de B, con P que satisface (1.1).
Demostraci´ on. Como A y B son similares, existe P invertible tal que B = P
−1AP . De lo anterior se deduce que A = P BP
−1y luego
f
A(λ) = det(A − λI) = det(P BP
−1− λP P
−1) = det P (B − λI )P
−1. Puesto que
∀ A, B ∈ C
n×n: det(AB) = det(A) det(B), entonces det(P ) det(P
−1) = det(P P
−1) = det(I) = 1 y en consecuencia,
f
A(λ) = det(P ) det(B − λI) det(P
−1) = det(B − λI ) = f
B(λ).
Eso muestra que A y B tienen el mismo polinomio caracter´ıstico y por lo tanto los mismos n valores propios, contando su multiplicidad algebraica.
Consideremos ahora un valor propio λ de A y un vector propio x asociado a λ. Multi- plicando a la izquierda por P
−1la ecuaci´on Ax = λx obtenemos
P
−1Ax = λ(P
−1x). (1.2)
Por otra parte, P
−1Ax = P
−1A(P P
−1)x = (P
−1AP )(P
−1x), lo cual, en virtud de la igualdad B = P
−1AP , conduce a
P
−1Ax = B(P
−1x). (1.3)
Se sigue de las igualdades (1.2) y (1.3) que B(P
−1x) = λ(P
−1x). Notando que P
−1x 6 = 0, concluimos que P
−1x es un vector propio de B asociado al valor propio λ.
Definici´ on 1.6. Sea B = { u
1, . . . , u
n} ⊂ C
n. Se dice que B es una base ortonormal de C
nsi
u
∗iu
j= δ
ij=
( 1 para i = j, 0 para i 6 = j.
Teorema 1.1 (Forma normal de Schur). Sea A ∈ C
n×n. Entonces existen matrices U , T ∈ C
n×n, U unitaria y T triangular superior, tales que T = U
∗AU = U
−1AU . Es decir, A es unitariamente similar a una matriz triangular superior.
Demostraci´ on. Procedemos por inducci´on sobre el orden n de la matriz A. Para n = 1, es trivial porque basta elegir U =
1
y T = A. Supongamos que el resultado es v´alido para todas las matrices de orden k − 1. Probemos que es cierto para todas las matrices de orden k. Sea A ∈ C
k×ky consideremos un valor propio λ
1de A y u
(1)un vector propio asociado elegido de manera que k u
(1)k
22= (u
(1))
∗u
(1)= 1. Ahora, de acuerdo al Teorema de Completaci´on de Base, podemos elegir una base ortonormal de C
kque contenga a u
(1), digamos B = { u
(1), . . . , u
(k)} , y definir la matriz unitaria P
1∈ C
k×kcomo
P
1:=
u
(1)u
(2)· · · u
(k).
A continuaci´on consideremos la matriz B
1= P
∗1AP
1. Notemos primero que AP
1=
Au
(1)Au
(2)· · · Au
(k)=
λ
1u
(1)v
(2)· · · v
(k), (1.4)
donde v
(j):= Au
(j)para j = 2, . . . , k. Al multiplicar por la izquierda (1.4) por P
∗1se obtiene B
1= P
∗1λ
1u
(1)v
(2)· · · v
(k)=
λ
1P
∗1u
(1)P
∗1v
(2)· · · P
∗1v
(k). Como P
∗1P
1= I y dado que u
(1)es la primera columna de P
1, entonces
P
∗1u
(1)=
1 0 ...
0
, y por lo tanto
B
1=
λ
1α
2· · · α
k0 ... A
20
,
donde A
2∈ C
(k−1)×(k−1)y α
2, . . . , α
kson escalares en C . Aplicamos la hip´otesis de inducci´on para concluir que existe ˆ P
2∈ C
(k−1)×(k−1), ˆ P
2unitaria, tal que
P ˆ
∗2A
2P ˆ
2= ˆ T , (1.5)
con ˆ T triangular superior. Entonces, al definir la matriz P
2∈ C
k×kpor
P
2:=
1 0 · · · 0 0 ... P ˆ
20
, obtenemos
P
∗2P
2=
1 0 · · · 0 0 ... P ˆ
∗2P ˆ
20
= I . As´ı, P
2es unitaria y adem´as satisface
P
∗2B
1P
2=
1 0 · · · 0 0 ... P ˆ
∗20
λ
1α
2· · · α
k0 ... A
20
P
2=
λ
1α
2· · · α
k0 ... P ˆ
∗2A
20
P
2=
λ
1α
2· · · α
k0 ... P ˆ
∗2A
20
1 0 · · · 0 0 ... P ˆ
20
.
1. CONCEPTOS B ´ASICOS 9
Al realizar la multiplicaci´on de matrices indicada y usando (1.5) llegamos a
P
∗2B
1P
2=
λ
1ω
2· · · ω
k0 ... P ˆ
∗2A
2P ˆ
20
=
λ
1ω
2· · · ω
k0 ... T ˆ 0
=: T , donde T es una matriz triangular superior y los ω
j, j = 2, . . . , k , est´an dados por
ω
j= (α
2, . . . , α
k) ˆ P
(j)2, donde ˆ P
(j)2es la columna j de ˆ P
2.
Puesto que
T = P
∗2B
1P
2= P
∗2(P
∗1AP
1)P
2= (P
1P
2)
∗A(P
1P
2),
podemos elegir U como la matriz unitaria U = P
1P
2con lo cual T = U
∗AU . Del principio
de inducci´on se concluye la validez del teorema.
Cap´ıtulo 2
M´ etodos directos para la soluci´ on de sistemas lineales (Parte I)
En este cap´ıtulo se consideran m´etodos directos para la soluci´on de sistemas lineales Ax = b, A ∈ K
n×n, b ∈ K
n, K = R o K = C , (2.1) donde se supone que det(A) 6 = 0. (Un m´ etodo directo entrega la soluci´on exacta del problema en un n´ umero finito de pasos, al contrario de los m´ etodos iterativos, que se estudiar´an m´as adelante.)
Te´oricamente, la soluci´on de (2.1) est´a dada por x = (ξ
1, . . . , ξ
n)
Tcon ξ
i= det
a
1· · · a
i−1b a
i+1· · · a
ndet(A) , i = 1, . . . , n, donde
A =
a
1· · · a
n.
Esta regla es conocida como regla de Cramer. Practicamente, s´olo en el caso n = 2 o para ma- trices A especiales, la f´ormula es util por razones de esfuerzo computacional y la acumulaci´on de errores de redondeo.
El problema (2.1) nos lleva al problema m´as general
AX = B, A ∈ K
n×n, X ∈ K
n×p, B ∈ K
n×p, (2.2) el cual incluye el problema de
AX = I
de encontrar la inversa de A. Para resolver (2.2), tomamos en cuenta que este problema representa la soluci´on simult´anea de p problemas del tipo (2.1), dado que para
X =
x
1· · · x
p, B =
b
1· · · b
p, tenemos que
AX = B ⇐⇒ Ax
i= b
i, i = 1, . . . , p;
el problema de encontrar A
−1es equivalente a n problemas del tipo (2.1), dado que AX = I ⇐⇒ Ax
i= e
i, i = 1, . . . , n,
11
con X =
x
1· · · x
ny
e
i:=
0. ..
0 1 0. ..
0
← i. (2.3)
2.1. Sistemas lineales escalonados. Matrices triangulares y su inversi´ on Definici´ on 2.1. Sea A = (α
ij) ∈ K
n×n. Si α
ij= 0 para j < i, entonces A se llama matriz triangular superior; si α
ij= 0 para i < j, entonces A se llama matriz triangular inferior.
Un sistema lineal con una matriz triangular se llama escalonado.
Los sistemas escalonados juegan un rol importante, dado que sus soluciones pueden ser determinadas f´acilmente, por ejemplo en el caso de una matriz A triangular superior:
α
11x
1+ α
12x
2+ · · · + α
1nx
n= b
1, α
22x
2+ · · · + α
2nx
n= b
2,
...
α
n−1,n−1x
n−1+ α
n−1,nx
n= b
n−1, α
nnx
n= b
n.
(2.4)
Se usa la ´ ultima ecuaci´on para calcular x
n= b
n/α
nn, luego se remplaza x
nen la pen´ ultima ecuaci´on para determinar x
n−1, etc´etera. Recordamos que para una matriz A triangular,
det(A) = Y
n i=1α
ii6 = 0 ⇐⇒ ∀ i = 1, . . . , n : α
ii6 = 0.
Una matriz triangular puede ser invertida f´acilmente resolviendo los n sistemas lineales con las n columnas unitarias. Dado que la inversa nuevamente es una matriz triangular del mismo tipo, resultan simplificaciones significativas. Considerando el sistema Rx = e
i, nos damos cuenta que x no depende de las columnas i+1, . . . , n de R. Entonces, si particionamos la matriz R como
R =
R
11r
0 %
, R
11∈ K
(n−1)×(n−1), r ∈ K
n−1, % ∈ K , esta observaci´on se refleja en la f´ormula
R
−1=
R
−111− %
−1R
−111r
0 %
−1.
Eso significa que para la implementaci´on de la inversi´on de una matriz triangular superior,
podemos sucesivamente remplazar las columnas n, n − 1, . . . , 2, 1 de R por las columnas
de R
−1.
2.2. EL M ´ETODO DE ELIMINACI ´ON DE GAUSS 13
2.2. El m´ etodo de eliminaci´ on de Gauss
La idea del m´etodo de eliminaci´on de Gauss consiste en transformar un sistema arbitrario con una matriz n × n regular en un sistema con una matriz triangular superior, usando a lo m´as n − 1 pasos de transformaci´on de equivalencia:
∗ · · · ∗
... ...
... ...
... ...
∗ · · · ∗
∗ ...
... ...
∗
=
∗ ...
... ...
∗
⇐⇒
∗ ∗ · · · ∗
0 ... ...
... ... ...
... ... ...
0 ∗ · · · ∗
∗ ...
... ...
∗
=
∗ ...
... ...
∗
⇐⇒
∗ ∗ ∗ · · · ∗
0 ∗ ∗ ...
... 0 ... ...
... ... ... ...
0 0 ∗ · · · ∗
∗ ...
... ...
∗
=
∗ ...
... ...
∗
⇐⇒ · · · ⇐⇒
∗ ∗ · · · ∗
0 ∗ ...
... 0 ... ...
... . .. ∗ ∗ 0 0 · · · 0 ∗
∗ ...
... ...
∗
=
∗ ...
... ...
∗
.
En esta representaci´on esquem´atica del algoritmo, el s´ımbolo “ ∗ ” representa un elemento que puede asumir un valor diferente de cero, mientras que por “0” se marca cualquier elemento que debe asumir el valor cero debido a la definici´on del algoritmo.
En el i-´esimo paso, i = 1, . . . , n − 1, usamos las siguientes transformaciones:
a) Si es necesario, intercambiamos la fila i con una de las filas i + 1, . . . , n del sistema.
b) Si as´ı se desea, intercambiamos la columna i con alguna de las columnas i+1, . . . , n del sistema. Tal medida sirve para reducir el efecto de acumulaci´on de errores de redondeo.
c) Sustracci´on de m´ ultiplos apropiados de la fila i de las filas i + 1, . . . , n.
Para la administraci´on de los pasos, usaremos el siguiente esquema, que tambien incluye los n´ umeros de filas y columnas. Sean
α
(1)ij:= α
ij, i, j = 1, . . . , n; β
i(1):= β
i, i = 1, . . . , n. (2.5) Al iniciarse la computaci´on, el esquema est´a dado por
1 2 · · · n
1 α
(1)11α
12(1)· · · α
(1)1nβ
1(1)... ... ... ...
n α
(1)n1α
n2(1)· · · α
(1)nnβ
n(1).
Despu´es de i − 1 pasos, el esquema asume la siguiente forma:
˜
σ
1(1)· · · · σ ˜
i(i−1)−1σ
i(i)· · · σ
n(i)˜
π
1(1)α ˜
(1)11∗ · · · ∗ α ˜
(i−1)1,i−1α ˜
(i)1,i· · · α ˜
(i)1,nβ ˜
1(1)... 0 ∗ ∗ ∗ ∗ ...
... ... 0 . .. ... ... ... ...
... ... . .. ∗ ∗ ∗ ∗ ...
˜
π
i(i−−11)0 · · · · 0 α ˜
(ii−−1,i1)−1α ˜
(i)i−1,i· · · α ˜
i(i)−1,nβ ˜
i(i−−11)π
i(i)0 · · · · 0 0 α
(i)ii· · · α
(i)inβ
i(i)... ... ... ... ... ... ...
π
n(i)0 · · · · 0 0 α
(i)ni· · · α
(i)nnβ
n(i).
Aqu´ı
π ˜
1(1), . . . , π ˜
i(i−−11), π
(i)i, . . . , π
n(i)y
˜
σ
(1)1, . . . , σ ˜
(ii−−11), σ
i(i), . . . , σ
n(i)son permutaciones del vector de ´ındices (1, . . . , n),
˜
α
kj(k), β ˜
k(k), k = 1, . . . , i − 1, j = k, . . . , i − 1 son elementos “listos” del sistema final, y
α
(i)kj, β
k(i), j, k = i, . . . , n son elementos del sistema restante antes de los intercambios.
El i-´esimo paso de transformaci´on consiste en primer lugar en un intercambio de filas (columnas) entre la fila i y una fila j > i y posiblemente entre la columna i y una columna k > i, de tal forma que α
jk(i)se cambia a la posici´on (i, i). Los elementos intercambiados los llamamos
˜
σ
k(i), α ˜
(i)jk, j = 1, . . . , n, k = i, , . . . , n; β ˜
j(i), π
j(i), j = i, . . . , n.
Ahora supongamos que ˜ α
(i)ii6 = 0 (mas adelante demostraremos que esto siempre se puede lograr). La i-´esima fila ya no se modifica. Los ceros en las posiciones i + 1, . . . , n de la columna i se generan de la siguiente forma:
α
(i+1)jk:= ˜ α
(i)jk− α ˜
(i)ji˜
α
(i)iiα ˜
(i)ik, β
j(i+1):= ˜ β
j(i)− α ˜
(i)ji˜ α
(i)iiβ ˜
i(i), i + 1 6 j, k 6 n, π
(i+1)j:= ˜ π
j(i), i + 1 6 j 6 n,
σ
(i+1)k:= ˜ σ
k(i), i + 1 6 k 6 n.
(2.6)
El cuociente ˜ α
(i)ji/˜ α
(i)iise llama multiplicador para la fila j.
Despu´es de n − 1 pasos ponemos por unificaci´on formal
˜
α
(n)nn:= α
(n)nn, β ˜
n(n):= β
n(n), π ˜
n(n):= π
(n)n, σ ˜
n(n):= σ
n(n).
2.2. EL M ´ETODO DE ELIMINACI ´ON DE GAUSS 15
Al final, llegamos al esquema
˜
σ
1(1)· · · σ ˜
n(n)˜
π
1(1)α ˜
(1)11· · · α ˜
(n)1nβ ˜
1(1)... . .. ... ...
˜
π
(n)nα ˜
(n)nnβ ˜
n(n), (2.7)
el cual puede ser escrito en forma
Ry = c
con una matriz triangular superior R. La soluci´on de este sistema es y = (η
1, . . . , η
n)
T, y podemos recuperar la soluci´on x = (ξ
1, . . . , ξ
n)
Tdel sistema original a trav´es de
ξ
σ˜(i)i
= η
i, i = 1, . . . , n, (2.8)
usando la informaci´on de la primera fila del diagrama (2.7), que indica los ´ındices de las componentes de x correspondientes.
La f´ormula esencial para la conversi´on del sistema restante depu´es de los cambios es la siguiente:
(j, k)
nuevo= (j, k)
antiguo− (j, i)
antiguo(i, i)
antiguo(i, k)
antiguo, i + 1 6 j 6 n, i + 1 6 k 6 n. (2.9) El divisor de los multiplicadores, el elemento (i, i)
antiguo, se llama elemento pivote. Es un elemento diagonal de la matriz triangular correspondiente.
La parte derecha se transforma a trav´es del mismo esquema. Resulta ´ util guardar los mul- tiplicadores da cada paso de transformaci´on; se pueden almacenar en las posiciones ocupadas por cero, y tambien se intercambian.
Ejemplo 2.1. Para ilustrar el algoritmo, consideramos el sistema Ax = b con
A =
0 1 − 3
1 1 3
1 − 1 3
, b =
3
− 4 5
.
La aplicaci´ on del algoritmo genera la siguiente sucesi´ on de esquemas. Partimos de 1 = σ
(1)12 = σ
2(1)3 = σ
(1)3π
(1)1= 1 0 = α
(1)111 = α
(1)12− 3 = α
(1)133 = β
1(1)π
(1)2= 2 1 = α
(1)211 = α
(1)223 = α
(1)23− 4 = β
2(1)π
(1)3= 3 1 = α
(1)31− 1 = α
(1)323 = α
(1)335 = β
3(1).
Intercambiamos filas y columnas para que el elemento (2, 3) asume la posici´ on diagonal (1, 1).
Es decir, este elemento lo consideramos como pivote:
3 = ˜ σ
(1)12 = ˜ σ
2(1)1 = ˜ σ
(1)3˜
π
(1)1= 2 3 = ˜ α
(1)111 = ˜ α
(1)121 = ˜ α
(1)13− 4 = ˜ β
1(1)˜
π
(1)2= 1 − 3 = ˜ α
(1)211 = ˜ α
(1)220 = ˜ α
(1)233 = ˜ β
2(1)˜
π
(1)3= 3 3 = ˜ α
(1)31− 1 = ˜ α
(1)321 = ˜ α
(1)335 = ˜ β
3(1).
Ahora calculamos los multiplicadores
λ
21:= α ˜
(1)21˜
α
(1)11= − 1,
el cual corresponde a la sustracci´ on de la fila 1, multiplicada por ( − 1), de la fila 2, y λ
31:= α ˜
31(1)˜
α
11(1)= 1,
que corresponde a la sustracci´ on de la fila 1 de la fila 3. El resultado de estas operaciones es
3 = ˜ σ
1(1)2 = σ
(2)21 = σ
3(2)˜
π
1(1)= 2 3 = ˜ α
(1)111 = ˜ α
(1)121 = ˜ α
(1)13− 4 = ˜ β
1(1)π
2(2)= 1 − 1 = λ
212 = α
(2)221 = α
(2)23− 1 = β
2(2)π
3(2)= 3 1 = λ
31− 2 = α
(2)320 = α
(2)339 = β
3(2).
Intercambiamos las filas 2 y 3 por motivo de ilustraci´ on:
3 = ˜ σ
1(1)2 = ˜ σ
(2)21 = ˜ σ
3(2)˜
π
1(1)= 2 3 = ˜ α
(1)111 = ˜ α
(2)121 = ˜ α
(2)13− 4 = ˜ β
1(1)˜
π
2(2)= 3 1 = λ
21− 2 = ˜ α
(2)220 = ˜ α
(2)239 = ˜ β
2(2)˜
π
3(2)= 1 − 1 = λ
312 = ˜ α
(2)321 = ˜ α
(2)33− 1 = ˜ β
3(2),
donde los multiplicadores fueron intercambiados con las filas y luego renombrados. Ahora calculamos que
λ
32:= α ˜
(2)32˜
α
(2)22= − 1,
2.2. EL M ´ETODO DE ELIMINACI ´ON DE GAUSS 17
el cual corresponde a la sustracci´ on de la fila 2, multiplicada por ( − 1), de la fila 3. As´ı finalmente llegamos al esquema
3 = ˜ σ
1(1)2 = ˜ σ
(2)21 = ˜ σ
3(3)˜
π
1(1)= 2 3 = ˜ α
(1)111 = ˜ α
(2)121 = ˜ α
(3)13− 4 = ˜ β
1(1)˜
π
2(2)= 3 1 = λ
21− 2 = ˜ α
(2)220 = ˜ α
(3)239 = ˜ β
2(2)π
3(3)= 1 − 1 = λ
31− 1 = λ
321 = α
(3)338 = β
3(3)˜
π
3(3)α ˜
(3)33β ˜
3(3).
Entonces obtenemos la matriz triangular superior R y la parte derecha transformada c dadas por
R =
3 1 1 0 − 2 0
0 0 1
, c =
− 4 9 8
. La soluci´ on del sistema Ry = c entrega
η
3= 8(= ξ
1), η
2= − 9
2 (= ξ
2), η
1= 1 3
− 4 + 9 2 − 8
= − 5
2 (= ξ
3).
Hasta ahora siempre se ha presumido que cuando la matriz A es no singular, el inter- cambio de filas (y columnas) siempre nos permite lograr que
˜
α
(i)ii6 = 0, i = 1, . . . , n.
Ahora vemos que este enunciado realmente es v´alido. Usaremos las siguientes estrategias de pivote: la b´ usqueda del pivote en la columna, donde en el k-´esimo paso determinamos el ´ındice k tal que
α ˜
(k)kk= m´ax
i>k
α
(k)ik(2.10)
y s´olo se intercambain filas, o la b´ usqueda del pivote en la matriz restante, donde determi- namos el ´ındice k tal que
α ˜
(k)kk= m´ax
i,j>k
α
(k)ij, (2.11)
la cual implica el intercambio de filas y columnas. En ambos casos, los multiplicadores satisfacen
α ˜
(i)ji/˜ α
(i)ii6 1,
lo que causa un comportamento favorable del error de redondeo.
Ejemplo 2.2 (Tarea 17, Curso 2006). Se considera el sistema lineal Ax = b dado por A =
7 1 1 10 1 1 1000 0 1
, b =
10 13 1001
.
La soluci´ on exacta del sistema es x = (1, 2, 1)
T. Resolvemos ahora el sistema usando una aritm´ etica con cuatro d´ıgitos significativos, usando el algoritmo de Gauss
a) sin pivoteo,
b) con b´ usqueda del pivote en la columna.
c) Interpretar los resultados.
Usaremos la representaci´ on cient´ıfica de los n´ umeros, por ejemplo 1234,567 −→ 1,234567 × 10
3−→ 1,235E + 3 3,141759 −→ 3,141759 × 10
0−→ 3,142E + 0 0,000654321 −→ 6,5432 × 10
−4−→ 6,543E − 4.
Transformamos cada resultado intermedio a esta forma y redondeamos hasta el ´ ultimo d´ıgi- to. Ojo: Internamente, las calculadoras usan una exactitud mayor que la desplegada en la pantalla.
a) Sin pivoteo obtenemos:
A e =
7,000 × 10
01,000 × 10
01,000 × 10
01,000 × 10
11,000 × 10
11,000 × 10
01,000 × 10
01,300 × 10
11,000 × 10
30,000 × 10
01,000 × 10
01,001 × 10
3
Fila 2
nueva= Fila 2
antigua− 1,419 × 10
0Fila 1
antiguay Fila 3
nueva= Fila 3
antigua− 1,429 × 10
2Fila 1
antigua:
A e
(1)=
7,000 × 10
01,000 × 10
01,000 × 10
01,000 × 10
1− 4,290 × 10
−1− 4,290 × 10
−11,290 × 10
01,429 × 10
2− 1,419 × 10
2− 4,280 × 10
2
.
Ahora calculamos Fila 3
nueva= Fila 3
antigua− 3,331 × 10
2Fila 2
antigua: A e
(2)=
7,000 × 10
01,000 × 10
01,000 × 10
01,000 × 10
1− 4,290 × 10
−1− 4,290 × 10
−11,290 × 10
0− 1,000 × 10
21,700 × 10
0
.
La resubstituci´ on entrega
x
3= 1,700 × 10
0, x
2= 1,307 × 10
0, x
1= 0,999 × 10
0. b) Con pivoteo obtenemos
A e =
7,000 × 10
01,000 × 10
01,000 × 10
01,000 × 10
11,000 × 10
11,000 × 10
01,000 × 10
01,300 × 10
11,000 × 10
30,000 × 10
01,000 × 10
01,001 × 10
3
.
Intercambiamos la primera y la tercera fila:
1,000 × 10
30,000 × 10
01,000 × 10
01,001 × 10
31,000 × 10
11,000 × 10
01,000 × 10
01,300 × 10
11,000 × 10
01,000 × 10
01,000 × 10
01,000 × 10
1
.
2.3. DESCRIPCI ´ON MATRICIAL DEL ALGORITMO DE GAUSS Y EL TEOREMA LR 19
Fila 2
nueva= Fila 2
antigua− 1,000 × 10
−2Fila 1
antiguay Fila 3
nueva= Fila 3
antigua− 7,000 × 10
−3Fila 1
antigua:
A e
(1)=
1,000 × 10
30,000 × 10
01,000 × 10
01,001 × 10
31,000 × 10
09,900 × 10
−12,990 × 10
01,000 × 10
09,930 × 10
−12,993 × 10
0
.
Fila 3
nueva= Fila 3
antigua− 1,000 × 10
0Fila 2
antigua: A e
(1)=
1,000 × 10
30,000 × 10
01,000 × 10
01,001 × 10
31,000 × 10
09,900 × 10
−12,990 × 10
03,000 × 10
−33,000 × 10
−3
.
La resubstituci´ on entrega
x
1= 1,000 × 10
0, x
2= 2,000 × 10
0, x
3= 1,000 × 10
0.
c) Con pivoteo, no hay errores de redondeo en este ejemplo, mientras que sin pivoteo, el error en la segunda componente es de aprox. 35 % y en la tercera de aprox. 70 %.
2.3. Descripci´ on matricial del algoritmo de Gauss y el teorema LR
La transformaci´on descrita en la secci´on anterior, Ax = b ⇔ Ry = c, ser´a descrita ahora como operaci´on matricial. Recordamos que en el algoritmo aparecen las sigiuentes operaciones: intercambios de filas y combinaciones lineales de filas, que son operaciones matriciales “de la izquierda”, y el intercambio de columnas, lo cual es una operaci´on matricial
“de la derecha”.
El intercambio de la fila i con una fila k > i es efectuado por multiplicaci´on de la izquierda con una matriz de permutaci´on
P =
e
T1...
e
Ti−1e
Tke
Ti+1...
e
Tk−1e
Tie
Tk+1...
e
Tn
=
1
. ..
1
0 0 · · · 0 1
... 1 0
... . .. ...
0 1 ...
1 0 · · · · 0 1
. ..
1
.
An´alogamente, las columnas i y j > i se intercambian a trav´es de la multiplicaci´on de la derecha por
Q =
e
1· · · e
i−1e
je
i+1· · · e
j−1e
ie
j+1· · · e
n.
Nos damos cuenta que P = P
T, Q = Q
Ty P
2= Q
2= I. Finalmente, los ceros debajo del elemento ˜ α
(i)iise generan por multiplicaci´on de la izquierda por la matriz
T
i=
1
. ..
1
− α ˜
(i)i+1,i˜ α
(i)ii1
... . ..
− α ˜
(i)n,i˜
α
(i)ii1
= I − q
ie
Ti, q
i:=
0 ...
0
˜ α
(i)i+1,i˜ α
(i)ii...
˜ α
n,i(i)˜ α
(i)ii
.
Aqu´ı q
ies el vector compuesto por i ceros y los multiplicadores del i-´esimo paso. Para explicarlo, sea
g =
γ
1...
γ
l0 ...
0
, l < i
alg´ un vector (que corresponde a una de las columnas 1 a i − 1 de la matriz transformada en el i-´esimo paso). Entonces
T
ig = (I − q
ie
Ti)g = g − q
i(e
Tig
|{z}
=0) = g,
o sea, las i − 1 primeras columnas quedan sin cambiar. La columna j, j > i, es de la siguiente forma:
a
(i)j=
˜ α
(i)1j...
˜ α
(i)i−1,j˜ α
(i)ij...
˜ α
(i)n,j
= g
(i)j+ h
(i)j, g
(i)j:=
˜ α
(i)1j...
˜ α
(i)i−1,j0 ...
0
, h
(i)j:=
0 ...
0
˜ α
(i)ij...
˜ α
(i)n,j
.
Entonces
T
ia
(i)j= T
ig
(i)j+ h
(i)j= T
ig
(i)j+ T
ih
(i)j= g
(i)j+ h
(i)j− q
ie
Tih
(i)j| {z }
= ˜α(i)ij
2.3. DESCRIPCI ´ON MATRICIAL DEL ALGORITMO DE GAUSS Y EL TEOREMA LR 21
=
˜ α
(i)1j...
˜ α
(i)i−1,j0 ...
0
+
0 ...
0
˜ α
(i)ij...
˜ α
(i)n,j
− α ˜
ij(i)
0 ...
0
˜ α
(i)i+1,i˜ α
(i)ii...
˜ α
(i)n,i˜ α
(i)ii
=
˜ α
1j(i)...
˜ α
ij(i)˜ α
(i+1)i+1,j...
˜ α
(i+1)n,j
, j = 1, . . . , n,
donde α
(i+1)ki= 0 para k > i + 1. Escrita en forma de matrices, la transformaci´on equivalente efectuada por el algoritmo de Gauss es la siguiente:
Ax = b
⇐⇒ T
1P
1AQ
1Q
1x = T
1P
1b
⇐⇒ T
2P
2T
1P
1