3.3. Número de condición de una matriz.

(1)

3.3. N´

umero de condici´

on de una matriz.

Consideremos el sistema Ax = b, de solución u. Queremos controlar qué cambios se producen en la solución cuando hacemos pequeños cambios en las componentes de b o de A. Empecemos por tomar un cambio ∆b enb. Entonces la solución cambiará a u+ ∆u, y se tiene

A(u+ ∆u) = b+ ∆b, A∆u= ∆b.

Por tanto, el cambio en la soluci´on se estima enA−1_{∆b. Si tomamos una norma vectorial} y la norma matricial subordinada, entonces

k∆uk ≤°°A−1°_°_k_∆b_k_.

Por otro lado, kbk ≤ kAk kuk, de donde 1 kuk ≤

kAk

kbk. Medimos el error relativo, y obtenemos k∆uk kuk ≤ kAk ° °_A−1°_°k∆bk kbk .

As´ı, la variación en el error relativo de la solución está asociada a la cantidadkAk kA−1_k_. Definición 3.3.1. Seak·k una norma matricial subordinada yAuna matriz inversible. Entonces el número

cond(A) =kAk°°A−1°°

se denomina n´umero de condici´on o condicionamiento de la matriz A respecto a k·k.

No hay problema en extender la definici´on a cualquier norma matricial. Consideremos ahora cambios en la matriz A.

Teorema 3.3.2. Sea k·knorma matricial subordinada, A matriz inversible yb 6=0. Si

Au=b,(A+ ∆A)(u+ ∆u) = b entonces k∆uk ku+ ∆uk ≤cond(A) k∆Ak kAk . Demostraci´on. De Au=b llegamos a

(2)

Entonces

k∆uk ≤°°A−1°°_k_∆A_{k k}_u_{+ ∆u}_k_, k∆uk

ku+ ∆uk ≤cond(A) k∆Ak

kAk .

Teorema 3.3.3. Sea k·k norma matricial subordinada,A matriz inversible y k∆Ak< 1/kA−1_{k. Si} (A+ ∆A)(u+ ∆u) = b+ ∆b entonces k∆uk kuk ≤ cond(A) 1−cond(A)k∆_k_AA_kk µ k∆bk kbk + k∆Ak kAk ¶ . Demostraci´on. [BF98, p.468].

Proposici´on 3.3.4. Sea k·k norma matricial subordinada y A una matriz inversible. Entonces

1. cond(A)≥1.

2. cond(A) = cond(A−1₎_.

3. cond(λA) = cond(A) para todo λ∈K− {0}. Demostraci´on. Como la norma es subordinada,

1 =kIk=°°AA−1_°°_{≤ k}_A_k°_°_A−1°_°_{= cond(A).} Por otro lado,

cond(A) =kAk°°A−1°_°₌°_°_A−1°_°_k_A_k_{= cond(A}−1_). Si λ es no nulo, entonces

cond(λA) = kλAk°°(λA)−1°°=|λ| kAk¯¯λ−1¯¯°°A−1°°= cond(A).

Proposici´on 3.3.5. Sea A una matriz inversible. Entonces

cond2(A) = s

λn(A∗A)

λ1(A∗_A)

dondeλn(A∗A), λ1(A∗A)son,respectivamente, los autovalores mayor y menor de la

(3)

Demostraci´on. ComoAes regular, la matrizA∗_A_{es hermitiana y sus autovalores reales} son todos positivos. Si w∈V, no nulo, entonces

w∗_A∗_Aw₌_k_Aw_k2 2 >0

porque A es inversible. Siλ es autovalor de A∗_{A, con} _v _{autovector asociado, entonces} 0<v∗_A∗_Av₌_λ_k_v_k2

2 de donde λ >0. Sabemos que

kAk2₂ =ρ(A∗_{A) =} _λ n(A∗A) y ° °_A−1°°2 2 =ρ((A −1₎∗_A−1_{) =} _ρ(A−1_(A−1₎∗_{) =}_ρ((A∗_A)−1_{) =} 1 λ1(A∗A) .

Lema 3.3.6. SeaAmatriz hermitiana no singular, con autovaloresλ1 ≤λ2 ≤. . .≤λn.

Entonces

cond2(A) = λn

λ1 .

Demostraci´on. Recordemos queρ(A−1_{) =} 1

λ1. Entonces

cond2(A) =kAk₂°°A−1°°₂ =ρ(A)ρ(A−1) = λn λ1 .

Nota 3.3.7. Sea k·k norma matricial subordinada y A matriz hermitiana. Entonces

cond(A) = kAk°°A−1°_°_≥_ρ(A)ρ(A−1_{) = cond} 2(A).

Entonces, para matrices hermitianas, cond2 es el menor de todos.

Lema 3.3.8. Si U es unitaria y A es una matriz arbitraria, entonces cond2(A) = cond2(UA) = cond2(AU) = cond2(U∗AU), es decir, cond2 es invariante por

transfor-maciones unitarias, y cond2(U) = 1.

Demostraci´on.

Nota 3.3.9. 1. El número de condición de una matriz es siempre un número mayor que 1, por lo que el sistema Ax=b estará tanto mejor condicionado cuanto más próximo a 1 esté dicho cond(A).

2. Si A es una matriz unitaria, el sistema estar´a siempre bien condicionado respecto a cond2.

(4)

Ejemplo 3.3.10. Consideremos el sistema Ax=b con A =     10 7 8 7 7 5 6 5 8 6 10 9 7 5 9 10    ,b=     32 23 33 31    

y supongamos que tenemos una variaci´on en b dada por

∆b=     0,1 −0,1 0,1 −0,1    .

La soluci´on exacta del sistema es

u=     1 1 1 1    

mientras que la del sistema alterado Ax=b+ ∆b es

u+ ∆u=     9,2 −12,6 4,5 −1,1    .

Para la norma k·k₂ calculamos los errores relativos y tenemos k∆uk₂

kuk₂ ≈8,2,

k∆bk₂

kbk₂ ≈0,003. Esto era de esperar porque cond2(A)≈2984,1.

Nota 3.3.11. El cálculo del número de condición a partir de la definición implica a la inversa de la matriz, por lo que no es un buen método. En la práctica, se suele calcular como subproducto del proceso de resolución de un sistema. También se suelen dar cotas a kA−1_k

Nota 3.3.12. Una regla del pulgar”sobre la influencia del número de condición sobre la validez de la solución es la siguiente. Supongamos que se usa eliminación gaussiana con pivoteo parcial sobre un sistema bien escalado Ax = b con aritmética de t-d´ıgitos en coma flotante. Supongamos también que no hay otras fuentes de error. Entonces, si cond(A) es del orden de 10p_{, la solución calculada es precisa con} _t₋_p _d´ıgitos

sig-nificativos. En otras palabras, esperamos una p´erdida de unos p d´ıgitos. Por ejemplo, consideremos el siguiente sistema:

,835x +,667y =,168 ,333x +,266y =,067.

(5)

Entonces A−1 ₌ µ −266000 667000 333000 −835000 ¶ ,kAk₁ = 1,168,kA−1_k 1 = 1502000, cond1(A) = 1754336≈1,7×106.

El valor de cond1(A) no es tan importante como su orden de magnitud. Lo anterior indica que el cambio relativo en la solución puede ser del orden de un millón de veces el cambio relativo en A. As´ı, si usamos eliminación gaussiana con 8 d´ıgitos para resolver el sistema, únicamente podemos esperar t−p = 8−6 = 2 d´ıgitos significativos. Esto no significa que podamos tener suerte y alcancemos mayor precisión.