4. Ecuaciones No Lineales
4.1 Introducción
En general no es posible obtener las raíces de una ecuación no lineal
f
( )
x
=
0
en forma explícita, debiéndose utilizar métodos iterativos. Partiendo de una raíz aproximada,x
0, se obtiene una secuenciaK
3 2 1
,
x
,
x
x
que converge a la raíz deseada. Para algunos métodos es suficiente conocer el intervalo[ ]
a,
b
en que se halla la raíz; otros procedimientos, de convergencia más rápida, requieren una aproximación inicial cercana a la raíz. Puede ser conveniente empezar los cálculos con un método del primer tipo y cambiar a un método de convergencia más rápida en la etapa final.La primera parte de este capítulo considera el caso en que la raíz,
x
, es una raíz simple, es decir,f
′
(
x
)
≠
0
. Las dificultades que se presentan en el caso de raíces múltiples se discuten en la sección 4.6. La sección 4.7 revisa métodos específicos para extraer “ceros" (raíces) de polinomios.La parte final da algunas ideas para la solución de sistemas de ecuaciones no lineales, un problema que ciertamente puede demandar mucho esfuerzo de cómputo.
4.2 Aproximaciones Iniciales
Pueden obtenerse aproximaciones iniciales a las raíces de
f
( )
x
=
0
graficando o tabulando la función.Si
f
(
a
o)
⋅
f
(
b
o)
<
0
, hay por lo menos una raíz,x
, en el intervalo(
a ,
ob
o)
. En elmétodo de Bisección se definen una serie de intervalos
(
,
)
(
,
)
(
,
)
K
2 2 1
1 0
0
b
a
b
a
b
a
⊃
⊃
.El punto medio de un intervalo
(
a
i,
b
i)
esx
i=
(
a
i+
b
i)
/
2
. Suponiendo quef
( )
x
≠
0
(si este no es el caso, se ha hallado la raíz) se define el sub-intervalo
(
a
i+1,
b
i+1)
mediante:
<
⋅
<
⋅
=
+ +
0
)
(
)
(
)
,
(
0
)
(
)
(
)
,
(
)
,
(
1 1i i i
i
i i i
i i
i
x
f
a
f
x
a
b
f
x
f
si
b
x
b
a
Introduciendo la notación
ε
n=
x
n−
x
, se tiene queε
n+1=
O
(
12ε
n)
. Como3 . 3 1
2
10
−≈
− , se requieren 3 ó 4 pasos para mejorar un dígito decimal en la aproximación. La convergencia es prácticamente independiente def
( )
x
.Por ejemplo, para la función:
( )
sen
( )
0
4
2
=
−
=
x
x
x
f
puede iniciarse la iteración con
2
5
.
1
0 0
=
=
b
a
obteniéndose:
-1 -0.5 0 0.5 1
1 1.5 2 2.5
i
a
ib
ic
if
( )
c
i1 1.5 2. 1.75 <0
2 1.75 2. 1.875 <0
3 1.875 2. 1.9375 >0
4 1.875 1.9375 1.90625 <0
5 1.90625 1.9375 ...
Se han subrayado las cifras correctas. Puede observarse que la convergencia es lenta.
4.3 Método de Newton – Raphson
Si
x
0 es suficientemente cercano a la raízx
:( ) ( )
(
)
( ) (
21 0)
2( )
00
0 0
0
+
−
′
+
−
′′
+
=
=
f
x
x
x
f
x
x
x
f
x
L
x
f
Y despreciando términos de orden superior:
)
(
)
(
0 0 0
x
f
x
f
x
x
′
−
≈
.Puede entonces pensarse en iterar con:
i i
i
x
h
x
+1=
+
donde:( )
( )
ii i
x
f
x
f
h
′
−
=
expresión que define el método de Newton – Raphson (o simplemente de Newton). La figura muestra una interpretación geométrica:
-0.25 0 0.25 0.5
1.75 2 2.25
x f(x)
Por ejemplo, puede emplearse el método de Newton para extraer la raíz
p
de un númeroc
, lo que equivale a resolver:0
)
(
x
=
x
−
c
=
f
p1
)
(
'
x
=
p
x
p−f
Con el método de Newton:
i
x
1
+
i
( )
( )
i i ii
x
f
x
f
x
x
′
−
=
+1
y por lo tanto:
+
−
=
−
−
=
− −+1 1
(
1
)
11
p i i p
i p i i i
x
c
x
p
p
x
p
c
x
x
x
Para obtener la raíz cúbica de 2 se tendría:
+
=
+1 2
2
2
3
1
i i i
x
x
x
e iniciando los cálculos con
x
0=
1
:i
x
iε
i=
x
i−
x
0 1 -0.259921
1 1.333 0.073412
2 1.2638889 0.003968
3 1.2599334934 1.244
⋅
10
−54 1.25992105001778 1.229
⋅
10
−10Puede observarse que la convergencia es muy rápida. Sin embargo este no siempre es el caso. Considérese, por ejemplo, la ecuación:
( )
x
=
2
−
x
−
ctg
( )
x
=
0
f
para la que
f
′
(
x
)
=
−
1
+
cos
ec
2( )
x
Los resultados obtenidos con dos distintas aproximaciones iniciales,
x
0=
0
.
5
yx
0=
2
, son:i
x
i parax
0=
0
.
5
x
i parax
0=
2
0 0.5 2.0
1 0.5986 -0.18504
2 0.628703 -0.44878
3 0.6308034 -1.49817
4 0.630812760 -676.133
5 -1140.538
6 -1163.343 ¡Diverge!
Las condiciones para la convergencia del método de Newton se revisan a continuación.
De la expansión de
f
en series de Taylor:(
x
x
)
f
( )
η
x
f
x
x
x
f
x
f
=
n+
−
n⋅
′
n+
−
n⋅
′′
=
22
1
)
(
)
(
)
(
)
(
0
η en intervalo( )
x,
x
Dividiendo entre
f
′
(
x
n)
(que se supone distinto de cero):( )
( ) (
)
(
)
( )
( )
nn n
n n
n
x
f
f
x
x
x
x
x
x
x
f
x
f
′
′′
−
−
=
−
=
−
+
′
+ 2 2η
1 1
( )
( )
21
2
1
n n n
x
f
f
η
ε
ε
′
′′
=
y cuando
x
n→
x
se tiene que 1 2)
(
)
(
2
1
n n
x
f
x
f
ε
ε
′
′′
→
+ .
Esto es válido sólo si
f
′
( )
x
≠
0
, es decir si la raíz es simple. El caso de raíces múltiples se revisa más adelante. El proceso converge cuandoε
n+1<
ε
n, es decir si:1
0
f
′′
f
′
<
ε
. Si la raíz es simple y la aproximación inicial es adecuada, la convergencia del método de Newton es cuadrática.Con el método de Newton pueden también obtenerse raíces complejas. Esto requiere que la aproximación inicial sea un número complejo. Por ejemplo, si:
0
1
)
(
x
=
x
2+
=
f
se tendría:
( )
( )
−
=
′
−
=
+
i i i
i i
i
x
x
x
f
x
f
x
x
.
1
2
1
1
e iniciando los cómputos con x0=1+i:
i
x
i0
1
+
i
1
0
.
25
+
0
.
75
i
2
−
0
.
075
+
0
.
975
i
3 0.0017+0.9968i
4
−
0
.
000005
+
1
.
000004
i
4.4 Método de la Secante y Otros Procesos del Mismo Tipo
Si en
)
(
)
(
1
n n n
n
x
f
x
f
x
x
′
−
=
+ la derivada
f
′
(
x
n)
se aproxima por(
)
(
1)
1
− −
−
−
n n
n n
x
x
f
f
, donde
f
ndenota
f
(
x
n)
, se tiene el método de la Secante:n n
n
x
h
x
+1=
+
(
)
)
(
11
− −
−
−
−
=
n n
n n n n
f
f
x
x
f
h
Se supone quef
n≠
f
n−1Para cada punto,
n
, solo debe evaluarse una función,f
n, mientras que el método de Newton requiere también la evaluación def
n′
.Es importante hacer notar que NO es conveniente rescribir estas expresiones en la forma:
(
)
(
1)
1 1
1
− − −
+
=
⋅
−
−
⋅
n n
n n n n n
f
f
f
x
f
x
x
ya que con esta última expresión pueden introducirse fuertes errores numéricos cuando 1
−
≈
nn
x
x
yf
n⋅
f
n−1>
0
.En la tabla siguiente se resuelve
f
(
x
)
=
14x
2−
sen(
x
)
parax
≈
2
por el método de lan
x
nf
( )
x
nε
n=
x
n−
x
0 1. -0.59147 -0.93
1 2. 0.090703 0.066
2 1.86704 -0.084980 -0.067
3 1.93135 -0.003177 -0.0024
4 1.93384 -0.000114 +0.00009
5 1.93375 -0.000005
<
12⋅
10
−5(en la gráfica adjunta casi no se aprecia la diferencia entre la función y la secante).
La convergencia de método de la secante es en general más lenta que la del método de Newton. Sin embargo, se justifica usar este método si la evaluación de
f
′
( )
x
requiere más del 44% del trabajo que se emplea en evaluarf
( )
x
, ya que el mayor número de iteraciones queda más que compensado por el menor número de operaciones realizadas en cada caso. A esta conclusión se llega comparando la convergencia de ambos métodos. Para el método de la secante:
−
−
−
=
−
=
−
− − +
+
1 1 1
1
n n
n n n n n n n
f
f
f
x
x
ε
ε
ε
ε
y siendo:
( ) ( )
=
+
′
( )
+
′′
( )
+
K
=
f
x
f
x
f
x
f
x
f
n n n n2 2 1
ε
ε
se obtiene (despreciando términos de orden superior):
(
)
(
)
(
−
)
′
+
(
−
)
′′
+
=
−
+
′′
+
′
+
=
− −
− +
L
K
)
(
)
(
)
(
)
(
2 1 2
1 1
1 2
2 1
1
x
f
x
f
x
f
x
f
n n n
n
n n n
n n
n
ε
ε
ε
ε
ε
ε
ε
ε
ε
ε
(
)
(
(
)
)
21
)
(
)
(
)
(
)
(
2 21 12
1
′′
+
K
′
+
+
′′
+
K
+
′
+
=
ε
nε
nf
x
ε
nf
x
f
x
ε
nε
n−f
x
1 2
1 1
)
(
)
(
− +
≈
′
′′
∴
n n nx
f
x
f
ε
ε
ε
Suponiendo entonces:
ε
n+1=
C
ε
nβ y por lo tanto 1(
1)
1 11
2
1
2
− − −
+
+
=
n=
′
′′
n nn
C
f
f
C
ε
ε
ε
ε
β β β , dedonde se obtiene:
1
(
1
5
)
1
.
618
K
2 1
2
=
β
+
→
β
=
+
=
β
Es decir, la convergencia delmétodo de la secante es entre lineal y cuadrática. -0.25
0 0.25
1.75 2
En el método de Falsa Posición la secante se toma entre los puntos
(
x ,
nf
n)
y(
x ,
rf
r)
, donder
<
n
es el mayor índice para el cualf
nf
r<
0
. Sif
( )
x
es continuo, estemétodo es siempre convergente. Sin embargo, la convergencia es de primer orden.
Otra alternativa es el método de Steffensen:
( )
( )
n n nn
x
g
x
f
x
x
+1=
−
donde:
( )
(
( )
) ( )
( )
n n nn n
x
f
x
f
x
f
x
f
x
g
=
+
−
cuya convergencia es de segundo orden: 1
( )
(
1
( )
)
2)
(
2
1
n
n
f
x
x
f
x
f
ε
ε
+
′
′
′′
≈
+
4.5. Otros Métodos Iterativos
Una ecuación de la forma
f
( )
x
=
0
puede rescribirse comox
=
g
(x
)
. Dada entonces una aproximaciónx
0 a una raízx
def
( )
x
=
0
, la secuencia,
,
,
L
3 2 1
x
x
x
definida por:( )
n ng
x
x
+1=
converge ax
siempre queg
′
( )
x
<
1
en la región de interés. El procedimiento puede ser más simple que otros y en algunos casos puede incluso converger más rápidamente.Por ejemplo, la ecuación:
0
1
tg
)
2
(
)
(
x
=
−
x
x
−
=
f
es equivalente a
ctg
x
=
(
2
−
x
)
. En este caso podría iterarse conctg
x
n+1=
2
−
x
n o, loque es lo mismo,
x
n+1=
arc
ctg
(
2
−
x
n)
. Sin embargo, la iteración escrita al revés, es decirx
n+1=
2
−
ctg
x
n, no funciona.En efecto, tomando
x
0=
0
e iterando conctg
x
n+1=
2
−
x
n se obtienen:n
x
n0 0.
1 0.464
2 0.577
3 0.6125
4 0.6245
5 0.6286
6 0.6301
...
10 0.6308017
...
20 0.630812760
Una interpretación gráfica del proceso se muestra en la figura. En lo que sigue se analiza cómo se reducen los errores en este caso. Si se considera
x
n=
x
+
ε
n1
1 +
+
=
+
ε
nn
x
x
se tiene que
ctg
(
x
+
ε
n+1)
=
2
−
(
x
+
ε
n)
-0.50 0.5 1 1.5 2
-0.5 0 0.5 1 1.5 2 2.5
x y(x)
ctg x
Suponiendo que
ε
n+1<<
x
puede hacerse una expansión de la cotangente en series:( )
n(
)
nn
x
O
x
x
−
ε
++
ε
+=
2
−
−
ε
sen
ctg
21 2 1y siendo
x
la solución exacta, ésta satisface idénticamente la ecuación:ctg
x
=
(
2
−
x
)
; de donde se concluye que:(
)
n nn
≈
x
ε
≈
ε
ε
+ 31 2
1
sen
es decir
ε
n+1<
ε
n y por lo tanto el proceso es convergente.Si en cambio se considera la iteración
x
n+1=
2
−
ctg
x
n se tiene queε
n+1≈
3
ε
n y elproceso no converge, aún cuando
x
0 sea muy cercano a la raíz x:
n
x
n0 0.6
1 0.538
2 0.325
3 0.965
4 2.69
5 4.01
4.6. Condicionamiento de las Raíces: Raíces Múltiples
Si
x
n es una aproximación a una raízx
def
(
x
)
=
0
, se tiene:( )
x
=
f
( ) (
x
+
x
−
x
) ( ) (
f
′
x
+
x
−
x
) ( )
f
′′
x
+
K
f
n n 21 n 2Para xn ≈x puede escribirse:
( )
( )
x
f
x
f
x
x
n n′
≈
−
Si el error en la evaluación de
f
(
x
n)
es deO
( )
δ
(δ
depende de la precisión de lacomputadora y es independiente de
x
) el error en la aproximación de la raízx
n−
x
esde
( )
′
δ
x
f
O
. Entonces, sif
′
( )
x
es muy pequeño se tiene que( )
>>
δ
′
δ
x
f
y se diceque la raíz
x
está mal condicionada.El mismo argumento puede repetirse cuando se trata de una raíz de multiplicidad
m
, caso en el que::( )
(
)
0
)
(
)
(
=
′′
=
1=
′
x
f
x
f
−x
f
K
m .En tal caso:
( )
( )
m m n
x
f
m
x
x
O
1
!
δ
⋅
=
−
Considérese por ejemplo:
f
( )
x
=
x
2−
2
x
+
1
=
0
, que tiene una raíz doblex
=
1
. Supóngase que se trabaja con aritmética de punto flotante y 8 decimales en la mantisa. Entoncesδ
=
12⋅
10
−8, y siendof
′′
( )
x
=
2
se obtiene:(
)
12 4 42 2 8 2
1
10
0
.
7071
10
2
2
10
−⋅
=
⋅
−=
−⋅
=
−
x
O
K
x
nes decir, cualquier valor en el rango: 0,99992929 ≤x≤ 1,00007071 sería aceptado como exacto, pudiéndose tener un error relativo de orden
10
−5.-1 -0.5 0 0.5 1
0 1 2 3 4 5
x p(x)
Siendo las raíces múltiples mal condicionadas, es de esperarse que la separación relativa de las raíces afecte el condicionamiento. Particularmente crítico es el caso en que las raíces están más o menos uniformemente espaciadas, por ejemplo en:
( ) (
=
−
1
)(
−
2
)(
−
3
) (
−
20
)
=
20−
210
19+
20615
18−
+
20
!
=
0
ρ
x
x
x
x
L
x
x
x
x
L
Si en lugar del coeficiente 210 se tuviera un coeficiente (210 + ε), se obtendrían las raíces:
0
=
ε
910
−=
ε
1
a10
1
a10
11
10
.
85
12
13
i
11
.
0
38
.
12
±
14
15
i
72
.
0
37
.
14
±
16
17
i
88
.
0
57
.
16
±
18
19
i
35
.
0
67
.
18
±
20
20
Este ejemplo es particularmente mal condicionado, pero son frecuentes las dificultades análogas al evaluar los ceros (es decir, las raíces) de polinomios. La evaluación de las raíces de un polinomio es un problema numérico que debe evitarse, a menos que los datos iniciales hayan sido los coeficientes del polinomio en forma explícita.
Raíz bien condicionada
Aparte de un mal condicionamiento, las raíces múltiples reducen el orden de la convergencia. Así, por ejemplo, el método de Newton, cuya convergencia es cuadrática cuando
x
n es aproximadamente una raíz simple:( )
( )
ε
′
′′
=
ε
+1 22
1
n n
x
f
x
f
tiene convergencia lineal cuando la raíz es múltiple. Para una raíz de multiplicidad
m
:( )
1( )
21
1
m n nn
=
−
ε
+
O
ε
ε
+El método de Newton modificado:
( )
( )
n n nn
x
f
x
f
m
x
x
′
−
=
+1
tiene todavía convergencia cuadrática, pero en general no es posible conocer
m
a priori. Alternativamente, puede pensarse en procesos del tipo:( )
( )
( )
n n nx
f
x
f
x
u
′
=
( )
( ) ( )
( )
n n nn
u
x
x
f
x
f
x
u
′
′′
−
=
′
1
( )
( )
n n nn
x
u
x
u
x
x
′
−
=
+1
Pero nótese que esto es poco efectivo cuando la raíz es simple, puesto que se requiere evaluar una función adicional,
f
′′
( )
x
n .4.7. Métodos para Calcular Raíces de Polinomios
En esta sección se revisan algunos de los muchos métodos específicos para evaluar las raíces (ceros) de polinomios:
ρ
( )
x
=
x
n+
a
1x
n−1+
a
2x
n−2+
K
+
a
n−1x
+
a
n=
0
(
x
−
α
1)(
x
−
α
2)(
x
−
α
3) (
K
x
−
α
n)
=
0
Es frecuente subestimar las dificultades que se presentan en problemas de este tipo. Los métodos mencionados en los acápites anteriores (Newton, secante y otros) son también aquí aplicables, aunque pueden ser poco eficientes.
4.7.1 Método de Bernoulli
Este es un proceso "clásico", que en general resulta poco apropiado, porque se obtiene primero la raíz de mayor módulo.
Se toman
n
valores arbitrariost
t
t
L
t
n3 2
1
,
,
(con tn ≠0) y se calculan nuevos valores porrecursión:
∑
= −
−
=
ni
i p i
p
a
t
t
1
p n n p
p
p
c
r
c
r
c
r
t
=
+
+
K
+
2 2 1 1
Las
r
i son raíces (distintas de cero) de:( )
∑
=−
−
=
ni
i n i
n
a
r
r
1
es decir, las
r
i son las raíces del polinomio:r
i=
α
i.Por tanto:
p n n p
p
p
c
c
c
t
=
α
+
α
+
K
+
α
2 2 1 1
y si
α
>
α
−1≥
K
≥
α
1n
n se tiene que:
n
t
t
Lim
=
α
− ρ
ρ ∞ → ρ
1 .
Esto es análogo a una iteración directa para determinar un valor propio de una matriz. También aquí la convergencia es lenta cuando
α
n≈
α
n−1 . El proceso converge a αn,aún cuando
c
n=
0
(gracias a los errores de redondeo). El inconveniente principal deeste método es que extrae primero la raíz de mayor módulo y la "deflación" con esta raíz (que no es exacta) puede introducir errores importantes en las otras raíces.
Supóngase, por ejemplo, que:
( )
x
=
x
4−
2
x
3+
1
.
25
x
2−
0
.
25
x
−
0
.
75
f
.Con
t
0=
t
1=
t
2=
0
yt
3=
1
se obtienen:k
t
k nk k
t t
α ≈
−1
4 2.0 2.0
5 2.75 1.375
6 3.25 1.1818
7 4.3125 1.3269
8 6.7500 1.5652
9 10.9844 1.6273
10 17.0469 1.5519
...
15 125.113 1.5104
16 188.240 1.5046
...
19 632.809 1.4986
20 949497 1.5004
4.7.2. Método de Graeffe (método de los cuadrados de las raíces)
Este es un proceso que puede ser empleado para mejorar el condicionamiento de las raíces, pero es inadecuado para completar la extracción de las mismas.
Dado:
p
1( )
x
=
x
n+
a
1x
n−1+
a
2x
n−2+
K
+
a
n−1x
+
a
n=
0
O bien:
p
1(
x
)
=
(
x
−
α
1)(
x
−
α
2)(
x
−
α
3) (
K
x
−
α
n)
=
0
.Puede formarse un nuevo polinomio
( ) ( ) ( ) ( )
x
1
np
1x
p
1x
(
x
2α
12)
(
x
2α
22)
(
x
2α
32)
(
x
2α
n2)
φ
=
−
−
=
−
−
−
L
−
.Como
φ
( )
x
solo contiene potencias pares dex
, se puede definir:( )
( )
(
)
(
)
(
32)
(
2)
2 2 2
1
2
x
x
x
x
x
x
np
=
φ
=
−
α
−
α
−
α
K
−
α
Es decir,
p
2( )
x
=
0
tiene raícesα
12L
α
2iL
α
n2, que son justamente los cuadrados delas raíces de
p
1( )
x
=
0
. Del mismo modo pueden obtenersep
4( ) ( )
x
p
8x
L
p
m( )
x
. Lasraíces de
p
m( )
x
=
0
, son lasα
imdondem
=
2
r. Si se tienen coeficientes ( )L
3 ) ( 2 ) ( 1
,
,
r r r
a
a
a
tales que:( )
( ) ( ) ( ) ( )0
1 2
2 1
1
+
+
+
+
=
+
=
− − − rn r n n
r n
r n
m
x
x
a
x
a
x
a
x
a
p
K
los coeficientes
a
1 (r+1), ( 1)
L
3 ) 1 ( 2
,
+
+ r
r
a
a
dep
2m( )
x
resultan:( )
( )
( )( )
( ) ( )
−
+
−
=
∑
−= + −
−
+ min( ,)
1 2
1
(
1
)
2
1
i i n
j
r j i r
j i j r
i i n r
i
a
a
a
a
Y para
m
(or
) suficientemente grande, puede escribirse:( )r m
a
11
≈
α
( )( )K
r r m
a
a
1 2 2
≈
α
( )( )rk r k m k
a
a
1
−
≈
α
Estas expresiones permiten, en teoría, determinar los valores absolutos de las raíces. Los signos deben obtenerse por sustitución en el polinomio original
p
( )
x
=
0
.Por ejemplo, considérese el polinomio
p
( )
x
=
x
3−
6
x
2+
11
x
−
6
(cuyas raíces 1, 2, 3 están uniformemente espaciadas y por tanto están mal condicionadas):r
m
a
1a
2a
30 1 -6. 11. -6.
1 2 -14. 49. -36.
2 4 -98. 1393. -1296.
3 8 -6818.2 1.6864 x 106 -1.6796 x 106 4 16 -4.3112 x 107 2.8212 x 1012 -2.8212 x 1012 ....
de donde
α
116≈
4
.
3112
⋅
10
74 7
12 16
2
6
.
5438
10
10
4.3112
10
2.8212
⋅
=
⋅
⋅
≈
99998
.
0
10
2.8212
10
2.8211
12 12 16
3
=
⋅
⋅
≈
α
es decir
α
1≈
3
.
0003
α
2≈
1
.
9998
α
3≈
1
.
0000
Las raíces de
p
( ) ( ) ( )
x
p
x
p
x
L
8 4
2 están mejor condicionadas en cada paso. Sin embargo, se observa un crecimiento muy rápido de los coeficientes (posible "overflow") por lo que no pueden realizarse muchos pasos.
4.7.3. Método de Laguerre
Un muy buen método para extraer raíces de polinomios es el de Laguerre. En este método, las sucesivas aproximaciones a una raíz se calculan mediante:
)
(
)
(
)
(
1
k k
k k
k
x
H
x
p
x
p
n
x
x
±
′
−
=
+
donde
n
es el grado del polinomio y:(
1
) (
[
1
)(
(
)
)
(
)
(
)
]
)
(
x
kn
n
p
x
k 2n
p
x
kp
x
kH
=
−
−
′
−
′′
Como en otros casos, debe considerarse el signo que evita la cancelación, es decir, aquel para el que
x
k+1−
x
k resulta lo más pequeño posible.El método de Laguerre requiere evaluar
p
( )
x
k ,p
′
( )
x
k yp
′′
( )
x
k en cada paso, pero la convergencia (para raíces simples) es cúbica. Si las raíces son reales, este método converge siempre. Suponiendo que la aproximación inicialx
0 esté en el intervalo entrer
α
yα
r+1, converge a una de esas dos raíces. Si en cambiox
0<
α
1 ox
0>
α
n el proceso converge aα
1 oα
n, respectivamente.Por ejemplo, considérese el polinomio:
( ) (
)(
)(
)(
)(
)(
)(
)(
)
0
40320
109584
118124
67284
22449
4536
546
36
8
7
6
5
4
3
2
1
2 3
4 5
6 7
8
−
+
−
+
−
+
−
+
=
=
=
−
−
−
−
−
−
−
−
=
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
p
Con la aproximación inicial
x
0=
0
se obtienen:k
x
p
( )
x
kp
′
( )
x
kp
′′
( )
x
kH
( )
x
k0 40320 -109584 236248 5.499492E+10
0.937418 369.916 -6836.714 31394.812 1.639940E+09
0.999940 0.302 -5041.569 26140.729 1.245010E+09
1.000000
En forma similar, con la aproximación inicial
x
0=
2
.
5
:k
x
p
( )
x
kp
′
( )
x
kp
′′
( )
x
kH
( )
x
k2.5 121.816 -132.750 -977.625 7.532588E+06
2.838696 42.391 -277.131 60.892 3.618725E+06
2.994301 1.374 -242.118 367.294 2.844179E+06
3.000000
pero los coeficientes del polinomio fueran todos reales, sería aconsejable extraer factores cuadráticos con el procedimiento descrito en la sección 4.7.4
4.7.4. Método de Bairstow (factorización iterativa de polinomios).
Un polinomio
p
( )
x
=
x
n+
a
1x
n−1+
a
2x
n−2+
K
+
a
n−1x
+
a
n puede expresarse como:( )
x =(
x2+rx+s)
⋅q(
x,r,s)
+xF( ) ( )
r,s +Gr,sρ .
Se requiere determinar
r
,
s
para quex
2+
rx
+
s
sea un factor exacto dep
( )
x
, es decir, para que se tengaF
( )
r
,
s
=
G
( )
r
,
s
=
0
. Siendo éste el caso, dos de las raíces (o un par de raíces complejas) pueden obtenerse dex
2+
rx
+
s
=
0
; el resto de las raíces son los ceros deq
( )
x
. Dados valores aproximados der
,
s
tales comor
n ys
n, se obtienen valores mejorados,r
n+1 ys
n+1, considerando:(
,
) (
,
) (
)
(
)
0
, 1
, 1
1
1 +
≈
+
+−
+
+−
≈
+
n s n r n n
n s n r n n n n n
n
ds
dF
s
s
dr
dF
r
r
s
r
F
s
r
F
(
,
) (
,
) (
)
(
)
0
, 1
, 1
1
1 +
≈
+
+−
+
+−
≈
+
n s n r n n n s n r n n n n n
n
ds
dG
s
s
dr
dG
r
r
s
r
G
s
r
G
de donde, con la notación
ds
dG
G
dr
dF
F
r=
L
s=
, se tiene:n s n r r s s r
s s
n n
G
F
G
F
G
F
F
G
r
r
,
1
−
⋅
−
⋅
−
=
+
n s n r r s s r
r r
n n
G
F
G
F
G
F
F
G
s
s
,
1
−
⋅
−
⋅
−
=
+
Dado que el polinomio original
p
( )
x
es independiente der
ys
, al derivar el polinomio( )
x
(
x
rx
s
)
q
xF
G
p
=
2+
+
⋅
+
+
con relación ar
ys
se obtienen:(
2+
+
)
⋅
+
(
+
)
=
0
+
x
rx
s
q
rxF
rG
rxq
(
2+
+
)
⋅
+
(
+
)
=
0
+
x
rx
s
q
sxF
sG
sq
es decir, los
F
r yG
r son los coeficientes del residuo al dividir−
x
q
( )
x
entres
rx
x
2+
+
mientras losF
s yG
s se obtienen como coeficientes del residuo al dividir( )
x
q
−
también entrex
2+
rx
+
s
.La convergencia de este proceso depende de una buena aproximación inicial.
El siguiente ejemplo ilustra un paso del proceso. Supóngase que se tiene el polinomio:
( )
x
=
x
4−
5
x
3+
14
x
2−
25
x
+
25
=
0
p
y un factor aproximado
x
2−
4
x
+
4
(es decirr
o=
−
4
,s
0=
+
4
). Dividiendop
( )
x
entre este factor (utilizando el procedimiento de Ruffini) se obtiene:( )
x
p
1 -5 14 -25 254
0
=
−
r
4 -4 244
0
=
−
Y análogamente:
-xq(x)
-1 1 -6 04 -4 -12
-4 4 12
-1 -3 -14 12
-q(x)
-1 1 -64 -4
-4 4
-1 -3 -2
y de estos resultados:
1
3
=
=
G
F
12
14
, ,
=
−
=
r r
G
F
2
3
, ,
−
=
−
=
r r
G
F
64
=
⋅
−
⋅
=
F
rG
sF
sG
rw
( )( ) ( )( )
4.0469
64
2
3
3
1
4
1
=
−
−
−
−
−
−
=
r
( )( ) ( )( )
4.7813
64
12
3
14
1
4
1
=
−
−
−
=
s
es decir:
x
2+
r
1x
+
s
1=
x
2−
4.0469
x
+
4.7813
En el siguiente paso se obtienen:
2547
.
1
=
F
G
=
−
0
.
6350
1003
.
13
−
=
r
F
G
r=
14
.
7920
0938
.
3
−
=
s
F
G
s=
−
0
.
5803
de donde
r
2=
−
4
.
0973
,s
2=
4
.
9732
. El factor exacto esx
2−
4
x
+
5
.El método antes descrito es adecuado solo si la aproximación inicial es cercana al factor exacto (esto es análogo a lo que ocurre con el método de Newton). Pueden también utilizarse las mismas ideas para separar factores de grado mayor que 2.
4.7.5. Método de Jenkins y Traub
Este proceso tiene algunas similitudes con el método de iteración inversa para hallar vectores característicos. Converge a la raíz de menor módulo (lo que es beneficioso para una "deflación" adecuada; véase la sección 4.7.6) y permite efectuar translaciones para acelerar la convergencia. Es probablemente el mejor de los métodos para extraer raíces de polinomios (pero en algunos casos no es el más eficiente). El algoritmo tiene 3 etapas:
a. Dado el polinomio i n i
n
i
x
a
x
p
−=
∑
=
0
)
(
cona
o=
1
,
a
n≠
0
, se determina:( )
(
)
10 0
)
(
)
(
−−=
∑
−
=
′
=
n ii n
i
x
a
i
n
x
y por recursión: ( ) ( ) ( )
−
=
+(
)
)
0
(
)
0
(
)
(
1
)
(
1
p
x
p
h
x
h
x
x
h
k kk
k
=
0
,
1
,
2
L
A medida que
k
crece, las razones entre los coeficientes deh
( )k(x
)
y aquellos de ( )1(
x
)
h
k+ tienden a hacerse constantes e iguales a la raíz de menor módulo: ( )( )1
(
(
0
0
)
)
1≈
+α
kkh
h
b. En una segunda etapa, con una “translación” fija
s
0≈
r
1, se determinan:( )
(
)
( ) ( )
−
−
=
+(
)
)
(
)
(
)
(
1
)
(
0 0 0 1x
p
s
p
s
h
x
h
s
x
x
h
k k kc. Y finalmente se refina la aproximación con translaciones variables en cada paso: ( )
( )
( )
( )
1 1 1r
s
h
s
h
s
s
k k k k kk
=
+
≈
− + ( )
(
)
( ) ( )
−
−
=
+ + + +(
)
)
(
)
(
)
(
1
)
(
1 1 1 1x
p
s
p
s
h
x
h
s
x
x
h
k k k k k kCada paso de este método requiere
O
( n
2
)
operaciones.En lo que sigue se analiza cómo el proceso converge. El polinomio cuyas raíces se buscan puede expresarse en la forma:
( ) (
) (
) (
)
30
3 2 2 1
1
−
α
−
α
=
α
−
=
x
mx
mx
mK
x
p
donde
L
3 2 1
,
m
,
m
m
son las multiplicidades de las raíces.El método se inicia con
h
( )0(
x
)
=
p
′
(
x
)
, que es un polinomio de gradon
−
1
.
Este polinomio puede escribirse en la forma:( ) ( )
(
)
∑
−
α
=
i ix
x
p
c
x
h
0(
)
0(
)
donde
c
i( )0=
m
i. Puede probarse por inducción que los sucesivos polinomios( )
x
h
( )
x
h
( )
x
L
h
(1) (2) (3) son también polinomios de gradon
−
1
.
Supóngase que: ( ) ( )(
)
∑
−
α
=
− − i k i kx
x
p
c
x
h
1(
)
1(
)
Entonces: ( )
(
)
( ) ( ) − − = − − ( ) ) ( ) ( ) ( 1 ) ( 1 1 x p s p s h x h s x x h k k k k k k(
)
( )(
)
( )(
)
− − − − =∑
−∑
− i k k k i k i k i k s s p c s p x p x x p c sx α α
) ( ) ( ) ( ) (
1 1 1
( )