Apuntes H Scaletti – Ecuaciones No Lineales

(1)

4. Ecuaciones No Lineales

4.1 Introducción

En general no es posible obtener las raíces de una ecuación no lineal

f

( )

x

=

0

en forma explícita, debiéndose utilizar métodos iterativos. Partiendo de una raíz aproximada,

x

₀, se obtiene una secuencia

K

3 2 1

,

x

,

x

que converge a la raíz deseada. Para algunos métodos es suficiente conocer el intervalo

[ ]

a,

b

en que se halla la raíz; otros procedimientos, de convergencia más rápida, requieren una aproximación inicial cercana a la raíz. Puede ser conveniente empezar los cálculos con un método del primer tipo y cambiar a un método de convergencia más rápida en la etapa final.

La primera parte de este capítulo considera el caso en que la raíz,

x

, es una raíz simple, es decir,

f

′

(

x

)

≠

0

. Las dificultades que se presentan en el caso de raíces múltiples se discuten en la sección 4.6. La sección 4.7 revisa métodos específicos para extraer “ceros" (raíces) de polinomios.

La parte final da algunas ideas para la solución de sistemas de ecuaciones no lineales, un problema que ciertamente puede demandar mucho esfuerzo de cómputo.

4.2 Aproximaciones Iniciales

Pueden obtenerse aproximaciones iniciales a las raíces de

f

( )

x

=

0

graficando o tabulando la función.

Si

f

(

a

o

)

⋅

f

(

b

o

)

<

0

, hay por lo menos una raíz,

x

, en el intervalo

(

a ,

o

b

o

)

. En el

método de Bisección se definen una serie de intervalos

₍

_,

₎

₍

_,

₎

₍

_,

₎

K

2 2 1

1 0

0

b

a

b

a

b

a

⊃

.

El punto medio de un intervalo

(

a

i

,

b

i

)

es

x

i

=

(

a

i

+

b

i

)

/

2

. Suponiendo que

f

( )

x

≠

0

(si este no es el caso, se ha hallado la raíz) se define el sub-intervalo

(

a

_i₊₁

,

b

_i₊₁

)

mediante:









<

⋅

<

⋅

=

+ +

0 )

(

)

(

)

,

(

0 )

(

)

(

)

,

(

)

,

(

₁ ₁

i i i

i

i i i

i i

i

x

f

a

f

x

a

b

f

x

f

si

b

x

b

a

Introduciendo la notación

ε

n

=

x

n

−

x

, se tiene que

ε

n+1

=

O

(

12

ε

n

)

. Como

3 . 3 1

2

10

−

≈

− , se requieren 3 ó 4 pasos para mejorar un dígito decimal en la aproximación. La convergencia es prácticamente independiente de

f

( )

x

.

Por ejemplo, para la función:

( )

sen

( )

0

4

2

=

−

=

x

f

puede iniciarse la iteración con

2

5 .

1

0 0

=

b

a

obteniéndose:

-1 -0.5 0 0.5 1

1 1.5 2 2.5

(2)

i

a

_i

b

_i

c

_i

f

( )

c

_i

1 1.5 2. 1.75 <0

2 1.75 2. 1.875 <0

3 1.875 2. 1.9375 >0

4 1.875 1.9375 1.90625 <0

5 1.90625 1.9375 ...

Se han subrayado las cifras correctas. Puede observarse que la convergencia es lenta.

4.3 Método de Newton – Raphson

Si

x

₀ es suficientemente cercano a la raíz

x

:

( ) ( )

(

)

( ) (

₂1 ₀

)

2

( )

₀

0

0 0

0

+

−

′

+

−

′′

+

=

_f

_x

_f

_x

_f

_x

L

x

f

Y despreciando términos de orden superior:

)

(

)

(

0 0 0

x

f

x

f

x

′

−

≈

.

Puede entonces pensarse en iterar con:

i i

i

x

h

x

₊1

=

+

donde:

( )

i

i i

x

f

x

f

h

′

−

=

expresión que define el método de Newton – Raphson (o simplemente de Newton). La figura muestra una interpretación geométrica:

-0.25 0 0.25 0.5

1.75 2 2.25

x f(x)

Por ejemplo, puede emplearse el método de Newton para extraer la raíz

p

de un número

c

, lo que equivale a resolver:

0 )

(

x

=

x

−

c

=

f

p

1

)

(

'

x

=

p

x

p−

f

Con el método de Newton:

i

x

1

+

i

(3)

( )

i i i

i

x

f

x

f

x

′

−

=

+1

y por lo tanto:













+

−

=

−

=

₋ ₋

+1 1

(

1 )

1

p i i p

i p i i i

x

c

x

p

x

p

c

x

Para obtener la raíz cúbica de 2 se tendría:

_













+

=

+1 2

2

3

1

i i i

x

e iniciando los cálculos con

x

0

=

1

:

i

x

_i

ε

_i

=

x

_i

−

x

0 1 -0.259921

1 1.333 0.073412

2 1.2638889 0.003968

3 1.2599334934 1.244

⋅

10

−5

4 1.25992105001778 1.229

⋅

10

−10

Puede observarse que la convergencia es muy rápida. Sin embargo este no siempre es el caso. Considérese, por ejemplo, la ecuación:

( )

x

=

2 −

x

−

ctg

( )

x

=

0 f

para la que

f

′

(

x

)

=

−

1 +

cos

ec

2

( )

x

Los resultados obtenidos con dos distintas aproximaciones iniciales,

x

0

=

0 .

5

y

x

0

=

2

, son:

i

x

i para

x

0

=

0 .

5 x

i para

x

0

=

2

0 0.5 2.0

1 0.5986 -0.18504

2 0.628703 -0.44878

3 0.6308034 -1.49817

4 0.630812760 -676.133

5 -1140.538

6 -1163.343 ¡Diverge!

Las condiciones para la convergencia del método de Newton se revisan a continuación.

De la expansión de

f

en series de Taylor:

(

x

)

f

( )

η

x

f

x

f

x

f

=

_n

+

−

_n

⋅

′

_n

+

−

_n

⋅

′′

=

2

1 )

(

)

(

)

(

)

(

0

η en intervalo

( )

x,

x

Dividiendo entre

f

′

(

x

_n

)

(que se supone distinto de cero):

( )

( ) (

)

(

)

( )

n

n n

n

x

f

x

f

x

f

′

′′

−

=

−

=

−

+

′

+ 2 2

η

1 1

( )

2

1

2

1

n n n

x

f

η

_ε

ε

′

′′

=

(4)

y cuando

x

_n

→

x

se tiene que ₁ 2

)

(

)

(

2

1

n n

x

f

x

f

ε

′

′′

→

+ .

Esto es válido sólo si

f

′

( )

x

≠

0

, es decir si la raíz es simple. El caso de raíces múltiples se revisa más adelante. El proceso converge cuando

ε

_n₊₁

<

ε

_n, es decir si:

1

0

f

′′

f

′

<

ε

. Si la raíz es simple y la aproximación inicial es adecuada, la convergencia del método de Newton es cuadrática.

Con el método de Newton pueden también obtenerse raíces complejas. Esto requiere que la aproximación inicial sea un número complejo. Por ejemplo, si:

0

1 )

(

x

=

x

2

+

=

f

se tendría:

( )













−

=

′

−

=

+

i i i

i i

i

x

f

x

f

x

.

1

2

1

e iniciando los cómputos con x₀=1+i:

i

x

_i

0

1 +

i

1

0 .

25 +

0 .

75 i

2

−

0 .

075 +

0 .

975 i

3 0.0017+0.9968i

4

−

0 .

000005

+

1 .

000004

i

4.4 Método de la Secante y Otros Procesos del Mismo Tipo

Si en

)

(

)

(

1

n n n

n

x

f

x

f

x

′

−

=

+ la derivada

f

′

(

x

n

)

se aproxima por

(

)

(

1

)

1

− −

−

n n

x

f

, donde

f

_n

denota

f

(

x

_n

)

, se tiene el método de la Secante:

n n

n

x

h

x

₊1

=

+

(

)

(

₁

1

− −

−

=

n n

n n n n

f

x

f

h

Se supone que

f

_n

≠

f

_n₋₁

Para cada punto,

n

, solo debe evaluarse una función,

f

_n, mientras que el método de Newton requiere también la evaluación de

f

_n

′

.

Es importante hacer notar que NO es conveniente rescribir estas expresiones en la forma:

(

)

(

1

)

1 1

1

− − −

+

=

⋅

₋

−

⋅

n n

n n n n n

f

x

f

x

ya que con esta última expresión pueden introducirse fuertes errores numéricos cuando 1

−

≈

n

x

y

f

n

⋅

f

n−1

>

0

.

En la tabla siguiente se resuelve

_f

(

_x

)

=

1₄

_x

2

−

sen(

_x

)

_para

_x

≈

₂

_{por el método de la}

(5)

n

x

_n

f

( )

x

_n

ε

_n

=

x

_n

−

x

0 1. -0.59147 -0.93

1 2. 0.090703 0.066

2 1.86704 -0.084980 -0.067

3 1.93135 -0.003177 -0.0024

4 1.93384 -0.000114 +0.00009

5 1.93375 -0.000005

<

1₂

⋅

₁₀

−5

(en la gráfica adjunta casi no se aprecia la diferencia entre la función y la secante).

La convergencia de método de la secante es en general más lenta que la del método de Newton. Sin embargo, se justifica usar este método si la evaluación de

f

′

( )

x

requiere más del 44% del trabajo que se emplea en evaluar

f

( )

x

, ya que el mayor número de iteraciones queda más que compensado por el menor número de operaciones realizadas en cada caso. A esta conclusión se llega comparando la convergencia de ambos métodos. Para el método de la secante:













−

=

−

=

−

− − +

+

1 1 1

1

n n

n n n n n n n

f

x

ε

y siendo:

( ) ( )

=

+

′

( )

+

′′

( )

+

K

=

f

x

f

x

f

x

f

x

f

n n n n

2 2 1

ε

se obtiene (despreciando términos de orden superior):

(

)

(

)

(

−

)

′

+

(

−

)

′′

+

=

−

+

′′

+

′

+

=

− −

− +

L

K

)

(

)

(

)

(

)

(

2 1 2

1 1

1 2

2 1

1

x

f

x

f

x

f

x

f

n n n

n

n n n

n n

n

ε

(

)

(

)

2

1

)

(

)

(

)

(

)

(

2 ₂1 ₁

2

1

′′

+

_K

′

+

′′

+

_K

+

′

+

=

ε

n

ε

n

f

x

ε

n

f

x

f

x

ε

n

ε

n−

f

x

1 2

1 1

)

(

)

(

− +

≈

_′

′′

∴

n n n

x

f

x

f

_ε

ε

Suponiendo entonces:

ε

n+1

=

C

ε

nβ y por lo tanto 1

(

1

)

1 1

1

2

1

2

− − −

+

=

n

=

_′

′′

n n

n

C

f

C

ε

β β β _{, de}

donde se obtiene:

₁

(

₁

₅

)

₁

_.

₆₁₈

K

2 1

2

=

β

+

→

β

=

+

=

β

Es decir, la convergencia del

método de la secante es entre lineal y cuadrática. -0.25

0 0.25

1.75 2

(6)

En el método de Falsa Posición la secante se toma entre los puntos

(

x ,

_n

f

_n

)

y

(

x ,

_r

f

_r

)

, donde

r

<

n

es el mayor índice para el cual

f

n

f

r

<

0

. Si

f

( )

x

es continuo, este

método es siempre convergente. Sin embargo, la convergencia es de primer orden.

Otra alternativa es el método de Steffensen:

( )

n n n

n

x

g

x

f

x

₊₁

=

−

donde:

( )

(

( )

) ( )

( )

n n n

n n

x

f

x

f

x

f

x

f

x

g

=

+

−

cuya convergencia es de segundo orden: ₁

( )

(

1 ( )

)

2

)

(

2

1

n

f

x

f

x

f

_ε

ε

+

′

′′

≈

+

4.5. Otros Métodos Iterativos

Una ecuación de la forma

f

( )

x

=

0

puede rescribirse como

x

=

g

(x

)

. Dada entonces una aproximación

x

₀ a una raíz

x

de

f

( )

x

=

0

, la secuencia

_,

L

3 2 1

x

definida por:

( )

n n

g

x

₊₁

=

converge a

x

siempre que

g

′

( )

x

<

1

en la región de interés. El procedimiento puede ser más simple que otros y en algunos casos puede incluso converger más rápidamente.

Por ejemplo, la ecuación:

0

1 tg

)

2 (

)

(

x

=

−

x

−

=

f

es equivalente a

ctg

x

=

(

2 −

x

)

. En este caso podría iterarse con

ctg

x

_n₊1

=

2 −

x

_n o, lo

que es lo mismo,

x

_n₊₁

=

arc

ctg

(

2 −

x

_n

)

. Sin embargo, la iteración escrita al revés, es decir

x

_n+1

=

2 −

ctg

x

_n, no funciona.

En efecto, tomando

x

₀

=

0

e iterando con

ctg

x

_n₊₁

=

2 −

x

_n se obtienen:

n

x

n

0 0.

1 0.464

2 0.577

3 0.6125

4 0.6245

5 0.6286

6 0.6301

...

10 0.6308017

...

20 0.630812760

Una interpretación gráfica del proceso se muestra en la figura. En lo que sigue se analiza cómo se reducen los errores en este caso. Si se considera

x

_n

=

x

+

ε

_n

1

1 +

+

=

+

ε

n

x

se tiene que

ctg

(

x

+

ε

_n₊1

)

=

2 −

(

x

+

ε

_n

)

-0.5

0 0.5 1 1.5 2

-0.5 0 0.5 1 1.5 2 2.5

x y(x)

ctg x

(7)

Suponiendo que

ε

_n₊₁

<<

x

puede hacerse una expansión de la cotangente en series:

( )

n

(

)

n

x

O

x

−

ε

+

ε

₊

=

2 −

−

ε

sen

ctg

₂1 2 ₁

y siendo

x

la solución exacta, ésta satisface idénticamente la ecuación:

ctg

x

=

(

2 −

x

)

; de donde se concluye que:

(

)

n n

n

≈

x

ε

≈

ε

+ 3

1 2

1

sen

es decir

ε

_n₊₁

<

ε

_n y por lo tanto el proceso es convergente.

Si en cambio se considera la iteración

x

_n+1

=

2 −

ctg

x

_n se tiene que

ε

n+1

≈

3 ε

n y el

proceso no converge, aún cuando

x

₀ sea muy cercano a la raíz x

:

n

x

n

0 0.6

1 0.538

2 0.325

3 0.965

4 2.69

5 4.01

4.6. Condicionamiento de las Raíces: Raíces Múltiples

Si

x

_n es una aproximación a una raíz

x

de

f

(

x

)

=

0

, se tiene:

( )

_x

=

_f

( ) (

_x

+

_x

−

_x

) ( ) (

_f

′

_x

+

_x

−

_x

) ( )

_f

′′

_x

+

K

f

_n _n ₂1 _n 2

Para x_n ≈x puede escribirse:

( )

x

f

x

f

x

n n

′

≈

−

Si el error en la evaluación de

f

(

x

n

)

es de

O

( )

δ

(

δ

depende de la precisión de la

computadora y es independiente de

x

) el error en la aproximación de la raíz

x

_n

−

x

es

de

( )













′

δ

x

f

O

. Entonces, si

f

′

( )

x

es muy pequeño se tiene que

( )

>>

δ

′

δ

x

f

y se dice

que la raíz

x

está mal condicionada.

El mismo argumento puede repetirse cuando se trata de una raíz de multiplicidad

m

, caso en el que::

( )

₍

₎

₀

)

(

)

(

=

′′

=

1

=

′

_x

_f

_x

_f

−

_x

f

K

m _.

En tal caso:

( )

_{( )}

m m n

x

f

m

x

O

1

!













_δ

_⋅

=

−

(8)

Considérese por ejemplo:

f

( )

x

=

x

2

−

2 x

+

1 =

0

, que tiene una raíz doble

x

=

1

. Supóngase que se trabaja con aritmética de punto flotante y 8 decimales en la mantisa. Entonces

δ

=

1₂

⋅

₁₀

−8_{, y siendo}

_f

′′

( )

_x

=

₂

_{se obtiene:}

(

)

1₂ 4 4

2 2 8 2

1

₁₀

₀

_.

₇₀₇₁

₁₀

2

10

−

⋅

=

⋅

−

=

−

⋅

=

−

_x

_O

K

x

_n

es decir, cualquier valor en el rango: 0,99992929 ≤x≤ 1,00007071 sería aceptado como exacto, pudiéndose tener un error relativo de orden

10

−5.

-1 -0.5 0 0.5 1

0 1 2 3 4 5

x p(x)

Siendo las raíces múltiples mal condicionadas, es de esperarse que la separación relativa de las raíces afecte el condicionamiento. Particularmente crítico es el caso en que las raíces están más o menos uniformemente espaciadas, por ejemplo en:

( ) (

=

−

1 )(

−

2 )(

−

3 ) (

−

20 )

=

20

−

210

19

+

20615

18

−

+

20 !

=

0 ρ

_x

L

_x

L

Si en lugar del coeficiente 210 se tuviera un coeficiente (210 + ε), se obtendrían las raíces:

0 =

ε

9

10

−

=

ε

1

a

10

1

a

10

11

10 .

85

12

13

i

11 .

0

38 .

12 ±

14

15

i

72 .

0

37 .

14 ±

16

17

i

88 .

0

57 .

16 ±

18

19

i

35 .

0

67 .

18 ±

20

Este ejemplo es particularmente mal condicionado, pero son frecuentes las dificultades análogas al evaluar los ceros (es decir, las raíces) de polinomios. La evaluación de las raíces de un polinomio es un problema numérico que debe evitarse, a menos que los datos iniciales hayan sido los coeficientes del polinomio en forma explícita.

Raíz bien condicionada

(9)

Aparte de un mal condicionamiento, las raíces múltiples reducen el orden de la convergencia. Así, por ejemplo, el método de Newton, cuya convergencia es cuadrática cuando

x

_n es aproximadamente una raíz simple:

( )













ε

′

′′

=

ε

+1 2

2

1

n n

x

f

x

f

tiene convergencia lineal cuando la raíz es múltiple. Para una raíz de multiplicidad

m

:

( )

1

( )

2

1

m n n

n

=

−

ε

+

O

ε

+

El método de Newton modificado:

( )

n n n

n

x

f

x

f

m

x

′

−

=

+1

tiene todavía convergencia cuadrática, pero en general no es posible conocer

m

a priori. Alternativamente, puede pensarse en procesos del tipo:

( )

_{( )}

n n n

x

f

x

f

x

u

′

=

( )

_{( ) ( )}

( )

n n n

n

u

x

f

x

f

x

u

′

′′

−

=

′

1 ( )

( )

n n n

n

x

u

x

u

x

′

−

=

+1

Pero nótese que esto es poco efectivo cuando la raíz es simple, puesto que se requiere evaluar una función adicional,

f

′′

( )

x

_n .

4.7. Métodos para Calcular Raíces de Polinomios

En esta sección se revisan algunos de los muchos métodos específicos para evaluar las raíces (ceros) de polinomios:

ρ

( )

x

=

x

n

+

a

₁

x

n−1

+

a

₂

x

n−2

+

K

+

a

_n₋₁

x

+

a

_n

=

0 (

x

−

α

1

)(

x

−

α

2

)(

x

−

α

3

) (

K

x

−

α

n

)

=

0

Es frecuente subestimar las dificultades que se presentan en problemas de este tipo. Los métodos mencionados en los acápites anteriores (Newton, secante y otros) son también aquí aplicables, aunque pueden ser poco eficientes.

4.7.1 Método de Bernoulli

Este es un proceso "clásico", que en general resulta poco apropiado, porque se obtiene primero la raíz de mayor módulo.

Se toman

n

valores arbitrarios

t

L

t

_n

3 2

1

,

(con tn ≠0) y se calculan nuevos valores por

recursión:

∑

= −

−

=

n

i

i p i

p

a

t

1

(10)

p n n p

p

c

r

c

r

c

r

t

=

+

K

+

2 2 1 1

Las

r

i son raíces (distintas de cero) de:

( )

∑

=

−

=

n

i

i n i

n

_a

_r

r

1

es decir, las

r

i son las raíces del polinomio:

r

i

=

α

i.

Por tanto:

p n n p

p

c

t

=

α

+

α

+

K

+

α

2 2 1 1

y si

α

>

α

₋₁

≥

K

≥

α

₁

n

n se tiene que:

n

t

Lim

=

α

− ρ

ρ ∞ → ρ

1 _.

Esto es análogo a una iteración directa para determinar un valor propio de una matriz. También aquí la convergencia es lenta cuando

α

_n

≈

α

_n₋₁ . El proceso converge a αn,

aún cuando

c

n

=

0

(gracias a los errores de redondeo). El inconveniente principal de

este método es que extrae primero la raíz de mayor módulo y la "deflación" con esta raíz (que no es exacta) puede introducir errores importantes en las otras raíces.

Supóngase, por ejemplo, que:

( )

x

=

x

4

−

2 x

3

+

1 .

25 x

2

−

0 .

25 x

−

0 .

75 f

_.

Con

t

0

=

t

1

=

t

2

=

0

y

t

3

=

1

se obtienen:

k

t

k _n

k k

t t

α ≈

−1

4 2.0 2.0

5 2.75 1.375

6 3.25 1.1818

7 4.3125 1.3269

8 6.7500 1.5652

9 10.9844 1.6273

10 17.0469 1.5519

...

15 125.113 1.5104

16 188.240 1.5046

...

19 632.809 1.4986

20 949497 1.5004

(11)

4.7.2. Método de Graeffe (método de los cuadrados de las raíces)

Este es un proceso que puede ser empleado para mejorar el condicionamiento de las raíces, pero es inadecuado para completar la extracción de las mismas.

Dado:

p

₁

( )

x

=

x

n

+

a

₁

x

n−1

+

a

₂

x

n−2

+

K

+

a

_n₋₁

x

+

a

_n

=

0

O bien:

p

₁

(

x

)

=

(

x

−

α

₁

)(

x

−

α

₂

)(

x

−

α

₃

) (

K

x

−

α

_n

)

=

0

_.

Puede formarse un nuevo polinomio

( ) ( ) ( ) ( )

x

1

n

p

₁

x

p

₁

x

(

x

2

α

₁2

)

(

x

2

α

₂2

)

(

x

2

α

₃2

)

(

x

2

α

_n2

)

φ

=

−

=

−

L

−

_.

Como

φ

( )

x

solo contiene potencias pares de

x

, se puede definir:

( )

(

)

(

)

(

32

)

(

2

)

2 2 2

1

2

x

n

p

=

φ

=

−

α

−

α

−

α

K

−

α

Es decir,

p

₂

( )

x

=

0

tiene raíces

α

₁2

L

α

2_i

L

α

_n2_{, que son justamente los cuadrados de}

las raíces de

p

1

( )

x

=

0

. Del mismo modo pueden obtenerse

p

4

( ) ( )

x

p

8

x

L

p

m

( )

x

. Las

raíces de

p

_m

( )

x

=

0

, son las

α

_imdonde

m

=

2

r. Si se tienen coeficientes ( )

L

3 ) ( 2 ) ( 1

,

r r r

a

tales que:

( )

( ) ( ) ( ) ( )

0

1 2

2 1

1

+

=

+

=

− − ₋ r

n r n n

r n

m

x

a

x

a

x

a

x

a

p

K

los coeficientes

a

1 (r+1)

, ( 1)

L

3 ) 1 ( 2

,

+

+ r

r

_a

a

de

p

₂_m

( )

x

resultan:

( )

_{( )}

( ) ( )













−

+

−

=

∑

−

= + −

−

+ min( ,)

1 2

1

₍

₁

₎

₂

₁

i i n

j

r j i r

j i j r

i i n r

i

a

Y para

m

(o

r

) suficientemente grande, puede escribirse:

( )r m

a

₁

1

≈

α

( )_{( )}

K

r r m

a

1 2 2

≈

α

_{( )}( )_r

k r k m k

a

1

−

≈

α

Estas expresiones permiten, en teoría, determinar los valores absolutos de las raíces. Los signos deben obtenerse por sustitución en el polinomio original

p

( )

x

=

0

.

Por ejemplo, considérese el polinomio

p

( )

x

=

x

3

−

6 x

2

+

11 x

−

6

(cuyas raíces 1, 2, 3 están uniformemente espaciadas y por tanto están mal condicionadas):

r

m

a

1

a

2

a

3

0 1 -6. 11. -6.

1 2 -14. 49. -36.

2 4 -98. 1393. -1296.

3 8 -6818.2 1.6864 x 106 -1.6796 x 106 4 16 -4.3112 x 107 2.8212 x 1012 -2.8212 x 1012 ....

de donde

α

₁16

≈

4 .

3112

⋅

10

7

4 7

12 16

2

6 .

5438

10

10 4.3112

10 2.8212

⋅

=

⋅

≈

(12)

99998

.

0

10 2.8212

10 2.8211

12 12 16

3

=

⋅

≈

α

es decir

α

1

≈

3 .

0003

α

2

≈

1 .

9998

α

3

≈

1 .

0000

Las raíces de

_p

( ) ( ) ( )

_x

_p

_x

_p

_x

L

8 4

2 están mejor condicionadas en cada paso. Sin embargo, se observa un crecimiento muy rápido de los coeficientes (posible "overflow") por lo que no pueden realizarse muchos pasos.

4.7.3. Método de Laguerre

Un muy buen método para extraer raíces de polinomios es el de Laguerre. En este método, las sucesivas aproximaciones a una raíz se calculan mediante:

)

(

)

(

)

(

1

k k

k

x

H

x

p

x

p

n

x

±

′

−

=

+

donde

n

es el grado del polinomio y:

(

1 ) (

[

1 )(

(

)

(

)

(

)

]

)

(

x

_k

n

p

x

_k 2

n

p

x

_k

p

x

_k

H

=

−

′

−

′′

Como en otros casos, debe considerarse el signo que evita la cancelación, es decir, aquel para el que

x

_k₊₁

−

x

_k resulta lo más pequeño posible.

El método de Laguerre requiere evaluar

p

( )

x

_k ,

p

′

( )

x

_k y

p

′′

( )

x

_k en cada paso, pero la convergencia (para raíces simples) es cúbica. Si las raíces son reales, este método converge siempre. Suponiendo que la aproximación inicial

x

₀ esté en el intervalo entre

r

α

y

α

_r₊₁, converge a una de esas dos raíces. Si en cambio

x

₀

<

α

₁ o

x

0

>

α

_n el proceso converge a

α

₁ o

α

_n, respectivamente.

Por ejemplo, considérese el polinomio:

( ) (

)(

)

0 40320

109584

118124

67284

22449

4536

546

36

8

7

6

5

4

3

2

1

2 3

4 5

6 7

8

₋

₊

₋

₊

₋

₊

₋

₊

₌

=

−

=

x

p

Con la aproximación inicial

x

0

=

0

se obtienen:

k

x

p

( )

x

k

p

′

( )

x

k

p

′′

( )

x

k

H

( )

x

k

0 40320 -109584 236248 5.499492E+10

0.937418 369.916 -6836.714 31394.812 1.639940E+09

0.999940 0.302 -5041.569 26140.729 1.245010E+09

1.000000

En forma similar, con la aproximación inicial

x

0

=

2 .

5

:

k

x

p

( )

x

k

p

′

( )

x

k

p

′′

( )

x

k

H

( )

x

k

2.5 121.816 -132.750 -977.625 7.532588E+06

2.838696 42.391 -277.131 60.892 3.618725E+06

2.994301 1.374 -242.118 367.294 2.844179E+06

3.000000

(13)

pero los coeficientes del polinomio fueran todos reales, sería aconsejable extraer factores cuadráticos con el procedimiento descrito en la sección 4.7.4

4.7.4. Método de Bairstow (factorización iterativa de polinomios).

Un polinomio

p

( )

x

=

x

n

+

a

₁

x

n−1

+

a

₂

x

n−2

+

K

+

a

_n₋₁

x

+

a

_n_{puede expresarse como:}

( )

x =

(

x2+rx+s

)

⋅q

(

x,r,s

)

+xF

( ) ( )

r,s +Gr,s

ρ _.

Se requiere determinar

r

,

s

para que

x

2

+

rx

+

s

sea un factor exacto de

p

( )

x

, es decir, para que se tenga

F

( )

r

,

s

=

G

( )

r

,

s

=

0

. Siendo éste el caso, dos de las raíces (o un par de raíces complejas) pueden obtenerse de

x

2

+

rx

+

s

=

0

; el resto de las raíces son los ceros de

q

( )

x

. Dados valores aproximados de

r

,

s

tales como

r

_n y

s

_n, se obtienen valores mejorados,

r

_n₊₁ y

s

_n₊₁, considerando:

(

,

) (

,

) (

)

(

)

0

, 1

1

1 +

≈

+

−

+

−

≈

+

n s n r n n

n s n r n n n n n

n

ds

dF

s

dr

dF

r

s

r

F

s

r

F

(

,

) (

,

) (

)

(

)

0

, 1

1

1 +

≈

+

−

+

−

≈

+

n s n r n n n s n r n n n n n

n

ds

dG

s

dr

dG

r

s

r

G

s

r

G

de donde, con la notación

ds

dG

G

dr

dF

F

_r

=

L

_s

=

_{, se tiene:}

n s n r r s s r

s s

n n

G

F

G

F

G

F

G

r

,

1













−

⋅

−

⋅

−

=

+

n s n r r s s r

r r

n n

G

F

G

F

G

F

G

s

,

1













−

⋅

−

⋅

−

=

+

Dado que el polinomio original

p

( )

x

es independiente de

r

y

s

, al derivar el polinomio

( )

x

(

x

rx

s

)

q

xF

G

p

=

2

+

⋅

+

con relación a

r

y

s

se obtienen:

(

2

+

)

⋅

+

(

+

)

=

0 +

x

rx

s

q

r

xF

r

G

r

xq

(

2

+

)

⋅

+

(

+

)

=

0 +

x

rx

s

q

s

xF

s

G

s

q

es decir, los

F

_r y

G

_r son los coeficientes del residuo al dividir

−

x

q

( )

x

entre

s

rx

x

2

+

mientras los

F

_s y

G

_s se obtienen como coeficientes del residuo al dividir

( )

x

q

−

también entre

x

2

+

rx

+

s

.

La convergencia de este proceso depende de una buena aproximación inicial.

El siguiente ejemplo ilustra un paso del proceso. Supóngase que se tiene el polinomio:

( )

x

=

x

4

−

5 x

3

+

14 x

2

−

25 x

+

25 =

0 p

y un factor aproximado

x

2

−

4 x

+

4

(es decir

r

o

=

−

4

,

s

0

=

+

4

). Dividiendo

p

( )

x

entre este factor (utilizando el procedimiento de Ruffini) se obtiene:

( )

x

p

1 -5 14 -25 25

4

0

=

−

r

4 -4 24

4

0

=

−

(14)

Y análogamente:

-xq(x)

-1 1 -6 0

4 -4 -12

-4 4 12

-1 -3 -14 12

-q(x)

-1 1 -6

4 -4

-4 4

-1 -3 -2

y de estos resultados:

1

3 =

=

G

F

12

14

, ,

=

−

=

r r

G

F

2

3

, ,

−

=

−

=

r r

G

F

64 =

⋅

−

⋅

=

F

r

G

s

F

s

G

r

w

( )( ) ( )( )

_4.0469

64

2

3

1

4

1

=

−

=

r

( )( ) ( )( )

_4.7813

64

12

3

14

1

4

1

=

−

=

s

es decir:

x

2

+

r

₁

x

+

s

₁

=

x

2

−

4.0469

x

+

4.7813

En el siguiente paso se obtienen:

2547

.

1 =

F

G

=

−

0 .

6350

1003

.

13 −

=

r

F

G

_r

=

14 .

7920

0938

.

3 −

=

s

F

G

s

=

−

0 .

5803

de donde

r

₂

=

−

4 .

0973

,

s

₂

=

4 .

9732

. El factor exacto es

x

2

−

4 x

+

5

.

El método antes descrito es adecuado solo si la aproximación inicial es cercana al factor exacto (esto es análogo a lo que ocurre con el método de Newton). Pueden también utilizarse las mismas ideas para separar factores de grado mayor que 2.

4.7.5. Método de Jenkins y Traub

Este proceso tiene algunas similitudes con el método de iteración inversa para hallar vectores característicos. Converge a la raíz de menor módulo (lo que es beneficioso para una "deflación" adecuada; véase la sección 4.7.6) y permite efectuar translaciones para acelerar la convergencia. Es probablemente el mejor de los métodos para extraer raíces de polinomios (pero en algunos casos no es el más eficiente). El algoritmo tiene 3 etapas:

a. Dado el polinomio _i n i

n

i

x

a

x

p

−

=

∑

=

0

)

(

con

a

o

=

1 ,

a

n

≠

0

, se determina:

( )

₍

₎

1

0 0

)

(

)

(

−−

=

∑

−

=

′

=

n i

i n

i

x

a

i

n

x

(15)

y por recursión: ( ) ( ) ( )

_











−

=

+

₍

₎

)

0 (

)

0 (

)

(

1 )

(

1

_p

_x

p

h

x

h

x

h

k k

k

_k

₌

₀

_,

₁

_,

₂

_L

A medida que

k

crece, las razones entre los coeficientes de

h

( )k

(x

)

y aquellos de ( )1

₍

_x

₎

h

k+ tienden a hacerse constantes e iguales a la raíz de menor módulo: ( )

( )1

(

₍

0 ₀

)

₎

1

≈

₊

α

_kk

h

b. En una segunda etapa, con una “translación” fija

s

₀

≈

r

₁, se determinan:

( )

(

)

( ) ( )













−

=

+

₍

₎

)

(

)

(

)

(

1 )

(

0 0 0 1

x

p

s

p

s

h

x

h

s

x

h

k k k

c. Y finalmente se refina la aproximación con translaciones variables en cada paso: ( )

_{( )}

( )

_{( )}

1 1 1

r

s

h

s

h

s

k k k k k

k

=

+

≈

− + ( )

(

)

( ) ( )













−

=

+ + + +

₍

₎

)

(

)

(

)

(

1 )

(

1 1 1 1

x

p

s

p

s

h

x

h

s

x

h

k k k k k k

Cada paso de este método requiere

O

( n

2 )

operaciones.

En lo que sigue se analiza cómo el proceso converge. El polinomio cuyas raíces se buscan puede expresarse en la forma:

( ) (

) (

)

3

0

3 2 2 1

1

−

α

−

α

=

α

−

=

_x

m

_x

m

_x

m

K

x

p

donde

L

3 2 1

,

m

,

m

son las multiplicidades de las raíces.

El método se inicia con

h

( )0

(

x

)

=

p

′

(

x

)

, que es un polinomio de grado

n

−

1 .

Este polinomio puede escribirse en la forma:

( ) ( )

(

)

∑

₋

_α

=

i i

x

p

c

x

h

0

(

)

0

(

)

donde

c

_i( )0

=

m

_i. Puede probarse por inducción que los sucesivos polinomios

( )

_x

_h

( )

_x

_h

( )

_x

L

h

(1) (2) (3) son también polinomios de grado

n

−

1 .

Supóngase que: ( ) ( )

(

)

∑

₋

_α

=

− − i k i k

x

p

c

x

h

1

(

)

1

(

)

Entonces: ( )

(

)

( ) ( )         − − = − − ₍ ₎ ) ( ) ( ) ( 1 ) ( 1 1 x p s p s h x h s x x h k k k k k k

(

)

( )

(

)

( )

(

)

      − − − − =

∑

−

∑

− i k k k i k i k i k s s p c s p x p x x p c s

x α α

) ( ) ( ) ( ) (

1 1 1

( )

(

) (

)

∑

( )

(

)

∑

= ₋ − − = − i k i i k i k i x x p c x x p s c α α α ) ( ) ( 1