Formulación implícita - Discretización temporal

4. PROBLEMA UNIDIMENSIONAL

4.4. Discretización temporal

4.4.3. Formulación implícita

Una limitación importante de los esquemas explícitos es la restricción sobre el incremento del paso (véaseproposición 4.4.A) para asegurar la convergencia del algoritmo. Sin embargo, para el caso de los esquemas implícitos, esta restricción es más débil, pudiendo tener convergencia para incrementos de tiempo grandes.

Un primer paso, para abordar la formulación implícitadel sistema diferencial (4.12) (pág.46) es em- plear el método de Euler implícito o regresivo, que aunque es de primer orden, se caracteriza por su estabilidad al ser L-estable(véase LeVeque [46] o Shampine [83]). Por tanto

Un+1−Un k =A(U n+1₎_Un+1₌_f₍_Un+1₎ es decir: (4.34) Un+1=kA(Un+1)Un+1+Un ⇐⇒ Un+1=kf(Un+1) +Un con lo cual: (4.35) (I −kA(Un+1))Un+1 =Un

que resulta la ecuación matricial no lineal:

(4.36) B(Un+1)Un+1 =Un

con

B(Un+1) =I−kA(Un+1)

La resolución numérica de la ecuación (4.34) o bien (4.35), no es tan directa como en el caso explícito, pues hay que resolver una ecuación algebraica no lineal con la incógnitaUn+1.

LLegado a este punto se puede proceder de dos maneras. Una de ellas es la propuesta por Weickert et al.[103] (véase también Weickert y Benhamouda [102]), que denominaréProcedimiento directo. La otra posibilidad se basa en construir un procedimiento iterativo para resolver la ecuación algebraica no lineal (4.35) o (4.36). A esta alternativa la identificaré con el nombre Procedimiento iterativo. Con ambos procedimientos se va a llegar a las mismas conclusiones.

Procedimiento directo

En este caso, se observa que la matriz I −kA(V) de la ecuación (4.35), tiene unas características interesantes, para todo V ∈ Rm_{. En efecto, debido a la definición de la matriz}_A₍_V₎ ₍_4.10_{) y con la} función de difusividad (3.25), resulta que la matrizI −kA(V) es cuadrada tridiagonal real, con los términos de la diagonal principal positivos, simétrica, estrictamente diagonalmente dominante. Esto implica que esta matriz esdefinida positiva(véase Varga[94, pág. 23corolario 1.22]). Además, puesto que los términos distintos de la diagonal principal son no positivos, hace que se trate de unaMatriz de Stieltjes (véase Varga[94, pág. 91definición 3.23]). Todo ello implica que la inversa es una matriz no negativa(M- Matriz(véase Varga[94, pág. 91definición 3.22]). Pero además, comoI−kA(U)es irreducible, entonces la inversa espositiva(véase Varga[94, pág. 91corolario 3.24]). Esto permite asegurar que la matriz

(I−kA(V))−1

existe y es positiva. Por tanto tiene sentido resolver de una maneradirectala ecuación (4.35) o (4.36). Esto es

Un+1=(I −kA(Un+1))−1Un

Es claro, que se desconoceUn+1, con lo cual es imposible utilizarlo en el segundo miembro de la ecua- ción anterior. Para evitar esta circunstancia se aproxima por el valorUn. Con lo cual quedaría el esquema discreto:

(4.37) Un+1 = (I −kA(Un))−1Un

4.4. Discretización temporal

conocido como el método semi-implícito. Queda por comprobar que este algoritmo, con la función de difusividad propuesta (3.25), cumple con las condiciones (D1), . . . , (D6) para generar un modeloescala- espacio, correspondiente a un proceso de filtrado discreto de una imagen. La demostración de este hecho se realizará en laproposición4.4.E(pág.70). Una ventaja de este procedimiento frente alesquema explíci- to(4.30), está en la no restricción en el incremento de tiempok, para asegurar que elmétodo semi-implícito genera unmodelo de escala-espacio.

Procedimiento iterativo

En este caso se trata de plantear un proceso iterativo que genere una sucesión convergente a la solución de la ecuación algebraica no lineal (4.35) o (4.36). El objetivo de desarrollar esta metodología es buscar una argumentación clara, sobre la razón de utilizar elmétodo semi-implícito(4.37) como esquema para generar un modeloescala-espacio. Me parece interesante afrontar este hecho, pues pueden surgir ciertas dudas a la hora de estudiar la consistencia del método.

Para abordar el planteamiento mediante un procedimiento iterativo, se consideran diferentes alter- nativas para resolver la ecuación algebraica no lineal

(4.38) U∗ =kf(U∗) +Z

que tiene la misma naturaleza que la ecuación (4.34), que quiere resolverse. 1. Iteración del punto fijo

El proceso deIteración de punto fijotrata de buscar la soluciónU∗de (4.38), planteando una nueva ecuación algebraica

(4.39) U∗ =G(U∗) con G(U) =kf(U) +Z

U∗recibe el nombre depunto fijode la funciónG. La idea para obtener la soluciónU∗consiste en construir una sucesión mediante la funciónG

(4.40) Uν+1=G(Uν) ν = 0,1,2. . .

que sea convergente a la soluciónU∗

Definición 4.4.1 Un punto fijoU∗deGes unpunto de atracciónde la iteración (4.40) (o eslocal- mente convergenteaU∗) si existe un entornoS deU∗tal que para todoU0 ∈S la iteración (4.40)

está bien definida y converge aU∗

Un resultado básico sobre la convergencia local del proceso iterativo (4.40) es el Teorema de Os- trowski, cuya demostración puede encontrarse en Ortega [58, pág. 145].

Teorema 4.4.1 [Teorema de Ostrowski]SeaGdiferenciable en el punto fijoU∗y siendo el radio espectral de su matriz jacobiana menor que1, esto es, Rad(∂G

∂U(U∗)

)

<1. EntoncesU∗es un punto de atracción de la iteración(4.40)

El siguiente paso consistiría en construir iteraciones del tipo (4.40) que al menos, sean localmente convergentes. Este resultado presenta una dificultad clara. Hay que evaluar la matriz jacobiana, precisamente en el puntoU∗ que hay que determinar.

2. Iteración funcional

Una primera aproximación a la solución de la ecuación algebraica (4.38) es generar una sucesión de la forma:

Capítulo – 4. PROBLEMA UNIDIMENSIONAL

Sin embargo, este procedimiento puede resultar inútil. En efecto, si considera la diferencia entre ambas ecuaciones para determinar el error se tendría:

µν+1 =Uν+1−U∗=k[f(Uν)−f(U∗)]

Si por un momento, para simplificar el razonamiento,f es lineal, esto esf(U) =JU, entonces la ecuación anterior se transformaría en

µν+1=Uν+1−U∗=k J[Uν −U∗)] =kJµν

Si además el valor inicial U0 es el autovector w del autovalor λ de la matriz J, entonces este proceso iterativo generaría la expresión:

µν+1= (k λ)νw

A la vista de este resultado, es obvio que si |k λ| > 1 la iteración no converge. Para que exista convergencia para cualquier dato inicial, es necesario que|k λ|< 1 para todos los autovaloresλ

deJ.

Este resultado se puede extender a problemas no lineales (véase Ascher y Petzold [3, pág. 53] o bien Shampine [83, pág. 405]). En este caso se impone

_∂∂G_U(U∗)=k ∂f

∂U(U

∗₎_<₁

para poder aplicar elTeorema de Ostrowskiy así obtener la convergencia de la iteración (4.41) (véase Ascher y Petzold [3]). Se observa que para problemas de naturalezastiff orígidos, que están aso- ciados a valores muy grandes de la norma de la matriz jacobiana def (véase LeVeque [46]), este proceso iterativo sería totalmente inapropiado, pues esto requeriría un pasokmuy pequeño para asegurar la convergencia del problema algebraico no lineal.

3. Método de Newton

Otra opción es aplicar elMétodo de Newtonpara resolver la ecuación (4.38), expresada ahora de la forma:

(4.42) q(U) =U−kf(U)−Z =0

teniendo en cuenta el desarrollo de la funciónf en el entorno del valor calculado previamenteUν

q(U) =q(Uν) + ∂q

∂U(U

ν₎₍_U₋_Uν_{) +}_O₍_∥_U₋_Uν_∥2₎

Si U∗ es solución del problema, entonces q(U∗) = 0. Si se desprecian los términos de orden 2

resulta

0=q(U∗)≈q(Uν) + ∂q

∂U(U

ν₎₍_U∗₋_Uν₎ A partir de aquí, se considera la iteración

(4.43) 0=q(Uν) + ∂q

∂U(U

ν₎₍_Uν+1₋_Uν₎ _con _ν_{= 0}_,₁_{, . . .}

con la idea de obtener una sucesión{Uν} convergente a la soluciónU∗. Teniendo en cuenta la ecuación (4.42) resulta ∂q ∂U(U ν_{) =}_I₋_k ∂f ∂U(U ν₎ y sustituyendo en la expresión (4.43) se llega a:

0=q(Uν) + ( I−k∂f ∂U(U ν₎)₍_Uν+1₋_Uν₎ _con _ν _{= 0}_,₁_{, . . .} 64

4.4. Discretización temporal

y esto permite escribir

(4.44) ( I−k∂f ∂U(U ν₎)₍_Uν+1₋_Uν_{) =}₋_q₍_Uν₎ _⇐⇒ ∂q ∂U(U ν_)[_δ_{] =}₋_q₍_Uν₎

siendoδ=Uν+1−Uν y conν= 0,1, . . .Esta expresión también puede reescribirse de la forma

(4.45) Uν+1 =Uν −

(

I−k ∂f

∂U(U

ν₎)−1_q₍_Uν₎ _con _ν _{= 0}_,₁_{, . . .}

Si ahora se define la función

G(Uν) =Uν− (

I−k∂f

∂U(U

ν₎)−1_q₍_Uν₎ entonces el proceso (4.45) se transforma en una iteración de punto fijo (4.40)

Uν+1 =G(Uν) ν = 0,1, . . .

Por tanto, en elmétodo de Newton, es necesario para cada iteración, resolver el sistema (4.44)

∂q ∂U(U ν_)[_δ_{] =}₋_q₍_Uν₎ siendo (4.46) ∂q ∂U(U)≡I−k ∂f ∂U(U)

lamatriz de iteración(véase por ejemplo Shampine [83] o Ascher y Petzold [3]).

Este proceso será posible siempre y cuando estamatriz de iteración sea regular, pudiendo afirmar entonces que

q(U∗) =0 ⇐⇒ U∗ =G(U∗)

A la vista del desarrollo anterior, resulta que elMétodo de Newtones de orden dos y por tanto su convergencia es cuadrática. Sin embargo, es unaconvergencia local, lo que implica que es necesario conocer inicialmente un valor próximo a la solución, para que la convergencia sea eficiente (véase Ortega [58, pág. 148]).

Si ahora se aplica elMétodo de Newtonal problema de la difusión no lineal (4.34), resulta que la ecuación (4.42) se transforma en

q(U) =U−kA(U)U −Un=0

ya que en este casof(U) =A(U)U, siendoA(U)lamatriz de difusividades(4.10). Además, debido a laproposición 4.3.A(pág.51), lamatriz de iteracióntoma la forma

∂q

∂U(U)≡I−k

∂f

∂U(U) =I−k[A(U) +C(U)]

El efecto de la función de difusividad considerada (3.25), sobre estamatriz de iteración, hace que pueda no ser definida positiva o negativa durante el proceso iterativo, y por tanto no sea inverti- ble. Esta circunstancia tiene relación con laObservación establecida en la página53, en la que se relaciona los coeficientes del jacobiano_∂∂_Uf con la funciónρ′′. El valor deρ′′no siempre es negativo. Esto es consecuencia de la función de difusividadg(3.25), que aunque es positiva, es decreciente. Lo que implica que su derivada es negativa. Por tanto, los términos de la subdiagonal y super- diagonal del jacobiano pueden tomar valores positivos y negativos durante el proceso iterativo, lo que implica (por ejemplo, por elTeorema del círculo de Gerschgorin, véase Varga [94] u Ortega [58])

Capítulo – 4. PROBLEMA UNIDIMENSIONAL

que la matriz jacobiana deja de ser definida positiva o negativa, y por tanto no es inversible. Esto lleva a la imposibilidad de considerar el proceso iterativo del tipo (4.45).

Otra manera de argumentar sobre la dificultad de invertir la matriz de iteración es hacer referencia a la proposición 4.3.B (pág.55). En este caso se ha demostrado que si g está definida por (3.25), entonces:

∂f

∂U(U) = (1−p)A(U) con lo cual la matriz de iteración (4.46) queda

∂q

∂U(U) =I−k

∂f

∂U(U) =I−k(1−p)A(U)

comop > 1 entonces queda una matriz que no cumple los requisitos para asegurar que existe

inversa (véase Ortega [58]) durante todo el proceso iterativo.

Se trata, por tanto, de solucionar el inconveniente planteado en elmétodo de Newton. Por ello se considera el estudio de un esquema alternativo para resolver la ecuación algebraica no lineal propuesta (4.35).

Propuesta de un método iterativo alternativo

A la vista de la dificultad encontrada al tratar de aplicar el Método de Newton al problema no lineal (4.35), debido a la posible singularidad de la matriz de iteración, se propone la siguiente aproxima- ción de la matriz de iteración

(4.47) ∂q

∂U (U) =I−k

∂f

∂U(U) =I −kA(U)−kC(U)≈I −kA(U)

este planteamiento es similar almétodo de la rigidez tangencial(véase Hinton y Owen [63] o Reddy [78]) que se emplea en problemas no lineales relacionados de con procesos plásticos en el cálculo estructural. En este caso las incógnitas son, por lo general, desplazamientos espaciales. Se prescinde del término

C(U)≡ ∂A(U)

∂U U

que da lugar a una matriz no simétrica. Este hecho produce una aproximación al problema de forma casi linealya que la matriz que permanece en la formulación esA(U).

Esta idea es la que se pretende trasladar al caso que se quiere resolver. El hecho de considerar la aproximación

(4.48) ∂q

∂U (U) =I−k

∂f

∂U (U)≈I−kA(U)

permite transformar la iteración (4.45) en

(4.49) Uν+1=G(Uν) con Uν+1 =Uν−(I−kA(Uν))−1q(Uν)

o bien por (4.44) en

(I−kA(Uν)) [Uν+1−Uν] =−q(Uν) ⇐⇒ (I−kA(Uν)) [δ] =−q(Uν)

Proposición 4.4.B (Sanguino et al. [82]) SeaA(U), la matriz del sistema de ecuaciones en diferencias(4.35) congdada por(3.25). Entonces

1. la matrizI−kA(U)es definida positiva para cualquier valor deU yk∈R+.

2. por el apartado anterior implica(I−kA(U))−1_{existe, entonces}_∥₍_I₋_k_A₍_U₎₎−1_∥1_{= 1} 66

4.4. Discretización temporal

Demostración:

1. Los coeficientes de la matrizI−kA(U)se generan a partir de los coeficientes de la matrizA(U(t))para cada tiempotfijo. Entonces teniendo en cuenta (4.13) y (4.14) se obtienen los siguientes coeficientes para I−kA(U) wi i= 1−kai i = 1 + k h2 (gi−1+gi) (4.50a) wi i−1=−kai i−1 = − k h2 gi−1 (4.50b) wi i+1=−kai i−1 = − k h2 gi (4.50c)

conn= 2, . . . , m−1y además por las condiciones de contorno tipo Neumann

w1 1= 1−ka1 1 = 1 + k h2g1 (4.51a) wm m= 1−kam m = 1 + k h2gm−1 (4.51b)

Debido a la naturaleza deg, resulta que la matrizI−kA(U)es cuadrada tridiagonal real, con los tér- minos de la diagonal principal positivos, simétrica, estrictamente diagonalmente dominante. Esto implica que esta matriz esdefinida positiva(véase Varga[94, pág. 23corolario 1.22]). Además, puesto que los térmi- nos distintos de la diagonal principal son no positivos hace que se trate de unaMatriz de Stieltjes(véase Varga[94, pág. 91definición 3.23]). Todo ello implica quela inversa es una matriz no negativa(M-Matriz(véa- se Varga[94, pág. 91definición 3.22]). Pero además, comoI−kA(U)es irreducible, entonces la inversa es positiva(véase Varga[94, pág. 91corolario 3.24]).

Puesto que en el razonamiento no se han impuesto condiciones sobre el argumentoU y el valor positivo

k, se cumple para cualesquiera de estos valores.

2. A la vista de la definición de la matrizA(U)es inmediato comprobar que si

[V]t= [1,1, . . . ,1]

entonces se cumple que

[V]t[kA(U)] = [0]t

o bien que

[V]t[I−kA(U)] = [V]t

por tanto

[V]t[I−kA(U)]−1= [V]t

Debido a queI−kA(U), tal y como se ha visto en el primer apartado es unaM-matriz(véase por ejemplo, Ortega [58, pág. 108]), resulta por definición que[I−kA(U)]−1>O(es decir, todos sus términos son no negativos). Así pues, si se identifican por[eij]los coeficientes de la matriz[I−kA(U)]−1entonces

[V]t[I−kA(U)]−1= [_m ∑ i=1 ei1, m ∑ i=1 ei2, . . . , m ∑ i=1 ei m ] = [_m ∑ i=1 |ei1|, m ∑ i=1 |ei2|, . . . , m ∑ i=1 |ei m| ] = [1,1, . . . ,1] =⇒ =⇒m´ax j m ∑ i=1 |ei j|= 1 =[I−kA(U)]−1₁ (4.52)

y análogamente para la∥ · ∥∞, pues la matriz es simétrica.

Así pues, el esquema (4.49), tiene sentido operacional, pues tal y como se ha visto, se puede calcular la matriz(I−kA(U))−1. Sin embargo, resulta también interesante plantear el proceso iterativo (4.49) desde otro punto de vista. La idea es sustituir la funciónqpor su definición (4.42).

Proposición 4.4.C (Sanguino et al. [82]) Si q(U) = U −kf(U)−Z, como ya se ha definido en (4.42), entonces el proceso iterativo(4.49)es equivalente al esquema

(4.53) Uν+1 = [I−kA(Uν)]−1[Z] ν= 0,1,2, . . .

y además se cumple que

Capítulo – 4. PROBLEMA UNIDIMENSIONAL

Demostración:

La prueba es inmediata. La definición deq(4.42), sabiendo que f(U) =A(U)[U]

se sustituye en (4.49) y se obtiene

Uν+1=Uν−(I−kA(Uν))−1( (I−kA(Uν)) [Uν]−Z) = (I−kA(Uν))−1[Z]

conν= 0,1, . . .y siendoU0 ₌_Z

un vector inicial dado. Además, teniendo en cuenta (4.52) y las propiedades de las normas resulta

∥Uν+1∥16[I−kA(Uν)]−1 1∥

Z∥1=∥Z∥1 ν= 0,1,2, . . .

El esquema iterativo (4.53) que es del tipo (4.40) recibe el nombre deMétodo de iteración directao Método de las aproximaciones sucesivaso también elMétodo de Picard(véase por ejemplo Hinton y Owen [63] o Reddy [78]).

Queda por probar que el esquema (4.53) es en efecto, convergente. La idea es aplicar elTeorema del punto fijo(véase Ortega y Rheinboldt [59, pág. 161]).

Proposición 4.4.D El esquema iterativo(4.53)da lugar a un proceso convergente depunto fijo. Demostración:

Sea el conjunto acotado, similar al considerado en la demostración de laproposición 4.3.CCondición (S1) (pág.57)

Υ ={U ∈Rm/ ∥U∥16K} para cierto K∈R+

Claramente es un conjuntoacotadoy cerradodebido a que la norma es una función continua. Además es un conjuntoconvexo. En efecto: seanU,V ∈Υentonces

∥αU+ (1−α)V∥1= n ∑ i=1 |α Ui+ (1−α)Vi|=α n ∑ i=1 Ui+ (1−α) n ∑ i=1 Vi =α∥U∥1+ (1−α)∥V∥16α K+ (1−α)K=K

Así pues,Υes un conjuntocompacto y convexoenRm

. SeaZun elemento dado (fijo) deΥy sea T(U)≡I−kA(U)

entonces se define la función enΥ

G(U) = [I−kA(U)]−1[Z]≡T−1(U)Z Puede probarse queGes continua. En efecto: seanU,V ∈Υ

G(U)−G(V) =T−1(U)Z−T−1(V)Z =[T−1(U)T(V)T−1(V)−T−1(U)T(U)T−1(V)]Z =[T−1(U)T(V)−T−1(U)T(U)]T−1(V)Z =T−1(U) [T(V)−T(U)]T−1(V)Z =T−1(U) [I−kA(V)−I+kA(U)]T−1(V)Z =T−1(U) [kA(U)−kA(V)]T−1(V)Z De esta manera se tiene:

∥G(U)−G(V)∥16k∥T−1(U)∥1 ∥A(U)−A(V)∥1∥T−1(V)∥1∥Z∥1

Por laproposición4.4.B(pág.66) se sabe que:

∥T−1(U)∥1=∥T−1(V)∥1= 1

si además se aplica laproposición4.3.C(condición (S1)) (pág.57), resulta

(4.54) ∥G(U)−G(V)∥1 6 k∥A(U)−A(V)∥1∥Z∥16k M∥Z∥1∥U−V∥16k M K∥U−V∥1

4.4. Discretización temporal

que permite establecer queGes continua enΥ.

Por otra parte, se ha visto en la demostración deproposición4.4.BqueT−1₍_U₎_Z _>_O

(esto es, que todos sus términos son no negativos). Lo cual implica que si[e]t= [1,1, . . . ,1], entonces por (4.52) se tiene

∥G(U)∥1 =etG(U) =etT−1(U)Z=∥T−1(U)Z∥1 6∥T−1(U)∥1 ∥Z∥1= ∥Z∥1 6K

Así pues,Gcumple

G(Υ)⊂Υ

Como además se ha visto queΥes un conjuntocompactoyconvexo, por elTeorema del Punto fijo de Brouwer(véase Ortega y Rheinboldt [59, pág. 161]) se sigue queG(U)tiene un punto fijo:U∗enΥ.

Este resultado es importante, porque sin imponer ninguna restricción al parámetrok= ∆tse puede afirmar que el proceso iterativo (4.53):

Uν+1=G(Uν) = [I−kA(Uν)]−1[Z] ν= 0,1,2, . . .

es convergente enΥ.

Una cuestión adicional, que en principio no se considera en este trabajo, es sobre la unicidad de la solución. Para ello es necesario imponer la condición adicional sobreGde sercontractiva(véase Ortega y Rheinboldt [59, pág. 120]). El hecho de considerar esta situación, no aporta ningún elemento importante sobre el razonamiento que se desarrolla y por tanto no se plantea.

In document Estudio y desarrollo de un preproceso basado en la difusión no lineal para la segmentación en imágenes (página 72-79)