El m´
etodo de las caracter´
ısticas aleatorias:
Notas de clase
Rafael Granero Belinch´
on
122 de marzo de 2011
Resumen
En estas clases estudiaremos la teor´ıa de existencia y unicidad para las Ecuaciones Dife-renciales Estoc´asticas (ordinarias) y sus aplicaciones a las Ecuaciones en Derivadas Parciales. En concreto estudiaremos una generalizaci´on del m´etodo de las caracter´ısticas. Estos apuntes son autocontenidos en la medida de lo posible, por lo que el lector que est´e en apuros con la probabilidad puede consultar facilmente los teoremas necesarios en los ap´endices.
´
Indice
1. Introducci´on 2
I
Bases de Procesos y Ecuaciones estoc´
asticas
6
2. Volvamos al movimiento browniano 6
3. Existencia y unicidad para las ecuaciones estoc´asticas 10
4. La medida de Wiener 14
II
Teor´ıa para las ecuaciones lineales
17
5. Problemas Parab´olicos 18
5.1. La ecuaci´on del calor . . . 18
5.2. Ecuaciones parab´olicas generales . . . 19
6. Problemas El´ıpticos 26
6.1. La ecuaci´on de Poisson. . . 26
6.2. Ecuaciones el´ıpticas generales . . . 30
III
Aplicaciones
31
7. Aplicaciones a las ecuaciones de los flu´ıdos 31
7.1. La ecuaci´on de Burgers . . . 32
1
Email: [email protected],
Consejo Superior de Investigaciones Cient´ıficas,
Instituto de Ciencias Matem´aticas (CSIC-UAM-UC3M-UCM) C/ Nicol´as Cabrera, 13-15
Campus de Cantoblanco, 28049 - Madrid
8. Aplicaciones al C´alculo Num´erico 33
A. La f´ormula de Itˆo 34
B. La integral de Itˆo 37
1.
Introducci´
on
En la f´ısica, sin entrar demasiado en los detalles, hay dos tipos de fen´omenos principales, los difusivos y los conservativos. Dichos fen´omenos se corresponden con dos tipos bien diferenciados de ecuaciones en derivadas parciales, las parab´olicas (ecuaci´on del calor) y las hiperb´olicas (ecuaci´on de ondas) respectivamente. Las ecuaciones el´ıpticas (ecuaci´on de Poisson) pueden verse como el caso estacionario de ambos fen´omenos. Los comportamientos de dos ecuaciones de distinto tipo son bien distintos, as´ı como los m´etodos usuales para tratarlas.
Consideremos N part´ıculas de masa unidad de un gas ideal con choques perfectamente el´asticos evolucionando seg´un las leyes de Newton en ausencia de fuerzas externas. Es decir, si xi(t) y vi(t)
son las posici´on y la velocidad de la part´ıcula i en el tiempo t > 0 se tiene d
dtxi= vi, d
dtvi= 0, i = 1, ...N. (1)
Consideremos ahora f (x, v, t) la funci´on de densidad de las part´ıculas.1Se tiene que dicha densidad
evoluciona seg´un la ecuaci´on de Boltzmann d
dtf (x, v, t) = ∂tf (x, v, t) + ∇xf (x, v, t) · v + ∇vf (x, v, t) · d dtv
= ∂tf (x, v, t) + ∇xf (x, v, t) · v = C, (2)
con C el t´ermino de colisi´on. Este t´ermino en la distribuci´on de equilibrio ser´a 0.
Si ahora nos preguntamos por las curvas caracter´ısticas de la ecuaci´on (2), las cuales conocemos bien por ser esta ecuaci´on de primer orden, obtenemos las ecuaciones diferenciales ordinarias de (1).
Dado que en este modelo no podemos perder part´ıculas ni velocidad, estamos frente a un modelo conservativo. Ese es el motivo por el que la ecuaci´on en derivadas parciales que aparece es de tipo hiperb´olico. Observamos que para el problema de la evoluci´on de N part´ıculas de un gas ideal el m´etodo de las caracter´ısticas hace equivalentes ambos enfoques, el microsc´opico, representado por las ecuaciones diferenciales ordinarias, y el mesosc´opico, encarnado en la ecuaci´on en derivadas parciales (2).
Consideremos ahora una part´ıcula de masa unidad que se encuentra inmersa en un flu´ıdo en reposo de manera que sufre constantemente choques con las part´ıculas del flu´ıdo. Que el flu´ıdo est´e en reposo es importante para el tipo de choques que se dar´an, que en este caso ser´an igual de numerosos en todas direcciones. Sin embargo, si el flu´ıdo se moviese r´apidamente en una direcci´on determinada nuestra part´ıcula sufrir´ıa m´as choques en esa direcci´on que en las dem´as, lo que nos dar´ıa un t´ermino de transporte ~b(x) en la ecuaci´on. Como la cantidad de part´ıculas del flu´ıdo es enorme podemos modelizar dichos choques con una fuerza aleatoria. Sea X(t) la posici´on de dicha part´ıcula, y F la fuerza aleatoria. Las fuerzas presentes en la part´ıcula son el rozamiento, que es proporcional a la velocidad de la part´ıcula (Ley de Stokes), y la fuerza aleatoria causada por el bombardeo. La segunda ley de Newton aplicada a esta part´ıcula nos dice que la ecuaci´on del movimiento es
d2
dt2X(t) = −µ
d
dtX(t) + F. (3)
Esta ecuaci´on podemos escribirla como un sistema parecido a (1) d
dtX = V, d
dtV = −µV + F (4)
1
De manera que la cantidad de part´ıculas en el volumen x + dx con velocidades v + dv para un cierto tiempo t es f (t, x, v)dxdv. Suponemos que N es tan grande que podemos tomar f (x, v, t) una funci´on con argumentos continuos.
Observamos el cambio de caracter de la ecuaci´on para la velocidad. En este caso perdemos ve-locidad, por lo que nuestro sistema no es conservativo, estamos frente a un proceso de difusi´on. Vemos que el cambio en las condiciones microsc´opicas, como no pod´ıa ser de otra manera, altera el resultado mesosc´opico.2
Adem´as, la aparici´on de un t´ermino estoc´astico hace que necesitemos nuevas herramientas, como son las ecuaciones diferenciales estoc´asticas y el c´alculo estoc´astico, para entender el sistema (4). Estas herramientas se desarrollaron en el siglo XX y a d´ıa de hoy poseen una teor´ıa bien conocida. Nos referimos a los resultados de existencia, unicidad y regularidad para una ecuaci´on diferencial estoc´astica (ordinaria), as´ı como con resultados como la f´ormula de Itˆo, con la noci´on de integal estoc´astica (en el sentido de Itˆo) o de medida de Wiener. El lector interesado puede consultar [Ku-84],[Ku-97],[O],[Ev], [Dy], [Du], [App] y [Fr].
As´ı esperamos que unas ecuaciones diferenciales ordinarias como (1) sean equivalentes a una ecuaci´on del tipo hiperb´olico como (2), mientras que unas ecuaciones diferenciales estoc´asticas (que son una generalizaci´on de una ecuaci´on ordinaria) sean equivalentes a una ecuaci´on de tipo parab´olico, y por lo tanto con caracter difusivo. Equivalentemente podemos pensar en una ecuaci´on de convecci´on-difusi´on como una generalizaci´on de una ecuaci´on de transporte, donde las carac-ter´ısticas son aleatorias y es esta componente browniana lo que hace que aparezca el laplaciano.
Ver qu´e ecuaciones en derivadas parciales nos dejan ecuaciones como (4) seg´un sea el t´ermino F , y qu´e interpretaci´on y aplicaciones tienen ser´a el objetivo del ensayo.
El texto se organiza de la siguiente manera: en la primera parte trataremos las definiciones b´asicas que nos permiten construir nuestra teor´ıa. En la segunda parte estudiaremos las ecuaciones en derivadas parciales lineales que involucran soluciones de ecuaciones diferenciales estoc´asticas generadas por un movimiento browniano. En esta secci´on tenemos los resultados m´as ’te´oricos’ en el sentido de que pueden ser parte un curso avanzado de Ecuaciones Diferenciales o de Procesos Estoc´asticos. Comenzaremos con el caso bien conocido de la ecuaci´on del calor en todo el espacio para continuar con el problema de Cauchy para ecuaciones parab´olicas m´as generales con coefi-cientes aut´onomos bastante regulares. Veremos el caso de los problemas el´ıpticos, tanto en todo el espacio como en dominios acotados con frontera suave. En la tercera y ´ultima parte daremos (brevemente) varias aplicaciones de los resultados contenidos en las secciones anteriores. En esta ´
ultima parte se tratan algunos problemas no-lineales. Durante todo el texto daremos breves nocio-nes de la historia de la integral en funcionocio-nes, la ’integral de caminos’, el movimiento browniano... adem´as de esbozar algunos desarrollos, como pueden ser los ’juegos diferenciales’ y su relaci´on con operadores el´ıpticos no-lineales, que complementan la teor´ıa que tratamos.
Un apunte hist´orico: La ecuaci´on central de la teor´ıa cin´etica es la ecuaci´on de Boltzmann ∂tf (x, v, t) + ∇xf (x, v, t) · v + ∇vf (x, v, t) ·
d
dtv = C(f ), (5)
donde C(f ) es el t´ermino de colisi´on. La ecuaci´on
∂tf (x, v, t) + ∇xf (x, v, t) · v + ∇vf (x, v, t) ·
d
dtv = 0, (6)
es la ecuaci´on de Vlasov (lineal). Estas ecuaciones fueron escritas ya por James C. Maxwell en 1866 ([Mx]). Son ecuaciones que describen la densidad de probabilidad de unas part´ıculas que evolu-cionan seg´un una ley microsc´opica que tiene un caracter estoc´astico. T´ıpicamente las trayectorias ser´an soluciones de ecuaciones diferenciales estoc´asticas. El m´as famoso de estos procesos es el movimiento browniano (ver Figura1). Este proceso recibe su nombre en honor a Robert Brown quien lo describe en 1828 (ver [B]).
Albert Einstein en [E] estudia (matem´aticamente) el movimiento de part´ıculas inmersas en un flu´ıdo incompresible. En ese texto tambi´en trata la presi´on osm´otica como un fen´omeno basado en el movimiento browniano, que matem´aticamente es el proceso estoc´astico con incrementos inde-pendientes identicamente distribu´ıdos con distribuci´on normal de media 0 y varianza el incremento temporal, i.e.
2
Reservamos el t´ermino macrosc´opicopara las ecuaciones de Euler y Navier-Stokes, que se pueden deducir de la ecuaci´on de Boltzmann tomando, al menos formalmente, unos l´ımites.
Definici´on 1(Movimiento browniano). Dado un espacio de probabilidad (Ω, B, P ), se dice que un proceso W (ω, t), W : Ω × [0, T ] → R es un movimiento browniano si se cumple que
1. W (ω, 0) = 0 y t 7→ W (ω, t) es continua c.t.p. 2. W (ω, t) − W (ω, s) ∼ N(0, t − s) ∀t ≥ s > 0 3. Los incrementos son independientes.
Se˜nalamos que la condici´on W (0) = 0 es para normalizar.
0 200 400 600 800 1000 1200 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1.6 −1.4 −1.2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 −1 −0.5 0 0.5 1 1.5 2
Figura 1: a) Dos trayectorias de un movimiento browniano, b) un movimiento browniano en el plano. 0 1 2 3 4 5 6 7 8 9 10 −2 0 2 4 6 8 10 v(t) t −0.5−0.5 0 0.5 1 1.5 2 0 0.5 1 1.5 2 2.5
Figura 2: a) Algunas trayectorias de la soluci´on de la ecuaci´on de Langevin v, b) una trayectoria soluci´on de la ec. de Langevin en 2D.
M.Smoluchowski en 1906 (ver [Sm]) tambi´en trabaj´o en la descripci´on del movimiento brow-niano.
El proceso d ~W (t,ω)dt , la derivada (incremento) del movimiento browniano recibe el nombre de ruido blanco y es el t´ermino aleatorio perturbativo m´as com´un.3 Usaremos el ruido blanco para
perturbar una ecuaci´on diferencial ordinaria y obtener una ecuaci´on diferencial estoc´astica (ordi-naria). Para un tratamiento matem´atico moderno del movimiento browniano se puede consultar [MP].
Queremos se˜nalar que la ecuaci´on d
dtV = −µ~V + ~~ F ,
en el caso en el que ~F es el ruido blanco recibe el nombre de ecuaci´on de Langevin, en honor del f´ısico Paul Langevin (ver Figura1).
Un enfoque nuevo al movimiento browniano lo dio Norbert Wiener en 1923, con su art´ıculo [W]. En dicho texto Wiener observaba que al ser las trayectorias del movimiento browniano curvas continuas para casi todo ω, el movimiento browniano pod´ıa pensarse como una variable aleatoria que tome valores en el espacio de las funciones continuas dependientes del tiempo. El enfoque del movimiento browniano como un proceso estoc´astico es tratar ~W (t, ω) como unas variables aleatorias indexadas seg´un el par´ametro t, mientras que el enfoque del movimiento browniano como
3
Si bien hablamos coloquialmente de derivada del movimiento browniano, fijo ω, las trayectorias ~W (t, ω) no son derivables para casi todo ω. La m´axima regularidad es que ser´an H¨older con α < 1/2.
una variable aleatoria con valor en un espacio de funciones es tratar ~W (ω) = ω(t).4Este segundo
enfoque ser´a clave en todo este ensayo, por inducirnos una medida en el espacio de funciones. Integrando con respecto a esta medida resolveremos varias ecuaciones en derivadas parciales. El lector que quiera abundar en este tema puede consultar los art´ıculos de Mark Kac [K-66],[K-50] y [K-47]. Los textos [K-66] y [K-47] contienen un resumen hist´orico. Para un tratamiento m´as moderno de la integraci´on funcional puede consultarse [F].
Wiener desarroll´o esta teor´ıa mientras trabajaba en el problema de entender la turbulencia de un flu´ıdo. Encontr´o que la turbulencia ten´ıa relaci´on con el movimiento browniano. Debemos tener esto en mente para cuando lleguemos a la secci´on de aplicaciones a las ecuaciones de los flu´ıdos. As´ı en su autobiograf´ıa escribe
“The problem of turbulence, was too complicated for immediate attack, but there was a related problem which I found to be just right for the theoretical considerations of the field I had chosen for myself. This was the problem of the Brownian motion, and it was to provide the subject of my first major mathematical work.... Here I had a situation in which particles describe not only curves but statistical assemblages of curves. It was an ideal proving ground for my ideas concerning the Lebesgue integral in a space of curves, and it had the abundantly physical texture of the work of Gibbs. It was to this field that I had decided to apply the work that I had already done along the lines of integration theory....”
Comentario 1 Para ser m´as rigurosos al hablar de la f´ısica estad´ıstica debemos hacer notar que al tener todos estos modelos una escala microsc´opica las leyes v´alidas no son las de la mec´anica cl´asica, sino las de la mec´anica cu´antica. Deber´ıamos hablar entonces de bosones y fermiones, pero todo esto nos llevar´ıa demasiado lejos y no es de inter´es para el tema del texto. Tambi´en deber´ıamos hablar de p, el momento de las part´ıculas, y de f (x, p, t) la densidad de las part´ıculas. Para los lectores interesados recomendamos el libro [Kub].
Comentario 2 Un modelo m´as general que la ecuaci´on (4) es considerar un potencial U (x) que interaccione con las part´ıculas, de manera que la fuerza, en el caso de que F sea un movimiento browniano, es −∇U + dW (t, ω) − d
dtX. As´ı nuestras part´ıculas evolucionan seg´un la ecuaci´on
estoc´astica de segundo orden d2 dt2X =~ √ 2d ~W dt − d dtX − ∇U( ~~ X) (7)
y se tiene que la densidad de las part´ıculas evoluciona seg´un la ecuaci´on de Fokker-Planck siguiente ∂tf + ∇xf · v − ∇xU (x) · ∇vf = ∆vf + ∇v· (fv). (8)
Comentario 3 Debemos hacer aqu´ı una observaci´on sobre la nomenclatura de la ecuaci´on de Fokker-Planck. En la literatura a veces se llama ecuaci´on de Fokker-Planck a la ecuaci´on
∂tu = d
X
i,j=1
∂yi∂yj(aij(y)u) − ∇y· (~b(y)u) − c(y)u. (9) Nosotros trataremos una ecuaci´on muy similar. Para nosotros la ecuaci´on de Fokker-Planck es
∂tu = d
X
i,j=1
aij(x)∂xi∂xju + ~b(x) · ∇xu − c(x)u. (10) La relaci´on entre ambas es sutil. Consideremos p(0, x, t, y) la soluci´on fundamental de la ecuaci´on (10). Demostraremos enseguida que nos define un semigrupo para una cierta clase de funciones, pero por el momento nos contentaremos con creerlo. Si escribimos dicho semigrupo, actuando sobre f , como Ttf (x) y si escribimos A para su generador observamos que se tiene
Ttf (x) = Z Rd f (y)p(0, x, t, y)dy, Axf (x) = d X i,j=1 aij(x)∂xi∂xjf + ~b(x) · ∇f − c(x)f. 4
Usualmente, utilizaremos la notaci´on ~W (t) para el movimiento browniano. Sin embargo, para hacer hincapi´e en la idea del movimiento browniano como una variable aleatoria con valores en un espacio funcional, escribiremos W (ω) ∈ C([0, T ]) o ω(t).
Es un hecho bien conocido que los generadores de los semigrupos y el propio semigrupo conmutan, es decir AxTtf (x) = Tt(Ayf )(x). As´ı, si tenemos suficiente regularidad para realizar los c´alculos,
conclu´ımos AxTtf (x) = Z Rd Axp(0, x, t, y)f (y)dy = Z Rd p(0, x, t, y)Ayf (y)dy = Tt(Ayf )(x), (11)
y si integramos por partes en la ´ultima igualdad observamos que Z Rd p(0, x, t, y)Ayf (y)dy = Z Rd A∗yp(0, x, t, y)f (y)dy, siendo el operador A∗
yel adjunto de A. Un simple c´alculo nos ense˜na la relaci´on entre las ecuaciones
(9) y (10), que es que son una la adjunta de la otra, pues A∗yf =
d
X
i,j=1
∂yi∂yj(aij(y)f ) − ∇y· (~b(y)u) − c(y)u.
Como consecuencia extraemos que p(0, x, t, y) satisface la ecuaci´on (10) en x y (9) en y.
Parte I
Bases de Procesos y Ecuaciones
estoc´
asticas
2.
Volvamos al movimiento browniano
Veremos que el movimiento browniano es el paradigma m´as sencillo de proceso estoc´astico, por lo tanto ser´a nuestro banco de pruebas.
Consideremos ahora una malla en dos dimensiones (una asociada al espacio y otra al tiempo) {(ndx, mdt), m, n ∈ Z} con incrementos dx y dt. Consideremos una part´ıcula que est´a en tiempo 0 en la posici´on x = 0. Esta part´ıcula tiene una probabilidad 1/2 de moverse hacia la derecha o hacia la izquierda, a la vez que autom´aticamente subir´a en la malla al ser el eje vertical el eje temporal. Tal y como hemos dicho anteriormente nuestro modelo quiere reflejar la situaci´on de una part´ıcula que se mueve ’al azar’ por estar sometida a choques aleatorios.
Sea p(n, m) la probabilidad de que esta part´ıcula est´e en la posici´on ndx en tiempo mdt. Usando probabilidades condicionadas, se tiene que
p(n, m + 1) = 1
2(p(n − 1, m) + p(n + 1, m)) y por lo tanto,
p(n, m + 1) − p(n, m) = 12(p(n − 1, m) − 2p(n, m) + p(n + 1, m)) Si ahora suponemos que
dx2 dt = D > 0 (12) podemos escribir p(n, m + 1) − p(n, m) dt = D 2 (p(n − 1, m) − 2p(n, m) + p(n + 1, m)) dx2
La condici´on en el cociente que hemos establecido en (12) es necesaria para obtener una ecuaci´on parab´olica, si considerasemos otra distinta el l´ımite resultante no tendr´ıa sentido.
Formalmente, asumiendo que los l´ımites que tomamos a continuaci´on existen, haciendo dx, dt → 0 pero guardando (12) y escribiendo ndx = x, mdt = t, resulta que nuestra probabilidad discreta converge a una densidad,
p(n, m) → f(x, t)
y obtenemos que la densidad verifica la ecuaci´on del calor con par´ametro D/2 ∂tf (x, t) = D
2∆f (x, t), f (x, 0) = δ0(x) (13)
La hip´otesis (12) es clave y nos garantiza que la ecuaci´on que obtenemos es la de difusi´on, como por otra parte debe ser dado el modelo que hemos considerado. Nuestra constante D ser´a igual a la unidad en el movimiento browniano est´andar.
Estos c´alculos son puramente formales, pues entre otras cosas, el paso al l´ımite anterior no es riguroso. Sin embargo se puede formalizar de manera precisa por medio del teorema del l´ımite cen-tral, el cual nos confirma que la probabilidad del proceso definido anteriormente viene dada por una distribuci´on normal N (0, Dt). Todos estos c´alculos se encuentran, convenientemente justificados, en [Ev].
Consideramos ahora unos tiempos t1, t2..., tn y unos intervalos B1, ...Bn. Podemos calcular las
probabilidades de que nuestro movimiento browniano est´e en tiempo tien el intervalo Biutilizando
las propiedades anteriores. Sea
p(t, x, y) = √1 2πtexp −|x − y|2 2t P (a1< W (t1) < b1, ...an< W (tn) < bn) = Z B1 ... Z Bn p(t1, 0, x1)p(t2− t1, x1, x2)...p(tn− tn−1, xn−1, xn)dxn...dx1 (14)
Este c´alculo ser´a relevante a la hora de construir la medida de Wiener.
Por un argumento est´andar de aproximaci´on, una vez establecida para funciones escalonadas, podemos generalizar esta f´ormula para funciones
E[f (W (t1), ..., W (tn))] =
Z
Rn
f (x1, ..., xn)p(t1, 0, x1)p(t2− t1, x1, x2)...p(tn− tn−1, xn−1, xn)dxn...dx1 (15)
Comentario 4 M´as tarde veremos que (15) puede entenderse como una ’integral en funciones’ ya que, fijo T , podemos ver el movimiento browniano como una aplicaci´on W (ω) : Ω 7→ C([0, T ]), y as´ı f ser´a una funci´on que recibe como argumento otra funci´on. Un c´alculo similar y un paso al l´ımite permiti´o a Wiener definir su medida y a Feynman dar una nueva formulaci´on de la mec´anica cu´antica (ver secciones 1.3 y 3.3).
De la definici´on podemos concluir f´acilmente que
E[W (t)] = 0, E[W2(t)] = t
Podemos calcular la covarianza de forma parecida. Si s < t entonces
E[W (t)W (s)] = E[(W (s) + W (t) − W (s))W (s)] = s + E[(W (t) − W (s))W (s)] = s Para sus aplicaciones en ecuaciones diferenciales, nos interesan las propiedades de sus trayecto-rias. Antes de poder demostrar nada, hemos de enunciar el teorema de regularidad de Kolmogorov cuya prueba puede encontrarse en [Ev]:
Teorema 1(Kolmogorov). Sea X un proceso estoc´astico con trayectorias continuas c.t.p. tal que E[|X(t) − X(s)|β] ≤ C(t − s)1+α, ∀t, s ≥ 0
entonces para todo 0 < γ <αβ y T > 0 existe K(ω) tal que |X(t) − X(s)| ≤ K|t − s|γ
Veamos que el movimiento browniano cumpla la hip´otesis del teorema. Fijemos t > s, entonces se tiene E[|W (t) − W (s)|2m] = 1 p2π(t − s) Z R |x|2mexp(−|x|2/2(t − s))dx = (t − s) m √ 2π Z R|y| 2m exp(−|y|2/2)dy = C|t − s|m
donde hicimos el cambio natural, que ya intu´ıamos ´util en los c´alculos formales anteriores (12), y = √x
t − s (16)
La hip´otesis se cumple con β = 2m y α = m − 1. Entonces se ha de tener que γ < α β =
1 2 −
1 2m
para todo m y conclu´ımos que γ < 12.
Hemos demostrado que el movimiento browniano tiene trayectorias H¨older continuas en [0, T ] con exponente γ < 1/2. Este resultado es ´optimo en el sentido de que ning´un otro γ ≥ 12 nos
servir´a. La prueba es la siguiente. Si tuvi´eramos una estimaci´on H¨older con γ = 1/2 entonces se cumplir´ıa
sup
0<s<t<T
|W (t) − W (s)|
|t − s|1/2 ≤ C(ω) c.t.p. (17)
Una desigualdad como la anterior no es posible, pues, si consideramos una partici´on 0 = t1 <
t2... < tn= T , sup 0<s<t<T |W (t) − W (s)| (t − s)1/2 ≥ sup i |W (ti+1) − W (ti)| (ti+1− ti)1/2
Hemos minorado la expresi´on original por unas variables aleatorias (hemos fijado los tiempos) independientes e id´enticamente distibuidas con distribuciones conocidas (normales est´andar), por lo que podemos calcular expl´ıcitamente la probabilidad de que el supremo de dichas variables sea mayor que un cierto par´ametro L. Si tom´asemos γ distinto de 1/2 entonces no quedar´ıan variables id´enticamente distribu´ıdas. P sup i |W (ti+1) − W (ti)| (ti+1− ti)1/2 ≥ L = 1 − P |W (t2) − W (t1)| (t2− t1)1/2 n → 1, si n → ∞
Como L era arbitrario podemos tomarlo tan grande como queramos y concluir que no existe tal constante, por lo que no es H¨older continua. Como no es Lipschitz en ning´un intervalo de tiempo conclu´ımos que no es derivable en casi ning´un punto, es decir, una part´ıcula en un medio que se mueva como un movimiento browniano no tendr´a bien definida la velocidad en ning´un punto. Esta propiedad presenta graves dificultades de interpretaci´on desde el punto de f´ısico, que resolveremos m´as adelante mediante otro modelo diferente. Otra demostraci´on, obra de Erd¨os, Kakutani y Devoretzky, de este hecho puede encontrarse en [Ev].
Queremos remarcar que este proceso estoc´astico no es de variaci´on total acotada, pues si lo fuese, dada una partici´on, se tendr´ıa
n X i=0 |W (ti+1) − W (ti)|2 ≤ m´ax i (|W (ti+1) − W (ti)|) n X i=0 |W (ti+1) − W (ti)| ≤ V (0, T ) m´ax i (|W (ti+1) − W (ti)|),
y esta ´ultima expresi´on tiende a cero por la continuidad del movimiento browniano confor-me refinamos la partici´on. La contradicci´on est´a en que la variaci´on cuadr´atica del movimiento browniano es mayor que cero, por lo tanto V (0, T ), la variaci´on total no puede ser acotada.
Hemos demostrado as´ı el siguiente resultado:
Teorema 2. El movimiento browniano tiene trayectorias H¨older continuas con exponente γ <
1
2. Este exponente es ´optimo, en particular sus trayectorias no tienen variaci´on acotada ni son
Una propiedad muy importante de los procesos que vamos a estudiar es la propiedad de Markov, que viene a decir que el proceso no guarda memoria de la historia pasada. O de forma m´as precisa, Definici´on 2 (Proceso de Markov). Sea X(t). Es un proceso de Markov si cumple que, dada Fs
la fitraci´on generada por el proceso (ver ap´endices),
P [X(t) ∈ B|Fs] = P [X(t) ∈ B|X(s)] c.t.p., ∀t > s
Es decir, suponiendo que podemos definir el proceso X empezando en cualquier punto x, se ha de cumplir que X empiece de nuevo en todo tiempo, sin recordar por d´onde ya pas´o o dej´o de pasar. Para ver la definici´on y propiedades de la esperanza condicionada puede consultarse [Ev]. Siendo el movimiento browniano el origen y prototipo de todos estos procesos, el primer paso es comprobar que la verifica.
Teorema 3. El movimiento browniano, W , es un proceso de Markov.
Demostraci´on. Observamos que X(t) = W (t + s) − W (s), t ≥ 0 es un movimiento browniano (que parti´o del origen). Adem´as es independiente de W (t), 0 ≤ t ≤ s, por la propiedad 3 de la definici´on del movimiento browniano.5Entonces se tiene que W (t+ s) es un movimiento browniano
que empez´o en W (s).
Siendo el movimiento browniano un proceso tan relevante hay una extensa literatura donde se pueden consultar m´as exhaustivamente sus propiedades, por ejemplo pueden consultarse [MP],[Du]. Como no es el tema central de este texto, nos remitimos a las referencias antes citadas para su estudio detallado, y retomaremos el tema con el que empezamos, nuestro modelo para una part´ıcula en un medio sometida a un bombardeo aleatorio. Nuestro primer modelo, el movimiento browniano, vimos que no ten´ıa una velocidad definida en casi ning´un punto y que era de variaci´on no acotada en cualquier intervalo. Como eso plantea dificultades desde el punto de vista f´ısico, vamos a presentar un modelo alternativo. En lugar de estudiar la posici´on de la part´ıcula vamos a fijarnos en su velocidad. Sea v(t) la velocidad de la part´ıcula. Las fuerzas a las que est´a sometida son el rozamiento, que ser´a proporcional a la velocidad, y un t´ermino aleatorio que refleja los bombardeos. Anticip´andonos, escribiremos el t´ermino aleatorio como dW
dt y lo llamaremos ruido
blanco. En un cierto sentido, si lo que estamos modelizando es la velocidad, esta funci´on deber´ıa ser la ’derivada’ del movimiento browniano (ver [Ev]).
Por la segunda ley de Newton, denotando por −av(t)dt el t´ermino de rozamiento, tenemos
dv(t) = −av(t)dt + bdW, v(0) = v0, (18)
que recibe el nombre de ecuaci´on de Langevin. La posici´on vendr´a dada por dx(t) = v(t), x(0) = x0.
La posici´on verificar´a la ecuaci´on de Ornstein-Uhlenbeck. Formalmente, podemos tratar la ecuaci´on de Langevin como si fuese una EDO normal y escribir su soluci´on
v(t) = e−atv0+ b
Z t
0
e−a(t−s)dW (s). (19)
El problema es dar sentido al t´erminoRt
0e−a(t−s)dW (s), que no es una integral de Riemann, sino
una integral estoc´astica, que se interpreta en el sentido de la integral de Itˆo (ver [Ev], [Du], [MP] y ap´endices).6
Las ideas con las que debemos quedarnos es que el objeto definido en (18) (una ecuaci´on diferencial estoc´astica) no tiene sentido tal y como est´a ah´ı, esa manera de presentarlo es s´olo formal, s´olo tiene sentido escrito en su forma integral (una vez que hemos definido la integral de Itˆo) que es v(t) = v0+ Z t 0 −av(s)ds + Z t 0 bdW (s) (20) 5
Dos procesos X(t), Y (t) se dicen independientes si para todo par de conjuntos de tiempos ti, sise tiene que el
vector formado (X(t1), .., X(tn)) es independiente del vector (Y (s1), ..., Y (sn)). 6
Las soluciones de esta integraci´on son procesos estoc´asticos y por lo tanto, aleatorios. Podemos interpretar las ecuaciones estoc´asticas como una EDO en cada ω. La siguiente secci´on est´a dedicada al estudio de cu´ando un problema como (18) est´a bien propuesto y qu´e propiedades verifica su soluci´on.
3.
Existencia y unicidad para las ecuaciones estoc´
asticas
Una vez hemos presentado algunos modelos de ecuaciones estoc´asticas, es el momento de dar la definici´on general. Sea ~X0una variable aleatoria n−dimensional y sea ~W un proceso de Wiener
m−dimensional e independiente de nuestra variable ~X0.7
Como σ−´algebra consideramos la engendrada por la variable aleatoria inicial y el movimiento browniano, esto es8
F(t) = Σ{ ~X0, ~W (s) 0 ≤ s ≤ t}.
Sean dos funciones
~b : Rd
× [0, T ] → Rd σ : Rd× [0, T ] → Md×m
donde Md×mes el espacio de las matrices de dimensi´on d × m.
Dado que las trayectorias del movimiento browniano no son suaves, no podemos esperar so-luciones derivables para las ecuaciones estoc´asticas. Como hemos observado anteriormente, estas ecuaciones s´olo tienen sentido en su formulaci´on integral. Antes de ver la definici´on de soluci´on de la ecuaci´on estoc´astica necesitamos otras
Definici´on 3(Procesos progresivamente medible). Una funci´on f (s, ω) es progresivamente medible si es medible en el conjunto [0, T ] × Ω con respecto a la σ−´algebra B × F, la menor σ−´algebra en [0, T ] × Ω que contiene a los conjuntos A × B con A en [0, T ] y B en Ω. Tambi´en se conoce como independiente del futuro.
Definici´on 4 (Espacios Lppara los procesos). Para los procesos f (s, ω) se definen los siguientes
espacios L1([0, T ]) = {f(s, ω), E Z T 0 |f(s)|ds < ∞}. Para un p general se considera
Lp([0, T ]) = {f(s, ω), E Z T 0 |f(s)| pds < ∞}.
Definici´on 5. Se dice que el proceso estoc´astico ~X(t) es soluci´on de la ecuaci´on diferencial es-toc´astica d ~X = ~b( ~X, t)dt + σ( ~X, t)d ~W , ~X(0) = ~X0 (21) si se cumplen 1. ~X(t) es progresivamente medible. 2. ~b( ~X(t), t) ∈ L1[0, T ]. 3. σ( ~X(t), t) ∈ L2[0, T ]. 4. ~ X(t) = ~X0+ Z t 0 ~b( ~X(s), s)ds + Z t 0 σ( ~X(s), s)d ~W c.t.p. ∀ 0 ≤ t ≤ T (22) 7
Movimiento browniano y proceso de Wiener son t´erminos que se emplean indistintamente a lo largo de todo el texto.
8
Notaremos como ΣX(s), 0 ≤ s ≤ t a la σ−´algebra generada por el proceso X(s). Pedimos atenci´on al lector para que no se confunda con la difusi´on de la ecuaci´on, la cual, tradicionalmente, tambi´en se denota por σ.
Que consideremos s´olo las ecuaciones de primer orden no es una restricci´on, pues una ecuaci´on de grado n se puede escribir como n ecuaciones de grado uno.
Para probar la existencia y la unicidad utilizaremos el m´etodo de aproximaciones sucesivas, exactamente igual que con las EDO.
As´ı el teorema es
Teorema 4(Existencia y unicidad). Supongamos que tanto ~b como σ son funciones Lipschitz en la variable espacial y para todos los tiempos en el intervalo [0, T ]
i.e. |~b(x, t) −~b(x′, t)| ≤ L1|x − x′|, ∀ 0 ≤ t ≤ T
|σ(x, t) − σ(x′, t)| ≤ L2|x − x′|, ∀ 0 ≤ t ≤ T
Sea ~X0 una variable aleatoria en L2[0, T ] independiente del movimiento browniano considerado.
Entonces existe un ´unico proceso en L2[0, T ] tal que es soluci´on de la ecuaci´on (21).9
Antes de demostrarlo damos varios resultados necesarios que dejamos sin demostraci´on (ver [O] y [Ev]).
Lema 1(Desigualdad de Gronwall). Sean φ un funci´on no negativa definida en el intervalo 0 ≤ t ≤ T , y sean C0, A unas constantes. Si se cumple
φ(t) ≤ C0+
Z t
0 Aφ(s)ds ∀ 0 ≤ t ≤ T
entonces se tiene
φ(t) ≤ C0exp(At).
Teorema 5 (Desigualdad para martingalas). Sea X una martingala entonces se tiene, si 1 < p < ∞, E m´ax 0≤s≤t|X(s)| p ≤ p p − 1 p E(|X(t)|p).
Lema 2 (Desigualdad de Chevichev). Sea X variable aleatoria, entonces para todo λ > 0 y p ∈ [1, ∞) se tiene
P (|X| ≥ λ) ≤E(|X|
p)
λp
Lema 3 (Borel-Cantelli). Denotamos por Ani.o. al l´ımite superior de esta familia de conjuntos.
Es decir, aquellos elementos que est´an un n´umero infinito de veces. Entonces si
∞ X n=1 P (An) < ∞ entonces P (An i.o.) = 0
Ahora s´ı que podemos pasar a la demostraci´on del teorema de existencia y unicidad para las ecuaciones estoc´asticas.
Demostraci´on. (Unicidad) Supongamos que hay dos soluciones ~X y ~X′. Rest´andolas obtenemos
~ X(t) − ~X′(t) = Z t 0 ~b( ~X(t), t) −~b( ~X′(t), t)dt + Z t 0 σ( ~X(t), t) − σ( ~X′(t), t)d ~W Entonces se tiene que
E(| ~X(t) − ~X′(t)|2) ≤ 2E Z t 0 ~b( ~X(t), t) −~b( ~X′(t), t)ds 2 + Z t 0 σ( ~X(t), t) − σ( ~X′(t), t)d ~W 2 9
Observamos que podemos utilizar Cauchy-Schwarz y la condici´on de ser Lipschitz para acotar cada t´ermino. E Z t 0 ~b( ~X(t), t) −~b( ~X′(t), t)ds 2 ≤ T E Z t 0 ~b( ~X(t), t) −~b( ~X′(t), t) 2 ≤ L2TZ t 0 E(| ~X(t) − ~ X′(t)|2)
Para acotar el segundo sumando utilizamos las propiedades de la integral de Itˆo ([Ev],[Du]). E Z t 0 σ( ~X(t), t) − σ( ~X′(t), t)d ~W 2 = E Z t 0 σ( ~X(t), t) − σ( ~X ′(t), t) 2 ds ≤ L2 Z t 0 E(| ~X(t) − ~ X′(t)|2)ds Y, considerando las dos desigualdades
E(| ~X(t) − ~X′(t)|2) ≤ C Z t
0 E(| ~X(t) − ~
X′(t)|2)ds Ahora podemos utilizar la desigualdad de Gronwall con
φ(t) = E(| ~X(t) − ~X′(t)|2), C0= 0
y conclu´ımos que ~X y ~X′ son iguales en casi todo punto para todo tiempo.
(Existencia) Consideraremos las aproximaciones ~ Xn+1(t) = ~X0+ Z t 0 ~b(Xn(s), s)ds +Z t 0 σ( ~Xn(s), s)d ~W
Usaremos el siguiente resultado (cuya demostraci´on, basada en un m´etodo de inducci´on, puede consultarse en [Ev]): Sea la ’distancia’ dn(t) = E(| ~Xn+1(t) − ~Xn(t)|2) Entonces se cumple dn(t) ≤ (M t) n+1 (n + 1)! ∀ n = 1, ..., 0 ≤ t ≤ T para alguna constante M = M (L, T, ~X0).
Se tiene, por los c´alculos anteriores, que m´ax 0≤t≤T| ~X n+1(t) − ~Xn(t)|2 ≤ L2T 2Z T 0 | ~ Xn(t) − ~Xn−1(t)|2dt + m´ax 0≤t≤T2 Z t 0 σ( ~Xn(s), s) − σ( ~Xn−1(s), s)d ~W 2
Ahora usamos el teorema5y el resultado anterior y conclu´ımos que se tiene E[ m´ax 0≤t≤T| ~X n+1 (t) − ~Xn(t)|2] ≤ L2T 2 Z T 0 | ~ Xn(t) − ~Xn−1(t)|2dt + 8L2Z T 0 | ~ Xn(t) − ~Xn−1(t)|2dt ≤ C(M T ) n n!
Aplicando la desigualdad de Chevichev y el lema de Borel-Cantelli conclu´ımos que P m´ax 0≤t≤T| ~X n+1(t) − ~Xn(t)| > 1 2n i.o. = 0
Entonces para casi todo ω, ~Xn converge uniformemente en [0, T ] a un proceso ~X. Pasando al
l´ımite en la definici´on de ~Xn+1y en las integrales conclu´ımos que el proceso l´ımite es soluci´on de la
ecuaci´on (22). La prueba de que el proceso est´a en L2puede consultarse en [Ev] o en [O]. La prueba
se basa en la definici´on recurrente del proceso Xn+1(t) y en la suma de la serie exponencial.
Dado que una ecuaci´on estoc´astica es una generalizaci´on de una ecuaci´on ordinaria, pod´ıamos esperar que la demostraci´on fuese similar. Sin embargo, dado que el browniano no es derivable en casi ning´un punto, en general no podremos esperar que una soluci´on de una ecuaci´on estoc´astica vaya a ser diferenciable. La m´axima regularidad que podemos esperar es la misma que para el browniano, que es H¨older-α con α < 1/2 en tiempo. En las condiciones del teorema tendremos H¨older-β con β < 1 en espacio.
Para introducir la idea de flujo estoc´astico, que no es m´as que la versi´on aleatoria de la idea de flujo de las EDO, usaremos un nuevo par´ametro s, el tiempo inicial, y escribiremos ~Xt
s(x) para la
soluci´on de
d ~X(t) = ~b( ~X(t), t)dt + σ( ~X(t), t)d ~W , X(s) = x~ (23) As´ı se tiene la propiedad de flujo
~ Xt
u( ~Xsu(x)) = ~Xst(x) en c.t.p. ∀ 0 ≤ s ≤ u ≤ t ≤ T, ∀x ∈ Rd (24)
La demostraci´on de este hecho puede verse en las notas del curso impartido por M.Gubinelli en su p´agina web o en [Ku-84].
Para hablar de la regularidad respecto de los par´ametros necesitamos una desigualdad para poder aplicar el teorema de Kolmogorov. En [BF] puede encontrarse
E[| ~Xst(x) − ~Xt
′
s′(x′)|p] ≤ C[|x − x′|p+ |s − s′|p/2+ |t − t′|p/2] (25) Ahora, si consideramos x = x′ y queremos ver el exponente de H¨older en el tiempo tenemos
que aplicar el teorema de Kolmogorov de manera id´entica a como lo hicimos en la secci´on anterior. Conclu´ımos que, vista la soluci´on como una funci´on en s (o en t) el exponente de H¨older es γ < 1/2. Verlo para el espacio es similar. Consideremos ahora s = s′, t = t′. Entonces aplicamos el teorema
de Kolmogorov y conclu´ımos que el exponente es γ < 1. Hemos demostrado as´ı el resultado siguiente Teorema 6 (Regularidad). Sea una ecuaci´on estoc´astica con coeficientes bajo las hip´otesis del teorema4. Y sea ~Xt
s(x) su soluci´on. Entonces se tiene
1. s 7→ ~Xt s(x) es H¨older-γ si γ < 1/2. 2. t 7→ ~Xt s(x) es H¨older-γ si γ < 1/2. 3. x 7→ ~Xt s(x) es H¨older-γ si γ < 1.
Claro est´a que si se tiene una mayor regularidad en las funciones ~b y σ entonces se tendr´a mayor regularidad en el espacio. En concreto se tiene
Teorema 7. Sean los coeficientes de la ecuaci´on estoc´astica funciones Ck,α en x, entonces la
soluci´on Xt
0(x) es Ck,β en x con β < α.
En el tiempo no ganaremos nada, porque el contraejemplo del movimiento browniano lo impide. Para las demostraciones rigurosas de estas afirmaciones puede consultarse [Ku-84].
Teorema 8. Sean los coeficientes de la ecuaci´on estoc´astica satisfaciendo las hip´otesis del teorema
4, entonces existe c constante tal que dos soluciones de la misma ecuaci´on con distintos valores iniciales cumplen
E[| ~X1(t) − ~X2(t)|2] ≤ |x1− x2|2ect.
Demostraci´on. La idea de la prueba es aplicar la f´ormula de Itˆo (ver ap´endices) a la funci´on norma, ρ2( ~X1(t), ~X2(t)) =
d
X
i=1
(X1i(t) − X2i(t))2
Hay que mencionar que hay dos tipos de ecuaciones estoc´asticas, cada uno de ellos basado en una integraci´on estoc´astica diferente. Son las ecuaciones de Itˆo, que se basan en la integral de Itˆo y son las que trataremos aqu´ı, y las de Stratonovich, que se basan en la integral del mismo nombre. Para m´as detalles se pueden consultar los ap´endices.
Las ecuaciones estoc´asticas podemos considerarlas como generalizaciones de la ecuaci´on de Langevin para una part´ıcula suspendida en un medio y sometida a bombardeos aleatorios que cambian su velocidad. Es entonces f´acil establecer que reflejan una difusi´on10.
Pensando en las soluciones como difusiones es posible convencerse de que verificar´an la propie-dad de Markov, esto es, que son procesos de Markov. La prueba rigurosa se puede consultar en [O]. En cualquier caso esto no es sorprendente, pues la aleatoriedad aparec´ıa por medio del movimiento browniano, y ´este es un proceso de Markov. No ha de preocuparnos que los coeficientes puedan depender de t, pues podemos suponerlos independientes si a˜nadimos t como otra coordenada de la inc´ognita ~X(t) ∈ Rd+1.
Veremos que el hecho de ser un proceso markoviano nos da un semigrupo de operadores. Pero antes necesitamos definir la medida de Wiener.
4.
La medida de Wiener
En esta secci´on presentaremos la medida de Wiener para poder continuar definiendo los se-migrupos asociados a procesos de Markov en la secci´on siguiente. Necesitamos esta medida para integrar en las funciones y construir as´ı soluciones de una EDP.
La medida de Wiener es la inducida por el movimiento browniano, visto, no como una funci´on ~
W (ω, t), sino como
~
W : Ω 7→ C([0, T ], Rd)
Lo trataremos entonces como una variable aleatoria que toma valores en un espacio de funciones. En efecto, sea x un punto cualquiera, entonces podemos considerar los siguientes espacios de funciones Cx([0, T ], Rd) = {f ∈ C([0, T ], Rd), f (0) = x} (26)
Cxy([0, T ], Rd) = {f ∈ C([0, T ], Rd), f (0) = x, f (T ) = y} (27)
Podemos definir una medida en el espacio, (26) considerando un movimiento browniano que no parta de 0 sino de x.11 O equivalentemente podemos considerar el proceso ~V (t) = x + ~W (t).
En el segundo caso, (27), la medida constru´ıda se dice condicionada ya que hemos impuesto el extremo final.
La manera rigurosa de construir ambas es similar.12 Para simplificar, consideraremos el
ca-so unidimensional (d = 1) y x = 0.13 Consideraremos los conjuntos (que llamaremos cilindros)
siguientes14. Dados tiempos t
1, ...tn y borelianos en R B1, ..., Bn definimos el conjunto
ΠB1,...,Bn
t1,...,tn = {f ∈ C0([0, T ], R), f (ti) ∈ Bi} (28) Hemos de asignarles una probabilidad, y es ahora donde el c´alculo previo (14) nos ayuda. Pues les asignamos la probabilidad us´andolo.
W(ΠB1,...,Bn t1,...,tn ) = Z B1 . . . Z Bn n−1 Y i=0 1 (√2πti+1− ti) e−|x1|2t1 e−|x2−x1|2(t2−t1) ...e −|xn−xn−1| 2(tn −tn−1)dxn...dx1 (29)
Observamos que si para cierto tiempo nuestro boreliano es todo el espacio entonces ese tiempo no cuenta, i.e. si en ti se tiene Bi= R entonces
W(ΠB1,...,Bn
t1,...,tn ) = W(Π
B1,...Bi−1,Bi+1,...,Bn
t1,...,ti−1,ti+1,...,tn )
10
De hecho a la funci´on ~b se le llama drift, a σ, t´ermino de difusi´ony a las soluciones de ecuaciones como (21), difusiones de Itˆo.
11
Lo llamaremos espacio de caminos del ingl´es ’path space’ Cada una de las funciones ser´a un camino (’path’ )
12
Las separa una integraci´on (ver cap´ıtulo 3)
13
Notaremos W0= W. 14
Hay varias maneras de construir la medida de Wiener. Nosotros optaremos por considerar los cilindros y utilizar el teorema de extensi´on de Kolmogorov. Otra demostraci´on se puede consultar en [GJ].
0 50 100 150 200 250 300 350 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 t B1 B2 B 3 B 4
Figura 3: Los cilindros.
Esto es una consecuencia de la ecuaci´on de Chapman-Kolmogorov. Si p(t, x, y) =√1
2πtexp(−(x − y)
2/2t)
entonces la ecuaci´on de Chapman-Kolmogorov se puede escribir p(s + t, x, y) =
Z
R
p(s, x, z)p(t, z, y)dz (30)
es decir, la probabilidad de ir en s + t de x a y es la misma que la de ir de x a z en s y de z a y en t siempre que contemos todos los z posibles.
Para poder utilizar el teorema de extensi´on de Kolmogorov hemos de ver que a conjuntos iguales se les asigna la misma medida. Es decir, hemos de ver que si
ΠB1,...,Bn t1,...,tn = Π A1,...,Am s1,...,sm entonces W(ΠB1,...,Bn t1,...,tn ) = W(Π A1,...,Am s1,...,sm )
Esto se puede reducir al caso donde un conjunto de tiempos y boreles contiene al otro, pues si ambos conjuntos son iguales entonces podemos considerar la intersecci´on de ambos y uno de ellos, i.e. tenemos el siguiente caso
ΠB1,...,Bn
t1,...,tn = Π
B1,...,Bn,A1,...,Am
t1,...,tn,s1,...,sm
Pero ahora podemos reducir la propiedad que queremos a la que hab´ıamos demostrado ya usando las ecuaciones de Chapman-Kolmogorov. En efecto, si se cumple la igualdad entonces en los tiempos ’nuevos’ sj del miembro de la derecha los boreles respectivos, Aj, han de ser todo el espacio. Si no
fuese as´ı, existe una funci´on continua que pasa por los borelianos correctos en todos los tiempos ti
iguales y obtenemos una contradicci´on. Una vez que los boreles son todo el espacio entonces usando las ecuaciones de Chapman-Kolmogorov podemos concluir que las medidas de ambos conjuntos son iguales.
Usamos el teorema de extensi´on (o de existencia) de Kolmogorov, pues tenemos que se satisfacen las condiciones de consistencia. Adem´as, as´ı definida la medida es numerablemente aditiva en los cilindros. Que es finitamente aditiva es una simple observaci´on. La numerabilidad viene de que podemos escribir15
W(∪∞i=1Ci) = W(∪Ni=1Ci) + W(∪∞i=N +1Ci)
por ser v´alido para un n´umero finito de conjuntos. Ahora conclu´ımos observando que el segundo sumando converge a cero cuando avanzamos en N por ser la medida de un conjunto que tiende al vac´ıo.
Por lo tanto tenemos una medida en la σ−´algebra generada por los cilindros antes mencionados. Sin embargo no est´a nada claro a simple vista cu´al es dicha σ−´algebra.
Consideremos el conjunto
A = {φ, f(s) < φ(s) < g(s)}
para ciertas funciones continuas f, g. Sean silos racionales en el intervalo [0, T ]. Entonces podemos
escribir el conjunto como A = ∞ [ n=1 \ si {f(si) + 1/n < φ(si) < g(si) − 1/n}
Por lo que tenemos que es una uni´on numerable de intersecciones de cilindros. Conjuntos como el anterior estar´an en la σ−´algebra, y por lo tanto estar´an los boreles (de la convergencia uniforme), pues bastar´a fijar ψ y tomar f = ψ − ε y g = ψ + ε. Es m´as, se puede demostrar que ambas σ−´algebras en realidad coinciden.
Introduciremos la notaci´on, muy com´un, ~
W (ω, t) = ω(t) Entonces la medida anterior nos define una esperanza
E0[f ] =
Z
C0([0,T ],R)
f (ω)dW (31)
Observamos que el cero aparece como sub´ındice en el integrando porque consideramos un movi-miento browniano con origen el cero. Si queremos considerar movimovi-mientos partiendo de un punto x escribiremos
Ex[f ] =
Z
Cx([0,T ],R)
f (ω)dWx (32)
Esta probabilidad se concentrar´a en las funciones continuas que pasan por x en tiempo 0. Si fijamos unos tiempos, entonces podemos cambiar la integral en el espacio de funciones por una integral en Rd.16 Esto es consecuencia de c´omo hemos definido la medida en los cilindros.
E[f1( ~W (t1)), ..., fn( ~W (tn))] = Z Rn n Y j=1 fj(xj)p(tj− tj−1, xj, xj−1)dx1dx2, ...dxn
Esta f´ormula nos es bien conocida en un caso con un s´olo tiempo, pues no es m´as que la f´ormula del semigrupo de la ecuaci´on del calor. As´ı si
H0= −1 2∆ e−tH0f (x) = Z R p(t, x, y)f (y)dy = Ex[f ( ~W (t))] = E0[f (x + ~W (t))] (33) 15
Se sabe (ver [Kl]) que si consideramos constantes de difusi´on imaginarias la medida resultante no es numera-blemente aditiva.
16
Esta es la primera f´ormula de representaci´on que hemos conseguido.
Observamos que entonces podemos escribir la medida en funci´on de estos operadores. E0[f1( ~W (t1)), ..., fn( ~W (tn))] = [e−t1H0f1e−(t2−t1)H0f2...e−(tn−tn−1)H0fn](0)
Hemos definido la medida de Wiener como la inducida por el movimiento browniano, pero podemos hacer lo mismo con otros procesos. Por ejemplo la medida definida en (27) no est´a inducida por el movimiento browniano, sino por el puente browniano ~X, definido como
~
X(t) = ~W (t) + t
T(y − ~W (t)) Se puede definir tambi´en como la soluci´on de la SDE
d ~X(t) = t − ~X(t)
T − t dt + d ~W
con el mismo punto inicial que tenga el movimiento browniano que lo induce.
As´ı podemos definir la medida (con medida del espacio total igual a p(T2− T1, x, y)) inducida
por el puente browniano que en tiempo T1est´a en x y en T2est´a en y como unos ciertos operadores,
exactamente igual que en el caso anterior, Z Cy x([T1,T2],R) f1( ~X(t1), f2( ~X(t2), ...fn( ~X(tn)dW[Tx,y1,T2]= = [e−(T1−t1)H0f 1e−(t2−t1)H0f2...e−(tn−tn−1)H0fne−(T2−tn)H0(·, y)](x) (34)
Comentario 5 Cualquier difusi´on nos da una medida en el espacio de las funciones continuas con respecto a la σ−´algebra de los cilindros17. Puede consultarse [F] para m´as detalles. Lo que
ocurrir´a es que no ser´a posible escribirla tan expl´ıcitamente salvo en unos pocos casos.
0 200 400 600 800 1000 1200 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2
Figura 4: Trayectorias de un puente browniano.
17
En realidad cualquier proceso estoc´astico con trayectorias continuas nos define una medida en la σ−´algebra de los cilindros. Tambi´en podemos extender esta idea a las EDO que tengan unicidad, existencia y sus soluciones sean continuas. S´olo que en este caso la medida es totalmente singular, con probabilidad 1 caer´a en la ´unica soluci´on de la EDO.
Parte II
Teor´ıa para las ecuaciones lineales
5.
Problemas Parab´
olicos
5.1.
La ecuaci´
on del calor
Es un resultado cl´asico que la soluci´on fundamental de la ecuaci´on del calor ∂tu =
1
2∆u (35)
es una gaussiana. Esto se puede ver de diversas maneras, desde buscar soluciones autosemejan-tes (ver [Ev-08] o [I]), a razonar con paseos aleatorios (ver [Ev]). Es este ´ultimo camino el que seguiremos nosotros.
Fijemos T > 0 el tiempo final de nuestra evoluci´on y consideremos el problema de Cauchy para la ecuaci´on (35). Sea f (x) el dato inicial, que supondremos positivo y en L1(Rd) con d la dimensi´on
del espacio (t´ıpicamente ser´a 1,2,o 3). Entonces la soluci´on de la ecuaci´on (35) viene dada por u(t, x) = Z Rd f (y)W (0, x, t, y)dy, (36) con W (s, x, t, y) = 1 p2π(t − s)e −|x−y|2 2(t−s) . (37)
Si recordamos la definici´on1 que dimos anteriormente se tiene que si ~Xt
0(x) es la posici´on en
tiempo t de un movimiento browniano que en tiempo 0 estaba en x la esperanza de f ( ~Xt
0(x)) con
respecto a la medida de Wiener,18se puede escribir como
Ex[f ( ~X0t(x))] = Z C([0,T ])f (ω(t))dW(ω) = Z Rd f (y)W (0, x, t, y). (38)
Observamos que las expresiones (36) y (38) coinciden. Por lo tanto tenemos que Ex[f ( ~X0t(x))]
es soluci´on (cl´asica) de (35). As´ı tenemos que si consideramos a las soluciones de las ecuaciones estoc´asticas como una generalizaci´on de las curvas caracter´ısticas para ecuaciones parab´olicas en-tonces las trayectoria del movimiento browniano ser´an las curvas caracter´ısticas de la ecuaci´on del calor.
Este m´etodo nos brinda una nueva intuici´on. Consideremos una cantidad c de part´ıculas que en el tiempo inicial estaban en el punto z, i.e. f (y) = cδ(y − z). Dichas part´ıculas comienzan a moverse siguiendo un movimiento browniano, por lo tanto tienen unas probabilidades de acabar tras un tiempo t en el punto x que vienen dadas por W (0, x, t, z). As´ı u(t, x) = cW (0, x, t, z) es la cantidad esperada de part´ıculas en el punto x.
De nuestra representaci´on probabilista se extraen varias consecuencias f´acilmente. Para empezar se conserva el signo de f . Recordemos que f ≥ 0, entonces
Ex[f ( ~X0t(x)] ≥ 0,
por ser la esperanza de una funci´on positiva. Tambi´en se conserva la masa. En efecto
Z Rd Ex[f ( ~X0t(x))]dx = Z Rd Z Rd f (y)W (0, x, t, y)dydx = Z Rd f (y)dy, pues basta observar que
Z
RdW (0, x, t, y)dx = 1, ∀t, y.
18
Esta medida, soportada en las funciones continuas C([0, T ]) para todo T , la denotaremos como dW(ω) por estar inducida por el movimiento browniano ~W (t, ω).
Si ahora suponemos que f (x) = f (|x|) y por lo tanto es sim´etrica se tendr´a que Ex[f (X0t(x))]
ser´a sim´etrica. La raz´on en este caso es que la probabilidad de cambiar entre dos posiciones x e y viene dada por una funci´on de la distancia entre ambos puntos.
En realidad la relaci´on del movimiento browniano con la ecuaci´on del calor no deber´ıa ser nada sorprendente, pues conocemos la naturaleza at´omica de la mater´ıa, as´ı como que la temperatura es una medici´on del grado de agitaci´on, siempre existente, de los ´atomos. Si recordamos que el modelo que daba origen al movimiento browniano era el de considerar una part´ıcula peque˜na inmersa en un flu´ıdo, y por lo tanto sometida a choques aleatorios con las part´ıculas vecinas, no es llamativa la aparici´on en escena de la ecuaci´on del calor. De otra manera, un modelo que refleja la agitaci´on de part´ıculas peque˜nas debe tener alguna relaci´on con la ecuaci´on del calor.
Esta formulaci´on de integrales funcionales y difusiones markovianas adem´as de una nueva intui-ci´on, nos da tambi´en un nuevo m´etodo para aproximar las soluciones de la ecuaciones en derivadas parciales, el m´etodo de Monte-Carlo (ver la parte de Aplicaciones).
Un apunte hist´orico: La relaci´on entre la ecuaci´on del calor ∂tu =
D 2∆u
y el movimiento browniano ya la not´o Albert Einstein a principios del siglo XX. De esta relaci´on se puede obtener
D = T R N µ
con T la temperatura absoluta, R la constante universal de los gases, N el n´umero de Avogadro y µ un n´umero que depende del tama˜no de la part´ıcula y de la viscosidad del flu´ıdo en el que estaba inmersa la part´ıcula browniana. As´ı utilizaron esta expresi´on de la constante D para determinar el n´umero de Avogadro. Este logro bien vali´o un premio Nobel en 1926 para Perrin.
5.2.
Ecuaciones parab´
olicas generales
El caso de la ecuaci´on del calor (35) es bien conocido. Sin embargo, es un caso particular de un resultado m´as amplio para ecuaciones parab´olicas del tipo
∂tu = d
X
i,j=1
aij(x)∂xi∂xju + ~b(x) · ∇u − c(x)u, u(0, x) = f (x) (39)
donde suponemos que aij(x),~b(x) ∈ Rd y c(x) ∈ R+ son funciones Cb2,α(Rd), con
Pd
i,j=1aijθjθi≥
h|θ|2 con h > 0, para todo vector θ ∈ Rd y a
ij una matr´ız sim´etrica. Requeriremos que c ≥ 0
para evitar problemas de resonancia al encontrar c alg´un autovalor del problema el´ıptico asociado. Adem´as supondremos que existe una matriz σ tal que la matriz de coeficientes se puede escribir como a = σσt. En general σ no ser´a ´unica (pensemos que no tiene por qu´e ser una matriz cuadrada),
pero la medida que induce Xt
0(x) no es sensible a estos cambios en σ (ver [F]). Fijemos T > 0 el
tiempo final de nuestra evoluci´on y el dato inicial f ∈ Cb(Rd) ∩ L1(Rd).
Esperamos que por ser una generalizaci´on de una ecuaci´on del calor admita un resultado pa-recido al de la secci´on anterior para un cierto tipo de ecuaciones estoc´asticas. As´ı en funci´on de σ y ~b definiremos una ecuaci´on estoc´astica que har´a las veces de curva caracter´ıstica y que nos inducir´a una medida en las funciones continuas.
Procederemos de la siguiente manera: primero nos centraremos en el caso en el que c(x) = 0 y por lo tanto no hay absorci´on. En este caso daremos una descripci´on probabilista del semigru-po involucrando ecuaciones estoc´asticas y esperanzas con respecto a la medida que inducen en C([0, T ]). Tras haber dado un resultado para este caso, consideraremos el caso c ≥ 0 y utilizaremos la f´ormula de Feynman-Kac para caracterizar el semigrupo.
El caso c = 0: Consideremos la ecuaci´on diferencial estoc´astica, escrita formalmente como una diferencial (ver [O])
~ Xt
0(x) en este caso es la posici´on de una part´ıcula que sufre ’choques aleatorios anis´otropos’ (el
t´ermino σd ~W ) y un transporte en la direcci´on ~b(x) que cambian su velocidad. Un ejemplo f´ısico es el caso de una part´ıcula inmersa en una disoluci´on que fluye por una rampa. El fluir da el t´ermino ~b(x) y el que sea una disoluci´on genera la anisotrop´ıa σ(x).
Dada la soluci´on de la ecuaci´on estoc´astica (40) definimos el semigrupo
Ttf (x) = Ex[f ( ~X0t(x))] = Z C([0,T ])f (ω(t))dX (ω) = Z Rd f (y)P (0, x, t, dy) = Z Rd f (y)p(0, x, t, y), (41) donde P (s, x, t, Γ) es la funci´on de transici´on, que da la probabilidad de que en tiempo t − s nuestro proceso que parte de x en tiempo s llegue a Γ, es decir
P (s, x, t, Γ) = P ( ~Xst(x) ∈ Γ) =
Z
Γ
p(s, x, t, y)dy
y p(s, x, t, y) es la densidad de transici´on. Queremos hacer notar que nuestra p(s, x, t, y) en el caso de una ecuaci´on estoc´astica como (40) no es otra que la soluci´on fundamental del problema parab´olico (39) con c = 0, tal y como parec´ıa claro del caso de la ecuaci´on del calor.19Se tiene que
dX es la medida en las funciones continuas que induce la soluci´on de la ecuaci´on (40). La esperanza es con respecto a dX . Todo esto es an´alogo al caso de la medida de Wiener (ver [F]).
Tal y como suced´ıa con la ecuaci´on del calor, si consideramos como una generalizaci´on de una curva caracter´ıstica a la soluci´on de una ecuaci´on estoc´astica, entonces las soluciones de (40) ser´an las curvas caracter´ısticas de ecuaciones parab´olicas como (39) o (43).
Observamos que si f ≥ 0 entonces Ttf ≥ 0. Adem´as tenemos Ttf ∈ L∞, es m´as, se tiene
||Ttf ||∞≤ ||f||∞.
Por lo tanto Ttes un semigrupo de contracciones en L∞. A este tipo de semigrupos se les llama
markovianos.
Que efectivamente es un semigrupo se desprende de la propiedad de Markov20y de las
propie-dades de la esperanza condicionada (ver [Ev]),
E[f ( ~X0t+s(x))|Σ( ~X(z), 0 ≤ z ≤ s)] = E[f( ~Xst( ~X0s(x)))] = Ttf ( ~X0s(x))
Ahora tomando esperanzas y aplicando las propiedades de la esperanza condicionada conclu´ımos Ts+tf (x) = TsTtf (x)
Definimos su dominio como
D(Tt) = {f ∈ L∞, ||Ttf − f|| → 0, si t → 0}
Este conjunto es un espacio vectorial (por la linealidad de la esperanza y la desigualdad triangular). Adem´as es cerrado. En efecto, basta observar que si
fn∈ D(Tt) → f, Ttfn→ Ttf
entonces
||Ttf − f||∞≤ ||Ttf − Ttfn||∞+ ||Ttfn− fn||∞+ ||fn− f||∞→ 0.
Y por lo tanto f ∈ D(Tt).
Se tiene tambi´en que
t 7→ Ttf
19
Se llama soluci´on fundamental porque permite construir la soluci´on para un dato inicial continuo y acotado dado.
20
Hay muchas formulaciones de la propiedad de Markov, nosotros utilizaremos una con esperanzas (ver [Du],[F]). ~
X es un proceso de Markov si
E[ ~X(t + h)|Σ{ ~X(s), 0 ≤ s ≤ t}] = E[ ~X(t + h)| ~X(t)]. Σ(·) denota la σ−´algebra generada.
es continuo. En efecto,
||Tt+hf − Ttf ||∞≤ ||Tt(Thf − f)||∞≤ ||Thf − f||∞→ 0
Hemos demostrado as´ı el siguiente resultado
Proposici´on 1(Semigrupo). Dado una soluci´on de la ecuaci´on estoc´astica (40) (o en general un proceso de Markov), se tiene que
1. Ttes un semigrupo de contracciones en L∞, con dominio
D(Tt) = {f ∈ L∞, ||Ttf − f|| → 0, si t → 0}.
Adem´as el dominio es un espacio vectorial cerrado. 2. s 7→ Ts es continuo.
Para fijar las ideas, veamos algunos ejemplos en una dimensi´on espacial.
Ejemplo 1: Consideremos la ecuaci´on diferencial ordinaria, escrita para conservar la notaci´on como
dXt(x) = bdt.
Entonces, como no tiene ning´un tipo de naturaleza estoc´astica, podemos obviar las esperanzas. En este caso el operador es
Ttf (x) = Ex[f (X0t(x))] = f (x + bt).
Vemos que es justamente la soluci´on de la ecuaci´on de transporte ut= bux, u(0, x) = f (x)
En este caso el generador del semigrupo es
A = b∂x.
Ejemplo 2: Consideremos ahora la ecuaci´on estoc´astica dX = dW, X(0) = x con soluci´on
X0t(x) = x + W (t)
Vimos anteriormente que
Ttf (x) = Ex[f (x + W (t))]
resolv´ıa la ecuaci´on del calor con difusi´on 1/2, ut= 1
2uxx, u(x, 0) = f (x) En este caso el generador es
A = 1 2∂
2 x.
Ejemplo 3: Podemos considerar la ecuaci´on estoc´astica dX = bdt + dW, X(0) = x y entonces el semigrupo ir´a asociado a la ecuaci´on
ut= bux+1
2uxx En este caso el generador es
A = b∂x+
1 2∂
2 x.
En general, observamos que el generador del semigrupo, que se define como A = l´ım h→0 Thf (x) − f(x) h , es el operador el´ıptico, Au = 1 2 d X i,j=1 ai,j(x)∂xi∂xju + d X i=1 bi(x)∂xiu. (42)
al menos si lo restringimos a las funciones suficientemente regulares (ver [F] o [Dy]).
Para demostrarlo s´olo hemos de tomar esperanzas en la f´ormula de Itˆo aplicada a f (x) ∈ C2 b(Rd)
(ver [F]). Por lo tanto tenemos asociada la ecuaci´on d
dtTtf (x) = ATtf (x), T0f (x) = f (x). Para m´as detalles puede consultarse [Du] o [App].
Comentario 6 Se tiene que el operador A tiene sentido cl´asico para las funciones f ∈ C2 b(Rd),
adem´as C2
b(Rd) ⊆ D(A) ⊂ D(Tt) ⊂ L∞. Los dominios dependen de la dimensi´on considerada,
as´ı para d = 1 D(A) = C2
b(Rd), pero para d > 1 es estrictamente mayor. Veremos que en realidad
no hay que pedir tanto al dato inicial.
Queremos remarcar que antes ten´ıamos la continuidad en t, pero ahora, al menos para ciertas funciones f , tenemos la derivabilidad en t. Querremos la derivabilidad tambi´en en x, pero esa es debida al propio proceso de Markov.
La f´ormula de Bismut-Elworthy-Li (ver [Du] o [Ku-84]) nos permite escribir la derivada espacial de Ttf (x) sin usar las derivadas de f . En concreto,
Teorema 9(F´ormula de Bismut-Elworthy-Li). Sea f ∈ Cb(Rd), una soluci´on de (40) ~X0t(x) con
coeficientes Cb2,α(Rd) y v, w dos direcciones. Entonces la derivada de T
tf (x) en la direcci´on v es
∇vTtf (x) ≤ C|v|√
t ||f||∞. Para las segundas derivadas la f´ormula es similar,
∇v,wTtf (x) ≤ C|v||w|
t ||f||∞. Por lo tanto se tiene el siguiente teorema.
Teorema 10. Sea Xt
0(x) la soluci´on de la ecuaci´on (40) con coeficientes C 2,α
b (Rd) y consideremos
Ex la esperanza con respecto a la medida en las funciones continuas inducida por X0t(x). Sea
f ∈ Cb(Rd) ∩ L1(Rd). Entonces
u(t, x) = Ttf (x) =
Z
C([0,T ])f (ω(t))dX (ω) = E
x[f (X0t(x)]
es la ´unica soluci´on cl´asica de la ecuaci´on de Fokker-Planck siguiente ∂tu = d X i,j=1 aij(x)∂xi∂xju + ~b(x) · ∇u, u(0, x) = f (x). (43) con aij = σσt.
Como demostraremos el teorema an´alogo con c ≥ 0, que es un caso m´as general, este teorema lo dejamos sin demostraci´on por ser ´esta similar a la del teorema11.
As´ı hemos descrito el semigrupo para (43) con t´ecnicas probabilistas.
Podemos pensar que tenemos f (y) part´ıculas inicialmente en el punto y. La velocidad de estas part´ıculas evoluciona siguiendo la ecuaci´on (40). Al final recuperamos Ttf (x) como la cantidad
media de part´ıculas que han llegado en tiempo t al punto x.
El caso c ≥ 0: Consideremos la ecuaci´on (40) con coeficientes Cb2,α(Rd). Para no preocuparnos
de la regularidad del dato inicial lo tomaremos f ∈ C2
b(Rd). Escribamos
˜
Au = Au − c(x)u, con A el operador (42).
Entonces se tiene el famoso teorema de Feynman y Kac, Teorema 11(Feynman-Kac). Sea Xt
0(x) la soluci´on de la ecuaci´on (40) con coeficientes C 2,α b (Rd)
y consideremos Ex la esperanza con respecto a la medida en las funciones continuas inducida por
Xt
0(x). Sea f ∈ Cb2(Rd) ∩ L1(Rd) el dato inicial de (39). Entonces
u(t, x) = ˜Ttf (x) = Z C([0,T ]) f (ω(t))e−R0tc(ω(s))dsdX (ω) = Ex[f ( ~Xt 0(x))e− Rt 0c( ~X s 0(x)ds)].
es la ´unica soluci´on cl´asica de la ecuaci´on de Fokker-Planck siguiente ∂tu =
d
X
i,j=1
aij(x)∂xi∂xju + ~b(x) · ∇u − c(x)u, u(0, x) = f (x). (44) con aij = σσt.
Demostraci´on. Sea t fijo. Consideramos los procesos Z0r(x) = − Z r 0 c( ~X0s(x))ds, Y0r(x) = eZ r 0(x) con diferenciales dZ0r(x) = −c( ~X0r(x))dr, dY0r(x) = −c( ~X0r(x))Y0r(x)dr.
Entonces la diferencial del producto u(t − r, ~Xr
0(x))Y0r(x) es
d(u(t − r, ~X0r(x))Y0r(x)) = d(u(t − r, ~X0r(x)))Y0r(x) + udY0r(x).
Por la f´ormula de Itˆo aplicada a u(t − r, ~Xr
0(x)) se tiene
− ∂tu(t − r, ~X0r(x)) + Au(t − r, ~X0r(x))
dr + ∇u(t − r, ~X0r(x)) · σd ~W .
Si introducimos esto en la f´ormula anterior obtenemos d(u(t − r, ~X0r(x))Y0r(x)) = −∂u(t − r, ~X r 0(x)) ∂t + Au(t − r, ~X r 0(x)) dr + ∇u(t − r, ~X0r(x)) · σd ~W Y0r(x) − u(t − r, ~X0r(x))c( ~X0r(x))Y0r(x).
Ahora integramos hasta r = t y tomamos esperanzas con respecto a la medida que induce (40). El resultado de esto es ˜ Ttf (x) − u(t, x) = E Z t 0 −∂u(t − r, ~X r 0(x)) ∂t + ˜Au(t − r, ~X r 0(x)) e−R0rc( ~X s 0(x)dsdr = 0.
Observamos que si bien para la ecuaci´on (43) la soluci´on s´olo depende del punto final de la trayectoria del proceso soluci´on de (40), para una ecuaci´on con absorci´on como (39) la soluci´on depende de toda la trayectoria. Por lo tanto, si fijamos x y t entonces estamos integrando un funcional.
Para ˜Ttf (x) hay una proposici´on an´aloga a la proposici´on1. No la demostraremos ahora
com-pleta, pero s´ı que veremos que ˜Ttes un semigrupo de contracciones en L∞ y el decaimiento de los
operadores Tty ˜Tten Lp(Rd). Se tiene que es un semigrupo de contracciones en L∞. En efecto,
|| ˜Ttf (x)||∞≤ ||f(x)||∞ Z C([0,T ]) e−R0tc(ω(s))dsdX (ω) ∞ ≤ ||f(x)||∞.
Adem´as, la masa va desapareciendo Z Rd ˜ Ttf (x)dx ≤ Z Rd Ttf (x)dx = Z Rd Ex[f (X0t(x))]dx = Z Rd Z Rd p(0, x, t, y)f (y)dydx = Z Rd f (y)dy. A los semigrupos que, como ˜Tt, pierden masa se les llama submarkovianos. Una ecuaci´on como (43)
en un dominio acotado U de Rd con condiciones de borde u|
∂U = 0 nos da otro tipo de semigrupo
submarkoviano.
De la ca´ıda de la masa y de que sea un semigrupo de contracciones en L∞podemos concluir
|| ˜Ttf (x)||p≤ ||f|| 1 p 1 ||f||∞ Z C([0,T ]) e−R0tc(ω(s))dsdX (ω) ∞ !1−1p , ∀p ∈ [1, ∞], ∀t ≥ 0. Por si no tuviesemos el t´ermino c nos interesa c´omo decae la densidad de probabilidad en L∞,
para probar el decaimiento del operador Tten todos los Lp(Rd). En [Fr] (teorema 4.5) tenemos la
siguiente cota
|p(t, x, y)| ≤ C td/2.
Una prueba (distinta de la de [Fr]) de demostrar dicha desigualdad es considerar unas coordenadas adaptadas a la advecci´on. As´ı consideramos las caracter´ısticas
~ Y (t) = Z t 0 ~b(~Y (s))ds Definimos ahora v(t, x) = u(t, x − ~Y (t)) con lo que d X i,j=1 ai,j(x)∂xi∂xju = d X i,j=1 ai,j(x)∂xi∂xjv pero ∂tv = ∂tu − ∇u · ~Y′(t) = ∂tu − ∇u ·~b(x).
Observamos que v resuelve la ecuaci´on del calor (con unos coeficientes ai,j(x)) y que se tiene
||u||∞ = ||v||∞, por lo que tenemos probado el decaimiento (ver la construcci´on de la soluci´on
fundamental para esta difusi´on en [I]) y conclu´ımos as´ı || ˜Ttf (x)||p≤ ||Ttf (x)||p≤ ||f|| 1 p 1||f|| 1−1 p ∞ ≤ c (td/2)1−1 p, ∀p ∈ (1, ∞], ∀t ≥ 0.
Con estos resultados hemos puesto de manifiesto que comportamientos microsc´opicos ’como el movimiento browniano’ nos dan ecuaciones macrosc´opicas como (43).
Comentario 7 Toda esta t´ecnica probabil´ıstica es v´alida gracias a que tenemos un proceso de Markov, pero estos no deben ser necesariamente difusiones de Itˆo, i.e. soluciones de ecuaciones estoc´asticas con ruido blanco como (40), como veremos pueden ser procesos de L´evy m´as generales que incluyan saltos.
En lo que resta de secci´on trataremos el problema de valor inicial y de contorno con dato Dirichlet en un dominio suficientemente regular. Sea U el dominio del problema.
Proposici´on 2. Sea el τxtiempo de parada que nos indica el tiempo que tarda X0t(x), soluci´on de
(40), en golpear por primera vez la frontera del dominio U . Si f ∈ Cb2(Rd) ∩ L1(Rd) y g ∈ Cb(∂U )
entonces la soluci´on del problema de valores iniciales y de contorno ∂tu = 1 2 d X i,j=1
ai,j(x)∂xi∂xju + ~b · ∇u, u(0, x) = f(x) si x ∈ U, u|∂U = g(x), (45) es
u(t, x) = Ex[f (X0t(x)χ{t<τx}(t)] + Ex[g(X
τx
0 (x))χ{t≥τx}(t)], (46)
donde χA es la caracter´ıstica del conjunto A.
Demostraci´on. Sea U ⊂ Rd un dominio con frontera regular y el tiempo de parada τ
x definido
anteriormente. Con t fijo, aplicamos la f´ormula de Itˆo a u(t − r, ~Xr 0(x)), u(t − r, ~X0r(x)) − u(t, x) = Z r 0 ∂s+ A u(t − s, ~X0s(x))ds + Z r 0 ∇u(t − s, ~ X0s(x)) · σd ~W . Observamos que ∂s= −∂t.
Ahora hacemos r = t y observamos que si t ≥ τx entonces u(0, X0τx(x)) = g(X0τx(x)). Tomamos
esperanzas con respecto a las medidas inducidas por la soluci´on de (40), concluyendo Ex[f ( ~X0t(x))χ{t<τx}(t)] + Ex[g( ~X
τx
0 (x))χ{t≥τx}(t)] − u(t, x) = 0.
Si la condici´on de borde fuese Neumann tambi´en se puede dar un resultado, pero hay que definir una reflexi´on y es m´as laborioso (ver [R]).
Un apunte hist´orico: Richard P. Feynman public´o un art´ıculo ([Fe-48]) en 1948 (una revisi´on de su tesis doctoral ([Fe-05]) del a˜no 1942) en el que daba una tercera formulaci´on de la mec´anica cu´antica.21 La formulaci´on de Feynman se basa en una integral de caminos y en el uso de las
ecuaciones de Chapman-Kolmogorov. Sin embargo hay problemas para definir una medida con respecto a la que integrar. En palabras del propio Feynman
“The formulation given here suffers from a serious drawback. The mathematical con-cepts needed are new. (...) One needs, in adittion, an appropiate measure for the space of the argument functions x(t) of the functionals.”
Veamos r´apidamente qu´e hace Feynman. Consideremos una part´ıcula cu´antica de masa m, sin efectos reslativistas o esp´ın que se mueve bajo los efectos de un potencial V (x). Sea K(ta, xa, tb, xb)
el n´ucleo de la ecuaci´on de Schr¨odinger. Entonces si φ es la contribuci´on de cada camino se tiene K(ta, xa, tb, xb) =
X
caminos de (ta, xa) a (tb, xb)
φ(X(t))
La idea ahora es que todos los caminos contribuyen a la probabilidad, pero lo hacen de manera distinta. Esto es bastante intuitivo. La interpretaci´on m´as popular de la mec´anica cu´antica afirma el car´acter probabil´ıstico del movimiento a esas escalas. Por lo tanto, si sabemos que una part´ıculas se mueve entre dos puntos es razonable pensar que la probabilidad ’se traslada’ al camino que ha seguido. En concreto se tiene
φ(X(t)) = Cei/~A (X(t)) donde C es una constante para normalizar y
A(X(t)) = Z tb ta 1 2m(X ′(t))2 − V (X(t))dt. 21
Las otras dos formulaciones son la matricial de Heisenberg y la basada en espacios de Hilbert y operadores de Schr¨odinger. Esta formulaci´on de Feynman es la m´as intuitiva en opini´on del autor.