El método de las características aleatorias: Notas de clase

(1)

El m´

etodo de las caracter´

ısticas aleatorias:

Notas de clase

Rafael Granero Belinch´

on

1

22 de marzo de 2011

Resumen

En estas clases estudiaremos la teor´ıa de existencia y unicidad para las Ecuaciones Dife-renciales Estocásticas (ordinarias) y sus aplicaciones a las Ecuaciones en Derivadas Parciales. En concreto estudiaremos una generalización del método de las caracter´ısticas. Estos apuntes son autocontenidos en la medida de lo posible, por lo que el lector que esté en apuros con la probabilidad puede consultar facilmente los teoremas necesarios en los apéndices.

´

_Indice

1. Introducci´on 2

I

Bases de Procesos y Ecuaciones estoc´

asticas

6

2. Volvamos al movimiento browniano 6

3. Existencia y unicidad para las ecuaciones estoc´asticas 10

4. La medida de Wiener 14

II

Teor´ıa para las ecuaciones lineales

17

5. Problemas Parab´olicos 18

5.1. La ecuaci´on del calor . . . 18

5.2. Ecuaciones parab´olicas generales . . . 19

6. Problemas El´ıpticos 26

6.1. La ecuaci´on de Poisson. . . 26

6.2. Ecuaciones el´ıpticas generales . . . 30

III

Aplicaciones

31

7. Aplicaciones a las ecuaciones de los flu´ıdos 31

7.1. La ecuaci´on de Burgers . . . 32

1

Email: [email protected],

Consejo Superior de Investigaciones Cient´ıficas,

Instituto de Ciencias Matem´aticas (CSIC-UAM-UC3M-UCM) C/ Nicol´as Cabrera, 13-15

Campus de Cantoblanco, 28049 - Madrid

(2)

8. Aplicaciones al C´alculo Num´erico 33

A. La f´ormula de Itˆo 34

B. La integral de Itˆo 37

1. Introducci´

on

En la f´ısica, sin entrar demasiado en los detalles, hay dos tipos de fenómenos principales, los difusivos y los conservativos. Dichos fenómenos se corresponden con dos tipos bien diferenciados de ecuaciones en derivadas parciales, las parabólicas (ecuación del calor) y las hiperbólicas (ecuación de ondas) respectivamente. Las ecuaciones el´ıpticas (ecuación de Poisson) pueden verse como el caso estacionario de ambos fenómenos. Los comportamientos de dos ecuaciones de distinto tipo son bien distintos, as´ı como los métodos usuales para tratarlas.

Consideremos N part´ıculas de masa unidad de un gas ideal con choques perfectamente el´asticos evolucionando seg´un las leyes de Newton en ausencia de fuerzas externas. Es decir, si xi(t) y vi(t)

son las posici´on y la velocidad de la part´ıcula i en el tiempo t > 0 se tiene d

dtxi= vi, d

dtvi= 0, i = 1, ...N. (1)

Consideremos ahora f (x, v, t) la funci´on de densidad de las part´ıculas.1_{Se tiene que dicha densidad}

evoluciona seg´un la ecuaci´on de Boltzmann d

dtf (x, v, t) = ∂tf (x, v, t) + ∇xf (x, v, t) · v + ∇vf (x, v, t) · d dtv

= ∂tf (x, v, t) + ∇xf (x, v, t) · v = C, (2)

con C el término de colisión. Este término en la distribución de equilibrio será 0.

Si ahora nos preguntamos por las curvas caracter´ısticas de la ecuaci´on (2), las cuales conocemos bien por ser esta ecuaci´on de primer orden, obtenemos las ecuaciones diferenciales ordinarias de (1).

Dado que en este modelo no podemos perder part´ıculas ni velocidad, estamos frente a un modelo conservativo. Ese es el motivo por el que la ecuación en derivadas parciales que aparece es de tipo hiperbólico. Observamos que para el problema de la evolución de N part´ıculas de un gas ideal el método de las caracter´ısticas hace equivalentes ambos enfoques, el microscópico, representado por las ecuaciones diferenciales ordinarias, y el mesoscópico, encarnado en la ecuación en derivadas parciales (2).

Consideremos ahora una part´ıcula de masa unidad que se encuentra inmersa en un flu´ıdo en reposo de manera que sufre constantemente choques con las part´ıculas del flu´ıdo. Que el flu´ıdo esté en reposo es importante para el tipo de choques que se darán, que en este caso serán igual de numerosos en todas direcciones. Sin embargo, si el flu´ıdo se moviese rápidamente en una dirección determinada nuestra part´ıcula sufrir´ıa más choques en esa dirección que en las demás, lo que nos dar´ıa un término de transporte ~b(x) en la ecuación. Como la cantidad de part´ıculas del flu´ıdo es enorme podemos modelizar dichos choques con una fuerza aleatoria. Sea X(t) la posición de dicha part´ıcula, y F la fuerza aleatoria. Las fuerzas presentes en la part´ıcula son el rozamiento, que es proporcional a la velocidad de la part´ıcula (Ley de Stokes), y la fuerza aleatoria causada por el bombardeo. La segunda ley de Newton aplicada a esta part´ıcula nos dice que la ecuación del movimiento es

d2

dt2X(t) = −µ

d

dtX(t) + F. (3)

Esta ecuaci´on podemos escribirla como un sistema parecido a (1) d

dtX = V, d

dtV = −µV + F (4)

1

De manera que la cantidad de part´ıculas en el volumen x + dx con velocidades v + dv para un cierto tiempo t es f (t, x, v)dxdv. Suponemos que N es tan grande que podemos tomar f (x, v, t) una funci´on con argumentos continuos.

(3)

Observamos el cambio de caracter de la ecuación para la velocidad. En este caso perdemos ve-locidad, por lo que nuestro sistema no es conservativo, estamos frente a un proceso de difusión. Vemos que el cambio en las condiciones microscópicas, como no pod´ıa ser de otra manera, altera el resultado mesoscópico.2

Además, la aparición de un término estocástico hace que necesitemos nuevas herramientas, como son las ecuaciones diferenciales estocásticas y el cálculo estocástico, para entender el sistema (4). Estas herramientas se desarrollaron en el siglo XX y a d´ıa de hoy poseen una teor´ıa bien conocida. Nos referimos a los resultados de existencia, unicidad y regularidad para una ecuación diferencial estocástica (ordinaria), as´ı como con resultados como la fórmula de Itô, con la noción de integal estocástica (en el sentido de Itô) o de medida de Wiener. El lector interesado puede consultar [Ku-84],[Ku-97],[O],[Ev], [Dy], [Du], [App] y [Fr].

As´ı esperamos que unas ecuaciones diferenciales ordinarias como (1) sean equivalentes a una ecuación del tipo hiperbólico como (2), mientras que unas ecuaciones diferenciales estocásticas (que son una generalización de una ecuación ordinaria) sean equivalentes a una ecuación de tipo parabólico, y por lo tanto con caracter difusivo. Equivalentemente podemos pensar en una ecuación de convección-difusión como una generalización de una ecuación de transporte, donde las carac-ter´ısticas son aleatorias y es esta componente browniana lo que hace que aparezca el laplaciano.

Ver qué ecuaciones en derivadas parciales nos dejan ecuaciones como (4) según sea el término F , y qué interpretación y aplicaciones tienen será el objetivo del ensayo.

El texto se organiza de la siguiente manera: en la primera parte trataremos las definiciones básicas que nos permiten construir nuestra teor´ıa. En la segunda parte estudiaremos las ecuaciones en derivadas parciales lineales que involucran soluciones de ecuaciones diferenciales estocásticas generadas por un movimiento browniano. En esta sección tenemos los resultados más ’teóricos’ en el sentido de que pueden ser parte un curso avanzado de Ecuaciones Diferenciales o de Procesos Estocásticos. Comenzaremos con el caso bien conocido de la ecuación del calor en todo el espacio para continuar con el problema de Cauchy para ecuaciones parabólicas más generales con coefi-cientes autónomos bastante regulares. Veremos el caso de los problemas el´ıpticos, tanto en todo el espacio como en dominios acotados con frontera suave. En la tercera y última parte daremos (brevemente) varias aplicaciones de los resultados contenidos en las secciones anteriores. En esta ´

ultima parte se tratan algunos problemas no-lineales. Durante todo el texto daremos breves nocio-nes de la historia de la integral en funcionocio-nes, la ’integral de caminos’, el movimiento browniano... adem´as de esbozar algunos desarrollos, como pueden ser los ’juegos diferenciales’ y su relaci´on con operadores el´ıpticos no-lineales, que complementan la teor´ıa que tratamos.

Un apunte histórico: La ecuación central de la teor´ıa cinética es la ecuación de Boltzmann ∂tf (x, v, t) + ∇xf (x, v, t) · v + ∇vf (x, v, t) ·

d

dtv = C(f ), (5)

donde C(f ) es el término de colisión. La ecuación

∂tf (x, v, t) + ∇xf (x, v, t) · v + ∇vf (x, v, t) ·

d

dtv = 0, (6)

es la ecuación de Vlasov (lineal). Estas ecuaciones fueron escritas ya por James C. Maxwell en 1866 ([Mx]). Son ecuaciones que describen la densidad de probabilidad de unas part´ıculas que evolu-cionan según una ley microscópica que tiene un caracter estocástico. T´ıpicamente las trayectorias serán soluciones de ecuaciones diferenciales estocásticas. El más famoso de estos procesos es el movimiento browniano (ver Figura1). Este proceso recibe su nombre en honor a Robert Brown quien lo describe en 1828 (ver [B]).

Albert Einstein en [E] estudia (matemáticamente) el movimiento de part´ıculas inmersas en un flu´ıdo incompresible. En ese texto también trata la presión osmótica como un fenómeno basado en el movimiento browniano, que matemáticamente es el proceso estocástico con incrementos inde-pendientes identicamente distribu´ıdos con distribución normal de media 0 y varianza el incremento temporal, i.e.

2

Reservamos el término macroscópicopara las ecuaciones de Euler y Navier-Stokes, que se pueden deducir de la ecuación de Boltzmann tomando, al menos formalmente, unos l´ımites.

(4)

Definici´on 1_{(Movimiento browniano). Dado un espacio de probabilidad (Ω, B, P ), se dice que un} proceso W (ω, t), W : Ω × [0, T ] → R es un movimiento browniano si se cumple que

1. W (ω, 0) = 0 y t 7→ W (ω, t) es continua c.t.p. 2. W (ω, t) − W (ω, s) ∼ N(0, t − s) ∀t ≥ s > 0 3. Los incrementos son independientes.

Se˜nalamos que la condici´on W (0) = 0 es para normalizar.

0 200 400 600 800 1000 1200 −1.5 −1 −0.5 0 0.5 1 1.5 2 −1.6 −1.4 −1.2 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 −1 −0.5 0 0.5 1 1.5 2

Figura 1: a) Dos trayectorias de un movimiento browniano, b) un movimiento browniano en el plano. 0 1 2 3 4 5 6 7 8 9 10 −2 0 2 4 6 8 10 v(t) t −0.5−0.5 0 0.5 1 1.5 2 0 0.5 1 1.5 2 2.5

Figura 2: a) Algunas trayectorias de la solución de la ecuación de Langevin v, b) una trayectoria solución de la ec. de Langevin en 2D.

M.Smoluchowski en 1906 (ver [Sm]) también trabajó en la descripción del movimiento brow-niano.

El proceso d ~W (t,ω)_dt , la derivada (incremento) del movimiento browniano recibe el nombre de ruido blanco y es el término aleatorio perturbativo más común.3 _{Usaremos el ruido blanco para}

perturbar una ecuación diferencial ordinaria y obtener una ecuación diferencial estocástica (ordi-naria). Para un tratamiento matemático moderno del movimiento browniano se puede consultar [MP].

Queremos se˜nalar que la ecuaci´on d

dtV = −µ~V + ~~ F ,

en el caso en el que ~F es el ruido blanco recibe el nombre de ecuaci´on de Langevin, en honor del f´ısico Paul Langevin (ver Figura1).

Un enfoque nuevo al movimiento browniano lo dio Norbert Wiener en 1923, con su art´ıculo [W]. En dicho texto Wiener observaba que al ser las trayectorias del movimiento browniano curvas continuas para casi todo ω, el movimiento browniano pod´ıa pensarse como una variable aleatoria que tome valores en el espacio de las funciones continuas dependientes del tiempo. El enfoque del movimiento browniano como un proceso estocástico es tratar ~W (t, ω) como unas variables aleatorias indexadas según el parámetro t, mientras que el enfoque del movimiento browniano como

3

Si bien hablamos coloquialmente de derivada del movimiento browniano, fijo ω, las trayectorias ~W (t, ω) no son derivables para casi todo ω. La máxima regularidad es que serán Hölder con α < 1/2.

(5)

una variable aleatoria con valor en un espacio de funciones es tratar ~W (ω) = ω(t).4_{Este segundo}

enfoque será clave en todo este ensayo, por inducirnos una medida en el espacio de funciones. Integrando con respecto a esta medida resolveremos varias ecuaciones en derivadas parciales. El lector que quiera abundar en este tema puede consultar los art´ıculos de Mark Kac [K-66],[K-50] y [K-47]. Los textos [K-66] y [K-47] contienen un resumen histórico. Para un tratamiento más moderno de la integración funcional puede consultarse [F].

Wiener desarrolló esta teor´ıa mientras trabajaba en el problema de entender la turbulencia de un flu´ıdo. Encontró que la turbulencia ten´ıa relación con el movimiento browniano. Debemos tener esto en mente para cuando lleguemos a la sección de aplicaciones a las ecuaciones de los flu´ıdos. As´ı en su autobiograf´ıa escribe

“The problem of turbulence, was too complicated for immediate attack, but there was a related problem which I found to be just right for the theoretical considerations of the field I had chosen for myself. This was the problem of the Brownian motion, and it was to provide the subject of my first major mathematical work.... Here I had a situation in which particles describe not only curves but statistical assemblages of curves. It was an ideal proving ground for my ideas concerning the Lebesgue integral in a space of curves, and it had the abundantly physical texture of the work of Gibbs. It was to this field that I had decided to apply the work that I had already done along the lines of integration theory....”

Comentario 1 Para ser más rigurosos al hablar de la f´ısica estad´ıstica debemos hacer notar que al tener todos estos modelos una escala microscópica las leyes válidas no son las de la mecánica clásica, sino las de la mecánica cuántica. Deber´ıamos hablar entonces de bosones y fermiones, pero todo esto nos llevar´ıa demasiado lejos y no es de interés para el tema del texto. También deber´ıamos hablar de p, el momento de las part´ıculas, y de f (x, p, t) la densidad de las part´ıculas. Para los lectores interesados recomendamos el libro [Kub].

Comentario 2 Un modelo m´as general que la ecuaci´on (4) es considerar un potencial U (x) que interaccione con las part´ıculas, de manera que la fuerza, en el caso de que F sea un movimiento browniano, es −∇U + dW (t, ω) − d

dtX. As´ı nuestras part´ıculas evolucionan seg´un la ecuaci´on

estoc´astica de segundo orden d2 dt2X =~ √ 2d ~W dt − d dtX − ∇U( ~~ X) (7)

y se tiene que la densidad de las part´ıculas evoluciona seg´un la ecuaci´on de Fokker-Planck siguiente ∂tf + ∇xf · v − ∇xU (x) · ∇vf = ∆vf + ∇v· (fv). (8)

Comentario 3 Debemos hacer aqu´ı una observación sobre la nomenclatura de la ecuación de Fokker-Planck. En la literatura a veces se llama ecuación de Fokker-Planck a la ecuación

∂tu = d

X

i,j=1

∂yi∂yj(aij(y)u) − ∇y· (~b(y)u) − c(y)u. (9) Nosotros trataremos una ecuaci´on muy similar. Para nosotros la ecuaci´on de Fokker-Planck es

∂tu = d

X

i,j=1

aij(x)∂xi∂xju + ~b(x) · ∇xu − c(x)u. (10) La relación entre ambas es sutil. Consideremos p(0, x, t, y) la solución fundamental de la ecuación (10). Demostraremos enseguida que nos define un semigrupo para una cierta clase de funciones, pero por el momento nos contentaremos con creerlo. Si escribimos dicho semigrupo, actuando sobre f , como Ttf (x) y si escribimos A para su generador observamos que se tiene

Ttf (x) = Z Rd f (y)p(0, x, t, y)dy, Axf (x) = d X i,j=1 aij(x)∂xi∂xjf + ~b(x) · ∇f − c(x)f. 4

Usualmente, utilizaremos la notaci´on ~W (t) para el movimiento browniano. Sin embargo, para hacer hincapi´e en la idea del movimiento browniano como una variable aleatoria con valores en un espacio funcional, escribiremos W (ω) ∈ C([0, T ]) o ω(t).

(6)

Es un hecho bien conocido que los generadores de los semigrupos y el propio semigrupo conmutan, es decir AxTtf (x) = Tt(Ayf )(x). As´ı, si tenemos suficiente regularidad para realizar los c´alculos,

conclu´ımos AxTtf (x) = Z Rd Axp(0, x, t, y)f (y)dy = Z Rd p(0, x, t, y)Ayf (y)dy = Tt(Ayf )(x), (11)

y si integramos por partes en la ´ultima igualdad observamos que Z Rd p(0, x, t, y)Ayf (y)dy = Z Rd A∗yp(0, x, t, y)f (y)dy, siendo el operador A∗

yel adjunto de A. Un simple cálculo nos enseña la relación entre las ecuaciones

(9) y (10), que es que son una la adjunta de la otra, pues A∗yf =

d

X

i,j=1

∂yi∂yj(aij(y)f ) − ∇y· (~b(y)u) − c(y)u.

Como consecuencia extraemos que p(0, x, t, y) satisface la ecuaci´on (10) en x y (9) en y.

Parte I

Bases de Procesos y Ecuaciones

estoc´

asticas

2. Volvamos al movimiento browniano

Veremos que el movimiento browniano es el paradigma más sencillo de proceso estocástico, por lo tanto será nuestro banco de pruebas.

Consideremos ahora una malla en dos dimensiones (una asociada al espacio y otra al tiempo) {(ndx, mdt), m, n ∈ Z} con incrementos dx y dt. Consideremos una part´ıcula que está en tiempo 0 en la posición x = 0. Esta part´ıcula tiene una probabilidad 1/2 de moverse hacia la derecha o hacia la izquierda, a la vez que automáticamente subirá en la malla al ser el eje vertical el eje temporal. Tal y como hemos dicho anteriormente nuestro modelo quiere reflejar la situación de una part´ıcula que se mueve ’al azar’ por estar sometida a choques aleatorios.

Sea p(n, m) la probabilidad de que esta part´ıcula est´e en la posici´on ndx en tiempo mdt. Usando probabilidades condicionadas, se tiene que

p(n, m + 1) = 1

2(p(n − 1, m) + p(n + 1, m)) y por lo tanto,

p(n, m + 1) − p(n, m) = 1₂(p(n − 1, m) − 2p(n, m) + p(n + 1, m)) Si ahora suponemos que

dx2 dt = D > 0 (12) podemos escribir p(n, m + 1) − p(n, m) dt = D 2 (p(n − 1, m) − 2p(n, m) + p(n + 1, m)) dx2

La condición en el cociente que hemos establecido en (12) es necesaria para obtener una ecuación parabólica, si considerasemos otra distinta el l´ımite resultante no tendr´ıa sentido.

(7)

Formalmente, asumiendo que los l´ımites que tomamos a continuaci´on existen, haciendo dx, dt → 0 pero guardando (12) y escribiendo ndx = x, mdt = t, resulta que nuestra probabilidad discreta converge a una densidad,

p(n, m) → f(x, t)

y obtenemos que la densidad verifica la ecuaci´on del calor con par´ametro D/2 ∂tf (x, t) = D

2∆f (x, t), f (x, 0) = δ0(x) (13)

La hipótesis (12) es clave y nos garantiza que la ecuación que obtenemos es la de difusión, como por otra parte debe ser dado el modelo que hemos considerado. Nuestra constante D será igual a la unidad en el movimiento browniano estándar.

Estos cálculos son puramente formales, pues entre otras cosas, el paso al l´ımite anterior no es riguroso. Sin embargo se puede formalizar de manera precisa por medio del teorema del l´ımite cen-tral, el cual nos confirma que la probabilidad del proceso definido anteriormente viene dada por una distribución normal N (0, Dt). Todos estos cálculos se encuentran, convenientemente justificados, en [Ev].

Consideramos ahora unos tiempos t1, t2..., tn y unos intervalos B1, ...Bn. Podemos calcular las

probabilidades de que nuestro movimiento browniano est´e en tiempo tien el intervalo Biutilizando

las propiedades anteriores. Sea

p(t, x, y) = √1 2πtexp −|x − y|2 2t P (a1< W (t1) < b1, ...an< W (tn) < bn) = Z B1 ... Z Bn p(t1, 0, x1)p(t2− t1, x1, x2)...p(tn− tn−1, xn−1, xn)dxn...dx1 (14)

Este c´alculo ser´a relevante a la hora de construir la medida de Wiener.

Por un argumento estándar de aproximación, una vez establecida para funciones escalonadas, podemos generalizar esta fórmula para funciones

E[f (W (t1), ..., W (tn))] =

Z

Rn

f (x1, ..., xn)p(t1, 0, x1)p(t2− t1, x1, x2)...p(tn− tn−1, xn−1, xn)dxn...dx1 (15)

Comentario 4 Más tarde veremos que (15) puede entenderse como una ’integral en funciones’ ya que, fijo T , podemos ver el movimiento browniano como una aplicación W (ω) : Ω 7→ C([0, T ]), y as´ı f será una función que recibe como argumento otra función. Un cálculo similar y un paso al l´ımite permitió a Wiener definir su medida y a Feynman dar una nueva formulación de la mecánica cuántica (ver secciones 1.3 y 3.3).

De la definici´on podemos concluir f´acilmente que

E[W (t)] = 0, E[W2(t)] = t

Podemos calcular la covarianza de forma parecida. Si s < t entonces

E[W (t)W (s)] = E[(W (s) + W (t) − W (s))W (s)] = s + E[(W (t) − W (s))W (s)] = s Para sus aplicaciones en ecuaciones diferenciales, nos interesan las propiedades de sus trayecto-rias. Antes de poder demostrar nada, hemos de enunciar el teorema de regularidad de Kolmogorov cuya prueba puede encontrarse en [Ev]:

Teorema 1(Kolmogorov). Sea X un proceso estoc´astico con trayectorias continuas c.t.p. tal que E[|X(t) − X(s)|β] ≤ C(t − s)1+α, ∀t, s ≥ 0

entonces para todo 0 < γ <α_β y T > 0 existe K(ω) tal que |X(t) − X(s)| ≤ K|t − s|γ

(8)

Veamos que el movimiento browniano cumpla la hip´otesis del teorema. Fijemos t > s, entonces se tiene E[|W (t) − W (s)|2m_{] =} 1 p2π(t − s) Z R |x|2m_exp(−|x|2_{/2(t − s))dx} = (t − s) m √ 2π Z R|y| 2m exp(−|y|2/2)dy = C|t − s|m

donde hicimos el cambio natural, que ya intu´ıamos ´util en los c´alculos formales anteriores (12), y = √x

t − s (16)

La hip´otesis se cumple con β = 2m y α = m − 1. Entonces se ha de tener que γ < α β =

1 2 −

1 2m

para todo m y conclu´ımos que γ < 1₂.

Hemos demostrado que el movimiento browniano tiene trayectorias Hölder continuas en [0, T ] con exponente γ < 1/2. Este resultado es óptimo en el sentido de que ningún otro γ ≥ 12 nos

servirá. La prueba es la siguiente. Si tuviéramos una estimación Hölder con γ = 1/2 entonces se cumplir´ıa

sup

0<s<t<T

|W (t) − W (s)|

|t − s|1/2 ≤ C(ω) c.t.p. (17)

Una desigualdad como la anterior no es posible, pues, si consideramos una partici´on 0 = t1 <

t2... < tn= T , sup 0<s<t<T |W (t) − W (s)| (t − s)1/2 ≥ sup i |W (ti+1) − W (ti)| (ti+1− ti)1/2

Hemos minorado la expresión original por unas variables aleatorias (hemos fijado los tiempos) independientes e idénticamente distibuidas con distribuciones conocidas (normales estándar), por lo que podemos calcular expl´ıcitamente la probabilidad de que el supremo de dichas variables sea mayor que un cierto parámetro L. Si tomásemos γ distinto de 1/2 entonces no quedar´ıan variables idénticamente distribu´ıdas. P sup i |W (ti+1) − W (ti)| (ti+1− ti)1/2 ≥ L = 1 − P |W (t2) − W (t1)| (t2− t1)1/2 n → 1, si n → ∞

Como L era arbitrario podemos tomarlo tan grande como queramos y concluir que no existe tal constante, por lo que no es Hölder continua. Como no es Lipschitz en ningún intervalo de tiempo conclu´ımos que no es derivable en casi ningún punto, es decir, una part´ıcula en un medio que se mueva como un movimiento browniano no tendrá bien definida la velocidad en ningún punto. Esta propiedad presenta graves dificultades de interpretación desde el punto de f´ısico, que resolveremos más adelante mediante otro modelo diferente. Otra demostración, obra de Erdös, Kakutani y Devoretzky, de este hecho puede encontrarse en [Ev].

Queremos remarcar que este proceso estocástico no es de variación total acotada, pues si lo fuese, dada una partición, se tendr´ıa

y esta última expresión tiende a cero por la continuidad del movimiento browniano confor-me refinamos la partición. La contradicción está en que la variación cuadrática del movimiento browniano es mayor que cero, por lo tanto V (0, T ), la variación total no puede ser acotada.

Hemos demostrado as´ı el siguiente resultado:

Teorema 2. El movimiento browniano tiene trayectorias H¨older continuas con exponente γ <

1

2. Este exponente es ´optimo, en particular sus trayectorias no tienen variaci´on acotada ni son

(9)

Una propiedad muy importante de los procesos que vamos a estudiar es la propiedad de Markov, que viene a decir que el proceso no guarda memoria de la historia pasada. O de forma m´as precisa, Definici´on 2 (Proceso de Markov). Sea X(t). Es un proceso de Markov si cumple que, dada Fs

la fitraci´on generada por el proceso (ver ap´endices),

P [X(t) ∈ B|Fs] = P [X(t) ∈ B|X(s)] c.t.p., ∀t > s

Es decir, suponiendo que podemos definir el proceso X empezando en cualquier punto x, se ha de cumplir que X empiece de nuevo en todo tiempo, sin recordar por dónde ya pasó o dejó de pasar. Para ver la definición y propiedades de la esperanza condicionada puede consultarse [Ev]. Siendo el movimiento browniano el origen y prototipo de todos estos procesos, el primer paso es comprobar que la verifica.

Teorema 3. El movimiento browniano, W , es un proceso de Markov.

Demostración. Observamos que X(t) = W (t + s) − W (s), t ≥ 0 es un movimiento browniano (que partió del origen). Además es independiente de W (t), 0 ≤ t ≤ s, por la propiedad 3 de la definición del movimiento browniano.5_{Entonces se tiene que W (t+ s) es un movimiento browniano}

que empez´o en W (s).

Siendo el movimiento browniano un proceso tan relevante hay una extensa literatura donde se pueden consultar más exhaustivamente sus propiedades, por ejemplo pueden consultarse [MP],[Du]. Como no es el tema central de este texto, nos remitimos a las referencias antes citadas para su estudio detallado, y retomaremos el tema con el que empezamos, nuestro modelo para una part´ıcula en un medio sometida a un bombardeo aleatorio. Nuestro primer modelo, el movimiento browniano, vimos que no ten´ıa una velocidad definida en casi ningún punto y que era de variación no acotada en cualquier intervalo. Como eso plantea dificultades desde el punto de vista f´ısico, vamos a presentar un modelo alternativo. En lugar de estudiar la posición de la part´ıcula vamos a fijarnos en su velocidad. Sea v(t) la velocidad de la part´ıcula. Las fuerzas a las que está sometida son el rozamiento, que será proporcional a la velocidad, y un término aleatorio que refleja los bombardeos. Anticipándonos, escribiremos el término aleatorio como dW

dt y lo llamaremos ruido

blanco. En un cierto sentido, si lo que estamos modelizando es la velocidad, esta funci´on deber´ıa ser la ’derivada’ del movimiento browniano (ver [Ev]).

Por la segunda ley de Newton, denotando por −av(t)dt el t´ermino de rozamiento, tenemos

dv(t) = −av(t)dt + bdW, v(0) = v0, (18)

que recibe el nombre de ecuación de Langevin. La posición vendrá dada por dx(t) = v(t), x(0) = x0.

La posición verificará la ecuación de Ornstein-Uhlenbeck. Formalmente, podemos tratar la ecuación de Langevin como si fuese una EDO normal y escribir su solución

v(t) = e−atv0+ b

Z t

0

e−a(t−s)dW (s). (19)

El problema es dar sentido al t´erminoRt

0e−a(t−s)dW (s), que no es una integral de Riemann, sino

una integral estocástica, que se interpreta en el sentido de la integral de Itô (ver [Ev], [Du], [MP] y apéndices).6

Las ideas con las que debemos quedarnos es que el objeto definido en (18) (una ecuación diferencial estocástica) no tiene sentido tal y como está ah´ı, esa manera de presentarlo es sólo formal, sólo tiene sentido escrito en su forma integral (una vez que hemos definido la integral de Itô) que es v(t) = v0+ Z t 0 −av(s)ds + Z t 0 bdW (s) (20) 5

Dos procesos X(t), Y (t) se dicen independientes si para todo par de conjuntos de tiempos ti, sise tiene que el

vector formado (X(t1), .., X(tn)) es independiente del vector (Y (s1), ..., Y (sn)). 6

(10)

Las soluciones de esta integración son procesos estocásticos y por lo tanto, aleatorios. Podemos interpretar las ecuaciones estocásticas como una EDO en cada ω. La siguiente sección está dedicada al estudio de cuándo un problema como (18) está bien propuesto y qué propiedades verifica su solución.

3. Existencia y unicidad para las ecuaciones estoc´

asticas

Una vez hemos presentado algunos modelos de ecuaciones estoc´asticas, es el momento de dar la definici´on general. Sea ~X0una variable aleatoria n−dimensional y sea ~W un proceso de Wiener

m−dimensional e independiente de nuestra variable ~X0.7

Como σ−´algebra consideramos la engendrada por la variable aleatoria inicial y el movimiento browniano, esto es8

F(t) = Σ{ ~X0, ~W (s) 0 ≤ s ≤ t}.

Sean dos funciones

~b : Rd

× [0, T ] → Rd σ : Rd× [0, T ] → Md×m

donde Md×mes el espacio de las matrices de dimensi´on d × m.

Dado que las trayectorias del movimiento browniano no son suaves, no podemos esperar so-luciones derivables para las ecuaciones estocásticas. Como hemos observado anteriormente, estas ecuaciones sólo tienen sentido en su formulación integral. Antes de ver la definición de solución de la ecuación estocástica necesitamos otras

Definición 3(Procesos progresivamente medible). Una función f (s, ω) es progresivamente medible si es medible en el conjunto [0, T ] × Ω con respecto a la σ−álgebra B × F, la menor σ−álgebra en [0, T ] × Ω que contiene a los conjuntos A × B con A en [0, T ] y B en Ω. También se conoce como independiente del futuro.

Definici´on 4 (Espacios Lp_{para los procesos). Para los procesos f (s, ω) se definen los siguientes}

espacios L1([0, T ]) = {f(s, ω), E Z T 0 |f(s)|ds < ∞}. Para un p general se considera

Lp_{([0, T ]) = {f(s, ω), E} Z T 0 |f(s)| p_ds < ∞}.

Definición 5. Se dice que el proceso estocástico ~X(t) es solución de la ecuación diferencial es-tocástica d ~X = ~b( ~X, t)dt + σ( ~X, t)d ~W , ~X(0) = ~X0 (21) si se cumplen 1. ~X(t) es progresivamente medible. 2. ~b( ~X(t), t) ∈ L1_{[0, T ].} 3. σ( ~X(t), t) ∈ L2_{[0, T ].} 4. ~ X(t) = ~X0+ Z t 0 ~b( ~X(s), s)ds + Z t 0 σ( ~X(s), s)d ~W c.t.p. ∀ 0 ≤ t ≤ T (22) 7

Movimiento browniano y proceso de Wiener son t´erminos que se emplean indistintamente a lo largo de todo el texto.

8

Notaremos como ΣX(s), 0 ≤ s ≤ t a la σ−álgebra generada por el proceso X(s). Pedimos atención al lector para que no se confunda con la difusión de la ecuación, la cual, tradicionalmente, también se denota por σ.

(11)

Que consideremos sólo las ecuaciones de primer orden no es una restricción, pues una ecuación de grado n se puede escribir como n ecuaciones de grado uno.

Para probar la existencia y la unicidad utilizaremos el m´etodo de aproximaciones sucesivas, exactamente igual que con las EDO.

As´ı el teorema es

Teorema 4(Existencia y unicidad). Supongamos que tanto ~b como σ son funciones Lipschitz en la variable espacial y para todos los tiempos en el intervalo [0, T ]

i.e. |~b(x, t) −~b(x′, t)| ≤ L1|x − x′|, ∀ 0 ≤ t ≤ T

|σ(x, t) − σ(x′, t)| ≤ L2|x − x′|, ∀ 0 ≤ t ≤ T

Sea ~X0 una variable aleatoria en L2[0, T ] independiente del movimiento browniano considerado.

Entonces existe un ´unico proceso en L2_{[0, T ] tal que es soluci´}_{on de la ecuaci´}_{on (}₂₁_).9

Antes de demostrarlo damos varios resultados necesarios que dejamos sin demostraci´on (ver [O] y [Ev]).

Lema 1(Desigualdad de Gronwall). Sean φ un funci´on no negativa definida en el intervalo 0 ≤ t ≤ T , y sean C0, A unas constantes. Si se cumple

φ(t) ≤ C0+

Z t

0 Aφ(s)ds ∀ 0 ≤ t ≤ T

entonces se tiene

φ(t) ≤ C0exp(At).

Teorema 5 (Desigualdad para martingalas). Sea X una martingala entonces se tiene, si 1 < p < ∞, E m´ax 0≤s≤t|X(s)| p ≤ _p p − 1 p E(|X(t)|p_).

Lema 2 (Desigualdad de Chevichev). Sea X variable aleatoria, entonces para todo λ > 0 y p ∈ [1, ∞) se tiene

P (|X| ≥ λ) ≤E(|X|

p₎

λp

Lema 3 (Borel-Cantelli). Denotamos por Ani.o. al l´ımite superior de esta familia de conjuntos.

Es decir, aquellos elementos que est´an un n´umero infinito de veces. Entonces si

∞ X n=1 P (An) < ∞ entonces P (An i.o.) = 0

Ahora s´ı que podemos pasar a la demostraci´on del teorema de existencia y unicidad para las ecuaciones estoc´asticas.

Demostraci´on. (Unicidad) Supongamos que hay dos soluciones ~X y ~X′_{. Rest´andolas obtenemos}

~ X(t) − ~X′(t) = Z t 0 ~b( ~X(t), t) −~b( ~X′(t), t)dt + Z t 0 σ( ~X(t), t) − σ( ~X′(t), t)d ~W Entonces se tiene que

E(| ~X(t) − ~X′(t)|2) ≤ 2E Z t 0 ~b( ~X(t), t) −~b( ~X′(t), t)ds 2 + Z t 0 σ( ~X(t), t) − σ( ~X′(t), t)d ~W 2 9

(12)

Observamos que podemos utilizar Cauchy-Schwarz y la condici´on de ser Lipschitz para acotar cada t´ermino. E Z t 0 ~b( ~X(t), t) −~b( ~X′(t), t)ds 2 ≤ T E Z t 0 ~b( ~X(t), t) −~b( ~X′(t), t) 2 ≤ L2_TZ t 0 E(| ~X(t) − ~ X′_(t)|2₎

Para acotar el segundo sumando utilizamos las propiedades de la integral de Itˆo ([Ev],[Du]). E Z t 0 σ( ~X(t), t) − σ( ~X′(t), t)d ~W 2 = E Z t 0 σ( ~X(t), t) − σ( ~X ′_{(t), t)} 2 ds ≤ L2 Z t 0 E(| ~X(t) − ~ X′(t)|2)ds Y, considerando las dos desigualdades

E(| ~X(t) − ~X′(t)|2) ≤ C Z t

0 E(| ~X(t) − ~

X′(t)|2)ds Ahora podemos utilizar la desigualdad de Gronwall con

φ(t) = E(| ~X(t) − ~X′(t)|2), C0= 0

y conclu´ımos que ~X y ~X′ _{son iguales en casi todo punto para todo tiempo.}

(Existencia) Consideraremos las aproximaciones ~ Xn+1(t) = ~X0+ Z t 0 ~b(Xn_{(s), s)ds +}Z t 0 σ( ~Xn(s), s)d ~W

Usaremos el siguiente resultado (cuya demostración, basada en un método de inducción, puede consultarse en [Ev]): Sea la ’distancia’ dn_{(t) = E(| ~}_Xn+1_{(t) − ~}_Xn_(t)|2₎ Entonces se cumple dn(t) ≤ (M t) n+1 (n + 1)! ∀ n = 1, ..., 0 ≤ t ≤ T para alguna constante M = M (L, T, ~X0).

Se tiene, por los cálculos anteriores, que máx 0≤t≤T| ~X n+1_{(t) − ~}_Xn_(t)|2 _{≤ L}2_{T 2}Z T 0 | ~ Xn_{(t) − ~}_Xn−1_(t)|2_dt + máx 0≤t≤T2 Z t 0 σ( ~Xn(s), s) − σ( ~Xn−1(s), s)d ~W 2

Ahora usamos el teorema5y el resultado anterior y conclu´ımos que se tiene E[ m´ax 0≤t≤T| ~X n+1 (t) − ~Xn(t)|2] ≤ L2T 2 Z T 0 | ~ Xn(t) − ~Xn−1(t)|2dt + 8L2Z T 0 | ~ Xn_{(t) − ~}_Xn−1_(t)|2_dt ≤ C(M T ) n n!

Aplicando la desigualdad de Chevichev y el lema de Borel-Cantelli conclu´ımos que P m´ax 0≤t≤T| ~X n+1_{(t) − ~}_Xn_{(t)| >} 1 2n i.o. = 0

(13)

Entonces para casi todo ω, ~Xn _{converge uniformemente en [0, T ] a un proceso ~}_{X. Pasando al}

l´ımite en la definici´on de ~Xn+1_{y en las integrales conclu´ımos que el proceso l´ımite es soluci´on de la}

ecuaci´on (22). La prueba de que el proceso est´a en L2_{puede consultarse en [}_Ev_{] o en [}_O_{]. La prueba}

se basa en la definici´on recurrente del proceso Xn+1_{(t) y en la suma de la serie exponencial.}

Dado que una ecuación estocástica es una generalización de una ecuación ordinaria, pod´ıamos esperar que la demostración fuese similar. Sin embargo, dado que el browniano no es derivable en casi ningún punto, en general no podremos esperar que una solución de una ecuación estocástica vaya a ser diferenciable. La máxima regularidad que podemos esperar es la misma que para el browniano, que es Hölder-α con α < 1/2 en tiempo. En las condiciones del teorema tendremos Hölder-β con β < 1 en espacio.

Para introducir la idea de flujo estocástico, que no es más que la versión aleatoria de la idea de flujo de las EDO, usaremos un nuevo parámetro s, el tiempo inicial, y escribiremos ~Xt

s(x) para la

soluci´on de

d ~X(t) = ~b( ~X(t), t)dt + σ( ~X(t), t)d ~W , X(s) = x~ (23) As´ı se tiene la propiedad de flujo

~ Xt

u( ~Xsu(x)) = ~Xst(x) en c.t.p. ∀ 0 ≤ s ≤ u ≤ t ≤ T, ∀x ∈ Rd (24)

La demostraci´on de este hecho puede verse en las notas del curso impartido por M.Gubinelli en su p´agina web o en [Ku-84].

Para hablar de la regularidad respecto de los par´ametros necesitamos una desigualdad para poder aplicar el teorema de Kolmogorov. En [BF] puede encontrarse

E[| ~Xst(x) − ~Xt

′

s′(x′)|p] ≤ C[|x − x′|p+ |s − s′|p/2+ |t − t′|p/2] (25) Ahora, si consideramos x = x′ _{y queremos ver el exponente de H¨}_{older en el tiempo tenemos}

que aplicar el teorema de Kolmogorov de manera idéntica a como lo hicimos en la sección anterior. Conclu´ımos que, vista la solución como una función en s (o en t) el exponente de Hölder es γ < 1/2. Verlo para el espacio es similar. Consideremos ahora s = s′_{, t = t}′_{. Entonces aplicamos el teorema}

de Kolmogorov y conclu´ımos que el exponente es γ < 1. Hemos demostrado as´ı el resultado siguiente Teorema 6 (Regularidad). Sea una ecuación estocástica con coeficientes bajo las hipótesis del teorema4. Y sea ~Xt

s(x) su soluci´on. Entonces se tiene

1. s 7→ ~Xt s(x) es Hölder-γ si γ < 1/2. 2. t 7→ ~Xt s(x) es Hölder-γ si γ < 1/2. 3. x 7→ ~Xt s(x) es Hölder-γ si γ < 1.

Claro est´a que si se tiene una mayor regularidad en las funciones ~b y σ entonces se tendr´a mayor regularidad en el espacio. En concreto se tiene

Teorema 7. Sean los coeficientes de la ecuaci´on estoc´astica funciones Ck,α _{en x, entonces la}

soluci´on Xt

0(x) es Ck,β en x con β < α.

En el tiempo no ganaremos nada, porque el contraejemplo del movimiento browniano lo impide. Para las demostraciones rigurosas de estas afirmaciones puede consultarse [Ku-84].

Teorema 8. Sean los coeficientes de la ecuación estocástica satisfaciendo las hipótesis del teorema

4, entonces existe c constante tal que dos soluciones de la misma ecuaci´on con distintos valores iniciales cumplen

E[| ~X1(t) − ~X2(t)|2] ≤ |x1− x2|2ect.

Demostración. La idea de la prueba es aplicar la fórmula de Itô (ver apéndices) a la función norma, ρ2( ~X1(t), ~X2(t)) =

d

X

i=1

(X1i(t) − X2i(t))2

(14)

Hay que mencionar que hay dos tipos de ecuaciones estocásticas, cada uno de ellos basado en una integración estocástica diferente. Son las ecuaciones de Itô, que se basan en la integral de Itô y son las que trataremos aqu´ı, y las de Stratonovich, que se basan en la integral del mismo nombre. Para más detalles se pueden consultar los apéndices.

Las ecuaciones estocásticas podemos considerarlas como generalizaciones de la ecuación de Langevin para una part´ıcula suspendida en un medio y sometida a bombardeos aleatorios que cambian su velocidad. Es entonces fácil establecer que reflejan una difusión10_.

Pensando en las soluciones como difusiones es posible convencerse de que verificarán la propie-dad de Markov, esto es, que son procesos de Markov. La prueba rigurosa se puede consultar en [O]. En cualquier caso esto no es sorprendente, pues la aleatoriedad aparec´ıa por medio del movimiento browniano, y éste es un proceso de Markov. No ha de preocuparnos que los coeficientes puedan depender de t, pues podemos suponerlos independientes si añadimos t como otra coordenada de la incógnita ~X(t) ∈ Rd+1_.

Veremos que el hecho de ser un proceso markoviano nos da un semigrupo de operadores. Pero antes necesitamos definir la medida de Wiener.

4. La medida de Wiener

En esta secci´on presentaremos la medida de Wiener para poder continuar definiendo los se-migrupos asociados a procesos de Markov en la secci´on siguiente. Necesitamos esta medida para integrar en las funciones y construir as´ı soluciones de una EDP.

La medida de Wiener es la inducida por el movimiento browniano, visto, no como una funci´on ~

W (ω, t), sino como

~

W : Ω 7→ C([0, T ], Rd₎

Lo trataremos entonces como una variable aleatoria que toma valores en un espacio de funciones. En efecto, sea x un punto cualquiera, entonces podemos considerar los siguientes espacios de funciones Cx([0, T ], Rd) = {f ∈ C([0, T ], Rd), f (0) = x} (26)

Cxy([0, T ], Rd) = {f ∈ C([0, T ], Rd), f (0) = x, f (T ) = y} (27)

Podemos definir una medida en el espacio, (26) considerando un movimiento browniano que no parta de 0 sino de x.11 _{O equivalentemente podemos considerar el proceso ~}_{V (t) = x + ~}_{W (t).}

En el segundo caso, (27), la medida constru´ıda se dice condicionada ya que hemos impuesto el extremo final.

La manera rigurosa de construir ambas es similar.12 _{Para simplificar, consideraremos el}

ca-so unidimensional (d = 1) y x = 0.13 _{Consideraremos los conjuntos (que llamaremos cilindros)}

siguientes14_{. Dados tiempos t}

1, ...tn y borelianos en R B1, ..., Bn definimos el conjunto

ΠB1,...,Bn

t1,...,tn = {f ∈ C0([0, T ], R), f (ti) ∈ Bi} (28) Hemos de asignarles una probabilidad, y es ahora donde el c´alculo previo (14) nos ayuda. Pues les asignamos la probabilidad us´andolo.

W(ΠB1,...,Bn t1,...,tn ) = Z B1 . . . Z Bn n−1 Y i=0 1 (√2πti+1− ti) e−|x1|2t1 _e−|x2−x1|2(t2−t1) _...e −|xn−xn−1| 2(tn −tn−1)_dx_n_...dx₁ ₍₂₉₎

Observamos que si para cierto tiempo nuestro boreliano es todo el espacio entonces ese tiempo no cuenta, i.e. si en ti se tiene Bi= R entonces

W(ΠB1,...,Bn

t1,...,tn ) = W(Π

B1,...Bi−1,Bi+1,...,Bn

t1,...,ti−1,ti+1,...,tn )

10

De hecho a la función ~b se le llama drift, a σ, término de difusióny a las soluciones de ecuaciones como (21), difusiones de Itô.

11

Lo llamaremos espacio de caminos del ingl´es ’path space’ Cada una de las funciones ser´a un camino (’path’ )

12

Las separa una integraci´on (ver cap´ıtulo 3)

13

Notaremos W0= W. 14

Hay varias maneras de construir la medida de Wiener. Nosotros optaremos por considerar los cilindros y utilizar el teorema de extensi´on de Kolmogorov. Otra demostraci´on se puede consultar en [GJ].

(15)

0 50 100 150 200 250 300 350 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 t B₁ B₂ B 3 B 4

Figura 3: Los cilindros.

Esto es una consecuencia de la ecuaci´on de Chapman-Kolmogorov. Si p(t, x, y) =√1

2πtexp(−(x − y)

2_/2t)

entonces la ecuaci´on de Chapman-Kolmogorov se puede escribir p(s + t, x, y) =

Z

R

p(s, x, z)p(t, z, y)dz (30)

es decir, la probabilidad de ir en s + t de x a y es la misma que la de ir de x a z en s y de z a y en t siempre que contemos todos los z posibles.

Para poder utilizar el teorema de extensi´on de Kolmogorov hemos de ver que a conjuntos iguales se les asigna la misma medida. Es decir, hemos de ver que si

ΠB1,...,Bn t1,...,tn = Π A1,...,Am s1,...,sm entonces W(ΠB1,...,Bn t1,...,tn ) = W(Π A1,...,Am s1,...,sm )

Esto se puede reducir al caso donde un conjunto de tiempos y boreles contiene al otro, pues si ambos conjuntos son iguales entonces podemos considerar la intersecci´on de ambos y uno de ellos, i.e. tenemos el siguiente caso

ΠB1,...,Bn

t1,...,tn = Π

B1,...,Bn,A1,...,Am

t1,...,tn,s1,...,sm

Pero ahora podemos reducir la propiedad que queremos a la que hab´ıamos demostrado ya usando las ecuaciones de Chapman-Kolmogorov. En efecto, si se cumple la igualdad entonces en los tiempos ’nuevos’ sj del miembro de la derecha los boreles respectivos, Aj, han de ser todo el espacio. Si no

fuese as´ı, existe una funci´on continua que pasa por los borelianos correctos en todos los tiempos ti

(16)

iguales y obtenemos una contradicci´on. Una vez que los boreles son todo el espacio entonces usando las ecuaciones de Chapman-Kolmogorov podemos concluir que las medidas de ambos conjuntos son iguales.

Usamos el teorema de extensión (o de existencia) de Kolmogorov, pues tenemos que se satisfacen las condiciones de consistencia. Además, as´ı definida la medida es numerablemente aditiva en los cilindros. Que es finitamente aditiva es una simple observación. La numerabilidad viene de que podemos escribir15

W(∪∞i=1Ci) = W(∪Ni=1Ci) + W(∪∞i=N +1Ci)

por ser v´alido para un n´umero finito de conjuntos. Ahora conclu´ımos observando que el segundo sumando converge a cero cuando avanzamos en N por ser la medida de un conjunto que tiende al vac´ıo.

Por lo tanto tenemos una medida en la σ−álgebra generada por los cilindros antes mencionados. Sin embargo no está nada claro a simple vista cuál es dicha σ−álgebra.

Consideremos el conjunto

A = {φ, f(s) < φ(s) < g(s)}

para ciertas funciones continuas f, g. Sean silos racionales en el intervalo [0, T ]. Entonces podemos

escribir el conjunto como A = ∞ [ n=1 \ si {f(si) + 1/n < φ(si) < g(si) − 1/n}

Por lo que tenemos que es una unión numerable de intersecciones de cilindros. Conjuntos como el anterior estarán en la σ−álgebra, y por lo tanto estarán los boreles (de la convergencia uniforme), pues bastará fijar ψ y tomar f = ψ − ε y g = ψ + ε. Es más, se puede demostrar que ambas σ−álgebras en realidad coinciden.

Introduciremos la notaci´on, muy com´un, ~

W (ω, t) = ω(t) Entonces la medida anterior nos define una esperanza

E0[f ] =

Z

C0([0,T ],R)

f (ω)dW (31)

Observamos que el cero aparece como sub´ındice en el integrando porque consideramos un movi-miento browniano con origen el cero. Si queremos considerar movimovi-mientos partiendo de un punto x escribiremos

Ex[f ] =

Z

Cx([0,T ],R)

f (ω)dWx (32)

Esta probabilidad se concentrar´a en las funciones continuas que pasan por x en tiempo 0. Si fijamos unos tiempos, entonces podemos cambiar la integral en el espacio de funciones por una integral en Rd.16 Esto es consecuencia de c´omo hemos definido la medida en los cilindros.

E[f1( ~W (t1)), ..., fn( ~W (tn))] = Z Rn n Y j=1 fj(xj)p(tj− tj−1, xj, xj−1)dx1dx2, ...dxn

Esta fórmula nos es bien conocida en un caso con un sólo tiempo, pues no es más que la fórmula del semigrupo de la ecuación del calor. As´ı si

H0= −1 2∆ e−tH0_{f (x) =} Z R p(t, x, y)f (y)dy = Ex[f ( ~W (t))] = E0[f (x + ~W (t))] (33) 15

Se sabe (ver [Kl]) que si consideramos constantes de difusi´on imaginarias la medida resultante no es numera-blemente aditiva.

16

(17)

Esta es la primera f´ormula de representaci´on que hemos conseguido.

Observamos que entonces podemos escribir la medida en funci´on de estos operadores. E0[f1( ~W (t1)), ..., fn( ~W (tn))] = [e−t1H0f1e−(t2−t1)H0f2...e−(tn−tn−1)H0fn](0)

Hemos definido la medida de Wiener como la inducida por el movimiento browniano, pero podemos hacer lo mismo con otros procesos. Por ejemplo la medida definida en (27) no est´a inducida por el movimiento browniano, sino por el puente browniano ~X, definido como

~

X(t) = ~W (t) + t

T(y − ~W (t)) Se puede definir tambi´en como la soluci´on de la SDE

d ~X(t) = t − ~X(t)

T − t dt + d ~W

con el mismo punto inicial que tenga el movimiento browniano que lo induce.

As´ı podemos definir la medida (con medida del espacio total igual a p(T2− T1, x, y)) inducida

por el puente browniano que en tiempo T1est´a en x y en T2est´a en y como unos ciertos operadores,

exactamente igual que en el caso anterior, Z Cy x([T1,T2],R) f1( ~X(t1), f2( ~X(t2), ...fn( ~X(tn)dW_[Tx,y₁_,T₂_]= = [e−(T1−t1)H0_f 1e−(t2−t1)H0f2...e−(tn−tn−1)H0fne−(T2−tn)H0(·, y)](x) (34)

Comentario 5 Cualquier difusión nos da una medida en el espacio de las funciones continuas con respecto a la σ−álgebra de los cilindros17_{. Puede consultarse [}_F_{] para más detalles. Lo que}

ocurrir´a es que no ser´a posible escribirla tan expl´ıcitamente salvo en unos pocos casos.

0 200 400 600 800 1000 1200 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2

Figura 4: Trayectorias de un puente browniano.

17

En realidad cualquier proceso estocástico con trayectorias continuas nos define una medida en la σ−álgebra de los cilindros. También podemos extender esta idea a las EDO que tengan unicidad, existencia y sus soluciones sean continuas. Sólo que en este caso la medida es totalmente singular, con probabilidad 1 caerá en la única solución de la EDO.

(18)

Parte II

Teor´ıa para las ecuaciones lineales

5. Problemas Parab´

olicos

5.1. La ecuaci´

on del calor

Es un resultado clásico que la solución fundamental de la ecuación del calor ∂tu =

1

2∆u (35)

es una gaussiana. Esto se puede ver de diversas maneras, desde buscar soluciones autosemejan-tes (ver [Ev-08] o [I]), a razonar con paseos aleatorios (ver [Ev]). Es este ´ultimo camino el que seguiremos nosotros.

Fijemos T > 0 el tiempo final de nuestra evoluci´on y consideremos el problema de Cauchy para la ecuaci´on (35). Sea f (x) el dato inicial, que supondremos positivo y en L1_(Rd_{) con d la dimensi´}_on

del espacio (t´ıpicamente será 1,2,o 3). Entonces la solución de la ecuación (35) viene dada por u(t, x) = Z Rd f (y)W (0, x, t, y)dy, (36) con W (s, x, t, y) = 1 p2π(t − s)e −|x−y|2 2(t−s) _. ₍₃₇₎

Si recordamos la definici´on1 que dimos anteriormente se tiene que si ~Xt

0(x) es la posici´on en

tiempo t de un movimiento browniano que en tiempo 0 estaba en x la esperanza de f ( ~Xt

0(x)) con

respecto a la medida de Wiener,18_{se puede escribir como}

Ex[f ( ~X0t(x))] = Z C([0,T ])f (ω(t))dW(ω) = Z Rd f (y)W (0, x, t, y). (38)

Observamos que las expresiones (36) y (38) coinciden. Por lo tanto tenemos que Ex[f ( ~X0t(x))]

es solución (clásica) de (35). As´ı tenemos que si consideramos a las soluciones de las ecuaciones estocásticas como una generalización de las curvas caracter´ısticas para ecuaciones parabólicas en-tonces las trayectoria del movimiento browniano serán las curvas caracter´ısticas de la ecuación del calor.

Este m´etodo nos brinda una nueva intuici´on. Consideremos una cantidad c de part´ıculas que en el tiempo inicial estaban en el punto z, i.e. f (y) = cδ(y − z). Dichas part´ıculas comienzan a moverse siguiendo un movimiento browniano, por lo tanto tienen unas probabilidades de acabar tras un tiempo t en el punto x que vienen dadas por W (0, x, t, z). As´ı u(t, x) = cW (0, x, t, z) es la cantidad esperada de part´ıculas en el punto x.

De nuestra representaci´on probabilista se extraen varias consecuencias f´acilmente. Para empezar se conserva el signo de f . Recordemos que f ≥ 0, entonces

Ex[f ( ~X0t(x)] ≥ 0,

por ser la esperanza de una funci´on positiva. Tambi´en se conserva la masa. En efecto

Z Rd Ex[f ( ~X0t(x))]dx = Z Rd Z Rd f (y)W (0, x, t, y)dydx = Z Rd f (y)dy, pues basta observar que

Z

RdW (0, x, t, y)dx = 1, ∀t, y.

18

Esta medida, soportada en las funciones continuas C([0, T ]) para todo T , la denotaremos como dW(ω) por estar inducida por el movimiento browniano ~W (t, ω).

(19)

Si ahora suponemos que f (x) = f (|x|) y por lo tanto es sim´etrica se tendr´a que Ex[f (X0t(x))]

será simétrica. La razón en este caso es que la probabilidad de cambiar entre dos posiciones x e y viene dada por una función de la distancia entre ambos puntos.

En realidad la relación del movimiento browniano con la ecuación del calor no deber´ıa ser nada sorprendente, pues conocemos la naturaleza atómica de la mater´ıa, as´ı como que la temperatura es una medición del grado de agitación, siempre existente, de los átomos. Si recordamos que el modelo que daba origen al movimiento browniano era el de considerar una part´ıcula pequeña inmersa en un flu´ıdo, y por lo tanto sometida a choques aleatorios con las part´ıculas vecinas, no es llamativa la aparición en escena de la ecuación del calor. De otra manera, un modelo que refleja la agitación de part´ıculas pequeñas debe tener alguna relación con la ecuación del calor.

Esta formulación de integrales funcionales y difusiones markovianas además de una nueva intui-ción, nos da también un nuevo método para aproximar las soluciones de la ecuaciones en derivadas parciales, el método de Monte-Carlo (ver la parte de Aplicaciones).

Un apunte histórico: La relación entre la ecuación del calor ∂tu =

D 2∆u

y el movimiento browniano ya la not´o Albert Einstein a principios del siglo XX. De esta relaci´on se puede obtener

D = T R N µ

con T la temperatura absoluta, R la constante universal de los gases, N el número de Avogadro y µ un número que depende del tamaño de la part´ıcula y de la viscosidad del flu´ıdo en el que estaba inmersa la part´ıcula browniana. As´ı utilizaron esta expresión de la constante D para determinar el número de Avogadro. Este logro bien valió un premio Nobel en 1926 para Perrin.

5.2. Ecuaciones parab´

olicas generales

El caso de la ecuación del calor (35) es bien conocido. Sin embargo, es un caso particular de un resultado más amplio para ecuaciones parabólicas del tipo

∂tu = d

X

i,j=1

aij(x)∂xi∂xju + ~b(x) · ∇u − c(x)u, u(0, x) = f (x) (39)

donde suponemos que aij(x),~b(x) ∈ Rd y c(x) ∈ R+ son funciones Cb2,α(Rd), con

Pd

i,j=1aijθjθi≥

h|θ|2 _{con h > 0, para todo vector θ ∈ R}d _{y a}

ij una matr´ız sim´etrica. Requeriremos que c ≥ 0

para evitar problemas de resonancia al encontrar c algún autovalor del problema el´ıptico asociado. Además supondremos que existe una matriz σ tal que la matriz de coeficientes se puede escribir como a = σσt_{. En general σ no será ´}_{unica (pensemos que no tiene por qué ser una matriz cuadrada),}

pero la medida que induce Xt

0(x) no es sensible a estos cambios en σ (ver [F]). Fijemos T > 0 el

tiempo final de nuestra evoluci´on y el dato inicial f ∈ Cb(Rd) ∩ L1(Rd).

Esperamos que por ser una generalización de una ecuación del calor admita un resultado pa-recido al de la sección anterior para un cierto tipo de ecuaciones estocásticas. As´ı en función de σ y ~b definiremos una ecuación estocástica que hará las veces de curva caracter´ıstica y que nos inducirá una medida en las funciones continuas.

Procederemos de la siguiente manera: primero nos centraremos en el caso en el que c(x) = 0 y por lo tanto no hay absorción. En este caso daremos una descripción probabilista del semigru-po involucrando ecuaciones estocásticas y esperanzas con respecto a la medida que inducen en C([0, T ]). Tras haber dado un resultado para este caso, consideraremos el caso c ≥ 0 y utilizaremos la fórmula de Feynman-Kac para caracterizar el semigrupo.

El caso c = 0: Consideremos la ecuaci´on diferencial estoc´astica, escrita formalmente como una diferencial (ver [O])

(20)

~ Xt

0(x) en este caso es la posici´on de una part´ıcula que sufre ’choques aleatorios anis´otropos’ (el

término σd ~W ) y un transporte en la dirección ~b(x) que cambian su velocidad. Un ejemplo f´ısico es el caso de una part´ıcula inmersa en una disolución que fluye por una rampa. El fluir da el término ~b(x) y el que sea una disolución genera la anisotrop´ıa σ(x).

Dada la solución de la ecuación estocástica (40) definimos el semigrupo

Ttf (x) = Ex[f ( ~X0t(x))] = Z C([0,T ])f (ω(t))dX (ω) = Z Rd f (y)P (0, x, t, dy) = Z Rd f (y)p(0, x, t, y), (41) donde P (s, x, t, Γ) es la funci´on de transici´on, que da la probabilidad de que en tiempo t − s nuestro proceso que parte de x en tiempo s llegue a Γ, es decir

P (s, x, t, Γ) = P ( ~Xst(x) ∈ Γ) =

Z

Γ

p(s, x, t, y)dy

y p(s, x, t, y) es la densidad de transición. Queremos hacer notar que nuestra p(s, x, t, y) en el caso de una ecuación estocástica como (40) no es otra que la solución fundamental del problema parabólico (39) con c = 0, tal y como parec´ıa claro del caso de la ecuación del calor.19_{Se tiene que}

dX es la medida en las funciones continuas que induce la solución de la ecuación (40). La esperanza es con respecto a dX . Todo esto es análogo al caso de la medida de Wiener (ver [F]).

Tal y como suced´ıa con la ecuación del calor, si consideramos como una generalización de una curva caracter´ıstica a la solución de una ecuación estocástica, entonces las soluciones de (40) serán las curvas caracter´ısticas de ecuaciones parabólicas como (39) o (43).

Observamos que si f ≥ 0 entonces Ttf ≥ 0. Adem´as tenemos Ttf ∈ L∞, es m´as, se tiene

||Ttf ||∞≤ ||f||∞.

Por lo tanto Ttes un semigrupo de contracciones en L∞. A este tipo de semigrupos se les llama

markovianos.

Que efectivamente es un semigrupo se desprende de la propiedad de Markov20_{y de las}

propie-dades de la esperanza condicionada (ver [Ev]),

E[f ( ~X0t+s(x))|Σ( ~X(z), 0 ≤ z ≤ s)] = E[f( ~Xst( ~X0s(x)))] = Ttf ( ~X0s(x))

Ahora tomando esperanzas y aplicando las propiedades de la esperanza condicionada conclu´ımos Ts+tf (x) = TsTtf (x)

Definimos su dominio como

D(Tt) = {f ∈ L∞, ||Ttf − f|| → 0, si t → 0}

Este conjunto es un espacio vectorial (por la linealidad de la esperanza y la desigualdad triangular). Adem´as es cerrado. En efecto, basta observar que si

fn∈ D(Tt) → f, Ttfn→ Ttf

entonces

||Ttf − f||∞≤ ||Ttf − Ttfn||∞+ ||Ttfn− fn||∞+ ||fn− f||∞→ 0.

Y por lo tanto f ∈ D(Tt).

Se tiene tambi´en que

t 7→ Ttf

19

Se llama soluci´on fundamental porque permite construir la soluci´on para un dato inicial continuo y acotado dado.

20

Hay muchas formulaciones de la propiedad de Markov, nosotros utilizaremos una con esperanzas (ver [Du],[F]). ~

X es un proceso de Markov si

E[ ~X(t + h)|Σ{ ~X(s), 0 ≤ s ≤ t}] = E[ ~X(t + h)| ~X(t)]. Σ(·) denota la σ−´algebra generada.

(21)

es continuo. En efecto,

||Tt+hf − Ttf ||∞≤ ||Tt(Thf − f)||∞≤ ||Thf − f||∞→ 0

Hemos demostrado as´ı el siguiente resultado

Proposición 1(Semigrupo). Dado una solución de la ecuación estocástica (40) (o en general un proceso de Markov), se tiene que

1. Ttes un semigrupo de contracciones en L∞, con dominio

D(Tt) = {f ∈ L∞, ||Ttf − f|| → 0, si t → 0}.

Adem´as el dominio es un espacio vectorial cerrado. 2. s 7→ Ts es continuo.

Para fijar las ideas, veamos algunos ejemplos en una dimensi´on espacial.

Ejemplo 1: Consideremos la ecuaci´on diferencial ordinaria, escrita para conservar la notaci´on como

dXt(x) = bdt.

Entonces, como no tiene ning´un tipo de naturaleza estoc´astica, podemos obviar las esperanzas. En este caso el operador es

Ttf (x) = Ex[f (X0t(x))] = f (x + bt).

Vemos que es justamente la soluci´on de la ecuaci´on de transporte ut= bux, u(0, x) = f (x)

En este caso el generador del semigrupo es

A = b∂x.

Ejemplo 2: Consideremos ahora la ecuación estocástica dX = dW, X(0) = x con solución

X0t(x) = x + W (t)

Vimos anteriormente que

Ttf (x) = Ex[f (x + W (t))]

resolv´ıa la ecuaci´on del calor con difusi´on 1/2, ut= 1

2uxx, u(x, 0) = f (x) En este caso el generador es

A = 1 2∂

2 x.

(22)

Ejemplo 3: Podemos considerar la ecuación estocástica dX = bdt + dW, X(0) = x y entonces el semigrupo irá asociado a la ecuación

ut= bux+1

2uxx En este caso el generador es

A = b∂x+

1 2∂

2 x.

En general, observamos que el generador del semigrupo, que se define como A = l´ım h→0 Thf (x) − f(x) h , es el operador el´ıptico, Au = 1 2 d X i,j=1 ai,j(x)∂xi∂xju + d X i=1 bi(x)∂xiu. (42)

al menos si lo restringimos a las funciones suficientemente regulares (ver [F] o [Dy]).

Para demostrarlo sólo hemos de tomar esperanzas en la fórmula de Itô aplicada a f (x) ∈ C2 b(Rd)

(ver [F]). Por lo tanto tenemos asociada la ecuaci´on d

dtTtf (x) = ATtf (x), T0f (x) = f (x). Para m´as detalles puede consultarse [Du] o [App].

Comentario 6 Se tiene que el operador A tiene sentido cl´asico para las funciones f ∈ C2 b(Rd),

adem´as C2

b(Rd) ⊆ D(A) ⊂ D(Tt) ⊂ L∞. Los dominios dependen de la dimensi´on considerada,

as´ı para d = 1 D(A) = C2

b(Rd), pero para d > 1 es estrictamente mayor. Veremos que en realidad

no hay que pedir tanto al dato inicial.

Queremos remarcar que antes ten´ıamos la continuidad en t, pero ahora, al menos para ciertas funciones f , tenemos la derivabilidad en t. Querremos la derivabilidad tambi´en en x, pero esa es debida al propio proceso de Markov.

La f´ormula de Bismut-Elworthy-Li (ver [Du] o [Ku-84]) nos permite escribir la derivada espacial de Ttf (x) sin usar las derivadas de f . En concreto,

Teorema 9(F´ormula de Bismut-Elworthy-Li). Sea f ∈ Cb(Rd), una soluci´on de (40) ~X0t(x) con

coeficientes C_b2,α(Rd_{) y v, w dos direcciones. Entonces la derivada de T}

tf (x) en la direcci´on v es

∇vTtf (x) ≤ C|v|√

t ||f||∞. Para las segundas derivadas la f´ormula es similar,

∇v,wTtf (x) ≤ C|v||w|

t ||f||∞. Por lo tanto se tiene el siguiente teorema.

Teorema 10. Sea Xt

0(x) la soluci´on de la ecuaci´on (40) con coeficientes C 2,α

b (Rd) y consideremos

Ex la esperanza con respecto a la medida en las funciones continuas inducida por X0t(x). Sea

f ∈ Cb(Rd) ∩ L1(Rd). Entonces

u(t, x) = Ttf (x) =

Z

C([0,T ])f (ω(t))dX (ω) = E

x[f (X0t(x)]

es la única solución clásica de la ecuación de Fokker-Planck siguiente ∂tu = d X i,j=1 aij(x)∂xi∂xju + ~b(x) · ∇u, u(0, x) = f (x). (43) con aij = σσt.

(23)

Como demostraremos el teorema análogo con c ≥ 0, que es un caso más general, este teorema lo dejamos sin demostración por ser ésta similar a la del teorema11.

As´ı hemos descrito el semigrupo para (43) con t´ecnicas probabilistas.

Podemos pensar que tenemos f (y) part´ıculas inicialmente en el punto y. La velocidad de estas part´ıculas evoluciona siguiendo la ecuaci´on (40). Al final recuperamos Ttf (x) como la cantidad

media de part´ıculas que han llegado en tiempo t al punto x.

El caso c ≥ 0: Consideremos la ecuaci´on (40) con coeficientes C_b2,α(Rd_{). Para no preocuparnos}

de la regularidad del dato inicial lo tomaremos f ∈ C2

b(Rd). Escribamos

˜

Au = Au − c(x)u, con A el operador (42).

Entonces se tiene el famoso teorema de Feynman y Kac, Teorema 11(Feynman-Kac). Sea Xt

0(x) la soluci´on de la ecuaci´on (40) con coeficientes C 2,α b (Rd)

y consideremos Ex la esperanza con respecto a la medida en las funciones continuas inducida por

Xt

0(x). Sea f ∈ Cb2(Rd) ∩ L1(Rd) el dato inicial de (39). Entonces

u(t, x) = ˜Ttf (x) = Z C([0,T ]) f (ω(t))e−R0tc(ω(s))dsdX (ω) = E_x[f ( ~Xt 0(x))e− Rt 0c( ~X s 0(x)ds)_].

es la única solución clásica de la ecuación de Fokker-Planck siguiente ∂tu =

d

X

i,j=1

aij(x)∂xi∂xju + ~b(x) · ∇u − c(x)u, u(0, x) = f (x). (44) con aij = σσt.

Demostraci´on. Sea t fijo. Consideramos los procesos Z0r(x) = − Z r 0 c( ~X0s(x))ds, Y0r(x) = eZ r 0(x) con diferenciales dZ0r(x) = −c( ~X0r(x))dr, dY0r(x) = −c( ~X0r(x))Y0r(x)dr.

Entonces la diferencial del producto u(t − r, ~Xr

0(x))Y0r(x) es

d(u(t − r, ~X0r(x))Y0r(x)) = d(u(t − r, ~X0r(x)))Y0r(x) + udY0r(x).

Por la f´ormula de Itˆo aplicada a u(t − r, ~Xr

0(x)) se tiene

− ∂tu(t − r, ~X0r(x)) + Au(t − r, ~X0r(x))

dr + ∇u(t − r, ~X0r(x)) · σd ~W .

Si introducimos esto en la f´ormula anterior obtenemos d(u(t − r, ~X0r(x))Y0r(x)) = −∂u(t − r, ~X r 0(x)) ∂t + Au(t − r, ~X r 0(x)) dr + ∇u(t − r, ~X0r(x)) · σd ~W Y0r(x) − u(t − r, ~X0r(x))c( ~X0r(x))Y0r(x).

Ahora integramos hasta r = t y tomamos esperanzas con respecto a la medida que induce (40). El resultado de esto es ˜ Ttf (x) − u(t, x) = E Z t 0 −∂u(t − r, ~X r 0(x)) ∂t + ˜Au(t − r, ~X r 0(x)) e−R0rc( ~X s 0(x)ds_dr = 0.

(24)

Observamos que si bien para la ecuación (43) la solución sólo depende del punto final de la trayectoria del proceso solución de (40), para una ecuación con absorción como (39) la solución depende de toda la trayectoria. Por lo tanto, si fijamos x y t entonces estamos integrando un funcional.

Para ˜Ttf (x) hay una proposición análoga a la proposición1. No la demostraremos ahora

com-pleta, pero s´ı que veremos que ˜Ttes un semigrupo de contracciones en L∞ y el decaimiento de los

operadores Tty ˜Tten Lp(Rd). Se tiene que es un semigrupo de contracciones en L∞. En efecto,

|| ˜Ttf (x)||∞≤ ||f(x)||∞ Z C([0,T ]) e−R0tc(ω(s))dsdX (ω) ∞ ≤ ||f(x)||∞.

Adem´as, la masa va desapareciendo Z Rd ˜ Ttf (x)dx ≤ Z Rd Ttf (x)dx = Z Rd Ex[f (X0t(x))]dx = Z Rd Z Rd p(0, x, t, y)f (y)dydx = Z Rd f (y)dy. A los semigrupos que, como ˜Tt, pierden masa se les llama submarkovianos. Una ecuaci´on como (43)

en un dominio acotado U de Rd _{con condiciones de borde u|}

∂U = 0 nos da otro tipo de semigrupo

submarkoviano.

De la ca´ıda de la masa y de que sea un semigrupo de contracciones en L∞_{podemos concluir}

|| ˜Ttf (x)||p≤ ||f|| 1 p 1 ||f||∞ Z C([0,T ]) e−R0tc(ω(s))dsdX (ω) ∞ !1−1p , ∀p ∈ [1, ∞], ∀t ≥ 0. Por si no tuviesemos el t´ermino c nos interesa c´omo decae la densidad de probabilidad en L∞_,

para probar el decaimiento del operador Tten todos los Lp(Rd). En [Fr] (teorema 4.5) tenemos la

siguiente cota

|p(t, x, y)| ≤ C td/2.

Una prueba (distinta de la de [Fr]) de demostrar dicha desigualdad es considerar unas coordenadas adaptadas a la advecci´on. As´ı consideramos las caracter´ısticas

~ Y (t) = Z t 0 ~b(~Y (s))ds Definimos ahora v(t, x) = u(t, x − ~Y (t)) con lo que d X i,j=1 ai,j(x)∂xi∂xju = d X i,j=1 ai,j(x)∂xi∂xjv pero ∂tv = ∂tu − ∇u · ~Y′(t) = ∂tu − ∇u ·~b(x).

Observamos que v resuelve la ecuaci´on del calor (con unos coeficientes ai,j(x)) y que se tiene

||u||∞ = ||v||∞, por lo que tenemos probado el decaimiento (ver la construcci´on de la soluci´on

fundamental para esta difusi´on en [I]) y conclu´ımos as´ı || ˜Ttf (x)||p≤ ||Ttf (x)||p≤ ||f|| 1 p 1||f|| 1−1 p ∞ ≤ c (td/2₎1−1 p, ∀p ∈ (1, ∞], ∀t ≥ 0.

Con estos resultados hemos puesto de manifiesto que comportamientos microsc´opicos ’como el movimiento browniano’ nos dan ecuaciones macrosc´opicas como (43).

Comentario 7 Toda esta técnica probabil´ıstica es válida gracias a que tenemos un proceso de Markov, pero estos no deben ser necesariamente difusiones de Itô, i.e. soluciones de ecuaciones estocásticas con ruido blanco como (40), como veremos pueden ser procesos de Lévy más generales que incluyan saltos.

En lo que resta de secci´on trataremos el problema de valor inicial y de contorno con dato Dirichlet en un dominio suficientemente regular. Sea U el dominio del problema.

(25)

Proposici´on 2. Sea el τxtiempo de parada que nos indica el tiempo que tarda X0t(x), soluci´on de

(40), en golpear por primera vez la frontera del dominio U . Si f ∈ Cb2(Rd) ∩ L1(Rd) y g ∈ Cb(∂U )

entonces la soluci´on del problema de valores iniciales y de contorno ∂tu = 1 2 d X i,j=1

ai,j(x)∂xi∂xju + ~b · ∇u, u(0, x) = f(x) si x ∈ U, u|∂U = g(x), (45) es

u(t, x) = Ex[f (X0t(x)χ{t<τx}(t)] + Ex[g(X

τx

0 (x))χ{t≥τx}(t)], (46)

donde χA es la caracter´ıstica del conjunto A.

Demostraci´on. Sea U ⊂ Rd _{un dominio con frontera regular y el tiempo de parada τ}

x definido

anteriormente. Con t fijo, aplicamos la f´ormula de Itˆo a u(t − r, ~Xr 0(x)), u(t − r, ~X0r(x)) − u(t, x) = Z r 0 ∂s+ A u(t − s, ~X0s(x))ds + Z r 0 ∇u(t − s, ~ X0s(x)) · σd ~W . Observamos que ∂s= −∂t.

Ahora hacemos r = t y observamos que si t ≥ τx entonces u(0, X0τx(x)) = g(X0τx(x)). Tomamos

esperanzas con respecto a las medidas inducidas por la soluci´on de (40), concluyendo Ex[f ( ~X0t(x))χ{t<τx}(t)] + Ex[g( ~X

τx

0 (x))χ{t≥τx}(t)] − u(t, x) = 0.

Si la condición de borde fuese Neumann también se puede dar un resultado, pero hay que definir una reflexión y es más laborioso (ver [R]).

Un apunte histórico: Richard P. Feynman publicó un art´ıculo ([Fe-48]) en 1948 (una revisión de su tesis doctoral ([Fe-05]) del año 1942) en el que daba una tercera formulación de la mecánica cuántica.21 _{La formulaci´}_{on de Feynman se basa en una integral de caminos y en el uso de las}

ecuaciones de Chapman-Kolmogorov. Sin embargo hay problemas para definir una medida con respecto a la que integrar. En palabras del propio Feynman

“The formulation given here suffers from a serious drawback. The mathematical con-cepts needed are new. (...) One needs, in adittion, an appropiate measure for the space of the argument functions x(t) of the functionals.”

Veamos rápidamente qué hace Feynman. Consideremos una part´ıcula cuántica de masa m, sin efectos reslativistas o esp´ın que se mueve bajo los efectos de un potencial V (x). Sea K(ta, xa, tb, xb)

el núcleo de la ecuación de Schrödinger. Entonces si φ es la contribución de cada camino se tiene K(ta, xa, tb, xb) =

X

caminos de (ta, xa) a (tb, xb)

φ(X(t))

La idea ahora es que todos los caminos contribuyen a la probabilidad, pero lo hacen de manera distinta. Esto es bastante intuitivo. La interpretación más popular de la mecánica cuántica afirma el carácter probabil´ıstico del movimiento a esas escalas. Por lo tanto, si sabemos que una part´ıculas se mueve entre dos puntos es razonable pensar que la probabilidad ’se traslada’ al camino que ha seguido. En concreto se tiene

φ(X(t)) = Cei/~A (X(t)) donde C es una constante para normalizar y

A_{(X(t)) =} Z tb ta 1 2m(X ′_(t))2 − V (X(t))dt. 21

Las otras dos formulaciones son la matricial de Heisenberg y la basada en espacios de Hilbert y operadores de Schrödinger. Esta formulación de Feynman es la más intuitiva en opinión del autor.