Central para Martingalas
Tesis Pre-Grado en Matem´ aticas David Alejandro Henriquez Bernal
Mayo 21, 2019
Asesor: Prof. Dr. Michael H¨ogele, Co-Ascesor: Prof. Dr. Sylvie Roelly Departamento de Matem´aticas, Universidad de los Andes
Las primeras versiones del Teorema del L´ımite Central se remontan a las ideas de De Moivre y Laplace, en donde la sucesi ´on de sumas renor- malizadas de variables aleatorias de Bernoulli con varianza acotada y promedio finito convergen en distribuci ´on a una variable aleatoria con distribuci ´on normal est´andar. En el presente trabajo se busca compren- der una versi ´on generalizada del Teorema del L´ımite Central donde la sucesi ´on de sumas renormalizadas de variables aleatorias se sustituyen por martingalas en tiempo continuo, un tipo de procesos estoc´asticos, con saltos acotados y variaci ´on cuadr´atica lineal en el tiempo. De es- ta manera al considerar una sucesi ´on de martingalas re-normalizadas el l´ımite es un proceso estoc´astico, un movimiento Browniano, en vez de vectores aleatorias Gaussianos. Siguiendo el articulo de Ward Whitt [24], para conseguir demostrar el Teorema del L´ımite Central en este contexto se usar´a la siguiente estructura. Primero, se introducen las he- rramientas necesarias para demostrar que toda subsucesi ´on convergen- te converge en el espacio de funciones continuas y converge al mismo limite (a trav´es de un corolario del Teorema de Prokhorov (3.6)). Segun- do se caracteriza el l´ımite de la sucesi ´on, o m´as precisamente de alguna sub-sucesi ´on, es decir se muestra que el limite es un movimiento Brow- niano. Por otro lado para ilustrar el Teorema del L´ımite Central para Martingalas se expondr´an dos ejemplos de sucesiones de martingalas locales que convergen a un movimiento Browniano, espec´ıficamente, se estudiar´a una sucesi ´on de procesos de Poisson compuestos compensa- dos y una sucesi ´on de caminatas aleatorias.
Quiero agradecer a Michael H ¨ogele por el acompa ˜namiento y asesoramien- to brindado durante la elaboraci ´on de este trabajo, a Sylvie Roelly por su orientaci ´on y el apoyo recibido en Potsdam cuando este proyecto estaba co- menzando. De igual manera quiero agradecer a mi familia y amigos por el soporte que me ofrecieron a lo largo de este proceso.
´Indice general III
1 Introducci ´on 3
2 Objetos principales y el TFLC 11
2.1. Objetos principales: martingalas, la variaci ´on cuadr´atica, el
movimiento Browniano . . . 11
2.2. Enunciado del TFLC para martingalas con saltos acotados . . 23
2.3. Ejemplos: procesos de Poisson compuestos compensados y ca- minatas aleatorias . . . 24
3 Pre-compacidad de las medidas de la sucesi ´on de martingalas locales 33 3.1. Herramientas de demostraci ´on: pre-compacidad en espacios de medidas . . . 33
3.2. Martingalas estoc´asticamente acotadas . . . 39
3.3. Demostraci ´on de laC-pre-compacidad con saltos acotados . . 40
4 Caracterizaci ´on del l´ımite 53 4.1. Herramientas de demostraci ´on: Teorema de L´evy . . . 53
4.2. Identificaci ´on del l´ımite con saltos acotados . . . 58
A Ap´endice 61 A.1. C´alculo de los primeros momentos de un proceso compuesto de Poisson . . . 61
A.2. Teoremas del l´ımite central cl´asico . . . 62
A.3. Tipos de convergencia de vectores aleatorios . . . 63
A.4. Anexo de las demostraciones de algunos teoremas . . . 64
Bibliograf´ıa 77
La siguiente lista muestra la notaci ´on usada a lo largo del documento N Los n ´umeros naturales {1,2,3,...}
d∈N Dimensi´on del espacio de estados R Los n ´umeros reales
t∈ [0,∞) Tiempo determinista
C([0,∞),Rd) Espacio de funciones continuas sobre[0,∞)con valores enRd c`adl`ag Espacio de funciones sobre[0,∞)con valores en Rd tales que,
∀t ∈ [0,∞) ∀tn↓t, l´ımtn→tX(tn) =X(t), (continua por derecha) y
∀t ∈ (0,∞) ∀tn↑t, l´ımtn→tX(tn) =X(t−), (el limite por izquierda exis- te)
∆X(t) Salto en el tiempo t para una funci ´on c`adl`ag X (∆X(t):=X(t)-X(t-)) i.i.d Variables aleatorias independientes e id´enticamente distribuidas S,E Espacios polacos, espacios topol ´ogicos metrizables completos y sepa-
rables
D([0, T],Rd) Espacio polaco constituido por funciones c`adl`ag sobre [0, T] dotado con la topolog´ıa de Skorokhod
(Ω,A,P) Espacio de probabilidad (Ft)t≥0 Filtraci ´on enA
B(E) Borelianos sobre E, σ-´algebra generada por los abiertos del espacio topol ´ogico(E,T )
τ, σ Tiempo de parada con respecto a la filtraci ´on(Ft)t≥0
M Martingala con respecto a la filtraci ´on(Ft)t≥0
Dd σ-´algebra de Borel deD([0,∞),Rd), B(D([0,∞),Rd)con respecto a la topolog´ıa de Skorokhod
(B(t)t≥0) Movimiento Browniano (N(t))t≥0 Proceso de Poisson
Introducci´ on
La ley de los grandes n ´umeros d´ebil expresa que dada una sucesi ´on de va- riables aleatorias independientes e id´enticamente distribuidas con primer momento finito, el promedio aritm´etico de las primeras n variables alea- torias converge en probabilidad a el promedio cuando n tiende a infinito.
Ahora, asumiendo la existencia de segundos momentos, las primeras versio- nes del teorema del limite central surgieron a partir de la ley de los grandes n ´umeros al considerar renormalizar la suma por una succi ´on(an/n)n≥1con el fin de que la probabilidad del error no converja en probabilidad a un va- lor distinto a cero. Resultando en que an := √
nσ y que el limite tiene una distribuci ´on normal est´andar independiente de los sumandos.
En la actualidad, hablar de teoremas del l´ımite central hace referencia a una multitud de afirmaciones acerca de la convergencia a una distribuci ´on nor- mal (infinito dimensionales) de una sucesi ´on de distribuciones, asociadas a funciones que dependen de un n ´umero creciente de vectores aleatorias (mul- tidimensionales) o en algunos casos elementos aleatorios m´as generales (en espacio de funciones infinito dimensionales). [6]
El teorema del l´ımite central desde sus or´ıgenes ha sido de gran importan- cia en el ´area de la estad´ıstica. Esto se debe a que dada una poblaci ´on y un muestreo aleatorio tomado de la poblaci ´on, la distribuci ´on de los promedios de las muestras tiende a una distribuci ´on normal a medida que el tama ˜no de las muestras aumentan [7]. Por ejemplo al realizar un experimento la va- riabilidad de los promedios implica la variabilidad de los los errores que en el limite de muchas mediciones presenta una distribuci ´on normal [23].
De igual manera la importancia que los teoremas del l´ımite central han teni- do sobre las matem´aticas y m´as precisamente sobre la teor´ıa de la probabili- dad, radica en los m´etodos matem´aticos, principalmente en an´alisis, que se desarrollaron alrededor de ella y el estatus como linea de investigaci ´on en s´ı
que le ayudo a brindar a la probabilidad dentro de las matem´aticas. De esta manera para alcanzar una mayor comprensi ´on del papel en las matem´aticas de los teoremas del limite central, es necesario hacer un recuento hist ´orico de las versiones que han surgido del mismo desde el siglo XVIII hasta me- diados del siglo XX. [6]
El primer trabajo alrededor del teorema del l´ımite central se remonta al art´ıculo publicado por Abraham de Moivre (1667–1754) en 1733. En este de Moivre desarrolla aproximaciones a distribuciones binomiales con el fin de refinar el trabajo de Jakob Bernoulli alrededor de la ley de los grandes n ´umeros. Sin embargo, el trabajo de de Moivre nunca expreso la universali- dad que caracteriza a los teoremas del l´ımite central. En gran medida porque el trabajo de de Moivre solo fue un caso particular del teorema del l´ımite central para el caso de variables aleatorias de Bernoulli con probabilidad p = 12 (por ejemplo, el lanzamiento de una moneda justa es modelado por una variable aleatoria de Bernoulli). [6]
El segundo trabajo importante en relaci ´on a el teorema del l´ımite central se encuentra con Pierre-Simon de Laplace (1749–1827) quien en 1812, despu´es de 40 a ˜nos de trabajo, publica el articulo Th´eorie analytique des probabilit´es en el cual presenta una generalizaci ´on del trabajo de de Moivre para p 6= 1.
En este trabajo los problemas que busca resolver Laplace se dividen en dos categor´ıas, por un lado en ”sumas de variables aleatorias” y por otro lado en ”hallar el inverso de probabilidades”. Dentro de la primera categor´ıa se encuentra el problema de estimar probabilidades a priori en relaci ´on a la ganancia y a la perdida en juegos de azar. Es en este contexto que Laplace desarrolla un m´etodo para aproximar las probabilidades de sumas de varia- bles aleatorias independientes usando funciones generadoras. [6]
Despu´es, Sim´eon Denis Poisson (1781–1840) brinda un an´alisis mas riguroso al teorema del l´ımite central de Laplace a trav´es de dos art´ıculos publicados entre 1824 y 1829. M´as precisamente el aporte de Poisson al teorema del l´ımite central es una comprensi ´on m´as profunda de lo que es una variable aleatoria (definici ´on importante en la versi ´on actual del teorema del l´ımite central) y algunos contraejemplos 1 que permitieron delimitar un poco la validez del teorema del l´ımite central. [6]
Alrededor del siglo XIX, empieza a crecer dentro de los matem´aticos de la ´epoca un consenso hacia una mayor abstracci ´on de las matem´aticas y hacia su desprendimiento del mundo f´ısico como raz ´on de existir, lo que encamina a los matem´aticos a buscar un mayor rigor en las matem´aticas. Es
1El contraejemplo mas prominente que considero Poisson fue la funci ´on caracter´ıstica f(x) =
1
π(1+x2) que no cumple el TLC ya que para esa distribuci ´on ning ´un momento existe.
tal vez contra intuitivas en la teor´ıa del error.
Dentro de este contexto se encuentran los matem´aticos Peter Gustav Lejeune Dirichlet (1805–1859) y Augustin Louis Cauchy (1789–1857) quienes entre los a ˜nos 1830 y 1850 trabajando en aplicaciones del teorema del l´ımite central a la teor´ıa del error, buscar obtener demostraciones rigurosas del teorema del limite central. Lo anterior ocasiona que el teorema empiece a adquirir relevancia dentro de las matem´aticas a parte de su aplicaci ´on en problemas pr´acticos.2.
De esta manera dentro de las principales aplicaciones de Dirichlet al teore- ma del l´ımite central se encuentran modificaciones del m´etodo Laplaciano
3 de aproximar una suma de variables aleatorias independientes a una dis- tribuci ´on normal. De igual manera dentro de las contribuciones de Cauchy, usando consideraciones similares a las de Dirichlect, expone una serie de cri- ticas al m´etodo de m´ınimos cuadrados de Laplace a trav´es de una disputa con Ir´en´ee Jules Bienaym´e (1796–1878) quien defend´ıa el m´etodo de Laplace.
[6]
En la segundo mitad del siglo XIX y principios del siglo XX encontramos la escuela rusa de St. Petersburgo, de la mano de Pafnutii Lvovich Chebyshev (1821–1894), Andrei Andreevich Markov (1856–1922) y Aleksandr Mikhailo- vich Lyapunov (1857–1918). Las ideas de Chebyshev se encuentran en una serie de art´ıculos publicados entre 1845 y 1887, en los cuales expresa cons- tantemente la necesidad de presentar cotas a los errores de las desviaciones entre las probabilidades exactas y las expresiones limites. Con respecto al teorema del l´ımite central, Chebyshev en 1887 presenta una demostraci ´on a trav´es del m´etodo de los momentos 4. Sin embargo, su demostraci ´on sigue presentando los mismos problemas de rigurosidad con respecto a las demos- traciones de Poisson y Laplace (cortar expansiones en series que en ocasio- nes divergen). Es importante resaltar en este punto que es hasta Chebyshev que el teorema del l´ımite central adquiere la forma de teorema l´ımite y se
2Un discusi ´on acerca de la creeciente abstraccion en matematicas se puede ver en Schnei- der, Ivo 1981a. Die Situation der mathematischen Wissenschaften vor und zu Beginn der wissenschaftlichen Laufbahn von Gauss. In Carl Friedrich Gauss (1775–1855). Sammelband von Beitr¨agen zum 200. Geburtstag von C. F. Gauss, I. Schneider (ed.), pp. 9–36. M ¨unchen:
Minerva.
3En t´erminos actuales, el m´etodo de Laplace en el fondo consist´ıa en hallar la funci ´on ca- racter´ıstica (la funci ´on caracter´ıstica de una variable aleatoria X esE[eitX]) de una suma de variables aleatorias para despu´es encontrar a trav´es de la funci ´on inversa la probabilidad de que la suma de variables aleatorias tome un valor particular.
4El m´etodo de los momentos busca encontrar cotas superiores e inferiores a integrales de la formaRb
a f(x)dx donde f(x)son densidades de probabilidad, dado que a, b∈ [A, B], a<b y los momentos M0 :=RB
A f(x)dx, M1 := RB
Ax f(x)dx,...,Mm :=RB
Axmf(x)dx existen hasta alg ´un m∈N.
expresan condiciones necesarias para su validez.
Por otro lado Markov en un articulo publicado en 1898 presenta una de- mostraci ´on mas completa del teorema del l´ımite central siguiendo las mis- ma ideas que Chebyshev. Sin embargo deja la sensaci ´on, al igual que con Chebyshev, que la importancia del teorema del l´ımite central radica en su utilidad como un espacio en donde se pueden presentar m´etodos relaciona- dos a momentos y fracciones continuas.
Finalmente el ´ultimo exponente de la escuela de St. Petersburg que consi- deraremos es Lyapunov quien presento una demostraci ´on del teorema del l´ımite central en un articulo publicado en el a ˜no 1900. La importancia de su contribuci ´on se encuentra en el hecho de que fue la primera persona en presentar una demostraci ´on rigurosa del teorema del l´ımite central siguien- do el m´etodo de Laplace de funciones caracter´ısticas, y no el m´etodo de los momentos de Chebyshev y Markov. Adem´as, es importante se ˜nalar su introducci ´on de un lema sobre la convergencia de funciones caracter´ısticas a un distribuci ´on normal, ya que en este lema se basa su demostraci ´on y sera usado por otros matem´aticos como Lindeberg y L´evy. De igual mane- ra Lyapunov fue capaz de brindar una cota a los errores como demandaba Chebyshev. [6]
Por otro lado en el a ˜no 1905 Albert Einstein (1879-1955) presenta la explica- ci ´on correcta de que es el movimiento Browniano que Brown reporto en sus observaciones. Por otro lado el primer modelo del movimiento Browniano como objeto matem´atico se le atribuye a Louis Jean-Baptiste Alphonse Ba- chelier (1870-1946), sin embargo su trabajo no hace referencia al movimien- to Browniano ni a Brown. La primera construcci ´on rigurosa del movimiento Browniano se le atribuye a Norbert Wiener (1894-1964) quien introduce la medida de Wiener en el espacio C[,1] bas´andose en el trabajo de Einstein [21].
En el a ˜no 1920 Jarl Waldemar Lindeberg (1876–1932) publica su trabajo en relaci ´on al calculo probabil´ıstico, con una versi ´on del teorema del l´ımite cen- tral bajo hip ´otesis muy d´ebiles (por ejemplo no asume que las variables alea- torias son independientes) y hasta se podr´ıa decir necesarias (condici ´on de Lindeberg)5. De esta manera las ventajas del teorema del l´ımite central de Lindeberg consiste en dos aspectos, por un lado se puede aplicar a contextos muy generales y por otro toma en consideraci ´on la tasa de convergencia. Sin embargo, aunque la demostraci ´on de Lindeberg brinda una demostraci ´on ri- gurosa del teorema del l´ımite central asumiendo condiciones suficientes, no presenta una demostraci ´on sobre la necesidad de las hip ´otesis, aspectos que ser´an cubiertos mas adelante por L´evy y Feller en 1935 y 1937 respectiva-
5La condici ´on de Lindeberg expresa que en el limite cuando n tiende a infinito la varianza de las variables aleatorias acotadas es igual a la varianza de las variables aleatorias sin acotar
suficientes para la versi ´on del teorema del limite central presentada por Lin- deberg usando el m´etodo de Laplace de las funciones caracter´ısticas, a ´un la versi ´on que presenta no es lo suficientemente general ya que solo considera sumas normadas.
Por otro lado Paul L´evy (1886–1971) despu´es de varias publicaciones entre 1925 y 1935, en 1930 adopta un nuevo m´etodo 6 desarrollado por el mismo y deja al lado el m´etodo de Laplace de las funciones caracter´ısticas. En el articulo de 1935 L´evy realiza tres contribuciones importantes al teorema del l´ımite central. En primer, lugar presenta condiciones suficientes y necesa- rias para la convergencia de sumas normalizadas con segundos momentos de variables aleatorias independientes e id´enticamente distribuidas a una distribuci ´on normal. En segundo lugar, presenta condiciones necesarias y suficientes para el caso m´as general de sumandos independientes. En tercer lugar intenta exponer las condiciones necesarias y suficientes para varia- bles dependientes, martingalas. De hecho, en el teorema del l´ımite central la suma de n variables aleatorias centradas en cero y renormalizadas por el producto de la ra´ız de n y la varianza es una sucesi ´on de martingalas con respecto a la filtraci ´on natural. Por otro lado, las demostraciones que pre- sento en relaci ´on al caso de variables dependientes reca´ıan en un lema que L´evy no demostr ´o en 1935, pero que fue demostrado en 1936 por Cram´er, raz ´on por la cual L´evy presenta otro articulo en 1937 en donde refina estas demostraciones. [6]
En la d´ecada de 1930, Andr´ei Nikol´ayevich Kolmog ´orov (1903-1987) presen- ta una axiomatizaci ´on de la teor´ıa de la probabilidad en el articulo ”Grund- lagen der Wahrscheinlichkeitsrechnung”publicado en Alemania en 1933. De igual manera en esta d´ecada tambi´en surgen desarrollos alrededor de varia- bles aleatorias sobre espacios de funciones (primeras ideas de lo que hoy en d´ıa se conoce como procesos estoc´asticos) y los avances de L´evy en relaci ´on a un teorema del l´ımite central para variables aleatorias dependientes.
En 1933 Kolmog ´orov tambi´en presenta una construcci ´on del movimiento Browniano dando una justificaci ´on mas rigurosa de la construcci ´on de Ba- chelier. De igual manera en 1948 L´evy presenta una construcci ´on del mo- vimiento Browniano usando argumentos de interpolaci ´on [13] y en 1951 Monroe David Donsker (1925–1991) presenta su construcci ´on del movimien- to Browniano a trav´es del limite de caminatas aleatorias [21].
6El m´etodo de la concentraci ´on y la dispersi ´on de L´evy busca comparar el tama ˜no de una variable aleatoria con la suma de todas las variables aleatorias. En este m´etodo la dispersi ´on de una variable aleatoria hace referencia a la m´ınima longitud de un intervalo asociado a una probabilidad particular y la concentraci ´on es la m´axima probabilidad asociada a un intervalo determinado.
La construcci ´on del movimiento Browniano que presenta Donskers es en realidad una versi ´on funcional del teorema del l´ımite central, siguiendo las ideas de Paul Erd˝os (1913-1996) y Mark Kac (1914-1984) sobre el principio de invarianza (el comportamiento l´ımite de una sucesi ´on de funciones defi- nidas a partir de sumas de variables aleatorias se puede determinar al consi- derar el l´ımite cuando las sumas tienen distribuciones especiales) en donde una sucesi ´on de distribuciones que depende de una sucesi ´on de variables aleatorias independientes (caminatas aleatorias sim´etricas) convergen a un movimiento Browniano. [6]
Por ´ultimo, continuando con las ideas de L´evy y Donsker la versi ´on funcio- nal para martingalas que estudiaremos en el presente trabajo, en el fondo esta considerando un teorema del l´ımite central para cada tiempo. Por lo tanto el trabajo consistir´a en encontrar cual debe ser las constantes de renor- malizacion (los an :=
√n
σ en el caso no funcional del teorema y la variaci ´on cuadr´atica para el caso funcional, pero con las condiciones necesarias para que el l´ımite del proceso de variaci ´on cuadr´atica sea lineal en el tiempo) adecuadas para el caso funcional, de manera tal que bajo el l´ımite correcto la sucesi ´on de martingalas converja a un proceso que en cada tiempo pre- sente una distribuci ´on normal, por lo cual el candidato mas natural es el movimiento Browniano. Esta versi ´on funcional del teorema del l´ımite cen- tral puede ser atribuida al trabajo de Patrick Paul Billingsley (1925–2011), de la escuela norteamericana, Yuri Vasilyevich Prokhorov (1929-2013), Anatoliy Volodymyrovych Skorokhod (1930-2011), de la escuela sovi´etica, entre otros, quienes en los a ˜nos 50’s-60’s desarrollaron en gran medida las ideas que se desarrollaran en el presente trabajo [3].
Por un lado Prokhorov en 1956 trabajando en espacios de funciones separa- bles y completos presenta el esquema de demostraci ´on que usaremos en este trabajo. Una sucesi ´on de procesos estoc´asticos convergen en distribuci ´on a un proceso estoc´astico X si, la sucesi ´on de distribuciones es pre-compacta, las sucesiones finito dimensionales convergen y el l´ımite de las distribucio- nes finito dimensionales caracterizan a X [8]. Por otro lado Skorokhod bus- co comprender un poco mejor el teorema en espacios de funciones que no necesariamente son completos y separables, trabajando en el espacio de fun- ciones continuas por derecha y con l´ımite por izquierda encontr ´o distintos tipos de convergencia en estos espacios seg ´un el tipo de topolog´ıa [22]. Por otro lado Billingsley hace uso del resultado de Prokhorov sobre la equivalen- cia entre pre-compacidad en espacios de medidas y la compacidad relativa y adem´as usa la caracterizaci ´on de L´evy de un movimiento Browniano. De- mostrando que el teorema funcional del l´ımite central para martingalas, se reduce a demostrar que la sucesi ´on de martingalas es pre-compacta y el l´ımi- te se puede caracterizar usando el teorema de L´evy7 [2].
7El teorema de L´evy expresa que dado un proceso estoc´astico d-dimensional X(t), el proceso M(t) :=X(t) −X(0)es un movimiento Browniano d-dimensional si M(t)es continuo y la
como pre-compacidad en espacios de medidas, sucesiones estoc´asticamente acotadas y la caracterizaci ´on del limite de L´evy [25]. En el presente trabajo es este el articulo que seguiremos para la demostraci ´on del Teorema funcional del l´ımite central con saltos acotados.
variaci ´on cuadr´atica entre las componentes j, k∈ {1, ..., d}es igual a δj,kt.
Objetos principales y el TFLC
2.1. Objetos principales: martingalas, la variaci´ on cuadr´ ati- ca, el movimiento Browniano
Los objetos principales que se estudiaran en este trabajo son una clase de procesos estoc´asticos, las martingalas, sin embargo antes de poder introdu- cirlas es necesario definir que es un proceso estoc´astico. En primer lugar, dado un espacio de probabilidad (Ω,A,P)y un espacio medible(E,A0)es posible definir un proceso estoc´astico con espacio de estados E, como una familia de variables aleatorias (Xt)t≥0 donde Xt : Ω → E. No obstante, en ocasiones resulta mas conveniente considerar un proceso estoc´astico como una sucesi ´on de funciones aleatorias(Xt(ω))ω∈Ω donde Xt(ω):[0,∞) →E.
A cada funci ´on Xt(ω)se le llama camino o realizaci ´on del proceso.
Nota 2.1 En el presente trabajo los espacios de llegada E de los procesos estoc´asticos no solo ser´an espacios de medida, sino que adem´as ser´an espacios m´etricos de manera que sea posible definir un valor esperado. Sin embargo con el fin de que exista cierta compatibilidad entre la σ-´algebra y la topolog´ıa (inducida por la m´etrica) es necesario que el espacio de llegada sea separable y completo.
Definici ´on 2.2 (Espacio vectorial Polaco) Sea (E,B(E)) un espacio vectorial vec- torial topol´ogico separable y completo, luego E se llama espacio Polaco.
Definici ´on 2.3 (Proceso estoc´astico) [10] Sea (Ω,A,P)un espacio de probabi- lidad, E un espacio vectorial Polaco,(E,B(E))el espacio medible y I⊂R.
Una familia de variables aleatorias(Xt)t∈I en (Ω,A,P)con valores en(E,B(E)), se llama un proceso estoc ´astico, con espacio de estados E y conjunto de ´ındices (o conjunto de tiempos) I.
La existencia de un proceso estoc´astico dada una familia de distribuciones finito dimensionales se encuentra determinada por el Teorema de extensi ´on
de Kolmogorov, sin embargo antes de definir el teorema es necesario intro- ducir que quiere decir que una familia de medidas de probabilidad sobre productos finitos sea consistente.
Definici ´on 2.4 [10] Sea(Ωi,Ai)i∈[0,∞) una colecci´on de espacios medibles, Ωi :=
×
ik=0Ωk yAi := Nik=0Ak. Adem´as sea(Pi)i∈[0,∞)una colecci´on de medi- das de probabilidad definidas sobre(Ωi,Ai)para cada i ∈ [0,∞).Luego si para i, j≥ k y A∈ Ak
Pi(A×Ωk+1× · · · ×Ωi) =Pj(A×Ωk+1× · · · ×Ωj), entonces la colecci´on(Pi)i∈[0,∞)se llama consistente.
Ahora con el prop ´osito de extender la definici ´on a un conjunto arbitrario de
´ındices I ⊂ [0,∞), es necesario definir la proyecci ´on can ´onica.
Definici ´on 2.5 [10] Sea I⊂ [0,∞)y(Ωi)i∈Iuna colecci´on arbitraria de conjuntos tales queΩ :=
×
i∈IΩi denota el espacio producto.Luego Xi :Ω→Ωi, ω →ω(i)se llama la proyecci´on a la i-´esima coordenada.
De manera mas general para J⊂ J0 ⊂ I la funci´on XJJ0:
×
j∈J0
Ωj →
×
j∈J
Ωj, ω0 →ω0|J,
sea llama proyecci´on can´onica. En particular XJ := XJI.
Definici ´on 2.6 Sea I ⊂ [0,∞), (Ωi,Ai)i∈I una colecci´on de espacios medibles y (PJ, J ⊂ I f inito) una familia de medidas de probabilidad sobre (Ωi,Ai) donde Ωi :=
×
ik=0Ωk yAi :=Nik=0Ak.Luego si
PL=PJ◦ (XLJ)−1 para todoL⊂ J ⊂ I finito, la colecci´on(PJ, J ⊂ I f inito)se llama consistente.
Teorema 2.7 (Teorema de extensi ´on de Kolmogorov (1933)) [10]
Sea I ⊂ [0,∞)un conjunto arbitrario de ´ındices y(Ei,B(Ei))i∈I una colecci´on de espacios medibles donde Ei es un espacio vectorial Polaco. Sea (PJ, J ⊂ I f inito) una familia consistente de medidas de probabilidad sobre(EJ,B(E)J)donde EJ :=
×
k∈JEk yB(E)J :=Nk∈JB(Ek).Entonces existe una ´unica medida de probabilidadP sobre(Ω,A)tales que PJ =P◦X−J 1para todo J ⊂ I.
Nota 2.8 Sea I ⊂ [0∞), luego el proceso estoc´astico (Xt)t∈I como una colecci´on de variables aleatorias con valores en el espacio de funciones
×
t∈I
Et es muy grande y poco ´util. Entonces por lo general se busca considerar solamente un espacio de
funciones con mas propiedades espec´ıficas como continuidad.
Ahora si E := Rd entonces el espacio de funciones a considerar es el espacio de funciones continuas sobre Rd con valores en [0,∞),C([0,∞),Rd), o si esto no es posible, el espacio de funciones continuas a derecha y con l´ımite por izquierda (el cual con la norma J1, que es una norma que se obtiene a partir de una perturbaci´on en el tiempo y el espacio de la norma uniforme, forma un espacio m´etrico separable y completo conocido como el espacio de Skorokhod ).
Definici ´on 2.9 (Funciones c`adl`ag,D([0, T],Rd))
Sea T > 0 yD([0, T],Rd) un espacio de funciones con valores en Rd definidas sobre el intervalo[0, T]tales que para toda funci´on X enD([0, T],Rd)se cumplen las siguientes condiciones
∀t ∈ [0, T] ∀tn↓t, l´ımtn→tX(tn) =X(t), (continua por derecha),
∀t ∈ (0, T] ∀tn↑t, l´ımtn→tX(tn) =X(t−), (el l´ımite por izquierda existe), entonces a el espacio de funciones D([0, T],Rd) se le llama espacio de funciones c`adl`ag con valores en [0, T]. En particular cuando T es arbitrariamente grande obtenemos el espacio de funciones c`adl`ag sobre[0,∞),D([0,∞),Rd).
Nota 2.10 La palabra c`adl`ag proviene de su acr´onimo en franc´es ”continue `a droite, l´ımite `a gauche” (continua por derecha y l´ımite por izquierda).
Ahora describiremos algunas propiedades que cumple el espacio de funcio- nes continuas sobre el intervalo [0, T],C([0, T],Rd)y que contin ´uan siendo validas en el espacio de funciones c`adl`agD([0, T],Rd).
Teorema 2.11 [1] Sea T>0 luego,
1. D([0, T],Rd)es un espacio vectorial con suma y multiplicaci´on por escalar punto a punto.
2. Si f , g ∈ D([0, T],Rd)entonces f g ∈ D([0, T],Rd). Mas aun si f(t) 6= 0 para todo t ∈ [0, T]entonces 1/ f ∈ D([0, T],Rd).
3. Sea h∈C(Rd,Rd)y f ∈D([0, T],Rd)entonces h◦ f ∈D([0, T],Rd). 4. Toda funci´on c`adl`ag sobre[0, T]se encuentra acotada en intervalos compactos.
5. Toda funci´on c`adl`ag sobre[0, T]es uniformemente continua por derecha en interva- los compactos.
6. El l´ımite uniforme de una sucesi´on de funciones c`adl`ag en[0, T]es c`adl`ag.
7. Toda funci´on c`adl`ag sobre [0, T] se puede aproximar uniformemente en intervalos compactos por una sucesi´on de funciones escalonadas.
8. Toda funci´on c`adl`ag sobre[0, T]es Borel medible.
Demostraci ´on1. D([0, T],Rd)es un sub-espacio del espacio vectorial de todas las funciones de[0, T]aRd,(Rd)[0,T].
Sean f , g∈D([0, T],Rd)y(tn)n≥1una sucesi ´on tales que tn↓t entonces
tl´ımn→t(f +g)(tn) = l´ım
tn→tf(tn) +l´ım
tn→tg(tn) = f(t) +g(t) = (f+g)(t), y si λ ∈R entonces
tl´ımn→tλ f(tn) =λl´ım
tn→t f(tn) =λ f(t).
De igual manera si(t0n)n≥1es una sucesi ´on tales que t0n ↑t (t6=0) y f , g∈ D([0, T),Rd)entonces
tl´ım0n→t(f+g)(t0n) = l´ım
t0n→tf(t0n) + l´ım
t0n→tg(t0n) = f(t−) +g(t−) = (f+g)(t−), y si λ ∈R entonces
tl´ım0n→tλ f(t0n) =λl´ım
t0n→tf(t0n) =λ f(t−).
2. Sean (tn)n≥1 y (t0n)n≥1 dos sucesiones tales que tn ↓ t y t0n ↑ t0 (t0 6= 0) respectivamente entonces
tl´ımn→tf g(tn) = l´ım
tn→t f(tn)l´ım
tn→tg(tn) = f(t)g(t), y
tl´ım0n→tf g(t0n) = l´ım
t0n→t f(tn)l´ım
t0n→tg(tn) = f(t0−)g(t0−), Ahora si f(t) 6=0 para todo t∈ [0, T)entonces
tl´ımn→t(1/ f)(tn) =1/ l´ım
tn→tf(tn) =1/ f(t), y
tl´ım0n→t(1/ f)(t0n) =1/ l´ım
t0n→tf(tn) =1/ f(t0−).
3. Sean (tn)n≥1 y (t0n)n≥1 dos sucesiones tales que tn ↓ t y t0n ↑ t0 (t0 6= 0) respectivamente entonces
tl´ımn→th◦ f(tn) =h(l´ım
tn→tf(tn)) =h◦f(t), y
tl´ım0n→th◦ f(t0n) =h(l´ım
t0n→tf(tn)) =h◦f(t0−).
4. Sea K⊂ [0, T]un subconjunto compacto y p∈Rd. Luego queremos ver que existe r >0 tales que f(K) ⊂Br(p).
Sea t ∈K, como f es continua por derecha, existe δt+>0 tales que
|f(s) − f(t)| < 1 para todo s ∈ (t, t+δt+). Luego si rt+ = 1+ |f(t) −p| entonces
|f(s) −p| ≤ |f(s) − f(t)| + |f(t) −p| <rt+, es decir f(s) ∈ Brt+(p)para todo s∈ (t, t+δt+).
De manera similar como l´ımite por la izquierda de f existe, existe δt− > 0 tales que |f(s) − f(t)| < 1 para todo s ∈ (t−δt−, t). Luego si rt− = 1+
|f(t−) −p|entonces
|f(s) −p| ≤ |f(s) − f(t)| + |f(t) −p| <rt−,
por lo tanto f(s) ∈ Brt−(p) para todo s ∈ (t−δt−, t). Ahora para todo s ∈ Ut = (t−δt−, t+δt+), f(s) ∈ Brt(p)donde
rt =m´ax{rt−, rt+}.
Finalmente como{Ut|t∈ [0, T]}es un recubrimiento abierto de K, entonces existe n ∈N y t1, ..., tn ∈ K tales que K⊂ U1∪ · · · ∪Uny por lo tanto para todo s ∈ K obtenemos que f(s) ∈ Br(p) en donde r = m´ax{rt1, ..., rtn}, es decir f(K) ⊂Br(p).
5. Sea ε>0 , K⊂ [0, T]compacto y f una funci ´on c`adl`ag. Luego queremos en- contrar δ >0 tales que para todo y y para todo x, si x, y∈K y y∈ (x, x+δ) entonces |f(x) − f(y)| <ε.
De esta manera como f es continua por derecha en cada punto x ∈ K, en- tonces existen δx >0 tales que f((x, x+δ2x)) ⊂Bε
2(f(x)).
Si adem´as δ0 ∈ K, como[0, δ0) ∪ ((x, x+ δ2x))x∈K es un recubrimiento de K entonces existe un recubrimiento finito[0, δ0) ∪ ((xi, xi+ δ2xi))i=1,...,n .
De esta manera si 2δ :=m´ın{δx12 , ...,δxn2 }, y si y∈ (x, x+2δ)como x∈ (xi, xi+ δ2xi)para alg ´un i entonces
|y−xi| ≤ |y−x| + |x−xi| < δ 2+ δxi
2 < δxi 2 + δxi
2 =δxi, es decir y∈ (xi, xi+ δ2xi). Por lo tanto y∈ (x, x+2δ)implica que
|f(xi) − f(y)| < ε2 y por lo tanto
|f(x) − f(y)| ≤ |f(x) − f(xi)| + |f(xi) − f(y)| ≤ ε 2+ ε
2 =ε.
6. Sea fn una sucesi ´on de funciones c`adl`ag en[0, T]. Luego si f(x)es el l´ımite uniforme de fn :[0, T] →Rd, entonces f es c`adl`ag si es continua por derecha y el l´ımite por izquierda existe para todo x. Sea x∈ [0, T]luego
Continuidad por derecha.
Sea ε > 0, luego por definici ´on del l´ımite existe n0 > n tales que supx∈[0,T]|f(x) − fn0(x)| ≤ 3ε.
Ahora fn0(x)es continua por la derecha en x por lo tanto existe δ> 0 tales que si y∈ (x, x+δ)entonces|fn0(x) − fn0(y)| ≤ 3ε.
Pero entonces si y∈ (x, x+δ),
|f(x) − f(y)| ≤ |f(x) − fn0(x)| + |fn0(x) − fn0(y)| + |fn0(y) − f(y)|
≤ ε 3 + ε
3+ ε 3 =ε.
L´ımite por izquierda existe.
Sea ε > 0, luego por definici ´on del l´ımite existe n0 > n tales que
|f(x−) − fn0(x−)| ≤ 3ε.
Ahora el l´ımite por izquierda en x de fn0 existe, por lo tanto existe δ>0 tales que si y∈ (x−δ, x)entonces|fn0(x−) − fn0(y)| ≤ 3ε. Pero entonces si y∈ (x−δ, x),
|f(x−) − f(y)| ≤ |f(x−) − fn0(x−)| + |fn0(x−) −fn0(y)| + |fn0(y) − f(y)|
≤ ε 3 + ε
3+ ε 3 = ε.
7. Sea δ>0 y 0=x0<...< xN =T una sucesi ´on de puntos tales que
0 < xn+1−xn < δ para n = 0, ..., N−1. Entonces es posible definir una funci ´on escal ´on dada por
g(x) =
(f(xn), xn ≤x< xn+1
f(xN−1), x =T.
Luego por 5. f es uniformemente continua por derecha, por lo tanto dado ε>0 existe δ>0 tales que
|f(x) − f(y)| <ε si y ∈ [x, x+δ).
Ahora para cada x∈ [0, T)existe n tales que xn≤ x≤xn+1. Pero entonces
|xn−x| ≤ |xn+1−xn| <δ, y por lo tanto
|f(x) −g(x)| = |f(x) − f(xn)| <ε.
Ahora si x=T,
|xN−1−x| ≤ |xN−xN−1| <δ, y por lo tanto
|f(x) −g(x)| = |f(x) − f(xN−1)| <ε
8. Toda funci ´on c`adl`ag sobre[0, T]es Borel medible ya que por 7. toda funci ´on c`adl`ag se puede aproximar por funciones escal ´on y las funciones escal ´on
son Borel medibles.
Nuestro inter´es en este trabajo se encuentra en el espacio de Skorkhod so- bre el intervalo [0,∞). Sin embargo para esto es necesario primero dotar con una topolog´ıa que permita construir procesos estoc´asticos al espacio D([0, T],Rd) , para as´ı obtener el espacio de Skorokhod sobre el intervalo [0, T].
Definici ´on 2.12 (Espacio de Skorokhod, D([0, T],Rd)) Sea T> 0 y
D([0, T],Rd)el espacio de funciones c`adl`ag sobre el intervalo [0, T]. Adem´as para cada T >0 consideremos la m´etrica sobreD([0, T],Rd)
dT(x, y):= ´ınf
λ∈Λ{sup
s<t
{logλ(t) −λ(s)
t−s } ∨ sup
t∈[0,T]
|x(t) −y(λ(t))|}, (2.1)
donde Λ es el espacio de funciones de [0, T]a [0, T]continuas y estrictamente cre- cientes.
Luego al espacio m´etrico(D([0, T],Rd), dT)se llama el espacio de Skorokhod sobre el intervalo[0, T], que denotaremos simplemente comoD([0, T],Rd).
Ejemplo 2.13 Sea(tn)n≥1una sucesi´on de n ´umeros reales tales que tn→1 y sean xn, y∈D([0, 2],R)tales que xn=1[0,tn], y=1[0,1].
Luego si λn(t) ∈Λ tales que,
λn:= (1
tnt si 0≤t≤ tn
1
2−tnt+212−−ttn
n si tn≤t≤2.
Ahora como|xn−y(λn)| =0 para todo n∈N y l´ımn→∞log(λn(t)−t−λsn(s)) =0, dT(xn, y):= ´ınf
λ∈Λ{sup
s<t
{log(λ(t) −λ(s)
t−s )} ∨ sup
t∈[0,T]
|xn(t) −y(λn(t))|} =0.
Nota 2.14 El espacio D([0, T],Rd)es un espacio m´etrico separable y completo es decir es un espacio Polaco.
Definici ´on 2.15 (Espacio de Skorokhod, D([0,∞),Rd)) SeaD([0,∞),Rd)el espacio de funciones c`adl`ag sobre el intervalo[0,∞). Ahora para cada entero m>0 consideremos la funci´on
gm(t) =
1 si t≤m−1,
m−t si m−1< t<m,
0 si t≥m.
Luego para x, y∈D([0,∞),Rd)es posible definir la siguiente m´etrica d∞(x, y):= 1
2m
∑
∞ m=1(1∧dm(gmx, gmy)), (2.2) de manera que (D([0,∞),Rd), d∞) es un espacio m´etrico denominado el espa- cio de Skorokhod sobre el intervalo [0,∞), que denotaremos simplemente como D([0,∞),Rd).
Si observamos la ecuaci ´on (2.2) que define a d∞, el papel de las funciones gm
es simplemente restringir las funciones x, y ∈ D([0,∞),Rd) a D([0, T],Rd) de manera continua.
Nota 2.16 (H,A) es un espacio de Borel si existe un conjunto de Borel B ∈ B(R)isomorfo a H como espacios medibles. Por lo tanto (D([0,∞),Rd),Ad∞)es isomorfo a(B,B(B))dondeAd∞ es la σ-´algebra generada por la topolog´ıa inducida por la m´etrica d∞[10]. La importancia de que el espacio de Skorokhod sea un espacio Polaco radica en que los espacios Polacos son espacios de Borel y ser un espacio de Borel es una condici´on necesaria para que la medida sobre el espacio de caminos exista, es decir es una condici´on necesaria para que el proceso estoc´astico exista.
Definici ´on 2.17 (Filtraci ´on de σ-´algebra) Sea (Ω,A,P) un espacio de proba- bilidad y (Ft)t∈[0,∞) una sucesi´on de sub-σ-´algebras de A tales que para t < s Fs ⊂ Ft, luego(Ft)t∈[0,∞)se llama filtraci´on enA.
Ejemplo 2.18 Dado S un espacio vectorial Polaco y un proceso estoc´astico(Xt)t∈[0,∞), sobre un espacio de probabilidad (Ω,A,P), con valores sobre el espacio medible (S,B(S)). La sucesi´on de σ-´algebras(Ft)t∈[0,∞)en dondeFt := σ(Ss≤tX−s1(B(S))) es una filtraci´on y se le llama la filtraci ´on natural asociada al proceso(Xt)t∈[0,∞). Ahora presentaremos algunos propiedades de regularidad que asumiremos que cumplen las filtraciones.
Definici ´on 2.19 (Continuidad por derecha) Sea(Ω,A,P)un espacio de proba- bilidad y(Ft)t∈[0,∞) una filtraci´on enA, luego se dice que es continua por derecha si
Ft= \
u;u>t
Fu ∀t∈ [0,∞)
Definici ´on 2.20 (Completo) Sea(Ω,A,P)un espacio de probabilidad y(Ft)t∈[0,∞) una filtraci´on enA, luego la filtraci´on (Ft)t∈[0,∞) es completa, siF0contiene a to- dos los conjuntosP-nulos deA.
Nota 2.21 Una filtraci´on continua por derecha y completa se llama filtraci ´on can ´onica.
Definici ´on 2.22 (Martingala d dimensional) Sea(Ω,A,P)un espacio de pro- babilidad,(Ft)t∈[0,∞)una filtraci´on y(Mt)t∈[0,∞)un proceso estoc´astico con valores en(Rd,B(Rd)). Luego si
1. E[|Mt|]:=R |Mt(ω)|dP(dω) <∞ para cada t∈ [0,∞),
2. MtesFt-medible para cada t∈ [0,∞),
3. E[Mt|Fs] = MsP-c.s para t>s,,
entonces a(Mt)t∈[0,∞) es una(Ft)t≥0-martingala (la esperanza condicional se defi- ne como en el A. Klenke, Probability Theory [10]).
Nota 2.23 Los procesos que cumplen la condici´on 3 de la definici´on 2.22 se llaman procesos adaptados.
Definici ´on 2.24 (Proceso adaptado) Sea (Ω,A,P) un espacio de probabilidad, S un espacio vectorial Polaco, (S,B(S))el espacio medible, F := (Ft)t∈[0,∞) una filtraci´on en B(S)y (Xt)t∈[0,∞) un proceso estoc´astico con valores en E, tales que XtesFt-medible para cada t en[0,∞), luego Xtse llamaF-adaptado.
Nota 2.25 Todo proceso es adaptado con respecto a su filtraci´on natural.
En el presente trabajo estaremos interesados en una clase particular de va- riables aleatorias con valores positivos llamadas tiempos aleatorios, en parti- cular estudiaremos el tiempo de primera llegada de un proceso estoc´astico aun conjunto abierto. En particular si τ es un tiempo de primera llegada aso- ciado a un proceso estoc´astico(Xt)t≥0, y(Ft)t≥0 es una filtraci ´on asociada a este proceso (por ejemplo la filtraci ´on natural) entonces los eventos {τ≤t} son Ft-medibles.
Definici ´on 2.26 (Tiempo de parada) Sea τ una variable aleatoria definida sobre el espacio de probabilidad (Ω,A,P), con valores en [0,∞) ∪ {∞}y con filtraci´on asociada(Ft)t∈[0,∞). Luego si para cualquier t∈ [0,∞)
{τ≤t} ∈ Ft, τ se llama un tiempo de parada.
Definici ´on 2.27 (Tiempo de primera llegada a un abierto) Sea(Ω,F,P)un espacio de probabilidad y (Xt)t≥0 un proceso estoc´astico asociado a este espacio de probabilidad con valores en Rd y con filtraci´on natural (Ft)t≥0. Adem´as sea A⊂Rdun abierto, luego
τA:=´ınf{t >0 : X(t) ∈ A}, se llama tiempo de primera llegada a un abierto A.
Lema 2.28 [16], [19] Sea(X(t))t≥0un proceso estoc´astico con caminos continuos por derecha, (Ft)t≥0 la filtraci´on can´onica asociada a (X(t))t≥0 y A ⊂ Rd un conjunto abierto. Luego el tiempo de primera llegada τAsatisface,
{τA< t} ∈ Ft. En particular si(Ft+)t≥0:=Tu>tFuentonces,
{τA≤ t} ∈ Ft+,
es decir τAes un tiempo de parada con respecto a(Ft+)t≥0. Demostraci ´on En primer lugar para t>0,
{τA< t} = [
Q+3r≤t
{X(r) ∈A} ∈ Ft.
”⊂”, si τA(ω) <t, entonces existe s<t tales que X(s, ω) ∈ A. Ahora como los caminos son continuos por derecha, existe r ∈ Q tales que s < r < t y X(r, ω) ∈ A. Por lo tanto ω∈SQ+3r≤t{X(r) ∈ A}.
” ⊃ ”, sea ω ∈ {X(r) ∈ A} para alg ´un r∈ (0, t] ∩Q. Como A es abierto y t→ X(t, ω)es continua por derecha, tenemos que τA(ω) <r≤t.
En segundo lugar,
{τA ≤t} = \
n≥1
{τA <t+ 1
n} ∈\Ft+1
n = Ft+.
Los tiempos de parada resultan ser herramientas muy ´utiles para localizar un proceso, ya que como se vera a continuaci ´on para el caso de las martin- galas, estos permiten que cada camino del proceso estoc´astico se mantenga constante para tiempos posteriores a un tiempo de parada τ.
Definici ´on 2.29 (Martingala local d-dimensional) Sea (Ω,A,P) un espacio de probabilidad,(Ft)t∈[0,∞) una filtraci´on y(Mt)t∈[0,∞) un proceso estoc´astico con valores en (Rd,B(Rd)), tales que MtesF-adaptado. Luego si existe una sucesi´on de tiempos de parada(τn)n∈[0,∞)tales que l´ımn→∞τn=∞ casi siempre de manera que el proceso(Mτn∧t)t≥0es unaF-martingala uniformemente integrable, entonces (Mt)t≥0 se llama unaF-martingala local.
Toda martingala es una martingala local, solo basta considerar la sucesi ´on de tiempos de parada(τn)n≥1donde τn:=∞. Por otro lado no toda martingala local es una martingala, un ejemplo se encuentra en la teor´ıa del juego, mas precisamente en el juego de lanzar una moneda. La idea es pensar que se inicia el juego con un peso y se lanza la moneda, si el resultado es cara entonces el jugador gana y se queda con el peso, de lo contrario el jugador deber´a duplicar la apuesta y la estrategia consiste en continuar duplicando la apuesta hasta que el jugador gane y pueda dejar de jugar con la ganancia neta de un dolar. De esta manera en el siguiente ejemplo se formaliza esta estrategia de juego.