• No se han encontrado resultados

Teorema Funcional del Límite Central para Martingalas

N/A
N/A
Protected

Academic year: 2022

Share "Teorema Funcional del Límite Central para Martingalas"

Copied!
84
0
0

Texto completo

(1)

Central para Martingalas

Tesis Pre-Grado en Matem´ aticas David Alejandro Henriquez Bernal

Mayo 21, 2019

Asesor: Prof. Dr. Michael H¨ogele, Co-Ascesor: Prof. Dr. Sylvie Roelly Departamento de Matem´aticas, Universidad de los Andes

(2)
(3)

Las primeras versiones del Teorema del L´ımite Central se remontan a las ideas de De Moivre y Laplace, en donde la sucesi ´on de sumas renor- malizadas de variables aleatorias de Bernoulli con varianza acotada y promedio finito convergen en distribuci ´on a una variable aleatoria con distribuci ´on normal est´andar. En el presente trabajo se busca compren- der una versi ´on generalizada del Teorema del L´ımite Central donde la sucesi ´on de sumas renormalizadas de variables aleatorias se sustituyen por martingalas en tiempo continuo, un tipo de procesos estoc´asticos, con saltos acotados y variaci ´on cuadr´atica lineal en el tiempo. De es- ta manera al considerar una sucesi ´on de martingalas re-normalizadas el l´ımite es un proceso estoc´astico, un movimiento Browniano, en vez de vectores aleatorias Gaussianos. Siguiendo el articulo de Ward Whitt [24], para conseguir demostrar el Teorema del L´ımite Central en este contexto se usar´a la siguiente estructura. Primero, se introducen las he- rramientas necesarias para demostrar que toda subsucesi ´on convergen- te converge en el espacio de funciones continuas y converge al mismo limite (a trav´es de un corolario del Teorema de Prokhorov (3.6)). Segun- do se caracteriza el l´ımite de la sucesi ´on, o m´as precisamente de alguna sub-sucesi ´on, es decir se muestra que el limite es un movimiento Brow- niano. Por otro lado para ilustrar el Teorema del L´ımite Central para Martingalas se expondr´an dos ejemplos de sucesiones de martingalas locales que convergen a un movimiento Browniano, espec´ıficamente, se estudiar´a una sucesi ´on de procesos de Poisson compuestos compensa- dos y una sucesi ´on de caminatas aleatorias.

(4)

Quiero agradecer a Michael H ¨ogele por el acompa ˜namiento y asesoramien- to brindado durante la elaboraci ´on de este trabajo, a Sylvie Roelly por su orientaci ´on y el apoyo recibido en Potsdam cuando este proyecto estaba co- menzando. De igual manera quiero agradecer a mi familia y amigos por el soporte que me ofrecieron a lo largo de este proceso.

(5)

´Indice general III

1 Introducci ´on 3

2 Objetos principales y el TFLC 11

2.1. Objetos principales: martingalas, la variaci ´on cuadr´atica, el

movimiento Browniano . . . 11

2.2. Enunciado del TFLC para martingalas con saltos acotados . . 23

2.3. Ejemplos: procesos de Poisson compuestos compensados y ca- minatas aleatorias . . . 24

3 Pre-compacidad de las medidas de la sucesi ´on de martingalas locales 33 3.1. Herramientas de demostraci ´on: pre-compacidad en espacios de medidas . . . 33

3.2. Martingalas estoc´asticamente acotadas . . . 39

3.3. Demostraci ´on de laC-pre-compacidad con saltos acotados . . 40

4 Caracterizaci ´on del l´ımite 53 4.1. Herramientas de demostraci ´on: Teorema de L´evy . . . 53

4.2. Identificaci ´on del l´ımite con saltos acotados . . . 58

A Ap´endice 61 A.1. C´alculo de los primeros momentos de un proceso compuesto de Poisson . . . 61

A.2. Teoremas del l´ımite central cl´asico . . . 62

A.3. Tipos de convergencia de vectores aleatorios . . . 63

A.4. Anexo de las demostraciones de algunos teoremas . . . 64

Bibliograf´ıa 77

(6)
(7)

La siguiente lista muestra la notaci ´on usada a lo largo del documento N Los n ´umeros naturales {1,2,3,...}

d∈N Dimensi´on del espacio de estados R Los n ´umeros reales

t∈ [0,∞) Tiempo determinista

C([0,∞),Rd) Espacio de funciones continuas sobre[0,∞)con valores enRd c`adl`ag Espacio de funciones sobre[0,)con valores en Rd tales que,

∀t ∈ [0,∞) ∀tn↓t, l´ımtntX(tn) =X(t), (continua por derecha) y

∀t ∈ (0,∞) ∀tn↑t, l´ımtntX(tn) =X(t−), (el limite por izquierda exis- te)

∆X(t) Salto en el tiempo t para una funci ´on c`adl`ag X (∆X(t):=X(t)-X(t-)) i.i.d Variables aleatorias independientes e id´enticamente distribuidas S,E Espacios polacos, espacios topol ´ogicos metrizables completos y sepa-

rables

D([0, T],Rd) Espacio polaco constituido por funciones c`adl`ag sobre [0, T] dotado con la topolog´ıa de Skorokhod

(Ω,A,P) Espacio de probabilidad (Ft)t0 Filtraci ´on enA

B(E) Borelianos sobre E, σ-´algebra generada por los abiertos del espacio topol ´ogico(E,T )

τ, σ Tiempo de parada con respecto a la filtraci ´on(Ft)t0

(8)

M Martingala con respecto a la filtraci ´on(Ft)t0

Dd σ-´algebra de Borel deD([0,∞),Rd), B(D([0,∞),Rd)con respecto a la topolog´ıa de Skorokhod

(B(t)t0) Movimiento Browniano (N(t))t0 Proceso de Poisson

(9)

Introducci´ on

La ley de los grandes n ´umeros d´ebil expresa que dada una sucesi ´on de va- riables aleatorias independientes e id´enticamente distribuidas con primer momento finito, el promedio aritm´etico de las primeras n variables alea- torias converge en probabilidad a el promedio cuando n tiende a infinito.

Ahora, asumiendo la existencia de segundos momentos, las primeras versio- nes del teorema del limite central surgieron a partir de la ley de los grandes n ´umeros al considerar renormalizar la suma por una succi ´on(an/n)n1con el fin de que la probabilidad del error no converja en probabilidad a un va- lor distinto a cero. Resultando en que an := √

nσ y que el limite tiene una distribuci ´on normal est´andar independiente de los sumandos.

En la actualidad, hablar de teoremas del l´ımite central hace referencia a una multitud de afirmaciones acerca de la convergencia a una distribuci ´on nor- mal (infinito dimensionales) de una sucesi ´on de distribuciones, asociadas a funciones que dependen de un n ´umero creciente de vectores aleatorias (mul- tidimensionales) o en algunos casos elementos aleatorios m´as generales (en espacio de funciones infinito dimensionales). [6]

El teorema del l´ımite central desde sus or´ıgenes ha sido de gran importan- cia en el ´area de la estad´ıstica. Esto se debe a que dada una poblaci ´on y un muestreo aleatorio tomado de la poblaci ´on, la distribuci ´on de los promedios de las muestras tiende a una distribuci ´on normal a medida que el tama ˜no de las muestras aumentan [7]. Por ejemplo al realizar un experimento la va- riabilidad de los promedios implica la variabilidad de los los errores que en el limite de muchas mediciones presenta una distribuci ´on normal [23].

De igual manera la importancia que los teoremas del l´ımite central han teni- do sobre las matem´aticas y m´as precisamente sobre la teor´ıa de la probabili- dad, radica en los m´etodos matem´aticos, principalmente en an´alisis, que se desarrollaron alrededor de ella y el estatus como linea de investigaci ´on en s´ı

(10)

que le ayudo a brindar a la probabilidad dentro de las matem´aticas. De esta manera para alcanzar una mayor comprensi ´on del papel en las matem´aticas de los teoremas del limite central, es necesario hacer un recuento hist ´orico de las versiones que han surgido del mismo desde el siglo XVIII hasta me- diados del siglo XX. [6]

El primer trabajo alrededor del teorema del l´ımite central se remonta al art´ıculo publicado por Abraham de Moivre (1667–1754) en 1733. En este de Moivre desarrolla aproximaciones a distribuciones binomiales con el fin de refinar el trabajo de Jakob Bernoulli alrededor de la ley de los grandes n ´umeros. Sin embargo, el trabajo de de Moivre nunca expreso la universali- dad que caracteriza a los teoremas del l´ımite central. En gran medida porque el trabajo de de Moivre solo fue un caso particular del teorema del l´ımite central para el caso de variables aleatorias de Bernoulli con probabilidad p = 12 (por ejemplo, el lanzamiento de una moneda justa es modelado por una variable aleatoria de Bernoulli). [6]

El segundo trabajo importante en relaci ´on a el teorema del l´ımite central se encuentra con Pierre-Simon de Laplace (1749–1827) quien en 1812, despu´es de 40 a ˜nos de trabajo, publica el articulo Th´eorie analytique des probabilit´es en el cual presenta una generalizaci ´on del trabajo de de Moivre para p 6= 1.

En este trabajo los problemas que busca resolver Laplace se dividen en dos categor´ıas, por un lado en ”sumas de variables aleatorias” y por otro lado en ”hallar el inverso de probabilidades”. Dentro de la primera categor´ıa se encuentra el problema de estimar probabilidades a priori en relaci ´on a la ganancia y a la perdida en juegos de azar. Es en este contexto que Laplace desarrolla un m´etodo para aproximar las probabilidades de sumas de varia- bles aleatorias independientes usando funciones generadoras. [6]

Despu´es, Sim´eon Denis Poisson (1781–1840) brinda un an´alisis mas riguroso al teorema del l´ımite central de Laplace a trav´es de dos art´ıculos publicados entre 1824 y 1829. M´as precisamente el aporte de Poisson al teorema del l´ımite central es una comprensi ´on m´as profunda de lo que es una variable aleatoria (definici ´on importante en la versi ´on actual del teorema del l´ımite central) y algunos contraejemplos 1 que permitieron delimitar un poco la validez del teorema del l´ımite central. [6]

Alrededor del siglo XIX, empieza a crecer dentro de los matem´aticos de la ´epoca un consenso hacia una mayor abstracci ´on de las matem´aticas y hacia su desprendimiento del mundo f´ısico como raz ´on de existir, lo que encamina a los matem´aticos a buscar un mayor rigor en las matem´aticas. Es

1El contraejemplo mas prominente que considero Poisson fue la funci ´on caracter´ıstica f(x) =

1

π(1+x2) que no cumple el TLC ya que para esa distribuci ´on ning ´un momento existe.

(11)

tal vez contra intuitivas en la teor´ıa del error.

Dentro de este contexto se encuentran los matem´aticos Peter Gustav Lejeune Dirichlet (1805–1859) y Augustin Louis Cauchy (1789–1857) quienes entre los a ˜nos 1830 y 1850 trabajando en aplicaciones del teorema del l´ımite central a la teor´ıa del error, buscar obtener demostraciones rigurosas del teorema del limite central. Lo anterior ocasiona que el teorema empiece a adquirir relevancia dentro de las matem´aticas a parte de su aplicaci ´on en problemas pr´acticos.2.

De esta manera dentro de las principales aplicaciones de Dirichlet al teore- ma del l´ımite central se encuentran modificaciones del m´etodo Laplaciano

3 de aproximar una suma de variables aleatorias independientes a una dis- tribuci ´on normal. De igual manera dentro de las contribuciones de Cauchy, usando consideraciones similares a las de Dirichlect, expone una serie de cri- ticas al m´etodo de m´ınimos cuadrados de Laplace a trav´es de una disputa con Ir´en´ee Jules Bienaym´e (1796–1878) quien defend´ıa el m´etodo de Laplace.

[6]

En la segundo mitad del siglo XIX y principios del siglo XX encontramos la escuela rusa de St. Petersburgo, de la mano de Pafnutii Lvovich Chebyshev (1821–1894), Andrei Andreevich Markov (1856–1922) y Aleksandr Mikhailo- vich Lyapunov (1857–1918). Las ideas de Chebyshev se encuentran en una serie de art´ıculos publicados entre 1845 y 1887, en los cuales expresa cons- tantemente la necesidad de presentar cotas a los errores de las desviaciones entre las probabilidades exactas y las expresiones limites. Con respecto al teorema del l´ımite central, Chebyshev en 1887 presenta una demostraci ´on a trav´es del m´etodo de los momentos 4. Sin embargo, su demostraci ´on sigue presentando los mismos problemas de rigurosidad con respecto a las demos- traciones de Poisson y Laplace (cortar expansiones en series que en ocasio- nes divergen). Es importante resaltar en este punto que es hasta Chebyshev que el teorema del l´ımite central adquiere la forma de teorema l´ımite y se

2Un discusi ´on acerca de la creeciente abstraccion en matematicas se puede ver en Schnei- der, Ivo 1981a. Die Situation der mathematischen Wissenschaften vor und zu Beginn der wissenschaftlichen Laufbahn von Gauss. In Carl Friedrich Gauss (1775–1855). Sammelband von Beitr¨agen zum 200. Geburtstag von C. F. Gauss, I. Schneider (ed.), pp. 9–36. M ¨unchen:

Minerva.

3En t´erminos actuales, el m´etodo de Laplace en el fondo consist´ıa en hallar la funci ´on ca- racter´ıstica (la funci ´on caracter´ıstica de una variable aleatoria X esE[eitX]) de una suma de variables aleatorias para despu´es encontrar a trav´es de la funci ´on inversa la probabilidad de que la suma de variables aleatorias tome un valor particular.

4El m´etodo de los momentos busca encontrar cotas superiores e inferiores a integrales de la formaRb

a f(x)dx donde f(x)son densidades de probabilidad, dado que a, b∈ [A, B], a<b y los momentos M0 :=RB

A f(x)dx, M1 := RB

Ax f(x)dx,...,Mm :=RB

Axmf(x)dx existen hasta alg ´un mN.

(12)

expresan condiciones necesarias para su validez.

Por otro lado Markov en un articulo publicado en 1898 presenta una de- mostraci ´on mas completa del teorema del l´ımite central siguiendo las mis- ma ideas que Chebyshev. Sin embargo deja la sensaci ´on, al igual que con Chebyshev, que la importancia del teorema del l´ımite central radica en su utilidad como un espacio en donde se pueden presentar m´etodos relaciona- dos a momentos y fracciones continuas.

Finalmente el ´ultimo exponente de la escuela de St. Petersburg que consi- deraremos es Lyapunov quien presento una demostraci ´on del teorema del l´ımite central en un articulo publicado en el a ˜no 1900. La importancia de su contribuci ´on se encuentra en el hecho de que fue la primera persona en presentar una demostraci ´on rigurosa del teorema del l´ımite central siguien- do el m´etodo de Laplace de funciones caracter´ısticas, y no el m´etodo de los momentos de Chebyshev y Markov. Adem´as, es importante se ˜nalar su introducci ´on de un lema sobre la convergencia de funciones caracter´ısticas a un distribuci ´on normal, ya que en este lema se basa su demostraci ´on y sera usado por otros matem´aticos como Lindeberg y L´evy. De igual mane- ra Lyapunov fue capaz de brindar una cota a los errores como demandaba Chebyshev. [6]

Por otro lado en el a ˜no 1905 Albert Einstein (1879-1955) presenta la explica- ci ´on correcta de que es el movimiento Browniano que Brown reporto en sus observaciones. Por otro lado el primer modelo del movimiento Browniano como objeto matem´atico se le atribuye a Louis Jean-Baptiste Alphonse Ba- chelier (1870-1946), sin embargo su trabajo no hace referencia al movimien- to Browniano ni a Brown. La primera construcci ´on rigurosa del movimiento Browniano se le atribuye a Norbert Wiener (1894-1964) quien introduce la medida de Wiener en el espacio C[,1] bas´andose en el trabajo de Einstein [21].

En el a ˜no 1920 Jarl Waldemar Lindeberg (1876–1932) publica su trabajo en relaci ´on al calculo probabil´ıstico, con una versi ´on del teorema del l´ımite cen- tral bajo hip ´otesis muy d´ebiles (por ejemplo no asume que las variables alea- torias son independientes) y hasta se podr´ıa decir necesarias (condici ´on de Lindeberg)5. De esta manera las ventajas del teorema del l´ımite central de Lindeberg consiste en dos aspectos, por un lado se puede aplicar a contextos muy generales y por otro toma en consideraci ´on la tasa de convergencia. Sin embargo, aunque la demostraci ´on de Lindeberg brinda una demostraci ´on ri- gurosa del teorema del l´ımite central asumiendo condiciones suficientes, no presenta una demostraci ´on sobre la necesidad de las hip ´otesis, aspectos que ser´an cubiertos mas adelante por L´evy y Feller en 1935 y 1937 respectiva-

5La condici ´on de Lindeberg expresa que en el limite cuando n tiende a infinito la varianza de las variables aleatorias acotadas es igual a la varianza de las variables aleatorias sin acotar

(13)

suficientes para la versi ´on del teorema del limite central presentada por Lin- deberg usando el m´etodo de Laplace de las funciones caracter´ısticas, a ´un la versi ´on que presenta no es lo suficientemente general ya que solo considera sumas normadas.

Por otro lado Paul L´evy (1886–1971) despu´es de varias publicaciones entre 1925 y 1935, en 1930 adopta un nuevo m´etodo 6 desarrollado por el mismo y deja al lado el m´etodo de Laplace de las funciones caracter´ısticas. En el articulo de 1935 L´evy realiza tres contribuciones importantes al teorema del l´ımite central. En primer, lugar presenta condiciones suficientes y necesa- rias para la convergencia de sumas normalizadas con segundos momentos de variables aleatorias independientes e id´enticamente distribuidas a una distribuci ´on normal. En segundo lugar, presenta condiciones necesarias y suficientes para el caso m´as general de sumandos independientes. En tercer lugar intenta exponer las condiciones necesarias y suficientes para varia- bles dependientes, martingalas. De hecho, en el teorema del l´ımite central la suma de n variables aleatorias centradas en cero y renormalizadas por el producto de la ra´ız de n y la varianza es una sucesi ´on de martingalas con respecto a la filtraci ´on natural. Por otro lado, las demostraciones que pre- sento en relaci ´on al caso de variables dependientes reca´ıan en un lema que L´evy no demostr ´o en 1935, pero que fue demostrado en 1936 por Cram´er, raz ´on por la cual L´evy presenta otro articulo en 1937 en donde refina estas demostraciones. [6]

En la d´ecada de 1930, Andr´ei Nikol´ayevich Kolmog ´orov (1903-1987) presen- ta una axiomatizaci ´on de la teor´ıa de la probabilidad en el articulo ”Grund- lagen der Wahrscheinlichkeitsrechnung”publicado en Alemania en 1933. De igual manera en esta d´ecada tambi´en surgen desarrollos alrededor de varia- bles aleatorias sobre espacios de funciones (primeras ideas de lo que hoy en d´ıa se conoce como procesos estoc´asticos) y los avances de L´evy en relaci ´on a un teorema del l´ımite central para variables aleatorias dependientes.

En 1933 Kolmog ´orov tambi´en presenta una construcci ´on del movimiento Browniano dando una justificaci ´on mas rigurosa de la construcci ´on de Ba- chelier. De igual manera en 1948 L´evy presenta una construcci ´on del mo- vimiento Browniano usando argumentos de interpolaci ´on [13] y en 1951 Monroe David Donsker (1925–1991) presenta su construcci ´on del movimien- to Browniano a trav´es del limite de caminatas aleatorias [21].

6El m´etodo de la concentraci ´on y la dispersi ´on de L´evy busca comparar el tama ˜no de una variable aleatoria con la suma de todas las variables aleatorias. En este m´etodo la dispersi ´on de una variable aleatoria hace referencia a la m´ınima longitud de un intervalo asociado a una probabilidad particular y la concentraci ´on es la m´axima probabilidad asociada a un intervalo determinado.

(14)

La construcci ´on del movimiento Browniano que presenta Donskers es en realidad una versi ´on funcional del teorema del l´ımite central, siguiendo las ideas de Paul Erd˝os (1913-1996) y Mark Kac (1914-1984) sobre el principio de invarianza (el comportamiento l´ımite de una sucesi ´on de funciones defi- nidas a partir de sumas de variables aleatorias se puede determinar al consi- derar el l´ımite cuando las sumas tienen distribuciones especiales) en donde una sucesi ´on de distribuciones que depende de una sucesi ´on de variables aleatorias independientes (caminatas aleatorias sim´etricas) convergen a un movimiento Browniano. [6]

Por ´ultimo, continuando con las ideas de L´evy y Donsker la versi ´on funcio- nal para martingalas que estudiaremos en el presente trabajo, en el fondo esta considerando un teorema del l´ımite central para cada tiempo. Por lo tanto el trabajo consistir´a en encontrar cual debe ser las constantes de renor- malizacion (los an :=

n

σ en el caso no funcional del teorema y la variaci ´on cuadr´atica para el caso funcional, pero con las condiciones necesarias para que el l´ımite del proceso de variaci ´on cuadr´atica sea lineal en el tiempo) adecuadas para el caso funcional, de manera tal que bajo el l´ımite correcto la sucesi ´on de martingalas converja a un proceso que en cada tiempo pre- sente una distribuci ´on normal, por lo cual el candidato mas natural es el movimiento Browniano. Esta versi ´on funcional del teorema del l´ımite cen- tral puede ser atribuida al trabajo de Patrick Paul Billingsley (1925–2011), de la escuela norteamericana, Yuri Vasilyevich Prokhorov (1929-2013), Anatoliy Volodymyrovych Skorokhod (1930-2011), de la escuela sovi´etica, entre otros, quienes en los a ˜nos 50’s-60’s desarrollaron en gran medida las ideas que se desarrollaran en el presente trabajo [3].

Por un lado Prokhorov en 1956 trabajando en espacios de funciones separa- bles y completos presenta el esquema de demostraci ´on que usaremos en este trabajo. Una sucesi ´on de procesos estoc´asticos convergen en distribuci ´on a un proceso estoc´astico X si, la sucesi ´on de distribuciones es pre-compacta, las sucesiones finito dimensionales convergen y el l´ımite de las distribucio- nes finito dimensionales caracterizan a X [8]. Por otro lado Skorokhod bus- co comprender un poco mejor el teorema en espacios de funciones que no necesariamente son completos y separables, trabajando en el espacio de fun- ciones continuas por derecha y con l´ımite por izquierda encontr ´o distintos tipos de convergencia en estos espacios seg ´un el tipo de topolog´ıa [22]. Por otro lado Billingsley hace uso del resultado de Prokhorov sobre la equivalen- cia entre pre-compacidad en espacios de medidas y la compacidad relativa y adem´as usa la caracterizaci ´on de L´evy de un movimiento Browniano. De- mostrando que el teorema funcional del l´ımite central para martingalas, se reduce a demostrar que la sucesi ´on de martingalas es pre-compacta y el l´ımi- te se puede caracterizar usando el teorema de L´evy7 [2].

7El teorema de L´evy expresa que dado un proceso estoc´astico d-dimensional X(t), el proceso M(t) :=X(t) −X(0)es un movimiento Browniano d-dimensional si M(t)es continuo y la

(15)

como pre-compacidad en espacios de medidas, sucesiones estoc´asticamente acotadas y la caracterizaci ´on del limite de L´evy [25]. En el presente trabajo es este el articulo que seguiremos para la demostraci ´on del Teorema funcional del l´ımite central con saltos acotados.

variaci ´on cuadr´atica entre las componentes j, k∈ {1, ..., d}es igual a δj,kt.

(16)
(17)

Objetos principales y el TFLC

2.1. Objetos principales: martingalas, la variaci´ on cuadr´ ati- ca, el movimiento Browniano

Los objetos principales que se estudiaran en este trabajo son una clase de procesos estoc´asticos, las martingalas, sin embargo antes de poder introdu- cirlas es necesario definir que es un proceso estoc´astico. En primer lugar, dado un espacio de probabilidad (Ω,A,P)y un espacio medible(E,A0)es posible definir un proceso estoc´astico con espacio de estados E, como una familia de variables aleatorias (Xt)t0 donde Xt : Ω → E. No obstante, en ocasiones resulta mas conveniente considerar un proceso estoc´astico como una sucesi ´on de funciones aleatorias(Xt(ω))ω donde Xt(ω):[0,) →E.

A cada funci ´on Xt(ω)se le llama camino o realizaci ´on del proceso.

Nota 2.1 En el presente trabajo los espacios de llegada E de los procesos estoc´asticos no solo ser´an espacios de medida, sino que adem´as ser´an espacios m´etricos de manera que sea posible definir un valor esperado. Sin embargo con el fin de que exista cierta compatibilidad entre la σ-´algebra y la topolog´ıa (inducida por la m´etrica) es necesario que el espacio de llegada sea separable y completo.

Definici ´on 2.2 (Espacio vectorial Polaco) Sea (E,B(E)) un espacio vectorial vec- torial topol´ogico separable y completo, luego E se llama espacio Polaco.

Definici ´on 2.3 (Proceso estoc´astico) [10] Sea (Ω,A,P)un espacio de probabi- lidad, E un espacio vectorial Polaco,(E,B(E))el espacio medible y I⊂R.

Una familia de variables aleatorias(Xt)tI en (Ω,A,P)con valores en(E,B(E)), se llama un proceso estoc ´astico, con espacio de estados E y conjunto de ´ındices (o conjunto de tiempos) I.

La existencia de un proceso estoc´astico dada una familia de distribuciones finito dimensionales se encuentra determinada por el Teorema de extensi ´on

(18)

de Kolmogorov, sin embargo antes de definir el teorema es necesario intro- ducir que quiere decir que una familia de medidas de probabilidad sobre productos finitos sea consistente.

Definici ´on 2.4 [10] Sea(i,Ai)i∈[0,) una colecci´on de espacios medibles, Ωi :=

×

ik=0k yAi := Nik=0Ak. Adem´as sea(Pi)i∈[0,∞)una colecci´on de medi- das de probabilidad definidas sobre(i,Ai)para cada i ∈ [0,).

Luego si para i, j≥ k y A∈ Ak

Pi(A×k+1× · · · ×i) =Pj(A×k+1× · · · ×j), entonces la colecci´on(Pi)i∈[0,)se llama consistente.

Ahora con el prop ´osito de extender la definici ´on a un conjunto arbitrario de

´ındices I ⊂ [0,∞), es necesario definir la proyecci ´on can ´onica.

Definici ´on 2.5 [10] Sea I⊂ [0,∞)y(i)iIuna colecci´on arbitraria de conjuntos tales queΩ :=

×

iIi denota el espacio producto.

Luego Xi :Ω→i, ωω(i)se llama la proyecci´on a la i-´esima coordenada.

De manera mas general para J⊂ J0 ⊂ I la funci´on XJJ0:

×

jJ0

j

×

jJ

j, ω0ω0|J,

sea llama proyecci´on can´onica. En particular XJ := XJI.

Definici ´on 2.6 Sea I ⊂ [0,∞), (i,Ai)iI una colecci´on de espacios medibles y (PJ, J ⊂ I f inito) una familia de medidas de probabilidad sobre (i,Ai) donde Ωi :=

×

ik=0k yAi :=Nik=0Ak.

Luego si

PL=PJ◦ (XLJ)1 para todoL⊂ J ⊂ I finito, la colecci´on(PJ, J ⊂ I f inito)se llama consistente.

Teorema 2.7 (Teorema de extensi ´on de Kolmogorov (1933)) [10]

Sea I ⊂ [0,∞)un conjunto arbitrario de ´ındices y(Ei,B(Ei))iI una colecci´on de espacios medibles donde Ei es un espacio vectorial Polaco. Sea (PJ, J ⊂ I f inito) una familia consistente de medidas de probabilidad sobre(EJ,B(E)J)donde EJ :=

×

kJEk yB(E)J :=NkJB(Ek).

Entonces existe una ´unica medida de probabilidadP sobre(Ω,A)tales que PJ =P◦XJ 1para todo J ⊂ I.

Nota 2.8 Sea I ⊂ [0∞), luego el proceso estoc´astico (Xt)tI como una colecci´on de variables aleatorias con valores en el espacio de funciones

×

tI

Et es muy grande y poco ´util. Entonces por lo general se busca considerar solamente un espacio de

(19)

funciones con mas propiedades espec´ıficas como continuidad.

Ahora si E := Rd entonces el espacio de funciones a considerar es el espacio de funciones continuas sobre Rd con valores en [0,∞),C([0,∞),Rd), o si esto no es posible, el espacio de funciones continuas a derecha y con l´ımite por izquierda (el cual con la norma J1, que es una norma que se obtiene a partir de una perturbaci´on en el tiempo y el espacio de la norma uniforme, forma un espacio m´etrico separable y completo conocido como el espacio de Skorokhod ).

Definici ´on 2.9 (Funciones c`adl`ag,D([0, T],Rd))

Sea T > 0 yD([0, T],Rd) un espacio de funciones con valores en Rd definidas sobre el intervalo[0, T]tales que para toda funci´on X enD([0, T],Rd)se cumplen las siguientes condiciones

∀t ∈ [0, T] ∀tn↓t, l´ımtntX(tn) =X(t), (continua por derecha),

∀t ∈ (0, T] ∀tn↑t, l´ımtntX(tn) =X(t−), (el l´ımite por izquierda existe), entonces a el espacio de funciones D([0, T],Rd) se le llama espacio de funciones c`adl`ag con valores en [0, T]. En particular cuando T es arbitrariamente grande obtenemos el espacio de funciones c`adl`ag sobre[0,∞),D([0,∞),Rd).

Nota 2.10 La palabra c`adl`ag proviene de su acr´onimo en franc´es ”continue `a droite, l´ımite `a gauche” (continua por derecha y l´ımite por izquierda).

Ahora describiremos algunas propiedades que cumple el espacio de funcio- nes continuas sobre el intervalo [0, T],C([0, T],Rd)y que contin ´uan siendo validas en el espacio de funciones c`adl`agD([0, T],Rd).

Teorema 2.11 [1] Sea T>0 luego,

1. D([0, T],Rd)es un espacio vectorial con suma y multiplicaci´on por escalar punto a punto.

2. Si f , g ∈ D([0, T],Rd)entonces f g ∈ D([0, T],Rd). Mas aun si f(t) 6= 0 para todo t ∈ [0, T]entonces 1/ f ∈ D([0, T],Rd).

3. Sea h∈C(Rd,Rd)y f ∈D([0, T],Rd)entonces h◦ f ∈D([0, T],Rd). 4. Toda funci´on c`adl`ag sobre[0, T]se encuentra acotada en intervalos compactos.

5. Toda funci´on c`adl`ag sobre[0, T]es uniformemente continua por derecha en interva- los compactos.

6. El l´ımite uniforme de una sucesi´on de funciones c`adl`ag en[0, T]es c`adl`ag.

(20)

7. Toda funci´on c`adl`ag sobre [0, T] se puede aproximar uniformemente en intervalos compactos por una sucesi´on de funciones escalonadas.

8. Toda funci´on c`adl`ag sobre[0, T]es Borel medible.

Demostraci ´on1. D([0, T],Rd)es un sub-espacio del espacio vectorial de todas las funciones de[0, T]aRd,(Rd)[0,T].

Sean f , g∈D([0, T],Rd)y(tn)n1una sucesi ´on tales que tn↓t entonces

tl´ımnt(f +g)(tn) = l´ım

tntf(tn) +l´ım

tntg(tn) = f(t) +g(t) = (f+g)(t), y si λR entonces

tl´ımntλ f(tn) =λl´ım

tnt f(tn) =λ f(t).

De igual manera si(t0n)n1es una sucesi ´on tales que t0n ↑t (t6=0) y f , g∈ D([0, T),Rd)entonces

tl´ım0nt(f+g)(t0n) = l´ım

t0ntf(t0n) + l´ım

t0ntg(t0n) = f(t−) +g(t−) = (f+g)(t−), y si λR entonces

tl´ım0ntλ f(t0n) =λl´ım

t0ntf(t0n) =λ f(t−).

2. Sean (tn)n1 y (t0n)n1 dos sucesiones tales que tn ↓ t y t0n ↑ t0 (t0 6= 0) respectivamente entonces

tl´ımntf g(tn) = l´ım

tnt f(tn)l´ım

tntg(tn) = f(t)g(t), y

tl´ım0ntf g(t0n) = l´ım

t0nt f(tn)l´ım

t0ntg(tn) = f(t0−)g(t0−), Ahora si f(t) 6=0 para todo t∈ [0, T)entonces

tl´ımnt(1/ f)(tn) =1/ l´ım

tntf(tn) =1/ f(t), y

tl´ım0nt(1/ f)(t0n) =1/ l´ım

t0ntf(tn) =1/ f(t0−).

3. Sean (tn)n1 y (t0n)n1 dos sucesiones tales que tn ↓ t y t0n ↑ t0 (t0 6= 0) respectivamente entonces

tl´ımnth◦ f(tn) =h(l´ım

tntf(tn)) =h◦f(t), y

tl´ım0nth◦ f(t0n) =h(l´ım

t0ntf(tn)) =h◦f(t0−).

(21)

4. Sea K⊂ [0, T]un subconjunto compacto y p∈Rd. Luego queremos ver que existe r >0 tales que f(K) ⊂Br(p).

Sea t ∈K, como f es continua por derecha, existe δt+>0 tales que

|f(s) − f(t)| < 1 para todo s ∈ (t, t+δt+). Luego si rt+ = 1+ |f(t) −p| entonces

|f(s) −p| ≤ |f(s) − f(t)| + |f(t) −p| <rt+, es decir f(s) ∈ Brt+(p)para todo s∈ (t, t+δt+).

De manera similar como l´ımite por la izquierda de f existe, existe δt > 0 tales que |f(s) − f(t)| < 1 para todo s ∈ (t−δt, t). Luego si rt = 1+

|f(t−) −p|entonces

|f(s) −p| ≤ |f(s) − f(t)| + |f(t) −p| <rt,

por lo tanto f(s) ∈ Brt(p) para todo s ∈ (t−δt, t). Ahora para todo s ∈ Ut = (t−δt, t+δt+), f(s) ∈ Brt(p)donde

rt =m´ax{rt, rt+}.

Finalmente como{Ut|t∈ [0, T]}es un recubrimiento abierto de K, entonces existe n ∈N y t1, ..., tn ∈ K tales que K⊂ U1∪ · · · ∪Uny por lo tanto para todo s ∈ K obtenemos que f(s) ∈ Br(p) en donde r = m´ax{rt1, ..., rtn}, es decir f(K) ⊂Br(p).

5. Sea ε>0 , K⊂ [0, T]compacto y f una funci ´on c`adl`ag. Luego queremos en- contrar δ >0 tales que para todo y y para todo x, si x, y∈K y y∈ (x, x+δ) entonces |f(x) − f(y)| <ε.

De esta manera como f es continua por derecha en cada punto x ∈ K, en- tonces existen δx >0 tales que f((x, x+δ2x)) ⊂Bε

2(f(x)).

Si adem´as δ0 ∈ K, como[0, δ0) ∪ ((x, x+ δ2x))xK es un recubrimiento de K entonces existe un recubrimiento finito[0, δ0) ∪ ((xi, xi+ δ2xi))i=1,...,n .

De esta manera si 2δ :=m´ın{δx12 , ...,δxn2 }, y si y∈ (x, x+2δ)como x∈ (xi, xi+ δ2xi)para alg ´un i entonces

|y−xi| ≤ |y−x| + |x−xi| < δ 2+ δxi

2 < δxi 2 + δxi

2 =δxi, es decir y∈ (xi, xi+ δ2xi). Por lo tanto y∈ (x, x+2δ)implica que

|f(xi) − f(y)| < ε2 y por lo tanto

|f(x) − f(y)| ≤ |f(x) − f(xi)| + |f(xi) − f(y)| ≤ ε 2+ ε

2 =ε.

6. Sea fn una sucesi ´on de funciones c`adl`ag en[0, T]. Luego si f(x)es el l´ımite uniforme de fn :[0, T] →Rd, entonces f es c`adl`ag si es continua por derecha y el l´ımite por izquierda existe para todo x. Sea x∈ [0, T]luego

(22)

Continuidad por derecha.

Sea ε > 0, luego por definici ´on del l´ımite existe n0 > n tales que supx∈[0,T]|f(x) − fn0(x)| ≤ 3ε.

Ahora fn0(x)es continua por la derecha en x por lo tanto existe δ> 0 tales que si y∈ (x, x+δ)entonces|fn0(x) − fn0(y)| ≤ 3ε.

Pero entonces si y∈ (x, x+δ),

|f(x) − f(y)| ≤ |f(x) − fn0(x)| + |fn0(x) − fn0(y)| + |fn0(y) − f(y)|

ε 3 + ε

3+ ε 3 =ε.

L´ımite por izquierda existe.

Sea ε > 0, luego por definici ´on del l´ımite existe n0 > n tales que

|f(x−) − fn0(x−)| ≤ 3ε.

Ahora el l´ımite por izquierda en x de fn0 existe, por lo tanto existe δ>0 tales que si y∈ (x−δ, x)entonces|fn0(x−) − fn0(y)| ≤ 3ε. Pero entonces si y∈ (x−δ, x),

|f(x−) − f(y)| ≤ |f(x−) − fn0(x−)| + |fn0(x−) −fn0(y)| + |fn0(y) − f(y)|

ε 3 + ε

3+ ε 3 = ε.

7. Sea δ>0 y 0=x0<...< xN =T una sucesi ´on de puntos tales que

0 < xn+1−xn < δ para n = 0, ..., N−1. Entonces es posible definir una funci ´on escal ´on dada por

g(x) =

(f(xn), xn ≤x< xn+1

f(xN1), x =T.

Luego por 5. f es uniformemente continua por derecha, por lo tanto dado ε>0 existe δ>0 tales que

|f(x) − f(y)| <ε si y ∈ [x, x+δ).

Ahora para cada x∈ [0, T)existe n tales que xn≤ x≤xn+1. Pero entonces

|xn−x| ≤ |xn+1−xn| <δ, y por lo tanto

|f(x) −g(x)| = |f(x) − f(xn)| <ε.

Ahora si x=T,

|xN1−x| ≤ |xN−xN1| <δ, y por lo tanto

|f(x) −g(x)| = |f(x) − f(xN1)| <ε

(23)

8. Toda funci ´on c`adl`ag sobre[0, T]es Borel medible ya que por 7. toda funci ´on c`adl`ag se puede aproximar por funciones escal ´on y las funciones escal ´on

son Borel medibles. 

Nuestro inter´es en este trabajo se encuentra en el espacio de Skorkhod so- bre el intervalo [0,∞). Sin embargo para esto es necesario primero dotar con una topolog´ıa que permita construir procesos estoc´asticos al espacio D([0, T],Rd) , para as´ı obtener el espacio de Skorokhod sobre el intervalo [0, T].

Definici ´on 2.12 (Espacio de Skorokhod, D([0, T],Rd)) Sea T> 0 y

D([0, T],Rd)el espacio de funciones c`adl`ag sobre el intervalo [0, T]. Adem´as para cada T >0 consideremos la m´etrica sobreD([0, T],Rd)

dT(x, y):= ´ınf

λΛ{sup

s<t

{logλ(t) −λ(s)

t−s } ∨ sup

t∈[0,T]

|x(t) −y(λ(t))|}, (2.1)

donde Λ es el espacio de funciones de [0, T]a [0, T]continuas y estrictamente cre- cientes.

Luego al espacio m´etrico(D([0, T],Rd), dT)se llama el espacio de Skorokhod sobre el intervalo[0, T], que denotaremos simplemente comoD([0, T],Rd).

Ejemplo 2.13 Sea(tn)n1una sucesi´on de n ´umeros reales tales que tn→1 y sean xn, y∈D([0, 2],R)tales que xn=1[0,tn], y=1[0,1].

Luego si λn(t) ∈Λ tales que,

λn:= (1

tnt si 0≤t≤ tn

1

2tnt+212ttn

n si tn≤t≤2.

Ahora como|xn−y(λn)| =0 para todo n∈N y l´ımnlog(λn(t)−tλsn(s)) =0, dT(xn, y):= ´ınf

λΛ{sup

s<t

{log(λ(t) −λ(s)

t−s )} ∨ sup

t∈[0,T]

|xn(t) −y(λn(t))|} =0.

Nota 2.14 El espacio D([0, T],Rd)es un espacio m´etrico separable y completo es decir es un espacio Polaco.

Definici ´on 2.15 (Espacio de Skorokhod, D([0,∞),Rd)) SeaD([0,∞),Rd)el espacio de funciones c`adl`ag sobre el intervalo[0,∞). Ahora para cada entero m>0 consideremos la funci´on

gm(t) =





1 si t≤m−1,

m−t si m−1< t<m,

0 si t≥m.

(24)

Luego para x, y∈D([0,∞),Rd)es posible definir la siguiente m´etrica d(x, y):= 1

2m

m=1

(1∧dm(gmx, gmy)), (2.2) de manera que (D([0,∞),Rd), d) es un espacio m´etrico denominado el espa- cio de Skorokhod sobre el intervalo [0,∞), que denotaremos simplemente como D([0,∞),Rd).

Si observamos la ecuaci ´on (2.2) que define a d, el papel de las funciones gm

es simplemente restringir las funciones x, y ∈ D([0,∞),Rd) a D([0, T],Rd) de manera continua.

Nota 2.16 (H,A) es un espacio de Borel si existe un conjunto de Borel B ∈ B(R)isomorfo a H como espacios medibles. Por lo tanto (D([0,∞),Rd),Ad)es isomorfo a(B,B(B))dondeAd es la σ-´algebra generada por la topolog´ıa inducida por la m´etrica d[10]. La importancia de que el espacio de Skorokhod sea un espacio Polaco radica en que los espacios Polacos son espacios de Borel y ser un espacio de Borel es una condici´on necesaria para que la medida sobre el espacio de caminos exista, es decir es una condici´on necesaria para que el proceso estoc´astico exista.

Definici ´on 2.17 (Filtraci ´on de σ-´algebra) Sea (Ω,A,P) un espacio de proba- bilidad y (Ft)t∈[0,∞) una sucesi´on de sub-σ-´algebras de A tales que para t < s Fs ⊂ Ft, luego(Ft)t∈[0,∞)se llama filtraci´on enA.

Ejemplo 2.18 Dado S un espacio vectorial Polaco y un proceso estoc´astico(Xt)t∈[0,∞), sobre un espacio de probabilidad (Ω,A,P), con valores sobre el espacio medible (S,B(S)). La sucesi´on de σ-´algebras(Ft)t∈[0,∞)en dondeFt := σ(SstXs1(B(S))) es una filtraci´on y se le llama la filtraci ´on natural asociada al proceso(Xt)t∈[0,∞). Ahora presentaremos algunos propiedades de regularidad que asumiremos que cumplen las filtraciones.

Definici ´on 2.19 (Continuidad por derecha) Sea(Ω,A,P)un espacio de proba- bilidad y(Ft)t∈[0,∞) una filtraci´on enA, luego se dice que es continua por derecha si

Ft= \

u;u>t

Fu ∀t∈ [0,∞)

Definici ´on 2.20 (Completo) Sea(Ω,A,P)un espacio de probabilidad y(Ft)t∈[0,∞) una filtraci´on enA, luego la filtraci´on (Ft)t∈[0,∞) es completa, siF0contiene a to- dos los conjuntosP-nulos deA.

Nota 2.21 Una filtraci´on continua por derecha y completa se llama filtraci ´on can ´onica.

Definici ´on 2.22 (Martingala d dimensional) Sea(Ω,A,P)un espacio de pro- babilidad,(Ft)t∈[0,∞)una filtraci´on y(Mt)t∈[0,∞)un proceso estoc´astico con valores en(Rd,B(Rd)). Luego si

(25)

1. E[|Mt|]:=R |Mt(ω)|dP() <∞ para cada t∈ [0,∞),

2. MtesFt-medible para cada t∈ [0,∞),

3. E[Mt|Fs] = MsP-c.s para t>s,,

entonces a(Mt)t∈[0,∞) es una(Ft)t0-martingala (la esperanza condicional se defi- ne como en el A. Klenke, Probability Theory [10]).

Nota 2.23 Los procesos que cumplen la condici´on 3 de la definici´on 2.22 se llaman procesos adaptados.

Definici ´on 2.24 (Proceso adaptado) Sea (Ω,A,P) un espacio de probabilidad, S un espacio vectorial Polaco, (S,B(S))el espacio medible, F := (Ft)t∈[0,∞) una filtraci´on en B(S)y (Xt)t∈[0,∞) un proceso estoc´astico con valores en E, tales que XtesFt-medible para cada t en[0,∞), luego Xtse llamaF-adaptado.

Nota 2.25 Todo proceso es adaptado con respecto a su filtraci´on natural.

En el presente trabajo estaremos interesados en una clase particular de va- riables aleatorias con valores positivos llamadas tiempos aleatorios, en parti- cular estudiaremos el tiempo de primera llegada de un proceso estoc´astico aun conjunto abierto. En particular si τ es un tiempo de primera llegada aso- ciado a un proceso estoc´astico(Xt)t0, y(Ft)t0 es una filtraci ´on asociada a este proceso (por ejemplo la filtraci ´on natural) entonces los eventos {τ≤t} son Ft-medibles.

Definici ´on 2.26 (Tiempo de parada) Sea τ una variable aleatoria definida sobre el espacio de probabilidad (Ω,A,P), con valores en [0,∞) ∪ {}y con filtraci´on asociada(Ft)t∈[0,∞). Luego si para cualquier t∈ [0,∞)

{τ≤t} ∈ Ft, τ se llama un tiempo de parada.

Definici ´on 2.27 (Tiempo de primera llegada a un abierto) Sea(Ω,F,P)un espacio de probabilidad y (Xt)t0 un proceso estoc´astico asociado a este espacio de probabilidad con valores en Rd y con filtraci´on natural (Ft)t0. Adem´as sea A⊂Rdun abierto, luego

τA:=´ınf{t >0 : X(t) ∈ A}, se llama tiempo de primera llegada a un abierto A.

(26)

Lema 2.28 [16], [19] Sea(X(t))t0un proceso estoc´astico con caminos continuos por derecha, (Ft)t0 la filtraci´on can´onica asociada a (X(t))t0 y A ⊂ Rd un conjunto abierto. Luego el tiempo de primera llegada τAsatisface,

{τA< t} ∈ Ft. En particular si(Ft+)t0:=Tu>tFuentonces,

{τA≤ t} ∈ Ft+,

es decir τAes un tiempo de parada con respecto a(Ft+)t0. Demostraci ´on En primer lugar para t>0,

{τA< t} = [

Q+3rt

{X(r) ∈A} ∈ Ft.

”⊂”, si τA(ω) <t, entonces existe s<t tales que X(s, ω) ∈ A. Ahora como los caminos son continuos por derecha, existe r ∈ Q tales que s < r < t y X(r, ω) ∈ A. Por lo tanto ωSQ+3rt{X(r) ∈ A}.

” ⊃ ”, sea ω ∈ {X(r) ∈ A} para alg ´un r∈ (0, t] ∩Q. Como A es abierto y t→ X(t, ω)es continua por derecha, tenemos que τA(ω) <r≤t.

En segundo lugar,

{τA ≤t} = \

n1

{τA <t+ 1

n} ∈\Ft+1

n = Ft+. 

Los tiempos de parada resultan ser herramientas muy ´utiles para localizar un proceso, ya que como se vera a continuaci ´on para el caso de las martin- galas, estos permiten que cada camino del proceso estoc´astico se mantenga constante para tiempos posteriores a un tiempo de parada τ.

Definici ´on 2.29 (Martingala local d-dimensional) Sea (Ω,A,P) un espacio de probabilidad,(Ft)t∈[0,∞) una filtraci´on y(Mt)t∈[0,∞) un proceso estoc´astico con valores en (Rd,B(Rd)), tales que MtesF-adaptado. Luego si existe una sucesi´on de tiempos de parada(τn)n∈[0,∞)tales que l´ımnτn=∞ casi siempre de manera que el proceso(Mτnt)t0es unaF-martingala uniformemente integrable, entonces (Mt)t0 se llama unaF-martingala local.

Toda martingala es una martingala local, solo basta considerar la sucesi ´on de tiempos de parada(τn)n1donde τn:=∞. Por otro lado no toda martingala local es una martingala, un ejemplo se encuentra en la teor´ıa del juego, mas precisamente en el juego de lanzar una moneda. La idea es pensar que se inicia el juego con un peso y se lanza la moneda, si el resultado es cara entonces el jugador gana y se queda con el peso, de lo contrario el jugador deber´a duplicar la apuesta y la estrategia consiste en continuar duplicando la apuesta hasta que el jugador gane y pueda dejar de jugar con la ganancia neta de un dolar. De esta manera en el siguiente ejemplo se formaliza esta estrategia de juego.

Referencias

Documento similar

Enunciado 2 del teorema central del límite (Linderberg-Lévy): Sea una muestra aleatoria simple de tamaño n de cualquier población de media P y desviación típica

A través de la estandarización de las medias obtenidas se verifica el cumplimiento del teorema central del lı́mite en su versión Lindeberg-Lévy, y por medio de su histograma y