Teorema Funcional del Límite Central para Martingalas

(1)

Central para Martingalas

Tesis Pre-Grado en Matem´ aticas David Alejandro Henriquez Bernal

Mayo 21, 2019

Asesor: Prof. Dr. Michael H¨ogele, Co-Ascesor: Prof. Dr. Sylvie Roelly Departamento de Matem´aticas, Universidad de los Andes

(2)

(3)

Las primeras versiones del Teorema del L´ımite Central se remontan a las ideas de De Moivre y Laplace, en donde la sucesi ón de sumas renormalizadas de variables aleatorias de Bernoulli con varianza acotada y promedio finito convergen en distribuci ón a una variable aleatoria con distribuci ón normal estándar. En el presente trabajo se busca comprender una versi ón generalizada del Teorema del L´ımite Central donde la sucesi ón de sumas renormalizadas de variables aleatorias se sustituyen por martingalas en tiempo continuo, un tipo de procesos estocásticos, con saltos acotados y variaci ón cuadrática lineal en el tiempo. De esta manera al considerar una sucesi ón de martingalas re-normalizadas el l´ımite es un proceso estocástico, un movimiento Browniano, en vez de vectores aleatorias Gaussianos. Siguiendo el articulo de Ward Whitt [24], para conseguir demostrar el Teorema del L´ımite Central en este contexto se usará la siguiente estructura. Primero, se introducen las herramientas necesarias para demostrar que toda subsucesi ón convergen- te converge en el espacio de funciones continuas y converge al mismo limite (a través de un corolario del Teorema de Prokhorov (3.6)). Segun- do se caracteriza el l´ımite de la sucesi ón, o más precisamente de alguna sub-sucesi ón, es decir se muestra que el limite es un movimiento Brow- niano. Por otro lado para ilustrar el Teorema del L´ımite Central para Martingalas se expondrán dos ejemplos de sucesiones de martingalas locales que convergen a un movimiento Browniano, espec´ıficamente, se estudiará una sucesi ón de procesos de Poisson compuestos compensados y una sucesi ón de caminatas aleatorias.

(4)

Quiero agradecer a Michael H ögele por el acompa ñamiento y asesoramien- to brindado durante la elaboraci ón de este trabajo, a Sylvie Roelly por su orientaci ón y el apoyo recibido en Potsdam cuando este proyecto estaba co- menzando. De igual manera quiero agradecer a mi familia y amigos por el soporte que me ofrecieron a lo largo de este proceso.

(5)

´Indice general III

1 Introducci ´on 3

2 Objetos principales y el TFLC 11

2.1. Objetos principales: martingalas, la variaci ´on cuadr´atica, el

movimiento Browniano . . . 11

2.2. Enunciado del TFLC para martingalas con saltos acotados . . 23

2.3. Ejemplos: procesos de Poisson compuestos compensados y caminatas aleatorias . . . 24

3 Pre-compacidad de las medidas de la sucesi ´on de martingalas locales 33 3.1. Herramientas de demostraci ´on: pre-compacidad en espacios de medidas . . . 33

3.2. Martingalas estoc´asticamente acotadas . . . 39

3.3. Demostraci ´on de laC-pre-compacidad con saltos acotados . . 40

4 Caracterizaci ón del l´ımite 53 4.1. Herramientas de demostraci ón: Teorema de Lévy . . . 53

4.2. Identificaci ´on del l´ımite con saltos acotados . . . 58

A Ap´endice 61 A.1. C´alculo de los primeros momentos de un proceso compuesto de Poisson . . . 61

A.2. Teoremas del l´ımite central cl´asico . . . 62

A.3. Tipos de convergencia de vectores aleatorios . . . 63

A.4. Anexo de las demostraciones de algunos teoremas . . . 64

Bibliograf´ıa 77

(6)

(7)

La siguiente lista muestra la notaci ´on usada a lo largo del documento N Los n ´umeros naturales {1,2,3,...}

d∈N Dimensi´on del espacio de estados R Los n ´umeros reales

t∈ [0,∞) Tiempo determinista

C([0,∞),R^d) Espacio de funciones continuas sobre[0,∞)con valores enR^d c`adl`ag Espacio de funciones sobre[_0,_∞)con valores en R^d tales que,

∀t ∈ [0,∞) ∀tn↓t, l´ımtn→tX(tn) =X(t), (continua por derecha) y

∀t ∈ (0,∞) ∀t_n↑t, l´ım_t_n→tX(t_n) =X(t−), (el limite por izquierda existe)

∆X(t) Salto en el tiempo t para una funci ón càdlàg X (∆X(t):=X(t)-X(t-)) i.i.d Variables aleatorias independientes e idénticamente distribuidas S,E Espacios polacos, espacios topol ógicos metrizables completos y sepa-

rables

D([0, T],R^d) Espacio polaco constituido por funciones c`adl`ag sobre [0, T] dotado con la topolog´ıa de Skorokhod

(_Ω,A,P) Espacio de probabilidad (F_t)_t_≥₀ Filtraci ´on enA

B(E) Borelianos sobre E, σ-´algebra generada por los abiertos del espacio topol ´ogico(E,T )

τ, σ Tiempo de parada con respecto a la filtraci ´on(F_t)_t_≥₀

(8)

M Martingala con respecto a la filtraci ´on(F_t)_t_≥₀

D^d σ-´algebra de Borel deD([0,∞),R^d), B(_D([0,∞),R^d)con respecto a la topolog´ıa de Skorokhod

(B(t)_t_≥₀) Movimiento Browniano (N(t))_t_≥₀ Proceso de Poisson

(9)

Introducci´ on

La ley de los grandes n úmeros débil expresa que dada una sucesi ón de variables aleatorias independientes e idénticamente distribuidas con primer momento finito, el promedio aritmético de las primeras n variables aleatorias converge en probabilidad a el promedio cuando n tiende a infinito.

Ahora, asumiendo la existencia de segundos momentos, las primeras versiones del teorema del limite central surgieron a partir de la ley de los grandes n ´umeros al considerar renormalizar la suma por una succi ´on(an/n)_n_≥₁con el fin de que la probabilidad del error no converja en probabilidad a un valor distinto a cero. Resultando en que an := √

nσ y que el limite tiene una distribuci ´on normal est´andar independiente de los sumandos.

En la actualidad, hablar de teoremas del l´ımite central hace referencia a una multitud de afirmaciones acerca de la convergencia a una distribuci ón normal (infinito dimensionales) de una sucesi ón de distribuciones, asociadas a funciones que dependen de un n úmero creciente de vectores aleatorias (mul- tidimensionales) o en algunos casos elementos aleatorios más generales (en espacio de funciones infinito dimensionales). [6]

El teorema del l´ımite central desde sus or´ıgenes ha sido de gran importancia en el área de la estad´ıstica. Esto se debe a que dada una poblaci ón y un muestreo aleatorio tomado de la poblaci ón, la distribuci ón de los promedios de las muestras tiende a una distribuci ón normal a medida que el tama ño de las muestras aumentan [7]. Por ejemplo al realizar un experimento la variabilidad de los promedios implica la variabilidad de los los errores que en el limite de muchas mediciones presenta una distribuci ón normal [23].

De igual manera la importancia que los teoremas del l´ımite central han teni- do sobre las matemáticas y más precisamente sobre la teor´ıa de la probabilidad, radica en los métodos matemáticos, principalmente en análisis, que se desarrollaron alrededor de ella y el estatus como linea de investigaci ón en s´ı

(10)

que le ayudo a brindar a la probabilidad dentro de las matemáticas. De esta manera para alcanzar una mayor comprensi ón del papel en las matemáticas de los teoremas del limite central, es necesario hacer un recuento hist órico de las versiones que han surgido del mismo desde el siglo XVIII hasta me- diados del siglo XX. [6]

El primer trabajo alrededor del teorema del l´ımite central se remonta al art´ıculo publicado por Abraham de Moivre (1667–1754) en 1733. En este de Moivre desarrolla aproximaciones a distribuciones binomiales con el fin de refinar el trabajo de Jakob Bernoulli alrededor de la ley de los grandes n ´umeros. Sin embargo, el trabajo de de Moivre nunca expreso la universali- dad que caracteriza a los teoremas del l´ımite central. En gran medida porque el trabajo de de Moivre solo fue un caso particular del teorema del l´ımite central para el caso de variables aleatorias de Bernoulli con probabilidad p = ¹₂ (por ejemplo, el lanzamiento de una moneda justa es modelado por una variable aleatoria de Bernoulli). [6]

El segundo trabajo importante en relaci ón a el teorema del l´ımite central se encuentra con Pierre-Simon de Laplace (1749–1827) quien en 1812, después de 40 a ños de trabajo, publica el articulo Théorie analytique des probabilités en el cual presenta una generalizaci ón del trabajo de de Moivre para p 6= 1.

En este trabajo los problemas que busca resolver Laplace se dividen en dos categor´ıas, por un lado en ”sumas de variables aleatorias” y por otro lado en ”hallar el inverso de probabilidades”. Dentro de la primera categor´ıa se encuentra el problema de estimar probabilidades a priori en relaci ´on a la ganancia y a la perdida en juegos de azar. Es en este contexto que Laplace desarrolla un m´etodo para aproximar las probabilidades de sumas de variables aleatorias independientes usando funciones generadoras. [6]

Después, Siméon Denis Poisson (1781–1840) brinda un análisis mas riguroso al teorema del l´ımite central de Laplace a través de dos art´ıculos publicados entre 1824 y 1829. Más precisamente el aporte de Poisson al teorema del l´ımite central es una comprensi ón más profunda de lo que es una variable aleatoria (definici ón importante en la versi ón actual del teorema del l´ımite central) y algunos contraejemplos ¹ que permitieron delimitar un poco la validez del teorema del l´ımite central. [6]

Alrededor del siglo XIX, empieza a crecer dentro de los matemáticos de la época un consenso hacia una mayor abstracci ón de las matemáticas y hacia su desprendimiento del mundo f´ısico como raz ón de existir, lo que encamina a los matemáticos a buscar un mayor rigor en las matemáticas. Es

1El contraejemplo mas prominente que considero Poisson fue la funci ´on caracter´ıstica f(x) =

1

π(1+x²) que no cumple el TLC ya que para esa distribuci ´on ning ´un momento existe.

(11)

tal vez contra intuitivas en la teor´ıa del error.

Dentro de este contexto se encuentran los matemáticos Peter Gustav Lejeune Dirichlet (1805–1859) y Augustin Louis Cauchy (1789–1857) quienes entre los a ños 1830 y 1850 trabajando en aplicaciones del teorema del l´ımite central a la teor´ıa del error, buscar obtener demostraciones rigurosas del teorema del limite central. Lo anterior ocasiona que el teorema empiece a adquirir relevancia dentro de las matemáticas a parte de su aplicaci ón en problemas prácticos.².

De esta manera dentro de las principales aplicaciones de Dirichlet al teorema del l´ımite central se encuentran modificaciones del m´etodo Laplaciano

3 de aproximar una suma de variables aleatorias independientes a una distribuci ón normal. De igual manera dentro de las contribuciones de Cauchy, usando consideraciones similares a las de Dirichlect, expone una serie de cri- ticas al método de m´ınimos cuadrados de Laplace a través de una disputa con Irénée Jules Bienaymé (1796–1878) quien defend´ıa el método de Laplace.

[6]

En la segundo mitad del siglo XIX y principios del siglo XX encontramos la escuela rusa de St. Petersburgo, de la mano de Pafnutii Lvovich Chebyshev (1821–1894), Andrei Andreevich Markov (1856–1922) y Aleksandr Mikhailo- vich Lyapunov (1857–1918). Las ideas de Chebyshev se encuentran en una serie de art´ıculos publicados entre 1845 y 1887, en los cuales expresa cons- tantemente la necesidad de presentar cotas a los errores de las desviaciones entre las probabilidades exactas y las expresiones limites. Con respecto al teorema del l´ımite central, Chebyshev en 1887 presenta una demostraci ón a través del método de los momentos ⁴. Sin embargo, su demostraci ón sigue presentando los mismos problemas de rigurosidad con respecto a las demostraciones de Poisson y Laplace (cortar expansiones en series que en ocasiones divergen). Es importante resaltar en este punto que es hasta Chebyshev que el teorema del l´ımite central adquiere la forma de teorema l´ımite y se

2Un discusi ón acerca de la creeciente abstraccion en matematicas se puede ver en Schnei- der, Ivo 1981a. Die Situation der mathematischen Wissenschaften vor und zu Beginn der wissenschaftlichen Laufbahn von Gauss. In Carl Friedrich Gauss (1775–1855). Sammelband von Beiträgen zum 200. Geburtstag von C. F. Gauss, I. Schneider (ed.), pp. 9–36. M ünchen:

Minerva.

3En términos actuales, el método de Laplace en el fondo consist´ıa en hallar la funci ón caracter´ıstica (la funci ón caracter´ıstica de una variable aleatoria X esE[eîtX]) de una suma de variables aleatorias para después encontrar a través de la funci ón inversa la probabilidad de que la suma de variables aleatorias tome un valor particular.

4El m´etodo de los momentos busca encontrar cotas superiores e inferiores a integrales de la formaRb

a f(x)_{dx donde f}(x)son densidades de probabilidad, dado que a, b∈ [_{A, B}], a<b y los momentos M0 :=RB

A f(x)_{dx, M}₁ := RB

Ax f(x)_dx,...,M_m :=RB

Ax^mf(x)dx existen hasta alg ´un m∈_N.

(12)

expresan condiciones necesarias para su validez.

Por otro lado Markov en un articulo publicado en 1898 presenta una demostraci ón mas completa del teorema del l´ımite central siguiendo las mis- ma ideas que Chebyshev. Sin embargo deja la sensaci ón, al igual que con Chebyshev, que la importancia del teorema del l´ımite central radica en su utilidad como un espacio en donde se pueden presentar métodos relaciona- dos a momentos y fracciones continuas.

Finalmente el último exponente de la escuela de St. Petersburg que consi- deraremos es Lyapunov quien presento una demostraci ón del teorema del l´ımite central en un articulo publicado en el a ño 1900. La importancia de su contribuci ón se encuentra en el hecho de que fue la primera persona en presentar una demostraci ón rigurosa del teorema del l´ımite central siguiendo el método de Laplace de funciones caracter´ısticas, y no el método de los momentos de Chebyshev y Markov. Además, es importante se ñalar su introducci ón de un lema sobre la convergencia de funciones caracter´ısticas a un distribuci ón normal, ya que en este lema se basa su demostraci ón y sera usado por otros matemáticos como Lindeberg y Lévy. De igual manera Lyapunov fue capaz de brindar una cota a los errores como demandaba Chebyshev. [6]

Por otro lado en el a ño 1905 Albert Einstein (1879-1955) presenta la explica- ci ón correcta de que es el movimiento Browniano que Brown reporto en sus observaciones. Por otro lado el primer modelo del movimiento Browniano como objeto matemático se le atribuye a Louis Jean-Baptiste Alphonse Ba- chelier (1870-1946), sin embargo su trabajo no hace referencia al movimien- to Browniano ni a Brown. La primera construcci ón rigurosa del movimiento Browniano se le atribuye a Norbert Wiener (1894-1964) quien introduce la medida de Wiener en el espacio C[,1] basándose en el trabajo de Einstein [21].

En el a ño 1920 Jarl Waldemar Lindeberg (1876–1932) publica su trabajo en relaci ón al calculo probabil´ıstico, con una versi ón del teorema del l´ımite central bajo hip ótesis muy débiles (por ejemplo no asume que las variables aleatorias son independientes) y hasta se podr´ıa decir necesarias (condici ón de Lindeberg)⁵. De esta manera las ventajas del teorema del l´ımite central de Lindeberg consiste en dos aspectos, por un lado se puede aplicar a contextos muy generales y por otro toma en consideraci ón la tasa de convergencia. Sin embargo, aunque la demostraci ón de Lindeberg brinda una demostraci ón rigurosa del teorema del l´ımite central asumiendo condiciones suficientes, no presenta una demostraci ón sobre la necesidad de las hip ótesis, aspectos que serán cubiertos mas adelante por Lévy y Feller en 1935 y 1937 respectiva-

5La condici ´on de Lindeberg expresa que en el limite cuando n tiende a infinito la varianza de las variables aleatorias acotadas es igual a la varianza de las variables aleatorias sin acotar

(13)

suficientes para la versi ón del teorema del limite central presentada por Lin- deberg usando el método de Laplace de las funciones caracter´ısticas, a ún la versi ón que presenta no es lo suficientemente general ya que solo considera sumas normadas.

Por otro lado Paul Lévy (1886–1971) después de varias publicaciones entre 1925 y 1935, en 1930 adopta un nuevo método ⁶ desarrollado por el mismo y deja al lado el método de Laplace de las funciones caracter´ısticas. En el articulo de 1935 Lévy realiza tres contribuciones importantes al teorema del l´ımite central. En primer, lugar presenta condiciones suficientes y necesarias para la convergencia de sumas normalizadas con segundos momentos de variables aleatorias independientes e idénticamente distribuidas a una distribuci ón normal. En segundo lugar, presenta condiciones necesarias y suficientes para el caso más general de sumandos independientes. En tercer lugar intenta exponer las condiciones necesarias y suficientes para variables dependientes, martingalas. De hecho, en el teorema del l´ımite central la suma de n variables aleatorias centradas en cero y renormalizadas por el producto de la ra´ız de n y la varianza es una sucesi ón de martingalas con respecto a la filtraci ón natural. Por otro lado, las demostraciones que presento en relaci ón al caso de variables dependientes reca´ıan en un lema que Lévy no demostr ó en 1935, pero que fue demostrado en 1936 por Cramér, raz ón por la cual Lévy presenta otro articulo en 1937 en donde refina estas demostraciones. [6]

En la década de 1930, Andréi Nikoláyevich Kolmog órov (1903-1987) presenta una axiomatizaci ón de la teor´ıa de la probabilidad en el articulo ”Grund- lagen der Wahrscheinlichkeitsrechnung”publicado en Alemania en 1933. De igual manera en esta década también surgen desarrollos alrededor de variables aleatorias sobre espacios de funciones (primeras ideas de lo que hoy en d´ıa se conoce como procesos estocásticos) y los avances de Lévy en relaci ón a un teorema del l´ımite central para variables aleatorias dependientes.

En 1933 Kolmog órov también presenta una construcci ón del movimiento Browniano dando una justificaci ón mas rigurosa de la construcci ón de Ba- chelier. De igual manera en 1948 Lévy presenta una construcci ón del movimiento Browniano usando argumentos de interpolaci ón [13] y en 1951 Monroe David Donsker (1925–1991) presenta su construcci ón del movimien- to Browniano a través del limite de caminatas aleatorias [21].

6El método de la concentraci ón y la dispersi ón de Lévy busca comparar el tama ño de una variable aleatoria con la suma de todas las variables aleatorias. En este método la dispersi ón de una variable aleatoria hace referencia a la m´ınima longitud de un intervalo asociado a una probabilidad particular y la concentraci ón es la máxima probabilidad asociada a un intervalo determinado.

(14)

La construcci ón del movimiento Browniano que presenta Donskers es en realidad una versi ón funcional del teorema del l´ımite central, siguiendo las ideas de Paul Erd˝os (1913-1996) y Mark Kac (1914-1984) sobre el principio de invarianza (el comportamiento l´ımite de una sucesi ón de funciones definidas a partir de sumas de variables aleatorias se puede determinar al considerar el l´ımite cuando las sumas tienen distribuciones especiales) en donde una sucesi ón de distribuciones que depende de una sucesi ón de variables aleatorias independientes (caminatas aleatorias simétricas) convergen a un movimiento Browniano. [6]

Por último, continuando con las ideas de Lévy y Donsker la versi ón funcional para martingalas que estudiaremos en el presente trabajo, en el fondo esta considerando un teorema del l´ımite central para cada tiempo. Por lo tanto el trabajo consistirá en encontrar cual debe ser las constantes de renor- malizacion (los a_n :=

√n

σ en el caso no funcional del teorema y la variaci ón cuadrática para el caso funcional, pero con las condiciones necesarias para que el l´ımite del proceso de variaci ón cuadrática sea lineal en el tiempo) adecuadas para el caso funcional, de manera tal que bajo el l´ımite correcto la sucesi ón de martingalas converja a un proceso que en cada tiempo presente una distribuci ón normal, por lo cual el candidato mas natural es el movimiento Browniano. Esta versi ón funcional del teorema del l´ımite central puede ser atribuida al trabajo de Patrick Paul Billingsley (1925–2011), de la escuela norteamericana, Yuri Vasilyevich Prokhorov (1929-2013), Anatoliy Volodymyrovych Skorokhod (1930-2011), de la escuela soviética, entre otros, quienes en los a ños 50’s-60’s desarrollaron en gran medida las ideas que se desarrollaran en el presente trabajo [3].

Por un lado Prokhorov en 1956 trabajando en espacios de funciones separables y completos presenta el esquema de demostraci ón que usaremos en este trabajo. Una sucesi ón de procesos estocásticos convergen en distribuci ón a un proceso estocástico X si, la sucesi ón de distribuciones es pre-compacta, las sucesiones finito dimensionales convergen y el l´ımite de las distribuciones finito dimensionales caracterizan a X [8]. Por otro lado Skorokhod bus- co comprender un poco mejor el teorema en espacios de funciones que no necesariamente son completos y separables, trabajando en el espacio de funciones continuas por derecha y con l´ımite por izquierda encontr ó distintos tipos de convergencia en estos espacios seg ún el tipo de topolog´ıa [22]. Por otro lado Billingsley hace uso del resultado de Prokhorov sobre la equivalen- cia entre pre-compacidad en espacios de medidas y la compacidad relativa y además usa la caracterizaci ón de Lévy de un movimiento Browniano. De- mostrando que el teorema funcional del l´ımite central para martingalas, se reduce a demostrar que la sucesi ón de martingalas es pre-compacta y el l´ımi- te se puede caracterizar usando el teorema de Lévy⁷ [2].

7El teorema de L´evy expresa que dado un proceso estoc´astico d-dimensional X(t), el proceso M(t) :=X(t) −X(0)es un movimiento Browniano d-dimensional si M(t)es continuo y la

(15)

como pre-compacidad en espacios de medidas, sucesiones estocásticamente acotadas y la caracterizaci ón del limite de Lévy [25]. En el presente trabajo es este el articulo que seguiremos para la demostraci ón del Teorema funcional del l´ımite central con saltos acotados.

variaci ´on cuadr´atica entre las componentes j, k∈ {1, ..., d}es igual a δ_j,kt.

(16)

(17)

Objetos principales y el TFLC

2.1. Objetos principales: martingalas, la variaci´ on cuadr´ ati- ca, el movimiento Browniano

Los objetos principales que se estudiaran en este trabajo son una clase de procesos estocásticos, las martingalas, sin embargo antes de poder introdu- cirlas es necesario definir que es un proceso estocástico. En primer lugar, dado un espacio de probabilidad (_Ω,A,P)y un espacio medible(E,A⁰)es posible definir un proceso estocástico con espacio de estados E, como una familia de variables aleatorias (Xt)_t_≥₀ donde Xt : Ω → E. No obstante, en ocasiones resulta mas conveniente considerar un proceso estocástico como una sucesi ón de funciones aleatorias(_X_t(ω))_ω_∈_Ω _{donde X}_t(ω)_:[_0,_∞) →_E.

A cada funci ´on Xt(ω)se le llama camino o realizaci ´on del proceso.

Nota 2.1 En el presente trabajo los espacios de llegada E de los procesos estocásticos no solo serán espacios de medida, sino que además serán espacios métricos de manera que sea posible definir un valor esperado. Sin embargo con el fin de que exista cierta compatibilidad entre la σ-álgebra y la topolog´ıa (inducida por la métrica) es necesario que el espacio de llegada sea separable y completo.

Definici ´on 2.2 (Espacio vectorial Polaco) Sea (E,B(E)) un espacio vectorial vec- torial topol´ogico separable y completo, luego E se llama espacio Polaco.

Definici ´on 2.3 (Proceso estoc´astico) [10] Sea (_Ω,A,P)un espacio de probabilidad, E un espacio vectorial Polaco,(E,B(E))el espacio medible y I⊂_R.

Una familia de variables aleatorias(X_t)_t_∈_I en (_Ω,A,P)con valores en(E,B(E)), se llama un proceso estoc ´astico, con espacio de estados E y conjunto de ´ındices (o conjunto de tiempos) I.

La existencia de un proceso estoc´astico dada una familia de distribuciones finito dimensionales se encuentra determinada por el Teorema de extensi ´on

(18)

de Kolmogorov, sin embargo antes de definir el teorema es necesario intro- ducir que quiere decir que una familia de medidas de probabilidad sobre productos finitos sea consistente.

Definici ´on 2.4 [10] Sea(_Ω_i,A_i)_i_∈[_0,_∞₎ una colecci´on de espacios medibles, Ωⁱ :=

×

ⁱk=0Ωk yAⁱ := ^Nⁱ_k₌₀A_k. Adem´as sea(_P_i)_i_∈[_0,∞₎una colecci´on de medidas de probabilidad definidas sobre(_Ωⁱ_,Aⁱ)para cada i ∈ [_0,_∞).

Luego si para i, j≥ k y A∈ A^k

Pi(A×_Ω_k₊₁× · · · ×_Ω_i) =_P_j(A×_Ω_k₊₁× · · · ×_Ω_j), entonces la colecci´on(_P_i)_i_∈[_0,_∞₎se llama consistente.

Ahora con el prop ´osito de extender la definici ´on a un conjunto arbitrario de

´ındices I ⊂ [0,∞), es necesario definir la proyecci ´on can ´onica.

Definici ´on 2.5 [10] Sea I⊂ [0,∞)y(_Ω_i)_i_∈_Iuna colecci´on arbitraria de conjuntos tales queΩ :=

×

i∈IΩi denota el espacio producto.

Luego X_i :Ω→_Ω_i, ω →ω(i)se llama la proyecci´on a la i-´esima coordenada.

De manera mas general para J⊂ J⁰ ⊂ I la funci´on X_J^J⁰:

×

j∈J⁰

Ωj →

×

j∈J

Ωj, ω⁰ →ω⁰|_J,

sea llama proyección canónica. En particular XJ := X_JÎ.

Definici ´on 2.6 Sea I ⊂ [0,∞), (_Ω_i,A_i)_i_∈_I una colecci´on de espacios medibles y (_P_J, J ⊂ I f inito) una familia de medidas de probabilidad sobre (_Ωⁱ,Aⁱ) donde Ωⁱ :=

×

ⁱ_k=0Ωk yAⁱ :=^Nⁱ_k₌₀A_k.

Luego si

PL=_P_J◦ (X_L^J)⁻¹ para todoL⊂ J ⊂ I finito, la colecci´on(_P_J, J ⊂ I f inito)se llama consistente.

Teorema 2.7 (Teorema de extensi ´on de Kolmogorov (1933)) [10]

Sea I ⊂ [0,∞)un conjunto arbitrario de ´ındices y(E_i,B(E_i))_i_∈_I una colecci´on de espacios medibles donde E_i es un espacio vectorial Polaco. Sea (_P_J, J ⊂ I f inito) una familia consistente de medidas de probabilidad sobre(E^J,B(E)^J)donde E^J :=

×

k∈JE_k yB(E)^J :=^N_k_∈_JB(E_k).

Entonces existe una ´unica medida de probabilidadP sobre(_Ω,A)tales que PJ =_P◦X⁻_J ¹para todo J ⊂ I.

Nota 2.8 Sea I ⊂ [_0∞), luego el proceso estoc´astico (X_t)_t_∈_I como una colecci´on de variables aleatorias con valores en el espacio de funciones

×

t∈I

E_t es muy grande y poco ´util. Entonces por lo general se busca considerar solamente un espacio de

(19)

funciones con mas propiedades espec´ıficas como continuidad.

Ahora si E := _R^d entonces el espacio de funciones a considerar es el espacio de funciones continuas sobre R^d con valores en [0,∞),C([0,∞),R^d), o si esto no es posible, el espacio de funciones continuas a derecha y con l´ımite por izquierda (el cual con la norma J₁, que es una norma que se obtiene a partir de una perturbaci´on en el tiempo y el espacio de la norma uniforme, forma un espacio m´etrico separable y completo conocido como el espacio de Skorokhod ).

Definici ón 2.9 (Funciones càdlàg,D([_{0, T}]_,_R^d)₎

Sea T > 0 yD([0, T],R^d) un espacio de funciones con valores en R^d definidas sobre el intervalo[0, T]tales que para toda funci´on X enD([0, T],R^d)se cumplen las siguientes condiciones

∀t ∈ [_{0, T}] ∀t_n↓t, l´ımtn→tX(t_n) =X(t), (continua por derecha),

∀t ∈ (0, T] ∀t_n↑t, l´ım_t_n→tX(t_n) =X(t−), (el l´ımite por izquierda existe), entonces a el espacio de funciones D([0, T],R^d) se le llama espacio de funciones càdlàg con valores en [0, T]. En particular cuando T es arbitrariamente grande obtenemos el espacio de funciones càdlàg sobre[0,∞),D([0,∞),R^d).

Nota 2.10 La palabra càdlàg proviene de su acrónimo en francés ”continue à droite, l´ımite à gauche” (continua por derecha y l´ımite por izquierda).

Ahora describiremos algunas propiedades que cumple el espacio de funciones continuas sobre el intervalo [0, T],C([0, T],R^d)y que contin úan siendo validas en el espacio de funciones càdlàgD([0, T],R^d).

Teorema 2.11 [1] Sea T>0 luego,

1. D([_{0, T}]_,_R^d)es un espacio vectorial con suma y multiplicaci´on por escalar punto a punto.

2. Si f , g ∈ _D([0, T],R^d)entonces f g ∈ _D([0, T],R^d). Mas aun si f(t) 6= 0 para todo t ∈ [0, T]entonces 1/ f ∈ _D([0, T],R^d).

3. Sea h∈_C(_R^d,R^d)y f ∈_D([0, T],R^d)entonces h◦ f ∈_D([0, T],R^d). 4. Toda función càdlàg sobre[0, T]se encuentra acotada en intervalos compactos.

5. Toda función càdlàg sobre[0, T]es uniformemente continua por derecha en intervalos compactos.

6. El l´ımite uniforme de una sucesión de funciones càdlàg en[0, T]es càdlàg.

(20)

7. Toda función càdlàg sobre [0, T] se puede aproximar uniformemente en intervalos compactos por una sucesión de funciones escalonadas.

8. Toda función càdlàg sobre[0, T]es Borel medible.

Demostraci ´on1. D([0, T],R^d)es un sub-espacio del espacio vectorial de todas las funciones de[0, T]aR^d,(_R^d)^[^0,T^].

Sean f , g∈_D([0, T],R^d)y(t_n)_n_≥₁una sucesi ´on tales que t_n↓t entonces

tl´ımn→t(f +g)(tn) = l´ım

tn→tf(tn) +l´ım

tn→tg(tn) = f(t) +g(t) = (f+g)(t), y si λ ∈_{R entonces}

tl´ımn→tλ f(t_n) =λl´ım

tn→t f(t_n) =λ f(t).

De igual manera si(t⁰_n)_n_≥₁es una sucesi ´on tales que t⁰_n ↑t (t6=0) y f , g∈ _D([0, T),R^d)entonces

tl´ım⁰_n→t(f+g)(t⁰_n) = l´ım

t⁰_n→tf(t⁰_n) + l´ım

t⁰_n→tg(t⁰_n) = f(t−) +g(t−) = (f+g)(t−), y si λ ∈_{R entonces}

tl´ım⁰_n→tλ f(t⁰_n) =λl´ım

t⁰_n→tf(t⁰_n) =λ f(t−).

2. Sean (tn)_n_≥₁ y (t⁰_n)_n_≥₁ dos sucesiones tales que tn ↓ t y t⁰_n ↑ t⁰ (t⁰ 6= 0) respectivamente entonces

tl´ımn→tf g(tn) = l´ım

tn→t f(tn)l´ım

tn→tg(tn) = f(t)g(t), y

tl´ım⁰_n→tf g(t⁰_n) = l´ım

t⁰_n→t f(t_n)l´ım

t⁰_n→tg(t_n) = f(t⁰−)g(t⁰−), Ahora si f(t) 6=0 para todo t∈ [0, T)entonces

tl´ımn→t(1/ f)(tn) =1/ l´ım

tn→tf(tn) =1/ f(t), y

tl´ım⁰_n→t(1/ f)(t⁰_n) =1/ l´ım

t⁰_n→tf(t_n) =1/ f(t⁰−).

3. Sean (tn)_n_≥₁ y (t⁰_n)_n_≥₁ dos sucesiones tales que tn ↓ t y t⁰_n ↑ t⁰ (t⁰ 6= 0) respectivamente entonces

tl´ımn→th◦ f(tn) =h(l´ım

tn→tf(tn)) =h◦f(t), y

tl´ım⁰_n→th◦ f(t⁰_n) =h(l´ım

t⁰_n→tf(t_n)) =h◦f(t⁰−).

(21)

4. Sea K⊂ [0, T]un subconjunto compacto y p∈_R^d. Luego queremos ver que existe r >0 tales que f(K) ⊂B_r(p).

Sea t ∈K, como f es continua por derecha, existe δt+>0 tales que

|f(s) − f(t)| < 1 para todo s ∈ (t, t+δ_t+). Luego si r_t+ = 1+ |f(t) −p| entonces

|f(s) −p| ≤ |f(s) − f(t)| + |f(t) −p| <r_t+, es decir f(s) ∈ B_r_t+(p)para todo s∈ (t, t+δ_t+).

De manera similar como l´ımite por la izquierda de f existe, existe δ_t− > 0 tales que |f(s) − f(t)| < 1 para todo s ∈ (t−δ_t−, t). Luego si rt− = 1+

|f(t−) −p|entonces

|f(s) −p| ≤ |f(s) − f(t)| + |f(t) −p| <r_t−,

por lo tanto f(s) ∈ B_r_t₋(p) para todo s ∈ (t−δ_t−, t). Ahora para todo s ∈ Ut = (t−δt−, t+δt+), f(s) ∈ Brt(p)donde

r_t =m´ax{r_t−, r_t+}.

Finalmente como{U_t|t∈ [0, T]}es un recubrimiento abierto de K, entonces existe n ∈_{N y t}₁, ..., tn ∈ K tales que K⊂ U₁∪ · · · ∪Uny por lo tanto para todo s ∈ K obtenemos que f(s) ∈ B_r(p) en donde r = m´ax{r_t₁, ..., r_t_n}, es decir f(K) ⊂B_r(p).

5. Sea ε>_{0 , K}⊂ [_{0, T}]compacto y f una funci ón càdlàg. Luego queremos en- contrar δ >0 tales que para todo y y para todo x, si x, y∈K y y∈ (x, x+δ) entonces |f(x) − f(y)| <ε.

De esta manera como f es continua por derecha en cada punto x ∈ K, en- tonces existen δx >0 tales que f((x, x+^δ₂^x)) ⊂B^ε

2(f(x)).

Si adem´as δ₀ ∈ K, como[0, δ₀) ∪ ((x, x+ ^δ₂^x))_x_∈_K es un recubrimiento de K entonces existe un recubrimiento finito[0, δ₀) ∪ ((x_i, x_i+ ^δ₂^xi))_i₌_1,...,n .

De esta manera si ₂^δ :=m´ın{^δ^x1₂ , ...,^δ^xn₂ }, y si y∈ (x, x+₂^δ)como x∈ (x_i, x_i+ ^δ₂^xi)para alg ´un i entonces

|y−x_i| ≤ |y−x| + |x−x_i| < ^δ 2+ ^δ^xⁱ

2 < ^δ^xⁱ 2 + ^δ^xⁱ

2 =δ_x_i, es decir y∈ (x_i, x_i+ ^δ₂^xi). Por lo tanto y∈ (x, x+₂^δ)implica que

|f(x_i) − f(y)| < ^ε₂ y por lo tanto

|f(x) − f(y)| ≤ |f(x) − f(x_i)| + |f(x_i) − f(y)| ≤ ^ε 2+ ^ε

2 =ε.

6. Sea f_n una sucesi ón de funciones càdlàg en[0, T]. Luego si f(x)es el l´ımite uniforme de fn :[0, T] →_R^d, entonces f es càdlàg si es continua por derecha y el l´ımite por izquierda existe para todo x. Sea x∈ [0, T]luego

(22)

Continuidad por derecha.

Sea ε > 0, luego por definici ´on del l´ımite existe n⁰ > n tales que sup_x_∈[_0,T_]|f(x) − f_n⁰(x)| ≤ ₃^ε.

Ahora f_n⁰(x)es continua por la derecha en x por lo tanto existe δ> 0 tales que si y∈ (x, x+δ)entonces|f_n⁰(x) − f_n⁰(y)| ≤ ₃^ε.

Pero entonces si y∈ (x, x+δ),

|f(x) − f(y)| ≤ |f(x) − f_n⁰(x)| + |f_n⁰(x) − f_n⁰(y)| + |f_n⁰(y) − f(y)|

≤ ^ε 3 + ^ε

3+ ^ε 3 =ε.

L´ımite por izquierda existe.

Sea ε > 0, luego por definici ´on del l´ımite existe n⁰ > n tales que

|f(x−) − f_n⁰(x−)| ≤ ₃^ε.

Ahora el l´ımite por izquierda en x de f_n⁰ existe, por lo tanto existe δ>0 tales que si y∈ (x−_{δ, x})_entonces|f_n⁰(x−) − f_n⁰(y)| ≤ ₃^ε_. Pero entonces si y∈ (x−δ, x),

|f(x−) − f(y)| ≤ |f(x−) − f_n⁰(x−)| + |f_n⁰(x−) −f_n⁰(y)| + |f_n⁰(y) − f(y)|

≤ ^ε 3 + ^ε

3+ ^ε 3 = _ε.

7. Sea δ>0 y 0=x₀<...< x_N =T una sucesi ´on de puntos tales que

0 < x_n+1−x_n < δ para n = 0, ..., N−1. Entonces es posible definir una funci ´on escal ´on dada por

g(x) =

(f(x_n), x_n ≤x< x_n+1

f(x_N−1), x =T.

Luego por 5. f es uniformemente continua por derecha, por lo tanto dado ε>0 existe δ>0 tales que

|f(x) − f(y)| <ε si y ∈ [x, x+δ).

Ahora para cada x∈ [0, T)existe n tales que xn≤ x≤xn+₁. Pero entonces

|x_n−x| ≤ |x_n+1−x_n| <δ, y por lo tanto

|f(x) −g(x)| = |f(x) − f(x_n)| <ε.

Ahora si x=T,

|x_N−1−x| ≤ |xN−x_N−1| <δ, y por lo tanto

|f(x) −g(x)| = |f(x) − f(x_N−1)| <ε

(23)

8. Toda funci ón càdlàg sobre[0, T]es Borel medible ya que por 7. toda funci ón càdlàg se puede aproximar por funciones escal ón y las funciones escal ón

son Borel medibles.

Nuestro inter´es en este trabajo se encuentra en el espacio de Skorkhod sobre el intervalo [0,∞). Sin embargo para esto es necesario primero dotar con una topolog´ıa que permita construir procesos estoc´asticos al espacio D([0, T],R^d) , para as´ı obtener el espacio de Skorokhod sobre el intervalo [0, T].

Definici ´on 2.12 (Espacio de Skorokhod, D([0, T],R^d)) Sea T> 0 y

D([_{0, T}]_,_R^d)el espacio de funciones càdlàg sobre el intervalo [_{0, T}]. Además para cada T >0 consideremos la métrica sobreD([0, T],R^d)

d_T(x, y)_:= _´ınf

λ∈_Λ{_sup

s<t

{_log^λ(t) −λ(s)

t−s } ∨ _sup

t∈[0,T]

|x(t) −y(λ(t))|}_, _(2.1)

donde Λ es el espacio de funciones de [0, T]a [0, T]continuas y estrictamente cre- cientes.

Luego al espacio m´etrico(_D([0, T],R^d), d_T)se llama el espacio de Skorokhod sobre el intervalo[0, T], que denotaremos simplemente comoD([0, T],R^d).

Ejemplo 2.13 Sea(tn)_n_≥₁una sucesi´on de n ´umeros reales tales que tn→1 y sean x_n, y∈_D([0, 2],R)tales que x_n=₁_[_0,t_n_], y=₁_[_0,1_].

Luego si λ_n(t) ∈Λ tales que,

λ_n:= (1

tnt si 0≤t≤ t_n

1

2−tnt+2¹₂⁻₋^t_tⁿ

n si t_n≤t≤2.

Ahora como|xn−y(λn)| =0 para todo n∈_{N y l´ım}_n_→_∞log(^λⁿ⁽^t⁾⁻_t₋^λ_sⁿ⁽^s⁾) =0, d_T(x_n, y):= ´ınf

λ∈_Λ{sup

s<t

{log(^λ(t) −λ(s)

t−s )} ∨ sup

t∈[0,T]

|x_n(t) −y(λ_n(t))|} =0.

Nota 2.14 El espacio D([0, T],R^d)es un espacio m´etrico separable y completo es decir es un espacio Polaco.

Definici ón 2.15 (Espacio de Skorokhod, D([0,∞),R^d)) SeaD([0,∞),R^d)el espacio de funciones càdlàg sobre el intervalo[0,∞). Ahora para cada entero m>0 consideremos la función

gm(t) =







1 si t≤m−1,

m−t si m−₁< t<m,

0 si t≥m.

(24)

Luego para x, y∈_D([0,∞),R^d)es posible definir la siguiente m´etrica d_∞(x, y):= ¹

2^m

∑

∞ m=1

(1∧d_m(g_mx, g_my)), (2.2) de manera que (_D([0,∞),R^d), d_∞) es un espacio m´etrico denominado el espacio de Skorokhod sobre el intervalo [0,∞), que denotaremos simplemente como D([0,∞),R^d).

Si observamos la ecuaci ´on (2.2) que define a d_∞, el papel de las funciones gm

es simplemente restringir las funciones x, y ∈ _D([0,∞),R^d) a D([0, T],R^d) de manera continua.

Nota 2.16 (H,A) es un espacio de Borel si existe un conjunto de Borel B ∈ B(_R)isomorfo a H como espacios medibles. Por lo tanto (_D([0,∞),R^d),A_d_∞)es isomorfo a(B,B(B))dondeA_d_∞ es la σ-álgebra generada por la topolog´ıa inducida por la métrica d_∞[10]. La importancia de que el espacio de Skorokhod sea un espacio Polaco radica en que los espacios Polacos son espacios de Borel y ser un espacio de Borel es una condición necesaria para que la medida sobre el espacio de caminos exista, es decir es una condición necesaria para que el proceso estocástico exista.

Definici ón 2.17 (Filtraci ón de σ-álgebra) Sea (_Ω,A,P) un espacio de probabilidad y (F_t)_t_∈[_0,∞₎ una sucesión de sub-σ-álgebras de A tales que para t < s F_s ⊂ F_t, luego(F_t)_t_∈[_0,∞₎se llama filtración enA.

Ejemplo 2.18 Dado S un espacio vectorial Polaco y un proceso estocástico(X_t)_t_∈[_0,∞₎, sobre un espacio de probabilidad (_Ω,A,P), con valores sobre el espacio medible (S,B(S)). La sucesión de σ-álgebras(F_t)_t_∈[_0,∞₎en dondeF_t := σ(^S_s_≤_tX⁻_s¹(B(S))) es una filtración y se le llama la filtraci ón natural asociada al proceso(X_t)_t_∈[_0,∞₎. Ahora presentaremos algunos propiedades de regularidad que asumiremos que cumplen las filtraciones.

Definici ´on 2.19 (Continuidad por derecha) Sea(_Ω,A,P)un espacio de probabilidad y(F_t)_t_∈[_0,∞₎ una filtraci´on enA, luego se dice que es continua por derecha si

F_t= ^\

u;u>t

F_u ∀t∈ [0,∞)

Definici ón 2.20 (Completo) Sea(_Ω,A,P)un espacio de probabilidad y(F_t)_t_∈[_0,∞₎ una filtración enA, luego la filtración (F_t)_t_∈[_0,∞₎ es completa, siF₀contiene a todos los conjuntosP-nulos deA.

Nota 2.21 Una filtración continua por derecha y completa se llama filtraci ón can ónica.

Definici ón 2.22 (Martingala d dimensional) Sea(_Ω,A,P)un espacio de probabilidad,(F_t)_t_∈[_0,∞₎una filtración y(M_t)_t_∈[_0,∞₎un proceso estocástico con valores en(_R^d,B(_R^d)). Luego si

(25)

1. E[|M_t|]:=R |M_t(ω)|_dP(dω) <∞ para cada t∈ [0,∞),

2. MtesF_t-medible para cada t∈ [0,∞),

3. E[M_t|F_s] = M_sP-c.s para t>s,,

entonces a(M_t)_t_∈[_0,∞₎ es una(F_t)_t_≥₀-martingala (la esperanza condicional se define como en el A. Klenke, Probability Theory [10]).

Nota 2.23 Los procesos que cumplen la condici´on 3 de la definici´on 2.22 se llaman procesos adaptados.

Definici ón 2.24 (Proceso adaptado) Sea (_Ω,A,P) un espacio de probabilidad, S un espacio vectorial Polaco, (S,B(S))el espacio medible, F := (F_t)_t_∈[_0,∞₎ una filtración en B(S)y (Xt)_t_∈[_0,∞₎ un proceso estocástico con valores en E, tales que X_tesF_t-medible para cada t en[0,∞), luego X_tse llamaF-adaptado.

Nota 2.25 Todo proceso es adaptado con respecto a su filtraci´on natural.

En el presente trabajo estaremos interesados en una clase particular de variables aleatorias con valores positivos llamadas tiempos aleatorios, en particular estudiaremos el tiempo de primera llegada de un proceso estocástico aun conjunto abierto. En particular si τ es un tiempo de primera llegada aso- ciado a un proceso estocástico(X_t)_t_≥₀, y(F_t)_t_≥₀ es una filtraci ón asociada a este proceso (por ejemplo la filtraci ón natural) entonces los eventos {τ≤t} son F_t-medibles.

Definici ´on 2.26 (Tiempo de parada) Sea τ una variable aleatoria definida sobre el espacio de probabilidad (_Ω,A,P), con valores en [0,∞) ∪ {_∞}y con filtraci´on asociada(F_t)_t_∈[_0,∞₎. Luego si para cualquier t∈ [0,∞)

{τ≤t} ∈ F_t, τ se llama un tiempo de parada.

Definici ón 2.27 (Tiempo de primera llegada a un abierto) Sea(_Ω,F_,_P)un espacio de probabilidad y (Xt)_t_≥₀ un proceso estocástico asociado a este espacio de probabilidad con valores en R^d y con filtración natural (F_t)_t_≥₀. Además sea A⊂_R^dun abierto, luego

τ_A:=´ınf{t >0 : X(t) ∈ A}, se llama tiempo de primera llegada a un abierto A.

(26)

Lema 2.28 [16], [19] Sea(X(t))_t_≥₀un proceso estocástico con caminos continuos por derecha, (F_t)_t_≥₀ la filtración canónica asociada a (X(t))_t_≥₀ y A ⊂ _R^d un conjunto abierto. Luego el tiempo de primera llegada τ_Asatisface,

{τ_A< t} ∈ F_t. En particular si(F_t₊)_t_≥₀:=^T_u_>_tF_uentonces,

{τ_A≤ t} ∈ F_t₊,

es decir τ_Aes un tiempo de parada con respecto a(F_t₊)_t_≥₀. Demostraci ´on En primer lugar para t>0,

{τ_A< t} = ^[

Q⁺3r≤t

{X(r) ∈A} ∈ F_t.

”⊂_{”, si τ}_A(ω) <t, entonces existe s<t tales que X(s, ω) ∈ A. Ahora como los caminos son continuos por derecha, existe r ∈ Q tales que s < r < t y X(r, ω) ∈ A. Por lo tanto ω∈^S_Q+3r≤t{X(r) ∈ A}.

” ⊃ ”, sea ω ∈ {X(r) ∈ A} para alg ´un r∈ (0, t] ∩Q. Como A es abierto y t→ X(t, ω)es continua por derecha, tenemos que τ_A(ω) <r≤t.

En segundo lugar,

{τ_A ≤t} = ^\

n≥1

{τ_A <t+ ¹

n} ∈^\F_t₊1

n = F_t₊_.

Los tiempos de parada resultan ser herramientas muy útiles para localizar un proceso, ya que como se vera a continuaci ón para el caso de las martingalas, estos permiten que cada camino del proceso estocástico se mantenga constante para tiempos posteriores a un tiempo de parada τ.

Definici ón 2.29 (Martingala local d-dimensional) Sea (_Ω,A,P) un espacio de probabilidad,(F_t)_t_∈[_0,∞₎ una filtración y(Mt)_t_∈[_0,∞₎ un proceso estocástico con valores en (_R^d,B(_R^d)), tales que MtesF-adaptado. Luego si existe una sucesión de tiempos de parada(τ_n)_n_∈[_0,∞₎tales que l´ım_n→_∞τ_n=∞ casi siempre de manera que el proceso(M_τ_n∧t)_t_≥₀es unaF-martingala uniformemente integrable, entonces (Mt)_t_≥₀ se llama unaF-martingala local.

Toda martingala es una martingala local, solo basta considerar la sucesi ´on de tiempos de parada(τ_n)_n_≥₁donde τ_n:=∞. Por otro lado no toda martingala local es una martingala, un ejemplo se encuentra en la teor´ıa del juego, mas precisamente en el juego de lanzar una moneda. La idea es pensar que se inicia el juego con un peso y se lanza la moneda, si el resultado es cara entonces el jugador gana y se queda con el peso, de lo contrario el jugador deber´a duplicar la apuesta y la estrategia consiste en continuar duplicando la apuesta hasta que el jugador gane y pueda dejar de jugar con la ganancia neta de un dolar. De esta manera en el siguiente ejemplo se formaliza esta estrategia de juego.