Criterio de parada cerca de la cima de una caminata aleatoria
Jos´e ´Angel Islas Anguiano
FCFM
Universidad Autonoma de Sinaloa
23 de Octubre de 2017
Figure:
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
´Indice
1 Problemas de parada ´optima
2 Problema: Criterio de parada cerca de la cima de una caminata aleatoria
Planteamiento Antecedentes Resultados Nuevos resultados
Regla de parada
Definici´on
Una regla de parada con respecto a una secuencia de variables aleatorias X1, X2, ... es una variable aleatoria τ con valores en (1,2,...) y la propiedad de que para cada t en (1,2,...), la ocurrencia o no ocurrencia del evento τ = t depende solo de los valores X1, X2, ..., Xt.
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Problemas de parada ´ optima
Definici´on. Problemas de parada ´optima
Losproblemas de parada ´optimaest´an definidos por dos objetos:
(i) una secuencia de variables aleatorias, X1, X2, ..., cuya distribution conjunta se conoce
(ii) una secuenca de funciones de recompensa de valores reales,
y0, y1(x1), y2(x1, x2), ..., y∞(x1, x2, ...)
(iii) De (i) y (ii), si nos detenemos en el tiempo k y si X1= x1, X2 = x2, ..., Xk= xk, entonces recibimos la recompensa Yk = yk(x1, x2, ..., xk)
Cuando pararse o continuar observando las variables aleatorias para maximizar el valor esperado de la recomensa o minimizar el costo esperado?, Esto esE[Yτ]
Problemas de parada ´ optima
Definici´on. Problemas de parada ´optima
Losproblemas de parada ´optimaest´an definidos por dos objetos:
(i) una secuencia de variables aleatorias, X1, X2, ..., cuya distribution conjunta se conoce
(ii) una secuenca de funciones de recompensa de valores reales,
y0, y1(x1), y2(x1, x2), ..., y∞(x1, x2, ...)
(iii) De (i) y (ii), si nos detenemos en el tiempo k y si X1= x1, X2 = x2, ..., Xk= xk, entonces recibimos la recompensa Yk = yk(x1, x2, ..., xk)
Cuando pararse o continuar observando las variables aleatorias para maximizar el valor esperado de la recomensa o minimizar el costo esperado?, Esto esE[Yτ]
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Problemas de parada ´ optima
Definici´on. Problemas de parada ´optima
Losproblemas de parada ´optimaest´an definidos por dos objetos:
(i) una secuencia de variables aleatorias, X1, X2, ..., cuya distribution conjunta se conoce
(ii) una secuenca de funciones de recompensa de valores reales,
y0, y1(x1), y2(x1, x2), ..., y∞(x1, x2, ...)
(iii) De (i) y (ii), si nos detenemos en el tiempo k y si X1= x1, X2 = x2, ..., Xk= xk, entonces recibimos la recompensa Yk = yk(x1, x2, ..., xk)
Cuando pararse o continuar observando las variables aleatorias para maximizar el valor esperado de la recomensa o minimizar el costo esperado?, Esto esE[Yτ]
Problemas de parada ´ optima
Definici´on. Problemas de parada ´optima
Losproblemas de parada ´optimaest´an definidos por dos objetos:
(i) una secuencia de variables aleatorias, X1, X2, ..., cuya distribution conjunta se conoce
(ii) una secuenca de funciones de recompensa de valores reales,
y0, y1(x1), y2(x1, x2), ..., y∞(x1, x2, ...)
(iii) De (i) y (ii), si nos detenemos en el tiempo k y si X1= x1, X2 = x2, ..., Xk= xk, entonces recibimos la recompensa Yk = yk(x1, x2, ..., xk)
Cuando pararse o continuar observando las variables aleatorias para maximizar el valor esperado de la recomensa o minimizar el costo esperado?, Esto esE[Yτ]
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Problemas de horizonte finito
Horizonte finito
Es necesario parar despues de observar X1, X2, ..., XN
Inducci´on para atr´as (Backward Induction)
Se utiliza Inducci´on para atr´as para resolver este tipo de problemas.
Problemas de horizonte finito
Horizonte finito
Es necesario parar despues de observar X1, X2, ..., XN
Inducci´on para atr´as (Backward Induction)
Se utiliza Inducci´on para atr´as para resolver este tipo de problemas.
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Planteamiento del problema
Caminata aleatoria
(i) Sean X1, X2, ..., XN iid Bernoulli(p) , esto es
Xi =
(1, con probabilidad p
−1, con probabilidad 1 − p.
(ii) Considere S0:= 0, Sn:= X1+ X2+ ... + Xnpara n ≤ N y
(iii) MN := max(S0, S1, ...SN)
Planteamiento del problema
Caminata aleatoria
(i) Sean X1, X2, ..., XN iid Bernoulli(p) , esto es
Xi =
(1, con probabilidad p
−1, con probabilidad 1 − p.
(ii) Considere S0 := 0, Sn:= X1+ X2+ ... + Xnpara n ≤ N y
(iii) MN := max(S0, S1, ...SN)
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Planteamiento del problema
Caminata aleatoria
(i) Sean X1, X2, ..., XN iid Bernoulli(p) , esto es
Xi =
(1, con probabilidad p
−1, con probabilidad 1 − p.
(ii) Considere S0 := 0, Sn:= X1+ X2+ ... + Xnpara n ≤ N y
(iii) MN := max(S0, S1, ...SN)
Antecedentes
Problema
Suponga que se desea maximizar la probabilidad de ”deterse en la cima” de la caminata aleatoria, esto es,P (Sτ = MN). Cu´al es la regla de parada ´optima τ ?
Fue resuelto por Hlynka and Sheahan (1988) para el caso p = 12. Recientemente Yam et al. (2009) dieron una soluci´on general.
1 Si p > 12,τ = N es la ´unica regla de p´arada ´optima
2 Si p < 12,τ = 0es la ´unica regla de p´arada ´optima
3 Si p = 12, cualquier regla τ tal que P (Sτ = Mτ o τ = N ) = 1 es ´optima
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Antecedentes
Problema
Suponga que se desea maximizar la probabilidad de ”deterse en la cima” de la caminata aleatoria, esto es,P (Sτ = MN). Cu´al es la regla de parada ´optima τ ?
Fue resuelto por Hlynka and Sheahan (1988) para el caso p = 12. Recientemente Yam et al. (2009) dieron una soluci´on general.
1 Si p > 12,τ = N es la ´unica regla de p´arada ´optima
2 Si p < 12,τ = 0es la ´unica regla de p´arada ´optima
3 Si p = 12, cualquier regla τ tal que P (Sτ = Mτ o τ = N ) = 1 es ´optima
Antecedentes
Problema
Suponga que se desea maximizar la probabilidad de ”deterse en la cima” de la caminata aleatoria, esto es,P (Sτ = MN). Cu´al es la regla de parada ´optima τ ?
Fue resuelto por Hlynka and Sheahan (1988) para el caso p = 12. Recientemente Yam et al. (2009) dieron una soluci´on general.
1 Si p > 12,τ = N es la ´unica regla de p´arada ´optima
2 Si p < 12,τ = 0es la ´unica regla de p´arada ´optima
3 Si p = 12, cualquier regla τ tal que P (Sτ = Mτ o τ = N ) = 1 es ´optima
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Antecedentes
Problema
Suponga que se desea maximizar la probabilidad de ”deterse en la cima” de la caminata aleatoria, esto es,P (Sτ = MN). Cu´al es la regla de parada ´optima τ ?
Fue resuelto por Hlynka and Sheahan (1988) para el caso p = 12. Recientemente Yam et al. (2009) dieron una soluci´on general.
1 Si p > 12,τ = N es la ´unica regla de p´arada ´optima
2 Si p < 12,τ = 0es la ´unica regla de p´arada ´optima
3 Si p = 12, cualquier regla τ tal que P (Sτ = Mτ o τ = N ) = 1 es ´optima
Antecedentes
Problema
Suponga que se desea maximizar la probabilidad de ”deterse en la cima” de la caminata aleatoria, esto es,P (Sτ = MN). Cu´al es la regla de parada ´optima τ ?
Fue resuelto por Hlynka and Sheahan (1988) para el caso p = 12. Recientemente Yam et al. (2009) dieron una soluci´on general.
1 Si p > 12,τ = N es la ´unica regla de p´arada ´optima
2 Si p < 12,τ = 0es la ´unica regla de p´arada ´optima
3 Si p = 12, cualquier regla τ tal que P (Sτ = Mτ o τ = N ) = 1 es ´optima
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Criterio de parada cerca de la cima
Problema
Dado N > 0, encuentre una regla de parada τ ≤ N tal que maximize
P (MN − Sτ ≤ 1).
(Gana si se detiene en uno de losdosvalores mas altos )
Exploraci´ on
Definici´on
Diremos que estamos en elestado(n, i) si:
1 Faltan n pasos hasta el final N ;
2 La caminata esta i unidades por debajo del m´aximo actual.
Obviamente, es ´optimocontinuaren los estados (n, 2), (n, 3), . . . Lema (Allaart)
En el estado (n, 0) con n ≥ 1, tambi´en es ´optimo continuar. No es tan dif´ıcil – detenerse despues de elsiguientepaso (ya sea para arriba o abajo) esal menos tan bueno como detenerseahora. Conclusi´on
Los estados cr´ıticos son (n, 1), para n = 1, 2, . . . .
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Exploraci´ on
Definici´on
Diremos que estamos en elestado(n, i) si:
1 Faltan n pasos hasta el final N ;
2 La caminata esta i unidades por debajo del m´aximo actual.
Obviamente, es ´optimocontinuaren los estados (n, 2), (n, 3), . . .
Lema (Allaart)
En el estado (n, 0) con n ≥ 1, tambi´en es ´optimo continuar. No es tan dif´ıcil – detenerse despues de elsiguientepaso (ya sea para arriba o abajo) esal menos tan bueno como detenerseahora. Conclusi´on
Los estados cr´ıticos son (n, 1), para n = 1, 2, . . . .
Exploraci´ on
Definici´on
Diremos que estamos en elestado(n, i) si:
1 Faltan n pasos hasta el final N ;
2 La caminata esta i unidades por debajo del m´aximo actual.
Obviamente, es ´optimocontinuaren los estados (n, 2), (n, 3), . . . Lema (Allaart)
En el estado (n, 0) con n ≥ 1, tambi´en es ´optimo continuar.
No es tan dif´ıcil – detenerse despues de elsiguientepaso (ya sea para arriba o abajo) esal menos tan bueno como detenerseahora.
Conclusi´on
Los estados cr´ıticos son (n, 1), para n = 1, 2, . . . .
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Exploraci´ on
Definici´on
Diremos que estamos en elestado(n, i) si:
1 Faltan n pasos hasta el final N ;
2 La caminata esta i unidades por debajo del m´aximo actual.
Obviamente, es ´optimocontinuaren los estados (n, 2), (n, 3), . . . Lema (Allaart)
En el estado (n, 0) con n ≥ 1, tambi´en es ´optimo continuar.
No es tan dif´ıcil – detenerse despues de elsiguientepaso (ya sea para arriba o abajo) esal menos tan bueno como detenerseahora.
Exploraci´ on
Lema (Allaart)
Para cada n ≥ 1, existe 0 < pn≤ 1 tal que , en el estado (n, 1), es
´ optimo
parar si p ≤ pn; continuar si p ≥ pn.
Nota
Los pnson calculados usando inducci´on para atr´as.
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Exploraci´ on
Lema (Allaart)
Para cada n ≥ 1, existe 0 < pn≤ 1 tal que , en el estado (n, 1), es
´ optimo
parar si p ≤ pn; continuar si p ≥ pn. Nota
Los pnson calculados usando inducci´on para atr´as.
Table:Valores cr´ıticos pn
n pn n pn
1 1 11 .48452
2 0.5 12 .47984
3 0.5 13 .48543
4 .46898 14 .48175 5 .48288 15 .48624 6 .47144 16 .48330 7 .48268 17 .48697 8 .47470 18 .48453 9 .48357 19 .48760 10 .47752 20 .48554
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Gr´ afica y conjeturas
Gr´afica de la probabilidades cr´ıticas
- n 6
pn
0.45 0.50
2 3 4 7 10 13
• •
•
•
•
• • • • • • •
La gr´afica sugiere:
1 pn< 0.5 para todo n ≥ 4
2 limn→∞pn= 0.5
3 p2n−2< p2n< p2n−1 < p2n+1, para todo n ≥ 4,
Gr´ afica y conjeturas
Gr´afica de la probabilidades cr´ıticas
- n 6
pn
0.45 0.50
2 3 4 7 10 13
• •
•
•
•
• • • • • • •
La gr´afica sugiere:
1 pn< 0.5 para todo n ≥ 4
2 limn→∞pn= 0.5
3 p2n−2 < p2n< p2n−1 < p2n+1, para todo n ≥ 4,
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Gr´ afica y conjeturas
Gr´afica de la probabilidades cr´ıticas
- n 6
pn
0.45 0.50
2 3 4 7 10 13
• •
•
•
•
• • • • • • •
La gr´afica sugiere:
1 pn< 0.5 para todo n ≥ 4
lim p = 0.5
Propiedades de la sucesi´ on
Teorema (Allaart)
1 pn< 0.5 para todo n ≥ 4
2 lim supn→∞pn= 0.5
3 p2n< p2n−1 < p2n+1 para todo n ≥ 4, Conjecturas acerca de pn (Allaart)
i) limn→∞pn= 0.5.
ii) p2n ≤ p2n+2 para todo n ≥ 2.
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Propiedades de la sucesi´ on
Teorema (Allaart)
1 pn< 0.5 para todo n ≥ 4
2 lim supn→∞pn= 0.5
3 p2n< p2n−1 < p2n+1 para todo n ≥ 4, Conjecturas acerca de pn (Allaart)
i) limn→∞pn= 0.5.
ii) p2n ≤ p2n+2 para todo n ≥ 2.
Propiedades de la sucesi´ on
Teorema (Allaart)
1 pn< 0.5 para todo n ≥ 4
2 lim supn→∞pn= 0.5
3 p2n < p2n−1 < p2n+1 para todo n ≥ 4,
Conjecturas acerca de pn (Allaart) i) limn→∞pn= 0.5.
ii) p2n ≤ p2n+2 para todo n ≥ 2.
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Propiedades de la sucesi´ on
Teorema (Allaart)
1 pn< 0.5 para todo n ≥ 4
2 lim supn→∞pn= 0.5
3 p2n < p2n−1 < p2n+1 para todo n ≥ 4, Conjecturas acerca de pn (Allaart)
i) limn→∞pn= 0.5.
ii) p2n ≤ p2n+2 para todo n ≥ 2.
Nuevos resultados
Teorema
1 pn≥ p4 para n ≥ 1
2 p2n+4≤ p2n+1 para todo n ≥ 0.
3 p2n+6≤ p2n+1 para todo n ≥ 3.
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Nuevos resultados
Teorema
1 pn≥ p4 para n ≥ 1
2 p2n+4 ≤ p2n+1 para todo n ≥ 0.
3 p2n+6≤ p2n+1 para todo n ≥ 3.
Nuevos resultados
Teorema
1 pn≥ p4 para n ≥ 1
2 p2n+4 ≤ p2n+1 para todo n ≥ 0.
3 p2n+6 ≤ p2n+1 para todo n ≥ 3.
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Gr´ afica
Gr´afica de la probabilidades cr´ıticas
- n 6
pn
0.45 0.50
2 3 4 7 10 13
• •
•
•
•
• • •
• • • •
Teorema
1 pn≥ p4 para n ≥ 1
2 p2n+4≤ p2n+1 para todo n ≥ 0.
3 p2n+6≤ p2n+1 para todo n ≥ 3.
Gr´ afica
Gr´afica de la probabilidades cr´ıticas
- n 6
pn
0.45 0.50
2 3 4 7 10 13
• •
•
•
•
• • •
• • • •
Teorema
1 pn≥ p4 para n ≥ 1
2 p2n+4 ≤ p2n+1 para todo n ≥ 0.
3 p2n+6≤ p2n+1 para todo n ≥ 3.
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Gr´ afica
Gr´afica de la probabilidades cr´ıticas
- n 6
pn
0.45 0.50
2 3 4 7 10 13
• •
•
•
•
• • •
• • • •
Teorema
1 pn≥ p4 para n ≥ 1
2 p ≤ p para todo n ≥ 0.
Gr´ afica
Gr´afica de la probabilidades cr´ıticas
- n 6
pn
0.45 0.50
2 3 4 7 10 13
• •
•
•
•
• • •
• • • •
Teorema
1 pn≥ p4 para n ≥ 1
2 p2n+4 ≤ p2n+1 para todo n ≥ 0.
3 p2n+6 ≤ p2n+1 para todo n ≥ 3.
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria
Proyecto
Competencia en una caminata aleatoria.
Dos corredores de valores: A y B Uno gana y el otro pierde A tiene la preferencia
Cual es la estrategia de cada corredor que maximiza su probabilidad de ganar?
Referencias
Allaart, P. C. (2010).
How to stop near the top in a random walk?.
Decision Making Processes under Uncertainty and Ambiguity, RIMS Kokyuroku 1682, 33–40.
Hlynka, M. and Sheahan, J. N. (1988).
The secretary problem for a random walk.
Stoch. Proc. Appl. 28, 317–325.
Yam, S. C. P., Yung, S. P. and Zhou, W. (2009).
Two rationales behind ‘buy-and-hold or sell-at-once’.
J. Appl. Probab. 46, 651–668.
Jos´e ´Angel Islas Anguiano Criterio de parada cerca de la cima de una caminata aleatoria