Convergencia y criterios de parada - Análisis del modelo

2.3 Análisis del modelo

2.3.4 Convergencia y criterios de parada

La ley de los grandes números da condiciones suficientes para dar un sentido a la noción informal de suficiente muestreo, donde el usuario puede elegir a priori cierta proximidad deseada a µ, y luego producir suficientes muestras hasta que la misma se cumpla. Sin embargo, este resultado sólo indica que ese punto eventualmente llegará, es decir que existe un valor de N que satisfará los deseos del usuario†. No da empero ningún indicio sobre cómo medir de forma efectiva la proximidad a µque se obtiene con la muestra aleatoria actual.

Cuantificar esta proximidad es de enorme utilidad práctica. Normalmente cuando se analiza un modelo mediante simulación, el usuario solicita la estimación †_{Estrictamente hablando esto se formula en la}_{ley fuerte de los grandes números}_{, una variante}

2.3.4 Convergencia y criterios de parada 29

de algún valor con cierta precisión. Simulaciones independientes son lanzadas para generar la muestra aleatoria, a partir de la cual se construye la estimación. La ley de los grandes números dice que eventualmente se habrán generado suficientes muestras como para satisfacer la precisión buscada, pero eso es insuficiente en el caso práctico. Necesitamos poder dar algún tipo de garantía respecto de la distancia entre el valor real y la estimación actual. Sólo de esta forma podremos decidir si es necesario generar más simulaciones. En otras palabras: es crucial contar con algún criterio de parada.

Por suerte hay propiedades del límite de la suma de vairables aleatorias which provide ways to measure the accuracy of the current estimate, helping to build a termination criterion. Nótese que para cualquier variable aleatoria X lavariable alteatoria estandarizada Z definida como

Z =. Xq−E(X) Var(X)

satisface E(Z) = 0, Var(Z) = 1. SeaCN la suma de alguna muestra aleatoria de tamaño N con mediaµy varianzaσ2, i.e.CN

. =PN

i=1Xi. El Teorema 2 saysCN/N converges to µ; the following result studies this convergence and gives an explicit cumulative distribution function for the standardization ZN

=(CN−N µ)/₍_σ√_N₎.

Teorema 3(Teorema Central del Límite). Sea {Xi}Ni=1 una muestra aleatoria con

media µ y varianza positiva finita σ2_{. Sea} _C

N . =PN i=1Xi, entonces l´ım N→∞P CN −N µ σ√N 6z ! = Φ(z)

para z ∈ _R finito, donde Φ(z) es la función de distribución acumulada de una distribución normal estándar:

Φ(z) = √1 2π Z z −∞e −x2 2 dx .

El Teorema 3 habla de convergencia en la distribución, declarando que que la media muestral estandarizadaZN converge a la función de distribución acumulada de una normal estándar. Generally speaking the speed of convergence depends on the real distribution of the Xi, high skewness and long tails playing against it. Several rules of thumb exists about which N is large enough to start using the approximation of the Central Limit Theorem, e.g. N > 30, or CN > 5 ∧ N ∗(1−CN/N)>5 for binomial proportions. Of course and in general, the

larger the sample the better the approximation.

Estrictamente, el Teorema 3 should be applied if the variance of the population is known. En la mayoría de las situaciones prácticas σ2 _{es desconocida y debe ser}

aproximada con el estimador insesgado

S_N2 =. 1 N −1 N X i=1 Xi−XN 2 (4)

En estos casos la distribución t de Student con N −1 grados de libertad debería ser empleada en lugar de la normal, puesto que tiene una cola más larga y no depende de los valores poblacionales µy σ2_{. Formalmente:}

XN −µ

SN/√_N ∼ TN−1 (5)

donde SN . =qS2

N, µes desconocida, y la distribución t de Student con ν ∈ R grados de libertad está caracterizada por la función de densidad de probabilidad

fν(t) = 1 √ νB(1 2, ν 2) 1 + t 2 ν !−ν+1₂

donde B es la función Beta. The corresponding cumulative distribution function Tν(t) is harder to express and thus not included. It is a known result thatTν(x) converges to Φ(x) cuando ν→ ∞, relacionando coherentemente la ecuación (5) el Teorema 3.

Desde una perspectiva práctica and given the symmetry of the cumulative distribution function of the Student’s t-distribution (i.e. Tν(−t) = 1−Tν(t)), this means that for sufficiently large N it is safe to assume P(−t < ZN < t) ≈ 2TN−1(t)−1. Nótese que el uso de la estandarización

ZN =

XN −µ

σ_/√_N

pues CN = N XN, donde SN de la ecuación (4) debe ser usada en la ecuación anterior como aproximación paraσcuando la varianza poblacional es desconocida.

Para ver como estos resulados fit in the scenario of model analysis by simulation, suppose the user wants to find out the likelihood γ of satisfying certain property in his model. Furthermore, and here lies the core asset, he requests an upper bound de ε >0 para la probabilidad de error en la estimación.

El método Monte Carlo estándar via discrete event simulation generates several, N say, independent simulations. Each simulation results in some path which will either satisfy the property or not. Thus a random sample {Xi}Ni=1 is

generated, where Xi = 1 if the i-th simulated path satisfies the property and Xi = 0 otherwise. This definition of theXi means the queried likelihood is the population mean, γ = µ. Thus a straightforward estimator ˆγ for the likelihood is the sample mean XN. DenótenseX =XN y σ_X =SN/√N, entonces lo que sigue

devuelve una cuantificación (conservativa) del error incurrido en la aproximación: P(|γˆ−γ|₆ε) = P(−ε₆γˆ−γ ₆ε) =P − ε σ_X 6 X−µ σ_X 6 ε σ_X ! ≈2TN−1 ε σ_X ! −1

2.3.4 Convergencia y criterios de parada 31

Notar que hasta ahora sólo hemos considerado estimadores puntuales, i.e. se le da al usuario una estimación ˆγ ∈_R del valor real γ que desea conocer, and can compute the probability of error incurred in the estimation. The approach usually followed in practice is slightly more involved and adds an interval a la información provista por el estimador puntual.

Definición 5(Intervalo de confianza). Dada una muestra aleatoria{Xi}Ni=1tomada

de alguna población, un intervalo de confianza (IC) alrededor de algún parámetro θ ∈_R de la población es un intervalo [l, u]⊂_R, cuyos límitesl, u son variables aleatorias derivadas de la muestra, y que contiene (cubre) al verdadero parámetro θ con alguna probabilidad conocida.

La Definición 5 es un tanto laxa because the specific expression of the interval may vary depending on the parameter to estimate and the nature of the sample. For this thesis the main interest is to build a IC around the population mean µ. Denote by zα theα-quantile of the standard normal distribution for 0< α <1, i.e. the area to the right of zα ∈R under the curve of its density function is α. Usando la simetría de esta función junto con la aproximación provista por el Teorema Central del Límite esto se traduce en

P −zα 2 6 X−µ σ_X 6zα2 ! ≈1−α o equivalentemente P X−zα 2σX 6µ6X+z α 2σX ≈1−α (6)

La Ecuación (6) expresa que para muestras lo suficientemente grandes, la probabilidad de queµse encuentre en el intervaloX±zα

2σX está aproximada por

1−α. This interval is thus called a 100(1−α)% confidence interval. The value 100(1−α)∈(0,100) is the confidence level and its width 2zα

2σX is theprecision

of the interval. The same analysis follows using Student’s t-distribution instead of the normal distribution, cuando la varianza poblacional es desconocida.

Ahora sí contamos con todos los ingredientes para analizar un sistema mediante simulación. El usuario provee una descripción formal de su modelo y de la propiedad que desea consultar. También especifica el nivel de confianza y la precisión con la que se estimará el parámetro. Se simulan caminos de ejecución con la técnica de simulación de eventos discretos, que resultan en realizaciones de las v.a. X y σ_X (o el estimador que corresponda para ˆγ y su varianza). Como el nivel de confianza fue prefijado, con cada nueva realización (i.e. por cada simulación finalizada) se actualiza el intervalo. Así, el valor concreto de la precisión del intervalo estimado se va actualizando, y de acuerdo al Teorema 2 este valor eventualmente disminuirá. El cómputo finaliza ni bien la precisión lograda para el intervalo se hace más chica que la que había solicitado el usuario. Alternativamente el usuario podría prefijar un nivel de confianza y un tiempo límite de cómputo, midiendo la precisión lograda en el intervalo estimado cuando las simulaciones concluyan.

In document Automatización de técnicas de división por importancia para la simulación de eventos raros (página 36-40)