2.3 Análisis del modelo
2.3.4 Convergencia y criterios de parada
La ley de los grandes números da condiciones suficientes para dar un sentido a la noción informal de suficiente muestreo, donde el usuario puede elegir a priori cierta proximidad deseada a µ, y luego producir suficientes muestras hasta que la misma se cumpla. Sin embargo, este resultado sólo indica que ese punto eventualmente llegará, es decir que existe un valor de N que satisfará los deseos del usuario†. No da empero ningún indicio sobre cómo medir de forma efectiva la proximidad a µque se obtiene con la muestra aleatoria actual.
Cuantificar esta proximidad es de enorme utilidad práctica. Normalmente cuando se analiza un modelo mediante simulación, el usuario solicita la estimación †Estrictamente hablando esto se formula en laley fuerte de los grandes números, una variante
2.3.4 Convergencia y criterios de parada 29
de algún valor con cierta precisión. Simulaciones independientes son lanzadas para generar la muestra aleatoria, a partir de la cual se construye la estimación. La ley de los grandes números dice que eventualmente se habrán generado suficientes muestras como para satisfacer la precisión buscada, pero eso es insuficiente en el caso práctico. Necesitamos poder dar algún tipo de garantía respecto de la distancia entre el valor real y la estimación actual. Sólo de esta forma podremos decidir si es necesario generar más simulaciones. En otras palabras: es crucial contar con algún criterio de parada.
Por suerte hay propiedades del límite de la suma de vairables aleatorias which provide ways to measure the accuracy of the current estimate, helping to build a termination criterion. Nótese que para cualquier variable aleatoria X lavariable alteatoria estandarizada Z definida como
Z =. Xq−E(X) Var(X)
satisface E(Z) = 0, Var(Z) = 1. SeaCN la suma de alguna muestra aleatoria de tamaño N con mediaµy varianzaσ2, i.e.CN
. =PN
i=1Xi. El Teorema 2 saysCN/N converges to µ; the following result studies this convergence and gives an explicit cumulative distribution function for the standardization ZN
.
=(CN−N µ)/(σ√N).
Teorema 3(Teorema Central del Límite). Sea {Xi}Ni=1 una muestra aleatoria con
media µ y varianza positiva finita σ2. Sea C
N . =PN i=1Xi, entonces l´ım N→∞P CN −N µ σ√N 6z ! = Φ(z)
para z ∈ R finito, donde Φ(z) es la función de distribución acumulada de una distribución normal estándar:
Φ(z) = √1 2π Z z −∞e −x2 2 dx .
El Teorema 3 habla de convergencia en la distribución, declarando que que la media muestral estandarizadaZN converge a la función de distribución acumulada de una normal estándar. Generally speaking the speed of convergence depends on the real distribution of the Xi, high skewness and long tails playing against it. Several rules of thumb exists about which N is large enough to start using the approximation of the Central Limit Theorem, e.g. N > 30, or CN > 5 ∧ N ∗(1−CN/N)>5 for binomial proportions. Of course and in general, the
larger the sample the better the approximation.
Estrictamente, el Teorema 3 should be applied if the variance of the population is known. En la mayoría de las situaciones prácticas σ2 es desconocida y debe ser
aproximada con el estimador insesgado
SN2 =. 1 N −1 N X i=1 Xi−XN 2 (4)
En estos casos la distribución t de Student con N −1 grados de libertad debería ser empleada en lugar de la normal, puesto que tiene una cola más larga y no depende de los valores poblacionales µy σ2. Formalmente:
XN −µ
SN/√N ∼ TN−1 (5)
donde SN . =qS2
N, µes desconocida, y la distribución t de Student con ν ∈ R grados de libertad está caracterizada por la función de densidad de probabilidad
fν(t) = 1 √ νB(1 2, ν 2) 1 + t 2 ν !−ν+12
donde B es la función Beta. The corresponding cumulative distribution function Tν(t) is harder to express and thus not included. It is a known result thatTν(x) converges to Φ(x) cuando ν→ ∞, relacionando coherentemente la ecuación (5) el Teorema 3.
Desde una perspectiva práctica and given the symmetry of the cumulative distribution function of the Student’s t-distribution (i.e. Tν(−t) = 1−Tν(t)), this means that for sufficiently large N it is safe to assume P(−t < ZN < t) ≈ 2TN−1(t)−1. Nótese que el uso de la estandarización
ZN =
XN −µ
σ/√N
pues CN = N XN, donde SN de la ecuación (4) debe ser usada en la ecuación anterior como aproximación paraσcuando la varianza poblacional es desconocida.
Para ver como estos resulados fit in the scenario of model analysis by simulation, suppose the user wants to find out the likelihood γ of satisfying certain property in his model. Furthermore, and here lies the core asset, he requests an upper bound de ε >0 para la probabilidad de error en la estimación.
El método Monte Carlo estándar via discrete event simulation generates several, N say, independent simulations. Each simulation results in some path which will either satisfy the property or not. Thus a random sample {Xi}Ni=1 is
generated, where Xi = 1 if the i-th simulated path satisfies the property and Xi = 0 otherwise. This definition of theXi means the queried likelihood is the population mean, γ = µ. Thus a straightforward estimator ˆγ for the likelihood is the sample mean XN. DenótenseX =XN y σX =SN/√N, entonces lo que sigue
devuelve una cuantificación (conservativa) del error incurrido en la aproximación: P(|γˆ−γ|6ε) = P(−ε6γˆ−γ 6ε) =P − ε σX 6 X−µ σX 6 ε σX ! ≈2TN−1 ε σX ! −1
2.3.4 Convergencia y criterios de parada 31
Notar que hasta ahora sólo hemos considerado estimadores puntuales, i.e. se le da al usuario una estimación ˆγ ∈R del valor real γ que desea conocer, and can compute the probability of error incurred in the estimation. The approach usually followed in practice is slightly more involved and adds an interval a la información provista por el estimador puntual.
Definición 5(Intervalo de confianza). Dada una muestra aleatoria{Xi}Ni=1tomada
de alguna población, un intervalo de confianza (IC) alrededor de algún parámetro θ ∈R de la población es un intervalo [l, u]⊂R, cuyos límitesl, u son variables aleatorias derivadas de la muestra, y que contiene (cubre) al verdadero parámetro θ con alguna probabilidad conocida.
La Definición 5 es un tanto laxa because the specific expression of the interval may vary depending on the parameter to estimate and the nature of the sample. For this thesis the main interest is to build a IC around the population mean µ. Denote by zα theα-quantile of the standard normal distribution for 0< α <1, i.e. the area to the right of zα ∈R under the curve of its density function is α. Usando la simetría de esta función junto con la aproximación provista por el Teorema Central del Límite esto se traduce en
P −zα 2 6 X−µ σX 6zα2 ! ≈1−α o equivalentemente P X−zα 2σX 6µ6X+z α 2σX ≈1−α (6)
La Ecuación (6) expresa que para muestras lo suficientemente grandes, la probabilidad de queµse encuentre en el intervaloX±zα
2σX está aproximada por
1−α. This interval is thus called a 100(1−α)% confidence interval. The value 100(1−α)∈(0,100) is the confidence level and its width 2zα
2σX is theprecision
of the interval. The same analysis follows using Student’s t-distribution instead of the normal distribution, cuando la varianza poblacional es desconocida.
Ahora sí contamos con todos los ingredientes para analizar un sistema mediante simulación. El usuario provee una descripción formal de su modelo y de la propiedad que desea consultar. También especifica el nivel de confianza y la precisión con la que se estimará el parámetro. Se simulan caminos de ejecución con la técnica de simulación de eventos discretos, que resultan en realizaciones de las v.a. X y σX (o el estimador que corresponda para ˆγ y su varianza). Como el nivel de confianza fue prefijado, con cada nueva realización (i.e. por cada simulación finalizada) se actualiza el intervalo. Así, el valor concreto de la precisión del intervalo estimado se va actualizando, y de acuerdo al Teorema 2 este valor eventualmente disminuirá. El cómputo finaliza ni bien la precisión lograda para el intervalo se hace más chica que la que había solicitado el usuario. Alternativamente el usuario podría prefijar un nivel de confianza y un tiempo límite de cómputo, midiendo la precisión lograda en el intervalo estimado cuando las simulaciones concluyan.