• No se han encontrado resultados

Selección de distribuciones de probabilidad

N/A
N/A
Protected

Academic year: 2021

Share "Selección de distribuciones de probabilidad"

Copied!
21
0
0

Texto completo

(1)

Selección de distribuciones de probabilidad

Georgina Flesia

FaMAF

(2)

Análisis estadístico de datos simulados

I Los sistemas reales tienen fuentes de aleatoriedad:

Tipo de sistema Fuente de aleatoriedad

Fabricación Tiempos de procesamiento Tiempos de falla

Tiempos de reparación de máquinas Defensa Tiempos de arribo y carga útil

de aviones o misiles. Errores de lanzamiento.

Comunicaciones Tiempos entre llegadas de mensajes. Longitudes de mensajes.

Transporte Tiempo de embarque

(3)

Simulación a partir de los datos

Para simular un sistema real es necesario:

I Representar cada fuente de aleatoriedad de acuerdo a una distribución de probabilidad.

I Elegir adecuadamente la distribución, para no afectar los resultados de la simulación.

¿Cómo elegir una distribución? ¿Cómo simular un sistema a partir de un conjunto de observaciones?

I Utilizando los datos directamente.

I Realizando el muestreo a partir de la distribuciónempíricade los datos.

I Utilizando técnicas de inferencia estadística.

I Elección de una distribución teórica.

I Estimación de parámetros.

I Tests de bondad de ajuste.

(4)

Elección de una distribución

Utilizar los datos directamente: I Sólo reproduce datos históricos.

I En general es una información insuficiente para realizar simulaciones.

I Es útil paracomparar dos sistemas, para hacer unavalidación del modeloexistente con el simulado.

Distribución empírica:

I Reproduce datos intermedios (datos continuos).

I Es recomendable si no se pueden ajustar los datos a una distribución teórica.

(5)

Inferencia estadística de un modelo

Inferencia estadística vs. distribución empírica:

I Las distribuciones empíricas pueden tener irregularidades si hay pocos datos, una distribución teórica suaviza los datos.

I Puede obtenerse información aún fuera del rango de los datos observados.

I Puede ser necesario imponer un determinado tipo de distribución, por el tipo de modelo que se desea simular. I No es necesario almacenar los datos observados ni las

correspondientes probabilidades acumuladas. I Es fácil modificar los parámetros.

I Puede no existir una distribución adecuada. I Generación de valores extremos no deseados.

(6)

Distribuciones de probabilidad más utilizadas

Continuas:

I Uniforme: Para cantidades que varían "aleatoriamente" entre valoresayb, y que no se conocen más datos.

I Exponencial: Tiempos entre llegadas de "clientes" a un sistema, y que ocurren a una tasa constante. Tiempos de falla de

máquinas.

I Gamma, Weibull: Tiempo de servicio, tiempos de reparación. I Normal: Errores. Sumas grandes→Teorema central del límite. I Otras: (Law & Kelton, cap. 6)

Parámetros:

I de posición: (normal, uniforme)

I de escala: (normal, uniforme, exponencial, lognormal) I de forma: (Gamma, Weibull, lognormal)

(7)

Distribución uniforme

I f(x) = b−a1 I(a,b)(x) I a: posición,b−a: escala. I Rango: a<x <b. I Media: a+b 2 . I Varianza: (b−a2)2.

(8)

Distribución Gamma

(

α, β

)

I f(x) = β−αxα−Γ(α)1exp(−x/β) I α: forma,β: escala. I Rango: x >0. I Media:αβ. I Varianza: αβ2. I NOTACIÓN paraβ I α=1⇒Exponencial

(9)

Distribución Weibull

(

α, β

)

I f(x) =αβ−αxα−1e−(x/β)α I α: forma,β: escala. I Rango: x >0. I Media: βαΓ α1.

(10)

Distribución Normal

(

µ, σ

2

)

I f(x) = 1 √ 2πσexp(−(x −µ) 2/(2σ2)) I µ: posición,σ: escala. I Rango: R. I Media:µ. I Varianza: σ2.

(11)

Distribución Lognormal

(

µ, σ

2

)

I f(x) = 1 x√2πσ2e −(log(x)−µ)2/(2σ2) I σ: forma,µ: escala. I Rango: x >0. I Media:eµ+σ2/2 . I Varianza: e2µ+σ‘(eσ21).

(12)

Distribuciones de probabilidad más utilizadas

Discretas: I Bernoulli.

I Uniforme discreta.

I Geométrica: número de observaciones hasta detectar el primer error.

I Binomial negativa: número de observaciones hasta detectar el n-ésimo error.

I Poisson: Número de eventos en un intervalo de tiempo, si ocurren a tasa constante.

(13)

Distribución Binomial

(14)

Distribución Geométrica

(15)
(16)

Distribución Poisson

(17)

Distribución empírica

I Supongamos que se tienen disponibles los datos observados Y1=y1, Y2=y2, . . . ,Yn=ynY1,Y2, . . . ,Yn, se define la

distribución empírica de la muestra a la función Fe(x) =

#{i|Yi ≤x}

n .

I Fe(x): proporción de valores observados menores o iguales ax.

I Si se ordena los datos en forma creciente : y(j) =j−ésimo valor más pequeño

y(1)<y(2) <· · ·<y(n). Distribución empírica ⇒ Fe(x) =                        0 x <y(1) 1 n y(1)≤x <y(2) .. . j n y(j)≤x <y(j+1) .. . 1 y(n)≤x

(18)

Gráficamente

F(x)

y(1) y(2) y(3) y(4) y(5)

(19)

Técnicas de prueba de independencia

Para ciertos tests, es necesario asumir independencia de los datos observados.

Ejemplos de no independencia:

I Datos de temperaturas a lo largo de un día. I Tiempos de demora en una cola de espera. Técnicas

I Gráficos de correlación:ρj.

I Diagramas de dispersión (scattering): (Xi,Xi+1). I Tests no paramétricos.

(20)

Inferencia estadística de un modelo

1. Elegir una o más distribuciones apropiadas.

2. Estimación de parámetros de la distribución elegida.

3. Pruebas (tests) de bondad de ajuste. I Hipótesis nula:Fe(x)es “cercana” aF(x).

I Estadístico de Kolmogorov-Smirnov D≡max

x |Fe(x)−F(x)|, −∞<x<∞.

4. Si es necesario, corregir la distribución adoptada. Elegir una distribución

I Conocer el origen de los datos.

I Estimar algunas medidas a partir de los datos:

I Media, mediana, máximo y mínimo, coeficiente de variación, desviación estándar, coeficiente de asimetría.

I Histograma.

I q-cuantiles, diagramas de caja (box-plots) I Q−Qplots yP−Pplots.

(21)

Medidas útiles

Parámetro Estimador Estima

Min, Max X(1),X(n) rango

Mediaµ X(n) Tendencia central

Mediana mˆ = ( X(n+1)/2 1 2(Xn/2+X(n/2+1)) Tendencia central. Varianzaσ2 S2(n) Variabilidad c.v.=σµ cvˆ(n) = √ S2(n) X(n) Variabilidad τ τˆ=S2(n) X(n) Variabilidad Asimetríaν= E[(X2−)3µ)/23] νˆ(n) = P i(Xi−X(n)) 3/ n [S2(n)]3/2 Simetría

Referencias

Documento similar

[r]

Asegurar una calidad mínima en los datos es una de las tareas más difíciles de conseguir para los organismos públicos cuyo objetivo es publicar datos lo más rápidamente posible

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación

1. LAS GARANTÍAS CONSTITUCIONALES.—2. C) La reforma constitucional de 1994. D) Las tres etapas del amparo argentino. F) Las vías previas al amparo. H) La acción es judicial en

Se aplica este modelo a una situación derivada de repetir n veces una prueba o experimento aleatorio con sólo dos resultados posibles que llamamos éxito y fracaso.. Sea p

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

[r]

[r]