• No se han encontrado resultados

Selección de distribuciones de probabilidad

N/A
N/A
Protected

Academic year: 2021

Share "Selección de distribuciones de probabilidad"

Copied!
30
0
0

Texto completo

(1)

Selección de distribuciones de probabilidad

Patricia Kisbye

FaMAF

(2)

Análisis estadístico de datos simulados

I Los sistemas reales tienen fuentes de aleatoriedad:

Tipo de sistema Fuente de aleatoriedad

Fabricación Tiempos de procesamiento Tiempos de falla

Tiempos de reparación de máquinas Defensa Tiempos de arribo y carga útil

de aviones o misiles. Errores de lanzamiento.

Comunicaciones Tiempos entre llegadas de mensajes. Longitudes de mensajes.

Transporte Tiempo de embarque

(3)

Simulación a partir de los datos

Para simular un sistema real es necesario:

I Representar cada fuente de aleatoriedad de acuerdo a una distribución de probabilidad.

I Elegir adecuadamente la distribución, para no afectar los resultados de la simulación.

¿Cómo elegir una distribución? ¿Cómo simular un sistema a partir de un conjunto de observaciones?

I Utilizando los datos directamente.

I Realizando el muestreo a partir de la distribución empírica de los datos.

(4)

Elección de una distribución

Utilizar los datos directamente: I Sólo reproduce datos históricos.

I En general es una información insuficiente para realizar simulaciones.

I Es útil paracomparar dos sistemas, para hacer unavalidación del modeloexistente con el simulado.

Distribución empírica:

I Reproduce datos intermedios (datos continuos).

(5)

Inferencia estadística

Inferencia estadística vs. distribución empírica:

I Las distribuciones empíricas pueden tener irregularidades si hay pocos datos, una distribución teórica suaviza los datos.

I Puede obtenerse información aún fuera del rango de los datos observados.

I Puede ser necesario imponer un determinado tipo de distribución, por el tipo de modelo que se desea simular. I No es necesario almacenar los datos observados ni las

correspondientes probabilidades acumuladas. I Es fácil modificar los parámetros.

(6)

Distribuciones de probabilidad más utilizadas

Continuas:

I Uniforme: Para cantidades que varían "aleatoriamente" entre valores a y b, y que no se conocen más datos.

I Exponencial: Tiempos entre llegadas de "clientes" a un sistema, y que ocurren a una tasa constante. Tiempos de falla de

máquinas.

I Gamma, Weibull: Tiempo de servicio, tiempos de reparación. I Normal: Errores. Sumas grandes → Teorema central del límite. I Otras: (Law & Kelton, cap. 6)

Parámetros:

I de posición: (normal, uniforme)

(7)
(8)
(9)

Distribución Weibull (α, β)

(10)
(11)
(12)

Distribuciones de probabilidad más utilizadas

Discretas: I Bernoulli.

I Uniforme discreta.

I Geométrica: número de observaciones hasta detectar el primer error.

I Binomial negativa: número de observaciones hasta detectar el n-ésimo error.

(13)

Distribución Binomial

(14)

Distribución Geométrica

(15)
(16)

Distribución Poisson

(17)

Distribución empírica

Datos continuos

I Datos observados: X1,X2, . . . ,Xndisponibles.

I Datos agrupados en un intervalo: histograma.

Si los datos estándisponibles, puede construirse una función de distribución lineal a trozos:

I Ordenando los datos de menor a mayor: X(1),X(2), . . . ,X(n)

I Definiendo F (x ) como: F (x ) =      0 x < X(1) i−1 n−1+ x −X(i)

(n−1)(X(i+1)−X(i)) X(i)≤ x < X(i+1) 1 ≤ i < n

1 X(n)≤ x

(18)

Si los datos estánagrupadosen intervalos: [a0,a1), [a1,a2), . . . , [ak −1,ak)

y cada intervalo [aj−1,aj)contiene nj observaciones:

n1+n2+ · · · +nk =n

es razonable definir la distribución empírica como: G(a0) =0, G(aj) =

n1+n2+ · · · +nj

(19)
(20)

Caso discreto

I Si los datos X1,X2, . . . ,Xnestándisponiblesse define la función

de masa empírica:

p(x ) = #{i | Xi =x } n

I Si los datos estánagrupados, se define la función de masa p(x ) de modo que la suma en cada intervalo sea igual a la proporción de Xi´s en dicho intervalo.

(21)

Técnicas de prueba de independencia

Para ciertos tests, es necesario asumir independencia de los datos observados.

Ejemplos de no independencia:

I Datos de temperaturas a lo largo de un día. I Tiempos de demora en una cola de espera. Técnicas

I Gráficos de correlación: ρj.

I Diagramas de dispersión (scattering): (Xi,Xi+1).

(22)

Inferencia estadística

1. Elegir una o más distribuciones apropiadas.

2. Estimación de parámetros de la distribución elegida. 3. Pruebas (tests) de bondad de ajuste.

4. Si es necesario, corregir la distribución adoptada. Elegir una distribución

I Conocer el origen de los datos.

I Estimar algunas medidas a partir de los datos:

I Media, mediana, máximo y mínimo, coeficiente de variación, desviación estándar, coeficiente de asimetría.

I Histograma.

(23)

Medidas útiles

Función Estimador Estima

Min, Max X(1), X(n) rango

Media µ X (n) Tendencia central

(24)

Estimación de parámetros

Dada una muestra de n datos observados, se llamaestimadorθˆdel parámetro θ a cualquier función de los datos observados.

Propiedades de un buen estimador

I Insesgabilidad: se dice que el estimador es insesgado si E [ˆθ] = θ.

I Consistencia: si al aumentar la muestra, el estimador se aproxima al parámetro.

I Eficiencia: se calcula comparando su varianza con la de otro estimador.

(25)

Estimador de máxima verosimilitud

Supongamos que se tiene la hipótesis de una distribución discreta para los datos observados, y se desconoce un parámetro θ. Sea pθ(x ) la probabilidad de masa para dicha distribución.

Dado que se han observado datos X1,X2, . . . ,Xn, se define la función

de máxima verosimilitud L(θ) como sigue:

L(θ) = pθ(X1) ·pθ(X2) · · ·pθ(Xn).

El estimador de máxima verosimilitud es el valor ˆθque maximiza L(θ): L(ˆθ) ≥L(θ), θvalor posible.

Si la distribución supuesta es continua, y fθ(x ) es la densidad para

dicha distribución, se define:

(26)

Estimador de máxima verosimilitud

El estimador de máxima verosimilitud tiene, en general, las siguientes propiedades:

1. Es único: L(ˆθ) >L(θ) para cualquier otro valor de θ. 2. La distribución asintótica de ˆθtiene media θ. 3. Es invariante: φ = h(θ), entonces ˆφ =h(ˆθ).

(27)

Ejemplo

Para la distribución exponencial, θ = β (β > 0) y fβ(x ) = β1e−x/β para

(28)

Ejemplo

(29)

Estimadores de máxima verosimilitud:

Distribuciones continuas:

I Uniforme: ˆa = min{Xi}, ˆb = max{Xi}.

I Exponencial: ˆβ =X (n).

(30)

Estimadores de máxima verosimilitud

Distribuciones discretas:

I Binomial (t, p): si t es conocido, ˆp = X (n)/t. I Bernoulli: Caso binomial con t = 1 e igual p. I Geométrica: ˆp = 1

X (n).

I Binomial negativa (s, p): número de ensayos hasta el s-ésimo éxito. Si s es conocido: ˆp = s

X (n).

Referencias

Documento similar

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

[r]

Luis Miguel Utrera Navarrete ha presentado la relación de Bienes y Actividades siguientes para la legislatura de 2015-2019, según constan inscritos en el

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

El tercero tiene notas bajas pero la mayor es estadística, una de las temáticas trabajadas de forma más mecánica, asimismo el último arquetipo muestra que, aun con notas buenas,

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

&#34;No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería