Ing. Julio Rito Vargas Pág. 1
UNIVERSIDAD DE MANAGUA
Al más alto nivel
SIMULACIÓN DE SISTEMAS
Guía práctica #1
Pruebas de Bondad de Ajuste con Stat::Fit de Promodel
Prof.: Ing. Julio Rito Vargas A. Grupo: Ingenierías/IIC-2016
Objetivos:
Realizar pruebas de bondad de ajuste con datos discretos y datos continuos usando el módulo de Stat::Fit del lenguaje de Simulación ProModel.
Interpretar los resultados: RECHAZOS Y ACEPTACIONES usando la opción AUTO:FIT
Obtener las estadísticas descriptivas e histogramas de frecuencias de los datos
Interpretar los resultados: RECHAZOS, ACEPTACIONES Y Ranking, usando la opción FIT.
Interpretar los resultados de las pruebas: RECHAZOS, ACEPTACIONES y p-value.
La herramienta Stat::Fit de ProModel se utiliza para analizar y determinar el tipo de distribución de probabilidad de un conjunto de datos. Este programa permite comparar los resultados entre varias distribuciones analizadas mediante una calificación. Entre sus procedimientos: emplea las pruebas Chi-cuadrada, de Kolmogorov-Smirnov y de Anderson-Darlíng. Además calcula los parámetros apropiados para cada tipo de distribución, e incluye información de estadística descriptiva adicional como media, mediana, moda, valor mínimo, valor máximo y varianza, entre otros datos así como histogramas de frecuencias y diagrama de barras.
Stat::fit nos permite lograr 5 objetivos que apoyan a que tus resultados de Simulación sean confiables:
1. Ajuste de Curvas. Te ayuda a encontrar la mejor distribución para representar los datos. Stat::fit utiliza las pruebas de Bondad de Ajuste más comúnmente conocidas, como son:
a. Anderson-Darling. b. Chi-Cuadrada.
c. Kolmogorov-Smirnov.
Ing. Julio Rito Vargas Pág. 2 3. Determinar el tamaño de la muestra para toma de tiempos de proceso y
transportación.
4. Graficar los datos de entrada, graficar todas las distribuciones de probabilidad
que se pueden utilizar, hacer estadística descriptiva de datos.
El módulo Stat::Fit:
Se puede activar desde la ventana principal de Promodel cuando el programa inicia y muestra la opción Stat::Fit.
También se puede hacer desde la opción de menú Tools (herramientas) la tercera opción de Tools es Stat::Fit.
Datos para prueba con Stat::Fil
Grupo datos 1 Grupo datos 2 Grupo datos 3 Grupo datos 4
Valores discretos Valores continuos Valores discretos
Valores continuos
Orden Datos Orden Datos Orden Datos Orden Datos
1 9 1 25.15 1 5 1 15.50
2 9 2 26.03 2 8 2 22.00
3 9 3 25.93 3 3 3 10.60
4 4 4 19.10 4 3 4 20.00
5 7 5 22.16 5 3 5 20.10
6 8 6 20.77 6 4 6 12.60
7 9 7 20.65 7 1 7 14.90
8 2 8 23.29 8 6 8 12.40
Ing. Julio Rito Vargas Pág. 3
10 6 10 23.29 10 5 10 13.20
11 6 11 21.84 11 2 11 20.10
12 10 12 26.56 12 3 12 17.00
13 5 13 24.25 13 3 13 15.80
14 10 14 20.55 14 6 14 19.40
15 7 15 24.41 15 0 15 14.00
16 11 16 26.75 16 2 16 8.00
17 4 17 21.49 17 2 17 41.00
18 8 18 22.03 18 2 18 4.00
19 5 19 26.12 19 5 19 22.70
20 3 20 20.78 20 5 20 11.50
21 7 21 19.52 21 3 21 20.10
22 8 22 23.18 22 5 22 27.90
23 7 23 22.80 23 7 23 4.00
24 5 24 24.89 24 8 24 6.00
25 6 25 19.92 25 3 25 8.00
26 11 26 24.08 26 5 26 11.10
27 6 27 23.68 27 2 27 11.50
28 3 28 20.66 28 8 28 20.20
29 8 29 22.27 29 1 29 5.00
30 2 30 22.54 30 4 30 32.20
31 4 31 22.42 31 3 31 13.50
32 5 32 24.10 32 5 32 20.50
33 6 33 21.64 33 2 33 18.90
34 3 34 26.38 34 1 34 8.00
35 5 35 22.82 35 10 35 9.00
36 5 36 19.63 36 3 36 25.40
37 7 37 22.17 37 4 37 6.00
38 5 38 17.48 38 5 38 13.70
39 5 39 19.47 39 2 39 23.60
40 6 40 23.02 40 3 40 17.70
41 4 41 25.78 41 2 41 14.20
42 2 42 21.80 42 1 42 4.00
43 6 43 19.68 43 2 43 9.00
44 4 44 20.04 44 3 44 20.30
45 4 45 21.27 45 5 45 9.00
46 7 46 23.15 46 7 46 16.10
47 6 47 22.91 47 3 47 18.40
48 6 48 22.66 48 0 48 11.10
49 4 49 22.70 49 7 49 10.90
Ing. Julio Rito Vargas Pág. 4 En las páginas 2 y 3 están los grupos de datos para las pruebas: Los grupos 1 y 3 son datos discretos y Los grupos 2 y 4 son datos continuos.
I.
Procedimiento para realizar la exploración de los datos del grupo 1
a. Digite los datos del grupo 1 en una hoja de Excel y guarde el archivo en su USB o computadora.
b. Copie los datos del grupo 1 de la hoja de Excel y páselos a Stat::Fit usando el menú: Edit->Paste.
c. Guarde el archivo en formato de Stat::Fil en su USB o computadora.
d. Obtenga las estadísticas de los datos con la opción del menú: Statistics-> Descriptive.
Ing. Julio Rito Vargas Pág. 5 Con la esta información exploratoria tenemos una descripción general de los datos, es decir conocemos el valor mínimo y máximo, el rango, las medidas de tendencia central y las medidas de dispersión.
II.
Procedimiento para realizar la Prueba de Bondad de Ajuste.
a. Haga la prueba de bondad de ajuste con la opción Auto::Fit e interpreta los resultados y escoja la distribución para estos datos y sus parámetros. Haga clic en el menú: Fit→Auto::Fit
En la ventana que despliega Auto::Fit , seleccione la opción discrete distributions (distribuciones discretas) y haga clic en el botón OK.
En la imagen siguiente se muestran los resultados de la prueba de bondad de ajuste.
Ing. Julio Rito Vargas Pág. 6 Distribuciones:
La Distribución Binomial, para la cual ha obtenido los siguientes parámetros Binomial (55,0.108).
La Distribución Poisson, para la cual ha obtenido el siguiente parámetro Poisson(5.92). La Distribución Uniforme Discreta, para la cual ha obtenido los siguientes parámetros Uniforme(2,11).
La Distribución Geométrica, para la cual ha obtenido el siguiente parámetro Geométrica(0.145)
Rango:
Puede verse que los rangos son mejores para las dos primeras distribuciones Binomial y Poisson, es decir los datos se comportan más parecidos o provienen de poblaciones de distribuciones Binomiales o Poisson.
Aceptación:
Los datos fueron comparados con cuatro distribuciones discretas: Binomial, Poisson, Uniforme y Geométrica.
Los resultados de las pruebas es que los datos se pueden considerar provenientes de distribuciones Binomial, Poisson y Uniforme, es decir no se rechaza “do not reject” que sean de esas distribuciones, pero si se rechaza “reject” que sean de una distribución geométrica.
Por lo que sería conveniente considerar los datos como una Distribución Binomial o Poisson. Sabiendo que los parámetros de una Binomial son n y p B(n,p) donde μ=np =55*0.108=5.94; el parámetro de una Poisson es λ=5.92 (lambda) que es la media. P(λ). Puede observar que las medias de ambas distribuciones son muy aproximadas.
Ing. Julio Rito Vargas Pág. 7 Puede observar en la gráfica que la distribución Binomial es más aproximada a la densidad de los datos pero solo ligeramente, ya que las curvas son muy próximas.
Ing. Julio Rito Vargas Pág. 9 II.b Haga la prueba de bondad de ajuste con las opciones del menú: Fit→Setup
Al escoger Setup, seleccione las distribuciones discretas no rechazadas y las pruebas Chicuadradas y KS (Kolmogorov-Smirnov).
Con las pruebas aplicadas el maximo estimador de probabilidad resulta: Binomial(11,0.538) Para μ=11*0.538=5.918
III.
Procedimiento para realizar la exploración de los datos del grupo 2
a. Digite los datos del grupo 2 en una hoja de Excel y guarde el archivo en su USB o computadora.
b. Copie los datos del grupo 2 de la hoja de Excel y páselos a Stat::Fit usando el menú: Edit->Paste.
Ing. Julio Rito Vargas Pág. 10 d. Obtenga las estadísticas de los datos con la opción del menú: Statistics->
Descriptive.
e. Obtenga el histograma de frecuencias con el menú: Input-> Input Graph y luego en el menú: Graphs-→Graphics Style.
Con la esta información exploratoria tenemos una descripción general de los datos del grupo 2, es decir conocemos el valor mínimo y máximo, el rango, las medidas de tendencia central y las medidas de dispersión.
IV. PROCEDIMIENTO PARA REALIZAR LA PRUEBA DE BONDAD DE AJUSTE A LOS
DATOS DEL GRUPO 2.
a. Haga la prueba de bondad de ajuste con la opción Auto::Fit e interpreta los resultados y escoja la distribución para estos datos y sus parámetros. Haga clic en el menú: Fit→Auto::Fit
Ing. Julio Rito Vargas Pág. 11 En la imagen siguiente se muestran los resultados de la prueba de bondad de ajuste.
Puede observar que se ha comparado los datos del grupo 2 con dieciocho distribuciones estadísticas continuas.
Las Distribuciones continuas que mejor se ajustan a los datos:
La Distribución Weibull(17,5, 2.58,5.75) con rango de 97.
La Distribución Triangular(16.5, 27.7,22.8) con rango de 90.2.
La Distribución Pearson 6(17.5, 311, 4.84, 296) con rango de 75.9.
La Distribución LogLogistic(17.5, 3.6, 4.8) con rango de 58.9
La Distribución Gamma (17.5, 5.76, 0.868) con rango de 51.7.
La Distribución Erlang (17.5, 6, 0.868) con rango de 45.1.
Ing. Julio Rito Vargas Pág. 12 Como puede ver en la imagen anterior hay tres distribuciones más que pueden ser consideradas aceptables (do not reject) pero hay 8 distribuciones que no se ajustan a los datos (reject/se rechaza).
Rango:
Puede verse que los rangos son mejores para las dos primeras distribuciones Binomial y Poisson, es decir los datos se comportan más parecidos o provienen de poblaciones de distribuciones Binomiales o Poisson.
Aceptación:
Los datos fueron comparados con cuatro distribuciones discretas: Binomial, Poisson, Uniforme y Geométrica.
Los resultados de las pruebas es que los datos se pueden considerar provenientes de distribuciones Binomial, Poisson y Uniforme, es decir no se rechaza “do not reject” que sean de esas distribuciones, pero si se rechaza “reject” que sean de una distribución geométrica.
IV.a Interpretar los resultados de las pruebas: RECHAZOS, ACEPTACIONES y p-value. Usando el menú: Fit.→Goodness of Fit
Para ilustrar solo analizaremos los resultados de una Distribución continua, la Weibull
Ing. Julio Rito Vargas Pág. 13 Y no se rechaza.
También se ha analizado con las pruebas Anderson-Darling con un p-value=0.955
Con resultado que no se rechaza. Es decir los datos se comportan como una distribución Weibull con los parámetros valor mínimo=17.48, α=2.57644 β=5.7469
De la misma manera se deben analizar el resto de distribuciones que se han comparado con los datos.
ACTIVADAD PRÁCTICA POR LOS ESTUDIANTES:
1. Digite los datos del grupo 3 y 4 en el editor de Stat::Fit
2. Realice las pruebas de bondad de ajuste y determine la mejor distribución estadística a la pertenecen tal como se realizó para los grupos de datos 1 y 2 de la presente guía.
3. Obtengan las estadísticas descriptivas de grupo