Ing. Julio Rito Vargas Pág. 1
UNIVERSIDAD DE MANAGUA
Al más alto nivel
SIMULACIÓN DE SISTEMAS
Guía práctica #1
Pruebas de Bondad de Ajuste con Stat::Fit de Promodel
Prof.: Ing. Julio Rito Vargas A. Grupo: Ingenierías/IC-2018
Objetivos:
Realizar pruebas de bondad de ajuste con datos discretos y datos continuos usando el módulo de Stat::Fit del lenguaje de Simulación ProModel.
Interpretar los resultados: RECHAZOS Y ACEPTACIONES usando la opción AUTO:FIT
Obtener las estadísticas descriptivas e histogramas de frecuencias de los datos
Interpretar los resultados: RECHAZOS, ACEPTACIONES Y Ranking, usando la opción FIT.
Interpretar los resultados de las pruebas: RECHAZOS, ACEPTACIONES y p-value.
Introducción:
La herramienta Stat::Fit de ProModel se utiliza para analizar y determinar el tipo de distribución de probabilidad de un conjunto de datos. Este programa permite comparar los resultados entre varias distribuciones analizadas mediante una calificación. Entre sus procedimientos: emplea las pruebas Chi-cuadrada, de Kolmogorov-Smirnov y de Anderson-Darlíng. Además calcula los parámetros apropiados para cada tipo de distribución, e incluye información de estadística descriptiva adicional como media, mediana, moda, valor mínimo, valor máximo y varianza, entre otros datos así como histogramas de frecuencias y diagrama de barras.
Stat::fit nos permite lograr 5 objetivos que apoyan a que tus resultados de Simulación sean confiables:
1. Ajuste de Curvas. Te ayuda a encontrar la mejor distribución para representar los datos. Stat::fit, utiliza las pruebas de Bondad de Ajuste más comúnmente conocidas, como son:
a. Anderson-Darling. b. Chi-Cuadrada.
c. Kolmogorov-Smirnov.
Ing. Julio Rito Vargas Pág. 2 3. Determinar el tamaño de la muestra para toma de tiempos de proceso y
transportación.
4. Graficar los datos de entrada, graficar todas las distribuciones de probabilidad
que se pueden utilizar, hacer estadística descriptiva de datos.
El módulo Stat::Fit (versión 3): Del programa Promodel versión 2016.
Se puede activar desde la barra de menú (Stat::Fit) haciendo clic sobre el botón.
Opcionalmente se puede ir al menú Herramientas y se selecciona la opción Stat::Fit.
Datos para prueba con Stat::Fil
Grupo datos 1 Grupo datos 2 Grupo datos 3 Grupo datos 4
Valores discretos Valores continuos Valores discretos Valores continuos
Orden Datos Orden Datos Orden Datos Orden Datos
1 9 1 25.15 1 14 1 9.400
2 9 2 26.03 2 13 2 7.445
3 9 3 25.93 3 13 3 10.489
4 4 4 19.10 4 20 4 12.553
5 7 5 22.16 5 12 5 12.397
6 8 6 20.77 6 7 6 8.620
7 9 7 20.65 7 15 7 6.619
8 2 8 23.29 8 20 8 6.306
9 4 9 21.90 9 10 9 8.045
10 6 10 23.29 10 14 10 8.453
11 6 11 21.84 11 13 11 9.346
12 10 12 26.56 12 10 12 9.260
Ing. Julio Rito Vargas Pág. 3
14 10 14 20.55 14 18 14 9.829
15 7 15 24.41 15 20 15 9.628
16 11 16 26.75 16 16 16 13.323
17 4 17 21.49 17 15 17 6.775
18 8 18 22.03 18 17 18 11.078
19 5 19 26.12 19 15 19 11.804
20 3 20 20.78 20 15 20 13.838
21 7 21 19.52 21 16 21 7.112
22 8 22 23.18 22 16 22 8.306
23 7 23 22.80 23 19 23 6.957
24 5 24 24.89 24 13 24 9.274
25 6 25 19.92 25 10 25 9.935
26 11 26 24.08 26 13 26 13.466
27 6 27 23.68 27 14 27 5.633
28 3 28 20.66 28 11 28 9.532
29 8 29 22.27 29 16 29 12.190
30 2 30 22.54 30 13 30 7.827
31 4 31 22.42 31 14 31 5.764
32 5 32 24.10 32 12 32 8.864
33 6 33 21.64 33 12 33 9.192
34 3 34 26.38 34 24 34 10.270
35 5 35 22.82 35 21 35 9.269
36 5 36 19.63 36 17 36 8.974
37 7 37 22.17 37 17 37 13.944
38 5 38 17.48 38 17 38 11.731
39 5 39 19.47 39 18 39 14.751
40 6 40 23.02 40 23 40 8.690
41 4 41 25.78 41 15 41 9.831
42 2 42 21.80 42 14 42 8.952
43 6 43 19.68 43 9 43 11.350
44 4 44 20.04 44 16 44 9.237
45 4 45 21.27 45 15 45 11.515
46 7 46 23.15 46 16 46 10.056
47 6 47 22.91 47 12 47 9.355
48 6 48 22.66 48 18 48 14.389
49 4 49 22.70 49 18 49 6.515
50 3 50 18.24 50 18 50 8.527
En las páginas 2 y 3 están los grupos de datos para las pruebas: Los grupos 1 y 3 son datos discretos y Los grupos 2 y 4 son datos continuos.
Ing. Julio Rito Vargas Pág. 4 Los datos del grupo 4: corresponden a los datos de un estudio de atención de los clientes en una floristería, medidos en minutos por cliente.
I.
Procedimiento para realizar la exploración de los datos del grupo 1
a. Digite los datos del grupo 1 en una hoja de Excel y guarde el archivo en su USB o computadora.
b. Copie los datos del grupo 1 de la hoja de Excel y páselos a Stat::Fit usando el menú: Edit->Paste.
c. Guarde el archivo en formato de Stat::Fit en su USB o computadora.
d. Obtenga las estadísticas de los datos con la opción del menú: Statistics-> Descriptive.
Ing. Julio Rito Vargas Pág. 5 Con la esta información exploratoria tenemos una descripción general de los datos, es decir conocemos el valor mínimo y máximo, el rango, las medidas de tendencia central y las medidas de dispersión.
II.
Determinación del tipo de distribución de un conjunto de datos
A través de la Prueba de Bondad de Ajuste.
a. Haga la prueba de bondad de ajuste con la opción Auto::Fit e interpreta los resultados y escoja la distribución para estos datos y sus parámetros. Haga clic en el menú: Fit→Auto::Fit
En la ventana que despliega Auto::Fit , seleccione la opción discrete distributions (distribuciones discretas) y haga clic en el botón OK.
Ing. Julio Rito Vargas Pág. 6 Puede observar que comparado los datos del grupo 1 con cuatro distribuciones estadísticas.
Distribuciones:
La Distribución Binomial, para la cual ha obtenido los siguientes parámetros Binomial (55,0.108).
La Distribución Poisson, para la cual ha obtenido el siguiente parámetro Poisson(5.92).
Rango:
Puede verse que los rangos para las dos distribuciones Binomial y Poisson, son muy próximos, es decir los datos se comportan muy parecidos o provienen de poblaciones de distribuciones Binomiales o Poisson.
Aceptación:
Los resultados de las pruebas; es que los datos se pueden considerar provenientes de distribuciones Binomial o Poisson, es decir no se rechaza “do not reject” que sean de esas distribuciones.
Por lo que sería conveniente considerar los datos como una Distribución Binomial o Poisson. Sabiendo que los parámetros de una Binomial son n y p B(n,p) donde μ=np =55*0.108=5.94; el parámetro de una Poisson es λ=5.92 (lambda) que es la media. P(λ). Puede observar que las medias de ambas distribuciones son muy aproximadas.
Ing. Julio Rito Vargas Pág. 7 Puede observar en la gráfica que la distribución Binomial es más aproximada a la densidad de los datos pero solo ligeramente a la Poisson, ya que ambas curvas son muy próximas.
Ing. Julio Rito Vargas Pág. 8 Puede observar que los valores p-value en el caso de las distribuciones Poisson y Binomial 0.994 y 1 (uno). Lo que indica que ambos valores están en la zona de aceptación de las curvas, para un nivel de confianza del 95%. Por lo tanto se ratifica con las pruebas Chicuadrada y Kolmogorov Smirnov, que los datos se comportan como datos provenientes de una población Binomial o bien de una población Poisson.
III.
Procedimiento para realizar la exploración de los datos del grupo 2
a. Digite los datos del grupo 2 en una hoja de Excel y guarde el archivo en su USB o computadora.
Ing. Julio Rito Vargas Pág. 9 c. Guarde el archivo en formato de Stat::Fil en su USB o computadora. d. Obtenga las estadísticas de los datos con la opción del menú: Statistics->
Descriptive.
Ing. Julio Rito Vargas Pág. 10 Con la esta información exploratoria tenemos una descripción general de los datos del grupo 2, es decir conocemos el valor mínimo y máximo, el rango, las medidas de tendencia central y las medidas de dispersión.
IV. PROCEDIMIENTO PARA REALIZAR LA PRUEBA DE BONDAD DE AJUSTE A LOS
DATOS DEL GRUPO 2.
a. Haga la prueba de bondad de ajuste con la opción Auto::Fit e interpreta los resultados y escoja la distribución para estos datos y sus parámetros. Haga clic en el menú: Fit→Auto::Fit
En la ventana que despliega Auto::Fit , seleccione la opción continue distributions (distribuciones continuas) y haga clic en el botón OK. La distribución continua tiene tres opciones: 1) Sin límite 2) límite inferior 3) asignar límite. Para los datos a analizar asigne 17.48 como límite inferior tal como lo muestra la estadística descriptiva.
En la imagen siguiente se muestran los resultados de la prueba de bondad de ajuste.
Ing. Julio Rito Vargas Pág. 11 Las Distribuciones analizadas en el orden que mejor se ajustan a los datos:
La Distribución Lognormal(-59.5, 4.41,0.0273) con rango de 100.
La Distribución Normal(22.5, 2.24) con rango de 95.2.
La Distribución Uniforme(17.5,26.8) con rango de 1.32
La Distribución Exponencial(17.5, 5.5) con rango de 0
Como puede ver en la imagen anterior hay tres distribuciones que pueden ser consideradas aceptables (do not reject): Lognormal, Normal y Uniforme pero hay una distribución que no se ajustana los datos (reject/se rechaza) la Exponencial.
Rango:
Puede verse que los rangos son mejores para las dos primeras distribuciones Lognormal y Normal, es decir los datos se comportan más parecidos o provienen de poblaciones de distribuciones Lognormal o Normal con un 100 y 95.2 de rango. Aunque los datos son ligeramente Uniforme su rango es menor que las dos anteriores. Por lo que no es recomendable considerar los datos como Uniforme cuando hay dos distribuciones que mejor se ajustan.
Aceptación:
Los datos fueron comparados con cuatro distribuciones discretas: Lognormal,Normal Uniforme y Exponencial.
Ing. Julio Rito Vargas Pág. 13 Para ilustrar solo analizaremos los resultados de una Distribución continua, Lognormal
La que ha sido analizadas con las pruebas Kolmogorov-Smirnov con p-value=0.928 y no
se rechaza.
También se ha analizado con las pruebas Anderson-Darling con un p-value=0.961. Con resultado, que no se rechaza. Es decir los datos se comportan como una distribución Lognormal con los parámetros valor mínimo=-59.5415, μ=4.4066 σ=0.0272558
Para efectos de una simulación con estos datos la distribución que se recomienda usar es la Lognormal.
Ing. Julio Rito Vargas Pág. 14 ACTIVADAD PRÁCTICA POR LOS ESTUDIANTES:
1. Digite los datos del grupo 3 y 4 en el editor de Stat::Fit
2. Realice las pruebas de bondad de ajuste y determine la mejor distribución estadística a la pertenecen tal como se realizó para los grupos de datos 1 y 2 de la presente guía.
3. Obtengan las estadísticas descriptivas de cada grupo de datos