SIMULACIÓN DE SISTEMAS Guía práctica 1 Pruebas de Bondad de Ajuste con Stat::Fit de Promodel

(1)

Ing. Julio Rito Vargas Pág. 1

UNIVERSIDAD DE MANAGUA

Al más alto nivel

SIMULACIÓN DE SISTEMAS

Guía práctica #1

Pruebas de Bondad de Ajuste con Stat::Fit de Promodel

Prof.: Ing. Julio Rito Vargas A. Grupo: Ingenierías/IC-2018

Objetivos:

 Realizar pruebas de bondad de ajuste con datos discretos y datos continuos usando el módulo de Stat::Fit del lenguaje de Simulación ProModel.

 Interpretar los resultados: RECHAZOS Y ACEPTACIONES usando la opción AUTO:FIT

 Obtener las estadísticas descriptivas e histogramas de frecuencias de los datos

 Interpretar los resultados: RECHAZOS, ACEPTACIONES Y Ranking, usando la opción FIT.

 Interpretar los resultados de las pruebas: RECHAZOS, ACEPTACIONES y p-value.

Introducción:

La herramienta Stat::Fit de ProModel se utiliza para analizar y determinar el tipo de distribución de probabilidad de un conjunto de datos. Este programa permite comparar los resultados entre varias distribuciones analizadas mediante una calificación. Entre sus procedimientos: emplea las pruebas Chi-cuadrada, de Kolmogorov-Smirnov y de Anderson-Darlíng. Además calcula los parámetros apropiados para cada tipo de distribución, e incluye información de estadística descriptiva adicional como media, mediana, moda, valor mínimo, valor máximo y varianza, entre otros datos así como histogramas de frecuencias y diagrama de barras.

Stat::fit nos permite lograr 5 objetivos que apoyan a que tus resultados de Simulación sean confiables:

1. Ajuste de Curvas. Te ayuda a encontrar la mejor distribución para representar los datos. Stat::fit, utiliza las pruebas de Bondad de Ajuste más comúnmente conocidas, como son:

a. Anderson-Darling. b. Chi-Cuadrada.

c. Kolmogorov-Smirnov.

(2)

Ing. Julio Rito Vargas Pág. 2 3. Determinar el tamaño de la muestra para toma de tiempos de proceso y

transportación.

4. Graficar los datos de entrada, graficar todas las distribuciones de probabilidad

que se pueden utilizar, hacer estadística descriptiva de datos.

El módulo Stat::Fit (versión 3): Del programa Promodel versión 2016.

Se puede activar desde la barra de menú (Stat::Fit) haciendo clic sobre el botón.

Opcionalmente se puede ir al menú Herramientas y se selecciona la opción Stat::Fit.

Datos para prueba con Stat::Fil

Grupo datos 1 Grupo datos 2 Grupo datos 3 Grupo datos 4

Valores discretos Valores continuos Valores discretos Valores continuos

Orden Datos Orden Datos Orden Datos Orden Datos

1 9 1 25.15 1 14 1 9.400

2 9 2 26.03 2 13 2 7.445

3 9 3 25.93 3 13 3 10.489

4 4 4 19.10 4 20 4 12.553

5 7 5 22.16 5 12 5 12.397

6 8 6 20.77 6 7 6 8.620

7 9 7 20.65 7 15 7 6.619

8 2 8 23.29 8 20 8 6.306

9 4 9 21.90 9 10 9 8.045

10 6 10 23.29 10 14 10 8.453

11 6 11 21.84 11 13 11 9.346

12 10 12 26.56 12 10 12 9.260

(3)

Ing. Julio Rito Vargas Pág. 3

14 10 14 20.55 14 18 14 9.829

15 7 15 24.41 15 20 15 9.628

16 11 16 26.75 16 16 16 13.323

17 4 17 21.49 17 15 17 6.775

18 8 18 22.03 18 17 18 11.078

19 5 19 26.12 19 15 19 11.804

20 3 20 20.78 20 15 20 13.838

21 7 21 19.52 21 16 21 7.112

22 8 22 23.18 22 16 22 8.306

23 7 23 22.80 23 19 23 6.957

24 5 24 24.89 24 13 24 9.274

25 6 25 19.92 25 10 25 9.935

26 11 26 24.08 26 13 26 13.466

27 6 27 23.68 27 14 27 5.633

28 3 28 20.66 28 11 28 9.532

29 8 29 22.27 29 16 29 12.190

30 2 30 22.54 30 13 30 7.827

31 4 31 22.42 31 14 31 5.764

32 5 32 24.10 32 12 32 8.864

33 6 33 21.64 33 12 33 9.192

34 3 34 26.38 34 24 34 10.270

35 5 35 22.82 35 21 35 9.269

36 5 36 19.63 36 17 36 8.974

37 7 37 22.17 37 17 37 13.944

38 5 38 17.48 38 17 38 11.731

39 5 39 19.47 39 18 39 14.751

40 6 40 23.02 40 23 40 8.690

41 4 41 25.78 41 15 41 9.831

42 2 42 21.80 42 14 42 8.952

43 6 43 19.68 43 9 43 11.350

44 4 44 20.04 44 16 44 9.237

45 4 45 21.27 45 15 45 11.515

46 7 46 23.15 46 16 46 10.056

47 6 47 22.91 47 12 47 9.355

48 6 48 22.66 48 18 48 14.389

49 4 49 22.70 49 18 49 6.515

50 3 50 18.24 50 18 50 8.527

En las páginas 2 y 3 están los grupos de datos para las pruebas: Los grupos 1 y 3 son datos discretos y Los grupos 2 y 4 son datos continuos.

(4)

Ing. Julio Rito Vargas Pág. 4 Los datos del grupo 4: corresponden a los datos de un estudio de atención de los clientes en una floristería, medidos en minutos por cliente.

I. Procedimiento para realizar la exploración de los datos del grupo 1

a. Digite los datos del grupo 1 en una hoja de Excel y guarde el archivo en su USB o computadora.

b. Copie los datos del grupo 1 de la hoja de Excel y páselos a Stat::Fit usando el menú: Edit->Paste.

c. Guarde el archivo en formato de Stat::Fit en su USB o computadora.

d. Obtenga las estadísticas de los datos con la opción del menú: Statistics-> Descriptive.

(5)

Ing. Julio Rito Vargas Pág. 5 Con la esta información exploratoria tenemos una descripción general de los datos, es decir conocemos el valor mínimo y máximo, el rango, las medidas de tendencia central y las medidas de dispersión.

II. Determinación del tipo de distribución de un conjunto de datos

A través de la Prueba de Bondad de Ajuste.

a. Haga la prueba de bondad de ajuste con la opción Auto::Fit e interpreta los resultados y escoja la distribución para estos datos y sus parámetros. Haga clic en el menú: Fit→Auto::Fit

En la ventana que despliega Auto::Fit , seleccione la opción discrete distributions (distribuciones discretas) y haga clic en el botón OK.

(6)

Ing. Julio Rito Vargas Pág. 6 Puede observar que comparado los datos del grupo 1 con cuatro distribuciones estadísticas.

Distribuciones:

La Distribución Binomial, para la cual ha obtenido los siguientes parámetros Binomial (55,0.108).

La Distribución Poisson, para la cual ha obtenido el siguiente parámetro Poisson(5.92).

Rango:

Puede verse que los rangos para las dos distribuciones Binomial y Poisson, son muy próximos, es decir los datos se comportan muy parecidos o provienen de poblaciones de distribuciones Binomiales o Poisson.

Aceptación:

Los resultados de las pruebas; es que los datos se pueden considerar provenientes de distribuciones Binomial o Poisson, es decir no se rechaza “do not reject” que sean de esas distribuciones.

Por lo que sería conveniente considerar los datos como una Distribución Binomial o Poisson. Sabiendo que los parámetros de una Binomial son n y p B(n,p) donde μ=np =55*0.108=5.94; el parámetro de una Poisson es λ=5.92 (lambda) que es la media. P(λ). Puede observar que las medias de ambas distribuciones son muy aproximadas.

(7)

Ing. Julio Rito Vargas Pág. 7 Puede observar en la gráfica que la distribución Binomial es más aproximada a la densidad de los datos pero solo ligeramente a la Poisson, ya que ambas curvas son muy próximas.

(8)

Ing. Julio Rito Vargas Pág. 8 Puede observar que los valores p-value en el caso de las distribuciones Poisson y Binomial 0.994 y 1 (uno). Lo que indica que ambos valores están en la zona de aceptación de las curvas, para un nivel de confianza del 95%. Por lo tanto se ratifica con las pruebas Chicuadrada y Kolmogorov Smirnov, que los datos se comportan como datos provenientes de una población Binomial o bien de una población Poisson.

III. Procedimiento para realizar la exploración de los datos del grupo 2

a. Digite los datos del grupo 2 en una hoja de Excel y guarde el archivo en su USB o computadora.

(9)

Ing. Julio Rito Vargas Pág. 9 c. Guarde el archivo en formato de Stat::Fil en su USB o computadora. d. Obtenga las estadísticas de los datos con la opción del menú: Statistics->

Descriptive.

(10)

Ing. Julio Rito Vargas Pág. 10 Con la esta información exploratoria tenemos una descripción general de los datos del grupo 2, es decir conocemos el valor mínimo y máximo, el rango, las medidas de tendencia central y las medidas de dispersión.

IV. PROCEDIMIENTO PARA REALIZAR LA PRUEBA DE BONDAD DE AJUSTE A LOS

DATOS DEL GRUPO 2.

a. Haga la prueba de bondad de ajuste con la opción Auto::Fit e interpreta los resultados y escoja la distribución para estos datos y sus parámetros. Haga clic en el menú: Fit→Auto::Fit

En la ventana que despliega Auto::Fit , seleccione la opción continue distributions (distribuciones continuas) y haga clic en el botón OK. La distribución continua tiene tres opciones: 1) Sin límite 2) límite inferior 3) asignar límite. Para los datos a analizar asigne 17.48 como límite inferior tal como lo muestra la estadística descriptiva.

En la imagen siguiente se muestran los resultados de la prueba de bondad de ajuste.

(11)

Ing. Julio Rito Vargas Pág. 11 Las Distribuciones analizadas en el orden que mejor se ajustan a los datos:

 La Distribución Lognormal(-59.5, 4.41,0.0273) con rango de 100.

 La Distribución Normal(22.5, 2.24) con rango de 95.2.

 La Distribución Uniforme(17.5,26.8) con rango de 1.32

 La Distribución Exponencial(17.5, 5.5) con rango de 0

Como puede ver en la imagen anterior hay tres distribuciones que pueden ser consideradas aceptables (do not reject): Lognormal, Normal y Uniforme pero hay una distribución que no se ajustana los datos (reject/se rechaza) la Exponencial.

Rango:

Puede verse que los rangos son mejores para las dos primeras distribuciones Lognormal y Normal, es decir los datos se comportan más parecidos o provienen de poblaciones de distribuciones Lognormal o Normal con un 100 y 95.2 de rango. Aunque los datos son ligeramente Uniforme su rango es menor que las dos anteriores. Por lo que no es recomendable considerar los datos como Uniforme cuando hay dos distribuciones que mejor se ajustan.

Aceptación:

Los datos fueron comparados con cuatro distribuciones discretas: Lognormal,Normal Uniforme y Exponencial.

(12)

(13)

Ing. Julio Rito Vargas Pág. 13 Para ilustrar solo analizaremos los resultados de una Distribución continua, Lognormal

La que ha sido analizadas con las pruebas Kolmogorov-Smirnov con p-value=0.928 y no

se rechaza.

También se ha analizado con las pruebas Anderson-Darling con un p-value=0.961. Con resultado, que no se rechaza. Es decir los datos se comportan como una distribución Lognormal con los parámetros valor mínimo=-59.5415, μ=4.4066 σ=0.0272558

Para efectos de una simulación con estos datos la distribución que se recomienda usar es la Lognormal.

(14)

Ing. Julio Rito Vargas Pág. 14 ACTIVADAD PRÁCTICA POR LOS ESTUDIANTES:

1. Digite los datos del grupo 3 y 4 en el editor de Stat::Fit

2. Realice las pruebas de bondad de ajuste y determine la mejor distribución estadística a la pertenecen tal como se realizó para los grupos de datos 1 y 2 de la presente guía.

3. Obtengan las estadísticas descriptivas de cada grupo de datos