• No se han encontrado resultados

PRUEBAS DE BONDAD DE AJUSTE

N/A
N/A
Protected

Academic year: 2021

Share "PRUEBAS DE BONDAD DE AJUSTE"

Copied!
13
0
0

Texto completo

(1)

Facultad de Ciencias Químicas e Ingeniería, UAEM

Simulación de Procesos

(2)

Contenido

Prueba de bondad de ajuste 𝜒2 ... 2

Ejemplo de prueba de bondad de ajuste 𝜒2 ... 2

Prueba de bondad de ajuste de Kolmogorov-Smirnov ... 6

Ejemplo de prueba de bondad de ajuste de Kolmogorov-Smirnov ... 6

Conclusiones ... 9

Apéndice... 10

... 11

(3)

Prueba de bondad de ajuste 𝜒

2

Esta prueba se utiliza para encontrar la distribución de probabilidad de una serie de datos mediante histograma y tabla de frecuencias. La metodología de la prueba de 𝜒2 es la siguiente:

1. Se elabora una tabla de frecuencias de 𝑚 intervalos, a partir de los 𝑛 datos históricos. Se propone, de acuerdo a la regla de Sturges, que 𝑚 = 1 + 3.322 log 𝑛. Otra forma de determinar el número de intervalos es mediante 𝑚 = √𝑛. Se obtiene la frecuencia observada 𝑖 de cada intervalo (𝐹𝑂𝑖). Se calcula la media y la varianza de los datos. De acuerdo a la tabla de frecuencias se grafica el histograma.

2. De acuerdo a la tabla de frecuencias y al histograma, obtenidos en el paso anterior, se propone una distribución de probabilidad.

3. Con la distribución propuesta, se calcula la frecuencia esperada para cada uno de los intervalos (𝐹𝐸𝑖) mediante la integración de la distribución propuesta y su posterior multiplicación por el número total de datos.

4. Se calcula el estimador, de acuerdo a la siguiente expresión: 𝐶 = ∑(𝐹𝐸𝑖− 𝐹𝑂𝑖)

2 𝐹𝐸𝑖 𝑚

𝑖=1

5. Si el estimador 𝐶 es menor o igual al valor correspondiente de 𝜒2 con 𝑚 − 𝑘 − 1 grados de libertad (𝑘 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛) y a un nivel de confianza de 1 − 𝛼, la hipótesis de que los datos siguen la distribución propuesta se acepta, y en caso contrario se rechaza y se propone una nueva distribución, repitiendo el procedimiento anterior.

Ejemplo de prueba de bondad de ajuste 𝜒

2

1. Los datos en meses del tiempo entre fallas de un automóvil son:

(4)

Se tienen 50 datos, por lo que el número de intervalos es: 𝑚 = 1 + 3.322 log 50

𝑚 = 6.644 ≈ 7

El rango se obtiene a partir del valor máximo y del valor mínimo registrados. En este caso: 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 = 49.31

𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 = 31.08

𝑟𝑎𝑛𝑔𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 𝑟𝑎𝑛𝑔𝑜 = 18.23

Una vez calculados el rango y el número de intervalos, se estima el ancho de clase: 𝑎𝑛𝑐ℎ𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 =𝑟𝑎𝑛𝑔𝑜

𝑚 𝑎𝑛𝑐ℎ𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 = 2.61

A continuación, se procede a construir la tabla de frecuencias y el histograma: Tabla 1. Tabla de frecuencia del ejemplo 1

(5)

Figura 1. Histograma del ejemplo 1

Observando los datos de la columna de frecuencia observada (FO) y la forma del histograma, podemos suponer que los datos siguen una distribución de Weibull. Se trata de un modelo continuo asociado a variables del tipo tiempo de vida, tiempo hasta que un mecanismo falla, etc. La función de densidad de este modelo viene dada por:

𝑓(𝑥) = {𝛼𝛽−𝛼𝑥𝛼−1𝑒−(𝛽𝑥)

𝛼

𝑠𝑖 𝑥 > 0 0 𝑑𝑒 𝑜𝑡𝑟𝑎 𝑚𝑎𝑛𝑒𝑟𝑎

La función de distribución que se propone, se obtiene por la integración de la función de densidad: 𝐹(𝑥) = {1 − 𝑒−( 𝑥 𝛽) −𝛼 𝑠𝑖 𝑥 > 0 0 𝑑𝑒 𝑜𝑡𝑟𝑎 𝑚𝑎𝑛𝑒𝑟𝑎 Donde 𝛼 y 𝛽 son parámetros de forma y escala respectivamente.

Por ejemplo, 𝐹(𝑥) evaluado para el primer intervalo quedaría de la siguiente forma:

(6)

Definiendo 𝛼 = 6.31 y 𝛽 = 40.09, y evaluando desde el límite inferior hasta el límite superior del primer intervalo

𝐹(𝑥)1 = [1 − 𝑒−( 33.69 40.09) −6.31 ] − [1 − 𝑒−(31.0840.09) −6.31 ] 𝐹(𝑥)1= 0.1019 De este modo, la frecuencia esperada es:

𝐹𝐸1 = 𝑛 ∗ 𝐹(𝑥)1 𝐹𝐸1= 50(0.1019) = 5.0967

De manera similar se procede para el resto de las clases y se construye la siguiente tabla de 𝐹𝑂𝑖 𝑣𝑠 𝐹𝐸𝑖

Tabla 2. Tabla comparativa entre frecuencias observadas y frecuencias esperadas de acuerdo al modelo propuesto.

Número

de clase

Límite

inferior

Límite

superior

FO

i

F(x)

i

FE

i

=

n*F(x)

i

1

31.08 33.69 7 0.10193339 5.09666964

2

33.69 36.3 12 0.13022439 6.51121962

3

36.3 38.91 10 0.14921047 7.4605233

4

38.91 41.52 8 0.14966434 7.48321708

5

41.52 44.13 4 0.12729759 6.36487973

6

44.13 46.74 4 0.08819177 4.40958871

7

46.74 49.35 5 0.04736468 2.36823414

Finalmente, se calcula el estimador, de acuerdo a la siguiente expresión:

𝐶 = ∑(𝐹𝐸𝑖− 𝐹𝑂𝑖) 2 𝐹𝐸𝑖 𝑚 𝑖=1 𝐶 = 10.0791

(7)

Prueba de bondad de ajuste de Kolmogorov-Smirnov

Esta prueba también es utilizada para encontrar la distribución de probabilidad y, a diferencia de la prueba de bondad de ajuste de 𝜒2, esta prueba trabaja con la distribución de probabilidad acumulada. La metodología es la siguiente:

1. Se elabora una tabla de frecuencias de 𝑚 intervalos, a partir de los 𝑛 datos históricos. Se propone, de acuerdo a la regla de Sturges, que 𝑚 = 1 + 3.322 log 𝑛. Otra forma de determinar el número de intervalos es mediante 𝑚 = √𝑛. Se obtiene la frecuencia observada 𝑖 de cada intervalo (𝐹𝑂𝑖). Se calcula la media y la varianza de los datos.

2. A continuación, se obtiene la probabilidad acumulada observada 𝑖 (𝑃𝑂𝑖), resultado de dividir la frecuencia observada de cada intervalo por el número total de datos. 3. Se calcula la probabilidad acumulada observada de cada intervalo (𝑃𝐴𝑂𝑖) del paso

anterior.

4. Se propone una distribución de probabilidad de acuerdo con la forma de la tabla de frecuencias obtenida en el paso 1.

5. Con la distribución propuesta se calcula la probabilidad esperada para cada uno de los intervalos (𝑃𝐸𝑖) mediante la integración de la distribución propuesta.

6. Se calcula la probabilidad acumulada esperada (𝑃𝐴𝐸𝑖) para cada intervalo de clase. 7. Se calcula el valor absoluto entre (𝑃𝐴𝐸𝑖) para cada intervalo y se selecciona la

máxima diferencia, llamándola 𝐷𝑀.

8. El estimador 𝐷𝑀 se compara con un valor límite correspondiente a la tabla 1 anexada en el presente documento, con 𝑛 datos y a un nivel de confianza de 1 − 𝛼. Si el estimador 𝐷𝑀 ≤ límite de la tabla 1, la distribución propuesta se acepta, en caso contrario se rechaza y se propone una nueva distribución.

Ejemplo de prueba de bondad de ajuste de Kolmogorov-Smirnov

El número de horas de vida de un componente electrónico se comporta de acuerdo con los datos históricos siguientes:

(8)

158.8 149.6 144.8 145.2 158.8 150.1 149.6 142.1 150.6 151.6 145.5 154.6 158.4 164.2 152.6 144.5 147.5 142.3 149.3 148.5 Construya un histograma y determine la distribución de probabilidad de los datos a un nivel de confianza 1 − 𝛼 = 90% utilizando la prueba de bondad de ajuste de Komolgorov-Smirnov.

Se tienen 50 datos, por lo que el número de intervalos será igual a 𝑚 = 1 + 3.322 log 50

𝑚 = 6.64 ≈ 7

Se obtiene la media, varianza y desviación estándar para la presente muestra de datos: 𝜇 = 150.416

𝜎2= 30.5809 𝜎 = 5.53

Análogo al problema anterior, se construye la tabla de frecuencia observada, incluyendo además las columnas de probabilidad observada y probabilidad observada acumulada.

𝑃𝑂𝑖 = 𝐹𝑂𝑖 𝑛 𝑃𝑂𝐴𝑖 = ∑ 𝑃𝑂𝑖 𝑖 𝑚=1

(9)

A partir de los datos de probabilidad acumulada, se obtiene el siguiente gráfico de densidad:

Observando los datos se puede pensar que siguen una distribución normal con media de 150.416 y desviación estándar de 5.53. La función normal no es integrable, así que se utilizará la tabla normal estándar.

De tabla normal estándar, se lee la probabilidad acumulada desde −∞ hasta 𝑧𝑖. Por ejemplo, para el primer intervalo:

𝑧𝑖 = (𝑥𝑖− 𝜇) 𝜎 𝑧1= 𝐿𝑆1− 𝜇 𝜎 = 140.55 − 150.416 5.53 = −1.7841

Con ayuda de la función de Excel DISTR.NORM.ESTAND.N (z; acumulado) se busca el valor correspondiente a la probabilidad esperada acumulada (PEA) desde −∞ hasta −1.7841 es de 0.0372 para una distribución normal estándar. El procedimiento es similar para los demás intervalos.

(10)

Número de clase Límite superior z PEA 1 140.55 -1.7841 0.0372 2 144.5 -1.0698 0.1424 3 148.45 -0.3555 0.3611 4 152.4 0.3588 0.6401 5 156.35 1.0731 0.8584 6 160.3 1.7873 0.9631 7 164.25 2.5016 0.9938

Finalmente se estima |POA-PEA| y se determina la diferencia máxima DM Tabla 4. Tabla de Probabilidad Esperada Acumulada Número

de clase

Límite

superior FO PO POA z PEA |POA-PEA|

1 140.55 1 0.02 0.02 -1.7841 0.0372 0.0172 2 144.5 3 0.06 0.08 -1.0698 0.1424 0.0624 3 148.45 13 0.26 0.34 -0.3555 0.3611 0.0211 4 152.4 19 0.38 0.72 0.3588 0.6401 0.0799 5 156.35 5 0.1 0.82 1.0731 0.8584 0.0384 6 160.3 6 0.12 0.94 1.7873 0.9631 0.0231 7 164.25 3 0.06 1 2.5016 0.9938 0.0062 𝐷𝑀 = 0.0799

El valor de DM se compara con la 𝑑5%,50 = 0.1923 (ver tabla “Valores Críticos de Kolmogorov-Smirnov). Como DM es menor, se acepta la hipótesis de que los datos siguen una distribución normal con media de 150.416 y desviación estándar de 5.53 a un nivel de confianza del 95%.

Conclusiones

(11)

acumulada y hace una comparación más directa entre ésta y la probabilidad observada acumulada.

(12)
(13)

Bibliografía

Referencias

Documento similar

 Tejidos de origen humano o sus derivados que sean inviables o hayan sido transformados en inviables con una función accesoria..  Células de origen humano o sus derivados que

Where possible, the EU IG and more specifically the data fields and associated business rules present in Chapter 2 –Data elements for the electronic submission of information

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)