Prueba de Bondad de Ajuste

(1)

PRUEBAS DE BONDAD DE AJUSTE

1.- ¿QUE SON?



 Se entiende pSe entiende por bondad de or bondad de ajuste a la asajuste a la asimilación de los imilación de los datos observdatos observadosados de una variable a una función.

de una variable a una función.

2.-OBJETIVOS:



 Las pruebas de Las pruebas de bondad de ajusbondad de ajuste tienen por objetivo dte tienen por objetivo determinar si loseterminar si los datos disponibles se ajustan a una determinada distribución.

datos disponibles se ajustan a una determinada distribución.

3.- ¿CUÁLES SON?

Entre las pruebas de bondad de ajuste más conocidas, cabe mencionar las Entre las pruebas de bondad de ajuste más conocidas, cabe mencionar las siguientes:

siguientes:

•• Prueba Prueba de de Chi Chi CuadradoCuadrado

•• Prueba Prueba de de Kolmogorov Kolmogorov SmirnovSmirnov

4.-PRUEBA DE CHIP CUADRADO:

4.1.-DEFINICIÓN:

La prueba de Chi

La prueba de Chi Cuadrado se basa en la comparación entre la Cuadrado se basa en la comparación entre la frecuenciafrecuencia observada en un intervalo de clase y la frecuencia esperada en dicho observada en un intervalo de clase y la frecuencia esperada en dicho intervalo, calculada de acuerdo con la distribución teórica

intervalo, calculada de acuerdo con la distribución teórica considerada.considerada.

4.2.-VALOR ESTADÍSTICO DEL CHI-CUADRADO CALCULADO:

El estadístico de prueba,

(2)



DONDE:



O

í

:

Frecuencia observada en el intervalo i, de acuerdo a la muestra

considerada.



E

i

:

Frecuencia esperada en el intervalo i, de acuerdo a la

distribución seleccionada.



K:

Número de intervalos de clase en que se han agrupado las observaciones.

4.3.-VALOR TABULAR DE CHI-CUADRADO:

El valor tabular del estadístico Chi-cuadrado,2t ,se determina a

partir del cuadro siguiente: En función:

 Grados de libertad:

 El nivel de significación elegido.

. .  =  − 1 − 

(3)

4.4.-CRITERIO DE DECISIÓN:

 Si el valor estadístico del Chi-cuadrado calculado es menor o igual que el valor tabular, es decir:

2

C 2t

Entonces, se acepta la hipótesis nula, que establece que los valores observados se ajustan a la distribución considerada, al nivel de significación seleccionado (usualmente  = 5% o 1%).

 Si el valor estadístico Chi-cuadrado calculado es mayor que el valor tabular, es decir:

2

C

>

2t

Entonces, se rechaza la hipótesis nula y se acepta la hipótesis alternativa, que establece que los valores observados no se ajustan a la distribución considerada, al nivel de significación seleccionado (usualmente  = 5% o 1%).

4.5.-PASOS A SEGUIR:

Determinar el Número de Intervalos de Clase Método de Sturget:

DONDE:

o NC = número de intervalos de clase o N = número de datos

4.6.-CÁLCULO DE LA AMPLITUD DE CADA INTERVALO:

La amplitud de cada intervalo se determina con la ecuación:

(4)

4.7.-CÁLCULO DE LOS LÍMITE INFERIOR:

El límite inferior del primer intervalo de clase se determina con la relación:

Límite inferior = Xmin - X/2

4.8

.-

CÁLCULO DE LOS INTERVALOS DE CLASE, MARCAS DE

CLASE, FRECUENCIAS ABSOLUTA Y RELATIVA OBSERVADAS Y

FRECUENCIA ACUMULADA:

 La frecuencia absoluta observada corresponde al número de valores comprendido en el intervalo de clase. La suma de todas las frecuencias absolutas debe ser igual al total de datos, N.

 La frecuencia relativa se obtiene de dividir la frecuencia absoluta entre el número de datos, N.

 La frecuencia acumulada resulta de acumular los valores correspondientes a la frecuencia relativa. La frecuencia acumulada en el último intervalo de clase debe dar.

4.9.-CÁLCULO DE LA MEDIA Y DESVIACIÓN ESTÁNDAR PARA LOS

DATOS AGRUPADOS:

La media y la desviación estándar de los datos agrupados se determina mediante las siguientes relaciones:

Donde:

• f i – frecuencia absoluta.

• xi – marca de clase.

• k – número de intervalos de clase. • N – Número total de datos.

(5)

• Adoptar alguna distribución probabilística y determinar la frecuencia esperada para cada intervalo de clase.

(6)

(7)

5.- PRUEBA DE KOLMOGOROV-SMIRNOV:

5.1.- INTRODUCCION:

Es una prueba no paramétrica de la igualdad de las distribuciones de probabilidad, unidimensionales continuos que se pueden usar para comparar una muestra con una distribución de probabilidad de referencia.

5.2.- IMPORTANCIA:

El test de Kolmogorov-Smirnov es bastante potente con muestras grandes. El nivel de medición de la variable y su distribución son elementos que intervienen en la selección del test que se utilizará en el procesamiento posterior. De hecho, si la variable es continua con distribución normal, se podrán aplicar técnicas paramétricas. Si es una variable discreta o continua no normal, solo son aplicables técnicas no paramétricas pues aplicar las primeras arrojaría resultados de dudosa validez.

5.3.- DESARROLLO:

La única premisa que se necesita es que las mediciones se encuentren al menos en una escala de intervalo. Se necesita que la medición considerada sea básicamente continua. Además dicha prueba es aplicable cualquiera sea el tamaño de la muestra.

5.4.- POTENCIA Y EFICACIA:

La prueba de una muestra de K-S puede en todos los casos en que se aplique ser igual de confiable que su prueba alternativa, la prueba de ji-cuadrado.

5.5.- ETAPAS DE DESARROLLO:

El estadístico Kolmogorov – Smirnov , considera a la desviación de la función de distribución de Probabilidades de la muestra P(x) de la Función de Probabilidades Teórica.

(8)

• Determinar la frecuencia observada acumulada y la frecuencia teórica acumulada, Po(x) y P(x).

• En cada caso, calcular: Dn = máx. P(x) – Po(x) 

• Así, Dn es la máxima diferencia entre la función de distribución acumulada de la muestra y la función de distribución acumulada teórica escogida.

• El valor critico Dα de la prueba debe ser obtenida de tablas en función de α y n.

• Se fija el nivel de Probabilidad α, valores de 0.05 y 0.01 son los más usuales. (CUADRO).

• Tener en cuenta la función de distribución de probabilidad de Weibull.

(9)

(10)

(11)

(12)