ANÁLISIS DE VARIANZA
(ANOVA)
Mas de dos
muestras
➢ Como F → ∞, la curva se acerca al eje x.
Características de la distribución F
➢ Hay una "familia" de Distribuciones F.
➢ Cada miembro de la familia está
determinado por dos parámetros: los grados de libertad del numerador y los grados de libertad del denominador.
➢ F no puede ser negativo, y es una distribución continua
➢ La distribución F está positivamente sesgada.
➢ Sus valores van de 0 a ∞
El estadístico para comparar:
122 2
F s
= s
La distribución F también se usa para probar si dos o más medias de muestra provienen de poblaciones
iguales .
Suposiciones
▪ Las poblaciones muestreadas siguen la distribución normal.
▪ Las poblaciones tienen desviaciones estándar iguales.
▪ Las muestras se seleccionan al azar y son
independientes.
• Configuración de hipótesis y regla de decisión:
H
0: μ
1= μ
2= ... = μ
kH
a: Las medias no son todas iguales
• Rechazar H
0si F> F
α; k-1; n-k• La Hipótesis nula es que las medias de las poblaciones son las mismas.
• La hipótesis alternativa es que al menos uno de las medias es diferente.
• La estadística de prueba es la distribución F.
• La regla de Decisión es rechazar la hipótesis nula si F
(calculado) es mayor que F (tabla).
Si se toman muestras de k poblaciones, los grados de libertad del numerador son k - 1.
Si hay un total de n observaciones, los grados de libertad del denominador son n - k.
La estadística de prueba se calcula mediante:
Suma de cuadrados
Grados de libertad
Promedios
cuadráticos Valor de F Intermuestral
(tratamiento)
SSTR k – 1 SSTR / (k – 1) MSTR / MSE Intramuestral (error) SSE n – k SSE / (n – k )
(
G)
2SST = X − X
( )
2SSE = X − X SSTR 1
K SSE n K
F = −
−
donde:
Media General X G
Media de la muestra X k
Suponga que se desea verificar si existen diferencias entre el servicio prestado por cuatro aerolíneas. Se pide entonces a 22 pasajeros que califiquen el servicio de 0 a 100 según su
apreciación personal.
Ejemplo 1
¿Hay alguna diferencia en el nivel medio de satisfacción entre las cuatro aerolíneas?
Use el nivel de significancia 0.01.
Paso 1:
H
0: μ
E= μ
A= μ
T= μ
OH
a: las medias no son todas iguales Solución:
Paso 3:
NO hay diferencias
SI hay diferencias Paso 2:
α=0.01
→ F
;k-1;n-k =F
0.01;4-1;22-4 =F
0.01;3;18 =5.09
1485.09 594.41 890.69
SSTR SST SSE SSTR
SSTR
= −
= −
=
890.6
8.
1 9 4 1
594.
99
41 22 4 F
SSTR K SSE n K
F − −
=
= =
− −
(
X − XG)
2(
X − Xk)
2El valor calculado de F en la muestra, 8.99 es mayor que el valor crítico de la tabla 5.09, por lo que la hipótesis nula es rechazada.
Conclusión: Significa que si hay
La directora gerente de una gran empresa industrial quiere determinar si tres
programas de formación diferentes ejercen efectos distintos sobre la productividad de los empleados. Estos programas son los tratamientos que el ANOVA puede evaluar.
Catorce empleados son elegidos y asignados al azar a uno de los tres programas. Una vez terminada la formación, cada empleado realiza un examen para determinar su
competencia. A cuatro empleados se les impartió el primer programa, y a cinco cada uno de los otros dos. Los grupos serán tratados como muestras separadas y utilizados para extraer inferencias sobre las poblaciones de empleados que pudieran pasar por los programas de formación respectivos. Las puntuaciones de los empleados en el examen posterior a la formación se muestran en la tabla siguiente. Al nivel del 5%, ¿se
aprecia una diferencia en las puntuaciones medias?
EJERCICIO PROPUESTO 1
Tratamientos
Programa 1 Programa 2 Programa 3
85 80 82
72 84 80
F=1.9432