T´ ecnicas de Inferencia Estad´ıstica II Tema 2. Contrastes de hip´ otesis param´ etricos
Parte III. Contrastes para varias muestras independientes
M. Concepci´on Aus´ın Universidad Carlos III de Madrid
Grado en Estad´ıstica y Empresa Curso 2016/17
Contenidos
1. Introducci´on
2. Contrastes param´etricos ANOVA
Introducci´ on: Contrastes para m´ ultiples muestras
En este tema vamos a abordar elproblema de homogeneidad a partir de k muestras independientes:
Muestra deY1:{y11, . . . ,y1n1} Muestra deY2:{y21, . . . ,y2n2}
· · ·
Muestra deYk :{yk1, . . . ,yknk}
Como se trata dek muestras independientes, los tama˜nos de cada muestra ,n1,n2,...,nk, pueden ser diferentes.
Introducci´ on: Contrastes para m´ ultiples muestras
Ejemplo 2.12.
Se toman medidas del peso de un tipo de estorninos en 4 regiones para examinar si existen diferencias entre las variedades de cada regi´on:
Peso
Loc. 1 78, 88, 87, 88, 83, 82, 81, 80, 80, 89 Loc. 2 78, 78, 83, 81, 78, 81, 82, 76, 76 Loc. 3 79, 73, 79, 75, 77, 78, 80, 78, 83, 84 Loc. 4 77, 69, 75, 70, 74, 83, 80
Contrastes param´ etricos ANOVA
Suponemos que lask variables son normales con la misma varianza:
Y1∼N µ1, σ2 Y2∼N µ2, σ2
· · ·
Yk ∼N µk, σ2
Queremos resolver el siguiente contraste:
H0:µ1=µ2=. . .=µk H1: Alguna media es diferente
Contrastes param´ etricos ANOVA
De este modo, se puede expresar que cada observaci´on es:
yij =µi+ij donde:
• yij representa la observaci´onj-´esima del grupoi.
• µi es la media del grupoi.
• ij es el error de la la observaci´onj-´esima del grupoi.
Se asume que los errores son normales, independientes con la misma varianza:
ij ∼N(0, σ2)
Contrastes param´ etricos ANOVA
• El An´alisis de la Varianza (ANOVA)decide si los grupos son iguales comparando la distancia entre las medias en funci´on de varianza de los grupos.
• Grupos con la misma diferencia de medias ser´an probablemente distintos si sus datos tienen menos variabilidad.
Ejemplo 2.13.
Pintar un gr´afico que presente los boxplots de los pesos de cada regi´on.
Contrastes param´ etricos ANOVA
Calculamos la media de cada grupo y la media total:
Muestra deY1:{y11, . . .y1n1} →y¯1·= Xn1
j=1y1j n1 Muestra deY2:{y21, . . .y2n2} →y¯2·=
Xn2
j=1y2j n2
· · ·
Muestra deYk :{yk1, . . .yknk} →y¯k·= Xnk
j=1ykj
nk
Toda la muestra :{y11, . . . ,yknk} →y = Xk
i=1
Xni
j=1yij
n1+. . .+nk
Contrastes param´ etricos ANOVA
Vemos que cada observaci´on es:
yij−y = (yij−y¯i·) + ¯yi·−y
Luego, elevando al cuadrado y sumando para todas las observaciones:
k
X
i=1 ni
X
j=1
yij−y2
=
k
X
i=1 ni
X
j=1
(yij−y¯i·)2+
k
X
i=1 ni
X
j=1
¯ yi·−y2
+ 2
k
X
i=1 ni
X
j=1
(yij−y¯i·) ¯yi·−y
| {z }
=0
Contrastes param´ etricos ANOVA
El primer t´ermino se llamavariaci´on total osuma de cuadrados total (TSS):
TSS=
k
X
i=1 ni
X
j=1
yij−y2
El segundo t´ermino se llama variaci´on explicada osuma de cuadrados explicado por el factor (FSS):
FSS =
k
X
i=1 ni
X
j=1
¯ yi·−y2
y el ´ultimo t´ermino se llama variaci´on no explicada osuma de cuadrados residual (RSS):
RSS =
k
X
i=1 ni
X
j=1
(yij−y¯i·)2
De modo que:
TSS=FSS+RSS
Contrastes param´ etricos ANOVA
Elestad´ıstico de contrastees:
FSS k−1 RSS n−k
∼H0Fk−1,n−k
Toda la informaci´on se resume en la tabla ANOVA:
Fuentes S. Cuadrados gosLib. Varianzas F Factor FSS=
k
X
i=1 ni
X
j=1
¯ yi·−y2
k−1 ˆsF2 = FSS k−1
ˆ sF2 ˆ sR2 Residual RSS=
k
X
i=1 ni
X
j=1
(yij−y¯i·)2 n−k ˆsR2 = RSS n−k
Total TSS=
k
X
i=1 ni
X
j=1
yij−y2
n−1 ˆsy2
Contrastes param´ etricos ANOVA
Ejemplo 2.14
Contrastar la hip´otesis de que haya diferencias entre las medias del peso de los estorninos en las distintas localidades.