Inferencia Estad´ıstica
Estimaci ´on de par ´ametros
mediante intervalos de confianza
y contrastes de hip ´otesis
´Indice
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
Distribuciones de los estad´ısticos muestrales
Estimaci ´ on mediante intervalos de confianza
Estimaci ´ on mediante contraste de hip ´ otesis
Distribuciones de los estad´ısticos muestrales de una poblaci´on normal
❖´Indice
Distribuciones de los estad´ısticos
muestrales
❖Introducci ´on
❖Para la varianza muestral
❖Para la media muestral
❖Para la proporci ´on muestral
❖Para el cociente de varianzas
❖Para la diferencia de medias
muestrales
❖Para la diferencia de proporciones Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
Distribuciones de los estad´ısticos muestrales
❖´Indice
Distribuciones de los estad´ısticos
muestrales
❖Introducci ´on
❖Para la varianza muestral
❖Para la media muestral
❖Para la proporci ´on muestral
❖Para el cociente de varianzas
❖Para la diferencia de medias
muestrales
❖Para la diferencia de proporciones Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
Como se ha visto en el tema anterior, los estad´ısticos muestrales se pueden utilizar para la estimaci ´on puntual de los correspondientes par ´ametros poblacionales. Pero adem ´as de la estimaci ´on puntual, existen otros m ´etodos de estimaci ´on de par ´ametros poblacionales como son los interva- los de confianza y los contrastes de hip ´otesis (que se estudiaran en temas posteriores).
Para el estudio de estos m ´etodos ser ´a fundamental tener en cuenta el car ´acter aleatorio de los estad´ısticos muestrales y conocer su distribuci ´on.
As´ı, se entiende por distribuci ´on de muestreo de un estad´ıstico la dis- tribuci ´on de probabilidad que puede obtenerse como resultado de un n ´umero infinito de muestras aleatorias independientes, cada una de tama ˜no n, provenientes de la poblaci ´on de inter ´es.
Destacar que este tema se centra en estad´ısticos muestrales cuyas dis- tribuciones de probabilidad son obtenidas a partir de poblaciones con dis- tribuci ´on normal. Esta caracter´ıstica marcar ´a tambi ´en los siguientes temas de estimaci ´on param ´etrica mediante intervalos de confianza y contraste de hip ´otesis.
Media poblacional conocida y desconocida
❖´Indice
Distribuciones de los estad´ısticos
muestrales
❖Introducci ´on
❖Para la varianza muestral
❖Para la media muestral
❖Para la proporci ´on muestral
❖Para el cociente de varianzas
❖Para la diferencia de medias
muestrales
❖Para la diferencia de proporciones Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
Sea X1, . . . , Xn una muestra aleatoria simple de tama ˜no n procedente de una poblaci ´on N(µ, σ2), donde µ es conocida. Se verifica entonces que
1 σ2
n
X
i=1
(Xi − µ)2 ∼ χ2n.
Sea X1, . . . , Xn una muestra aleatoria simple de tama ˜no n procedente de una poblaci ´on N(µ, σ2), donde µ es desconocida. Se verifica entonces que
1 σ2
n
X
i=1
Xi − X2
∼ χ2n−1.
Varianza poblacional conocida y desconocida
❖´Indice
Distribuciones de los estad´ısticos
muestrales
❖Introducci ´on
❖Para la varianza muestral
❖Para la media muestral
❖Para la proporci ´on muestral
❖Para el cociente de varianzas
❖Para la diferencia de medias
muestrales
❖Para la diferencia de proporciones Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
Sea X1, . . . , Xn una muestra aleatoria simple de tama ˜no n procedente de una poblaci ´on N(µ, σ2), donde σ2 es conocida. Se verifica entonces que
X ∼ N
µ, σ
√n
.
Sea X1, . . . , Xn una muestra aleatoria simple de tama ˜no n procedente de una poblaci ´on N(µ, σ2), donde σ2 es desconocida. Se verifica entonces que
X − µ√ n
Sn−1 = X − µ√
n − 1
Sn ∼ tn−1.
Distribuci´on para la proporci´on muestral
❖´Indice
Distribuciones de los estad´ısticos
muestrales
❖Introducci ´on
❖Para la varianza muestral
❖Para la media muestral
❖Para la proporci ´on muestral
❖Para el cociente de varianzas
❖Para la diferencia de medias
muestrales
❖Para la diferencia de proporciones Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
Sea X1, . . . , Xn una muestra aleatoria simple procedente de una variable aleatoria distribuida seg ´un una Bernouilli de par ´ametro p, entonces la vari- able aleatoria dada por la proporci ´on muestral
P = 1 n
n
X
i=1
Ai,
tiene distribuci ´on aproximadamente Normal N
p, p(1 − p) n
,
si el tama ˜no muestral es suficientemente elevado y donde
Ai =
1 , si el individuo i presenta la caracter´ıstica en estudio con probabilidad p
0 , en otro caso
.
Distribuci´on para el cociente de varianzas
❖´Indice
Distribuciones de los estad´ısticos
muestrales
❖Introducci ´on
❖Para la varianza muestral
❖Para la media muestral
❖Para la proporci ´on muestral
❖Para el cociente de varianzas
❖Para la diferencia de medias
muestrales
❖Para la diferencia de proporciones Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
DadasX1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples independi- entes procedentes de sendas poblaciones normales N(µ1, σ12) y N(µ2, σ22), se verifica entonces que
F = Sn−12
Sm−12 · σ22 σ12,
es una variable aleatoria que se distribuye seg ´un una F de Snedecor con n − 1 y m − 1 grados de libertad para el numerador y el denominador, respectivamente.
Varianzas poblacionales conocidas
❖´Indice
Distribuciones de los estad´ısticos
muestrales
❖Introducci ´on
❖Para la varianza muestral
❖Para la media muestral
❖Para la proporci ´on muestral
❖Para el cociente de varianzas
❖Para la diferencia de medias
muestrales
❖Para la diferencia de proporciones Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
Dadas X1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples indepen- dientes procedentes de dos poblaciones normales N(µ1, σ12) y N(µ2, σ22), siendo σ12 y σ22 conocidas. Entonces, la diferencia X−Y se distribuye como sigue
X − Y ∼ N
µ1 − µ2, σ12
n + σ22 m
.
Varianzas poblacionales desconocidas e iguales
❖´Indice
Distribuciones de los estad´ısticos
muestrales
❖Introducci ´on
❖Para la varianza muestral
❖Para la media muestral
❖Para la proporci ´on muestral
❖Para el cociente de varianzas
❖Para la diferencia de medias
muestrales
❖Para la diferencia de proporciones Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
Dadas X1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples indepen- dientes procedentes de dos poblaciones normales N(µ1, σ12) y N(µ2, σ22), siendo σ12 y σ22 desconocidas e iguales (σ12 = σ22 = σ2). Entonces,
(X − Y ) − (µ1 − µ2) Sp
qm+n mn
∼ tn+m−2,
donde
Sp2 = (n − 1) · Sn−12 + (m − 1) · Sm−12
n + m − 2 .
Distribuci´on para la diferencia de proporciones
❖´Indice
Distribuciones de los estad´ısticos
muestrales
❖Introducci ´on
❖Para la varianza muestral
❖Para la media muestral
❖Para la proporci ´on muestral
❖Para el cociente de varianzas
❖Para la diferencia de medias
muestrales
❖Para la diferencia de proporciones Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
DadasX1, . . . , Xn e Y1, . . . , Ym dos muestras aleatorias simples independi- entes con tama ˜nos n y m, procedentes de variables aleatorias de Bernouilli, con par ´ametros p1 y p2. Se verifica entonces que la variable aleatoria
(P1 − P2) − (p1 − p2) qp1(1−p1)
n + p2(1−pm 2)
∼ N(0, 1).
Estimaci´on mediante intervalos de confianza
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Estimaci´on mediante intervalos de confianza
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
La estimaci ´on puntual, estudiada en temas anteriores, nos aporta un valor concreto pero no aporta una medida de la precisi ´on de la estimaci ´on. Una manera de subsanar este hecho ser ´a obtener de cada muestra, no un es- timador puntual, sino un intervalo que se sospecha que debe contener al par ´ametro. En ocasiones ser ´a m ´as interesante saber entre que posibles valores se puede mover el par ´ametro m ´as que conocer un valor puntual del mismo. Es decir, puede ser m ´as interesante proporcionar un intervalo dentro del cual est ´e contenido el verdadero valor de un par ´ametro descono- cido, con cierto grado de certeza, que dar una aproximaci ´on puntual del mismo. El conocido dicho m ´as vale acertar aproximadamente que fallar exactamente resume de manera concisa esta idea.
Evidentemente, esta t ´ecnica no tiene por que dar siempre un resul- tado correcto y a la probabilidad de que hayamos acertado al decir que el par ´ametro estaba contenido en dicho intervalo se le denomina nivel de con- fianza. Los extremos del intervalo de confianza se calcular ´an a partir de los datos muestrales y por tanto ser ´an variables aleatorias que depender ´an, entre otros elementos, del nivel de confianza.
M´etodo del estad´ıstico pivote
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Sea X una variable aleatoria (continua o discreta) cuya distribuci ´on de probabilidad depende de un par ´ametro desconocido, θ. Dada una mues- tra aleatoria simple, X1, . . . , Xn, y una funci ´on t, t = T (X1, . . . , Xn; θ), tal que:
● Para cada θ, T(·; θ) es un estad´ıstico muestral.
● Para cada realizaci ´on de la muestra, x1, . . . , xn, T(x1, . . . , xn; ·) es es- trictamente mon ´otona.
● Si Λ = Img(t), para cada λ ∈ Λ, la ecuaci ´on λ = T (x1, . . . , xn; θ), tiene soluci ´on en θ.
En tal caso, si para cadaθ, t tiene distribuci ´on independiente de θ, se puede construir un intervalo de confianza para θ.
Entonces, el proceso a seguir en cada ocasi ´on para construir un intervalo de confianza, conocido como m ´etodo del estad´ıstico pivote, ser ´a siempre el mismo:
● Seleccionar un estad´ıstico, T, que debe contener al par ´ametro para el cual se desea estimar el intervalo de confianza, θ, y cuya distribuci ´on sea conocida y no dependa del par ´ametro desconocido, θ.
M´etodo del estad´ıstico pivote
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
● La distribuci ´on de tal variable aleatoria es independiente del valor del par ´ametro y, por tanto, se pueden encontrar los cuantiles α2 y 1 − α2 que definen un intervalo de extremos fijos, entre los que, con probabilidad 1 − α, se encontrar ´a dicha variable. Esto es:
P h λα
2 ≤ t ≤ λ1−α2
i = 1 − α,
donde λα
2 y λ1−α
2 son los puntos (cuartiles) de la distribuci ´on del es- tad´ıstico T que dejan a su izquierda una probabilidad α2 y 1 − α2 , re- spectivamente.
● El siguiente paso ser ´a despejar el par ´ametro en la desigualdad de la probabilidad anterior, obteniendo un nuevo suceso de extremos aleato- rios que contendr ´a al verdadero valor del par ´ametro fijo y desconocido:
P[a ≤ θ ≤ b] = 1 − α, donde a = T−1
λα
2
y b = T−1
λ1−α
2
.
El intervalo obtenido, [a, b], ser ´a el intervalo de confianza, al nivel 1 − α, para el par ´ametro desconocido en estudio.
M´etodo del estad´ıstico pivote
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Por su propia construcci ´on este m ´etodo nos permite afirmar que si se construyen distintos intervalos, cada vez con distintas realizaciones de la muestra, al menos el 100(1 − α)% de ellos contiene el verdadero valor del par ´ametro.
Hay que destacar que una vez que se ha calculado el intervalo para una muestra determinada, no es correcto decir la probabilidad de que el par ´ametro pertenezca al intervalo es 1 − α, ya que una vez calculado el intervalo, este deja de ser aleatorio y la probabilidad ser ´a 1 si el intervalo es de los 1 − α que contienen al par ´ametro, ´o 0 o si el intervalo es uno de los α intervalos que no contienen al par ´ametro. Por tanto, no tiene sentido hablar de probabilidad sino de confianza. La confianza est ´a puesta en que el m ´etodo de construcci ´on de los intervalos nos asegura que (1 − α)100%
de las muestras producir ´an intervalos que contienen al par ´ametro.
Los niveles de confianza habituales son del 90%, 95% y 99%. Advertir que conforme aumenta la confianza, si bien disminuye el porcentaje de intervalos err ´oneos, la estimaci ´on realizada es m ´as pobre. Si os dijera que estimo que vuestra nota final estar ´a comprendida entre 0 y 10, ¿os he proporcionado informaci ´on ´util? Y eso que en este caso hemos trabajado a un 100% de confianza!!!
Con media poblacional conocida
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Sea X una variable aleatoria tal que la distribuci ´on de probabilidades de dicha variable aleatoria es N(µ, σ2), donde µ es conocida. Entonces, dada una muestra aleatoria simple, X1, . . . , Xn, se toma como cantidad pivotal:
1 σ2
n
X
i=1
(Xi − µ)2,
que tiene una distribuci ´on χ2 con n grados de libertad.
Sea χ1−α
2 el cuantil 1 − α2 de la distribuci ´on χ2 con n grados de libertad y χα
2 es el cuantil α2 de la misma distribuci ´on, esto es:
P h
Y < χ1−α
2
i = 1 − α
2, P h
Y < χα
2
i = α 2, donde Y ∼ χ2n. En tal caso:
P
"
χα
2 < 1 σ2
n
X
i=1
(Xi − µ)2 < χ1−α
2
#
= 1 − α,
Con media poblacional conocida
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
de donde, despejando σ2 P
"
1 χ1−α
2
n
X
i=1
(Xi − µ)2 < σ2 < 1 χα
2
n
X
i=1
(Xi − µ)2
#
= 1 − α.
Entonces, el intervalo de confianza para la varianza de la poblaci ´on donde la media es conocida se expresar ´a como:
"
1 χ1−α
2
n
X
i=1
(Xi − µ)2, 1 χα
2
n
X
i=1
(Xi − µ)2
# .
Con media poblacional desconocida
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Sea X una variable aleatoria tal que la distribuci ´on de probabilidades de dicha variable aleatoria es N(µ, σ2), donde µ es desconocida. Entonces, dada una muestra aleatoria simple, X1, . . . , Xn, se selecciona como canti- dad pivotal:
1 σ2
n
X
i=1
(Xi − X)2,
que tiene una distribuci ´on χ2 con n− 1 grados de libertad.
Teniendo en cuenta, al igual que antes, que χ1−α
2 es el cuantil 1 − α2 de la distribuci ´on χ2 con n grados de libertad y χα
2 es el cuantil α2 de la misma distribuci ´on, entonces:
P
"
χα
2 < 1 σ2
n
X
i=1
(Xi − X)2 < χ1−α
2
#
= 1 − α,
de donde, despejando σ2 P
"
1 χ1−α
2
n
X
i=1
(Xi − X)2 < σ2 < 1 χα
2
n
X
i=1
(Xi − X)2
#
= 1 − α.
Con media poblacional desconocida
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Entonces, el intervalo de confianza, al nivel 1 − α, para la varianza de una poblaci ´on donde la media es desconocida es
"
1 χ1−α
2
n
X
i=1
(Xi − X)2, 1 χα
2
n
X
i=1
(Xi − X)2
# .
Con varianza poblacional conocida
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Para obtener el intervalo de confianza del par ´ametro media poblacional de una variable aleatoria X distribuida como una N(µ, σ2), donde σ2 es una cantidad conocida, dada X1, . . . , Xn una muestra aleatoria simple proce- dente de X, se selecciona como cantidad pivotal:
X − µ
√σn
,
que se distribuye seg ´un una N(0, 1). Dicha distribuci ´on se emplear ´a para calcular el intervalo de confianza de manera que se verifica que:
P
"
Zα
2 < X − µ√ n
σ < Z1−α
2
#
= 1 − α,
donde Zα
2 y Z1−α
2 son los puntos de una distribuci ´on N(0, 1) que dejan por debajo suya una probabilidad α2 y 1 − α2, respectivamente. Esto es:
P h
Z < Zα
2
i = α
2 , P h
Z < Z1−α
2
i = 1 − α 2, donde Z ∼ N(0, 1).
Con varianza poblacional conocida
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Si en la desigualdad de la probabilidad anterior despejamos µ, se obtiene:
P
X + Zα
2 · σ
√n < µ < X + Z1−α
2 · σ
√n
= 1 − α.
Por tanto, se ha obtenido un intervalo que contiene en su interior a la media poblacional µ con una probabilidad 1 − α. Esto es, teniendo en cuenta la simetr´ıa1 de la distribuci ´on normal:
X − Z1−α2 · σ
√n, X + Z1−α
2 · σ
√n
,
es el intervalo de confianza, al nivel de confianza 1 − α, para la media de una poblaci ´on normal con varianza conocida.
1Puesto que la distribuci ´on Normal es sim ´etrica con respecto a su media, que en este caso es el cero, se verifica que Zα
2 = −Z1−α2 . Este hecho se
Con varianza poblacional desconocida
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Sea X una variable aleatoria tal que la distribuci ´on de probabilidades de dicha variable aleatoria es Normal N(µ, σ2), donde σ2 es desconocida. En- tonces, dada una muestra aleatoria simple, X1, . . . , Xn, utilizaremos como cantidad pivotal:
X − µ√ n Sn−1 ,
que se distribuye seg ´un una distribuci ´on t-Student con n − 1 grados de libertad, donde
Sn−1 = v u u t
1 n − 1
n
X
i=1
(Xi − X)2.
El intervalo de confianza queda determinado por P
"
tα
2 < X − µ√ n
Sn−1 < t1−α
2
#
= 1 − α,
donde tα
2 y t1−α
2 son los puntos de una t de Student con n − 1 grados de libertad que dejan por debajo suya una probabilidad α2 y 1 − α2, respectiva- mente. Esto es:
Con varianza poblacional desconocida
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
P h
t < tα
2
i = α
2 , P h
t < t1−α
2
i = 1 − α 2, donde t ∼ tn−1.
Despejando el par ´ametro desconocido, en este caso µ, en la expresi ´on anterior obtenemos la probabilidad equivalente:
P
X + tα
2 · Sn−1
√n < µ < X + t1−α
2 · Sn−1
√n
= 1 − α.
De forma que usando que la distribuci ´on t-Student es sim ´etrica, la regi ´on que determina
X − t1−α2 · Sn−1
√n , X + t1−α
2 · Sn−1
√n
,
es el intervalo de confianza, al nivel de confianza 1 − α, para la media de una poblaci ´on normal con varianza desconocida.
Intervalo de confianza para la proporci´on
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Dada X1, . . . , Xn una muestra aleatoria de tama ˜no n procedente de una Bernoulli, estimamos la proporci ´on muestral mediante la distribuci ´on
P − p qP (1−P )
n
,
que puede considerarse aproximadamente normal de media cero y vari- anza uno, cuando el tama ˜no de la muestra es suficientemente grande.
Teniendo en cuenta que la distribuci ´on normal es sim ´etrica y sea Z1−α
2 el cuantil 1 − α2 de la distribuci ´on normal de media cero y varianza uno, se verifica entonces que
P
−Z1−α2 < P − p qP (1−P )
n
< Z1−α
2
= 1 − α.
Si en el suceso expresado en la probabilidad anterior despejamos p, queda P
"
P − Z1−α
2
rP(1 − P )
n < p < P + Z1−α
2
rP(1 − P ) n
#
= 1 − α.
Intervalo de confianza para la proporci´on
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Por tanto, el intervalo de confianza, al nivel 1 − α, para la proporci ´on se define como:
"
P − Z1−α2
rP(1 − P )
n , P + Z1−α
2
rP(1 − P ) n
# .
Intervalo para el cociente de varianzas
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Dadas X1, . . . , Xn e Y1, . . . , Ym, dos muestras aleatorias simples indepen- dientes procedentes de dos poblaciones normales, N(µ1, σ12) y N(µ2, σ22), con medias y varianzas desconocidas, la variable usada como cantidad pivotal ser ´a
Sn−12
Sm−12 · σ22 σ12,
que tiene una distribuci ´on F de Snedecor con n− 1 grados de libertad para el numerador y m − 1 grados de libertad para el denominador.
Si Fα
2 es el cuantil α2 y F1−α
2 es el cuantil 1 − α2 de dicha distribuci ´on, entonces
P
Fα
2 < Sn−12
Sm−12 · σ22
σ12 < F1−α
2
= 1 − α,
donde despejando σ22
σ12 resultaP
Fα
2 · Sm−12
Sn−12 < σ22
σ21 < F1−α
2 · Sm−12 Sn−12
= 1 − α.
Y entonces, el intervalo de confianza, al nivel 1 − α, para el cociente de varianzas de dos poblaciones normales es
Fα
2 · Sm−12
S2 , F1−α
2 · Sm−12 S2
.
Con varianzas poblacionales conocidas
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Dadas dos muestras aleatorias simples independientes, X1, . . . , Xn e Y1, . . . , Ym, procedentes de dos poblaciones normales, N(µ1, σ12) y N(µ2, σ22), con varianzas conocidas, entonces la variable aleatoria usada como cantidad pivotal ser ´a
(X − Y ) − (µ1 − µ2) qσ12
n + σm22
,
la cual tiene una distribuci ´on N(0, 1).
SiZ1−α
2 es el cuantil1−α2 de dicha distribuci ´on normal, entonces se verifica que
P
−Z1−α2 < (X − Y ) − (µ1 − µ2) qσ12
n + σm22
< Z1−α
2
= 1 − α,
donde hemos usado una vez m ´as que por ser la distribuci ´on Normal sim ´etrica se verifica que Zα
2 = −Z1−α2 .
Con varianzas poblacionales conocidas
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Si en el suceso expresado en la probabilidad anterior despejamos µ1 − µ2, queda
P
"
(X − Y ) − Z1−α2
rσ12
n + σ22
m < µ1 − µ2 <
(X − Y ) + Z1−α2
rσ12
n + σ22 m
#
= 1 − α,
obteni ´endose el intervalo de confianza para la diferencia de medias, al nivel 1 − α, para dos poblaciones normales cuyas varianzas son conocidas
"
(X − Y ) − Z1−α2
rσ12
n + σ22
m ,(X − Y ) + Z1−α2
rσ12
n + σ22 m
# .
Con varianzas poblacionales desconocidas e iguales
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Dadas dos muestras aleatorias simples independientes, X1, . . . , Xn e Y1, . . . , Ym, procedentes de dos poblaciones normales, N(µ1, σ12) y N(µ2, σ22), con varianzas desconocidas e iguales (σ12 = σ22 = σ2), entonces la variable aleatoria usada como cantidad pivotal ser ´a
(X − Y ) − (µ1 − µ2) Sp
qm+n nm
,
que tiene una distribuci ´on t-Srudent con m + n − 2 grados de libertad y donde
Sp = s
(n − 1) · Sn−12 + (m − 1) · Sm−12
n + m − 2 .
Si t1−α
2 es el cuantil 1 − α2 de la distribuci ´on t-Student con m+ n − 2 grados de libertad, entonces se verifica que
P
−t1−α2 < (X − Y ) − (µ1 − µ2) Sp
qm+n nm
< t1−α
2
= 1 − α,
Con varianzas poblacionales desconocidas e iguales
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Si en la expresi ´on anterior despejamos µ1 − µ2, obtenemos:
P
"
(X − Y ) − t1−α2 Spr m + n
nm < µ1 − µ2 <
(X − Y ) + t1−α2 Spr m + n nm
#
= 1 − α.
Por tanto, el intervalo de confianza para la diferencia de medias, al nivel 1 − α, para dos poblaciones normales cuyas varianzas son desconocidas
"
(X − Y ) − t1−α2 Spr m + n
nm ,(X − Y ) + t1−α2 Spr m + n nm
# .
I.C. para la diferencia de proporciones
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
❖M ´etodo del estad´ıstico pivote
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones Estimaci ´on mediante contraste de
hip ´otesis
Dadas dos muestras aleatorias simples de tama ˜no m y n procedentes de dos variables aleatorias independientes distribuidas seg ´un dos Bernouillis de par ´ametros p1 y p2, respectivamente. Entonces
(P1 − P2) − (p1 − p2) qP1(1−P1)
n + P2(1−Pm 2)
∼ N(0, 1).
Si Z1−α
2 es el cuantil 1 − α2 de la distribuci ´on N(0, 1), entonces, teniendo en cuenta que la distribuci ´on normal es sim ´etrica, se verifica que
P
−Z1−α2 < (P1 − P2) − (p1 − p2) qP1(1−P1)
n + P2(1−Pm 2)
< Z1−α
2
= 1 − α.
Si en el suceso expresado en la probabilidad anterior despejamos p1 − p2, queda P h
(P1 − P2) − Z1−α2 · δ < p1 − p2 < (P1 − P2) + Z1−α
2 · δi
= 1 − α, donde δ =
qP1(1−P1)
n + P2(1−Pm 2). Por tanto, el intervalo de confi- anza, al nivel 1 − α, para la diferencia de proporciones muestrales ser ´a h(P − P ) − Z · δ, (P − P ) + Z · δi
.
Estimaci´on mediante contraste de hip´otesis
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
❖Introducci ´on al contraste de hip ´otesis
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones
Introducci´on al contraste de hip´otesis
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
❖Introducci ´on al contraste de hip ´otesis
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones
En el presente tema se aborda el problema de inferencia sobre los par ´ametros desconocidos de una distribuci ´on desde un nuevo enfoque. En este caso desarrollaremos un procedimiento, conocido como contraste de hip ´otesis, que va a permitir discernir si una propuesta sobre los posibles val- ores que puede tomar un par ´ametro puede considerarse o no como cierta.
Dicha decisi ´on ser ´a tomada a partir de una regla, referida como regi ´on de rechazo, basada en la informaci ´on muestral (destacar que no se estudiar ´a c ´omo se construye dicha regi ´on de rechazo, la cual nos ser ´a dada directa- mente).
El procedimiento de contrastaci ´on, que estudiaremos en los siguientes apartados, tiene los siguientes pasos:
● Planteamiento de hip ´otesis nula y alternativa, as´ı como elecci ´on del nivel de significaci ´on (normalmente 0’05 y 0’01).
● Selecci ´on de un estad´ıstico de prueba que conduce a unos l´ımites (val- ores cr´ıticos) que dividen el espacio muestral en una regi ´on donde se rechaza la hip ´otesis nula (regi ´on cr´ıtica).
● Tomar una decisi ´on.
Contrastes de hip´otesis e intervalos de confianza
❖´Indice
Distribuciones de los estad´ısticos
muestrales
Estimaci ´on mediante intervalos de
confianza
Estimaci ´on mediante contraste de
hip ´otesis
❖Introducci ´on al contraste de hip ´otesis
❖Para la varianza poblacional
❖Para la media poblacional
❖Para la proporci ´on
❖Para el cociente de varianzas
❖Para la diferencia de medias
poblacionales
❖Para la diferencia de proporciones
Para aplicar esta metodolog´ıa necesitaremos las mismas distribuciones us- adas en la obtenci ´on de intervalos de confianza. Esta situaci ´on no es ca- sual, ya que una regla factible para rechazar un determinado valor para el par ´ametro o par ´ametros desconocidos es que dicho valor se encuentre fuera del correspondiente intervalo de confianza. El contraste y los interva- los de confianza son pues, dos cuestiones estrechamente relacionadas.