Tema 5 - Introducci´ on
Tema 3. Estimaci´ on puntual
Tema 4. Estimadores de m´ axima verosimilitud
Generalizaci´ on
Tema 5. Intervalos de confianza
Definici´on.
Intervalos de confianza para medias y varianzas en poblaciones normales.
Intervalos de confianza en muestras grandes.
Determinaci´on del tama˜no muestral.
Distribuci´ on temporal del temario
1 2 3 4 5 6 7 8 9
Tema 1 T T T P
Tema 2 T T T P T T T P P
Tema 3 T T T P T T T P P
Tema 4 T T T P T T T P P
Tema 5 T T T P T T T P P
Tema 6 T T T P T T T P P
Tema 7 T T T P T T T P P
7 7 7 7 6 6 6 6 6 58
0 0 0 7 0 0 0 6 6 19
T denota una hora de clase de teor´ıa P denota una hora de clase pr´actica
Tema 5. Intervalos de confianza
Los contenidos a desarrollar en este tema son los siguientes:
Definici´on e interpretaci´on frecuentista.
Intervalos de confianza para medias y varianzas en poblaciones normales:
casos de una y dos poblaciones.
Intervalos de confianza en muestras grandes.
Determinaci´on del tama˜no muestral.
Lecturas recomendadas: Secciones 8.1 a 8.10 del libro de Pe˜na (2005) y el cap´ıtulo 8 de Newbold (2001).
Estimador por intervalos de confianza
Definici´on 1. Sea XXX = (X1, X2, . . . , Xn) una muestra aleatoria de una poblaci´on X con funci´on de distribuci´on Fθθθ donde θθθ = (θ1, θ2, . . . , θk) es un vector de par´ametros. Un estimador por intervalos de confianza de θi al nivel de confianza 1 − α es una funci´on que a la muestra xxx = (x1, x2, . . . , xn) le hace corresponder un intervalo (T1(xxx), T2(xxx)) =
T1(x1, x2, . . . , xn), T2(x1, x2, . . . , xn)
que satisface:
Pr{θi ∈ (T1(XXX), T2(XXX))} = 1 − α, para cada θi ∈ Θi.
Observaci´on 1: Notar que (T1(XXX), T2(XXX)) 6= (T1(xxx), T2(xxx)).
Observaci´on 2: Se dice (T1(xxx), T2(xxx)) es un intervalo de confianza de θi.
Ejemplo 1. Sea XXX = (X1, X2, . . . , Xn) una muestra aleatoria simple de una poblaci´on X ∼ N(µ, σ2) con σ2 conocida. Hallar un estimador por intervalos de confianza para la media, µ.
Sabemos que X¯ ∼ N(µ, σn2).
Por tanto, X¯√−µσ n
∼ N(0,1).
Entonces, Pr n
− zα/2 < X¯√−µσ n
< zα/2o
= 1 − α.
I Un intervalo de confianza para µ es:
X¯ − zα/2√σn,X¯ + zα/2√σn .
I Otros intervalos son:
X¯ − zα√σn,+∞
y
−∞,X¯ + zα√σn
.
Cantidad pivotal
Definici´on 2. Sea XXX = (X1, X2, . . . , Xn) una muestra aleatoria de una poblaci´on X con funci´on de distribuci´on Fθθθ donde θθθ = (θ1, θ2, . . . , θk) es un vector de par´ametros. Una cantidad pivotal para θi es una funci´on C(X1, X2, . . . , Xn, θi) tal que su distribuci´on no depende de θi.
Ejemplo 1.
Sabemos que X¯√−µσ n
∼ N(0,1).
Entonces, X¯√−µσ n
es una cantidad pivotal para µ.
M´ etodo de la cantidad pivotal
Si tenemos una cantidad pivotal, para construir intervalos de confianza se puede utilizar el siguiente procedimiento:
1. Obtener la distribuci´on de la cantidad pivotal.
2. Obtener C1 y C2 tales que Pr {C1 < C(X1, X2, . . . , Xn, θi) < C2} = 1−α.
3. Despejar θi de las desigualdades C1 < C(X1, X2, . . . , Xn, θi) < C2, esto es, lograr T1(X1, X2, . . . , Xn) < θi < T2(X1, X2, . . . , Xn).
Finalmente, (T1(x1, x2, . . . , xn), T2(x1, x2, . . . , xn)) es un intervalo para θi.
Volvamos al Ejemplo 1
Ejemplo 2. Supongamos que los rendimientos de las acciones de la empresa SEGURA.SL siguen una distribuci´on normal de media µ euros y varianza σ2 = 1.
Se toma una m.a.s. de 20 rendimientos y se tiene:
5,29 3,66 5,71 6,62 4,30 5,85 6,25 3,40 3,55 5,57 4,60 5,69 5,81 5,71 6,29 5,66 6,19 3,79 4,98 4,84
(a) Calcular un intervalo de confianza al 90 % para el rendimiento promedio de esta empresa.
¯
x = 1
20 (5,29 + 3,66 + · · · + 4,84) = 5,188,
¯
x − zα/2 σ
√n,x¯ + zα/2 σ
√n
= (5,188 − 1,645 × 1
√10, 5,188 + 1,645 × 1
√10)
= (4,6678, 5,7082) I ¿Pr(µ ∈ (4,6678, 5,7082))? ¿µ ∈ (4,6678, 5,7082) ?
Interpretaci´ on frecuentista del intervalo de confianza
Tema 5. Intervalos de confianza
Los contenidos a desarrollar en este tema son los siguientes:
Definici´on e interpretaci´on frecuentista.
X
Intervalos de confianza para medias y varianzas en poblaciones normales:
casos de una y dos poblaciones.
Intervalos de confianza en muestras grandes.
Determinaci´on del tama˜no muestral.
Distribuciones asociadas a la distribuci´ on normal - χ χ χ
222Definici´on 3. Sean X1, X2, . . . , Xn variables aleatorias independientes e id´enticamente distribuidas N(0,1). La distribuci´on χχχ222 con n grados de libertad es la distribuci´on de la v.a. S =
n
P
i=1
Xi2.
E[S] = n.
Var(S) = 2n.
χ2α
α
Distribuciones asociadas a la distribuci´ on normal ttt de Student
Definici´on 4. Sean Y , X1, X2, . . . , Xn variables aleatorias independientes e id´enticamente distribuidas N(0,1). La distribuci´on ttt de Student con n grados de libertad es la distribuci´on de la v.a. T = PnY
i=1 Xi2.
E[T] = 0.
Var(T) = n−2n .
− tα 0 tα
α α
Distribuciones asociadas a la distribuci´ on normal F F F de Fisher
Definici´on 5. Sean X1, X2, . . . , Xn e Y1, Y2, . . . , Ym variables aleatorias in- dependientes e id´enticamente distribuidas N(0,1). La distribuci´on FFFn,mn,mn,m de Fisher–Snedecor con n y m grados de libertad es la distribuci´on de la v.a.
F =
1 n
Pn
i=1 Xi2
1 m
Pm
i=1 Yi2.
E[F] = m−2m .
Var(F) = n(m−2)2m2(n+m−2)2(m−4). 1/T ∼ Fm,n.
Fn,m,α = 1/Fm,n,1−α.
Fn,m,α
α
Cantidades pivotales en la distribuci´ on normal
Lema de Fisher: Sean X1, X2, . . . , Xn v.a. i.i.d. N(µ, σ2). Entonces:
(i) X¯ ∼ N(µ, σn2).
(ii) (n−1)σ2 S2 ∼ χ2n−1.
(iii) X¯ y S2 son independientes.
Corolario:
X¯−µ
√σ n
es una cantidad pivotal para µ. W Util si conocemos´ σ2. X¯−µ
√S n
es una cantidad pivotal para µ.
(n−1)
σ2 S2 es una cantidad pivotal para σ2.
I.C. en la distribuci´ on normal
Intervalos de confianza de nivel 111 −−− ααα para µµµ:
(a) Con σ conocida:
I =
¯
x ∓ zα/2 σ
√n
(b) Con σ desconocida:
I =
¯
x ∓ tn−1;α/2 s
√n
Intervalo de confianza de nivel 111 −−− ααα para σσσ222: I =
"
(n − 1)s2
χ2n−1;α/2 , (n − 1)s2 χ2n−1;1−α/2
#
Ejemplo 2. Supongamos que los rendimientos de las acciones de la empresa SEGURA.SL siguen una distribuci´on normal de media µ euros y varianza σ2,
ambas desconocidas .
(b) Calcular un intervalo de confianza al 90 % para el rendimiento promedio de esta empresa.
¯
x = 1
20 (5,29 + 3,66 + · · · + 4,84) = 5,188, s2 = 1
19 (5,29 − 5,188)2 + (3,66 − 5,188)2 + · · · + (4,84 − 5,188)2
= 0,9929.
¯
x − tn−1,α/2 s
√n,x¯ + tn−1,α/2 s
√n
= (5,188 ∓ 1,729p
0,9929/10)
= (4,6432,5,7328)
I ¿Pr(µ ∈ (4,6432,5,7328))? ¿µ ∈ (4,6432,5,7328)?
Ejemplo 2.
(c) Calcular un intervalo de confianza al 90 % para la varianza del rendimiento.
s2 = 1
19 (5,29 − 5,188)2 + (3,66 − 5,188)2 + · · · + (4,84 − 5,188)2
= 0,9929.
(n − 1)s2
χ2n−1;α/2 , (n − 1)s2 χ2n−1;1−α/2
!
=
19 × 0,9929
30,14 , 19 × 0,9929 10,12
= (0,6259,1,8641)
I ¿Pr(σ2 ∈ (0,6259,1,8641)? ¿σ2 ∈ (0,6259,1,8641)? ¿1 ∈ (0,6259,1,8641)?
I.C. en muestras grandes - 1
Sean X1, X2, . . . , Xn variables aleatorias independientes siendo el tama˜no de muestra suficientemente grande (n > 30). Entonces la distribuci´on de X¯ es aproximadamente una N(µ, Sn2).
X¯−µ
√S n
es una cantidad pivotal para µ.
Intervalos de confianza de nivel 111 −−− ααα para µµµ (con n > 30):
I =
¯
x ∓ zα/2 s
√n
Ejemplo 3. Aplicar el resultado anterior para obtener un intervalo de confianza de una proporci´on.
Ejemplo 4. Un partido pol´ıtico pretende conocer la intenci´on de voto de cara a las pr´oximas elecciones. Para ello encarga un sondeo sobre un total de 230 personas, de las que 69 contestan que le votar´ıan.
a) Hallar un intervalo de confianza al 90 % para la verdadera proporci´on poblacional, indicando las hip´otesis asumidas.
pb= 23069 = 0,3.
α = 0,1 ⇒ α2 = 0,05 ⇒ zα
2 = 1,645.
Hip´otesis asumidas: M.A.S de una Bernoulli(p), y n grande.
pb± zα
2
q
p(1−b p)b
n = 0,3 ± 1,645 × 0,0302 = 0,3 ± 0,049679.
I Con lo que el intervalo resultante es (0,2503,0,3497).
b) Si el intervalo result´o ser (0,243,0,357), ¿cu´al fue el nivel de confianza elegido?
La longitud del intervalo = 0,357 − 0,243 = 0,114.
0,114 = 2zα
2
q0,3×(1−0,3)
230 ⇒ zα
2 = 1,8874
α
2 = 1 − 0,9706 ⇒ 1 − α = 0,9412.
I Se trata de un intervalo al 94,12 %.
Cantidades pivotales en dos poblaciones con distribuci´ on normal
Proposici´on 1: Sean X1, X2, . . . , Xn v.a. i.i.d. N(µ1, σ12) e Y1, Y2, . . . , Ym v.a. i.i.d. N(µ2, σ22) e independientes entre si. Entonces:
(i) X¯−rY¯−(µ1−µ2)
σ2 n1+σ
22 m
∼ N(0,1).
(ii) Si σ1 = σ2, X¯−qY¯−(µ1−µ2) Sp2(n1+m1 )
∼ tn+m−2 donde Sp2 = (n−1)S
2
1+(m−1)S22 n+m−2 . (iii) Si σ1 6= σ2, X¯−rY¯−(µ1−µ2)
S2 n1+S
22 m
∼ tf donde f es el entero m´as pr´oximo a
(s21/n1+s22/n2)2
(s2
1/n1)2 n1−1 +(s
2
2/n2)2 n2−1
.
Cantidades pivotales en dos poblaciones con distribuci´ on normal
Corolario 1:
X¯−Y¯−(µ1−µ2) r
σ2 n1+σ
22 m
es una cantidad pivotal. W Util si conocemos´ σ1 y σ2.
X¯−Y¯−(µ1−µ2) q
Sp2
(
n1+m1)
es una cantidad pivotal. W V´alida si σ1 = σ2.X¯−Y¯−(µ1−µ2) r
S2 n1+S
22 m
es una cantidad pivotal para µ1 − µ2.
I.C. en dos poblaciones con distribuci´ on normal
Intervalos de confianza de nivel 111 −−− ααα para µµµ111 −−− µµµ222: (a) σ1 y σ2 conocidas:
I =
¯
x − y¯ ∓ zα/2 q
σ12/n + σ22/m
.
(b) σ1 y σ2 desconocidas e iguales:
I = h
¯
x − y¯ ∓ tn1+n2−2;α/2 spp
1/n + 1/mi .
(c) σ1 y σ2 desconocidas y diferentes:
I =
¯
x − y¯ ∓ tf;α/2 q
s21/n + s22/m
.
Proposici´on 1: (continuaci´on)
(iv)
S2 1 σ2 1 S2 2 σ2 2
∼ Fn−1,m−1.
Corolario 1: (continuaci´on)
S2 1 σ2 1 S2 2 σ2 2
es una cantidad pivotal para el cociente σ
2 1
σ22.
Intervalos de confianza de nivel 111 −−− ααα para σσσ121122/σ/σ/σ222222: I =
s21/s22
Fn−1,m−1;α/2
, s21
s22Fm−1,n−1;α/2
.
Ejemplo 5. Queremos ver mediante un intervalo de confianza si los pa´ıses emergentes tienen en media la misma inflaci´on que los pa´ıses desarrollados.
Para eso, tomamos la inflaci´on en 10 pa´ıses emergentes y en 10 pa´ıses desarrollados.
Desarrollados 3,99 4,07 3,70 1,79 5,30 3,47 2,39 3,33 4,14 3,11 Emergentes 4,73 5,01 5,07 4,66 4,49 4 4,33 5,14 3,15 3,46
a) Calcular un intervalo de confianza para el cociente de varianzas.
b) ¿Es posible calcular un I.C. para la diferencia de medias? ¿a qu´e conclusiones llegamos?
c) Comentar los supuestos que hay que hacer.
Ejemplo 5. a)
Comparison of Standard Deviations ---
Desarrollados Emergentes
--- Standard deviation 0.976632 0.680199
Variance 0.95381 0.462671
Df 9 9
Ratio of Variances = 2.06153 95.0% Confidence Intervals
Standard deviation of Desarrollados: [0.671762;1.78295]
Standard deviation of Emergentes: [0.467865;1.24178]
Ratio of Variances: [0.512055;8.2997]
Ejemplo 5. b)
Comparison of Means ---
95.0% confidence interval for mean of Desarrollados: [2.83036,4.22764]
95.0% confidence interval for mean of Emergentes: [3.91741,4.89059]
95.0% confidence interval for the difference between the means
assuming equal variances: -0.875 +/- 0.790708 [-1.66571,-0.0842918]
Comparison of Means ---
95.0% confidence interval for mean of Desarrollados: [2.83036,4.22764]
95.0% confidence interval for mean of Emergentes: [3.91741,4.89059]
95.0% confidence interval for the difference between the means
not assuming equal variances: -0.875 +/- 0.797578 [-1.67258,-0.0774224]
I.C. en muestras grandes - 2
Sean (X1, X2, . . . , Xn) e (Y1, Y2, . . . , Ym) variables aleatorias i.i.d. e inde- pendientes entre si, siendo los tama˜nos de muestra suficientemente grandes (n, m > 30). Entonces la distribuci´on de X¯ − Y¯ es aproximadamente una N(µ1 − µ2, S
2 1
n + S
2 2
m).
X¯−Y¯−(µ1−µ2) S2
n1+S
22 m
1/2 es una cantidad pivotal para µ1 − µ2.
Intervalos de confianza de nivel 111 −−− ααα para µµµ (con n, m > 30):
I =
"
¯
x − y¯ ∓ zα/2
rS12
n + S22 m
#
Ejemplo 6. Aplicar el resultado anterior para obtener un intervalo de confi- anza para la diferencia de dos proporciones.
Ejemplo 7. En un sondeo de opini´on llevado a cabo en el a˜no 2002 con 1000 individuos en las ciudades de Murcia y Cartagena se encontr´o que el 55 % de ellos eran favorables a la construcci´on de un nuevo aeropuerto.
Dicho sondeo se repiti´o en el a˜no 2003 tras una intensa campa˜na publicitaria, encontr´andose esta vez un 60 % de individuos favorables a esta opci´on, entre 1500 encuestados. Se pide:
a) Construir un intervalo de confianza de nivel 95 % para la proporci´on p1 de individuos favorables a la construcci´on del nuevo aeropuerto, de entre los encuestados en el a˜no 2002. ¿Podr´ıa afirmarse al nivel de significaci´on del 5 % que s´olo la mitad de los encuestados prefer´ıan un nuevo aeropuerto?
b) Planteando los supuestos necesarios, construir un intervalo de confianza al 95 % para la diferencia p2 − p1 de las proporciones de individuos favorables en los a˜nos 2003 y 2002. ¿Podr´ıa afirmarse al nivel de significaci´on del 5 % que la campa˜na publicitaria en favor de la construcci´on del nuevo aeropuerto pudo tener efecto?
a) IC(p1,95 %) = ˆp1 ± 1,96
rpˆ1(1 − pˆ1)
n1 = [0,5192, 0,5808]
Como dicho intervalo no contiene el valor p=0.5 no podemos afirmar al nivel de significaci´on del 5 % que s´olo la mitad de los encuestados eran favorables al nuevo aeropuerto.
b) Si suponemos que las muestras de encuestados en los a˜nos 2002 y 2003 son independientes, se tendr´a:
IC(p2 − p1,95 %) = ˆp2 − pˆ1 ± 1,96
rpˆ1(1 − pˆ1)
n1 + pˆ2(1 − pˆ2)
n2 =
= 0,6−0,55±1,96
r0,55(0,45)
1000 + 0,6(0,4)
1500 = 0,05±0,0396 = [0,0104,0,0896].
Como este intervalo s´olo contiene valores positivos, podemos afirmar al nivel de significaci´on del 5 % que la campa˜na publicitaria en favor del nuevo aeropuerto pudo tener efecto.
Tema 5. Intervalos de confianza
Los contenidos a desarrollar en este tema son los siguientes:
Definici´on e interpretaci´on frecuentista.
X
Intervalos de confianza para medias y varianzas en poblaciones normales:
casos de una y dos poblaciones.
X
Intervalos de confianza en muestras grandes.
X
Determinaci´on del tama˜no muestral.
C´ alculo del tama˜ no muestral
Definici´on 6. El error de una estimaci´on por intervalos de confianza de nivel 1 − α es la semiamplitud del intervalo obtenido.
Ejemplo 8. Volviendo al Ejemplo 1, supongamos que Var(X) = 25, ¿cu´al debe ser el m´ınimo tama˜no muestral para que el error de estimaci´on no sea superior a 0.5 con nivel de confianza del 95 %?
Sabemos que la semiamplitud el intervalo es: zα/2√σn. Imponemos que zα/2√σn < 0,5.
Sustituyendo los valores: 1,96√5n < 0,5.
Por tanto, 384,16 ≤ n. W nminimo = 385.
Ejemplo 9. Volviendo al Ejemplo 4
c) Si el partido quisiera un intervalo de confianza al 90 % cuya longitud no excediera de 0.15, ¿cu´al ser´ıa el tama˜no muestral necesario?
La longitud del intervalo = 2zα
2
q
p(1−b p)b n .
El intervalo de confianza alcanzar´a su longitud m´axima cuando pb= 12, de modo que calcularemos n para este caso que es el m´as desfavorable.
En ese caso, longitud = 2zα
2
q 1 4n
1 − α = 0,9 ⇒ α2 = 0,05 ⇒ zα
2 = 1,645.
0,15 = 2 × 1,645
q 1
4n ⇒ √
n = 1,6450,15 = 10,967 ⇒ n = 10,9672 = 120,28.
Por tanto se tomar´ıa n = 121.
Recapitulaci´ on
Tema 5. Intervalos de confianza
Definici´on e interpretaci´on frecuentista. W ¿Qu´e es un I.C.?
Intervalos de confianza para medias y varianzas en poblaciones normales.
Intervalos de confianza en muestras grandes.
W Ejemplos de inter´es pr´actico.
Determinaci´on del tama˜no muestral. W ¿Cuando y por qu´e?
Tema 5. Intervalos de confianza
Definici´on.
Ejemplos de intervalos de confianza.
Determinaci´on del tama˜no muestral.
¿Esta θ en el intervalo de confianza?
Tema 6. Contraste de hip´ otesis
Conceptos fundamentales.
Contrastes para la media y la varianza en poblaciones normales.
Contrastes con muestras grandes.
Relaci´on entre los intervalos de confianza y los contrastes de hip´otesis.
Determinaci´on del tama˜no muestral.