Cap´ıtulo 5
Intervalos de confianza
Como su nombre indica, el objetivo de un estad´ıstico puntual para un par´ametro desconocido de una poblaci´on, es acercarnos al verdadero valor del mismo dando un valor concreto a partir de una muestra. Dif´ıcilmente esta estimaci´on acertar´a con el valor exacto del par´ametro. No obstante, la pretensi´on de dar con dicho valor puede ser excesiva, y podemos relajarla buscando simplemente una “aproximaci´on razonable” del mismo. En esta l´ınea surgen los intervalos de confianza, para un nivel de confianza dado.
1.
Definiciones
Definici´on 1.1. Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X con funci´on de masa
Pθ (o funci´on de densidadfθ), dondeθ= (θ1� . . . � θk)∈Θ. Un estimador por intervalos de confianza de θi (al nivel de confianza 1−α), es una funci´on que a cada posible muestra x1� . . . � xN le hace corresponder un intervalo(T1� T2) = (T1(x1� . . . � xN)� T2(x1� . . . � xN)), tal que, para todo θ∈Θ:
Pθ
�
θi∈(T1� T2)
� =Pθ
�
(x1� . . . � xN) :θi ∈(T1(x1� . . . � xN)� T2(x1� . . . � xN))
�
= 1−α .
Para la construcci´on de intervalos de confianza, usaremos cantidades pivotales.
Definici´on 1.2. Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X con funci´on de masa
Pθ (o funci´on de densidad fθ), donde θ= (θ1� . . . � θk)∈Θ. Una cantidad pivotalpara θi es una funci´on C(X1� . . . � XN;θi) tal que su distribuci´on no depende de θ.
Una vez obtenida una cantidad pivotal C(X1� . . . � XN;θi), la construcci´on de un intervalo para
estimar es el siguiente:
- se eligen dos valores� c1 y c2 tales que:
Pθ
�
(x1� . . . � xN) :c1< C(X1� . . . � XN;θi)< c2
�
= 1−α .
Obs´ervese quec1 yc2 no dependen deθ, al ser C(X1� . . . � XN;θi) una cantidad pivotal.
- Despejamos θi de las desigualdades c1< C(X1� . . . � XN;θi)< c2.
Obtenemos as´ı un estimador por intervalos de confianza para θi. Obs´ervese que la cantidad pivotal
debe ser continua y mon´otona enθi.
Necesitaremos, pues, obtener cantidades pivotales, y en este cap´ıtulo describiremos la construcci´on para los modelos m´as importantes.
2.
Poblaciones normales
Sea X∼N(µ;σ), y (X1� . . . � XN) una muestra aleatoria de dicha poblaci´on. El estimador media
muestral, ¯X, tiene las siguientes propiedades:
E[ ¯X] =E[X] =µ � V[ ¯X] = V[X] N =
σ N .
Por otra parte,X1� . . . � XN son variables aleatorias independientes, todas con la misma distribuci´on,
N(µ;σ), y as´ı
¯
X ∼N(µ;σ/√N). Por otra parte, el estimador cuasi–varianza muestral
S2= 1 N −1
N
�
i=1
(Xi−E[ ¯X])2
tiene esperanza
E[S2] =σ2.
Necesitaremos conocer la distribuci´on seguida por este estad´ıstico. Se tiene la siguiente definici´on:
Definici´on 2.1. �Distribuci´on χ2) Sean Z1� . . . � Z
N variables aleatorias independientes, todas con distribuci´on N(0 ; 1). La distribuci´on χ2 de Pearson con N grados de libertad (abreviadamente χ2
N) es la distribuci´on de la variable aleatoria
N
�
i=1 Zi2.
Esta distribuci´on est´a asociada a la distribuci´on normal, y sus valores vienen dados por una tabla. Es claro que si (X1� . . . � XN) es una muestra aleatoria de una poblaci´on X ∼N(µ;σ), entonces:
N
�
i=1
(Xi−µ)2
σ2 ∼χ 2
N de manera que:
N −1 σ2 S
2 =
N
�
i=1
(Xi−X)¯ 2
σ2 =
N
�
i=1
(Xi−µ+µ−X)¯ 2
σ2
=
N
�
i=1
(Xi−µ)2
σ2 −2 ¯ X−µ
σ2
� �
(Xi−µ)
� +
N
�
i=1
( ¯X−µ)2 σ2
=
N
�
i=1
(Xi−µ)2
σ2 −2N
( ¯X−µ)2 σ2 +N
( ¯X−µ)2 σ2
=
N
�
i=1
(Xi−µ)2
σ2 −N
( ¯X−µ)2 σ2 =χ
2
N −
� ¯ X−µ σ/√N
�2 ∼χ2
N−1.
Propiedad: [Lema de Fisher] Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X con
distribuci´onN(µ; σ). Entonces:
¯
X∼N(µ;σ/√N) ; N −1 σ2 S
2
∼χ2N−1;
y, adem´as,X¯ yS2 sonindependientes.
Igual que para la distribuci´on de la cuasi–varianza de N variables aleatorias independientes con igual distribuci´on N(µ � σ), hemos introducido una nueva distribuci´on, necesitaremos las siguientes nuevas definiciones.
Definici´on 2.2. �Distribuci´on t de Student) Sean Y, X1� . . . � XN variables aleatorias indepen-dientes, todas con distribuci´on N(0 ; 1). La distribuci´on t de Student con N grados de libertad
(abreviadamentetN) es la distribuci´on de la variable aleatoria
Y �
1
N
�N i=1Xi2
= �Y 1
N χ
2
N
.
Definici´on 2.3. �Distribuci´on F de Fisher–Snedecor) Sean X1� . . . � Xm, Y1� . . . � Yn variables aleatorias independientes, todas con distribuci´onN(0 ; 1). La distribuci´on F de Fisher–Snedecor
con m y ngrados de libertad (abreviadamente Fm;n) es la distribuci´on de la variable aleatoria
1
m
�m i=1Xi2
1
n
�n i=1Yi2
= 1
mχ2m
1
nχ2n
.
2.1.
Cantidades pivotales en poblaciones normales
Recogemos, de manera resumida, las principales cantidades pivotales utilizadas para la cons-trucci´on de estimadores por intervalos de confianza, para el caso de una poblaci´on X ∼ N(µ;σ). Distinguiremos el caso de un muestra y el de dos muestras.
Cantidades pivotales para el caso de una muestra
a) Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´onX ∼N(µ;σ), conσ conocido.
Entonces:
¯ X−µ
σ/√N ∼N(0 ; 1) y es una cantidad pivotal para µ.
b) Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X ∼N(µ;σ). Entonces:
¯ X−µ
S/√N ∼ tN−1 es una cantidad pivotal para µ
N −1 σ2 S
2
Obs´ervese que si (X1� . . . � XN) es una muestra aleatoria de una poblaci´on N(µ;σ), entonces:
¯ X−µ σ/√N �
1 N−1
N −1 σ2 S
2
= X¯−µ
S/√N ∼tN−1
por definici´on de la distribuci´on tde Student conN−1 grados de libertad.
Cantidades pivotales para el caso de dos muestras
a) Sean (X1� . . . � Xm) e (Y1� . . . � Yn) muestras aleatorias independientes de las poblaciones
X∼N(µ1;σ) e Y ∼N(µ2;σ), respectivamente. Entonces: ¯
X−Y¯ −(µ1−µ2)
Sp
� 1
m +
1
n
∼tm+n−2 y es una cantidad pivotal paraµ1−µ2
donde
S2
p =
(m−1)S2
X+ (n−1)SY2
m+n−2
puede interpretarse como una ponderaci´on de las cuasi–varianzas muestrales S2
X y SY2,
correspondientes a cada una de las muestras.
b) Sean (X1� . . . � Xm) e (Y1� . . . � Yn) muestras aleatorias independientes de las poblaciones
X∼N(µ1;σ1) e Y ∼N(µ2;σ2), respectivamente. Entonces:
S2
X/σ12 S2
Y/σ22 ∼
Fm−1;n−1 y es una cantidad pivotal para σ12/σ22.
Obs´ervese que, en la situaci´on descrita para dos muestras: 1
m−1 m−1
σ2 1
S2
X
1 n−1
n−1 σ2
2 S2
Y
= S 2
X/σ12 S2
Y/σ22 ∼
Fm−1;n−1
de ah´ı la afirmaci´on del apartado b). La comprobaci´on del primer apartado excede el nivel de este curso, y no se abordar´a.
2.2.
Intervalos de confianza en poblaciones normales
Utilizando las cantidades pivotales del apartado anterior, es sencillo obtener intervalos de con-fianza para los par´ametros de una poblaci´on normal. Distinguiremos diferentes casos:
Primer caso:
Sea(X1� . . . � XN)una muestra aleatoria de una poblaci´on X∼N(µ;σ), con σ conocido.
En-tonces: �
¯ X−zα/2
σ √
N� ¯ X+zα/2
σ √
N �
es un intervalo de confianza paraµ�al nivel1−α), siendozαel valor que verificaP(Z > zα) =α,
Segundo caso:
Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X∼N(µ;σ). Entonces: a) �X¯−tN−1 ;α/2
S √
N� ¯
X+tN−1 ;α/2 S √
N �
es un intervalo de confianza paraµ�al nivel1−α), siendotN;α el valor que verifica que P(tN > tN;α) =α.
b) �(N−1)S
2
χ2
N−1 ;α/2
� (N −1)S 2
χ2
N−1 ; 1−α/2 �
es un intervalo de confianza para σ2 �al nivel 1
−α), siendo
χ2
N;αel valor que verifica: P(χ2N > χ2N;α) =α.
Tercer caso:
Sean(X1� . . . � Xm)e(Y1� . . . � Yn)muestras aleatorias independientes de dos poblaciones normales
con igual desviaci´on t´ıpica: X∼N(µ1;σ) e Y ∼N(µ2;σ), respectivamente. Entonces:
� ¯
X−Y¯ −tm+n−2 ;α/2Sp
� 1 m+
1
n�X¯ −Y¯ +tm+n−2 ;α/2Sp
� 1 m+
1 n
�
es un intervalo de confianza para la diferencia de medias,µ1−µ2 �al nivel 1−α).
Cuarto caso:
Sean(X1� . . . � Xm)e(Y1� . . . � Yn)muestras aleatorias independientes de dos poblaciones normales:
X ∼N(µ1;σ1) e Y ∼N(µ2;σ2), respectivamente. Entonces:
� S2
X/SY2
Fm−1 ;n−1 ;α/2
� S 2
X/SY2
Fm−1 ;n−1 ; 1−α/2
�
es un intervalo de confianza para la raz´on de varianzas,σ2
1/σ22 �al nivel 1−α), siendo Fm;n;α
el valor que verifica:P(Fm;n> Fm;n;α) =α.
Observaci´on:En el manejo de las tablas correspondientes a la distribuci´onFm;n, conviene tener en
cuenta la siguiente relaci´on (obs´ervese el cambio de orden en los grados de libertad): Fm;n; 1−α= Fn;1m;α.
2.3.
Ejemplos
Ejemplo 36 Una empresa fabrica bombillas cuya duraci´on en horas sigue una distribuci´onN(µ; 200). Una muestra aleatoria de 36 bombillas ha dado una vida media de 7000 horas. Constr´uyase un in-tervalo de confianza al nivel del 99 � para la vida media de las bombillas fabricadas por esa f´abrica.
Soluci´on: Tenemos una muestra de tama˜noN = 36 de una poblaci´on,X∼N(µ; 200), de varianza conocida. Usaremos la cantidad pivotal:
¯ X−µ
200/6 ∼N(0 ; 1) ;
y, paraα= 0.01, repartimos la probabilidad de manera equitativa a izquierda y derecha de la media muestral ¯x= 7000. En otras palabras, consideramos la igualdad:
P �
−c < 7000−µ 200/6 < c
�
De la tabla para unaN(0 ; 1) se tiene c=zα/2≈2.58 (puesα/2 = 0.005). Construimos el intervalo de confianza paraµ, al nivel del 99 %, despejando µen las desigualdades:
−2.58< 7000−µ
200/6 <2.58
de manera que:
µ < 7000 +200
6 2.58 =
21000 + 258
3 =
21258
3 = 7086 (de la desigualdad izquierda) µ > 7000− 200
6 2.58 =
21000−258
3 =
20742
3 = 6914 (de la desigualdad derecha)
Resumiendo, el intervalo de confianza paraµ al nivel del 99 % para la muestra dada es:
I = �
7000−200
6 2.58�7000 + 200
6 2.58 �
= (6914�7086).
Ejemplo 37 Una muestra aleatoria de 16 cigarrillos de una cierta marca tiene un contenido medio de nicotina de 1.6mg. y una desviaci´on t´ıpica de 0.7mg. Suponiendo que la variable X =“contenido de nicotina en un cigarrillo”, sigue una distribuci´on N(µ; σ), obt´engase un intervalo de confianza al 99 � del contenido medio de nicotina por cigarrillo en esa marca.
Soluci´on: En este caso se quiere estimar µ en una poblaci´on N(µ;σ), con ambos par´ametros desconocidos. Partimos de una muestra de tama˜no N = 16, con ¯x = 1.6 y cuasi–desviaci´on t´ıpica muestral
s= �
0.7216
15 ≈0.723. Sabemos que en este caso hemos de usar la cantidad pivotal:
¯ x−µ s/√N =
1.6−µ 0.723/4
que sigue una distribuci´ontde Student conN−1 = 15 grados de libertad. Para la muestra dada, el intervalo de confianza para µal nivel de confianza 1−α queda
� ¯
x−tN−1 ;α/2 s √
N�x¯+tN−1 ;α/2
s √
N �
=�1.6−t15 ;α/2 0.723
4 �1.6 +t15 ;α/2 0.723
4 �
�
siendot15 ;α/2 el valor tal que P(t15 > t15 ;α/2) = α/2. Como en nuestro caso 1−α = 0.99 entonces
α= 0.01 y as´ı, de la correspondiente tabla para la distribuci´ont de Student, obtenemos:
t15 ;α/2=t15 ; 0.005= 2.947.
El intervalo que nos piden es pues: �
1.6−t15 ;α/2 0.723
4 �1.6 +t15 ;α/2 0.723
4 �
= �1.6−2.9470.723
4 �1.6 + 2.947 0.723
4 �
Observaci´on: En este ejemplo hemos tenido que calcular la cuasi–desviaci´on t´ıpica muestral a partir de la desviaci´on t´ıpica muestral. Si seguimos el uso dado, denotando por √v la desviaci´on t´ıpica muestral, vemos que:
s √
N = �
vNN
−1
√ N =
√ v√N √
N√N −1 = √
v √
N −1
Podr´ıamos haber expresado el intervalo de confianza utilizando la desviaci´on t´ıpica muestral: �
¯
x−tN−1 ;α/2
√ v √
N−1�x¯+tN−1 ;α/2
√ v √
N−1� �
pero no usaremos esta expresi´on, para no liar la notaci´on. Tan s´olo hemos de tener cuidado al tomar los datos del problema.
Ejemplo 38 Una muestra aleatoria de una poblaci´on N(µ; σ) ha dado los diez valores siguientes
6.9 ; 5.7 ; 8.4 ; 9.3 ; 7.2 ; 8.5 ; 7.4 ; 9.1 ; 6.5 ; 7.6.
Constr´uyase un intervalo de confianza de σ2 al 95 � .
Soluci´on: Estamos ante una poblaci´on N(µ; σ) de la que desconocemos ambos par´ametros. Para estimar por intervalos de confianza σ2 usaremos la cantidad pivotal
N−1 σ2 S
2
que sabemos sigue una distribuci´on χ2 con N −1 grados de libertad. As´ı, de la muestra dada, tan s´olo usaremos la cuasi–varianza muestral:
S2= 1 N −1
N
�
i=1
(Xi−X)¯ 2.
Los siguientes c´alculos dan con ella:
¯
x = 76.6
10 = 7.66 varianza muestral: v = 1
10(6.9
2+5.72+8.42+9.32+7.22+8.52+7.42+9.12+6.52+7.62)
−7.662
= 598.82
10 −58.6756 = 59.882−58.6756 = 1.2064 s2 = v10
9 =
12.064
9 ≈1.34. Para construir el intervalo pedido
�(N −1)s2 χ2
N−1 ;α/2
� (N−1)s 2
χ2
N−1 ; 1−α/2
�
hemos de calcularχ2
N−1 ;α/2 yχ
2
N−1 ; 1−α/2, con N−1 = 9,α/2 = (1−0.95)/2 = 0.025. Estos valores
son, respectivamente:
χ2
9 ; 0.025= 19.023 ; χ29 ; 1−0.025=χ
2
9 ; 0.975= 2.7.
Sustituyendo en la expresi´on del intervalo de confianza para estimarσ2 al nivel pedido, se obtiene: �
9·1.34 19.023�
9·1.34 2.7
�
≈(0.634�4.467)�
Ejemplo 39 Se ha ofrecido a un grupo de estudiantes elegir entre dar o no una hora complementaria de clase semanal. El examen final fue el mismo para todos los estudiantes. Del curso normal (sin clase extra), 15 alumnos obtuvieron una puntuaci´on media de 76 con desviaci´on t´ıpica 6, y 28 del curso con hora complementaria una puntuaci´on media de 84 con desviaci´on t´ıpica 5. Obt´engase un intervalo de confianza al 90 � de la diferencia de puntuaciones medias, suponiendo que las poblaciones son normales de varianzas iguales.
Soluci´on: En las condiciones dadas es aplicable el intervalo �
¯
X−Y¯ −tm+n−2 ;α/2Sp
� 1 m +
1
n�X¯ −Y¯ +tm+n−2 ;α/2Sp
� 1 m +
1 n
�
con
m= 15 ; ¯x= 76 ; s2X = 62
15 14 =
540 14 n= 28 ; ¯y= 84 ; s2Y = 52
28 27 =
700 27 y
s2
p =
(m−1)s2
X+ (n−1)s2Y
m+n−2
= 14 540
14 + 27 700
27 15 + 28−2 =
1240 41
Sustituyendo α = 1−0.9 = 0.1, obtenemos, de la tabla para una distribuci´on t de Student con 15 + 28−2 = 41 grados de libertad1:
t41 ;α/2=t41 ; 0.05 ≈1.684
En definitiva, el intervalo de confianza paraσ2 al 90 %, dadas las dos muestras, es: �
76−84−1.684 �
1240 41
�
28 + 15
28·15 �76−84 + 1.684 �
1240 41
�
28 + 15 28·15
�
= �
−6−1.684 �
1240·43
41·28·15�−6 + 1.684 �
1240·43 41·28·15
�
=�−6−1.684 �
62·43
41·21�−6 + 1.684 �
62·43 41·21
�
≈(−8.9633�−3.0367).
Ejemplo 40 En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos pobla-ciones aisladas, A1 y A2, se obtuvieron los siguientes datos:
N1 = 13 x1¯ = 4 s1 = 3 N2 = 11 x2¯ = 5 s2 = 2.2.
Suponiendo que el tiempo de desarrollo en la poblaci´on Ai sigue una distribuci´on N(µi;σi), para
i= 1�2, obtener un intervalo de confianza para el cociente de varianzas al nivel 0.80 .
Soluci´on: Un intervalo de confianza para el cocienteσ12/σ22, al nivel 0.80 = 1−α conα = 0.2, ser´a: �
S2 1/S22 FN1−1 ;N2−1 ; 0.1
� S
2 1/S22 FN1−1 ;N2−1 ; 0.9
�
De los datos dados, se obtiene de la correspondiente tabla (α/2 = 0.1):
F12 ; 10 ; 0.1 = 2.2841 ; y: F12 ; 10 ; 0.9= 1 F10 ; 12 ; 0.1
= 1
2.1878 ≈0.4571.
El intervalo queda: �
32/2.22 2.2841 �
32/2.22 1/2.1878
�
≈(0.8141�4.0682).
3.
Otras poblaciones
Cuando la muestra se obtiene de poblaciones con distribuci´on Bernoulli, o de Poisson, usaremos intervalos de confianza asint´oticos, para ponernos en la situaci´on anterior. Para ello las cantidades pivotales utilizadas tendr´an una distribuci´on l´ımite (cuando N → ∞) independiente de par´ametros desconocidos.
Intervalos de confianza para una distribuci´on de Bernoulli
Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X ∼B(1 ; p). Entonces:
� ¯ X−zα/2
� �
p(1−�p)
N �X¯ +zα/2 �
� p(1−p)�
N �
es un intervalo de confianza para p �al nivel 1−α), siendo p�= ¯X =“frecuencia relativa de ´exitos”.
Estamos utilizando la siguiente cantidad pivotal asint´otica:
¯ X−p �
�
p(q−p)/N� ∼N(0 ; 1) (aproximadamente, para N grande).
Intervalos de confianza para una distribuci´on de Poisson
Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X ∼Poisson(λ). Entonces:
�¯ X−zα/2
� �
λ/N �X¯ +zα/2 �
� λ/N�
es un intervalo de confianza paraλ�al nivel 1−α), siendo�λ= ¯X.
En este caso, la cantidad pivotal asint´otica es:
¯ X−λ �
� λ/N
4.
M´ınimo tama˜
no muestral
Un problema muy relacionado con la construcci´on de intervalos de confianza es el de determinar el m´ınimo tama˜no muestral necesario para obtener una determinadaprecisi´onen nuestra estimaci´on. Es decir, cu´antos elementos tenemos que observar, al menos, para que el error cometido con la estimaci´on no supere cierta cantidad.
Definici´on 4.1. El error de una estimaci´on por intervalos de confianza (al nivel 1−α) es la semi– amplitud del intervalo obtenido.
Ejemplo 41 Determinar el m´ınimo tama˜no muestral de una poblaci´on N(µ;σ = 5), para que el error de la estimaci´on por intervalos de confianza para µal 95 �, no sea superior a 0.5.
Soluci´on: Estimaremosµ mediante un intervalo de confianza de la forma: �
¯ X−zα/2
σ √
N � ¯ X+zα/2
σ √
N �
con lo cual el error cometido ser´a
Error =zα/2 σ √
N .
Siendoα = 1−0.95 = 0.05, α/2 = 0.025y σ= 5, se quiere obtener el m´ınimo valor de N para que:
z0.025 5 √
N = 1.96 5 √
N ≤0.5 de donde: N ≥
�5·1.96 0.5
�2
= 19.62= 384.16.
Es decir, necesitaremos observar 385 elementos para conseguir la precisi´on deseada (error≤0.5) para esa estimaci´on.
Para otros intervalos, un c´alculo similar nos llevar´ıa a determinar, en cada caso, el m´ınimo ta-ma˜no muestral. T´engase en cuenta que este m´ınimo tama˜no muestral ha de tomarse como un valor orientativo. As´ı, si obtenemos, para determinada precisi´on, un m´ınimo tama˜no muestral de 196, en-tenderemos que debemos observar alrededor de 200 elementos. Esto es esencial, sobre todo en los casos en que el m´ınimo tama˜no muestral depende de la muestra concreta obtenida.
5.
Intervalos de confianza m´
as frecuentes
Recogemos por ´ultimo, los intervalos de confianza antes obtenidos, y alg´un otro, en una lista esquem´atica. Se utiliza la siguiente notaci´on
(X1� . . . � Xn) muestra aleatoria (m.a.) de X.
¯ x= 1
n
n
�
i=1
xi� s2=
1 n−1
n
�
i=1
1. X ∼N(µ� σ)
Intervalo de confianza 1−α paraµ: I = � ¯ x±zα/2
σ √n � σ conocida I = � ¯
x±tn−1;α/2
s √n
�
σ desconocida
Intervalo de confianza 1−α paraσ2:I = �
(n−1)s2 χ2
n−1;α/2
� (n−1)s 2
χ2
n−1;1−α/2 �
2. X ∼B(1� p) (muestras grandes).
Intervalo de confianza 1−α parap:I = �
¯ x±zα/2
� ¯ x(1−x)¯
n �
3. X ∼P(λ) (muestras grandes).
Intervalo de confianza 1−α paraλ:I = �
¯ x±zα/2
� ¯ x n
�
4. Dos poblaciones Normales independientes X ∼N(µ1� σ1), Y ∼N(µ2� σ2) independientes (X1� . . . � Xn1) m.a. de X; se calcula ¯x ys
2 1. (Y1� . . . � Yn2) m.a. de Y; se calcula ¯y ys22.
s2p=
(n1−1)s2
1+ (n2−1)s22 n1+n2−2
Intervalo de confianza 1−α paraµ1−µ2:
I = �
¯x−y¯±zα/2 � σ2 1 n1 + σ2 2 n2
σ1,σ2 conocidas
I = �
¯
x−y¯±tn1+n2−2;α/2 sp
� 1 n1 + 1 n2 �
σ1� σ2 desconocidas,σ1=σ2
I = �
¯x−y¯±tf;α/2 � s2 1 n1 + s2 2 n2
σ1� σ2 desconocidas,σ1�=σ2
dondef = entero m´as pr´oximo a (s 2
1/n1+s22/n2)2 �s2
1/n1)2
n1+1 + �s2
2/n2)2
n2+1 −2
Intervalo de confianza 1−α paraσ12/σ22:I = �
s2 1/s22 Fn1−1;n2−1;α/2
� (s21/s22)Fn2−1;n1−1;α/2
5. Comparaci´on de proporciones (muestras grandes e independientes) X ∼B(1� p1), Y ∼B(1� p2), independientes.
(X1� . . . � Xn1) m.a. de X; se calcula ¯x ys 2 1. (Y1� . . . � Yn2) m.a. de Y; se calcula ¯y ys22.
Intervalo de confianza 1−α parap1−p2:I = �
x¯−y¯±zα/2 �
¯
x(1−x)¯ n1 +
¯
y(1−y)¯ n2
6. Datos emparejados
(X� Y)∼Normal bivariante (µ1� µ2� σ1� σ2� ρ). (X1� Y1)� . . . �(Xn� Yn) m.a. de (X� Y).
D=X−Y ∼N�µ=µ1−µ2� σ= �
σ2
1+σ22−2ρ σ1σ2 �
(D1� . . . � Dn) m.a. de D, dondeDi =Xi−Yi.
Problemas
1. En una poblaci´on se desea conocer la probabilidad de que un individuo sea al´ergico al polen de las acacias. En 100 individuos tomados al azar se observaron 10 al´ergicos. Hallar el intervalo de confianza al 95 % para la probabilidad pedida. ¿Cu´antos individuos se deber´ıan observar para que, con el mismo nivel de confianza, el error m´aximo en la estimaci´on de la proporci´on de al´ergicos sea del 0.01?
2. Se supone que el n´umero de erratas por p´agina en un libro sigue una distribuci´on de Poisson. Elegidas al azar 95 p´aginas, se obtuvieron los siguientes resultados:
N´umero de erratas 0 1 2 3 4 5 N´umero de p´aginas 40 30 15 7 2 1
Hallar el intervalo de confianza al 90 % para el n´umero medio de erratas por p´agina en todo el libro.
3. Se mide el tiempo de duraci´on (en segundos) de un proceso qu´ımico realizado 20 veces en condi-ciones similares, obteni´endose los siguientes resultados:
28�25�32� 25�28�26�31�29�26�26�23�18� 20�16�24�17�22�23�25�21.
Suponiendo que la duraci´on sigue una distribuci´on Normal, hallar los intervalos de confianza al 90 % para ambos par´ametros.
4. La vida activa (en d´ıas) de cierto f´armaco sigue una distribuci´onN(1200 ; 40). Se desea enviar un lote de este f´armaco de manera que la vida media del lote no sea inferior a 1180 d´ıas, con probabilidad 0.95. Hallar el tama˜no del lote.
5. Una noticia en el peri´odico dice que, de 1000 personas encuestadas sobre una cuesti´on, 556 se muestran a favor y 444 en contra, y concluye afirmando que el 55.6 % de la poblaci´on se muestra a favor, con un margen de error de±3 %. ¿Cu´al es el nivel de confianza de esta afirmaci´on? 6. Se quiere estudiar la proporci´on p de declaraciones de la renta con alg´un defecto. En una
muestra preliminar peque˜na (muestra piloto) de tama˜no 50 se han observado 22 declaraciones defectuosas. ¿Cu´al es el tama˜no muestral necesario para estimarpcometiendo un error m´aximo de 0.01 con una probabilidad 0.99?
7. En una gran zona ganadera se desea estimar la proporci´on de ovejas que sufren cierta enferme-dad degenerativa. Calcular el tama˜no muestral necesario para estimar esta proporci´on con un error menor que 0.03 a un nivel de confianza del 0.95, sabiendo que, en una peque˜na muestra preliminar, se seleccionaron 30 ovejas, de las cuales 2 resultaron padecer la enfermedad. 8. En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones
aisladas,A1 y A2, se obtuvieron los siguientes datos: N1= 13 x1¯ = 4 s1= 3 N2= 11 x2¯ = 5 s2= 2.2.
Suponiendo que el tiempo de desarrollo en la poblaci´on Ai sigue una distribuci´on N(µi;σi),
parai= 1�2, se pide:
a) Hallar un intervalo de confianza para el cociente de varianzas al nivel 0.80 .
b) Obtener un intervalo de confianza paraµ1−µ2, con nivel de confianza 0.95 .
9. Para construir un intervalo de confianza de la media poblacional de unaN(µ;σ) conσconocida, se ha utilizado una muestra de tama˜no ny se ha obtenido el intervalo del 95 %. ¿C´omo ha de ser modificado el tama˜no de la muestra para obtener el mismo intervalo con una confianza del 99 %?
10. Una f´abrica elabora dos art´ıculos A y B, cuya demanda aleatoria sigue una distribuci´on normal de medias µA yµB desconocidas, y desviaciones t´ıpicas σA = 100 y σB = 50. Observados 100
puntos de venta, la demanda media de dichos art´ıculos ha resultado de 200 y 150 unidades, respectivamente. Constr´uyase un intervalo de confianza al 95 % para la diferencia de medias. 11. En una muestra aleatoria de 500 familias propietarias de televisor en una gran ciudad, se
com-prob´o que 280 se hab´ıan suscrito a cierto canal de televisi´on. Obt´engase un intervalo de confianza del 95 % de la proporci´on real de familias con televisor suscritas a dicho canal en esa ciudad. 12. Una m´aquina produce engranajes cuyo di´ametro, debido a imperfecciones inherentes al
funcio-namiento de la m´aquina, es una variable aleatoria con distribuci´on N(µ;σ = 0.03), de forma queµ puede ser fijada a voluntad mediante un reglaje de la m´aquina. Para que un engranaje sea utilizable, su di´ametro debe estar comprendido entre 15.50 y 15.60 mm. Calc´ulese:
a) el valor deµque hace m´axima la proporci´on de engranajes utilizables y dicha proporci´on m´axima.
b) el tama˜no n de la muestra de engranajes necesario para poder construir, a partir de la media muestral ¯x, un intervalo de confianza deµal 95 % de amplitud menor que 0.02 mm.
13. De una poblaci´on normal de mediaµdesconocida se selecciona una muestra de tama˜non= 10, resultando: 40, 45, 39, 46, 58, 52, 50, 45, 57, 49 .
Constr´uyase un intervalo de confianza al 95 % para el par´ametroµ, suponiendo que:
a) la varianza poblacional esσ2 = 49;
b) la varianza poblacional es desconocida.
14. Sabiendo que X sigue una distribuci´on N(µ;σ = 4), calc´ulese el tama˜no muestral m´ınimo para que, con una confianza del 99 %, el intervalo (¯x−1.5�x¯+ 1.5) contenga al par´ametro µ. 15. El di´ametro (en cent´ımetros) de diez piezas met´alicas de forma esf´erica, seleccionadas al azar
de la producci´on de una m´aquina, result´o
2.02, 1.98, 2.04, 1.99, 2.05, 2.00, 2.02, 2.00, 1.98, 2.03 .
a) Suponiendo que el di´ametro sigue una distribuci´on normal, constr´uyase un intervalo de confianza al 95 % del di´ametro medio de las piezas producidas por esta m´aquina.
b) ¿Cu´al deber´a ser el tama˜no muestral m´ınimo si, a este nivel de confianza, se pretende dar un intervalo de estimaci´on cuya amplitud no supere los 0.02 cm?
16. Con objeto de decidir si un nuevo proceso de fabricaci´on da mejores resultados que el antiguo, en cuanto a la proporci´on de elementos defectuosos, se selecciona una muestra de 1000 elementos del nuevo proceso, y otra de 2000 del antiguo, resultando 40 y 140 elementos defectuosos, respectivamente.
a) Obt´engase un intervalo de confianza al 95 % para la diferencia de proporciones de elementos defectuosos de ambos procesos.
17. Se desea conocer la probabilidad de que una pieza falle en los cinco primeros a˜nos de funciona-miento. En 100 piezas tomadas al azar se observaron 10 fallos. Halla el intervalo de confianza de nivel 0.95 para la probabilidad pedida. ¿Cu´antas piezas se deber´ıan observar para que, con el mismo nivel de confianza, el margen de error en la estimaci´on de la proporci´on de fallos sea de±0.01?
18. En una poblaci´on, la altura de los individuos varones sigue una distribuci´on N(µ;σ = 7.5). Halla el tama˜no de la muestra para estimarµ con un margen de error inferior a ±2 cm. para un nivel de confianza 0.90.
19. En una explotaci´on minera, las rocas excavadas se someten a un an´alisis qu´ımico para deter-minar su contenido porcentual de cadmio. Se puede suponer que este contenido es una variable con distribuci´on normal de media µ y varianza σ2. Despu´es de analizar 25 rocas se obtiene un contenido porcentual medio de 9.77 con una cuasidesviaci´on t´ıpica de 3.164. La explota-ci´on comercial de este mineral es econ´omicamente rentable si el contenido medio en la mina es superior al 8 %.
a) Construye un intervalo de confianza de nivel 95 % para el contenido porcentual medio de cadmio en la mina.
b) Otro indicador de la calidad de la mina es la uniformidad de su contenido mineral medida a trav´es de la varianzaσ, que debe ser menor al 3 %. Construye un intervalo de confianza de nivel 95 % paraσ2.
20. Como parte de un estudio para la reducci´on de los gases de efecto invernadero que emiten los coches, se estudian los efectos de un determinado aditivo que reduce las emisiones. SeaX el n´umero de kil´ometros recorridos por un coche con un litro de gasolina sin el aditivo. Sea Y el n´umero de kil´ometros recorridos con un litro de gasolina con el aditivo. Se observan los kil´ometros recorridos por litro de gasolina en ocho coches, cuatro de ellos sin aditivo. Los datos que se obtienen son:
4 �
i=1
xi = 25.4
4 �
i=1
yi = 31.2
4 �
i=1 x2
i = 173.53
4 �
i=1 y2
i = 261.22
a) Suponiendo que el aditivo puede cambiar la media pero no la varianza, y especificando las hip´otesis necesarias, calcula un intervalo de confianza al 95 % para la diferencia de medias.
b) A la vista del intervalo obtenido ena), ¿hay alguna indicaci´on de que el aditivo tiene alg´un efecto en el n´umero de kil´ometros recorridos por litro de gasolina?