Intervalos confianza

(1)

Cap´ıtulo 5

Intervalos de conﬁanza

Como su nombre indica, el objetivo de un estad´ıstico puntual para un parámetro desconocido de una población, es acercarnos al verdadero valor del mismo dando un valor concreto a partir de una muestra. Dif´ıcilmente esta estimación acertará con el valor exacto del parámetro. No obstante, la pretensión de dar con dicho valor puede ser excesiva, y podemos relajarla buscando simplemente una “aproximación razonable” del mismo. En esta l´ınea surgen los intervalos de confianza, para un nivel de confianza dado.

1. Deﬁniciones

Definición 1.1. Sea (X1� . . . � XN) una muestra aleatoria de una población X con función de masa

Pθ (o función de densidadfθ), dondeθ= (θ1� . . . � θk)∈Θ. Un estimador por intervalos de confianza de θi (al nivel de confianza 1−α), es una función que a cada posible muestra x1� . . . � xN le hace corresponder un intervalo(T1� T2) = (T1(x1� . . . � xN)� T2(x1� . . . � xN)), tal que, para todo θ∈Θ:

Pθ

�

θi∈(T1� T2)

� =Pθ

�

(x1� . . . � xN) :θi ∈(T1(x1� . . . � xN)� T2(x1� . . . � xN))

�

= 1₋α .

Para la construcci´on de intervalos de conﬁanza, usaremos cantidades pivotales.

Definición 1.2. Sea (X1� . . . � XN) una muestra aleatoria de una población X con función de masa

Pθ (o función de densidad fθ), donde θ= (θ1� . . . � θk)∈Θ. Una cantidad pivotalpara θi es una función C(X1� . . . � XN;θi) tal que su distribución no depende de θ.

Una vez obtenida una cantidad pivotal C(X1� . . . � XN;θi), la construcci´on de un intervalo para

estimar es el siguiente:

- se eligen dos valores� c1 y c2 tales que:

Pθ

�

(x1� . . . � xN) :c1< C(X1� . . . � XN;θi)< c2

�

= 1₋α .

Obs´ervese quec1 yc2 no dependen deθ, al ser C(X1� . . . � XN;θi) una cantidad pivotal.

- Despejamos θi de las desigualdades c1< C(X1� . . . � XN;θi)< c2.

Obtenemos as´ı un estimador por intervalos de conﬁanza para θi. Obs´ervese que la cantidad pivotal

debe ser continua y mon´otona enθi.

Necesitaremos, pues, obtener cantidades pivotales, y en este cap´ıtulo describiremos la construcci´on para los modelos m´as importantes.

(2)

2. Poblaciones normales

Sea X∼N(µ;σ), y (X1� . . . � XN) una muestra aleatoria de dicha poblaci´on. El estimador media

muestral, ¯X, tiene las siguientes propiedades:

E[ ¯X] =E[X] =µ � V[ ¯X] = V[X] N =

σ N .

Por otra parte,X1� . . . � XN son variables aleatorias independientes, todas con la misma distribuci´on,

N(µ;σ), y as´ı

¯

X ∼N(µ;σ/√N). Por otra parte, el estimador cuasi–varianza muestral

S2= 1 N ₋1

N

�

i=1

(Xi−E[ ¯X])2

tiene esperanza

E[S2_{] =}_σ2_.

Necesitaremos conocer la distribución seguida por este estad´ıstico. Se tiene la siguiente definición:

Definición 2.1. �Distribución χ2₎ _Sean _{Z1� . . . � Z}

N variables aleatorias independientes, todas con distribuci´on N(0 ; 1). La distribuci´on χ2 _{de Pearson} _con _N _{grados de libertad (abreviadamente} χ2

N) es la distribuci´on de la variable aleatoria

N

�

i=1 Zi2.

Esta distribución está asociada a la distribución normal, y sus valores vienen dados por una tabla. Es claro que si (X1� . . . � XN) es una muestra aleatoria de una población X ∼N(µ;σ), entonces:

N

�

i=1

(Xi−µ)2

σ2 ∼χ 2

N de manera que:

N ₋1 σ2 S

2 ₌

N

�

i=1

(Xi−X)¯ 2

σ2 =

N

�

i=1

(Xi−µ+µ−X)¯ 2

σ2

=

N

�

i=1

(Xi−µ)2

σ2 −2 ¯ X−µ

σ2

� �

(Xi−µ)

� +

N

�

i=1

( ¯X−µ)2 σ2

=

N

�

i=1

(Xi−µ)2

σ2 −2N

( ¯X−µ)2 σ2 +N

( ¯X−µ)2 σ2

=

N

�

i=1

(Xi−µ)2

σ2 −N

( ¯X₋µ)2 σ2 =χ

2

N −

� _¯ X₋µ σ/√N

�2 ∼χ2

N−1.

(3)

Propiedad: _{[Lema de Fisher]} _Sea _{(X1� . . . � X}_N₎ _{una muestra aleatoria de una poblaci´on} _X _con

distribuci´onN(µ; σ). Entonces:

¯

X_∼N(µ;σ/√N) ; N −1 σ2 S

2

∼χ2_N₋₁;

y, adem´as,X¯ yS2 _son_{independientes}_.

Igual que para la distribución de la cuasi–varianza de N variables aleatorias independientes con igual distribución N(µ � σ), hemos introducido una nueva distribución, necesitaremos las siguientes nuevas definiciones.

Definición 2.2. �Distribución t de Student) Sean Y, X1� . . . � XN variables aleatorias indepen-dientes, todas con distribución N(0 ; 1). La distribución t de Student _con _N _{grados de libertad}

(abreviadamentetN) es la distribuci´on de la variable aleatoria

Y �

1

N

�N i=1Xi2

= �Y 1

N χ

2

N

.

Definición 2.3. �Distribución F de Fisher–Snedecor) Sean X1� . . . � Xm, Y1� . . . � Yn variables aleatorias independientes, todas con distribuciónN(0 ; 1). La distribución F de Fisher–Snedecor

con m y ngrados de libertad (abreviadamente Fm;n) es la distribuci´on de la variable aleatoria

1

m

�m i=1Xi2

1

n

�n i=1Yi2

= 1

mχ2m

1

nχ2n

.

2.1. Cantidades pivotales en poblaciones normales

Recogemos, de manera resumida, las principales cantidades pivotales utilizadas para la cons-trucción de estimadores por intervalos de confianza, para el caso de una población X _∼ N(µ;σ). Distinguiremos el caso de un muestra y el de dos muestras.

Cantidades pivotales para el caso de una muestra

a) Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´onX ∼N(µ;σ), conσ conocido.

Entonces:

¯ X−µ

σ/√N ∼N(0 ; 1) y es una cantidad pivotal para µ.

b) Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X ∼N(µ;σ). Entonces:

¯ X−µ

S/√N ∼ tN−1 es una cantidad pivotal para µ

N −1 σ2 S

2

(4)

Obs´ervese que si (X1� . . . � XN) es una muestra aleatoria de una poblaci´on N(µ;σ), entonces:

¯ X−µ σ/√N �

1 N₋1

N −1 σ2 S

2

= X¯−µ

S/√N ∼tN−1

por definición de la distribución tde Student conN₋1 grados de libertad.

Cantidades pivotales para el caso de dos muestras

a) Sean (X1� . . . � Xm) e (Y1� . . . � Yn) muestras aleatorias independientes de las poblaciones

X∼N(µ1;σ) e Y ∼N(µ2;σ), respectivamente. Entonces: ¯

X−Y¯ −(µ1−µ2)

Sp

� 1

m +

1

n

∼tm+n−2 y es una cantidad pivotal paraµ1−µ2

donde

S2

p =

(m₋1)S2

X+ (n−1)SY2

m+n−2

puede interpretarse como una ponderaci´on de las cuasi–varianzas muestrales S2

X y SY2,

correspondientes a cada una de las muestras.

b) Sean (X1� . . . � Xm) e (Y1� . . . � Yn) muestras aleatorias independientes de las poblaciones

X_∼N(µ1;σ1) e Y _∼N(µ2;σ2), respectivamente. Entonces:

S2

X/σ12 S2

Y/σ22 ∼

Fm−1;n−1 y es una cantidad pivotal para σ12/σ22.

Obs´ervese que, en la situaci´on descrita para dos muestras: 1

m₋1 m₋1

σ2 1

S2

X

1 n₋1

n−1 σ2

2 S2

Y

= S 2

X/σ12 S2

Y/σ22 ∼

Fm−1;n−1

de ah´ı la afirmación del apartado b). La comprobación del primer apartado excede el nivel de este curso, y no se abordará.

2.2. Intervalos de conﬁanza en poblaciones normales

Utilizando las cantidades pivotales del apartado anterior, es sencillo obtener intervalos de con-fianza para los parámetros de una población normal. Distinguiremos diferentes casos:

Primer caso:

Sea(X1� . . . � XN)una muestra aleatoria de una poblaci´on X∼N(µ;σ), con σ conocido.

En-tonces: _�

¯ X−zα/2

σ √

N� ¯ X+zα/2

σ √

N �

es un intervalo de conﬁanza paraµ�al nivel1₋α), siendozαel valor que veriﬁcaP(Z > zα) =α,

(5)

Segundo caso:

Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X∼N(µ;σ). Entonces: a) �X¯₋tN−1 ;α/2

S √

N� ¯

X+tN−1 ;α/2 S √

N �

es un intervalo de conﬁanza paraµ�al nivel1₋α), siendotN;α el valor que veriﬁca que P(tN > tN;α) =α.

b) �(N−1)S

2

χ2

N−1 ;α/2

� (N −1)S 2

χ2

N−1 ; 1−α/2 �

es un intervalo de conﬁanza para σ2 _{�al nivel} ₁

−α), siendo

χ2

N;αel valor que veriﬁca: P(χ2N > χ2N;α) =α.

Tercer caso:

Sean(X1� . . . � Xm)e(Y1� . . . � Yn)muestras aleatorias independientes de dos poblaciones normales

con igual desviaci´on t´ıpica: X∼N(µ1;σ) e Y ∼N(µ2;σ), respectivamente. Entonces:

� ¯

X−Y¯ −tm+n−2 ;α/2Sp

� 1 m+

1

n�X¯ −Y¯ +tm+n−2 ;α/2Sp

� 1 m+

1 n

�

es un intervalo de conﬁanza para la diferencia de medias,µ1−µ2 �al nivel 1−α).

Cuarto caso:

Sean(X1� . . . � Xm)e(Y1� . . . � Yn)muestras aleatorias independientes de dos poblaciones normales:

X ∼N(µ1;σ1) e Y ∼N(µ2;σ2), respectivamente. Entonces:

� S2

X/SY2

Fm−1 ;n−1 ;α/2

� S 2

X/SY2

Fm−1 ;n−1 ; 1−α/2

�

es un intervalo de conﬁanza para la raz´on de varianzas,σ2

1/σ22 �al nivel 1−α), siendo Fm;n;α

el valor que veriﬁca:P(Fm;n> Fm;n;α) =α.

Observaci´on:En el manejo de las tablas correspondientes a la distribuci´onFm;n, conviene tener en

cuenta la siguiente relaci´on (obs´ervese el cambio de orden en los grados de libertad): Fm;n; 1−α= _Fn;1m;α.

2.3. Ejemplos

Ejemplo 36 Una empresa fabrica bombillas cuya duración en horas sigue una distribuciónN(µ; 200). Una muestra aleatoria de 36 bombillas ha dado una vida media de 7000 horas. Constrúyase un in-tervalo de confianza al nivel del 99 � para la vida media de las bombillas fabricadas por esa fábrica.

Soluci´on: _{Tenemos una muestra de tama˜}_no_N _{= 36 de una poblaci´on,}_X_∼_N_(µ_{; 200), de varianza} conocida. Usaremos la cantidad pivotal:

¯ X₋µ

200/6 ∼N(0 ; 1) ;

y, paraα= 0.01, repartimos la probabilidad de manera equitativa a izquierda y derecha de la media muestral ¯x= 7000. En otras palabras, consideramos la igualdad:

P �

−c < 7000−µ 200/6 < c

�

(6)

De la tabla para unaN(0 ; 1) se tiene c=zα/2≈2.58 (puesα/2 = 0.005). Construimos el intervalo de conﬁanza paraµ, al nivel del 99 %, despejando µen las desigualdades:

−2.58< 7000−µ

200/6 <2.58

de manera que:

µ < 7000 +200

6 2.58 =

21000 + 258

3 =

21258

3 = 7086 (de la desigualdad izquierda) µ > 7000₋ 200

6 2.58 =

21000−258

3 =

20742

3 = 6914 (de la desigualdad derecha)

Resumiendo, el intervalo de conﬁanza paraµ al nivel del 99 % para la muestra dada es:

I = �

7000₋200

6 2.58�7000 + 200

6 2.58 �

= (6914�7086).

Ejemplo 37 Una muestra aleatoria de 16 cigarrillos de una cierta marca tiene un contenido medio de nicotina de 1.6mg. y una desviación t´ıpica de 0.7mg. Suponiendo que la variable X =“contenido de nicotina en un cigarrillo”, sigue una distribución N(µ; σ), obténgase un intervalo de confianza al 99 � del contenido medio de nicotina por cigarrillo en esa marca.

Solución: _{En este caso se quiere estimar} _µ _{en una población} _N_(µ_;_{σ), con ambos parámetros} desconocidos. Partimos de una muestra de tamaño N = 16, con ¯x = 1.6 y cuasi–desviación t´ıpica muestral

s= �

0.7216

15 ≈0.723. Sabemos que en este caso hemos de usar la cantidad pivotal:

¯ x−µ s/√N =

1.6−µ 0.723/4

que sigue una distribucióntde Student conN−1 = 15 grados de libertad. Para la muestra dada, el intervalo de confianza para µal nivel de confianza 1₋α queda

� ¯

x−tN−1 ;α/2 s √

N�x¯+tN−1 ;α/2

s √

N �

=�1.6−t15 ;α/2 0.723

4 �1.6 +t15 ;α/2 0.723

4 �

�

siendot15 ;α/2 el valor tal que P(t15 > t15 ;α/2) = α/2. Como en nuestro caso 1−α = 0.99 entonces

α= 0.01 y as´ı, de la correspondiente tabla para la distribuci´ont de Student, obtenemos:

t15 ;α/2=t15 ; 0.005= 2.947.

El intervalo que nos piden es pues: �

1.6₋t15 ;α/2 0.723

4 �1.6 +t15 ;α/2 0.723

4 �

= �1.6₋2.9470.723

4 �1.6 + 2.947 0.723

4 �

(7)

Observación: En este ejemplo hemos tenido que calcular la cuasi–desviación t´ıpica muestral a partir de la desviación t´ıpica muestral. Si seguimos el uso dado, denotando por √v la desviación t´ıpica muestral, vemos que:

s √

N = �

v_NN

−1

√ N =

√ v√N √

N√N −1 = √

v √

N −1

Podr´ıamos haber expresado el intervalo de conﬁanza utilizando la desviaci´on t´ıpica muestral: �

¯

x−tN−1 ;α/2

√ v √

N−1�x¯+tN−1 ;α/2

√ v √

N−1� �

pero no usaremos esta expresión, para no liar la notación. Tan sólo hemos de tener cuidado al tomar los datos del problema.

Ejemplo 38 Una muestra aleatoria de una poblaci´on N(µ; σ) ha dado los diez valores siguientes

6.9 ; 5.7 ; 8.4 ; 9.3 ; 7.2 ; 8.5 ; 7.4 ; 9.1 ; 6.5 ; 7.6.

Constr´uyase un intervalo de conﬁanza de σ2 _{al 95 � .}

Solución: _{Estamos ante una población} _N(µ_; _{σ) de la que desconocemos ambos parámetros. Para} estimar por intervalos de confianza σ2 _{usaremos la cantidad pivotal}

N−1 σ2 S

2

que sabemos sigue una distribuci´on χ2 _con _N ₋_{1 grados de libertad. As´ı, de la muestra dada, tan} s´olo usaremos la cuasi–varianza muestral:

S2= 1 N ₋1

N

�

i=1

(Xi−X)¯ 2.

Los siguientes c´alculos dan con ella:

¯

x = 76.6

10 = 7.66 varianza muestral: v = 1

10(6.9

2_+5.72_+8.42_+9.32_+7.22_+8.52_+7.42_+9.12_+6.52_+7.62₎

−7.662

= 598.82

10 −58.6756 = 59.882−58.6756 = 1.2064 s2 = v10

9 =

12.064

9 ≈1.34. Para construir el intervalo pedido

�_(N ₋_1)s2 χ2

N−1 ;α/2

� (N−1)s 2

χ2

N−1 ; 1−α/2

�

hemos de calcularχ2

N−1 ;α/2 yχ

2

N−1 ; 1−α/2, con N−1 = 9,α/2 = (1−0.95)/2 = 0.025. Estos valores

son, respectivamente:

χ2

9 ; 0.025= 19.023 ; χ29 ; 1−0.025=χ

2

9 ; 0.975= 2.7.

Sustituyendo en la expresi´on del intervalo de conﬁanza para estimarσ2 _{al nivel pedido, se obtiene:} �

9·1.34 19.023�

9·1.34 2.7

�

≈(0.634�4.467)�

(8)

Ejemplo 39 Se ha ofrecido a un grupo de estudiantes elegir entre dar o no una hora complementaria de clase semanal. El examen final fue el mismo para todos los estudiantes. Del curso normal (sin clase extra), 15 alumnos obtuvieron una puntuación media de 76 con desviación t´ıpica 6, y 28 del curso con hora complementaria una puntuación media de 84 con desviación t´ıpica 5. Obténgase un intervalo de confianza al 90 � de la diferencia de puntuaciones medias, suponiendo que las poblaciones son normales de varianzas iguales.

Soluci´on: _{En las condiciones dadas es aplicable el intervalo} �

¯

X−Y¯ −tm+n−2 ;α/2Sp

� 1 m +

1

n�X¯ −Y¯ +tm+n−2 ;α/2Sp

� 1 m +

1 n

�

con

m= 15 ; ¯x= 76 ; s2X = 62

15 14 =

540 14 n= 28 ; ¯y= 84 ; s2Y = 52

28 27 =

700 27 y

s2

p =

(m₋1)s2

X+ (n−1)s2Y

m+n−2

= 14 540

14 + 27 700

27 15 + 28₋2 =

1240 41

Sustituyendo α = 1₋0.9 = 0.1, obtenemos, de la tabla para una distribuci´on t de Student con 15 + 28₋2 = 41 grados de libertad1_:

t41 ;α/2=t41 ; 0.05 ≈1.684

En deﬁnitiva, el intervalo de conﬁanza paraσ2 _{al 90 %, dadas las dos muestras, es:} �

76₋84₋1.684 �

1240 41

�

28 + 15

28·15 �76−84 + 1.684 �

1240 41

�

28 + 15 28·15

�

= �

−6₋1.684 �

1240_·43

41·28·15�−6 + 1.684 �

1240_·43 41·28·15

�

=�₋6₋1.684 �

62_·43

41·21�−6 + 1.684 �

62_·43 41·21

�

≈(₋8.9633�₋3.0367).

Ejemplo 40 En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos pobla-ciones aisladas, A1 y A2, se obtuvieron los siguientes datos:

N1 = 13 x1¯ = 4 s1 = 3 N2 = 11 x2¯ = 5 s2 = 2.2.

Suponiendo que el tiempo de desarrollo en la poblaci´on Ai sigue una distribuci´on N(µi;σi), para

i= 1�2, obtener un intervalo de conﬁanza para el cociente de varianzas al nivel 0.80 .

(9)

Solución: _{Un intervalo de confianza para el cociente}_σ₁2_/σ₂2_{, al nivel 0.80 = 1}₋_α _con_α _{= 0.2, será:} �

S2 1/S22 FN1−1 ;N2−1 ; 0.1

� S

2 1/S22 FN1−1 ;N2−1 ; 0.9

�

De los datos dados, se obtiene de la correspondiente tabla (α/2 = 0.1):

F12 ; 10 ; 0.1 = 2.2841 ; y: F12 ; 10 ; 0.9= 1 F10 ; 12 ; 0.1

= 1

2.1878 ≈0.4571.

El intervalo queda: _�

32_/2.22 2.2841 �

32_/2.22 1/2.1878

�

≈(0.8141�4.0682).

3. Otras poblaciones

Cuando la muestra se obtiene de poblaciones con distribución Bernoulli, o de Poisson, usaremos intervalos de confianza asintóticos, para ponernos en la situación anterior. Para ello las cantidades pivotales utilizadas tendrán una distribución l´ımite (cuando N → ∞) independiente de parámetros desconocidos.

Intervalos de confianza para una distribuci´on de Bernoulli

Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X ∼B(1 ; p). Entonces:

� ¯ X₋zα/2

� �

p(1₋�p)

N �X¯ +zα/2 �

� p(1₋p)�

N �

es un intervalo de conﬁanza para p �al nivel 1₋α), siendo p�= ¯X =“frecuencia relativa de ´exitos”.

Estamos utilizando la siguiente cantidad pivotal asint´otica:

¯ X₋p �

�

p(q₋p)/N� ∼N(0 ; 1) (aproximadamente, para N grande).

Intervalos de confianza para una distribuci´on de Poisson

Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X ∼Poisson(λ). Entonces:

�_¯ X₋zα/2

� �

λ/N �X¯ +zα/2 �

� λ/N�

es un intervalo de conﬁanza paraλ�al nivel 1₋α), siendo�λ= ¯X.

En este caso, la cantidad pivotal asint´otica es:

¯ X₋λ �

� λ/N

(10)

4. M´ınimo tama˜

no muestral

Un problema muy relacionado con la construcción de intervalos de confianza es el de determinar el m´ınimo tamaño muestral necesario para obtener una determinadaprecisiónen nuestra estimación. Es decir, cuántos elementos tenemos que observar, al menos, para que el error cometido con la estimación no supere cierta cantidad.

Definición 4.1. El error de una estimación por intervalos de confianza (al nivel 1−α) es la semi– amplitud _{del intervalo obtenido.}

Ejemplo 41 Determinar el m´ınimo tamaño muestral de una población N(µ;σ = 5), para que el error de la estimación por intervalos de confianza para µal 95 �, no sea superior a 0.5.

Soluci´on: _Estimaremos_µ _{mediante un intervalo de conﬁanza de la forma:} �

¯ X−zα/2

σ √

N � ¯ X+zα/2

σ √

N �

con lo cual el error cometido ser´a

Error =zα/2 σ √

N .

Siendoα = 1−0.95 = 0.05, α/2 = 0.025y σ= 5, se quiere obtener el m´ınimo valor de N para que:

z0.025 5 √

N = 1.96 5 √

N ≤0.5 de donde: N ≥

�₅_·_1.96 0.5

�2

= 19.62= 384.16.

Es decir, necesitaremos observar 385 elementos para conseguir la precisi´on deseada (error≤0.5) para esa estimaci´on.

Para otros intervalos, un cálculo similar nos llevar´ıa a determinar, en cada caso, el m´ınimo ta-maño muestral. Téngase en cuenta que este m´ınimo tamaño muestral ha de tomarse como un valor orientativo. As´ı, si obtenemos, para determinada precisión, un m´ınimo tamaño muestral de 196, en-tenderemos que debemos observar alrededor de 200 elementos. Esto es esencial, sobre todo en los casos en que el m´ınimo tamaño muestral depende de la muestra concreta obtenida.

5. Intervalos de conﬁanza m´

as frecuentes

Recogemos por último, los intervalos de confianza antes obtenidos, y algún otro, en una lista esquemática. Se utiliza la siguiente notación

(X1� . . . � Xn) muestra aleatoria (m.a.) de X.

¯ x= 1

n

�

i=1

xi� s2=

1 n−1

n

�

i=1

(11)

1. X _∼N(µ� σ)

Intervalo de conﬁanza 1₋α paraµ:          I = � ¯ x_±zα/2

σ √_n � σ conocida I = � ¯

x_±tn−1;α/2

s √_n

�

σ desconocida

Intervalo de conﬁanza 1−α paraσ2:I = �

(n₋1)s2 χ2

n−1;α/2

� (n−1)s 2

χ2

n−1;1−α/2 �

2. X ∼B(1� p) (muestras grandes).

Intervalo de conﬁanza 1₋α parap:I = �

¯ x_±zα/2

� ¯ x(1−x)¯

n �

3. X _∼P(λ) (muestras grandes).

Intervalo de conﬁanza 1₋α paraλ:I = �

¯ x_±zα/2

� ¯ x n

�

4. Dos poblaciones Normales independientes X _∼N(µ1� σ1), Y _∼N(µ2� σ2) independientes (X1� . . . � Xn1) m.a. de X; se calcula ¯x ys

2 1. (Y1� . . . � Yn2) m.a. de Y; se calcula ¯y ys22.

s2p=

(n1−1)s2

1+ (n2−1)s22 n1+n2₋2

Intervalo de conﬁanza 1₋α paraµ1₋µ2:

I = �

¯x₋y¯_±zα/2 � σ2 1 n1 + σ2 2 n2 

 σ1,σ2 conocidas

I = �

¯

x−y¯±tn1+n2−2;α/2 sp

� 1 n1 + 1 n2 �

σ1� σ2 desconocidas,σ1=σ2

I = �

¯x₋y¯_±tf;α/2 � s2 1 n1 + s2 2 n2 

 σ1� σ2 desconocidas,σ1_�=σ2

dondef = entero m´as pr´oximo a (s 2

1/n1+s22/n2)2 �s2

1/n1)2

n1+1 + �s2

2/n2)2

n2+1 −2

Intervalo de conﬁanza 1−α paraσ12/σ22:I = �

s2 1/s22 Fn1−1;n2−1;α/2

� (s21/s22)Fn2−1;n1−1;α/2

(12)

5. Comparaci´on de proporciones (muestras grandes e independientes) X ∼B(1� p1), Y ∼B(1� p2), independientes.

(X1� . . . � Xn1) m.a. de X; se calcula ¯x ys 2 1. (Y1� . . . � Yn2) m.a. de Y; se calcula ¯y ys22.

Intervalo de conﬁanza 1−α parap1−p2:I = �

x¯−y¯±zα/2 �

¯

x(1₋x)¯ n1 +

¯

y(1₋y)¯ n2

 

6. Datos emparejados

(X� Y)∼Normal bivariante (µ1� µ2� σ1� σ2� ρ). (X1� Y1)� . . . �(Xn� Yn) m.a. de (X� Y).

D=X₋Y _∼N�µ=µ1₋µ2� σ= �

σ2

1+σ22−2ρ σ1σ2 �

(D1� . . . � Dn) m.a. de D, dondeDi =Xi−Yi.

(13)

Problemas

1. En una población se desea conocer la probabilidad de que un individuo sea alérgico al polen de las acacias. En 100 individuos tomados al azar se observaron 10 alérgicos. Hallar el intervalo de confianza al 95 % para la probabilidad pedida. ¿Cuántos individuos se deber´ıan observar para que, con el mismo nivel de confianza, el error máximo en la estimación de la proporción de alérgicos sea del 0.01?

2. Se supone que el número de erratas por página en un libro sigue una distribución de Poisson. Elegidas al azar 95 páginas, se obtuvieron los siguientes resultados:

Número de erratas 0 1 2 3 4 5 Número de páginas 40 30 15 7 2 1

Hallar el intervalo de confianza al 90 % para el número medio de erratas por página en todo el libro.

3. Se mide el tiempo de duraci´on (en segundos) de un proceso qu´ımico realizado 20 veces en condi-ciones similares, obteni´endose los siguientes resultados:

28�25�32� 25�28�26�31�29�26�26�23�18� 20�16�24�17�22�23�25�21.

Suponiendo que la duración sigue una distribución Normal, hallar los intervalos de confianza al 90 % para ambos parámetros.

4. La vida activa (en d´ıas) de cierto fármaco sigue una distribuciónN(1200 ; 40). Se desea enviar un lote de este fármaco de manera que la vida media del lote no sea inferior a 1180 d´ıas, con probabilidad 0.95. Hallar el tamaño del lote.

5. Una noticia en el periódico dice que, de 1000 personas encuestadas sobre una cuestión, 556 se muestran a favor y 444 en contra, y concluye afirmando que el 55.6 % de la población se muestra a favor, con un margen de error de_±3 %. ¿Cuál es el nivel de confianza de esta afirmación? 6. Se quiere estudiar la proporción p de declaraciones de la renta con algún defecto. En una

muestra preliminar pequeña (muestra piloto) de tamaño 50 se han observado 22 declaraciones defectuosas. ¿Cuál es el tamaño muestral necesario para estimarpcometiendo un error máximo de 0.01 con una probabilidad 0.99?

7. En una gran zona ganadera se desea estimar la proporción de ovejas que sufren cierta enferme-dad degenerativa. Calcular el tamaño muestral necesario para estimar esta proporción con un error menor que 0.03 a un nivel de confianza del 0.95, sabiendo que, en una pequeña muestra preliminar, se seleccionaron 30 ovejas, de las cuales 2 resultaron padecer la enfermedad. 8. En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones

aisladas,A1 y A2, se obtuvieron los siguientes datos: N1= 13 x1¯ = 4 s1= 3 N2= 11 x2¯ = 5 s2= 2.2.

Suponiendo que el tiempo de desarrollo en la poblaci´on Ai sigue una distribuci´on N(µi;σi),

parai= 1�2, se pide:

a) Hallar un intervalo de conﬁanza para el cociente de varianzas al nivel 0.80 .

b) Obtener un intervalo de conﬁanza paraµ1₋µ2, con nivel de conﬁanza 0.95 .

(14)

9. Para construir un intervalo de confianza de la media poblacional de unaN(µ;σ) conσconocida, se ha utilizado una muestra de tamaño ny se ha obtenido el intervalo del 95 %. ¿Cómo ha de ser modificado el tamaño de la muestra para obtener el mismo intervalo con una confianza del 99 %?

10. Una f´abrica elabora dos art´ıculos A y B, cuya demanda aleatoria sigue una distribuci´on normal de medias µA yµB desconocidas, y desviaciones t´ıpicas σA = 100 y σB = 50. Observados 100

puntos de venta, la demanda media de dichos art´ıculos ha resultado de 200 y 150 unidades, respectivamente. Constr´uyase un intervalo de conﬁanza al 95 % para la diferencia de medias. 11. En una muestra aleatoria de 500 familias propietarias de televisor en una gran ciudad, se

com-probó que 280 se hab´ıan suscrito a cierto canal de televisión. Obténgase un intervalo de confianza del 95 % de la proporción real de familias con televisor suscritas a dicho canal en esa ciudad. 12. Una máquina produce engranajes cuyo diámetro, debido a imperfecciones inherentes al

funcio-namiento de la máquina, es una variable aleatoria con distribución N(µ;σ = 0.03), de forma queµ puede ser fijada a voluntad mediante un reglaje de la máquina. Para que un engranaje sea utilizable, su diámetro debe estar comprendido entre 15.50 y 15.60 mm. Calcúlese:

a) el valor deµque hace máxima la proporción de engranajes utilizables y dicha proporción máxima.

b) el tama˜no n de la muestra de engranajes necesario para poder construir, a partir de la media muestral ¯x, un intervalo de conﬁanza deµal 95 % de amplitud menor que 0.02 mm.

13. De una poblaci´on normal de mediaµdesconocida se selecciona una muestra de tama˜non= 10, resultando: _{40, 45, 39, 46, 58, 52, 50, 45, 57, 49 .}

Constrúyase un intervalo de confianza al 95 % para el parámetroµ, suponiendo que:

a) la varianza poblacional esσ2 _{= 49;}

b) la varianza poblacional es desconocida.

14. Sabiendo que X sigue una distribución N(µ;σ = 4), calcúlese el tamaño muestral m´ınimo para que, con una confianza del 99 %, el intervalo (¯x₋1.5�x¯+ 1.5) contenga al parámetro µ. 15. El diámetro (en cent´ımetros) de diez piezas metálicas de forma esférica, seleccionadas al azar

de la producción de una máquina, resultó

2.02, 1.98, 2.04, 1.99, 2.05, 2.00, 2.02, 2.00, 1.98, 2.03 .

a) Suponiendo que el diámetro sigue una distribución normal, constrúyase un intervalo de confianza al 95 % del diámetro medio de las piezas producidas por esta máquina.

b) ¿Cuál deberá ser el tamaño muestral m´ınimo si, a este nivel de confianza, se pretende dar un intervalo de estimación cuya amplitud no supere los 0.02 cm?

16. Con objeto de decidir si un nuevo proceso de fabricaci´on da mejores resultados que el antiguo, en cuanto a la proporci´on de elementos defectuosos, se selecciona una muestra de 1000 elementos del nuevo proceso, y otra de 2000 del antiguo, resultando 40 y 140 elementos defectuosos, respectivamente.

a) Obt´engase un intervalo de conﬁanza al 95 % para la diferencia de proporciones de elementos defectuosos de ambos procesos.

(15)

17. Se desea conocer la probabilidad de que una pieza falle en los cinco primeros años de funciona-miento. En 100 piezas tomadas al azar se observaron 10 fallos. Halla el intervalo de confianza de nivel 0.95 para la probabilidad pedida. ¿Cuántas piezas se deber´ıan observar para que, con el mismo nivel de confianza, el margen de error en la estimación de la proporción de fallos sea de±0.01?

18. En una población, la altura de los individuos varones sigue una distribución N(µ;σ = 7.5). Halla el tamaño de la muestra para estimarµ con un margen de error inferior a _±2 cm. para un nivel de confianza 0.90.

19. En una explotación minera, las rocas excavadas se someten a un análisis qu´ımico para deter-minar su contenido porcentual de cadmio. Se puede suponer que este contenido es una variable con distribución normal de media µ y varianza σ2_{. Después de analizar 25 rocas se obtiene} un contenido porcentual medio de 9.77 con una cuasidesviación t´ıpica de 3.164. La explota-ción comercial de este mineral es económicamente rentable si el contenido medio en la mina es superior al 8 %.

a) Construye un intervalo de conﬁanza de nivel 95 % para el contenido porcentual medio de cadmio en la mina.

b) Otro indicador de la calidad de la mina es la uniformidad de su contenido mineral medida a trav´es de la varianzaσ, que debe ser menor al 3 %. Construye un intervalo de conﬁanza de nivel 95 % paraσ2_.

20. Como parte de un estudio para la reducción de los gases de efecto invernadero que emiten los coches, se estudian los efectos de un determinado aditivo que reduce las emisiones. SeaX el número de kilómetros recorridos por un coche con un litro de gasolina sin el aditivo. Sea Y el número de kilómetros recorridos con un litro de gasolina con el aditivo. Se observan los kilómetros recorridos por litro de gasolina en ocho coches, cuatro de ellos sin aditivo. Los datos que se obtienen son:

4 �

i=1

xi = 25.4

4 �

i=1

yi = 31.2

4 �

i=1 x2

i = 173.53

4 �

i=1 y2

i = 261.22

a) Suponiendo que el aditivo puede cambiar la media pero no la varianza, y especificando las hipótesis necesarias, calcula un intervalo de confianza al 95 % para la diferencia de medias.

b) A la vista del intervalo obtenido ena), ¿hay alguna indicación de que el aditivo tiene algún efecto en el número de kilómetros recorridos por litro de gasolina?