Intervalos confianza

Texto completo

(1)

Cap´ıtulo 5

Intervalos de confianza

Como su nombre indica, el objetivo de un estad´ıstico puntual para un par´ametro desconocido de una poblaci´on, es acercarnos al verdadero valor del mismo dando un valor concreto a partir de una muestra. Dif´ıcilmente esta estimaci´on acertar´a con el valor exacto del par´ametro. No obstante, la pretensi´on de dar con dicho valor puede ser excesiva, y podemos relajarla buscando simplemente una “aproximaci´on razonable” del mismo. En esta l´ınea surgen los intervalos de confianza, para un nivel de confianza dado.

1.

Definiciones

Definici´on 1.1. Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X con funci´on de masa

Pθ (o funci´on de densidadfθ), dondeθ= (θ1� . . . � θk)∈Θ. Un estimador por intervalos de confianza de θi (al nivel de confianza 1−α), es una funci´on que a cada posible muestra x1� . . . � xN le hace corresponder un intervalo(T1� T2) = (T1(x1� . . . � xN)� T2(x1� . . . � xN)), tal que, para todo θ∈Θ:

θi∈(T1� T2)

� =Pθ

(x1� . . . � xN) :θi ∈(T1(x1� . . . � xN)� T2(x1� . . . � xN))

= 1α .

Para la construcci´on de intervalos de confianza, usaremos cantidades pivotales.

Definici´on 1.2. Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X con funci´on de masa

Pθ (o funci´on de densidad fθ), donde θ= (θ1� . . . � θk)∈Θ. Una cantidad pivotalpara θi es una funci´on C(X1� . . . � XN;θi) tal que su distribuci´on no depende de θ.

Una vez obtenida una cantidad pivotal C(X1� . . . � XN;θi), la construcci´on de un intervalo para

estimar es el siguiente:

- se eligen dos valores� c1 y c2 tales que:

(x1� . . . � xN) :c1< C(X1� . . . � XN;θi)< c2

= 1α .

Obs´ervese quec1 yc2 no dependen deθ, al ser C(X1� . . . � XN;θi) una cantidad pivotal.

- Despejamos θi de las desigualdades c1< C(X1� . . . � XN;θi)< c2.

Obtenemos as´ı un estimador por intervalos de confianza para θi. Obs´ervese que la cantidad pivotal

debe ser continua y mon´otona enθi.

Necesitaremos, pues, obtener cantidades pivotales, y en este cap´ıtulo describiremos la construcci´on para los modelos m´as importantes.

(2)

2.

Poblaciones normales

Sea X∼N(µ;σ), y (X1� . . . � XN) una muestra aleatoria de dicha poblaci´on. El estimador media

muestral, ¯X, tiene las siguientes propiedades:

E[ ¯X] =E[X] =µ � V[ ¯X] = V[X] N =

σ N .

Por otra parte,X1� . . . � XN son variables aleatorias independientes, todas con la misma distribuci´on,

N(µ;σ), y as´ı

¯

X ∼N(µ;σ/√N). Por otra parte, el estimador cuasi–varianza muestral

S2= 1 N 1

N

i=1

(Xi−E[ ¯X])2

tiene esperanza

E[S2] =σ2.

Necesitaremos conocer la distribuci´on seguida por este estad´ıstico. Se tiene la siguiente definici´on:

Definici´on 2.1. �Distribuci´on χ2) Sean Z1� . . . � Z

N variables aleatorias independientes, todas con distribuci´on N(0 ; 1). La distribuci´on χ2 de Pearson con N grados de libertad (abreviadamente χ2

N) es la distribuci´on de la variable aleatoria

N

i=1 Zi2.

Esta distribuci´on est´a asociada a la distribuci´on normal, y sus valores vienen dados por una tabla. Es claro que si (X1� . . . � XN) es una muestra aleatoria de una poblaci´on X ∼N(µ;σ), entonces:

N

i=1

(Xi−µ)2

σ2 ∼χ 2

N de manera que:

N 1 σ2 S

2 =

N

i=1

(Xi−X)¯ 2

σ2 =

N

i=1

(Xi−µ+µ−X)¯ 2

σ2

=

N

i=1

(Xi−µ)2

σ2 −2 ¯ X−µ

σ2

� �

(Xi−µ)

� +

N

i=1

( ¯X−µ)2 σ2

=

N

i=1

(Xi−µ)2

σ2 −2N

( ¯X−µ)2 σ2 +N

( ¯X−µ)2 σ2

=

N

i=1

(Xi−µ)2

σ2 −N

( ¯Xµ)2 σ2 =χ

2

N −

¯ Xµ σ/√N

�2 ∼χ2

N−1.

(3)

Propiedad: [Lema de Fisher] Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X con

distribuci´onN(µ; σ). Entonces:

¯

XN(µ;σ/√N) ; N −1 σ2 S

2

∼χ2N1;

y, adem´as,X¯ yS2 sonindependientes.

Igual que para la distribuci´on de la cuasi–varianza de N variables aleatorias independientes con igual distribuci´on N(µ � σ), hemos introducido una nueva distribuci´on, necesitaremos las siguientes nuevas definiciones.

Definici´on 2.2. �Distribuci´on t de Student) Sean Y, X1� . . . � XN variables aleatorias indepen-dientes, todas con distribuci´on N(0 ; 1). La distribuci´on t de Student con N grados de libertad

(abreviadamentetN) es la distribuci´on de la variable aleatoria

Y �

1

N

�N i=1Xi2

= �Y 1

N χ

2

N

.

Definici´on 2.3. �Distribuci´on F de Fisher–Snedecor) Sean X1� . . . � Xm, Y1� . . . � Yn variables aleatorias independientes, todas con distribuci´onN(0 ; 1). La distribuci´on F de Fisher–Snedecor

con m y ngrados de libertad (abreviadamente Fm;n) es la distribuci´on de la variable aleatoria

1

m

�m i=1Xi2

1

n

�n i=1Yi2

= 1

mχ2m

1

nχ2n

.

2.1.

Cantidades pivotales en poblaciones normales

Recogemos, de manera resumida, las principales cantidades pivotales utilizadas para la cons-trucci´on de estimadores por intervalos de confianza, para el caso de una poblaci´on X N(µ;σ). Distinguiremos el caso de un muestra y el de dos muestras.

Cantidades pivotales para el caso de una muestra

a) Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´onX ∼N(µ;σ), conσ conocido.

Entonces:

¯ X−µ

σ/√N ∼N(0 ; 1) y es una cantidad pivotal para µ.

b) Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X ∼N(µ;σ). Entonces:

¯ X−µ

S/√N ∼ tN−1 es una cantidad pivotal para µ

N −1 σ2 S

2

(4)

Obs´ervese que si (X1� . . . � XN) es una muestra aleatoria de una poblaci´on N(µ;σ), entonces:

¯ X−µ σ/√N �

1 N1

N −1 σ2 S

2

= X¯−µ

S/√N ∼tN−1

por definici´on de la distribuci´on tde Student conN1 grados de libertad.

Cantidades pivotales para el caso de dos muestras

a) Sean (X1� . . . � Xm) e (Y1� . . . � Yn) muestras aleatorias independientes de las poblaciones

X∼N(µ1;σ) e Y ∼N(µ2;σ), respectivamente. Entonces: ¯

X−Y¯ −(µ1−µ2)

Sp

� 1

m +

1

n

∼tm+n−2 y es una cantidad pivotal paraµ1−µ2

donde

S2

p =

(m1)S2

X+ (n−1)SY2

m+n−2

puede interpretarse como una ponderaci´on de las cuasi–varianzas muestrales S2

X y SY2,

correspondientes a cada una de las muestras.

b) Sean (X1� . . . � Xm) e (Y1� . . . � Yn) muestras aleatorias independientes de las poblaciones

XN(µ1;σ1) e Y N(µ2;σ2), respectivamente. Entonces:

S2

X/σ12 S2

Y/σ22 ∼

Fm−1;n−1 y es una cantidad pivotal para σ12/σ22.

Obs´ervese que, en la situaci´on descrita para dos muestras: 1

m1 m1

σ2 1

S2

X

1 n1

n−1 σ2

2 S2

Y

= S 2

X/σ12 S2

Y/σ22 ∼

Fm−1;n−1

de ah´ı la afirmaci´on del apartado b). La comprobaci´on del primer apartado excede el nivel de este curso, y no se abordar´a.

2.2.

Intervalos de confianza en poblaciones normales

Utilizando las cantidades pivotales del apartado anterior, es sencillo obtener intervalos de con-fianza para los par´ametros de una poblaci´on normal. Distinguiremos diferentes casos:

Primer caso:

Sea(X1� . . . � XN)una muestra aleatoria de una poblaci´on X∼N(µ;σ), con σ conocido.

En-tonces:

¯ X−zα/2

σ √

N� ¯ X+zα/2

σ √

N �

es un intervalo de confianza paraµ�al nivel1α), siendozαel valor que verificaP(Z > zα) =α,

(5)

Segundo caso:

Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X∼N(µ;σ). Entonces: a) �X¯tN−1 ;α/2

S √

N� ¯

X+tN−1 ;α/2 S √

N �

es un intervalo de confianza paraµ�al nivel1α), siendotN;α el valor que verifica que P(tN > tN;α) =α.

b) �(N−1)S

2

χ2

N−1 ;α/2

� (N −1)S 2

χ2

N−1 ; 1−α/2 �

es un intervalo de confianza para σ2 �al nivel 1

−α), siendo

χ2

N;αel valor que verifica: P(χ2N > χ2N;α) =α.

Tercer caso:

Sean(X1� . . . � Xm)e(Y1� . . . � Yn)muestras aleatorias independientes de dos poblaciones normales

con igual desviaci´on t´ıpica: X∼N(µ1;σ) e Y ∼N(µ2;σ), respectivamente. Entonces:

� ¯

X−Y¯ −tm+n−2 ;α/2Sp

� 1 m+

1

n�X¯ −Y¯ +tm+n−2 ;α/2Sp

� 1 m+

1 n

es un intervalo de confianza para la diferencia de medias,µ1−µ2 �al nivel 1−α).

Cuarto caso:

Sean(X1� . . . � Xm)e(Y1� . . . � Yn)muestras aleatorias independientes de dos poblaciones normales:

X ∼N(µ1;σ1) e Y ∼N(µ2;σ2), respectivamente. Entonces:

� S2

X/SY2

Fm−1 ;n−1 ;α/2

� S 2

X/SY2

Fm−1 ;n−1 ; 1−α/2

es un intervalo de confianza para la raz´on de varianzas,σ2

1/σ22 �al nivel 1−α), siendo Fm;n;α

el valor que verifica:P(Fm;n> Fm;n;α) =α.

Observaci´on:En el manejo de las tablas correspondientes a la distribuci´onFm;n, conviene tener en

cuenta la siguiente relaci´on (obs´ervese el cambio de orden en los grados de libertad): Fm;n; 1−α= Fn;1m;α.

2.3.

Ejemplos

Ejemplo 36 Una empresa fabrica bombillas cuya duraci´on en horas sigue una distribuci´onN(µ; 200). Una muestra aleatoria de 36 bombillas ha dado una vida media de 7000 horas. Constr´uyase un in-tervalo de confianza al nivel del 99 � para la vida media de las bombillas fabricadas por esa f´abrica.

Soluci´on: Tenemos una muestra de tama˜noN = 36 de una poblaci´on,XN; 200), de varianza conocida. Usaremos la cantidad pivotal:

¯ Xµ

200/6 ∼N(0 ; 1) ;

y, paraα= 0.01, repartimos la probabilidad de manera equitativa a izquierda y derecha de la media muestral ¯x= 7000. En otras palabras, consideramos la igualdad:

P �

−c < 7000−µ 200/6 < c

(6)

De la tabla para unaN(0 ; 1) se tiene c=zα/2≈2.58 (puesα/2 = 0.005). Construimos el intervalo de confianza paraµ, al nivel del 99 %, despejando µen las desigualdades:

−2.58< 7000−µ

200/6 <2.58

de manera que:

µ < 7000 +200

6 2.58 =

21000 + 258

3 =

21258

3 = 7086 (de la desigualdad izquierda) µ > 7000 200

6 2.58 =

21000−258

3 =

20742

3 = 6914 (de la desigualdad derecha)

Resumiendo, el intervalo de confianza paraµ al nivel del 99 % para la muestra dada es:

I = �

7000200

6 2.58�7000 + 200

6 2.58 �

= (6914�7086).

Ejemplo 37 Una muestra aleatoria de 16 cigarrillos de una cierta marca tiene un contenido medio de nicotina de 1.6mg. y una desviaci´on t´ıpica de 0.7mg. Suponiendo que la variable X =“contenido de nicotina en un cigarrillo”, sigue una distribuci´on N(µ; σ), obt´engase un intervalo de confianza al 99 � del contenido medio de nicotina por cigarrillo en esa marca.

Soluci´on: En este caso se quiere estimar µ en una poblaci´on N;σ), con ambos par´ametros desconocidos. Partimos de una muestra de tama˜no N = 16, con ¯x = 1.6 y cuasi–desviaci´on t´ıpica muestral

s= �

0.7216

15 ≈0.723. Sabemos que en este caso hemos de usar la cantidad pivotal:

¯ x−µ s/√N =

1.6−µ 0.723/4

que sigue una distribuci´ontde Student conN−1 = 15 grados de libertad. Para la muestra dada, el intervalo de confianza para µal nivel de confianza 1α queda

� ¯

x−tN−1 ;α/2 s √

N�x¯+tN−1 ;α/2

s √

N �

=�1.6−t15 ;α/2 0.723

4 �1.6 +t15 ;α/2 0.723

4 �

siendot15 ;α/2 el valor tal que P(t15 > t15 ;α/2) = α/2. Como en nuestro caso 1−α = 0.99 entonces

α= 0.01 y as´ı, de la correspondiente tabla para la distribuci´ont de Student, obtenemos:

t15 ;α/2=t15 ; 0.005= 2.947.

El intervalo que nos piden es pues: �

1.6t15 ;α/2 0.723

4 �1.6 +t15 ;α/2 0.723

4 �

= �1.62.9470.723

4 �1.6 + 2.947 0.723

4 �

(7)

Observaci´on: En este ejemplo hemos tenido que calcular la cuasi–desviaci´on t´ıpica muestral a partir de la desviaci´on t´ıpica muestral. Si seguimos el uso dado, denotando por √v la desviaci´on t´ıpica muestral, vemos que:

s √

N = �

vNN

−1

√ N =

√ v√N √

N√N −1 = √

v √

N −1

Podr´ıamos haber expresado el intervalo de confianza utilizando la desviaci´on t´ıpica muestral: �

¯

x−tN−1 ;α/2

√ v √

N−1�x¯+tN−1 ;α/2

√ v √

N−1� �

pero no usaremos esta expresi´on, para no liar la notaci´on. Tan s´olo hemos de tener cuidado al tomar los datos del problema.

Ejemplo 38 Una muestra aleatoria de una poblaci´on N(µ; σ) ha dado los diez valores siguientes

6.9 ; 5.7 ; 8.4 ; 9.3 ; 7.2 ; 8.5 ; 7.4 ; 9.1 ; 6.5 ; 7.6.

Constr´uyase un intervalo de confianza de σ2 al 95 � .

Soluci´on: Estamos ante una poblaci´on N(µ; σ) de la que desconocemos ambos par´ametros. Para estimar por intervalos de confianza σ2 usaremos la cantidad pivotal

N−1 σ2 S

2

que sabemos sigue una distribuci´on χ2 con N 1 grados de libertad. As´ı, de la muestra dada, tan s´olo usaremos la cuasi–varianza muestral:

S2= 1 N 1

N

i=1

(Xi−X)¯ 2.

Los siguientes c´alculos dan con ella:

¯

x = 76.6

10 = 7.66 varianza muestral: v = 1

10(6.9

2+5.72+8.42+9.32+7.22+8.52+7.42+9.12+6.52+7.62)

−7.662

= 598.82

10 −58.6756 = 59.882−58.6756 = 1.2064 s2 = v10

9 =

12.064

9 ≈1.34. Para construir el intervalo pedido

(N 1)s2 χ2

N−1 ;α/2

� (N−1)s 2

χ2

N−1 ; 1−α/2

hemos de calcularχ2

N−1 ;α/2 yχ

2

N−1 ; 1−α/2, con N−1 = 9,α/2 = (1−0.95)/2 = 0.025. Estos valores

son, respectivamente:

χ2

9 ; 0.025= 19.023 ; χ29 ; 1−0.025=χ

2

9 ; 0.975= 2.7.

Sustituyendo en la expresi´on del intervalo de confianza para estimarσ2 al nivel pedido, se obtiene:

9·1.34 19.023�

9·1.34 2.7

≈(0.634�4.467)�

(8)

Ejemplo 39 Se ha ofrecido a un grupo de estudiantes elegir entre dar o no una hora complementaria de clase semanal. El examen final fue el mismo para todos los estudiantes. Del curso normal (sin clase extra), 15 alumnos obtuvieron una puntuaci´on media de 76 con desviaci´on t´ıpica 6, y 28 del curso con hora complementaria una puntuaci´on media de 84 con desviaci´on t´ıpica 5. Obt´engase un intervalo de confianza al 90 � de la diferencia de puntuaciones medias, suponiendo que las poblaciones son normales de varianzas iguales.

Soluci´on: En las condiciones dadas es aplicable el intervalo

¯

X−Y¯ −tm+n−2 ;α/2Sp

� 1 m +

1

n�X¯ −Y¯ +tm+n−2 ;α/2Sp

� 1 m +

1 n

con

m= 15 ; ¯x= 76 ; s2X = 62

15 14 =

540 14 n= 28 ; ¯y= 84 ; s2Y = 52

28 27 =

700 27 y

s2

p =

(m1)s2

X+ (n−1)s2Y

m+n−2

= 14 540

14 + 27 700

27 15 + 282 =

1240 41

Sustituyendo α = 10.9 = 0.1, obtenemos, de la tabla para una distribuci´on t de Student con 15 + 282 = 41 grados de libertad1:

t41 ;α/2=t41 ; 0.05 ≈1.684

En definitiva, el intervalo de confianza paraσ2 al 90 %, dadas las dos muestras, es:

76841.684 �

1240 41

28 + 15

28·15 �76−84 + 1.684 �

1240 41

28 + 15 28·15

= �

−61.684 �

1240·43

41·28·15�−6 + 1.684 �

1240·43 41·28·15

=�61.684 �

62·43

41·21�−6 + 1.684 �

62·43 41·21

≈(8.9633�3.0367).

Ejemplo 40 En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos pobla-ciones aisladas, A1 y A2, se obtuvieron los siguientes datos:

N1 = 13 x1¯ = 4 s1 = 3 N2 = 11 x2¯ = 5 s2 = 2.2.

Suponiendo que el tiempo de desarrollo en la poblaci´on Ai sigue una distribuci´on N(µi;σi), para

i= 1�2, obtener un intervalo de confianza para el cociente de varianzas al nivel 0.80 .

(9)

Soluci´on: Un intervalo de confianza para el cocienteσ1222, al nivel 0.80 = 1α conα = 0.2, ser´a:

S2 1/S22 FN1−1 ;N2−1 ; 0.1

� S

2 1/S22 FN1−1 ;N2−1 ; 0.9

De los datos dados, se obtiene de la correspondiente tabla (α/2 = 0.1):

F12 ; 10 ; 0.1 = 2.2841 ; y: F12 ; 10 ; 0.9= 1 F10 ; 12 ; 0.1

= 1

2.1878 ≈0.4571.

El intervalo queda:

32/2.22 2.2841 �

32/2.22 1/2.1878

≈(0.8141�4.0682).

3.

Otras poblaciones

Cuando la muestra se obtiene de poblaciones con distribuci´on Bernoulli, o de Poisson, usaremos intervalos de confianza asint´oticos, para ponernos en la situaci´on anterior. Para ello las cantidades pivotales utilizadas tendr´an una distribuci´on l´ımite (cuando N → ∞) independiente de par´ametros desconocidos.

Intervalos de confianza para una distribuci´on de Bernoulli

Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X ∼B(1 ; p). Entonces:

� ¯ Xzα/2

� �

p(1�p)

N �X¯ +zα/2 �

� p(1p)�

N �

es un intervalo de confianza para p �al nivel 1α), siendo p�= ¯X =“frecuencia relativa de ´exitos”.

Estamos utilizando la siguiente cantidad pivotal asint´otica:

¯ Xp �

p(qp)/N� ∼N(0 ; 1) (aproximadamente, para N grande).

Intervalos de confianza para una distribuci´on de Poisson

Sea (X1� . . . � XN) una muestra aleatoria de una poblaci´on X ∼Poisson(λ). Entonces:

¯ Xzα/2

� �

λ/N �X¯ +zα/2 �

� λ/N�

es un intervalo de confianza paraλ�al nivel 1α), siendo�λ= ¯X.

En este caso, la cantidad pivotal asint´otica es:

¯ Xλ �

� λ/N

(10)

4.

M´ınimo tama˜

no muestral

Un problema muy relacionado con la construcci´on de intervalos de confianza es el de determinar el m´ınimo tama˜no muestral necesario para obtener una determinadaprecisi´onen nuestra estimaci´on. Es decir, cu´antos elementos tenemos que observar, al menos, para que el error cometido con la estimaci´on no supere cierta cantidad.

Definici´on 4.1. El error de una estimaci´on por intervalos de confianza (al nivel 1−α) es la semi– amplitud del intervalo obtenido.

Ejemplo 41 Determinar el m´ınimo tama˜no muestral de una poblaci´on N(µ;σ = 5), para que el error de la estimaci´on por intervalos de confianza para µal 95 �, no sea superior a 0.5.

Soluci´on: Estimaremosµ mediante un intervalo de confianza de la forma:

¯ X−zα/2

σ √

N � ¯ X+zα/2

σ √

N �

con lo cual el error cometido ser´a

Error =zα/2 σ √

N .

Siendoα = 1−0.95 = 0.05, α/2 = 0.025y σ= 5, se quiere obtener el m´ınimo valor de N para que:

z0.025 5 √

N = 1.96 5 √

N ≤0.5 de donde: N ≥

5·1.96 0.5

�2

= 19.62= 384.16.

Es decir, necesitaremos observar 385 elementos para conseguir la precisi´on deseada (error≤0.5) para esa estimaci´on.

Para otros intervalos, un c´alculo similar nos llevar´ıa a determinar, en cada caso, el m´ınimo ta-ma˜no muestral. T´engase en cuenta que este m´ınimo tama˜no muestral ha de tomarse como un valor orientativo. As´ı, si obtenemos, para determinada precisi´on, un m´ınimo tama˜no muestral de 196, en-tenderemos que debemos observar alrededor de 200 elementos. Esto es esencial, sobre todo en los casos en que el m´ınimo tama˜no muestral depende de la muestra concreta obtenida.

5.

Intervalos de confianza m´

as frecuentes

Recogemos por ´ultimo, los intervalos de confianza antes obtenidos, y alg´un otro, en una lista esquem´atica. Se utiliza la siguiente notaci´on

(X1� . . . � Xn) muestra aleatoria (m.a.) de X.

¯ x= 1

n

n

i=1

xi� s2=

1 n−1

n

i=1

(11)

1. X N(µ� σ)

Intervalo de confianza 1α paraµ:          I = � ¯ x±zα/2

σ √n � σ conocida I = � ¯

x±tn−1;α/2

s √n

σ desconocida

Intervalo de confianza 1−α paraσ2:I = �

(n1)s2 χ2

n−1;α/2

� (n−1)s 2

χ2

n−1;1−α/2 �

2. X ∼B(1� p) (muestras grandes).

Intervalo de confianza 1α parap:I = �

¯ x±zα/2

� ¯ x(1−x)¯

n �

3. X P(λ) (muestras grandes).

Intervalo de confianza 1α paraλ:I = �

¯ x±zα/2

� ¯ x n

4. Dos poblaciones Normales independientes X N(µ1� σ1), Y N(µ2� σ2) independientes (X1� . . . � Xn1) m.a. de X; se calcula ¯x ys

2 1. (Y1� . . . � Yn2) m.a. de Y; se calcula ¯y ys22.

s2p=

(n1−1)s2

1+ (n2−1)s22 n1+n22

Intervalo de confianza 1α paraµ1µ2:

I = �

¯x±zα/2 � σ2 1 n1 + σ2 2 n2 

 σ1,σ2 conocidas

I = �

¯

x−y¯±tn1+n2−2;α/2 sp

� 1 n1 + 1 n2 �

σ1� σ2 desconocidas,σ1=σ2

I = �

¯x±tf;α/2 � s2 1 n1 + s2 2 n2 

 σ1� σ2 desconocidas,σ1=σ2

dondef = entero m´as pr´oximo a (s 2

1/n1+s22/n2)2 �s2

1/n1)2

n1+1 + �s2

2/n2)2

n2+1 −2

Intervalo de confianza 1−α paraσ12/σ22:I = �

s2 1/s22 Fn1−1;n2−1;α/2

� (s21/s22)Fn2−1;n1−1;α/2

(12)

5. Comparaci´on de proporciones (muestras grandes e independientes) X ∼B(1� p1), Y ∼B(1� p2), independientes.

(X1� . . . � Xn1) m.a. de X; se calcula ¯x ys 2 1. (Y1� . . . � Yn2) m.a. de Y; se calcula ¯y ys22.

Intervalo de confianza 1−α parap1−p2:I = �

x¯−y¯±zα/2 �

¯

x(1x)¯ n1 +

¯

y(1y)¯ n2

 

6. Datos emparejados

(X� Y)∼Normal bivariante (µ1� µ2� σ1� σ2� ρ). (X1� Y1)� . . . �(Xn� Yn) m.a. de (X� Y).

D=XY N�µ=µ1µ2� σ= �

σ2

1+σ22−2ρ σ1σ2 �

(D1� . . . � Dn) m.a. de D, dondeDi =Xi−Yi.

(13)

Problemas

1. En una poblaci´on se desea conocer la probabilidad de que un individuo sea al´ergico al polen de las acacias. En 100 individuos tomados al azar se observaron 10 al´ergicos. Hallar el intervalo de confianza al 95 % para la probabilidad pedida. ¿Cu´antos individuos se deber´ıan observar para que, con el mismo nivel de confianza, el error m´aximo en la estimaci´on de la proporci´on de al´ergicos sea del 0.01?

2. Se supone que el n´umero de erratas por p´agina en un libro sigue una distribuci´on de Poisson. Elegidas al azar 95 p´aginas, se obtuvieron los siguientes resultados:

N´umero de erratas 0 1 2 3 4 5 N´umero de p´aginas 40 30 15 7 2 1

Hallar el intervalo de confianza al 90 % para el n´umero medio de erratas por p´agina en todo el libro.

3. Se mide el tiempo de duraci´on (en segundos) de un proceso qu´ımico realizado 20 veces en condi-ciones similares, obteni´endose los siguientes resultados:

28�25�32� 25�28�26�31�29�26�26�23�18� 20�16�24�17�22�23�25�21.

Suponiendo que la duraci´on sigue una distribuci´on Normal, hallar los intervalos de confianza al 90 % para ambos par´ametros.

4. La vida activa (en d´ıas) de cierto f´armaco sigue una distribuci´onN(1200 ; 40). Se desea enviar un lote de este f´armaco de manera que la vida media del lote no sea inferior a 1180 d´ıas, con probabilidad 0.95. Hallar el tama˜no del lote.

5. Una noticia en el peri´odico dice que, de 1000 personas encuestadas sobre una cuesti´on, 556 se muestran a favor y 444 en contra, y concluye afirmando que el 55.6 % de la poblaci´on se muestra a favor, con un margen de error de±3 %. ¿Cu´al es el nivel de confianza de esta afirmaci´on? 6. Se quiere estudiar la proporci´on p de declaraciones de la renta con alg´un defecto. En una

muestra preliminar peque˜na (muestra piloto) de tama˜no 50 se han observado 22 declaraciones defectuosas. ¿Cu´al es el tama˜no muestral necesario para estimarpcometiendo un error m´aximo de 0.01 con una probabilidad 0.99?

7. En una gran zona ganadera se desea estimar la proporci´on de ovejas que sufren cierta enferme-dad degenerativa. Calcular el tama˜no muestral necesario para estimar esta proporci´on con un error menor que 0.03 a un nivel de confianza del 0.95, sabiendo que, en una peque˜na muestra preliminar, se seleccionaron 30 ovejas, de las cuales 2 resultaron padecer la enfermedad. 8. En un estudio sobre el tiempo de desarrollo de una especie de insectos en dos poblaciones

aisladas,A1 y A2, se obtuvieron los siguientes datos: N1= 13 x1¯ = 4 s1= 3 N2= 11 x2¯ = 5 s2= 2.2.

Suponiendo que el tiempo de desarrollo en la poblaci´on Ai sigue una distribuci´on N(µi;σi),

parai= 1�2, se pide:

a) Hallar un intervalo de confianza para el cociente de varianzas al nivel 0.80 .

b) Obtener un intervalo de confianza paraµ1µ2, con nivel de confianza 0.95 .

(14)

9. Para construir un intervalo de confianza de la media poblacional de unaN(µ;σ) conσconocida, se ha utilizado una muestra de tama˜no ny se ha obtenido el intervalo del 95 %. ¿C´omo ha de ser modificado el tama˜no de la muestra para obtener el mismo intervalo con una confianza del 99 %?

10. Una f´abrica elabora dos art´ıculos A y B, cuya demanda aleatoria sigue una distribuci´on normal de medias µA yµB desconocidas, y desviaciones t´ıpicas σA = 100 y σB = 50. Observados 100

puntos de venta, la demanda media de dichos art´ıculos ha resultado de 200 y 150 unidades, respectivamente. Constr´uyase un intervalo de confianza al 95 % para la diferencia de medias. 11. En una muestra aleatoria de 500 familias propietarias de televisor en una gran ciudad, se

com-prob´o que 280 se hab´ıan suscrito a cierto canal de televisi´on. Obt´engase un intervalo de confianza del 95 % de la proporci´on real de familias con televisor suscritas a dicho canal en esa ciudad. 12. Una m´aquina produce engranajes cuyo di´ametro, debido a imperfecciones inherentes al

funcio-namiento de la m´aquina, es una variable aleatoria con distribuci´on N(µ;σ = 0.03), de forma queµ puede ser fijada a voluntad mediante un reglaje de la m´aquina. Para que un engranaje sea utilizable, su di´ametro debe estar comprendido entre 15.50 y 15.60 mm. Calc´ulese:

a) el valor deµque hace m´axima la proporci´on de engranajes utilizables y dicha proporci´on m´axima.

b) el tama˜no n de la muestra de engranajes necesario para poder construir, a partir de la media muestral ¯x, un intervalo de confianza deµal 95 % de amplitud menor que 0.02 mm.

13. De una poblaci´on normal de mediaµdesconocida se selecciona una muestra de tama˜non= 10, resultando: 40, 45, 39, 46, 58, 52, 50, 45, 57, 49 .

Constr´uyase un intervalo de confianza al 95 % para el par´ametroµ, suponiendo que:

a) la varianza poblacional esσ2 = 49;

b) la varianza poblacional es desconocida.

14. Sabiendo que X sigue una distribuci´on N(µ;σ = 4), calc´ulese el tama˜no muestral m´ınimo para que, con una confianza del 99 %, el intervalo (¯x1.5�x¯+ 1.5) contenga al par´ametro µ. 15. El di´ametro (en cent´ımetros) de diez piezas met´alicas de forma esf´erica, seleccionadas al azar

de la producci´on de una m´aquina, result´o

2.02, 1.98, 2.04, 1.99, 2.05, 2.00, 2.02, 2.00, 1.98, 2.03 .

a) Suponiendo que el di´ametro sigue una distribuci´on normal, constr´uyase un intervalo de confianza al 95 % del di´ametro medio de las piezas producidas por esta m´aquina.

b) ¿Cu´al deber´a ser el tama˜no muestral m´ınimo si, a este nivel de confianza, se pretende dar un intervalo de estimaci´on cuya amplitud no supere los 0.02 cm?

16. Con objeto de decidir si un nuevo proceso de fabricaci´on da mejores resultados que el antiguo, en cuanto a la proporci´on de elementos defectuosos, se selecciona una muestra de 1000 elementos del nuevo proceso, y otra de 2000 del antiguo, resultando 40 y 140 elementos defectuosos, respectivamente.

a) Obt´engase un intervalo de confianza al 95 % para la diferencia de proporciones de elementos defectuosos de ambos procesos.

(15)

17. Se desea conocer la probabilidad de que una pieza falle en los cinco primeros a˜nos de funciona-miento. En 100 piezas tomadas al azar se observaron 10 fallos. Halla el intervalo de confianza de nivel 0.95 para la probabilidad pedida. ¿Cu´antas piezas se deber´ıan observar para que, con el mismo nivel de confianza, el margen de error en la estimaci´on de la proporci´on de fallos sea de±0.01?

18. En una poblaci´on, la altura de los individuos varones sigue una distribuci´on N(µ;σ = 7.5). Halla el tama˜no de la muestra para estimarµ con un margen de error inferior a ±2 cm. para un nivel de confianza 0.90.

19. En una explotaci´on minera, las rocas excavadas se someten a un an´alisis qu´ımico para deter-minar su contenido porcentual de cadmio. Se puede suponer que este contenido es una variable con distribuci´on normal de media µ y varianza σ2. Despu´es de analizar 25 rocas se obtiene un contenido porcentual medio de 9.77 con una cuasidesviaci´on t´ıpica de 3.164. La explota-ci´on comercial de este mineral es econ´omicamente rentable si el contenido medio en la mina es superior al 8 %.

a) Construye un intervalo de confianza de nivel 95 % para el contenido porcentual medio de cadmio en la mina.

b) Otro indicador de la calidad de la mina es la uniformidad de su contenido mineral medida a trav´es de la varianzaσ, que debe ser menor al 3 %. Construye un intervalo de confianza de nivel 95 % paraσ2.

20. Como parte de un estudio para la reducci´on de los gases de efecto invernadero que emiten los coches, se estudian los efectos de un determinado aditivo que reduce las emisiones. SeaX el n´umero de kil´ometros recorridos por un coche con un litro de gasolina sin el aditivo. Sea Y el n´umero de kil´ometros recorridos con un litro de gasolina con el aditivo. Se observan los kil´ometros recorridos por litro de gasolina en ocho coches, cuatro de ellos sin aditivo. Los datos que se obtienen son:

4 �

i=1

xi = 25.4

4 �

i=1

yi = 31.2

4 �

i=1 x2

i = 173.53

4 �

i=1 y2

i = 261.22

a) Suponiendo que el aditivo puede cambiar la media pero no la varianza, y especificando las hip´otesis necesarias, calcula un intervalo de confianza al 95 % para la diferencia de medias.

b) A la vista del intervalo obtenido ena), ¿hay alguna indicaci´on de que el aditivo tiene alg´un efecto en el n´umero de kil´ometros recorridos por litro de gasolina?

Figure

Actualización...

Referencias

Actualización...