• No se han encontrado resultados

Tema 5. Intervalos de confianza

N/A
N/A
Protected

Academic year: 2023

Share "Tema 5. Intervalos de confianza"

Copied!
35
0
0

Texto completo

(1)

Tema 5 - Introducci´ on

Tema 3. Estimaci´ on puntual

Tema 4. Estimadores de m´ axima verosimilitud

Generalizaci´ on

Tema 5. Intervalos de confianza

Definici´on.

Intervalos de confianza para medias y varianzas en poblaciones normales.

Intervalos de confianza en muestras grandes.

Determinaci´on del tama˜no muestral.

(2)

Distribuci´ on temporal del temario

1 2 3 4 5 6 7 8 9

Tema 1 T T T P

Tema 2 T T T P T T T P P

Tema 3 T T T P T T T P P

Tema 4 T T T P T T T P P

Tema 5 T T T P T T T P P

Tema 6 T T T P T T T P P

Tema 7 T T T P T T T P P

7 7 7 7 6 6 6 6 6 58

0 0 0 7 0 0 0 6 6 19

T denota una hora de clase de teor´ıa P denota una hora de clase pr´actica

(3)

Tema 5. Intervalos de confianza

Los contenidos a desarrollar en este tema son los siguientes:

Definici´on e interpretaci´on frecuentista.

Intervalos de confianza para medias y varianzas en poblaciones normales:

casos de una y dos poblaciones.

Intervalos de confianza en muestras grandes.

Determinaci´on del tama˜no muestral.

Lecturas recomendadas: Secciones 8.1 a 8.10 del libro de Pe˜na (2005) y el cap´ıtulo 8 de Newbold (2001).

(4)

Estimador por intervalos de confianza

Definici´on 1. Sea XXX = (X1, X2, . . . , Xn) una muestra aleatoria de una poblaci´on X con funci´on de distribuci´on Fθθθ donde θθθ = (θ1, θ2, . . . , θk) es un vector de par´ametros. Un estimador por intervalos de confianza de θi al nivel de confianza 1 − α es una funci´on que a la muestra xxx = (x1, x2, . . . , xn) le hace corresponder un intervalo (T1(xxx), T2(xxx)) =

T1(x1, x2, . . . , xn), T2(x1, x2, . . . , xn)

que satisface:

Pr{θi ∈ (T1(XXX), T2(XXX))} = 1 − α, para cada θi ∈ Θi.

Observaci´on 1: Notar que (T1(XXX), T2(XXX)) 6= (T1(xxx), T2(xxx)).

Observaci´on 2: Se dice (T1(xxx), T2(xxx)) es un intervalo de confianza de θi.

(5)

Ejemplo 1. Sea XXX = (X1, X2, . . . , Xn) una muestra aleatoria simple de una poblaci´on X ∼ N(µ, σ2) con σ2 conocida. Hallar un estimador por intervalos de confianza para la media, µ.

Sabemos que X¯ ∼ N(µ, σn2).

Por tanto, X¯−µσ n

∼ N(0,1).

Entonces, Pr n

− zα/2 < X¯−µσ n

< zα/2o

= 1 − α.

I Un intervalo de confianza para µ es:

X¯ − zα/2σn,X¯ + zα/2σn .

I Otros intervalos son:

X¯ − zασn,+∞

y

−∞,X¯ + zασn

.

(6)

Cantidad pivotal

Definici´on 2. Sea XXX = (X1, X2, . . . , Xn) una muestra aleatoria de una poblaci´on X con funci´on de distribuci´on Fθθθ donde θθθ = (θ1, θ2, . . . , θk) es un vector de par´ametros. Una cantidad pivotal para θi es una funci´on C(X1, X2, . . . , Xn, θi) tal que su distribuci´on no depende de θi.

Ejemplo 1.

Sabemos que X¯−µσ n

∼ N(0,1).

Entonces, X¯−µσ n

es una cantidad pivotal para µ.

(7)

M´ etodo de la cantidad pivotal

Si tenemos una cantidad pivotal, para construir intervalos de confianza se puede utilizar el siguiente procedimiento:

1. Obtener la distribuci´on de la cantidad pivotal.

2. Obtener C1 y C2 tales que Pr {C1 < C(X1, X2, . . . , Xn, θi) < C2} = 1−α.

3. Despejar θi de las desigualdades C1 < C(X1, X2, . . . , Xn, θi) < C2, esto es, lograr T1(X1, X2, . . . , Xn) < θi < T2(X1, X2, . . . , Xn).

Finalmente, (T1(x1, x2, . . . , xn), T2(x1, x2, . . . , xn)) es un intervalo para θi.

Volvamos al Ejemplo 1

(8)

Ejemplo 2. Supongamos que los rendimientos de las acciones de la empresa SEGURA.SL siguen una distribuci´on normal de media µ euros y varianza σ2 = 1.

Se toma una m.a.s. de 20 rendimientos y se tiene:

5,29 3,66 5,71 6,62 4,30 5,85 6,25 3,40 3,55 5,57 4,60 5,69 5,81 5,71 6,29 5,66 6,19 3,79 4,98 4,84

(a) Calcular un intervalo de confianza al 90 % para el rendimiento promedio de esta empresa.

¯

x = 1

20 (5,29 + 3,66 + · · · + 4,84) = 5,188,

¯

x − zα/2 σ

√n,x¯ + zα/2 σ

√n

= (5,188 − 1,645 × 1

√10, 5,188 + 1,645 × 1

√10)

= (4,6678, 5,7082) I ¿Pr(µ ∈ (4,6678, 5,7082))? ¿µ ∈ (4,6678, 5,7082) ?

(9)

Interpretaci´ on frecuentista del intervalo de confianza

(10)

Tema 5. Intervalos de confianza

Los contenidos a desarrollar en este tema son los siguientes:

Definici´on e interpretaci´on frecuentista.

X

Intervalos de confianza para medias y varianzas en poblaciones normales:

casos de una y dos poblaciones.

Intervalos de confianza en muestras grandes.

Determinaci´on del tama˜no muestral.

(11)

Distribuciones asociadas a la distribuci´ on normal - χ χ χ

222

Definici´on 3. Sean X1, X2, . . . , Xn variables aleatorias independientes e id´enticamente distribuidas N(0,1). La distribuci´on χχχ222 con n grados de libertad es la distribuci´on de la v.a. S =

n

P

i=1

Xi2.

E[S] = n.

Var(S) = 2n.

χ2α

α

(12)

Distribuciones asociadas a la distribuci´ on normal ttt de Student

Definici´on 4. Sean Y , X1, X2, . . . , Xn variables aleatorias independientes e id´enticamente distribuidas N(0,1). La distribuci´on ttt de Student con n grados de libertad es la distribuci´on de la v.a. T = PnY

i=1 Xi2.

E[T] = 0.

Var(T) = n−2n .

− tα 0 tα

α α

(13)

Distribuciones asociadas a la distribuci´ on normal F F F de Fisher

Definici´on 5. Sean X1, X2, . . . , Xn e Y1, Y2, . . . , Ym variables aleatorias in- dependientes e id´enticamente distribuidas N(0,1). La distribuci´on FFFn,mn,mn,m de Fisher–Snedecor con n y m grados de libertad es la distribuci´on de la v.a.

F =

1 n

Pn

i=1 Xi2

1 m

Pm

i=1 Yi2.

E[F] = m−2m .

Var(F) = n(m−2)2m2(n+m−2)2(m−4). 1/T ∼ Fm,n.

Fn,m,α = 1/Fm,n,1−α.

Fn,m,α

α

(14)

Cantidades pivotales en la distribuci´ on normal

Lema de Fisher: Sean X1, X2, . . . , Xn v.a. i.i.d. N(µ, σ2). Entonces:

(i) X¯ ∼ N(µ, σn2).

(ii) (n−1)σ2 S2 ∼ χ2n−1.

(iii) X¯ y S2 son independientes.

Corolario:

X¯−µ

σ n

es una cantidad pivotal para µ. W Util si conocemos´ σ2. X¯−µ

S n

es una cantidad pivotal para µ.

(n−1)

σ2 S2 es una cantidad pivotal para σ2.

(15)

I.C. en la distribuci´ on normal

Intervalos de confianza de nivel 111 −−− ααα para µµµ:

(a) Con σ conocida:

I =

¯

x ∓ zα/2 σ

√n

(b) Con σ desconocida:

I =

¯

x ∓ tn−1;α/2 s

√n

Intervalo de confianza de nivel 111 −−− ααα para σσσ222: I =

"

(n − 1)s2

χ2n−1;α/2 , (n − 1)s2 χ2n−1;1−α/2

#

(16)

Ejemplo 2. Supongamos que los rendimientos de las acciones de la empresa SEGURA.SL siguen una distribuci´on normal de media µ euros y varianza σ2,

ambas desconocidas .

(b) Calcular un intervalo de confianza al 90 % para el rendimiento promedio de esta empresa.

¯

x = 1

20 (5,29 + 3,66 + · · · + 4,84) = 5,188, s2 = 1

19 (5,29 − 5,188)2 + (3,66 − 5,188)2 + · · · + (4,84 − 5,188)2

= 0,9929.

¯

x − tn−1,α/2 s

√n,x¯ + tn−1,α/2 s

√n

= (5,188 ∓ 1,729p

0,9929/10)

= (4,6432,5,7328)

I ¿Pr(µ ∈ (4,6432,5,7328))? ¿µ ∈ (4,6432,5,7328)?

(17)

Ejemplo 2.

(c) Calcular un intervalo de confianza al 90 % para la varianza del rendimiento.

s2 = 1

19 (5,29 − 5,188)2 + (3,66 − 5,188)2 + · · · + (4,84 − 5,188)2

= 0,9929.

(n − 1)s2

χ2n−1;α/2 , (n − 1)s2 χ2n−1;1−α/2

!

=

19 × 0,9929

30,14 , 19 × 0,9929 10,12

= (0,6259,1,8641)

I ¿Pr(σ2 ∈ (0,6259,1,8641)? ¿σ2 ∈ (0,6259,1,8641)? ¿1 ∈ (0,6259,1,8641)?

(18)

I.C. en muestras grandes - 1

Sean X1, X2, . . . , Xn variables aleatorias independientes siendo el tama˜no de muestra suficientemente grande (n > 30). Entonces la distribuci´on de X¯ es aproximadamente una N(µ, Sn2).

X¯−µ

S n

es una cantidad pivotal para µ.

Intervalos de confianza de nivel 111 −−− ααα para µµµ (con n > 30):

I =

¯

x ∓ zα/2 s

√n

Ejemplo 3. Aplicar el resultado anterior para obtener un intervalo de confianza de una proporci´on.

(19)

Ejemplo 4. Un partido pol´ıtico pretende conocer la intenci´on de voto de cara a las pr´oximas elecciones. Para ello encarga un sondeo sobre un total de 230 personas, de las que 69 contestan que le votar´ıan.

a) Hallar un intervalo de confianza al 90 % para la verdadera proporci´on poblacional, indicando las hip´otesis asumidas.

pb= 23069 = 0,3.

α = 0,1 ⇒ α2 = 0,05 ⇒ zα

2 = 1,645.

Hip´otesis asumidas: M.A.S de una Bernoulli(p), y n grande.

pb± zα

2

q

p(1−b p)b

n = 0,3 ± 1,645 × 0,0302 = 0,3 ± 0,049679.

I Con lo que el intervalo resultante es (0,2503,0,3497).

(20)

b) Si el intervalo result´o ser (0,243,0,357), ¿cu´al fue el nivel de confianza elegido?

La longitud del intervalo = 0,357 − 0,243 = 0,114.

0,114 = 2zα

2

q0,3×(1−0,3)

230 ⇒ zα

2 = 1,8874

α

2 = 1 − 0,9706 ⇒ 1 − α = 0,9412.

I Se trata de un intervalo al 94,12 %.

(21)

Cantidades pivotales en dos poblaciones con distribuci´ on normal

Proposici´on 1: Sean X1, X2, . . . , Xn v.a. i.i.d. N(µ1, σ12) e Y1, Y2, . . . , Ym v.a. i.i.d. N(µ2, σ22) e independientes entre si. Entonces:

(i) X¯rY¯−(µ1−µ2)

σ2 n1+σ

22 m

∼ N(0,1).

(ii) Si σ1 = σ2, X¯qY¯−(µ1−µ2) Sp2(n1+m1 )

∼ tn+m−2 donde Sp2 = (n−1)S

2

1+(m−1)S22 n+m−2 . (iii) Si σ1 6= σ2, X¯rY¯−(µ1−µ2)

S2 n1+S

22 m

∼ tf donde f es el entero m´as pr´oximo a

(s21/n1+s22/n2)2

(s2

1/n1)2 n1−1 +(s

2

2/n2)2 n2−1

.

(22)

Cantidades pivotales en dos poblaciones con distribuci´ on normal

Corolario 1:

X¯Y¯−(µ1−µ2) r

σ2 n1+σ

22 m

es una cantidad pivotal. W Util si conocemos´ σ1 y σ2.

X¯Y¯−(µ1−µ2) q

Sp2

(

n1+m1

)

es una cantidad pivotal. W alida si σ1 = σ2.

X¯Y¯−(µ1−µ2) r

S2 n1+S

22 m

es una cantidad pivotal para µ1 − µ2.

(23)

I.C. en dos poblaciones con distribuci´ on normal

Intervalos de confianza de nivel 111 −−− ααα para µµµ111 −−− µµµ222: (a) σ1 y σ2 conocidas:

I =

¯

x − y¯ ∓ zα/2 q

σ12/n + σ22/m

.

(b) σ1 y σ2 desconocidas e iguales:

I = h

¯

x − y¯ ∓ tn1+n2−2;α/2 spp

1/n + 1/mi .

(c) σ1 y σ2 desconocidas y diferentes:

I =

¯

x − y¯ ∓ tf;α/2 q

s21/n + s22/m

.

(24)

Proposici´on 1: (continuaci´on)

(iv)

S2 1 σ2 1 S2 2 σ2 2

∼ Fn−1,m−1.

Corolario 1: (continuaci´on)

S2 1 σ2 1 S2 2 σ2 2

es una cantidad pivotal para el cociente σ

2 1

σ22.

Intervalos de confianza de nivel 111 −−− ααα para σσσ121122/σ/σ/σ222222: I =

s21/s22

Fn−1,m−1;α/2

, s21

s22Fm−1,n−1;α/2

.

(25)

Ejemplo 5. Queremos ver mediante un intervalo de confianza si los pa´ıses emergentes tienen en media la misma inflaci´on que los pa´ıses desarrollados.

Para eso, tomamos la inflaci´on en 10 pa´ıses emergentes y en 10 pa´ıses desarrollados.

Desarrollados 3,99 4,07 3,70 1,79 5,30 3,47 2,39 3,33 4,14 3,11 Emergentes 4,73 5,01 5,07 4,66 4,49 4 4,33 5,14 3,15 3,46

a) Calcular un intervalo de confianza para el cociente de varianzas.

b) ¿Es posible calcular un I.C. para la diferencia de medias? ¿a qu´e conclusiones llegamos?

c) Comentar los supuestos que hay que hacer.

(26)

Ejemplo 5. a)

Comparison of Standard Deviations ---

Desarrollados Emergentes

--- Standard deviation 0.976632 0.680199

Variance 0.95381 0.462671

Df 9 9

Ratio of Variances = 2.06153 95.0% Confidence Intervals

Standard deviation of Desarrollados: [0.671762;1.78295]

Standard deviation of Emergentes: [0.467865;1.24178]

Ratio of Variances: [0.512055;8.2997]

(27)

Ejemplo 5. b)

Comparison of Means ---

95.0% confidence interval for mean of Desarrollados: [2.83036,4.22764]

95.0% confidence interval for mean of Emergentes: [3.91741,4.89059]

95.0% confidence interval for the difference between the means

assuming equal variances: -0.875 +/- 0.790708 [-1.66571,-0.0842918]

Comparison of Means ---

95.0% confidence interval for mean of Desarrollados: [2.83036,4.22764]

95.0% confidence interval for mean of Emergentes: [3.91741,4.89059]

95.0% confidence interval for the difference between the means

not assuming equal variances: -0.875 +/- 0.797578 [-1.67258,-0.0774224]

(28)

I.C. en muestras grandes - 2

Sean (X1, X2, . . . , Xn) e (Y1, Y2, . . . , Ym) variables aleatorias i.i.d. e inde- pendientes entre si, siendo los tama˜nos de muestra suficientemente grandes (n, m > 30). Entonces la distribuci´on de X¯ − Y¯ es aproximadamente una N(µ1 − µ2, S

2 1

n + S

2 2

m).

X¯Y¯−(µ1−µ2) S2

n1+S

22 m

1/2 es una cantidad pivotal para µ1 − µ2.

Intervalos de confianza de nivel 111 −−− ααα para µµµ (con n, m > 30):

I =

"

¯

x − y¯ ∓ zα/2

rS12

n + S22 m

#

Ejemplo 6. Aplicar el resultado anterior para obtener un intervalo de confi- anza para la diferencia de dos proporciones.

(29)

Ejemplo 7. En un sondeo de opini´on llevado a cabo en el a˜no 2002 con 1000 individuos en las ciudades de Murcia y Cartagena se encontr´o que el 55 % de ellos eran favorables a la construcci´on de un nuevo aeropuerto.

Dicho sondeo se repiti´o en el a˜no 2003 tras una intensa campa˜na publicitaria, encontr´andose esta vez un 60 % de individuos favorables a esta opci´on, entre 1500 encuestados. Se pide:

a) Construir un intervalo de confianza de nivel 95 % para la proporci´on p1 de individuos favorables a la construcci´on del nuevo aeropuerto, de entre los encuestados en el a˜no 2002. ¿Podr´ıa afirmarse al nivel de significaci´on del 5 % que s´olo la mitad de los encuestados prefer´ıan un nuevo aeropuerto?

b) Planteando los supuestos necesarios, construir un intervalo de confianza al 95 % para la diferencia p2 − p1 de las proporciones de individuos favorables en los a˜nos 2003 y 2002. ¿Podr´ıa afirmarse al nivel de significaci´on del 5 % que la campa˜na publicitaria en favor de la construcci´on del nuevo aeropuerto pudo tener efecto?

(30)

a) IC(p1,95 %) = ˆp1 ± 1,96

rpˆ1(1 − pˆ1)

n1 = [0,5192, 0,5808]

Como dicho intervalo no contiene el valor p=0.5 no podemos afirmar al nivel de significaci´on del 5 % que s´olo la mitad de los encuestados eran favorables al nuevo aeropuerto.

b) Si suponemos que las muestras de encuestados en los a˜nos 2002 y 2003 son independientes, se tendr´a:

IC(p2 − p1,95 %) = ˆp2 − pˆ1 ± 1,96

rpˆ1(1 − pˆ1)

n1 + pˆ2(1 − pˆ2)

n2 =

= 0,6−0,55±1,96

r0,55(0,45)

1000 + 0,6(0,4)

1500 = 0,05±0,0396 = [0,0104,0,0896].

Como este intervalo s´olo contiene valores positivos, podemos afirmar al nivel de significaci´on del 5 % que la campa˜na publicitaria en favor del nuevo aeropuerto pudo tener efecto.

(31)

Tema 5. Intervalos de confianza

Los contenidos a desarrollar en este tema son los siguientes:

Definici´on e interpretaci´on frecuentista.

X

Intervalos de confianza para medias y varianzas en poblaciones normales:

casos de una y dos poblaciones.

X

Intervalos de confianza en muestras grandes.

X

Determinaci´on del tama˜no muestral.

(32)

C´ alculo del tama˜ no muestral

Definici´on 6. El error de una estimaci´on por intervalos de confianza de nivel 1 − α es la semiamplitud del intervalo obtenido.

Ejemplo 8. Volviendo al Ejemplo 1, supongamos que Var(X) = 25, ¿cu´al debe ser el m´ınimo tama˜no muestral para que el error de estimaci´on no sea superior a 0.5 con nivel de confianza del 95 %?

Sabemos que la semiamplitud el intervalo es: zα/2σn. Imponemos que zα/2σn < 0,5.

Sustituyendo los valores: 1,965n < 0,5.

Por tanto, 384,16 ≤ n. W nminimo = 385.

(33)

Ejemplo 9. Volviendo al Ejemplo 4

c) Si el partido quisiera un intervalo de confianza al 90 % cuya longitud no excediera de 0.15, ¿cu´al ser´ıa el tama˜no muestral necesario?

La longitud del intervalo = 2zα

2

q

p(1−b p)b n .

El intervalo de confianza alcanzar´a su longitud m´axima cuando pb= 12, de modo que calcularemos n para este caso que es el m´as desfavorable.

En ese caso, longitud = 2zα

2

q 1 4n

1 − α = 0,9 ⇒ α2 = 0,05 ⇒ zα

2 = 1,645.

0,15 = 2 × 1,645

q 1

4n ⇒ √

n = 1,6450,15 = 10,967 ⇒ n = 10,9672 = 120,28.

Por tanto se tomar´ıa n = 121.

(34)

Recapitulaci´ on

Tema 5. Intervalos de confianza

Definici´on e interpretaci´on frecuentista. W ¿Qu´e es un I.C.?

Intervalos de confianza para medias y varianzas en poblaciones normales.

Intervalos de confianza en muestras grandes.

W Ejemplos de inter´es pr´actico.

Determinaci´on del tama˜no muestral. W ¿Cuando y por qu´e?

(35)

Tema 5. Intervalos de confianza

Definici´on.

Ejemplos de intervalos de confianza.

Determinaci´on del tama˜no muestral.

¿Esta θ en el intervalo de confianza?

Tema 6. Contraste de hip´ otesis

Conceptos fundamentales.

Contrastes para la media y la varianza en poblaciones normales.

Contrastes con muestras grandes.

Relaci´on entre los intervalos de confianza y los contrastes de hip´otesis.

Determinaci´on del tama˜no muestral.

Referencias

Documento similar

A pesar de lo anterior, yo les plantearía otra pregunta a los directivos de las instituciones educativas y esta pregunta va más en el contexto de la educación a distancia: