M´etodos Estad´ısticos de la Ingenier´ıa
Tema 10: Inferencia Estad´ıstica,
Intervalos de Confianza
Grupo B
´
Area de Estad´ıstica e Investigaci´on Operativa Licesio J. Rodr´ıguez-Arag´on
Abril 2010
Contenidos. . . 2
Estimaci´on por Intervalos 3 Intervalos de Confianza . . . 4
Intervalos para Medias 5 Intervalo paraµ cuandoσ es Conocida . . . 6
Ejemplo de intervalo de confianza con R . . . 7
Intervalo paraµ cuandoσ es Desconocida . . . 8
Ejemplo de intervalo de confianza con R . . . 9
Ejemplo de intervalo de confianza con R . . . 10
Intervalo paraµ1−µ2 con σ1 yσ2 Conocidas. . . 11
Intervalo paraµ1−µ2 con σ1 yσ2 Desconocidas . . . 12
Intervalo paraµ1−µ2 con σ1 yσ2 Desconocidas . . . 13
Intervalos para Varianzas 14 Estimaci´on de la Varianza . . . 15
Estimaci´on de Proporciones 16 Estimaci´on de una Proporci´on . . . 17
Contenidos
Estimaci´on por Intervalos. Intervalos para la Media. Intervalos para Varianzas. Estimaci´on de Proporciones.
A´un el estimador centrado m´as eficiente es improbable que estime con exactitud el valor del par´ametro de la poblaci´on, de ah´ı nace la necesidad de obtener un intervalo
dentro del cual se espera hallar el valor del par´ametro.
Instead of estimating the parameter by a single value, a Confidence Interval likely to include the parameter is given.
Licesio J. Rodr´ıguez-Arag´on Tema 10, M.E.I. – 2 / 17
Estimaci´
on por Intervalos
3 / 17
Intervalos de Confianza
Una estimaci´on por intervalos, de un par´ametroθ, es un intervalo de la forma ˆθI< θ <θˆS tal que
se verifique,
P(ˆθI < θ <θˆS) =γ
con γ suficientemente pr´oximo a 1.
Los valores ˆθI y ˆθS se denominan L´ımites de Confianza,Confidence Limits.
Mientras que γ es el Coeficiente de Confianza,Confidence Level.
En ocasiones, en lugar de fijarγ se fija su valor complementario,α= 1−γ, que normalmente ser´a un valor peque˜no. ´Este es elCoeficiente de Significaci´on,Significance, y representa la
probabilidad de fallar en la estimaci´on.
Intervalos para Medias
5 / 17
Intervalo para µ cuando σ es Conocida
SeaX1, X2, . . . , Xn una m.a.s. procedente de una N(µ, σ), conµ desconocida yσ conocida.
Queremos estimar µcon un nivel de confianzaγ.
Estimaremos la media poblacional µa partir de la media muestral ˆµ=X. El Teorema Central del Limite nos asegura que X≡ N(µ, σ/√n).
Buscamos ˆµI =ay ˆµS =b, extremos del intervalo de confianza, tales que:
P(a≤X≤b) =γ = 1−α P(a≤X≤b) = P((a−µ)/(σ/√n)/≤(X−µ)/(σ/√n)≤(b−µ)/(σ/√n)) P(a≤X≤b) = P((a−µ)/(σ/√n)/≤Z ≤(b−µ)/(σ/√n)) =γ Con Z≡ N(0,1). entonces: (a−µ)/(σ/√n) =z1−γ 2 ⇒ a=µ+ (σ/√n)z1−γ 2 (b−µ)/(σ/√n) =z1+γ 2 ⇒ b=µ+ (σ/√n)z1+γ 2 −3 −2 −1 0 1 2 3 0.0 0.1 0.2 0.3 0.4 Z Densidad γ Z((1− γ)2) Z((1+ γ)2)
Teniendo en cuenta que para laN(0,1), z1+γ
2 =−z 1−γ 2 . P(a≤X ≤b) = P(µ−(σ/√n)z1+γ 2 ≤ X≤µ+ (σ/√n)z1+γ 2 ) = = P(X−(σ/√n)z1+γ 2 ≤ µ≤X+ (σ/√n)z1+γ 2 ) =γ Luego tenemos que el intervalo de confianza para el nivelγ ser´a,
I = [X−(σ/√n)z1+γ 2 , X+ (σ/ √ n)z1+γ 2 ] Recordemos que z1+γ 2 es tal que, Φ(z) = 1+2γ. Los Coeficientes de Confianza m´as usuales son: γ = 0.95,z1+γ
2
=z0.975= 1.96,
γ = 0.99,z1+γ
2 =z0.995= 2.58.
Ejemplo de intervalo de confianza con R
Sea una m.a.s de tama˜non= 10 proveniente de una poblaci´on de varianza σ2 = 4.9 y media desconocida:
> x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > xbarra <- mean(x)
> sigma <- sqrt(4.9) > n <- length(x)
> c(xbarra - sigma/sqrt(n) * qnorm(0.975), xbarra + sigma/sqrt(n) *
+ qnorm(0.975))
[1] 14.18803 16.93197
> c(xbarra - sigma/sqrt(n) * qnorm(0.995), xbarra + sigma/sqrt(n) *
+ qnorm(0.995))
[1] 13.75692 17.36308
Intervalo para µ cuando σ es Desconocida
SeaX1, X2, . . . , Xn una m.a.s. procedente de una N(µ, σ), conµ yσ desconocidas.
Queremos estimar µcon un nivel de confianzaγ.
Estimaremos la media poblacional µa partir de la media muestral ˆµ=X y la varianza poblacional σ2 a partir de la cuasivarianza muestral ˆσ2 =S2c.
Buscamos ˆµI =ay ˆµS =b, extremos del intervalo de confianza, tales que:
P(a≤X≤b) =γ = 1−α P(a≤X ≤b) = P((a−µ)/(Sc/√n)/≤(X−µ)/(Sc/√n)≤(b−µ)/(Sc/√n)) P(a≤X≤b) = P((a−µ)/(Sc/√n)/≤T ≤(b−µ)/(Sc/√n)) =γ Con T ≡tn−1. entonces: (a−µ)/(Sc/√n) = tn−1,1−γ 2 ⇒ a=µ+ (Sc/√n)tn−1,1−γ 2 (b−µ)/(Sc/√n) = tn−1,1+γ 2 ⇒b=µ+ (Sc/ √ n)tn −1, 1+γ 2 −3 −2 −1 0 1 2 3 0.0 0.1 0.2 0.3 0.4 T Densidad γ t(n−1, (1− γ)2) t(n−1, (1+ γ)2)
Teniendo en cuenta que para la tn−1, tn−1,1+γ 2 =−tn −1, 1−γ 2 . P(a≤X≤b) = P(µ−(Sc/√n)tn−1,1+γ 2 ≤X≤µ+ (Sc/ √ n)tn −1, 1+γ 2 ) = = P(X−(Sc/√n)tn−1,1+γ 2 ≤µ≤X+ (Sc/ √ n)tn −1, 1+γ 2 ) =γ
Luego tenemos que el intervalo de confianza para el nivelγ ser´a, I = [X−(Sc/√n)tn−1,1+γ 2 , X+ (Sc/√n)tn−1,1+γ 2 ] Recordemos que tn −1, 1+γ
2 son los cuantiles
1+γ
2 de una distribuci´on tn−1.
Los Coeficientes de Confianza m´as usuales son: γ = 0.95, por ejemplo para n=20, tn
−1, 1+γ
2
= t19,0.975 = 2.09,
γ = 0.99, por ejemplo para n=20, tn
−1, 1+γ
2
= t19,0.995 = 2.86.
Ejemplo de intervalo de confianza con R
Sea una m.a.s de tama˜non= 10 proveniente de una poblaci´on de varianza y media desconocidas:
> x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > xbarra <- mean(x) > Sc <- sqrt(var(x)) > n <- length(x) > c(xbarra - Sc/sqrt(n) * qt(0.975, n - 1), xbarra + Sc/sqrt(n) * + qt(0.975, n - 1)) [1] 13.56776 17.55224 > c(xbarra - Sc/sqrt(n) * qt(0.995, n - 1), xbarra + Sc/sqrt(n) * + qt(0.995, n - 1)) [1] 12.69793 18.42207
Ejemplo de intervalo de confianza con R
> x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > t.test(x, conf.level = 0.95)
One Sample t-test
data: x
t = 17.6681, df = 9, p-value = 2.702e-08
alternative hypothesis: true mean is not equal to 0 95 percent confidence interval:
13.56776 17.55224 sample estimates: mean of x
15.56
Licesio J. Rodr´ıguez-Arag´on Tema 10, M.E.I. – 10 / 17
Intervalo para µ1−µ2 con σ1 y σ2 Conocidas
SeanX1 yX2 medias de muestras aleatorias independientes de poblaciones normales N(µ1, σ1),
N(µ2, σ2) de tama˜nosn1, n2 extra´ıdas de poblaciones con varianzas conocidasσ12, σ22.
Queremos estimar µ1−µ2 con un nivel de confianzaγ a partir de la diferencia entre las medias
muestrales µ\1−µ2 =X1−X2. Consideremos la variable: Z = (X1−qX2)−(µ1−µ2) σ2 1 n1 + σ2 2 n2 , tal queZ ≡ N(0,1). Entonces P(z1−γ 2 ≤Z ≤z 1+γ 2 ) =γ = 1−α.
De esta forma tendremos: P((X1−X2)−( s σ12 n1 + σ 2 2 n2 )z1+γ 2 ≤µ1−µ2≤(X1−X2) + s σ21 n1 +σ 2 2 n2 z1+γ 2 ) =γ
Luego tenemos que el intervalo de confianza para el nivelγ ser´a,
I = (X1−X2)− s σ2 1 n1 +σ 2 2 n2 z1+γ 2 ,(X1−X2) + s σ2 1 n1 +σ 2 2 n2 z1+γ 2
Intervalo para µ1−µ2 con σ1 y σ2 Desconocidas
SeanX1 yX2 medias de muestras aleatorias independientes de poblaciones normales N(µ1, σ1),
N(µ2, σ2) de tama˜nosn1, n2 extra´ıdas de poblaciones con varianzas desconocidasσ12, σ22.
Queremos estimar µ1−µ2 con un nivel de confianzaγ a partir de la diferencia entre las medias
muestrales µ\1−µ2 =X1−X2.
Caso I: Varianzas desconocidas pero iguales,σ =σ1 =σ2, consideremos la variable:
Z = (X1r−X2)−(µ1−µ2) σ21 n1 + 1 n2 ,
Las variables aleatorias de la forma, (n−1)Sc2
σ2 siguen distribucionesχ2n−1. R= (n1−1)S 2 c1 σ2 + (n2−1)Sc22 σ2 ≡χ 2 n1+n2−2
Las variables aleatorias Z yR son independientes y el estad´ıstico, T = q Z R n1+n2−2 = (X1r−X2)−(µ1−µ2) σ21 n1 + 1 n2 : s (n1−1)Sc21 + (n2−1)S 2 c2 σ2(n 1+n2−2) T ≡tn1+n2−2.
La varianza σ2 se estima mediante la expresi´on, Sp2 = (n1−1)S 2 c1 + (n2−1)S 2 c2 n1+n2−2 .
Con lo que el estimador T resulta,
T = (X1r−X2)−(µ1−µ2) S2 p 1 n1 + 1 n2 ≡ tn1+n2−2
Luego tenemos que el intervalo de confianza para el nivelγ ser´a,
I = " (X1−X2)− s S2 p 1 n1 + 1 n2 tn1+n2 −2, 1+γ 2 , (X1−X2) + s S2 p 1 n1 + 1 n2 tn 1+n2−2,1+2γ # Equivalentemente,
Intervalo para µ1−µ2 con σ1 y σ2 Desconocidas
Caso II:Varianzas desconocidas y distintas,σ16=σ2, consideremos la variable:
T = (X1r−X2)−(µ1−µ2) S2 c1 n1 + S2 c2 n2 ,
sigue, aproximadamente, una tg, dondeg est´a dado por la aproximaci´on de Welch:
g= S2 c1 n1 + S2 c2 n2 2 (S2 c1/n1) 2 n1−1 + (S2 c2/n2) 2 n2−1
El valor deg se puede redondear al valor entero m´as cercano. Luego tenemos que el intervalo de confianza para el nivelγ ser´a,
I = " (X1−X2)− s S2 c1 n1 +S 2 c2 n2 tg,1+γ 2 ,(X1−X2) + s S2 c1 n1 +S 2 c2 n2 tg,1+γ 2 # Equivalentemente, (X1−X2)± s S2 c1 n1 +S 2 c2 n2 tg,1+γ 2
Intervalos para Varianzas
14 / 17
Estimaci´on de la Varianza
SeaX1, X2, . . . , Xn una muestra aleatoria simple de una distribuci´onN(µ, σ).
Queremos estimar σ2 para un nivel de confianza γ.
Caso I: Mediaµ, conocida. Teniendo en cuenta que nSσ22 ≡χ2n. Podemos encontrar dos cuantiles
ayb de la χ2n tales que: P(a≤ nS 2 σ2 ≤b) = P(a≤ P (Xi−µ)2 σ2 ≤b) =γ.
Siendo entonces el intervalo de confianza paraσ2:
I = P (Xi−µ)2 χ2 n,1+γ 2 , P (Xi−µ)2 χ2 n,1−γ 2 .
Caso II:Media µ, desconocida. Teniendo en cuenta que (n−1)Sc2
σ2 ≡χ2n−1. Podemos encontrar
dos cuantiles ayb de laχ2n−1 tales que:
P(a≤ (n−1)S
2
c
σ2 ≤b) =γ.
Siendo entonces el intervalo de confianza paraσ2:
I = (n−1)Sc2 χ2 n−1, 1+γ 2 ,(n−1)S 2 c χ2 n−1, 1−γ 2 .
Estimaci´
on de Proporciones
16 / 17
Estimaci´on de una Proporci´on
Si muestreamos una poblaci´on binomialB(n, p), de la que desconocemos p, tomando una observaci´on X, buscamos estimar un intervalo de confianza parap∈(0,1).
Sabemos que E(X) =np, con lo que tomaremos como estimador ˆp=X/n.
Paransuficientemente grande ˆp se distribuye siguiendo unaN(µ=p, σ2 =pq/n), luego Z = ppˆ−p
pq/n ≡ N(0,1). Luego el intervalo de confianza para la p ser´a,
I = " ˆ p− r ˆ pqˆ nz1+γ 2 ,pˆ+ r ˆ pqˆ nz1+γ 2 # .