Métodos Estadísticos de la Ingeniería Tema 10: Inferencia Estadística, Intervalos de Confianza Grupo B

(1)

M´etodos Estad´ısticos de la Ingenier´ıa

Tema 10: Inferencia Estad´ıstica,

Intervalos de Confianza

Grupo B

´

Area de Estad´ıstica e Investigaci´on Operativa Licesio J. Rodr´ıguez-Arag´on

Abril 2010

Contenidos. . . 2

Estimaci´on por Intervalos 3 Intervalos de Confianza . . . 4

Intervalos para Medias 5 Intervalo paraµ cuandoσ es Conocida . . . 6

Ejemplo de intervalo de confianza con R . . . 7

Intervalo paraµ cuandoσ es Desconocida . . . 8

Intervalo paraµ1−µ2 con σ1 yσ2 Conocidas. . . 11

Intervalo paraµ1−µ2 con σ1 yσ2 Desconocidas . . . 12

Intervalo paraµ1−µ2 con σ1 yσ2 Desconocidas . . . 13

Intervalos para Varianzas 14 Estimaci´on de la Varianza . . . 15

Estimación de Proporciones 16 Estimación de una Proporción . . . 17

(2)

Contenidos

Estimaci´on por Intervalos. Intervalos para la Media. Intervalos para Varianzas. Estimaci´on de Proporciones.

Aún el estimador centrado más eficiente es improbable que estime con exactitud el valor del parámetro de la población, de ah´ı nace la necesidad de obtener un intervalo

dentro del cual se espera hallar el valor del par´ametro.

Instead of estimating the parameter by a single value, a Confidence Interval likely to include the parameter is given.

Licesio J. Rodr´ıguez-Arag´on Tema 10, M.E.I. – 2 / 17

Estimaci´

on por Intervalos

3 / 17

Intervalos de Confianza

Una estimaci´on por intervalos, de un par´ametroθ, es un intervalo de la forma ˆθI< θ <θˆS tal que

se verifique,

P(ˆθI < θ <θˆS) =γ

con γ suficientemente pr´oximo a 1.

Los valores ˆθI y ˆθS se denominan L´ımites de Confianza,Confidence Limits.

Mientras que γ es el Coeficiente de Confianza,Confidence Level.

En ocasiones, en lugar de fijarγ se fija su valor complementario,α= 1₋γ, que normalmente será un valor pequeño. Éste es elCoeficiente de Significación,Significance, y representa la

probabilidad de fallar en la estimaci´on.

(3)

Intervalos para Medias

_{5 / 17}

Intervalo para µ cuando σ es Conocida

SeaX1, X2, . . . , Xn una m.a.s. procedente de una N(µ, σ), conµ desconocida yσ conocida.

Queremos estimar µcon un nivel de confianzaγ.

Estimaremos la media poblacional µa partir de la media muestral ˆµ=X. El Teorema Central del Limite nos asegura que X≡ N(µ, σ/√n).

Buscamos ˆµI =ay ˆµS =b, extremos del intervalo de confianza, tales que:

P(a≤X≤b) =γ = 1−α P(a_≤X_≤b) = P((a₋µ)/(σ/√n)/_≤(X₋µ)/(σ/√n)_≤(b₋µ)/(σ/√n)) P(a_≤X_≤b) = P((a₋µ)/(σ/√n)/_≤Z _≤(b₋µ)/(σ/√n)) =γ Con Z≡ N(0,1). entonces: (a₋µ)/(σ/√n) =z1−γ 2 ⇒ a=µ+ (σ/√n)z1−γ 2 (b−µ)/(σ/√n) =z1+γ 2 ⇒ b=µ+ (σ/√n)z1+γ 2 −3 −2 −1 0 1 2 3 0.0 0.1 0.2 0.3 0.4 Z Densidad γ Z((1− γ)2) Z((1+ γ)2)

Teniendo en cuenta que para laN(0,1), z1+γ

2 =−z 1−γ 2 . P(a_≤X _≤b) = P(µ₋(σ/√n)z1+γ 2 ≤ X_≤µ+ (σ/√n)z1+γ 2 ) = = P(X₋(σ/√n)z1+γ 2 ≤ µ_≤X+ (σ/√n)z1+γ 2 ) =γ Luego tenemos que el intervalo de confianza para el nivelγ ser´a,

I = [X−(σ/√n)z1+γ 2 , X+ (σ/ √ n)z1+γ 2 ] Recordemos que z1+γ 2 es tal que, Φ(z) = 1+₂γ. Los Coeficientes de Confianza m´as usuales son: γ = 0.95,z1+γ

2

=z0.975= 1.96,

γ = 0.99,z1+γ

2 =z0.995= 2.58.

(4)

Ejemplo de intervalo de confianza con R

Sea una m.a.s de tama˜non= 10 proveniente de una poblaci´on de varianza σ2 = 4.9 y media desconocida:

> x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > xbarra <- mean(x)

> sigma <- sqrt(4.9) > n <- length(x)

> c(xbarra - sigma/sqrt(n) * qnorm(0.975), xbarra + sigma/sqrt(n) *

+ qnorm(0.975))

[1] 14.18803 16.93197

> c(xbarra - sigma/sqrt(n) * qnorm(0.995), xbarra + sigma/sqrt(n) *

+ qnorm(0.995))

[1] 13.75692 17.36308

(5)

Intervalo para µ cuando σ es Desconocida

SeaX1, X2, . . . , Xn una m.a.s. procedente de una N(µ, σ), conµ yσ desconocidas.

Queremos estimar µcon un nivel de confianzaγ.

Estimaremos la media poblacional µa partir de la media muestral ˆµ=X y la varianza poblacional σ2 a partir de la cuasivarianza muestral ˆσ2 =S2_c.

Buscamos ˆµI =ay ˆµS =b, extremos del intervalo de confianza, tales que:

P(a_≤X_≤b) =γ = 1₋α P(a_≤X _≤b) = P((a₋µ)/(Sc/√n)/≤(X−µ)/(Sc/√n)≤(b−µ)/(Sc/√n)) P(a_≤X_≤b) = P((a₋µ)/(Sc/√n)/≤T ≤(b−µ)/(Sc/√n)) =γ Con T _≡tn−1. entonces: (a₋µ)/(Sc/√n) = t_n₋₁_,1−γ 2 ⇒ a=µ+ (Sc/√n)t_n₋₁_,1−γ 2 (b−µ)/(Sc/√n) = t_n₋₁_,1+γ 2 ⇒b=µ+ (Sc/ √ n)t_n −1, 1+γ 2 −3 −2 −1 0 1 2 3 0.0 0.1 0.2 0.3 0.4 T Densidad γ t(n−1, (1− γ)2) t(n−1, (1+ γ)2)

Teniendo en cuenta que para la tn−1, tn₋1,1+γ 2 =₋t_n −1, 1−γ 2 . P(a≤X≤b) = P(µ−(Sc/√n)t_n₋₁_,1+γ 2 ≤X≤µ+ (Sc/ √ n)t_n −1, 1+γ 2 ) = = P(X−(Sc/√n)t_n₋₁_,1+γ 2 ≤µ≤X+ (Sc/ √ n)t_n −1, 1+γ 2 ) =γ

Luego tenemos que el intervalo de confianza para el nivelγ ser´a, I = [X₋(Sc/√n)t_n₋₁_,1+γ 2 , X+ (Sc/√n)t_n₋₁_,1+γ 2 ] Recordemos que t_n −1, 1+γ

2 son los cuantiles

1+γ

2 de una distribuci´on tn−1.

Los Coeficientes de Confianza m´as usuales son: γ = 0.95, por ejemplo para n=20, t_n

−1, 1+γ

2

= t19,0.975 = 2.09,

γ = 0.99, por ejemplo para n=20, t_n

−1, 1+γ

2

= t19,0.995 = 2.86.

(6)

Sea una m.a.s de tama˜non= 10 proveniente de una poblaci´on de varianza y media desconocidas:

> x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > xbarra <- mean(x) > Sc <- sqrt(var(x)) > n <- length(x) > c(xbarra - Sc/sqrt(n) * qt(0.975, n - 1), xbarra + Sc/sqrt(n) * + qt(0.975, n - 1)) [1] 13.56776 17.55224 > c(xbarra - Sc/sqrt(n) * qt(0.995, n - 1), xbarra + Sc/sqrt(n) * + qt(0.995, n - 1)) [1] 12.69793 18.42207

(7)

> x <- c(17.7, 17.3, 13.6, 12.3, 14, 13.1, 13, 15.4, 19.7, 19.5) > t.test(x, conf.level = 0.95)

One Sample t-test

data: x

t = 17.6681, df = 9, p-value = 2.702e-08

alternative hypothesis: true mean is not equal to 0 95 percent confidence interval:

13.56776 17.55224 sample estimates: mean of x

15.56

Licesio J. Rodr´ıguez-Arag´on Tema 10, M.E.I. – 10 / 17

Intervalo para µ1−µ2 con σ1 y σ2 Conocidas

SeanX1 yX2 medias de muestras aleatorias independientes de poblaciones normales N(µ1, σ1),

N(µ2, σ2) de tama˜nosn1, n2 extra´ıdas de poblaciones con varianzas conocidasσ12, σ22.

Queremos estimar µ1−µ2 con un nivel de confianzaγ a partir de la diferencia entre las medias

muestrales µ\1−µ2 =X1−X2. Consideremos la variable: Z = (X1−qX2)−(µ1−µ2) σ2 1 n1 + σ2 2 n2 , tal queZ _{≡ N}(0,1). Entonces P(z1₋γ 2 ≤Z ≤z 1+γ 2 ) =γ = 1−α.

De esta forma tendremos: P((X1−X2)−( s σ₁2 n1 + σ 2 2 n2 )z1+γ 2 ≤µ1−µ2≤(X1−X2) + s σ2₁ n1 +σ 2 2 n2 z1+γ 2 ) =γ

Luego tenemos que el intervalo de confianza para el nivelγ ser´a,

I =  (X₁−X₂)−   s σ2 1 n1 +σ 2 2 n2  z1+γ 2 ,(X1−X2) +   s σ2 1 n1 +σ 2 2 n2  z1+γ 2  

(8)

Intervalo para µ1−µ2 con σ1 y σ2 Desconocidas

SeanX1 yX2 medias de muestras aleatorias independientes de poblaciones normales N(µ1, σ1),

N(µ2, σ2) de tama˜nosn1, n2 extra´ıdas de poblaciones con varianzas desconocidasσ12, σ22.

Queremos estimar µ1−µ2 con un nivel de confianzaγ a partir de la diferencia entre las medias

muestrales µ\1−µ2 =X1−X2.

Caso I: Varianzas desconocidas pero iguales,σ =σ1 =σ2, consideremos la variable:

Z = (X1r−X2)−(µ1−µ2) σ21 n1 + 1 n2 ,

Las variables aleatorias de la forma, (n−1)Sc2

σ2 siguen distribucionesχ2_n₋₁. R= (n1−1)S 2 c1 σ2 + (n2−1)Sc22 σ2 ≡χ 2 n1+n2−2

Las variables aleatorias Z yR son independientes y el estad´ıstico, T = q Z R n1+n2−2 = (X1r−X2)−(µ1−µ2) σ21 n1 + 1 n2 : s (n1−1)Sc21 + (n2−1)S 2 c2 σ2₍_n 1+n2−2) T ≡tn1+n2−2.

La varianza σ2 se estima mediante la expresi´on, S_p2 = (n1−1)S 2 c1 + (n2−1)S 2 c2 n1+n2−2 .

Con lo que el estimador T resulta,

T = (X1r−X2)−(µ1−µ2) S2 p 1 n1 + 1 n2 ≡ tn1+n2−2

Luego tenemos que el intervalo de confianza para el nivelγ ser´a,

I = " (X1−X2)− s S2 p 1 n1 + 1 n2 t_n₁₊_n₂ −2, 1+γ 2 , (X1−X2) + s S2 p 1 n1 + 1 n2 t_n 1+n2−2,1+₂γ # Equivalentemente,

(9)

Intervalo para µ1−µ2 con σ1 y σ2 Desconocidas

Caso II:Varianzas desconocidas y distintas,σ16=σ2, consideremos la variable:

T = (X1r−X2)−(µ1−µ2) _S2 c1 n1 + S2 c2 n2 ,

sigue, aproximadamente, una tg, dondeg est´a dado por la aproximaci´on de Welch:

g= S2 c1 n1 + S2 c2 n2 2 (S2 c1/n1) 2 n1−1 + (S2 c2/n2) 2 n2−1

El valor deg se puede redondear al valor entero m´as cercano. Luego tenemos que el intervalo de confianza para el nivelγ ser´a,

I = " (X1−X2)− s S2 c1 n1 +S 2 c2 n2 t_g,1+γ 2 ,(X1−X2) + s S2 c1 n1 +S 2 c2 n2 t_g,1+γ 2 # Equivalentemente, (X1−X2)± s _S₂ c1 n1 +S 2 c2 n2 t_g,1+γ 2

(10)

Intervalos para Varianzas

_{14 / 17}

Estimaci´on de la Varianza

SeaX1, X2, . . . , Xn una muestra aleatoria simple de una distribuci´onN(µ, σ).

Queremos estimar σ2 para un nivel de confianza γ.

Caso I: Mediaµ, conocida. Teniendo en cuenta que nS_σ22 ≡χ2_n. Podemos encontrar dos cuantiles

ayb de la χ2_n tales que: P(a≤ nS 2 σ2 ≤b) = P(a≤ P (Xi−µ)2 σ2 ≤b) =γ.

Siendo entonces el intervalo de confianza paraσ2:

I =   P (Xi−µ)2 χ2 n,1+γ 2 , P (Xi−µ)2 χ2 n,1−γ 2  .

Caso II:Media µ, desconocida. Teniendo en cuenta que (n−1)Sc2

σ2 ≡χ2_n₋₁. Podemos encontrar

dos cuantiles ayb de laχ2_n₋₁ tales que:

P(a_≤ (n−1)S

2

c

σ2 ≤b) =γ.

Siendo entonces el intervalo de confianza paraσ2:

I =   (n−1)S_c2 χ2 n−1, 1+γ 2 ,(n−1)S 2 c χ2 n−1, 1₋γ 2  .

(11)

Estimaci´

on de Proporciones

_{16 / 17}

Estimaci´on de una Proporci´on

Si muestreamos una poblaci´on binomialB(n, p), de la que desconocemos p, tomando una observaci´on X, buscamos estimar un intervalo de confianza parap∈(0,1).

Sabemos que E(X) =np, con lo que tomaremos como estimador ˆp=X/n.

Paransuficientemente grande ˆp se distribuye siguiendo una_N(µ=p, σ2 =pq/n), luego Z = ppˆ−p

pq/n ≡ N(0,1). Luego el intervalo de confianza para la p ser´a,

I = " ˆ p₋ r ˆ pqˆ nz1+γ 2 ,pˆ+ r ˆ pqˆ nz1+γ 2 # .