Intervalos de Confianza

Texto completo

(1)

Intervalos de Confianza

Álvaro José Flórez

1Escuela de Ingeniería Industrial y Estadística

Facultad de Ingenierías

(2)

Intervalo de Confianza

Se puede hacer una estimación puntual de µ . . .pero no hay razón para esperar que esta estimación proveniente de una muestra sea exactamente igual al parámetro poblacional que se supone estima (diferentes muestras arrojan diferentes resultados). En el caso que se quiera estimarµ por medio dex:¯

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 0 20 40 60 80 100 55 60 65 70 # Muestra Estimación ● Parámetro Estimación

(3)

Intervalo de Confianza

Una estimación por intervalos para un parámetro poblacional es llamada un intervalo de confianza. No podemos estar seguros que el intervalo contiene al verdadero valor del parámetro poblacional desconocido. Sin embargo, el intervalo de confianza es construido de forma que se tenga una alta confianza (probabilidad) de que el intervalo contenga el parámetro poblacional (Montgomery and Runger, 2004).

Definición:Dada una muestra aleatoriaX1, . . . , Xncon función de

densidadf(xi, θ), un intervalo de confianza de(1−α)×100 %para

un parámetro θ es un intervalo aleatorio (T1, T2) con Pr(T1 < θ <

T2) = 1−α.

Para la estimación deµel intervalo de confianza estará determinado como:

¯

(4)

Intervalo de Confianza

Una estimación por intervalos para un parámetro poblacional es llamada un intervalo de confianza. No podemos estar seguros que el intervalo contiene al verdadero valor del parámetro poblacional desconocido. Sin embargo, el intervalo de confianza es construido de forma que se tenga una alta confianza (probabilidad) de que el intervalo contenga el parámetro poblacional (Montgomery and Runger, 2004).

Definición:Dada una muestra aleatoriaX1, . . . , Xncon función de

densidadf(xi, θ), un intervalo de confianza de(1−α)×100 %para

un parámetro θ es un intervalo aleatorio (T1, T2) con Pr(T1 < θ <

T2) = 1−α.

Para la estimación deµel intervalo de confianza estará determinado como:

¯

(5)

Intervalo de Confianza para

µ

Si se tiene una muestra aleatoriax1, . . . , xnproveniente de una distribución normal con mediaµdesconocida yσ2conocida (o de cualquier distribución

de probabilidad con unnsuficientemente grande). Entonces,x¯se distribuye normalmente con mediaµy varianzaσ2/n. Además se tiene que:

Z= x¯−µ

σ/√n ∼Normal(0,1)

Un intervalo de confianza paraµes un intervalo de la formaLI≤µ≤LS, dondeLSyLIson calculados a partir de la muestra (Variables aleatorias). Estos valores se determinan de tal forma que se cumpla la siguiente condición:

P(LI≤µ≤LS) = 1−α

Donde 0 ≤α≤1. Lo que indica que hay una probabilidad de1−αde que para la muestra seleccionada el intervalo de confianza contenga aµ

(6)

Intervalo de Confianza para

µ

Si se tiene una muestra aleatoriax1, . . . , xnproveniente de una distribución normal con mediaµdesconocida yσ2conocida (o de cualquier distribución

de probabilidad con unnsuficientemente grande). Entonces,x¯se distribuye normalmente con mediaµy varianzaσ2/n. Además se tiene que:

Z= x¯−µ

σ/√n ∼Normal(0,1)

Un intervalo de confianza paraµes un intervalo de la formaLI≤µ≤LS, dondeLSyLIson calculados a partir de la muestra (Variables aleatorias). Estos valores se determinan de tal forma que se cumpla la siguiente condición:

P(LI≤µ≤LS) = 1−α

Donde 0 ≤α≤1. Lo que indica que hay una probabilidad de1−αde que para la muestra seleccionada el intervalo de confianza contenga aµ

(7)

Intervalo de Confianza para

µ

Dado que: Z= x¯−µ σ/√n ∼Normal(0,1) Entonces: P zα/2≤ ¯ x−µ σ/√n ≤z1−α/2 = 1−α 0 Z(α/2) Z( 1 − α/2) Prob = α/2 Prob = α/2

(8)

Intervalo de Confianza para

µ

Si x¯ es la media muestral de una muestra aleatoria de tamaño n proveniente de una población normal (o de cualquier distribución si nes suficientemente grande) con varianzaσ2 conocida, entonces el intervalo del(1−α)×100 % paraµestá dado por:

¯ x+zα/2 σ √ n ≤µ≤x¯+z1−α/2 σ √ n

• Se tiene probabilidad(1−α)de seleccionar una muestra aleatoria que produzca un intervalo que contenga µ.

• A mayor nivel confianza mayor seguridad de que el intervalo dado contiene aµ.

(9)

Intervalo de Confianza para

µ

Si x¯ es la media muestral de una muestra aleatoria de tamaño n proveniente de una población normal (o de cualquier distribución si nes suficientemente grande) con varianzaσ2 conocida, entonces el intervalo del(1−α)×100 % paraµestá dado por:

¯ x+zα/2 σ √ n ≤µ≤x¯+z1−α/2 σ √ n

• Se tiene probabilidad(1−α)de seleccionar una muestra aleatoria que produzca un intervalo que contenga µ.

• A mayor nivel confianza mayor seguridad de que el intervalo dado contiene aµ.

(10)

Ejemplo

Un fabricante produce pistones para motores de vehículos. Por especificaciones del fabricante se sabe el diámetro de los pistones está normalmente distribuido con σ = 0,01mm. Para realizar un control de calidad sobre el producto se decide observar una muestra aleatoria de 15 pistones y se encontró que el promedio del diámetro de76,03mm.

• Construir un intervalo del 99 % de confianza para la media del diámetro de los pistones.

• Construir un intervalo del 95 % de confianza para la media del diámetro de los pistones.

(11)

Ejemplo

Un fabricante produce pistones para motores de vehículos. Por especificaciones del fabricante se sabe el diámetro de los pistones está normalmente distribuido con σ = 0,01mm. Para realizar un control de calidad sobre el producto se decide observar una muestra aleatoria de 15 pistones y se encontró que el promedio del diámetro de76,03mm.

Para el caso del 99 % el intervalo queda de la siguiente forma: (76,02335; 76,03665)

Lo que nos indica que con un 99 % de confianza se puede concluir que el diámetro medio de los pistones está entre 76.02335mm y 76.03665mm

(12)

Intervalo de Confianza para

µ

Fig:Simulación de 50 intervalos del 95 % confianza paraµ

Muestra inter v alo de confianza 0 10 20 30 40 50 µ

Si se toman muchas muestras de la misma población, todas del mismo tamaño, y construimos un intervalo para cada uno, se puede afirmar que el (1−α)×100 % de los intervalos así construidos contendrán el verdadero valor del parámetro.

(13)

Comportamiento de los intervalos de

confianza

Para estimarµ: ¯ x±z1−α/2 σ √ n

Estimación±Error de estimación

Es deseable tener un nivel de confianza alto y un error de estimación pequeño. El último se hace pequeño cuando:

• El nivel de confianza(1−α) se hace pequeño.

• La variabilidad entre los elementos de la población es pequeña. (σ es pequeño).

(14)

Comportamiento de los intervalos de

confianza

Para estimarµ: ¯ x±z1−α/2 σ √ n

Estimación±Error de estimación

Este procedimiento es correcto sólo en circunstancias concretas: • Los datos deben proceder de una muestra aleatoria.

• La población de los datos debe ser normal.

• Si la población no es normal, el tamaño de la muestra debe ser grande (teorema central del límite).

(15)

Comportamiento de los intervalos de

confianza

Para estimarµ: ¯ x±z1−α/2 σ √ n

Estimación±Error de estimación

En la mayoría de los casos no se tiene la suerte de conocer el valor de la varianza de la población de la cual se seleccionan las muestras aleatorias

¿Qué pasa cuando no se tiene conocimiento

de la desviación estándar?

(16)

Intervalo de Confianza para

µ

Si se tiene una muestra aleatoria x1, . . . , xn proveniente de una

distribución normal con media µ y σ2 desconocida, entonces es razonable la utilización de la media (x) y la varianza muestral (S¯ 2) para realizar los cálculos. Donde se tiene que:

T = x¯−µ

S/√n ∼tn−1

Entonces el intervalo del(1−α)×100 % paraµestá dado por:

¯ x+tn−1,α/2 S √ n ≤µ≤x¯+tn−1,1−α/2 S √ n Donde S2 = Pn i=1 (x1−x¯)2

n−1 y tn−1 se refiere a una distribución de

(17)

Distribución

t

-student

Una variable aleatoria X tiene una distribución t-student con n grados de libertad si su función de densidad está dada por:

Γ((n+ 1)/2) √ πnΓ(n/2) 1 +x 2 n (n+1)/2 , −∞< x <∞, n >0 −3 −2 −1 0 1 2 3 Normal(0,1) t(20) t(5) t(1)

(18)

Ejemplo

Una compañía constructora resuelve estudiar la resistencia a la compresión de una mezcla de concreto, con el objetivo de hacer control de calidad. Para ello se tomaron 18 cilindros de prueba de acuerdo con las normas establecidas. Se encontró en la muestra que, luego de 28 días de curado,x¯= 280kg/cm2 yS = 19,3kg/cm2. Construir un intervalo de confianza del 95 % y 90 % para el valor de la resistencia a la compresión media de la mezcla de concreto

Intervalo del 95 % de confianza:

(270,4023; 289,5977)

Lo que nos indica que con un 95 % de confianza se puede concluir que la resistencia media a la compresión de la mezcla de concreto está entre 270.4023kg/cm2 y 289.5977kg/cm2

(19)

Ejemplo

Una compañía constructora resuelve estudiar la resistencia a la compresión de una mezcla de concreto, con el objetivo de hacer control de calidad. Para ello se tomaron 18 cilindros de prueba de acuerdo con las normas establecidas. Se encontró en la muestra que, luego de 28 días de curado,x¯= 280kg/cm2 yS = 19,3kg/cm2. Construir un intervalo de confianza del 95 % y 90 % para el valor de la resistencia a la compresión media de la mezcla de concreto Intervalo del 95 % de confianza:

(270,4023; 289,5977)

Lo que nos indica que con un 95 % de confianza se puede concluir que la resistencia media a la compresión de la mezcla de concreto está entre 270.4023kg/cm2 y 289.5977kg/cm2

(20)

Ejercicio

Un fabricante de fibras sintéticas desea estimar la tensión de ruptura media de una fibra. Diseña un experimento en el que se observan las tensiones de ruptura (libras) de 16 hilos del proceso seleccionados aleatoriamente. Los resultados son:

20.8 20.6 21 20.9 19.9 20.2 19.8 19.6 20.9 21.1 20.4 20.6 19.7 19.6 20.3 20.7

Según el fabricante la tensión de ruptura de una fibra se encuentra modelada por una distribución normal con desviación estándar de 0.45 lb.

Construir un intervalo de confianza del 94 % para el valor real de la tensión de ruptura promedio de la fibra

Construir un intervalo de confianza del 90 % para el valor real de la tensión de ruptura promedio de la fibra (la varianza es desconocida)

(21)

Intervalo de confianza para

σ

2

Se tiene una muestra aleatoriax1, . . . , xn proveniente de una distribución normal con media µ y σ2 desconocida. En algunos casos es de interés estimar un intervalo de confianza para la varianza poblacional (σ2). Para la estimación se utiliza la varianza muestral (S2) y se tiene la siguiente

expresión: X2=(n−1)S 2 σ2 ∼χ 2 n−1 χ2

n−1se refiere a una distribución chi cuadrado conn−1grados de libertad.

Entonces el intervalo del(1−α)100 %paraσ2está dado por:

(n−1)S2 χ2 n−1,1−α/2 ≤σ2≤ (n−1)S 2 χ2 n−1,α/2

(22)

Intervalo de confianza para

σ

2

Se tiene una muestra aleatoriax1, . . . , xn proveniente de una distribución normal con media µ y σ2 desconocida. En algunos casos es de interés estimar un intervalo de confianza para la varianza poblacional (σ2). Para la estimación se utiliza la varianza muestral (S2) y se tiene la siguiente

expresión: X2=(n−1)S 2 σ2 ∼χ 2 n−1 χ2

n−1se refiere a una distribución chi cuadrado conn−1grados de libertad.

Entonces el intervalo del(1−α)100 %paraσ2 está dado por: (n−1)S2 χ2 n−1,1−α/2 ≤σ2≤ (n−1)S 2 χ2 n−1,α/2

(23)

Distribución

χ

2

Una variable aleatoria X tiene una distribución χ2 con ngrados de libertad si su función de densidad está dada por:

1 2n/2Γ(n/2)x k/2−1e−x/2 x >0, n >0 0 10 20 30 40 Chisq(2) Chisq(5) Chisq(10) Chisq(20)

(24)

Ejemplo

Una maquina de llenado es utilizada para llenar botellas con detergente líquido. Una muestra aleatoria de 20 botellas dio como resultado una varianza muestral de S2 = 0,0153onzas2. Si la varianza del volumen de llenado es muy grande, habrá una proporción inaceptable de botellas con contenidos de líquidos muy alejados de la media. Suponiendo que el llenado de la maquina está normalmente distribuido, construya un intervalo de confianza del 95 % para la varianza

(0,0088; 0,0326)

Lo que nos indica que con un nivel de confianza del 95 % la varianza del volumen de llenado de las botellas está entre 0.0088 y 0.0326

(25)

Ejemplo

Una maquina de llenado es utilizada para llenar botellas con detergente líquido. Una muestra aleatoria de 20 botellas dio como resultado una varianza muestral de S2 = 0,0153onzas2. Si la varianza del volumen de llenado es muy grande, habrá una proporción inaceptable de botellas con contenidos de líquidos muy alejados de la media. Suponiendo que el llenado de la maquina está normalmente distribuido, construya un intervalo de confianza del 95 % para la varianza

(0,0088; 0,0326)

Lo que nos indica que con un nivel de confianza del 95 % la varianza del volumen de llenado de las botellas está entre 0.0088 y 0.0326

(26)

Intervalos de confianza

(27)

Intervalos de confianza

¿Qué pasa si la distribución de los datos no es normal?

Las inferencias con respecto a la media son, en general, robustas, esto debido al Teorema Central del Límite.

Los intervalos de confianza y contrastes basados en la distribuciónt son aproximadamente válidos independientemente de la distribución de partida, aunque dejan de ser óptimas.

(28)

Intervalos de confianza

¿Qué pasa si la distribución de los datos no es normal?

Las inferencias respecto a varianzas son muy sensibles a este supuesto. Para cualquier población S2 es un estimador centrado de σ2. pero su distribución y varianza es muy dependiente de la población. En consecuencia, los intervalos o contrastes serán poco precisos si la población no es aproximadamente normal.

(29)

Intervalo de confianza para

σ

2

Fig:Simulación de 50 intervalos de confianza del 95 % para σ2= 1

(Normal) 0 10 20 30 40 50 1 2 3 4 inter v alo de confianza ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

(30)

Intervalo de confianza para

σ

2

Fig: Simulación de 50 intervalos de confianza del 95 % para σ2= 1

(Exponencial) 0 10 20 30 40 50 0 2 4 6 8 inter v alo de confianza ●● ●● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ●● ● ● ●

(31)

Intervalos de confianza

¿Cómo probar si un conjunto de datos se

distribuye normalmente?

Gráficamente se pueden observar algunas características de la distribución normal como son:

X Los datos provenientes de una distribución de probabilidad normal deben ser aproximadamente simétricos alrededor de la media.

X Debido a que las colas de las curvas normales descienden muy rápidamente, las muestras de poblaciones normales deben tener muy pocas observaciones atípicas.

(32)

Intervalos de confianza

¿Cómo probar si un conjunto de datos se

distribuye normalmente?

Gráficamente se pueden observar algunas características de la distribución normal como son:

X Los datos provenientes de una distribución de probabilidad normal deben ser aproximadamente simétricos alrededor de la media.

X Debido a que las colas de las curvas normales descienden muy rápidamente, las muestras de poblaciones normales deben tener muy pocas observaciones atípicas.

(33)

Intervalos de confianza

¿Cómo probar si un conjunto de datos se distribuye normalmente?

Fig:Datos provenientes de tres distribuciones de probabilidad diferentes

● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

Normal t−student exponencial

−4 −2 0 2 4 6

(34)

Intervalos de confianza para una proporción

En algunos casos es necesario construir un intervalo para una proporción poblacional (P). Si se toma una muestra aleatoria de tamaño n de una población grande y se observa que X(≤ n) observaciones presentan una característica de interés. Entoncespˆ=X/nes la estimación puntual de la proporción poblacional.

Si n es lo suficientemente grande entonces: pˆ ∼ Normal(µ = P, σ2 =

p(1−p)/n)

Entonces el intervalo de confianza (aproximado) del(1−α)100 % queda definido como: ˆ p+zα/2 r ˆ p(1−pˆ) n ≤P ≤pˆ+z1−α/2 r ˆ p(1−pˆ) n

(35)

Intervalos de confianza para una proporción

En algunos casos es necesario construir un intervalo para una proporción poblacional (P). Si se toma una muestra aleatoria de tamaño n de una población grande y se observa que X(≤ n) observaciones presentan una característica de interés. Entoncespˆ=X/nes la estimación puntual de la proporción poblacional.

Si n es lo suficientemente grande entonces: pˆ ∼ Normal(µ = P, σ2 =

p(1−p)/n)

Entonces el intervalo de confianza (aproximado) del(1−α)100 % queda definido como: ˆ p+zα/2 r ˆ p(1−pˆ) n ≤P ≤pˆ+z1−α/2 r ˆ p(1−pˆ) n

(36)

Intervalos de confianza para una proporción

En algunos casos es necesario construir un intervalo para una proporción poblacional (P). Si se toma una muestra aleatoria de tamaño n de una población grande y se observa que X(≤ n) observaciones presentan una característica de interés. Entoncespˆ=X/nes la estimación puntual de la proporción poblacional.

Si n es lo suficientemente grande entonces: pˆ ∼ Normal(µ = P, σ2 =

p(1−p)/n)

Entonces el intervalo de confianza (aproximado) del(1−α)100 % queda definido como: ˆ p+zα/2 r ˆ p(1−pˆ) n ≤P≤pˆ+z1−α/2 r ˆ p(1−pˆ) n

(37)

Ejemplo

El gerente de una empresa de producción asegura que su proceso genera una proporción de unidades defectuosas cercana al 5 %, al tomar una muestra de su producto se obtiene que de 200 unidades revisadas, un total de 15 unidades fueron defectuosas. Construya un intervalo de confianza del 90 % para la proporción de artículos defectuosos ¿Los datos corroboran la afirmación del productor?

(0,0443; 0,105)

Con una confianza del 90 % la proporción de unidades defectuosas se encuentra entre el 4.43 % y el 10.5 %

(38)

Ejemplo

El gerente de una empresa de producción asegura que su proceso genera una proporción de unidades defectuosas cercana al 5 %, al tomar una muestra de su producto se obtiene que de 200 unidades revisadas, un total de 15 unidades fueron defectuosas. Construya un intervalo de confianza del 90 % para la proporción de artículos defectuosos ¿Los datos corroboran la afirmación del productor?

(0,0443; 0,105)

Con una confianza del 90 % la proporción de unidades defectuosas se encuentra entre el 4.43 % y el 10.5 %

(39)

Bibliografía

Devore, J. L. (2008). Probabilidad y estadística para ingeniería y ciencias. Thomson Paraninfo, México, vol. 7 edition.

Gutierrez, A. and Zhang, H. (2010).Teoría Estadística: Aplicaciones y Métodos. Universidad Santo Tomás, Bogotá,Colombia, vol. 1 edition.

Montgomery, D. and Runger, G. (2004). Probabilidad y estadística aplicadas la ingeniería. Limusa-Wiley, México, 2 edition.

Moore, D. S. (2005). Estadística aplicada básica. Antoni Bosch Editor, Barcelona, España, vol. 2 edition.

Figure

Actualización...

Referencias

Actualización...

Related subjects :