ESTIMACIÓN POR INTERVALOS DE CONFIANZA

(1)

ESTIMACIÓN POR INTERVALOS DE CONFIANZA

Definición: Un estimador por intervalos, de un parámetro poblacional 𝜃, es un estadístico que se usa para determinar un rango o un intervalo, en el cual posiblemente se encuentre el valor de dicho parámetro. La correspondiente estimación, se llama estimación por intervalo.

De tal manera que, si queremos estimar el valor del parámetro poblacional 𝜃, debemos encontrar con ayuda de la información muestral, dos variables aleatorias 𝑈 𝑦 𝑉, 𝑐𝑜𝑛 𝑈 < 𝑉, tales que:

𝑃(𝑈 < 𝜃 < 𝑉) = (1 − 𝛼) ∗ 100% 𝑝𝑎𝑟𝑎 𝑢𝑛 𝛼 ∈ (0,1).

Teorema: Si se extraen repetidamente, muestras de una población, y se calculan los correspondientes

intervalos, entonces, el (

1 − 𝛼) ∗ 100% de los intervalos, contiene el valor del parámetro

(2)

Definición: Sea

𝜃

un parámetro desconocido. Supongamos que con ayuda de la información muestral,

podemos encontrar dos variables aleatorias U y V, con

𝑈 < 𝑉

,

tales que,

𝑃(𝑈 < 𝜃 < 𝑉) = (1 − 𝛼) ∗ 100%,

𝑝𝑎𝑟𝑎 𝑢𝑛 𝛼 ∈ (0,1).

La fracción (

1 − 𝛼), recibe el nombre de Grado de Confianza, 𝛼 se llama Nivel de Significancia, y el

intervalo desde U hasta V, es un estimador por intervalo de

𝜃 del (1 − 𝛼) ∗ 100%.

Si u y v, representan un valor particular de U y V, respectivamente, entonces el intervalo de confianza

desde u hasta v, se llama intervalo de confianza del (

1 − 𝛼) ∗ 100%.

En conclusion: Si se extraen muestras aleatorias de la población, un número elevado de veces, el

parámetro

𝜃, estará contenido en un (1 − 𝛼) ∗ 100% de los intervalos, calculados de este modo. Y

el intervalo de confianza obtenido de esta manera se escribe como:

𝑈 < 𝜃 < 𝑉

(3)

Intervalos de Confianza para la Media Poblacional

𝝁

.

Caso Muestras Grandes:

Teorema: Sea

𝑥̅ la media de una muestra aleatoria de tamaño n, tomada de una población con media

𝜇 y varianza 𝜎

2

> 0. Supongamos que se cumplen algunas de las siguientes condiciones:

i)La población es normal y

𝜎

2

es conocida (no importa el tamaño de muestra n).

ii)La población es normal con

𝜎

2

desconocida y tamaño de muestra n

≥ 30.

i) La forma de la población es desconocida o no normal,

𝜎

2

es conocida o desconocida y n

≥ 30.

Entonces el intervalo de confianza de (

1 − 𝛼) ∗ 100% para 𝜇 es:

𝑥̅ − 𝑍

_{1−𝛼 2}_⁄

𝜎

√𝑛

< 𝜇 < 𝑥̅ + 𝑍

1−𝛼 2⁄

𝜎

√𝑛

Siendo

𝑍

_{1−𝛼 2}_⁄

𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑍 =

_𝜎𝑥̅−𝜇 √𝑛

⁄

a la izquierda del cual, hay una probabilidad de

1 − 𝛼 2

⁄ en la

(4)

Ejemplos:

1) Con el fin de cumplir las normas establecidas, es importante que el porcentaje medio de impurezas de unas remesas de productos químicos no supere el 4%. Una muestra de 40 envios evidenció un porcentaje muestral de 5,62% de impurezas. Si se sabe que los porcentajes estan distribuidos normalmente, con desviación estándar de 1%.

a) Calcula un intervalo del 90% de confianza, para estimar el porcentaje medio de impurezas de la población y poder establecer si el porcentaje medio es el esperado.

2) Un fabricante de detergente líquido, está interesado en la uniformidad de la maquina utilizada para llenar las botellas. De manera específica es deseable que el promedio de llenado sea 8 onzas de líquido. De no ser así, se obtendría un número mayor de botellas con un contenido menor de detergente. Supóngase que la distribución del volumen de llenado es normal. Si al tomar una muestra al azar de 38 botellas estas arrojaron un contenido medio 8,5 onzas con una desviación muestral de 𝑆 = 3 onzas.

a) Calcula un intervalo de confianza del 95%, para estimar el contenido promedio de todas las botellas de la población. El intervalo tiene el promedio de llenado esperado.

(5)

3) Un fabricante de bolsas de arroz, produce bolsas cuyo contenido tiene una distribución normal con desviación típica de 15 gramos. A su vez, los contenidos de una muestra aleatoria de 25 bolsas, tienen un peso medio de 100 gramos. Se calculo el siguiente intervalo de confianza con la información muestral.

𝑝(94,12 ≤ 𝜇 ≤ 105,88) ¿Con que confianza fue construido este intervalo?

4) Un investigador desea hacer una estimación de la cantidad promedio de agua que consume cierta especie animal, en condiciones experimentales. El consumo diario de agua está distribuido normalmente. Una muestra aleatoria de animales, arrojó un consumo medio de 16,5 mililitros con una desviación estándar de 2 mililitros. Se calculo el siguiente intervalo con una confianza del 99%.

𝑝(15,64 ≤ 𝜇 ≤ 17,36) ¿Cuál fue la muestra n de animales, escogida para tal fin?

(6)

Caso Muestras Pequeñas:

Teorema: Sean

𝑥̅ y 𝑠

2

la media y la varianza de una muestra aleatoria de tamaño

𝑛 < 30, tomadas

de una población normal con media

𝜇 y varianza 𝜎

2

desconocida. Entonces el intervalo de confianza del (

1 − 𝛼) ∗ 100% para 𝜇 es:

𝑥̅ − 𝑇

𝛼 2 ⁄

𝑆

√𝑛

< 𝜇 < 𝑥̅ + 𝑇

𝛼⁄2

𝑆

√𝑛

Siendo

𝑇

𝛼 2 ⁄

𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑇 =

𝑥̅−𝜇 𝑠 √𝑛

⁄

a la derecha del cual, hay una probabilidad de 𝛼 2

⁄ en la gráfica

de la distribución T de Student con v = n - 1 grados de libertad.

Ejemplos:

1) Los siguientes datos, representan el incremento porcentual de las utilidades de 18 empresas durante el año pasado:

44,5 35,7 33,5 23,5 45,6 32,5 31,5 34,0 46,7 39,3 22,0 51,2 41,4 37,2 51,5 36,4 42,5 46,9

Si el incremento porcentual se distribuye de manera normal. Calcula un intervalo del 99% de confianza para estimar el incremento porcentual promedio de las empresas.

2) Los siguientes datos, representan las tasas de rentabilidad de una muestra de 10 títulos valores, de 10 clientes de la sucursal del Bosque, del Banco del Caribe:

(7)

Los datos estan en porcentajes. Si los datos se distribuyen de manera normal. Calcula un intervalo de confianza del 95% para estimar la verdadera rentabilidad media de los titulos valores de ésta sucursal. 3) Los contenidos de 7 recipientes similares, de ácido sulfúrico son:

9.8, 10.2, 10.4, 9.8, 10, 10.2, 9.6 Litros.

Encuentra un intervalo de confianza del 95% para estimar la media del contenido de todos los recipientes, suponiendo que la población de valores se distribuye de manera normal.

4) Un carpintero ha comprobado que las longitudes de las puertas solicitadas por sus clientes siguen una distribución normal con una desviación estándar de 32,4 cm. La media de las longitudes relativa a una muestra de 9 puertas es de 187,9 cm.

a) Construye un intervalo de confianza del 99%, para verificar la longitud media de las puertas de la población. 5) Una máquina produce varillas metálicas, usadas en el sistema de suspension de un automóvil. Se seleccionan una muestra aleatoria de 10 varillas y se mide su diametro en centimetros. Los datos resultantes se muestran a continuación.

1.014, 1.009, 1.041, 0.962, 1.058, 1.024, 1.019, 1.020, 1.002, 0.958

Asumiendo que el diametro de las varillas proviene de una población normal, encuentra un intervalo de 99% de confianza, para el verdadero valor del diametro medio de las varillas.

(8)

Intervalos de Confianza para la Diferencia de Medias Poblacionales 𝝁_𝟏 𝒚 𝝁_𝟐.

Caso Varianzas Poblacionales Conocidas o Desconocidas y Muestras Grandes.

Teorema: Sea

𝑥

̅̅̅ 𝑦 𝑥

1

̅̅̅ las medias de muestras aleatorias independiente de tamaño 𝑛

2 1

𝑦 𝑛

2

provenientes de poblaciones con medias

𝜇₁ 𝑦 𝜇₂

y varianzas

𝜎

₁2

𝑦 𝜎

₂2

, respectivamente. Supongamos

que se cumple algunas de las siguientes condiciones:

i) Ambas poblaciones son normales con varianzas poblacionales conocidas. (Tamaños de muestra

𝑛

₁

𝑦 𝑛

₂

no importan).

ii) Ambas poblaciones son normales, con varianzas

𝜎

₁2

𝑦 𝜎

₂2

, desconocidas y

𝑛

₁

≥ 30 y 𝑛

₂

≥ 30.

iii) Ambas poblaciones son desconocidas o no normales, ambas varianzas

𝜎

₁2

𝑦 𝜎

₂2

son conocidas o

no y

𝑛

₁

≥ 30 𝑦 𝑛

₂

≥ 30.

Un intervalo de confianza de (

1 − 𝛼) ∗ 100% para

𝜇₁− 𝜇₂ está dado por:

(𝑥

̅̅̅ − 𝑥

₁

̅̅̅

₂) − 𝑍_{1−𝛼 2}_⁄

√

𝜎

1 2 𝑛₁ +

𝜎

₂2 𝑛₂ < 𝜇1 − 𝜇2 <

(𝑥

̅̅̅ − 𝑥

1

̅̅̅

2) + 𝑍1−𝛼 2⁄

√

𝜎

₁2 𝑛₁ +

𝜎

₂2 𝑛₂

(9)

Siendo

𝑍

𝛼 2 ⁄

, 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑍 =

(𝑥̅̅̅̅− 𝑥₁ ̅̅̅̅)2 −𝜇1−𝜇2 √𝜎12 𝑛1+ 𝜎22 𝑛2

a la izquierda del cual, hay una probabilidad de

1 −

𝛼

2 ⁄ en la gráfica de la distribución normal.

Ejemplo:

1) Conociendo los efectos que produce el Plomo en sangre, en el desarrollo psicomotor de los niños, se consideró necesario profundizar la evaluación de ciertos parámetros de este tipo de desarrollo en los niños que viven en distritos de extrema pobreza y que cerca de sus viviendas existen depósitos con alto contenido de plomo. Las autoridades de salud indican que el nivel de plomo en sangre permisible es de menos de 10 mg/dl. Se elige una muestra aleatoria de niños de edades entre 6 y 8 años, que estudian y viven cerca a estos depósitos, y se aplica el Test de Berry para medir los parámetros del desarrollo psicomotor. Los resultados del Test de Berry se muestran en la siguiente tabla:

Nivel de Plomo (mg/dl) Niños Media Muestral Varianza Muestral

≥ 10 44 7,59 1

< 10 37 10,73 1,613

Con una confianza del 90% construye un intervalo que permita identificar en cual de las dos poblaciones de niños, la calificación promedio del test es mayor.

2) Los estudiantes de una universidad pueden elegir entre un curso de cierta asignatura con práctica de 4 horas al semestre y otro curso sin práctica de 3 horas al semestre. El examen final es el mismo para cada grupo. Si 45 estudiantes del grupo con práctica tiene una calificación promedio de 84 puntos (en una escala de 1 a

(10)

100) con una desviación estándar de 4 puntos y, por otro lado, 35 estudiantes del grupo sin práctica tiene una calificación promedio de 77 puntos con una desviación estándar de 6 puntos.

a) Calcula un intervalo de confianza del 99%, y verifica en cuál de las dos poblaciones de estudiantes el puntaje promedio es mayor, si en los estudiantes que ven la asignatura con práctica o en la que la ven sin práctica. 3) Si la desviación estandar de la duración de una batería del tipo A es de 8 horas, y para otra batería del tipo B, la desviación estandar son 6 horas. Al tomar una muestra aleatoria de 40 baterías del tipo A, estas arrojan una duración media de 105 horas, y otra muestra aleatoria de 35 baterías del tipo B, estas arrojan una duración media de 100 horas y con la información muestral, se construyó el siguiente intervalo de confianza para determinar en cual de los dos tipos de batería la duración media es mayor.

𝑃(3,64 ≤ 𝜇₁ − 𝜇₂ ≤ 6,36) = 1 − 𝛼 ¿Con qué probabilidad fue construido el intervalo?

4) Una muestra aleatoria fumadores, registro un promedio de horas de ausentismo laboral de 3.01 horas al mes, con una desviación típica de 1,09 horas. Para una muestra igual de trabajadores que nunca han fumado, el número medio de horas de ausentismo laboral fue de 2,88 horas con una desviación típica muestral de 1,01 horas al mes. Al calcular un intervalo de confianza del 95%, se obtuvo el siguiente resultado.

−0,11 < 𝜇₁ − 𝜇₂ < 0,37 Cuál fue el tamaño de muestra seleccionado en cada población.

(11)

Caso Varianzas Poblacionales Desconocidas Iguales y Muestras Pequeñas.

Teorema: Sea

𝑥

̅̅̅ 𝑦 𝑥

₁

̅̅̅ las medias de muestras aleatorias independiente de tamaño 𝑛

₂ ₁

< 30 𝑦 𝑛

₂

<

30 provenientes de poblaciones normales con medias

y varianzas

𝜎

₁2

𝑦 𝜎

₂2

iguales y

desconocidas.

Un intervalo de confianza de (

1 − 𝛼) ∗ 100% para

𝜇₁− 𝜇₂

está dado por:

(𝑥

̅̅̅ − 𝑥

₁

̅̅̅

₂) − 𝑇_{(𝛼 2}_⁄ _,𝑣)

√

𝑆

2 𝑛₁ +

𝑆

2 𝑛₂ < 𝜇1 − 𝜇2 <

(𝑥

̅̅̅ − 𝑥

1

̅̅̅

2) + 𝑇(𝛼⁄2,𝑣)

√

𝑆

2 𝑛₁ +

𝑆

2 𝑛₂ Dónde

𝑆

2

, es la llamada varianza combinada, dada por:

𝑠

2

=

(𝑛

1

− 1)𝑠

1 2

_{+ (𝑛}

2

− 1)𝑠

22

𝑛

₁

+ 𝑛

₂

− 2

Siendo

𝑇

𝛼 2 ⁄

, 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑇 =

(𝑥̅̅̅̅− 𝑥₁ ̅̅̅̅)₂ −𝜇₁−𝜇₂ √ 𝑠2 𝑛1+ 𝑠2 𝑛2

a la derecha del cual, hay una probabilidad de 𝛼 2

⁄ en la

(12)

Ejemplo:

1) Se seleccionó una muestra aleatoria de 10 parejas de representantes de ventas del mismo producto, y se les ofrecio un curso de capacitación sobre técnicas de ventas, a un elemento de cada par. La tabla de abajo, muestra las ventas generadas durante un mes, por cada uno de los elementos de la pareja. Asumiendo que las ventas se distribuyen de manera normal y que las varianzas poblacionales son desconocidas pero iguales. Halla un intervalo de confianza del 90%, para determinar la diferencia en el promedio de ventas de las dos poblaciones. Vale la pena que los empleados reciban la capacitación.

Par Sin Con Capacitación Capacitación

Par Sin Con Capacitación Capacitación 1 485 452 2 423 386 3 515 502 4 425 376 5 653 605 6 386 380 7 426 395 8 473 411 9 454 415 10 496 441

2) Un equipo de investigadores ha desarrollado un software, llamado GÉNESIS, para la enseñanza de la Historia de Colombia, para los alumnos de secundaria. Para verificarlo se selecciona una muestra aleatoria de tamaño 40, con características similares. Veinte escolares se asignan al azar al grupo control (enseñanza tradicional) y los otros veinte al grupo experimental (enseñanza con el software GÉNESIS), en ambos grupos enseñan docentes que han sido debidamente capacitados y desarrollan el mismo contenido temático. Al final del curso se aplica una prueba que mide el nivel de conocimientos, sobre historia de Colombia a cada grupo, y se obtienen las siguientes calificaciones.

GRUPO CONTROL 13 9,5 12 13 11,5 12 9,5 12 10 13,5 11 13,5 11,5 10,5 9 12 8 12 10,5 15 GRUPO EXPERIMENTAL 14,5 13,5 16,5 17 12 13,5 14 17,5 14 16 17,5 15 15,5 13 17 15 15,5 16 14,5 14,5

(13)

Con una confianza del 95%, y sabiendo que las calificaciones para cada grupo tiene distribución normal, con varianzas desconocidas e iguales. ¿Se podría concluir que los estudiantes que fueron capacitados con el software obtuvieron mayor calificación promedio que los del grupo sometido a capacitación tradicional?

Caso Varianzas Poblacionales Desconocidas Diferentes y Muestras Pequeñas.

Teorema: Sea

𝑥

̅̅̅ 𝑦 𝑥

₁

̅̅̅ las medias de muestras aleatorias independiente de tamaño 𝑛

₂ ₁

< 30 𝑦 𝑛

₂

<

30 provenientes de poblaciones normales con medias

y varianzas

𝜎

₁2

𝑦 𝜎

₂2

diferentes y

desconocidas.

Un intervalo de confianza de (

1 − 𝛼) ∗ 100% para

𝜇₁− 𝜇₂ está dado por:

(𝑥

̅̅̅ − 𝑥

₁

̅̅̅)

₂ − 𝑇(𝛼 2 ⁄ , 𝑣)

√

𝑠

₁2 𝑛₁ +

𝑠

₂2 𝑛₂ < 𝜇1 − 𝜇2 <

(𝑥

̅̅̅ − 𝑥

1

̅̅̅

2) + 𝑇(𝛼⁄2, 𝑣)

√

𝑠

₁2 𝑛₁ +

𝑠

₂2 𝑛₂

Siendo

𝑇

𝛼 2 ⁄

, 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑇 =

(𝑥̅̅̅̅− 𝑥₁ ̅̅̅̅)₂ −𝜇₁−𝜇₂ √ 𝑠12 𝑛1+ 𝑠22 𝑛2

a la derecha del cual, hay una probabilidad de

1 − 𝛼 2

⁄

en la gráfica de la distribución T de Student. Dónde v, está dado por:

𝑣 =

(

𝑠12 𝑛1+𝑠2 2 𝑛2) 2 (𝑠1 2 𝑛1)2 𝑛1−1+ (𝑠2 2 𝑛2)2 𝑛2−1

grados de

libertad.

(14)

Ejemplo:

1) Se extrajo una muestra de 24 trabajadores de una determinada empresa, los cuales asistieron a un curso de mercadeo. Los empleados fueron divididos en dos grupos iguales, de tal manera, que cada grupo fue capacitado por un profesional diferente. Al momento de ser evaluados por sus superiores, obtuvieron las calificaciones que abajo se muestran.

Grupo 1(Profesional 1) 75 78 64 72 70 63 69 54 82 67 60 73 Grupo 2(Profesional 2) 74 87 69 72 77 75 73 50 83 78 56 74

Si las poblaciones de las calificaciones se distribuyen de manera normal, con varianzas poblacionales, desconocidas y diferentes. Halla un intervalo de confianza del 95%, y con ello determina, con cual de los dos profesionales, la capacitación en mercadeo arrojó mejores resultados.