Intervalos de confianza

Texto completo

(1)

ESTIMACIÓN DE INTERVALOS

INDICE PAGINA

1 Introducción... 2 2 Intervalos de confianza... 3

3 Intervalo de confianza para la media, varianza conocida... 5

4 Intervalo de confianza para la diferencia de dos medias, varianzas

cono-cidas... 8 5 Intervalo de confianza para la media de una distribución normal,

va-rianza... 11 6 Intervalo de confianza para la diferencia de medias de dos

distribucio-nes normales, varianzas desconocidas ... 14

7 Intervalo de confianza para la varianza de una distribución normal... 18

8 Intervalo de confianza para el cociente de varianzas de dos

distribucio-nes normales ... 20

9 Intervalo de confianza para una proporción... 23

10 Intervalo de confianza para la diferencia de dos proporciones... 27

11 Tabla resumen de procedimientos para obtener intervalos de

confian-za... 29 12 Tablas... 30 13 Bibliografía... 34

(2)

1

INTRODUCCIÓN

En muchas situaciones, una estimación puntual no proporciona información suficiente sobre un parámetro.

La estimación por intervalos presenta la ventaja de que es posible cuantificar los errores

El intervalo en el que se afirma que se encuentra el parámetro de denomina

intervalo de confianza.

La probabilidad de que el parámetro pertenezca a dicho intervalo se denomina

grado de confianza y se suele representar como 1 - α .

De manera específica, se muestra cómo encontrar intervalos de confianza para medias, varianzas y proporciones. También se indica cómo encontrar intervalos que contengan una parte específica de las observaciones de una población; estos tipos de intervalos se conocen como intervalos de tolerancia.

Para determinar el intervalo de confianza utilizaremos los estadísticos que se dan a continuación y determinaremos una región que contenga al estadístico con

probabilidad 1 - α , de modo que deje a cada lado una región con probabilidad α /2.

En los siguientes puntos se estudian intervalos de confianza y otros problemas de estimación por intervalos.

(3)

2 INTERVALOS DE CONFIANZA

Una estimación por intervalos de un parámetro desconocido θ es un intervalo

de la forma l ≤ θ ≤ u, donde los puntos extremos l y u dependen del valor numérico

de el estadístico θ ^ para una muestra en particular, y de la distribución de muestreo

Θ^. Puesto que muestras diferentes producen valores distintos de θ ^ y, en

consecuencia, valores diferentes de los puntos extremos l y u, estos puntos son valores de variables aleatorias, por ejemplo, L y U, respectivamente. De la distribución de

muestreo de Θ^ es posible determinar los valores de L y U tales que la siguiente

proposición de probabilidad es verdadera:

P(L ≤ θ ≤ U) = 1 - α (2-1)

donde 0 < α < 1. Por tanto, se tiene una probabilidad de 1 - α de seleccionar una

muestra que produzca un intervalo que contiene el valor verdadero de θ .

El intervalo resultante

l ≤ θ ≤ u (2-2)

se conoce como intervalo de confianza del 100(1 - α ) por ciento para el parámetro

desconocido θ . Las cantidades l y u reciben el nombre de límites de confianza

inferior y superior, respectivamente, y 1 - α es el coeficiente de confianza. La interpretación de un intervalo de confianza es que, si se recopila un número infinito de

muestras aleatorias y se calcula un intervalo de confianza del 100(1 - α ) por ciento para

θ , para cada una de las muestras, entonces el 100 (1- α ) por ciento de esos intervalos

contienen el valor verdadero de θ .

El intervalo de confianza de la ecuación (2-2) recibe el nombre más apropiado de intervalo de confianza bilateral, ya que especifica los límites inferior y superior de

θ . En ocasiones, puede resultar más apropiado un intervalo de confianza unilateral.

Un intervalo de confianza unilateral inferior del 100 (1 - α ) por ciento para θ está

dado por el intervalo

l ≤ θ (2-3)

donde el límite de confianza l se elige de modo que

P(L ≤ θ ) = 1 - α (1-4)

De manera similar, un intervalo de confianza unilateral superior del 100(1-α ) por

ciento para θ está dado por el intervalo

θ ≤ u (2-5)

donde el límite de confianza superior u se coge de modo que

(4)

La longitud de u-l del intervalo de confianza observado es una medida

importante de la calidad de la información obtenida de la muestra. el semiintervalo θ -

l o u - θ se conoce como precisión del estimador. Entre más grande sea el intervalo de

confianza, mayor es la seguridad de que el intervalo en realidad contenga el valor

verdadero de θ . Por otra parte entre más grande sea el intervalo, menor información se

tiene acerca del valor verdadero de θ . En una situación ideal, se tiene un intervalo

relativamente pequeño con una confianza grande.

Los siguientes apartados presentan métodos para encontrar intervalos de confianza para medias, varianzas y proporciones. Las aplicaciones e estos tipos de intervalos de confianza se encuentran con frecuencia en la ingeniería, en la ciencia y en la administración.

(5)

3 INTERVALO DE CONFIANZA PARA LA MEDIA,

VARIANZA CONOCIDA

Supóngase que se tiene una población con media desconocida µ y varianza

conocida σ 2. De esta población se toma una muestra aleatoria X

1, X2, ... , Xn de tamaño

n. La media muestral X es un estimador puntual razonable de la media desconocida µ .

Puede obtenerse un intervalo de confianza del 100(1- α ) por ciento para µ al

considerar la distribución de muestreo de la media muestral X. La distribución de muestreo X es norma si la población es normal, y aproximadamente normas si se satisfacen las condiciones del teorema del límite central. El valor esperado o media de

X es µ , mientras que el de la varianza es σ 2/n. Por consiguiente, la distribución de el

estadístico

X - µ

Z=

σ /√n es una distribución normal estándar.

En la distribución de Z= ( X – µ ) / (σ /√n) se observa que

P{ -zα/2≤ Z ≤ zα/2 } = 1 - α

de modo que

P { -zα/2≤ ( X – µ ) / (σ /√n) ≤ zα/2 } = 1 - α

La expresión anterior se puede escribir como :

P{ X -zα/2 (σ /√n) ≤ µ ≤ X + zα/2 (σ /√n) } = 1 - α (3-1)

A partir de la consideración de la ecuación 2-1, los límites inferior y superior de las desigualdades de la ecuación 3-1, son los límites de confianza inferior y superior, L U, respectivamente. Esto conduce a la siguiente definición:

Definición: Intervalo de confianza para la media con varianza conocida.

Si x es la media muestral de una muestra aleatoria de tamaño n de una población con

varianza conocida σ 2, un intervalo de confianza par aµ del 100(1 - α ) por ciento está

dado por

x - zα/2 (σ /√n) ≤ µ ≤ x + zα/2 (σ /√n) (3-2)

donde zα/2 es el punto crítico de la distribución normal estándar que corresponde al

(6)

Para muestras tomadas de una población normal, o para muestras de tamaño n ≥

30, sin importar la forma que tenga la población, el intervalo de confianza dado por la ecuación 3-2 proporciona buenos resultados. Sin embargo, para muestras pequeñas tomadas de poblaciones que no son normales, no es posible esperar que el nivel de

confianza 1 -α sea exacto.

Ejemplo

Una empresa fabrica focos que tienen una duración distribuida aproximada de forma normal con una desviación típica de 40 horas.

Si una muestra de 30 focos tiene una vida promedio de 780 horas, obtenga un intervalo de confianza del 96% para la media de población de todos los focos.

Solución datos: σ = 40 horas ; n=30 ; x=780 ; 1 - α = 1 – 0.96 = 0.04 y α /2 = 0.02 zα/2= 2.06 (mirar tabla 1) Se aplica la fórmula : x - zα/2 (σ /√n ) ≤ µ ≤ x + zα/2 (σ / √n ) 780 – 2.06 (40 / √30) ≤ µ ≤ 780 + 2.06 (40 / √30) (764.95 , 795.04)

La estimación puntual de µ =780 con dispersión de 40 horas es alta.

Selección del tamaño de la muestra

La precisión del intervalo de confianza de la ecuación 1-8 es zα/2(σ /√n ). Esto

significa que al utilizar x para estimar µ , el error E= |x - µ | es menor o igual que zα/2

(σ /√n) con una confianza del 100(1-α ) por ciento. En situaciones donde puede

controlarse el tamaño de la muestra, es posible elegir n de forma que se tenga una

confianza del 100(1-α ) por ciento de que el error al estimar µ sea menor que el error

especificado E. El tamaño apropiado de la muestra se obtiene al seleccionar n de modo

que zα/2(σ /√n) = E. La solución de esta ecuación proporciona la fórmula siguiente para

n.

Definición:

Si x se utiliza como estimación de µ , entonces puede tenerse una confianza del

100(1- α ) por ciento de que el error |x - µ | no será mayor que una cantidad específica

E cuando el tamaño de la muestra sea

(7)

Si el miembro derecho de la ecuación anterior no es un entero, entonces el resultado debe redondearse. Esto asegura que el nivel de confianza no sea menor que

100(1 - α ) por ciento.

Ejemplo

¿De qué tamaño debiera ser la muestra anterior si se desea tener una confianza del 96%

de que la diferencia de µ con x fuese menor de 3 horas?

Solución

n = ( (zα/2 σ ) / E ) 2

n = ( ( 2. 06 40 ) / 3 ) 2 = 754,4 focos.

Intervalos de confianza unilaterales.

También es posible obtener intervalos de confianza unilaterales para µ

haciendo l = - ∞ o u= + ∞, y remplazando zα/2 por zα. El intervalo de confianza

superior de 100(1-α ) por ciento para µ es:

µ ≥ u = x + zα σ /√n (3-4)

y el intervalo de confianza inferior del 100(1 - α ) por ciento para µ es:

(8)

4 INTERVALO DE CONFIANZA PARA LA DIFERENCIA

DE DOS MEDIAS, VARIANZAS CONOCIDAS

Supóngase que se tienen dos poblaciones independientes con medias

desconocidas µ 1 y µ 2, y varianzas conocidas σ 12 y σ 22, respectivamente. Se desea

encontrar un intervalo de confianza del 100(1 - α ) por ciento para la diferencia de las

medias µ 1 - µ 2.

Sean X11, X12,...,X1n1 una muestra aleatoria de n1 observaciones tomadas de la

primera población y X21, X22,...,X2n2 una muestra aleatoria de n2 observaciones tomadas

de la segunda población. Si X1 y X2 son las medias muéstrales, el estadístico X1 - X2 es

un estimador puntual de µ 1 - µ 2. La variable aleatoria

X1 - X2 –(µ 1 - µ 2)

Z =

√(σ 12/ n1)+ (σ 22/ n2)

tiene una distribución normal estándar si las dos poblaciones son normales, o es aproximadamente normal estándar si se cumplen las condiciones del teorema del límite central, respectivamente. Esto implica que

P(-zα/2≤ Z ≤ zα/2) = 1 - α

o

X1 - X2 –(µ 1 - µ 2)

P(-zα/2≤ ≤ zα/2) = 1 - α

√(σ 12/ n1)+ (σ 22/ n2)

La expresión anterior puede reacomodarse de la siguiente manera

P(X1-X2 -zα/2√(σ 12/n1)+(σ 22/n2)≤ µ 1-µ 2 ≤ X1-X2 -zα/2 √(σ 12/ n1)+(σ 22/ n2) )=1-α

(4-1) Al comparar las ecuaciones 2-1 y 4-1, puede desarrollarse la siguiente definición

(9)

Definición: Intervalo de confianza para la diferencia de dos medias, varianzas conocidas.

Si x1-x2 son las medias de dos muestras aleatorias independientes de tamaños n1 y n2

tomadas de poblaciones que tienen varianzas conocidas σ 12 y σ 22 , respectivamente,

entonces un intervalo de confianza del 100(1 - α ) por ciento para µ 1- µ 2 es

x1-x2 - zα/2 √(σ 12/n1) + (σ 22/n2) ≤ µ 1-µ 2 ≤ x1-x2 + zα/2 √(σ 12/ n1) + (σ 22/ n2) (4-2)

donde zα/2 es el punto crítico superior que corresponde al porcentaje α /2 de la

distribución normal estándar.

El nivel de confianza 1 - α es exacto cuando las poblaciones son normales. Para

poblaciones que no lo son, el nivel de confianza es aproximadamente válido para tamaños grandes de muestras.

Ejemplo

Se prueban dos fórmulas diferentes de un combustible oxigenado para motor en cuanto

al octanaje. La varianza del octanaje para la fórmula 1 es σ 12=1.5, mientras que para la

fórmula 2 es σ 22=1.2. Se prueban dos muestras aleatorias de tamaño n1=15 y n2=20.

Los octanajes promedio observados son x1= 89.6 y x2= 92.5. Construya un intervalo de confianza bilateral del 95% para la diferencia en el octanaje promedio.

Solución: 95%, 1 – 0.95 = 0.05 ; 0.05/2 = 0.025 z0.025 = 1.96 X1 - X2 - zα/2 √(σ 12/n1) + (σ 22/n2) ≤ µ 1-µ 2 ≤ X1 - X2 + zα/2 √(σ 12/ n1) + (σ 22/ n2) 89.6 – 92.5 – 1.96√ 1.5/15 + 1.2/20 ≤ µ 1-µ 2 ≤ 89.6 – 92.5 + 1.96√ 1.5/15 + 1.2/20 -2.9 – 1.96 x 0.04 ≤ µ 1-µ 2 ≤ -2.9 + 1.96 x 0.04 -3.684 ≤ µ 1-µ 2 ≤ -2.116

(10)

Selección del tamaño de la muestra.

Si se conocen las desviaciones estándar σ 1 y σ 2 y los tamaño de las dos muestras son

iguales ( n1 = n2 = n, por ejemplo), entonces puede determinarse el tamaño requerido de

la muestra de modo que se tenga una confianza del 100(1 - α ) por ciento en que el

error den la estimación de µ 1 - µ 2 por x1 – x2 sea menor que E. El tamaño requerido

para la muestra de cada población

n = ( zα/2 / E )2 (σ 12 + σ 22) (4-3)

Recuérdese que es necesario redondear n si éste no es un entero. Con esto se asegura

que el nivel de confianza no sea menor que 100( 1 - α ) por ciento.

Intervalos de confianza unilaterales.

También es posible obtener intervalos de confianza unilaterales para µ 1 - µ 2. Un

intervalo unilateral superior del 100(1 - α ) por ciento de confianza para µ 1 - µ 2 es

µ 1-µ 2 ≤ x1 - x2 + zα/2 √(σ 12/ n1) + (σ 22/ n2) (4-4)

mientras que un intervalo unilateral inferior del 100(1 - α ) por ciento de confianza es

(11)

5 INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA

DISTRIBUCION NORMAL, VARIANZA DESCONOCIDA

Supóngase que se desea encontrar un intervalo de confianza para la media de una distribución, pero que la varianza no es conocida. De manera específica, supóngase que

se tiene una muestra aleatoria de tamaño n, X1, X2,...,Xn y que X y S2 son la media y la

varianza muéstrales, respectivamente. Una posibilidad sería remplazar σ en las

fórmulas del intervalo de confianza para µ con varianza conocida (ecuaciones 3-1, 3-3

y 3-4) con el valor calculado de la desviación muestral s. Si el tamaño de la muestra, n, es relativamente grande (por ejemplo, n >30), entonces éste es un procedimiento aceptable. En consecuencia, a menudo los intervalos de confianza de las secciones 3 y 4 reciben el nombre de intervalos de confianza para muestras grandes, debido a que son aproximadamente válidos incluso si las varianzas no conocidas de la población se reemplazan con las varianzas muéstrales correspondientes. Nótese que en el problema

de dos muestras, sección 4, tanto n1 como n2 debes ser mayores que 30.

Cuando el tamaño de las muestras es pequeño, el enfoque anterior no funciona, y entonces debe emplearse otro procedimiento. Para producir un intervalo de confianza válido, debe hacerse una hipótesis más fuerte con respecto a la población de interés. La hipótesis usual es que la población está distribuida de manera normal. Esto conduce a

intervalos de confianza basados en distribuciones t. De manera específica, sea X1,

X2,...,X3 una muestra aleatoria tomada de una distribución normal con media µ y

varianza σ 2 desconocidas.

La distribución de muestreo de el estadístico

X - µ

T= S/√n

es la distribución t con n-1 grado de libertad. A continuación se indica cómo obtener el

intervalo de confianza para µ .

Sea tα/2,n-1 el punto crítico superior que corresponde al porcentaje α /2 de la

distribución t con n-1 grado de libertad. Se tiene que: P( -tα/2,n-1 ≤ T ≤ tα/2,n-1 ) = 1 - α

o

X - µ

P( -tα/2,n-1 ≤ ≤ tα/2,n-1 ) = 1 - α

S/√n

Después de reacomodar la ecuación anterior, se tiene que

P( X - tα/2,n-1 S/√n ≤ µ ≤ X + tα/2,n-1 S/√n ) = 1 - α (5-1)

La comparación entre las ecuaciones 5-1 y 2-1 conduce a la siguiente definición

(12)

Definición: Intervalo de confianza para la media de una distribución normal, varianza desconocida.

Si x y s con la media y la desviación estándar de una muestra aleatoria tomada de una

distribución normal con varianza σ 2 desconocida, entonces un intervalo de confianza

del 100( 1 - α ) por ciento para µ está dado por

x – tα/2,n-1 s/√n ≤ µ ≤ x + tα/2,n-1 s/√n (5-2)

donde tα/2,n-1 es el punto crítico superior que corresponde al porcentaje α /2 de la

distribución t con n –1 grado de libertad.

Recuérdese que este intervalo de confianza supone que el muestreo se hace sobre una población normal. Esta hipótesis tiene una importancia moderada para muestras pequeñas. Por fortuna, la hipótesis de normalidad es válida en muchas situaciones prácticas. Cuando no es éste el caso, entonces deben emplearse intervalos de confianza independientes de la distribución, o no paramétricos.

Cuando la población es normal, los intervalos de la distribución t son los

intervalos e conformidad del 100(1-α ) por ciento más pequeños posible, también son

superiores a los proporcionados por los métodos no paramétricos.

Ejemplo

Se han estudiado 20 mediciones de tiempo el tiempo de combustión residual de especímenes tratados de ropa de dormir para niños (en segundos)

9.85 9.93 9.75 9.77 9.67 9.87 9.67 9.94 9.85 9.75

9.83 9.92 9.74 9.99 9388 9.95 9.95 9.93 9.92 9.89

Se desea encontrar un intervalo de confianza del 95% para el tiempo de combustión residual. Supóngase que sigue una distribución normal.

Solución

Se calcula la media y la desviación estándar.

x= 9.8525 s=0.0965 tα/2, n-1 = t 0.05/2,20-1 = t0.025,19 = 2.023 (mirar tabla 2) x - tα/2,n-1 s / √n ≤ µ ≤ x + tα/2,n-1 s / √n 9.8525 – 2.023 (0.0965/ √20) ≤ µ ≤ 9.8525 + 2.023 (0.0965/ √20) 0.8073 ≤ µ ≤ 9.8977

(13)

Selección del tamaño de la muestra

La selección del tamaño n de la muestra necesario para proporcionar un intervalo de

confianza de la longitud requerida no es tan fácil como en el caso donde se conoce σ

debido a que la longitud del intervalo depende tanto del valor de σ (el cual no se

conoce antes de recopilar los datos), como del tamaño n de la muestra. Por otra parte, n

ingresa al intervalo de confianza a través de los términos 1/√n y tα/2,n-1. En consecuencia,

el tamaño n de la muestra debe obtenerse a partir de un procedimiento de prueba y error,

utilizando una estimación previa de σ (la cual puede basarse en la experiencia). Otra

posibilidad es tomar una muestra preliminar de n observaciones para obtener una

estimación de σ . Luego, utilizando el valor es calculado a partir de esta muestra como

aproximación e σ , puede emplearse la ecuación 3-2 para calcular el valor requerido de

n que proporciona la exactitud y nivel de confianza deseados.

Intervalos de confianza unilaterales

Es fácil encontrar intervalos de confianza unilaterales para la media de una distribución normal done la varianza no es conocida. El intervalo de confianza inferior del 100(1 -

α ) por ciento para µ está dado por

x - tα/2,n-1 s/√n ≤ µ (4-3)

y el intervalo de confianza del 100(1-α ) por ciento para µ es

(14)

6 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE

MEDIAS DE DOS DISTRIBUCIONES NORMALES,

VARIANZAS DESCONOCIDAS.

En esta sección se extienden los resultados e la sección 5 al caso de dos poblaciones con medias y varianzas desconocidas, y se desea encontrar intervalos de

confianza par la diferencia entre medias µ 1 - µ 2. Si los tamaños de la muestras n1 y n2

son mayores que 30, entonces puede emplearse el intervalo de la distribución normal de la sección3. Sin embargo, cuando se toman muestras pequeñas se supone que las poblaciones de interés están distribuidas de manera normal, y los intervalos de confianza se basan en la distribución t.

Considérense dos variables aleatorias normales independientes, X1 con media

µ 1 y varianza σ 12 y X2 con media µ 2 y varianza σ 22 , por ejemplo. Tanto las medias

µ 1 y µ 2 como las varianzas σ 12 y σ 22 son desconocidas. Sin embargo, considérese

que es razonable suponer que las dos varianzas son iguales; esto es, σ 12= σ 22=σ . Se

desea encontrar un intervalo de confianza del 100(1 - α ) por ciento para la diferencia

entre medias µ 1 y µ 2.

Se toman muestras aleatorias de tamaño n1 y n2 de las dos poblaciones

representadas por X1 y X2, respectivamente; sean X1 y X2 las medias muéstrales, y S12 y

S22 las varianzas muéstrales. Puesto que S12 y S22 son estimadores de la varianza común

σ 2, entonces puede obtenerse un estimador combinado de σ 2, mejor que S

12 o S22 por

separado. Este estimador es

(n1 – 1) S12 + (n2 – 1) S22

Sp2 = (6-1)

n1 + n2 – 2

Para desarrollar el intervalo de confianza para µ 1- µ 2, nótese que la distribución del a

estadística

X1 - X2 – (µ 1- µ 2)

T =

Sp√ 1/n1 + 1/n2

es la distribución t con n1 + n2 – 2 grados de libertad. Por tanto:

P( -tα/2, n1+n2–2 ≤ T ≤ + tα/2, n1+n2–2) = 1 - α

o

X1 - X2 – (µ 1- µ 2)

P( -tα/2, n1+n2–2 ≤ ≤ + tα/2, n1+n2–2) = 1 - α

Sp√ 1/n1 + 1/n2

(15)

P(X1-X2 -tα/2, n1+n2–2Sp√1/n1+1/n2 ≤ µ 1-µ 2 ≤X1-X2 +α/2, n1+n2–2 Sp√1/n1+1/n2 ) =1-α

(6-2)

El examen de la ecuación 6-2 conduce a la siguiente definición de intervalo de

confianza del 100(1 - α ) por ciento para µ 1-µ 2.

Definición: Intervalo de confianza para la diferencia entre medias de dos distribuciones normales, varianzas desconocidas pero iguales.

Si x1, x2 s12 y s22 son las medias y las varianzas de dos muestras aleatorias de tamaños n1

y n2 respectivamente, tomadas de dos poblaciones normales e independientes con

varianzas desconocidas pero iguales, entonces un intervalo de confianza del 100(1 - α )

por ciento para la diferencia de medias µ 1-µ 2 es

x1-x2 -tα/2, n1+n2–2 sp√1/n1+1/n2 ≤ µ 1-µ 2 ≤ x1-x2 + tα/2, n1+n2–2 sp√1/n1+1/n2 (6-3)

donde sp = √ [(n1 – 1) S12 + (n2 – 1) S22] / (n1 + n2 – 2 ) es el estimador combinado de la

desviación estándar común de la población, y tα/2, n1+n2–2 es el punto crítico superior que

corresponde al porcentaje α /2 de la distribución t con n1 + n2 – 2 grados de libertad.

Ejemplo:

Al tomar 10 muestras de cemento estándar se encontró que el peso promedio de calcio

es x1=90.0, con una desviación estándar muestral de s1=5.0; los resultados obtenidos con

15 muestras de cemento contaminado con plomo fueron x2=87.0 y s2=4.0.

Supóngase que el porcentaje de peso de calcio está distribuido de manera normal.

Encuéntrese un intervalo de confianza del 95% para la diferencia entre medias µ 1-µ 2

de los dos tipos de cemento. Supóngase que las dos poblaciones normales tienen la misma desviación estándar.

Solución sp = √ [(n1 – 1) S12 + (n2 – 1) S22 ] / (n1 + n2 – 2 ) sp = √ [(10 – 1) (5.0)2 + (15 – 1)(4.0)2 ] / (10 + 15 – 2 ) sp= √19.52 = 4.4 tα/2, n1+n2–2 = t 0.05/2 , 10+15–2 = 2.069 x1 - x2 –t0.025,23 sp √1/n1+1/n2 ≤ µ 1-µ 2 ≤ x1 - x2 + t0.025,23 sp √1/n1+1/n2 90.0–87.0 -2.069(4.4) √ 1/10 + 1/15 ≤ µ 1-µ 2 ≤ 90.0–87.0 +2.069 (4.4) √ 1/10 + 1/15

-0.72 ≤ µ 1-µ 2 ≤ 6.72 Como incluye el 0 no se puede decir que haya diferencia de

(16)

Intervalos de confianza unilaterales

Es sencillo construir intervalos de confianza unilaterales para la diferencia entre medias con varianzas desconocidas pero iguales. El intervalo de confianza inferior del

100(1-α ) por ciento para µ 1-µ 2 es

x1- x2 - tα/2, n1+n2–2 sp√1/n1+1/n2 ≤ µ 1 - µ 2 (6-4)

mientras que el intervalo de confianza superior del 100(1-α ) por ciento para µ 1 - µ 2 es

µ 1 - µ 2 ≤ x1- x2 - tα/2, n1+n2–2 sp√1/n1+1/n2 (6-5)

Varianzas desiguales

En muchas situaciones no es razonable supones que σ 2

1 = σ 22. Aún cuando no

pueda garantizarse esta hipótesis, puede hallarse un intervalo de confianza del

100(1-α ) por ciento para µ 1 - µ 2 utilizando el hecho de que el estadístico

X1 - X2 – (µ 1- µ 2)

T* = √ (S12/n1) + (S22/n2)2

tiene, de manera aproximada, una distribución t con grados de libertad dados por (S12/n1 + S22/n2)2 v = - 2 (6-6) (S12/n1)2 (S22/n2)2 n1 + 1 n2 + 1 Por tanto P( - tα/2,v≤ T*≤ tα/2,v ) ≅ 1 - α

El intervalo de confianza para µ 1- µ 2 puede obtenerse si se sustituir T* en esta

(17)

Definición: Intervalo de confianza para la diferencia entre medias de dos distribuciones normales, varianzas desconocidas y desiguales.

Si x1 , x2 , s12 y s22 son las medias y las varianzas de dos muestras aleatorias de tamaños

n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con

varianzas desconocidas y desiguales, entonces un intervalo de confianza aproximada del

100(1 - α ) por ciento para la diferencia entre medias µ 1 - µ 2 es

x1 - x2 - tα/2,v √ s12/n1 + s22/n2≤ µ 1 - µ 2 ≤ x1 - x2 + tα/2,v √ s12/n1 + s22/n2 (6-7)

donde v está dada por la ecuación 6-6 y tα/2,v es el punto crítico superior que corresponde

al porcentaje α /2 de la distribución t con v grados de libertad.

Los límites de confianza unilaterales superior e inferior puede obtenerse al

remplazar el límite de confianza inferior (superior ) con - ∞ (∞) y cambiando α /2 por

α .

7 INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA

DISTRIBUCIÓN NORMAL.

(18)

Supóngase que se desea encontrar una estimación del intervalo de confianza para la

varianza σ 2 de una población normal. Si X

1,X2,...,Xn es una muestra aleatoria de

tamaño n tomada de esta población normal, y se S2 se utiliza para encontrar el intervalo

de confianza de σ 2. Como la distribución de ( n – 1) S2 X = σ 2

es ji-cuadrada con n – 1 grado de libertad. Se nota que: P( χ 2 1-α/2,n-1≤ X ≤ χ 2α/2,n-1) = 1 - α de modo que ( n – 1) S2 P(χ 2 1-α/2,n-1 ≤ ≤ χ 2α/2,n-1) = 1 - α σ 2

La expresión anterior puede escribirse como ( n – 1) S2 ( n – 1) S2

P( ≤ σ 2≤ ) = 1 - α

χ 2

1-α/2,n-1 χ 2α/2,n-1 (7-1)

La comparación de la ecuación 7-1 con la 2-1 conduce a la siguiente definición

del intervalo de confianza para σ 2.

Definición: Intervalo de confianza para la varianza de una distribución normal.

Si s2 es la varianza muestral de una muestra aleatoria de n observaciones tomadas de una

distribución normal con varianza desconocida σ 2, entonces un intervalo de confianza

del 100(1 - α ) por ciento para σ 2

( n – 1) S2 ( n – 1) S2

≤ σ 2 χ 2

1-α/2,n-1 χ 2α/2,n-1 (7-2)

donde χ 2

1-α/2,n-1 yχ 2α/2,n-1 son los puntos críticos superior e inferior que corresponden

al porcentaje α /2 de la distribución ji-cuadrada con n-1 grado de libertad,

respectivamente.

(19)

Para encontrar un intervalo de confianza inferior del 100(1 -α ) por ciento para

σ 2, se hace el límite de confianza superior de la ecuación 7-2 igual a y se reemplaza

χ 2

α/2,n-1 por χ 2α,n-1, con lo que se tiene

(n – 1 ) s2

≤ σ 2

χ 2

α,n-1 (7-3)

El intervalo de confianza superior del 100( 1 - α ) por ciento se obtiene al hacer

el límite de confianza inferior de la ecuación 7-2 igual a cero, y remplazar χ 2

1-α/2,n-1 con χ 2

1-α,n-1, lo que da como resultado

(n – 1 ) s2

σ 2

χ 2

(20)

8 INTERVALO DE CONFIANZA PARA EL COCIENTE DE

VARIANZAS DE DOS DISTRIBUCIONES NORMALES

Supóngase que se tienen dos poblaciones normales e independientes con

varianzas desconocidas σ 12 y σ 22, respectivamente. De este par de poblaciones, se

tiene disponibles dos muestras aleatorias de tamaños n1 y n2, respectivamente; sean S12 y

S22 las dos varianzas muéstrales . Se desea encontrar un intervalo de confianza del

100(1-α ) por ciento para el cociente de las dos varianzas, σ 12 / σ 22.

Para hallar el intervalo de confianza, recuérdese que la distribución de muestreo de

S22/σ 22

F =

S12/σ 12

es una F con n2 – 1 y n1 – 1 grados de libertad. Y su campana tiene una figura:

P(f 1-α/2, n2-1,n1-1≤ F ≤ f α/2, n2-1,n1-1) = 1 - α de modo que S22/σ 22 P(f 1-α/2, n2-1,n1-1≤ ≤ f α/2, n2-1,n1-1) = 1 - α S12/σ 12 Por consiguiente: P( (S12/ S22 )f 1-α/2, n2-1,n1-1≤ σ 12 / σ 22≤ (S12/ S22 )f α/2, n2-1,n1-1) = 1 - α (8-1)

La comparación de las ecuaciones 2-1 y 8-1 conduce a la siguiente definición del

intervalo de confianza para σ 12 / σ 22

Definición: Intervalo de confianza para el cociente de las varianzas de dos distribuciones normales

Si s12 y s22 son las varianzas muéstrales de dos muestras aleatorias de tamaños n1 y n2,

respectivamente, tomadas de dos poblaciones normales e independientes con varianzas

σ 12 y σ 22 desconocidas, entonces un intervalo de confianza del 100 (1 - α ) por ciento

para el cociente σ 12 / σ 22 es

(s12/ s22 )f 1-α/2, n2-1,n1-1≤ σ 12 / σ 22 ≤ (s12/ s22 )f α/2, n2-1,n1-1 (8-2)

donde f α/2, n2-1,n1-1 y f 1-α/2, n2-1,n1-1 son los puntos críticos superior e inferior que

corresponden al porcentaje α /2 de la distribución F con n2 –1 y n1 – 1 grados de

(21)

En la ecuación 8-2 se requiere el punto que corresponde al porcentaje de la cola inferior de la distribución F. El punto crítico inferior que corresponde al porcentaje 1 -

α /2 puede calcularse a partir del punto crítico superior que corresponde al porcentaje

α /2 con la expresión

f 1-α/2, n2-1,n1-1 = 1 / f α/2, n2-1,n1-1 (8-3)

Intervalos de confianza unilaterales.

También es posible construir intervalos de confianza unilaterales para el

cociente de las varianzas σ 12 / σ 22 . Un límite inferior de confianza del 100(1 - α ) por

ciento para σ 12 / σ 22 es

(s12/ s22 )f 1-α/2, n2-1,n1-1≤ σ 12 / σ 22 (8-4)

y un límite superior de confianza del 100(1 - α ) por ciento para σ 12 / σ 22 es

σ 12 / σ 22 ≤ (s12/ s22 )f α/2, n2-1,n1-1 (8-5)

Ejemplo

Una compañía fabrica propulsores. Una de las operaciones consiste en esmerilar el terminado de una superficie con una aleación de titanio. Pueden emplearse dos

procesos. Para ello se toma una muestra de n1= 12 partes del primer proceso, la cual

tiene una desviación estándar muestral s1= 5.1 micropulgadas, y una muestra aleatoria

de n2= 15 partes del segundo proceso con una desviación estándar muestral s2 = 4.7

micropulgadas. Se desea encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas.

(22)

Solución.

1-0.9 = 0.1 -> 0.1 /2 = 0.05

fα/2, n2-1, n1-1 = f0.05 , 15 – 1 , 12 – 1 = f 0.05, 14,11 = 2.57 (mirar tabla3)

usando la ecuación 8-4 se obtiene que f 0.95, 14,11 = 1 - f 0.05, 14,11 = 1 / 2.57

(s12 / s22 )f 1-α/2, n2-1,n1-1≤ σ 12 / σ 22 ≤ (s12 / s22 )f α/2, n2-1,n1-1

(5.12 / 4.72 ) 0.39 σ

12 / σ 22 ≤ (5.12 / 4.72 ) 2.57

(26.01 / 22.09) 0.39 ≤ σ 12 / σ 22 ≤ (26.01 / 22.09) 2.57

0.46 ≤ σ 12 / σ 22 ≤ 3.02

Como el intervalo incluye a la unidad, no es posible afirmar que las desviaciones estándar dos los dos procesos sean diferentes con un nivel de confianza del 90%

(23)

9 INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN

A menudo es necesario construir un intervalo de confianza para una proporción. Por ejemplo, supóngase que se toma una muestra aleatoria de tamaño n de una

población grande (posiblemente infinita) y que X ( ≤ n) observaciones de esta muestra

pertenecen a una clase de interés. Entonces P^= X/n es un estimador puntual de la proporción de la población p que pertenece a esta clase. Nótese que n y p son los parámetros de una distribución binomial. Por otra parte, e sabe que la distribución de muestreo de P^ es aproximadamente normal con media p y varianza p(1 – p)/n, si p no está muy próximo a 0 o 1 y si n es relativamente grande. Por tanto, la distribución de P^ - p

Z =

√ [p (1 – p)] / n

es aproximadamente una distribución normal estándar.

Para construir el intervalo de confianza para p, nótese que P( -zα/2 ≤ Z ≤ zα/2) ≈ 1 - α

de modo que

P^ - p

P( -zα/2 ≤ ≤ zα/2) ≈ 1 - α

√ [p (1 – p)] / n La expresión anterior puede escribirse como

P( P^ -zα/2 √ [p (1 – p)] / n ≤ p ≤ P^ + zα/2 √ [p (1 – p)] / n ≈ 1 - α

(9-1)

La cantidad √ [p (1 – p)] / n de la ecuación 9-1 es el error estándar del estimador

puntual P^. Desafortunadamente, los límites superior e inferior del intervalo de confianza obtenidos a partir de la ecuación 9-1 contiene el parámetro desconocido p. Sin embargo, una solución satisfactoria es remplazar p por P^ en el error estándar, lo que da como resultado

P( P^ -zα/2 √ [P^ (1 – P^)] / n ≤ p ≤ P^ + zα/2 √ [P^ (1 – P^)] / n ) ≈ 1 - α

(9-2)

La ecuación 9-2 conduce a un intervalo de confianza del 100(1 - α ) por ciento

(24)

Definición: Intervalo de confianza de una proporción

Si p^ es la proporción de observaciones de una muestra aleatoria de tamaño n que pertenece a una clase de interés, entonces un intervalo de confianza aproximado del

100(1 - α ) por ciento para la proporción p de la población que pertenece a esta clase es

p^ -zα/2 √ [p^ (1 – p^)] / n ≤ p ≤ p^ + zα/2 √ [p^ (1 – p^)] / n (9-3)

donde zα/2 es el punto crítico superior que corresponde al porcentaje α /2 de la

distribución normal estándar.

Este procedimiento requiere que np y n(1-p) sean mayores o iguales que 5. En situaciones donde esta aproximación es inapropiada (en particular, en casos donde n es pequeño), deben emplearse otros métodos. Las tablas de distribución binomial también pueden emplearse para obtener un intervalo de confianza para p. Si n es grande pero p pequeño, entonces puede utilizarse una aproximación Poisson para la distribución binomial con la finalidad de construir intervalos de confianza. Sin embargo, los autores prefieren utilizar métodos numéricos basados en la función de probabilidad binomial.

Ejemplo

En una m.a. de 85 soportes para arreglar el cigüeñal de un automóvil, 10 tienen un terminado que es más rugoso de los que las especificaciones permiten. Hallar un intervalo de confianza bilateral del 95%.

Solución

Una estimación puntual de rugosidad es p^= x/n = 10/85 = 0.12

1- 0.95= 0.05 = α -> α /2 = 0.025

z0.025 =1.96

p^ - zα/2 √ [p^ (1 – p^)] / n ≤ p ≤ p^ + zα/2 √ [p^ (1 – p^ )] / n

0.12 – 1.06 √ (0.12 (1 – 0.12) ) / 85 ≤ p ≤ 0.12 + 1.06 √ (0.12 (1 – 0.12) ) / 85

(25)

Selección del tamaño de la muestra

Puesto que P^ es el estimador puntual de p, puede definirse el error de estimar p

por P^ como E=|p – P^|. Nótese que se tiene una confianza aproximada del 100 (1 - α )

por ciento de que este error es menor que zα/2√ [p(1 – p)]/n . En el ejercicio anterior se

tiene una confianza del 95% de que la proporción muestral p^= 0.12 difiere de la proporción verdadera p por una cantidad que no excede 0.07.

En situaciones donde puede seleccionarse el tamaño de la muestra, puede

escogerse a n de modo que exista una confianza del 100( 1 - α ) por ciento de que el

error es menor que algún valor especificado E. Si se hace E= zα/2√ [p(1 – p)]/n y se

resuelve para n, el tamaño apropiado de la muestra es

n = ( zα/2 / E) 2 p (1 – p) (9-4)

Para utilizar la ecuación 9-4 se requiere una estimación de p. Si se tiene una estimación p^ de alguna muestra anterior, entonces p puede sustituirse por éste en la ecuación 9-4, o quizás sea posible hacer una estimación subjetiva. Si estas alternativas no son satisfactorias, entonces puede tomarse una muestra preliminar, calcular p^, y luego utilizar la ecuación exactitud deseada. Otro enfoque para seleccionar n utiliza el hecho de que el tamaño de la muestra obtenido en la ecuación 9-4 siempre es máximo

para p= 0.5 [esto es, p(1 – p) ≤ 0.25, cumpliéndose la igualdad cuando p=0.5], y esto

puede emplearse para obtener una cota superior sobre n. En otras palabras, al menos se

tiene una confianza del 100(1 - α ) por ciento de que el error al estima p con `^ sea

menor que E si el tamaño de la muestra es

n = ( zα/2 / E) 2 (0.25) (9-5) Ejemplo

Tomando el ejemplo anterior.

¿Cuál grande debe ser la muestra si se desea tener una confianza del 95% de que el error al utilizar p^ como estimación de p sea menor que 0.05?

Solución

Al utilizar p^= 0.12 como estimador inicial de p, se tiene: n = ( zα/2 / E) 2 p^ (1 – p^)

(26)

n = (1.96 / 0.05)2 0.12 ( 0.88) 1.63

Intervalos de confianza unilaterales

Pueden encontrarse intervalos de confianza unilaterales para p mediante una modificación sencilla de la ecuación 9-3. El intervalo de confianza inferior aproximado

del 100( 1 - α ) por ciento es

p^ -zα/2 √ [p^ (1 – p^)] / n ≤ p (9-6)

y el intervalo de confianza superior aproximado del 100 (1 - α ) por ciento es

(27)

10 INTERVALO DE CONFIANZA PARA LA DIFERENCIA

DE DOS PROPORCIONES

Supóngase que existen dos proporciones de interés, p1 y p2, y es necesario obtener un

intervalo de confianza del 100( 1 - α ) por ciento para la diferencia de éstas, p1 – p2.

Supóngase que se toman dos muestras independientes de tamaño n1 y n2 de dos

poblaciones infinitamente grandes. En estas dos muestras, sean X1 el número de

observaciones de la primera muestra que pertenece a la clase de interés, y X2 el número

de observaciones en la muestra tomada de la segunda población que pertenecen a la

clase de interés. Entonces, X1 y X2 son variables aleatorias binomiales independientes

con parámetros (n1, p1) y (n2, p2). Ahora bien, P1^ = X1/ n1 y P2^= X2/n2 son estimadores

independientes de p1 y p2, respectivamente. Por otra parte, bajo la hipótesis de que se

aplica la aproximación normal de una distribución binomial, el estadístico P1^ - P2^ - (p1 – p2)

Z=

√ p1(1- p1)/ n1 + p2(1- p2)/ n2

tiene una distribución que es aproximadamente normal estándar. Esto implica que P( - zα/2≤ Z ≤ zα/2 ) ≈ 1 - α

de modo que puede sustituirse la Z de esta expresión y utilizar entonces un enfoque similar al empleado en la sección 9 para encontrar un intervalo de confianza

aproximado del 100( 1 - α ) por ciento para p1 – p2.

Definición: Intervalo de confianza para la diferencia de dos proporciones

Si p1^ y p2^ son las proporciones muéstrales de una observación en dos muestras

aleatorias independientes de tamaños n1 y n2 que pertenecen a una clase de interés,

entonces un intervalo de confianza aproximado del 100(1 - α ) por ciento para la

diferencia de las proporciones verdaderas p1 – p2 es

p1^–p2^-zα/2√p1(1- p1)/ n1+p2(1-p2)/n2 ≤ p1 – p2 ≤ p1^–p2^-zα/2√p1(1-p1)/n1+p2(1-p2)/n2

(10-1)

donde zα/2 es el punto crítico superior que corresponde al porcentaje α /2 de la

distribución normal estándar.

Intervalos de confianza unilaterales

El intervalo de confianza inferior aproximado del 100(1 - α ) por ciento para p1 – p2 es

(28)

y el intervalo de confianza superior aproximado del 100 ( 1 - α ) por ciento para p1 – p2

es

(29)

11 TABLA RESUMEN DE PROCEDIMIENTOS PARA OBTENER

INTERVALOS DE CONFIANZA

Tipo de problema Estimación puntual Intervalo de confianza bilateral del 100(1 - ciento α ) por Media µ , varianza σ 2 conocidas x x - z

α/2 (σ /√n) ≤ µ ≤ x + zα/2 (σ /√n)

Diferencia entre dos medias µ 1 y µ 2, varianzas σ 12 y σ 22 conocidas

x1 –x2 x1-x2 - zα/2 √(σ 12/n1) + (σ 22/n2) ≤ µ 1-µ 2 ≤

x1-x2 + zα/2 √(σ 12/ n1) + (σ 22/ n2) Media µ de una distribución

normal, varianza σ 2 desconocida

x x – tα/2,n-1 s/√n ≤ µ ≤ x + tα/2,n-1 s/√n

Diferencia entre medias de dos dis-tribuciones normales µ 1 y µ 2, varian-zas σ 12 y σ 22 desconocidas x1 –x2 x1-x2 -tα/2, n1+n2–2 sp√1/n1+1/n2 ≤ µ 1-µ 2 ≤ x1-x2 + tα/2, n1+n2–2 sp√1/n1+1/n2 sp = √[(n1 – 1) S12 + (n2 – 1) S22] / (n1 + n2 – 2 ) Diferencia entre medias de dos

dis-tribuciones normales µ 1 y µ 2, varian-zas σ 12≠ σ 22 desconocidas

x1 –x2 x1 - x2 - tα/2,v √ s12/n1 + s22/n2 ≤ µ 1 - µ 2 ≤

x1 - x2 + tα/2,v √ s12/n1 + s22/n2

v=(S12/n1+S22/n2)2/ [(S12/n1)2/ n1+1] +[(S22/n2)2/ n2+1] –2 Varianza σ 2 de una distribución

normal s

2 ( n – 1) S2 /χ 2

1-α/2,n-1 ≤ σ 2≤( n – 1) S2 / χ 2α/2,n-1

Cociente de las varianzas σ 12 / σ 22 de dos distribuciones normales s1

2/ s

22 (s12/ s22 )f 1-α/2, n2-1,n1-1≤ σ 12 / σ 22 ≤ (s12/ s22 )f α/2, n2-1,n1-1

Proporción o parámetro de una

distribución binomial p p^

p^ - zα/2 √ [p^(1 – p^)] /n ≤ p ≤

p^ + zα/2 √ [p^ (1 – p^)] / n

Diferencia entre dos proporciones o dos parámetros binomiales p1 – p2

p1^ - p2^ p1^–p2^-zα/2√p1(1- p1)/ n1+p2(1-p2)/n2 ≤ p1 – p2 ≤

(30)

BIBLIOGRAFÍA

1.-R.E. Walpole y R.H. Myers. Probabilidad y estadística. McGraw-Hill,1992

2.-Douglas C. Montgomery y George C. Runger Probabilidad y Estadística aplicadas a

Figure

Actualización...

Referencias

Actualización...