Teor+¼a de Estad+¡stica II ADM revizado MARZO 2014

(1)

UNIDAD I

MUESTREO Y DISTRIBUCIONES MUESTRALES

1. INFERENCIA ESTADÍSTICA

Es el proceso de generalizar resultados muéstrales a la población.

El objeto de la teoría de las muestras es obtener, por camino inferencial, conclusiones válidas para una población numerosa, partiendo de la observación del comportamiento de una parte en general pequeña, llamada muestra.

La teoría del muestreo es un estudio de las relaciones existentes entre una población y muestras extraídas de la misma. Permite estimar cantidades desconocidas de la población (tales como media, la varianza, etc.) llamados parámetros, a partir del conocimiento de las correspondientes cantidades muestrales (tales como la media muestral, la varianza, etc.) llamadas estadísticas.

Generalmente la inferencia estadística se descompone en dos áreas:

a) Pruebas de hipótesis: aceptar o rechazar declaraciones acerca de los parámetros de

la población.

Una hipótesis estadística es una declaración o afirmación tentativa acerca de un parámetro o parámetros de una población.

b) Estimaciones: estimar valores de parámetros de la población 2.- MUESTREO DE UNA POBLACIÓN

Muestreo es el proceso por el cual se selecciona un número relativamente reducido de elementos de una población estadística, con objeto de proceder a su análisis.. Los elementos seleccionados constituyen una muestra. La población es el conjunto de todos los elementos que podrían ser analizados en relación con el atributo o característica objeto de estudio. Es evidente que el análisis de una determinada característica poblacional sería exacto si pudiésemos llevarlo a cabo con todos los elementos de la población. Sin embargo, consideraciones de coste, así como la viabilidad en el tratamiento de los datos, nos llevan a seleccionar una muestra y llevar a cabo en ella el análisis. Los resultados de tal estudio serán extrapolados a toda la población.

Es preciso que la muestra sea representativa de la población, respecto de la cuestión que va a ser objeto de análisis.

(2)

Un muestreo es de tipo aleatorio cuando cada elemento poblacional tiene asociada una determinada probabilidad de ser elegido, sean estas iguales entre si o no. En el muestreo no aleatorio se decide, cuáles formarán parte de la muestra.

El muestreo aleatorio se dice simple cuando todos los elementos muestrales tienen la misma probabilidad de ser escogidos para formar parte de la muestra.

En ocasiones, se sabe que la población consta de subgrupos bastante homogéneos internamente, aunque posiblemente muy diferentes entre sí. En esta situación es muy adecuado llevar a cabo un muestreo estratificado, en donde, cada uno de los subgrupos son homogéneos, formando estrato.

Se denomina muestreo estratificado simple aquel en que, dentro de cada estrato, se seleccionan los elementos por medio de un muestreo aleatorio simple. Se denomina muestreo estratificado uniforme cuando se extrae un mismo número de elementos de cada estrato. Se denomina muestreo estratificado proporcional cuando el número de elementos muestrales a extraer de cada estrato poblacional se toma proporcional al tamaño relativo del estrato dentro de la población. Si la varianza dentro de cada estrato es muy diferente de unos a otros, puede preferirse tomar más elementos muestrales de los estratos con mayor varianza.

Decimos que tenemos una clasificación de la población por conglomerados, cuando diversos elementos configuran una unidad inseparable, en términos del muestreo. Efectuamos un muestreo por conglomerados cuando llevamos a cabo un muestreo aleatorio entre los conglomerados poblacionales, pasando a formar parte de la muestra todos los elementos poblacionales que forman parte de cada uno de los conglomerados que fueron seleccionados. Por ejemplo, las personas que integran un hogar, las familias que viven en una misma casa, o los municipios de una provincia.. Este tipo de muestreo es adecuado cuando existe bastante diversidad dentro de cada conglomerado, siendo todos los conglomerados relativamente similares entre sí.

3.- DISTRIBUCIONES MUESTRALES

Debe considerarse todas las posibles muestras de tamaño "n" que pueden extraerse de una población dada. Para cada muestra se puede calcular un estadístico, tal como la media, la varianza, desviación típica, etc., que variará de una muestra a otra. De ésta forma se obtiene una distribución del estadístico que se conoce como distribución muestral.

Si por ejemplo, el estadístico de que se trata es la media muestral, la distribución se conoce como distribución muestral de medias o distribución muestral de la media. Análogamente se obtendrían las distribuciones muestrales de las desviaciones típicas, varianzas, medianas, proporciones etc.

4.- DISTRIBUCIÓN MUESTRAL DE MEDIAS

La media de la distribución muestral de las medias de todas las muestras posibles siempre será exactamente igual a la media del universo. Esto es cierto en base de teorema del límite central y es válido para cualquier población, no importa cual sea el tamaño de las muestras. Esto nos asegura que, si se extraen repetidas muestras independientes de n observaciones de una población, entonces, cuando el número de muestras se hace muy grande, el promedio de las medias muestrales se hace muy próximo a la verdadera media poblacional.

Supóngase que son extraídas de una población finita todas las posibles muestras de tamaño "n"; si se denota la media y la desviación típica de la distribución muestral de las

(3)

medias por (x) y (x) y la media y desviación típica de la población por  y (x) respectivamente se tiene:

La varianza de la distribución muestral de X decrece a medida que aumenta el tamaño muestral n; la correspondiente desviación típica, recibe el nombre error estándar de X.

Si el número n de miembros de la muestra no es muy pequeña en comparación del número N de miembros de la población (n>5% de N), para el calculo del error estándar, se debe utilizar el factor de corrección por población finita, de donde resulta:

Si el tamaño muestral es una proporción pequeña del tamaño poblacional (n<5% de N), se utiliza :

Para valores grandes de "n" (n  30), la distribución muestral de medias se aproxima a una distribución normal independientemente de la población de que se trate (teorema central del límite) incluso cuando la distribución de la población no es normal.

En caso de que la población se distribuya normalmente, la distribución muestral de medias se distribuye también normalmente, incluso para pequeños valores de "n" (es decir n < 30)

La probabilidad de que la media muestral difiera de la media poblacional, decrece a medida que aumenta el tamaño muestral.

5.- DISTRIBUCIÓN MUESTRAL DE PROPORCIONES

Para grandes valores de "n" (n  30) la distribución muestral se aproxima a una distribución normal.

Para poblaciones finitas y muestreo sin remplazo se usan: =p y de donde se tiene:

Para p fijo, el error estándar de proporción muestral disminuye a medida que crece el tamaño muestral. Esto implica que al aumentar el tamaño muestral, la distribución P se concentra más alrededor de su media. La probabilidad de que la proporción muestral y la

 

  x  

 

x 

 

1   N n N n x 

 

x  P  p 

 

n q p P x   .  p   Proporción poblacional P X  Proporción muestral

 

. . ₁ 1 .       N n N n q p N n N n q p x 

Para población infinita y también para población finita en la que el muestreo se hace con remplazo.

 

  x 

 

n x x   

Si el muestreo es con remplazo, tenemos:

Si el muestreo es sin remplazo, tenemos

 

1   N n N n x 

 

x  

 

n x x   

(4)

poblacional difieran en más de una cantidad fija disminuye a medida que crece el tamaño muestral. En otras palabras, si tomamos una muestra mayor de la población, nuestra inferencia acerca de la proporción de individuos que poseen una característica particular se hará más firme.

6.- MEDICIÓN DEL ERROR POR MUESTREO: ERROR ESTÁNDAR Y SUS APLICACIONES

Al resumir los resultados de un estudio mediante cualquiera de las medidas estadística (promedios, porcentajes, etc.), hay que tener en cuenta que tales constantes pueden adolecer de los mismos defectos que presentan las mediciones individuales.

Los errores mas comunes son: Los errores debidos al observador, al objeto observado y el método de observación, estos errores pueden algunas veces desaparecer al utilizar una medida de resumen o puede hacerse mas aparentes.

Un observador a causa de su impericia o fatiga, puede cometer errores.

En realidad, no existe ningún método estadístico que permita valorar exactamente los errores una vez cometidos. Una perfecta preparación de los observadores, un control adecuado de las técnicas y la estandarización de un método que permita estudiar a todos los individuos en las mejores condiciones, serán imprescindibles para reducir a un mínimo los errores.

6.1 Error por muestreo

Por lo general resulta imposible estudiar la totalidad de la población en la cual puede observarse determinado fenómeno, teniendo que limitarnos al estudio de una muestra de dicha población. El error que puede cometerse se debe simplemente al hecho de que no estamos estudiando la totalidad del universo sino una porción de él, y este se conoce con el nombre de error por muestreo y él, representa en realidad la diferencia que hay entre el

valor dado por la muestra y el verdadero valor del universo que tratamos de averiguar.

6.2 Medición del error por muestreo: Error estándar.

La constante estadística que permite la medición del error por muestreo, recibe el nombre de Error Estándar. Desde luego que cada una de las medidas de resumen, tendrá su correspondiente error estándar. Podrá hablarse por consiguiente del error estándar del promedio, del error estándar de un porcentaje o del error estándar del coeficiente de correlación, etc.

6.3 Origen del Error Estándar

Si de una población determinada se obtiene un número grande de muestras del mismo tamaño y en cada una se calcula el promedio, estos promedios se distribuirán alrededor del verdadero valor del universo formando una curva normal.

Por consiguiente, como los promedios de un conjunto de muestras extraídas de determinado universo se distribuyen alrededor del verdadero valor del universo formando una curva normal, puede afirmarse: que ninguna muestra diferirá del valor del universo en más de 3 veces la desviación estándar, respecto de la media.

La desviación estándar de un conjunto de muestras obtenidas de determinada población, puede estimarse con bastante exactitud, a partir de una sola muestra.

Esta constante estadística, mediante la cual se estima la verdadera desviación estándar de un conjunto de muestras, recibe el nombre de Error Estándar.

(5)

6.4 Desviación Estándar y Error Estándar

La diferencia que hay entre desviación estándar y el error estándar, es que desviación estándar, sirve para indicar la variación que presentan los individuos de una muestra, alrededor de su promedio, por su parte, el error estándar mide la variación de un conjunto de muestras y puede considerarse, por lo tanto, como la desviación estándar de un conjunto de muestras.

Por lo tanto, si queremos describir la manera como se distribuyen alrededor del promedio los individuos de la muestra que estamos estudiando, debemos calcular la desviación estándar, pero si lo que deseamos es saber cómo se distribuyen los promedios de diferentes muestras alrededor del verdadero valor del universo, entonces debemos calcular el error estándar

Resumiendo:

Error Estándar es la distribución de los distintos promedios muestrales alrededor de

la media del universo.

Desviación Estándar es la variación que presentan los individuos de una muestra alrededor de su media.

(6)

UNIDAD II

ESTIMACIÓN PUNTUAL

1. INTRODUCCIÓN

Un estimador de un parámetro poblacional es una variable aleatoria que depende de la información de la muestra y cuyas realizaciones proporcionan aproximaciones al valor desconocido del parámetro.

Un estimador puntual de un parámetro poblacional es una función de la muestra que da como resultado un único valor que sea una buena aproximación. La correspondiente realización se llama estimación puntual del parámetro.

2. ESTIMAS INSESGADAS

Si la media de la distribución muestral de un estadístico (es igual al correspondiente parámetro poblacional, el estadístico se llama estimador insesgado del parámetro, si no es igual se dice estimador sesgado del mismo. Los valores correspondientes de tales estadísticos se conocen, respectivamente como estimas insesgadas o sesgadas.

Se dice que el estimador  es un estimador insesgado del parámetro, si la media de la distribución muestral de  es  , es decir E () = .

La notación de esperanzas indica que si repetimos el proceso de muestreo muchas veces, en promedio, el valor que se obtiene de un estimador insesgado será igual al parámetro poblacional.

Por tanto, podemos decir que la media, la varianza y la proporción muestrales son estimadores insesgados de los correspondientes parámetros poblacionales. Es por esta razón, por la que al definir la varianza muestral dividimos la suma de los cuadrados de las discrepancias por (n-1) en lugar de n . En el primer caso se obtiene un estimador insesgado, mientras que en el segundo no. La media de la distribución de la desviación típica muestral no es la desviación típica poblacional.. Por tanto, la desviación típica muestral no es un estimador insesgado de la desviación típica poblacional.

Por consiguiente, se dice que un estimador es sesgado si no es insesgado. Llamaremos sesgo a la diferencia entre la media del estimador y el verdadero parámetro.

Sea  el estimador de . El sesgo de  se define como la diferencia entre su media y ., es decir, Sesgo () = E() - . De esto se deduce que el sesgo de un estimador insesgado es 0.

(7)

Si las distribuciones muestrales de dos estadísticos tienen la misma media, el estadístico que tenga menor varianza se llama estimador eficiente de la media, mientras que el otro estadístico se llama estimador no eficiente.

Sean 1 y 2 dos estimadores insesgados de , obtenidos en muestras del mismo

tamaño, entonces, se dice que 1 es mas eficiente que 2 si:

Var.( 1) < Var. (2 ).

La eficiencia relativa de un estimador respecto al otro es el cociente de sus varianzas, es decir,

Eficiencia relativa = Var.( 1 ) / Var. (2 )

Definición: Si  es un estimador insesgado de  , y no hay ningún otro estimador insesgado que tenga menor varianza, entonces se dice que  es el estimador insesgado más eficiente o de minima varianza de 

Algunos ejemplos de estimadores insesgados de mínima varianza son:

1.- La media muestral cuando la muestra proviene de una distribución normal 2.- la varianza muestral cuando la muestra proviene de una distribución normal 3.- La proporción muestral binomial

4.- ESTIMACIÓN POR INTERVALOS

4.1.- INTERVALOS DE CONFIANZA

En la mayoría de los problemas prácticos, un estimador puntual por sí solo es inadecuado. Es más adecuado encontrar un estimador por intervalo, que es un rango de valores entre los que posiblemente se encuentre la cantidad que se estima.

Si extraemos una muestra relativamente grande de la población, es lógico esperar que la información que nos aporta sea más fiable que la procedente de una muestra más pequeña, siempre que las demás condiciones del muestreo sean las mismas. Este aspecto no se refleja en la estimación puntual. El incremento de la precisión de nuestra información sobre los parámetros de la población, se refleja en los estimadores. Cuanto mayor sea la muestra, menor será el intervalo que recoge nuestra incertidumbre sobre el verdadero valor del parámetro, siempre que las otras condiciones permanezcan iguales.

Un estimador por intervalos de un parámetro poblacional es una regla (basada en información muestral) para determinar un rango, o un intervalo, en el cual posiblemente se encuentre dicho parámetro. La estimación correspondiente se denomina estimación por intervalos.

La cantidad (1 - ) se denomina contenido probabilístico o nivel de confianza del intervalo.

Observación:

*Un parámetro poblacional es una medida de resumen de una población, en tanto que a una medida de resumen de una muestra se le denomina estadística muestral.

* Una distribución poblacional representa la distribución de valores de una población, y una distribución muestral representa la distribución de los valores de una muestra.

(8)

4.1.1 .- INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCIÓN NORMAL: VARIANZA POBLACIONAL CONOCIDA.

Supongamos que tenemos una muestra aleatoria de n observaciones procedentes de una

distribución normal con media  y varianza  2 _{.Si } 2_{es conocida y el valor observado de}

la media muestral esX , entonces, un intervalo de confianza del 100(1 - )% para la media poblacional está dada por:

Puede comprobarse, entonces, que la longitud de un intervalo de confianza depende de

su contenido

probabilístico, de la desviación típica poblacional y del número de observaciones de la muestra. En particular, se verifican los siguientes resultados:

1.- Dado un contenido probabilístico y un tamaño muestral, cuanto mayor sea la desviación típica poblacional, mayor longitud tendrá el intervalo de confianza para la media poblacional.

2.- Dado un contenido probabilístico y una desviación típica poblacional, cuanto mayor sea el tamaño de la muestra, más corto será el intervalo de confianza para la media poblacional.

3.- Dada una desviación típica poblacional y un tamaño muestral, cuanto mayor sea el contenido probabilístico (1 - ) , mayor será la longitud del intervalo de confianza para la media poblacional.

4.1.2 INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL:

TAMAÑOS MUESTRALES GRANDES.

Supongamos que tenemos una muestra de n observaciones procedentes de una distribución con media . Sean X y S media muestral y la desviación típica, respectivamente. Entonces, si n es grande ( n = 30 observaciones o más constituyen una muestra grande), una buena aproximación de un intervalo de confianza del 100(1 - )% para . viene dada por:

En la mayor parte de los casos, esta aproximación seguirá siendo adecuada incluso cuando la distribución de la población no es normal.

n Z X n Z X _ /2. _ _ _ /2. n Z W _ 2. /2.

La longitud del intervalo, es decir, la distancia entre los extremos, está dada por:

n S Z X n S Z X _ /2. _ __ _ /2.

(9)

4.1.3 INTERVALOS DE CONFIANZA PARA LA MEDIA DE UNA DISTRIBUCIÓN NORMAL: VARIANZA POBLACIONAL DESCONOCIDA

DISTRIBUCIÓN t DE STUDENT

Trataremos ahora el caso, de considerable interés práctico, en el que la varianza poblacional es desconocida y el tamaño de la muestra es pequeño.

Se puede utilizar cuando la muestra ha sido extraída de una población que se distribuye normalmente. La distribución t es simétrica, pero ligeramente más achatada que la distribución normal. Además, varía con el número de grado de libertad. Cuando el número de grados de libertad es muy pequeño, la distribución t se aleja bastante de la normal; pero a medida que aumentan los grados de libertad, la distribución t se va pareciendo cada vez más a la normal.

Tanto la distribución t como la normal, tienen media 0 y las funciones de densidad son simétricas alrededor de la media. Sin embargo, la función de densidad de la t de Student tiene una dispersión mayor que la normal estándar.

Los grados de libertad se definen como: v = n - 1

Se utiliza cuando n < 30 normalmente distribuida y no se conoce (x)

Dada una muestra n de observaciones con media X y desviación típica S, procedente de una población normal con media ., la variable aleatoria sigue una distribución t de Student con (n-1) grados de libertad

Podemos emplear ahora la distribución t de Student para derivar intervalos de confianza para la media de una población normal cuando la varianza es desconocida y se dispone solo de un número moderado de observaciones.

Supongamos que tenemos una muestra aleatoria de n observaciones procedentes de una distribución normal con media . y vararianza desconocida. Si la media y la desviación típica muestrales son, respectivamente, X y S, entonces, un intervalo de confiaza del 100(1 - )% para la media poblacional . viene dada por:

4.1.4 INTERVALOS DE CONFIANZA PARA PROPORCIONES DE LA

POBLACIÓN (MUESTRAS GRANDES)

Sea P, la proporción observada de éxitos en una muestra aleatoria de n observaciones procedentes de una población con una proporción p de éxitos. Entonces, si n es grande, un intervalo de confianza del del 100(1 - )% para la proporción poblacional viene dada por:

n S t X n S t X_ v./2. __ _ _ v./2. n Q P Z P p n Q P Z P /2.    /2. . n S X n S X t   .

(10)

Si el tamaño muestral es grande, podemos conseguir una buena aproximación sustituyendo p por su estimador puntual P, es decir:

Los intervalos de confianza construidos de este modo son generalmente bastante fiables cuando se basan en muestras con n = 40 o más observaciones.

Resumen:

Uso de la distribución normal:

Si una población tiene distribución normal, la distribución muestral de la media para cualquier tamaño de muestra tiene también distribución normal; esto es cierto independientemente de si se conoce o no la dispersión poblacional.

Aplicación:

1) Cuando n  30 en todos los casos (Teorema Central del Límite) 2) Cuando n < 30 debe ser normalmente distribuida y conocida  Ejemplos:

1.-Un restaurante desea estimar la cantidad media de dinero que gasta un consumidor para almorzar. Se selecciona una muestra al azar de tamaño n = 36 y se encuentra que la media es igual a 1.20$ y una desviación típica de 0.24 $ con un coeficiente de confianza del 95%. ¿Cuál será el intervalo de confianza?

X = 1.20 $ S = 0.24 $

n = 36 Z = 1.96

1,20  1.96 ( 0.24)

36

1,1216 < u < 1,2784 representa el gasto promedio de los clientes del restaurante.

2.-Una escuela desea estimar el peso medio de los estudiantes del 6º grado. Se selecciona una muestra al azar de n = 30 y se encuentra que la media de la muestra esX = 45 Kg. Se conoce que la desviación típica de la población es 6 Kg. con un coeficiente de confianza del 95%. ¿Cuál será el intervalo de confianza que resulta?

X = 45 

 = 6 45  1.96( 6)

n = 30 30

Z = 1.96

42,85 < u < 47,15 representa el peso medio de los estudiantes del sexto grado.

3.- En una semana determinada se elige al azar una muestra de 300 empleados de un número muy grande, que trabajan en una empresa manufacturera. Los trabajadores realizan una labor a destajo, y se encuentra que el promedio de pago por pieza trabajada es de $ 1.800 con una desviación estándar muestral de S = $ 140. Estimar el pago promedio a

La variable aleatoria Z tiene una distribución normal estándar:

n q p p P Z / .   n Q P n q p. _ .

(11)

destajo para todos los empleados de la empresa, con una estimación por intervalo que permita tener una confianza del 95% de que ese intervalo incluye el valor de la media poblacional, es: X= 1800 S = 140 1 -  = 0,95 n = 300 X+1.96 Sx = 1800 + 1.96(8.0829) = $ 1784.16 a $ 1815.84 S x = S/n = 140/ 300 = 8,0829

Conclusión: puede afirmarse que el pago promedio a destajo para todos los empleados está entre $ 1784,16 y $ 1815,84, con un grado de confianza del 95% en esta estimación.

4.- una empresa de investigación de mercados entrevista a una muestra aleatoria de 100 hombres de una comunidad grande, y encuentra que una proporción de 0.4 de ellos prefieren la hoja de rasurar fabricadas por la empresa cliente de los investigadores, y no las demás marcas. Calcular el intervalo de confianza del 95% para la proporción de todos los hombres de esa comunidad que prefieren las hojas de rasurar cliente de los investigadores.

n = 100

sp = (0.4) ( 0.6)/100 = 0.24/100 = 0.05

P + z sp = 0.4 + 1.96 (0.05) = 0.4 + 0.098 = 0.4 + 0.1 = 0.3 a 0.5

Se puede afirmar con una confianza del 95% que la proporción de hombres de esa comunidad que prefieren las hojas de rasurar de la empresa que está entre 0.3 y 0.5

5) Una lista de un departamento de personal, elige al azar los expedientes de 16 trabajadores a destajo, y encuentra que el salario promedio por pieza es de $ 950. Se supone que los salarios de esa empresa, tienen una distribución normal, si se sabe que la desviación estándar de los salarios es de $ 100, estime los valores para el salario promedio utilizando un intervalo de confianza del 90 %.

n = 16 X = $ 950  = 100 1 -  = 0,90 Z = 1,645 X +1.645 x 950  1,645 (25) 950  41,125 908.88 a 991,13  x = /n = 100/ 16 = 25

Conclusión: puede afirmarse que el pago promedio a destajo por pieza para todos los trabajadores está entre $ 908.88 y $ 991.13, con un grado de confianza del 90% en esta estimación.

Uso de la distribución t de Student

Aplicación:

Cuando: n < 30, normalmente distribuida y se conoce S.

La distribución t de Student comparada con la distribución normal es platicúrtica (plana).

(12)

v = n - 1 grado de libertad, que significa los valores libres de la muestra para variar.

El número de grados de libertad muestra el número total de observaciones en la muestra, menos el número de restricciones impuesto en ellas. La regla general es: v = n – número de parámetros estimados.

La distribución t es adecuada para las inferencias relacionadas con la media cuando no se conoce  y la población está normalmente distribuida, cualquiera fuera el tamaño de la muestra

Sin embargo, a medida que se aumenta el tamaño de la muestra (y el v) la distribución t puede ser aproximado por la distribución normal cuando n  30 o v > 29 para una sola muestra.

En poblaciones finitas sin reposición se utiliza el factor de corrección de una población finita (fpc)

Ejemplo: El diámetro promedio de una muestra de n =12 varillas incluidas en un embarque es de 2,350 mm, con una desviación estándar de 0.050 mm. Se supone que la distribución de los diámetros de todas las varillas incluidas en el embarque tiene una distribución aproximadamente normal. Determine el intervalo de confianza del 99% para estimar el diámetro promedio de todas las varillas.

X = 2,350 S = 0,05

1 -  = 0,99 tv = 3,1058 n = 12

X+3,1058 Sx = 2,350 + 3,1058(0.01445) = 2,305 a 2,395

S x = S/n = 0.05/ 12 = 0.01445

4.1.5 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE

DOS MEDIAS POBLACIONALES UTILIZANDO LA DISTRIBUCIÓN NORMAL

Con frecuencia es necesario estimar la diferencia entre dos medias poblacionales, tal como la diferencia entre los niveles salariales en dos empresas. Siendo el estimador puntual no sesgado de (u1 - u2) es la diferencia

El intervalo de confianza se construye de manera similar a la estimación de la media, excepto que el error estándar de la distribución muestral que corresponde en este caso es el de la diferencia entre medias. El uso de la distribución normal se basa en las mismas condiciones que para el caso de la distribución muestral de la media, excepto que en este caso hay dos medias.

Cuando se conocen las desviaciones estándar de las dos poblaciones, el error estándar de la diferencia entre dos medias es:

Cuando no se conocen las desviaciones estándar de las poblaciones, el error estándar estimado de la diferencia entre dos medias, suponiendo que resulta apropiado el uso de la distribución normal es:

Los valores de errores estándar de las medias respectivas que se incluyen en éstas fórmulas se calculan incluyendo la posibilidad de utilizar los factores de corrección por población finita cuando es apropiado.

) (X1X2 ) ( 2 ) ( 2 ) (x₁ x₂  X1  X2  _   ) ( 2 ) ( 2 ) (x₁x₂  S X1 S X2  2 ) ( 2 1 ) ( 2 ) ( 2 1 2 1 n n x x x x    _  

(13)

Además del intervalo de confianza de dos extremos, puede construirse también un intervalo de confianza de un extremo para la diferencia entre dos medias.

Ejemplo: El salario diario promedio para una muestra de 30 empleados de una empresa manufacturera grande es $ 28.000, con una desviación estándar de $ 1.400. En otra empresa grande, una muestra aleatoria de 40 empleados tiene un salario promedio diario de $ 27.000, con una desviación estándar muestral de $ 1.000. El intervalo de confianza del 99% para estimar la diferencia entre los niveles diarios de salarios en las dos empresas es:

Int. del 99% = (X1 -X2) + z x1 - x2 = $ 1.000 + 2,58 (300,55) = $ 1.000 + 773,92 = $ 224, 58 a $ 1775,42 = $ 225 a $ 1775 en donde: X1 - X2 = $ 28000 - $ 27000 = $ 1000 Z = 2,58 x1 = S1 = 1400 = 1400 = 255,60 n1 30 5,477 x2 = S2 = 1000 = 1000 = 158,11 n2 40 6,325

Por ello, puede afirmarse que el salario diario promedio de la primera empresa es mayor que el correspondiente a la segunda, en una cantidad que va de $ 225 a $ 1775, con una confianza del 99% en esa estimación del intervalo.

4.1.6 LA DISTRIBUCIÓN t DE STUDENT Y LOS INTERVALOS DE

CONFIANZA PARA LA DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES

Es aplicable bajo las siguientes condiciones:

1) No se conocen las desviaciones estándar de las poblaciones

2) Las muestras son pequeñas (n<30). Si las muestras son grandes, entonces es posible aproximar los valores t mediante la distribución normal standard .

3) Se supone que las poblaciones tienen distribuciones aproximadamente normales (debe observarse que no pueden aplicarse el teorema del límite central cuando se trata de muestras pequeñas).

4) Las varianzas de las dos poblaciones (que se desconocen) son iguales, o2 1 = o22

Debido a la suposición anterior, el error standard de la diferencia de dos medias con la distribución t para dos varianzas muestraleses la siguiente:

) ( 2 ) ( 2 ) (x1x2  S X1 S X2  ) ( 2 ) ( 2 ) (x₁x₂  S X1 S X2  _{= 300,55}

(14)

El error standard de la diferencia entre dos medias, con base de estimación combinada de la varianza es:

En donde el grado de libertad es v = n1 + n2 - 2

Ejemplo: la vida útil promedio de una muestra

aleatoria de n1 = 10 focos es X1 = 4.600 horas, con S1 =

250 horas. Para otra marca de focos, la vida útil promedio y la desviación estándar de una muestra de n2 =

8 focos, son X2 = 4.000 horas y S2 = 200 horas. Se asume que la vida útil de los focos de

ambas marcas tiene una distribución normal. El intervalo de confianza del 90 % para estimar la diferencia entre las vidas útiles de las dos marcas de focos es:

Int. del 90% = (X1 - X2) + tv. x1 - x2 = 600 + 1,746 (108,847) = 600  190 = 410 a 790 h en donde X1 - X2 = 4600 - 4000 = 600 t v = 1.745 2_{= (n} 1-1) s2 1 + (n2-1) s2 2 = 9 (250)2 +7(200)2 = 52.656,25 n1 +n2 - 2 10+8-2

Se puede afirmar con una confianza del 90%, que la primera marca de focos tiene una vida útil promedio mayor que la segunda, en una cantidad de entre 410 y 790 horas.

4.1.7 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS PROPORCIÓNES POBLACIONALES (MUESTRAS GRANDES)

Para estimar la diferencia entre las proporciones de dos poblaciones en un intervalo de confianza implica utilizar el error estándar de la diferencia entre las proporciones. El uso de la distribución normal se basa en las mismas condiciones que para la distribución muestral de la proporción, excepto que se trata de dos muestras y se aplican los requerimientos de cada una de ellas. La fórmula utilizada es:

Sea P1 la proporción de éxitos observada en una muestra aleatoria de tamaño n1 ,

procedente de una población con proporción de éxitos p1 y sea P2 , la proporción de éxitos

observada en una muestra aleatoria independiente procedente de una población con p1 de éxitos. Entonces, si los tamaños muestrales son grandes (si cada muestra es por lo menos 40) , un intervalo de confianza del 100(1-)% viene dado por:

donde la variable aleatoria Z sigue una distribución normal estándar.

2 ) 1 ( ) 1 ( 2 1 2 2 2 1 2 1 2       n n S n S n



2 1 2 1 2 2 ) (p p



p



p



_





2 ) ( 2 1 ) ( 2 ) ( 2 1 2 1 n n x x x x    _  =  2_{/ n} 1 + 2 / n2 = 108,847 2 2 2 1 1 1 ) ( . . 2 1 _n Q P n Q P p p    









2 2 2 1 1 1 2 / 2 1 2 1 2 2 2 1 1 1 2 / 2 1 . . . . n Q P n Q P Z P P p p n Q P n Q P Z P P   _       _ 

(15)

P = Proporción de éxito en el suceso

Z = Valor tabulado para diferentes niveles de confianza.  = Error estándar de la diferencia de proporciones

Ejemplo: Una empresa de mercadeos entrevista a una muestra de 100 hombres de una comunidad grande y encuentra que una proporción de 0,40 hombres manifestó preferir las hojas de rasurar de la empresa cliente de los investigadores y no las demás marcas. En otra comunidad grande, 60 hombres de una muestra aleatoria de 200 prefirieron las hojas de rasurar de la empresa cliente. Hallar el intervalo de confianza del 90% para la proporción de hombres de las comunidades que prefieren las hojas de rasurar de la empresa cliente.

Int. del 90%: (P1 - P2)  Z.(p1 - p2) = 0,10  1,645(0.059) = 0,003 a 0,197 en donde: P1 - P2 = 0,40 - 0,30 = 0,10 Z = 1,645 2 p1= P1  Q 1 = (0,40)(0,60) = 0,0024 n1 100 2 p2 = P2 Q 2 = (0,3)(0,70)= 0,00105 n2 200

5 NOTACIONES UTILIZADAS EN LA DETERMINACIÓN

DE INTERVALOS DE CONFIANZA

6 TEOREMA CENTRAL DEL LÍMITE

2 1 2 1 2 2 ) (p p



p



p



_





=  0.00345 = 0,059 X = Media de la muestra  = Media de la población

 = Desviación standard de la población



x



 = Media de la distribución muestral dedemedia







 x  Son iguales para cualquier tamaño de n

S _{= Desviación standard de la muestra} n = Tamaño de la muestra

N = Tamaño de la población

 = Riesgo o significación





(16)

Establece que si el tamaño del universo tiende al infinito, la distribución de todas las muestras que se pueden extraer de ese universo tenderá a tener la configuración de la curva normal, y que ésta distribución de muestreo tendrá una media aritmética igual a la media del universo y una desviación standard finito que será igual a la desviación standard de la población.

Como regla general se puede establecer que si el tamaño de "n" es mayor a 30, la distribución muestral de la media será aproximadamente normal:

Al aumentar el tamaño de la muestra, la distribución muestral de la media se aproxima a la forma de la distribución normal sin importar la forma de la distribución de las mediciones individuales de la población.

La información crucial que proporciona el teorema central del límite, es que, cuando el número de términos de la suma, n, es grande, la distribución Z tiende a una distribución normal estándar.

Como regla general, siempre que el tamaño de la muestra sea por lo menos 30, la distribución muestral de la media será aproximadamente normal.

Resumen:

1.- Para la mayor parte de las distribuciones de población, independientemente de su forma, la distribución muestral de la media tendrá distribución aproximadamente normal si se seleccionan muestras de por lo menos 30 observaciones (n > 30).

2.- Si la distribución de la población es bastante simétrica la distribución muestral de la media será aproximadamente normal si se seleccionan muestra de por lo menos 15 observaciones.

3.- Si la población tiene una distribución normal, la distribución muestral de la media tendrá distribución normal independiente del tamaño de la muestra.

Observación: si el muestreo se realiza sin reposición de una población con un tamaño finito N, y si el tamaño de la muestra n, representa más del 5% de la población, se debe usar un factor de corrección para la población finita (fpc), de lo contrario no es necesario, puesto que la incidencia no es significativa.

7.-

CÓMO ESTIMAR EL TAMAÑO DE LA MUESTRA

Un investigador puede creer que el intervalo de confianza resultante es demasiado amplio, enfrentándose así a un grado de incertidumbre poco deseable. La única manera de reducir esta incertidumbre consiste en tomar una muestra con un tamaño mayor.

En algunos casos, el investigador puede ser capaz de fijar por adelantado la amplitud del intervalo de confianza, eligiendo un tamaño muestral lo suficientemente grande como para garantizar dicha amplitud.

El intervalo de confianza desarrollado precedentemente, está centrado en la media muestral y recorre una distancia L a cada lado de la media muestral, de manera que L es la mitad de la longitud del intervalo:

Supongamos ahora que se quiere fijar de antemano L, por tanto despejando la formula se puede tener el tamaño muestral que nos permita garantizar que el intervalo de confianza tendrá una amplitud L a cada lado de la media muestral, varianza poblacional conocida. n Z L_  2/  2 2 2 / 2 L Z n 



n X npq n X Z /       

(17)

De la misma manera, se puede determinar para la proporción

Supongamos que tomamos una muestra aleatoria procedente de una población. Entonces un intervalo de confianza del 100( 1- )% para la proporción poblacional, que tiene una amplitud máxima L a cada lado de la proporción muestral, viene dada por la siguiente fórmula:

En la actualidad, con frecuencia se informan acerca de los resultados de encuestas de opinión de la población, o algún subconjunto de la misma, sobre temas ciertos temas de interés. Normalmente, estas noticias dan cuenta de los porcentajes de los miembros de la población que comparten un criterio determinado. Estas informaciones suelen concluir con frases como: “Con un margen de error del 3%”.Aunque normalmente no se indica, el margen de error se corresponde con la longitud de los intervalos de confianza del 95%. El margen de error más/ menos, es el valor de L expresado como un porcentaje.

8 DECISIONES ESTADÍSTICAS

A menudo, en la práctica, se tiene que tomar decisiones sobre poblaciones, partiendo de la información muestral de las mismas. Tales decisiones se llaman "decisiones estadísticas". 2 2 / 2 _. L Q P Z n 

(18)

UNIDAD III Y IV

PRUEBAS DE HIPÓTESIS

1.-

CONCEPTOS DEL CONTRATE DE HIPÓTESIS

Una hipótesis estadística es una declaración o afirmación tentativa acerca de un parámetro o parámetros de una población.

Es una conjetura que el investigador realiza sobre la población, que debe ser verificada a través de la información muestral.

La hipótesis se formula sobre la población, y las conclusiones sobre la validez de esta hipótesis se basan en la información muestral

La hipótesis es simplemente una explicación provisional de los hechos, que se anticipa con el fin de constatar si es cierta. Ella permite centrar la observación sobre aquellos fenómenos que guardan relación con el problema que se estudia, evitando que muchos hechos importantes pasen inadvertidos o que el investigador se pierda en un cúmulo de observaciones inconexas.

Hay cuatro posibles resultados:

1. Cuando H0 es verdadera y se rechaza, se trata de un error tipo I; la probabilidad de

cometer este error es .

2. Cuando H0 es verdadera y se acepta, se trata de una decisión correcta; la

probabilidad de realizar esta decisión es 1 - .

3. Cuando H0 es falsa y se acepta, se trata de un error de tipo II; la probabilidad de

cometer este error es .

4. Cuando H0 es falsa y se rechaza, se trata de una decisión correcta; la probabilidad

de realizar esta decisión correcta es 1 - .

RESUMEN

REFERENCIA TIPO DE ERROR PROBABILIDAD

Rechazar H0 cuando es verdadera I  significación)

Aceptar H0 cuando es falsa II 

Aceptar H0 cuando es verdadera   confianza)

Rechazar H0 cuando es falsa   potencia)

La tarea está concluida cuando se rechaza o no la H0.

(19)

Al realizar pruebas de hipótesis, se parte de un valor supuesto (hipotético) de un parámetro poblacional. Después de recolectar una muestra aleatoria, se compara la estadística muestral, así como la media (X), con el parámetro hipotético. Después, se acepta o se rechaza el valor hipotético, según proceda. Se rechaza el valor hipotético sólo si el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Etapa 1: Identificación del patrón de la población: se refiere a la forma de distribución de la población:¿normal?, ¿binomial?.

La normal es una buena distribución de otras distribuciones; sin embargo hay muchos casos en los cuales no puede aplicarse la distribución normal. Luego, el primer problema consiste en identificar la distribución probabilística.

Procedimientos estadísticos:

- Enfoque paramétrico: requiere la identificación de la distribución probabilística. - Enfoque no paramétrico: es un enfoque libre que no requiere especificación acerca de la distribución.

Etapa 2: plantear la hipótesis nula y la hipótesis alternativa.

(a) Hipótesis nula: representa la conclusión que se obtendría si el proceso funcionara en forma correcta, se denota con H0. Una hipótesis nula es una declaración

tentativa de que un parámetro de la población es igual a un valor específico ( está implícita la idea de que no hay diferencia). La hipótesis se considerará cierta a no ser que se produzca suficiente evidencia en contra. Cuando se recoge una información muestral, esta hipótesis es juzgada, o contrastada. Si la hipótesis no es cierta, entonces, debe ser cierta alguna hipótesis alternativa, así el investigador elabora un contraste y formula una hipótesis alternativa, frente a la cual se contrasta la hipótesis nula.

(b) Hipótesis alternativa: Se denota generalmente con H1. Se acepta cuando se

rechaza H0. Es una declaración tentativa de que el mismo parámetro de la población

tiene un valor diferente del especificado en H0. Ejemplo: H1 :  ≠ 50.

Quien realiza el trabajo estadístico obtiene datos muestrales para determinar si existe evidencia para apoyar H1.

Si los datos muestrales muestran un promedio suficientemente bajo, la H0 se rechaza

en favor de la H1. De manera semejante si los datos muestrales muestran un promedio

suficientemente alto, también se rechaza H0.

La hipótesis, nula o alternativa puede designar un único valor, para el parámetro poblacional (). En este caso, se dice que la hipótesis es simple. Ho :  = o (valor específico)

La hipótesis también puede designar un rango de valores para el parámetro poblacional desconocido. Una hipótesis de este tipo se denomina compuesta y será cierta para más de un valor del parámetro poblacional. ( > o o  < o ).

En muchas aplicaciones, se contrasta una hipótesis nula simple, digamos Ho :  = o

frente a una alternativa compuesta. En algunos casos, sólo interesan alternativas a un lado de la hipótesis nula. Por ejemplo H1:  > o ó H1:  < o que se denominan alternativas

unilaterales.

Una prueba que implique cualquiera de las dos alternativas se denomina Prueba de una cola o unilateral.

Otra posibilidad es que queremos contrastar esta hipótesis nula simple frente a la alternativa general de que el valor  es cualquiera distinto de o , es decir, H1 : ≠ o

Debido a que la H1 no especifica la dirección de la diferencia, se le denomina Prueba

(20)

Ejemplo 1: Uno puede estar interesado solamente en si el promedio es mayor de 50. Entonces: H1 :  > 50

Aquí la hipótesis nula se rechaza solo si la evidencia muestral indica un valor suficientemente grande para .

Ejemplo 2: De la misma manera, puede haber interés sólo si el promedio es menor de 50. Entonces H1 :  < 50.

En éste caso la H1 se rechaza sólo si la evidencia muestral indica un valor bastante

bajo para .

Ejemplo 3: Un auditor desea probar el supuesto de que el valor promedio de todas las cuentas por cobrar en una empresa determinada es de $260.000, tomando una muestra de n=36 y calculando la media muestral lo contradice en forma clara, porque debe “darse el beneficio de la duda” al valor hipotético en el procedimiento de prueba. Las hipótesis nula y alternativa para esta prueba son: Ho:= $260.000 y H1:  $260.000.

Etapa 3: Especificar el nivel de significancia que se va a utilizar

El nivel de significación es el estándar estadístico que rechaza la hipótesis nula. Si se especifica un nivel de significación del 5%, entonces se rechaza la hipótesis nula solamente si el resultado muestral es tan diferente del valor hipotético.

Debe observarse que si se utiliza el nivel de significancia del 5%, existe una probabilidad del 0.05 de rechazar a la hipótesis nula cuando, de hecho, es cierta. A esto se le denomina error tipo I. La probabilidad del error tipo I es siempre igual al nivel de significación que se utiliza como criterio para rechazar la hipótesis nula; se le designa mediante la letra griega “alfa”. Los niveles que se utilizan con mayor frecuencia en las pruebas de hipótesis son el 5%, el 1% y el 2%.

Ocurre un error de tipo II si se acepta la hipótesis nula cuando, de hecho, es falsa. Ya que  es la probabilidad de cometer un error de tipo 1, ¿por qué no seleccionar el menor valor posible?.

Conforme  disminuye, aumenta la probabilidad de aceptar una hipótesis H0 falsa. El

error de no rechazar la H0 cuando es falsa se denomina: error tipo 2 : .

OBS.: Solo se puede reducir la probabilidad de cometer un error de un tipo, a costa de incrementar la probabilidad de cometer un error de otro tipo. Solo pueden reducirse ambas probabilidades simultáneamente si se aumenta el tamaño muestral.

Significante o estadísticamente significante, es cuando se rechaza la hipótesis, es decir, cuando el valor calculado (Z, t, etc.) cae en la región de significación (región de rechazo). Cuando la diferencia observada no puede explicarse fácilmente por el azar.

No significante, es cuando se acepta la hipótesis, es decir, cuando el valor calculado (z, t, etc.) cae en la región de confianza. Cuando la diferencia observada puede ser producido por el azar.

Cuando se acepta la hipótesis nula se puede decir que la diferencia con la media poblacional no es significante, si por el contrario, si se rechaza la hipótesis nula, la diferencia con la media poblacional es significante.

Etapa 4: Elegir la estadística de prueba

La estadística de prueba puede ser la estadística muestral (el estimador insesgado del parámetro que se prueba) o una versión transformada de esa estadística muestral. Por ejemplo, para probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria de esa población para utilizarla como estadística de prueba. Sin embargo, si la distribución de muestreo de la media tiene distribución normal, entonces es común que

(21)

se transforme la media muestral en un valor “Z” el cual, a su vez, sirve como estadística de prueba.

Estadístico de prueba: es una variable aleatoria cuyo valor se utiliza para llegar a la decisión de rechazar o no la H0. Puede ser la media muestral X o alguna otra variable

como Z.

Los valores del estadístico de prueba se dividen en dos categorías: 1) Región de rechazo (región crítica)

2) Región de no rechazo (aceptación)

La región de no rechazo es el conjunto de valores para el estadístico de prueba, que provocará la aceptación de H0.

El valor que separa las dos regiones, es el “ valor crítico”; es el primer valor de la región crítica.

La región crítica es el conjunto de valores que serán lo suficientemente grandes como para provocar el rechazo de la H0.

Tienen que ser valores grandes, debido a que el rechazo de H0 significa la aceptación

de H1.

Etapa 5: Determinar el valor real de la estadística de prueba

Por ejemplo, al probar un valor hipotético de la media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crítico que se establece es un valor de Z, entonces se transforma la media muestral en un valor de Z.

Etapa 6: Tomar la decisión

Se compara el valor observado de la estadística muestral con el valor (o valores) críticos de la estadística de prueba. Después, se acepta o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones de los administradores operativos, como por ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de mercadotecnia utilizar.

La regla de la decisión sería: rechazar (?) si la media muestral es mayor que C (punto crítico) ó menor que C. La media puede convertirse en un valor Z (a menudo Z puede utilizarse como estadístico de prueba). En este caso el valor crítico se toma de la tabla normal estándar.

3.-

PRUEBA DE UN VALOR HIPOTÉTICO DE LA MEDIA

UTILIZANDO LA DISTRIBUCIÓN NORMAL

Puede utilizarse la distribución normal para probar un valor hipotético de la media poblacional: (1) cuando la muestra es grande (n ≥ 30), utilizando el teorema del límite central, o (2) cuando la muestra es pequeña (n<30), pero la distribución de la población es normal y se conoce “”.

Comencemos con el problema de contrastar la hipótesis nula de que la media poblacional es igual a cierto valor,   Esta hipótesis se representa H0 :  =  o .

Supongamos que la hipótesis alternativa de interés es que la media poblacional

supera este valor específico, es decir, H1 :  >  o.

Es natural que el contraste sobre la media poblacional se base en la media muestral. En particular, uno desconfiaría de la veracidad de una hipótesis nula, frente a esta alternativa, si la media muestral observada fuese mucho mayor que  o . El contraste se

apoya en el hecho de que la variable aleatoria Z sigue una distribución normal estándar, es decir, con media  y desviación típica /n.

(22)

En algunos casos, sólo interesan alternativas a un lado de la hipótesis nula, por ejemplo:

H1:  >  o ó H1:  <  o

Las hipótesis alternativas de este tipo se denominan alternativas unilaterales. RESUMEN

a) Prueba de una y de dos colas: H0 :  =  o

H1 :    o

Enunciado: rechazar H0 si el estadístico de prueba Z > Z/2 ó Z < - Z/2

H1 :  >  o,

Enunciado: Rechazar H0 si el estadístico de prueba Z > Z

H1 :  <  O

Enunciado: rechazar h0 si el estadístico de prueba Z < - Z

donde ” o” es cualquier valor específico para la media verdadera.

b) Prueba de una cola H0 :    o

H1 :  >  o

Enunciado: Rechazar H0 si el estadístico de prueba Z > Z

H0 :    o

H1 :  <  o

Enunciado: Rechazar H0 si el estadístico de prueba Z < -Z.

Ejemplo1: Sea o el peso medio poblacional (en gramos) de cereales por caja. La

hipótesis nula es que esta media es al menos 200 gramos, luego tenemos: H0:   200

La alternativa es que el verdadero peso medio es inferior a 200 gramos, es decir, H1: 

< 200.

Ejemplo 2: La compañía resuelve aceptar envíos de piezas siempre que no tenga evidencia para sospechar que más del 5% son defectuosas. La hipótesis nula aquí es como sigue: H0: p  0.05. La alternativa es H1: p > 0.05. La hipótesis nula, entonces, es que el

cargamento de piezas tiene una calidad adecuada, mientras que la alternativa es que no la tiene.

Ejemplo 3: Suponga que la conjetura de la profesora es que la realización de controles regularmente no produce diferencias en el promedio de las puntuaciones del examen final. Denotemos por  la diferencia entre las puntuaciones medias poblacionales para las dos partes del curso, con o sin controles regulares. La hipótesis nula es como sigue: H0:  = 0.

Sin embargo la profesora puede sospechar que posiblemente los controles produzcan un incremento en el promedio y, en consecuencia, querrá contrastar la hipótesis nula frente a la alternativa H1:  > 0.

En otros casos queremos contrastar una hipótesis nula de igualdad frente a la alternativa general, es decir, de no igualdad que se denomina alternativa bilateral.

Ejemplo 4: Un investigador puede considerar que la propuesta de reforma fiscal es acogida de igual forma por hombres y mujeres. Si  es la diferencia entre las dos proporciones poblacionales a favor de la propuesta, entonces, la hipótesis nula es H0:  = 0.

(23)

Si el investigador no tiene una buena razón para sospechar que la mayor parte del apoyo venga de una población en lugar de la otra, esta hipótesis nula puede contrastarse frente a la hipótesis alternativa bilateral H1:   0

4.-

CONEXIÓN ENTRE INTERVALOS DE CONFIANZA Y

PRUEBA DE HIPÓTESIS

Los intervalos de confianza se usan para estimar los parámetros, mientras que las pruebas de hipótesis se utilizan para tomar decisiones sobre valores especificados de parámetros de la población.

5.-

CONTRASTES PARA LA VARIANZA DE UNA

DISTRIBUCIÓN NORMAL

En esta parte, desarrollaremos procedimientos para contrastar hipótesis sobre la varianza poblacional 2_{, a partir de una muestra aleatoria de n observaciones de una}

población normal. La variable aleatoria 2_{sigue una distribución chi-cuadrado con (n-1)}

grados de libertad. Si la hipótesis nula es que la varianza de la población es igual a cierto valor específico 2

o , es decir: Ho: 2 =2º, entonces, cuando la hipótesis nula es cierta, la

variable aleatoria 2

n-1, sigue una distribución chi-cuadrado con (n-1) grados de libertad. Los contrastes de hipótesis sobre la varianza de una población normal se basan, entonces, en el valor observado en la muestra para la variable.

Contraste para la varianza de una población normal:

Supongamos que disponemos de una muestra de n observaciones de una población normal con varianza 2 _{. Si la varianza muestral observada es S}2_{, entonces, los siguientes}

contrastes tienen nivel de significación :

1) Para contrastar una de las hipótesis nulas

Ho: 2 =20 ; Ho: 2  20 , frente a la alternativa H1: 2 > 20

2) Para contrastar una de las hipótesis nulas Ho: 2 =20 Ho: 2  20 frente a la alternativa 2 < 20 la regla de decisión es:

3)Para contrastar hipótesis nula Ho: 2 =20 frente a la alternativa 2 20, la regla de

decisión es:

La regla de decisión es : rechazar Ho si   

 1 2 2 0 2 ) 1 (    n S n  1 2 2 0 2 ) 1 (    n S n _           1 1 2 2 0 2 ) 1 ( n S n Rechazar Ho si  1 /2 2 2 0 2 ) 1 (       n S n          1 1 2 2 0 2 ) 1 ( n S n o

(24)

6.-

CONTRASTE DE UN VALOR HIPOTÉTICO DE LA MEDIA

UTILIZANDO LA DISTRIBUCIÓN t DE STUDENT

Es apropiada como estadística de prueba cuando la muestra es pequeña (n < 30), tiene una distribución normal y se desconoce dispersión poblacional ().

Supongamos que disponemos de una muestra aleatoria de n observaciones de una población normal con media   media muestral x y desviación típica s observadas, entonces los siguientes contrastes tienen nivel de significación .

a) Prueba de una y de dos colas: H0 :  =  o

H1 :    o

Enunciado: rechazar H0 si el estadístico de prueba t > t(n-1)/2 ó t <- t(n-1)/2

H1 :  >  o,

Enunciado: Rechazar H0 si el estadístico de prueba t > t

H1 :  <  O

Enunciado: rechazar h0 si el estadístico de prueba t < - t

donde ” o” es cualquier valor específico para la media verdadera.

b) Prueba de una cola H0 :    o

H1 :  >  o

Enunciado: Rechazar H0 si el estadístico de prueba t > t

H0 :    o

H1 :  <  o

Enunciado: Rechazar H0 si el estadístico de prueba t < - t

7.-

CONTRASTE PARA LA DIFERENCIA ENTRE DOS

MEDIAS

En esta parte examinaremos el caso en el que se dispone de muestras aleatorias de dos poblaciones, y en el que el parámetro de interés consiste en la diferencia entre las dos medias poblacionales.

7.1 CONTRASTES BASADOS EN DATOS PAREADOS

En muchas situaciones, las muestras se extraen como pares de valores, tal como cuando se determina el nivel de productividad de los trabajadores, antes y después de un programa de capacitación. A esta clase de datos se les denomina observaciones apareadas o pares asociados, también se denominada muestras dependientes.

El método apropiado para probar la diferencia entre las medias de dos muestras, consiste primero en determinar la diferencia d entre cada par de valores, y después probar la hipótesis nula de que la diferencia poblacional promedio es 0. Por ello, desde el punto de vista de los cálculos, se aplica una prueba a una muestra de valores d

media n d d 



... estándar desviación n d n d Sd ... 1 ) ( 2 2   



. d S d t .... ... : ) 1 H0 12 D0 o

(25)

Cuando la muestra es pequeña (n < 30) se utiliza la distribución t de Student. Cuando la muestra es grande (n> 30) se utiliza la distribución normal.

7.2 CONTRASTES BASADOS EN MUESTRAS INDEPENDIENTES

Gracias al teorema central del límite, si los dos tamaños muestrales son grandes, el resultado sigue siendo una buena aproximación cuando se sustituyen las varianzas poblacionales por las muestrales, incluso cuando las distribuciones poblacionales no son normales.

7.3 CONTRASTES PARA LA DIFERENCIA ENTRE DOS MEDIAS

UTILIZANDO LA DISTRIBUCIÓN NORMAL (varianzas conocidas o

tamaños muestrales grandes)

Para determinar el valor de Z se utiliza el error estándar de la diferencia entre las medias. El uso de la distribución normal se basa en las mismas condiciones que en el caso de una muestra, excepto que ahora se tienen dos muestras independientes.

La hipótesis nula que generalmente se prueba consiste en que las dos muestras se obtienen de poblaciones con medias iguales. En este caso, la diferencia entre las dos medias es igual a cero (D0 = 0).

7.4 CONTRASTES PARA LA DIFERENCIA ENTRE MEDIAS DE DOS

POBLACIONES NORMALES, UTILIZANDO LA DISTRIBUCIÓN T DE STUDENT (varianzas poblacionales iguales)

Se requiere la suposición de que las varianzas de las dos poblaciones sean iguales y que las muestras sean pequeñas (v = n1 + n2 - 2) < 30

7.5 PRUEBA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES

POBLACIONALES (muestras grandes)

Cuando se desea probar la hipótesis de que las proporciones de dos poblaciones no son distintas, se combinan las dos proporciones muestrales para proceder a determinar el error estándar de la diferencia de las proporciones.

estándar desviación n d d Sd ... 1 ) ( 2   



0 2 1 0: ) 3 H   D . .... : 1 2 0 0 D hipótesisnula H    a alternativ D H1:12  0... . .... : 1 2 0 0 D hipótesisnula H     ). 1 ( : Rechazar si t t_n_ a alternativ D H₁:₁₂  ₀... Rechazar si:t t(n1). 0 2 1 0: ) 2 H   D H₁:₁₂ D₀ ... ... : Rechazar si t  t₍_n_₁_).__/₂ o Rechazar si:t t₍_n_₁_).__/₂       ) (tn1 t(n 1; P

(26)

Cada muestra debe contener al menos 40 observaciones.

Las pruebas sobre la diferencia entre dos proporciones pueden llevarse a cabo como pruebas de un extremo o de dos extremos.

8 PRUEBA PARA EL VALOR HIPOTÉTICO DE LA

VARIANZA UTILIZANDO LA DISTRIBUCIÓN JI

CUADRADO

Las pruebas pueden ser de uno o de dos extremos, aunque las hipótesis mas comunes con respecto a las varianzas poblacionales se refieren a pruebas de un extremo. Puede utilizarse la tabla para determinar el o los valores críticos de la estadística ji-cuadrado para diversos niveles de significación.

Las pruebas pueden ser de uno o de dos extremos, aunque las hipótesis más comunes con respecto a las varianzas poblacionales se refieren a pruebas de un extremo.

9 DISTRIBUCIONES F Y LA PRUEBA PARA LA

DIFERENCIA ENTRE DOS VARIANZAS

La distribución F comienza en cero y va aumentando hasta alcanzar un máximo en el valor de

La configuración de esta distribución varia con n1 y n2; pero a medida que n1 y n2

aumentan, la distribución tiende a ser simétrica. La distribución normal y la de t son casos especiales de la distribución F. Los valores de F siempre se dan basándose en el número de grados de libertad, en vez del tamaño de las muestras.

La distribución F puede utilizarse únicamente si las dos poblaciones tienen distribución normal, aún si las muestras son grandes; no hay teorema del límite central.

Algunas características de la distribución F

1.- Una puntuación F es el cociente de dos varianzas de población estimadas independientemente.

F = S2

1 / S2 2

n1 = tamaño de la muestra de la primera población

n2 = tamaño de la muestra de la segunda población

F = distribución calculada

2.- La distribución F es una distribución de probabilidad, esto es, el área debajo toda la curva es 1, y la probabilidad que una F quede entre a y b es dada por el área debajo de la curva entre a y b

3.- En toda distribución F el rango de valores F es de 0 a 

4.- Los cuadros F se dan en términos de grados de libertad: V1 = n1 – 1; V2 = n2 - 1

) 2 ( ) ( 2 1 2 1 2   n n n n

n y después se reduce, tendiendo a cero a medida que el valor de F

aumenta hasta el infinito.

2 0

2

2 ( 1).



  n S Es la estadística que se utiliza para probar el valor hipotético de una varianza poblacional

(27)

La forma de cualquier distribución F depende de los valores V1 y V2. Todos estos

valores son asimétricos a la derecha, pero se tornan más simétricos según aumenta el número de grados de libertad.

F (V1; V2 ) distribución de la tabla

9.1 COMO USAR UN CUADRO F

En la tabla se dan valores de F cuando el extremo derecho de la distribución tiene área de 0,05 o 0,01.

En consecuencia, las pruebas de hipótesis de dos extremos sólo pueden hallarse valiéndose de estos cuadros si  = 0,10 ó 0,02.

En la tabla se presenta únicamente valores de F para porcentajes en el extremo derecho, de modo que se necesita calculo adicional para pruebas de dos extremos ó de un extremo izquierdo.

Para encontrar el valor crítico de F para V1 y V2 , encuéntrese el valor crítico de F para

V2 y V1 grados de libertad ( adviértase que se invierte el orden de la V ) y tómese su

recíproca:

El valor crítico inferior siempre es menor que 1

Es posible simplificar los cálculos usando como n1,X1, S12 la muestra que presente

mayor varianza; en este caso no se necesita calcular el límite inferior, puesto que F siempre excederá de l, los valores tabulares también; mientras que el valor crítico menor de F (límite inferior) será menor que 1.

La distribución F es el modelo de probabilidad apropiado para el cociente de las varianzas de las muestras tomadas en forma independiente de la misma población con distribución normal

Como todas las varianzas muestrales son estimadores insesgados de la varianza poblacional, el valor esperado a largo plazo del cociente es aproximadamente 1

La distribución F tiene una función de densidad asimétrica, definida sólo para valores no negativos.

En aplicaciones prácticas, pondremos siempre la mayor varianza en el numerador.

UNIDAD V

NOCIONES SOBRE LA TEORÍA DE LAS MUESTRAS

2 2 2 1

.

S

F



Es la estadística que se utiliza para probar la hipótesis nula de que no existe diferencia entre las dos varianzas   ) sup ( 1 . ) inf ( 1 2 2 1 erior v v F erior v v F 