Estadística Inferencial

(1)

(2)

ESTADÍSTICA INFERENCIAL 1

Sesión No. 8

Nombre: Pruebas de hipótesis referentes al valor de la media de la población. Parte II.

Objetivo: Al finalizar la sesión, el estudiante conocerá cómo calcular el tamaño de la muestra requerido para probar la media. Así mismo aplicará el método del valor P para pruebas de hipótesis referentes a la media de la población.

Contextualización

Establecer el tamaño muestral apropiado para una investigación es fundamental y depende del método de análisis a emplear. A partir de la prueba de hipótesis que se utilizará es posible un acercamiento al tamaño de la muestra particular. En la sesión anterior, se ha visto que la decisión de rechazar o aceptar 𝐻₀ se tomó al comparar el valor calculado del estadístico de prueba con un valor crítico de 𝑧 basado en el nivel de significancia 𝛼 de la prueba. Aún así, diferentes niveles de significancia pueden conducir a diversas conclusiones. Para evitar confusiones en las conclusiones, algunos experimentadores prefieren usar un nivel de significancia variable llamado valor P para la prueba.

(3)

Introducción al Tema

¿Por qué es importante establecer el tamaño apropiado de una muestra para probar la media?

Imagen recuperada de: 4.bp.blogspot.com

En esta sesión, se expondrá en primer lugar cómo determinar el tamaño de la muestra requerido para probar la media. Podrás ver que, para el caso de pruebas de hipótesis para la media con varianza conocida, y tamaño de muestra grande o población normal muestreada, se tiene una expresión sencilla para calcular el tamaño de muestra.

También podrás revisar acerca de un procedimiento para las pruebas de hipótesis conocido como método del valor P, que actualmente ha cobrado popularidad por ser fácilmente aplicable al software de cómputo.

(4)

Explicación

4.3 Determinación del tamaño de muestra requerido para probar la media

¿Cómo determinar el tamaño de la muestra en una prueba de hipótesis para la media poblacional?

Al realizar una prueba de hipótesis para el valor de la media poblacional, el nivel de significancia elegido determina la probabilidad de cometer un error tipo I en esta prueba. Al controlar el tamaño de la muestra, también se controla la probabilidad de cometer un error tipo II.

La expresión matemática para determinar el tamaño de la muestra en la prueba de hipótesis de cola inferior para la media poblacional se muestra a continuación:

𝒏 =(𝒛_(𝝁𝟎𝒂+ 𝒛_{− 𝝁𝒂)}𝜷)𝟐𝝈_𝟐𝟐

Donde:

𝑧𝑎 = Valor de 𝑧 que proporciona un área de 𝑎 en la cola superior de la distribución normal estándar.

𝑧𝛽= Valor de 𝑧 que proporciona un área de 𝛽 en la cola superior de la distribución normal estándar.

𝜎 = Desviación estándar poblacional.

𝜇0= Valor de la media poblacional en la hipótesis nula.

𝜇𝑎= Valor de la media poblacional utilizada para el error tipo II.

Para una prueba de hipótesis de dos colas se emplea 𝑧𝑎 2_⁄ en lugar de 𝑧𝑎 en la misma expresión.

(5)

ESTADÍSTICA INFERENCIAL 4 Ejemplo:

Un contratista tiene que decidir si acepta un pedido de vigas recibido de un proveedor o si lo rechaza por no ser del tamaño solicitado. Las especificaciones indican que la longitud promedio de las vigas debe ser por lo menos 120 centímetros. Para evaluar si el pedido

recibido satisface lo anterior, se selecciona una muestra de 36 vigas y se miden. De acuerdo con esta muestra se deberá tomar la decisión de aceptar el pedido de vigas o devolverlo por no tener la longitud adecuada.

Sea 𝜇 el número medio de longitud que tienen las vigas del envío. La hipótesis nula y alternativa para la media poblacional que se plantean son:

𝐻0: 𝜇 ≥ 120 𝐻1: 𝜇 < 120

Suponiendo que el contratista establece con base a su propio criterio lo siguiente acerca de las probabilidades de cometer los errores tipo I y tipo II:

 Para el error tipo I: Si la media de la longitud de las vigas del pedido es 𝜇 = 120, el estará dispuesto a asumir el riesgo de que la probabilidad de rechazar el envío sea 0.05.

 Para el error tipo II: Si la media de la longitud de las vigas del pedido es 5 centímetros menos de lo que indican las especificaciones (es decir, 𝜇 = 115), estoy dispuesto a asumir el riesgo de que la probabilidad de aceptar el envío sea 𝛽 = 0.10.

Si 𝛼 = 0.05 y 𝛽 = 0.10. Mediante la distribución de probabilidad normal estándar se tiene que:

𝑧𝑎 = 𝑧0.05= 1.645

(6)

ESTADÍSTICA INFERENCIAL 5 𝑧𝛽 = 𝑧0.10= 1.282

Como 𝜇₀ = 120, 𝜇_𝑎 = 115 y 𝜎 = 12 se tiene que:

𝑛 = (1.645 + 1.282)_{(120 − 115)}2(12)₂ 2 = 49.3478 ≅ 50

Como las probabilidades de los dos tipos de errores se han controlado utilizando 𝑛 = 50, queda justificado que, en esta prueba de hipótesis, el contratista diga se

acepta 𝐻0 o se rechaza 𝐻0. Las inferencias correspondientes se hacen teniendo

probabilidades admitidas de cometer un error tipo I o un error tipo II.

Acerca de la relación entre 𝛼 , 𝛽 y el tamaño 𝑛 de la muestra caben tres observaciones (Anderson, Sweeney, & Williams, Estadística para administración y economía, 2008).

1. Una vez que se tienen dos de estos tres valores, el tercero puede calcularse.

2. Dado un nivel de significancia 𝛼, aumentando el tamaño de la muestra se reduce 𝛽.

3. Dado un tamaño de muestra, al disminuir 𝛼 aumenta 𝛽 y al aumentar 𝛼, disminuye 𝛽.

La tercera observación debe tenerse en cuenta cuando no se controla la probabilidad de cometer un error tipo II. Dicha observación indica que no se deben elegir niveles de significancia 𝛼 innecesariamente pequeños; para un

(7)

ESTADÍSTICA INFERENCIAL 6 tamaño de muestra dado, elegir un nivel de significancia pequeño implica más riesgo de cometer un error tipo II. Valores pequeños de 𝛼 son mejores si sólo preocupa cometer un error tipo I. Pero valores pequeños de 𝛼 tienen la desventaja de incrementar la probabilidad de cometer un error tipo II.

4.4 Método del valor P para pruebas de hipótesis referentes a la media de la población

¿En qué consiste el método del valor P?

El procedimiento de prueba de hipótesis para la media poblacional por el método del valor P es el siguiente (Anderson, Sweeney, & Williams, Estadística para negocios y economía, 2012):

1. Establecer la hipótesis nula y la hipótesis alternativa.

2. Especificar el nivel de significancia.

3. Recabar los datos muestrales y calcular el valor del estadístico de prueba.

4. Emplear el valor del estadístico de prueba para calcular el valor P.

5. Rechazar 𝐻0 si el valor P≤ 𝛼

El valor P es el nivel más pequeño de significancia 𝛼 para el cual la información observada indica que 𝐻0 debe ser rechazada cuando se utiliza un procedimiento de prueba especificado con un conjunto de datos dado.

El valor P es un número comprendido entre 0 y 1, por ser una probabilidad, que mide el grado en que los datos observados confirman 𝐻₀. Es una probabilidad asociada al valor que toma el estadístico de contraste para los datos de la muestra. Cuanto menor sea el valor P es menos probable que los datos observados se ajusten a la hipótesis nula formulada (González Manteiga & Perez de Vargas, 2012).

Para calcular el valor P, se emplea el valor del estadístico de prueba. El método a seguir depende de si se trata de una prueba de cola inferior, de cola superior o de dos colas.

(8)

ESTADÍSTICA INFERENCIAL 7 En la prueba de cola inferior, el valor P es la probabilidad de conseguir un valor del estadístico de prueba tan pequeño o menor que el obtenido con la muestra. Por ende, para calcular el valor P, en el caso de 𝜎 conocida, se debe determinar el área bajo la curva normal estándar para valores de 𝑧 ≤ que el valor del estadístico de prueba. Una vez que se ha determinado el valor P, la conclusión a un nivel particular 𝛼 resulta de comparar el valor P con 𝛼:

1. Valor P≤ 𝛼 ⇒ rechazar 𝐻₀ al nivel 𝛼 2. Valor P> 𝛼 ⇒ no rechazar 𝐻₀ al nivel 𝛼 Ejemplo:

El Instituto Nacional del Consumidor (INCO) realiza un estudio para verificar si cierta marca de refresco embotellado cumple con el contenido neto de 3 litros que se anuncia en su etiqueta. El INCO establece que mientras la media poblacional del volumen de llenado sea por lo menos 3 litros por envase, los derechos del consumidor estarán protegidos. Por lo tanto, el INCO selecciona una muestra de 36 botellas de refresco de un contenedor grande, la media muestral obtenida es 𝑥̅ = 2.92 litros. Los estudios realizados con anterioridad indican que 𝜎 = 0.18 y que se puede sostener que la población de los volúmenes de llenado tiene una distribución normal.

Solución

Si la media poblacional del volumen de llenado es por lo menos de 3 litros, lo que afirma la embotelladora es correcto. Esto establece la hipótesis nula de la prueba.

𝐻0: 𝜇 ≥ 3

Si la media poblacional del volumen de llenado es menor de 3 litros, lo que afirma la embotelladora es incorrecto. Esto establece la hipótesis alternativa de la prueba.

(9)

ESTADÍSTICA INFERENCIAL 8 𝐻1: 𝜇 < 3

El responsable de realizar la prueba en el INCO afirma que si la empresa satisface sus especificaciones de volumen en 𝜇 = 3, no tomará ninguna medida en su contra. Pero está dispuesto a asumir un riesgo de 1% de cometer tal error (𝛼 = 0.01).

Con 𝑥̅ = 2.92, 𝜎 = 0.18 y 𝑛 = 36 se determina el valor del estadístico de prueba 𝑧. 𝑧 = 𝑥̅ − 𝜇0

𝜎 √𝑛⁄ =

2.92 − 3

0.18 √36⁄ = −2.67

Como el valor P es la probabilidad de que el estadístico de prueba 𝑧 sea menor o igual que −2.67 (el área bajo la curva normal estándar a la izquierda del estadístico de prueba), en la siguiente tabla de probabilidad normal estándar aparece que el área en la cola inferior para 𝑧 = −2.67 es 0.0038.

En la gráfica se puede ver que a 𝑥̅ = 2.92 le corresponde 𝑧 = −2.67 y el valor P = 0.0038.

(10)

Dado que el responsable de la prueba eligió como nivel de significancia un valor 𝛼 = 0.01, al comparar éste valor con el valor P (0.0038 ≤ 0.01), por lo tanto 𝐻0 es rechazada.

Algunos lineamientos que los expertos en estadística recomiendan para interpretar valores P pequeños son (Anderson, Sweeney, & Williams, Estadística para negocios y economía, 2012):

• Menor que 0.01: Evidencia terminante para concluir que 𝐻1 es verdadera. • Entre 0.01 y 0.05: Fuerte evidencia para concluir que 𝐻1 es verdadera. • Entre 0.05 y 0.10: Evidencia débil para concluir que 𝐻1 es verdadera. • Mayor que 0.10: Evidencia insuficiente para concluir que 𝐻1 es verdadera.

(11)

Conclusión

En esta sesión, pudiste ver cómo determinar el tamaño de la muestra requerido en una prueba de hipótesis para la media poblacional, de manera que se controlen tanto la probabilidad de cometer un error tipo I como un error tipo II. También se presentaron los pasos básicos del método del valor P para pruebas de hipótesis acerca de una media poblacional. El cual se basa en la determinación de un valor P que es una medida de fortaleza de la evidencia de los datos en contra de la hipótesis nula.

Si los intervalos de confianza están dedicados a determinar los valores creíbles para una cantidad como una media poblacional 𝜇, ¿cuál será la relación entre los intervalos de confianza y las pruebas de hipótesis?

(12)

Para aprender más

¿Cuándo nace el concepto del p-valor y cómo ha evolucionado hasta el concepto tal y como es utilizado en nuestros días?

• Romero, S. N. (2012). La revolución en la toma de decisiones estadísticas: el p-valor. Telos, 14(3), 439-446. Septiembre-Diciembre Documento obtenido de:

(13)

Actividad de Aprendizaje

Instrucciones:

Con la finalidad de profundizar en los conocimientos adquiridos a lo largo de esta sesión, ahora tendrás que realizar la siguiente actividad:

Resuelva los siguientes problemas.

1. En un estudio sobre el rendimiento de la gasolina en los automóviles, medido en kilómetros por litro, se probaron las siguientes hipótesis

Hipótesis Conclusión

𝐻0: ≥ 20 𝑘𝑘𝑘í𝑚𝑚𝑚𝑚𝑚𝑚 𝑝𝑚𝑚 𝑐𝑎𝑐𝑎 𝑘𝑘𝑚𝑚𝑚 Confirma lo que sostiene el fabricante 𝐻1< 20 𝑘𝑘𝑘ó𝑚𝑚𝑚𝑚𝑚𝑚 𝑝𝑚𝑚 𝑐𝑎𝑐𝑎 𝑘𝑘𝑚𝑚𝑚 Refuta lo que sostiene el fabricante; el _{rendimiento es menor de lo afirmado}

Para 𝜎 = 3 y un nivel de significancia de 0.02, ¿qué tamaño de muestra se recomienda si el investigador desea tener 80% de probabilidad de detectar que 𝜇 es menor que 20 kilómetros por litro cuando en realidad es de 19?

2. La longitud objetivo de cintas empleadas en moños para regalos es de 245 cm. De una muestra de 50 cintas, cada una con una longitud determinada, se obtiene una media de longitud de 246.18 cm y una desviación estándar de 3.6 cm. ¿Sugieren estos datos que la longitud promedio verdadera es algún otro diferente del valor objetivo?

3. Un gerente de control de calidad para probar si en el proceso de fabricación de LEDs se satisface el estándar de producir 120 piezas por lote se usan las hipótesis 𝐻0: 𝜇 = 120 y 𝐻1: 𝜇 ≠ 120. Empleando un nivel de significancia de 0.05 y una desviación estándar de 5. Si la media de producción disminuye a 117 piezas por lote, el gerente de control de

(14)

ESTADÍSTICA INFERENCIAL 13 calidad desea tener 98% de oportunidad de concluir que no se está satisfaciendo el estándar de producción. ¿De qué tamaño deberá tomarse la muestra?

Puedes realizarlo en un procesador de textos, al final tendrás que guardarlo en formato PDF, y entregarlo de acuerdo a las indicaciones de tu profesor.

Recuerda que esta actividad te ayudará a reforzar tus conocimientos en la determinación del tamaño de la muestra y el método del valor P.

Esta actividad representa el 5% de tu calificación y se tomará en cuenta lo siguiente:

• Tus datos generales. • Título de la actividad.

• Procedimiento correcto y completo de los ejercicios. • Ortografía y redacción.

(15)

Bibliografía

• Alvarado, V. J. A., & Obagi, A. J. J. (2008). Fundamentos de inferencia estadística. Colombia: Pontificia Universidad Javeriana.

• Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadística para administración y economía (10 ed.). México: Cengage Learning. • Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2012). Estadística

para negocios y economía (11 ed.). México: Cengage Learning.

• Devore, J. L. (2008). Probabilidad y estadística para ingeniería y ciencias (8 ed.). México: Cengage Learning.

• González, M. M. T., & Pérez de Vargas, A. (2012). Estadística aplicada. Una visión instrumental. España: Díaz de Santos.

• Hines, W. W., & Montgomery, D. C. (1996). Probabilidad y estadística para ingeniería y administración (2 ed.). México: Compañía Editorial Continental.

• Lind, D. A., Marchal, W. G., & Wathen, S. A. (2012). Estadística aplicada a los negocios y economía (15 ed.). México: McGraw-Hill.

• Mendenhall, W., Beaver, R. J., & Beaver, B. M. (2015). Introducción a la probabilidad y estadística (14 ed.). México: Cengage Learning.

• Navidi, W. (2006). Estadística para ingenieros. México: McGraw-Hill.

• Spiegel, M. R., & Stephens, L. J. (2008). Estadística. México: McGraw-Hill. • Triola, M. F. (2004). Estadística (9 ed.). México: Pearson Educación.

• Triola, M. F., & Pineda Anaya, M. L. (2004). Probabilidad y Estadística. México: Pearson Education.

(16)

ESTADÍSTICA INFERENCIAL 15 • Wackerly, D. D., Mendenhall III, W., & Scheaffer, R. L. (2010). Estadística

matemática con aplicaciones (7 ed.). México: Cengage Learning.

• Walpole, R. E., Myers, R. H., & Myers, S. L. (1999). Probabilidad y estadística para ingenieros (6 ed.). México: Prentice-Hall.

Cibergrafía

• Romero, S. N. (2012). La revolución en la toma de decisiones estadísticas: el p-valor. Telos, 14(3), 439-446. Septiembre-Diciembre Documento obtenido de:

http://www.redalyc.org/pdf/993/99324907004.pdf Te invito a que consultes la Biblioteca Digital UNID