UNIDAD V Inferencia estadística
INFERENCIA ESTADÍSTICA
Los conceptos básicos de probabilidad y distribuciones muestrales sirven de base para el método de inferencia estadística, la cual tiene como objetivo obtener información de las poblaciones a partir de las muestras obtenidas. En general se avoca a las dos siguientes áreas prueba de hipótesis y estimación.
PRUEBA DE HIPÓTESIS Y ESTIMACIÓN.
Una explicación concisa de cada una de estas áreas se da a continuación:
• prueba de hipótesis: aceptar o rechazar declaraciones acerca de los parámetros de la población.
• estimación: estimar valores de los parámetros de la población.
PLANTEAMIENTO DE LA HIPÓTESIS NULA Y ALTERNATIVA
Una hipótesis estadística consiste en realizar una declaración afirmativa o negativa acerca del valor de un parámetro o parámetros de una población. La aceptación o rechazo de la hipótesis estadística requiere de información obtenida a partir de la muestras de la población. Si la información obtenida es suficiente, la hipótesis estadística puede ser apoyada o no.
Los pasos esenciales para realizar una prueba de hipótesis se indicas a continuación:
• identificación del patrón de distribución de la variable aleatoria (binomial, normal…)
Un procedimiento estadístico que requiere la identificación de la distribución probabilística se denomina enfoque paramétrico. Si no se especifica la distribución de probabilidad entonces se tiene un enfoque no paramétrico.
• planteamiento de la hipótesis. En general se proponen 2 hipótesis, una denominada hipótesis nula denotada por Ho, la cual se propone con el objetivo de ver si puede ser rechazada y la hipótesis alternativa la cual se denota por H1 y es válida si la hipótesis nula es rechazada.
Comúnmente la hipótesis nula Ho, implica la idea de que no hay diferencia entre los parámetros, de ahí su nombre de nula.
Por ejemplo se puede proponer que el promedio no es diferente de un valor particular, esto es Ho:|i = n0 Las hipótesis alternativas H1, que pueden establecerse como complementaria para la hipótesis nula Ho anterior, puede tomar alguna y solo una de las siguientes opciones:
PRUEBA DE DOS COLAS Ho:|i = n0
H1: \i *■ n0
Debido a que no se especifica la dirección de la diferencia entre \i y |i0, la prueba se le denomina prueba de dos colas.
100
APUNTES DE ESTADISTICA GONZALO GALVEZ COYT
0.5 0.45 0.4 0.35 0.3 0.25
0.2 0.15 0.1 0.05
-3 -2 -1 0 2 3 4
Figura. Esquema utilizando la distribución normal para mostrar la prueba de dos colas, la región sombreada representa la región de rechazo de la hipótesis nula H
o
PRUEBA DE UNA COLA DERECHA Ho:µ = µ0
H1: µ > µ0
Como µ > µ0, la prueba es llamada de una cola derecha
0.5 0.45 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0
-3 -2 -1 0 1 2 3
4
Figura. Esquema utilizando la distribución normal para mostrar la prueba de cola derecha, la región sombreada representa la región de rechazo de la hipótesis nula H
o
PRUEBA DE UNA COLA IZQUIERDA:
H
o
:\l = |Í
0
Como µ < µ0, la prueba es llamada de una cola izquierda
APUNTES DE ESTADISTICA GONZALO GALVEZ COYT
0.5 0.45
0.4 0.35
0.3 0.25
0.2 0.15
0.1 0.05
0-4 -3 -2 -1 0 1 2 3 4
Figura. Esquema utilizando la distribución normal para mostrar la prueba de cola izquierda, la región sombreada representa la región de rechazo de la hipótesis nula Ho
ESPECIFICACION DEL NIVEL DE SIGNIFICACION a
Normalmente las muestras extraídas de una población en general no son idénticas y presentan diferentes medias y desviaciones típicas, etc., estas diferencias pueden deberse a la naturaleza aleatoria del problema, por ejemplo si se considera la prueba de hipótesis
Ho:|i = n0 H1: n > n0
La pregunta seria ¿Qué tan grande debe ser la media muestra para rechazar la hipótesis nula? De otra manera, ¿Qué tan grande debe ser la media muestral para que se considere significativamente mayor?
La respuesta a la pregunta depende directamente del nivel de significación elegido para realizar la prueba de hipótesis, normalmente se denota como a, por ejemplo si a = 5%, la hipótesis nula no se rechazará en 5 de 100 muestras lo suficientemente grandes.
Los valores comúnmente elegidos como niveles de significación son a=10%, a=5%, a=2.5%, a=1.0%, a=0.5%
El nivel de significación: se puede entender también como la probabilidad de rechazar una hipótesis nula verdadera o la probabilidad de cometer un error tipo I que anteriormente se denotó por a. Por otra parte el error de no rechazar la hipótesis nula cuando es falsa se denomina error tipo II, denotado por p.
Los dos tipos de errores se resumen a continuación
TIPO DE ERROR PROBABILIDAD
Rechazar Ho cuando es verdadera I a.
No rechazar a Ho cuando es falsa II p
La relación entre los tipos de error a y p se muestra en la siguiente gráfica para la .Ho:|i= |i0 y H1: \I>\M 0
102
x
J _ L > J 00_
Figura. Relación entre los errores tipo I representado por el área sombreada a y el error tipo II representado por el área sombreada p
Las áreas oscuras representan la probabilidades a y p, si se disminuye la probabilidad a al desplazar la línea vertical a la derecha el valor de p aumenta, y viceversa, si la línea vertical se mueve a la izquierda aumenta a y disminuye p.
PLANTEAMIENTO DE LA REGLA DE DECISIÓN
• Elegir el estadístico de prueba el cual es una variable aleatoria cuyo valor se utiliza para aceptar o rechazar la hipótesis nula. Puedes ser un estadístico muestral tal como la media muestral, desviación típica, proporción de defectos, etc.
• Especificar el nivel de significancia de a.
• Los valores del estadístico de prueba se dividen en 2 categorías: región de rechazo y región de aceptación, también se conoce la región de rechazo como región crítica.
TOMA DE LA DECISIÓN:
• El valor que separa las dos regiones es llamado el valor crítico. Se toma la decisión dependiendo
en que región cae el valor del estadístico de prueba. Si el valor del estadístico de prueba cae el la región
de rechazo, la hipótesis nula se rechaza, en caso contrario se acepta.
TABLA DE DECISIONES Decisión H0 es verdadera H0 es falsa Se rechaza H0 Error tipo I α Decisión correcta
1-β No se rechaza H0 Decisión correcta
1-α
Error tipo II β
10 3
Las siguientes figuras muestran el valor crítico, las regiones de aceptación y rechazo, para el caso de que se utilice a Z como estadístico de prueba, para cada una de los tres tipos de prueba de hipótesis.
Prueba de dos colas
0.5 0.45
0.4 0.35
0.3 0.25
0.2 0.15
0.1 0.05 0
-3 -%/2 -1 1 - a
0
1 a/22 3
4
Región de rechazo T Región de aceptación *£ Región de rechazo ' Valor crítico Zα/2
Prueba de cola derecha
0. 5 0.45 0.4 0. 35 0. 3 0.25
0.2 0. 15 0. 1 0. 05
Prueba de cola izquierda -3 -2
Región de aceptación
0 3
+x+-
^ Región de rechazo Valor crítico Za
0. 5 - 0.45 - 0.4 - 0.35 - 0. 3 - 0.25 - 0.2 - 0.15 - 0. 1 - 0.05 - 0 L
Región de rechazo f
Valor cr íti co Z a
Región de aceptación
H1: HͿHO
Valor crítico Zα/2
H1: H>>io
-1 1 2
H1: ]x<]io
104
EJEMPLOS
1. En la prueba de la hipótesis nula µ = 100, la hipótesis alternativa puede ser cualquiera de las siguientes.
a. µ =110 b. µ = 90
c. µ > 100 d. µ < 100 e. µ ≠ 100
¿Cuáles de estas cinco pruebas son de una cola? ¿Cuáles son de dos colas?
SOLUCION
1) Como µ =110 y se encuentra a la derecha, es una prueba de cola derecha.
2) En este caso µ = 90 es menor a 100, por lo que es una prueba de cola izquierda.
3) µ > 100 es una prueba de cola derecha.
4) µ < 100 es una prueba de cola izquierda.
e) µ≠10 representa a una prueba de dos colas.
2. Supóngase que la producción promedio por hora de los trabajadores de cierta fábrica es de 60 unidades. El director de personal de la fábrica afirma que el programa de entrenamiento implantado hace algún tiempo ha aumentarlo la productividad de los trabajadores. Plantéense las hipótesis nula y alternativa.
SOLUCION
La Hipótesis nula en general se relaciona con que el estimador no cambia, por lo tanto H0: µ=60 y como se señala que el programa de entrenamiento ha mejorado la productividad la hipótesis alternativa se propone de cola derecha, esto es H1: µ>60
3. Cierto proceso de producción está diseñado para dar como resultado tornillos con una longitud media de 3 plg. Plantéese la regla de decisión para cada una de las siguientes situaciones:
a. El gerente de producción desea determinar si la longitud promedio ha disminuido.
b. Desea determinar si la longitud promedio ha aumentado.
c. Desea determinar si la longitud promedio ha cambiado.
SOLUCION
Para el problema se debe seleccionar µ0= 3 pulgadas y de acuerdo a cada uno de los incisos 5) H0: µ=3 H1: µ< 3 Ha disminuido
6) H0: µ=3 H1: µ> 3 Ha aumentado 7) H0: µ=3 H1: µ≠ 3 Ha cambiado
4. Supóngase que el gasto anual en libros por parte de los estudiantes universitarios de los EUA se distribuye normalmente con media de $ 200. Formúlese, para cada una de las siguientes pruebas, la hipótesis alternativa y plantéese la regla de decisión.
a. Pruébese si los estudiantes en la universidad a la que usted asiste han gastado más que el promedio nacional.
b. Pruébese si el gasto anual por parte de los estudiantes de la universidad a la que usted asiste es diferente del promedio nacional.
105
APUNTES DE ESTADISTICA GONZALO GALVEZ COYT
SOLUCION
En este caso se elige |i0= 200 y la hipótesis nula es para ambos inciso H0: \i =200.
8) La hipótesis alternativa es H1: |i<200, y se rechaza H0 para algún valor de Xlo suficientemente grande.
9) La hipótesis alternativa es H1: ^ 200 y se rechaza H0 si Xlo suficientemente grande o suficientemente pequeño.
HIPOTESIS INEXACTA
Las hipótesis se pueden clasificar como exactas e inexactas. Una hipótesis es exacta si se especifica en la prueba un único valor, por ejemplo, H0 : \i= |io, mientras que si especifica un conjunto de valores como H0 : \i < |io ó H0 : \i > |io será una hipótesis inexacta. Las siguientes figuras muestran los casos de la Hipótesis exacta e inexacta de manera gráfica.
0.1 - 0. 09 - 0. 08 0. 07 0. 06 0. 05 0. 04 0. 03 0. 02 0. 01 0 ■
70 75 8
H0 : p . < f i o '
Figura. Sucesión de gráficas con media menor a 100 que muestran el caso H0 : |i < \io
0.
1 0.
09 0.
08 0.
07 0.
06 0.
05 0.
04 0.
03 0.
02 0.01
H0 : µ > µo
Figura. Sucesión de gráficas con media mayor a 100 que muestran el caso H0 : µ > µo
El área sombreada para cada una de las gráficas de las dos figuras anteriores es cada vez más pequeña conforme la media se vuelve más pequeña (ó más grande), lo anterior implica que si se rechaza la hipótesis exacta µ = µo con probabilidad α entonces para todos los casos µ ≤ µo (ó µ > µo) se rechazara la hipótesis nula con una probabilidad menor a α. Por lo que los casos de hipótesis inexactas se trabajarán como hipótesis exactas µ = µo con probabilidad de rechazo α.