Prueba de Hipótesis. Una hipótesis estadística es una proposición sobre los parámetros de una o más poblaciones.

(1)

Prueba de Hipótesis

En otras unidades se muestra como puede estimarse un parámetro a partir de los datos contenidos en una muestra. Puede encontrarse ya sea en un solo número o en un intervalos de valores posibles. Sin embargo, muchos problemas requieren que se tomen una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe el nombre de hipótesis y el procedimiento de toma de decisiones sobre la hipótesis se conoce como prueba de hipótesis. Es conveniente considerar a la prueba de hipótesis estadística como la etapa de análisis de datos de un experimento comparativo, en el que se está interesado por ejemplo en comparar la media de una población con un valor especificado. Estos sencillos experimentos comparativos se encuentran muy a menudo en la práctica y proporcionan una buena fundamentación para problemas de diseño experimental más complejos, En esta unidad se estudian experimentos comparativos donde intervienen una o dos poblaciones, y la finalidad es probar hipótesis con respecto a los parámetros de las poblaciones.

Ahora es momento de dar una definición formal de una hipótesis estadística. Definición:

Una hipótesis estadística es una proposición sobre los parámetros de una o más poblaciones.

Puesto que se emplean distribuciones de probabilidad para representar poblaciones, también es posible considerar una hipótesis estadística como una proposición sobre la distribución de probabilidad de una variable aleatoria. Lo usual es que la hipótesis involucre a uno o más parámetros de esta distribución.

Por ejemplo, supóngase que se tiene interés en la rapidez de combustión de un agente propulsor sólido utilizado en los sistemas de salida de emergencia para la tripulación de aeronaves. La rapidez de combustión es una variable aleatoria que puede describirse con una distribución de probabilidad. Supóngase que el interés se centra sobre la rapidez de combustión promedio (que es un parámetro de esta distribución). De manera específica, el interés recae en decidir si la rapidez de combustión promedio es o no 50 cm/s. Esto puede expresarse de manera formal como:

(2)

H0: µ = 50 cm/s

H1: µ ≠ 50cm/s

La proposición H0: µ = 50 cm/s de la ecuación se conoce como hipótesis nula, mientras

que la proposición H1: µ≠ 50cm/s recibe el nombre de hipótesis alternativa.

Puesto que la hipótesis alternativa especifica valores de µ que pueden ser mayores o menores que 50 crn/s, también se conoce como hipótesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una hipótesis alternativa unilateral, como en

H0: µ = 50 cm/s H0: µ = 50 cm/s

o

H1: µ < 50cm/s H1: µ > 50cm/s

Es importante recordar que las hipótesis siempre son proposiciones sobre la población o distribución bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del parámetro de la población especificado en la hipótesis nula (50 cm/s en el ejemplo anterior) se determina en una de tres maneras diferentes. Primero, puede ser resultado de la experiencia pasada o del conocimiento del proceso, o incluso de pruebas o experimentos previos. Entonces, el objetivo de la prueba de hipótesis usualmente es determinar si ha cambiado el valor del parámetro. Segundo, este valor puede obtenerse a partir de alguna teoría o modelo que se relaciona con el proceso bajo estudio. En este caso, el objetivo de la prueba de hipótesis es verificar la teoría o modelo. Aparece una tercera situación cuando el valor del parámetro de la población proviene de consideraciones externas, tales como las especificaciones de diseño o ingeniería, o de obligaciones contractuales. En esta situación, el objetivo usual de la prueba de hipótesis es probar el cumplimiento de las especificaciones.

Un procedimiento que conduce a una decisión sobre una hipótesis en particular recibe el nombre de prueba de hipótesis. Los procedimientos de prueba de hipótesis dependen del empleo de la información contenida en una muestra aleatoria de la población de interés. Si esta información es consistente con la hipótesis, se concluye que ésta es verdadera; sin embargo, si esta información es inconsistente con la hipótesis, se concluye que ésta es falsa. Debe hacerse hincapié en que la verdad o falsedad de una

(3)

hipótesis en particular nunca puede conocerse con certidumbre, a menos que pueda examinarse a toda la población. Usualmente esto es imposible en muchas situaciones prácticas. Por tanto, es necesario desarrollar un procedimiento de prueba de hipótesis teniendo en cuenta la probabilidad de llegar a una conclusión equivocada.

La estructura de los problemas de prueba de hipótesis es idéntica en todas las aplicaciones que se considerarán en esta unidad. La hipótesis nula es la hipótesis que desea probarse. El rechazo de la hipótesis nula siempre conduce a la aceptación de la hipótesis alternativa. En el estudio de la prueba de hipótesis, la hipótesis nula siempre de plantea de modo que especifique un valor exacto del parámetro (como en la proposición Ho: µ = 50 cm/s). La hipótesis alternativa permite que el parámetro tome varios valores

(como en la proposición H1: µ ≠ 50cm/s). La prueba de hipótesis involucra la toma de una

muestra aleatoria, el cálculo de un estadístico de prueba a partir de los datos muestrales, y luego el uso de este estadístico para tomar una decisión sobre la hipótesis nula.

Prueba de una hipótesis estadistica

Para ilustrar los conceptos generales, considérese el problema de la rapidez de combustión del agente propulsor presentado con anterioridad. La hipótesis nula es que la rapidez promedio de combustión es 50 cm/s, mientras que la hipótesis alternativa es que ésta no es igual a 50 cm/s. Esto es, se desea probar:

H0: µ = 50 cm/s

H1: µ ≠ 50cm/s

Supóngase que se realiza una prueba sobre una muestra de n = 10 especímenes, y que se observa cuál es la rapidez de combustión promedio x. La media muestral es un estimador de la media verdadera de la población µ. Un valor de la media muestral x que esté próximo al valor hipotético H0: µ = 50 cm/s es una evidencia de que el verdadero

valor de la media µ es realmente 50 cm/s; esto es, tal evidencia apoya la hipótesis nula Ho. Por otra parte, una media muestral muy diferente de 50 cm/s constituye una evidencia que apoya la hipótesis alternativa H1.

(4)

La media muestral puede tomar muchos valores diferentes. Supóngase que si 48.5≤x≤51.5, entonces se acepta la hipótesis nula H0: µ = 50, y que si x < 48.5 o x > 51.5,

entonces se acepta la hipótesis alternativa H1: µ ≠ 50cm/s. Esto se ilustra en la figura

siguiente.

Se acepta H1 Se acepta H0 Se acepta H1

µ≠ 50cm/s µ = 50 cm/s µ≠ 50cm/s | | _ 48.5 50 51.5 X

Los valores de x que son menores que 48.5 o mayores que 51.5 constituyen la región crítica de la prueba, mientras que todos los valores que están en el intervalo 48.5 ≤x≤ 51.5 forman la región de aceptación. Las fronteras entre las regiones crítica y de aceptación reciben el nombre de valores críticos. En el ejemplo, los valores críticos son 48.5 y 51.5. Por otra parte, la costumbre es establecer conclusiones con respecto a la hipótesis nula H0. Por tanto, se rechaza H0 en favor de Hl si el estadístico de prueba cae en la región

crítica, de lo contrarío, se acepta H0.

Este procedimiento de decisión puede conducir a una de dos conclusiones erróneas. Por ejemplo, es posible que el verdadero valor de la rapidez promedio de combustión del agente propulsor sea igual con 50 cm/s. Sin embargo, para todos los especímenes bajo prueba, bien puede observarse un valor del estadístico de prueba x que cae en la región crítica. En este caso, la hipótesis nula H0 será rechazada en favor de

la alternativa H1, cuando, de hecho, H0 en realidad es verdadera. Este tipo de conclusión

equivocada se conoce como error tipo I.

El error tipo I se define como el rechazo de la hipótesis nula H0 cuando esta es

verdadera.

Ahora supóngase que la verdadera rapidez promedio de combustión es diferente de 50cm/s, aunque la media muestral x caiga dentro de la región de aceptación. En este caso se acepta H0 cuando ésta es falsa. Este tipo de conclusión errónea recibe el nombre

de error tipo II.

(5)

Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones diferentes que determinan si la decisión final es correcta o errónea. Estas situaciones aparecen en la tabla que a continuación se expone:

Decisión H0 es verdadera H0 es falsa Aceptar H0 no hay error error tipo II

Rechazar H0 error tipo I no hay error

Dado que la decisión se basa en variables aleatorias, entonces es posible asociar probabilidades con los errores tipo I y II de la tabla. La probabilidad de cometer un error tipo I se denota con la letra griega α. Esto es,

α = P(error tipo I) = P(rechazar H0 ¦H0 es verdadero)

Algunas veces, la probabilidad del error tipo I, recibe el nombre de nivelo tamaño de significancia de la prueba. En el ejemplo de la rapidez promedio de combustión del agente propulsor, se presenta un error tipo I cuando x > 51.5 o x < 48.5 y la verdadera rapidez promedio de combustión es µ =50 cm/s. Supóngase que la desviación estándar de la rapidez de combustión es σ√n = 2.5 cm/s y que la rapidez de combustión tiene una distribución para la que se aplican las condiciones del teorema del limite central, de modo que la distribución de la media muestral es aproximadamente normal con media µ=50 y desviación estándar σ√n = √2.5/10 = 0.79. La probabilidad de cometer un error tipo I es igual la suma de las áreas que aparecen sombreadas las colas de la distribución normal de la siguiente figura. Esta probabilidad puede calcularse de la siguiente manera:

_ _

α =P(X < 48.5 | µ = 50) +P(X > 51.5 | µ =50)

Los valores de z que corresponden a los valores típicos 48.5 y 51.5 son

Z1 = 48.5 - 50 = -1.90

0.79

(6)

0.79 Por consiguiente,

α = P(Z< -1.90) + P(Z> 1.90) = 0.0288 + 0.0288 = 0.0576

Esto implica que el 5.76% de todas las, muestras aleatorias conducirán al rechazo de hipótesis H0 : µ= 50 cm/s cuando la verdadera rapidez promedio de combustión es en

realidad 50 cm/s.

Al analizar la figura precedente se nota que es posible reducir a al aumentar la región de aceptación. Por ejemplo, si se toman como valores críticos 48 y 52, el valor de α es

α = P (z < 48 -50 )+ P(z > 52 -50 ) 0.79 0.79 = P(Z < -2.53) + P(Z > 2.53) = 0.0057 + 0.0057 = 0.0114

También puede reducirse el valor de a mediante el incremento del tamaño de la muestra. Si n = 16, entonces σ / √n = 2.5/ √16 = 0.625 y, al utilizar la región crítica original de la figura, se tiene que:

(7)

0.625 y z2= 51.5 –50 = 2.40 0.625 Por consiguiente, α = P(Z < -2.40) + P(Z > 2.40) = 0.0082 + 0.0082 = 0.0164

Al evaluar un procedimiento de prueba de hipótesis, también es importante examinar la probabilidad del error tipo II, el cual se denota por β. Esto es,

β = P(error tipo II) = P(aceptar H0| H0 es falsa)

Para calcular β se debe tener una hipótesis alternativa específica; esto es, debe tenerse un valor particular de µ. Por ejemplo, supóngase que es importante rechazar la hipótesis nula H0:µ = 50 cada vez que la rapidez promedio de combustión µ es mayor que

52 crn/s o menor que 48 crn/s. Para elIo, puede calcularse la probabilidad β de un error tipo II para los valores µ = 52 y µ=48, y utilizar este resultado para averiguar algo con respecto a la forma en que se desempeñará la prueba. De manera específica, ¿cómo trabajará el procedimiento de prueba si se desea detectar, esto es, rechazar H0, para un

valor medio de µ = 52 o µ = 48? Dada la simetría, solo es necesario evaluar uno de los dos casos; esto es, encontrar la probabilidad de aceptar la hipótesis nula H0:µ=50 crn/s

cuando el valor verdadero es µ = 52 crn/s.

La figura que a continuación se expone será de gran ayuda para calcular la probabilidad β de un error tipo II. La distribución normal de la parte izquierda de la figura es la distribución del estadístico de prueba X cuando la hipótesis nula H0:µ = 50 es

verdadera (esto es lo que se entiende con la expresión "bajo H0:µ = 50), y la distribución

normal de la derecha es la distribución de X cuando la hipótesis alternativa es verdadera y el valor de la media es 52 (o "bajo H0:µ = 52"). Se comete un error tipo II si la media

muestral x cae entre 48.5 y 51.5 (que son las fronteras de la región crítica) cuando µ = 52. Como puede verse en la figura, esto es solo la probabilidad de que 48.5 ≤ X ≤ 51.5 cuando la media verdadera es µ = 52, lo que corresponde al área sombreada bajo la distribución normal de la derecha. Por lo tanto, con respecto a esta figura, se tiene:

(8)

_

β = P (48.5 ≤ X ≤ 51.5 | µ = 52)

Los valores de z que corresponden a 48.5 y 51.5 cuando µ = 52 son:

z1= 48.5 - 52 = -4.43 0.79 y z2= 51.5 –52 = -0.63 0.79 Entonces: β = P (-4.43 ≤ X ≤ -0.63) = P (z ≤ -0.63) - P (z ≤ -4.43) = 0.2643 – 0.000 = 0.2643

(9)

En consecuencia, si se prueba H0 : µ= 50 contra H0 : µ= 50 con n=10 y el valor

verdadero de la media es µ = 52, la probabilidad de que se acepte la hipótesis nula falsa es 0.2643. Por simetría, si el valor verdadero de la media es µ = 48, el valor de β también es 0.2643.

La probabilidad β de cometer un error tipo II aumenta rápidamente a medida que el valor verdadero de µ tiende al valor hipotético. Por ejemplo, en la figura a continuación:

donde el valor verdadero de la media es µ = 50.5 y el valor hipotético es H0: µ = 50. El

valor verdadero de µ está muy próximo a 50, y el valor de β es

β = P(48.5 ≤ X ≤ 51.51 | µ = 50.5)

Tal como se muestra en la figura precedente, los valores de z que corresponden a 48.5 y 51.5 cuando µ = 50.5 son z1= 48.5 – 50.5 = -2.53 0.79 y z2= 51.5 –50.5 = 1.27 0.79

(10)

Por consiguiente,

β = P( -2.53 ≤ Z ≤ 1.27) = P(Z ≤ 1.27) - P(Z ≤ -2.53) = 0.8980 -0.0057

= 0.8923

Por tanto, la probabilidad del error tipo II es mucho mayor para el caso donde la media verdadera es 50.5 cm/s, que para el caso donde ésta es 52 cm/s. Claro está que en muchas situaciones prácticas el interés no recae en cometer un error tipo II si la media está "próxima" al valor hipotético de ésta. Se podría estar más interesado en detectar diferencias grandes entre la media verdadera y el valor especificado en la hipótesis nula.

La probabilidad del error tipo II también depende del tamaño de la muestra n. Supóngase que la hipótesis nula es H0:µ = 50 cm/s y que el valor verdadero de la media

es µ = 52. Si el tamaño de la muestra aumenta de n = 10 a n = 16, entonces se obtiene la situación ilustrada en la figura siguiente. La distribución normal de la izquierda es la distribución de X cuando la media µ = 50, mientras que la distribución normal de la derecha es la distribución de X cuando µ = 52. Tal como se muestra en la figura, la probabilidad del error tipo II es:

(11)

β= P(48.5 ≤ X ≤ 51.5 | µ = 52)

Cuando µ = 16, la desviación estándar de X es σ/√n = 2.5/ √16 = 0.625, y los valores de z que corresponden a 48.5 y 51.5 cuando µ = 52 son

z1= 48.5 – 52 = -5.60 0.625 y z2= 51.5 – 52 = -0.80 0.625 Por consiguiente: β = P(-5.60 ≤ Z ≤ -0.80) = P(Z ≤ -0.80) – P(Z ≤ - 5.60) = 0.2119 -0.000 = 0.2119.

(12)

Hay que recordar que cuando n = 10 y µ = 52, se tiene que β = 0.2643; por tanto, el aumento en el tamaño de la muestra da como resultado una disminución en la probabilidad del error tipo II.

A continuación se resumen los resultados de esta sección, así como otros cálculos similares: Región de aceptación Tamaño de la muestra α Β para µ = 52 Β para µ = 50.5 48.5 < x < 51.5 10 0.0576 0.2643 0.8923 48 < x < 52 10 0.0114 0.5000 0.9705 48.5 < x < 51.5 16 0.0164 0.2119 0.9445 48 < x < 52 16 0.0014 0.5000 0.9918

Los resultados con negrita no fueron calculados en el texto, pero el lector puede verificarlos con facilidad. La tabla y lo estudiado hasta el momento revelan cuatro puntos importantes:

1) El tamaño de la región crítica y, en consecuencia, la probabilidad α de un error tipo I, siempre pueden reducirse mediante una selección apropiada de los valores críticos. 2) Los errores tipo I y II están relacionados. Una disminución en la probabilidad en un tipo de error siempre da como resultado un aumento en la probabilidad del otro, siempre y cuando el tamaño de la muestra n no cambie.

3) En general, un aumento en el tamaño de la muestra reduce tanto a α como a β , siempre y cuando los valores críticos se mantengan constantes.

4) Cuando la hipótesis nula es falsa, β aumenta a medida que el valor verdadero del parámetro tiende al valor hipotético propuesto por la hipótesis nula. El valor de β disminuye a medida que aumenta la diferencia entre el verdadero valor medio y el propuesto.

En general, el analista controla la probabilidad α del error tipo I cuando escoge los valores críticos. Así, usualmente es más fácil para el analista fijar la probabilidad del error tipo I en (casi) cualquier valor deseado. Puesto que el analista puede controlar de manera

(13)

directa la probabilidad de rechazar de manera errónea H0, siempre puede considerarse el

rechazo de la hipótesis nula H0 como una conclusión fuerte.

Por otra parte, la probabilidad β del error tipo II no es constante, sino que depende del valor verdadero del parámetro. Ésta también depende del tamaño de la muestra que se haya seleccionado. Dado que la probabilidad β del error tipo II es una función tanto del tamaño de la muestra como del punto en el cual la hipótesis nula H0 es falsa, es

costumbre considerar la decisión de aceptar H0 como una conclusión débil, a menos que

se sepa que β es aceptablemente pequeño. Por consiguiente, más que decir "se acepta H0", se prefiere la terminología "incapaz de rechazar H0". La incapacidad de rechazar H0

implica que no se ha encontrado evidencia suficiente para rechazar a H0, esto es, para

hacer una proposición fuerte. La incapacidad de rechazar H0 no significa necesariamente

que exista una probabilidad grande de que H0 sea cierta. Esto simplemente significa que

se requieren más datos para alcanzar una conclusión fuerte. Lo anterior puede tener implicaciones importantes para la formulación de hipótesis.

Un concepto importante que se usará más adelante es el de la potencia de una prueba estadística.

La potencia de una prueba estadística es la probabilidad de rechazar la hipótesis nula Ho cuando fa hipótesis alternativa es verdadera.

El valor de la potencia es 1 - β, y la potencia puede interpretarse como la probabilidad de rechazar de manera correcta una hipótesis nula falsa. A menudo las pruebas estadísticas se comparan mediante la comparación de sus propiedades de potencia. Por ejemplo, considérese el problema de la rapidez de combustión del agente propulsor cuando se prueba H0:µ = 50 cm/s contra H1:µ ≠ 50 cm/s. Supóngase que

el valor verdadero de la media es µ = 52. Cuando n = 10, se tiene que β = 0.2643, de modo que la potencia de esta prueba es 1 -β = 1 - 0.2643 = 0.7357 cuando µ = 52.

La potencia es una medida muy descriptiva y concisa de la sensibilidad de una prueba estadística, donde por sensibilidad se entiende la capacidad de una prueba para detectar diferencias. En este caso, la sensibilidad de la prueba para detectar la diferencia entre una rapidez promedio de combustión de 50 cm/s y otra de 52 cm/s, es 0.7357. Esto es, si el valor verdadero de la media es en realidad 52 cm/s, esta prueba rechazará de manera correcta H0:µ = 50 cm/s y "detectará" esta diferencia e173 .57% de las veces. Si

(14)

se piensa que el valor de esta potencia es bajo, entonces el analista puede aumentar a o el tamaño de la muestra n.

Hipótesis unilaterales y bilaterales

Una prueba de cualquier hipótesis, tal como

H0:µ = 50 cm/s

H1:µ≠ 50 cm/s

recibe el nombre de prueba bilateral, debido a que es importante detectar diferencias a partir del valor hipotético de la media µ0 que se encuentren en cualquier lado de µ0. En

una prueba de este tipo, la región crítica se separa en dos partes, con (usualmente) la misma probabilidad en cada cola de la distribución de la estadística de prueba.

Muchos problemas de prueba de hipótesis involucran de manera natural hipótesis alternativas unilaterales, tales como

H0:µ = µ0

H1:µ >µ0

o

H0:µ = µ0

H1:µ < µ0

Si la hipótesis alternativa es H1:µ >µ0 la región crítica debe encontrarse en la cola

superior de la distribución del estadístico de prueba, mientras que si la hipótesis alternativa es H1:µ < µ0 la región crítica debe encontrarse en la cola inferior de la

distribución. En consecuencia, en ocasiones estas pruebas se conocen como pruebas de una cola. Es fácil localizar la región crítica para pruebas unilaterales. Para ello, simplemente se visualiza el comportamiento del estadístico de prueba si la hipótesis nula

(15)

es verdadera, y se coloca la región crítica en el extremo o cola apropiada de la distribución. En general, la desigualdad en la hipótesis alternativa "apunta" en la dirección de la región crítica.

Al construir hipótesis, siempre se plantea la hipótesis nula como una igualdad, de modo que la probabilidad α del error tipo I pueda controlarse en un valor específico. La hipótesis alternativa puede ser unilateral o bilateral, dependiendo de la conclusión que ha de obtenerse si se rechaza H0. Si el objetivo es hacer una afirmación donde aparezcan

proposiciones tales como "mayor que", "menor que", "superior a", "excede a", "al menos" y otras similares, entonces la alternativa unilateral es la que resulta más apropiada. Si la afirmación no implica ninguna dirección, o si es del tipo "no es igual a", entonces debe utilizare la alternativa bilateral.

En algunos problemas reales, donde se recomiendan los procedimientos de prueba unilaterales, en ocasiones es difícil escoger un planteamiento apropiado de la hipótesis alternativa. Por ejemplo, supóngase que un embotellador de refresco compra botellas de 10 onzas a una compañía vidriera. El embotellador desea estar seguro de que las botellas cumplen con las especificaciones sobre la presión interna promedio o presión de estallamiento, la cual, para botellas de 10 onzas, debe tener un valor mínimo de 200 psi. El embotellador ha resuelto formular el procedimiento de decisión para un lote especifico de botellas COmo un problema de hipótesis. Para este problema, existen dos planteamientos posibles: Ho: µ = 200 psi H1: µ > 200 psi o Ho: µ = 200 psi H1: µ < 200 psi

Considérese el planteamiento dado por la primera ecuación. Si se rechaza la hipótesis nula, entonces las botellas serán juzgadas como satisfactorias; mientras que si no se rechaza H0, la implicación es que las botellas no cumplen con las especificaciones y, por

ende, no deben utilizarse. Dado que el rechazo de H0 es una conclusión fuerte, este

planteamiento obliga al fabricante de las botellas a "demostrar" que la presión de estallamiento promedio de las botellas es mayor que la especificada. Ahora considérese el planteamiento dado por la segunda ecuación. En esta situación, las botellas serán

(16)

consideradas satisfactorias a menos que se rechace H0. Esto es, se concluye que las

botellas son satisfactorias a menos que exista evidencia fuerte en sentido contrario.

¿Qué planteamiento es el correcto: el de la primera ecuación o el de la segunda ecuación? La respuesta es "depende". Para la primera ecuación, existe cierta probabilidad de que H0 no sea rechazada (esto es, puede decidirse que las botellas no son

satisfactorias), aun cuando la verdadera media sea ligeramente mayor que 200 psi. Este planteamiento implica que se desea que el fabricante de las botellas demuestre que el producto cumple o excede las especificaciones. Tal planteamiento puede ser apropiado si, en el pasado, el fabricante ha experimentado dificultades para cumplir con las especificaciones, o si las condiciones de seguridad del producto lo obligan a ajustarse de manera estricta a la especificación de 200 psi. Por otra parte, para el planteamiento de la segunda ecuación, existe cierta probabilidad de que H0 será aceptada y se considerará

que las botellas son satisfactorias, aun cuando la verdadera media sea ligeramente menor que 200 psi. Puede concluirse que las botellas no son satisfactorias sólo cuando existe una fuerte evidencia de que la media no es mayor que 200 psi, esto es, cuando se rechace H0: µ = 200 psi. Este planteamiento supone que todos están felices con el

desempeño pasado del fabricante y que las pequeñas desviaciones de la especificación µ ≥ 200 psi no serán de consecuencias.

Al formular hipótesis alternativas unilaterales, debe recordarse que el rechazo de H0 siempre es una conclusión fuerte. En consecuencia, en la hipótesis alternativa debe

ponerse la proposición sobre la que es importante llegar a una conclusión fuerte. A menudo, en problemas reales, esto depende del punto de vista de los involucrados y de la experiencia que tengan con la situación.

Pasos de la prueba de hipótesis

Para los distintos casos prácticos que se pueden presentar ante una investigación, se recomienda utilizar los siguientes pasos al aplicar la metodología de prueba de hipótesis.

1) Del contexto del problema, identificar el parámetro de interés. 2) Establecer la hipótesis nula, H0.

3) Especificar una apropiada hipótesis alternativa, H1.

(17)

5) Establecer un estadístico de prueba apropiado. 6) Establecer la región de rechazo para el estadístico.

7) Calcular todas las cantidades muestrales necesarias, sustituirlas en la ecuación para el estadístico de prueba y calcular el valor correspondiente.

8) Decidir si debe o no rechazarse H0 y notificar esto en el contexto del problema.

Los pasos 1 a 4 deben completarse antes de examinar los datos muestrales.

Algunos comentarios prácticos sobre la prueba de hipótesis

En la práctica, este procedimiento formal y (en apariencia) rígido, no siempre es necesario. En general, una vez que el experimentador (o tomador de decisiones) ha decidido sobre la pregunta de interés y ha determinado el diseño del experimento (esto es, cómo recopilar los datos, cómo tomar las mediciones y cuántas observaciones se requieren), entonces en realidad sólo se necesitan tres pasos:

1. Especificar la estadística de prueba que va a utilizarse (tal como z0).

2. Especificar la ubicación de la región crítica (de dos colas, de cola superior o de cola inferior).

3. Especificar los criterios de rechazo (en general, el valor de α, o el valor P para el que debe ocurrir el rechazo).

A menudo, en la solución de problemas reales, estos pasos se completan casi al mismo tiempo, aunque es necesario hacer hincapié en que es necesario reflexionar detenidamente cada uno de ellos. Esta es la razón por la que se presentó y se utilizó el proceso de ocho pasos: parece reforzar los fundamentos del enfoque correcto. Si bien, tal vez no se utilice todas las veces en la solución de problemas reales, es un marco de referencia útil cuando se aprenden por primera vez métodos estadísticos.

Significado estadístico y significado práctico: Ya se ha mencionado que es muy útil

notificar los resultados de una prueba de hipótesis en términos de un valor P, ya que esto conlleva más información que la simple proposición "rechazar H0" o "no es posible

rechazar H0". Esto es, el rechazo de H0 con un nivel de significancia 0.05 tiene un

significado mayor si el valor del estadístico de prueba está bien ubicado en la región crítica, excediendo por más del 5% el valor crítico, que si apenas excede este valor.

(18)

Incluso un valor P muy pequeño puede ser difícil de interpretar desde un punto de vista práctico cuando se toman decisiones, ya que, si bien un valor pequeño de P indica significancia estadística en el sentido en que debe rechazarse H0 en favor de H1 el

alejamiento real detectado con respecto a H0 puede tener poca significancia práctica (a

los ingenieros les gusta decir "significancia ingenieril"). Esto es particularmente cierto cuando el tamaño de la muestra n es grande.

Construcción de la prueba: cuando se muestrea una población normal con media µ y varianza conocida σ2 y se prueba H0: µ =µ0 contra H1: µ >µ0, se comienza con la media

muestral X y luego se emplea la estadística de prueba estandarizada

Z0 = x - µ0

σ / √n

Entonces, la intuición sugiere que se rechace H0: µ =µ0 cuando el valor numérico de Z0 es

grande. La región crítica se obtiene al usar el hecho de que Z0 tiene una distribución

normal estándar cuando H0:µ =µ0 es verdadera, de modo que el punto Zα será el valor

crítico apropiado.

Pueden emplearse métodos más formales para el desarrollo de procedimientos para la prueba estadística de hipótesis. Un método muy utilizado para la construcción de pruebas es el principio de la razón de verosimilitudes. Muchos de los procedimientos de prueba presentados en este libro pueden obtenerse con el empleo de este método. Por ejemplo, la prueba anterior es una prueba de razón de verosimilitudes. A menudo, las pruebas estadísticas obtenidas a partir de este principio tienen el error tipo II más pequeño (la β más pequeña) de entre todas las pruebas que tienen la misma probabilidad para el error tipo I (α). Es así como, en cierto sentido, éstos son procedimientos de prueba óptimos.

Prueba de hipótesis sobre la media

En esta parte de la unidad se consideran pruebas de hipótesis sobre la media de una población (o la media de una distribución de probabilidad), donde la varianza de la población es conocida.

(19)

Las suposiciones para esta prueba son mínimas. La población o distribución de interés tiene media µ y varianza σ2, con σ2 conocida. El estadístico de prueba se basa en la media muestral X, por lo que también se supondrá que la población está distribuida de manera normal o que se aplican las condiciones del teorema del límite central. Esto significa que la distribución de X es aproximadamente normal con media µ y varianza σ2

/n.

Desarrollo del procedimiento de prueba: Supóngase que se desea probar la hipótesis

H0:µ =µ0

H1:µ≠µ0

donde µ0 es una constante específica. Se tiene una muestra aleatoria X1,X2,....Xn de la

población. Puesto que X tiene una distribución aproximadamente normal con media µ0 y desviación estándar σ2/√n si la hipótesis nula es verdadera, entonces puede construirse una región crítica con base en el valor calculado de la media muestral x.

Habitualmente, es más conveniente estandarizar la media muestral y utilizar la estadística de prueba basada en la distribución normal estándar. Esto es, el procedimiento de prueba para H0:µ =µ0 utiliza el estadístico de prueba

Z0 = x - µ0

σ2/√n

si la hipótesis nula H0:µ =µ0 es verdadera, E( X) =µ0, de donde se desprende que la

distribución de Z0 es la distribución normal estándar [denotada por N(0,1)]. En

consecuencia, si H0:µ =µ0 es cierta, la probabilidad de que la estadística de prueba Z0

caiga entre -Zα/2 y Zα/2 es 1-α. (Recuérdese que Zα/2 es el punto que corresponde al

porcentaje 100 α/2 de la distribución normal estándar.) La figura que a continuación se presenta ilustra esta situación.

(20)

Nótese que la probabilidad de que la estadística de prueba Z0 caiga en la región Z0 > Zα/2

o Z0 < - Zα/2 cuando H0:µ =µ0 es verdadera, es α. Es evidente que una muestra que

produce un valor del estadístico de prueba que cae en las colas de la distribución de Z0

será inusual si H0:µ =µ0 es cierta, por tanto, esto es un indicador de que H0 es falso. En

consecuencia, H0 debe rechazarse si

Z0 > Zα/2

o

Z0 < - Zα/2

Por otra parte, H0 no puede rechazarse si

- Zα/2 ≤ Z0 ≤ Zα/2

La última ecuación expuesta define la región de aceptación de H0, y las ecuaciones

anteriores definen la región crítica o región de rechazo. La probabilidad del error tipo I para este procedimiento de prueba es α.

En general, es más fácil comprender la región crítica y el procedimiento de prueba usando la estadística de prueba es Z0 más que X. Sin embargo, la misma región critica

siempre puede escribirse en términos del valor calculado de la media muestral x. Un procedimiento idéntico al anterior es el siguiente:

_ _

Rechazar H0 : µ = µ0 si X > a o X < b

Donde

(21)

a = µ0 + Zα/2 σ2/√n

b = µ0 - Zα/2 σ2/√n

También pueden desarrollarse procedimientos para la prueba de hipótesis sobre µ, donde la hipótesis alternativa es unilateral. Supóngase que se especifican las hipótesis como:

H0:µ =µ0 H1:µ >µ0

Al definir la región crítica para esta prueba, se observa que un valor negativo de la estadística de prueba Z0 nunca conducirá a la conclusión de que H0 : µ = µ0 es falsa. Por

consiguiente, la región crítica debe colocarse en la cola superior de la distribución normal estándar y el rechazo de H0 se hará cuando el valor calculado de Z0 sea muy grande. Esto

es, H0 será rechazada si

Z0 >Zα

De manera similar, para probar

H0 : µ = µ0

H1 : µ < µ0

Se calcula la estadística de prueba Z0 y se rechaza H0, sí el valor de Z0 es muy pequeño

Esto la región crítica se encuentra en la cola inferior de la distribución normal estándar y se rechaza H0 ,si

Z0 > - Zα

Valores P en la prueba de hipótesis

Una manera de notificar los resultados de una prueba de hipótesis es establecer que la hipótesis nula fue o no rechazada con un valor especificado de α o nivel de significancia. A menudo, este planteamiento de conclusiones resulta inadecuado, ya que

(22)

no brinda al tomador de decisiones ninguna , si el valor calculado de la estadística de prueba estaba apenas en la región de rechazo o bien ubicado dentro de ella. Además, establecer de esta manera los resultados, impone a otros usuarios de la información el nivel de significancia predeterminado. Este puede ser poco satisfactorio, ya que algunos tomadores de decisiones se sentirán incómodos con los riesgos implicados por α = 0.05.

Para evitar estas dificultades, en la práctica se ha adoptado, de manera amplia, el enfoque del valor P. El valor p es la probabilidad de que el estadístico de prueba tome un valor menos tan extremo como el valor observado del estadístico de prueba cuando ola hipótesis nula H0, es verdadera. Es así como el valor P acarrea mucha información sobre

el evidencia contra H0 de modo que el tomador de decisiones pueda llegar a una

conclusión para cualquier nivel de significancia especificado. A continuación se proporciona definición formal de un valor P

El valor P es el nivel de significancia más pequeño que conduce al rechazo de la hipótesis nula H0.

Es habitual llamar al estadístico de prueba (ya los datos) significante cuando se rechaza a la hipótesis nula H0; por tanto, el valor P puede considerarse como el nivel de

significancia α más pequeño para el que los datos son significativos. Una vez que se conoce el valor P, el tomador de decisiones puede determinar por si mismo cuán significativos son los datos, sin que el analista de los mismos imponga un nivel de significancia seleccionado de antemano.

Para las pruebas de distribuciones normales presentadas hasta el momento, es relativamente sencillo calcular el valor P. Si Z0 es el valor calculado del estadístico de

prueba, entonces el valor p es

2 [1 – Φ (|Z0|)] para una prueba de dos colas: H0:µ =µ0 H1:µ≠µ0

P = 1 - Φ (Z0) para una prueba de cola superior: H0:µ =µ0 H1:µ > µ0

(23)

En las expresiones anteriores, Φ(z) es la función de distribución acumulada normal estándar

No siempre resulta sencillo calcular el valor exacto de P para una prueba. Sin embargo, muchos programas de computadora modernos para análisis estadístico notifican valores P, y éstos también pueden obtenerse con algunas calculadoras de mano. Finalmente, si se utiliza el enfoque del valor P, entonces puede modificarse el paso 6 del procedimiento para la prueba de hipótesis. De manera especifica, no es necesario plantear explícitamente la región critica.

En muchos problemas de ingeniería, se tiene interés en una variable aleatoria que sigue una distribución binomial. Por ejemplo, considérese un proceso de producción que fabrica artículos que son clasificados como aceptables o defectuosos. Lo usual y más razonable es modelar la ocurrencia de artículos defectuosos con la distribución binomial, donde el parámetro binomial p representa la proporción de artículos defectuosos producidos. En consecuencia, muchos problemas de decisión en ingeniería incluyen una prueba de hipótesis con respecto a p.

Considérese la prueba

H0:p =p0

H1:p ≠ p0

A continuación se proporciona una prueba basada en la aproximación normal de una distribución binomial. Este procedimiento aproximado es válido siempre y cuando p no sea muy próximo a cero o uno, y si el tamaño de la muestra es relativamente grande. Sea X el número de observaciones en una muestra aleatoria de tamaño n que pertenece a la clase asociada con p . Entonces, si la hipótesis nula H0:p=p0 es verdadera, se tiene que X

~ N (np0, np0(1 – p0)), aproximadamente. Para probar H0:p =p0, se calcula el estadístico de

prueba

(24)

Z0 > Zα/2 o Z0 < - Zα/2

Las regiones críticas para las hipótesis alternativas unilaterales se construyen de la manera usual.

PRUEBAS DE HIPÓTESIS SOBRE LA VARIANZA

Algunas veces se necesitan pruebas sobre la varianza o la desviación estándar de una población. En esta parte se presentala hipótesis de que la población es normal.

Procedimientos de prueba para una población normal: Supóngase que se desea

probar la hipótesis de que la varianza de una población normal σ2 es igual a un valor específico, por ejemplo, σ2. Sea X1, X2 ... Xn, una muestra aleatoria de n observaciones

tomadas de esta población. Para probar

H0:σ2 =σ20

H1:σ2≠ σ20

se utiliza el estadístico de prueba

X20 = ( n – 1 ) S2

σ20

donde S2 es la varianza muestral. Ahora, si H0:σ2 =σ20 es verdadera, entonces el

estadístico de prueba X20 sigue una distribución ji-cuadrada con n - 1 grados de libertad.

Por consiguiente, se calcula el valor de la estadística de prueba X20, y la hipótesis H0:σ2

=σ2

0 debe rechazarse si

X20 > X2α/2,n - 1

o si

X20 > X2 1 -α /2,n - 1

donde X20 > X2α/2,n - 1 y X20 > X2 1 -α /2,n - 1 son los puntos que corresponden a los porcentajes

(25)

respectivamente, El mismo estadístico de prueba se utiliza para hipótesis alternativas unilaterales. Para la hipótesis unilateral

H0:σ2 =σ20

H1:σ2≠ σ20

se rechaza H0 si ,

X20 > X2α/2,n - 1

Para la otra hipótesis unilateral

H0:σ2 =σ20

H1:σ2 < σ20

se rechaza H0 si