Control Estadístico de Procesos
Control Estadístico de Procesos
Test de Hipótesis
El contraste de hipótesis o test de hipótesis es una herramienta muy importante y ampliamente utilizada para comparar mediciones y tomar decisiones basadas en una
probabilidad. Vamos a explicarlo con un ejemplo. Supongamos que en una huerta se cultivan tomates en un terreno donde hay sembradas 300 plantas de tomates,
utilizando un determinado tipo de fertilizante.
El agricultor desea probar un nuevo fertilizante, basándose en la propaganda de una revista de horticultura.
Con este fin, en la siguiente cosecha utiliza el nuevo fertilizante en una de las plantas, en la que obtiene 12,5 Kg. de tomates. Cómo saber si el rendimiento en esta planta fue mejor porque se utilizó un nuevo fertilizante? Indudablemente necesitamos comparar este valor con el rendimiento de las otras plantas en las que se usó el fertilizante habitual. Los rendimientos de distintas plantas seguramente fluctúan al azar:
...Etc. ...Etc.
10,9 Kg. 12,1 Kg.
9,3 Kg.
10,1 Kg.
11,9 Kg.
1
2
3
4
5
Es decir, no tenemos un único resultado con el fertilizante anterior Es decir, no tenemos un único resultado con el fertilizante anterior sino muchos resultados que varían aleatoriamente, y es posible que sino muchos resultados que varían aleatoriamente, y es posible que algunos de esos resultados superen los 12,5 Kg. Se necesita,
algunos de esos resultados superen los 12,5 Kg. Se necesita,
entonces, un criterio para decidir si el nuevo fertilizante produce una entonces, un criterio para decidir si el nuevo fertilizante produce una mejora en el rendimiento.
mejora en el rendimiento.
Para resolver el problema, necesitamos hacer algunas Para resolver el problema, necesitamos hacer algunas suposiciones.
suposiciones.
Primero: El conjunto de resultados de muchas plantas de tomate con el primer fertilizante constituye un universo conceptual de observaciones de distribución normal. Hablamos de universo conceptual o hipotético porque es el universo o población de
resultados que tendríamos con un número enormemente grande de plantas, con el mismo fertilizante y en las mismas condiciones.
Segundo:
Segundo: Aunque el promedio y la desviación standard de una Aunque el promedio y la desviación standard de una población hipotética, en general, no se conoce, el promedio y la población hipotética, en general, no se conoce, el promedio y la
desviación standard calculados con el rendimiento de las 299 plantas desviación standard calculados con el rendimiento de las 299 plantas restantes, utilizando el fertilizante habitual, constituyen una buena restantes, utilizando el fertilizante habitual, constituyen una buena estimación de la media y desviación standard del universo.
estimación de la media y desviación standard del universo.
Kg. de Tomates Función
de Gauss
Vamos a suponer, entonces, que conocemos la media y desviación Vamos a suponer, entonces, que conocemos la media y desviación standard del universo y son los siguientes:
standard del universo y son los siguientes:
µ
µ = 10,7 Kg. = 10,7 Kg.
σ
σ = 0,8 Kg. = 0,8 Kg.
(Estimados con los rendimientos de 299 Plantas) (Estimados con los rendimientos de 299 Plantas)
El único resultado obtenido con el nuevo fertilizante es 12,5 Kg., lo El único resultado obtenido con el nuevo fertilizante es 12,5 Kg., lo cual supera el promedio del universo de resultados obtenidos con el cual supera el promedio del universo de resultados obtenidos con el fertilizante anterior.
fertilizante anterior.
Kg. de Tomates Función
de Gauss
10,7 Kg. 0,8 Kg.
Kg. de Tomates Función
de Gauss
10,7 Kg. 0,8 Kg.
Si bien el promedio es 10,7 Kg., en la población hay resultados más Si bien el promedio es 10,7 Kg., en la población hay resultados más altos, y tal vez algunos iguales o mayores que 12,5 Kg.
altos, y tal vez algunos iguales o mayores que 12,5 Kg. Se puedeSe puede decir, entonces, que el nuevo fertilizante produce mejores
decir, entonces, que el nuevo fertilizante produce mejores
resultados?
resultados? Para tomar la decisión, conviene razonar de la siguientePara tomar la decisión, conviene razonar de la siguiente manera:
manera:
Si en la población hipotética de resultados obtenidos con el primer Si en la población hipotética de resultados obtenidos con el primer fertilizante es común encontrar valores iguales o mayores que 12,5 fertilizante es común encontrar valores iguales o mayores que 12,5 Kg., entonces el resultado obtenido con el nuevo fertilizante no tiene Kg., entonces el resultado obtenido con el nuevo fertilizante no tiene nada de excepcional.
nada de excepcional. Afirmamos, entonces, que el nuevo fertilizanteAfirmamos, entonces, que el nuevo fertilizante es igual que el anterior (No hay diferencia), y que el resultado
es igual que el anterior (No hay diferencia), y que el resultado obtenido se debió solamente a la fluctuación al azar de los obtenido se debió solamente a la fluctuación al azar de los resultados que obtendríamos con cualquier fertilizante. resultados que obtendríamos con cualquier fertilizante.
Por otro lado, si en la población hipotética de resultados obtenidos con el primer fertilizante es poco común encontrar un valor como 12,5 Kg., quiere decir que el resultado del nuevo fertilizante sí es excepcional (es significativo) y por lo tanto tenemos razones para afirmar que es mejor que el anterior.
Esas son las dos hipótesis de valor opuesto que se plantean, una de las cuales es rechazada y la otra aceptada sobre la base de las probabilidades derivadas de la comparación con la distribución normal. Formalmente, éstas hipótesis son las siguientes:
Hipótesis Nula: No hay diferencia entre los fertilizantes (Las
diferencias son nulas). El valor obtenido con el nuevo fertilizante se debe sólo a la fluctuación aleatoria de los rendimientos de las
plantas.
Para decidir entre ambas hipótesis, se calcula el estadístico Z, y se
Para decidir entre ambas hipótesis, se calcula el estadístico Z, y se
obtiene de la distribución normal standard la probabilidad de un valor
obtiene de la distribución normal standard la probabilidad de un valor
(del estadístico Z) mayor o igual al calculado.
(del estadístico Z) mayor o igual al calculado.Si la probabilidad de unSi la probabilidad de un valor igual o mayor que el calculado es mayor que 0,05 se acepta la valor igual o mayor que el calculado es mayor que 0,05 se acepta la hipótesis nula a un nivel de significación de 0,05. Esto quiere decir hipótesis nula a un nivel de significación de 0,05. Esto quiere decir que hay una probabilidad mayor que 0,05 (mayor que 5 %) de que hay una probabilidad mayor que 0,05 (mayor que 5 %) de obtener por casualidad (Fluctuación aleatoria) un valor de Z tan obtener por casualidad (Fluctuación aleatoria) un valor de Z tan grande como el calculado. Si la probabilidad de un valor igual o grande como el calculado. Si la probabilidad de un valor igual o mayor que el calculado es menor que 0,05 se rechaza la hipótesis mayor que el calculado es menor que 0,05 se rechaza la hipótesis nula a un nivel de significación de 0,05. Es decir, la probabilidad de nula a un nivel de significación de 0,05. Es decir, la probabilidad de obtener en forma aleatoria un valor tan grande de Z es menor que obtener en forma aleatoria un valor tan grande de Z es menor que 0,5 (menor que 5 %). En este caso se dice que el resultado obtenido 0,5 (menor que 5 %). En este caso se dice que el resultado obtenido con el nuevo fertilizante es
con el nuevo fertilizante es significativo.significativo.
En nuestro ejemplo:
Hipótesis
Alternativa:
Hay diferencias
significativas
Hipótesis Nula:
No hay diferencias
Con cual me quedo?
Z
x
12,5 Kg. 10,7 Kg.
Entrando en la tabla de la distribución normal standard, obtenemos Entrando en la tabla de la distribución normal standard, obtenemos que la probabilidad de un Z igual o mayor que 2,25 es P = 0,0122 que la probabilidad de un Z igual o mayor que 2,25 es P = 0,0122 (1,22 %). Quiere decir, entonces, que es muy poco probable obtener (1,22 %). Quiere decir, entonces, que es muy poco probable obtener un rendimiento de 12,5 Kg. de tomates con el fertilizante habitual. un rendimiento de 12,5 Kg. de tomates con el fertilizante habitual. Rechazamos, entonces, la Hipótesis Nula (Y aceptamos la Hipótesis Rechazamos, entonces, la Hipótesis Nula (Y aceptamos la Hipótesis Alternativa) a un nivel de significación de 0,05.
Alternativa) a un nivel de significación de 0,05.
Ahora bien, para estar totalmente seguro y antes de invertir dinero en comprar una cantidad importante del fertilizante, el agricultor decide hacer una nueva prueba, y en la cosecha siguiente utiliza el nuevo producto en 10 plantas de tomate, con lo cual la prueba es mas segura. Las hipótesis a contrastar son las mismas, pero el cálculo es algo diferente.
Ahora tenemos 10 resultados, cuyo promedio vamos a suponer que sea 11,5 Kg. Estos 10 resultados constituyen una muestra del
universo de rendimientos individuales de las plantas. Pero el promedio 11,5 Kg. es un elemento del universo de promedios muestrales (Promedios de 10 resultados) derivado del universo
anterior, con el mismo promedio que este y con desviación standard:
como ya hemos visto. El estadístico Z es, entonces: como ya hemos visto. El estadístico Z es, entonces:
En la tabla de la distribución normal standard, la probabilidad de un Z En la tabla de la distribución normal standard, la probabilidad de un Z igual o mayor que 3,16 es P = 0,0008 (0,08 %) aproximadamente. La igual o mayor que 3,16 es P = 0,0008 (0,08 %) aproximadamente. La
10
10
Z
X
10
11,5 Kg. 10,7 Kg.
0,8 Kg.
10
plantas de 11,5 Kg. de tomates con el fertilizante habitual es plantas de 11,5 Kg. de tomates con el fertilizante habitual es prácticamente nula.
prácticamente nula.
Rechazamos, entonces la Hipótesis Nula (Y aceptamos la
Hipótesis Alternativa) a un nivel de significación de 0,0008. El nivel de confianza en las bondades del nuevo fertilizante, ahora, es mayor.