LAURA ELENA PUENTES PRADO
UNIVERSIDAD DE GUANAJUATO
DIVISIÓN DE CIENCIAS NATURALES Y EXACTAS
MAT-2051 1 (DISEÑO DE EXPERIMENTOS)
TAREA #3. DISEÑOS EN BLOQUES
I. Problemas del libro. Capítulo 4
1. ¿En qué situación se aplica un diseño de bloques completos al azar? ¿En qué difieren los factores de tratamiento y de bloques?
Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor, es deseable que las posibles diferencias se deban principalmente al factor de interés y no a otros factores que no se consideran en el estudio. Cuando se quiere nulificar el efecto de estos otros factores se realiza un bloqueo. Por ejemplo, supongamos que se quieren compara varias máquinas, si cada máquina es manejada por un operador diferente y se sabe que éste tiene influencia en el resultado, entonces la forma de anular el efecto operador en la comparación (bloquear) consiste en que cada operador trabaje durante el experimento con cada una de las máquinas.
Los factores de bloque son aquellos factores adicionales al factor de interés que se incorporan de manera explícita en un experimento comparativo. No se quiere analizar su efecto si no es un medio para estudiar de manera adecuada y eficaz al factor interés (tratamiento).
2. ¿Qué diferencia hay entre un DBCA y los diseños en cuadro latino?
En un diseño de bloques completos al azar (DBCA) se consideran tres fuentes de variabilidad: el factor de tratamientos, el factor de bloque y el error aleatorio.
En el diseño en cuadro latino (DCL) se controlan: dos factores de bloque y se estudia un factor de tratamientos, así que se tienen cuatro fuentes de variabilidad que pueden afectar sobre la respuesta observada.
3. De acuerdo con el modelo estadístico para un diseño en bloques, ¿por qué a través de este diseño se reduce el error aleatorio?
Porque en el diseño de bloques se analizan posibles factores (bloques) que pueden influir de manera significativa en nuestro experimento entonces en base a ellos decidir si nuestros resultados son válidos o no.
4. A continuación se muestra parte del ANOVA para un diseño de bloques, que tiene tres tratamientos y cinco bloques con una sola repetición por tratamiento-bloque.
a) Agregar en esta tabla los grados de libertad, el cuadrado medio y la razón F para cada una de las fuentes de variación.
b) Interprete en forma práctica para cada caso, lo que está estimando el cuadrado medio.
Si la hipótesis nula es verdadera el cuadrado medio puede estimar la varianza (ζ2
). c) Escriba el modelo estadístico y las hipótesis pertinentes.
Modelo: { } Hipótesis: Tratamiento para algún
d) Apóyese en las tablas de distribución F para aceptar o rechazar la hipótesis. Como Fcritica < F0 entonces H0 se rechaza.
Es decir que SI existe diferencia significativa entre los tratamientos. Fuente de
variación
S. de cuadrados
G. de
libertad C. medio Razón F0 Valor-p F critica
Tratamiento 600 2 600/2= 300 4.8 ¿? F2,8=4.46
Bloque 850 4 850/4= 212.5 3.4 ¿? F4,8=3.84
Error 500 ( )( )
8 500/8=62.5
e) Con apoyo de un software obtenga el valor-p para cada caso. Interprete los resultados.
5. (6) Aunque en el análisis de varianza para un diseño en bloques completos al azar también se puede probar la hipótesis sobre si hay diferencia entre los bloques, se dice que esta hipótesis se debe ver con ciertas reservas. Explique por qué.
Porque ésta no es una prueba F exacta, sino aproximada, debido a la restricción de aleatorización (sólo se aleatoriza dentro del bloque no de manera completa a causa de que no es práctico e incluso imposible aleatorizar totalmente dada la existencias de los bloques). Sin embargo, en la práctica se recomienda su interpretación porque es evidencia en favor o en contra de que valió la pena el esfuerzo de controlar el factor de bloque. Si resulta significativa significa que el factor de bloque si tiene influencia sobre la variable respuesta, y debe ser tomado en cuenta para mejorar la calidad de ésta.
6. (7) Explique por qué se utiliza el adjetivo azar en el nombre del diseño en bloques completos al azar.
Porque aunque es imposible aleatorizar de bloque a bloque, si se aleatoriza dentro del mismo bloque, y también se aleatorizan los tratamientos. La imposibilidad de aleatorizar de bloque a bloque se aprecia claramente cuando se bloquean factores como día o turno, ya que no tiene sentido pensar en seleccionar al azar el orden de los días o los turnos porque es imposible regresar en el tiempo.
7. (10) Se hace un estudio sobre la efectividad de tres maracas de atomizador para matar moscas. Para ello cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hicieron seis réplicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta fuente de variación. Los datos obtenidos se muestran a continuación:
Marca de atomizador
Número de réplica (día)
1 2 3 4 5 6
1 72 65 67 75 62 73
2 55 59 68 70 53 50
3 64 74 61 58 51 69
Modelo: { } Hipótesis: Tratamiento para algún
b) ¿Existe diferencia entre la efectividad promedio de los atomizadores?
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 6 414 69 26 Fila 2 6 355 59.1666667 66.9666667 Fila 3 6 377 62.8333333 66.1666667 Columna 1 3 191 63.6666667 72.3333333 Columna 2 3 198 66 57 Columna 3 3 196 65.3333333 14.3333333 Columna 4 3 203 67.6666667 76.3333333 Columna 5 3 166 55.3333333 34.3333333 Columna 6 3 192 64 151 ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F Tratamiento 296.333333 2 148.166667 2.88075178 0.10280442 4.10282102 Bloques 281.333333 5 56.2666667 1.09397278 0.42071775 3.32583453 Error 514.333333 10 51.4333333 Total 1092 17
Como entonces se acepta, es decir que no existe diferencia significativa entre los atomizadores para matar moscas.
c) ¿Hay algún atomizador mejor? Argumente su respuesta.
En base al análisis anterior se concluye que no existe diferencia significativa entre los atomizadores. Entonces no hay ningún atomizador mejor
d) ¿Hay diferencias significativas en los resultados de diferentes días en qué se realizó el experimento? Argumente su respuesta.
Hipótesis: Bloques
para algún
Como entonces se acepta, es decir que no existe diferencia significativa entre los bloques, es decir, los días en que se realizó la prueba.
e) Verifique los supuestos de normalidad y de igual varianza entre las maracas.
Normalidad ( ) [∑ ( ) ] i Datos en orden Coeficientes
Shapiro-Wilks xn-i+j-xi ai(xn-i+j-xi)
1 50 0.4886 25 12.215
2 51 0.3253 23 7.4819
3 53 0.2553 20 5.106
4 55 0.2027 17 3.4459
6 59 0.1197 10 1.197 7 61 0.0837 7 0.5859 8 62 0.0496 5 0.248 9 64 0.0163 1 0.0163 10 65 Σ 32.2004 11 67 12 68 13 69 14 70 15 72 16 73 17 74 18 75 64.235 Entonces 0.9495 Y de tablas 0.982
Por lo tanto si la hipótesis nula se acepta. Es una distribución normal.
Varianza constante
para algún Dónde: ( )[∑( ) ( ) ] ( ) ∑( ) ∑ ( ) Para tratamiento: si 2 log si 2 26 1.41497335 66.9666667 1.82585868 66.1666667 1.82063926 Σ 159.133333 5.06147129 ( ) 21.2178 ( ) ( )( ) 9.7775 ( )( ) 1.0944 20.571 De tablas 5.991
Por lo tanto, como entonces, la hipótesis nula se rechaza, esto quiere decir que no existe Homocedasticidad en los datos.
Para bloque: Σ si 2 72.3333333 57 14.3333333 76.3333333 34.3333333 151 405.333333 log si 2 1.85933848 1.75587486 1.1563472 1.88271423 1.53571597 2.17897695 10.3689677 ( ) 135.1111 ( ) ( )( ) -19.8845 ( )( ) 1.0178 - 44.9862 De tablas 11.070
Por lo tanto, como entonces, la hipótesis nula se acepta, esto quiere decir que hay homogeneidad de varianza en los datos con respecto a los bloques.
Independencia
El método analítico de comprobar el supuesto de independencia se realiza con la prueba Durbin-Watson. ( ) ∑ ∑( ) ( ) Datos yi ei ei 2 (ei-ei-1) 2 1 72 69.000 -3.00 9.00 2 65 69.000 4.00 16.00 49 3 67 69.000 2.00 4.00 4 4 75 69.000 -6.00 36.00 64 5 62 69.000 7.00 49.00 169 6 73 69.000 -4.00 16.00 121 7 55 59.167 4.17 17.36 66.6944444 8 59 59.167 0.17 0.03 16 9 68 59.167 -8.83 78.03 81 10 70 59.167 -10.83 117.36 4 11 53 59.167 6.17 38.03 289 12 50 59.167 9.17 84.03 9 13 64 62.833 -1.17 1.36 106.777778
14 74 62.833 -11.17 124.69 100 15 61 62.833 1.83 3.36 169 16 58 62.833 4.83 23.36 9 17 51 62.833 11.83 140.03 49 18 69 62.833 -6.17 38.03 324 Σ 795.667 1630.472 2.049
De las tablas obtenemos para p=2, y
Por lo tanto, siendo que se acepta , es decir no existe correlación entre los datos.
8. (12) Se diseñó un experimento para estudiar el rendimiento de cuatro detergentes. Las siguientes lecturas de “blancura” se obtuvieron con un equipo especial diseñado para 12 cargas de lavado, distribuidas en tres modelos de lavadoras:
Detergente Lavadora 1 Lavadora 2 Lavadora 3
A
45 43 51B
47 44 52C
50 49 57a) Señale el nombre del diseño experimental utilizado. Diseño en bloques completos al azar.
{ }
b) Formule la hipótesis que se quiere probar en este problema. Tratamiento: para algún Bloques: para algún
c) Realice el análisis estadístico más apropiado para estos datos y obtenga conclusiones.
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 3 139 46.3333333 17.3333333 Fila 2 3 143 47.6666667 16.3333333 Fila 3 3 156 52 19 Fila 4 3 128 42.6666667 36.3333333 Columna 1 4 184 46 11.3333333 Columna 2 4 173 43.25 24.25 Columna 3 4 209 52.25 11.5833333 ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F Tratamiento 133.666667 3 44.5555556 34.1276596 0.00036333 4.75706266
Bloque 170.166667 2 85.0833333 65.1702128 8.5228E-05 5.14325285
Error 7.83333333 6 1.30555556
Total 311.666667 11
En tratamiento:
Dado que , la hipótesis nula es rechazada, esto quiere decir que si existe diferencia significativa entre los diferentes tipos de detergentes.
En bloque:
Como , la hipótesis nula se rechaza, esto se interpreta en que la lavadora que se utilice si tiene influenza en el resultado del tratamiento (detergente).
9. (15) Un aspecto crítico para que se conserve la leche es la temperatura de almacenamiento. De manera tradicional se han usado termómetros de mercurio (Mer) para verificar que la temperatura sea la adecuada, pero ahora se han comprado termómetros electrónicos (Rtd) para facilitar el proceso de medición. Sin embrago, se duda de las mediciones de estos nuevos dispositivos. Para aclarar dudas y diagnosticar la situación, durante cinco días se toman mediciones con ambos tipos de termómetros en varios silos (a la misma hora). Los datos para cinco silos se muestran a continuación:
Silo Mer Día 1 Rtd Mer Día 2 Rtd Mer Día 3 Rtd Mer Día 4 Rtd Mer Día 5 Rtd
A
4.0 2.6 4.0 2.8 5.0 5.0 0.5 0.0 3.0 2.4B
5.0 6.4 6.0 6.4 2.0 2.3 4.0 4.2 4.0 4.0C
4.5 3.3 4.0 1.4 3.5 1.8 2.0 -1.9 3.0 -7.6D
2.5 3.1 4.0 5.0 6.5 6.6 4.5 2.7 4.0 6.3E
4.0 0.0 4.0 0.4 3.5 0.6 2.0 -4.0 4.0 -6.3a) Observe los datos y establezca una conjetura acerca de la confiabilidad de las mediciones con Rtd (del termómetro de mercurio no hay duda).
A primera vista, si comparamos el termómetro de Mer con el Rtd se aprecian diferencias grandes, incluso el termómetro Rtd marca temperaturas inferiores a 0°C, cosa que nunca sucede con el otro termómetro.
b) Es claro que el silo se puede ver como tratamiento y día como bloque. Considere sólo los datos de Rtd y establezca el modelo estadístico. También haga el ANOVA correspondiente y obtenga conclusiones.
El tipo de análisis sería Diseño en bloques completos al azar (DBCA), cuyo modelo es:
{ } Hipótesis: Tratamiento: para algún Bloques: para algún
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 5 12.8 2.56 3.148 Fila 2 5 23.3 4.66 3.068 Fila 3 5 -3 -0.6 18.915 Fila 4 5 23.7 4.74 3.203 Fila 5 5 -9.3 -1.86 9.728 Columna 1 5 15.4 3.08 5.197 Columna 2 5 16 3.2 6.18 Columna 3 5 16.3 3.26 6.078 Columna 4 5 1 0.2 11.085 Columna 5 5 -1.2 -0.24 39.653
ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F Filas 182.532 4 45.633 8.09095745 0.00091159 3.00691728 Columnas 62.008 4 15.502 2.74858156 0.06486529 3.00691728 Error 90.24 16 5.64 Total 334.78 24 En tratamiento:
Dado que , la hipótesis se rechaza, esto significa que la temperatura en los silos es diferente.
En bloque:
Como , la hipótesis nula se acepta, esto se interpreta en que el día no tiene un efecto en la medición de la temperatura.
c) Repita el inciso anterior pero ahora para las mediciones Mer.
El tipo de análisis sería Diseño en bloques completos al azar (DBCA), cuyo modelo es:
{ } Hipótesis: Tratamiento: para algún Bloques: para algún
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 5 16.5 3.3 2.95 Fila 2 5 21 4.2 2.2 Fila 3 5 17 3.4 0.925 Fila 4 5 21.5 4.3 2.075 Fila 5 5 17.5 3.5 0.75 Columna 1 5 20 4 0.875 Columna 2 5 22 4.4 0.8 Columna 3 5 20.5 4.1 2.925 Columna 4 5 13 2.6 2.675 Columna 5 5 18 3.6 0.3 ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F Filas 4.46 4 1.115 0.69040248 0.60921239 3.00691728 Columnas 9.76 4 2.44 1.51083591 0.24602212 3.00691728 Error 25.84 16 1.615 Total 40.06 24 En tratamiento:
Dado que , la hipótesis se acepta, esto significa que la temperatura en los silos no es diferente.
En bloque:
Como , la hipótesis nula se acepta, esto se interpreta en que el día no tiene un efecto en la medición de la temperatura.
d) ¿Las conclusiones obtenidas en los incisos anteriores coinciden? Comente su respuesta.
No las conclusiones con respecto a los tratamientos (silos) fue distinta, en el caso del termómetro Rtd había variación en los silos; mientras que con el termómetro Mer, eso no se detectó, los silos
eran estadísticamente iguales. Esto quiere decir que los termómetros son distintos entre sí, ya que muestran conclusiones diferentes.
e) Datos pareados. Para comprara los dos métodos de medición (Mer y Rtd) obtenga como variable de respuesta a la diferencia de temperaturas que registran los métodos para cada día en cada silo. Considerando esto, establezca el modelo estadístico, haga el ANOVA correspondiente y obtenga conclusiones.
Para |MER-RTD|
Silo Día 1 Día 2 Día 3 Día 4 Día 5
Dif. Dif. Dif. Dif. Dif.
A
1.4 1.2 0 0.5 0.6B
1.4 0.4 0.3 0.2 0C
1.2 2.6 1.7 3.9 10.6D
0.6 1 0.1 1.8 2.3E
4 3.6 2.9 6 10.3El tipo de análisis sería Diseño en bloques completos al azar (DBCA), cuyo modelo es:
{ } Hipótesis: Tratamiento: para algún Bloques: para algún
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 5 3.7 0.74 0.318 Fila 2 5 2.3 0.46 0.298 Fila 3 5 20 4 14.665 Fila 4 5 5.8 1.16 0.793 Fila 5 5 26.8 5.36 8.953 Columna 1 5 8.6 1.72 1.732 Columna 2 5 8.8 1.76 1.708 Columna 3 5 5 1 1.6 Columna 4 5 12.4 2.48 5.997 Columna 5 5 23.8 4.76 27.703 ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F Filas 96.8136 4 24.2034 6.65998927 0.00235744 3.00691728 Columnas 41.9616 4 10.4904 2.88661723 0.05639643 3.00691728 Error 58.1464 16 3.63415 Total 196.9216 24 En tratamiento:
Dado que , la hipótesis nula se rechaza esto se interpreta en que, la diferencia entre las temperaturas de los termómetros, en los silos es diferente, es decir, hay diferencias entre cada tratamiento.
En bloque:
Como , la hipótesis nula se acepta, esto se interpreta en que el día no tiene un efecto en la medición de la temperatura.
En conclusión, se puede inferir por los resultados en los incisos anteriores, que el termómetro Rtd es diferente al termómetro Mer, y considerando que sobre éste último no hay duda de su funcionamiento, entonces, el termómetro Rtd, está dañado y no registra las temperaturas correctas.
10. (16) Se requiere estudiar el efecto de cinco catalizadores diferentes (A, B, C, D y E) sobre el
tiempo de reacción
de un proceso químico. Cada lote de material sólo permite cinco corridas y cada corrida requiere aproximadamente 1.5 horas, por lo que sólo se pueden realizar cinco corridas diarias. El experimentador decide correr los experimentos con un diseño en cuadro latino para controlar activamente a loslotes
ydías
. Los datos obtenidos son:Día
1 2 3 4 5
Lote 1 A=8 B=7 D=1 C=7 E=3
2 C=11 E=2 A=7 D=3 B=8
3 B=4 A=9 C=10 E=1 D=5
4 D=6 C=8 E=6 B=6 A=10
5 E=4 D=2 B=3 A=8 C=8
a) ¿Cómo se aleatorizó el experimento?
Primero se construyó el cuadro latino estándar, y después se aleatoriza el orden de los renglones, y después el de las columnas. La regla fundamental es que cada letra debe aparecer sólo una vez en cada renglón y en cada columna.
b) Anote la ecuación del modelo y las hipótesis estadísticas correspondientes. El tipo de análisis es Diseño en cuadro latino (DCL), cuyo modelo es:
Hipótesis: Tratamiento: para algún Bloque 1: para algún
Bloque 2:
para algún
c) ¿Existen diferencias entre los tratamientos? ¿Cuáles tratamientos son diferentes entre sí?
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 5 26 5.2 9.2 Fila 2 5 31 6.2 13.7 Fila 3 5 29 5.8 13.7 Fila 4 5 36 7.2 3.2 Fila 5 5 25 5 8 Columna 1 5 33 6.6 8.8 Columna 2 5 28 5.6 11.3 Columna 3 5 27 5.4 12.3 Columna 4 5 25 5 8.5 Columna 5 5 34 6.8 7.7 sA= 5 42 8.4 1.3 sB= 5 28 5.6 4.3 sC= 5 44 8.8 2.7 sD= 5 17 3.4 4.3 sE= 5 16 3.2 3.7 ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Valor crítico para F Tratamiento 141.44 4 35.36 11.3092 3.26 Días (B1) 12.24 4 3.06 0.9787 3.26 Lotes (B2) 15.44 4 3.86 1.2345 3.26 Error 37.52 12 3.1267 Total 206.64 24
En tratamiento:
Dado que , la hipótesis nula se rechaza, es decir, los tratamientos (catalizadores) son diferentes entre sí.
En bloque 1:
Como , la hipótesis nula se acepta, es decir, en que el día no tiene un efecto en los catalizadores.
En bloque 2:
Como , la hipótesis nula se acepta, es decir, que el número de lote no tiene eecto sobre el catalizador.
d) ¿Los factores de ruido, lote y día afectan el tiempo de reacción del proceso?
No, lo efectos de ruido (lote y día) no tienen influencia significativa sobre la reacción del procesos (catalizadores), es decir no influyen en los resultados de los tratamientos.
e) Dibuje los gráficos de medias para los tratamientos, los lotes y los días. ¿Cuál tratamiento es mejor?
Hipótesis: ⁄ ( )( )√ ⁄ ( )( ) 2.1788128 3.12667 √ ( ) 2.4366
Utilizando LSD µi-µj LSD H0 µA µB 2.8 > 2.43663628 µA µC 0.4 < 2.43663628 µA µD 5 > 2.43663628 µA µE 5.2 > 2.43663628 µB µC 3.2 > 2.43663628 µB µD 2.2 < 2.43663628 µB µE 2.4 < 2.43663628 µC µD 5.4 > 2.43663628 µC µE 5.6 > 2.43663628 µD µE 0.2 < 2.43663628
En base a esta comparación los catalizadores E, D y B son estadísticamente iguales y los que resultan mejores, ya que el tempo de reacción es menor.
f) Verifique los supuestos del modelo, considerando que los datos se obtuvieron columna por columna, día por día.
Normalidad ( ) [∑ ( ) ] i yij ai xn-i+1-xi ai(xn-i+1-xi) 1 1 0.4450 24 10.6800 2 1 0.3069 23 7.0587 3 2 0.2543 21 5.3403 4 2 0.2148 20 4.2960 5 3 0.1822 18 3.2796
8.61
Entonces 7.3802 Y de tablas 0.985
Por lo tanto si la hipótesis nula se rechaza. Estos datos no provienen de una distribución normal. 6 3 0.1539 17 2.6163 7 3 0.1283 16 2.0528 8 4 0.1046 14 1.4644 9 4 0.0823 13 1.0699 10 5 0.0610 11 0.6710 11 6 0.0403 9 0.3627 12 6 0.0200 8 0.1600 13 6 0.0000 7 0.0000 14 7 Σ 39.0517 15 7 16 7 17 8 18 8 19 8 20 8 21 8 22 9 23 10 24 10 25 11
Varianza constante
Como los datos no tienen una distribución normal se utiliza el estadístico de Levine.
Para tratamiento:
para algún
Desviaciones de cada valor respecto a la media (tratamiento)
0.4 1.4 1.8 2.4 0.2
1.4 2.4 2.2 0.4 1.2
0.6 1.6 1.2 1.6 2.2
1.6 0.4 0.8 2.6 2.8
0.4 2.6 0.8 1.4 0.8
Análisis de varianza de un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 5 4.4 0.88 0.332 Columna 2 5 8.4 1.68 0.772 Columna 3 5 6.8 1.36 0.388 Columna 4 5 8.4 1.68 0.772 Columna 5 5 7.2 1.44 1.108 ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F Tratamientos 2.1504 4 0.5376 0.797 0.54104084 2.8660814 Error 13.488 20 0.6744 Total 15.6384 24
Por lo tanto si la hipótesis nula se acepta. Por lo tanto si existe homogeneidad de varianza con respecto a los tratamientos.
Para bloque 1 (Días):
para algún
Desviaciones de cada valor respecto a la media (Días)
1.4 1.4 4.4 2.0 3.8
4.4 3.6 1.6 2.0 1.2
2.6 3.4 4.6 4.0 1.8
0.6 2.4 0.6 1.0 3.2
2.6 3.6 2.4 3.0 1.2
Análisis de varianza de un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Columna 1 5 11.6 2.32 2.072
Columna 2 5 14.4 2.88 0.932
Columna 3 5 13.6 2.72 3.052
Columna 4 5 12 2.4 1.3
ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F Entre grupos 1.5104 4 0.3776 0.21493625 0.92702704 2.8660814 Dentro de los grupos 35.136 20 1.7568 Total 36.6464 24
Por lo tanto si la hipótesis nula se acepta. Por lo tanto si existe homogeneidad de varianza con respecto al día.
Para bloque 2 (Lotes):
para algún
Desviaciones de cada valor con respecto a la media (Lotes)
2.8 1.8 4.2 1.8 2.2
4.8 4.2 0.8 3.2 1.8
1.8 3.2 4.2 4.8 0.8
1.2 0.8 1.2 1.2 2.8
Análisis de varianza de un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza
Fila 1 5 12.8 2.56 1.008 Fila 2 5 14.8 2.96 2.748 Fila 3 5 14.8 2.96 2.748 Fila 4 5 7.2 1.44 0.608 Fila 5 5 12 2.4 0.8 ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F Entre grupos 7.7696 4 1.9424 1.22750253 0.33073341 2.8660814 Dentro de los grupos 31.648 20 1.5824 Total 39.4176 24
Por lo tanto como la hipótesis nula se acepta. Por lo tanto si existe homogeneidad de varianza con respecto a los lotes.
Independencia
El método analítico de comprobar el supuesto de independencia se realiza con la prueba Durbin-Watson. ( ) ∑ ( ) ∑ ( ) Datos yi ei ei 2 (ei-ei-1) 2 8 8.4 0.40 0.16 9 8.4 -0.60 0.36 1.0 7 8.4 1.40 1.96 4.0 8 8.4 0.40 0.16 1.0 10 8.4 -1.60 2.56 4.0 4 5.6 1.60 2.56 10.2 7 5.6 -1.40 1.96 9.0 3 5.6 2.60 6.76 16.0 6 5.6 -0.40 0.16 9.0 8 5.6 -2.40 5.76 4.0 11 8.8 -2.20 4.84 0.0 8 8.8 0.80 0.64 9.0 10 8.8 -1.20 1.44 4.0 7 8.8 1.80 3.24 9.0 8 8.8 0.80 0.64 1.0 6 3.4 -2.60 6.76 11.6 2 3.4 1.40 1.96 16.0 1 3.4 2.40 5.76 1.0 3 3.4 0.40 0.16 4.0 5 3.4 -1.60 2.56 4.0 4 3.2 -0.80 0.64 0.6 2 3.2 1.20 1.44 4.0 6 3.2 -2.80 7.84 16.0 1 3.2 2.20 4.84 25.0 3 3.2 0.20 0.04 4.0 Σ 65.200 167.480 2.5687
Por lo tanto, siendo que se acepta , es decir no existe correlación entre los datos.
11. (21) Se quieren comparar tres dietas (A, B, C) a base de proteínas de origen vegetal utilizando 18 ratas de laboratorio de una misma camada. Primero se observa por un tiempo el apetito para formar tres grupos de seis ratas, según su voracidad; y cada uno de estos grupos se clasifica a su vez en tres grupos de dos ratas, de acuerdo a su peso inicial. Se plantea un experimento donde la variable de respuesta es el peso en gramos ganado por las ratas después de cierto período, con los siguientes resultados:
Apetito/ Peso inicial A1 A2 A3 P1 67 (C) 105 (A) 95 (B) 72 112 86 P2 85 (A) 75 (B) 88 (C) 98 67 110 P3 66 (B) 68 (C) 108 (A) 47 91 120
a) Analice los datos. ¿Cuáles factores influyen en el peso ganado por las ratas? El tipo de análisis es Diseño en cuadro latino (DCL), cuyo modelo es:
Hipótesis: Tratamiento: para algún Bloque 1: para algún Bloque 2: para algún
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
A 3 628 209.333333 550.333333 B 3 436 145.333333 1164.33333 C 3 496 165.333333 900.333333 Fila 1 3 537 179 1524 Fila 2 3 523 174.333333 840.333333 Fila 3 3 500 166.666667 3350.33333 Columna 1 3 435 145 1252 Columna 2 3 518 172.666667 1546.33333 Columna 3 3 607 202.333333 566.333333
ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Valor crítico para F Tratamiento 6432 2 3216 99.4639175 6.94427191 Peso inicial (B1) 232.666667 2 116.333333 3.59793814 6.94427191 Voracidad (B2) 4932.66667 2 2466.33333 76.2783505 6.94427191 Error 64.6666667 2 32.3333333 Total 11662 8 En tratamiento:
Dado que , la hipótesis nula se rechaza, es decir, los tratamientos (dietas) son diferentes entre sí.
En bloque 1:
Como , la hipótesis nula se acepta, es decir, que el peso inicial no tiene un efecto en el resultado.
En bloque 2:
Como , la hipótesis nula se rechaza, es decir, que la voracidad de las ratas si es un factor que influye en los resultados.
b) ¿Cuál dieta es mejor?
Utilizando LSD
µi-µj LSD H0
µA µB 64 > 19.9763391
µA µC 44 > 19.9763391
µB µC 20 > 19.9763391
Por lo tanto, se puede concluir que la dieta B es la mejor, ya que el incremento de peso es el menor.
c) ¿Alguno de los factores de bloque puede ser ignorado? Argumente su respuesta. Como el peso inicial no tiene influencia en los resultados, este factor de bloque puede ser ignorado.
d) Si ése fuera el caso, analice de nuevo el experimento y saque conclusiones. Hipótesis: Tratamiento: para algún Bloques para algún
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 3 628 209.333333 550.333333 Fila 2 3 436 145.333333 1164.33333 Fila 3 3 496 165.333333 900.333333 Columna 1 3 435 145 1252 Columna 2 3 518 172.666667 1546.33333 Columna 3 3 607 202.333333 566.333333 ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Probabilidad Valor crítico para F Filas 6432 2 3216 43.264574 0.00195228 6.94427191 Columnas 4932.66667 2 2466.33333 33.1793722 0.00323209 6.94427191 Error 297.333333 4 74.3333333 Total 11662 8
En tratamiento:
Dado que , la hipótesis nula se rechaza, es decir, los tratamientos (dietas) son diferentes entre sí.
En bloque:
Como , la hipótesis nula se rechaza, es decir, que él apetito si influye en el resultado. Es decir los resultados siguen siendo los mismos.
e) Verifique los supuestos del modelo.
Normalidad ( ) [∑ ( ) ] i Datos en orden Coeficientes Shapiro-Wilks xn-i+j-xi ai(xn-i+j-xi) 1 50 0.5888 14 8.2432 2 51 0.3244 11 3.5684 3 53 0.1976 8 1.5808 4 55 0.0947 4 0.3788 5 58 Σ 13.7712 6 59 7 61 8 62 9 64 3680.125 Entonces 0.00644 Y de tablas 0.978
Por lo tanto si la hipótesis nula se acepta. Estos dato provienen de una distribución normal.
Varianza constante
Como los datos tienen una distribución normal se utiliza el estadístico de Bartlett. para algún Dónde: ( )[∑( ) ( ) ] ( ) ∑( ) ∑ ( )
Para tratamiento: si 2 log si 2 550.333333 2.74062582 1164.33333 3.06607733 900.333333 2.95440333 Σ 2615 8.76110648 sp 2 = 871.666667 log sp 2 = 2.94035044 q= -5212.3579 c= 1.05555556 χ2= -11370.2924 De tablas 5.991
Por lo tanto, como entonces, la hipótesis nula se rechaza, esto quiere decir que no existe Homocedasticidad en los datos.
Para bloque: Σ si 2 1252 1546.33333 566.333333 3364.66667 log si 2 3.09760433 3.18930312 2.75307212 9.03997957
sp 2 = 1121.55556 log sp 2 = 3.04982079 q= 0.2189656 c= 1.11111111 χ2 = 0.45377118 De tablas 5.991
Por lo tanto, como entonces, la hipótesis nula se acepta, esto quiere decir que hay homogeneidad de varianza en los datos con respecto a los bloques.
Independencia
El método analítico de comprobar el supuesto de independencia se realiza con la prueba Durbin-Watson. ( ) ∑ ( ) ∑ ( ) independencia Datos yi ei ei 2 (ei-ei-1) 2 1 183 209.333333 -26.33 693.44 2 217 209.333333 7.67 58.78 1156 3 228 209.333333 18.67 348.44 121
4 113 145.333333 -32.33 1045.44 2601 5 142 145.333333 -3.33 11.11 841 6 181 145.333333 35.67 1272.11 1521 7 139 165.333333 -26.33 693.44 3844 8 159 165.333333 -6.33 40.11 400 9 198 165.333333 32.67 1067.11 1521 Σ 5230.000 12005.000 2.2954
De las tablas no viene el valor correspondiente, para y , por lo tanto, no se pudo concluir el método analítico.
Gráficamente: en base al valor de se puede concluir que no hay correlación entre los datos.
12. (23) Un investigador está interesado en el efecto del porcentaje de lisina y del porcentaje de proteína en la producción de vacas lecheras. Se consideran siete niveles en cada factor.
% de lisina: 0.0
(A)
, 0.1(B)
, 0.2(C)
, 0.3(D)
, 0.4(E)
, 0.5(F)
, 0.6(G)
. % de proteína: 2(α)
, 4(β)
, 6(χ)
, 8(δ)
, 10(ε)
, 12(φ)
, 14(γ)
.Para el estudio se seleccionan siete vacas al azar, a las cuales se les da un seguimiento de siete períodos de tres meses. Los datos en galones de leche fueron los siguientes:
Vaca/ período 1 2 3 4 5 6 7 1 304 436 350 504 417 519 432 (Aα) (Bε) (Cβ) (Dφ) (Eχ) (Fγ) (Gδ) 2 381 505 425 564 494 350 413 (Bβ) (Cφ) (Dχ) (Eγ) (Fδ) (Gα) (Aε) 3 432 566 479 357 461 340 502 (Cχ) (Dγ) (Eδ) (Fα) (Gε) (Aβ) (Bφ) 4 442 372 536 366 495 425 507 (Dδ) (Eα) (Fε) (Gβ) (Aφ) (Bχ) (Cγ) 5 496 449 493 345 509 481 380 (Eε) (Fβ) (Gφ) (Aχ) (Bγ) (Cδ) (Dα) 6 534 421 352 427 346 478 397 (Fφ) (Gχ) (Aγ) (Bδ) (Cα) (Dε) (Eβ) 7 543 386 435 485 406 554 410 (Gγ) (Aδ) (Bα) (Cε) (Dβ) (Eφ) (Fχ)
a) Analice este experimento. ¿Qué factores tienen efecto en la producción de leche? Se utiliza un análisis de diseño en cuadro greco-latino (DCGL)
Modelo: Hipótesis: % Lisina: para algún % Proteína: para algún Vaca: para algún
Período: para algún α Β Χ δ Ε φ γ A 304 340 345 386 413 495 352 B 435 381 425 427 436 502 509 C 346 350 432 481 485 505 507 D 380 406 425 442 478 504 566 E 372 397 417 479 496 554 564 F 357 449 410 494 536 534 519 G 350 366 421 432 461 493 543
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 7 2635 376.428571 3940.95238 Fila 2 7 3115 445 2057.66667 Fila 3 7 3106 443.714286 4887.2381 Fila 4 7 3201 457.285714 4051.57143 Fila 5 7 3279 468.428571 5728.95238 Fila 6 7 3299 471.285714 4704.57143 Fila 7 7 3066 438 4638.66667 Columna 1 7 2544 363.428571 1587.95238 Columna 2 7 2689 384.142857 1383.80952 Columna 3 7 2875 410.714286 887.571429 Columna 4 7 3141 448.714286 1456.57143 Columna 5 7 3305 472.142857 1629.14286 Columna 6 7 3587 512.428571 518.285714 Columna 7 7 3560 508.571429 5363.61905
Vaca/ período 1 2 3 4 5 6 7 1 304 436 350 504 417 519 432 2 381 505 425 564 494 350 413 3 432 566 479 357 461 340 502 4 442 372 536 366 495 425 507 5 496 449 493 345 509 481 380 6 534 421 352 427 346 478 397 7 543 386 435 485 406 554 410
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN Cuenta Suma Promedio Varianza
Fila 1 7 2962 423.142857 5925.47619 Fila 2 7 3132 447.428571 5777.61905 Fila 3 7 3137 448.142857 6361.80952 Fila 4 7 3143 449 4415.33333 Fila 5 7 3153 450.428571 4055.28571 Fila 6 7 2955 422.142857 4501.14286 Fila 7 7 3219 459.857143 4644.47619 Columna 1 7 3132 447.428571 7373.28571 Columna 2 7 3135 447.857143 4611.14286 Columna 3 7 3070 438.571429 4937.61905 Columna 4 7 3048 435.428571 7151.61905 Columna 5 7 3128 446.857143 3555.80952 Columna 6 7 3147 449.571429 6674.28571 Columna 7 7 3041 434.428571 2542.95238 ANÁLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados F Valor crítico para F % Lisina 42783.551 6 7130.5918 7.2322 2.51 %Proteína 145879.551 6 24313.2585 24.6598 2.51 Vaca 8754.408 6 1459.0680 1.4799 2.51 Período 1760.980 6 293.4966 0.2977 2.51 Error 23662.776 24 985.9490
Total 222841.265 48
En %Lisina:
Dado que , la hipótesis nula se rechaza, es decir, el porcentaje de lisina no es igual para cada nivel, es decir, si tiene un efecto significativo.
En % Proteína:
Como , , la hipótesis nula se rechaza, lo que significa que, el porcentaje de proteína si tiene un efecto en la producción de vacas lecheras.
Vaca:
Como , la hipótesis nula se acepta, es decir, que la vaca (que vaca es) no es un factor que influye en los resultados.
Período:
Como , la hipótesis nula se acepta, es decir, que el período tampoco es un factor que influye en los resultados.
c) ¿Cómo puede explicar la falta de efectos en vacas y período? Estos factores que no influyen en la producción de las vacas.
d) ¿Qué porcentajes de lisina y proteína dan los mejores resultados? Utilizando diferencias mínimas significativas
Utilizando LSD µi-µj LSD H0 1 µA µB 68.571 > 33.872 2 µA µC 67.286 > 33.872 3 µA µD 80.857 > 33.872 4 µA µE 92.000 > 33.872 5 µA µF 94.857 > 33.872 6 µA µG 61.571 > 33.872 7 µB µC 1.286 < 33.872 8 µB µD 12.286 < 33.872 9 µB µE 23.429 < 33.872 10 µB µF 26.286 < 33.872 11 µB µG 7.000 < 33.872 12 µC µD 13.571 < 33.872 13 µC µE 24.714 < 33.872 14 µC µF 27.571 < 33.872 15 µC µG 5.714 < 33.872 16 µD µE 11.143 < 33.872 17 µD µF 14.000 < 33.872 18 µD µG 19.286 < 33.872 19 µE µF 2.857 < 33.872 20 µE µG 30.429 < 33.872 21 µF µG 33.286 < 33.872
Entonces se concluye que el porcentaje de lisina A es el que proporciona menor producción de las vacas, pero el resto son significativamente iguales.
e) Verifique los supuestos del modelo.
Normalidad
II. Problemas marcados con asterisco
1. (2) Un equipo de especialistas en remotivación, en un hospital psiquiátrico,
condujo un experimento para comprobar cinco métodos para remotivar a
los pacientes. Estos fueron agrupados de acuerdo con el nivel de motivación
inicial. En cada grupo, los pacientes fueron asignados al azar a los cinco
métodos. Al final del periodo experimental, un equipo de trabajo formado
por un psiquiatra, un psicólogo, una enfermera y un trabajador social
evaluaron a los pacientes. Ningún miembro del equipo de evaluación sabia
de los métodos que fueron asignados a los pacientes. El equipo asignó a
cada paciente una calificación como medida de su nivel de motivación. Los
resultados fueron los siguientes:
Nivel de
motivación inicial
Método de motivación
A
B
C
D
E
Nulo
58
68
60
68
64
Muy bajo
62
70
65
80
69
Bajo
67
78
68
81
70
Promedio
70
81
70
89
74
¿Proporcionan estos datos evidencia suficiente que indique una diferencia
en las calificaciones medias entre los métodos? Sea α = 0.05
2. (3) La enfermera supervisora de un departamento de salud local quería
analizar el efecto de la hora del día en la duración de las visitas domiciliarias
realizadas por el personal de enfermería. Pensaba que las diferencias
individuales entre las enfermeras podían ser grandes, por lo que utilizó a las
enfermeras como un factor de formación de bloques. Recolecto además los
siguientes datos:
Enfermera
Duración de la visita domiciliaria
En la
mañana
A medio
día
Temprano
por la
tarde
Por la
tarde
A
27
28
30
23
B
31
30
27
20
C
35
38
34
30
D
20
18
20
14
¿Proporcionan estos datos evidencia suficiente para indicar una diferencia
en la duración de las visitas domiciliarias en las diferentes horas del día? Sea
α = 0.05
3. (5) Se realiza un experimento para investigar el efecto de la temperatura de
secado en granos de trigo con la finalidad de mejorar la calidad en el
horneado para producir pan. Se utilizaron tres niveles de temperatura y la
variable de respuesta medida fue el volumen de la pieza de pan obtenida.
Los datos obtenidos fueron los siguientes:
Temperatura
(°C)
Volumen (cm
3)
70.0
1245
1235
1285
1242
1235
75.0
1235
1240
1200
1220
1210
80.0
1225
1200
1170
1155
1095
a) ¿La temperatura de secado afecta el volumen de pan? Usar un α=0.01
b) Utilizar el método de LSD para determinar la diferencia de medias y cuál es
el tratamiento más adecuado que cumple con los fines de obtener un mayor
volumen.
c) Analizar el cumplimiento de normalidad y homogeneidad de varianzas por
los métodos gráficos y matemáticos.
4.
(9) Un artículo en “Agricultural Engineering” (diciembre 1964, pp672-673)
describe un experimento en el cual el peso ganado diariamente por los
cerdos es evaluado en los diferentes niveles de temperatura de su vivienda.
El peso promedio de cada grupo de cerdos al inicio del experimento es considerado como un factor de ruido. Los datos obtenidos de este experimento se muestran a continuación:Peso (lbs)
Temperatura promedio del aire de la vivienda (°F)
50
60
70
80
90
100
100
1.37
1.58
2.00
1.97
1.40
0.39
150
1.47
1.75
2.16
1.82
1.14
-0.19
a) ¿La temperatura promedio de la vivienda afecta al peso promedio ganado? Usa α=0.05
b) Utiliza el método de LSD de Fisher para determinar qué niveles de temperatura son diferentes.
c) Analiza los residuos de este experimento y haz comentarios sobre la adecuación del modelo.