La suma de cuadrados total es una distancia cuadrática que representa la acumulación de todos los desvíos de cada observación con respecto a su media total (Expresión 2). Esto no es otra cosa que el
numerador de la fórmula de la varianza que conocemos, calculada con respecto a la media total
(Expresión 3).
Suma de cuadrados total: SCTotal =Σ(X −X)2 (Expresión 2)
Varianza poblacional: N X X x 2 2 =Σ( − ) δ (Expresión 3) 4
5 SCTotal = (25 - 37,42)² + (30 - 37,42)² +···+ (15 - 37.42)² = 5201,83
Podemos ayudarnos con una calculadora de funciones estadísticas para obtener este valor de manera muy sencilla. Hagamos un ejemplo con los datos de la Tabla 1. La SCTotal, representa los desvíos de
todos los valores con respecto a la media total, de modo que debemos considerar los 24 valores que obtuvimos en nuestro experimento (cada réplica de cada tratamiento: 25, 30, 38, 32,...17, 15). Para la mayoría de los modelos de CASIO se procede de esta manera. Lo primero y muy importante que hay que hacer es limpiar la memoria estadística de la máquina con el comando <SHIFT> SCL
porque si la han utilizado antes para un cálculo estadístico, los valores permanecerán en memoria incluso si la máquina se apagó. Luego <colocamos> (“ingresamos”) cada dato, presionando la tecla M+ después que cada uno aparece en pantalla.
Cuando todos los datos están ingresados, calculamos la varianza poblacional que es EL CUADRADO del número que se obtiene con la tecla de la desviación estándar poblacional (14,72) y que en las calculadoras CASIO aparece como σn. Una vez que tenemos ese valor (216,74), lo multiplicamos por
N, el número de datos ingresados a la calculadora, en este caso, 24. Con este procedimiento,
obtenemos el número 5201,83 que es la suma de cuadrados total de nuestro ejemplo. También obtenemos el mismo valor si usamos la varianza muestral (tecla σn-1), pero multiplicando el resultado al cuadrado (266,17) por 23 (recordemos que la fórmula de varianza muestral es similar pero dividida por n-1).
La SCHum se obtiene exactamente del mismo modo, pero en lugar de trabajar con los datos de cada
réplica y tratamiento, debemos ingresar las tres medias de humedad (33,9; 45,75 y 32,62). El resultado obtenido con la tecla σn, debemos elevarlo al cuadrado y multiplicarlo por 24. Con este procedimiento, obtenemos el número 838,55 que es el valor de la suma de cuadrados de la humedad. Para calcular la SCTemp ingresamos las cuatro medias de temperatura y procedemos como en el caso
de la SCHum. En nuestro ejemplo, tenemos el valor 1862,64. Para obtener la SCTrat se ingresan las doce
medias de cada tratamiento y se sigue el procedimiento que hemos descrito (siempre multiplicando por el número total de observaciones).
Para calcular la suma de cuadrados del error, basta despejar este término de la Expresión 3, dado que ya hemos calculado los otros dos sumandos. En nuestro ejemplo, tenemos que: SCError = 5201,83 -
5056,83 = 145,00.
SC
Total= SC
Trat+ SC
Error (Expresión 3)Para calcular el valor de la suma de cuadrados de la interacción, utilizamos la Expresión 4 (que se deriva del modelo nulo del ANOVA) y despejamos:
SC
Trat= SC
Temp+ SC
Hum+ SC
Tempx Hum (Expresión 4)SC
Tempx Hum= SC
Trat- SC
Temp- SC
HumLa SCError indica las variaciones “dentro” de cada tratamiento. Nos interesa es determinar si las
variaciones introducidas por la temperatura, humedad e interacción son significativamente más grandes que las que se producen solo por error. Una forma de determinar cuánto más grandes son
las variaciones producidas por cada tratamiento con respecto al error, es dividir las variaciones
producidas por cada uno de los tratamientos entre las variaciones producidas por el error. Sin embargo, esto no puede hacerse directamente con las sumas de cuadrados.
Es lógico pensar, que las sumas de cuadrados representan desvíos acumulados y un valor
valores, solo por el hecho de haber sido el resultado de ‘menos’ términos en la suma. Esto puede enmascarar los efectos que queremos medir. Por ello, hacemos una corrección de cada suma de cuadrado dividiéndola por sus respectivos grados de libertad y al resultado de esta división se le conoce como Cuadrados Medios (CM), que son también los valores que aparecen en la Tabla 1. Los grados de libertad (GL) de la temperatura serán 4 - 1 (generalizando a T-1, donde T es la cantidad de temperaturas distintas utilizadas en el experimento). Los grados de libertad de la variable Humedad se calculan de modo similar: 3 - 1 porque hay 3 porcentajes de humedad, es decir (H-1) siendo H la cantidad de humedades empleadas en el experimento. La interacción tendrá el producto de los GL de ambos tratamientos, es decir (H-1)(T-1). Los GL del error serán (H x T)(n-1) en donde n es el número de réplicas utilizadas en cada caso. La suma de todos estos grados de libertad (Humedad, Temperatura, Interacción y Error) produce los grados de libertad del totales, que corresponden a la expresión (N-1), en donde N es el total de valores obtenidos para la variable dependiente o variable respuesta (suma de todas las réplicas de todos los tratamientos).
En este momento, ya podemos comparar los CM de cada fuente de variación con el CM del error para ver si son significativamente mayores que éste y determinar si el efecto producido por el tratamiento es estadísticamente mayor que el que se produce por error. La forma como lo haremos es dividiendo el CM de cada tratamiento por el CM del error. Este cociente lo llamamos F. Ahora, veamos algo: los CM son también sumas de cuadrados, y el cociente de dos sumas de cuadrados sigue una distribución F
de Fisher, que como recordarán tiene dos parámetros (grados de libertad) que se conocen como ν1 y
ν2. El primero de ellos, es el GL del numerador (la fuente de variación) y el segundo, es siempre el del error. Como lo aprendieron en Bioestadística, pueden determinar las zonas de aceptación y no aceptación de Ho, para α = 0,01 o para α = 0,05 (Figura 2).
Figura 2: Zonas de aceptación y rechazo (no aceptación) de Ho. Aquellos cocientes (F experimentales) que superen el F crítico, indican que la fuente de variación que se está evaluando produce un efecto
significativamente mayor que el que se produce solamente por error. La zona de rechazo aparece sombreada.
Los valores críticos de F obtenidos de las tablas se presentan en la Tabla 3.
α = 0,05 α = 0,01
F3,12 3,49 5,95
F2,12 3,88 6,93
F6,12 3,00 4,82
Tabla 3. Valores críticos de la distribución F de Fisher para los casos planteados.
Es necesario determinar valores críticos de F para cada tratamiento, porque cada tratamiento puede tener distintos grados de libertad. Con estos valores críticos, podemos establecer zonas de aceptación y rechazo de H0 y pueden proceder como ya aprendieron en Bioestadística: si el valor experimental es
mayor que el valor crítico para un dado nivel de significancia, esa fuente de variación tiene un efecto
7
significativo sobre la variable dependiente. Todos los valores de F obtenidos experimentalmente superaron los valores críticos, de modo que los efectos que hemos estudiado son estadísticamente significativos a esos valores de confianza. También podemos observar que el F producido por la temperatura es mayor que el producido por la humedad y éste a su vez es ligeramente mayor que el producido por la interacción, lo cual nos da una idea de su magnitud.