CUARTA UNIDAD: DE LOS RESULTADOS.
CUARTA UNIDAD: DE LOS RESULTADOS
4.2.1. PRUEBAS PARAMÉTRICAS
Los análisis perimétricos se utilizan cuándo: 1) la distribución poblacional de la variable dependiente es normal; 2) el nivel de medición de la variable dependiente es por intervalo o razón; 3) el estudio aborda dos o más poblaciones con varianzas homogéneas. Entre las pruebas estadísticas paramétricas más utilizadas se hallan: coeficiente de correlación de Pearson, prueba ―t‖, análisis de varianza unidireccional, análisis factorial de varianza, análisis de covarianza.
El coeficiente de correlación de Pearson es una prueba estadística para analizar la correlación entre dos variables medidas por intervalos o razón. Se simboliza: ―r‖. Sirve para probar hipótesis correlacionales del tipo ―a mayor X, mayor Y―; ―a mayor X, menor Y‖; ―altos valores de X están asociados con altos valores de Y‖. El coeficiente de correlación de Pearson se calcula a partir de las puntuaciones obtenidas en una misma muestra con dos variables. El coeficiente puede variar de -1 a +1, en donde -1 es una correlación negativa perfecta: ―a mayor X menor Y‖, es decir que cada vez que X aumenta una unidad, Y disminuye una unidad; y, + 1 es una correlación positiva perfecta. El signo indica la dirección de la correlación (positiva o negativa) y el valor numérico, la magnitud de la correlación.
La prueba t sirve para evaluar si las medias de dos grupos difieren significativamente. Se simboliza: ―t‖. Se aplica a hipótesis de de diferencia entre grupos. La comparación se realiza sobre una variable; si hay diferentes variables se efectúan varias pruebas t, una por cada variable. Su aplicación exige un nivel de medición de intervalos o razón.
El valor t resulta de la aplicación de una fórmula que toma en cuenta datos como: media, desviación estándar , error estándar. Para saber si el valor t obtenido es significativo es necesario conocer los grados de libertad y el nivel de significación. Con esos datos, el valor t se compara contra el que le corresponde en una tabla denominada ―tabla de distribución t de Student‖. Si el valor t obtenido es mayor que el que aparece en la tabla se confirma la hipótesis. Por ejemplo, si la hipótesis dice: ―Los jóvenes le atribuyen mayor importancia al atractivo físico en sus relaciones heterosexuales que las jóvenes‖. Y el valor t calculado es 6,698 > 1,645 (valor en la tabla de t Student), al nivel de significación del 0,05, con 245grados de libertad, se acepta la hipótesis de investigación.
El análisis de varianza unidireccional (oneway) sirve para analizar si tres o más grupos difieren significativamente en cuanto a sus medias y varianzas. Se usa con hipótesis de
93
diferencias entre más de dos grupos, que proponen que los grupos difieren significativamente entre si. Involucra una variable independiente y una dependiente. El nivel de medición de la variable independiente debe ser categórica (involucra grupos diferentes por ejemplo religión (católico, musulmán, protestante); puede ser nominal, ordinal, de intervalo o de razón, pero las dos últimas deben reducirse a categorías. La variable dependiente debe ser por intervalos o por razón.
El análisis de varianza unidireccional produce un valor, conocido como F, que compara a los grupos en cuanto a sus puntuaciones intergrupos e intragrupos. Si los grupos difieren entre si, sus puntuaciones varían más de lo que puede variar las puntuaciones entre los integrantes de un mismo grupo. Si tenemos tres familias: a, b, c, cada una integrada por personas distintas, esperamos que los integrantes de una familia se parezcan más entre si de lo que se parece a los miembros de otra familia. Esta misma lógica se aplica a la razón F, que nos indica si las diferencias entre los grupos son mayores que las diferencias intragrupos. Estas diferencias son medidas en términos de varianza, que es una medida de variabilidad alrededor de la media.
En la determinación del valor F se utilizan datos como la media cuadrática, suma de cuadrados entre grupos, grados de libertad entre grupos, suma de cuadrados intragrupos, grados de libertad intragrupos, nivel de significación. Para conocer si el valor de F es o no significativo debe compararse con el valor que aparece en la tabla de distribución F, tomando en cuenta los grados y el nivel de significación escogido. El valor F es significativo cuando es igual o mayor que el de la tabla, lo que quiere decir que los grupos difieren significativamente entre sí, en cuyo caso se acepta la hipótesis de investigación. Por ejemplo, en una investigación con cuatro grupos sobre la hipótesis de investigación: ―Los niños expuestos a demasiada violencia televisiva exhibirán conducta agresiva en sus juegos respecto de los niños que se exponen a contenidos de mediana a baja violencia‖, la razón F resulto significativa. Lo que debe entenderse como diferencias significativas entre las medias de los grupos o, en otras palabras, que el contenido altamente violento tiene efecto sobre la conducta agresiva de los niños en sus juegos. El análisis factorial de varianza (ANOVA) es una prueba estadística para evaluar el efecto de dos o más variables independientes sobre una variable dependiente. Es una extensión del análisis de varianza unidireccional. Evalúa los efectos de cada variable independiente por separado, y los efectos conjuntos de dos o más variables independientes. La variable dependiente debe medirse por intervalos o razón; las variables independientes pueden estar en cualquier nivel de medición, pero expresadas de manera categórica. Se utiliza en diseños experimentales factoriales.
Se somete a análisis estadístico los resultados relativos a la hipótesis ―la similitud de valores, la atracción física y el grado de retroalimentación positiva son factores que inciden en la satisfacción sobre la relación en parejas de novios cuyas edades oscilan entre los 24 y 32 años‖. El análisis concluyo que cada una de las tres variables tenía efecto significativo sobre la satisfacción en la relación; y que también había efectos conjuntos: de la similitud y la atracción (efecto de dos variables independientes), y de la similitud, la atracción y la retroalimentación (efecto de las tres variables). De manera que se aceptó la hipótesis de investigación.
El análisis de covarianza es una prueba estadística que analiza la relación entre una variable dependiente y dos o más independientes, una de las cuales es categórica y la otra continua. La prueba controla el efecto de esta última, denominada covariable, que contamina la relación entre las variables categóricas y las dependientes. También se utiliza este análisis cuando el interés es conocer la relación entre la covariable y la
94
variable dependiente. O, también, si se quiere de información del efecto conjunto, tanto de las variables independientes categóricas como de las covariables.
Para proceder de esta prueba la variable dependiente debe ser medida por intervalo o razón, las variables independientes categóricas pueden serlo en cualquier nivel, y las covariables deben medirse por intervalo o razón. Su interpretación es parecida a la del análisis de varianza. El valor F, producto del análisis de covarianza, se interpreta igual que en el análisis de varianza. Solo que las inferencias y conclusiones se hacen tomando en cuenta que las medidas de la variable dependiente (efecto de la variable independiente categórica) han sido ajustadas removiendo el efecto de la covariable. Supongamos la hipótesis: ―Los trabajadores que reciban retroalimentación verbal sobre su desempeño, tendrán mayor productividad que los trabajadores que reciban retroalimentación por escrito y que los que no reciban ningún tipo de retroalimentación‖. Como el investigador no ha conformado aleatoriamente ninguno de sus tres grupos, no ha controlado el factor ―motivación‖, de manera que pudiera haber en algún grupo gente más motivada que en los otros, lo cual se convierte en un factor de invalidación de los resultados. Para evitar esta situación y conocer los efectos reales de la variable independiente categórica (el tipo de retroalimentación) el alumno decide controlar el efecto de la covariable (motivación), midiéndola antes del inicio del experimento. Al conocer su influencia puede ―quitarla‖ de la variable dependiente.
Una vez realizado el análisis de covarianza se evalúa si F es o no significativa, comparándola con el valor de la tabla de distribución F que le corresponde. Si es igual o mayor, se acepta la hipótesis y si no, se le rechaza. Como en el ejemplo F era menor el valor de la tabla se rechazó la hipótesis de investigación y se aceptó la hipótesis nula. PRUEBAS NO PARAMÉTRICAS
Estadígrafo ―U‖ de Mann Whitney
Según GUILFORD y otros (1984), la prueba estadística U de Mann Whitney es una técnica de inferencia no paramétrica que se utiliza en el estudio del comportamiento de grupos independientes. En este grupo, los sujetos se eligen al azar entre la población y luego se dividen de manera aleatoria en dos o más grupos. Todos los sujetos participan en los grupos de control o experimental. Al analizar los datos se establece una comparación entre los datos de cada grupo para determinar si el azar es una explicación razonable de las diferencias entre los puntajes de los grupos.
La prueba de U de Mann Whitney analiza el grado de separación entre los dos conjuntos de datos provenientes de las muestras.
Este grado de separación se calcula mediante las siguientes fórmulas:
2
1
1 1
S
n
n
T
Aproximación para muestras grandes:
12
1
2
2 1 2 1 2 1
n
n
n
n
n
n
T
Z
c Donde:S=Suma de los rangos de los datos de la muestra 1 T=Número de empates para un rango dado.
95
Prueba no Paramétrica de Rangos de Wilcoxon.
Esta prueba nos permite comparar nuestros datos con una mediana teórica. Cuando tenemos una muestra de parejas de valores, por ejemplo antes y después del tratamiento, que podemos denominar (X1,Y1), (X2,Y2), ... ,(Xn,Yn). De la misma forma, ahora calcularemos las diferencias X1-Y1, X2-Y2, ... , Xn-Yn y las ordenaremos en valor absoluto, asignándoles el rango correspondiente. Calculamos R+ la suma de rangos positivos (cuando Xi es mayor que Yi), y la suma de rangos negativos R-. Ahora la hipótesis nula es que esas diferencias proceden de una distribución simétrica en torno a cero y si fuera cierta los valores de R+ y R- serán parecidos. El estadístico de prueba, T, es la menor de las dos sumas de rangos. Cuando n > 15 la distribución muestral de T bajo el supuesto de que H0 es cierta se aproxima a una normal de parámetros:
4
1
n
n
T
24
1
2
1
2
n
n
n
T
El estadístico de prueba es el valor Z: T
T
T
Z
que se distribuye según una normal tipificada.
Prueba no Paramétrica de Dócima de Kolmogorov-Smirnov para Dos Grupos
Esta prueba de bondad de ajuste se aplica para datos continuos por lo tanto la escala de medida debe ser al menos ordinal. Cuando esta prueba se aplica para una muestra lo que interesa es averiguar si la distribución acumulada observada se aproxima a una función de distribución hipotética.
x
F
x
Sn
Sup
D
x
n
0
Los análisis no perimétricos pueden efectuarse con distribuciones no normales y con variables medidas en cualquier nivel. Entre las pruebas paramétricas más conocidas tenemos la Ji cuadrada y los coeficientes de correlación por rangos ordenados de Spearman y Kendall.