Análisis complementarios y verificación de la validez

CAPÍTULO I. FUNDAMENTACIÓN TEÓRICA

1.7. Fases en el proceso de construcción de una escala de actitudes

1.7.6. Análisis complementarios y verificación de la validez

Carretero-Dios y Pérez (2005) señalan que antes de la aplicación del análisis factorial exploratorio es necesario comprobar que hay relación entre los ítems, es decir, que haya agrupaciones relevantes entre ellos. Para comprobar esta pertinencia del AFE,

se emplean las pruebas de KMO (Kaiser-Meyer-Olkin) y el test de Barlett, recomendándose el cálculo de ambas pruebas por Cortina (1993).

El índice KMO compara los coeficientes de correlación de Pearson con la correlación parcial entre variables. Si la suma de los coeficientes de correlación parcial al cuadrado es muy pequeña, el índice KMO tendrá un valor muy próximo a uno, y, por lo tanto, el análisis factorial exploratorio es pertinente. Los valores de KMO que han presentado autores como el propio Kaiser (1974, en Visauta, 1998) reflejan que aquellos que son superiores a 0,70 son considerados aceptables, y aquellos inferiores a 0,50 son considerados inaceptables o muy malos.

El test de Barlett se utiliza para verificar si la matriz de correlaciones es igual a la de identidad, es decir, que todos los coeficientes de la diagonal son iguales a la unidad y los externos a ella iguales a cero. En el caso de obtener un nivel de significación menor de 0,05 en el test de Barlett se podrá pensar que la matriz de correlaciones no es identitaria, y que por lo tanto el análisis factorial exploratorio es pertinente.

Cuando se construye un nuevo instrumento, como una escala de actitudes, hay que tener en cuenta además la validez del instrumento (Morales et al., 2003). La validez se define por Fontes de Gracia, García Gallego, Garriga, Pérez-Llantada y Sarriá (2008, p.173) como “el grado de confianza que puede adoptarse respecto a la veracidad de los resultados obtenidos en una investigación concreta”.

Realizando los análisis de validación se pretende confirmar el significado previsto de la actitud que queremos medir, es decir, que queremos medir ese constructo y no otro. Este tipo de validez se denomina validez de constructo, y pueden utilizarse dos tipos de estrategias para comprobar hipótesis basadas en el mismo resultado:

 Validez convergente: comprobando relaciones esperadas y plausibles con otras medidas u otros test que supuestamente miden lo mismo.

 Validez divergente: comprobando que el rasgo o constructo no tiene relación con otros con los que no esperamos que la tenga, o que se diferencia de otros constructos del mismo ámbito.

La validez de constructo puede verse amenazada por dos causas: bien porque los constructos teóricos en los que se basa la investigación no han sido definidos de forma correcta, por lo que las variables no están preparadas para ser medidas y manipuladas; o bien, porque no se examinan empíricamente las interrelaciones existentes entre

La validez de contenido, viene siendo estudiada como una parte integrante de la validez de constructo, y se entiende como la evidencia de que la definición semántica quedó bien recogida en los ítems formulados (Carretero-Dios y Pérez, 2005). Como señala Sireci (1998) el propósito es proporcionar evidencias a favor de que los ítems construidos son relevantes para el constructo y representan adecuadamente a cada uno de los componentes propuestos en la definición semántica

A diferencia de otros tipos de validez, no puede ser expresada cuantitativamente, a través de un índice o coeficiente; ella es más bien una cuestión de juicio. Es decir, la validez de contenido, por lo general, se estima de manera subjetiva o intersubjetiva (aunque también se aplican análisis matemáticos, como se verá en la página siguiente). El procedimiento más comúnmente empleado para determinar la validez de contenido, es el que se conoce con el nombre de juicios de expertos (Crocker y Algina, 1986; Osterlind, 1989), para lo cual se procede de la siguiente manera:

1. Se seleccionan al menos dos jueces o expertos con el fin de juzgarlos ítems del instrumentode manera independiente, en términos de la relevancia o congruencia de: los reactivos con el universo de contenido, la claridad en la redacción y la tendenciosidad o sesgo en la formulación de los ítems.

2. Cada experto recibe suficiente información escrita acerca del propósito de la prueba, la conceptualización del universo de contenido y la tabla de especificaciones.

3. Cada juez recibe un instrumento de validación en el cual se recoge la información que proporciona como experto.

4. Se recogen y analizan los instrumentos de validación y se toman las decisiones (eliminación o modificación parcial de los ítems) en función de la coincidencia, o no, de las opiniones mostradas.

Aparte de la validación por expertos, existen otras modalidades de validación de contenido de la versión definitiva de la escala que consisten en que una muestra de estudiantes describa lo que les sugiere cada uno de los ítems, para comprobar que están entendiendo lo mismo que se quiere preguntar en la escala (Kind et al., 2007).

También se emplean técnicas matemáticas para establecer la validez de contenido. Entre ellos está el análisis factorial exploratorio, que tiene un papel importante en la verificación de la validez de constructo o de significado de la variable medida

(Stapleton, 1997). Las dos cuestiones más importantes a tener en cuenta en el análisis factorial son según Spector (1992): el número de factores que mejor representan a los ítems, y la interpretación de los factores. Y el mismo autor continúa (p.54):

“Although factor analysis is a mathematical procedure, the answer to these two questions falls in the realm of subjective judgment as much as in the realm of statistical decision rules”.

(Aunque el análisis factorial es un procedimiento matemático la respuesta a las dos preguntas anteriores recae en el juicio subjetivo, y por tanto en las decisiones que se toman).

El análisis se desarrolla en varios pasos. Primero, los componentes principales son obtenidos por cada ítem analizado, que estará asociado con un autovalor, que representa la proporción relativa de varianza para cada factor (Spector, 1992).Cuando se ha determinado cuántos factores existen se aplica la rotación ortogonal a estos factores, que en función de diversos criterios matemáticos van a producir los grupos de ítems. Es de esperar que cada variable se agrupe en un único factor.

Según Morales et al. (2003) hay que tener en cuenta una serie de premisas a la hora de hacer un análisis factorial del instrumento:

 El hecho de hacer un análisis factorial no prueba la validez de constructo, sino que hay que tener en cuenta algunas otras premisas como se ha visto anteriormente.

 Que todas las variables tengan su peso en el primer factor sin rotar no prueba unidimensionalidad, aunque éste debe explicar una mayor proporción de varianza que el resto de los factores.

 Del mismo modo, es normal encontrarse con varios factores en las escalas con las que pretendemos medir un único rasgo; de hecho encontrarse un único factor es más bien la excepción y puede deberse a ítems excesivamente repetitivos. No se puede concluir con el hecho de encontrar varios factores que la escala es multidimensional (Nunnally y Berstein, 1995).

 Los factores rotados nos permiten apreciar si estamos midiendo lo que decimos que mediamos, al clarificar los aspectos que subyacen a una serie de variables, qué variables o ítems definen cada factor y cómo esos factores están relacionados entre sí.

 El número de factores que se rotan no debe ser una decisión arbitraria, lo que se recomienda en la bibliografía es utilizar el Scree Test de Cattell o el gráfico de sedimentación para decidir el número de factores en el punto de inflexión de la línea que une los valores de las varianzas.

1.7.7. Problemas asociados a las escalas de actitudes: deseabilidad social y

In document La actitud hacia el bienestar animal en el ámbito educativo (página 93-97)