Anális
Anális
is f
is f
actor
actor
ial:
ial:
una técnica para evaluar
una técnica para evaluar
la dimensionalidad de las pruebas
Análi
Análisis sis factorifactorial:al:
una técnica para evaluar
una técnica para evaluar
la dimensionalidad de las pruebas
Análisis factorial:
Análisis factorial:
una técnica para evaluar la dimensionalidad de las pruebas
una técnica para evaluar la dimensionalidad de las pruebas
Cuaderno técnico 6
Cuaderno técnico 6
Salvador Zamora Muñoz Salvador Zamora Muñoz Lucía Monroy Cazorla Lucía Monroy Cazorla César Chávez Álvarez César Chávez Álvarez Revisión técnica: Revisión técnica: Antonio Saade Antonio Saade HazinHazin
Análisis factorial: Análisis factorial:
una técnica para evaluar la dimensionalidad de las pruebas una técnica para evaluar la dimensionalidad de las pruebas Cuaderno técnico 6
Cuaderno técnico 6
D.R. © 2009, Centro Nacional de Evaluación D.R. © 2009, Centro Nacional de Evaluación para la
para la Educación Superior, A.C. (CenevaEducación Superior, A.C. (Ceneval)l) Av
Av. Camino . Camino al Desierto dal Desierto de los Leone los Leones 19,es 19, Col. San Ángel, Deleg. Álvaro Obregón, Col. San Ángel, Deleg. Álvaro Obregón, C.P. 01000, México, D.F.
C.P. 01000, México, D.F. www
www.ceneval.edu.m.ceneval.edu.mxx
Diseño: Mónica Cortés Genis Diseño: Mónica Cortés Genis
Formación: Alvaro Edel Reynoso Castañeda Formación: Alvaro Edel Reynoso Castañeda Abril de 2
Abril de 2009009
Impreso en México • Printed in México Impreso en México • Printed in México
Directorio
Directorio
Dirección General
Dirección General
Rafael Vidal Uribe
Rafael Vidal Uribe Dirección General Adjunta de los EGEL
Dirección General Adjunta de los EGEL
Jorge Hernández Uralde
Jorge Hernández Uralde Dirección General Adjunta de los EXANI
Dirección General Adjunta de los EXANI
José O
José O. Medel Bello. Medel Bello Dirección General Adjunta de Programas Especiales
Dirección General Adjunta de Programas Especiales
Rocío Llarena de Thierry
Rocío Llarena de Thierry Dirección General Adjunta Técnica y de
Dirección General Adjunta Técnica y de InvInvestigaciónestigación
Lucía Monroy Cazorla
Lucía Monroy Cazorla Dirección General Adjunta de Operación
Dirección General Adjunta de Operación
F
Francisco Javier Apreza rancisco Javier Apreza García Méndez García Méndez Dirección General Adjunta de
Dirección General Adjunta de DifusiónDifusión
Javier D
Javier Díaz de la Serna Braojos íaz de la Serna Braojos Dirección General Adjunta de Administración
Dirección General Adjunta de Administración
Francisco Javier Anaya Torres
Francisco Javier Anaya Torres
Dirección de Procesos Ópticos y Calicación
Dirección de Procesos Ópticos y Calicación
María del Socorro Martínez de Luna
María del Socorro Martínez de Luna Dirección de Tecnologías de la Infor
Dirección de Tecnologías de la Informaciónmación
y las
y las ComunicaciComunicacionesones
F
Índice Índice PPrreeffaacciio .o . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . . .. . .. 99 Capítulo I Capítulo I Antecedentes históricos Antecedentes históricos .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 1111 Capítulo II Capítulo II
¿¿QQuué é ees s eel l aannáálliissiis s ffaaccttoorriiaall? ? .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 1515 El
El modelo modelo de de factores factores 1717 Supuestos
Supuestos del del modelo modelo 1818 Métodos
Métodos de de extracción extracción de de factores factores 1919 Selección
Selección del del número número de de factores factores que que serán serán extraídos extraídos 2020 Criterio a priori (tipos de análisis factorial)
Criterio a priori (tipos de análisis factorial) 2020 Criterio de la raíz latente (eigenvalor >1)
Criterio de la raíz latente (eigenvalor >1) 2121 Criterio del gráfico de codo (contraste de caída)
Criterio del gráfico de codo (contraste de caída) 2222 Criterio del porcentaje de varianza explicada
Criterio del porcentaje de varianza explicada 2323 Interpretación
Interpretación de de la la matriz matriz de de cargas cargas factoriales factoriales 2323 Un
Un concepto concepto muy muy controvertido: controvertido: rotación rotación de de factores factores 2626 Rotaciones ortogonales
Rotaciones ortogonales 2626
Rotaciones oblicuas
Rotaciones oblicuas 2727
V
Valoración de las aloración de las comunalidades comunalidades 2828 Puntajes
Puntajes factorialefactoriales s 2525 Bondad
Bondad de de ajuste ajuste del del modelo modelo de de factores factores 2828 Análisis factor
Análisis factorial con variables dial con variables discretas iscretas 2929
Capítulo III Capítulo III
FFuunnddaammeennttoos s ttééccnniiccoos s ddeel l aannáálliissiis s ffaaccttoorriiaal.l. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 3131 Aspectos forma
Aspectos formales les 3131
Soluciones
Soluciones múltiples múltiples al al modelo modelo 3434 Número
Número máximo máximo de de factores factores 3535 Métodos
Máxima
Máxima verosimilitud verosimilitud 3939 Mínimos
Mínimos cuadrados cuadrados 4040
Mínimos
Mínimos cuadrados cuadrados generalizados generalizados 4040 Mínimos
Mínimos cuadrados cuadrados ponderados ponderados 4040 Método
Método de de rotación rotación de de ejes ejes principales principales 4141 Prueba
Prueba sobre sobre el el número número de de factores factores en en el el modelo modelo 4141 Punta
Puntajes jes factoriales factoriales 4242 Método
Método de de Bartlett Bartlett o o de de mínimos mínimos cuadrados cuadrados ponderados ponderados 4242 Método
Método de de Thompson Thompson o o de de regresión regresión 4343
Capítulo IV Capítulo IV
Aplicación con variables continuas
Aplicación con variables continuas .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 4545 Descripción
Descripción general general del del EXANI-I EXANI-I 4545 Definición
Definición del del ejemplo ejemplo 4646 Análisis en SPS Análisis en SPSS S 4848 Análisis en R Análisis en R 6363 Capítulo V Capítulo V
Aplicación con variables discretas
Aplicación con variables discretas.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 6969
Objetivo 69
Objetivo 69
Descripción
Descripción de de las las variables variables 6969 Análisis en R
Análisis en R 8686
Un
Un comentario comentario final final 9090
BBiibblliiooggrraaffíía a .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 9191
Anexo 1 Anexo 1
C
Índice de tablas
Índice de tablas
TTabla abla 1.1.
Artículos pu
Artículos publicados sobre anblicados sobre análisis factoriaálisis factorial en diferentesl en diferentes d
diisscciipplliinnaass, , 11990044--22000044 .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 1. 122
TTabla abla 2.2.
M
Maattrriiz z dde e ccaarrggaas s ffaaccttoorriiaallees s ppaarra a uun n ccaasso o hhiippoottééttiicco o .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 2244
TTabla abla 3.3.
Directrices para la identificación de cargas factoriales Directrices para la identificación de cargas factoriales
ssiiggnniiffiiccaattiivvaass, , bbaassaaddaas s een n eel l ttaammaañño o dde e lla a mmuueessttrra a .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 2255
TTabla abla 4.4.
M
Meeddiiddaas s dde ce coorrrreellaacciióón n eennttrre e vvaarriiaabblleess .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 2299
TTabla abla 5.5.
D
Doommiinniioos s eevvaalluuaaddoos s ppoor r eel l EEXXAANNII--II.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 4477
TTabla abla 6.6.
Ma
Matrtriz iz de de cocorrrrelelacacioionenes es entntre re lalas vs varariaiablbles es quque ee evavalúlúa ea el El EXAXANINI-I -I .. .. .. .. .. .. .. 5151
TTabla abla 7.7.
PPrruueebbaas s KKMMO O y y dde e eeffeerriicciiddaad d dde e BBaarrttlleetttt .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 5533
TTabla abla 8.8.
C
Coommuunnaalliiddaaddees ds deel ml mooddeello uo unniiffaaccttoorriiaal dl deel El EXXAANNII--II.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 5577
TTabla abla 9.9.
TTotaotal de la val de la variarianza exnza expliplicadcada por ea por el modl modelo uelo unifnifactactoriorial deal del EXAl EXANI-NI-I.I. .. .. .. .. 5757
Tabla 10. Tabla 10.
C
Caarrggaas s ffaaccttoorriiaallees s dde e llaas s vvaarriiaabbllees s mmaanniiffiieessttaas.s. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 5588
Tabla 11. Tabla 11.
M
Maattrriiz z dde e ccoorrrreellaacciioonnees s rreepprroodduucciiddaas s ppoor r eel l mmooddeello o .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 6600
Tabla 12. Tabla 12.
Índice de figuras
Índice de figuras
Figura 1. Figura 1.
Cr
Crececimimieientnto o en en llas as pupublblicicacaciionones es ssoobrbre e ananáálilissis is ffacactotorriaial l .. .. .. .. .. .. .. .. .. .. .. .. .. 1133
Figura 2. Figura 2.
R
Reepprreesseennttaacciióón n ddeel l mmooddeello o uunniiffaaccttoorriiaal .l . .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 1166
Figura 3. Figura 3.
R
Reepprreesseennttaacciióón n ddeel l mmooddeello o mmuullttiiffaaccttoorriiaal l .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 1166
Figura 4. Figura 4.
E
Exxpplliiccaacciióón n dde e lla a eeccuuaacciióón n ddeel l mmooddeello o dde e ffaaccttoorreess.. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 1188
Figura 5. Figura 5. G Grrááffiicco o dde e ccooddo o .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. . 2. 222 Figura 6. Figura 6. M
Prefacio
Prefacio
E
E
l Centro Nacional de Evaluación para la Educación l Centro Nacional de Evaluación para la Educación Superior (Ceneval) esSuperior (Ceneval) es una institución de carácter eminentemente técnico. A lo largo de tres lustros una institución de carácter eminentemente técnico. A lo largo de tres lustros su actividad esencial ha sido promover la calidad de la educación mediante su actividad esencial ha sido promover la calidad de la educación medianteeva-luaciones válidas, conables y pertinentes de los aprendizajes.
luaciones válidas, conables y pertinentes de los aprendizajes.
Primordialmente, evalúa los conocimientos y habilidades adquiridos por los Primordialmente, evalúa los conocimientos y habilidades adquiridos por los individ
individuos en los uos en los procesos de enseñanza-apreprocesos de enseñanza-aprendizajendizaje, formales o , formales o no forno forma- ma-les, de los sistemas educativos. Así contribuye a la toma de decisiones les, de los sistemas educativos. Así contribuye a la toma de decisiones funda-mentadas. De hecho, con sus servicios de evaluación atiende instituciones de mentadas. De hecho, con sus servicios de evaluación atiende instituciones de educación media superior y superior, autoridades educativas, organizaciones educación media superior y superior, autoridades educativas, organizaciones profesionales y otras
profesionales y otras instancias públicas y privadas yinstancias públicas y privadas y, desde lueg, desde luego, al destinatarioo, al destinatario
nal –y el más importante– de sus pruebas: el propio sustentante.
nal –y el más importante– de sus pruebas: el propio sustentante.
Con la serie
Con la serie Cuadernos técnicos Cuadernos técnicos el Centro promueve también el uso de herra- el Centro promueve también el uso de herra-mientas de análisis en círculos cada vez más amplios. El propósito de estos mientas de análisis en círculos cada vez más amplios. El propósito de estos títulos es contribuir a elevar la calidad de la educación mexicana y fomentar una títulos es contribuir a elevar la calidad de la educación mexicana y fomentar una auténtica cultura de la evaluación.
auténtica cultura de la evaluación.
La inteligencia, el nivel de ansiedad o el grado de satisfacción no pueden La inteligencia, el nivel de ansiedad o el grado de satisfacción no pueden medirse directamente. Los especialistas las denominan variables latentes o medirse directamente. Los especialistas las denominan variables latentes o
constructos; y para estimarlas lo hacen mediante variables maniestas, como
constructos; y para estimarlas lo hacen mediante variables maniestas, como
podrían ser la respuesta a un reactivo o el número de aciertos en un examen. podrían ser la respuesta a un reactivo o el número de aciertos en un examen.
La teoría que sustenta el empleo del
La teoría que sustenta el empleo del análisis factorial –tema de estudio del
análisis factorial –tema de estudio del
presente texto– asume que la variable latente es continua: los individuos pueden
presente texto– asume que la variable latente es continua: los individuos pueden
ordenarse de mayor a menor nivel del atributo bajo estudio. El propósito es ordenarse de mayor a menor nivel del atributo bajo estudio. El propósito es analizar la estructura de correlación entre un g
analizar la estructura de correlación entre un grupo de rupo de variablvariables medidas, asu-es medidas, asu-miendo que la asociación entre
miendo que la asociación entre ellas puede ser explicada por una ellas puede ser explicada por una o más varia-o más varia-bles latentes, que en el caso del análisis factorial se les reconoce como factores. bles latentes, que en el caso del análisis factorial se les reconoce como factores.
E
E
l primer planteaml primer planteamiento del análisis factoriaiento del análisis factorial se remonl se remonta a principios del siglota a principios del sigloXX
XX , cuando Charles Spearman (1904) hizo un estudio sobre la medición de, cuando Charles Spearman (1904) hizo un estudio sobre la medición de
la intelig
la inteligencia. Conjeturó que si dos haencia. Conjeturó que si dos habilbilidades están correlacionadas, entoidades están correlacionadas, entoncesnces cada u
cada una está compuesta por dos factores: uno que les es na está compuesta por dos factores: uno que les es común, responsabcomún, responsable dele de
la correlación, y otro que es especíco pues determi
la correlación, y otro que es especíco pues determina la d
na la diferencia entre ambas.
iferencia entre ambas.
En los primeros años de
En los primeros años de esta herramienta metodológica el enfoque predo-esta herramienta metodológica el enfoque predo-minante era asumir
minante era asumir a a prior priori i que en los datos subyacía una estructura unif que en los datos subyacía una estructura unifactorial.actorial. Thurstone (
Thurstone (11935) p935) propuso un cambiropuso un cambio en la concepo en la conceptuatualización del anállización del análisis fac-isis fac-torial sugiriendo que los datos analizados podrían explicarse por más de una torial sugiriendo que los datos analizados podrían explicarse por más de una variabl
variable e latenlatente te (f(factoactor)r); ; que que lo lo importante importante era era determinar determinar el el número número de de factofactoresres
que podrían ser identicados. El estudio de inteligencia Thurstone (1938) pro
que podrían ser identicados. El estudio de inteligencia Thurstone (1938) pro
--puso que la inteligencia puede ser explicada por siete factores.puso que la inteligencia puede ser explicada por siete factores. En 19
En 1936 la Sociedad de Psicom36 la Sociedad de Psicometría fetría fundó una undó una revista de investigación es-revista de investigación es-pecializada:
pecializada: Psychometrika,Psychometrika,
en cuyas páginas se publicaron entre nales de los
en cuyas páginas se publicaron entre nales de los
años treinta y principios de los cincuenta numerosos artículos sobre cuestiones años treinta y principios de los cincuenta numerosos artículos sobre cuestiones relacio
relacionadas con el nadas con el desarrodesarrollo del allo del análisis nálisis factofactorial, rial, tales como la estitales como la estimaciónmación de las comunalidades, la extracción de factores comunes, la determinación del de las comunalidades, la extracción de factores comunes, la determinación del número de factores, la rotación de los factores, la estimación de los puntajes número de factores, la rotación de los factores, la estimación de los puntajes factoriales, los métodos para acelerar la velocidad de los cálcu
factoriales, los métodos para acelerar la velocidad de los cálculos y la indeter-los y la indeter-minación de los modelos.
minación de los modelos.
En la actualidad, el uso del análisis factorial como herramienta En la actualidad, el uso del análisis factorial como herramienta
metodológi-ca se ha extendido a diversos ámbitos del quehacer cientíco: la psicología (en
ca se ha extendido a diversos ámbitos del quehacer cientíco: la psicología (en
estudios de habilidades, motivación, aprendizaje, etcétera); la pedagogía (en estudios de habilidades, motivación, aprendizaje, etcétera); la pedagogía (en es-tudios relacionados con el aprovechamiento escolar, la tipología de profesores, tudios relacionados con el aprovechamiento escolar, la tipología de profesores,
etcétera); la sociología (en dimensiones de
etcétera); la sociología (en dimensiones de grupo, actitudes políticas, anidad
grupo, actitudes políticas, anidad
política, etcétera), y en muchas otras disciplinas (ecología, economía, medicina, política, etcétera), y en muchas otras disciplinas (ecología, economía, medicina, metrología...). metrología...). Capítulo I Capítulo I Antecedentes históricos Antecedentes históricos
Como una muestra del uso de esta técnica estadística en los años recientes, Como una muestra del uso de esta técnica estadística en los años recientes, Kaplunovsky (2006) presentó los resultados de una exploración realizada en Kaplunovsky (2006) presentó los resultados de una exploración realizada en in-ternet en mayo de 2004. Detectó 3,460 artículos relacionados con este método ternet en mayo de 2004. Detectó 3,460 artículos relacionados con este método
cuantitativo y los clasicó de acuerdo con los
cuantitativo y los clasicó de acuerdo con los campos del conocimiento en que
campos del conocimiento en que
se habían generado los datos, los cuales se muestran en la tabla 1. se habían generado los datos, los cuales se muestran en la tabla 1.
En la gura 1 se muestra el incremento que han tenido, en los últimos 15
En la gura 1 se muestra el incremento que han tenido, en los últimos 15
años, los estudios que utilizan el análisis factorial en la información. años, los estudios que utilizan el análisis factorial en la información.
T
Tabla 1. Artículos publicados abla 1. Artículos publicados sobre análisis factorialsobre análisis factorial en diferentes disciplinas, 1904-2004 en diferentes disciplinas, 1904-2004 Área Área 1904- 1904-1980 1980 1981-1985 1985 1986-1990 1990 1991-1995 1995 1995-2000 2000 2000-2004 2004 TotalTotal Biología Biología Química Química Cromatografía Cromatografía Ecología Ecología Economía Economía Alimentación Alimentación Geriatría Geriatría Procesamiento de imágenes Procesamiento de imágenes Industria Industria Resonancia magnética Resonancia magnética Medicina Medicina Metodología Metodología Investigación de operaciones Investigación de operaciones Fisiología Fisiología Psiquiatría Psiquiatría Psicología Psicología Espectroscopia Espectroscopia 166 166 280 280 88 88 138 138 85 85 50 50 88 88 147 147 78 78 49 49 418 418 391 391 95 95 203 203 365 365 1280 1280 326 326 18 18 12 12 4 4 2 2 14 14 1 1 8 8 2 2 4 4 1 1 30 30 10 10 1 1 20 20 15 15 93 93 11 11 17 17 14 14 7 7 4 4 12 12 4 4 5 5 7 7 0 0 1 1 32 32 25 25 1 1 26 26 14 14 86 86 27 27 20 20 36 36 16 16 11 11 9 9 5 5 10 10 22 22 2 2 3 3 64 64 31 31 1 1 38 38 39 39 159 159 40 40 23 23 53 53 22 22 15 15 4 4 2 2 9 9 27 27 6 6 6 6 67 67 49 49 9 9 39 39 61 61 219 219 50 50 41 41 77 77 15 15 45 45 26 26 21 21 31 31 51 51 28 28 13 13 116 116 151 151 41 41 29 29 99 99 344 344 90 90 47 47 88 88 24 24 61 61 20 20 17 17 25 25 38 38 38 38 25 25 109 109 125 125 42 42 51 51 137 137 379 379 108 108
Figura 1. Crecimiento en las publicaciones sobre análisis
Figura 1. Crecimiento en las publicaciones sobre análisis factorialfactorial Publicaciones
Publicaciones PublicacionesPublicaciones sin Psychology sin Psychology
Capítulo II
Capítulo II
¿Qué es el
¿Qué es el análisis factorial?análisis factorial?
E
E
l análisis factorial es una técnica estadística multivariada que se incorpora al análisis factorial es una técnica estadística multivariada que se incorpora a la metodología cula metodología cuantitativa que involucra variables latentes.antitativa que involucra variables latentes.11 Estas variables Estas variables no obser
no observablesvables, denominadas frecuentemente constructos, son variables que no, denominadas frecuentemente constructos, son variables que no
pueden medirse de manera directa: se estiman a través de variables maniestas
pueden medirse de manera directa: se estiman a través de variables maniestas
(observadas). Ejemplos de variables latentes podrían ser la inteligencia, el nivel (observadas). Ejemplos de variables latentes podrían ser la inteligencia, el nivel de ansiedad, el nivel socioeconómico, el capital cultural, el grado d
de ansiedad, el nivel socioeconómico, el capital cultural, el grado de satisfaccióne satisfacción con un producto
con un producto o el nivel de razonamiento verbal. Varo el nivel de razonamiento verbal. Variables observadas po-iables observadas po-drían ser la respuesta a un reactivo de un examen, el número de aciertos en un drían ser la respuesta a un reactivo de un examen, el número de aciertos en un examen, la intensidad con que se lanzó una pelota, el número de computadoras examen, la intensidad con que se lanzó una pelota, el número de computadoras en una vivienda, etcétera.
en una vivienda, etcétera.
En el análisis factorial se asume que la variable latente es continua: los En el análisis factorial se asume que la variable latente es continua: los indi- viduos pueden or
viduos pueden ordenarse de mdenarse de mayor a ayor a menor nivmenor nivel del atriel del atributo bajo estudbuto bajo estudioio. El. El objetivo primordial de esta herramienta es estudiar la estructura de correlación objetivo primordial de esta herramienta es estudiar la estructura de correlación entre un grupo de variables medidas, asumiendo que la asociación entre las entre un grupo de variables medidas, asumiendo que la asociación entre las variables puede ser explicada por una o
variables puede ser explicada por una o más variables latentesmás variables latentes, que en el , que en el casocaso del análisis factorial se les reconoce como factores. Dicho de otra manera, la del análisis factorial se les reconoce como factores. Dicho de otra manera, la correlación entre el gr
correlación entre el grupo de variables se explica por la preupo de variables se explica por la presencia de los factoressencia de los factores subyacentes a ellas.
subyacentes a ellas.
En el caso de que esta estructura de correlación pueda explicarse a través En el caso de que esta estructura de correlación pueda explicarse a través de un solo factor, estaremos ante un modelo
de un solo factor, estaremos ante un modelo unifactorial; unifactorial; por el contrario, si por el contrario, si necesitamos más de un factor para explicar estas correlaciones, utilizaremos necesitamos más de un factor para explicar estas correlaciones, utilizaremos un modelo
un modelo multifactorial multifactorial . En este último caso, se espera que las variables que. En este último caso, se espera que las variables que componen cada uno de estos factores estén fuertemente correlacion
componen cada uno de estos factores estén fuertemente correlacionadas, y adas, y concon correlaciones débiles con las variables que componen el resto de los factores. correlaciones débiles con las variables que componen el resto de los factores.
Cuando se representa grácamente un modelo latente, como el análisis fac
Cuando se representa grácamente un modelo latente, como el análisis fac
--torial, es común representar los factores con un óvalo o círculo, y las variables torial, es común representar los factores con un óvalo o círculo, y las variablesmaniestas con un cuadrado o rectángul
maniestas con un cuadrado o rectánguloo. Las echas van del factor a las varia
. Las echas van del factor a las varia
-- sobre análisis de clases latentes para una denición más extensa de sobre análisis de clases latentes para una denición más extensa de
bles, indicando que el factor es
bles, indicando que el factor es una variable explicativa y las variables manies
una variable explicativa y las variables manies
--tas son variables dependientes. En las guras 2 y 3 se muestra la representación
tas son variables dependientes. En las guras 2 y 3 se muestra la representación
gráca de un modelo unifactorial y otro multifactorial, respectivamente.
gráca de un modelo unifactorial y otro multifactorial, respectivamente.
Figura 2. Representación del modelo
Figura 2. Representación del modelo unifactorialunifactorial
Figura 3. Representación del modelo
Figura 3. Representación del modelo multifactorialmultifactorial V V 11 V V 22 V V 33 V V 44 V V 55 V V 66 V V 77 V V 88 V V 99 V V 1010 Habilidad Habilidad matemática matemática V V 11 V V 22 V V 33 V V 44 V V 55 V V 66 V V 77 V V 88 V V 99 V V 1010 Series Series numéricas numéricas Resolución Resolución problemas problemas
Los factores
Los factores f f 11,, f f 22,...,,..., f f k k , juegan el , juegan el papel de variables explicativas, y cada una depapel de variables explicativas, y cada una de las
las X’s X’s
el de variables de respuesta; las λ’s son los coecientes asociados a cada
el de variables de respuesta; las λ’s son los coecientes asociados a cada
factor, y reciben el nombre de
factor, y reciben el nombre de cargas factoriales; cargas factoriales; por último, los errores del mode- por último, los errores del
mode-lo son las u’s. En este sentido, el modemode-lo está determinando por las variables y
lo son las u’s. En este sentido, el modelo está determinando por las variables y
no por los individuos. no por los individuos.
Las cargas factoriales indican la correlación entre cada variable y el factor Las cargas factoriales indican la correlación entre cada variable y el factor correspondiente; así, una variable con mayor carga factorial será más correspondiente; así, una variable con mayor carga factorial será más represen-tativ
tativa del factor. De este a del factor. De este modomodo, las carg, las cargas factoriales sirven para as factoriales sirven para interpretar lainterpretar la
función que cumple cada
función que cumple cada variabl
variable para denir cada
e para denir cada uno de los
uno de los factores
factores. En la
. En la
El modelo de factores
El modelo de factores
En este apartado se explicarán los aspectos básicos de la teoría que sustenta el En este apartado se explicarán los aspectos básicos de la teoría que sustenta el análisis factorial y se pospone su explicación formal, en términos matemáticos, análisis factorial y se pospone su explicación formal, en términos matemáticos, hasta el capítulo 3: Fundamentos técnicos del análisis factorial.
hasta el capítulo 3: Fundamentos técnicos del análisis factorial.
Supongamos que tenemos un conjunto de variables observadas
Supongamos que tenemos un conjunto de variables observadas X X 11,, X X 22,...,,..., X
X pp y se asume que en este conjunto subyacen y se asume que en este conjunto subyacen kk factores (el número de factores factores (el número de factores
debe ser estrictamente menor al número de variables observadas). De acuerdo debe ser estrictamente menor al número de variables observadas). De acuerdo con lo que hemos planteado en secciones anteriores, los factores son variables con lo que hemos planteado en secciones anteriores, los factores son variables latentes que
latentes que explican explican
la asociación entre las variables maniestas (en este caso
la asociación entre las variables maniestas (en este caso
laslas X’s X’s ); entonces ); entonces, podemos pensar el , podemos pensar el modelo de factores modelo de factores de manera simide manera similar allar al
modelo de regresión lineal, en el que se exprese esta relación entre factores y modelo de regresión lineal, en el que se exprese esta relación entre factores y vari
Supuestos del modelo
Supuestos del modelo
En el modelo de
En el modelo de factores, afactores, a f f 11,, f f 22,...,,..., f f k k se les denomina se les denomina factores factores comunes comunes y y aau u 11,,u u 22,...,... ,u ,u pp factores
factores especícos especícos . Los supuestos básicos sobre los que se construye el modelo. Los supuestos básicos sobre los que se construye el modelo
son los siguientes: son los siguientes: 1.
1. Los Los factores factores comunescomunes f f j j j j =1,2,...,=1,2,...,kk no están correlacionados y tienen media no están correlacionados y tienen media
cero y varianza cero y varianza uno.uno.
2.
2. Los
Los factores
factores especícos
especícos
ui ui no están cor no están correlacionados y tienen media cero yrelacionados y tienen media cero yvari
varianza
anza Ψ
Ψ
ii i i =1,2,...,=1,2,..., p p..3.
3. Los factores com
Los factores comunes no están
unes no están correlacionados con los factores
correlacionados con los factores especícos.
especícos.
Bajo estos supuestos es posible descomponer la varianza de cada una de Bajo estos supuestos es posible descomponer la varianza de cada una de las variables observables del modelo o
las variables observables del modelo o variables indicadoras variables indicadoras ( ( X X ii ), en dos compo- ), en dos compo-nentes no cor
nentes no correlacionadosrelacionados. Por un lado la . Por un lado la varianza común, conocida como lavarianza común, conocida como la
Figura 4. Explicación de la
Figura 4. Explicación de la ecuación del modelo de factoresecuación del modelo de factores Variable obse
Variable observadarvada
Cargas factoriales Cargas factoriales Factores Factores Error Error
comunalidad
comunalidad de la variable y que representa la varianza de la variable de la variable y que representa la varianza de la variable X X i i que es que es
explicada por los f
explicada por los factores comunes y, por el otro
actores comunes y, por el otro, la varianza especíc
, la varianza especíca conocida
a conocida
como
como especicidad especicidad y que es la varianza no explicada por estos factores comunes. y que es la varianza no explicada por estos factores comunes.
Los factores comunes y sus
Los factores comunes y sus características asociadas (comunalidades, especici
características asociadas (comunalidades, especici
--dades, número, etcétera) representan el objeto de interés en el análisis factorial. dades, número, etcétera) representan el objeto de interés en el análisis factorial.Métodos de extracción de factores
Métodos de extracción de factores
T
Todas las odas las técnicas de técnicas de estimación del estimación del modelo factorial modelo factorial parten del parten del supuesto desupuesto de que los factores iniciales que serán extraídos de la matriz de correlaciones de las que los factores iniciales que serán extraídos de la matriz de correlaciones de las vari
variables ables indicadindicadoras oras no no estaráestarán cn correlacionorrelacionadosados. . El El objetiobjetivo vo de de los los métodos métodos dede extracción de factores es minimizar la distancia entre la matriz de cor
extracción de factores es minimizar la distancia entre la matriz de correlacionesrelaciones observada y la matriz de cor
observada y la matriz de correlaciones que se desprende del modelo (matriz querelaciones que se desprende del modelo (matriz que
especica el modelo de factores). La
especica el modelo de factores). La diferencia entre los métodos radica en la
diferencia entre los métodos radica en la
denición de “distancia” que utilizan para llegar a la solución. El método de mí
denición de “distancia” que utilizan para llegar a la solución. El método de mí
--nimos cuadrados, por ejemplonimos cuadrados, por ejemplo, se ocupa de minimizar , se ocupa de minimizar la suma de cuadrados dela suma de cuadrados de las diferencias entre estas dos matrices, por lo que los valores de los parámetros las diferencias entre estas dos matrices, por lo que los valores de los parámetros
que logren e
que logren este objetivo serán los estimadores nales.
ste objetivo serán los estimadores nales.
Uno de los métodos más comunes para la extracción de factores es el con Uno de los métodos más comunes para la extracción de factores es el cono- o-cido como
cido comoFFactorización de ejes practorización de ejes principales (Principal axis facincipales (Principal axis factoting)toting). Se trata de un mé-. Se trata de un
mé-todo iterativo para estimar las comunalidades y subsecuentemente extraer los todo iterativo para estimar las comunalidades y subsecuentemente extraer los factores. Este método es igual al que se usa en la técnica multivariada conocida factores. Este método es igual al que se usa en la técnica multivariada conocida como
como Análisis de Análisis de componentes princomponentes principales,cipales, salvo que no se realiza sobre la matriz salvo que no se realiza sobre la matriz
original de correlación (véanse detalles en el capítulo 3). Los factores se extraen original de correlación (véanse detalles en el capítulo 3). Los factores se extraen
de manera sucesiva, por lo que la solución nal consiste en factores ortogona
de manera sucesiva, por lo que la solución nal consiste en factores ortogona
--lesles. El primer factor se . El primer factor se obtiene de forobtiene de forma que explique la ma que explique la mayor cantidamayor cantidad de d de lala vari
proceso continúa hasta que se ha
proceso continúa hasta que se ha extraído un número suciente de f
extraído un número suciente de factores. En
actores. En
el siguiente apartado revisaremos algunos criterios para determinar el número el siguiente apartado revisaremos algunos criterios para determinar el número de factores con que se debería detener este proceso.
de factores con que se debería detener este proceso.
Selección del número de factores por ser extraídos
Selección del número de factores por ser extraídos
Uno de los objetivos del análisis factorial es la reducció
Uno de los objetivos del análisis factorial es la reducción de los datos originalesn de los datos originales
a un número menor de variables, per
a un número menor de variables, pero podría ocurrir que –dado u
o podría ocurrir que –dado un conjunto de
n conjunto de
datos– se tengan soluciones muy dif
datos– se tengan soluciones muy diferentes, dependiendo del número de facto
erentes, dependiendo del número de facto
--res considerado. Por tal motivres considerado. Por tal motivo son varios los criterios que po son varios los criterios que pueden serueden servirnos devirnos de guía para determinar cuántos factores extraer.
guía para determinar cuántos factores extraer.
En el capítulo 3 determinaremos el número máximo de factores que se En el capítulo 3 determinaremos el número máximo de factores que se pue-den extraer, dependiendo del número de variables indicadoras que se incluyan den extraer, dependiendo del número de variables indicadoras que se incluyan en el modelo; y
en el modelo; y a continuación explicaremos la lógica de algunos criterios uti-a continuación explicaremos la lógica de algunos criterios uti-lizados para la selección del número de factores por extraer en el análisis; lizados para la selección del número de factores por extraer en el análisis;
co-menzaremos con los criterios teóricos que denen el
menzaremos con los criterios teóricos que denen el
análisis factorial conrmatorioanálisis factorial conrmatorioy con algunos criterios estadísticos que nos ayudarán a seleccionar el número y con algunos criterios estadísticos que nos ayudarán a seleccionar el número exacto de factores por extraer en el marco del
exacto de factores por extraer en el marco del análisis factorial exploratorioanálisis factorial exploratorio..
Criterio a priori (tipos de análisis factorial)
Criterio a priori (tipos de análisis factorial)
En muchas ocasiones no se tiene certeza sobre el número de factores
En muchas ocasiones no se tiene certeza sobre el número de factores kk que que
subyacen en la estructura de datos; por ende, se puede realizar la extracción de subyacen en la estructura de datos; por ende, se puede realizar la extracción de factores de manera secuencial, se inicia con
factores de manera secuencial, se inicia con kk=1 y se llega hasta un número de=1 y se llega hasta un número de
factores que permita lograr un buen ajuste del modelo a los datos. Este factores que permita lograr un buen ajuste del modelo a los datos. Este proce-dimiento de incorporar factores hasta lograr un buen ajuste da lugar al llamado dimiento de incorporar factores hasta lograr un buen ajuste da lugar al llamado
análisis factorial
análisis factorial exploratorioexploratorio,, en el que el investigador no conoce de en el que el investigador no conoce de antemano elantemano el
número de f
número de factores que subyacen en actores que subyacen en las variables observadas. Una desventajalas variables observadas. Una desventaja de este tipo de análisis: puede ocurrir que
ninguna interpretación para el investigador. Por el contrario, cuando en una ninguna interpretación para el investigador. Por el contrario, cuando en una in- ves
vestigación tigación se se determina determina de de forma forma preciprecisa sa el el número número de de factorfactoreses, , se se está está ante ante unun
análisis factorial conrmatorio
análisis factorial conrmatorio. La forma usual de proponer este número de factores. La forma usual de proponer este número de factores
es en atención a alguna teoría propuesta en el área de aplicación. En este caso, es en atención a alguna teoría propuesta en el área de aplicación. En este caso,
los objetivo
los objetivos de
s de la investigación se centran en la conr
la investigación se centran en la conrmación del número de
mación del número de
factores
factores y, y, consecuentemente, en la validación de esta teoría consecuentemente, en la validación de esta teoría mediante la eviden-mediante la
eviden-cia empírica proporcionada por los datos. Si el ajuste estadístico de los datos al cia empírica proporcionada por los datos. Si el ajuste estadístico de los datos al modelo teórico es satisfactorio, se podrá concluir que el
modelo teórico es satisfactorio, se podrá concluir que el modelo es adecuado.modelo es adecuado. Entonces, cuando el análisis factorial es de tipo exploratorio, se tiene la Entonces, cuando el análisis factorial es de tipo exploratorio, se tiene la nece-sidad de decidir cuántos factores se deben retener en
sidad de decidir cuántos factores se deben retener en el análisisel análisis. En seguida se. En seguida se enuncian algunos criterios establecidos para decidir este número.
enuncian algunos criterios establecidos para decidir este número.
Criterio de la raíz latente (eigenvalor >1)
Criterio de la raíz latente (eigenvalor >1)
La lógica que sigue este criterio se basa en la idea de que cada uno de los La lógica que sigue este criterio se basa en la idea de que cada uno de los
facto-res extraídos debería justicar, al menos, la varianza de una variable individual
res extraídos debería justicar, al menos, la varianza de una variable individual
(de lo contrario se incumpliría con el objetivo de reducir la dimensión de los (de lo contrario se incumpliría con el objetivo de reducir la dimensión de los datos originales).
datos originales).
El análisis factorial –al igual que otras técnicas multivariadas– utiliza eigen
El análisis factorial –al igual que otras técnicas multivariadas– utiliza eigen
-- valores (raíces latentes) y sus corvalores (raíces latentes) y sus correspondientes eigenvectores para consolidarrespondientes eigenvectores para consolidar la varianza en una matriz. En el contexto del análisis factorial, los eigenvalores la varianza en una matriz. En el contexto del análisis factorial, los eigenvalores representan la cantidad de varianza de todas las variables indicadoras que puede representan la cantidad de varianza de todas las variables indicadoras que puede ser explicada por un
ser explicada por un factor determinado. Cada una de las variables contribuyefactor determinado. Cada una de las variables contribuye con un valor de 1 en el eigenvalor (varianza) total.
con un valor de 1 en el eigenvalor (varianza) total.22 Por lo tanto, de acuerdo con Por lo tanto, de acuerdo con este criterio, deberían elegirse los factores con eigenvalores mayores a 1 para este criterio, deberían elegirse los factores con eigenvalores mayores a 1 para garantizar que explican la varianza de al menos una variable.
Criterio del gráfico de codo (contraste de caída)
Criterio del gráfico de codo (contraste de caída)
Este criterio consiste en analizar el comportamiento de los eigenvalores Este criterio consiste en analizar el comportamiento de los eigenvalores aso-ciados a los factores extraídos, para determinar un punto de corte entre la ciados a los factores extraídos, para determinar un punto de corte entre la pen-diente pronunciada de los eigenvalores altos y la penpen-diente (más bien plana) de diente pronunciada de los eigenvalores altos y la pendiente (más bien plana) de los eigenvalores bajos.
los eigenvalores bajos.
La siguiente gura representa los primeros 11 factores extraídos en el análi
La siguiente gura representa los primeros 11 factores extraídos en el análi
--sis factorial de un conjunto de reactivos que componen el área de un examen. sis factorial de un conjunto de reactivos que componen el área de un examen.Del lado izquierdo de la gráca un punto sobresale de los demás, haciendo
Del lado izquierdo de la gráca un punto sobresale de los demás, haciendo
que la pendiente de la línea que une todos los puntos cambie drásticamente en que la pendiente de la línea que une todos los puntos cambie drásticamente en el lugar correspondiente al segundo factor. En este sitio, todo el conjunto de el lugar correspondiente al segundo factor. En este sitio, todo el conjunto de
Figura 5. Gráfico de codo Figura 5. Gráfico de codo Gráfico de codo (scree - plot) Gráfico de codo (scree - plot)
Criterio de contraste de caída Criterio de contraste de caída
E E i i g g e e n n v v a a l l o o r r 3.5 3.5 3.0 3.0 2.5 2.5 2.0 2.0 1.5 1.5 1.0 1.0 0.5 0.5 1 1 22 33 44 55 66 77 88 99 1100 1111
factores se divide en dos gr
factores se divide en dos grupos, el primero compuesto solamente por el primerupos, el primero compuesto solamente por el primer factor, que explica una cantidad mayor de varianza que cualquiera de los diez factor, que explica una cantidad mayor de varianza que cualquiera de los diez factores restantes pertenecientes al segundo grupo y para los que la cantidad factores restantes pertenecientes al segundo grupo y para los que la cantidad de varianza explicada parece haberse estab
de varianza explicada parece haberse estabilizado. Pilizado. Por lo tanto, con este criterioor lo tanto, con este criterio deberíamos incluir sólo el primer factor.
deberíamos incluir sólo el primer factor.
Criterio del porcentaje de varianza explicada
Criterio del porcentaje de varianza explicada
Este criterio consiste en analizar el porcentaje acumulado de la varianza total Este criterio consiste en analizar el porcentaje acumulado de la varianza total extraída. Esto es, se busca asegurar que el número de factores e
extraída. Esto es, se busca asegurar que el número de factores extraídos alcancextraídos alcance a explicar un porcentaje determinado de la varianza total de los datos. Aunque a explicar un porcentaje determinado de la varianza total de los datos. Aunque no se ha determinado un porcentaje preciso de varianza explicada que sirva no se ha determinado un porcentaje preciso de varianza explicada que sirva como umbral para concluir con la extracción de factores, algunos autores como umbral para concluir con la extracción de factores, algunos autores su-gieren que en el caso de aplicaciones concernientes a las Ciencias Naturales se gieren que en el caso de aplicaciones concernientes a las Ciencias Naturales se puede detener el proceso cuando se alcance 95% de la varianza o cuando la puede detener el proceso cuando se alcance 95% de la varianza o cuando la inclusión de un factor adicional contribuya con menos de 5% a la varianza inclusión de un factor adicional contribuya con menos de 5% a la varianza ex-plicada acumulada. Para el caso de las Ciencias Sociales los criterios propuestos plicada acumulada. Para el caso de las Ciencias Sociales los criterios propuestos son más laxos. Se habla de continuar la extracción de factores hasta log
son más laxos. Se habla de continuar la extracción de factores hasta lograr 60%rar 60% de la varianza total (Hair
de la varianza total (Hair et al.,et al.,
1998/1999).
1998/1999).
Interpretación de la matriz de cargas factoriales
Interpretación de la matriz de cargas factoriales
Una vez que se han estimado las cargas factoriales es importante establecer Una vez que se han estimado las cargas factoriales es importante establecer criterios que permitan interpretar los resultados obtenidos. Esta interpretación criterios que permitan interpretar los resultados obtenidos. Esta interpretación hará posible establecer una conexión entre los resultados vertidos por el análisis hará posible establecer una conexión entre los resultados vertidos por el análisis factorial y los constructos teóricos relacionados con los datos. En este sentido, factorial y los constructos teóricos relacionados con los datos. En este sentido, la extracción de un determinado número de factores por los criterios la extracción de un determinado número de factores por los criterios
estadís-ticos ya mencionados, carecerá de sentido si no podemos darle un signicado
ticos ya mencionados, carecerá de sentido si no podemos darle un signicado
Las cargas factoriales indican la correlación entre cada variable y el factor Las cargas factoriales indican la correlación entre cada variable y el factor correspondiente, de ahí que una variable con mayor carga factorial será más correspondiente, de ahí que una variable con mayor carga factorial será más representativa del factor
representativa del factor. T. Tomando en cuenta omando en cuenta esto, un análisis de la matriz esto, un análisis de la matriz dede
cargas factoriales puede ayudarnos a identicar cómo se agr
cargas factoriales puede ayudarnos a identicar cómo se agrupan las variables
upan las variables
maniestas para conformar cada uno de los factores resultantes del modelo, e
maniestas para conformar cada uno de los factores resultantes del modelo, e
incluso a etiquetarlos. Una vez que sabemos cuáles de las variables maniestas
incluso a etiquetarlos. Una vez que sabemos cuáles de las variables maniestas
“cargan” en el factor 1, por ejemplo, podemos deducir qué tipo de constructo
“cargan” en el factor 1, por ejemplo, podemos deducir qué tipo de constructo
teórico está representado por dicho factor. teórico está representado por dicho factor.
En la siguiente tabla se muestra la matriz de cargas factoriales para un En la siguiente tabla se muestra la matriz de cargas factoriales para un ejem-plo hipotético en el que se realizó un análisis factorial con las respuestas a 10 plo hipotético en el que se realizó un análisis factorial con las respuestas a 10 reactivos de opción múltiple de una prueba. Los primeros 5 (RM1 a RM5) son reactivos de opción múltiple de una prueba. Los primeros 5 (RM1 a RM5) son reactivos del área de Razonamiento matemático, mientras que los últimos cinco reactivos del área de Razonamiento matemático, mientras que los últimos cinco (RV1 a RV5) corresponden al área de Razonamiento verbal.
(RV1 a RV5) corresponden al área de Razonamiento verbal.
De acuerdo con estos resultados, podemos identicar al factor 1 con una
De acuerdo con estos resultados, podemos identicar al factor 1 con una
inuencia común en las primeras cinco variables y al factor 2 con una inuen
inuencia común en las primeras cinco variables y al factor 2 con una inuen
--cia común en las últimas cinco. De esta manera podríamos dividir el total de cia común en las últimas cinco. De esta manera podríamos dividir el total deÁrea
Área Va Variable(Reactivo)(Reactivo)riable Factor Factor
Razonamiento verbal Razonamiento verbal Razonamiento matemático Razonamiento matemático RM1 RM1 RM2 RM2 RM3 RM3 RM4 RM4 RM5 RM5 1 1 22 0.6 0.6 0.5 0.5 0.6 0.6 0.6 0.6 0.5 0.5 0.1 0.1 0.1 0.1 0.2 0.2 0.1 0.1 0.1 0.1 0.1 0.1 0.2 0.2 0.1 0.1 0.2 0.2 0.2 0.2 0.6 0.6 0.6 0.6 0.6 0.6 0.6 0.6 0.7 0.7 RV1 RV1 RV2 RV2 RV3 RV3 RV4 RV4 RV5 RV5 T
Carga factorial Carga factorial
(a) La significancia se basa en un nivel de
(a) La significancia se basa en un nivel de significación de 0.05, unasignificación de 0.05, una potencia de 80% y los errores estándar supuestamente dos veces potencia de 80% y los errores estándar supuestamente dos veces mayores que los coeficientes convencionales
mayores que los coeficientes convencionales de correlaciónde correlación
Tamaño muestral necesario Tamaño muestral necesario
para la significancia- (a) para la significancia- (a) 0.30 0.30 0.35 0.35 0.40 0.40 0.45 0.45 0.50 0.50 0.55 0.55 0.60 0.60 0.65 0.65 0.70 0.70 0.75 0.75 352 352 250 250 200 200 150 150 120 120 100 100 85 85 70 70 60 60 50 50 T
Tabla 3. Directrices abla 3. Directrices para la identificación para la identificación de cargas factorialesde cargas factoriales significativas, basadas en el tamaño de la
significativas, basadas en el tamaño de la muestramuestra
variables (rea
variables (reactivos) en dos grupos, que no se traslapan, y que son indicativosctivos) en dos grupos, que no se traslapan, y que son indicativos de dos variables latentes diferentes: Razonamiento matemático (factor 1) y de dos variables latentes diferentes: Razonamiento matemático (factor 1) y Ra-zonamiento verbal (factor 2).
zonamiento verbal (factor 2).
¿Cómo podemos determinar si una carga factorial es lo sucientemente
¿Cómo podemos determinar si una carga factorial es lo sucientemente
“grande” para concluir que la correlación entre la variable y el factor es signi
“grande” para concluir que la correlación entre la variable y el factor es signi
--cativa? Haircativa? Hair et al et al
. (1998/1999) proponen ciertas directrices para determinar si
. (1998/1999) proponen ciertas directrices para determinar si
una carga factorial es o no signicativa, dependiendo del tamaño de la muestra
una carga factorial es o no signicativa, dependiendo del tamaño de la muestra
utilizada para el análisis (esta tabla se basa en estudios de potencia estadística): utilizada para el análisis (esta tabla se basa en estudios de potencia estadística):
En el ejemplo anterior la interpretación fue muy sencilla, porque cada En el ejemplo anterior la interpretación fue muy sencilla, porque cada
va-riable resultó estadisticamente signicativa para un solo factor. Sin embargo,
riable resultó estadisticamente signicativa para un solo factor. Sin embargo,
este no es el caso frecuente. A continuación se describe un procedimiento que este no es el caso frecuente. A continuación se describe un procedimiento que
puede ayudar a claricar la interpretación de los resultados.
puede ayudar a claricar la interpretación de los resultados.
Un concepto muy controversial: rotación de factores
Un concepto muy controversial: rotación de factores
Cuando el modelo en cuestión está deter
Cuando el modelo en cuestión está determinado por un solo factor, su soluciónminado por un solo factor, su solución es única; sin embargo, las soluciones de los modelos multifactoriales, no son es única; sin embargo, las soluciones de los modelos multifactoriales, no son
siempre únicas, ya que cuando existen
siempre únicas, ya que cuando existen dos o más factores si
dos o más factores signicativos
gnicativos, las dis
, las dis
--tintas combinaciones posibles pueden interpretarse de dis--tintas maneras tintas combinaciones posibles pueden interpretarse de distintas maneras(véan-se “soluciones múltiples al modelo” en el capítulo 3). Este aspecto ha suscitado
se “soluciones múltiples al modelo” en el capítulo 3). Este aspecto ha suscitado
críticas sobre el análisis factorial, ya que se piensa que depende de cuestiones críticas sobre el análisis factorial, ya que se piensa que depende de cuestiones subjetivas
subjetivas, que pudieran encaminar las , que pudieran encaminar las soluciones a resultados preconcebidossoluciones a resultados preconcebidos por el investigador. Estas críticas son erróneas en dos aspectos: primero, el por el investigador. Estas críticas son erróneas en dos aspectos: primero, el in- vestigador no obtiene la soluc
vestigador no obtiene la solución queión que él desea; él desea; segundo, es más adecuado decir segundo, es más adecuado decir que la misma solución
que la misma solución puede expresarse de diferentes puede expresarse de diferentes maneras; de hecho, variasmaneras; de hecho, varias
características de las soluciones –por ejemplo las comunalidades– permanecen
características de las soluciones –por ejemplo las comunalidades– permanecen
inalteradas.
inalteradas. Rotación Rotación
–nombre que se le da
–nombre que se le da al proceso de cambiar de una solución
al proceso de cambiar de una solución
a otra– proviene de la representación geométrica de este procedimiento.
a otra– proviene de la representación geométrica de este procedimiento.
La razón principal para rotar una solución es claricar la estructura de las
La razón principal para rotar una solución es claricar la estructura de las
cargas factoriales. Los factores deben tener un signicado claro para el
cargas factoriales. Los factores deben tener un signicado claro para el inve
invess
--tigador, a partir del contexto de aplicación. Si la estructura que muestran las tigador, a partir del contexto de aplicación. Si la estructura que muestran las cargas factoriales de la solución inicial son confusas o difíciles de interpretar, cargas factoriales de la solución inicial son confusas o difíciles de interpretar, una rotación puede proporcionar una estructura más fácil de interpretar.una rotación puede proporcionar una estructura más fácil de interpretar.
Rotaciones ortogonales
Rotaciones ortogonales
Uno de los patrones de cargas factoriales más usuales y de hecho más deseables Uno de los patrones de cargas factoriales más usuales y de hecho más deseables es la llamada
es la llamada estructura simple de cargas factoriales estructura simple de cargas factoriales . Se dice que las cargas factoriales. Se dice que las cargas factoriales presentan una estructura simple si cada variable tiene una gran carga en un presentan una estructura simple si cada variable tiene una gran carga en un solo factor, con cargas cercanas a cero en el resto de los factores. Una de las solo factor, con cargas cercanas a cero en el resto de los factores. Una de las rotaciones ortogonales (los nuevos ejes después de la rotación siguen siendo rotaciones ortogonales (los nuevos ejes después de la rotación siguen siendo ortogonales) que procura generar una estr
varimax,
varimax, implementada en la mayoría de los paquetes estadísticos. No hay ga- implementada en la mayoría de los paquetes estadísticos. No hay
ga-rantía de que una rotación produzca necesariamente una estructura de cargas rantía de que una rotación produzca necesariamente una estructura de cargas simple, pero, de hacerlo
simple, pero, de hacerlo, puede ayudar a una interp, puede ayudar a una interpretación mucho más fácil deretación mucho más fácil de los factores. Existe
los factores. Existen otras rotaciones ortogn otras rotaciones ortogonales (comoonales (como quartimax quartimax y y equimax equimax ), ), pero ninguna tiene la popularidad de varimax.
pero ninguna tiene la popularidad de varimax.
Rotaciones oblicuas
Rotaciones oblicuas
Contrario a las rotaciones ortogonales, las rotaciones oblicuas permiten relajar Contrario a las rotaciones ortogonales, las rotaciones oblicuas permiten relajar
la restricción de ortogonalidad con el n de ganar simplicidad en la interpre
la restricción de ortogonalidad con el n de ganar simplicidad en la interpre
--tación de lostación de los factoresfactores. Con este . Con este método los factores resultan cormétodo los factores resultan correlacionadosrelacionados,, aunque generalmente esta correlación es pequeña. El uso de rotaciones oblicuas aunque generalmente esta correlación es pequeña. El uso de rotaciones oblicuas
se justica porque en muchos contextos es lógico suponer que los factores es
se justica porque en muchos contextos es lógico suponer que los factores es
--tán correlacionados. Petán correlacionados. Pese a que pueden se a que pueden ser de utilidad en algunas situaciones,ser de utilidad en algunas situaciones, estas rotaciones raramente se usan, a diferencia de las ortogonales. Entre las estas rotaciones raramente se usan, a diferencia de las ortogonales. Entre las rotaciones oblicuas,
rotaciones oblicuas, promax promax es conceptualmente simple; sin embargo, la más es conceptualmente simple; sin embargo, la más popular es
popular es oblimin oblimin ..
V
Valoracaloración dión de lae las coms comunalidunalidadesades
Además
Además del an
del análisis
álisis de la m
de la matriz
atriz de car
de cargas facto
gas factoriales
riales, es i
, es importan
mportante v
te vericar
ericar sisi
cada una de las variables incluidas en el análisis son explicadas aceptablemente cada una de las variables incluidas en el análisis son explicadas aceptablemente
por el modelo. Esto puede lograrse analizando la e
por el modelo. Esto puede lograrse analizando la estimación nal de las comu
stimación nal de las comu
--nalidades. Puesto que la comunalidad representa la proporción de la varianza nalidades. Puesto que la comunalidad representa la proporción de la varianza de la variable indicadora que es explicada pode la variable indicadora que es explicada por los factores comunes del moder los factores comunes del modelo,lo, Hair
Hair et al.et al.
(1998/1999) proponen que
(1998/1999) proponen que
las variables con una comunalidad menor a las variables con una comunalidad menor a 0.5 0.5carecen de una explicación suciente
carecen de una explicación suciente y no deberían ser consideradas en la interpreta- y no deberían ser consideradas en la
interpreta-ción nal del análisis.
ción nal del análisis.
Puntajes factoriales
Puntajes factoriales
Una vez realizado el análisis factorial, quizá con alguna rotación de los factores, Una vez realizado el análisis factorial, quizá con alguna rotación de los factores,
el paso nal es asignar los puntajes factoriales (scores) a cada individuo en la
el paso nal es asignar los puntajes factoriales (scores) a cada individuo en la
muestra. Esta construcción de puntajes genera una nueva variable por cada muestra. Esta construcción de puntajes genera una nueva variable por cada factor en el modelo. Usualmente estas variables derivadas del análisis factorial factor en el modelo. Usualmente estas variables derivadas del análisis factorial pueden utilizarse como insumo para otros procedimientos estadísticos de pueden utilizarse como insumo para otros procedimientos estadísticos de in-terés. Existen dos métodos para construir estos puntajes factoriales, a saber: terés. Existen dos métodos para construir estos puntajes factoriales, a saber: el método de Bartlett o de mínimos cuadrados ponderados y el método de el método de Bartlett o de mínimos cuadrados ponderados y el método de Thompson o
Thompson o de regreside regresión (capíón (capítulo 3)tulo 3)..
Bondad de ajuste del modelo de factores
Bondad de ajuste del modelo de factores
Dado que el análisis factorial se realiza a través de un modelo, ¿qué tan bien Dado que el análisis factorial se realiza a través de un modelo, ¿qué tan bien ajusta este modelo a nuestros datos? Un primer elemento de juicio lo constituye ajusta este modelo a nuestros datos? Un primer elemento de juicio lo constituye
la matriz de residuos, denida por:
la matriz de residuos, denida por:
que es la diferencia entre nuestra matriz observada de correlaciones y la matriz que es la diferencia entre nuestra matriz observada de correlaciones y la matriz de correlaciones re
de correlaciones reproducida por el modelo de factores. Si estas diferencias sonproducida por el modelo de factores. Si estas diferencias son
pequeñas, se puede armar que el modelo de factores ajusta bien a los datos.
pequeñas, se puede armar que el modelo de factores ajusta bien a los datos.
Los valores de estas matrices están acotados entre
Los valores de estas matrices están acotados entre –1 y 1, de modo que las
–1 y 1, de modo que las dife
dife
--rencias deben ser realmente pequeñas. Paquetes estadísticos comorencias deben ser realmente pequeñas. Paquetes estadísticos como SPSSSPSS remar-
remar-can diferencias menores o iguales a 0.05. Obsérvese además que los elementos can diferencias menores o iguales a 0.05. Obsérvese además que los elementos
en la diagonal de e
en la diagonal de esta matriz de residuos son las
sta matriz de residuos son las especicidades del model
especicidades del modeloo. Un
. Un
buen ajuste signica, en este caso, que el modelo con k factores es adecuado
buen ajuste signica, en este caso, que el modelo con k factores es adecuado
para nuestra información. para nuestra información.
Análi
Análisis fsis factoriaactorial con l con variabvariables les discretdiscretasas
El análisis factorial estándar se realiza con variables continuas; sin embargo, en El análisis factorial estándar se realiza con variables continuas; sin embargo, en muchas áreas de aplicación lo usual es tener variables medidas en escalas muchas áreas de aplicación lo usual es tener variables medidas en escalas no-minal u ordinal. En estos casos, lo adecuado es realizar el análisis respetando el minal u ordinal. En estos casos, lo adecuado es realizar el análisis respetando el orden de medición de
orden de medición de las variables invlas variables involucradas. Dado que el análisis factorial seolucradas. Dado que el análisis factorial se basa en el uso de la matriz de cor
basa en el uso de la matriz de correlación, una manera de considerar la escala derelación, una manera de considerar la escala de medición de las distintas variables involucradas en el estudio es calcular el tipo medición de las distintas variables involucradas en el estudio es calcular el tipo de correlación que cor
de correlación que corresponda a cada par de responda a cada par de variablvariables, de acuerdo con su es-es, de acuerdo con su es-cala particular. En este sentido, la tabla siguiente muestra el tipo de correlación cala particular. En este sentido, la tabla siguiente muestra el tipo de correlación que conviene calcular, de acuerdo con el orden de medición de las variables que conviene calcular, de acuerdo con el orden de medición de las variables involucradas.
involucradas.
El análisis factorial supone la existencia de una variable
El análisis factorial supone la existencia de una variable latente latente continua con continua con distribución normal. De esta manera, cuando se utilizan variables discretas distribución normal. De esta manera, cuando se utilizan variables discretas (or-dinales y dicotómicas), estás se utilizan como si fueran continuas.
dinales y dicotómicas), estás se utilizan como si fueran continuas.
EEssccaalla da de me meeddiicciióónn CCoonnttiinnuuaa C
Coonnttiinnuuaa PPeeaarrssoonn
Tetracórica Tetracórica PPoolliiccóórriiccaa PPoolliiccóórriiccaa
PPololisisereriaiall PPununto to bibiseseririalal Ordinal Ordinal Ordinal Ordinal Dicotómica Dicotómica Dicotómica Dicotómica T
Capítulo III
Capítulo III
Fundamentos técnicos del análisis factorial
Fundamentos técnicos del análisis factorial
Aspect
Aspectos foos formalesrmales
E
E
n este apartado presentaremos algunos aspectos formales de la teoría quen este apartado presentaremos algunos aspectos formales de la teoría que sustenta este análisis. La presentación se hará de manera general, sustenta este análisis. La presentación se hará de manera general, consi-derando el modeloderando el modelo multifactorial del que se desprende, como caso multifactorial del que se desprende, como caso particular,particular,
el modelo unifactorial. A lo largo
el modelo unifactorial. A lo largo de la exposición se d
de la exposición se denirán algunos de los
enirán algunos de los
conceptos relacionados con esos modelos. conceptos relacionados con esos modelos.
Supongamos que tenemos un conjunto de variables observadas
Supongamos que tenemos un conjunto de variables observadas X X 11,, X X 22,...,,..., X
X p p y se asume que en este conjunto subyacen y se asume que en este conjunto subyacen kk factores con factores con k<<pk<<p. Sin perder. Sin perder
generalidad, podemos suponer que las variables están centradas sobre sus generalidad, podemos suponer que las variables están centradas sobre sus me-dias, i.e.; tienen media
dias, i.e.; tienen media cero.cero.
Una manera usual de escribir el modelo factorial es a través de su Una manera usual de escribir el modelo factorial es a través de su represen-tación en forma matricial:
tación en forma matricial:
Donde, Donde,
Con
Con X X
, la matriz de datos, Λ la matriz de cargas factoriales, y
, la matriz de datos, Λ la matriz de cargas factoriales, y
f f y y U U son los son los vectvectores de ores de varivariables no ables no observablesobservables.. A
A f f 11,, f f 22,...,,..., f f k k se les denomina factores comunes (comunalidad) y a se les denomina factores comunes (comunalidad) y a u u 11,, u u 22,...,,...,upup