Exemple d’Anàlisi Factorial
Font: Kim, J, & C, W, Mueller (1978) Introduction to Factor Analysis (p, 52)
1. Objectiu de l’anàlisi
En una enquesta s’ha demanat a 100 persones que expressin en una escala les seves opinions sobre sis aspectes de política relacionats amb l’acció de govern.
V1 = El govern hauria d'invertir més diners en educació V2 = El govern hauria d'invertir més diners en reduir l'atur
V3 = El govern hauria de tenir un major control sobre les grans empreses V4 = El govern hauria d'evitar l'exclusió a través de l'ocupació
V5 = El govern hauria de garantir que es reservés una quota de llocs de treball per les minories
V6 = El govern hauria d'ampliar els programes de protecció social
No obstant, nosaltres no disposem del fitxer de dades. Tan sols tenim la matriu de correlacions entre les sis variables. A partir d’aquesta informació, podem realitzar una anàlisi factorial i extreure dos factors que expliquin les correlacions observades entre les sis variables originals.
2. Procediment per a realitzar AF amb SPSS: sintaxis
Treballarem amb arxius de sintaxis de SPSS, en els quals cal escriure els comandaments necessaris per a realitzar l’anàlisi i després executar-los. En primer lloc, hem de
demanar al programa que capturi la matriu de correlacions entre les sis variables. Les instruccions són les següents:
matrix data variables = v1 to v6 /contents = corr /N = 100 / format = full. begin data 1 ,5461 ,4734 ,1119 ,0387 ,2639 ,5461 1 ,4284 ,1625 ,1348 ,2070 ,4734 ,4284 1 ,0673 ,0275 ,1597 ,1119 ,1625 ,0673 1 ,3804 ,2817 ,0387 ,1348 ,0275 ,3804 1 ,1543 ,2639 ,2070 ,1597 ,2817 ,1543 1 end data. variable labels v1 'educació' v2 'atur' v3 'control empreses' v4 'exclusió' v5 'minories' V6 'protecció'.
En la primera fila indiquem que entrem una matriu de dades amb 6 variables, que els nombres són correlacions corresponents a 100 individus i que la matriu és complerta (quadrada i no triangular com a vegades són les matrius de correlacions).
En la segona fila indiquem que comença l’entrada de dades, després posem les dades i, finalment, indiquem que s’ha acabat l’entrada de dades.
El darrer comandament indica quina és l’etiqueta de cada variable.
Encara que no és el procediment més adequat, comencem fent l’estimació dels factors per components principals. Les instruccions per a realitzar l’anàlisi factorial són les següents:
factor /matrix = in(cor= ) /analysis = v1 to v6 /criteria factors(2)
/print initial extraction rotation fscore /plot eigen rotation (1,2)
/extraction = pc /rotation = varimax /method = correlation.
S’indica que les dades són correlacions, quines són les variables a analitzar, quants factors es vol extreure (dos en aquest cas), quins resultats volem que ens mostri
(l’extracció inicial, la resultant de la rotació i les puntuacions per al càlcul dels factors), quins gràfics ha de presentar (el dels valors propis i el de les variables en els dos
primers factors obtinguts en la rotació), el mètode d’extracció dels factors (components principals), el tipus de rotació a aplicar i que el mètode de treball és amb correlacions.
A continuació es presenta i es comenta l’uotput d’aquesta anàlisi.
3. Output de l’AF amb SPSS: extracció per components principals
A. factorial
Comunalidades 1,000 ,708 1,000 ,639 1,000 ,601 1,000 ,666 1,000 ,599 1,000 ,367 educació atur control empreses exclusió minories protecció Inicial ExtracciónMétodo de extracción: Análisis de Componentes principales.
Les dues components retingudes expliquen in 70,8% de la variació inicial de la variable educació, un 63,9 de la de la variable atur i així successivament.
Podem observar com la variable protecció (opinió sobre si el govern hauria d’ampliar els programes de protecció social) és la que queda pitjor representada per les dues components, tant sols en un 36,7%.
Varianza total explicada
Componente Autovalores iniciales
Sumas de las saturaciones al cuadrado de la extracción
Suma de las saturaciones al cuadrado de la rotación Total % de la varianza % acumulado Total % de la varianza % acumulado Total % de la varianza % acumulado 1 2,216 36,936 36,936 2,216 36,936 36,936 2,021 33,687 33,687 2 1,363 22,717 59,654 1,363 22,717 59,654 1,558 25,966 59,654 3 ,821 13,678 73,331 4 ,592 9,861 83,193 5 ,574 9,573 92,765 6 ,434 7,235 100,000 Método de extracción: Análisis de Componentes principales.
Les tres columnes de la part esquerra d’aquest quadre ens indiquen els valors propis de cada una de les components (la variància de cadascuna d’elles), el percentatge que aquesta variància representa sobre la variació total i el percentatge acumulat respectivament. Per exemple, el valor propi de la primera component és 2,216. La variació total és 6 (ja que tinc 6 variables, cadascuna d’elles amb variància 1). Per tant, el percentatge de la variació total corresponent a la primera component principal és 2,216*100/6 = 36,936. Anàlogament, el % de la variació total corresponent a la segona component és 22,717. El percentatge acumulat entre la primera i la segona és, doncs, 36,936 + 22,717 = 59,654.
Les tres columnes centrals de la taula reprodueixen la mateixa informació que les de l’esquerra però només per a les components de l’extracció inicial retingudes pel model.
Les tres darreres columnes reprodueixen la mateixa informació que les tres centrals però corresponent a l’extracció final un cop aplicada la rotació. Podem observar com els percentatges de variació explicada per la primera i segona component respectivament varien una mica respecte els de l’extracció inicial. En total, les dues components expliquen quasi un 60% de la variació total.
Gráfico de sedimentación Número de componente 6 5 4 3 2 1 Au to va lo r 2,5 2,0 1,5 1,0 ,5 0,0
El gràfic de sedimentació mostra els valors propis de cada component. Serveix per a orientar-nos sobre el nombre adequat de factors a retenir.
Matriz de componentesa ,772 -,334 ,768 -,221 ,672 -,386 ,436 ,690 ,328 ,701 ,529 ,295 educació atur control empreses exclusió minories protecció 1 2 Componente
Método de extracción: Análisis de componentes principales. 2 componentes extraídos
a.
La matriu de components mostra els resultats de l’extracció inicial. Els valors que hi ha a cada casella són les correlacions entre les dues primeres components i les variables inicials.
A fi de facilitar la interpretació dels factors, voldríem que aquesta matriu tingués una
estructura simple, en la que un grup de variables correlacionés fortament amb el primer
factor i molt poc amb el segon i un altre grup de variables ho fes a l’inrevés. Per tal d’aconseguir una estructura d’aquest tipus, apliquem una rotació.
Matriz de componentes rotadosa
,838 ,076 ,780 ,173 ,775 -,018 ,053 ,814 -,047 ,773 ,324 ,512 educació atur control empreses exclusió minories protecció 1 2 Componente
Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Varimax con Kaiser.
La rotación ha convergido en 3 iteraciones. a.
La matriu de components rotats mostra la correlació de cadascuna de les sis variables amb les dues components extretes en aquest model.
• La primera component està fortament correlacionada amb l’opinió sobre com hauria d’actuar el govern amb temes d’educació, atur i control d’empreses.
• La segona component està fortament correlacionada amb l’opinió sobre l’actuació del govern en els temes d’exclusió social i tracte a les minories.
• La variable que conté l’opinió sobre els programes de protecció social, està correlacionada amb les dues components, tot i que ho està més amb la segona.
De fet, un esquema del el model factorial resultant, en el que per a facilitar la
interpretació no dibuixem les fletxes corresponents a les correlacions inferors a 0,20, és el següent: Educació e1 Factor 1 Atur e2 Control empreses e3 Protecció e4 Factor 2 Exclusió e5 Minories e6 comunalitats unicitats
És a dir, cada variable es descomposa en una part que és deguda a l’efecte dels factors comuns (comunalitat) i una part que és específica (unicitat) que està incorrelacionada amb les parts específiques de la resta de variables.
Valor de la variable = comunalitat + unicitat
A partir de la informació continguda en la matriu de components rotats podem escriure el sistema d’equacions d’aquest model:
Educació = 0,838 · F1 + 0,076 · F2 + e1 Atur = 0,780 · F1 + 0,173 · F2 + e2 Control empreses = 0,775 · F1 – 0,018 · F2 + e3 Protecció = 0,324 · F1 + 0,512 · F2 + e4 Exclusió = 0,053 · F1 + 0,814 · F2 + e5 Minories = -0,047 · F1 + 0,773 · F2 + e6
No obstant en aquest model, degut a què hem extret els factors pel mètode de components principals, les unicitats de les diferents variables sí que estan
correlacionades. En efecte, totes elles són una combinació lineal de les components tercera quarta cinquena i sisena que no hem retingut en el model.
Matriz de transformación de las componentes ,878 ,478 -,478 ,878 Componente 1 2 1 2
Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Varimax con Kaiser.
La matriu de transformació de les components ens dóna la correlació entre les components de l’extracció inicial i les de l’extracció final un cop aplicada la rotació. Aquests coeficients ens donen informació sobre l’angle de la rotació.
En aquest cas, la rotació és de 61,44º ja que Cos(61,44)=0,478
Gráfico de componentes en espacio rotado
Componente 1
1,0 ,5 0,0 -,5 -1,0Componente 2
1,0 ,5 0,0 -,5 -1,0 protecció minoriesexclusió control empreses atur educacióEl gràfic de les components en l’espai rotat mostra los 6 variables en el pla format per les dues primeres components rotades. Les coordenades de cada punt són els valors que apareixen en la matriu de components rotats. Podem observar com hi ha tres variables
molt correlacionades amb la primera component, dues més molt correlacionades amb la segona, i una que queda a mig camí entre els dos blocs.
Matriz de coeficientes para el cálculo de las puntuaciones en las componentes
,423 -,049 ,382 ,023 ,402 -,104 -,069 ,539 -,116 ,523 ,106 ,304 educació atur control empreses exclusió minories protecció 1 2 Componente
Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Varimax con Kaiser.
La matriu de coeficients per al càlcul de les puntuacions en les components permet expressar els valors de cadascun dels dos factors com a combinació lineal del valor de les variables originals. Les equacions en aquest cas són:
F1 = 0,423 · Educació + 0,382 · Atur + 0,402 · Control empreses – 0,069 · Exclusió – 0,116 · Minories + 0,106 · Protecció
F2 = - 0,49 · Educació + 0,023 · Atur - 0,104 · Control empreses + 0,539 · Exclusió + 0,523 · Minories + 0,304 · Protecció
Matriz de covarianza de las puntuaciones de las componentes
1,000 ,000 ,000 1,000 Componente 1 2 1 2
Método de extracción: Análisis de componentes principales. Método de rotación: Normalización Varimax con Kaiser.
La matriu de covariància de les puntuacions de les components ens indica quina és la correlació entre les dues components. Com que en aquest cas hem aplicat una rotació ortogonal (Varimax), les dues components continuen sent incorrelacionades i els respectius eixos formen un angle de 90º. Però si haguéssim aplicat una rotació obliqua, en aquesta taula trobaríem informació sobre el grau de correlació que hi ha entre les dues components.
4. Output de l’AF amb SPSS: extracció per màxima versemblança
Les instruccions per tal de realitzar una anàlisi factorial d’aquestes mateixes dades amb extracció dels factors pel mètode de la màxima versemblança (ML) són les següents:
factor /matrix = in(cor= *) /analysis = v1 to v6 /criteria factors(2)
/print initial extraction rotation fscore /plot eigen rotation (1,2)
/extraction = ml /rotation = varimax /method = correlation.
L’únic canvi respecte la sintaxi aplicada en l’anàlisi anterior és el mètode d’extracció que és “ml” i abans era “pc”
Els resultats d’aquesta anàlisi són els següents:
A. factorial
Comunalidadesa ,388 ,629 ,352 ,486 ,266 ,366 ,201 ,623 ,155 ,234 ,139 ,182 educació atur control empreses exclusió minories protecció Inicial ExtracciónMétodo de extracción: Máxima verosimilitud. Se han encontrado una o más estimaciones de comunalidad mayores que 1 durante las iteraciones. La solución resultante deberá ser interpretada con precaución.
a.
Varianza total explicada
2,216 36,936 36,936 1,693 28,209 28,209 1,527 25,450 25,450 1,363 22,717 59,654 ,827 13,786 41,995 ,993 16,545 41,995 ,821 13,678 73,331 ,592 9,861 83,193 ,574 9,573 92,765 ,434 7,235 100,00 Factor 1 2 3 4 5 6 Total % de la varianz a % acumu lado Total % de la varianz a % acumu lado Total % de la varianz a % acumu lado Autovalores iniciales
Sumas de las saturaciones al cuadrado de la extracción
Suma de las saturaciones al cuadrado de la rotación
Gráfico de sedimentación Número de factor 6 5 4 3 2 1 Au to va lo r 2,5 2,0 1,5 1,0 ,5 0,0 Matriz factoriala ,747 -,266 ,682 -,144 ,561 -,227 ,392 ,685 ,230 ,426 ,385 ,182 educació atur control empreses exclusió minories protecció 1 2 Factor
Método de extracción: Máxima verosimilitud.
2 factores extraídos. Requeridas 12 iteraciones. a.
Prueba de la bondad de ajuste
1,039 4 ,904
Chi-cuadrado gl Sig.
Matriz de factores rotadosa
,789 ,076 ,678 ,159 ,604 ,033 ,064 ,787 ,028 ,483 ,271 ,328 educació atur control empreses exclusió minories protecció 1 2 Factor
Método de extracción: Máxima verosimilitud.
Método de rotación: Normalización Varimax con Kaiser. La rotación ha convergido en 3 iteraciones. a.
Matriz de transformación de los factores
,905 ,424 -,424 ,905 Factor 1 2 1 2
Método de extracción: Máxima verosimilitud.
Gráfico de factor en espacio factoria
Factor 1 1,0 ,5 0,0 -,5 -1,0 Factor 2 1,0 ,5 0,0 -,5 -1,0 protecció minories exclusió control empreses atur educacióMatriz de coeficientes para el cálculo de las puntuaciones factoriales
,507 -,042 ,305 ,034 ,229 -,032 -,066 ,678 -,023 ,205 ,060 ,115 educació atur control empreses exclusió minories protecció 1 2 Factor
Método de extracción: Máxima verosimilitud.
Método de rotación: Normalización Varimax con Kaiser. Matriz de covarianza de las puntuaciones factoriales
,757 ,051 ,051 ,672 Factor 1 2 1 2
Método de extracción: Máxima verosimilitud.