Guió de les anàlisis
Pedro López Roldán
Departament de Sociologia
Anàlisi de dades amb
Statistical Product and Service Solutions
IBM SPSS StatisticsProcediments d’anàlisi
1.
L’anàlisi de mitjanes i de variància
2.
L’anàlisi de correlació i de regressió
3.
L’anàlisi de taules de contingència
4.
L’anàlisi log-lineal i logit
5.
L’anàlisi factorial de components principals
6.
L’anàlisi de correspondències
1. L’anàlisi de mitjanes i de variància
Bibliografia:
Bardina, X.; Farré, M.; López-Roldán, P. (2005). Estadística: un
curs introductori per a estudiants de ciències socials i humanes. Volum 2. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 166. Cap. 2
López-Roldán, P.; Lozares Colina, C. (1999). Anàlisi bivariable
de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 79. Cap. 2
Sánchez Carrión, J. J. (1999). Manual de análisis estadístico de
los datos. Madrid: Alianza. Manuales, 055. Cap. 5 i 7
López-Roldán, P. (2011). L’anàlisi de variància amb SPSS. IBM SPSS Statistics Base 19. Cap. 4, 7, 9, 10 i 11.
1. L’anàlisi de mitjanes i de variància
Exercici 1: Comparació de mitjanes i anàlisi exploratòria.
Arxiu de dades: pibhab.sav
Arxiu de sintaxi: AED-pibhab.sps
Exercici 2: Comparació de mitjanes, anàlisi exploratòria i ANOVA unifactorial.
Arxiu de dades: GSS93 reducido.sav Arxiu de sintaxi: AED-Estudis.sps
Exercici 3: Comparació de mitjanes, prova de la t i ANOVA unifactorial
Arxiu de sintaxi: AV-Valoracio.sps
Exercici 4: ANOVA unifactorial i multifactorial
Arxiu de dades: Datos de empleados.sav Arxiu de sintaxi: AV-Empleados.sps
1. L’anàlisi de mitjanes i de variància
Exercici proposat:
A partir de les dades de la matriu GSS93reducido.sav seleccioneu tres variables i analitzeu la seva relació mitjançant una anàlisis de variància multifactorial:
Proposa un model de relacions entre les variables
(hipòtesis).
Realitza una anàlisi descriptiva.
Comprova els supòsit de normalitat i homoscedasticitat.
Contrasta les hipòtesis i determineu el model que s'ajusta a
les dades.
Podeu fer una anàlisi unifactorial prèvia i després multifactorial
2. L’anàlisi de correlació i de regressió
Bibliografia:
López-Roldán, P.; Lozares Colina, C. (1999). Anàlisi bivariable de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 79. Cap. 3
Sánchez Carrión, J. J. (1999). Manual de análisis estadístico de los datos.
Madrid: Alianza. Manuales, 055. Cap. 8 i 9
Bardina, X.; Farré, M.; López-Roldán, P. (2005). Estadística: un curs introductori per a estudiants de ciències socials i humanes. Volum 2. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 166. Cap. 4 i 7.
Cea D’ancona, M. A. (2002). Anàlisis multivariable. Teoría y pràctica en la investigación social. Madrid: Sintesis. Cap. 1
López-Roldán, P. (2011). L’anàlisi de regressió amb l’SPSS. IBM SPSS Statistics Base 19. Cap. 4, 12, 16.
2. L’anàlisi de correlació i de regressió
Exercici 1: Anàlisi de regressió simple de la relació entre el % de Vot del PSC a les autonòmiques de 1999 i el % d’immigració de la resta de l’Estat.
Arxiu de sintaxi: AR-VotPSC.sps Arxiu de dades: VotPSC.sav
Exercici 2: Anàlisi de regressió simple de la relació entre ideologia, ingressos i edat.
Arxiu de sintaxi: AR-Ideologia.sps
Exercici 3: Anàlisi de regressió simple i múltiple del text de J. J. Sánchez Carrión.
Arxiu de sintaxi: AR-Carrión.sps
2. L’anàlisi de correlació i de regressió
Exercici proposat: A partir de les dades de Mundo61.sav analitza la relació
entre la variable dependent "tmi" (Taxa de mortalitat infantil) i dues variables independents mitajançant una anàlisi de regressió múltiple.
Proposa un model de relacions entre les variables (hipòtesis). Per tal de
seleccionar les variables independents del model és útil examinar les correlacions entre un conjunt més nombrós de variables. Una vegada seleccionat el model:
Detecta la linealitat, l'existència de casos anòmals, la normalitat i
l'existència de col·linealitat.
Indica la capacitat explicativa del model. Interpreta l'equació de regressió múltiple.
Pots fer una anàlisi de regressió simple prèvia i després la múltiple
Exercici proposat: A partir de les dades de Barcelona.sav fes el mateix exercici
3. L’anàlisi de taules de contingència
Bibliografia:
Sánchez Carrión, J. J. (1999). Manual de análisis estadístico de
los datos. Madrid: Alianza. Manuales, 055. Cap. 6
López-Roldán, P.; Lozares Colina, C. (1999). Anàlisi bivariable
de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 79. Cap. 1
López-Roldán, P. (2011). L’anàlisi de taules de contingència amb
l’SPSS.
IBM SPSS Statistics Base 19. Cap. 5.
3. L’anàlisi de taules de contingència
Exercici 1:
Relació entre les variables abandonament
dels estudis universitaris, l'activitat laboral i l'horari, a
partir d'un total de 474 casos.
Arxiu de sintaxi: TC-Log-Abandonament.sps Dades publicades a l’article:
LATIESA, Margarita (1991). «Introducció a los modelos logarítmicos lineales». Papers. Revista de Sociologia 37. P. 97-112.
Exercici 2:
Anàlisi de la relació entre l’actitud
(“permanència de la dona a la llar”), el nivell
d’estudis i el sexe.
4. L’anàlisi log-lineal i logit
Bibliografia:
Latiesa, M. (1991). «Introducció a los modelos logarítmicos lineales».
Papers. Revista de Sociologia 37. P. 97-112.
López-Roldán, P.; Lozares Colina, C. (1999). Anàlisi bivariable de dades
estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 79. Cap. 1
Sánchez Carrión, J. J. (1984). Introducción a las técnicas de análisis
multivariable aplicadas a las ciencias sociales. Centro de Investigaciones Sociológicas, Madrid. Cap. 11
Cea d’Ancona, M. A. (2002). Análisis multivariable. Teoría y práctica en
la investigación social. Madrid: Sintesis. Cap. 2
López-Roldán, P. (2011). L’anàlisi de log-lineal. IBM SPSS Advanced Statistics 19. Cap. 9, 10, 11.
4. L’anàlisi log-lineal i logit
Exercici 1: Log-lineal de l'abandonament dels estudis universitaris, l'activitat laboral i l'horari.
Arxiu de sintaxi: TC-Log-Abandonament.sps
Exercici 2: Log-lineal de la relació entre l’actitud (“permanència de la dona a la llar”), el nivell d’estudis i el sexe.
Arxiu de sintaxi: TC-Log-Actitud.sps
Exercici 3: Logit de la relació entre els Ingressos i els Estudis, l’Antiguitat i el Permís de treball.
Arxiu de sintaxi: Logit-Immigracio.sps
Dades publicades a l’article:
SANCHEZ CARRION, Juan Javier (1984). Introducción a las técnicas de análisis multivariable aplicadas a las ciencias sociales. Centro de Investigaciones Sociológicas, Madrid. Cap. 11
5. L’anàlisi de components principals
Bibliografia:
Lozares Colina, C.; López-Roldán, P. (2000). Anàlisi
multivariable de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials 93. Cap. 3
Cea d’Ancona, M. A. (2002). Análisis multivariable. Teoría y
práctica en la investigación social. Madrid: Síntesis. Cap. 5 IBM SPSS Statistics Base 19. Cap. 22.
3. L’anàlisi de taules de contingència
Exercici proposat: A partir de les dades de la matriu GSS93 reducido.sav
selecciona tres variables i analitza la seva relació mitjançant taules de contingència.
Proposa un model de relacions entre les variables (hipòtesis).
Pots proposar relacions bivariables i/o multivariables
Comprova que es satisfan les condicions per a la seva anàlisi.
Contrasta les hipòtesis i determineu el model que s'ajusta a les dades.
Interpreta els resultats a partir dels percentatges, els residus, les V de
Cramer, els gràfics de barres.
Si consideres la variable VOTO92, pots fer l’anàlisi de l’abstencionisme amb la
variable VOT generant-la a partir de la sintaxi següent:
RECODE VOTO92 (1=1)(2=2)(ELSE=9) INTO VOT. MIS VAL VOT(9).
VARIABLE LABELS VOT 'Va votar al 1992?'.
VALUE LABELS VOT 2 'No votà' 1 'Sí votà' 9 'Sense dades'. FORMATS VOT (F1.0).
5. L’anàlisi de components principals
Exercici 1: Anàlisi de components principals amb variables del Cens de Població d’Alcobendas a partir de l’agregació de la població en seccions censals.
Arxiu de dades: Alcobendas.sav
Arxiu de sintaxi: ACP-Alcobendas.sps
Exercici proposat: Fes una anàlisi de components principals amb la selecció de 10 variables de la matriu dades Barcelona.sav.
Comprova la idoneïtat de l’anàlisi. Determina el nombre de factors.
Interpreta’ls a partir de la matriu de components i del gràfic
factorial. Pots fer una rotació varimax.
6. L’anàlisi de correspondències
Bibliografia:
Joaristi Olariaga, L.; Lizasoain Hernández, L. (1999). Análisis de
correspondencias. Madrid: La Muralla.
López-Roldán, P.; Lozares Colina, C. (1999). Anàlisi bivariable
de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 79. Cap. 1
López-Roldán, P. (2011). L’anàlisi de correspondències amb l’SPSS. IBM SPSS Categories 19. Cap. 5, 6, 12 i 13.
6. L’anàlisi de correspondències
Exercici 1: Anàlisi de correspondències simples entre el Coneixement
de la llengua catalana i l’Edat.
Arxiu de sintaxi: ACS-Català.sps
Exercici 2: Anàlisi de correspondències simples entre la Comarca i la
Població Ocupada per sectors.
Arxiu de sintaxi: ACS-Ocupació.sps
Exercici 3: Anàlisi de correspondències simples de la matriu de
distàncies entre municipis de Catalunya.
Arxiu de sintaxi: ACS-Mapa.sps
Exercici 4: Anàlisi de correspondències múltiples entre l’actitud
(“permanència de la dona a la llar”), el nivell d’estudis i el sexe.
Arxiu: TC-Log-Actitud.sps
Exercici 5: Anàlisi de correspondències múltiples de les activitats i temps de treball productiu, reproductiu i temps lliure.
Arxiu de dades: Matriu-Temps.sav Arxiu de sintaxi: ACM-Temps.sps
6. L’anàlisi de correspondències
Exercici proposat: Fes una anàlisi de correspondències múltiples de l'abandonament dels estudis universitaris, l'activitat laboral i l'horari a partir de les dades de l’arxiu de sintaxi TC-Log-Abandonament.sps
Exercici proposat: Fes una anàlisi de correspondències múltiples a partir d’una selecció de variables de la matriu GSS93 reducido.sav.
Pots replicar l’exercici de taules de contingència i ampliar-lo amb
més variables.
Determina el nombre de factors.
Interpreta’ls els factors a partir de les contribucions i del gràfic
factorial.
7. L’anàlisi de classificació
Bibliografia:
Lozares Colina, C.; López-Roldán, P. (2000). Anàlisi
multivariable de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials 93. Cap. 4
Cea d’Ancona, M. A. (2002). Anàlisis multivariable. Teoría y
pràctica en la investigación social. Madrid: Sintesis. Cap. 3 SPSS 10 Guía para el análisis de datos. Cap. 21 i 22.
7. L’anàlisi de classificació
Exercici 1: Anàlisi de classificació (conglomerats o cluster
analysis) amb variables del Cens de Població d’Alcobendas a partir de l’agregació de la població en seccions censals.
Arxiu de dades: Alcobendas.sav
Arxiu de sintaxi: ACL-Alcobendas.sps
Exercici 2: Anàlisi de classificació a partir de l’anàlisi de les activitats i temps de treball productiu, reproductiu i temps lliure.
Arxiu de dades: Matriu-Temps.sav Arxiu de sintaxi: ACL-Temps.sps
7. L’anàlisi de classificació
Exercici proposat: Fes una anàlisi de classificació a partir dels factors resultants de la selecció de 10 variables de la matriu dades Barcelona.sav amb les que vas fer l’anàlisi de components principals.
Escull el mètode classificatori i determina el nombre de grups. Descriu i interpreta els grups o tipus que s’obtenen.
Fes una representació factorial dels individus segons el grup al qual
pertanyen.
Exercici proposat: Fes igualment una anàlisi de classificació a partir dels factors obtinguts amb la selecció de variables de la matriu GSS93 reducido.sav de l’exercici d’anàlisi de correspondències múltiples.