Anàlisi de dades amb

Texto completo

(1)

Guió de les anàlisis

Pedro López Roldán

Departament de Sociologia

Anàlisi de dades amb

Statistical Product and Service Solutions

IBM SPSS Statistics

(2)

Procediments d’anàlisi

1.

L’anàlisi de mitjanes i de variància

2.

L’anàlisi de correlació i de regressió

3.

L’anàlisi de taules de contingència

4.

L’anàlisi log-lineal i logit

5.

L’anàlisi factorial de components principals

6.

L’anàlisi de correspondències

(3)

1. L’anàlisi de mitjanes i de variància

Bibliografia:

 Bardina, X.; Farré, M.; López-Roldán, P. (2005). Estadística: un

curs introductori per a estudiants de ciències socials i humanes. Volum 2. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 166. Cap. 2

 López-Roldán, P.; Lozares Colina, C. (1999). Anàlisi bivariable

de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 79. Cap. 2

 Sánchez Carrión, J. J. (1999). Manual de análisis estadístico de

los datos. Madrid: Alianza. Manuales, 055. Cap. 5 i 7

 López-Roldán, P. (2011). L’anàlisi de variància amb SPSS.  IBM SPSS Statistics Base 19. Cap. 4, 7, 9, 10 i 11.

(4)

1. L’anàlisi de mitjanes i de variància

 Exercici 1: Comparació de mitjanes i anàlisi exploratòria.

 Arxiu de dades: pibhab.sav

 Arxiu de sintaxi: AED-pibhab.sps

 Exercici 2: Comparació de mitjanes, anàlisi exploratòria i ANOVA unifactorial.

 Arxiu de dades: GSS93 reducido.sav  Arxiu de sintaxi: AED-Estudis.sps

 Exercici 3: Comparació de mitjanes, prova de la t i ANOVA unifactorial

 Arxiu de sintaxi: AV-Valoracio.sps

 Exercici 4: ANOVA unifactorial i multifactorial

 Arxiu de dades: Datos de empleados.sav  Arxiu de sintaxi: AV-Empleados.sps

(5)

1. L’anàlisi de mitjanes i de variància

Exercici proposat:

A partir de les dades de la matriu GSS93

reducido.sav seleccioneu tres variables i analitzeu la seva relació mitjançant una anàlisis de variància multifactorial:

 Proposa un model de relacions entre les variables

(hipòtesis).

 Realitza una anàlisi descriptiva.

 Comprova els supòsit de normalitat i homoscedasticitat.

 Contrasta les hipòtesis i determineu el model que s'ajusta a

les dades.

 Podeu fer una anàlisi unifactorial prèvia i després multifactorial

(6)

2. L’anàlisi de correlació i de regressió

Bibliografia:

 López-Roldán, P.; Lozares Colina, C. (1999). Anàlisi bivariable de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 79. Cap. 3

 Sánchez Carrión, J. J. (1999). Manual de análisis estadístico de los datos.

Madrid: Alianza. Manuales, 055. Cap. 8 i 9

 Bardina, X.; Farré, M.; López-Roldán, P. (2005). Estadística: un curs introductori per a estudiants de ciències socials i humanes. Volum 2. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 166. Cap. 4 i 7.

 Cea D’ancona, M. A. (2002). Anàlisis multivariable. Teoría y pràctica en la investigación social. Madrid: Sintesis. Cap. 1

 López-Roldán, P. (2011). L’anàlisi de regressió amb l’SPSS.  IBM SPSS Statistics Base 19. Cap. 4, 12, 16.

(7)

2. L’anàlisi de correlació i de regressió

 Exercici 1: Anàlisi de regressió simple de la relació entre el % de Vot del PSC a les autonòmiques de 1999 i el % d’immigració de la resta de l’Estat.

 Arxiu de sintaxi: AR-VotPSC.sps  Arxiu de dades: VotPSC.sav

 Exercici 2: Anàlisi de regressió simple de la relació entre ideologia, ingressos i edat.

 Arxiu de sintaxi: AR-Ideologia.sps

 Exercici 3: Anàlisi de regressió simple i múltiple del text de J. J. Sánchez Carrión.

 Arxiu de sintaxi: AR-Carrión.sps

(8)

2. L’anàlisi de correlació i de regressió

 Exercici proposat: A partir de les dades de Mundo61.sav analitza la relació

entre la variable dependent "tmi" (Taxa de mortalitat infantil) i dues variables independents mitajançant una anàlisi de regressió múltiple.

 Proposa un model de relacions entre les variables (hipòtesis). Per tal de

seleccionar les variables independents del model és útil examinar les correlacions entre un conjunt més nombrós de variables. Una vegada seleccionat el model:

 Detecta la linealitat, l'existència de casos anòmals, la normalitat i

l'existència de col·linealitat.

 Indica la capacitat explicativa del model.  Interpreta l'equació de regressió múltiple.

 Pots fer una anàlisi de regressió simple prèvia i després la múltiple

 Exercici proposat: A partir de les dades de Barcelona.sav fes el mateix exercici

(9)

3. L’anàlisi de taules de contingència

Bibliografia:

 Sánchez Carrión, J. J. (1999). Manual de análisis estadístico de

los datos. Madrid: Alianza. Manuales, 055. Cap. 6

 López-Roldán, P.; Lozares Colina, C. (1999). Anàlisi bivariable

de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 79. Cap. 1

 López-Roldán, P. (2011). L’anàlisi de taules de contingència amb

l’SPSS.

 IBM SPSS Statistics Base 19. Cap. 5.

(10)

3. L’anàlisi de taules de contingència

Exercici 1:

Relació entre les variables abandonament

dels estudis universitaris, l'activitat laboral i l'horari, a

partir d'un total de 474 casos.

 Arxiu de sintaxi: TC-Log-Abandonament.sps  Dades publicades a l’article:

LATIESA, Margarita (1991). «Introducció a los modelos logarítmicos lineales». Papers. Revista de Sociologia 37. P. 97-112.

Exercici 2:

Anàlisi de la relació entre l’actitud

(“permanència de la dona a la llar”), el nivell

d’estudis i el sexe.

(11)

4. L’anàlisi log-lineal i logit

Bibliografia:

 Latiesa, M. (1991). «Introducció a los modelos logarítmicos lineales».

Papers. Revista de Sociologia 37. P. 97-112.

 López-Roldán, P.; Lozares Colina, C. (1999). Anàlisi bivariable de dades

estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 79. Cap. 1

 Sánchez Carrión, J. J. (1984). Introducción a las técnicas de análisis

multivariable aplicadas a las ciencias sociales. Centro de Investigaciones Sociológicas, Madrid. Cap. 11

 Cea d’Ancona, M. A. (2002). Análisis multivariable. Teoría y práctica en

la investigación social. Madrid: Sintesis. Cap. 2

 López-Roldán, P. (2011). L’anàlisi de log-lineal.  IBM SPSS Advanced Statistics 19. Cap. 9, 10, 11.

(12)

4. L’anàlisi log-lineal i logit

 Exercici 1: Log-lineal de l'abandonament dels estudis universitaris, l'activitat laboral i l'horari.

 Arxiu de sintaxi: TC-Log-Abandonament.sps

 Exercici 2: Log-lineal de la relació entre l’actitud (“permanència de la dona a la llar”), el nivell d’estudis i el sexe.

 Arxiu de sintaxi: TC-Log-Actitud.sps

 Exercici 3: Logit de la relació entre els Ingressos i els Estudis, l’Antiguitat i el Permís de treball.

 Arxiu de sintaxi: Logit-Immigracio.sps

Dades publicades a l’article:

SANCHEZ CARRION, Juan Javier (1984). Introducción a las técnicas de análisis multivariable aplicadas a las ciencias sociales. Centro de Investigaciones Sociológicas, Madrid. Cap. 11

(13)

5. L’anàlisi de components principals

Bibliografia:

 Lozares Colina, C.; López-Roldán, P. (2000). Anàlisi

multivariable de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials 93. Cap. 3

 Cea d’Ancona, M. A. (2002). Análisis multivariable. Teoría y

práctica en la investigación social. Madrid: Síntesis. Cap. 5  IBM SPSS Statistics Base 19. Cap. 22.

(14)

3. L’anàlisi de taules de contingència

 Exercici proposat: A partir de les dades de la matriu GSS93 reducido.sav

selecciona tres variables i analitza la seva relació mitjançant taules de contingència.

 Proposa un model de relacions entre les variables (hipòtesis).

 Pots proposar relacions bivariables i/o multivariables

 Comprova que es satisfan les condicions per a la seva anàlisi.

 Contrasta les hipòtesis i determineu el model que s'ajusta a les dades.

 Interpreta els resultats a partir dels percentatges, els residus, les V de

Cramer, els gràfics de barres.

 Si consideres la variable VOTO92, pots fer l’anàlisi de l’abstencionisme amb la

variable VOT generant-la a partir de la sintaxi següent:

RECODE VOTO92 (1=1)(2=2)(ELSE=9) INTO VOT. MIS VAL VOT(9).

VARIABLE LABELS VOT 'Va votar al 1992?'.

VALUE LABELS VOT 2 'No votà' 1 'Sí votà' 9 'Sense dades'. FORMATS VOT (F1.0).

(15)

5. L’anàlisi de components principals

 Exercici 1: Anàlisi de components principals amb variables del Cens de Població d’Alcobendas a partir de l’agregació de la població en seccions censals.

 Arxiu de dades: Alcobendas.sav

 Arxiu de sintaxi: ACP-Alcobendas.sps

 Exercici proposat: Fes una anàlisi de components principals amb la selecció de 10 variables de la matriu dades Barcelona.sav.

 Comprova la idoneïtat de l’anàlisi.  Determina el nombre de factors.

 Interpreta’ls a partir de la matriu de components i del gràfic

factorial. Pots fer una rotació varimax.

(16)

6. L’anàlisi de correspondències

Bibliografia:

 Joaristi Olariaga, L.; Lizasoain Hernández, L. (1999). Análisis de

correspondencias. Madrid: La Muralla.

 López-Roldán, P.; Lozares Colina, C. (1999). Anàlisi bivariable

de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials, 79. Cap. 1

 López-Roldán, P. (2011). L’anàlisi de correspondències amb l’SPSS.  IBM SPSS Categories 19. Cap. 5, 6, 12 i 13.

(17)

6. L’anàlisi de correspondències

 Exercici 1: Anàlisi de correspondències simples entre el Coneixement

de la llengua catalana i l’Edat.

 Arxiu de sintaxi: ACS-Català.sps

 Exercici 2: Anàlisi de correspondències simples entre la Comarca i la

Població Ocupada per sectors.

 Arxiu de sintaxi: ACS-Ocupació.sps

 Exercici 3: Anàlisi de correspondències simples de la matriu de

distàncies entre municipis de Catalunya.

 Arxiu de sintaxi: ACS-Mapa.sps

 Exercici 4: Anàlisi de correspondències múltiples entre l’actitud

(“permanència de la dona a la llar”), el nivell d’estudis i el sexe.

 Arxiu: TC-Log-Actitud.sps

 Exercici 5: Anàlisi de correspondències múltiples de les activitats i temps de treball productiu, reproductiu i temps lliure.

 Arxiu de dades: Matriu-Temps.sav  Arxiu de sintaxi: ACM-Temps.sps

(18)

6. L’anàlisi de correspondències

 Exercici proposat: Fes una anàlisi de correspondències múltiples de l'abandonament dels estudis universitaris, l'activitat laboral i l'horari a partir de les dades de l’arxiu de sintaxi TC-Log-Abandonament.sps

 Exercici proposat: Fes una anàlisi de correspondències múltiples a partir d’una selecció de variables de la matriu GSS93 reducido.sav.

 Pots replicar l’exercici de taules de contingència i ampliar-lo amb

més variables.

 Determina el nombre de factors.

 Interpreta’ls els factors a partir de les contribucions i del gràfic

factorial.

(19)

7. L’anàlisi de classificació

Bibliografia:

 Lozares Colina, C.; López-Roldán, P. (2000). Anàlisi

multivariable de dades estadístiques. Bellaterra (Barcelona): Universitat Autònoma de Barcelona. Col·lecció Materials 93. Cap. 4

 Cea d’Ancona, M. A. (2002). Anàlisis multivariable. Teoría y

pràctica en la investigación social. Madrid: Sintesis. Cap. 3  SPSS 10 Guía para el análisis de datos. Cap. 21 i 22.

(20)

7. L’anàlisi de classificació

 Exercici 1: Anàlisi de classificació (conglomerats o cluster

analysis) amb variables del Cens de Població d’Alcobendas a partir de l’agregació de la població en seccions censals.

 Arxiu de dades: Alcobendas.sav

 Arxiu de sintaxi: ACL-Alcobendas.sps

 Exercici 2: Anàlisi de classificació a partir de l’anàlisi de les activitats i temps de treball productiu, reproductiu i temps lliure.

 Arxiu de dades: Matriu-Temps.sav  Arxiu de sintaxi: ACL-Temps.sps

(21)

7. L’anàlisi de classificació

 Exercici proposat: Fes una anàlisi de classificació a partir dels factors resultants de la selecció de 10 variables de la matriu dades Barcelona.sav amb les que vas fer l’anàlisi de components principals.

 Escull el mètode classificatori i determina el nombre de grups.  Descriu i interpreta els grups o tipus que s’obtenen.

 Fes una representació factorial dels individus segons el grup al qual

pertanyen.

 Exercici proposat: Fes igualment una anàlisi de classificació a partir dels factors obtinguts amb la selecció de variables de la matriu GSS93 reducido.sav de l’exercici d’anàlisi de correspondències múltiples.

Figure

Actualización...

Referencias

Actualización...

Related subjects :