• No se han encontrado resultados

Pràctica 1 INICIACIÓ A L ÚS DEL PROGRAMA ESTADÍSTIC SPSS

N/A
N/A
Protected

Academic year: 2021

Share "Pràctica 1 INICIACIÓ A L ÚS DEL PROGRAMA ESTADÍSTIC SPSS"

Copied!
15
0
0

Texto completo

(1)

Pràctica 1

INICIACIÓ A L’ÚS DEL PROGRAMA

ESTADÍSTIC SPSS

Objectius:

En aquesta pràctica, es pretén familiaritzar els estudiants amb el programa informàtic SPSS. Al llarg de la pràctica aprendrem a definir i introduir dades, utilitzar l‟editor d‟aquesta aplicació informàtica, crear noves variables com a transformació de les variables originals, filtrar dades i ponderar arxius de dades.

Índex:

1. Introducció al programa 2. Tipus de variables

3. Edició, transformació i recodificació de variables 4. Filtres.

(2)

1. Introducció al programa

El programa SPSS (Statistical Package for Social Sciences) per a Windows és una aplicació especialitzada en el tractament estadístic de dades.

El programa treballa principalment amb 2 tipus d‟arxius:

Tipus d’arxiu Extensió dades pròpies de SPSS .sav resultats de SPSS .spv

A més a més, permet importar arxius creats amb altres aplicacions com fulls de càlcul i bases de dades, així com exportar dades, taules de resultats i gràfiques.

En Inicio/Programas/SPSS Inc/Statistics 17.0, seleccionem “SPSS Statistics 17.0” i s‟obrirà una finestra d‟opcions:

L‟opció seleccionada per defecte és Abrir un origen de datos existente. SPSS també disposa d‟un tutorial que permet, en poc temps, veure les possibilitats d‟aquesta aplicació estadística.

Si seleccionem Introducir datos i polsem a continuació en Aceptar, s‟obri la finestra d‟edició de dades:

(3)

En la part inferior de la pantalla principal apareix la barra d’estat en la qual hi ha informació sobre el processador de SPSS (SPSS Statistics El procesador está listo), a més de dos pestanyes que permeten seleccionar "Vista de datos" o "Vista de

variables".

En la part superior apareix la barra de menús i sota ella una altra barra amb icones associades als menús més utilitzats. Al situar el punter del ratolí sobre qualsevol de les icones, apareix informació sobre l‟operació associada.

Archivo Crear, obrir, tancar o guardar els diferents arxius de SPSS, obrir bases de dades, llegir dades de text, ..., imprimir, accés directe a les dades utilitzades recentment, eixir del SPSS.

Edición Desfer, copiar, tallar, pegar, eliminar, insertar variable, anar a un cas, opcions.

Ver Barra d‟estat, Barres de ferramentes, Fonts, Quadrícula, Etiquetes de valor, Dades.

Datos Definir propietats de variables, ..., ordenar casos, seleccionar casos, ponderar casos.

Transformar Modificació i generació de noves variables. Calcular, Recodificar,... Analizar Des d‟aquest menú s‟accedeix a tots els procediments estadístics

instal·lats en l‟aplicació.

Gráficos Creació i edició de diversos tipus de gràfiques.

Utilidades Accedeix a la informació sobre variables i altres utilitats.

Ventana Permet seleccionar i organitzar totes les finestres actives.

Abans de començar l‟anàlisi de les dades convé, sempre, preparar-les per al seu millor maneig i interpretació.

(4)

Els arxius de dades tenen la forma de una taula en la qual cada fila representa els valors que un individu determinat té per a unes variables. En terminologia de SPSS cada fila és un cas. En les columnes de la taula apareixen els diferents valors que una variable determinada pren per a cadascun dels individus d‟aquest grup.

En aquest document per a referir-nos a un arxiu de dades evitarem l‟extensió „.sav‟. Per exemple l‟arxiu „dedos.sav‟ s‟anomenarà simplement „dedos‟.

Vegem com obrir un arxiu de dades :

1) Crea una carpeta en l‟escriptori de l‟ordinador, per exemple Dades. A continuació, còpia l‟arxiu GLUCOSA (disponible en Aula Virtual) en la carpeta que has creat en l‟escriptori.

2) En SPSS, selecciona el menú Archivo/Abrir/Datos i, en la finestra que apareix, busca la carpeta anterior i selecciona l‟arxiu GLUCOSA.

2. Tipus de variables

Les variables en SPSS no tenen el mateix nom que els que hem utilitzat en Teoria però és fàcil adonar-se que són similars, únicament que SPSS permet afegir més informació a les seues variables. Utilitzarem un exemple per a il·lustrar aquesta idea.

Arxiu de dades GLUCOSA:

Aquest arxiu recull les dades obtingudes en un projecte d‟investigació en el qual es comparaven els nivells de glucosa en sang en dones embarassades i dones control. S‟estudiaren 40 dones embarassades i 40 no embarassades. L‟experiment consistia en mesurar el nivell de glucosa en sang (mg/dl) abans i una hora després d‟ingerir un xarop ensucrat, en les setmanes 8, 20 i 32 de gestació per a les dones embarassades i en els mateixos intervals de temps per a les no embarassades.

Les dades obtingudes es troben en les següents variables:

embarazo: indica si la dona està embarassada o no

( 1 = sí embarassada, 0 = no embarassada )

g1antes: nivell de glucosa en sang, abans del xarop, en la setmana 8 de gestació g1des: nivell de glucosa en sang, una hora després del xarop, en la setmana 8 de

gestació

g2antes: nivell de glucosa en sang, abans del xarop, en la setmana 20 de gestació g2des: nivell de glucosa, una hora després del xarop, en la setmana 20 de gestació

g3antes: nivell de glucosa en sang, abans del xarop, en la setmana 32 de gestació g3des: nivell de glucosa, una hora després del xarop, en la setmana 32 de gestació

(5)

Observa que al fer clic sobre la icona d‟etiquetes la columna de embarazo canvia la seua presentació.

El primer pas a realitzar per a crear un arxiu de dades, on no s‟ha introduït encara cap dada, és definir les variables. L‟arxiu GLUCOSA ja està creat i, a partir d‟ell anem a veure com està definida cada variable. Tenim tres procediments:

Fer doble clic sobre l‟encapçalament de la variable.

Seleccionar, en la part inferior, la pestanya Vista de variables. En el menú Utilidades seleccionar Variables.

Vegem com estan definides les variables de l‟arxiu GLUCOSA. Selecciona, per exemple, Vista de variables. Apareix la finestra:

Observa que hi ha una fila per a cada variable i que existeixen 10 columnes: Nombre,

Tipo, Anchura, Decimales, Etiqueta, Valores, Perdidos, Columnas, Alineación i Medida. La definició d‟una variable es basa en les opcions que s‟ofereixen en aquesta

finestra:

Nombre. Defineix el nom de la variable, complint les regles següents: No utilitzar símbols com &, /, $, etc., ni espais en blanc.

No començar amb un número.

No utilitzar noms reservats com ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO, o WITH.

Tipo. Defineix el tipus de la variable, indicant Anchura (espais necessaris per a contenir la part entera, el separador decimal i els decimals) i Decimales.

SPSS permet treballar amb els següents tipus de variables:

Numérico: format numèric estàndard (separador decimal definit pel sistema operatiu, en el nostre país és la coma).

Coma: comes de separació cada tres posicions. Un punt per a la part decimal (sistema anglo-saxó).

Punto: al contrari que l‟anterior (sistema llatí).

Notación Científica: ús de la E per a exponent. Per exemple, 2,34E2 equival a 234.

Cadena: variable alfanumèrica (cadenes de caràcters).

(6)

Si escrivim el nom d‟una variable, SPSS la defineix per defecte Numèrica 8.2, la qual cosa significa: Anchura: 8 i Decimales: 2; és a dir, una amplària de columna de 8 espais, sent els 2 últims per als decimals (el separador decimal ocupa una posició). Fes un clic sobre el quadre corresponent al Tipo en la variable g1antes. Polsa, ara en el quadre colorat amb tres punts i observa aquestes possibilitats.

Alterna les seleccions dels tipus no numèrics: Fecha, Dólar, Moneda personalizada i Cadena i observa els formats permesos.

Per a eixir, sense modificar el tipus original de la variable, polsa Cancelar.

Etiqueta. És opcional definir una etiqueta descriptiva de cada variable que permet identificadors més llargs (es recomana no usar més de 40 caràcters). SPSS usarà aquesta etiqueta en els resultats. Si no hi ha, usarà el nom de la variable, que pot ser suficientment descriptiu.

Valores. Són valors numèrics per a etiquetar els valors d‟una variable (no confondre amb l‟etiqueta d‟una variable). No és obligatori, però sí molt útil en alguns casos.

Situa‟t en el camp corresponent a Valores de la variable embarazo i polsa sobre el quadre colorat: Què significa aquesta variable? Quins valors agafa? Què significa cada valor?

(7)

Perdidos. Permet definir els valors de les dades especificats com perduts pel

usuari. En moltes ocasions és útil per a identificar informació perduda o que no s‟ha

pogut obtindre. Per exemple, es pot voler distingir la dada perduda corresponent a un entrevistat que es nega a respondre, de la dada perduda degut a que la pregunta no afectava a eixe entrevistat. Els valors de dades especificades com perdudes per l‟usuari apareixen marcats per a un tractament especial i s‟exclouen de la majoria dels càlculs.

Columnas. Permet especificar l‟amplària de la columna, és a dir, el nombre de caràcters. Podem fer-lo també des del propi arxiu de dades.

Alineación: És un format que permet seleccionar la justificació de les dades de la columna: Izquierda, Derecha i Centrado.

Medida. Es pot seleccionar un dels tres nivells de mesura:

• Escala: Per a variables quantitatives (en SPSS s‟anomenen variables d‟escala). Les variables d‟escala han de ser numèriques.

• Ordinal: Per a variables categòriques ordinals. Els valors representen categories amb un cert ordre intrínsec (baix, mitjà, alt; totalment d‟acord, d‟acord, en desacord). Les variables ordinals poden ser de cadena o valors numèrics. Notar que per a variables de cadena ordinals, se suposa que l‟ordre alfabètic dels valors de cadena indica l‟ordre correcte de les categories; en el cas de baix, mitjà i alt, l‟ordre seria alt, baix i mitjà (ordre que no és correcte). Per tant, és més recomanable utilitzar codis numèrics per a representar dades ordinals.

• Nominal: Per a variables categòriques no ordinals. Els valors representen categories sense ordre. Les variables nominals poden ser de cadena o valors numèrics que representen categories diferents, per exemple 1 = Home i 2= Dona.

Observa com han sigut definides totes les variables de l’arxiu GLUCOSA. Per a eixir de cada finestra, polsa Cancelar, així evitaràs modificar l’arxiu.

Per a crear un nou arxiu de dades de SPSS, sense cap dada, hem de seleccionar el menú de Archivo/Nuevo/Datos:

A l‟obrir l‟aplicació SPSS, si hem triat l‟opció de crear un arxiu nou per a introduir dades, SPSS li donarà el nom Sin titulo 1, identificant-lo a més com

[conjunto_de_datos1]. Si, pel contrari, hem obert un arxiu existent, aquest

s‟obrirà amb el seu nom i serà identificat com [conjunto_de_datosxx]. Podem tancar un arxiu tancant la finestra o amb el menú Archivo/Cerrar. Si a un arxiu obert se li ha fet alguna modificació, SPSS ens preguntarà si desitgem guardar o no les modificacions abans de tancar-lo.

Quan tingues la finestra de l‟Editor de dades de SPSS oberta i buida, lleig atentament les següents instruccions abans d‟introduir dades:

(8)

Hem de definir les variables adequadament (en Vista de variables, per exemple) de forma que després puguem començar a introduir les dades en qualsevol ordre (en

Vista de datos).

Per a introduir les dades, ens situem en una casella, teclegem el seu valor i, a continuació, polsem Intro o el Tabulador o fem clic en altra casella. Podem introduir les dades per files (cas per cas) o columnes (variable a variable) indistintament. Si s‟introdueixen valors numèrics, s‟ha de tindre en compte si la variable ha sigut definida com Numérica, Punto o Coma, per a introduir correctament el separador decimal.

Si s‟han d‟introduir moltes dades, convé anar guardant l‟arxiu amb l‟opció Guardar

Datos o amb el botó de guardar habitual de las aplicacions Windows.

Si ja l‟havíem guardat anteriorment, per a guardar les últimes modificacions, seleccionarem l‟opció de Guardar dins de Archivo.

Si és la primera vegada que el guardem, com encara no li hem assignat un nom a l‟arxiu, seleccionarem l‟opció Guardar como ... dins de Archivo. Ens demanarà el nom que li volem donar a l‟arxiu, la seua extensió (per defecte utilitzarà .sav per a dades del SPSS) i la carpeta en la qual volem guardar-lo.

Exercici 1.

Introdueix les dades que apareixen en el quadre següent, tenint en compte que la variable

embarazo és numèrica i se li ha d‟assignar nom, tipus, format i associar-li etiquetes de

valor, tal i com es definiren en l‟arxiu GLUCOSA.

1.- Defineix les variables amb el nom indicat, tipus i format convenients. 2.- Introdueix els valors numèrics de l‟arxiu de dades.

3.- Guarda l‟arxiu de dades amb el nom GLUCOSA_1 en l‟escriptori.

Una vegada introduïdes les dades podem considerar modificar-les, ja siga per a introduir o ampliar amb nous valors o per a rectificar algun valor ja introduït. L‟edició de dades en SPSS conté comandaments per a: tallar, copiar, pegar, eliminar i buscar (similar a altres aplicacions Windows), insertar variables o casos, anar al cas, ordenar

(9)

Exercici 2.

1.- Insertar, entre els casos 4t i 5è, les dades corresponents al següent individu:

1 74,00 143,00 71,00 105,00 66,00 100,00

(Ens situem en l‟individu Nº 5 i seleccionem Insertar caso.

2.- Reemplaça el valor de la variable g1antes del cas 1r, per 50,00

3.- Modifica les especificacions (nom, tipus i columna) de la variable g2antes per a

que s‟anomene g2antes_2, el tipus siga Coma i es presenten les seues dades centrades. Intenta ara canviar el seu nom a 2_g2antes. Què passa?

4.- Assigna les següents etiquetes de variable:

embarazo embaràs sí (1) ó no (0)

g1antes glucosa (mg/dl) abans, setmana 8

g1des glucosa (mg/dl) després, setmana 8

5.- Situa‟t en Vista de datos i posa la fletxa del ratolí damunt del nom de la variable

embarazo. Què observes en el punter?, què passa si fas clic?, i si ara polses la

tecla Supr?. Usa la icona Deshacer cambios per a recuperar la variable.

6.- Assigna les etiquetes de valor de la variable embarazo:

0 = no, 1 = sí

7.- Polsa el símbol d‟etiqueta de la barra de ferramentes. Què observes?, què ocorre en

una cel·la de la variable embarazo si fem clic?

8.- Guardar les modificacions en l‟arxiu GLUCOSA_1.

3. Edició, transformació i recodificació de variables

Una vegada introduïdes les dades, i prèviament a l‟anàlisi estadística de les dades, és possible modificar les dades originals presents a l‟arxiu. Aquests canvis poden referir-se a les variables, als casos, o a l‟arxiu en conjunt. Pot interessar-nos tant la recodificació dels valors d‟una variable com la generació de noves variables mitjançant transformacions de les ja existents.

SPSS permet generar noves variables mitjançant transformacions numèriques efectuades sobre les antigues.

Suposem que, després de tindre l‟arxiu de dades ja introduït, necessitem, per a cada individu, la mitjana dels nivells de glucosa abans d‟ingerir el xarop (g1antes, g2antes y

g3antes). Convindria generar una nova variable que continguera aquestes mitjanes.

Triem Transformar/ Calcular, i realitzem els passos següents:

1. Assignar un nom i un tipus (per defecte serà numèrica) a la nova variable en el quadre de text de la Variable de destino, en el nostre cas medantes

2. Definir la Expressió numèrica que permetrà calcular els seus valors. Utilitzarem els noms de les variables de l‟arxiu (podem escriure‟ls o seleccionar-los del llistat que apareix a l‟esquerra i traslladar-los al quadre Expresión numérica), i usar el mini teclat de la finestra per a definir operacions numèriques i lògiques.

(10)

3. Polsar Aceptar. Es crearà una nova variable amb nom medantes. Es pot modificar ara el seu tipus i format.

També es poden crear expressions numèriques amb més d‟una variable utilitzant

operadors aritmètics com +, -, *, /, ** i funcions com Abs, Arsin, Artan, Cos, Exp,

Lg10, Ln, entre moltes altres accessibles des del quadre Grupo de funciones.

Al fer clic sobre una funció apareix una descripció al quadre de l‟esquerra. Si fem doble clic, la funció es pega dins del quadre Expresión numérica. L‟argument de les funcions ha d‟anar entre parèntesi i, si hi ha més d‟un, separats per comes.

Per exemple, en Grupo de funciones dins del grup FDA y FDA no centrada trobem les funcions Cdf.Binomial o Cdf.Normal que donen el valor de les probabilitats acumulades de distribucions Binomial i Normal amb els arguments que s‟especifiquen. Altres funcions que s‟utilitzen per a la generació de variables aleatòries, estan dins del grup

Números aleatorios i comencen per Rv. Són prou útils en estudis de simulació.

És important tindre cura amb l‟ordre d‟utilització dels operadors i no oblidar que els valors originals es perden si utilitzem com variable de destinació una ja existent.

El botó Si... permet fer transformacions condicionades, sotmeses a que es verifique una condició lògica. S‟inclouran únicament aquells casos que complisquen la condició. La resta dels casos passaran a ser valors perduts definits pel sistema.

Per exemple, si volem generar la variable medantes només de les dones embarassades, i guardar les modificacions en una nova variable medantes_2, haurem de:

Fer clic en el quadre Si ...

(11)

Escriure la condició: embarazo = 1

Polsar Continuar i en la següent pantalla polsar Aceptar.

Una expressió lògica és una expressió que pot ser avaluada com vertadera o falsa en funció dels valors de les variables que apareixen en ella. El nexe de les variables són els operadors de relació: = , >= , <= , < , > , ~= . És possible formar expressions complexes, utilitzant els operadores lògics: AND (&), OR ( | ), NOT (~). Per exemple, la condició “g1antes >= 60 & g1antes <= 80” defineix la condició: “Tindre nivell de

glucosa g1antes entre 60 i 80”.

Exercici 3.

1. Crear la variable meddes com la mitjana de les 3 mesures de glucosa després del xarop.

2. Crear la variable dif_med que expresse la diferència entre les variables

medantes i meddes de les dones embarassades.

A partir d‟una variable podem crear una altra els valors de la qual siguen una

recodificació dels de la primera. Aquesta recodificació podem fer-la tant en la mateixa

variable com en una altra nova o ja existent, es recomana no perdre mai els valors originals. Seleccionarem el menú Transformar/Recodificar/En distintas variables... S‟obrirà una finestra en la qual haurem d‟assignar un nom (i, si volem, una etiqueta) a la nova variable.

¡Atenció!

, si selecciones En las mismas variables ... esborraràs el contingut de la variable original.

(12)

Vegem com recodificar la variable g1antes en una nova variable anomenada

cod_g1an, classificant-la en: baix < 60, mitjà [60,80), alt [80,100) i molt alt ≥ 100.

1. Seleccionem la variable g1antes, escrivim el nom de la Variable de resultado (cod_g1an), en el quadre corresponent i polsem Cambiar.

2. Polsem en Valores antiguos y nuevos ... Ací especificarem els valors antics (de

g1antes ) i els seus nous valors (en cod_g1an ).

La recodificació és molt útil quan volem agrupar valors de variables numèriques dins de determinats intervals. Utilitzem les possibilitats descrites en Rango.

Per a especificar g1antes < 60 ⟹ cod_g1an = 1, escriurem, en Rango, INFERIOR hasta

valor 60, i en Valor nuevo 1, polsarem Añadir i repetirem els mateixos passos amb la

(13)

A continuació, polsar Continuar i en la següent finestra Aceptar.

Exercici 4.

1. Afegir a la variable cod_g1an les etiquetes de valors baix, mitjà, alt i molt alt. 2. Recodificar la variable g1des en una nova variable quantitativa cod_g1des amb

les 4 categories anteriors.

4. Filtres

El programa SPSS permet seleccionar determinats casos per a fer una anàlisi, bé temporalment o de forma permanent, sobre la base d‟un criteri lògic o d‟una decisió aleatòria. Això ho aconseguirem definint un filtre, una vegada activat, només les dades que complisquen la condició del filtre podran ser processades. Per a definir un filtre, seleccionarem el menú Datos/Seleccionar casos... L‟opció per defecte és Todos los

casos.

Si seleccionem Si se satisface la condición, en el quadre Resultado apareixen les opcions Descartar casos no seleccionados (sense eliminar aquests casos de l‟arxiu),

Copiar casos seleccionados a un nuevo conjunto de datos i Eliminar casos no seleccionados. L‟última opció només hauríem d‟usar-la si realment volem reduir la

grandària de l‟arxiu a solament els casos seleccionats, ja que la resta de casos seran eliminats.

(14)

En l‟opció més usual Descartar casos no seleccionados, els casos que no satisfan la condició apareixen ratllats, però no desapareixen de l‟arxiu, i podran ser recuperats en desactivar el filtre. Observem que es crea també una variable nova anomenada

filter_$ i que si s‟elimina desapareix el filtre associat, aquesta variable pot ser

utilitzada, una vegada desactivat el filtre, per a tornar a activar-lo més endavant amb l‟opció Usar variable de filtro en el quadre anterior.

Exercici 5.

1. Seleccionar, sense eliminar, les dades de les dones embarassades.

2. Desfer el filtre anterior i crear un altre que seleccione els casos on g1des > 120.

3. Tornar l‟arxiu al seu estat inicial.

4. Seleccionar els 8 primers casos de totes les variables (utilitza la variable interna

$casenum que representa el número de cas, afegint les condicions lògiques

adequades).

5. Ponderació de dades

Com hem vist la forma natural de generar un arxiu SPSS és introduint cas per cas amb les corresponents variables. De vegades tindrem l‟ocasió de treballar amb dades que ja estan processades i resumides. Considerem, per exemple aquest resum d‟acta.

(15)

Resum d‟acta

En aquest cas podem introduir exactament la informació tal i com es presenta per a després ponderar les dades segons indiquen les freqüències. La Vista de

datos de SPSS presentaria el següent

aspecte:

Notem que hem eliminat l‟entrada Presentats ja que és la suma de Suspens, Aprovat,

Notable i Excel·lent i realment hi ha 26 casos en total.

Ara en el menú Datos/Ponderar casos, seleccionaríem la variable total com a variable de freqüència.

Exercici 6.

Obri l‟arxiu CEREBROS i respon

1. Quines variables conté?, de quins tipus són?, en quines unitats està codificada cada variable?

2. Recodifica la variable cuerpo en 3 categories: menys de 30 Kg., entre 30 i 60 Kg. i més de 60 Kg. Guarda aquesta variable com codcuer.

Referencias

Documento similar

í El diccionari de les dades, la informació que identifica cada variable, a més de poder consultar-la a la pestanya de vista de variables, es pot consultar en qualsevol moment

La organización debe establecer las acciones necesarias para aprovisionarse de los recursos necesarios previstos de acuerdo al resultado de la evaluación de riesgos y el

Amb caràcter general, sens perjudici de les mesures de protecció i seguretat establertes en aquesta Resolució i en els plans sectorials a què fa referència l'apartat 1.2, les

Como norma general, todo el personal auxiliar que participe en el evento: azafatas, fotógrafos, intérpretes, etc, tendrán que poner en práctica las medidas de distanciamiento

Disseny i implementació d’una base de dades per la creació d’una aplicació que permet la gestió de les pràctiques d’estudiants a les empreses.. Jorge

El poeta de Folgueroles va trigar a escriure aquest text, que li fou reclamat per Monné en cartes del 6 i del 29 de desembre de 1886 (Epistolari de Jacint Verdaguer, V. 18-19), ja

 Disseny i l‟optimització de membranes compòsit incorporant MOFs per a la seva aplicació en SRNF i separació de mescles de gasos..  Desenvolupament d‟un equip

Per això, descrivim la relació entre la dona i el rol de gènere vigent a la societat, analitzem la relació entre el sexe femení i l‟ús de diferents drogues,