6. Contrastes no param´etricos
6.3. Contraste χ 2 sobre independencia de dos variables
Para obtener los resultados del contrasteχ2 de Pearson sobre independencia de variables aleatorias se selecciona
Analizar⇒Estad´ısticos descriptivos⇒Tablas de contingencia.
Figura 122:Cuadro de di´alogo de la opci´on Tablas de contingencia
Como se ve en la Figura 122, podemos seleccionar las variables que constituyen lasFilaspor un lado, y lasColumnaspor otro. El que se especifique m´as de una variable de cada tipo no implica que se vayan a tratar todas conjuntamente, sino que se procesan las posibles combinaciones de dos en dos. Por defecto, haciendo clic enAceptar, y sin m´as especificaciones, se obtienen las tablas de contingencia (o de doble entrada) con las frecuencias absolutas conjuntas y marginales. Por ejemplo, si enFilasseleccionamos la variable opini´on1 y enColumnasla variable opini´on2 obtenemos en el visor de resultados de SPSS las tablas de las Figuras 123 y 124.
Figura 123:Tabla–resumen de casos de las variables opini´on1 y opini´on2
En el cuadro de di´alogo de la Figura 122 podemos seleccionar una variable de control en el tercer recuadro en blanco. Por cada categor´ıa de esta tercera variable (la de control) se presenta una tabla de contingencia simple de las dos variables especificadas enFilasyColumnas. Es posible especificar m´as de una variable de control. En el caso de que hubiese, por ejemplo, dos variables de control, se producir´ıa una tabla de contingencia simple de las dos variables cuya relaci´on se quiere examinar por cada combinaci´on de categor´ıas de las dos variables de control.
Figura 124:Tabla de contingencia de las variables opini´on1 y opini´on2
Por ejemplo, si enFilasseleccionamos la variable opini´on1, enColumnasla variable opini´on2 y en el recuadro de las variables de control seleccionamos la variable materia, obtenemos, en el visor de resultados, la tabla de la Figura 125.
Figura 125:Tabla de contingencia de opini´on1 y opini´on2 con la variable control materia
En el cuadro de di´alogo de la Figura 122 hay dos opciones m´as, que son:
Mostrar los gr´aficos de barras agrupados: Se obtiene el gr´afico de barras de la variable declarada en Filas, agrupado seg´un la variable deColumnas.
Suprimir tablas: No se muestra ninguna tabla, sino s´olo los estad´ısticos (en el caso de que por lo menos alguno de ellos haya sido solicitado).
En el cuadro de di´alogo de la Figura 122 nos quedan tres botones por explicar:Estad´ısticos,CasillasyFormato.
Figura 126:Cuadro de di´alogo de la opci´on Estad´ısticos
Si pulsamos el bot´onEstad´ısticosnos aparece el cuadro de di´alogo de la Figura 126. En este cuadro se pueden elegir los coeficientes de correlaci´on que deseemos calcular. Tambi´en con esta opci´on se realizan tests de hip´otesis para contrastar
la hip´otesis de que el coeficiente de correlaci´on en toda la poblaci´on sea igual a cero. De entre todo lo que aparece, nos interesa marcar la opci´onChi-cuadrado, que proporciona los resultados del contrasteχ2de Pearson sobre independencia de las dos variables implicadas.
Por ejemplo, enFilasseleccionamos la variable opini´on1, enColumnas la variable opini´on2 y al pulsar el bot´onEs- tad´ısticosseleccionamosChi-cuadrado. Obtenemos, entonces las tablas de las Figuras 123, 124 y 127.
Figura 127:Contrasteχ2de Pearson sobre independencia de las variables opini´on1 y opini´on2
Comentaremos los resultados: En primer lugar, los contrastes Raz´on de verosimilitud y Asociaci´on lineal por lineal no los hemos estudiado. En lo concerniente al contraste Chi-cuadrado de Pearson sobre independencia de las dos variables, el valor (muestral) del estad´ıstico χ2 es 130659; los grados de libertad (gl) son 16, que es el resultado de la siguiente multiplicaci´on: (n´umero de filas-1)×(n´umero de columnas-1); y el p-valor o n´ıvel cr´ıtico (Sig. asint. bilateral) es00624 (mayor que el habitual nivel de significaci´on,α= 0005), por lo que deber´ıamos aceptar la hip´otesis nula de independencia de las variables opini´on1 y opini´on2. Pero hay que tener en cuenta la observaci´on que aparece en la parte inferior de la tabla, en la que se nos hace notar que el 100 % (m´as del 20 %) de las frecuencias esperadas (eij) son inferiores a 5; por lo tanto, no podemos aplicar este contraste. Adem´as, hay frecuencias esperadas menores que 1 (la menor es0033). En consecuencia, no podemos hacer caso de los resultados de este contraste para las variables seleccionadas, ya que no se cumplen las condiciones para poder aplicar dicho procedimiento.
Si pulsamos el bot´onCasillasdel cuadro de di´alogo de la Figura 122 nos aparece el nuevo cuadro de di´alogo de la Figura 128. En este cuadro nos encontramos con tres bloques de opciones aditivas. En el bloqueFrecuenciastenemos:
Figura 128:Cuadro de di´alogo para especificar m´as cosas sobre las casillas de las tablas de contingencia
Observadas: Por defecto muestra las frecuencias absolutas observadas.
Esperadas: Son las frecuencias absolutas esperadas baja la hip´otesis de independencia entre ambas variables (´utiles para realizar el test de independencia chi-cuadrado).
En el bloquePorcentajestenemos:
Fila: Porcentaje de casos en cada casilla respecto de casos totales de la fila. Columna: An´alogo por columnas.
Total: Porcentaje de casos en cada casilla sobre el total de la tabla.
En el bloqueResiduoss´olo explicar´e que la opci´onNo tipificadospresenta los resultados de las diferencias entre frecuencias absolutas observadas y las frecuencias absolutas esperadas.
Respecto del ejemplo que estamos comentando, si enFrecuenciasseleccionamosObservadasyEsperadas; enPorcentajes
seleccionamosTotal; y enResiduosseleccionamosNo tipificados; entonces obtenemos los resultados de la Figura 129. Si pulsamos el bot´onFormatodel cuadro de di´alogo de la Figura 122 nos aparece el nuevo cuadro de di´alogo de la Figura 130. En este cuadro s´olo es posible reordenar las filas:
Ascendente: Se presentan los valores de la variable en orden ascendente (es la opci´on por defecto). Descendente: Al contrario de la anterior.
Figura 129:Nueva tabla de contingencia de las variables opini´on1 y opini´on2
Figura 130:Cuadro de di´alogo para especificar el formato de las tablas de contingencia
6.3.1. Ejemplo de edici´on de una tabla de contingencia en el editor de datos
Supongamos que queremos saber si, en una determinada poblaci´on, son independientes las variables “uso de la bib- lioteca” y “preferencia sobre distintos tipos de pel´ıcula”, seg´un los datos de la siguiente muestra:
uso de la pel´ıculas pel´ıculas pel´ıculas
biblioteca b´elicas de aventuras melodram´aticas
alto 16 8 2
medio 6 10 4
bajo 4 8 12
En primer lugar tenemos que introducir estos datos. Para ello, se seleccionaArchivo⇒Nuevo⇒Datos. Se crean dos variables, que se pueden denominar uso y pel´ıcula, de manera que entre ambas reflejen todas las posibles combinaciones entre sus modalidades. Los resultados de la variable uso ser´an: 1 (=“alto uso”), 2 (=“medio uso”) y 3 (=“bajo uso”). Los resultados de la variable pel´ıcula ser´an: 1 (=“b´elicas”), 2 (=“aventuras”) y 3 (=“melodram´aticas”). Adem´as hay que crear otra variable, que llamaremos frecuenc con las frecuencias absolutas observadas en cada combinaci´on de modalidades. Como se ha de reflejar todas las posibles combinaciones de los resultados de las dos variables, la matriz de datos ha de ser la de la Figura 131. No olvidemos grabar ahora este fichero de datos con el nombreContingencia.sav.
A continuaci´on, desde la ventana del Editor de datos, hay que seleccionarDatos⇒Ponderar casos. En el cuadro de di´alogo resultante (Figura 133) hay que activar la opci´onPonderar casos mediantey hay que seleccionar la variable frecuenc en el recuadroVariable de frecuencia.
A partir de aqu´ı se puede hacer todo lo anteriormente expuesto: Seleccionamos la opci´onAnalizar⇒Estad´ısticos descrip- tivos⇒Tablas de contingencia. En el cuadro de di´alogo de la Figura 122 seleccionamos la variable uso enFilasy la variable pel´ıcula enColumnas. Pulsamos el bot´onEstad´ısticosy en el cuadro que aparece (Figura 126) activamosChi-cuadrado. En el cuadro de di´alogo de la Figura 122 podemos tambi´en pulsar el bot´onCasillasy activar (Figura 128) las opcionesEsperadas
Figura 131:Datos del fichero Contingencia.sav
Figura 132:Tabla de contingencia entre uso y pel´ıcula
Seg´un los resultados (Figura 134), el nivel cr´ıtico (Sig. asint. (bilateral)) es igual a00002(claramente menor que el habitual nivel de significaci´on,α= 0005) por lo que rechazamos la hip´otesis nula de que las variables uso y pel´ıcula son independientes. Por tanto, aceptamos que dichas variables son dependientes.