• No se han encontrado resultados

Prueba de asociación de dos variables cualitativas

N/A
N/A
Protected

Academic year: 2021

Share "Prueba de asociación de dos variables cualitativas"

Copied!
9
0
0

Texto completo

(1)

Prueba de asociación de dos variables cualitativas

Descripción

Esta prueba se aplica en diseños de investigación en los que se estudia a un único grupo de individuos donde a cada uno de ellos se han medido simultáneamente dos variables cualitativas.

El resultado del recuento de ambas variables se vacía en las celdillas de una tabla compuesta por renglones y columnas a la que se llama tabla de contingencia o de doble entrada.

La prueba compara la distribución de frecuencias observada en las celdillas (Fo) con una distribución teórica llamada distribución de frecuencias esperada (Fe)

El procedimiento de la prueba incluye el cálculo de la distribución de frecuencias teórica o esperada (Fe). Esta distribución representa la forma en que quedarían repartidas las frecuencias en las celdillas de la tabla de contingencia, bajo la suposición de que ambas variables no se asocian.

El propósito de la prueba es averiguar si existen diferencias estadísticamente significativas entre la distribución observada (Fo) y la distribución esperada (Fe).

En la prueba se plantean las siguientes hipótesis estadísticas: Hipótesis estadística nula: Ho: Fo = Fe

Hipótesis estadística alterna: Ha: Fo ≠ Fe

El procedimiento de la prueba incluye el cálculo de la medida de resumen llamada Chi cuadrada. El rechazo de la Ho ocurre cuando el valor calculado con los datos resulta mayor que el valor crítico de dicha medida contenido en una tabla llamada Valores Críticos de Chi cuadrada. En el caso de que se haya podido rechazar a la Ho, se dice que existe asociación entre las dos variables medidas al grupo de individuos.

En el caso de que el valor de Chi cuadrada calculada sea igual o menor al de Chi cuadrada crítica se dice que no se rechaza a la Ho y, por tanto, se concluye que la Fo es semejante a la Fe. Por lo anterior, se concluye que no parece existir asociación entre las dos variables estudiadas en el grupo de individuos.

Ejemplo desarrollado

A un grupo de 90 estudiantes de estudiantes de licenciatura le fueron medidas simultáneamente dos variables cualitativas: orientación política de sus padres y tipo de educación primaria recibida. A las

variables correspondieron las siguientes escalas de modalidades:

Orientación política de los padres Tipo de educación primaria recibida Conservadora Rígida Moderada Moderada Liberal Flexible

(2)

A continuación se muestra un listado parcial de la base de datos: Estudiante No. Orientación política de los padres Tipo de educación primaria recibida 1 Conservadora Rígida 2 Conservadora Rígida 3 Liberal Rígida 4 Moderada Liberal . . . . . . 87 Liberal Flexible 88 Moderada Moderada

A partir de la base de datos se contaron los casos y se acomodaron en una tabla como la siguiente:

Frecuencias observadas (Fo)

Tipo de educación primaria recibida Totales Orientación

política de los

padres Rígida Moderada Flexible

Conservadora 15 10 7 32

Moderada 10 10 10 30

Liberal 5 9 14 28

Totales 30 29 31 90

Por contar con tres renglones y tres columnas para los datos, la tabla tuvo nueve celdillas para anotar la distribución observada de los casos (Fo). En la tabla se encontró que entre los estudiantes cuyos padres tenían orientación política conservadora hubo predominio de educación primaria de tipo rígida; por otro lado, entre los estudiantes cuyos padres tenían orientación política liberal predominó la educación de tipo flexible; finalmente, se observó que no había predominio de algún tipo de educación primaria entre los estudiantes cuyos padres tenían orientación política de tipo moderada.

En términos coloquiales podría decirse que a orientación política conservadora correspondió educación rígida y que a orientación política liberal correspondió educación flexible.

Se supuso que, en el caso de que no existiera ninguna asociación entre la orientación política de los padres y el tipo de educación primaria recibida por los estudiantes, la distribución de los alumnos no habría mostrado la tendencia recién descrita.

(3)

Para efectuar un contraste entre la distribución observada (Fo) y la distribución esperada bajo la suposición de que no existiera asociación (Fe) se efectuó el cálculo de esta última distribución. A

continuación se muestran los resultados del cálculo de la Fe:

Frecuencias esperadas bajo la suposición de no asociación (Fe)

Tipo de educación primaria recibida Totales

Orientación política de los

padres Rígida Moderada Flexible

Conservadora 11 10 11 32

Moderada 10 10 10 30

Liberal 9 9 10 28

Totales 30 29 31 90

El cálculo de la frecuencia esperada para cada una de las celdillas se hizo con la siguiente fórmula:

(

tmr (tmc)

)

e

tt

=

donde:

e = frecuencia esperada para una celdilla determinada tmr = total marginal del renglón de dicha celdilla

tmc = total marginal de la columna de la misma celdilla tt = total de casos de toda la tabla

Obsérvese cómo se efectuó el cálculo de la frecuencia esperada (e) para la celdilla superior izquierda

que, de momento, solo contiene a la frecuencia observada (o):

15 10 7 32

10 10 10 30 5 9 14 28

30 29 31 90

tmr de la celdilla = 32; tmc de la celdilla = 30 tt o gran total = 90

e para la celdilla =

( ) ( )

( )

( ) ( )

( )

32

30

10.7

11

90

tmr

tmc

tt

=

=

(4)

De la misma manera se procedió a calcular las frecuencias esperadas para cada una de las demás celdillas. Las frecuencias esperadas se anotaron entre paréntesis junto a la correspondiente frecuencia observada de la siguiente manera:

15 (11) 10 (10) 7 (11) 32 (32) 10 (10) 10 (10) 10 (10) 30 (30) 5 (9) 9 (9) 14 (10) 28 (28) 30 (30) 29 (29) 31 (31) 90

Al comparar, celdilla por celdilla, las frecuencias

o

con las frecuencias

e

se encontró que algunas veces había notables diferencias.

Con el propósito de disponer de una medida de resumen que pudiera sintetizar en una sola cifra las diferencias encontradas, se calculó el valor de la medida llamada Chi cuadrada o también Ji cuadrada, que se simboliza de la siguiente manera

χ

2

, y cuya fórmula es la siguiente:

(

)

2

2

o e

e

χ

Donde:

Σ

: Letra griega sigma que indica sumar todas las expresiones del siguiente tipo

o

: Cada frecuencia observada

e

: cada frecuencia esperada para el caso que se está ejemplificando, los cálculos fueron como sigue:

(

15 11

) (

2 10 10

) (

2 7 11

) (

2 10 10

)

2

(

) (

)

(

)

2

(

)

2

(

)

2 5 9 9 9 14 10 10 10 9 9 10 11 10 11 10

2

2

10 10

10 10

− − − − − − − + + + +

+

+ + +

Así, el resultado del cálculo fue:

(

)

2 2

6.3

o e

e

χ

=

(5)

Se dedujo que si cada una de las frecuencias observadas

o

hubiera sido idéntica a su correspondiente frecuencia esperada

e

, entonces cada diferencia hubiera valido 0 (cero). Si ello hubiera ocurrido, cada

diferencia elevada al cuadrado también hubiera valido cero, por tanto cada expresión

(

)

2

o e

e

también hubiera valido cero y, finalmente, el valor de su suma, es decir, el valor de Chi cuadrada hubiera sido cero.

El valor calculado no fue cero, sino 6.3; por lo tanto se decidió que debía buscarse un valor crítico que, al

ser rebasado, indicaría que la serie completa de frecuencias observadas Fo y la serie completa de frecuencias esperadas Fe eran significativamente diferentes entre sí. Para ello se recurrió a un libro en

donde localizó una tabla de la que se muestra un fragmento en seguida:

Fragmento de la tabla de valores críticos de 2

χ

Grados de libertad Valores críticos al nivel de significancia de 0.05 1 3.84 2 5.99 3 7.81 4 9.49 5 11.07 … … 100 124.34

En el mismo libro, se encontró que el renglón de la columna llamada Grados de libertad en donde debía localizarse el valor crítico por rebasar correspondía a la operación siguiente:

Grados de libertad (G.L.) = (Columnas -1) (Renglones – 1)

En vista de que la tabla de contingencia con los datos tenía tres renglones y tres columnas, el resultado de la operación fue el siguiente:

Grados de libertad (G.L.) = (3 -1) (3 – 1) = (2) (2) = 4

Al encontrar que el valor calculado de Chi cuadrada (6.3) no rebasaba al valor crítico de Chi cuadrada

(que era de 9.49) se concluyó que no había una diferencia estadísticamente significativa entre la

distribución de frecuencias observadas con la distribución de frecuencias esperadas; es decir; que la idea de que Fo era igual a Fe (Fo = Fe) no podría rechazarse.

En toda prueba de análisis estadístico la suposición de igualdad se llama hipótesis estadística nula, que en este caso se simbolizó de la siguiente forma: Ho: Fo = Fe; por otra parte, la suposición de diferencia se llama hipótesis estadística alterna, que en este caso se simbolizó así: Ha: Fo ≠ Fe.

(6)

asociación entre la orientación política de los padres y el tipo de educación primaria que recibieron los estudiantes.

La anterior conclusión fue redactada así: No se rechazó a la Ho (p > 0.05).

Procedimiento

1. Confirmar que el propósito del estudio consiste en evaluar la asociación entre dos variables cualitativas medidas a un grupo de individuos.

2. Luego de efectuar el recuento de los datos, disponer la distribución de frecuencias observadas

(Fo) en una tabla de contingencia.

3. Mediante la fórmula

e

( )

tmr (tmc)

tt

=

aplicada celdilla por celdilla, calcular la distribución esperada bajo la suposición de no asociación (Fe) y anotar los resultados de los cálculos en la misma tabla de contingencia. Las sumas horizontales y verticales de las distribuciones Fo y Fe deben ser idénticas.

4. Mediante la fórmula

(

)

2

2

o e

e

χ

determinar el valor de Chi cuadrada calculada.

5. Comparar el valor de Chi cuadrada calculada con el valor de Chi cuadrada crítica, usando una

tabla de valores críticos. Identificar el renglón de los grados de libertad (G.L.) correspondientes al número de columnas y de renglones de la tabla de contingencia mediante la fórmula

G.L. = (C – 1) (R – 1), donde C corresponde al número de columnas y R al número de

renglones.

6. En caso de que el valor de Chi cuadrada calculada rebase al valor crítico de la tabla, rechazar a la hipótesis estadística nula Ho señalando que el nivel de significancia fue de 0.05; usualmente se acostumbra redactar lo anterior de la siguiente forma: se rechazó Ho con una p < 0.05; en

caso de que el valor calculado haya sido igual o no hubiera rebasado al valor crítico se señala que no fue posible rechazar la Ho.

7. De acuerdo al paso anterior, establecer la conclusión referente a si ambas variables parecen

tener una asociación significativa o no.

Problema resuelto

Los siguientes datos fueron recogidos por un investigador:

Casos de desempeño escolar deficiente según exposición crónica al plomo Desempeño deficiente Exposición crónica SI NO SI 42 11 53 NO 13 38 51 55 49 104

(7)

El investigador observó que de los 53 individuos expuestos crónicamente al plomo 42 (79%) presentaron desempeño escolar deficiente, mientras que de los 51 no expuestos solo 13 (26%) tuvieron desempeño escolar deficiente; a su juicio, lo anterior parecía demostrar que existía una intensa asociación entre ambas variables

Con el propósito de imaginar cuál hubiera sido la distribución de los datos suponiendo que no existiera ninguna asociación entre las variables, decidió calcular la distribución de frecuencias que se esperaría encontrar bajo dicha suposición. Para ello usó la fórmula

e

(

tmr (tmc)

)

tt

=

en todas y cada una de las celdillas de la tabla de contingencia y anotó sus resultados entre paréntesis en la siguiente tabla

Desempeño deficiente Exposición Crónica SI NO SI 42 (28.0288) 11 (24.9712) 53 (53) NO 13 (26.9712) 38 (24.0288) 51 (51) 55 (55) 49 (49) 104

Al observar que la distribución que observó no era de ninguna manera semejante a la que se esperaría bajo la suposición de no asociación decidió determinar el valor de Chi cuadrada calculada mediante la siguiente fórmula:

(

)

2

2

o e

e

χ

Sus cálculos produjeron el siguiente resultado:

(

) (

2

) (

2

) (

2

)

2

42

28.0288

11

24.9712

13

26.9712

38

24.0288

28.0288

24.9712

26.9712

24.0288

30.14

+

+

+

=

Aunque el valor de Chi cuadrada calculada le pareció suficientemente grande, el investigador optó por compararlo con un valor crítico que, si era rebasado por el valor calculado, le permitiría concluir que la distribución observada (Fo) no era semejante a la distribución esperada (Fe)

En realidad, lo que el investigador estaba haciendo era probar las siguientes hipótesis estadísticas: Hipótesis estadística nula: Ho: Fo = Fe

(8)

El investigador encontró la siguiente tabla de valores críticos:

Fragmento de la tabla de valores críticos de 2

χ

Grados de libertad Valores críticos al nivel de significancia de 0.05 1 3.84 2 5.99 3 7.81 4 9.49 5 11.07 … … 100 124.34

Para ubicar el renglón correspondiente a los grados de libertad de su tabla de contingencia usó la siguiente fórmula: Grados de libertad (G.L.) = (Columnas -1) (Renglones – 1) = ( 2-1 ) ( 2-1 ) = 1 En virtud de que el valor crítico de Chi cuadrada correspondiente a un grado de libertad era 3.84 y de que dicho valor era ampliamente rebasado por el valor de Chi cuadrada calculada (30.14), el investigador concluyó que podría rechazar a la hipótesis estadística nula.

En el reporte de su estudio, el investigador escribió lo siguiente: para los 104 individuos estudiados, se encontró asociación estadísticamente significativa entre la exposición crónica al plomo y el desempeño escolar deficiente (p < 0.05). El símbolo entre paréntesis se refiere a que existe un riesgo

de equivocarse al asegurar que existe dicha asociación de un tamaño menor a 0.05 (o, en porcentaje, menor al 5%).

Problemas a resolver

Problema 1

¿Se asocian ambas variables?

Levantadores de pesas según régimen de entrenamiento y capacidad aeróbica

Capacidad aeróbica Régimen de

entrenamiento Mínima Regular Suficiente

Ligero 23 19 16

Moderado 14 17 15

(9)

Problema 2

¿Cuál alimento se asoció con la diarrea?

Ingestión Presentación de diarrea

de sopa NO SI Totales

NO 102 15 117

SI 51 192 243

153 207

Ingestión Presentación de diarrea

de arroz NO SI Totales NO 84 108 192 SI 69 99 168 153 207 Ingestión de Presentación de diarrea Mole NO SI Totales NO 33 105 138 SI 120 102 222 153 207

Referencias

Documento similar

&#34;No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

El nuevo Decreto reforzaba el poder militar al asumir el Comandante General del Reino Tserclaes de Tilly todos los poderes –militar, político, económico y gubernativo–; ampliaba

No había pasado un día desde mi solemne entrada cuando, para que el recuerdo me sirviera de advertencia, alguien se encargó de decirme que sobre aquellas losas habían rodado

Después de una descripción muy rápida de la optimización así como los problemas en los sistemas de fabricación, se presenta la integración de dos herramientas existentes

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

El desarrollo de una conciencia cáritas es esencial para identificar cuando un momento de cuidado se convierte en transpersonal, es necesaria para identificar

Una segunda corriente de estudios ha examinado el papel de los factores asociados con el contenido, ya sea en forma de tipo específico de historias, ubicación y/o diseño, o la

Las probabilidades de éxito de este procedimiento serán distintas en función de la concreta actuación del reclamante antes de que se produjera la declaración de incons-.. En caso