• No se han encontrado resultados

COEFICIENTE JI CUADRADO. Universidad Central de Venezuela Aron, Francisco; Baptista, Andreina; Bracamonte, Karley; Gutiérrez, Alesson; Urbina, Jesmin.

N/A
N/A
Protected

Academic year: 2021

Share "COEFICIENTE JI CUADRADO. Universidad Central de Venezuela Aron, Francisco; Baptista, Andreina; Bracamonte, Karley; Gutiérrez, Alesson; Urbina, Jesmin."

Copied!
10
0
0

Texto completo

(1)

COEFICIENTE JI CUADRADO. Universidad Central de Venezuela

Aron, Francisco; Baptista, Andreina; Bracamonte, Karley; Gutiérrez, Alesson; Urbina, Jesmin.

Definición.

Coeficiente de correlación Ji2, X2 o también denominado como prueba de hipótesis. Este coeficiente de correlación nos permite poder comparar una distribución observada " real" de datos con una distribución esperada " hipotética".

• Ese trabaja solo con variables de tipo:

Nominales categóricas (dicotómicas genuinas, politómicas). Características y utilización.

• Se debe observar la muestra de manera aleatoria a partir de una población dividida.

• El tamaño de la muestra debe ser mayor a 30 sujetos.

• Son prácticamente la base de metodologías inferenciales, demostrando así su importancia.

• Lo que son las frecuencias esperadas deben ser de 5 o superiores a 5. • El coeficiente debe ser positivo (ya que esta elevado al cuadrado). Tipos de ji cuadrado

Prueba de Homogeneidad: esta prueba se basa en comprobar si una cierta cantidad de muestras de carácter cualitativo provienen de la misma población. Por ejemplo: ¿estas tres muestras de alumnos provienen de la misma población de alumnos aprobados? Para ello se necesita que las variables sean medibles y se encuentren representadas mediante categorías con las que se pueda construir la tabla de contingencias.

Prueba de Independencia: está como su nombre lo indica consiste en comprobar si las variables están relacionadas entre sí. Por ejemplo: ¿el color de ojos se relaciona con el color del cabello? Aunque se puede notar que este difiere de la prueba anterior en cuanto al concepto de la prueba, ambas arrojan los mismos resultados. Este tipo de contrastes se aplican siempre que se desee comparar una misma variable en una serie de situaciones

(2)

diferentes, también se desea demostrar si existen diferencias en las dos poblaciones con respecto a la variable que se encuentra en estudio.

Pasos para aplicar el ji cuadrado.

• Se completa la tabla de las frecuencias observadas, calculando los marginales de cada categoría (sumar cada columna y cada fila).

• Se presentan la hipótesis nula (Ho) y la hipótesis alternativa (He).

• Se procede a calcular las frecuencias esperadas (ƒe), multiplicando el total de filas por el total de columnas, entre el total.

𝑓𝑓𝑓𝑓=𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑒𝑒𝑠𝑠𝑑𝑑𝑒𝑒𝑇𝑇𝑇𝑇𝑓𝑓𝑀𝑀𝑀𝑀𝑐𝑐𝑀𝑀𝑑𝑑𝑀𝑀𝑓𝑓𝑀𝑀𝑒𝑒𝑐𝑐𝑓𝑓𝑒𝑒𝑀𝑀𝑐𝑐𝑀𝑀𝑀𝑀

• Al tener los resultados de ƒe se calcula 𝜒𝜒2 para cada categoría con la siguiente

fórmula.

𝜒𝜒

2

=

(

𝑓𝑓𝑇𝑇 − 𝑓𝑓𝑒𝑒

)

2

𝑓𝑓𝑒𝑒

• Se procede a sumar los resultados de cada 𝜒𝜒2 para obtener 𝜒𝜒2 total.

• A continuación se calcula el grado de libertad (gl) con la siguiente fórmula. gl= (N° de filas – 1).(N° de columnas – 1)

• Posteriormente se busca el valor crítico en la tabla de distribución de ji cuadrado (𝜒𝜒2) ubicando el valor obtenido en el grado de libertad, y considerando el grado de significación.

• Y por último se procede a comparar valores de 𝜒𝜒2 obtenidos; entendiendo que:

*El 𝜒𝜒2 calculado es mayor que el 𝜒𝜒2 de la tabla, entonces se rechaza la hipótesis nula.

*El 𝜒𝜒2 calculado es menor que el 𝜒𝜒2 de la tabla, entonces se rechaza la hipótesis alternativa.

Ejemplo:

Se desea analizar si las profesiones de docencia y medicina están relacionadas con el estado civil.

(3)

H1: hay asociación entre las variables de profesión y estado civil. Nivel de significación: 0,05.

Casado Divorciado Soltero

Docente 32 27 5

Médico 49 15 8

Paso 1

casado Divorciado soltero total

Docente 32 27 5 64 Medico 49 15 8 72 Total 81 42 13 136 Paso 2 𝑓𝑓𝑓𝑓(32)64136 = 38,11 ∗81 𝑓𝑓𝑓𝑓(49) =72136 = 42,88 ∗81 𝑓𝑓𝑓𝑓(27) =64136 = 19,76∗42 𝑓𝑓𝑓𝑓(15)72136 = 22,23 ∗42 𝑓𝑓𝑓𝑓(5) =64136 = 6,11 ∗13 𝑓𝑓𝑓𝑓(8) =72136 = 6,88∗13

casado divorciado soltero Total

Docente 38,11 19,76 6,11 63,98 Medico 42,88 22,23 6,88 71,99 Total 80,99 41,99 12,99 135,97 Paso 3 𝜒𝜒2=(32−38,11)2 38,11 = 0,97 𝜒𝜒2= (49−42.88)2 42.88 =0,87 𝜒𝜒2= (27−19,76)2 19,76 = 2,65

(4)

𝜒𝜒2=(15−22,23)2 22,23 = 2,35 𝜒𝜒2= (5−6,11)2 6,11 =0,20 𝜒𝜒2 = (8−6,88)2 6,88 = 0,18 Paso 4 𝜒𝜒2= 0,97+0,87+2,65+2,35+0,20+0,18= 7,22 Paso 5 Gl= (2-1)*(3-1)= 1*2= 2 Paso 6

(Busque el valor crítico en el fragmento de la tabla que se encuentra debajo de la interpretación)

𝜒𝜒2𝑐𝑐𝑀𝑀𝑀𝑀𝑐𝑐𝑓𝑓𝑀𝑀𝑀𝑀𝑑𝑑𝑇𝑇= 7,04 𝜒𝜒2𝑓𝑓𝑀𝑀𝑡𝑡𝑀𝑀𝑀𝑀= 1,3863

Interpretación: como nuestro 𝜒𝜒2es mayor que el 𝜒𝜒2 arrojado por la tabla se rechaza la hipótesis nula (Ho) lo que infiere que la asociación de las variables es significativa, lo que nos dice que ser casado, divorciado o soltero tiene asociación con ser docente o médico.

Tabla. 1 Fragmento de la tabla de distribución ji cuadrado.

Ejercicio:

Se quiere saber que tanto tiene de asociación la cantidad de suicidios al año con la edad que tienen las personas entre 15 y 30.

(5)

Nivel de significación: 0,05.

Ho: No hay asociación entre las variables edad y la cantidad de suicidios. Hi: Si hay asociación entre las variables edad y la cantidad de suicidios.

N° de suicidios N° de suicidios N° de suicidios N° de suicidios N° de suicidios 0 1 2 3 4 Edad 15-20 5 10 14 21 28 Edad 20-25 17 12 9 5 3 Edad 25-30 27 19 11 3 1

• Se completa el cuadro con la sumatoria de los marginales.

N° de suicidios N° de suicidios N° de suicidios N° de suicidios N° de suicidios Total 0 1 2 3 4 Edad15-20 5 10 14 21 28 78 Edad 20-25 17 12 9 5 3 46 Edad 25-30 27 19 11 3 1 61 Total 49 42 36 32 36 185 𝑓𝑓𝑓𝑓(5)78185 = 20,65 ∗49 𝑓𝑓𝑓𝑓(17) =46185 = 12,18 ∗49 𝑓𝑓𝑓𝑓(27) =61185 = 16,15∗49 𝑓𝑓𝑓𝑓(10)78185 = 17,70 ∗42 𝑓𝑓𝑓𝑓(12) =46185 = 10,44 ∗42 𝑓𝑓𝑓𝑓(19) =61185 = 13,84∗42 𝑓𝑓𝑓𝑓(14)78185 = 15,17 ∗36 𝑓𝑓𝑓𝑓(9) =46185 = 8,95 ∗36 𝑓𝑓𝑓𝑓(11) =61185 = 11,87∗36 𝑓𝑓𝑓𝑓(21)78185 = 13,49 ∗32 𝑓𝑓𝑓𝑓(5) =46185 = 7,95 ∗32 𝑓𝑓𝑓𝑓(3) =61185 = 10,55∗32 𝑓𝑓𝑓𝑓(28)78185 = 15,17 ∗36 𝑓𝑓𝑓𝑓(3) =46185 = 8,95 ∗36 𝑓𝑓𝑓𝑓(1) =61185 = 11,87∗36

(6)

• Se ponen los resultados en el cuadro en su respectivo lugar. N° de suicidios N° de suicidios N° de suicidios N° de suicidios N° de suicidios Total 0 1 2 3 4 Edad15-20 20,65 17,70 15,17 13,49 15,17 82,18 Edad 20-25 12,18 10,44 8,95 9,75 8,95 50,27 Edad 25-30 16,15 13,18 11,87 10,55 11,87 63,62 Total 48,98 41,32 35,99 33,79 35,99 196,07

• Sacamos el ji cuadrado (𝜒𝜒2) de cada una de las frecuencias.

𝜒𝜒2=(5−20,65)2 20,65 = 11,86 𝜒𝜒2= (17−12,18)2 12,18 =1,90 𝜒𝜒2 = (27−16,15)2 16,15 = 7,28 𝜒𝜒2=(1𝑜𝑜−17,70)2 17,70 = 3,34 𝜒𝜒2 = (12−10,44)2 10,44 =0,23 𝜒𝜒2 = (19−13,18)2 13,18 = 2,56 𝜒𝜒2=(14−15,17)2 15,17 = 0,09 𝜒𝜒2= (9−8,95)2 8,95 =2,89 𝜒𝜒2= (11−11,87)2 11,87 = 0,06 𝜒𝜒2=(21−13,49)2 13,49 = 4,18 𝜒𝜒2= (5−9,75)2 9,75 =2,31 𝜒𝜒2= (3−10,55)2 10,55 = 5,40 𝜒𝜒2=(28−15,17)2 15,17 = 10,85 𝜒𝜒2 = (3−8,95)2 8,95 =3,95 𝜒𝜒2= (1−11,87)2 11,87 =9,95

• Sumamos todas nuestras 𝜒𝜒2

Ʃ: 11,86 + 1,90 + 7,28 + 3,34 + 0,23 + 2,56 + 0,09 + 2,89 + 0,06 + 4,18 + 2,31 + 5,40 + 10,85 + 3,95 + 9,95= 151,99.

• Luego sacamos el grado de libertad GL: (3 – 1)*(5 – 1)= 2*4= 8

𝜒𝜒2𝑐𝑐𝑀𝑀𝑀𝑀𝑐𝑐𝑓𝑓𝑀𝑀𝑀𝑀𝑑𝑑𝑀𝑀: 151,99. 𝜒𝜒2𝑇𝑇𝑀𝑀𝑡𝑡𝑀𝑀𝑀𝑀: 9,4877.

Interpretación: se puede inferir que como nuestra 𝜒𝜒2 calculado es mayor que el 𝜒𝜒2 de la tabla, se rechaza la hipótesis nula (Ho), y que la asociación es significativa, diciendo que la tener edad entre 15-30 tiene asociación con cuantos suicidios ocurren al año.

(7)

-Solo se puede aplicar para medir la relación entre dos variables nominales.

-No se aplica para conocer la asociación entre las variables sino que se centra en conocer la asociación o no asociación en las variables (en algunos libros aparece que se busca conocer la independencia de las variables) (Guilford y Fuchter, 1984). Aplicando la Docima de Hipótesis, o como también se conoce, “contraste de Ji Cuadrado”, en la cual se contrasta la hipótesis nula, que significa que no hay correlación entre las variables y por lo tanto las variables son independientes entre sí (que no hay asociación entre ellas) dentro de la población en la que se está trabajando, con la hipótesis alternativa, que se refiere a que si hay una correlación entre las variables y existe una dependencia entre ellas (Guilford y Fuchter, 1984).

- El Ji Cuadrado solo puede tomar valores positivos

- La Corrección de Continuidad de Yates es una modificación que se emplea cuando se aplica Ji Cuadrado a problemas con 1 grado de libertad y cuando toda frecuencia esperada es menor que 10, la cual tiene por objetivo disminuir cada diferencia entre frecuencia obtenida y frecuencia esperada en el grado de 0.5 con la finalidad de disminuir el valor obtenido de Ji Cuadrado. Esta corrección es importante ya que como se trabajan con frecuencias (números enteros), si dichas frecuencias son grandes la corrección no tiene mucha relevancia, en cambio si las frecuencias son pequeñas, una variación de 0.5 muy posiblemente tendrá una relevancia significativa. Cabe destacar que se aplica a tablas comprendidas de 2x2 y 1x2 ya que en tablas más grandes, aparte de ser complicada su aplicación no es tan grande la necesidad de corrección (Guilford y Fuchter, 1984).

La Formula aplicada para este caso es:

𝜒𝜒𝑐𝑐2 = 𝑛𝑛[|bc−ad|−0,5]

2

(𝑎𝑎+𝑐𝑐)(𝑏𝑏+𝑑𝑑)(𝑎𝑎+𝑏𝑏)(𝑐𝑐+𝑑𝑑)

• Aquí un ejercicio para practicar:

 Para conocer la opinión de las mujeres de cierta ciudad sobre subir los precios de los en todos los artículos de recién nacidos, se realiza una encuesta a 148 mujeres, cuyos resultados se recogen en la siguiente tabla:

De acuerdo Desacuerdo No contestaron

Mujeres con hijos 20 46 8

Mujeres sin hijos 34 13 27

Contrastar con un nivel de significación de 5%, que no existen diferencias de opinión entre mujeres con hijos y mujeres sin hijos ante el aumento de los artículos para recién nacidos.

(8)
(9)
(10)

Referencias Bibliográficas

Fernández, S. (s,f). Aplicaciones de la chi cuadrado: Tablas de contingencia. Homogeneidad. Dependencia e independencia. Facultad de Ciencias de Económicas y Empresariales, Departamento de Economía Aplicada. Universidad autónoma de Madrid.

Guilford, J. P. & Fuchter, B. (1984). Estadística aplicada a la Psicología y la Educación. México, D.F.: McGraw-Hill.

Monje, F; Angel, A y Perez, J. (S/F). Estadística no paramétrica prueba de chi cuadrado x2. Secretaria de estado de educación y universidades (MECD).

Calatrava, Y; Maldonado, H; Rincón, J; Sevilla, C. (2012). Técnicas cuantitativas de gestión (Distribución de Chi cuadrado). Recuperado el 08 de junio de 2018. https://es.slideshare.net/sevilla_carlos2004/distribucion-de-chi-cuadrado

Referencias

Documento similar

1) La Dedicatoria a la dama culta, doña Escolástica Polyanthea de Calepino, señora de Trilingüe y Babilonia. 2) El Prólogo al lector de lenguaje culto: apenado por el avan- ce de

6 José Carlos Rovira, en su estudio Léxico y creación poética en Miguel Hernández, expone lo que para él simboliza la figura del rayo: “El poeta es rayo que no cesa,

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

n que se contiene La Ordenanza que generalmente deberá observarse para el modo de.. cazar y pescar en estos rey nos, con señalamiento de los tiempos de veda, de una y

d) que haya «identidad de órgano» (con identidad de Sala y Sección); e) que haya alteridad, es decir, que las sentencias aportadas sean de persona distinta a la recurrente, e) que

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

Para comparar la evolución de los síntomas de los pacientes según tipo de enfermedad, se determinó el estadígrafo ji al cuadrado de Pearson, Prueba de McNemar para diferencia de