• No se han encontrado resultados

Distribución chi cuadrado

N/A
N/A
Protected

Academic year: 2018

Share "Distribución chi cuadrado"

Copied!
11
0
0

Texto completo

(1)

1

DISTRIBUCIÓN CHI-CUADRADO O JI-CUADRADO X2 CONCEPTO BÁSICO

Frecuencia: es el número de datos que caen en cada celda.

Frecuencias Observadas (fo): son aquellas que representan los valores muestrales observados correspondientes a una variable categórica o cuantitativa sometida a estudio. Ejemplo: afiliación partidaria; reacción ante un nuevo plan de impuesto sobre la renta; edad y sexo, etc.

Frecuencias Esperadas (fe): son aquellas que representan los valores muestrales esperados que corresponden a una variable categórica o cuantitativa sometida a estudio, considerando que la hipótesis nula es correcta.

Variable Categórica: una variable categórica es aquella en la que se clasifica o categoriza cada individuo en solo una de varias celdas o clases; estas celdas o clases son totalmente incluyentes o mutuamente excluyentes.

Nivel de significancia (α) de la distribución chi-cuadrado: es una probabilidad expresada en porcentaje que nos permite tomar la decisión de aceptar o rechazar la hipótesis nula o alternativa basándonos en la evidencia mostrada por los datos muestrales. Regularmente se utilizan valores de 0.01, 0.05, 0.10 u otro valor dependiendo del tipo de prueba que se realice o de la confiabilidad deseada.

Tabla de Contingencia: es una representación de datos de una clasificación de doble entrada. Los datos se clasifican en celdas y se reporta cuantos hay en cada una de ellas. La tabla de contingencia implica dos factores (o variables) y la pregunta usual respecto a tales tablas es si los datos indican que una de las variables es independiente o dependiente.

Hipótesis Nula: es aquella que especifica un valor numérico del parámetro de la población, el cual, esperamos aceptar o desaprobar a partir de la evidencia proporcionada por la muestra. Se representa simbólicamente por Ho

(2)

2

Prueba chi-cuadrada para la independencia (pruebas para tablas de contingencias)

Este tipo de prueba implican dos variables categóricas y/o cuantitativas y lo que se prueba es la hipótesis de que las dos son estadísticas independientes.

DISEÑO O FORMATO DE LA TABLA DE CONTINGENCIA PARA ESTE TIPO DE PRUEBA

ENCABEZADO

DE RENGLÓN

(1ERA.

VARIABLE)

ENCABEZADO DE COLUMNAS

(2DA. VARIABLE)

Col. 1 Col. 2 Col. 3 Total

Renglón 1 Celda Celda Celda RT1

Renglón 2 Celda Celda Celda RT2

TOTAL CT1 CT2 CT3 n

Procedimiento de cálculo para realizar esta prueba

a) Se determinan los valores de todas las frecuencias esperadas para cada una de las celdas o casillas tomando como base los datos muestrales que se presenten en la tabla de contingencia y a partir de ésta, se calculan las frecuencias esperadas.

ENCABEZADO

DE RENGLÓN

ENCABEZADO DE COLUMNAS

Col. 1 Col. 2 Col. 3 Total Renglón 1 Fe (11) Fe (12) Fe (13) RT1

Renglón 2 Fe (21) Fe (22) Fe (23) RT2

Renglón 3 Fe (31) Fe (32) Fe (33) RT3

TOTAL CT1 CT2 CT3 n

Totales de renglones

Total de observaciones

(muestra)

Totales de columnas

Totales de renglones

Total de observaciones

(muestra)

(3)

3

En general podemos calcular la frecuencia esperada para cualquier celda con la ecuación.

fe = RT x CT n

En la que:

- fe = frecuencia esperada en una celda dada.

- RT = total de renglones para el renglón que contiene a dicha celda. - CT = total de columnas para la columna que contiene a dicha celda - n = número total de observaciones

Luego:

Fe (11) = CT1 x RT1, Fe (21)= CT1 x RT2, Fe (31) = CT1 x RT3

n n n Fe (12) = CT2 x RT1, Fe (22)= CT2 x RT2, Fe (32) = CT2 x RT3

n n n Fe (13) = CT3 x RT1, Fe (23)= CT3 x RT2, Fe (33) = CT2 x RT3

n n n b) Se aplica la regla de decisión

La regla de decisión para esta prueba tiene como objetivo aceptar o rechazar la hipótesis nula, y consiste en realizar el procedimiento de cinco pasos:

donde:

- Ho= las variables son independiente

- Ha= las variables son dependientes

Donde:

fo = frecuencia observada en una celda dada fe = frecuencia esperada en una celda dada

Se plantea la

hipótesis nula H

0

y

la hipótesis

alternativa H

a .

1er. paso

Calculamos el valor

del Chi-cuadrado de

prueba a patir de los

datos muestrales,

esto es:

(4)

4

2

Procedimientos o pasos para calcular el chi-cuadrado x2 de prueba a través de la tabla de cálculo.

TABLA DE CÁLCULOS

PASO 1 PASO 2 PASO 3

f

o

— f

e

(f

o

— f

e

)

2

(f

o

— f

e

)

2

f

e

f

0

(1)

f

e

(11)

x

x

xx

f

0

(2)

f

e

(12)

x

x

xx

x

x

xx

x

x

xx

n

n

0

-

?

X2=chi-cuadrado =

𝑓0− 𝑓𝑒 𝑓𝑒

Columna 1: Determine las diferencias, entre cada foy fe. Es decir, (fo—fe). La suma de estas diferencias es

cero.

Columna 2: Eleve al cuadrado la diferencia entre cada frecuencia observada y esperada, es decir, (fo—fe)2

Columna 3: Divida el resultado de cada observación entre la frecuencia esperada. Es decir (fo—fe )2

fe Finalmente, sume estos valores.

El resultado es el valor de x2.

TOTAL

PASO

PASO

(5)

5 Donde:

g.l.= número de grados de libertad = (r-1) (C-1) α= nivel de significancia

r= número de filas de la tabla de contingencia (renglones) c= número de columnas de la tabla de contingencia

- Si 𝒙𝒄𝟐 > 𝒙𝟐𝒕, entonces se rechaza la 𝐻𝑜 y se acepta la 𝐻𝑎 se concluye que las variables

están relacionadas. - Si 𝒙𝒄𝟐 < 𝒙

𝒕

𝟐, entonces se acepta la 𝐻

𝑜 y se rechaza la 𝐻𝑎 se concluye que las variables

no están relacionadas.

Gráfica de la distribución chi-cuadrado x2 a través de la cual podemos determinar la aceptación o rechazo de la hipótesis nula (Ho)

Donde:

- La región de rechazo se sustenta en base al nivel de significancia a la que siempre es posible asignarle un porcentaje comprendido regularmente entre 1% y 10%, es decir α=1%, 2%,…10%.

- Valor crítico o de la tabla, el cual se calcula para un determinado grado de libertad (g.l.) y el nivel de significancia que se tome en consideración, este valor crítico representa el llamado chi-cuadrado de la tabla y se representa por la fórmula:

𝑋𝑡2 = [g.l.α] 𝑋𝑡2 = [(C-1) (r-1), α]

Determinamos el valor Chi-cuadrado crítico o

de la tabla utilizando la siguiente fórmula:

𝑋

𝑡2

= [g.l.α]

𝑋

𝑡2

= [

(C-1) (r-

1), α]

3er. paso

•Realizar la decisión (comparar los

estadísticos). Para hacer esta comparación se procede de la siguiente manera:

4to. paso

Región de rechazo

Escala de x2

Valor crítico Región de aceptación.

Aceptar la hipótesis nula si el valor de x2 de

la muestra cae en esta región. 𝒙𝒄𝟐 < 𝒙𝒕𝟐

(6)

6 Donde:

g.l.= grado de libertad=(r-1)(C-1), siendo r =no total de renglones y C= no total de columnas.

α= nivel de significancia

•Se concluye que: con un nivel de confianza del 99% o 95%, etc hay o existe independencia o

dependencia entre las dos variables que se hayan investigado.

(7)

7

EJERCICIO DE APLICACIÓN (ESTUDIO DE CASO)

El señor George McMahon, presidente de la Compañía Nacional General Aseguradora de Salud, se opone al seguro de salubridad nacional. Argumenta que sería muy costoso de implantar, en particular debido a que la existencia de este sistema, entre otras cosas, tendería a fomentar en la gente permanecer más tiempo en los hospitales. George tiene la creencia de que las hospitalizaciones dependen del tipo de seguro de salud que tengan las personas. Le pide a Donna McClish, la especialista en estadística de la empresa, que verifique el asunto. Donna, recogió datos de una muestra aleatoria de 660 hospitalizaciones, y la información la resumió en una tabla de doble entrada, para la cual, se dan las frecuencias observadas, en las nueve diferentes hospitalizaciones y el tipo de seguro (o “celdas”) en que fue dividida la muestra. Donna desea probar la hipótesis:

¿Son independientes la estancia en un hospital y la cobertura de un seguro, con un nivel de significancia del 1% (α=0.01)?

Datos de hospitalizaciones clasificados según el tipo de cobertura del seguro y el tiempo de estancia

Fracción de costos cubiertos por el seguro

Días de hospitalización

<5 5-10 >10 Total

< 25% 40 75 65 180

25-50% 30 45 75 150

>50% 40 100 190 330

Total 110 220 330 660

Solución:

a) Calculamos las frecuencias esperadas de los datos muestrales que representa la tabla, esto es:

fe (11)= 110 𝑥 180

660 =30 , fe (21)=

110 𝑥 150

660 =25 , fe (31)=

330 𝑥 330 660 =55

fe (12)= 220 𝑥 180

660 =60 , fe (22)=

220 𝑥 150

660 =50 , fe (32)=

330 𝑥 330 660 =110

fe (13)= 3300 𝑥 180

660 =90 , fe (23)=

330 𝑥 150

660 =75 , fe (33)=

330 𝑥 330 660 =165

b) Se aplica la regla de decisión, la cual consiste en desarrollar los 5 pasos que establece esta regla:

1. Planteamos la hipótesis nula y la alternativa, de la siguiente manera: H0= tiempo de estancia y tipo de seguro son independientes

(8)

8

2. Calculamos el chi-cuadrado de prueba, de la siguiente manera:

fo fe Paso 1 Paso 2 Paso 3

f

o

— f

e

(f

o

— f

e

)

2

(f

o

— f

e

)

2

f

e

40 30 10 100 3.333

75 60 15 225 3.750

65 90 -25 625 6.944

30 25 5 25 1.000

45 50 -5 25 0.500

75 75 0 0 0.000

40 55 -15 225 4.091

100 110 -10 100 0.909

190 165 25 625 3.788

660 660 0 - 24.315

Luego : X2= =24.315

3. Determinamos el valor de chi-cuadrado crítico o de la tabla, utilizando la fórmula:

𝑥

𝑡2[𝑔.𝑙.]

Donde:

r=total de renglones=3 c=total de columnas=3

g.l.= (r-1) (c-1)=(3-1)(3-1)=(2)(2)=4 α=0.01

Luego:

𝑥𝑡2[(𝑔.𝑙.𝛼)] 𝑥𝑡2[(𝑟−1)(𝑐−1)𝛼] = 𝑥𝑡2[(𝑔.𝑙.𝛼)] = 𝑥𝑡[4,001]

2 =13.28

El valor de chi-cuadrado crítico o teórico (13.28) se obtiene con la intersección de 4 grado de libertad (g.l.) ubicado en la primera columna del lado izquierdo y el nivel de significación de 0.01 (α=0.01), ver tabla de la chi-cuadrado.

(9)

9

(10)

10

4. Se realiza la decisión (comparar los estadísticos), es decir, comparamos el valor de chi-cuadrado de prueba (𝑥𝑐2=24.315) con el chi-cuadrado de la tabla o teórico (𝑥𝑡2=13.28), esto es:

𝑥𝑐2>𝑥𝑡2

24.315 > 13.28

Luego: el chi-cuadrado de prueba es mayor que el chi-cuadrado de la tabla, se rechaza la hipótesis nula y se acepta la hipótesis alternativa, por lo tanto, se puede observar en la gráfica que el valor de la chi-cuadrada de prueba (𝑥𝑐2=24.315) no cae en la región

de aceptación (ver gráfica)

Región de rechazo Se rechaza α=0.01 Ho

13.28 Escala de x2

Valor crítico

𝑥𝑐2=24.315

(Valor chi-cuadrado de la muestra) 5. Conclusión

(11)

Referencias

Documento similar

Se estima una distancia de más de 11 millones de años luz hablando de una cantidad de sistemas solares que no tendrían espacio en nuestra mente y esto solo hablando del grupo

También hemos visto como la principal característica de este proceso de racialización es que se hace presente en los libros de texto de una forma dialéctica, al pretender

El tercero tiene notas bajas pero la mayor es estadística, una de las temáticas trabajadas de forma más mecánica, asimismo el último arquetipo muestra que, aun con notas buenas,

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

Ésta es una constatación que no se puede obviar en la reflexión sobre la reforma del sistema competencial: la combinación entre un sistema de atri- bución mediante

Gastos derivados de la recaudación de los derechos económicos de la entidad local o de sus organis- mos autónomos cuando aquélla se efectúe por otras enti- dades locales o

Sabemos que, normalmente, las ​cookies deben ser almacenadas y enviadas de vuelta al servidor sin modificar; sin embargo existe la posibilidad de que un atacante

1. LAS GARANTÍAS CONSTITUCIONALES.—2. C) La reforma constitucional de 1994. D) Las tres etapas del amparo argentino. F) Las vías previas al amparo. H) La acción es judicial en