PRÁCTICAS DE
CORRECCIÓN DE
INCONSISTENCIA
Censo 2002
La Demografía para el desarrollo socioeconómico de ChileTALLER REGIONAL SOBRE ANÁLISIS DE COHERENCIA, CALIDAD Y COBERTURA DE LA INFORMACIÓN CENSAL. CELADE-CEA/CEPAL-UNFPA 1 al 5 de agosto de 2011. Gustavo Villalón Sergio Vera Subdepto. Estadísticas Demográficas
Contenidos
• Definición de Corrección de Inconsistencias • Origen de las inconsistencias
• Prácticas de Corrección de Inconsistencias – Censo 2002 (sexo y edad)
• Bases de Datos Original versus Censal • Variable Sexo
Prácticas de Corrección de
Inconsistencias
• Equivale a proveer reglas que permitan discernir acerca de la coherencia de los datos y también restablecerla cuando no está presente
• Solución: recurrir a la fuente, opción difícil y de alto costo
• La alternativa es la creación de “algún procedimiento” que asegure que los valores asignados se acercan lo más posible a la realidad
• Se sustenta en el concepto que es preferible ser correcto y no exacto a ser incoherente, cuando ser exacto resulta imposible
Origen de las inconsistencias
• Imperfecciones en el método de medición.
- Temperamento o forma de reaccionar - Estado de ánimo
- Predisposición - Comunicación
• Imperfecciones en la resolución o nivel de desglose.
- Capacitación de los encuestadores
Origen de las inconsistencias
• Inconsistencias de orden sistemático.
- Inconsistencias en el diseño del instrumento de medición
• Método usado para transferir la información a un método magnético
-Tecnología usada para transferir la información en papel a un medio magnético
Prácticas de Corrección de
Inconsistencias – Censo 2002
• En el Censo de 2002 hubo corrección/imputación en las variables sexo y edad
• De la memoria del censo 2002 fue posible rescatar las reglas de corrección/imputación para la variable sexo pero no para la edad
• Independientemente de no tener la regla de corrección/imputación para edad, se realizarán evaluaciones entre la Base Original y la Censal
Bases de Datos
Base Original (BO) :14.904.066 registros (98,6%)
Registros Faltantes : 212.362 registros (1,4%)
Bases de Datos
Gráfico 1: Porcentaje de registros en la Base Original respecto de la Base Censal 2002, según regiones.
96,5 97,0 97,5 98,0 98,5 99,0 99,5 100,0 P o rc ent aj e
Regla de Corrección/imputación de la
variable Sexo
1. Jefe de hogar y Cónyuge del mismo sexo:
Si el sexo del jefe de hogar y el sexo del cónyuge cumplen condición de rango, pero son iguales, entonces:
- Se le asigna sexo en función de la fecundidad.
- Si existe dualidad: jefe de hogar es hombre y
Regla de Corrección/imputación de la
variable Sexo
2. Si sólo uno de ellos, el jefe de hogar o cónyuge, carece de respuesta en la pregunta sexo:
- Se asigna el sexo contrario a la persona que
carece de respuesta
3. Si ambos, jefe de hogar y cónyuge, carecen de respuesta en la pregunta sexo:
Regla de Corrección/imputación de la
variable Sexo
- Si existe dualidad, entonces se asigna sexo en función de la edad de la siguiente forma:
- si la edad del jefe de hogar es mayor que la edad del cónyuge, entonces jefe de hogar es hombre y cónyuge es mujer
- si la edad del jefe de hogar es menor que la edad del cónyuge, entonces jefe de hogar es mujer y cónyuge es hombre
- si el cónyuge carece de respuesta en la pregunta edad, entonces jefe de hogar es hombre cónyuge es mujer
Regla de Corrección/imputación de la
variable Sexo
- Si existe dualidad, entonces se asigna sexo en función de la edad de la siguiente forma:
- si jefe de hogar carece de respuesta en la pregunta edad, entonces jefe de hogar es mujer y cónyuge es hombre
- si existe dualidad, entonces, jefe de hogar es hombre y cónyuge es mujer
Regla de Corrección/imputación de la
variable Sexo
4. Si existe jefe de hogar y no existe cónyuge presente:
- Si tiene respuesta de fecundidad, jefe de hogar es
mujer, en caso contrario, jefe de hogar es hombre
5. Para el resto de los miembros del hogar asignar el sexo en función de la fecundidad
Gráfico 2: Porcentaje de falta de la variable sexo, según regiones. Base Original - Censo 2002.
0,0 0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8
Gráfico 3: Porcentaje de duplicidad de la variable sexo, según regiones.
Base Original - Censo 2002.
0,000 0,001 0,002 0,003 0,004 0,005 0,006 0,007 0,008 0,009
Gráfico 4: Índice de Masculinidad en la Base Original (BO) y en la Base Censo 2002 (BC), según regiones.
80 85 90 95 100 105 110 115 BO BC
Gráfico 5: Porcentaje de omisión de la variable edad en personas con error o sin la variable sexo, según regiones.
Base Original - Censo 2002.
0,0 5,0 10,0 15,0 20,0 25,0 30,0 35,0 40,0 Po rc e n ta je
Gráfico 6: Porcentaje de omisión de la variable edad por sexo, según regiones. Base Original - Censo 2002.
0,0 0,1 0,1 0,2 0,2 0,3 0,3 0,4 P o rc ent aj e Hombres Mujeres
Gráfico 7: Índice de Masculinidad en la Base Original (BO) versus Base Censo 2002 (BC), según grupos de edad.
0 20 40 60 80 100 120 0 1-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74 75-79 80+ Grupos de edad M u je re s po r c a da 1 0 0 H o m b res BO BC
Gráfico 8: Porcentaje de omisión/error de la variable sexo, según grupos de edad. Base Original - Censo 2002
0 5 10 15 20 25 0 1-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74 75-79 80+ Grupos de Edad P o rc ent aj e
Reflexiones
• Disponer de la Base Original (BO) sin datos corregidos o imputados
• Disponer de la Base Censal (BC) en formato tal que se pueda asociar con la BO
• Disponer de las reglas de corrección/imputación, principalmente para las variables: sexo, edad, estado civil/conyugal, escolaridad y fecundidad