Estadística Bayesiana y Elecciones en México
XXVIII Foro Nacional de Estadística
Instituto Nacional de Estadística y Geografía. Aguascalientes, México. Septiembre 27, 2013.
Manuel Mendoza R.
Departamento de Estadística Instituto Tecnológico Autónomo de México Departamento de Probabilidad y Estadística
El sistema electoral en México se ha transformado radicalmente en los últimos 20 años. Las elecciones federales son organizadas por un organismo
autónomo, el Instituto Federal Electoral.
Existe una variedad de fuerzas políticas con posibilidades
reales de ganar elecciones.
El Instituto Federal Electoral (IFE), Es dirigido por Consejo General que integra a 9 Consejeros
Ciudadanos.
Opera el Registro Federal de Electores.
Recluta, cada tres años, un millón de ciudadanos que para que
colaboren como funcionarios de casilla.
Es el conducto para que los Partidos Políticos reciban el
Audita los informes financieros de los Partidos y supervisa las
campañas electorales.
Despliega el operativo nacional para instalar las casillas de
votación en todo el país.
Recibe, y acumula los votos para anunciar los resultados y,
Actúa como árbitro entre los partidos y puede imponer sanciones
si alguno viola las reglas electorales.
Además, el IFE Convoca Especialistas en distintas materias para proponer,
diseñar, auditar u operar algunos de los procedimientos con los que desahoga sus funciones.
• Comité Asesor del Programa de Resultados Preliminares (PREP).
• Comité Técnico del Padrón Electoral.
• Comité Técnico del Conteo Rápido.
Opera el Registro Federal de Electores.
Recibe, y acumula los votos para anunciar los resultados .
Convoca Especialistas.
El Padrón Electoral es el listado donde se asientan los datos de
todos los ciudadanos que tienen derecho a votar en las elecciones federales.
El registro de un ciudadano se produce a solicitud del propio
interesado.
El ciudadano que concluye exitosamente su registro recibe una
credencial para votar con fotografía.
El Padrón Electoral
La credencial para votar sirve como medio de identificación. A partir del padrón se produce el Listado Nominal de votantes. La credencial se presenta al momento de la votación, se coteja
con el listado nominal y con la persona que la presenta.
Antes de una elección federal, el Padrón Electoral debe ser
declarado válido por el Consejo General del IFE.
No existe una definición legal del concepto de Padrón Electoral Válido.
Dos características básicas:
• Que estén todos los que deben estar. • Qué no estén los que no deben estar.
Se traducen en dos indicadores:
• Cobertura. • Actualización.
No existen cotas mínimas legales para estos indicadores. Se evalúan a través de encuestas.
Encuesta de Cobertura.
• Encuesta Nacional de Personas Elegibles para el Padrón.
Encuesta de Actualización.
• Muestra de Registros en el Padrón Electoral.
El Registro Federal de Electores cuenta con una Dirección de
Estadística muy competente.
Es indispensable una opinión (auditoría) externa. Comité Técnico del Padrón Electoral integrado por
• Demógrafos, • Geógrafos,
• Expertos en Sistemas de Información y, • Estadísticos.
Comité Técnico del Padrón Electoral
Valora la seguridad e integridad del sistema de información,
Confronta la cobertura reportada con la información demográfica. Evalúa los instrumentos cartográficos y de georeferencia que se
utlizan para asignar los módulos de empadronamiento y para levantar las encuestas;
Valora las componentes técnicas de las encuestas y contrastan
sus resultados a partir de procedimientos alternativos.
Distintos expertos Estadísticos han participado en este Comité. En general, los trabajos están directamente realcionados con el
análisis de encuestas (muestreo de poblaciones finitas).
Existe mucha experiencia en el tema y gran cantidad de
referencias bibliográficas (desde la perspectiva frecuentista).
Con un enfoque Bayesiano, el acervo disponible es mucho más
limitado.
Objetivo: Describir la variable aleatoria X, con soporteX
y funciónde probabilidad P( X(n) |q ) totalmente conocida, excepto por valor del parámetro fijo de dimensión finitaq.
Se cuenta con una muestra de observaciones X(n) con función de
probabilidad conjunta P( X(n)|q ).
Antes de los datos X(n), la información sobre q se describe con la
probabilidad inicial ( a priori ) P( q ).
Las interpretaciones de la probabilidad en el modelo de muestreo
P( X(n) |q) y en la distribución inicial
P(q) son distintas.
En el primer caso describen variabilidad mientras
que en segundo describen incertidumbre.
Las inferencias sobre el parámetro, una vez observados e
incorporados los datos de la muestra, se realizan a partir de la distribución final (a posteriori) P( q | X(n) )
P( q | X(n) ) P( X(n) | q ) P( q )
Ejemplo 1. X variable aleatoria Normal con media m y varianza s2 conocida (precisión t = 1/s2). P( X | q ) = N( X | m, t ); q = m
Si la inicial para m es P( m ) = N ( m | m, t0 ) P( m | X(n) ) P( X(n) | m ) P( m ) P( m | X(n) ) = N( m | mX, tX )
Ejemplo 2. X variable aleatoria Normal con media m y varianza s2 desconocidas (precisión t = 1/s2). P( X | q ) = N( X | m, t ); q = ( m, t )
Si la inicial para q es P( q ) = P( m,t ) = P( m|
t ) P( t ) = N ( m | m, ct) Gamma ( t | a, b ) P( q | X(n) ) P( X(n) | q ) P( q )P( q | X(n) ) P( X(n) | q ) P( q ) P( q| X(n) ) = P( m, t | X(n) ) = P( m
|
t,
X(n) ) P( t | X(n) ) = N ( m | mX, cX t) Gamma ( t | aX, bX ) P( m | X(n) ) =
P( m,t | X(n) ) dt =
N( m | mX, tX ) Gamma ( t | aX, bX ) dt P( m | X(n) ) =Stu
( m | mX,g
X, n-1 )
Ejemplo 3. X variable aleatoria Poisson con media l.P( X | q ) = Poisson( X | l ); q = l
Si la inicial para l es P( l ) = Gamma ( l | a, b)P( l | X(n) ) P( X(n) | l ) P( l )
P( l | X(n) ) = Gamma ( l | aX, bX )
1 u1 2 u2 · · · · · · · · N uN Unidades en la Población e identificadores
Poblaciones Finitas
1 u1 2 u2 · · · · · · · · N uN Unidades en la Población e identificadores 1 u1 X(u1) 2 u2 X(u2) · · · · · · · · · · · · N uN X(uN)
Valores de la variable bajo estudio
Unidades en la Población e identificadores 1 u1 X(u1) 2 u2 X(u2) · · · · · · · · · · · · N uN X(uN)
Valores de la variable bajo estudio
1 u1 X(u1) 2 u2 X(u2) · · · · · · · · · · · · N uN X(uN) Unidades en la Población e identificadores
Valores de la variable bajo estudio 1 u1 X(u1) p1 2 u2 X(u2) p2 · · · · · · · · · · · · · · · · N uN X(uN) pN Probabilidades de selección
Poblaciones Finitas
1 u1 X(u1) p1 2 u2 X(u2) p2 · · · · · · · · · · · · · · · · N uN X(uN) pN Unidades en la Población e identificadores
Valores de la variable bajo estudio
Probabilidades de selección (muestreo aleatorio simple)
1 u1 X(u1) 1/N 2 u2 X(u2) 1/N · · · · · · · · · · · · · · · · N uN X(uN) 1/N
Poblaciones Finitas
Problemas habituales:
Estimación del total poblacional T = X1 + X2 + · · · + XN
Estimación de la media poblacional M = T / N
Estimación de una proporción poblacional
Variable Aleatoria X muestra ( x1, x2, …, xn ); (n < N). P es totalmente conocida
X
es desconocido Los parámetros de interés ( T, M ) dependen de
X
Espacio muestral
X
= { X1, X2, · · · , XN } Función de probabilidad P = { p1, p2, · · · , pN }
El parámetro ( de dimensión finita, N ) es
X
Poblaciones Finitas
Análisis Bayesiano de Poblaciones Finitas
Existen distintas posibilidades para abordar este problema como un caso del análisis paramétrico. Por ejemplo, suponga que:
X
= { X1, X2, · · · , XN } es una muestra aleatoria, de tamaño N, de una variable X*. La función de probabilidad de X*, P( X* | f ) es conocida salvo por el valor de f F.
Análisis Bayesiano de Poblaciones Finitas
X(n) = { X1, · · · , Xn } es una submuestra de
X
que se obtienepor un mecanismo de remuestreo.
El remuestreo tiene probabilidades P = { p1, p2, · · · , pN }.
Si las probabilidades P = { p1, p2, · · · , pN } son conocidas y no dependen de los valores de X, entonces se puede probar que
Análisis Bayesiano de Poblaciones Finitas
A partir de una distribución inicial P(
f
) para el parámetrof
enel modelo P( X* |
f
), y la función de verosimilitud P( X(n) |f
), se obtiene la finalP(
f
| X(n) ) P( X(n) |f
) P(f
). Para T = X1 + X2 + · · · + XN, la inferencia respectiva se obtiene
a través de la distribución predictiva
Análisis Bayesiano de Poblaciones Finitas
En particular, si P( X* |
f
) = Poisson ( X* |f
), entoncesP( T |
f
) = Poisson ( T|
Nf
) Si como inicial para
f,
se utiliza una distribuciónGamma, entonces
Análisis Bayesiano de Poblaciones Finitas
Si la inicial conjugada es mínimo informativa, entonces
P( T | X(n) ) es Binomial Negativa
Si se estima puntualmente el valor del total T con una
función de utilidad cuadrática, entonces
Análisis Bayesiano de Poblaciones Finitas
Además del valor estimado puntual, se cuenta con toda la
distribución predictiva posterior de T
P( T | X(n) )
A partir de esta distribución es posible determinar intervalos de
Volviendo al Padrón…
Información a través de la Encuesta de Verificación Nacional
Muestral (cobertura) 2008.
Diseño estratificado y polietápico.
• Vivienda Localidad Sección Estrato Entidad Federativa • 3000 secciones en muestra de un total de 64, 619 ( 4.64% )
Información del Registro Federal Electoral Mexicano en 2008 para establecer la calidad del Padrón Electoral Mexicano. Se estimó el Total de habitantes con edad 18 años y más, residente
en el país ( TX ).
Se estimó el Total de habitantes con edad 18 años y más, residente
en el país, que estaba registrado en el padrón ( TY ).
Se estimó la proporción de empadronamiento ( TY / TX ).
El país se integra con 32 entidades federativas (estados). Todas las entidades federativas se incluyeron en el estudio. El total nacional se estima sumando los totales estimados
de todas las entidades federativas.
Cada estado está dividido en estratos.
Todos los estratos fueron muestreados en cada estado.
El total de un estado se estima sumando los totales estimados
para todos sus estratos.
Si en el estado j cada estrato se muestrea independientemente, se
obtiene una serie de distribuciones predictivas P( Tji | X(n(ji)) ) ; i = 1, … , e(j)
de manera que la distribución de interés
P( Tj | X(n(j)) )
se puede determinar a partir de las predictivas de los estratos con la transformación
Tj = Tj1 + Tj2 + … + Tje(j)
Si la distribución de la suma de los totales de los estratos no se puede
calcular fácilmente, una alternativa es proceder por simulación.
• De la distribución para el estrato i se muestrea (simula) un valor tji,
entonces
tj = tj1 + tj2 + … + tje(j)
es un valor observado de la distribución predictiva del total del estado.
• Para el nivel del país, la suma t = t1 + t2 + … + tk constituye un valor observado de la distribución predictiva del total nacional.
Diseño estratificado y polietápico.
• Vivienda Localidad Sección Estrato Estado País
Los pasos de Estrato a Estado y Estado a País se resuelven con la
suma de predictivas.
Suma de predictivas Modelo Poisson
Diseño estratificado y polietápico.
• Vivienda Localidad Sección Estrato Estado País
Lo mismo ocurre con el paso de Sección a Estrato.
El paso de Localidad a Sección utiliza probabilidades de selección no
El estrato i incluye Ni secciones de las cuales se selecciona, medianteun mecanismo aleatorio, una muestra de tamaño ni .
Si las probabilidades de selección son: qi1, qi2, …, qiNi entoncesse
contará con la información de las secciones Si(1), Si(2),…Si(ni) seleccionadas con probabilidades qi(1), qi(2),…qi(ni).
De cada sección en la muestra se dispone de la distribución predictiva
para el total de la sección
P( Tir | X(n(ir)) ) ; r = 1, … , ni
Por simulación, para la r-ésima sección en la muestra se contará con un valor tir generado de la predictiva del total de la sección, Una posibilidad ingenua es promediar en cada simulación esos
valores y multiplicar el resultado por el número de secciones en el estrato.
De esa forma, primero se obtiene un valor simulado de la predictiva
para el promedio de los totales de las secciones en la muestra que, a su vez, aproxima al promedio de los totales seccionales en el estrato.
Al multiplicar ese promedio por el número de secciones en el estrato
se aproxima el total del estrato.
Otra posibilidad es utilizar la idea de factores de expansión.
Cada valor simulado se pondera con el recíproco de la probabilidad
de selección de la sección a la que corresponde
tir = tir / qir
este valor aproxima el total del estrato.
Los valores ponderados se promedian y se obtiene una valor
aproximado proveniente de la distribución predictiva para el total del estrato.
Resultados población (T
X)
Q(97.5%) = 70,958,405 Q(2.5%) = 69,612,551 70,294,068 VNM 2008 = 70,311,037 CNP 2000 = 72,284,007 CNP 2005 = 68, 985,182Aguascalientes Baja California
Baja California Sur Campeche Resultados
Coahuila Colima
Chiapas Chihuahua
Distrito Federal Durango
Guanajuato Guerrero
( % )
Aguascalientes Baja California
Baja California Sur Campeche
Coahuila Colima
Chiapas Chihuahua
Distrito Federal Durango
Guanajuato Guerrero
Comentarios
El mecanismo subsume la población finita en un modelo
paramétrico para poblaciones infinitas y aborda un problema de inferencia sobre parámetros como uno de predicción.
El mismo procedimiento puede visualizarse como inferencia
paramétrica.
El modelo paramétrico P( X* |
f
) equivale a la especificación deuna distribución a priori sobre el parámetro N-dimensional
X
.
La actualización con X(n) produce la posteriori P(X
| X(n) ). A partir de P(
X
| X(n) ) se deriva la posteriori para la cantidad deEl Conteo Rápido 2012
143, 495 casillas en un territorio de
2 millones de kilómetros cuadrados
Un padrón electoral con más de 70
millones de votantes
Para capturar diferencias regionales, las 143,495 casillas se
organizaron en los 300 distritos electorales del país.
En cada distrito se consideraron la parte rural y la parte urbana.
El resultado fue un conjunto 483 estratos de casillas.
En cada estrato se tomó una muestra aleatoria de casillas.
En total, la muestra fue de 7,597 casillas.
En cada casilla pueden votar alrededor de 500 ciudadanos.
La variables que se observan son el número de votos para cada
uno de los candidatos.
Es la suma de variables Bernoulli.
Se consideran i.d. porque pertenecen al mismo estrato.
No es razonable suponer que son independientes.
El número de votos se modela con una Normal con media y
varianza desconocidas y no relacionadas.
El esquema es mucho más simple que en el problema del
Padrón.
Al final se tiene la predictiva del número de votos a favor de cada
candidato y la predictiva del total de votos válidos.
De los valores simulados de esas predictivas se obtiene una
muestra de la proporción de voto efectivo en favor de cada
candidato.
18:00
Resultados Conteo Rápido 2006
21:40
22:10
22:15
Conteo Rápido Resultado Final
PAN (35.8, 36.4) 35.89
PRD (35.1, 35.6) 35.59