• No se han encontrado resultados

Estadística Bayesiana y Elecciones en México

N/A
N/A
Protected

Academic year: 2021

Share "Estadística Bayesiana y Elecciones en México"

Copied!
164
0
0

Texto completo

(1)

Estadística Bayesiana y Elecciones en México

XXVIII Foro Nacional de Estadística

Instituto Nacional de Estadística y Geografía. Aguascalientes, México. Septiembre 27, 2013.

Manuel Mendoza R.

Departamento de Estadística Instituto Tecnológico Autónomo de México Departamento de Probabilidad y Estadística

(2)

El sistema electoral en México se ha transformado radicalmente en los últimos 20 años.

 Las elecciones federales son organizadas por un organismo

autónomo, el Instituto Federal Electoral.

Existe una variedad de fuerzas políticas con posibilidades

reales de ganar elecciones.

(3)

El Instituto Federal Electoral (IFE),

Es dirigido por Consejo General que integra a 9 Consejeros

Ciudadanos.

Opera el Registro Federal de Electores.

Recluta, cada tres años, un millón de ciudadanos que para que

colaboren como funcionarios de casilla.

 Es el conducto para que los Partidos Políticos reciban el

(4)

Audita los informes financieros de los Partidos y supervisa las

campañas electorales.

Despliega el operativo nacional para instalar las casillas de

votación en todo el país.

Recibe, y acumula los votos para anunciar los resultados y,

 Actúa como árbitro entre los partidos y puede imponer sanciones

si alguno viola las reglas electorales.

(5)

Además, el IFE

Convoca Especialistas en distintas materias para proponer,

diseñar, auditar u operar algunos de los procedimientos con los que desahoga sus funciones.

• Comité Asesor del Programa de Resultados Preliminares (PREP).

• Comité Técnico del Padrón Electoral.

• Comité Técnico del Conteo Rápido.

(6)

Opera el Registro Federal de Electores.

 Recibe, y acumula los votos para anunciar los resultados .

 Convoca Especialistas.

(7)

El Padrón Electoral es el listado donde se asientan los datos de

todos los ciudadanos que tienen derecho a votar en las elecciones federales.

El registro de un ciudadano se produce a solicitud del propio

interesado.

El ciudadano que concluye exitosamente su registro recibe una

credencial para votar con fotografía.

El Padrón Electoral

(8)

La credencial para votar sirve como medio de identificación.  A partir del padrón se produce el Listado Nominal de votantes.  La credencial se presenta al momento de la votación, se coteja

con el listado nominal y con la persona que la presenta.

Antes de una elección federal, el Padrón Electoral debe ser

declarado válido por el Consejo General del IFE.

(9)

No existe una definición legal del concepto de Padrón Electoral Válido.

Dos características básicas:

• Que estén todos los que deben estar. • Qué no estén los que no deben estar.

(10)

Se traducen en dos indicadores:

• Cobertura. • Actualización.

 No existen cotas mínimas legales para estos indicadores.  Se evalúan a través de encuestas.

(11)

Encuesta de Cobertura.

• Encuesta Nacional de Personas Elegibles para el Padrón.

Encuesta de Actualización.

• Muestra de Registros en el Padrón Electoral.

(12)

El Registro Federal de Electores cuenta con una Dirección de

Estadística muy competente.

 Es indispensable una opinión (auditoría) externa.  Comité Técnico del Padrón Electoral integrado por

• Demógrafos, • Geógrafos,

• Expertos en Sistemas de Información y, • Estadísticos.

(13)

Comité Técnico del Padrón Electoral

 Valora la seguridad e integridad del sistema de información,

Confronta la cobertura reportada con la información demográfica. Evalúa los instrumentos cartográficos y de georeferencia que se

utlizan para asignar los módulos de empadronamiento y para levantar las encuestas;

Valora las componentes técnicas de las encuestas y contrastan

sus resultados a partir de procedimientos alternativos.

(14)

Distintos expertos Estadísticos han participado en este Comité.  En general, los trabajos están directamente realcionados con el

análisis de encuestas (muestreo de poblaciones finitas).

Existe mucha experiencia en el tema y gran cantidad de

referencias bibliográficas (desde la perspectiva frecuentista).

Con un enfoque Bayesiano, el acervo disponible es mucho más

limitado.

(15)

Objetivo: Describir la variable aleatoria X, con soporte

X

y función

de probabilidad P( X(n) |q ) totalmente conocida, excepto por valor del parámetro fijo de dimensión finitaq.

Se cuenta con una muestra de observaciones X(n) con función de

probabilidad conjunta P( X(n)|q ).

 Antes de los datos X(n), la información sobre q se describe con la

probabilidad inicial ( a priori ) P( q ).

(16)

Las interpretaciones de la probabilidad en el modelo de muestreo

P( X(n) |q) y en la distribución inicial

P(q) son distintas.

En el primer caso describen variabilidad mientras

que en segundo describen incertidumbre.

(17)

 Las inferencias sobre el parámetro, una vez observados e

incorporados los datos de la muestra, se realizan a partir de la distribución final (a posteriori) P( q | X(n) )

P( q | X(n) )  P( X(n) | q ) P( q )

(18)

Ejemplo 1. X variable aleatoria Normal con media m y varianza s2 conocida (precisión t = 1/s2). P( X | q ) = N( X | m, t ); q = m

Si la inicial para m es P( m ) = N ( m | m, t0 ) P( m | X(n) )  P( X(n) | m ) P( m )  P( m | X(n) ) = N( m | mX, tX )

(19)

Ejemplo 2. X variable aleatoria Normal con media m y varianza s2 desconocidas (precisión t = 1/s2). P( X | q ) = N( X | m, t ); q = ( m, t )

Si la inicial para q es P( q ) = P( m,t ) = P( m

|

t ) P( t ) = N ( m | m, ct) Gamma ( t | a, b ) P( q | X(n) )  P( X(n) | q ) P( q )

(20)

P( q | X(n) )  P( X(n) | q ) P( q ) P( q| X(n) ) = P( m, t | X(n) ) = P( m

|

t

,

X(n) ) P( t | X(n) ) = N ( m | mX, cX t) Gamma ( t | aX, bX ) P( m | X(n) ) =

P( m,t | X(n) ) dt =

N( m | mX, tX ) Gamma ( t | aX, bX ) dt P( m | X(n) ) =

Stu

( m | mX,

g

X, n-1 )

(21)

Ejemplo 3. X variable aleatoria Poisson con media l.

P( X | q ) = Poisson( X | l ); q = l

Si la inicial para l es P( l ) = Gamma ( l | a, b)

P( l | X(n) )  P( X(n) | l ) P( l )

P( l | X(n) ) = Gamma ( l | aX, bX )

(22)

1 u1 2 u2 · · · · · · · · N uN Unidades en la Población e identificadores

Poblaciones Finitas

(23)

1 u1 2 u2 · · · · · · · · N uN Unidades en la Población e identificadores 1 u1 X(u1) 2 u2 X(u2) · · · · · · · · · · · · N uN X(uN)

Valores de la variable bajo estudio

(24)

Unidades en la Población e identificadores 1 u1 X(u1) 2 u2 X(u2) · · · · · · · · · · · · N uN X(uN)

Valores de la variable bajo estudio

(25)

1 u1 X(u1) 2 u2 X(u2) · · · · · · · · · · · · N uN X(uN) Unidades en la Población e identificadores

Valores de la variable bajo estudio 1 u1 X(u1) p1 2 u2 X(u2) p2 · · · · · · · · · · · · · · · · N uN X(uN) pN Probabilidades de selección

Poblaciones Finitas

(26)

1 u1 X(u1) p1 2 u2 X(u2) p2 · · · · · · · · · · · · · · · · N uN X(uN) pN Unidades en la Población e identificadores

Valores de la variable bajo estudio

Probabilidades de selección (muestreo aleatorio simple)

1 u1 X(u1) 1/N 2 u2 X(u2) 1/N · · · · · · · · · · · · · · · · N uN X(uN) 1/N

Poblaciones Finitas

(27)

Problemas habituales:

Estimación del total poblacional T = X1 + X2 + · · · + XN

 Estimación de la media poblacional M = T / N

Estimación de una proporción poblacional

(28)

Variable Aleatoria X  muestra ( x1, x2, …, xn ); (n < N).

 P es totalmente conocida

X

es desconocido

 Los parámetros de interés ( T, M ) dependen de

X

 Espacio muestral

X

= { X1, X2, · · · , XN }

Función de probabilidad P = { p1, p2, · · · , pN }

 El parámetro ( de dimensión finita, N ) es

X

Poblaciones Finitas

(29)

Análisis Bayesiano de Poblaciones Finitas

Existen distintas posibilidades para abordar este problema como un caso del análisis paramétrico. Por ejemplo, suponga que:

X

= { X1, X2, · · · , XN } es una muestra aleatoria, de tamaño N, de una variable X*.

La función de probabilidad de X*, P( X* | f ) es conocida salvo por el valor de f F.

(30)

Análisis Bayesiano de Poblaciones Finitas

X(n) = { X1, · · · , Xn } es una submuestra de

X

que se obtiene

por un mecanismo de remuestreo.

El remuestreo tiene probabilidades P = { p1, p2, · · · , pN }.

Si las probabilidades P = { p1, p2, · · · , pN } son conocidas y no dependen de los valores de X, entonces se puede probar que

(31)

Análisis Bayesiano de Poblaciones Finitas

A partir de una distribución inicial P(

f

) para el parámetro

f

en

el modelo P( X* |

f

), y la función de verosimilitud P( X(n) |

f

), se obtiene la final

P(

f

| X(n) )  P( X(n) |

f

) P(

f

).

Para T = X1 + X2 + · · · + XN, la inferencia respectiva se obtiene

a través de la distribución predictiva

(32)

Análisis Bayesiano de Poblaciones Finitas

En particular, si P( X* |

f

) = Poisson ( X* |

f

), entonces

P( T |

f

) = Poisson ( T

|

N

f

)

Si como inicial para

f,

se utiliza una distribución

Gamma, entonces

(33)

Análisis Bayesiano de Poblaciones Finitas

Si la inicial conjugada es mínimo informativa, entonces

P( T | X(n) ) es Binomial Negativa

Si se estima puntualmente el valor del total T con una

función de utilidad cuadrática, entonces

(34)

Análisis Bayesiano de Poblaciones Finitas

Además del valor estimado puntual, se cuenta con toda la

distribución predictiva posterior de T

P( T | X(n) )

A partir de esta distribución es posible determinar intervalos de

(35)

Volviendo al Padrón…

 Información a través de la Encuesta de Verificación Nacional

Muestral (cobertura) 2008.

Diseño estratificado y polietápico.

• Vivienda  Localidad  Sección  Estrato  Entidad Federativa • 3000 secciones en muestra de un total de 64, 619 ( 4.64% )

Información del Registro Federal Electoral Mexicano en 2008 para establecer la calidad del Padrón Electoral Mexicano.

(36)

Se estimó el Total de habitantes con edad 18 años y más, residente

en el país ( TX ).

Se estimó el Total de habitantes con edad 18 años y más, residente

en el país, que estaba registrado en el padrón ( TY ).

Se estimó la proporción de empadronamiento ( TY / TX ).

(37)

El país se integra con 32 entidades federativas (estados). Todas las entidades federativas se incluyeron en el estudio. El total nacional se estima sumando los totales estimados

de todas las entidades federativas.

(38)

Cada estado está dividido en estratos.

Todos los estratos fueron muestreados en cada estado.

El total de un estado se estima sumando los totales estimados

para todos sus estratos.

(39)

Si en el estado j cada estrato se muestrea independientemente, se

obtiene una serie de distribuciones predictivas P( Tji | X(n(ji)) ) ; i = 1, … , e(j)

de manera que la distribución de interés

P( Tj | X(n(j)) )

se puede determinar a partir de las predictivas de los estratos con la transformación

Tj = Tj1 + Tj2 + … + Tje(j)

(40)

Si la distribución de la suma de los totales de los estratos no se puede

calcular fácilmente, una alternativa es proceder por simulación.

• De la distribución para el estrato i se muestrea (simula) un valor tji,

entonces

tj = tj1 + tj2 + … + tje(j)

es un valor observado de la distribución predictiva del total del estado.

• Para el nivel del país, la suma t = t1 + t2 + … + tk constituye un valor observado de la distribución predictiva del total nacional.

(41)

Diseño estratificado y polietápico.

• Vivienda  Localidad  Sección  Estrato  Estado  País

Los pasos de Estrato a Estado y Estado a País se resuelven con la

suma de predictivas.

Suma de predictivas Modelo Poisson

(42)

Diseño estratificado y polietápico.

• Vivienda  Localidad  Sección  Estrato  Estado  País

Lo mismo ocurre con el paso de Sección a Estrato.

El paso de Localidad a Sección utiliza probabilidades de selección no

(43)

El estrato i incluye Ni secciones de las cuales se selecciona, mediante

un mecanismo aleatorio, una muestra de tamaño ni .

 Si las probabilidades de selección son: qi1, qi2, …, qiNi entoncesse

contará con la información de las secciones Si(1), Si(2),…Si(ni) seleccionadas con probabilidades qi(1), qi(2),…qi(ni).

De cada sección en la muestra se dispone de la distribución predictiva

para el total de la sección

P( Tir | X(n(ir)) ) ; r = 1, … , ni

(44)

Por simulación, para la r-ésima sección en la muestra se contará con un valor tir generado de la predictiva del total de la sección,

Una posibilidad ingenua es promediar en cada simulación esos

valores y multiplicar el resultado por el número de secciones en el estrato.

De esa forma, primero se obtiene un valor simulado de la predictiva

para el promedio de los totales de las secciones en la muestra que, a su vez, aproxima al promedio de los totales seccionales en el estrato.

Al multiplicar ese promedio por el número de secciones en el estrato

se aproxima el total del estrato.

(45)

Otra posibilidad es utilizar la idea de factores de expansión.

 Cada valor simulado se pondera con el recíproco de la probabilidad

de selección de la sección a la que corresponde

tir = tir / qir

este valor aproxima el total del estrato.

 Los valores ponderados se promedian y se obtiene una valor

aproximado proveniente de la distribución predictiva para el total del estrato.

(46)

Resultados población (T

X

)

Q(97.5%) = 70,958,405 Q(2.5%) = 69,612,551 70,294,068 VNM 2008 = 70,311,037 CNP 2000 = 72,284,007 CNP 2005 = 68, 985,182

(47)

Aguascalientes Baja California

Baja California Sur Campeche Resultados

(48)

Coahuila Colima

Chiapas Chihuahua

(49)

Distrito Federal Durango

Guanajuato Guerrero

(50)

( % )

(51)

Aguascalientes Baja California

Baja California Sur Campeche

(52)

Coahuila Colima

Chiapas Chihuahua

(53)

Distrito Federal Durango

Guanajuato Guerrero

(54)

Comentarios

El mecanismo subsume la población finita en un modelo

paramétrico para poblaciones infinitas y aborda un problema de inferencia sobre parámetros como uno de predicción.

El mismo procedimiento puede visualizarse como inferencia

paramétrica.

El modelo paramétrico P( X* |

f

) equivale a la especificación de

una distribución a priori sobre el parámetro N-dimensional

X

.

La actualización con X(n) produce la posteriori P(

X

| X(n) ).

A partir de P(

X

| X(n) ) se deriva la posteriori para la cantidad de

(55)

El Conteo Rápido 2012

143, 495 casillas en un territorio de

2 millones de kilómetros cuadrados

Un padrón electoral con más de 70

millones de votantes

(56)

Para capturar diferencias regionales, las 143,495 casillas se

organizaron en los 300 distritos electorales del país.

En cada distrito se consideraron la parte rural y la parte urbana.

El resultado fue un conjunto 483 estratos de casillas.

En cada estrato se tomó una muestra aleatoria de casillas.

En total, la muestra fue de 7,597 casillas.

(57)

En cada casilla pueden votar alrededor de 500 ciudadanos.

La variables que se observan son el número de votos para cada

uno de los candidatos.

Es la suma de variables Bernoulli.

Se consideran i.d. porque pertenecen al mismo estrato.

No es razonable suponer que son independientes.

(58)

El número de votos se modela con una Normal con media y

varianza desconocidas y no relacionadas.

El esquema es mucho más simple que en el problema del

Padrón.

Al final se tiene la predictiva del número de votos a favor de cada

candidato y la predictiva del total de votos válidos.

De los valores simulados de esas predictivas se obtiene una

muestra de la proporción de voto efectivo en favor de cada

candidato.

(59)
(60)

18:00

Resultados Conteo Rápido 2006

(61)
(62)
(63)
(64)
(65)
(66)
(67)
(68)
(69)
(70)
(71)
(72)
(73)
(74)
(75)
(76)
(77)
(78)
(79)
(80)
(81)
(82)
(83)
(84)
(85)
(86)
(87)
(88)
(89)
(90)
(91)
(92)
(93)
(94)
(95)
(96)
(97)
(98)
(99)
(100)
(101)
(102)
(103)
(104)
(105)
(106)

21:40

(107)
(108)
(109)
(110)
(111)
(112)

22:10

(113)
(114)

22:15

(115)

Conteo Rápido Resultado Final

PAN (35.8, 36.4) 35.89

PRD (35.1, 35.6) 35.59

(116)

18:51

Resultados Conteo Rápido 2012

(117)
(118)
(119)
(120)
(121)
(122)
(123)
(124)
(125)
(126)
(127)
(128)
(129)
(130)
(131)
(132)
(133)
(134)
(135)
(136)
(137)
(138)
(139)
(140)
(141)
(142)
(143)
(144)
(145)
(146)
(147)
(148)
(149)
(150)
(151)
(152)
(153)
(154)
(155)
(156)
(157)
(158)
(159)
(160)
(161)

22:30

(162)
(163)

Comentarios Finales

Estos son solamente dos ejemplos del análisis Bayesiano de

muestras de poblaciones finitas.

Aún no existe una literatura abundante y concluyente sobre el

tema.

(164)

Referencias

Documento similar

El Programa de Mecenazgo organiza un concurso para &#34;Amigos del IAC&#34; en el cual podrán realizar una propuesta de observación para un telescopio robótico 1. Aquellas que

Necessary and su fficient conditions for their existence in an approximate dynamics of order k are obtained and we give explicit expressions of these equilibria, use- ful for the

Los dispositivos Android pueden encontrarse en varios modos: modo normal (es el modo en que se suele iniciar el dispositivo y en el que se realizan las tareas básicas como

Cada época, a través de la poesía, avanza sus propias reivindicaciones, y el lector de este libro, ante todo, descubrirá cuán fecunda es hoy en día la lectura de José

En cada antecedente debe considerarse como mínimo: Autor, Nombre de la Investigación, año de la investigación, objetivo, metodología de la investigación,

Respecto a la familia de instrumento, los resultados del análisis no paramétrico nos indican que los docentes de la especialidad de percusión se perciben como

En consecuencia, a fin de avanzar en la comprensión de la cronología de la anexión incaica del Collasuyo mediante la elaboración de interpretaciones alternativas a las basadas en

crear un espacio (laboratorio de análisis social y diseño) que nos permita abordar el problema de la topofobia desde acercamientos no unidiscipli- nares; recopilar información sobre