Muestreo y
Distribuciones
Muestrales
Dr. Víctor Aguirre Torres, ITAM. 2
Muestreo
POBLACION muestra Muestreo
Inferencia Estadística
Conteos rápidos, preferencias electorales, etc.
Tipos de Muestreo
Muestreo No Probabilístico
No aplican las fórmulas estadísticas del curso
Muestreo Probabilístico.
Aplican las fórmulas estadísticas del
curso
Dr. Víctor Aguirre Torres, ITAM. 4
Muestreo No Probabilístico
No se conocen de antemano las
probabilidades de que aparezcan cada uno de los elementos de la población en la
muestra.
Ejemplos: Muestreo por Conveniencia,
Muestreo en Centros Comerciales, Muestreo por Cuotas, Encuestas Telefónicas no
Solicitadas, etc.
Adolece de sesgos en la selección de la muestra.
Muestreo Probabilístico
Las unidades se seleccionan por un
procedimiento probabilístico controlado.
Las probabilidades de que aparezcan cada uno de los elementos de la
población en la muestra se conocen de antemano.
Evita sesgos en la selección de los
elementos de la muestra.
Dr. Víctor Aguirre Torres, ITAM. 6
Tipos de Muestreo Probabilístico
Muestreo Aleatorio Simple (MAS)
Muestreo Sistemático (MS) con Arranque Aleatorio
Muestreo Aleatorio Estratificado (MAE)
Muestreo Polietápico o por
Conglomerados.
Muestreo Aleatorio Simple (MAS)
Existe un marco de muestreo: listado, mapa, tarjetero, etc.
Todas la unidades tiene IGUAL.
probabilidad de aparecer en la muestra.
N = Tamaño de la población.
n = Tamaño de la muestra.
Total de muestras disrtintas: C
nNDr. Víctor Aguirre Torres, ITAM. 8
Muestreo Aleatorio Simple (MAS).
=ALEATORIO.ENTRE(1,$E$3)
Muestreo Aleatorio Simple.
Tamaño de la población N 400
Tamaño de la muestra n 15
Variable orden
Elemento a encuestar
265 1 167
71 2 397
24 3 213
10 4 85
361 5 93
65 6 112
324 7 100
375 8 31
382 9 134
69 10 86
60 11 149
57 12 381
69 13 369
399 14 286
14 15 274
Los elementos se fijan copiando los valores de la columna variable.
Muestreo Sistemático con Arranque Aleatorio (MS)
Existe un marco de muestreo: listado, mapa, tarjetero, etc.
Todas la unidades tiene IGUAL probabilidad de aparecer en la muestra.
Procedimiento:
Calcular k=N/n.
Elegir un arranque aleatorio entre 1 y k, digamos a.
Elegir las unidades a, a+k, a+2k, ... Etc.
Dr. Víctor Aguirre Torres, ITAM. 10
Muestreo Sistemático (MS) con Arranque Aleatorio.
Muestreo Sistemático con Arranque Aleatorio Tamaño de la población N 1000
Tamaño de la muestra n 40
Muestrear uno cada k 25 Variable
Arranque aleatorio 23 19 orden
Elemento a encuestar
1 19
2 44
3 69
4 94
5 119
6 144
38 944
39 969
40 994
...
¿Qué se observa o mide?
Variable cuantitativa X
1= edad de un árbol X
2= ingreso del hogar X
3= gasto del hogar
Variable cualitativa
X
5= partido político
X = género
Dr. Víctor Aguirre Torres, ITAM. 12
Estimación Puntual. Variable cuantitativa X
Estimadores puntuales (muestra)
∑
==
n1 i
x
in x 1
∑
=−
= n
1 j
2 j
2
X ( x x )
1 - n s 1
∑
==
N1 j
j
X
x
N
µ 1
∑
=−
= N
1 j
2 X j
2
X ( x )
N
1
µ
σ
POBLACION muestra
Muestreo
Inferencia Estadística
Población, fijo Muestra, variable aleatoria
Ejemplo.
Se obtuvo una muestra sistemática de 22 carrocerías de una línea de pintado.
Se midieron espesores de las carrocerías en 3 planos y 7 posiciones.
3 2
1
Dr. Víctor Aguirre Torres, ITAM. 14
Datos Muestrales.
obs ESP3.1 ESP3.2 ESP3.4 ESP1.2 ESP1.3 ESP2.2 ESP2.3
1 1 0.98 1 0.93 0.77 1.19 1.02
2 0.98 0.96 0.89 0.92 0.83 1.09 0.97
3 1.01 0.94 0.92 0.94 0.75 1.12 0.98
4 0.92 0.85 0.87 0.93 0.8 1.09 0.88
5 1.02 0.97 1.05 1.09 0.93 1.09 0.97
6 0.93 0.96 0.85 0.91 0.83 1.01 0.89
7 1.1 1.01 1.02 0.85 0.96 1.1 1.06
8 1.23 1.1 1.21 0.98 0.92 1.3 1.3
9 1.18 1.18 1.13 1.01 1 1.18 1.21
10 1.18 1.1 1.12 0.93 1 1.13 0.94
11 0.89 0.84 0.8 0.88 0.72 0.96 0.75
12 1.06 0.93 0.81 0.91 0.81 0.94 0.87
13 1.04 0.98 0.94 1.01 0.92 1.06 1
14 1.09 1.01 1.02 1.08 0.72 1.04 0.89
15 1.08 1.05 1.14 0.91 0.89 1.06 1
16 1.02 1.09 1 0.89 0.87 1.05 0.88
17 1 1.02 0.91 0.93 0.81 1.08 0.85
18 0.93 0.98 0.84 0.83 0.7 0.98 0.84
19 1.02 1.01 0.94 0.97 0.79 1.1 1
20 0.89 0.84 0.83 0.98 0.89 0.94 0.83
21 1.09 1.05 0.96 1.1 0.96 1.26 1
22 0.87 0.96 0.81 0.91 0.81 1.02 0.84
Promedio 1.0241 0.9914 0.9573 0.9495 0.8491 1.0814 0.9532 Var
muestral 0.0096 0.0073 0.0143 0.0053 0.0083 0.0087 0.0157 Desviación
Estándar 0.0980 0.0855 0.1195 0.0725 0.0909 0.0935 0.1255
Variable cualitativa X
X solo toma valores 0 o 1.
Parámetro poblacional de interés:
población la
en unos
de Proporción
N x p 1
N 1 j
j X
=
= ∑
=
Dr. Víctor Aguirre Torres, ITAM. 16
Estimación Puntual
Parámetro Estimador
∑
== n
1 i
i
X x
n p 1
∑
== N
1 j
j
X x
N p 1
Población, fijo Muestra, variable aleatoria
POBLACION muestra Muestreo
Inferencia Estadística
Ejemplo.
Se obtuvo una muestra sistemática de 1114 electores que fueron a votar en una elección. Datos Muestrales:
Votos a favor p barra
Partido 1 473 0.4246
Partido 2 418 0.3752
Partido 3 167 0.1499
Partido 4 56 0.0503
Total 1114
Dr. Víctor Aguirre Torres, ITAM. 18
Variación Muestral
Tanto como son variables aleatorias.
Ambas pueden tomar una cantidad prácticamente infinita de valores
distintos.
Se puede modelar su variación por medio de la distribución de
probabilidades Normal.
x p
Demo de la Universidad de Rice
http://www.ruf.rice.edu/~lane/stat_sim/sampli ng_dist/
Muestra el histograma del promedio muestral, en el caso hipotético que se pudiesen obtener una gran cantidad de muestras de la misma población.
Si n=25 (tamaño de la muestra) el histograma es aproximadamente normal.
Dr. Víctor Aguirre Torres, ITAM. 20
Distribución Muestral de bajo MAS y MS.
Se puede mostrar que
Teorema del Límite Central. Para n>30, tiene un distribución de probabilidades
aproximadamente normal con media y desviación estándar
x
2 X X
X X )
) x (
E = µ = σ = σ ; E(s2X =σ ) n
x Var(
;
n
σ
Xx
µ
X0.82 0.84 0.86 0.88 0.90 0.92 0.94 0.96 0.98
f(x) 0
5 10 15 20 25
Distribución Muestral de
bajo MAS y MS. Posición 1.2.
x
0192 .
09 0 . 0
09 .
9 . 0 ) x ( E
9 . 22
n
) 2 . 1 ( X
) 2 . 1 ( X
2 . 1
) 2 . 1 ( X
=
=
=
=
=
=
22
(supuesto) (supuesto) 0
σ σ µ
Intervalo de Variación
Muestral Máxima: 0.842-0.957
0192 ) .
0
9 . 0 957 . z 0 0192
. 0
9 . 0 842 . (0 P ) 957 . 0 x
842 . 0 (
P < 1.2 < = − < < −
Valor observado
Dr. Víctor Aguirre Torres, ITAM. 22
Distribución Muestral de bajo MAS y MS.
Se puede mostrar que
Si np>5 y n(1-p)>5 entonces la distribución muestral de se pues aproximar con una distribución normal con parámetros
p
n
) p 1
( ) p
p Var(
; p )
p (
E = = − = σ 2p
n
) p 1
( p p
) p (
E = p = −
= σ
µ y p
0.29 0.31 0.32 0.34 0.35 0.36 0.38 0.39 0.41
f(x) 0
5 10 15 20 25 30
Distribución Muestral de bajo MAS y MS.Partido 2.
p
0.014291 0.000204
; 389.9
(supuesto)
0.35
σ
) p Var(
1 . 724 )
p 1 ( n np
p ) p ( E
1114 n
p2
2
2 2
2 2
=
=
=
−
=
=
=
=
Intervalo de Variación
Muestral Máxima: 0.3071-0.3928
Valor observado
01429 ) .
0
35 . 0 3928 .
z 0 01429
. 0
35 . 0 3071 .
(0 P ) 3928 .
0 p 3071 .
0 (
P < 2 < = − < < −
Dr. Víctor Aguirre Torres, ITAM. 24
Problemas Recomendados Capítulo 7.
Promedio muestral: 26, 30.