Master en Marketing Muestreo en Poblaciones finitas
Master en Marketing Muestreo en Poblaciones finitas
Tema1: Muestreo en poblaciones finitas
•
1. Introducción
•
2. Conceptos básicos
•
3. Selección de la muestra
–
3.1. Muestreos probabilísticos y no probabilísticos.
–
3.2. Muestreos unietápicos y polietápicos.
–
3.3. Muestreo sin reposición y con reposición.
–
3.4. Distribuciones de probabilidad en el muestreo
probabilístico
•
4. Estimación
–
4.1. Propiedades de los estimadores
–
4.2. Sesgo en las estimaciones
–
4.3. Normalidad
Master en Marketing Muestreo en Poblaciones finitas
Tema1: Muestreo en poblaciones finitas
Para la toma de decisiones en el ámbito empresarial y social, es
necesario el mayor grado de conocimiento de la situación que se desea
intervenir. La información requerida es un conjunto de variables tanto
cuantitativas como cualitativas, y la calidad de esta información, incide
directamente en las consecuencias derivadas de las decisiones
adoptadas
.
1. Introducción
Master en Marketing Muestreo en Poblaciones finitas
Población:
es el objeto de nuestro estudio, el conjunto de unidades en las
cuales es posible definir una variable cualitativa o cuantitativa, que
representa la característica o características que se desean estudiar. Los
diferentes elementos de la población se denominan Miembros o
Individuos.
Tema1: Muestreo en poblaciones finitas
La población se puede clasificar por el tamaño en finitas o infinitas.
Las poblaciones infinitas: no son completamente observables, por lo que se resolverá conociendo la distribución de probabilidad a través del proceso de inferencia sobre parámetros desconocidos.
Las poblaciones finitas, compuestas por una cantidad finita de miembros N, se plantean dos posibles situaciones según sea o no posible la observación completa
Master en Marketing Muestreo en Poblaciones finitas
-
Un censo
consiste en la observación de la característica de estudio en todos y cada uno de los individuos que constituyen la población.En modelos censales se conoce perfectamente la distribución de probabilidad de la variable, no existiendo por tanto ningún problema de inferencia estadística
Tema1: Muestreo en poblaciones finitas
-
Una muestra
es un subconjunto de la población en estudio.La finalidad de una muestra es construir un modelo reducido de la población cuyos resultados sean extrapolables a la población total. Para que la extrapolación sea posible la muestra debe ser representativa, es decir, la distribución de la característica en la muestra debe comportarse del mismo modo que en la población.
2. Conceptos básicos
Master en Marketing Muestreo en Poblaciones finitas
Se denomina
muestreo
al procedimiento de selección de la muestra.
Es obvio que el procedimiento de extraer conclusiones sobre la
población a partir de un subconjunto de la misma está sujeto a error.
Algunos procedimientos de muestreo permiten controlar el error,
haciendo que sea el menor posible, y estimando su tamaño.
Aún siendo posible el estudio de todos y cada uno de los elementos que
componen la población, el estudio de la misma mediante métodos de
muestreo presenta ventajas frente al censo. Estas son reducción del
volumen de datos, por lo que redunda en menor coste y mayor rapidez
para obtener conclusiones.
Se contemplan al menos dos etapas en una investigación por muestreo,
Tema1: Muestreo en poblaciones finitas
Master en Marketing Muestreo en Poblaciones finitas
A continuación se enumeran las fases, en sentido amplio de una
investigación por muestreo:
1.Trabajos preliminares o previos
: Definición del objetivo y la
elaboración del cuestionario.
2.Diseño de la muestra
:
• Plan de muestreo: Definición del tamaño de la muestra y definición de las unidades de muestreo.
• Métodos de estimación: Decidir el tipo de muestreo, y por tanto las estimación que realizaremos.
3.Trabajo de campo
: Proceso de recogida de datos.
4.Proceso de datos:
Aplicación de las formulas de estimación elaboradas.
5.Elaboración del informe final.
Tema1: Muestreo en poblaciones finitas
Master en Marketing Muestreo en Poblaciones finitas
- Unidad de muestreo es cada una de las partes en que se divide la población para seleccionar la muestra.
Estas unidades de muestreo las elige el investigador, con la condición que sean distinguibles e identificables. Pueden ser elementales si es el objeto último del que se desea obtener la información o no elementales si están constituidas por grupos de unidades elementales.
Tema1: Muestreo en poblaciones finitas
3. Selección de la muestra
La selección cobra mucha importancia sobre todo en poblaciones heterogéneas sobre las variables de estudio, ya que si es homogénea la población, cualquier unidad seleccionada seria representativa.
Un paso previo a la selección de la muestra es dividir la población en partes.
Master en Marketing Muestreo en Poblaciones finitas
En cuanto a la forma en que se seleccionan las unidades muestrales se distinguen dos grandes tipos de muestreo: muestreos no probabilísticos y muestreos probabilísticos.
Tema1: Muestreo en poblaciones finitas
3. Selección de la muestra
•Los muestreos probabilísticos se caracterizan porque cada elemento de la población tiene una probabilidad conocida y no nula de ser seleccionada. Los resultados se obtienen mediante un proceso automático objetivo que permite medir y controlar los errores. Entre los muestreos probabilísticos destacan los siguientes: •Entre los muestreos no probabilísticos se encuentran el muestreo opinático o el muestreo errático. El investigador selecciona determinísticamente las unidades muestrales. El grave inconvenientes es que no se puede cuantificar los errores cometidos en la estimación o fijar tamaño muestrales. Muestreos Subjetivos.
Master en Marketing Muestreo en Poblaciones finitas
• Muestreo aleatorio simple. Es un método de selección de un número fijo de unidades muestrales n, que garantiza que todas las muestras de tamaño n tienen la misma probabilidad de ser escogidas.
• Muestreo estratificado. Se particiona la población en conjuntos llamados estratos que se caracterizan porque en cada uno de ellos los elementos son homogéneos entre si y heterogéneos entre los diferentes estratos.
• Muestreo por conglomerados. Se divide la población en grupos de proximidad. Si la proximidad es geográfica, se denomina muestreo por áreas.
• Muestreo sistemático. Se determina un procedimiento que permite escoger la totalidad de la muestra a partir de la selección aleatoria de la primera unidad muestral.
La elección y aplicación de estos métodos esta supeditada a la información complementaria que se posea sobre la característica en estudio.
Tema1: Muestreo en poblaciones finitas
3. Selección de la muestra
Master en Marketing Muestreo en Poblaciones finitas
Por lo que respecta al número de fases contempladas en el proceso de selección se distingue entre muestreo unietápico y muestreo multietápico.
Tema1: Muestreo en poblaciones finitas
3. Selección de la muestra
•Por otra parte, el muestreo multietápico consta de varias fases de selección. En cada fase se seleccionan mediante el procedimiento escogido, un conjunto de unidades muestrales. En segundas y posteriores fases se muestrea en unidades de orden inferior contenidas en las unidades escogidas en la primera etapa. Las unidades muestrales de la primera etapa se denominan primarias. Las unidades contenidas en las primarias que se consideran en la segunda etapa se denominan
secundarias, y así sucesivamente hasta llegar a las unidades elementales.
•El muestreo unietápico consta de una única fase de selección. Se escoge un tipo de muestreo y de su aplicación se obtiene la muestra.
Master en Marketing Muestreo en Poblaciones finitas
Atendiendo al número de veces que cada unidad muestral puede
aparecer en la muestra
, los procedimientos de muestreo
se clasifican en
muestreo sin reposición y muestreo con reposición.
Tema1: Muestreo en poblaciones finitas
3. Selección de la muestra
•
Muestreo con reposición,
al menos en una muestra del conjunto de
todas las posibles aparece como mínimo una unidad muestral dos veces.
•
Muestro sin reposición
cada unidad muestral sólo puede obtenerse una vez.
Master en Marketing Muestreo en Poblaciones finitas
En un muestreo probabilístico sobre una población finita se consideran distribuciones de probabilidad en cada muestra y en el conjunto de todas las posibles muestras, tal y como se establece a continuación.
La población constituida por N individuos es el conjunto: A={A1,….., AN}
Tema1: Muestreo en poblaciones finitas
3. Selección de la muestra
Espacio muestral es el conjunto de todas las posibles muestras. Cada
muestra de tamaño n estará formada por n individuos y se denotará mediante el conjunto:
MAj={a1,….., an} ai∈A, i=1, 2,...,n
El índice j permite diferenciar cada muestra particular dentro de conjunto de todas las posibles muestras de tamaño n. El orden de los índices en la muestra no
Master en Marketing Muestreo en Poblaciones finitas
Previamente vamos a ver formulas para calcular el número de muestras
posibles tendiendo en cuenta si la elección de los individuos en la muestra
es con reposición o sin reposición y si se distingue el orden en el que fue
elegido o no se distingue: donde n= tamaño de la muestra y N el numero
de elementos de la población.
Tema1: Muestreo en poblaciones finitas
n
n
N
N
VR
,
=
3. Selección de la muestra
3.4. Distribuciones de probabilidad en el muestreo probabilístico
Master en Marketing Muestreo en Poblaciones finitas
•
Muestra con reposición y no distinguiendo el orden:
Tema1: Muestreo en poblaciones finitas
3. Selección de la muestra
3.4. Distribuciones de probabilidad en el muestreo probabilístico
)!
1
(
!
)!
1
(
1
,−
⋅
−
+
=
+
−
=
N
n
n
N
n
n
N
CR
N n•
Muestra sin reposición y distinguiendo el orden:
)!
(
!
,n
N
N
V
N nMaster en Marketing Muestreo en Poblaciones finitas
•
Muestra sin reposición y no distinguiendo el orden:
Tema1: Muestreo en poblaciones finitas
3. Selección de la muestra
3.4. Distribuciones de probabilidad en el muestreo probabilístico
)!
(
!
!
,
n
N
n
N
n
N
C
N
n
−
⋅
=
Master en Marketing Muestreo en Poblaciones finitas
siendo J(n) el número posible de muestras distintas de tamaño n.
La distribución conjunta depende del tipo de muestreo utilizado. En el muestreo aleatorio simple, por ejemplo, todas las muestras posibles tienen la mismaprobabilidad
Tema1: Muestreo en poblaciones finitas
P
jP
jj J n
≥
=
=
∑
0
1
1
y
( )
3. Selección de la muestra
3.4. Distribuciones de probabilidad en el muestreo probabilístico
-Distribución conjunta de la muestra es la distribución de probabilidad definida sobre el conjunto de todas las posibles muestras.
Es decir, es el conjunto de valores P(MAj) = Pj que asigna a cada muestra MAj de tamaño n la probabilidad que tiene de ser seleccionada.
Master en Marketing Muestreo en Poblaciones finitas
-Distribuciones marginales de las componentes de la muestra es la probabilidad de que en una posición concreta i de la muestra sea seleccionado un individuo concreto Ar:
Pir=P(ai=Ar), para cada i fijo
Se verifica para cada i:
Tema1: Muestreo en poblaciones finitas
A partir de las distribuciones conjuntas y marginales se obtienen las distribuciones de probabilidad de las variables contador, que indican el número de
3. Selección de la muestra
3.4. Distribuciones de probabilidad en el muestreo probabilístico
1
y
0
1
=
≥
∑
=
N
r
ir
ir
P
Master en Marketing Muestreo en Poblaciones finitas
La distribución de probabilidad de las frecuencias absolutas depende del tipo de muestreo utilizado.
Tema1: Muestreo en poblaciones finitas
3. Selección de la muestra
3.4. Distribuciones de probabilidad en el muestreo probabilístico
Las variables contador se definen como:
F
A
A
ir
r r
=
=
≠
1
0
si a
si a
i
i
y
F
rF
iri n
.
=
=
∑
1
Estas variables son las frecuencias absolutas de aparición del individuo r- ésimo en una posición concreta y en la muestra respectivamente.
Es evidente que para cualquier valor de r,
}
n
,...,
1
,
0
{
F
.r∈
∑
=
=
N
1 r
r
n
F
Master en Marketing Muestreo en Poblaciones finitas
En poblaciones finitas el problema de la estimación se centra en
parámetros descriptivos de la población sobre una o varias características
cuantitativas como la media, varianza, el total, etc., o cualitativas como la
proporción de individuos que presentan una determinada cualidad.
Las características asociadas al individuo Ai de la población se
representarán por Xi , Yi , Zi…. Los valores correspondientes al individuo
aj de la muestra por xj , yj , zj….
Los parámetros poblacionales se notarán con mayúsculas frente a los
muestrales con minúsculas.
Tema1: Muestreo en poblaciones finitas
Master en Marketing Muestreo en Poblaciones finitas
Los parámetros poblacionales que son más frecuentemente objeto de
estudio son:
Tema1: Muestreo en poblaciones finitas
4. Estimación
a) De carácter cuantitativo:
Media poblacional:
X
=
1
N
iX
iN
=
∑
1
Total poblacional:
∑
= N 1 i i
X
=
X
X
=
N
X
Varianza poblacional: N 2
Master en Marketing Muestreo en Poblaciones finitas
Cuasivarianza poblacional:
Tema1: Muestreo en poblaciones finitas
4. Estimación
a) De carácter cuantitativo:
∑
=
−
N
1 i
2 i
2
)
X
X
(
1
-N
1
=
S
2 21
-N
N
=
S
σ
Coeficientes de variación :
C
X
x
=
σ
C
S
X
x
Master en Marketing Muestreo en Poblaciones finitas
b) De carácter cualitativo
:
Tema1: Muestreo en poblaciones finitas
4. Estimación
Total de clase: A
Proporción poblacional
N
A
=
P
Master en Marketing Muestreo en Poblaciones finitas
Tema1: Muestreo en poblaciones finitas
4. Estimación
b) De carácter cualitativo
:
Las medidas cualitativas se pueden transformar en cuantitativas sin más que considerar la variable Xi definida como:
1 si el individuo
presenta la cualidad C
0 si el individuo
no presenta la cualidad C
i i
i
A
X
A
=
verificándose de esta forma:
X
=
P
,
X
A
N 1 i
i
∑
=
Master en Marketing Muestreo en Poblaciones finitas
c) Considerando dos características en la población
Tema1: Muestreo en poblaciones finitas
4. Estimación
Covarianza poblacional
σ
XY i ii N
N
X
X Y Y
=
−
−
=
∑
1
1
(
)(
)
Cuasivarianza poblacional
S
N
X
X Y Y
XY i i
i N
=
−
∑
=−
−
1
1
1(
)(
)
Razón poblacional
Y
X
Y
X
=
=
Master en Marketing Muestreo en Poblaciones finitas
Se denomina
inferencia
al proceso mediante el cual se obtienen
conclusiones sobre la población través del análisis de una muestra de
la misma
Los procedimientos de inferencia no son independientes del tipo
de muestreo utilizado, puesto que éste condiciona las probabilidades de
las distintas muestras que pueden aparecer.
Tema1: Muestreo en poblaciones finitas
4. Estimación
Dado un tipo de muestreo probabilístico, a partir del cual se
obtiene una muestra, se denomina estimador a una función de la
muestra que se usa para inferir el valor de la característica
poblacional que queremos estimar.
ɵ( ,...., ) ɵ
θ x1 xn =θ
El conjunto de valores que puede tomar el parámetro se
Master en Marketing Muestreo en Poblaciones finitas
Este proceso de estimación en el que para cada muestra, el estimador
proporcionará una estimación concreta del parámetro se denomina
estimación puntual
. Por otra parte, cada muestra tiene una probabilidad
de ser seleccionada, por tanto, las distintas estimaciones tendrán su
correspondiente probabilidad que dependerá tanto del procedimiento de
selección de la muestra, ya que este determina las probabilidades de las
mismas, como del estimador empleado.
Tema1: Muestreo en poblaciones finitas
4. Estimación
Bajo este punto de vista un estimador es una variable aleatoria, que
tomará el valor
ɵ
(
, .... ,
)
θ
x
1x
n∈ ℜ
Master en Marketing Muestreo en Poblaciones finitas
Tendrá por tanto perfecto sentido hablar de su esperanza, varianza, etc.
Por ejemplo la esperanza del estimador se calcularía como
Tema1: Muestreo en poblaciones finitas
4. Estimación
E
x
x
nP
jMAj
[
θ
ɵ
]
=
∑
θ
ɵ
( ,....,
1)
Donde la suma se efectúa sobre todas las posibles muestras de tamaño n.
Master en Marketing Muestreo en Poblaciones finitas
4.1. Propiedades de los estimadores
Tema1: Muestreo en poblaciones finitas
4. Estimación
Un primer criterio para estudiar la bondad de un estimador se
obtiene definiendo el error cometido en la estimación. Éste se define
como la distancia entre la estimación realizada y el verdadero valor del
parámetro . Para eliminar la influencia del signo en esta diferencia se
considera su cuadrado , y puesto que esta medida es una variable
aleatoria se toma un representante calculando su esperanza.
Se denomina error cuadrático medio (ECM)
aECM
(
θ
ˆ
)
=
E
(
θ
ˆ
−
θ
)
2Se verifica que
2)
)
ˆ
(
E
(
)
ˆ
(
V
)
ˆ
(
Master en Marketing Muestreo en Poblaciones finitas
Un valor pequeño del error cuadrático medio significa que el
estimador elegido, en media, no se encuentra lejos del parámetro
desconocido y este podría ser un buen criterio para comparar distintos
estimadores, eligiendo aquel que minimice el error cuadrático medio.
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.1. Propiedades de los estimadores
Master en Marketing Muestreo en Poblaciones finitas
4.1.1. Estimador insesgado
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.1. Propiedades de los estimadores
Un estimador es insesgado cuando su media o esperanza
matemática coincide con el valor verdadero del parámetro
desconocido:
θ
θ
ˆ
)
=
(
E
Si el estimador es insesgado, minimiza el segundo sumando en
que se descompone el error cuadrático medio,
0
)
)
ˆ
(
(
E
θ
−
θ
2=
Master en Marketing Muestreo en Poblaciones finitas
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.1. Propiedades de los estimadores
4.1.1. Estimador insesgado
En este caso el error cuadrático medio coincide con la varianza del
estimador. Se dirá en este caso que un estimador es eficiente cuando
es el que tiene mínima varianza entre todos los estimadores
insesgados.
Master en Marketing Muestreo en Poblaciones finitas
4.1.2. Estimador consistente
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.1. Propiedades de los estimadores
Un estimador es consistente si la probabilidad de que la
desviación entre el estimador y el valor verdadero del parámetro
sea superior a cualquier número
ε
por pequeño que sea, se acerca a
cero cuando el número de elementos de la muestra se acerca al
número de elementos en la población.
0
)
ˆ
(
−
>
n →
→
NP
θ
θ
ε
Master en Marketing Muestreo en Poblaciones finitas
Además del sesgo debido a la elección de estimador existen otras causas de sesgo que se deben al proceso de selección. Entre éstas se señalan las siguientes:
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.2. Sesgo en las estimaciones
1. Tendencias en la no respuesta
:
Master en Marketing Muestreo en Poblaciones finitas
2. Inadecuada definición de las unidades muestrales.
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.2. Sesgo en las estimaciones
Puede ocurrir en este caso que algunas unidades elementales
tengan probabilidad nula o superior al resto.
3. Método de reposición
Master en Marketing Muestreo en Poblaciones finitas
4. Efecto del investigador
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.2. Sesgo en las estimaciones
Master en Marketing Muestreo en Poblaciones finitas
Es habitual asumir que la distribución del estimador es una distribución normal. Sin embargo, en una población finita, y por tanto discreta, no se puede hablar estrictamente de distribución normal, ya que ésta es continua. Asumimos la distribución normal de una población cuando su distribución de frecuencias se encuentra suficientemente próxima a la obtenida de la normal.
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.3. Normalidad
Si un estimador está formado por combinaciones lineales de unapoblación normal, su distribución también es normal.
Master en Marketing Muestreo en Poblaciones finitas
Es claro que la estimación puntual posee la ventaja de dejar especificado unívocamente el parámetro que se pretende estimar, pero no es menos claro que una vez obtenido éste no tenemos ninguna forma de saber si se encuentra próximo o no al auténtico valor del parámetro. Para tener una medida del error cometido en la estimación conviene considerar la estimación por intervalos.
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.4. Intervalos de confianza
Master en Marketing Muestreo en Poblaciones finitas
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.4. Intervalos de confianza
Desde un punto de vista teórico un intervalo de confianza queda definido por dos estadísticos
)
,...,
(
ˆ
)
,...,
(
ˆ
1 2 1
1
x
x
nθ
x
x
nθ
<
que verifican
α
θ
θ
θ
ˆ
(
,...,
)
<
<
ˆ
(
,...,
))
=
1
−
(
1x
1x
n 2x
1x
nP
En tal caso para una muestra concreta
))
,...,
(
ˆ
),
,...,
(
ˆ
Master en Marketing Muestreo en Poblaciones finitas
Una vez observada la muestra no tiene sentido hablar de probabilidad,
bien ocurre
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.4. Intervalos de confianza
))
,...,
(
ˆ
),
,...,
(
ˆ
(
θ
1x
1x
nθ
2x
1x
nθ
∈
o bien,(
ˆ
(
,...,
),
ˆ
(
,...,
))
1 2 1
1
x
x
nθ
x
x
nθ
θ
∉
Master en Marketing Muestreo en Poblaciones finitas
La estimación por intervalos proporciona una medida de la
precisión obtenida a partir de la longitud del intervalo, cuanto menor
sea la amplitud del intervalo más precisa es la estimación, es decir
menor error cometemos. La situación óptima sería conseguir intervalos
de pequeña longitud y con un alto nivel de confianza, sin embargo
estas dos medidas se comportan en sentido inverso, es decir, con un
tamaño muestral fijo si decidimos aumentar el nivel de confianza,
también aumentará la longitud del intervalo por tanto perderemos
precisión, si decidimos aumentar la precisión nos veremos afectados
por una reducción en el nivel de confianza. Todo ello afectado por el
tamaño muestral que permite al aumentar una mejora tanto en la
precisión como en el nivel de confianza.
Tema1: Muestreo en poblaciones finitas
4. Estimación
Master en Marketing Muestreo en Poblaciones finitas
4.4.1. Intervalos de confianza para estimadores insesgados
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.4. Intervalos de confianza
Bajo la hipótesis de normalidad, si el estimador es insesgado
) 1 , 0 ( )
ˆ ( ˆ
N V
≡ −
θ θ θ
de modo que el intervalo se obtiene despejando θ de la expresión
α
θ
θ
θ
α
=
−
<
−
1
)
ˆ
(
ˆ
Z
V
Master en Marketing Muestreo en Poblaciones finitas
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.4. Intervalos de confianza
4.4.1. Intervalos de confianza para estimadores insesgados
Siendo entonces el intervalo de confianza:
)
)
ˆ
(
z
ˆ
,
)
ˆ
(
z
-ˆ
(
I
2
2
θ
θ
θ
θ
αV
+
αV
=
Donde
2
z
α es el número real que verificaα
α
=
−
≤
)
1
)
1
,
0
(
(
2
z
N
Master en Marketing Muestreo en Poblaciones finitas
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.4. Intervalos de confianza
4.4.1. Intervalos de confianza para estimadores insesgados
Expresión que depende de la varianza del estimador, por tanto sólo será útil cuando ésta sea conocida. Si se desconoce dicha varianza se pueden obtener intervalos usando la estimaciones apropiadas de la misma.
Sin la hipótesis de normalidad se puede utilizar la desigualdad de Chebyshev, si el estimador es insesgado, que establece:
(
θ
ˆ
−
θ
<
K
)
≥
1
−
α
P
siendo2
K
)
ˆ
(
V
θ
Master en Marketing Muestreo en Poblaciones finitas
Tema1: Muestreo en poblaciones finitas
4. Estimación
4.4. Intervalos de confianza
4.4.1. Intervalos de confianza para estimadores insesgados
El intervalo de confianza construido en este caso es:
+
−
=
α
θ
θ
α
θ
θ
ˆ
V
(
ˆ
)
,
ˆ
V
(
ˆ
)
I
Master en Marketing Muestreo en Poblaciones finitas
Tema 2:
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
1. Selección de la muestra
• 1.1. Sin reemplazamiento y sin distinción de orden.
• 1.2. Con reemplazamiento y sin distinción de orden.
• 1.3. Sin reemplazamiento distinguiendo el orden.
• 1.4. Con reemplazamiento y distinguiendo el orden. 2. Estimación de la media y del total
• 2.1. Estimación de la media
• 2.2. Estimación del total
• 2.3. Estimación de la diferencia de dos medias o dos totales 3. Estimación de la proporción y del total de clase
• 3.1. Estimación de la proporción
• 3.2. Estimación del total de clase
• 3.3. Estimación de la diferencia de proporciones 4. Estimación en subpoblaciones
• 4.1. Estimación si se conoce el número de elementos de la subpoblación
• 4.2. Estimación si se desconoce el número de elementos de la subpoblación 5. Muestreo con reemplazamiento
• 5.1. Estimación de la media poblacional y del total
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
1. Selección de la muestra
Se denomina muestreo aleatorio simple a un método de selección de una muestra de tamaño n de tal modo que todas las muestras tienen la misma probabilidad de ser seleccionadas.
Se presentan cuatro situaciones según se permita o no el reemplazamiento y se distingan o no las muestras por el orden en que se presentan las unidades muestrales contenidas en ellas.
Master en Marketing Muestreo en Poblaciones finitas
Se denomina también muestreo irrestrictamente aleatorio.
Tema 2: Muestreo aleatorio simple
1. Selección de la muestra
1.1. Sin reemplazamiento y sin distinción de orden.
En una población de tamaño N encontramos
N n
⎛ ⎝
⎜ ⎞
⎠ ⎟
posibles muestras distintas, siendo por tanto la probabilidad de elección de cada una de ellas:
P
N
n
n
N
n
N
j
=
⎛
⎝
⎜
⎞
⎠
⎟
=
−
1
!(
) !
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
1. Selección de la muestra
1.1. Sin reemplazamiento y sin distinción de orden.
Las frecuencias de aparición de los individuos Fr tomarán valores en {0,1} de modo que :
muestras
de
total
Nº
A
incluido
está
que
las
en
muestras
de
º
N
)
1
F
(
P
r=
=
rN
n
F
P
(
r=
1
)
=
N
n
F
P
(
r=
0
)
=
1
−
Además las probabilidades conjuntas de los indicadores vienen dadas por
)
1
(
)
1
,
1
(
−
−
=
=
=
F
n
n
F
Master en Marketing Muestreo en Poblaciones finitas
Esto es, el número de muestras en las que están incluidos tanto Ar como As dividido entre el número total de muestras.
Tema 2: Muestreo aleatorio simple
1. Selección de la muestra
1.1. Sin reemplazamiento y sin distinción de orden.
Se verifica:
,
]
[
N
n
F
E
r=
(
)
(
1
)
N
n
N
n
F
V
r=
−
⎟
⎠
⎞
⎜
⎝
⎛ −
−
−
=
N
n
1
)
1
N
(
N
n
)
F
,
F
(
COV
r sy
Fracción de muestreo:
N
n
f
=
es la proporción de unidades de la población contenidas en la muestra. Y factor de elevación es su inverso,
n N
Master en Marketing Muestreo en Poblaciones finitas
1.2. Con reemplazamiento y sin distinción de orden.
Tema 2: Muestreo aleatorio simple
1. Selección de la muestra
En una población de tamaño N encontramos
N
nposibles muestras distintas, siendo por tanto la probabilidad de cada una de ellas:
P
N
j
=
n1
Se verifica:
E F
n
N
r
[
]
=
)
N
1
1
(
N
n
)
F
(
V
r=
−
r s 2N
n
)
F
,
F
(
COV
=
−
Master en Marketing Muestreo en Poblaciones finitas
Se demuestra de forma muy sencilla. La variable contador de frecuencias de la posición i Fi,r sigue una distribución Binomial(1,1/N). Por tanto, Fr se comportará según una Binomial(n,1/N) dado que las extracciones se han hecho con reemplazamiento. La esperanza y varianza de una distribución binomial, son:
Tema 2: Muestreo aleatorio simple
1. Selección de la muestra
1.2. Con reemplazamiento y sin distinción de orden.
E F
n
N
r
[
]
=
)
N
1
1
(
N
n
)
F
(
V
r=
−
y
Por otra parte, el vector (F1,..,FN) se distribuye según una Multinomial(n,1/N,…,1/N), siendo su covarianza:
COV F F
n
N
r s
Master en Marketing Muestreo en Poblaciones finitas
1.3. Sin reemplazamiento distinguiendo el orden.
Tema 2: Muestreo aleatorio simple
1. Selección de la muestra
En una población de tamaño N existen
N
N
n
!
(
−
) !
posibles muestras distintas, siendo la probabilidad de cada una de ellas:
!
)!
(
N
n
N
P
j=
−
1.4. Con reemplazamiento y distinguiendo el orden.
En este caso, encontramos
)! 1 (
!
)! 1 (
− ⋅
− +
N n
n N
Master en Marketing Muestreo en Poblaciones finitas
Una de las formas más sencillas de escoger una muestra aleatoria simple consiste en extraer los elementos muestrales uno a uno, de modo que en cada extracción todos los elementos susceptibles de ser escogidos tienen la misma probabilidad. Por ejemplo enumerando las unidades poblacionales y usando una tabla de dígitos aleatorios.
Tema 2: Muestreo aleatorio simple
1. Selección de la muestra
1.4. Con reemplazamiento y distinguiendo el orden.
Master en Marketing Muestreo en Poblaciones finitas
2. Estimación de la media y del total
Tema 2: Muestreo aleatorio simple
En una población finita de N individuos puede resultar de interés conocer el valor medio o la suma de los valores de una determinada variable cuantitativa como puede ser la renta, gastos,... Los valores que esta variable toma para cada individuo de la población se denotarán por X1,...,XN y en una muestra MAj de n individuos por x1,...,xn.
2.1. Estimación de la media
En este caso el parámetro desconocido es la media poblacional:
N
X
...
X
X
N
1
=
X
1 NN
1 i
i
+
+
=
∑
Master en Marketing Muestreo en Poblaciones finitas
El estimador más utilizado de la media poblacional es la media muestral:
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.1. Estimación de la media
n
x
...
x
x
n
1
x
X
ˆ
1 nn 1 i i
+
+
=
=
=
∑
=La media muestral es un estimador insesgado de la media poblacional:
X
]
x
[
E
]
X
ˆ
[
E
=
=
∑
∑
∑
⎥
=
=
⎦
⎤
⎢
⎣
⎡
=
⎥
⎦
⎤
⎢
⎣
⎡
=
=
n i N i i NX
iE
[
F
i]
Master en Marketing Muestreo en Poblaciones finitas
Usando
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.1. Estimación de la media
E F
n
N
r
[
]
=
se tiene que∑
∑
= =
=
=
=
N1 i
i N
1 i
i
X
X
N
1
N
n
X
n
1
Master en Marketing Muestreo en Poblaciones finitas
La varianza del estimador es:
Tema 2: Muestreo aleatorio simple
(
1
f
)
n
S
]
x
[
V
]
X
ˆ
[
V
2−
=
=
2. Estimación de la media y del total
2.1. Estimación de la media
Para calcular la varianza del estimador se utilizan los valores de las varianzas y covarianzas de las variables contador, calculados anteriormente:
)
f
1
(
N
n
)
F
(
V
r=
−
(
1
f
)
)
1
N
(
N
n
)
F
,
F
(
COV
r s−
−
−
=
y
Master en Marketing Muestreo en Poblaciones finitas
El factor 1-f se llama corrección por población finita. Las expresiones coinciden con las poblaciones infinitas salvo por ese factor. Si f es suficientemente pequeña, en la práctica f<0,05, se puede ignorar. La consecuencia de ignorar la corrección por población finita es sobrevalorar el error.
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.1. Estimación de la media
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.1. Estimación de la media
Estimación de la cuasivarianza poblacional
La cuasivarianza muestral es un estimador insesgado para la cuasivarianza poblacional:
2 2
2
S
]
E[s
]
Sˆ
E[
=
=
Intervalo de confianza para la media:
Asumiendo la hipótesis de normalidad ,
(
,
(
1
)
)
n
f
S
X
N
x
≡
−
por tanto ,
) 1 , 0 ( )
1
( f N
n S
X x
≡ −
Master en Marketing Muestreo en Poblaciones finitas
de donde se tiene
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.1. Estimación de la media
Intervalo de confianza para la media( continuación)
,el intervalo de confianza al nivel de confianza 1-α se obtiene despejando de la expresión
α α ⎟⎟ = −
⎠ ⎞ ⎜ ⎜ ⎝ ⎛ < − − 1 ) 1
( z 2
f n S X x P
⎥
⎦
⎤
⎢
⎣
⎡
⋅
−
⋅
+
⋅
−
⋅
−
=
22
,
1
1
αf
z
αMaster en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.1. Estimación de la media
P (|N(0,1)| ≤ ) = 1 -α.
La expresión anterior depende del valor de la cuasivarianza poblacional, si ésta es desconocida, se parte de una estimación insesgada de la misma, que como hemos visto, es la cuasivarianza muestral. Se tiene que
1
)
1
(
−
≡
−−
n
t
f
n
s
X
x
, el intervalo de confianza será por tanto:
⎥
⎤
⎢
⎡
⋅
−
⋅
+
⋅
−
⋅
−
=
x
s
1
f
t
,
x
s
1
f
t
I
α αEl valor
z
2
α es el número real que verifica P (N(0,1) ≤
z
2
α ) = 1 -
α
2
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.1. Estimación de la media
2
t
α es el valor que verifica2
1
)
(
2
1
α
α=
−
≤
−
t
t
P
nSi el número de elementos de la muestra es mayor que 50, se puede aproximar
2
t
α porz
2
α
2.2. Estimación del total
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.2. Estimación del total
De la misma forma, el total muestral en una muestra MAj de n individuos es:
n 1
n
1 i
i
x
...
x
x
x
=
∑
=
+
+
=
El estimador más utilizado del total poblacional es:
∑
=⋅
=
ni
i
x
1
n
1
N
x
N
=
X
ˆ
x
N
es un estimador insesgado del total poblacional:X
]
x
N
[
E
]
Xˆ
[
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.2. Estimación del total
Se demuestra de forma muy sencilla utilizando las propiedades de la esperanza. La media muestral es un estimador insesgado de la media poblacional, por tanto,
[ ]
x
N
X
X
NE
]
x
N
[
E
]
Xˆ
[
E
=
=
=
=
Veamos cuál es la varianza del estimador, para conocer el error muestral
La varianza del estimador es:
(
1 f)
S N ]
x N [ V ]
Xˆ [ V
2 2
− =
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.2. Estimación del total
Utilizando las propiedades de la varianza y el resultado demostrado en la estimación de la media,
(
1
f
)
n
S
]
x
[
V
2
−
=
se obtiene de forma sencilla la varianza del estimador.
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
Intervalo de confianza para estimar el total:
2.2. Estimación del total
Si se puede suponer normalidad, el intervalo de confianza al nivel de confianza 1-α es:
⎥
⎦
⎤
⎢
⎣
⎡
⋅
−
⋅
+
⋅
−
⋅
−
=
2
2
1
f
z
n
NS
x
N
,
z
f
1
n
NS
x
N
I
α αz
2
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.2. Estimación del total
Si la cuasivarianza poblacional es desconocida se estima mediante la cuasivarianza muestral. El intervalo de confianza será por tanto:
⎥
⎦
⎤
⎢
⎣
⎡
⋅
−
⋅
+
⋅
−
⋅
−
=
2
2
1
f
t
n
Ns
x
N
,
t
f
1
n
Ns
x
N
I
α αdonde
t
α 2 se obtiene de las tablas de la distribución T-Student aproximándose porz
2
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
2. Estimación de la media y del total
2.3. Estimación de la diferencia de dos medias o dos totales
Si se recogen dos características de la población, Xi e Yi, se puede estimar la diferencia entre sus totales, o entre sus medias, . Para ello basta considerar la característica Zi = Xi-Yi de forma individual para poder aplicar los resultados anteriores .
3. Estimación de la proporción y del total de clase
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
3. Estimación de la proporción y del total de clase
Si se extrae una muestra aleatoria simple MAj de n individuos, el número de ellos que pertenecen a la clase C se denota mediante a y la proporción de unidades de C sobre el total de la muestra por :
n
a
p
=
Se puede transformar la variable cualitativa en otra cuantitativa de la siguiente forma:
⎩
⎨
⎧
∉
∈
=
C
si
C
si
i i i
A
0
A
1
X
Mediante esta transformación se verifica en la población:
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
3. Estimación de la proporción y del total de clase
Varianza poblacional: PQ P P X N X 2 2 N 1 i 2 i
2 =
∑
= − = − =σ
siendoP
1
Q
=
−
Cuasivarianza poblacional:
PQ
1
N
N
1
N
N
S
2 2−
=
−
=
σ
De igual forma, en la muestra, se verifica:
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
3. Estimación de la proporción y del total de clase
Varianza muestral:
pq
x
n
x
s
2n
1 i
2 i 2
1
=
−
=
∑
= donde q=1-p
Cuasivarianza muestral:
pq
1
n
n
s
2Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
3.1. Estimación de la proporción
3. Estimación de la proporción y del total de clase
Razonando de forma análoga al estudio de la media muestral, veamos cómo se puede estimar la proporción poblacional.
La proporción muestral es un estimador insesgado de la proporción poblacional:
P
]
p
[
E
]
P
ˆ
[
E
=
=
Si se utiliza el resultado obtenido en la estimación de la media de variables cuantitativas:
P
X
]
x
[
E
]
X
ˆ
[
E
]
P
ˆ
[
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
3. Estimación de la proporción y del total de clase
3.1. Estimación de la proporción
La varianza del estimador es:
n
PQ
1
N
n
N
]
p
[
V
]
P
ˆ
[
V
⋅
−
−
=
=
En efecto, utilizando la expresión obtenida para la varianza de la media muestral, se verifica:
=
=
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
Una estimación insesgada de la varianza del estimador es:
3. Estimación de la proporción y del total de clase
3.1. Estimación de la proporción
(
1
f
)
1
n
pq
]
P
ˆ
[
Vˆ
−
−
=
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
3. Estimación de la proporción y del total de clase
3.1. Estimación de la proporción
Intervalo de confianza para estimar la proporción:
En principio el estimador de la proporción, por ser esta una media, como resultado de los teoremas de convergencia, seguirá una distribución normal si el número de unidades muestrales es mayor que 50. El intervalo de confianza al nivel de confianza 1-α se deduce de los resultados anteriores sin más que sustituir adecuadamente las expresiones propias de las proporciones:
⎥ ⎦ ⎤ ⎢
⎣ ⎡
⋅ − − ⋅
+ ⋅
− − ⋅
− =
2
2 N 1 z
n N n
PQ p
, z 1 N
n N n
PQ p
Master en Marketing Muestreo en Poblaciones finitas
Tema 2: Muestreo aleatorio simple
3. Estimación de la proporción y del total de clase
3.1. Estimación de la proporción
Si el error muestral es desconocido, se considera una estimación insesgada del mismo, siendo en este caso el intervalo de confianza:
⎥ ⎦ ⎤ ⎢
⎣ ⎡
⋅ − ⋅
− +
⋅ − ⋅
− −
=
2
2 n 1 1 f z
pq p
, z f 1 1
n pq p
I α α