• No se han encontrado resultados

TEMARIOMUESTREOMASTER.pdf

N/A
N/A
Protected

Academic year: 2020

Share "TEMARIOMUESTREOMASTER.pdf"

Copied!
170
0
0

Texto completo

(1)

Master en Marketing Muestreo en Poblaciones finitas

(2)

Master en Marketing Muestreo en Poblaciones finitas

Tema1: Muestreo en poblaciones finitas

1. Introducción

2. Conceptos básicos

3. Selección de la muestra

3.1. Muestreos probabilísticos y no probabilísticos.

3.2. Muestreos unietápicos y polietápicos.

3.3. Muestreo sin reposición y con reposición.

3.4. Distribuciones de probabilidad en el muestreo

probabilístico

4. Estimación

4.1. Propiedades de los estimadores

4.2. Sesgo en las estimaciones

4.3. Normalidad

(3)

Master en Marketing Muestreo en Poblaciones finitas

Tema1: Muestreo en poblaciones finitas

Para la toma de decisiones en el ámbito empresarial y social, es

necesario el mayor grado de conocimiento de la situación que se desea

intervenir. La información requerida es un conjunto de variables tanto

cuantitativas como cualitativas, y la calidad de esta información, incide

directamente en las consecuencias derivadas de las decisiones

adoptadas

.

1. Introducción

(4)

Master en Marketing Muestreo en Poblaciones finitas

Población:

es el objeto de nuestro estudio, el conjunto de unidades en las

cuales es posible definir una variable cualitativa o cuantitativa, que

representa la característica o características que se desean estudiar. Los

diferentes elementos de la población se denominan Miembros o

Individuos.

Tema1: Muestreo en poblaciones finitas

La población se puede clasificar por el tamaño en finitas o infinitas.

Las poblaciones infinitas: no son completamente observables, por lo que se resolverá conociendo la distribución de probabilidad a través del proceso de inferencia sobre parámetros desconocidos.

Las poblaciones finitas, compuestas por una cantidad finita de miembros N, se plantean dos posibles situaciones según sea o no posible la observación completa

(5)

Master en Marketing Muestreo en Poblaciones finitas

-

Un censo

consiste en la observación de la característica de estudio en todos y cada uno de los individuos que constituyen la población.

En modelos censales se conoce perfectamente la distribución de probabilidad de la variable, no existiendo por tanto ningún problema de inferencia estadística

Tema1: Muestreo en poblaciones finitas

-

Una muestra

es un subconjunto de la población en estudio.

La finalidad de una muestra es construir un modelo reducido de la población cuyos resultados sean extrapolables a la población total. Para que la extrapolación sea posible la muestra debe ser representativa, es decir, la distribución de la característica en la muestra debe comportarse del mismo modo que en la población.

2. Conceptos básicos

(6)

Master en Marketing Muestreo en Poblaciones finitas

Se denomina

muestreo

al procedimiento de selección de la muestra.

Es obvio que el procedimiento de extraer conclusiones sobre la

población a partir de un subconjunto de la misma está sujeto a error.

Algunos procedimientos de muestreo permiten controlar el error,

haciendo que sea el menor posible, y estimando su tamaño.

Aún siendo posible el estudio de todos y cada uno de los elementos que

componen la población, el estudio de la misma mediante métodos de

muestreo presenta ventajas frente al censo. Estas son reducción del

volumen de datos, por lo que redunda en menor coste y mayor rapidez

para obtener conclusiones.

Se contemplan al menos dos etapas en una investigación por muestreo,

Tema1: Muestreo en poblaciones finitas

(7)

Master en Marketing Muestreo en Poblaciones finitas

A continuación se enumeran las fases, en sentido amplio de una

investigación por muestreo:

1.Trabajos preliminares o previos

: Definición del objetivo y la

elaboración del cuestionario.

2.Diseño de la muestra

:

• Plan de muestreo: Definición del tamaño de la muestra y definición de las unidades de muestreo.

• Métodos de estimación: Decidir el tipo de muestreo, y por tanto las estimación que realizaremos.

3.Trabajo de campo

: Proceso de recogida de datos.

4.Proceso de datos:

Aplicación de las formulas de estimación elaboradas.

5.Elaboración del informe final.

Tema1: Muestreo en poblaciones finitas

(8)

Master en Marketing Muestreo en Poblaciones finitas

- Unidad de muestreo es cada una de las partes en que se divide la población para seleccionar la muestra.

Estas unidades de muestreo las elige el investigador, con la condición que sean distinguibles e identificables. Pueden ser elementales si es el objeto último del que se desea obtener la información o no elementales si están constituidas por grupos de unidades elementales.

Tema1: Muestreo en poblaciones finitas

3. Selección de la muestra

La selección cobra mucha importancia sobre todo en poblaciones heterogéneas sobre las variables de estudio, ya que si es homogénea la población, cualquier unidad seleccionada seria representativa.

Un paso previo a la selección de la muestra es dividir la población en partes.

(9)

Master en Marketing Muestreo en Poblaciones finitas

En cuanto a la forma en que se seleccionan las unidades muestrales se distinguen dos grandes tipos de muestreo: muestreos no probabilísticos y muestreos probabilísticos.

Tema1: Muestreo en poblaciones finitas

3. Selección de la muestra

•Los muestreos probabilísticos se caracterizan porque cada elemento de la población tiene una probabilidad conocida y no nula de ser seleccionada. Los resultados se obtienen mediante un proceso automático objetivo que permite medir y controlar los errores. Entre los muestreos probabilísticos destacan los siguientes: •Entre los muestreos no probabilísticos se encuentran el muestreo opinático o el muestreo errático. El investigador selecciona determinísticamente las unidades muestrales. El grave inconvenientes es que no se puede cuantificar los errores cometidos en la estimación o fijar tamaño muestrales. Muestreos Subjetivos.

(10)

Master en Marketing Muestreo en Poblaciones finitas

Muestreo aleatorio simple. Es un método de selección de un número fijo de unidades muestrales n, que garantiza que todas las muestras de tamaño n tienen la misma probabilidad de ser escogidas.

Muestreo estratificado. Se particiona la población en conjuntos llamados estratos que se caracterizan porque en cada uno de ellos los elementos son homogéneos entre si y heterogéneos entre los diferentes estratos.

Muestreo por conglomerados. Se divide la población en grupos de proximidad. Si la proximidad es geográfica, se denomina muestreo por áreas.

Muestreo sistemático. Se determina un procedimiento que permite escoger la totalidad de la muestra a partir de la selección aleatoria de la primera unidad muestral.

La elección y aplicación de estos métodos esta supeditada a la información complementaria que se posea sobre la característica en estudio.

Tema1: Muestreo en poblaciones finitas

3. Selección de la muestra

(11)

Master en Marketing Muestreo en Poblaciones finitas

Por lo que respecta al número de fases contempladas en el proceso de selección se distingue entre muestreo unietápico y muestreo multietápico.

Tema1: Muestreo en poblaciones finitas

3. Selección de la muestra

•Por otra parte, el muestreo multietápico consta de varias fases de selección. En cada fase se seleccionan mediante el procedimiento escogido, un conjunto de unidades muestrales. En segundas y posteriores fases se muestrea en unidades de orden inferior contenidas en las unidades escogidas en la primera etapa. Las unidades muestrales de la primera etapa se denominan primarias. Las unidades contenidas en las primarias que se consideran en la segunda etapa se denominan

secundarias, y así sucesivamente hasta llegar a las unidades elementales.

•El muestreo unietápico consta de una única fase de selección. Se escoge un tipo de muestreo y de su aplicación se obtiene la muestra.

(12)

Master en Marketing Muestreo en Poblaciones finitas

Atendiendo al número de veces que cada unidad muestral puede

aparecer en la muestra

, los procedimientos de muestreo

se clasifican en

muestreo sin reposición y muestreo con reposición.

Tema1: Muestreo en poblaciones finitas

3. Selección de la muestra

Muestreo con reposición,

al menos en una muestra del conjunto de

todas las posibles aparece como mínimo una unidad muestral dos veces.

Muestro sin reposición

cada unidad muestral sólo puede obtenerse una vez.

(13)

Master en Marketing Muestreo en Poblaciones finitas

En un muestreo probabilístico sobre una población finita se consideran distribuciones de probabilidad en cada muestra y en el conjunto de todas las posibles muestras, tal y como se establece a continuación.

La población constituida por N individuos es el conjunto: A={A1,….., AN}

Tema1: Muestreo en poblaciones finitas

3. Selección de la muestra

Espacio muestral es el conjunto de todas las posibles muestras. Cada

muestra de tamaño n estará formada por n individuos y se denotará mediante el conjunto:

MAj={a1,….., an} ai∈A, i=1, 2,...,n

El índice j permite diferenciar cada muestra particular dentro de conjunto de todas las posibles muestras de tamaño n. El orden de los índices en la muestra no

(14)

Master en Marketing Muestreo en Poblaciones finitas

Previamente vamos a ver formulas para calcular el número de muestras

posibles tendiendo en cuenta si la elección de los individuos en la muestra

es con reposición o sin reposición y si se distingue el orden en el que fue

elegido o no se distingue: donde n= tamaño de la muestra y N el numero

de elementos de la población.

Tema1: Muestreo en poblaciones finitas

n

n

N

N

VR

,

=

3. Selección de la muestra

3.4. Distribuciones de probabilidad en el muestreo probabilístico

(15)

Master en Marketing Muestreo en Poblaciones finitas

Muestra con reposición y no distinguiendo el orden:

Tema1: Muestreo en poblaciones finitas

3. Selección de la muestra

3.4. Distribuciones de probabilidad en el muestreo probabilístico

)!

1

(

!

)!

1

(

1

,

+

=





+

=

N

n

n

N

n

n

N

CR

N n

Muestra sin reposición y distinguiendo el orden:

)!

(

!

,

n

N

N

V

N n

(16)

Master en Marketing Muestreo en Poblaciones finitas

Muestra sin reposición y no distinguiendo el orden:

Tema1: Muestreo en poblaciones finitas

3. Selección de la muestra

3.4. Distribuciones de probabilidad en el muestreo probabilístico

)!

(

!

!

,

n

N

n

N

n

N

C

N

n

=





(17)

Master en Marketing Muestreo en Poblaciones finitas

siendo J(n) el número posible de muestras distintas de tamaño n.

La distribución conjunta depende del tipo de muestreo utilizado. En el muestreo aleatorio simple, por ejemplo, todas las muestras posibles tienen la mismaprobabilidad

Tema1: Muestreo en poblaciones finitas

P

j

P

j

j J n

=

=

0

1

1

y

( )

3. Selección de la muestra

3.4. Distribuciones de probabilidad en el muestreo probabilístico

-Distribución conjunta de la muestra es la distribución de probabilidad definida sobre el conjunto de todas las posibles muestras.

Es decir, es el conjunto de valores P(MAj) = Pj que asigna a cada muestra MAj de tamaño n la probabilidad que tiene de ser seleccionada.

(18)

Master en Marketing Muestreo en Poblaciones finitas

-Distribuciones marginales de las componentes de la muestra es la probabilidad de que en una posición concreta i de la muestra sea seleccionado un individuo concreto Ar:

Pir=P(ai=Ar), para cada i fijo

Se verifica para cada i:

Tema1: Muestreo en poblaciones finitas

A partir de las distribuciones conjuntas y marginales se obtienen las distribuciones de probabilidad de las variables contador, que indican el número de

3. Selección de la muestra

3.4. Distribuciones de probabilidad en el muestreo probabilístico

1

y

0

1

=

=

N

r

ir

ir

P

(19)

Master en Marketing Muestreo en Poblaciones finitas

La distribución de probabilidad de las frecuencias absolutas depende del tipo de muestreo utilizado.

Tema1: Muestreo en poblaciones finitas

3. Selección de la muestra

3.4. Distribuciones de probabilidad en el muestreo probabilístico

Las variables contador se definen como:

F

A

A

ir

r r

=

=

1

0

si a

si a

i

i

y

F

r

F

ir

i n

.

=

=

1

Estas variables son las frecuencias absolutas de aparición del individuo r- ésimo en una posición concreta y en la muestra respectivamente.

Es evidente que para cualquier valor de r,

}

n

,...,

1

,

0

{

F

.r

=

=

N

1 r

r

n

F

(20)

Master en Marketing Muestreo en Poblaciones finitas

En poblaciones finitas el problema de la estimación se centra en

parámetros descriptivos de la población sobre una o varias características

cuantitativas como la media, varianza, el total, etc., o cualitativas como la

proporción de individuos que presentan una determinada cualidad.

Las características asociadas al individuo Ai de la población se

representarán por Xi , Yi , Zi…. Los valores correspondientes al individuo

aj de la muestra por xj , yj , zj….

Los parámetros poblacionales se notarán con mayúsculas frente a los

muestrales con minúsculas.

Tema1: Muestreo en poblaciones finitas

(21)

Master en Marketing Muestreo en Poblaciones finitas

Los parámetros poblacionales que son más frecuentemente objeto de

estudio son:

Tema1: Muestreo en poblaciones finitas

4. Estimación

a) De carácter cuantitativo:

Media poblacional:

X

=

1

N

i

X

i

N

=

1

Total poblacional:

= N 1 i i

X

=

X

X

=

N

X

Varianza poblacional: N 2

(22)

Master en Marketing Muestreo en Poblaciones finitas

Cuasivarianza poblacional:

Tema1: Muestreo en poblaciones finitas

4. Estimación

a) De carácter cuantitativo:

=

N

1 i

2 i

2

)

X

X

(

1

-N

1

=

S

2 2

1

-N

N

=

S

σ

Coeficientes de variación :

C

X

x

=

σ

C

S

X

x

(23)

Master en Marketing Muestreo en Poblaciones finitas

b) De carácter cualitativo

:

Tema1: Muestreo en poblaciones finitas

4. Estimación

Total de clase: A

Proporción poblacional

N

A

=

P

(24)

Master en Marketing Muestreo en Poblaciones finitas

Tema1: Muestreo en poblaciones finitas

4. Estimación

b) De carácter cualitativo

:

Las medidas cualitativas se pueden transformar en cuantitativas sin más que considerar la variable Xi definida como:

1 si el individuo

presenta la cualidad C

0 si el individuo

no presenta la cualidad C

i i

i

A

X

A

=

verificándose de esta forma:

X

=

P

,

X

A

N 1 i

i

=

(25)

Master en Marketing Muestreo en Poblaciones finitas

c) Considerando dos características en la población

Tema1: Muestreo en poblaciones finitas

4. Estimación

Covarianza poblacional

σ

XY i i

i N

N

X

X Y Y

=

=

1

1

(

)(

)

Cuasivarianza poblacional

S

N

X

X Y Y

XY i i

i N

=

=

1

1

1

(

)(

)

Razón poblacional

Y

X

Y

X

=

=

(26)

Master en Marketing Muestreo en Poblaciones finitas

Se denomina

inferencia

al proceso mediante el cual se obtienen

conclusiones sobre la población través del análisis de una muestra de

la misma

Los procedimientos de inferencia no son independientes del tipo

de muestreo utilizado, puesto que éste condiciona las probabilidades de

las distintas muestras que pueden aparecer.

Tema1: Muestreo en poblaciones finitas

4. Estimación

Dado un tipo de muestreo probabilístico, a partir del cual se

obtiene una muestra, se denomina estimador a una función de la

muestra que se usa para inferir el valor de la característica

poblacional que queremos estimar.

ɵ( ,...., ) ɵ

θ x1 xn

El conjunto de valores que puede tomar el parámetro se

(27)

Master en Marketing Muestreo en Poblaciones finitas

Este proceso de estimación en el que para cada muestra, el estimador

proporcionará una estimación concreta del parámetro se denomina

estimación puntual

. Por otra parte, cada muestra tiene una probabilidad

de ser seleccionada, por tanto, las distintas estimaciones tendrán su

correspondiente probabilidad que dependerá tanto del procedimiento de

selección de la muestra, ya que este determina las probabilidades de las

mismas, como del estimador empleado.

Tema1: Muestreo en poblaciones finitas

4. Estimación

Bajo este punto de vista un estimador es una variable aleatoria, que

tomará el valor

ɵ

(

, .... ,

)

θ

x

1

x

n

∈ ℜ

(28)

Master en Marketing Muestreo en Poblaciones finitas

Tendrá por tanto perfecto sentido hablar de su esperanza, varianza, etc.

Por ejemplo la esperanza del estimador se calcularía como

Tema1: Muestreo en poblaciones finitas

4. Estimación

E

x

x

n

P

j

MAj

[

θ

ɵ

]

=

θ

ɵ

( ,....,

1

)

Donde la suma se efectúa sobre todas las posibles muestras de tamaño n.

(29)

Master en Marketing Muestreo en Poblaciones finitas

4.1. Propiedades de los estimadores

Tema1: Muestreo en poblaciones finitas

4. Estimación

Un primer criterio para estudiar la bondad de un estimador se

obtiene definiendo el error cometido en la estimación. Éste se define

como la distancia entre la estimación realizada y el verdadero valor del

parámetro . Para eliminar la influencia del signo en esta diferencia se

considera su cuadrado , y puesto que esta medida es una variable

aleatoria se toma un representante calculando su esperanza.

Se denomina error cuadrático medio (ECM)

a

ECM

(

θ

ˆ

)

=

E

(

θ

ˆ

θ

)

2

Se verifica que

2

)

)

ˆ

(

E

(

)

ˆ

(

V

)

ˆ

(

(30)

Master en Marketing Muestreo en Poblaciones finitas

Un valor pequeño del error cuadrático medio significa que el

estimador elegido, en media, no se encuentra lejos del parámetro

desconocido y este podría ser un buen criterio para comparar distintos

estimadores, eligiendo aquel que minimice el error cuadrático medio.

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.1. Propiedades de los estimadores

(31)

Master en Marketing Muestreo en Poblaciones finitas

4.1.1. Estimador insesgado

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.1. Propiedades de los estimadores

Un estimador es insesgado cuando su media o esperanza

matemática coincide con el valor verdadero del parámetro

desconocido:

θ

θ

ˆ

)

=

(

E

Si el estimador es insesgado, minimiza el segundo sumando en

que se descompone el error cuadrático medio,

0

)

)

ˆ

(

(

E

θ

θ

2

=

(32)

Master en Marketing Muestreo en Poblaciones finitas

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.1. Propiedades de los estimadores

4.1.1. Estimador insesgado

En este caso el error cuadrático medio coincide con la varianza del

estimador. Se dirá en este caso que un estimador es eficiente cuando

es el que tiene mínima varianza entre todos los estimadores

insesgados.

(33)

Master en Marketing Muestreo en Poblaciones finitas

4.1.2. Estimador consistente

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.1. Propiedades de los estimadores

Un estimador es consistente si la probabilidad de que la

desviación entre el estimador y el valor verdadero del parámetro

sea superior a cualquier número

ε

por pequeño que sea, se acerca a

cero cuando el número de elementos de la muestra se acerca al

número de elementos en la población.

0

)

ˆ

(

>

n

 →

N

P

θ

θ

ε

(34)

Master en Marketing Muestreo en Poblaciones finitas

Además del sesgo debido a la elección de estimador existen otras causas de sesgo que se deben al proceso de selección. Entre éstas se señalan las siguientes:

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.2. Sesgo en las estimaciones

1. Tendencias en la no respuesta

:

(35)

Master en Marketing Muestreo en Poblaciones finitas

2. Inadecuada definición de las unidades muestrales.

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.2. Sesgo en las estimaciones

Puede ocurrir en este caso que algunas unidades elementales

tengan probabilidad nula o superior al resto.

3. Método de reposición

(36)

Master en Marketing Muestreo en Poblaciones finitas

4. Efecto del investigador

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.2. Sesgo en las estimaciones

(37)

Master en Marketing Muestreo en Poblaciones finitas

Es habitual asumir que la distribución del estimador es una distribución normal. Sin embargo, en una población finita, y por tanto discreta, no se puede hablar estrictamente de distribución normal, ya que ésta es continua. Asumimos la distribución normal de una población cuando su distribución de frecuencias se encuentra suficientemente próxima a la obtenida de la normal.

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.3. Normalidad

Si un estimador está formado por combinaciones lineales de unapoblación normal, su distribución también es normal.

(38)

Master en Marketing Muestreo en Poblaciones finitas

Es claro que la estimación puntual posee la ventaja de dejar especificado unívocamente el parámetro que se pretende estimar, pero no es menos claro que una vez obtenido éste no tenemos ninguna forma de saber si se encuentra próximo o no al auténtico valor del parámetro. Para tener una medida del error cometido en la estimación conviene considerar la estimación por intervalos.

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.4. Intervalos de confianza

(39)

Master en Marketing Muestreo en Poblaciones finitas

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.4. Intervalos de confianza

Desde un punto de vista teórico un intervalo de confianza queda definido por dos estadísticos

)

,...,

(

ˆ

)

,...,

(

ˆ

1 2 1

1

x

x

n

θ

x

x

n

θ

<

que verifican

α

θ

θ

θ

ˆ

(

,...,

)

<

<

ˆ

(

,...,

))

=

1

(

1

x

1

x

n 2

x

1

x

n

P

En tal caso para una muestra concreta

))

,...,

(

ˆ

),

,...,

(

ˆ

(40)

Master en Marketing Muestreo en Poblaciones finitas

Una vez observada la muestra no tiene sentido hablar de probabilidad,

bien ocurre

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.4. Intervalos de confianza

))

,...,

(

ˆ

),

,...,

(

ˆ

(

θ

1

x

1

x

n

θ

2

x

1

x

n

θ

o bien,

(

ˆ

(

,...,

),

ˆ

(

,...,

))

1 2 1

1

x

x

n

θ

x

x

n

θ

θ

(41)

Master en Marketing Muestreo en Poblaciones finitas

La estimación por intervalos proporciona una medida de la

precisión obtenida a partir de la longitud del intervalo, cuanto menor

sea la amplitud del intervalo más precisa es la estimación, es decir

menor error cometemos. La situación óptima sería conseguir intervalos

de pequeña longitud y con un alto nivel de confianza, sin embargo

estas dos medidas se comportan en sentido inverso, es decir, con un

tamaño muestral fijo si decidimos aumentar el nivel de confianza,

también aumentará la longitud del intervalo por tanto perderemos

precisión, si decidimos aumentar la precisión nos veremos afectados

por una reducción en el nivel de confianza. Todo ello afectado por el

tamaño muestral que permite al aumentar una mejora tanto en la

precisión como en el nivel de confianza.

Tema1: Muestreo en poblaciones finitas

4. Estimación

(42)

Master en Marketing Muestreo en Poblaciones finitas

4.4.1. Intervalos de confianza para estimadores insesgados

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.4. Intervalos de confianza

Bajo la hipótesis de normalidad, si el estimador es insesgado

) 1 , 0 ( )

ˆ ( ˆ

N V

≡ −

θ θ θ

de modo que el intervalo se obtiene despejando θ de la expresión

α

θ

θ

θ

α



=



<

1

)

ˆ

(

ˆ

Z

V

(43)

Master en Marketing Muestreo en Poblaciones finitas

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.4. Intervalos de confianza

4.4.1. Intervalos de confianza para estimadores insesgados

Siendo entonces el intervalo de confianza:

)

)

ˆ

(

z

ˆ

,

)

ˆ

(

z

(

I

2

2

θ

θ

θ

θ

α

V

+

α

V

=

Donde

2

z

α es el número real que verifica

α

α

=

)

1

)

1

,

0

(

(

2

z

N

(44)

Master en Marketing Muestreo en Poblaciones finitas

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.4. Intervalos de confianza

4.4.1. Intervalos de confianza para estimadores insesgados

Expresión que depende de la varianza del estimador, por tanto sólo será útil cuando ésta sea conocida. Si se desconoce dicha varianza se pueden obtener intervalos usando la estimaciones apropiadas de la misma.

Sin la hipótesis de normalidad se puede utilizar la desigualdad de Chebyshev, si el estimador es insesgado, que establece:

(

θ

ˆ

θ

<

K

)

1

α

P

siendo

2

K

)

ˆ

(

V

θ

(45)

Master en Marketing Muestreo en Poblaciones finitas

Tema1: Muestreo en poblaciones finitas

4. Estimación

4.4. Intervalos de confianza

4.4.1. Intervalos de confianza para estimadores insesgados

El intervalo de confianza construido en este caso es:

+

=

α

θ

θ

α

θ

θ

ˆ

V

(

ˆ

)

,

ˆ

V

(

ˆ

)

I

(46)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2:

(47)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

1. Selección de la muestra

1.1. Sin reemplazamiento y sin distinción de orden.

1.2. Con reemplazamiento y sin distinción de orden.

1.3. Sin reemplazamiento distinguiendo el orden.

1.4. Con reemplazamiento y distinguiendo el orden. 2. Estimación de la media y del total

2.1. Estimación de la media

2.2. Estimación del total

2.3. Estimación de la diferencia de dos medias o dos totales 3. Estimación de la proporción y del total de clase

3.1. Estimación de la proporción

3.2. Estimación del total de clase

3.3. Estimación de la diferencia de proporciones 4. Estimación en subpoblaciones

4.1. Estimación si se conoce el número de elementos de la subpoblación

4.2. Estimación si se desconoce el número de elementos de la subpoblación 5. Muestreo con reemplazamiento

5.1. Estimación de la media poblacional y del total

(48)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

1. Selección de la muestra

Se denomina muestreo aleatorio simple a un método de selección de una muestra de tamaño n de tal modo que todas las muestras tienen la misma probabilidad de ser seleccionadas.

Se presentan cuatro situaciones según se permita o no el reemplazamiento y se distingan o no las muestras por el orden en que se presentan las unidades muestrales contenidas en ellas.

(49)

Master en Marketing Muestreo en Poblaciones finitas

Se denomina también muestreo irrestrictamente aleatorio.

Tema 2: Muestreo aleatorio simple

1. Selección de la muestra

1.1. Sin reemplazamiento y sin distinción de orden.

En una población de tamaño N encontramos

N n

⎛ ⎝

⎜ ⎞

⎠ ⎟

posibles muestras distintas, siendo por tanto la probabilidad de elección de cada una de ellas:

P

N

n

n

N

n

N

j

=

=

1

!(

) !

(50)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

1. Selección de la muestra

1.1. Sin reemplazamiento y sin distinción de orden.

Las frecuencias de aparición de los individuos Fr tomarán valores en {0,1} de modo que :

muestras

de

total

A

incluido

está

que

las

en

muestras

de

º

N

)

1

F

(

P

r

=

=

r

N

n

F

P

(

r

=

1

)

=

N

n

F

P

(

r

=

0

)

=

1

Además las probabilidades conjuntas de los indicadores vienen dadas por

)

1

(

)

1

,

1

(

=

=

=

F

n

n

F

(51)

Master en Marketing Muestreo en Poblaciones finitas

Esto es, el número de muestras en las que están incluidos tanto Ar como As dividido entre el número total de muestras.

Tema 2: Muestreo aleatorio simple

1. Selección de la muestra

1.1. Sin reemplazamiento y sin distinción de orden.

Se verifica:

,

]

[

N

n

F

E

r

=

(

)

(

1

)

N

n

N

n

F

V

r

=

⎛ −

=

N

n

1

)

1

N

(

N

n

)

F

,

F

(

COV

r s

y

Fracción de muestreo:

N

n

f

=

es la proporción de unidades de la población contenidas en la muestra. Y factor de elevación es su inverso,

n N

(52)

Master en Marketing Muestreo en Poblaciones finitas

1.2. Con reemplazamiento y sin distinción de orden.

Tema 2: Muestreo aleatorio simple

1. Selección de la muestra

En una población de tamaño N encontramos

N

n

posibles muestras distintas, siendo por tanto la probabilidad de cada una de ellas:

P

N

j

=

n

1

Se verifica:

E F

n

N

r

[

]

=

)

N

1

1

(

N

n

)

F

(

V

r

=

r s 2

N

n

)

F

,

F

(

COV

=

(53)

Master en Marketing Muestreo en Poblaciones finitas

Se demuestra de forma muy sencilla. La variable contador de frecuencias de la posición i Fi,r sigue una distribución Binomial(1,1/N). Por tanto, Fr se comportará según una Binomial(n,1/N) dado que las extracciones se han hecho con reemplazamiento. La esperanza y varianza de una distribución binomial, son:

Tema 2: Muestreo aleatorio simple

1. Selección de la muestra

1.2. Con reemplazamiento y sin distinción de orden.

E F

n

N

r

[

]

=

)

N

1

1

(

N

n

)

F

(

V

r

=

y

Por otra parte, el vector (F1,..,FN) se distribuye según una Multinomial(n,1/N,…,1/N), siendo su covarianza:

COV F F

n

N

r s

(54)

Master en Marketing Muestreo en Poblaciones finitas

1.3. Sin reemplazamiento distinguiendo el orden.

Tema 2: Muestreo aleatorio simple

1. Selección de la muestra

En una población de tamaño N existen

N

N

n

!

(

) !

posibles muestras distintas, siendo la probabilidad de cada una de ellas:

!

)!

(

N

n

N

P

j

=

1.4. Con reemplazamiento y distinguiendo el orden.

En este caso, encontramos

)! 1 (

!

)! 1 (

− ⋅

− +

N n

n N

(55)

Master en Marketing Muestreo en Poblaciones finitas

Una de las formas más sencillas de escoger una muestra aleatoria simple consiste en extraer los elementos muestrales uno a uno, de modo que en cada extracción todos los elementos susceptibles de ser escogidos tienen la misma probabilidad. Por ejemplo enumerando las unidades poblacionales y usando una tabla de dígitos aleatorios.

Tema 2: Muestreo aleatorio simple

1. Selección de la muestra

1.4. Con reemplazamiento y distinguiendo el orden.

(56)

Master en Marketing Muestreo en Poblaciones finitas

2. Estimación de la media y del total

Tema 2: Muestreo aleatorio simple

En una población finita de N individuos puede resultar de interés conocer el valor medio o la suma de los valores de una determinada variable cuantitativa como puede ser la renta, gastos,... Los valores que esta variable toma para cada individuo de la población se denotarán por X1,...,XN y en una muestra MAj de n individuos por x1,...,xn.

2.1. Estimación de la media

En este caso el parámetro desconocido es la media poblacional:

N

X

...

X

X

N

1

=

X

1 N

N

1 i

i

+

+

=

(57)

Master en Marketing Muestreo en Poblaciones finitas

El estimador más utilizado de la media poblacional es la media muestral:

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.1. Estimación de la media

n

x

...

x

x

n

1

x

X

ˆ

1 n

n 1 i i

+

+

=

=

=

=

La media muestral es un estimador insesgado de la media poblacional:

X

]

x

[

E

]

X

ˆ

[

E

=

=

=

=

=

=

=

n i N i i N

X

i

E

[

F

i

]

(58)

Master en Marketing Muestreo en Poblaciones finitas

Usando

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.1. Estimación de la media

E F

n

N

r

[

]

=

se tiene que

= =

=

=

=

N

1 i

i N

1 i

i

X

X

N

1

N

n

X

n

1

(59)

Master en Marketing Muestreo en Poblaciones finitas

La varianza del estimador es:

Tema 2: Muestreo aleatorio simple

(

1

f

)

n

S

]

x

[

V

]

X

ˆ

[

V

2

=

=

2. Estimación de la media y del total

2.1. Estimación de la media

Para calcular la varianza del estimador se utilizan los valores de las varianzas y covarianzas de las variables contador, calculados anteriormente:

)

f

1

(

N

n

)

F

(

V

r

=

(

1

f

)

)

1

N

(

N

n

)

F

,

F

(

COV

r s

=

y

(60)

Master en Marketing Muestreo en Poblaciones finitas

El factor 1-f se llama corrección por población finita. Las expresiones coinciden con las poblaciones infinitas salvo por ese factor. Si f es suficientemente pequeña, en la práctica f<0,05, se puede ignorar. La consecuencia de ignorar la corrección por población finita es sobrevalorar el error.

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.1. Estimación de la media

(61)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.1. Estimación de la media

Estimación de la cuasivarianza poblacional

La cuasivarianza muestral es un estimador insesgado para la cuasivarianza poblacional:

2 2

2

S

]

E[s

]

E[

=

=

Intervalo de confianza para la media:

Asumiendo la hipótesis de normalidad ,

(

,

(

1

)

)

n

f

S

X

N

x

por tanto ,

) 1 , 0 ( )

1

( f N

n S

X x

≡ −

(62)

Master en Marketing Muestreo en Poblaciones finitas

de donde se tiene

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.1. Estimación de la media

Intervalo de confianza para la media( continuación)

,el intervalo de confianza al nivel de confianza 1-α se obtiene despejando de la expresión

α α ⎟⎟ = −

⎠ ⎞ ⎜ ⎜ ⎝ ⎛ < − − 1 ) 1

( z 2

f n S X x P

+

=

2

2

,

1

1

α

f

z

α

(63)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.1. Estimación de la media

P (|N(0,1)| ≤ ) = 1 -α.

La expresión anterior depende del valor de la cuasivarianza poblacional, si ésta es desconocida, se parte de una estimación insesgada de la misma, que como hemos visto, es la cuasivarianza muestral. Se tiene que

1

)

1

(

n

t

f

n

s

X

x

, el intervalo de confianza será por tanto:

+

=

x

s

1

f

t

,

x

s

1

f

t

I

α α

El valor

z

2

α es el número real que verifica P (N(0,1) ≤

z

2

α ) = 1 -

α

2

(64)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.1. Estimación de la media

2

t

α es el valor que verifica

2

1

)

(

2

1

α

α

=

t

t

P

n

Si el número de elementos de la muestra es mayor que 50, se puede aproximar

2

t

α por

z

2

α

2.2. Estimación del total

(65)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.2. Estimación del total

De la misma forma, el total muestral en una muestra MAj de n individuos es:

n 1

n

1 i

i

x

...

x

x

x

=

=

+

+

=

El estimador más utilizado del total poblacional es:

=

=

n

i

i

x

1

n

1

N

x

N

=

X

ˆ

x

N

es un estimador insesgado del total poblacional:

X

]

x

N

[

E

]

[

(66)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.2. Estimación del total

Se demuestra de forma muy sencilla utilizando las propiedades de la esperanza. La media muestral es un estimador insesgado de la media poblacional, por tanto,

[ ]

x

N

X

X

NE

]

x

N

[

E

]

[

E

=

=

=

=

Veamos cuál es la varianza del estimador, para conocer el error muestral

La varianza del estimador es:

(

1 f

)

S N ]

x N [ V ]

[ V

2 2

− =

(67)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.2. Estimación del total

Utilizando las propiedades de la varianza y el resultado demostrado en la estimación de la media,

(

1

f

)

n

S

]

x

[

V

2

=

se obtiene de forma sencilla la varianza del estimador.

(68)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

Intervalo de confianza para estimar el total:

2.2. Estimación del total

Si se puede suponer normalidad, el intervalo de confianza al nivel de confianza 1-α es:

+

=

2

2

1

f

z

n

NS

x

N

,

z

f

1

n

NS

x

N

I

α α

z

2

(69)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.2. Estimación del total

Si la cuasivarianza poblacional es desconocida se estima mediante la cuasivarianza muestral. El intervalo de confianza será por tanto:

+

=

2

2

1

f

t

n

Ns

x

N

,

t

f

1

n

Ns

x

N

I

α α

donde

t

α 2 se obtiene de las tablas de la distribución T-Student aproximándose por

z

2

(70)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

2. Estimación de la media y del total

2.3. Estimación de la diferencia de dos medias o dos totales

Si se recogen dos características de la población, Xi e Yi, se puede estimar la diferencia entre sus totales, o entre sus medias, . Para ello basta considerar la característica Zi = Xi-Yi de forma individual para poder aplicar los resultados anteriores .

3. Estimación de la proporción y del total de clase

(71)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

3. Estimación de la proporción y del total de clase

Si se extrae una muestra aleatoria simple MAj de n individuos, el número de ellos que pertenecen a la clase C se denota mediante a y la proporción de unidades de C sobre el total de la muestra por :

n

a

p

=

Se puede transformar la variable cualitativa en otra cuantitativa de la siguiente forma:

=

C

si

C

si

i i i

A

0

A

1

X

Mediante esta transformación se verifica en la población:

(72)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

3. Estimación de la proporción y del total de clase

Varianza poblacional: PQ P P X N X 2 2 N 1 i 2 i

2 =

= − = − =

σ

siendo

P

1

Q

=

Cuasivarianza poblacional:

PQ

1

N

N

1

N

N

S

2 2

=

=

σ

De igual forma, en la muestra, se verifica:

(73)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

3. Estimación de la proporción y del total de clase

Varianza muestral:

pq

x

n

x

s

2

n

1 i

2 i 2

1

=

=

= donde q=1-p

Cuasivarianza muestral:

pq

1

n

n

s

2

(74)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

3.1. Estimación de la proporción

3. Estimación de la proporción y del total de clase

Razonando de forma análoga al estudio de la media muestral, veamos cómo se puede estimar la proporción poblacional.

La proporción muestral es un estimador insesgado de la proporción poblacional:

P

]

p

[

E

]

P

ˆ

[

E

=

=

Si se utiliza el resultado obtenido en la estimación de la media de variables cuantitativas:

P

X

]

x

[

E

]

X

ˆ

[

E

]

P

ˆ

[

(75)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

3. Estimación de la proporción y del total de clase

3.1. Estimación de la proporción

La varianza del estimador es:

n

PQ

1

N

n

N

]

p

[

V

]

P

ˆ

[

V

=

=

En efecto, utilizando la expresión obtenida para la varianza de la media muestral, se verifica:

=

=

(76)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

Una estimación insesgada de la varianza del estimador es:

3. Estimación de la proporción y del total de clase

3.1. Estimación de la proporción

(

1

f

)

1

n

pq

]

P

ˆ

[

=

(77)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

3. Estimación de la proporción y del total de clase

3.1. Estimación de la proporción

Intervalo de confianza para estimar la proporción:

En principio el estimador de la proporción, por ser esta una media, como resultado de los teoremas de convergencia, seguirá una distribución normal si el número de unidades muestrales es mayor que 50. El intervalo de confianza al nivel de confianza 1-α se deduce de los resultados anteriores sin más que sustituir adecuadamente las expresiones propias de las proporciones:

⎥ ⎦ ⎤ ⎢

⎣ ⎡

⋅ − − ⋅

+ ⋅

− − ⋅

− =

2

2 N 1 z

n N n

PQ p

, z 1 N

n N n

PQ p

(78)

Master en Marketing Muestreo en Poblaciones finitas

Tema 2: Muestreo aleatorio simple

3. Estimación de la proporción y del total de clase

3.1. Estimación de la proporción

Si el error muestral es desconocido, se considera una estimación insesgada del mismo, siendo en este caso el intervalo de confianza:

⎥ ⎦ ⎤ ⎢

⎣ ⎡

⋅ − ⋅

− +

⋅ − ⋅

− −

=

2

2 n 1 1 f z

pq p

, z f 1 1

n pq p

I α α

3.2. Estimación del total de clase

Referencias

Documento similar

En estos últimos años, he tenido el privilegio, durante varias prolongadas visitas al extranjero, de hacer investigaciones sobre el teatro, y muchas veces he tenido la ocasión

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

Para ello, trabajaremos con una colección de cartas redactadas desde allí, impresa en Évora en 1598 y otros documentos jesuitas: el Sumario de las cosas de Japón (1583),

Esto viene a corroborar el hecho de que perviva aún hoy en el leonés occidental este diptongo, apesardel gran empuje sufrido porparte de /ue/ que empezó a desplazar a /uo/ a

En junio de 1980, el Departamento de Literatura Española de la Universi- dad de Sevilla, tras consultar con diversos estudiosos del poeta, decidió propo- ner al Claustro de la

Sanz (Universidad Carlos III-IUNE): &#34;El papel de las fuentes de datos en los ranking nacionales de universidades&#34;.. Reuniones científicas 75 Los días 12 y 13 de noviembre

(Banco de España) Mancebo, Pascual (U. de Alicante) Marco, Mariluz (U. de València) Marhuenda, Francisco (U. de Alicante) Marhuenda, Joaquín (U. de Alicante) Marquerie,

SVP, EXECUTIVE CREATIVE DIRECTOR JACK MORTON