5.Distribución de la variable aleatoria media muestral. 6.Distribución de la variable aleatoria varianza muestral

(1)

TEMA 1 INTRODUCCIÓN A LA INFERENCIA

ESTADÍSTICA

1.Introducción al muestreo

2.Elementos del muestreo

3.Tipos de muestreo

4.Distribuciones que intervienen en el muestreo

5.Distribución de la variable aleatoria media muestral

6.Distribución de la variable aleatoria varianza muestral

7.Distribuciones en el muestreo en una población normal

8.Distribución de la proporción muestral

(2)

1. Introducción al muestreo

En este primer tema se van a definir los elementos del mues-treo, se conocerán los diferentes tipos de muesmues-treo, sus ca-racterísticas, ventajas e inconvenientes. Además, se introdu-cirá el concepto de distribución de muestreo y se presentarán las principales distribuciones muestrales.

Cuando el investigador puede observar todos los elementos de la población, entonces su tarea se reduce a describir las ca-racterísticas y regularidades de la población. Pero si la obser-vación no puede ser exhaustiva, entonces aquellas caracterís-ticas hay que estudiarlas a través de una muestra representa-tiva. La información suministrada por la muestra puede servir para inducir o inferir, con mayor o menor exactitud, las carac-terísticas de la población.

La fase de descripción es (o puede ser) común a cualquier conjunto de observaciones, mientras que la de inferencia sólo tiene efectividad cuando se trabaja con muestras.

El objetivo de la inferencia es poder llegar al conocimiento de una población través del estudio de muestras. Se trata de un enfoque inductivo que va de lo particular (la muestra) a lo ge-neral (la población de la que procede la muestra). Este cono-cimiento va acompañado de una medida del error que se pue-de cometer.

El propósito de un estudio estadístico suele ser extraer con-clusiones acerca de la naturaleza de una población. Al ser la población grande y no poder ser estudiada en su integridad en la mayoría de los casos, las conclusiones obtenidas deben ba-sarse en el examen de solamente una parte de ésta, lo que nos lleva, en primer lugar a la justificación, necesidad y defi-nición de las diferentes técnicas de muestreo.

(3)

La técnica del muestreo permite producir información sobre un dominio dado a partir de la observación de una parte de dicho dominio. El dominio estudiado se suele denominar uni-verso o población.

Los primeros términos obligados a los que debemos hacer re-ferencia, definidos en el primer capítulo, serán los de estadís-tico o estimador.

Dentro de este contexto, será necesario asumir un estadístico o estimador como una variable aleatoria con una determinada distribución, y que será la pieza clave en las dos formas de in-ferencia estadística: la estimación y el contraste de hipótesis. Partiendo del hecho cierto de que una muestra, en general, no da una información exacta de las características de la pobla-ción que deseamos estudiar, puede procederse así:

• Utilizar la muestra para estimar dichas características. Es-te enfoque origina la Es-teoría de la estimación, medianEs-te la cual se da solución a los problemas específicos que se plantean.

• Emitir una hipótesis sobre las características tomando como base la experiencia, otras informaciones o incluso el presentimiento o la corazonada. Una hipótesis así formu-lada tiene poco valor científico. Este valor se adquiere to-mando una muestra de la población y utilizándola para verificar o contrastar la hipótesis. Este enfoque da lugar a la teoría de la verificación o constrastación de hipótesis. El concepto de estimador, como herramienta fundamental, lo caracterizamos mediante una serie de propiedades que nos servirán para elegir el “mejor” para una determinada

(4)

carac-terística de una población, así como algunos métodos para la obtención de ellos.

La teoría de la estimación se desarrolla en dos direcciones es-trechamente relacionadas:

1. Estimación por puntos. La característica de la pobla-ción se estima por medio de un solo número (un pun-to).

2. Estimación por intervalos. En este caso no se da un valor singular como estimación de la característica desconocida de la población, sino dos números que definen un intervalo, dentro del cual se encontrará la característica con una probabilidad dada.

(5)

2. Elementos del muestreo

Una población, colectivo o universo está constituida por todos los elementos que poseen unas características en cuyo estudio estamos interesados. El universo estudiado (finito o infinito) se debe definir de manera precisa, tanto respecto a las unida-des elementales que lo componen como a sus límites.

Las unidades estadísticas son los elementos que componen el universo.

Población objetivo vs población investigada: Población objeti-vo: población inicial a investigar. Población investigada: po-blación que realmente es objeto de estudio. Diferencia: nega-tivas a colaborar, ausencias, inaccesibilidad a algunos elemen-tos.

Un marco muestral es una lista completa y actualizada de las unidades del universo sin omisiones ni repeticiones, y donde cada unidad pueda identificarse sin ambigüedades. Lo ideal sería disponer de un marco tal que la lista de unidades mues-trales que lo componen coincida con la población objetivo. Se denomina muestra a un subconjunto de unidades estadísti-cas extraído del universo del cual se quiere conocer ciertas ca-racterísticas. A partir de los resultados observados sobre la muestra se va a extrapolar para producir estimaciones sobre dicho universo. Es una parte de los elementos de la población, pero esta parte ha de ser representativa del total.

Los conceptos de población y muestra están subordinados al uso que se piensa hacer del conjunto de observaciones dispo-nible. Si lo único que se pretende es describir las

(6)

característi-neral. Pero si se desea extender la información obtenida de él a otro conjunto mayor para inferir sus características, enton-ces, evidentemente, el conjunto de observaciones constituye una muestra. La muestra ha de reunir los requisitos suficien-tes para que el proceso de inferencia o inducción (paso de lo particular a lo general) pueda realizarse con ciertas garantías. En el caso de que la muestra de investigación se dirija a toda la población se dice que se realiza un censo, mientras que la recogida de la información muestral recibe el nombre de en-cuesta. A veces se suele emplear la expresión encuesta ex-haustiva como sinónimo de censo.

La operación de tomar una muestra de una población se de-nomina muestreo y los métodos de muestreo que se utilicen deben garantizar la representatividad para que pueda hablar-se correctamente de una muestra estadística.

Razones del muestreo:

1. Establecer contacto con la totalidad de la población requeriría demasiado tiempo.

2. El coste de estudiar todos los elementos en una po-blación puede resultar prohibitivo.

3. La imposibilidad de verificar todos los elementos de la población.

4. La naturaleza destructiva de algunas pruebas. 5. Los resultados de la muestra son adecuados.

(7)

Las características muestrales denominadas estadísticos se emplean para hacer inferencias con respecto a las característi-cas de la población, que reciben el nombre de parámetros. Un parámetro es una constante, pero un estadístico es una varia-ble aleatoria.

• Estadístico (estimador): es cualquier función de las va-riables aleatorias (elementos muestrales) que se observan en la muestra de manera que esta función no contiene cantidades desconocidas. Las informaciones de la muestra se resumen en el estadístico.

(

X

n

)

Z

=

₁

,

₂

,

K

,

Es una fórmula matemática que permite calcular la esti-mación de una magnitud a partir de los datos observados en la muestra extraída. Para un procedimiento dado, el azar puede conducir a diferentes muestras, por tanto a di-ferentes estimaciones (calculadas a partir del estimador). • Parámetro: es una caracterización numérica de la

distri-bución de la población de manera que describe, parcial o completamente, la función de densidad de probabilidad de la característica de interés. Los más comunes son la me-dia, la desviación típica y la proporción.

Una variable aleatoria es una variable que puede tomar un cierto número de valores con una probabilidad asociada a ca-da valor. La variable aleatoria sigue entonces una cierta dis-tribución. El estimador es una variable aleatoria.

Los elementos que integran la muestra son variables aleato-rias, por lo que cualquier función de estos elementos también será una variable aleatoria.

(8)

Para cualquier estadístico se espera una variabilidad de mues-tra a muesmues-tra, dado que un estadístico es una variable aleato-ria. De hecho, para cada estadístico existe lo que se conoce como su distribución de probabilidad de muestreo, la cual tie-ne en cuenta la variabilidad inherente y proporciona los me-dios necesarios por medio de los cuales puede evaluarse el estadístico.

De manera general, la distribución de muestreo de un estadís-tico no tiene la misma forma que la distribución de densidad de probabilidad en la distribución de la población.

Conviene distinguir entre dos clases de error. De una parte existen los errores muestrales, que son aquellos que están la-tentes en toda muestra representativa, pues aun siéndolo no proporciona, salvo raras excepciones, una medida exacta de las características de la población. Por ello hay que contar siempre con los errores muestrales o errores de muestreo. Es la diferencia entre un estadístico de la muestra y el parámetro de la población correspondiente. El valor del error de mues-treo se basa en la selección aleatoria de la muestra. Por tanto, los errores de muestreo son aleatorios y ocurren por casuali-dad.

Universo

_Muestra

n

(9)

Por otra parte están los sesgos, bajo cuya denominación se incluyen algunos errores específicos de las muestras como los debidos a su falta de representatividad, y otros que son co-munes a toda investigación estadística, tanto si es exhaustiva como si no lo es. A este último grupo pertenecen los errores de observación, considerados en su aspecto más amplio, es decir, los originados por definiciones defectuosas de los ele-mentos de la población, de las características a investigar; los debidos a respuestas o medidas mal efectuadas, a fórmulas inadecuadas, a cálculos equivocados, etc.

Los sesgos debidos a falta de representatividad de la muestra se eliminan utilizando simplemente métodos de muestreo que aseguren y garanticen la representatividad. Tales métodos han de basarse en el azar, es decir, el método de selección de la muestra ha de ser aleatorio.

(10)

Tenemos una variable

X

(X

₁

,…,X

_N

)

y una población finita de tamaño

N

. Si se efectúa una observación exhaustiva, se ob-tienen las siguientes características:

Media aritmética:

N

X

N i

∑

i

=

=1

µ

Varianza:

(

)

N

X

N i

∑

i

−

=

=1 2 2

µ

σ

Si se dispone de una muestra de

n

observaciones:

Media aritmética:

n

X

n i

∑

i

=

=1 Varianza:

(

)

n

X

S

n i

∑

i

−

=

=1 2 2 Cuasivarianza:

(

)

1

1 2 2 1

−

∑

−

=

n

X

S

n i i

X

y

S

₁2 van a usarse como estimadores de

µ

y

σ

2 respecti-vamente.

Características poblacionales

Características muestrales

(11)

3. Tipos de muestreo

Métodos de muestreo: conjunto de técnicas estadísticas que estudian la forma de seleccionar una muestra lo suficiente-mente representativa de una población cuya información per-mita inferir las propiedades o características de toda la pobla-ción cometiendo un error medible y acotable.

Los métodos de muestreo pueden ser probabilísticos (aleato-rios) y no probilísticos (no aleato(aleato-rios).

Probabilísticos: la selección es independiente del juicio u opinión de cualquier persona.

No Probabilísticos: esta condición no siempre se verifica. En ambos casos la selección de la muestra se puede hacer se-leccionando elementos de la población o sese-leccionando grupos de tales elementos.

Muestreo

No Probabilístico

Probabilístico

m. a. simple

m. a. sistemático

m. a. estratificado

m. a. por áreas y

conglomerados

La unidad

mues-tral es el

elemen-to de la población

La unidad

mues-tral es un grupo

de elementos de

(12)

En el muestreo probabilístico todos los elementos de la pobla-ción tienen la oportunidad de ser escogidos para la muestra. Es decir, toda unidad estadística tiene una probabilidad no nu-la y conocida de ser seleccionada en nu-la muestra.

En una muestra aleatoria o de probabilidad conocemos las po-sibilidades de que un elemento de la población se incluya o no en la muestra; es posible determinar objetivamente las esti-maciones de las características de la población que resultan de una muestra dada. Para la elección de una muestra se re-curre al azar y se puede emplear una formalización matemáti-ca para estudiar las propiedades de esta muestra. Se puede utilizar la teoría de la probabilidad para medir el error de muestreo.

En el muestreo no probabilístico o de juicio, se emplea el co-nocimiento y la opinión personal para identificar a los elemen-tos de la población que deben incluirse en la muestra.

La razón por la cual existen varios métodos de muestreo se debe a dos fines principales: reducción de costes y reducción de errores.

(13)

Muestreo aleatorio simple

El muestreo aleatorio simple selecciona muestras mediante métodos que permiten que cada posible muestra tenga una igual probabilidad de ser seleccionada y que cada elemento de la población total tenga una oportunidad igual de ser incluido en la muestra.

Es el más sencillo teóricamente. Sirve de base para los res-tantes métodos de muestreo aleatorios.

Está basado en el puro azar. Consiste en que cada elemento de la población se hace representar por una bola o tarjeta particularizada mediante un número. Todas las bolas o tarje-tas se introducen en una urna, donde se extraen tantarje-tas como requiera el tamaño de la muestra.

Las extracciones pueden ser con reposición o sin reposición. Muestreo con reposición: una unidad seleccionada en una extracción se “repone en la urna” y participa en las siguientes extracciones. Se puede extraer dicha unidad dos o más veces. En la práctica es el que preferentemente se emplea.

Muestreo sin reposición: Una vez extraída una unidad, no se la vuelve a tomar en cuenta para las siguientes extraccio-nes.

La diferencia básica entre las dos técnicas es la noción de in-dependencia. En el muestreo con reposición (reemplazamien-to), las observaciones

X

₁

,

X

₂

,

K

,

X

_n constituyen un conjun-to de variables aleaconjun-torias independientes e idénticamente dis-tribuidas dado que, en el proceso de reemplazamiento, ningu-na observación se ve afectada por otra. En la técnica de muestreo sin reemplazamiento, a pesar de que las

(14)

observa-ciones

X

₁

,

X

₂

,

K

,

X

_n poseen la misma distribución, no son independientes.

Conforme crece el tamaño de la población, el muestreo alea-torio sin reemplazamiento es, a todos los efectos, igual al muestreo aleatorio con reemplazamiento.

Cálculo de la muestra:

Cálculo de la media muestral (muestra de tamaño

n

de una población con media

X

y varianza

σ

2):

∑

=

= n i

X

i

n

X

1

Estimación de la media del estimador:

( )

X

=

µ

E

Estimación de la varianza del estimador: • Cuando hay reposición:

n

S

2

₌

σ

2

• Cuando no hay reposición:

n

N

n

N

S

2 2

1 σ













−

=

La varianza del estimador será pequeña cuando:

Urna

Tabla de números

(15)

•

σ

2 sea pequeño.

• El tamaño de la muestra sea grande. Como

1 −

−

N

n

N

es siempre inferior a

1

, la varianza del estima-dor sin reposición es menor que la del estimaestima-dor con reposi-ción para una misma variable. No obstante, cuando

N

es grande, el coeficiente

1 −

−

N

n

N

es cercano a

1

y las dos varian-zas son entonces idénticas.

La diferencia de precisión entre las extracciones con y sin re-posición favorece la no rere-posición. En general, la ventaja es poca, excepto cuando la tasa de muestreo

n

N

es cercana a

1

.

Si bien la varianza es nula cuando

N

=

n

en el caso sin repo-sición, no sucede lo mismo para la extracción con reposición.

(16)

Muestreo aleatorio sistemático

Es necesario que los elementos de la población estén dispues-tos ordenadamente o existe una lista o registro de ellos.

Supongamos que el tamaño de la muestra es tal que hay que seleccionar un elemento de cada

p

. Sabido esto, el muestreo sistemático empieza por elegir al azar un número que no sea superior a

p

; con esta única solución se obtiene una muestra sin más que añadir a dicho número seleccionado, que llama-remos

k

, el número

p

tantas veces como sea preciso para re-correr toda la población. Simbólicamente, la muestra sistemá-tica está constituida por los siguientes elementos:

k k+p k+2·p k+3·p

…

El muestreo sistemático, además de la ventaja en la reducción de los costes, tiene la de asegurar que en la muestra apare-cerán elementos de la población de todas las clases.

Puede decirse que el muestreo sistemático tiende a suminis-trar muestras más representativas que el aleatorio simple y será equivalente si las unidades del marco muestral están dis-tribuidas absolutamente al azar. Pero esto es cierto cuando en la disposición ordenada de los elementos de la población no existe una periodicidad coincidente con la de la muestra, por-que entonces la muestra sistemática proporcionará estimacio-nes sesgadas.

Cuando el orden físico se relaciona con la característica de la población, entonces no se debe utilizar el muestreo aleatorio sistemático, salvo que el orden tenga un efecto que permita dar más representatividad a la muestra extraída.

(17)

El muestreo sistemático difiere del muestreo aleatorio simple en que cada elemento tiene igual oportunidad de ser seleccio-nado, pero cada muestra no tiene una posibilidad igual de ser seleccionada.

(18)

Muestreo aleatorio estratificado

Una muestra, salvo raras excepciones, no puede proporcionar una información exacta de las características de la población. Estas raras excepciones se presentan en las poblaciones to-talmente uniformes con respecto al carácter sometido a estu-dio. En tal caso la varianza muestral de la media es igual a ce-ro porque la varianza poblacional también lo es. Esto equivale a decir que la precisión es máxima, es decir, no existe error de estimación.

Si se sabe que una población puede dividirse en partes (estra-tos), de forma que en cada una de ellas los elementos posean una gran homogeneidad con respecto al carácter que se estu-dia, entonces se aumenta la precisión de las estimaciones to-mando una muestra de cada estrato, es decir, actuando sepa-radamente en cada estrato. Este es el muestreo estratificado.

Dentro de cada estrato se puede aplicar el muestreo aleatorio simple o el aleatorio sistemático. En ambos casos la selección es aleatoria y se tiene el muestreo aleatorio estratificado.

El muestreo es satisfactorio cuando puede aplicarse una

estra-N

3

N

2

N

1

n

3

n

2

n

1

(19)

grupos diferenciados. En caso contrario, este método no apor-ta ninguna mejora susapor-tancial con respecto a los otros. Pero si existen tales grupos diferenciados, entonces el método puede aplicarse, bien para aumentar la precisión de las estimaciones o bien para reducir los costes, lo cual puede conseguirse dis-minuyendo el tamaño de la muestra si es que no se quiere aumentar la precisión.

La eficacia del muestreo estratificado no depende únicamente de que la población aparezca diversificada en grupos con cier-ta homogeneidad. Además, es preciso poseer información su-ficiente para definir y separar los grupos o estratos correcta-mente y para decidir el tamaño de la muestra que se ha de seleccionar en cada estrato.

La estratificación puede tener como objetivo principal: • Aumentar la precisión global.

• Obtener una precisión suficiente en el interior de cada es-trato.

Supuestos y notación: La extracción en el interior de cada es-trato es aleatorio simple y sin reposición.

•

k estratos: h = 1,2,…,k

• Para cada estrato

h

, el efectivo total es

N

_h





=

∑





=

k

h

N

h

N

1

Media muestral del estrato

h

:

∑

=

= h h h n i i h h

_n

X

1

(20)

∑

=

= k h

N

h

X

h

N

X

1

Es decir, la media de la población se estima a través de la media ponderada de las medias muestrales obtenidas en cada estrato. El peso es el del estrato en la población.

Tamaño de cada muestra (afijación): La tasa

n

_h

N

_h puede variar de un estrato a otro.

Muestreo estratificado proporcional o representativo: Se utiliza la misma proporción que en la población (fracción de muestreo igual). k k

N

n

N

n

N

n

N

n

=

L

2 2 1 1

El muestreo estratificado proporcional siempre tiene un es-timador de la varianza menor o igual a la del eses-timador del muestreo simple, y tanto más pequeña cuanto las medias de los estratos difieran de la media general.

Muestreo estratificado no proporcional: La fracción de muestreo no se aplica de manera constante a todos los es-tratos.

Justificación del muestreo estratificado no proporcional:

• Varianzas diferentes: Cuando las varianzas de los estratos difieren mucho entre sí.

• Tamaño de la muestra de cada estrato: Si un estrato cons-ta de muy pocos elementos puede ser aconsejable que la muestra correspondiente sea del 100%, es decir, que en dicho estrato la observación sea exhaustiva.

(21)

Reparto representativo o reparto de Neyman: Se utiliza una tasa de muestreo proporcional a la dispersión

σ

_h de la varia-ble estudiada

X

en cada estrato.

∑

=

= k h h h h h h

N

n

N

n

1

σ

Cuanto más heterogéneo sea un estrato con respecto a dicha variable, mayor será en éste la tasa de muestreo. Este reparto es el que reduce al mínimo la varianza total para una estratifi-cación dada.

La aplicación de la fórmula para calcular el reparto de Neyman supone que los valores

σ

_h se conocen a priori.

En la práctica, se utiliza el reparto de Neyman cuando el fenómeno estudiado tiene una distribución muy asimétrica. Si el fenómeno tiene una distribución simétrica respecto de su media, un muestreo estratificado proporcional proporciona re-sultados de calidad suficiente.

Búsqueda de precisión a nivel de cada estrato: Cuando se desea obtener información significativa para cada estrato, el problema es completamente distinto. En este caso habrá que dar una ventaja relativa a los estratos menos poblados, gene-ralmente en detrimento de la precisión global.

Si se desea la misma precisión a nivel de cada estrato y si se presume que los estratos presentan la misma heterogeneidad para el carácter estudiado, se deberán tomar tamaños de muestra similares en cada uno.

(22)

Si queremos que la varianza sea la misma en dos estratos (

i

,

j

):

( )

j j j j i i i i j i

n

N

n

N

n

X

Var

X

Var

2 2

1

1 σ

σ









−

=











 −

=

Despreciando las tasas de muestreo

n

_h

N

_h para simplificar:

n

j i j j i i 2 2 2 2

σ

₌

+

(23)

Ejemplo: Un país está dividido en dos regiones. Las regiones a su vez de dividen en municipios. Los datos aparecen en la si-guiente tabla; La muestra es de 80 municipios:

n = 80

Reparto proporcional:

20

000 .

1

000 .

4

80

60

000 .

3

000 .

4

80

2 2 1 1

=

N

n

N

n

N

n

_h _h Reparto de Neyman:

∑

=

= k h h h h h h

S

N

n

N

n

1

σ

32

000 .

16

200

·

000 .

1

·

80

48

000 .

500

000 .

24

200

·

000 .

1

100

·

000 .

3

100

·

000 .

3

·

80

·

1 1

=

+

=

∑

=

n

N

n

_k h h h h h h

σ

Estrato

h

Nº Municipios

N

_h Población

σ

_h

X

_h 1 3.000 956.800 100 319 2 1.000 605.000 200 605 Total 4.000 1.561.800 390

(24)

Precisión a nivel de cada estrato:

64

000 .

50

000 .

200 .

3

200

100

200

·

80

·

16

000 .

50

000 .

800

200

100

·

80

·

2 2 2 2 2 2 1 2 2 2 2 2 2 2 2 2 1 2 1 1 2 2 2 1 2 2 2 1 2 1

=

+

=

+

=

+

=

+

=

+

=

σ

n

(25)

Muestreo por conglomerados y por áreas

Un conglomerado es un grupo de elementos de la población. Por lo general, estos grupos o conglomerados tienen una exis-tencia real.

El muestreo por conglomerados consiste en seleccionar alea-toriamente cierto número de conglomerados y en investigar después todos los elementos pertenecientes a ellos.

De esta forma el problema de la obtención de listas de toda la población se simplifica mucho, porque ahora sólo se necesita la lista de los elementos pertenecientes a los conglomerados seleccionados.

Con frecuencia los conglomerados son áreas geográficas; por ello, el denominado muestreo por áreas no es más que un ca-so particular del muestreo por conglomerados.

Para que este tipo de muestreo no produzca una disminución en la precisión de las estimaciones es necesario, por una par-te, que en cada conglomerado existan elementos de la pobla-ción de todas las clases, y por otra, que los conglomerados sean lo más homogéneos posible.

Los principios que deben presidir el muestreo por conglome-rados son:

• Heterogeneidad de los elementos de la población dentro de cada conglomerado.

• Homogeneidad entre conglomerados.

Los principios del muestreo por conglomerados son contrarios a los del muestreo estratificado; en éste se busca una gran heterogeneidad entre los estratos y una gran homogeneidad

(26)

La perdida de precisión que puede resultar en el muestreo por conglomerados, a consecuencia de no cumplirse estos princi-pios, puede recuperarse aumentando el tamaño de la tra, lo cual puede ser posible porque este método de mues-treo es mucho menos costoso.

Estratos heterogéneos

entre sí pero

homogé-neos internamente

Conglomerados

homogéneos entre sí

pero heterogéneos

internamente

(27)

Muestreo por etapas

El muestreo por etapas (polietápico) es una generalización del muestreo por conglomerados mediante la cual se intenta re-ducir al mínimo posible el coste que supone la obtención de la lista de los elementos de la población.

El muestreo por etapas se basa en conglomerados. En la pri-mera etapa se seleccionan conglopri-merados de una clase; en la segunda etapa se seleccionan conglomerados más pequeños pertenecientes a los anteriores y así sucesivamente hasta lle-gar a los elementos de la población. De esta forma sólo se ne-cesita la lista de los elementos de la población sobre los cua-les se ha de aplicar la última etapa.

El muestreo por etapas tiene varias ventajas:

• En cada etapa se puede aplicar el muestreo aleatorio que se considere más adecuado al tipo de conglomerado de que se trate.

• En ausencia de un marco muestral completo, basta con elaborar un marco parcial.

• Habrá ahorro global de tiempo y gasto de desplazamiento. El precio a pagar por estas ventajas es que la precisión del muestreo en varias etapas es, en general, menor que la que tendríamos en un muestreo de una sola etapa con el mismo tamaño muestral. Se incrementan los errores puesto que en cada etapa se obtiene una muestra con su correspondiente error.

(28)

Muestreo no probabilístico (no aleatorio) y

se-mialeatorio

Justificación: a veces la insuficiencia de medios económicos, la escasez de tiempo disponible u otras razones no menos im-portantes impiden la aplicación de métodos aleatorios o pro-babilísticos de muestreo. En tales casos se acostumbra recu-rrir a métodos no aleatorios.

El muestreo no aleatorio es aquel en que los elementos de la población que han de constituir la muestra no se seleccionan al azar.

En su forma más simple, consiste en seleccionar los elemen-tos que, en nuestra opinión o en la del agente encuestador, pueden ser representativos de la población: muestreo opináti-co o muestreo intencional.

Como la selección no es aleatoria, no es posible obtener las distribuciones de las características muestrales y, por tanto, no puede medirse la precisión de las estimaciones. La teoría de la probabilidad no puede ser empleada para medir el error de muestreo.

El método es bueno en tanto que la muestra sea representati-va de la población, pero esto no hay medio científico de me-dirlo. Por tanto, el método da lugar a un sesgo latente.

Las mejoras del método se orientan en el sentido de estudiar previamente la estructura de la población para conseguir una muestra de estructura análoga. Se calcula una cuota o núme-ro de personas de cada clase que se ha de entrevistar para conseguir la identidad de estructura. Esta variante del método se denomina muestreo por cuotas.

Una mejora mayor puede conseguirse combinando el mues-treo aleatorio con el no aleatorio. Esto puede hacerse

(29)

espe-cialmente cuando se emplea el muestreo por etapas. Las pri-meras etapas de la selección pueden hacerse aleatoriamente, y la última, esto es, la de seleccionar los elementos de la po-blación que han de ser observados, puede llevarse a cabo mediante un muestreo por cuotas con agentes bien instruidos. Este método se denomina muestreo semialeatorio.

El muestreo no aleatorio no es un método científico de selec-ción y no es posible conocer la precisión de las estimaciones , ni incluso cuando se combina con el aleatorio, porque aun en este caso hay una o varias etapas en que la selección se deja en manos de los agentes encuestadores.

Cuando la investigación se refiere a cuestiones de respuesta laboriosa, difícil, molesta y delicada, el estadístico se enfrenta con dos clases de sesgos. De un lado están los debidos a los errores de observación cuando emplea una muestra aleatoria, y de otro, los debidos al método de muestreo cuando no es aleatorio. El conocimiento de la población y de las reacciones de sus elementos le ayudarán a decidirse por una de las dos alternativas, teniendo en cuenta, que su finalidad última es la de obtener estimaciones lo más exactas posible de las carac-terísticas de la población.

(30)

4. Distribuciones que intervienen en el

mues-treo

Cuando el tamaño de la muestra

n

es más pequeño que el tamaño de la población

N

, dos o más muestras pueden ser extraídas de la misma población. Un cierto estadístico puede ser calculado para cada una de las muestras posibles extraí-das de la población. La distribución del estadístico obtenido de la muestra es llamada la distribución en el muestreo del es-tadístico.

Un estadístico o estimador es una variable aleatoria con una determinada distribución, y que será importante en dos cate-gorías de la inferencia estadística: la estimación y el contraste de hipótesis.

En el muestreo intervienen tres distribuciones: 1. Distribución de la población.

2. Distribución de la muestra.

3. Distribución del estadístico en el muestreo.

Distribución de la población

Las características que deseamos observar en la población básica

X

tienen una determinada distribución de probabilidad

F(X)

.

( )

_σ

2

µ

=

X

Var

X

E

(31)

Distribución de la muestra

La distribución de la muestra será n-dimensional, habrá una distribución para cada elemento

X

₁

,

X

₂

,

K

,

X

_n.

(

X

n

)

F

₁

,

₂

,

K

,

Distribución del estadístico en el muestreo

Es la distribución de los valores que puede tomar el estadísti-co en todas las posibles muestras.

Z

( )

X

será una distribución unidimensional.

Su distribución depende de:

• La distribución de la población X.

• La forma de la función

Z

(estadístico). • Tipo de muestreo.

• Tamaño de la muestra.

Los estadísticos más habituales son los siguientes: • Media muestral:

=

∑

= n i

X

i

n

X

1

• Varianza muestral:

(

)

2 1 2

1 ∑

−

=

= n i

X

i

X

n

S

• Cuasivarianza muestral:

(

)

2 1 2 1

₁

1 ∑

−

=

= n i

X

i

X

n

S

X

(32)

Características

Poblacionales Características Muestrales

Media

µ

X

Desviación

σ

S

Proporción

p

P

La distribución muestral sirve para saber si un resultado muestral es raro. El concepto de distribución muestral permite determinar la probabilidad de que una muestra particular (realización muestral) no sea representativa en un determina-do gradetermina-do.

El razonamiento es el siguiente: se calcula la probabilidad de obtener, bajo nuestros supuestos, un resultado muestral co-mo el que se ha encontrado. Si esta probabilidad es muy pe-queña, dudaremos de los supuestos de partida.

(33)

Ejemplo: Tenemos la siguiente población:

Supongamos que se toman muestras de tres elementos (

n

=3)

3

2 3 1

X

₌

+

Distribución de probabilidad: i

X

P

( )

X

_i 2 3/12 3 3/12 4 2/12 5 3/12 10 1/12

Distribución de probabilidad de la muestra:

X

P

( )

X

2 (3/12)3 2,33 (3/12)3

M

6,66 (3/12)2_(1/12)

2

3

4

5

5 10 2

3

33 ,

2

1

=

X

4

2

=

X

5

3

=

X

4 =

µ

12 ,

2 =

σ

(34)

5. Distribución de la variable aleatoria

me-dia muestral

Sea

X

la media muestral de una muestra aleatoria de

n

ob-servaciones de una población que tiene una media

µ

y una varianza

σ

2.

∑

=

= n i

X

i

n

X

1

En ese caso:

1. La distribución de

X

en el muestreo tiene la media

( )

X

=

µ

E

La media de la distribución de las medias muestrales en el muestreo es la media poblacional. Si se extrae repetida e independientemente muestras de

n

observaciones aleato-rias e independientes de una población, entonces a medi-da que aumenta el número de muestras, la media de las medias muestrales se aproxima a la verdadera media po-blacional.

2. Si la población es muy grande en comparación con el ta-maño de la muestra, las distribuciones de los miembros de muestras aleatorias son aproximadamente indepen-dientes entre sí. Entonces, la distribución de

X

en el muestreo tiene la desviación típica

n

X

σ

=

(35)

La desviación típica de la distribución de

X

en el treo disminuye a medida que aumenta el tamaño mues-tral

n. Cuanto mayor es el tamaño de la muestra, más

concentrada está la distribución en el muestreo.

3. Si el tamaño de muestra

n

no es pequeño en compara-ción con el tamaño de la poblacompara-ción

N

(N<150.000)

y los miembros de la muestra no están distribuidos inde-pendientemente unos de otros (muestreo sin reemplaza-miento), el error típico de

X

es

n

N

n

N

X

σ

·

1 −

−

=

siendo

1 −

−

N

n

N

el denominado multiplicador de población finita o factor corrector de poblaciones finitas.

Cuando se muestrea una pequeña fracción de la población entera (es decir, cuando el tamaño de la población

N es

muy grande en relación con el tamaño de la muestra

n),

el multiplicador de población finita toma un valor cercano a

1

. Se suele referirse a

n

N

como la fracción de mues-treo, porque es la fracción de la población

N

contenida en la muestra n.

Cuando la fracción de muestreo es pequeña, el error estándar de la media para poblaciones finitas es tan cer-cano a la media para poblaciones infinitas que se puede utilizar la misma fórmula para ambas desviaciones. La

(36)

re-es menor a 0,05 no re-es necre-esario usar el multiplicador de población finita.

Para hacer

σ

_X más pequeña sólo es necesario agrandar

n. En consecuencia, resulta que el tamaño absoluto de la

muestra (y no el de la fracción de la población muestrea-da) es el que determina la precisión del muestreo.

Obtener una muestra de más elementos disminuye el error estándar, el incremento de la precisión puede no va-ler el coste ocasionado (utilidad decreciente).

En la mayoría de las aplicaciones, la media y la varianza definen la distribución en el muestreo. Estos resultados de la media y la varianza de la distribución en el muestreo se aplican a cualquier distribución de probabilidad que define la pauta de los valores existentes en la población.

4. Si la distribución de la población de la que procede la muestra es normal y, por lo tanto, la distribución de las medias muestrales en el muestreo es normal, la variable aleatoria

n

X

Z

X

σ

µ

σ

µ

₌

−

=

sigue una distribución normal estándar de media 0 y de varianza 1.

5. Si la distribución de la población no es normal, pero

n

es grande

(

n

≥

30 )

, entonces por el teorema central del

(37)

límite, la media sigue una distribución aproximadamente normal. Si

(

)













→

n

N

X

N

X

~

µ

,

σ

~

µ

,

σ

Si

(

)













→

≥

n

N

X

n

X

~

_µ

,

_σ

y

30 ~

_µ

,

σ

Las inferencias basadas en la media muestral son robustas con respecto al supuesto de la normalidad.

Resumiendo, si tomamos todas las muestras aleatorias posi-bles de una población y para cada una calculamos su media:

1. La media de las medias es exactamente igual a la media de la población.

2. La dispersión de la distribución muestral de medias es más estrecha que la distribución de la población.

3. La distribución muestral de medias suele tener forma de campana y se aproxima a la distribución de probabilidad normal.

(38)

Ejemplo. Tenemos una población con una distribución normal de media igual a 100 y desviación típica igual a 5.

Entonces













n

N

X

~

100 ,

5

Dibujamos para

n

= 25 y

n

= 100

(39)

6. Distribución de la variable aleatoria

va-rianza muestral

Sea

X

₁

,

X

₂

,

K

,

X

_n una muestra aleatoria de

n

observacio-nes procedentes de una población que tiene varianza

σ

2. La cantidad

(

)

2 1 2 1

₁

1 ∑

−

=

= n i

X

i

X

n

S

Se llama cuasivarianza muestral y su raíz cuadrada,

S

₁, se llama cuasidesviación típica muestral. Entonces

S

₁2 en el muestreo tiene una media

σ

2.

( )

2 2

1

=

σ

S

E

El valor esperado de la cuasivarianza muestral es la va-rianza poblacional. Se cumple cuando el tamaño de la muestra

n

es una pequeña proporción del tamaño de muestra de la población

N

.

2. La varianza de la distribución de

S

₁2 en el muestreo de-pende de la distribución de la población subyacente. Si esta distribución es normal, entonces

( )

2

₁

1

=

_n

₋

S

Var

σ

3. Si la distribución de la población es normal, entonces

(

₋

₁

)

2

∑

(

−

)

2 n

X

S

n

(40)

Distribución

2

n

χ

de Pearson

Sean

n variables aleatorias independientes

X

₁

,

X

₂

,

K

,

X

_n

distribuidas como

N(0,1)

. Se define

Z

=

X

₁2

+

X

₂2

+

L

X

_n2

y se denomina

χ

_n2 central, siendo

n

el número de variables aleatorias que la integran y el número de grados de libertad. La distribución se define únicamente para valores positivos, ya que las varianzas son todas ellas valores positivos. La función de densidad de la chi-cuadrado es asimétrica y tiene una larga cola positiva.

• La distribución

χ

_n2 está tabulada

( )

n

Var

n

E

n n

2

2 2

=

χ

• El cuartil

χ

_α2 es el valor de la distribución tal que

(

χ

2

>

χ

_α2

)

=

α

n

P

α

(41)

• Propiedad aditiva o reproductiva. Sean

X

₁ y

X

₂ variables aleatorias independientes con distribuciones 2

1 n

χ

y 2 2 n

χ

. La variable aleatoria suma tiene distribución chi-cuadrada con

n

₁

+

n

₂ grados de libertad. Sea

Z

=

X

₁

+

X

₂, se distribuye como 2

2 1 n

n +

χ

.

• Convergencia a la distribución normal. La distribución

χ

_n2 converge a una distribución

N

(

n

,

2 n

)

. La aproximación es buena cuando

n

≥

30

.

(

n

)

N

n

,

2

_→

χ

Si tenemos una muestra aleatoria procedente de una pobla-ción que sigue una distribupobla-ción normal, podemos hacer infe-rencia sobre la varianza muestral

σ

2 utilizando

S

₁2 y la distri-bución chi-cuadrado.

Las inferencias basadas en varianzas muestrales no son ro-bustas respecto al supuesto de la normalidad. Si sólo se dis-pone de un número moderado de observaciones muestrales, la existencia de serias desviaciones con respecto a la normali-dad en la población de la que procede la muestra puede inva-lidar gravemente las conclusiones del análisis.

(42)

Gráfico con distribuciones

χ

2 con diferentes grados de liber-tad.

(43)

7. Distribuciones en el muestreo en una

población normal

• Si la distribución poblacional es normal con varianza igual a

σ

2, entonces la variable aleatoria

(

)

(

)

2 1 2 2 2 1

1 σ

σ

∑

−

=

−

₌ n i

X

i

X

S

n

Se distribuye como una

χ

_n2₋₁.

Esta distribución es útil para realizar constrastes sobre la varianza de una población normal.

• Si la distribución poblacional es normal con media igual a

µ

, entonces la variable aleatoria

n

S

X

1

µ

−

Se distribuye como una

t

_n₋₁.

Esta distribución es útil para realizar estudios sobre la media en una población normal con varianza desconocida. Si en vez de utilizar las cuasivarianzas muestrales utilizára-mos las varianzas muestrales:

2 1 2 2

~

_n₋

nS

χ

σ

~

−1

−

n

t

S

X

µ

(44)

Distribución t de Student con n grados de

liber-tad

Sean

X

,

X

₁

,

X

₂

,

K

,

X

_n,

(

n

+

1 )

variables aleatorias inde-pendientes con distribución

N(0,1). Se define la distribución

t con n grados de libertad como

n

X

t

n n ₂ ₂ 2 2 1

+

=

L

o bien, es el cociente entre una N(0,1) y una

n

2

χ

indepen-dientes.

(45)

t

está tabulada

( )

₂

0 −

=

n

t

Var

t

E

• El cuartil

t

_α _/₂ es el valor de la

t

de Student tal que:

(

t

>

t

_α _/₂

)

=

α

/

2 P

_n

t

no depende de la varianza de las varia-bles que la integran.

• Convergencia a la distribución normal: La distribución

t

converge a una distribución

N(0,1)

. La aproximación es buena cuando

n

≥

30

.

α/2

1 −α

α/2

(46)

Teorema central del límite (teorema del límite

central)

El teorema central del límite establece que, para muestras aleatorias grandes, la forma de la distribución muestral de medias se aproxima a una distribución de probabilidad nor-mal. La aproximación es más precisa para muestras de gran tamaño que para muestras pequeñas.

Se puede razonar acerca de la distribución muestral de me-dias sin ninguna información sobre la forma de la distribución de la población de la que se toma la muestra. El teorema cen-tral del límite es verdadero para todas las distribuciones.

Teorema central del límite: Si todas las muestras de un tamaño en particular se seleccionan de cualquier población, la distribución muestral de medias se aproxima a una distribu-ción normal. Esta aproximadistribu-ción mejora con muestras más grandes.

Si la población sigue una distribución de probabilidad normal, entonces para cualquier tamaño de muestra la distribución muestral de medias también será normal. Si la distribución de la población es simétrica (pero no normal), surge la forma normal de la distribución muestral de medias con muestras pequeñas (por ejemplo, 10). Si se empieza con una distribu-ción con sesgo, o que tiene colas o extremos gruesos, es po-sible que se requiera muestras de 30 o más para observar la característica de normalidad.

En general, una muestra de 30 o más es lo suficientemente grande para utilizar el teorema central del límite.

(47)

La distribución de muestreo seguirá una distribución normal en dos condiciones:

1. Cuando las muestras se toman de poblaciones que se sa-be siguen la distribución normal. En este caso el tamaño de la muestra no es un factor.

2. Cuando no se conoce la forma de la distribución de pobla-ción o se sabe que es anormal, pero la muestra contiene por lo menos 30 observaciones.

(48)

8. Distribución de la proporción muestral

Sea

X el número de éxitos en una muestra binomial de n

va-riables cuyo parámetro es p. El parámetro es la proporción de miembros de la población que tienen una característica de in-terés (proporción de consumidores, proporción de votantes a un determinado partido político,…).

Dado que

X

~

b

(

n

,

p

)

:

( )

X

n

p

(

p

)

Var

p

n

X

E

−

=

1

·

La proporción muestral es

n

X

P

₌

X es la suma de un conjunto de n variables aleatorias de

Ber-noulli independientes, cada una de las cuales tiene una proba-bilidad de éxito

p. Por lo tanto,

P es la media de un conjunto

de variables aleatorias independientes.

Puede utilizarse el teorema central del límite para sostener que la distribución de probabilidad de

P puede considerarse

una variable aleatoria que sigue una distribución normal.

Sea

P la proporción muestral de éxitos en una muestra

alea-toria extraída de una población en la que la proporción de éxi-tos es p. En este caso

P

en el muestreo tiene media

p

.

( )

P

p

(49)

P

en el muestreo tiene una desviación típica

(

)

n

p

P

=

−

1 σ

Si N es pequeña y es muestreo sin reemplazamiento:

(

)

n

p

N

n

N

P

−

=

·

1

1 σ

3. Si el tamaño de la muestra es grande, la variable aleato-ria P

p

P

Z

σ

−

=

está distribuida aproximadamente como una normal es-tándar. Esta aproximación es buena si

(

1 ₋

p

)

_>

9 np

El error típico de la proporción muestral,

P

, disminuye a me-dida que aumenta el tamaño de la muestra y la distribución está más concentrada. Este resultado es de esperar, ya que la proporción muestral es una media muestral. Cuando el tama-ño de muestra es mayor, las inferencias sobre la proporción poblacional mejoran.

(50)

(51)

9. Variables muestrales para estudios

com-parativos

1. Diferencia de medidas 2. Cociente de varianzas 3. Diferencia de proporciones

Diferencia de medias

Esta distribución es útil para estudiar si dos poblaciones o grupos son diferentes en su comportamiento medio. Por ejemplo, para estudiar si existen diferencias significativas en-tre el gasto medio en un producto en dos regiones.

Tenemos dos muestras independientes:

Población

X

~

N

(

µ ,

_X

σ

_X

)

muestra de tamaño

n

_X Población

Y

~

N

(

µ ,

_Y

σ

_Y

)

muestra de tamaño

n

_Y

Si se trata de dos poblaciones normales de varianzas co-nocidas. Entonces:

(

)

_~

_{( )}

₀

_,

₁

2 2

N

n

Y

X

Y Y X X Y X

σ

µ

+

−

(52)

Si se trata de dos poblaciones normales de varianzas desconocidas pero iguales.

σ

X

=

Y

=

Entonces:

(

)

(

)

(

)

₂ 2 1 2 1

~

2

1

·

1

+ −

−

+

−

+

−

+

−

Y X n n Y X Y Y X X y X Y X

t

n

S

n

S

n

Y

X

_µ

Cociente de varianzas

Esta distribución es útil para realizar estudios comparativos sobre la dispersión o heterogeneidad de dos poblaciones nor-males.

Población

X

~

N

(

µ ,

_X

σ

_X

)

muestra de tamaño

n

_X Población

Y

~

N

(

µ ,

_Y

σ

_Y

)

muestra de tamaño

n

_Y Entonces: 1 , 1 2 2 1 2 2 1 2 2 1 2 2 1

~

·

− −

=

_n_X _n_Y X Y Y X Y Y X X

F

S

σ

(53)

Diferencia de proporciones

Esta distribución es útil para estudiar si en dos poblaciones o grupos existe la misma proporción de una característica. Por ejemplo, para estudiar si la proporción de consumidores o de votantes a un partido es la misma en dos regiones o en dos categorías de edad.

Población

1 ~

b

(

1 ,

p

₁

)

muestra de tamaño

n

₁ Población

2 ~

b

(

1 ,

p

₂

)

muestra de tamaño

n

₂ Las proporciones muestrales serán:

1 1 1

_n

X

P

=

2 2 2

_n

X

P

=

Si

n

₁

>

30

y

n

₂

>

30

, entonces:

(

)

(

)









₋

+

−

2 2 2 1 1 1 2 1 2 1

1

1 ,

~

n

p

n

p

N

P

(54)

Distribución F de Snedecor con

n

1

y

n

2

grados

de libertad

Sea

X

una variable aleatoria con distribución 2

1

n

χ

e

Y

una va-riable aleatoria con distribución 2

2

n

χ

. Si

X e

Y son

indepen-dientes, la variable aleatoria

1 2 2 1

·

· n

Y

n

X

n

Y

n

X

=

tiene distribución

F

central con

n

₁ grados de libertad en el numerador y

n

₂ en el denominador.

Es el cociente entre distribuciones

χ

2 independientes dividi-das entre sus respectivos grados de libertad.

F

está tabulada

( )

₂

2 2

−

=

n

F

E

cuando

n

₂

>

2 ( )

₍

(

_{) (}

)

₎

4

2

2 2 2 1 2 1 2 2

−

+

=

n

F

Var

cuando

n

₂

>

4

• Si 2 1,

~

F

_n _n

X

, entonces 1 2,

~

1

n n

F

X

•

F

=

t

2

(55)

• El cuartil _, _,_α

2 1 n

n

F

es el valor de la F de Snedecor tal que:

(

F

>

F

_n₁_,_n₂_,_α

)

=

α

P

A continuación se presentan una serie de distribuciones

F

de Snedecor con diferentes grados de libertad.