MUESTREO
POR
CONGLOMERADOS
UNIVERSIDAD TECNOLÓGICA DE PEREIRA FACULTAD DE INGENIERIA INDUSTRIAL Estadística III-Material 2-2012
Revisión, Cambios y Ampliación: Ing. José Alejandro Marín Fuente Primaria: Ing. César Augusto Zapata Urquijo
DEFINICIÓN
El muestreo por conglomerados es una muestra aleatoria en la que cada unidad de muestreo es un conjunto o conglomerado de elementos. Y se usa cuando el costo de conseguir una observación se incrementa con la distancia que separa los elementos.
DEFINICIÓN
• Tanto en el muestreo aleatorio, así como en el muestreo estratificado, sistemático y métodos indirectos de estimación, las unidades de muestreo son las mismas que las unidades objeto de estudio (unidades simples), pero en la práctica existen situaciones más generales en las que las unidades de muestreo comprenden dos o más unidades de estudio.
• En tal caso a las unidades de muestreo se las denomina unidades primarias o compuestas.
DEFINICIÓN
• Se busca dividir previamente al muestreo, la
población en conglomerados o áreas
convenientes, de las cuales se selecciona un cierto número para la muestra. Por lo tanto, sólo es necesario un marco de conglomerados que será más fácil de obtener y más barato. Es posible usar como marco, divisiones territoriales ya establecidas de las cuales ya existe información o áreas geográficas ya delimitadas. Está claro que se ahorra coste y tiempo al efectuar visitas a las unidades.
CARACTERISTICAS
• En el muestreo por conglomerados no se necesita un marco muy específico como en el caso del MAS en el que era necesario disponer de un listado de unidades de la población, o como en el muestreo estratificado, donde era necesario disponer de listados de unidades por estratos.
• El muestreo por conglomerados proporciona más información por unidad de costo que los demás muestreos. Es decir, permite el ahorro de costos y tiempo al efectuar visitas a las unidades seleccionadas. Igualmente, la concentración de unidades disminuye la necesidad de desplazamientos.
CARACTERISTICAS
• En el muestreo por conglomerados, cuando se toma un tamaño de muestra, la unidad muestral es el conglomerado y se debe encuestar a todos los elementos que se encuentran dentro del conglomerado.
• en el muestreo por conglomerados se suele tener menor precisión en las estimaciones, debido a que, aunque lo ideal es que haya heterogeneidad dentro, siempre va a existir un cierto grado de homogeneidad inevitable dentro de los conglomerados que disminuirá la precisión.
• La eficiencia de este tipo de muestreo disminuye al aumentar el tamaño de los conglomerados, cuando en realidad este tipo de muestreo es más útil en caso de poblaciones muy numerosas en las que se puedan construir conglomerados grandes.
CARACTERISTICAS
• El muestreo por conglomerados es un muestreo aleatorio simple, donde cada unidad
de muestreo contiene un número de
elementos.
• En el muestreo por conglomerados cuando se toma un tamaño de muestra la unidad muestral es el conglomerado y se debe encuestar a todos los elementos que se encuentran dentro del conglomerado.
CARACTERISTICAS
• Los conglomerados pueden ser de igual o de distinto tamaño, y han de ser lo más heterogéneos posible dentro de ellos y lo más homogéneos posible entre ellos, de tal forma que la situación ideal muestra de tamaño uno con mínimo coste.
• Se observa que la situación ahora es la complementaria a la del caso de los estratos estudiados anteriormente.
NOTACIÓN PARA EL
MUESTREO POR
CONGLOMERADOS
Considérese una población finita con M unidades elementales o últimas, agrupadas en N unidades mayores llamadas conglomerados o unidades primarias, de tal forma que no existan solapamientos entre los conglomerados y que éstos contengan en todo caso a la población en estudio. Se considera como unidad de muestreo el conglomerado, y extraemos de la población una muestra de n conglomerados a partir de la cual estimaremos los parámetros poblacionales.
El número de unidades elementales de un conglomerado se denomina tamaño del conglomerado.
NOTACIÓN PARA EL
MUESTREO POR
CONGLOMERADOS
Se supone probabilidades iguales y que todos los conglomerados son del mismo tamaño M, en cuyo caso se usará la siguiente notación.
N=Número de conglomerados en la población.
n=Número de conglomerados seleccionados en la muestra.
𝑀=Número de unidades elementales por conglomerado (tamaño del conglomerado) 𝑁 𝑀=Número total de unidades elementales en la población
𝑛 𝑀= Número total de unidades elementales en la muestra
𝑚𝑖=Número de elementos en el conglomerado.
FORMULAS PARA EL
MUESTREO POR
CONGLOMERADOS.
𝑦 = 𝑖=1 𝑛 𝑦 𝑖 𝑖=1 𝑛 𝑚 𝑖 𝑚 = 𝑖=1 𝑛 𝑚 𝑖 𝑛*Muestreo Unietápico De Conglomerados De Distinto Tamaño DE DISTINTO TAMAÑO
VARIANZA ESTIMADA DE LA MEDIA 𝑉 𝑌 = 𝑁 − 𝑛 𝑁𝑛𝑀2 ∗ 𝑠 2 𝑠2 = 𝑖=1 𝑛 𝑦 𝑖 − 𝑦𝑚𝑖 2 𝑛 − 1
Si no se conoce M se puede estimar por medio de m
EJEMPLO
Se quieren estimar los ingresos medios por persona en una ciudad, para ello se muestrean 25 conglomerados de un total de 415. Use los datos de la siguiente tabla para estimar el ingreso medio poblacional y establezca un límite para el error.
TABLA DE DATOS
Conglomerado # Residentes Ingresos por conglomerado
Conglomerado # Residentes Ingresos por conglomerado 1 8 96000 14 10 49000 2 12 121000 15 9 53000 3 4 42000 16 3 50000 4 5 65000 17 6 32000 5 6 52000 18 5 22000 6 6 40000 19 5 45000 7 7 75000 20 4 37000 8 5 65000 21 6 51000 9 8 45000 22 8 30000 10 3 50000 23 7 39000 11 2 85000 24 3 47000 12 6 43000 25 8 41000 13 5 54000
SOLUCIÓN
𝑦 = 𝑖=1 𝑛 𝑦 𝑖 𝑖=1 𝑛 𝑚 𝑖 = 1329000 151 = 8801,32 𝑚 = 𝑖=1 𝑛 𝑚 𝑖 𝑛 = 151 25 = 6,04VARIANZA ESTIMADA
𝑉 𝑦 = 𝑁 − 𝑛 𝑁𝑛 𝑀2 ∗ 𝑠2 𝑉 𝑦 = 415 − 25 415 ∗ 25 ∗ 6.042 ∗ 251892 𝑉 𝑦 = 653769,23LIMITE PARA EL ERROR
𝑉 𝑦 = 𝑁 − 𝑛 𝑁𝑛 𝑀2 ∗ 𝑠2 𝑙í𝑚𝑖𝑡𝑒 = 2 ∗ 𝑉 𝑦 𝑙í𝑚𝑖𝑡𝑒 = 2 ∗ 808,56 𝑙í𝑚𝑖𝑡𝑒 = 1617,12 𝜇 = 8801,32 ± 1617,12ESTIMADORES PARA EL TOTAL
POBLACIONAL
EJEMPLO
Se quiere estimar el total poblacional de todos los residentes de la ciudad y
calcular un límite para el error
poblacional, si existen en la ciudad 2500 habitantes.
FORMULAS PARA TOTAL
POBLACIONAL
t
𝑀 𝑦 = 𝑀 𝑖=1 𝑛 𝑦 𝑖 𝑖=1 𝑛 𝑚 𝑖 𝑉 𝑀 𝑦 = 𝑀2 𝑉 𝑦 = 𝑀2 𝑁 − 𝑛 𝑁𝑛 𝑀2 ∗ 𝑠2SOLUCIÓN
𝑀 𝑦 = 2500 ∗ 8801,32 𝑀 𝑦 = 22003300
LÍMITE PARA EL ERROR
𝑙í𝑚𝑖𝑡𝑒 = 𝑀 𝑦 ± 2 ∗ 𝑉(𝑀 𝑦) 𝑙í𝑚𝑖𝑡𝑒
= 22003300 ± 2 ∗ 25002 ∗ 653769,23
ESTIMADOR TOTAL CUANDO NO
SE CUENTA CON M
𝑁 𝑦𝑡 = 𝑁 𝑛 𝑖=1 𝑛 𝑦𝑖 𝑉 𝑁 𝑦𝑡 = 𝑁2 𝑉 𝑦𝑡 = 𝑁2 𝑁 − 𝑛 𝑁𝑛 ∗ 𝑠2 𝑠2 = 𝑖=1 𝑛 𝑦 𝑖 − 𝑦𝑡 2 𝑛 − 1EJEMPLO
Se quiere calcular el ingreso total de todos los residentes de la ciudad pero no se conoce M. Establezca un límite para el error y calcule el total poblacional.
VARIANZA ESTIMADA
𝑉 𝑁 𝑦𝑡 = 𝑁2 𝑉 𝑦𝑡 = 𝑁2 𝑁 − 𝑛 𝑁𝑛 ∗ 𝑠2 𝑁 𝑦𝑡 ± 2 ∗ 𝑁2 ∗ 𝑁 − 𝑛 𝑁𝑛 ∗ 𝑠2 = 22061400 ± 3505532TAMAÑO DE MUESTRA
𝑛 = 𝑁𝜎 2 𝑁𝐷 + 𝜎2 𝐷 = 𝐵 2𝑀2 4 𝑠2 = 𝑖=1 𝑛 𝑦 𝑖 − 𝑦𝑚𝑖 2 𝑛 − 1EJEMPLO
Si se quiere estimar m con una diferencia
de 500 cual debe ser el tamaño de muestra.
SOLUCIÓN
𝑛 = 415 ∗ 251892 2280100 + 251892 𝐷 = 𝐵2𝑀2 4 = 5002 ∗ 6.042 4 𝑛 = 166,576 𝑠𝑟 = 25189ESTIMADOR PARA EL
TOTAL
𝑛 = 𝑁𝜎 2 𝑁𝐷 + 𝜎2 𝐷 = 𝐵 2𝑀2 4𝑁2EJEMPLO
Si se quiere estimar t con una diferencia de 1000000 cual debe ser el tamaño de muestra y si sabemos que M=2500
EJEMPLO
Si se quiere estimar t con una diferencia
de 1000000 cual debe ser el tamaño de muestra y si se desconoce M.
MUESTREO POR CONGLOMERADOS
ESTIMACIÓN DE UNA PROPORCIÓN POBLACIONAL
Sirve para estimar una proporción poblacional o fracción. El mejor estimador de la proporción poblacional 𝑝 es la proporción muestral 𝑝.
FORMULA
𝑝 =
𝑎
𝑖𝑚
𝑖Donde 𝑎𝑖 es el número total de elementos en el conglomerado i que poseen la característica de interés.
𝑚𝑖 es el número de elementos en el
VARIANZA ESTIMADA DE P
𝑉 𝑝 = 𝑁 − 𝑛 𝑁𝑛 𝑀2 ∗ 𝑠2 𝑠2 = 𝑖=1 𝑛 𝑎 𝑖 − 𝑝𝑚𝑖 2 𝑛 − 1EJEMPLO
Se pregunta a los residentes de un barrio si la casa que tienen en la actualidad es propia o en arriendo. Los resultados se muestran en la siguiente tabla y se busca estimar la proporción de residentes que viven en alquiler y establecer un límite para el error. La población total de conglomerados es igual a 410
TABLA DE RESULTADOS
Conglomerado Residentes Arrendatarios
1 8 4 2 12 7 3 4 1 4 5 3 5 6 3 6 6 4 7 7 4 8 5 2 9 8 3 10 3 2 11 2 1 12 6 3 13 5 2 14 10 5 15 9 4 16 3 1 17 6 4 18 5 2 19 5 3 20 4 1 21 6 3 22 8 3 23 7 4 24 3 0 25 8 3
VARIANZA ESTIMADA DE Y
𝑉 𝑝 = 𝑁 − 𝑛 𝑁𝑛 𝑀2 ∗ 𝑠2 𝑉 𝑝 = 410 − 25 410 ∗ 25 ∗ 6,042 𝑉 𝑝 = 0,000546LÍMITE PARA EL ERROR
𝑝 ± 2 ∗ 0,00054 0,48 ± 0,0464
SELECCIÓN DEL TAMAÑO DE MUESTRA
𝑛 = 𝑁 ∗ 𝜎 2 𝑁𝐷 + 𝜎2 𝐷 = 𝐵 2 ∗ 𝑀2 4 𝑠2 = 𝑖=1 𝑛 𝑎 𝑖 − 𝑝𝑚𝑖 2 𝑛 − 1EJERCICIO
Del ejemplo anterior se quiere estimar la proporción p de residentes que viven en alquiler. ¿Cuál debe ser el tamaño de muestra para estimar p con un límite de 0,045 en la estimación.