Paso 5: Enfoques para la colecta de datos
7.3. Métodos de muestreo
En la evaluación de programas se utilizan muy diversos tipos de muestreo.
Un análisis detallado de cada uno de ellos rebasa con mucho los objetivos de este manual. Por lo tanto, nos limitaremos a presentar algunas características de los métodos más comunes. Los lectores interesados podrán consultar libros especializados sobre el tema, tales como Cochran (1977) y Hoyle (1999).
7.3.1. Muestreo simple al azar
En este caso todos y cada uno de los individuos de la población tienen la misma e independiente probabilidad de ser seleccionado como miembro de la muestra. Este muestreo se utiliza frecuentemente para estimar la media de una variable con distribución normal. La fórmula para obtener el tamaño de muestra es la siguiente:
2 2 2
2 2
) 1
(N d Z CV
CV Z n N
donde:
n = Tamaño de muestra.
N = Tamaño de la población.
d = Precisión (expresada en porcentaje).
Z = Valor de la distribución “z” para una confiabilidad dada (para poblaciones menores a 100 se debe usar el valor de la distribución “t”). Si la confiabilidad es de 95%, Z = 1.96.
CV = Coeficiente de variación de la variable sobre la que se establece la precisión y la confiabilidad.
Observe que para obtener el tamaño de muestra se requiere el tamaño de la población, si bien este no es un dato difícil de estimar para poblaciones pequeñas, si la población es muy grande, se puede asumir como infinita, teniéndose entonces que el tamaño de muestra se calcula de la siguiente manera:
2 2 2
d CV n Z
El dato que sí es imprescindible conocer en cualquier caso es el valor del coeficiente de variación poblacional o de un estimador del mismo para la variable sobre la que se establece la precisión y la confiabilidad.
A continuación se presenta un ejemplo para una precisión de 10% y una confiabilidad de 95% de los tamaños de muestra que se obtendrían para diferentes coeficientes de variación y diferentes tamaños de población en un muestreo simple aleatorio.
Note cómo el tamaño de muestra depende fundamentalmente de la variabilidad de la población y no del tamaño de la misma.
Coeficiente de variación
TAMAÑO DE POBLACIÓN
50 100 200 500 1,000 2,000 10,000
10% 4 4 4 4 4 4 4 4
20% 12 13 14 15 15 15 15 15
30% 20 26 29 32 33 34 34 34
50% 33 49 65 81 88 92 95 96
70% 40 65 97 137 158 172 185 188
100% 44 79 132 217 278 322 370 384
200% 48 94 177 377 606 869 1,332 1,537
300% 49 97 189 437 776 1,267 2,569 3,457
Para mostrar cómo la precisión deseada afecta el tamaño de muestra, a continuación se presenta un cuadro similar al primero, pero para una precisión del 5%, donde se puede observar que los tamaños de muestra son notablemente mayores. Por lo tanto, la precisión deseada es otro factor determinante para establecer el costo del muestreo ya que afecta considerablemente el tamaño de muestra.
Coeficiente de variación
TAMAÑO DE POBLACIÓN
50 100 200 500 1,000 2,000 10,000
10% 12 13 14 15 15 15 15 15
20% 28 38 47 55 58 60 61 61
30% 37 58 82 109 122 129 136 138
50% 44 80 132 217 278 322 370 384
70% 47 88 158 301 430 547 700 753
100% 48 94 177 377 606 869 1,332 1,537
200% 50 98 194 462 860 1,509 3,807 6,147
300% 50 99 197 483 933 1,747 5,804 13,830 El muestreo simple aleatorio también puede ser utilizado para estimar la proporción con que se presenta una determinada variable cualitativa en una población (por ejemplo, el porcentaje de mujeres beneficiadas). En este caso, se suele asumir que la proporción a estimar tiene un valor real de 0.5, ya que es este valor el que ofrece la varianza máxima en una distribución binomial. La fórmula para obtener el tamaño de muestra en un muestreo simple aleatorio para estimación de proporciones asumiendo varianza máxima es la siguiente:
2 2
2
* 25 . 0 )
1 (
* 25 . 0
Z D
N
Z n N
donde:
n = Tamaño de muestra.
N = Tamaño de la población.
D = Precisión absoluta (desviación absoluta máxima deseada).
Z = Valor de la distribución “z” para una confiabilidad dada (para poblaciones menores a 100 se debe usar el valor de la distribución “t”). Si la confiabilidad es de 95%, Z = 1.96.
Observe que para obtener el tamaño de muestra se requiere el tamaño de la población, si bien este no es un dato difícil de estimar para poblaciones pequeñas, si la población es muy grande, se puede asumir como infinita, teniéndose entonces que el tamaño de muestra se calcula de la siguiente manera:
2
* 2
25 . 0
D n Z
Note que en este caso no es necesario conocer la variabilidad de la población o un estimador de la misma, ya que se está asumiendo máxima varianza para la variable cualitativa bajo estudio. Es por ello que este tipo de muestreo es muy utilizado cuando no se cuenta con estimaciones de la varianza poblacional.
A continuación se presenta un ejemplo para una confiabilidad de 95%
de los tamaños de muestra que se obtendrían con diferentes niveles de precisión y diferentes tamaños de población en un muestreo simple aleatorio para la estimación de proporciones asumiendo varianza máxima.
Precisión absoluta
TAMAÑO DE POBLACIÓN
50 100 200 500 1,000 2,000 3,000 10,000
0.10 34 50 66 81 88 92 93 95 96
0.09 36 55 76 97 106 112 114 117 119
0.08 38 61 87 117 131 140 143 148 150
0.07 40 67 100 142 164 179 184 192 196
0.06 43 74 116 175 211 235 245 260 267
0.05 45 80 133 219 278 322 341 370 384
7.3.2. Muestreo estratificado
Consiste en agrupar a las unidades muestrales por grupos llamados estratos donde las unidades sean relativamente homogéneas al interior de ellos pero muy variables entre ellos. De esta forma, la suma de la varianza
muestrear al interior de los estratos y sumar cada uno de estas submuestras se tendrá generalmente un tamaño menor al del muestreo simple aleatorio.
La fórmula para calcular el tamaño de muestra es la siguiente.
n
NZ S pN d Z S p
2 2
2 2 2
donde:
n = Tamaño de muestra.
N = Tamaño de la población.
D = Precisión absoluta (desviación absoluta máxima deseada).
Z = Valor de la distribución “z” para una confiabilidad dada (para poblaciones menores a 100 se debe usar el valor de la distribución “t”). Si la confiabilidad es de 95%, Z = 1.96.
S²p = Varianza ponderada de la población.
= Media de la variable de interés.
d = Precisión = 0.10 ó 10%.
S PSi i
i k
2 2
1
Donde:
K = Total de estratos.
Si2 = Varianza del i–ésimo estrato.
Pi = Participación porcentual del estrato i–ésimo en la población.
Este tamaño de muestra puede distribuirse entre los diferentes estratos de muy diferentes maneras. Sin embargo, por ser la manera bajo la cual no se requiere información adicional, la mayoría de las veces el tamaño de muestra se distribuye proporcionalmente a la participación de cada estrato en la población total.
Note que para poder aplicar este diseño de muestreo se requiere tener un marco de muestreo preciso y una variable que refleje la variabilidad de la población. Cuando este es el caso, este diseño de muestreo es muy eficiente si la estratificación se hace correctamente. Un ejemplo de este diseño de muestra se encuentra en el Anexo 9.
7.3.3. Muestreo por conglomerados
En este caso, la unidad a muestrear no es el individuo sino que un grupo naturalmente conformado de individuos como un aula, organización o comunidad. Posteriormente, los individuos son seleccionados por submuestreo al interior de cada uno de los grupos. Este muestreo se recomienda cuando se cuenta con una marco de muestreo confiable para los grupos pero no para los individuos.