• No se han encontrado resultados

Establecer criterios de fiabilidad (p ej., precisión),

PRINCIPIOS BÁSICOS PARA EL DISEÑO DE ESTUDIOS Y SU ANÁLISIS

3. Establecer criterios de fiabilidad (p ej., precisión),

4. Identificación de las limitaciones prácticas del estudio, tales como el costo, la limitación de personal y la seguridad.

Por ejemplo, un estudio mal definido podría ser “cuantificar la abundancia de tigres (Panthera tigris) en la India”. Un estudio mejor definido sería “obtener un valor estimado no sesgado de la densidad de tigres en la Reserva de Tigres de Corbett (Figura 5.4a) durante el mes

de julio de 2005, con un coeficiente de variación menor del 25% y con un coste menor de 5.000 dólares”. La primera afirmación deja una gran cantidad de detalles a la discreción del biólogo de campo, sobre lo que está siendo medido (¿abundancia, densidad o presencia?), dónde (¿por toda la India?), cuando (¿todo el año? ¿ hoy?) y cuáles son los criterios del éxito. La segunda

afirmación no deja dudas en cuanto a ninguna de estas cuestiones, pero todavía se olvida de definir el porqué del interés e importancia de tener un valor estimado de la densidad. Queremos sugerir y enfatizar que especificar porqué se necesita un valor estimado concreto, tiene que ser en ella misma parte fundamental de la pregunta científica o de manejo que se plantea. Si todo esto se cumple, ahora sí que tenemos un excelente punto de inicio para desarrollar un diseño riguroso. Es obvio que la primera frase que planteamos resume el punto de interés del estudio, ya que en general, saber la abundancia de tigres en la India, con un cierto nivel de confianza, es importante, y en definitiva, es el tipo de respuesta que los políticos y el público quieren saber. Sin embargo, y de aquí nuestro énfasis, la clave es remodelar esta frase e idea de forma que podamos

“defender” las afirmaciones que podríamos querer hacer sobre los tigres en la India. Aún mejor, con todo ello hemos definido claramente nuestro objetivo científico y de gestión, y el valor stimado de la densidad de tigres es el primer paso para ayudarnos a alcanzar ese objetivo.

Poblaciones objeto del estudio, poblaciones muestreadas

A menos que una población y otro sistema de interés se muestra exhaustivamente y/o por completo, las conclusiones (inferencias) sobre la población deben basarse en subconjunto

muestreado. La forma en que se tome la muestra es crítica para la validez de estas deducciones. Nos referimos a la población de la cual estamos haciendo deducciones como población objetivo. En el ejemplo anterior, la población objetivo fue “los tigres de la Reserva de Corbett en julio del 2005”. De esta forma el muestreo puede diseñarse para que cumpla con los objetivos del estudio,

asegurándose de que las muestras representan efectivamente a dicha población “objetivo”. Un desajuste entre las poblaciones “objetivo” y las “muestreadas” es muy común y constituye un serio problema en la conservación, teniendo como resultado que los datos que se recogen no son aplicables a la población en la que estamos interesados. La Figura 5.4b ilustra una situación en que la parte muestreada de la población se ajusta estrechamente a la población objetivo (en este caso, la Reserva de Tigres de Corbett, RTC). Por el contrario, en la Figura 5.4c sólo se muestrea la parte sudoriental de la RTC. Está claro que sería muy arriesgado basar nuestras deducciones sobre toda la RTC a partir de muestras de sólo esa porción, que podrían no ser representativas de la RTC como un todo. Desde luego, podría ser que no se pudiera muestrear toda la RTC, dado los costes y los impedimentos logísticos. De hecho, gran parte de la RTC es inaccesible por carretera. Una carretera atraviesa gran parte de la porción oriental de la reserva (Figura 5.4d), y podría utilizarse para acceder a puntos de muestreo que estarían localizados dentro de una distancia específica de la carretera. No obstante, sería necesario tener en cuenta estas restricciones al extender la inferencia a la población objetivo, que debería ser redefinida de forma que se acoplase a la población muestra. Los investigadores también deberían considerar los efectos de la carretera en sí misma, tanto porque potencialmente altera la conducta de los tigres, los hace más detectables, o ambas cosas a la vez.

Replicación y aleatorización

Una vez que las poblaciones objetivo y muestreada se han definido apropiadamente, deben delinearse las unidades de muestreo, y diseñarse un método para el muestreo. A menudo las unidades de muestreo son unidades espaciales (p. ej. parcelas, segmentos de líneas, u otras divisiones espaciales) cuyo número es finito y conocido o determinable (p. ej. 1000 parcelas cuadradas de 1 ha en un área de estudio de 1000 ha). A veces las unidades de muestreo son los

animales mismos, en cuyo caso el número de unidades no se conoce con antelación. El muestreo debe replicarse para asegurarnos que nuestra muestra se extiende por toda la población muestra, y no representa condiciones en sólo puntos aislados. El objetivo del estudio es poder ser capaces de aplicar lo que hemos aprendido de la zona muestreada, a aquellos lugares que no

muestreamos. La mayoría de modelos estadísticos también asumen que los datos de la muestra se recogen según un esquema de aleatorización, en el cual una submuestra de unidades se extrae al azar de la lista total de la población muestreada. Un diseño de muestreo es un método para asegurar que se da la replicación y aleatorización adecuadas de las muestras, de forma que los datos resultantes puedan utilizarse de forma válida para los parámetros estimados. Más abajo trataremos de dos temas estrechamente relacionados. (i) la fiabilidad de los valores estimados de parámetros basadas en muestras, y (ii) los diseños de muestreo para asegurar que los datos de la muestra sean adecuados para la estimación de parámetros.

Fiabilidad del valor estimado

Los valores estimados de los parámetros tales como la abundancia, la densidad, la supervivencia, etc. se calculan a partir de los datos tomados de la muestra. Las muestras se seleccionan de acuerdo con un proceso de aleatorización , y por lo tanto la recolección de

valores de la muestra, y cualquier cálculo que utilice dichos valores, son también acontecimientos al azar. Dado que los datos muestrales se utilizan para calcular valores

estimados de los parámetros, los valores de dichas valores estimados son también resultados al azar: si hubiéramos de repetir el muestreo y calcular otro valor estimado, es casi seguro que obtendríamos un valor distinto. Es más, dicho valor podría o no podría estar próximo al valor paramétrico verdadero.

Según hasta qué punto los valores estimados de los parámetros se hallen, en promedio, cerca del valor paramétrico verdadero, se puede decir que son no sesgadas. Por otra parte, según hasta que punto estén los valores estimados de las muestras cercanas unas de otras, se dice que tienen una varianza baja (y por lo tanto, son altamente repetibles). Según hasta qué punto los valores estimados de las muestras tiendan a estar en promedio próximas al valor verdadero del parámetro (no sesgadas), y cerca unas de otras (repetibles), se dice que son exactas

Las relaciones del muestreo con el sesgo, la varianza y la exactitud pueden asemejarse a la analogía de la probabilidad de acertar al dispararle a una diana (Fig. 5.5), en la que el “ojo de buey” representa el valor verdadero para el parámetro (). Los valores estimados de la muestra generalmente variarán de una muestra a otra, pero idealmente, en promedio estarán cerca del valor del parámetro verdadero (Fig. 5.5a, 5.5c). En ambos casos, el procedimiento de estimación no estará sesgado. No obstante, en la Figura 5.5a los valores estimados están más cerca unas de otras (y el valor del parámetro verdadero ), mientras que en la Figura 5.5c los valores estimados tienen una varianza alta, y cualquier individual puede estar bastante lejos del parámetro

verdadero. Por el contrario, en la Figura 5.5b, la varianza es bastante baja y los valores estimados son muy repetibles, pero en promedio están lejos del parámetro verdadero. Finalmente, en la Figura 5.5d, los valores estimados son altamente variables y sesgadas.

Generalmente tendremos una única muestra a partir de la cual estimar nuestro parámetro, y es importante que este estimado tenga una alta probabilidad de estar cercana al valor verdadero del parámetro, que desde luego será desconocido. Podemos incrementar la repetibilidad de nuestros valores estimados mediante nuestro diseño de muestro, principalmente incrementando el número de muestras tomadas, pero también mediante estratificación y otros métodos. El sesgo se suele controlar cumpliendo los supuestos del modelo estadístico utilizado para estimar el

parámetro, y utilizando el modelo correcto, junto con datos que se han recogido adecuadamente según un diseño de muestreo apropiado. Dos formas comunes por las cuales los valores

estimados pueden ser sesgadas son (i) utilizar un diseño de muestreo inapropiado, y (ii) No tener en cuenta los sesgos sistemáticos en nuestros datos de la muestra, tales como una detección incompleta de los animales. Pronto veremos más abajo cómo ambos problemas pueden evitarse, mediante un diseño de muestreo apropiado, una correcta toma de datos de campo, y un uso de modelos estadísticos apropiados. Un punto final a observar a partir de la Figura 5.5 es que los ecólogos cuantitativos sugerirían que en este caso el peor escenario sería la Figura 5.5b, que superficialmente podría parecer que va en contra de la intuición. No obstante, argumentarían que los valores estimados muy repetibles y sesgadas implican que tenemos mejores datos de los que en realidad tenemos, lo que posiblemente llevaría al investigador a confiar mucho en una respuesta que de hecho es errónea. Cuando les preguntamos a nuestros estudiantes cual de entre estos casos es el peor, la mayoría contestan ingenuamente que es el “d”. Sin embargo, cuando les explicamos nuestros razonamientos les sugerimos que al menos en la Figura 5.5d sabemos que tenemos unos malos datos.

Diseños de muestreo estándar

Volviendo a nuestro ejemplo de la RTC, una muestra única y no replicable (Figura 5.6a) sería de poca utilidad para realizar inferencias, independientemente de cómo ésta sea

seleccionada. Igualmente, las muestras replicadas que no se seleccionan al azar, forzosamente pueden ser no representativas de la población objetivo, produciendo valores estimados sesgadas (Figura 5.6b). La mayoría de planificaciones y esquemas de muestreo combinan la replicación

con la aleatorización. Aquí describimos los diseños de muestreo más importantes: el muestreo al azar simple y el muestreo al azar estratificado.

Muestreo al azar simple

En el muestreo al azar simple, las unidades de muestreo se eligen al azar a partir de la población de muestra entera, con la misma probabilidad. Esto se consigue en primer lugar numerando todas las N unidades de muestreo potenciales, y luego eligiendo al azar n unidades, cada una con la misma probabilidad n/N de ser elegida. Por ejemplo, supongamos que estamos muestreando un estudio de 10.000 ha utilizando áreas de muestreo de 10 ha, y decidimos muestrear n = 100 de estas áreas. Potencialmente, existen 1.000 de dichas áreas que podrían ser muestreadas, cada una con una probabilidad de 100/1.000 = 0.1 de ser elegida. Un método simple de seleccionar dichas áreas a muestrear sería reseguir la lista de las áreas y seleccionar un número uniforme al azar entre 0 y 1; si este número es menor o igual a 0.1, seleccionaríamos el área, si no pasaríamos a la siguiente, hasta que se hubieran seleccionado 100. Otra forma sería ordenar al azar las 1.000 áreas, y luego seleccionar las 100 primeras. Cualquiera de las dos formas debería producir una distribución espacial de las áreas de muestra al azar (Fig. 5.6c), es decir, aparecería dispersada por toda el área de muestra sin ningún patrón obvio (en contraste con la Fig. 5.6b).

Muestreo al azar estratificado

Frecuentemente, la población que debe ser muestreada es heterogénea, pero se pueden identificaras regiones o estratos que son relativamente homogéneos. Por ejemplo, los tipos de cubierta forestal pueden ser mapados con anticipación utilizando fotografías aéreas u otras técnicas. Las muestras al azar se asignan entonces a cada uno de los estratos, como por ejemplo

en el caso de la RTC (fig. 5.6d). El muestreo al azar estratificado puede proporcionar unas mejores valores estimados de los parámetros poblacionales de interés, “absorbiendo” una parte de la variabilidad entre las unidades de muestreo de los estratos. Esta mejora se da cuando los estratos son responsables de una cantidad significativa de variación entre las unidades

muestreadas; de otro modo, no existe mejora alguna con respecto al muestreo al azar simple. Una idea que surge con el muestreo estratificado es cómo asignar la muestra entre los estratos.

Volveremos a esta idea cuando discutamos la determinación del tamaño de la muestra en las secciones siguientes.

Muestreo sistemático

En el muestreo sistemático, las unidades de muestreo se seleccionan según algún esquema ordenado regular, generalmente después de que la primera muestra haya sido

seleccionada al azar. Por ejemplo, en vez del muestreo al azar simple de la RTC (Fig. 5.6c), la primera área podría elegirse al azar, seguida de cada quinta área posterior (Fig. 5.6e). El muestreo sistemático generalmente tiene la ventaja de ser más fácil de emplear en el campo, debido a que las unidades de muestreo típicamente están a intervalos regulares en la distancia o el tiempo. El muestreo sistemático es equivalente al muestreo al azar cuando el atributo que está siendo muestreado está distribuido al azar por toda la población de muestreo. De otro modo, los gradientes u otros patrones causarán que los datos estén auto-correlacionados espacialmente. Los biólogos de campo a menudo “mienten” utilizando este tipo de muestreo debido a que en teoría puede proporcionar resultados equivalentes a los del muestreo al azar. Sin embargo, sabemos que en ecología la regla, más que la excepción, es el no azar, por lo que en general el muestreo al azar debería preferirse al muestreo sistemático.

A menudo los atributos ecológicos en los que estamos interesados son muy difíciles o caros de medir con exactitud, pero existen otros atributos correlacionados que son más baratos o fáciles de medir. Por ejemplo, si estamos interesados en estimar el volumen ocupado por un bosque, podemos hacerlo con mucha precisión mediante áreas de muestra, midiendo en cada una de ellas el diámetro y la altura de cada árbol. Un valor estimado del volumen mucho menos cara (pero menos precisa) podría ser estimarlo de una fotografía aérea. Igualmente, los conteos precisos de los patos que nidifican son posibles por medio de la observación directa de los patos nidificantes en el suelo, pero es mucho más barato (aunque también menos preciso) contar los patos desde una avioneta. En ambos casos, un atributo primario de interés (Y) es predecible a partir de una medición auxiliar (X). En el muestreo doble, aprovechamos estas características, mediante una muestra solapada en la cual X se mide en todas las unidades de muestreo n, e Y también se mide en una subserie (n/ n) de unidades. La unidades solapadas /

n en las cuales se toman las observaciones X,Y son entonces usadas para construir un modelos estadístico para predecir Y a partir de X; a menudo se trata de un modelo lineal simple o aun más simple un modelo de razón. Además de ser una solución eficaz cuando los recursos son limitados, el muestreo doble puede solucionar directamente el problema de una detección incompleta, cuando

Y y X son, respectivamente, un valor estimado no sesgado y sesgado de la abundancia u otro

atributo (Fig. 5.6f).

Determinación del tamaño de muestra preciso

Muestreo simple al azar

El tamaño de muestra preciso dependerá de la precisión requerida de los valores estimados de los parámetros. Ello a su vez depende de los objetivos del estudio. Los valores estimados precisas permitirán, bajo unos diseños de estudio apropiados, la detección de

importantes diferencias espaciales y temporales. A la inversa, los valores estimados que son muy imprecisas permitirán únicamente deducciones descriptivas y de lo más toscas sobre los

parámetros, e incluso éstas estarán sujetas a una gran incertidumbre debido a los amplios

intervalos de confianza. El cálculo del tamaño de la muestra dependerá del método particular que se esté usando para el valor estimado, y por lo tanto se tratará de ello en los capítulos

individuales dedicados a cada uno de los temas en particular. A menudo el tamaño de la muestra (n) se expresará como función de la varianza o coeficiente de variación (CV= DE / x ), con n incrementándose al disminuir la DE o el CV. Una típica relación entre la precisión y el tamaño de la muestra viene dado por el valor estimado de la media de una variable continua (Fig. 5.7). Un aumento rápido de la precisión se consigue pasando de n = 1 o 2, a una n de alrededor de 30 (el

CV disminuye de 1 a menos de 0.2). No obstante, un muestreo adicional que llegue hasta n = 100

no reduce el CV hasta 0.1. Una precisión adicional más allá de un CV = 0.1 requeriría otras aproximaciones, por ejemplo la estratificación, dada la variabilidad subyacente en la población muestreada. Por supuesto, téngase en cuenta que este es solo un mero ejemplo de las relaciones entre la precisión y el tamaño de la muestra.

Las directrices específicas sobre el tamaño de la muestra a menudo dependerán de los datos de campo reales recogidos y del modelo estadístico utilizado, y por lo tanto se discutirán en los capítulos dedicados a la estimación de parámetros (Parte II). No obstante, aquí

proporcionaremos algunas aproximaciones básicas para la estimación del tamaño de la muestra preciso para estimar la media μ con un nivel dado de precisión, basado en un muestreo simple al azar. Más formalmente, deseamos asegurar que la media estimada se halle dentro de una fracción

r de la media real, con una confianza (1-α). Si asumimos que la media de la muestra y está distribuida aproximadamente de forma normal, podremos utilizar la fórmula:

2 2 /        CV r z n  (5.1)

donde r es la precisión deseada (como proporción de la media verdadera), C ˆ es un valor V

estimado del coeficiente de variación de la población (σ/ μ), a menudo obtenido a partir de un estudio piloto, y z/2 es generalmente el punto α superior de la distribución normal estándar. Si

estamos muestreando sin reemplazar en una población finita (como sería generalmente el caso en un muestreo en un punto de muestreo), entonces se precisará un ajuste para el muestreo finito:

) / 1 ( ' N n n n   (5.2)

donde n se obtiene de la primera expresión y N es el número de unidades en la población muestreada.

Muestreo estratificado al azar

Tal como hemos visto anteriormente, el muestreo estratificado puede significar una mejora sobre el muestreo simple al azar, debido a que una parte de la variabilidad que de otro modo formaría parte del error en el valor estimado de la media, es absorbida por los estratos del censo. Del mismo modo como sucede con el muestreo simple al azar, el tamaño total de la muestra que precisamos, puede aproximarse mediante un estudio piloto. El punto clave entonces es decidir cómo vamos a asignar las distintas muestras a los distintos estratos. . Las dos

aproximaciones básicas son la asignación proporcional y la óptima. En el caso de la asignación proporcional, la muestra se asigna a los estratos basándose en su tamaño, que viene determinado por el número de unidades de muestreo disponibles (NBiB) o, lo que es equivalente, al área total por

estrato i. Así, la fórmula para la asignación proporcional es:

N N n

donde n es el tamaño total de la muestra y nBi es el tamaño de la muestra para el estrato i, siendo i

= 1….., I estratos. La asignación óptima también tiene en cuenta las diferencias entre los estratos en la variabilidad y el coste del muestreo

m m m I m i i i i C N C N n n / / 1  

  (5.4)

donde i es la desviación estándar específica del estrato y Ci es el costo del muestreo específico

de estrato.

Comparación del tiempo y el espacio (monitorización)

En el estudio de la conservación, en muchos casos estamos interesados no sólo en los