• No se han encontrado resultados

Inferencia estadística sobre poblaciones finitas con muestras intencionales

N/A
N/A
Protected

Academic year: 2021

Share "Inferencia estadística sobre poblaciones finitas con muestras intencionales"

Copied!
37
0
0

Texto completo

(1)

ESTADÍSTICA ESPAÑOLA Vol. 48, Núm. 162, 2006, págs. 295 a 331

Inferencia estadística sobre

poblaciones finitas con muestras

intencionales

por JULIO MIRÁS Instituto Galego de Estatística

RESUMEN

En un contexto de muestreo intencional, con el conocimiento pre-vio de una magnitud auxiliar, se buscan estrategias más eficientes que la formada por el estimador de razón con una muestra equilibrada en media, tanto en el caso de que en presencia de la relación esto-cástica:Yi=a+bXi; b>0;E(εi)=0,V(εi)=KXi,∀i;E(εiεj)=0, ∀i≠j, sea a=0 (modelo M1) como a≠ (modelo M2). 0

Palabras clave: muestreo intencional, modelos de superpoblación.

Clasificación AMS: 62D05

1. INTRODUCCIÓN

1.1. Elementos previos

El trabajo que se presenta en este artículo tiene como objetivo el estudio de es-trategias de inferencia en poblaciones finitas cuando se utiliza una muestra inten-cional, no aleatoria, convenientemente elegida por el investigador. Denotamos las unidades de la población finita objeto de estudio por i∈

{

1,...,N

}

=U; el tamaño de la

(2)

población se denota por N y una muestra de tamaño n entendida como un subcon-junto de n unidades de U se denota por ω . El conjunto de las Combinat(N;n) muestras posibles se denotará por Ω .

En situación de muestreo intencional no existe la denominada probabilidad P debida al muestreo, por lo que efectuaremos el análisis del proceso inferencial suponiendo que existe una relación estocástica ξ , entre la magnitud objetivo: Y=

{

Yi;i=1,...,N

}

y la magnitud auxiliar o tamaño: X=

{

Xi;i=1,...,N

}

cuyos valores

son números positivos conocidos a priori. El cálculo de valores esperados y varian-zas de un estimador θˆ de una magnitud poblacional θ , se realiza para una mues-tra fijada, de acuerdo con las especificaciones del modelo probabilístico que descri-be la relación entre X e Y. En consecuencia, al contrario de lo que ocurre en el contexto de la teoría del muestreo aleatorio, el valor esperado y la varianza de un estimador serán funciones de la muestra elegida; por esta razón cuando sea nece-sario precisar este hecho denotaremos un estimador por θˆ ω( ) y utilizaremos la notación simplificada θˆ cuando por el contexto del discurso no haya lugar a dudas.

Junto con la identificación de las unidades, la información a priori, está formada exclusivamente por el tamaño de la población, el tamaño de la muestra y los valo-res de la magnitud tamaño. Puesto que N y n son constantes la información previa se denotará simplificadamente por el vector X. Por muestreo intencional enten-demos la operación que consiste en la aplicación de un regla de decisión D, no aleatoria, que en función de la información previa, conduce a la elección de una muestra ω . Por estrategia de muestreo intencional entendemos el par

{ }

ˆθ;D formado por un estimador y una regla de decisión para elegir la muestra.

Estamos interesados en el uso de estimadores insesgados y en la comparación de distintas estrategias alternativas para estimar el total Y de la magnitud Y en la población finita cuando se dispone como información a priori del conocimiento del vector X. Para ello adoptamos la siguiente definición:

1.1.1.- Definición

Sean

{ }

Yˆ1;D1 y

{ }

Yˆ2;D2 dos estrategias para estimación del total

∈ = U i i Y Y ,

ta-les que: cualquiera que sea la muestra ω elegida con la regla D11 y la muestra ω 2

elegida con la regla D2 , los estimadores 1(ω y 1) Yˆ2(ω son insesgados, con 2) varianzas: v(Yˆ1(ω y 1)) v(Yˆ2(ω . En estas condiciones: 2))

Decimos que la estrategia

{ }

Yˆ1;D1 es mejor, más eficiente o preferible, que la

(3)

(a) v(Yˆ11))≤v(Yˆ22)), cualquiera que sea el vector de tamaños X de la po-blación finita.

(b) Existe al menos un X para el que se cumple: )) ( Yˆ ( v )) ( Yˆ ( v 1 ω1 < 2ω2

.

1.2. Modelos, estimadores insesgados y muestras equilibradas

Un primer modelo ξ desarrollado desde el punto de vista de la teoría de la pre-dicción por Royall (1970), con el antecedente de Brewer (1963), e intensamente estudiado en años posteriores junto con varios colaboradores en relación con la eficiencia del estimador de razón, que denotamos como modelo M1, es el siguiente modelo lineal homogéneo heteroscedástico:

i i i bX

Y = +ε [1.1]

con las especificaciones: 0

) (

i =

;

V(εi)=E(εi2)=KXi

, i=1,…,N;

E(εiεj)=0, i≠j

donde b>0 es un parámetro y K>0 una constante.

En estas condiciones el estimador lineal insesgado de mínima varianza (BLU) del total poblacional

∈ = U i i Y

Y , habiendo elegido y observado una muestra ω , es el estimador de razón y

x X ) (

razω = , y su varianza como estimador de Y es:

x ) x X ( X K ) Y ) ( Yˆ ( V )) ( Yˆ ( v raz ω = raz ω − = − [1.2] donde x e y denotan totales de la muestra ω y X denota total de la población.

Es conocido que, en general, la aceptación de un modelo estocástico de super-población conduce a la existencia de al menos una muestra en la que un determi-nado estimador insesgado presenta la menor varianza en torno al total Y que se desea estimar; en consecuencia la estrategia óptima consiste en utilizar dicha muestra. Madow, W. G. (1978) hace una interesante formalización de este asunto en su comentario a los artículos de Basu y de Royall y Cumberland. De [1.2] resulta que bajo el modelo M1 la estrategia óptima, en el sentido de estimación lineal insesgada de mínima varianza, conduce a elegir una muestra que presente el mayor valor del total muestral x y aplicar el estimador por razón.

(4)

También es conocido que si la relación entre las magnitudes presenta una orde-nada en el origen no nula; esto es, estamos en presencia del modelo no homogé-neo, heteroscedástico M2:

i i

i a bX

Y = + +ε [1.3] con las mismas especificaciones estocásticas:

i 2 i i) E( ) KX ( Vε = ε = , i=1,…,N;E(εiεj)=0, i≠j

donde a, b>0 son parámetros y K>0 una constante, el estimador por razón es

sesgado y este sesgo es: )

x x X ( a N ) Y ) ( Yˆ ( E )) ( Yˆ (

B raz ω = razω − = − . En consecuencia, para anular el sesgo se recomienda el uso de una muestra intencional tal que la media muestral de los valores X coincida con la media poblacional (muestra equili-brada en media que denotaremos por ω ); en esta situación el estimador por e razón (que ahora coincide con el estimador de expansión simple y

n N Yˆexp= ) es insesgado, y su varianza es:

n ) n N ( X K )) e ( Yˆ ( v )) e ( Yˆ ( v raz ω = expω = − [1.4] Respecto de la falta de robustez del estimador de razón Royall y Herson (1973)

reconocen que si estamos en presencia del modelo M2 (a≠ ) y la muestra no está 0 bien equilibrada el sesgo del estimador de razón puede ser importante. Asimismo Royall y Eberhardt (1975) recomiendan el uso de muestras equilibradas en la mayoría de los problemas y sugieren el rechazo de las muestras mal equilibradas. Royall y Herson (1973) también recomiendan el empleo de muestras equilibradas por estratos en cuyo caso el estimador de razón separado es más eficiente que aplicado a la población sin estratificar.

Es conocido, Royall (1988), que si en el modelo lineal no homogéneo (a≠ ) la 0 varianza de los residuos aleatorios es constante, modelo homoscedástico

K ) (

Vεi = , el predictor lineal insesgado de mínima varianza se obtiene eligiendo una

muestra intencional equilibrada en media y dicho predictor es el estimador de expansión Yˆexp=Ny, pero nosotros estamos interesados en el modelo lineal no homogéneo heteroscedástico con V(εi)=KXi como alternativa al modelo

heteros-cedástico M1.

Por otra parte cumple decir que el uso de muestras equilibradas se ha reconoci-do como deseable desde hace más tiempo, por ejemplo Yates (1949); y de hecho,

(5)

antes del célebre artículo de Neyman (1934) que supone la aceptación general del muestreo aleatorio, la muestra intencional equilibrada era el paradigma defendido por los pioneros del muestreo. En aquellos años, esta opción quedó relegada en la práctica ante la teoría del muestreo aleatorio elegantemente expuesta por Neyman y apoyada por su teoría de intervalos de confianza y por la ausencia de una funda-mentación teórica sólida, junto con la experiencia de Gini y Galvani (1929) con una muestra intencional seleccionada del Censo de Población de Italia de 1921, que si bien produjo buenas estimaciones de algunas variables no resultó igualmente exitosa para otras.

Los modelos de superpoblación en un principio se emplearon para evaluar la eficiencia de las estrategias de muestreo aleatorio en poblaciones finitas, ante distintas poblaciones generadas por un proceso estocástico, por ejemplo Cochran, W. G. (1946), Madow, W. G. (1953). Posteriormente se han empleado como ele-mento base del proceso inferencial en las denominadas estrategias de inferencia asistidas por modelo, siendo el libro de Särndal, Swensson y Wretman (1992) una referencia ya clásica en esta materia, y en la teoría de la predicción cuya referencia más importante es el libro de Valliant, Dorfman y Royal (2000). Una buena parte de los resultados que aquí estudiamos son conocidos en este contexto, pero hacemos un análisis específicamente dirigido al uso de muestras intencionales con la adver-tencia previa, por otra parte obvia, de que las conclusiones son válidas bajo las hipótesis de los modelos que las sustentan.

1.3. Planteamiento y contenido

Estamos interesados en la búsqueda de estrategias mejores que el uso de muestras equilibradas con el estimador de razón u otras igualmente eficientes, cuando estamos en presencia del modelo heteroscedástico M2 (a≠ ) como 0 alternativa al modelo M1. Esta búsqueda se justifica por alguno de los siguientes motivos:

a) Tenemos evidencias procedentes de estudios previos que la relación entre las magnitudes X e Y responde a un modelo lineal M2 con a≠ . 0

b) La relación entre X e Y plausiblemente responde a un modelo M1 con a=0 pero no tenemos evidencias al respecto y deseamos proteger la robustez del estimador ante la contingencia de que realmente sea a≠ . 0

c) Deseamos estimar los totales de varias magnitudes Y1, Y2 ,..., Yk , utilizando la

misma magnitud auxiliar, tales que si bien algunas responden al modelo M1 (a=0), no podemos razonablemente aceptar la misma hipótesis para las restantes, acep-tando como alternativa el modelo M2.

(6)

En la sección §2 se determina el estimador BLU del total Y, denotado por M, bajo el modelo M2. En la sección §3 se establecen y comparan varias estrategias que utilizan estimadores lineales insesgados tanto bajo la hipótesis del modelo M2 como del modelo M1. En la sección §4 se obtienen los estimadores BLU de los parámetros a, b del modelo M2. La sección §5 se dedica a la estimación de la constante K del modelo y de la varianza de los estimadores. En la sección §6 se comprueba que el estimador BLU, YˆM, puede expresarse como predictor BLU y de esta nueva expresión se obtiene una fórmula alternativa de su varianza en función de los parámetros K, a, b del modelo. La sección §7 se dedica al estudio de algu-nos aspectos de la aplicación del muestreo intencional con estratificación de la población.

2. ESTIMADORES LINEALES DEL TOTAL EN EL MODELO M2

En los siguientes apartados de la presente sección 2 consideramos el proceso inferencial bajo el modelo estocástico lineal M2, establecido en [1.3]. Notemos que:

(a) Empleamos una muestra fija, intencional, denotada por ω , y los cálculos de esperanzas y varianzas se refieren a la probabilidad establecida en el modelo estocástico, usualmente denominada probabilidad ξ para distinguirla de probabili-dad P que estaría presente en el caso de muestreo aleatorio.

(b) Estamos interesados en estimadores lineales del Total:

ω ∈ = ω i i iY C ) ( Yˆ ,

donde los coeficientes Ci;i∈ω, no dependen de los valores Yi ni de los parámetros desconocidos, estando totalmente determinados por la muestra ω que vamos a observar y por los N valores conocidos Xi ; i=1,...,N, de la magnitud auxiliar X .

2.1. Valor esperado y Varianza de una realización particular del proceso estocástico

El total de la magnitud objetivo en una realización particular del proceso, un censo según modelo, es una variable aleatoria:

= = ε + + = = N 1 i i N 1 i i Na bX Y

Y , cuyo valor esperado es:

bX Na ) Y ( E = + [2.1] y su varianza:

(7)

X K X K ) ( V ) Y ( V N 1 i i N 1 i i = = ε =

= = [2.2]

2.2. Valor esperado y Varianza de un estimador lineal

El valor esperado y la varianza de un estimador lineal

ω ∈ = ω i i iY C ) ( Yˆ ,

conside-rado como variable aleatoria según las especificaciones del modelo estocástico, son:

) Y C ( E )) ( Yˆ ( E i i i

ω ∈ = ω = i i i i i b CX C a

ω ∈ ω ∈ + [2.3]

ω ∈ ω ∈ = ε = = ω i i 2 i i i iY) C V( ) C ( V )) ( Yˆ ( V

ω ∈ i i 2 iX C K [2.4]

2.3. Estimadores insesgados del total

El error puntual de Yˆ como estimador de Y , es Yˆ − y su sesgo, teniendo en Y cuenta [2.1] y [2.3], es: ) X X C ( b ) N C ( a ) Y ) ( Yˆ ( E )) ( Yˆ ( B i i i i i− + − = − ω = ω

ω ∈ ω ∈ [2.5]

y es inmediato ver que el sesgo se anula, cualquiera que sea la muestra elegida y cualesquiera que sean los valores de los parámetros desconocidos del modelo, si y solo si se cumplen las condiciones:

(a) C N i i=

ω ∈ ; (b) CXi X i i =

ω ∈ [2.6]

2.4. Varianza del estimador lineal insesgado como estimador del total Utilizamos la notación v(Yˆ(ω))=V(Yˆ(ω)−Y) para la varianza de un estimador lineal del total actual Y, y reservamos la notación V(Yˆ(ω))=E(Yˆ(ω)−E(Yˆ(ω)))2para la varianza de Yˆ considerado como estadístico. Así tenemos:

ω ∈ = ∈ω ∉ω = − − = − = − = ω i N 1 i i i i i i i i iY Y) V( (C 1)Y Y) C ( V ) Y Yˆ ( V )) ( Yˆ ( v

(8)

y teniendo en cuenta la covarianza entre los dos sumandos es nula, por ser j i si ; 0 ) ( E ) ( E ) ( Eεiεj − εi εj = ≠ , resulta: =

ω ∈ ∉ω + − i i i i 2 i 1) V(Y) V( Y) C ( . Sustituyendo V(Yi)=KXi, tenemos:

ω ∈ ∉ω + − i i i i 2 i 1) X X) C ( (

K y teniendo en cuenta que un estimador insesgado cumple

[2.6b]:

ω ∈ − = − ω = ω i i 2 iX X) C ( K ) Y ) ( Yˆ ( V )) ( Yˆ ( v [2.7]

Esta varianza se puede expresar como el producto:

)) ( Yˆ ( H K )) ( Yˆ ( v ω = ω ; con: H(Yˆ( )) C X X i i 2 i − = ω

ω ∈ [2.8]

siendo H(Yˆ(ω una cantidad que para un estimador y una muestra dados, está )) determinada antes de observar las unidades muestrales (no depende de las Yi ni de los parámetros desconocidos).

Por otra parte conviene notar que teniendo en cuenta [2.4] y [2.7], para un esti-mador lineal insesgado del total, se cumple:

X K )) ( Yˆ ( V )) ( Yˆ ( v ω = ω − [2.9] 2.5- Estimadores lineales insesgados de mínima varianza (BLU)

Sea

ω ∈ α = θ i i iY

ˆ , donde los coeficientes

i

α no dependen de las Y , ni de los pa-i

rámetros desconocidos, un estimador lineal de una magnitud o parámetro poblacio-nal θ . Puesto que su valor esperado es:

ω ∈ ω ∈ α + α = θ i i i i i b X a ) ˆ (

E , para que sea

insesgado se debe cumplir:

ω ∈ ω ∈ α + α = θ i i i i i b X

a . Consideremos tres parámetros

en los que estamos interesados:

a) θ=aN+bX; debe ser:

ω ∈ α i i=N, y Xi X i i = α

ω ∈ . [2.10a]

(9)

b) θ=a; debe ser: 1 i i= α

ω ∈ , y Xi 0 i i = α

ω ∈ . [2.10b] c) θ=b ; debe ser: 0 i i= α

ω ∈ , y Xi 1 i i = α

ω ∈ . [2.10c]

que se resumen en la forma general: θ=aL+bM, dando al par (L,M) los valores (N, X), (1,0) y (0,1) respectivamente.

Teniendo en cuenta que bajo el modelo M2: 1) la varianza del estimador lineal

es: i i 2 iX K ) ˆ ( V

ω ∈ α =

θ ; 2) K es una constante y 3) V(Yi)=KXi, para determinar los

coeficientes que definen el estimador BLU de θ , elegida una muestra ω , busca-mos la solución que hace mínimo el valor de la función de Lagrange:

) X M ( ) L ( X i i i i i i i 2 i

ω ∈ ω ∈ ω ∈ α − μ + α − λ + α = φ [2.11]

en la que el segundo y tercer término expresan las condiciones para que el estima-dor sea insesgado cualesquiera que sean los valores de los parámetros del mode-lo. Resolviendo el sistema de ecuaciones que se obtiene al igualar a cero las derivadas parciales de φ respecto de α ;i;λμ, la solución es:

ω ∈ Δ − + Δ − = α − ;i X ) n M x L ( ) n L x M ( i ) 1 ( * i [2.12]

donde: Δ=xx(−1)−n2; con la notación:

ω ∈ − = i i ) 1 ( X 1 x .

2.5.1.- Estimador BLU del total Y para una muestra dada

Haciendo en [2.12]: L=N y M=X , obtenemos el estimador BLU para el total Y.

Denotaremos por

ω ∈ = ω i i * i M( ) CY

Yˆ este estimador que queda definido por los coeficientes: ω ∈ Δ − + Δ − = − ; i X ) n X x N ( ) n N x X ( C i ) 1 ( * i [2.13]

(10)

ω ∈ − − + − − = ); i X ) x x ( x ) X x ( x x x X ( n N C i a a a a * i [2.14]

donde: xa=n/x(−1) es la media armónica de los tamaños de las unidades de la

muestra.

En resumen: Fijada una muestra ω , bajo el modelo M2, el estimador BLU del

total es:

ω ∈ = ω i i * i M( ) C Y

Yˆ con Ci*;i∈ω dados en [2.13]=[2.14] y de acuerdo con [2.7] y [2.8], su varianza es: ) X X C ( K )) ( Yˆ ( v i i 2 * i M

ω ∈ − = ω ∝H(YˆM(ω)) [2.15] Si n>1 y no todas las unidades de la muestra tienen el mismo tamaño, la media aritmética es siempre mayor que la media armónica, en consecuencia Δ >0 y siempre existe la solución [2.13] =[2.14] cualquiera que sea la muestra elegida. No obstante puede ocurrir que para alguna muestra, alguno de los coeficientes C sea *i negativo. En este caso que se presenta en muestras muy desproporcionadas, por ejemplo la formada por las n mayores unidades o por las n menores, tal muestra debe ser rechazada ya que en ella el estimador presenta una varianza extraordina-riamente elevada.

La fórmula [2.15] expresa que la varianza del estimador BLU es proporcional a la cantidad H(YˆM(ω que puede ser evaluada a priori para cualquier muestra, dado )) X. Esto permite decidir si una muestra es más conveniente que otra.

3. COMPARACIÓN DE ESTRATEGIAS BAJO LOS MODELOS M2 Y M1

3.1. Estrategias particulares objeto de estudio

Se observa inmediatamente en [2.14] que si la muestra es equilibrada en media, y la denotamos por ω , tenemos: e

e i ; x / X n / N C*i = = ∈ω [3.1]

en consecuencia, en este caso: el estimador BLU YˆM(ω , coincide con el estima-e) dor de razón Yˆraz(ω y con el estimador de expansión simple e) Yˆexp(ω . Los tres e) son insesgados y su varianza, sustituyendo [3.1] en [2.7], es:

(11)

) n n N ( X K )) e ( Yˆ ( v )) e ( Yˆ ( v )) e ( Yˆ ( v M ω = raz ω = exp ω = − [3.2] También se observa inmediatamente en [2.14] que si la muestra cumple la con-dición: xa=X, media armónica de los tamaños muestrales igual a la media aritmé-tica de la población, en cuyo caso la denotamos por ω , tenemos: a

a i ; nX X C i * i = ∈ω [3.3]

en consecuencia, en este caso: el estimador BLU YˆM(ω coincide con el estimador a) ) a ( YˆPX ω

ω ∈ = i i i Y nX X

, que se forma con coeficientes inversamente proporcionales al tamaño de las unidades de la muestra. Los dos son insesgados y su varianza, sustituyendo en [3.3] en [2.7], es: ) n n N ( X K )) a ( Yˆ ( v )) a ( Yˆ ( v M ω = PX ω = − [3.4] En lo sucesivo utilizaremos la notación )

n n N ( X

H0= − de modo que las varian-zas [3.2] y [3.4] son iguales a KH0.

3.2. Conclusiones

Para una determinada población finita, dada una magnitud auxiliar X, denota-mos por D la regla que elige una muestra equilibrada en media y por e D la regla a que elige una muestra equilibrada en media armónica. Se cumple:

(a).- Las tres estrategias:

{

raz;De

}{

, Yˆexp;De

}{

, YˆPX;Da

}

conducen a estimado-res BLU con la misma varianza [3.2] = [3.4]; además las dos primeras estrategias son iguales.

(b).- Las estrategias

{

M;De

} {

, YˆM;Da

}

conducen a estimadores BLU y con la misma varianza que las tres del apartado (a); además la primera de ellas es igual a las dos primeras de (a) y la segunda es igual a la tercera.

3.2.1.- Observación

Cuando la relación entre la magnitud auxiliar y la magnitud objetivo presenta una ordenada en el origen no nula, además de la estrategia tradicionalmente recomendada

{

raz;De

}

, existe al menos otra estrategia distinta pero igualmente

(12)

eficiente que es

{

PX;Da

}

. La diferencia práctica es que si bien en el primer caso, en general, es relativamente fácil encontrar muestras que cumplan con buena aproximación el equilibrio en media aritmética, en el segundo caso pudiera ocurrir que no existan muestras con la condición xa≅ (en particular si el cociente NX n/ es próximo a 1). Además, en el uso práctico es más sencillo el estimador de razón puesto que emplea un único coeficiente (X/x) igual para todas las unidades mues-trales.

Por estas razones en lo que sigue prescindiremos de la estrategia

{

PX;Da

}

. También prescindiremos de la estrategia

{

exp;De

}

puesto que es igual a la

{

Yˆraz;De

}

.

3.3. Estrategia óptima bajo el modelo M2

Entendemos por estrategia óptima y la denotamos por

{

YˆM;D*

}

, la formada por el estimador BLU bajo el modelo M2 , y la regla de decisión D* que consiste en elegir la muestra ω∈Ω, que haga mínimo el valor de H(Yˆ ( )) C Xi X

i 2 * i Mω =

− ω ∈ , o lo

que es lo mismo mínima la varianza del estimador YˆM(ω . Denotamos por *) ω esta muestra, o una cualquiera de ellas si existe más de una.

Desconocemos una solución analítica para este problema pero en cada caso particular, dado el vector de valores de la magnitud auxiliar puede resolverse investigando cada una de las muestras ω∈Ω.

No obstante, la aplicación de un algoritmo para este proceso de búsqueda pue-de resultar excesivamente onerosa incluso para valores mopue-derados pue-de N y n, por lo que en el siguiente apartado damos una regla empírica que determina una muestra que si bien no es la óptima, ofrece una solución útil en la práctica.

3.4.- Estrategia seudo-óptima bajo el modelo M2

Para un tamaño de muestra dado n

2, sea Ω^⊂Ω el subconjunto de mues-tras formadas con: n1=1,2,...,n−1 unidades que presenten los n menores tama-1

ños y n2=n−n1 unidades que presenten los n mayores tamaños. Las experien-2 cias prácticas que he realizado indican que, como alternativa a la investigación de todas las muestras posibles, una solución práctica que denomino muestra seudo-óptima, se encuentra buscando la muestra que hace mínimoH(YˆM(ω en ))

Ω

^

. Denotaremos por ω^∈Ω^ esta muestra, o una cualquiera de ellas si existe más de una, tal que cumple:

)) ( Yˆ ( H . Mín )) ^ ( Yˆ ( H M ^ Mω = ω Ω ∈ ω [3.5]

(13)

Se trata de un método basado exclusivamente en experiencias prácticas y aun-que pueden encontrase ejemplos en los aun-que esta regla no determina la muestra óptima, proporciona una solución que debe investigarse antes de adoptar la mues-tra equilibrada en media.

Definimos y denotamos por

{

M;D^

}

la estrategia seudo-óptima como la forma-da por el estimador BLU bajo el modelo M2, y la siguiente regla regla D para la ^ elección de la muestra:

^

D : Si H(YˆM(ω^))<H0, elegimos la muestra seudo-óptima ^ω ; en caso contrario

elegimos la muestra equilibrada en media ω . e 3.5. Comparación de estrategias

Teniendo en cuenta el resultado sintetizado en la fórmula [2.8] resulta que para comparar dos estrategias que utilicen estimadores lineales insesgados, en presen-cia del modelo M2 podemos prescindir de la constante K. En consecuenpresen-cia, de acuerdo con la definición §1.1.1,

{ } {

Yˆ1;D1 f Yˆ2;D2

}

si se cumple:

(a).- H(Yˆ11))≤H(Yˆ22)), cualquiera que sea el vector de tamaños X de la po-blación finita.

(b).- Existe al menos un X para el que se cumple:

)) ( Yˆ ( H )) ( Yˆ ( H 1 ω1 < 2 ω2 .

Para un X dado, como medida de la eficiencia relativa de la primera respecto de la segunda, utilizaremos: G=100 H(Yˆ11))/H(Yˆ22)) que expresa la desviación típica del estimador que corresponde a la primera estrategia como porcentaje de la desviación típica del segundo. Cuanto menor o mayor que 100 sea G, más o menos preferible será la primera a la segunda.

3.6. Eficiencia de la estrategia seudo-óptima

La estrategia

{

YˆM;D^

}

es más más eficiente que la estrategia

{

Yˆraz;De

}

.

Veamos: En primer lugar, por la definición de D^ , bajo el modelo M2, teniendo en cuenta §3.2(b), la estrategia

{

M;D^

}

es al menos igualmente eficiente que

{

Yˆraz;De

}

. Es necesario entonces probar la condición §3.5(b); para ello vemos en

el siguiente apartado diversos ejemplos en los que existe X tal que H(YˆM(ω^)) es estrictamente menor que H0. Quedará así probado el enunciado.

(14)

3.6.1. Ejemplos

En todos los casos suponemos que se conoce una magnitud X y se desea esti-mar el total de una magnitud Y relacionada con X según el modelo M2. En cada ejemplo: 1) determinamos la muestra seudo-óptima ^ω ; 2) calculamos:

) n n N ( X

H0= − , H(YˆM(ω^)) y el valor de G . En todos los ejemplos G es estrictamen-te menor que 100, o lo que es lo mismo: H(YˆM(ω^))<H0.

Ejemplo 1. Población: N=78, Concejos de Asturias. Magnitud X: Número de Hectáreas de Superficie Agrícola Utilizada según datos de 1986, cuyo total es X=215.692. Tamaño de la muestra: n=24. Resultados: H =485.307. Muestra 0 seudo-óptima: n1=6 menores concejos y n2=18 mayores. H(YˆM(ω^))=210.456 <H0 .

(G=66).

Ejemplo 2. Población: N=52, Provincias de España incluyendo Ceuta y Melilla. Magnitud X: Plantilla, en Número de personas, de las Direcciones Provinciales del INS (Instituto Nacional de la Seguridad Social) en 1997, cuyo total es X=12.198. Tamaño de la muestra: n=18. Resultados:H = 23.041. Muestra seudo-óptima: n0 1=5

menores provincias y n2=13 mayores. H(YˆM(ω^))=13.593<H0 . (G=77).

Ejemplo 3. Población: N= 129, Principales empresas de carpinteria metálica en Galicia. Magnitud X: Facturación en miles de euros en el año 2000, cuyo total es X=178.101. Tamaño de la muestra n=27. Resultados:H = 672.826. Muestra seu-0

do-óptima: n1=16 menores empresas y n2=11 mayores. H(YˆM(ω^))= 404.370<H0 .

(G=78).

Ejemplo 4. Población: N=54, Empresas de conservas de pescado y frutos de mar en Galicia. Magnitud X: Facturación en miles de euros en 2000, cuyo total es X=837.577. Tamaño de la muestra: n=18. Resulta:H = 1.675.154. Muestra seudo-0 óptima: n1=5 menores y n2=13 mayores. H(YˆM(ω^))=284.044<H0 . (G=41).

Ejemplo 5. Población: N= 109, Municipios de Granada mayores de 1000 habi-tantes. Magnitud X: Población en el año 2003, cuyo total es X=793.952. Tamaño de la muestra n=21. Resultados:H = 3.327.037. Muestra seudo-óptima: n10 =13

meno-res municipios y n2=8 mayores. H(YˆM(ω^))=1.113.692<H0 . (G=58).

Ejemplo 6. Población: N= 304, Condados, tomada del apéndice B.3 del libro de Valliant, Dorfman y Royal (2000). Magnitud X: Número de hogares en 1960, cuyo total es X=2.715.075. Tamaño de la muestra: n=36. Resultados:H = 20.212.225. 0

Muestra seudo-óptima: n1=15 menores condados y n2=21 mayores.

)) ^ ( Yˆ ( H Mω =7.575.595<H0 . (G=61).

Ejemplo 7. Población: N= 284, Municipios de Suecia, tomada del apéndice B del libro de Särndal, Swensson y Wretman (1992). Magnitud X: Número de

(15)

emplea-dos municipales en 1984 (ME84), cuyo total es X=505.256. Tamaño de la muestra

n=33. Resultados:H = 3.843.008. Muestra seudo-óptima: n0 1=18 menores

munici-pios y n2=15 mayores. H(YˆM(ω^))=1.331.359<H0 . (G=59).

Ejemplo 8. Población: N=45, Cajas de Ahorros Confederadas en España, año 2002. Magnitud X: Número de oficinas cuyo total es X=20.205. Tamaño de la muestra: n=14. Resulta:H = 44.740. Muestra seudo-óptima: n0 1=3 menores y n2=11

mayores. H(YˆM(ω^))=15.336<H0 . (G=59). 3.7. Análisis bajo el Modelo M1

Los siguientes resultados se obtienen inmediatamente teniendo en cuenta que el modelo M1 es formalmente un caso particular del modelo M2 en que el paráme-tro a de la recta de regresión no existe.

3.7.1. Estimadores insesgados bajo el Modelo M1

Teniendo en cuenta que ahora el valor esperado del total que se desea estimar es: E(Y)1=bX, donde el subíndice 1 indica que estamos en el modelo M1, la condición para que un estimador lineal del total:

ω ∈ = i i iY C

Yˆ sea insesgado es:

i i iX C X

ω ∈

= , que equivale a la condición [2.6b] del modelo M2. Se comprueba inmediatamente que bajo el modelo M1:

El estimador de razón Yˆraz es insesgado cualquiera que sea la muestra elegida. El estimador de expansión Yˆexp, tiene un sesgo: B(Yˆexp)=Nb(x−X), que se anula si se elige una muestra equilibrada en media.

El estimador

ω ∈ = i i i PX Y X n X

Yˆ es insesgado cualquiera que sea la muestra elegida.

El estimador Yˆ es insesgado cualquiera que sea la muestra elegida. M

3.7.2.- Varianza de los estimadores insesgados bajo el Modelo M1

Las especificaciones estocásticas del modelo M1 son las mismas que las de M2, por lo que es aplicable el desarrollo formal efectuado en §2.4. Así tenemos la misma fórmula general para la varianza de un estimador lineal insesgado:

) X X C ( K )) ( Yˆ ( v i i 2 i 1 1= − ω

ω ∈ =K1H(Yˆ(ω)) [3.1]

(16)

con la advertencia de que el subíndice 1 expresa que la fórmula se refiere al mode-lo M1 y que, incluso para una misma población, al cambiar la hipótesis acerca del modelo debemos de cambiar el valor de la constante K. Sin embargo el valor de

)) ( Yˆ (

H ω para un mismo estimador

ω ∉ = i i iX C

Yˆ , es el mismo en ambos modelos

(no depende ni de K ni de a ni de b).

3.7.3. Conclusiones.

Los cuatro estimadores lineales Yˆraz(ω , e) Yˆexp(ω , e) YˆPX(ω y a) YˆM(ω son in-^) sesgados tanto en el modelo M2 como en el modelo M1. la varianza de los tres primeros estimadores es proporcional a la misma cantidad: )

n n N ( X H0= − y la varianza de YˆM(ω es proporcional a: ^) H(Yˆ ( ^)) C X X ^ i i 2 * i Mω =

− ω ∈ .

Por las razones ya indicadas en la observación §3.2.1, en el siguiente apartado prescindimos de los estimadores Yˆexp(ω y e) YˆPX(ω , centrándonos en la compa-a) ración de estrategias que emplean Yˆraz(ω o e) YˆM(ω . ^)

3.8. Comparación de las estrategias en ambiente de incertidumbre respecto de los dos modelos M1 y M2

Denotemos por H1 la hipotésis según la cual en nuestro problema de inferencia

se cumple el modelo M1 y denotemos por H2 la hipótesis según la cual se cumple el

modelo M2. Supongamos que:

(a) Se cumple una de las dos hipótesis H1 o H2 pero no sabemos cúal de ellas.

(b) Ante esta situación de incertidumbre, para evitar el sesgo bajo H2 , del

esti-mador que es óptimo bajo H1 (estimador de razón y uso de la muestra formada por

las n mayores unidades), decidimos utilizar estimadores lineales que sean insesga-dos bajo ambas hipótesis.

En estas condiciones: La estrategia

{

YˆM;D^

}

es más eficiente que la estrategia

{

Yˆraz;De

}

con independencia de que se cumpla H1 o H2 .

Veamos: En §3.6 hemos visto que bajo H2,

{

YˆM;D^

}

es más eficiente que la

es-trategia

{

raz;De

}

y teniendo en cuenta las conclusiones §3.7.3 , también es más eficiente bajo H1 ya que los estimadores y las cantidadesH y 0 H(Yˆ(ω^)) que se

comparan son las mismas bajo ambas hipótesis (no dependen de K ni de a ni de b). Todos los ejemplos de §3.6.1 son igualmente válidos si se supone que deseamos

(17)

estimar el total de una magnitud Y relacionada con X de acuerdo con el modelo M1 (en vez de con el modelo M2 como se supuso antes).

4. ESTIMADORES BLU DE LOS PARÁMETROS A Y B DEL MODELO M2 La estimación de los parámetros de la recta de regresión permite la estimación de la constante K del modelo, que se utilizará para estimar la varianza del estima-dor BLU del total. Además permite efectuar la predicción del valor de la magnitud objetivo en las unidades de la población que no están presentes en la muestra; lo que por ejemplo, permitiría en un censo imputar un valor no observado por falta de respuesta u otras causas. Otra aplicación es la estimación del modelo cuando se conocen los datos censales que se realiza como análisis previo con el fin de decidir si el modelo es útil para el empleo de muestras intencionales en estimaciones futuras.

4.1. Estimador BLU de a

Los coeficientes de ponderación que definen el estimador BLU:

ω ∈ = i i iY A aˆ

pa-ra el parámetro a del modelo, elegida una muestpa-ra ω , se obtienen inmediatamente de [2.12] sustituyendo: L=1;M=0 , de acuerdo con [2.10b]. Resultan ser:

ω ∈ Δ + Δ − = );i X x n ( A i i [4.1] Su varianza: i i 2 iX A K ) aˆ ( V

ω ∈ = [4.2] 4.2. Estimador BLU de b

Análogamente, los coeficientes de ponderación que definen el estimador BLU:

ω ∈ = i i iY B

bˆ para el parámetro b del modelo, elegida una muestra ω , se obtienen sustituyendo: L=0;M=1, de acuerdo con [2.10c]. Resultan ser:

ω ∈ Δ − Δ = − );i X n x ( B i ) 1 ( i [4.3] Su varianza: i i 2 iX B K ) bˆ ( V

ω ∈ = [4.4]

(18)

4.3. Covarianza entre aˆ y bˆ

Las varianzas de aˆ y bˆ se han dado en [4.2] y [4.4]; un sencillo ejercicio bajo las hipótesis del modelo M2 permite calcular la covarianza entre estos estadísticos. Esta es:

ω ∈ = i i i iBX A K ) bˆ , aˆ ( Cov [4.5]

5. ESTIMACIÓN DE K Y DE LA VARIANZA DE LOS ESTIMADORES

5.1. Estimación de K

Proponemos la siguiente estimación de K :

ω ∈ − − − = i i 2 i i X ) 2 n ( ) X bˆ aˆ Y ( Kˆ [5.1]

donde aˆ y bˆ son los estimadores BLU de a y b. Su justificación es la siguiente: Si los parámetros son conocidos, tendríamos

ω ∈ ∈ω = ε = − − i i i 2 i i 2 i i ) K nX ( E ) nX ) bX a Y ( (

E , y obtenemos [5.1] sustituyendo a y b por sus

estimadores BLU, reduciendo en 2 el número de grados de libertad de la forma cuadrática.

5.2. Estimación de las varianzas

Las siguientes estimaciones de las varianzas se obtienen inmediatamente susti-tuyendo la estimación (5.1) de K: ) X X C ( Kˆ ) Yˆ ( vˆ i i 2 * i M =

− ω ∈ [5.2] i i 2 iX A Kˆ ) aˆ ( Vˆ

ω ∈ = [5.3]

(19)

i i 2 iX B Kˆ ) bˆ ( Vˆ

ω ∈ = [5.3] 5.3. Ejemplos

En los siguientes ejemplos se utiliza el estimador BLU, YˆM, con la muestra seu-do-óptima. Los datos corresponden a los mismos ejemplos de §3.6.1 y van igual-mente numerados de 1 a 8.

Ejemplo 1. Se estima el Número de cabezas de ganado vacuno, que es

Y=379.137. Resultados:

Estimación del total: YˆM(ω = 358.976; Error cometido = -5,3%. ^) Estimación de parámetros: Kˆ =806; aˆ =79,43; bˆ =1,64.

Estimación de la desviación típica en % : DT^(M(ω )=3,6%. ^)

Ejemplo 2. Se estima el Número total de pensiones que gestionan las delega-ciones provinciales del INSS en 1997, que es Y=7.364.232. Resultados:

Estimación del total: YˆM(ω = 7.433.149; Error cometido= 0,9%. ^) Estimación de los parámetros: Kˆ =2.889.671; aˆ =-15.775; bˆ =677. Estimación de la desviación típica en %: DT^(M(ω )=2,7%. ^)

Ejemplo 3. Se estima el Valor añadido en 2001, que es Y=61.631 miles de euros. Resultados:

Estimación del total: YˆM(ω = 60.322; Error cometido= -2,1%. ^) Estimación de los parámetros: Kˆ =15,50; aˆ = 33,99; bˆ =0,31. Estimación de la desviación típica en %: DT^(M(ω )=4,2%. ^)

Ejemplo 4. Se estima el Valor añadido en 2001, que es Y=147.649 miles de euros. Resultados:

Estimación del total: YˆM(ω = 142.301; Error cometido = -3,6%. ^) Estimación de los parámetros: Kˆ =114,4; aˆ = 161,91; bˆ =0,16. Estimación de la desviación típica en %: DT^(M(ω )=4,0%. ^)

Ejemplo 5. Se estima el Total de superficie del comercio minorista, que es Y=1.667.423 metros cuadrados. Resultados:

(20)

Estimación del total: YˆM(ω = 1.732.388; Error cometido = 3,9%. ^) Estimación de los parámetros: Kˆ =1.246; aˆ = -1.991; bˆ =2,46. Estimación de la desviación típica en %: DT^(M(ω )=2,8%. ^)

Ejemplo 6. Se estima la Población en 1970, que es Y=11.243.111 habitantes. Resultados:

Estimación del total: YˆM(ω = 11.441.222; Error cometido = 1,8%. ^) Estimación de los parámetros: Kˆ =13.291; aˆ = -479; bˆ =4,27. Estimación de la desviación típica en %: DT^(M(ω )=2,8%. ^)

Ejemplo 7. Se estima el total de rentas de los Impuestos municipales, que es Y=69.605 millones de coronas suecas. Resultados:

Estimación del total: YˆM(ω = 69.768; Error cometido = 0,2%. ^) Estimación de los parámetros: Kˆ =0,4198; aˆ = -0,7804; bˆ = 0,1385. Estimación de la desviación típica en %: DT^(M(ω )=1,1%. ^) Ejemplo 8. Se estima el total de cuatro magnitudes poblacionales: 8.1. Número de empleados, que es Y=107.052 . Resultados: Estimación del total: YˆM(ω = 104.508; Error cometido = -2,4%. ^) Estimación de los parámetros: Kˆ =623; aˆ =4,69; bˆ = 5,16. Estimación de la desviación típica en %: DT^(M(ω )=3,0%. ^)

8.2. Número de cajeros automáticos, que es Y=27.863. Resultados: Estimación del total: YˆM(ω = 28.401; Error cometido = 1,9%. ^)

Estimación de los parámetros: Kˆ =96,1; aˆ =-19,37; bˆ = 1,45. Estimación de la desviación típica en %: DT^(M(ω )=4,3%. ^)

8.3. Número de cuentas de acreedores, que es Y=50.146.361. Resultados: Estimación del total: YˆM(ω = 49.246.521; Error cometido = -1,8 %. ^)

Estimación de los parámetros: Kˆ =216.735.815; aˆ = 3720; bˆ = 2429. Estimación de la desviación típica en %: DT^(M(ω )=3,7%. ^)

(21)

8.4. Total de activos en millones de euros, que es Y=486.767. Resultados: Estimación del total: YˆM(ω = 498.714; Error cometido = 2,5 %. ^)

Estimación de los parámetros: Kˆ =53.159; aˆ = -286,6; bˆ = 25,3. Estimación de la desviación típica en %: DT^(M(ω )=5,7%. ^) 6. PREDICCIÓN Y ESTIMACIÓN BLU DEL TOTAL

La teoría de la predicción lineal en poblaciones finitas parte de la siguiente idea: Puesto que después de haber observado una muestra conocemos el total muestral de la magnitud objetivo, la estimación del total poblacional se reduce a predecir el total de la parte de la población no observada. Se dice entonces que un predictor lineal insesgado del total se forma como suma del total observado en las unidades muestrales y un predictor lineal insesgado del total no observado.

A continuación vemos que el estimador BLU, Yˆ del total poblacional Y, que M hemos determinado en §2.5.1 bajo el modelo M2, se puede expresar como predic-tor BLU de Y.

6.1.- Expresión alternativa del estimador BLU como predictor

Dada una muestra, podemos construir un predictor insesgado según modelo, de la magnitud objetivo para cada unidad de la población; éste es: YˆMi(ω)=aˆ+bˆXi.

Veamos en primer lugar que:

6.1 (a). El estimador BLU del total se puede escribir como suma de los predicto-res individuales de los N valopredicto-res de la población:

= ω ∈ = N 1 i i M i i * iY Yˆ C [6.1]

6.1 (b). El total observado en la muestra es igual a la suma de los predictores de las unidades muestrales.

∑ ∑

ω ∈ ∈ω = i i i M i Yˆ Y [6.2]

El segundo miembro de [6.1] es igual a Naˆ+Xbˆ, sustituyendo ahora [4.1] y [4.3] en aˆ y bˆ respectivamente, es igual a:

(22)

ω ∈ − Δ − + Δ − i i i ) 1 ( X Y ) X n x N ( y ) n N x X

( que coincide con el primer miembro:

ω ∈ i i * iY

C , sustituyendo en éste los coeficientes C del estimador BLU determinados *i

en [2.13]. Análogamente para probar 6.1(b) , sustituyendo aˆ y bˆ en el segundo miembro de [6.2], se obtiene: naˆ+xbˆ=y=

ω ∈ i

i

Y .

En consecuencia, utilizando [6.1] y [6.2] podemos escribir el estimador BLU en la forma de predictor BLU del total poblacional Y:

bˆ ) x X ( aˆ ) n N ( Y Yˆ Y Y C Yˆ i i i Mi i i i i * i M=

=

+

=

+ − + − ω ∉ ∈ω ω ∈ ω ∈ [6.3]

6.2. Expresión alternativa de la varianza del estimador BLU

La varianza de Yˆ , considerado como estimador, o predictor, del total poblacio-M nal Y, teniendo en cuenta los resultados anteriores, es:

ω ∉ = − − + − = − = i i) Y bˆ ) x X ( aˆ ) n N (( V ) Y Yˆ ( V ) Yˆ ( v

{

(N n) V(aˆ) (X x) V(bˆ) 2(N n)(X x)Cov(aˆ,bˆ) (X x)

}

K − 2 + − 2 + − − + −

Otra forma más simple de expresar esta varianza es la siguiente. Teniendo en cuenta que la varianza de Yˆ , considerado como estadístico, es: M

)) bˆ , aˆ ( Cov X N 2 ) bˆ ( V X ) aˆ ( V N ( K ) Yˆ (

V M = 2 + 2 + y la relación [2.9], válida para cualquier

estimador lineal insesgado del total, resulta:

) X ) bˆ , aˆ ( Cov X N 2 ) bˆ ( V X ) aˆ ( V N ( K ) Yˆ ( v M = 2 + 2 + − [6.4] 7. ESTRATIFICACIÓN

Sea L el número de estratos en que se ha particionado la población finita, cada uno denotado por h=1,...,L, y sean N sus tamaños, con h =

h h

N

N . Denotemos el

tamaño de la nuestra fijado en cada estrato por n , siendo h =

h h

n

(23)

denota-mos por ω la muestra elegida en el h-ésimo estrato, la muestra conjunta será h

h hω

∪ =

ω . Si la muestra del estrato h es equilibrada se denota por ωhe ; si es seudo-óptima se denota por ω . ^h

El estimador del total poblacional =

h h

Y

Y , que resulta de aplicar el estimador

BLU del total de cada estrato por separado lo denotamos por =

h h . M str . M Yˆ Yˆ . Si

en la población se cumple el modelo M2 para la relación entre la magnitud objetivo y la magnitud auxiliar, YˆM.str es insesgado con varianza:

ω = ω = ω h h h . M h h h . M str . M ( )) v(Yˆ ( )) K H(Yˆ ( )) Yˆ ( v [7.1]

siendo, de acuerdo con [2.8]:

ω ∈ − = ω h i h ih 2 * ih h h . M ( )) C X X Yˆ ( H [7.2]

y C*ih los coeficientes del estimador BLU en el h-ésimo estrato de acuerdo con la fórmula [2.13]=[2.14] aplicada por separado a cada estrato. Si la población cumple el modelo M1 , la fórmula [7.1] se convierte en:

ω = ω = ω h h h . M 1 h h h . M str . M ( )) v(Yˆ ( )) K H(Yˆ ( )) Yˆ ( v [7.3]

que solo se diferencia de [7.1] en el valor de la constante K, que ahora denotamos por K1

7.1. Comparación de estrategias con estratificación

Formalmente la estratificación es una partición de la población finita en L clases disjuntas realizada a priori (antes de proceder a la selección de la muestra). Supo-nemos que en general el investigador establece el número de estratos y el reparto de las unidades de la población a cada uno de ellos teniendo en cuenta el conoci-miento del vector de valores de la magnitud auxiliar. Sean entonces

{ }

1;D1str y

{ }

Yˆ2;D2str dos estrategias con estratificación de la población finita para estimación

del total

∈ = U i i Y

Y , tales que: cualquiera que sea la muestra estratificada ω 1

(24)

estimadores estratificados Yˆ ω1( 1)str y Yˆ22)str son insesgados, con varianzas: ) ) ( Yˆ (

v 1 ω1str y v(Yˆ22)str). Decimos entonces que la estrategia

{ }

1;D1str es mejor, más eficiente o preferible, que la estrategia

{ }

2;D2str y escribimos

{ } { }

Yˆ1;D1strf Yˆ2;D2 str si se cumple:

(a). v(Yˆ11)str)≤v(Yˆ22)str), cualquiera que sea el vector de tamaños X de la población finita y la estratificación establecida en la población finita.

(b). Existe al menos un X y una estratificación para los que se cumple: ) ) ( Yˆ ( v ) ) ( Yˆ ( v 1 ω1str < 2ω2 str

.

7.2. Estimador de razón y muestras equilibradas por estratos

Para remediar la pérdida de robustez del estimador de razón si en el modelo es 0

a≠ (modelo M2), Royall y Herson (1973) también recomiendan la partición de la población finita en estratos, elegiendo una muestra equilibrada en cada uno de los estratos, con afijación óptima del tamaño muestral. En estas condiciones, denotan-do por ωe.str una muestra equilibrada en media en cada estrato, el estimador separado de razón:

= = = = = = ω L 1 h h h h L 1 h h h h L 1 h h . raz str . raz y n N y x X Yˆ ) str . e ( Yˆ

es insesgado. Su varianza es:

− = = ω h h . 0 h h h h h str . raz K H n ) n N ( X K )) str . e ( Yˆ ( v [7.3] siendo h h h h h . 0 n ) n N ( X H = − , h=1,...,L .

La afijación óptima, que hace mínima esta varianza para un tamaño total de muestra dado igual a n, es:

n ) X N ( X N n h h h h h h

= [7.4]

(25)

de modo que, sustituyendo [7.4] en [7.3], los citados autores obtienen para la varianza del estimador estratificado de razón con muestras equilibradas en cada estrato y afijación óptima, la fórmula:

⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ − = ω (

NX ) X n 1 K )) str . e ( Yˆ ( v 2 h h h opt . str . raz [7.5]

y demuestran que es menor que la varianza del estimador de razón aplicado a una muestra del mismo tamaño, equilibrada en media en el conjunto de la población sin estratificar; abreviadamente: )) e ( Yˆ ( v )) str . e ( Yˆ (

v raz.str.opt ω < razω [7.6] Denotando ahora por De.str la regla que elige una muestra equilibrada en cada

estrato, como resumen del apartado §7.1 , para el estimador de razón se cumple:

{

Yˆraz.str.opt.;De.str.

} {

f Yˆraz;De

}

[7.7] 7.2.1. Comparación con la estrategia seudo-óptima estratificada

Nos proponemos ahora la comparación de la estrategia de razón estratificada con afijación óptima:

{

Yˆraz.str.opt.;De.str.

}

con la estrategia

{

}

^ str str . M ;D Yˆ seudo-óptima estratificada en la que la regla de elección de la muestra D^strse define como:

str ^

D : En cada estrato, si H(YˆM.h(ω^h))<H0.h se elige la muestra seudo-óptima

^ h

ω , y en caso contrario se elige la muestra equilibrada en media ω . he

Tanto en presencia del modelo M2 o del M1 se cumple:

Utilizando el criterio de comparación de estrategias §7.1 , se cumple la siguiente relación de preferencia entre las dos estrategias:

{

^

}

f str str . M ;D Yˆ

{

raz.str.opt;De.str

}

[7.8] Veamos: Por definición de D^str cualquiera que sea X y la clasificación de las

unidades de la población en estratos, teniendo en cuenta que los estimadores de cada estrato: YˆM.h e Yˆraz.h son iguales cuando se utiliza la muestra equilibrada, la primera estrategia de [7.8] es al menos igualmente eficiente que la segunda; por otra parte, los ocho ejemplos que vemos a continuación en §7.2.2 prueban que

(26)

existen casos de magnitud auxiliar X y estratificación en que la varianza del estima-dor utilizado por la primera estrategia es estrictamente menor que la del estimaestima-dor utilizado por la segunda.

7.2.2. Ejemplos

En las ocho poblaciones consideradas en los ejemplos anteriores establecemos una estratificación, función de X, como es lo habitual en la práctica, y tomamos como afijación de la muestra la que es óptima para el estimador de razón.

Los estratos se han formado ordenando las unidades de cada población de me-nor a mayor tamaño (valor de la magnitud auxiliar) de forma que en el estrato h=1 se incluyen las N1 primeras unidades, en el estrato h=2 , las N2 siguientes y así

sucesivamente hasta el estrato h=L en el que se incluyen las NL mayores unidades.

Fijado el número de estratos, el reparto de las unidades de la población los estratos se ha hecho de modo que sea NhXh=cte.;h=1,...,L (con la aproximación posible); de esta forma la afijación óptima [7.4] para el estimador de razón estratificado es igual en todos los estratos: nh=n/L ;h=1,...,L. En los ocho ejemplos que vamos a ver se han formado tres estratos, L=3 , excepto en los ejemplos nº 4 y nº 8 que se han formado dos estratos, L=2.

En todos los ejemplos se cumple:

)) e ( Yˆ ( v )) str . e ( Yˆ ( v )) str ^ ( Yˆ ( v ^)) ( Yˆ (

v Mω < M.str.ω < raz.str.opt.ω < razω [7.9]

teniendo en cuenta que la relación entre las dos últimas varianzas de [7.9] se cumple siempre por lo dicho en §7.2. Notemos que en los ocho ejemplos que analizamos, en todos los estratos la regla D^str elige siempre la muestra

seudo-óptima. Como indicador de la ganancia en precisión calculamos para cada uno de los tres primeros estimadores de [7.9] el porcentaje (G) que supone su desviación típica respecto de la del estimador de razón con muestra equilibrada no estratifica-da (G4=100): ) Yˆ ( H / ) Yˆ ( H 100 ) Yˆ ( v / ) Yˆ ( v 100 G1= 1 4 = 1 4 = =100 v(Yˆ )/v(Yˆ ) G2 2 4 100 H(Yˆ2)/H(Yˆ4) ) Yˆ ( H / ) Yˆ ( H 100 ) Yˆ ( v / ) Yˆ ( v 100 G3= 3 4 = 3 4

(27)

) e ( Yˆ Yˆ ); str . e ( Yˆ Yˆ ); str ^ ( Yˆ Yˆ ^); ( Yˆ

1= Mω 2 = M.str.ω 3 = raz.str.opt.ω 4 = razω

El siguiente Cuadro 1 muestra la estratificación efectuada con los datos de los ejemplos considerados en §3.6.1. y en §5.3. Cuadro 1 Ejemplo N N1 N2 N3 n nh 1 78 40 24 14 24 8 2 52 24 18 10 18 6 3 129 63 44 22 27 9 4 54 43 11 --- 18 9 5 109 63 33 13 21 7 6 304 165 90 49 36 12 7 284 150 90 44 33 11 8 45 31 14 --- 14 7

y el Cuadro 2 presenta los valores de G para los tres estimadores que se compa-ran. En todos los ejemplos se cumple G1<G2<G3<G4=100.

La verificación de las relaciones G2 < G3 , completa la prueba de [7.8].

Cuadro 2 Ejemplo G1 G2 G3 1 66 81 88 2 77 87 92 3 78 86 90 4 41 49 72 5 58 73 79 6 61 82 88 7 59 77 85 8 59 71 88

(28)

7.3. Comparación de las estrategias seudo-óptimas estratificada y no estratifi-cada

Hemos visto en §7.2 que en el caso del estimador de razón con muestras equili-bradas, siempre es mejor el empleo del estimador estratificado con afijación óptima, que sin estratificación. Sin embargo cuando empleamos el estimador YˆM con

muestra seudo-óptima, no necesariamente la estratificación es una opción más eficiente. Esta afirmación queda probada por los ocho ejemplos de §7.2.2. En todos ellos tenemos G1 < G2 . Más concretamente: No podemos afirmar que la estrategia

{

^

}

M;D

Yˆ sea mejor que la estrategia

{

M.str;D^str

}

sino que para un X y una estrati-ficación dados, existen casos en que el estimador no estratificado con muestra seudo-óptima YˆM(ω es más eficiente que el estimador estratificado ^) YˆM.str(ω^str)

con muestras seudo-óptimas en cada estrato y que podemos comprobar este hecho a priori y por tanto adoptar la opción más conveniente.

7.4. Un modelo lineal para cada estrato

Si para una estratificación dada, admitimos un modelo de tipo M2 distinto para cada estrato, con parámetros ah;bh;Kh, que denotamos por M2h , el estimador

= h h . M str . M Yˆ

Yˆ también es insesgado con varianza:

ω = ω h h h . M h str . M ( )) K H(Yˆ ( )) Yˆ ( v [7.10]

Análogamente, la varianza del estimador insesgado de razón con estratificación y muestra equilibrada en cada estrato,es ahora:

= ω h h . 0 h str . raz ( e.str)) K H Yˆ ( v [7.11]

de modo que no es posible efectuar la comparación con estrategias no estratifica-das si suponemos que los valores de K son desconocidos. Estamos en una h

situación análoga si admitimos un modelo M1h , esto es: un modelo de tipo M1 distinto para cada estrato, con parámetros bh;Kh, en cuyo caso las varianzas son:

ω = ω h h h . M h . 1 1 str . M ( )) K H(Yˆ ( )) Yˆ ( v [7.12]

(29)

= ω h h . 0 h . 1 1 str . raz ( e.str)) K H Yˆ ( v [7.13]

indicando con el subíndice 1 que se refieren a un modelo M1h . Veamos algunas conclusiones:

7.4.1 (a) No es posible determinar la afijación óptima para el estimador de razón estratificado ya que ahora en vez de [7.4] será:

n ) X N K ( X N K n h h h h h h h h

=

,

o bien n ) X N K ( X N K n h h h h . 1 h h h . 1 h

=

respectivamente en el modelo M2h o en el modelo M1h , siendo dependientes de los valores desconocidos Kh o K1.h .

7.4.1 (b).- Sin embargo en presencia de un modelo M2h, o de un modelo M1h , para una estratificación y afijación de la muestra dadas, la estrategia seu-do-óptima estratificada es mejor que la estrategia que utiliza el estimador de razón con muestra estratificada equilibrada en cada estrato:

{

^

}

f str str . M ;D Yˆ

{

raz.str.;De.str

}

Veamos esto: De la definición de la regla D^str se deduce que la primera es al

menos igualmente eficiente que la segunda ya que si en un estrato, cualquiera que sea, tomamos ωhhe los estimadores del total del estrato: YˆMhe) y Yˆrazhe) son iguales y por tanto tienen la misma varianza; por otra parte, para ver que existe al menos un caso es que es más eficiente, teniendo en cuenta en el modelo M2h las fórmulas [7.10] y [7.11], o [7.12] y [7.13] en el M1h, hay que comprobar que se cumple al menos en uno de los estratos la desigualdad estricta:

h . 0 h . M ^ h h . M ( )) H H Yˆ ( H ω = < [7.14] de modo que en dicho estrato v(YˆM.h(ω^h))<v(Yˆraz.strhe)). Esta segunda condición se comprueba con los mismos ocho ejemplos de §7.2.2 utilizando la misma estrati-ficación y los mismos tamaños de muestra. Notemos que en todos los ocho ejem-plos se cumple [7.14] no sólo en un estrato, lo que sería suficiente, sino en todos los estratos. El resultado de los cálculos de HM.h y H0.h se presenta en el siguiente

(30)

Cuadro 3:

Ejemplo Estrato-1 Estrato-2 Estrato-3

1 H-Mh 125.934 123.630 72.567 H-0h 164.952 126.504 83.402 2 H-Mh 6.709 7.757 2.963 H-0h 7.869 7.902 3.749 3 H-Mh 200.585 194.727 107.035 H-0h 205.578 205.294 131.514 4 H-Mh 310.276 92.124 H-0h 717.287 143.935 ---5 H-Mh 84---5.107 708.132 206.708 H-0h 897.680 760.169 408.927 6 H-Mh 4.760.177 4.977.673 3.694.051 H-0h 6.041.970 5.211.336 4.438.307 7 H-Mh 839.829 894.841 530.804 H-0h 962.158 944.373 892.857 8 H-Mh 12.623 9.782 H-0h 20.091 14.345

(31)

---ANEXO DE DATOS

.

Los datos de los ejemplos nº 1, 2 y 8 se presentan a continuación. De los res-tantes se dan las referencias.

Ejemplo 3. Empresas de Trabajos de Carpintería metálica en Galicia, con Fac-turación (X) en 2000 mayor de 400 miles de euros. Magnitud Y: Valor añadido en 2001; ambas redondeadas a miles de euros. Fuente: Directorio de Empresas 2003. Consorcio Zona Franca de Vigo.

Ejemplo 4. Empresas de Conservas de pescado y Frutos de mar en Galicia. Magnitud X: Facturación en 2000. Magnitud Y: Valor añadido en 2001; ambas redondeadas a miles de euros. Fuente: Directorio de Empresas 2003. Consorcio Zona Franca de Vigo.

Ejemplo 5. Municipios de Granada mayores de 1000 habitantes. Magnitud X: Población en 2003. Magnitud Y: Superficie de las actividades comerciales minoris-tas, en metros cuadrados. Fuente: Anuario Económico de España 2004. La Caixa.

Ejemplo 6. Datos tomados del libro de Valliant, Dorfman y Royal. (Apéndice B). Condados de Carolina del Norte, Carolina del Sur y Georgia con menos de 100.000 hogares en 1960. Magnitud X: Nº de hogares en 1960. Magnitud Y: Población en 1970.

Ejemplo 7. Datos tomados del libro de Särndal, Swensson y Wretman. (Apéndi-ce B). Municipios de Suecia. Magnitud X: Nº de empleados municipales en 1984 (ME84). Magnitud Y: Rentas de los Impuestos municipales en 1985 (RMT85) en millones de coronas.

(32)

EJEMPLO 1. PRINCIPADO DE ASTURIAS 1986 Concejo X Y Concejo X Y 1 182 298 40 1.940 5.331 2 244 378 41 1.968 4.697 3 261 438 42 1.999 2.975 4 265 574 43 2.004 4.386 5 266 591 44 2.048 3.192 6 311 619 45 2.048 3.279 7 355 889 46 2.130 3.928 8 386 465 47 2.152 3.860 9 439 861 48 2.180 4.805 10 444 605 49 2.333 3.485 11 644 2.831 50 2.348 4.472 12 655 1.010 51 2.421 7.613 13 701 1.228 52 2.426 6.542 14 712 1.340 53 2.458 5.490 15 733 1.411 54 2.588 3.996 16 821 1.474 55 2.648 8.050 17 907 1.458 56 2.649 4.229 18 924 1.295 57 2.659 5.023 19 948 1.910 58 2.948 4.576 20 991 1.503 59 2.974 5.759 21 1.093 1.502 60 3.425 7.587 22 1.192 1.580 61 3.428 5.524 23 1.292 1.445 62 3.464 4.983 24 1.333 1.638 63 3.640 6.714 25 1.336 2.814 64 4.314 8.832 26 1.367 1.987 65 4.388 7.811 27 1.372 2.581 66 4.490 8.831 28 1.375 3.236 67 5.210 4.909 29 1.397 1.720 68 5.510 6.435 30 1.403 2.517 69 6.292 11.935 31 1.414 2.590 70 6.504 13.938 32 1.544 1.948 71 6.568 9.729 33 1.571 2.469 72 6.837 13.605 34 1.580 2.582 73 7.631 10.858 35 1.624 1.999 74 7.809 12.977 36 1.718 3.155 75 8.527 20.055 37 1.763 3.389 76 10.808 18.227 38 1.824 4.296 77 14.876 16.146 39 1.911 3.566 78 15.752 26.161

X: SAU (Superficie Agrícola Utilizada en Hectáreas) Y: Nº de cabezas de ganado vacuno

(33)

EJEMPLO 2. DELEGACIONES PROVINCIALES DEL INSS. 1997 Provincia X Y Provincia X Y 1 25 6.515 27 176 117.288 2 28 6.996 28 177 121.361 3 67 23.162 29 184 123.342 4 76 28.733 30 185 98.615 5 79 42.677 31 194 107.835 6 80 38.690 32 201 91.627 7 83 38.485 33 215 118.077 8 90 31.368 34 215 137.109 9 97 46.617 35 226 143.240 10 100 39.808 36 241 119.473 11 110 54.004 37 248 174.254 12 115 81.470 38 250 141.944 13 118 48.007 39 251 147.504 14 126 85.494 40 263 146.869 15 127 70.491 41 281 183.772 16 134 55.865 42 293 139.150 17 134 59.792 43 312 226.625 18 135 81.621 44 326 172.022 19 137 88.369 45 326 188.500 20 142 75.825 46 336 232.899 21 150 81.394 47 387 225.345 22 151 85.258 48 447 264.546 23 152 76.822 49 463 279.277 24 167 109.170 50 614 383.029 25 175 96.183 51 1.199 754.556 26 176 104.048 52 1.214 969.109

X: Plantilla (nº de personas)

Y: Nº de pensiones que gestionan

(34)

EJEMPLO 8. CAJAS DE AHORROS. DATOS A 31.12.2002 (Continúa) Caja X Y1 Y2 Y3 Y4 1 15 17 67 46.501 198 2 31 22 152 61.930 389 3 37 43 235 73.137 547 4 61 60 243 72.429 726 5 85 94 418 161.042 1.172 6 97 113 522 167.073 2.465 7 110 88 435 155.752 1.802 8 112 78 647 213.148 2.451 9 114 189 682 356.844 4.504 10 138 167 681 282.246 2.412 11 142 413 948 710.806 3.439 12 149 217 886 506.218 3.998 13 166 136 604 297.412 2.571 14 175 221 797 373.391 2.989 15 183 424 1.109 589.159 4.724 16 187 211 792 341.008 2.329 17 192 418 1.840 857.071 9.880 18 202 327 1.278 714.357 5.271 19 212 288 1.232 516.320 5.303 20 214 249 1.160 401.406 4.231 21 215 306 1.397 993.858 6.508 22 217 243 855 398.349 3.406 23 234 316 1.325 561.607 7.526 X: Nº de oficinas

Y1: Nº de cajeros automáticos Y2: Nº de empleados

Y3: Nº de cuentas de acreedores

Y4: Activos (redondeados en millones de euros) Anuario Estadístico de las Cajas de Ahorros. 2002

(35)

EJEMPLO 8. CAJAS DE AHORROS. DATOS A 31.12.2002 (Conclusión) Caja X Y1 Y2 Y3 Y4 24 236 196 1.063 630.010 3.868 25 244 316 1.250 416.663 4.583 26 281 318 1.283 455.550 3.626 27 325 735 2.579 1.241.737 14.502 28 350 422 1.683 1.027.806 7.249 29 359 507 2.373 805.789 7.869 30 377 430 2.119 772.066 6.115 31 400 336 2.330 1.159.535 10.356 32 433 482 2.101 844.796 6.492 33 436 474 2.277 1.320.853 8.340 34 448 365 2.399 902.605 8.104 35 536 591 2.128 1.320.149 7.718 36 539 559 2.751 1.035.355 12.691 37 561 666 2.447 950.061 10.775 38 699 840 3.456 1.764.884 24.638 39 764 921 4.292 1.977.118 14.614 40 788 1.169 4.652 2.570.652 23.555 41 810 1.453 5.356 2.687.047 22.183 42 943 801 4.310 2.026.697 16.404 43 961 1.243 4.982 2.478.887 28.243 44 1.874 3.619 11.792 5.347.568 70.156 45 4.553 6.780 21.124 9.559.469 95.845 X: Nº de oficinas

Y1: Nº de cajeros automáticos Y2: Nº de empleados

Y3: Nº de cuentas de acreedores

Y4: Activos (redondeados en millones de euros) Anuario Estadístico de las Cajas de Ahorros. 2002

(36)

REFERENCIAS

BREWER K. R. W. (1963). «Ratio estimation and finite populations: Some results deducible from the assumption of an underlyng stochastic process». Aust. J.

Statist. 5. 93-105.

CHAMBERS, R. (2003). «An Introduction to Model-based Survey Sampling». Instituto

vasco de Estadística.

COCHRAN, W. G. (1946). «Relative accuracy of systematic and stratified samples for a certain class of populations». Ann. Math. Statist. 17. 164-177.

GINI, C. Y GALVANI, L. (1929). «Di una applicazione del metodo rappresentativo all´ultimo censimento Italiano della popolazione (1º diciembre 1921)». Annali di

Statistica, Serie 6, v. 4. 1-107.

MADOW, W. G. (1953). «On the Theory of Systematic Sampling, III. Comparison of Cen-tered and Random Start Systematic Sampling». Ann. Math. Statist. 24, 101- 106. MDOW, W. G. (1978). «Comments on papers by Base and Royal and Cumberland».

Survey Sampling and Measurement. Academic Press. Pages. 315- 322.

NEWMAN, J. (1934). «On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection». Jour.

Roy. Stat. Soc.,97.Págs. 558-606.

ROYAL, R. M. (1970). «On finite population sampling theory under certain linear regression models». Biometrica 57, no. 2, 377-387.

ROYAL, R. M. Y HERSON, J. (1973a). «Robust estimation in finite populations I». J.

Amer. Statist. Assoc. 68, Pages. 880-889.

ROYAL, R. M. Y BERNHARD, K. R. (1975). «Variance estimates for the ratio estimator».

Sanilla, ser. C37, PTT. 1, 43-52.

RYAL, R. M. Y CUMBERLAND, W. G. (1978). «An empirical study of prediction theory in finite population sampling: simple random sampling and the ratio estimator».

Survey Sampling and Measurement. Edited by N. Krishnan Namboidiri. Aca-demic Press. 1978.

ROYAL, R. M. (1988). «The prediction approach to sampling theory». Handbook of

Statistics, vol. 6 . Págs. 399-413.

SÄRNDAL, SWENSSON Y WETMAN (1992). «Model Assisted Survey Sampling». Springer. VALLIANT, DORFMAN Y ROYAL (2000). «Finite Population Sampling and Inference. A

Prediction Approach». Wiley.

(37)

STATISTICAL INFERENCE ON FINITE POPULATIONS WITH PUR-POSIVE SAMPLES

ABSTRACT

In the context of purposive sampling, with previous knowledge of an auxiliary magnitude X in the stochastic model Yi=a+bXii; b>0;E(εi)=0,V(εi)=KXi,∀i;E(εiεj)=0 ,∀i≠j, we look for more effi-cient strategies than these which is made for the ratio estimator with a balanced sample in mean, in both case: a=0 (M1 model) ; a≠ (M2 0 model).

Key words: purposive sampling, superpopulation models.

Referencias

Documento similar

Volviendo a la jurisprudencia del Tribunal de Justicia, conviene recor- dar que, con el tiempo, este órgano se vio en la necesidad de determinar si los actos de los Estados

Puesto que la familia es el contexto más influyente y determinante para ellos, se analizará qué consecuencias tiene que la lectura sea valorada y considerada

Primeros ecos de la Revolución griega en España: Alberto Lista y el filohelenismo liberal conservador español 369 Dimitris Miguel Morfakidis Motos.. Palabras de clausura

&#34;No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

Habiendo organizado un movimiento revolucionario en Valencia a principios de 1929 y persistido en las reuniones conspirativo-constitucionalistas desde entonces —cierto que a aquellas

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación