• No se han encontrado resultados

Unidad 5. Muestreo Sistemático

N/A
N/A
Protected

Academic year: 2021

Share "Unidad 5. Muestreo Sistemático"

Copied!
17
0
0

Texto completo

(1)

UNIDAD 5

UNIDAD 5

MUESTREO SISTEMÁTICO

MUESTREO SISTEMÁTICO

El muestreo irrestricto aleatorio (m.i.a) y el muestreo aleatorio estratificado (m.a.e) requieren El muestreo irrestricto aleatorio (m.i.a) y el muestreo aleatorio estratificado (m.a.e) requieren de un trabajo detallado en el proceso de selección de la muestra. Porque las unidades de de un trabajo detallado en el proceso de selección de la muestra. Porque las unidades de muestreo en el marco adecuado deben de ser numeradas de modo que un mecanismo de muestreo en el marco adecuado deben de ser numeradas de modo que un mecanismo de aleatorización, como una tabla de números aleatorios, pueda utilizarse para seleccionar aleatorización, como una tabla de números aleatorios, pueda utilizarse para seleccionar unidades específicas de la muestra. Un diseño de muestreo que se utiliza frecuentemente unidades específicas de la muestra. Un diseño de muestreo que se utiliza frecuentemente porque simplifica el proceso de selección de la muestra es el muestreo sistemático (m.s). porque simplifica el proceso de selección de la muestra es el muestreo sistemático (m.s).

5.1.-PRESENTACIÓN DEL MUESTREO SISTEMATICO

5.1.-PRESENTACIÓN DEL MUESTREO SISTEMATICO

El muestreo sistemático es un proceso de selección regular cuyo punto de inicio es aleatorio, El muestreo sistemático es un proceso de selección regular cuyo punto de inicio es aleatorio, tomando un elemento de los k primeros elementos y posteriormente la selección de cada tomando un elemento de los k primeros elementos y posteriormente la selección de cada k-ésimo elemento, este tipo de muestreo es mas fácil de realizar y esta menos expuesto a ésimo elemento, este tipo de muestreo es mas fácil de realizar y esta menos expuesto a errores del encuestador.

errores del encuestador.

La muestra sistemática se define como una muestra obtenida al seleccionar aleatoriamente La muestra sistemática se define como una muestra obtenida al seleccionar aleatoriamente un elemento de los primeros k elementos en el marco y después cada k-ésimo elemento se un elemento de los primeros k elementos en el marco y después cada k-ésimo elemento se denomina muestra sistemática de 1 en k.

denomina muestra sistemática de 1 en k.

Por ejemplo, suponga que va a seleccionarse una muestra de n nombres de una larga lista; Por ejemplo, suponga que va a seleccionarse una muestra de n nombres de una larga lista; una forma sencilla de seleccionarlos es, eligiendo un intervalo apropiado (dependiendo de n) una forma sencilla de seleccionarlos es, eligiendo un intervalo apropiado (dependiendo de n) y seleccionar los nombres a lo largo de la lista. De ese modo si k=10, se escoge un numero y seleccionar los nombres a lo largo de la lista. De ese modo si k=10, se escoge un numero aleatorio entre los 10 primeros elementos, suponga que fue el 4 (selección aleatoria), el aleatorio entre los 10 primeros elementos, suponga que fue el 4 (selección aleatoria), el siguiente elemento sería el 14 luego el 24 y así sucesivamente se toma una observación siguiente elemento sería el 14 luego el 24 y así sucesivamente se toma una observación cada 10 elementos.

cada 10 elementos.

Las ventajas del muestreo sistemático son las siguientes: Las ventajas del muestreo sistemático son las siguientes:

1

1 El muestreo El muestreo sistemático es fácil de sistemático es fácil de realizarse en el realizarse en el campo y campo y por su por su forma de forma de llevarse allevarse a

cabo está menos expuesto a los errores de selección que cometen los investigadores. cabo está menos expuesto a los errores de selección que cometen los investigadores.

2

2 El El muestreo sistemático puede muestreo sistemático puede proporcionar mayor proporcionar mayor informaciinformación ón por unidad por unidad de de costocosto

que la que proporciona el muestreo irrestricto aleatorio ya que se extiende más que la que proporciona el muestreo irrestricto aleatorio ya que se extiende más uniformemente sobre toda la población y por lo tanto puede proporcionar mayor uniformemente sobre toda la población y por lo tanto puede proporcionar mayor información que una muestra equivalente en tamaño, tomada con muestreo irrestricto información que una muestra equivalente en tamaño, tomada con muestreo irrestricto

(2)

Una consideración importante en el muestreo sistemático es que su precisión depende del orden de las unidades de muestreo en el marco, ya que si estas están dispuestas de manera aleatoria entre todos los demás entonces la ventaja se pierde y resulta equivalente al irrestricto aleatorio.

Otros ejemplos del uso del muestreo sistemático se dan cuando se realiza la selección de cada k- esimo cuestionario de un censo, para su validación; cada k-esimo renglón de un libro para su revisión; o cada k-esima manzana de mapas numerados. Las ventajas mencionadas se acentúan cuando se le encarga a un enumerador la selección de las unidades de muestreo. Su instrucción puede consistir en que liste las viviendas de una manzana y que seleccione posteriormente las unidades numeradas r, r+k, r+2k etc. (r es el punto de partida). También puede servir para supervisar el trabajo de un enumerador, durante el levantamiento de cuestionarios en un censo, de modo que cada décimo cuestionario sea verificado.

La ventaja de que el muestreo sistemático produce muestras proporcionales se puede apreciar al seleccionarla de una lista de nombres en orden alfabético producirá aproximadamente la misma proporción de nombres de cada letra, o también en el caso de los auditores que requieren muestrear de una larga lista ordenadas en el tiempo, de cuentas para comprobar el cumplimiento de los procedimientos de contabilidad.

Los investigadores de mercado y los encuestadores, que regularmente muestrean personas en movimiento, frecuentemente utilizan un diseño sistemático, por ejemplo a cada vigésimo cliente en un mostrador de pago se le puede preguntar su opinión acerca del sabor, color o textura de un producto alimenticio o a cada décima persona que aborde un autobús se le puede pedir que responda un cuestionario acerca del servicio del autobús.

Los ingenieros agrónomos pueden muestrear sistemáticamente parcelas de terreno para estimar proporción de árboles enfermos o para estudiar patrones de crecimiento. Todas estas muestras son sistemáticas.

5.2.-OBTENCIÓN DE UNA MUESTRA SISTEMATICA

Los métodos para seleccionar los datos en un muestreo irrestricto aleatorio y en un muestreo sistemático son muy diferentes, en el primer caso se seleccionan con una tabla de números aleatorios y en el sistemático solamente el primer elemento se selecciona al azar entre los primeros k elementos y luego se seleccionan los demás de 1 en k hasta que se complete la

(3)

muestra.

Las muestras sistemáticas se seleccionan de 1 en 3 o de 1 en 5 en general de 1 en k, ahora ¿cómo se selecciona el número k? Sabiendo que N es conocido y se puede determinar el tamaño de “n”, entonces k debe de ser un número aleatorio menor o igual que N/n o sea:

n

 N 

 ≤

Posteriormente se selecciona cada k-esimo elemento a partir del punto de inicio hasta completar el tamaño de muestra n

Cuando N es desconocido la selección de k generalmente se supone para poder obtener una muestra de tamaño “n” pero si “k” se selecciona muy grande, el tamaño de “n” que se requiere no se podrá obtener utilizando una muestra sistemática de 1 en k de la población.

Ejemplo.

En una preparatoria de 2998 estudiantes repartidos en tres grados se desea conocer la opinión de los estudiantes sobre la utilidad del evento “feria del libro” que se realiza cada fin de curso. Se puede tener la lista de los estudiantes ordenados por grado, si optamos por un muestreo irrestricto aleatorio, posiblemente obtengamos mayor cantidad de estudiantes de primer grado cuya opinión será muy diferente a la de los estudiantes del segundo y del tercer grado, ya que por las fechas en las que se realiza el evento, los estudiantes del primer grado no tienen ninguna experiencia previa y esto daría una estimación deficiente y alejada de la realidad, en cambio con un muestreo sistemático se tendrían elementos proporcionales de los tres grados.

Si seleccionamos una muestra del 10% de los estudiantes, tendremos un intervalo muestral de k=10. Si el número al azar entre 1 y 10 es 4 los estudiantes con los números:

4, 14, 24, 34, 44, 54,……2994

conformarán la muestra. Si el número seleccionado al azar es el 9, entonces la muestra se integraría con los estudiantes listados con los números

9, 19, 29, 39, 49, 59,……2989

En la primera muestra se tienen 300 estudiantes y en la segunda solamente 299. El tamaño de la muestra puede diferir en una unidad cuando N no es exactamente divisible entre k.

(4)

suponer el valor de k necesario para obtener un tamaño de muestra n. Si se selecciona un valor de k muy grande, el tamaño de muestra n requerida no se obtendrá usando una muestra sistemática de 1 en k de la población. Este resultado no presenta problema si el experimentador puede volver a la población y realizar otra muestra sistemática de 1 en k hasta obtener el tamaño requerido. Sin embargo en algunas situaciones, obtener una segunda muestra sistemática es imposible. Por ejemplo, tomar una muestra sistemática de 1 en 40 compradores de periódicos, es prácticamente imposible, si el tamaño de la muestra es de n=90 compradores y no se obtiene en el tiempo que los compradores pasan por la esquina.

5.3.-ESTIMACIÓN DE UNA MEDIA, DE UN TOTAL Y DE UN PROPORCIÓN

POBLACIONAL

Sabemos que el objetivo de las encuestas por muestreo es estimar uno o más parámetros de la población. Para estimar una media poblacional se puede utilizar la media muestral

 y

de una muestra sistemática.

Estimador de la media poblacional µ

n  y  y n i i  s

=

=

=

1 ˆ µ 

Varianza estimada de

 y

 s

 

 

 

  −

=

 N 

n

 N 

n

 s

 y

 s 2 ) ( ˆ en donde 1 1 2 1 2 2 −           − =

= = n n  y  y  s n i n i i i o también 1 1 2 2 2 − − =

= n  y n  y  s n i i

Limite para el error de estimación

 

 

 

  −

=

 N  n  N  n  s  y v  s 2 2 ) ( ˆ

2  Con una probabilidad del 95%

Cuando N se desconoce se elimina el factor de corrección por población finita (c.p.f) de las ecuaciones anteriores.

(5)

Estimación de un total poblacional

La estimación de un total poblacional requiere del conocimiento del total de elementos N de la población, de manera semejante a lo que se hizo en el muestreo irrestricto aleatorio y en el aleatorio estratificado, para estimar

τ 

en el muestreo sistemático, se utiliza la siguiente relación:

Estimador del total poblacional

τ 

:

 s  s

=

 N 

y

τ ˆ

Varianza estimada de

τ 

 s

:

( ) ( )

 

 

 

  −



 

 



 

 

=

=

=

 N 

n

 N 

n

 s

 N 

 y

 N 

 y

 N 

 s  s  s 2 2 2

)

(

ˆ

ˆ

ˆ τ 

Límite para el error de estimación

:

 

 

 

  −



 

 



 

 

=

=

 N 

n

 N 

n

 s

 N 

 y

 N 

 B

 s 2 2

2

)

(

ˆ

2

con el 95% de confianza

Es importante notar que se necesita conocer el valor de N para poder estimar

τ

cuando se usa un muestreo sistemático.

Estimador de una proporción poblacional

Es común que se desee estimar una proporción poblacional con base en los datos de una muestra sistemática, en este caso al igual que en el muestreo irrestricto aleatorio las propiedades de la proporción

 pˆ

 s  son similares a la de la media muestral

 y

 s, considerando que las respuestas se miden de la siguiente manera:

yi = 1 si el elemento muestreado posee la característica de interés

yi = 0, si no posee la característica

Por lo que el estimador es el promedio de las respuestas 0 y 1 de la muestra.  Así el

estimador de una proporción poblacional

 es:

n

 y

 y

 p

n i i  s  s

=

=

=

1

ˆ

(6)

Varianza estimada de

 pˆ

 s

es:

 

 

 

  −

=

 N 

n

 N 

n

q

 p

 p

 s  s s

1

ˆ

ˆ

)

ˆ

(

ˆ

en donde:  s  s

p

q

ˆ

=

1

ˆ

Límite para el error de estimación es:

 

 

 

  −

=

=

 N 

n

 N 

n

q

 p

 p

 B

 s s  s

1

ˆ

ˆ

2

)

ˆ

(

ˆ

2

con el 95% de confianza

Recuérdese que cuando el tamaño de la población es desconocido entonces se omite el cpf, suponiendo a N relativamente grande con respecto a “n”.

Observación

Una observación pertinente en la estimación de los parámetros anteriores, es que la varianza de

 y

 ses idéntica a la varianza estimada de

 y

, obtenida por muestreo irrestricto aleatorio, esto no implica que las varianzas poblacionales sean iguales, ya que la varianza de

 y

 esta dada por la relación:

 

 

 

 

=

1 ) ( 2

 N 

n

 N 

n

 y

σ 

y la varianza de  y  esta dada por la relación: s

[

 ρ 

]

σ 

)

1

(

1

)

(

2

+

=

n

n

 y

 s

en donde

 ρ 

  es una medida de la correlación entre los pares de elementos dentro de la misma muestra sistemática.

  Cuando

 ρ 

  está cercano a uno, significa que los elementos muestrales son muy parecidos con respecto a la característica que se esta midiendo y por lo tanto la varianza de la media muestral sistemática será mayor que la que produciría el muestreo irrestricto aleatorio.

Si

 ρ 

  es negativo entonces se pensaría que los elementos muestrales son extremadamente diferentes y así el muestreo sistemático podría ser mejor que el irrestricto aleatorio, una observación importante es que

 ρ 

  no puede ser tan negativamente grande como para que la varianza pueda ser negativa.

(7)

Por último si

 ρ 

 esta cercano a cero y N lo bastante grande el muestreo sistemático es aproximadamente equivalente al irrestricto aleatorio.

Es importante señalar que un estimador insesgado de V ( y s)no puede ser obtenido usando solamente los datos de una muestra sistemática, sin que esto implique que nunca se pueda estimar la V ( y s), ya que en ocasiones el muestreo sistemático es equivalente al irrestricto aleatorio y pueden usarse las estimaciones de la varianza.

El éxito del muestreo sistemático con relación al irrestricto aleatorio o con respecto al estratificado, depende mucho de las propiedades de la población.

En algunas poblaciones el muestreo sistemático es extremadamente preciso y en otras resulta menos preciso, ya que dependiendo de la población y de algunos valores de n, la

) ( y s

V  puede incrementarse aun al tomar una muestra grande, por lo tanto, es muy difícil dar un consejo general respecto a las distintas situaciones en donde se pueda utilizar un muestreo sistemático, para ello es necesario conocer la estructura de la población para usarlo de manera efectiva.

 Ahora, es importante aclarar que la correlación que se da entre los pares de elementos dentro de una muestra sistemática depende del tipo de población de donde se seleccione la muestra.

Para ello se consideran tres tipos de poblaciones:

1 Población aleatoria 2 Población ordenada 3 Población periódica

La población aleatoria es aquella en que sus elementos están ordenados al azar.

Cuando una muestra sistemática se selecciona de una población aleatoria, se espera que sus elementos sean heterogéneos y que no tengan correlación entre valores vecinos con

0

=

 ρ    por lo que la varianza de  y es aproximadamente igual a la de  y , por lo que ambos s tipos de muestreo resultan equivalentes.

La población ordenada  es aquella cuyos elementos están ordenados en magnitud de acuerdo a algún esquema.

(8)

heterogénea con  ρ 

0 y si N es grande puede demostrarse que V ( y s)≤ V ( y)por lo que una muestra sistemática de una población ordenada proporciona mas información que una muestra irrestricta aleatoria por unidad de costo. Por ejemplo una lista de las cuentas por cobrar pueden estar ordenadas de mayor a menor cantidad, así la estimación de la muestra sistemática podría tener una varianza menor (generalmente inestimable) que la de de una m.i.a; ya que barre con todos los valores de las cuentas.

Como no podemos obtener una estimación de V ( y s)con base en los datos de una muestra, una estimación conservadora de dicha varianza es:

 

 

 

  −

=

 N 

n

 N 

n

 s

 y

 s 2

)

(

La población periódica es aquella cuyos elementos tienen variación cíclica.

Cuando una muestra sistemática es seleccionada de una población periódica, la efectividad del muestreo sistemático depende del valor de k.

Los elementos de este tipo de muestra pueden ser homogéneos (  ρ 

>

0) y cuando esto se da )

( y s

V  ≥ V ( y) y en este caso el muestreo sistemático proporciona menos información que el irrestricto aleatorio por unidad de costo.

Una forma de abatir este problema es cambiando varias veces el punto de inicio aleatorio y de esta manera se reduce la posibilidad de seleccionar observaciones con la misma posición relativa en una población periódica. Lo anterior tiene el efecto de mezclar los elementos de la población y al mismo tiempo el de seleccionar una sola muestra sistemática. Esto nos permite suponer que la muestra obtenida es equivalente a una muestra sistemática obtenida de una población aleatoria, entonces la varianza V ( y s)puede aproximarse usando la relación:

 

 

 

  −

=

 N 

n

 N 

n

 s

 y

 s 2

)

(

ˆ

Si hay una variación periódica en la población debemos de tener cuidado en el uso del muestreo sistemático. Por ejemplo si los hombres y las mujeres se alternan en una lista y k 

es par, la muestra sistemática solo tendrá hombres o solo mujeres, por lo que la estimación no sería representativa del parámetro.

(9)

Ejercicio 1

La sección de control de calidad de una empresa usa el muestreo sistemático para estimar la cantidad promedio de llenado de latas de 12 onzas que sale de una línea de producción. Los datos de la tabla adjunta representan una muestra sistemática de 1-en-50 de la producción de un día. Estime

µ

y establezca un límite para el error de estimación. Suponga que N = 1800

Cantidad de llenado (en onzas)

12.00 11.97 12.01 12.03 12.01 11.80 11.91 11.98 12.03 11.98 12.00 11.83 11.87 12.01 11.98 11.87 11.90 11.88 12.05 11.87 11.91 11.93 11.94 11.89 11.72 11.93 11.95 11.97 11.93 12.05 11.85 11.98 11.87 12.05 12.02 12.04 Solución:

La estimación de

µ

esta dada por

onzas n  y  y n i i  s 11.94 36 01 . 430 1

=

=

=

=

Para estimar el límite para el error de estimación, primero se calcula s 2

0063 . 35 2199 . 0 35 36 6 . 184908 57 . 5136 1 1 2 1 2 2

=

=

=

 

 

 

 

=

= = n n  y  y  s n i n i i i

Suponemos que la población de latas en una línea de producción, es una población aleatoria, entonces la varianza la estimaremos con:

00017 . 0 1800 36 1800 36 0063 . ) ( ˆ 2

=

 

 

 

 

=

 

 

 

  −

=

 N  n  N  n  s  y V   s

Y el límite para el error de estimación al 95% de confianza, sería: 0262 . 00017 . 2 ) ( ˆ 2 V  y s

=

=

(10)

En resumen estimamos que el promedio de llenado de latas de 12 onzas es de 11.94 onzas, y el límite para el error de estimación con un 95% de confianza es de 0.0262 por lo que la verdadera media del parámetro se debe de encontrar en el siguiente rango de valores (11.91,11.97) onzas.

Ejercicio 2

La empresa del caso anterior desea estimar el total de líquido utilizado en la línea de producción que se muestreo. Estime el total poblacional de la producción de un día con un límite para el error de estimación.

onzas

 y

 N 

 s  s

1800

(

11

.

94

)

21492

.

ˆ

=

=

=

τ 

 Ahora el límite para el error de estimación al 95% de confianza sería:

94

.

46

)

00017

.

0

(

)

1800

(

2

)

(

ˆ

2

)

(

ˆ

2

 N 

 y

 s

=

 N 

2

y

s

=

2

=

Ejercicio3

La gerencia de una compañía constructora está interesada en estimar la proporción de sus empleados de albañilería que favorecen una nueva política de la empresa de realizar los pagos de sus salarios mensualmente, a diferencia de la política anterior de pagos semanales. Se cuenta con una lista de los empleados referidos, en orden alfabético por lo que suponen que el comportamiento es el de una población aleatoria. Realizan una muestra sistemática de 1 en 10 de los empleados y los resultados de la encuesta para conocer quienes son los que favorecen la nueva política se dan en la tabla adjunta; estime la proporción de ellos sabiendo que se cuenta con 2000 trabajadores de albañilería y establezca un límite para el error de estimación.

Empleado muestreado Respuesta

3 1 13 0 23 1 : : : : 1997 1 132 200 1

=

= i i  y

(11)

Respuesta:  pˆ

=

0.66, B=0.0637.

5.4.-TAMAÑOS DE MUESTRA PARA ESTIMAR MEDIAS TOTALES Y PROPORCIONES

Para determinar el número de observaciones requeridas para estimar una media poblacional con un límite para el error de estimación B determinado, se encuentra despejando n de la relación siguiente:

)

ˆ

(

2

 s

 B

=

θ 

Para cualquiera de los estimadores

θ ˆ

 s (media, total o proporción poblacional) basados en un muestreo sistemático. Pero esta ecuación involucra a σs2 y ρ que deben de ser conocidas o

al menos poderlas estimar de estudios previos, en estas notas utilizaremos la fórmula para calcular n que se uso en el muestreo irrestricto aleatorio, pero considerando que esta fórmula podría dar una muestra muy grande cuando la población es ordenada y una muestra muy pequeña para poblaciones periódicas. Recuérdese que las varianzas de  y sy de  y son equivalentes cuando la población es aleatoria.

Tamaño de muestra requerido para estimar una media poblacional 

µ

con un límite para el error de estimación de B: 2 2 ) 1 ( σ  σ 

+

=

 D  N   N  n en donde: 4 2  B  D =

Nota

: σ2  puede aproximarse con s2, a partir de una muestra piloto o por estudios previos similares o bien

4

2

  Rango

σ  . En cualquier caso n será un valor aproximado. Si N es grande, como comúnmente ocurre, el (N-1) puede ser reemplazado por N.

Para determinar el tamaño de muestra requerido para estimar un total poblacional 

τ 

con un límite para el error de estimación de B:

2 2

)

1

(

σ 

σ 

+

=

 D

 N 

 N 

n

en donde: 2 2

4 N 

 B

 D

 =

El tamaño de muestra requerido para estimar una  proporción poblacional p con un límite para el error de estimación de B, será:

(12)

 pq

 D

 N 

 Npq

n

+

=

)

1

(

  en donde: q = 1- p y

4

2

 B

 D

 =

Hay ocasiones en donde se desconoce el valor de p y se estima de estudios previos pero cuando estos no existen lo ideal es suponer un valor de p=0.5 que nos proporcionará un tamaño de muestra conservador, que será probablemente mayor que el requerido.

En general para determinar el tamaño de muestra n se necesita conocer el error de estimación B, la varianza σ2 y el nivel de confianza 1-α.

Ejercicio 4.

Usando la información del ejercicio 1 determine el tamaño de muestra requerido para estimar µ con un límite para el error de estimación de 0.015 unidades.

Solución: Si B= 0.015 entonces: 0.00005625 4 ) 015 . 0 ( 4 2 2 = = = B  D

Como σ2 No se conoce se estima con s2

 Asi: 105.49 106 0063 . 0 ) 00005625 . 0 )( 1799 ( ) 0063 . 0 ( 1800 ) 1 ( 2 2

=

+

=

+

=

σ  σ   D  N   N  n latas

Ejercicio 5.

Determine el tamaño de muestra requerido para estimar

τ 

,

con los datos del ejercicio 2, con un límite para el error de estimación de 30 unidades. Resp. n=87 latas

Ejercicio 6.

Para la situación referida en el ejercicio 3, determine el tamaño de muestra requerido para estimar p con un límite para el error de estimación del 5%. ¿Qué tipo de muestra sistemática deberá de obtenerse? Resp. n=305 albañiles

5.5.- MUESTREO SISTEMÁTICO REPLICADO.

Este tipo de muestreo permite al experimentador estimar la media y un total poblacional con sus respectivas varianzas sin hacer ningún supuesto acerca de la naturaleza de la población. Recordemos que no se puede estimar la varianza de con base en la información contenida en una sola muestra sistemática, a menos que el muestreo sistemático genere una muestra aleatoria. Sin embargo en la mayoría de los casos el muestreo aleatorio sistemático no es

(13)

equivalente al irrestricto aleatorio, entonces es aconsejable utilizar un método alternativo para estimar la varianza V ( y), este método alternativo es el muestreo

sistemático

replicado.

Este método consiste en seleccionar varias muestras sistemáticas o replicas y así poder estimar la media poblacional �, como el promedio de todas las medias muestrales , la estimación de la varianza V ( y) utilizando el cuadrado de las desviaciones de cada una de las medias muestrales individuales alrededor de su media poblacional.

Para seleccionar nS muestras sistemáticas replicadas se separan más los elementos de cada

muestra. Por lo que 10 muestras de 1 en 50 (nS=10, k’=50) de 6 mediciones cada una,

contiene el mismo número de mediciones que una sola muestra de de 1 en 5 (k=5) conteniendo n=60 mediciones. El punto de inicio para cada una de las n S  muestras

sistemáticas es seleccionado aleatoriamente de entre los primeros k’ elementos. Los elementos restantes en cada muestra son obtenidos adicionando k’, 2k’ y así sucesivamente, al punto de inicio hasta que el número total por muestra, n/nS es obtenido.

Ejemplo.

Si tenemos una población de N=960 elementos y queremos seleccionar una

muestra sistemática de 60 elementos entonces 16 60 960

=

=

k   o sea una muestra de 1 en 16 elementos, se selecciona un número al azar de los primeros 16 elementos y este sería el punto de inicio de la muestra.

 Ahora si queremos seleccionar 10 muestras sistemáticas replicadas de esa misma población, primero seleccionamos un valor de k’, de manera que k’=knS, en donde nS es el número de

muestras sistemáticas que queremos seleccionar. Así para nuestro ejemplo k’=10k=10(16)=160.

Inmediatamente después seleccionamos 10 números aleatorios entre 1 y 160 y la constante k’=160, es la que se le adiciona a cada uno de estos 10 números que serán los puntos de inicio aleatorio de las muestras, hasta que se obtienen 10 muestras de tamaño 6, por ello siempre obtendremos 60 elementos.

Una selección de 10 números aleatorios entre 1 y 160 es:

(14)

Si se utilizan como puntos de inicio entonces las muestras quedarían así: Punto de inicio aleatorio 2º elemento muestral 3º elemento muestral 6º elemento muestral 6 166 326 ……… 806 17 177 337 ……… 817 21 181 341 ……… 821 42 202 362 ……… 842 73 233 393 ……… 873 81 241 401 ……… 881 86 246 406 ……… 886 102 262 422 ……… 902 112 272 432 ……… 912 145 305 465 ……… 945

Es común que nS=10 ya que permite obtener suficientes medias muestrales para obtener una

estimación satisfactoria de V (µ ˆ)

Las formulas para estimar �S con nS muestras sistemáticas se dan a continuación:

Estimador de la media poblacional usando n

S

 muestras sistemáticas de 1 en k’

=

=

n s i s i

n

 y

1

ˆ

µ 

en donde representa el promedio de la i-ésima muestra sistemática.

Varianza estimada de

)

1

(

)

ˆ

(

)

ˆ

(

ˆ

1 2

 

 

 

  −

=

=  s  s n i i

n

n

 y

 N 

n

 N 

 s

µ 

µ 

El límite para el error de estimación al 95% de confianza es:

) ˆ ( ˆ 2 V  µ   B

 =

(15)

También se puede utilizar el muestreo sistemático replicado para estimar un total poblacional

τ

, si N es conocida, con las siguientes relaciones:

Estimador del total poblacional usando n

S

 muestras sistemáticas de 1 en k’

=

=

=

n s i s i

n

 y

 N 

1

ˆ

ˆ

µ 

τ 

Varianza estimada de :

)

1

(

)

ˆ

(

)

ˆ

(

ˆ

)

ˆ

(

ˆ

1 2 2 2

 

 

 

  −

=

=

=  s  s n i i

n

n

 y

 N 

n

 N 

 N 

 N 

 s

µ 

µ 

τ 

El límite para el error de estimación al 95% de confianza es:

) ˆ ( ˆ 2 V τ   B

 =

Ejercicio 7

Un parque estatal cobra la admisión por automóvil en lugar de por persona y un funcionario del parque quiere estimar el número promedio de personas por automóvil para un día efectivo en particular durante el verano. El funcionario sabe por experiencia que entrarán al parque alrededor de 400 automóviles y quiere muestrear 80 de ellos. Para obtener una estimación de la varianza, utiliza el muestreo sistemático replicado con 10 muestras de 8 automóviles cada una. Usando los datos que se presentan en la tabla, estime el número promedio de personas por automóvil y establezca un límite para el error de estimación

Punto de inicio aleatorio Segundo elemento Tercer elemento Cuarto elemento Quinto elemento Sexto elemento Séptimo elemento Octavo elemento 2(3) 52(4) 102(5) 152(3) 202(6) 252(1) 302(4) 352(4) 3.75 14.06 5(5) 55(3) 105(4) 155(2) 205(4) 255(2) 305(3) 355(4) 3.38 11.42 7(2) 57(4) 107(6) 157(2) 207(3) 257(2) 307(1) 357(3) 2.88 8.29 13(6) 63(4) 113(6) 163(7) 213(2) 263(3) 313(2) 363(7) 4.62 21.34 26(4) 76(5) 126(7) 176(4) 226(2) 276(6) 326(2) 376(6) 4.50 20.25 31(7) 81(6) 131(4) 181(4) 231(3) 281(6) 331(7) 381(5) 5.25 27.56 35(3) 85(3) 135(2) 185(3) 235(6) 285(5) 335(6) 385(8) 4.50 20.25 40(2) 90(6) 140(2) 190(5) 240(5) 290(4) 340(4) 390(5) 4.12 16.97

(16)

46(6) 96(5) 146(4) 196(6) 246(3) 296(3) 346(5) 396(3) 4.38 19.18

Totales 41.63 177.41

Los datos del número de personas por automóvil yi está en el paréntesis.

El valor de k en una muestra sistemática sería:

5 80 400

=

=

=

n  N  k 

Entonces para 10 muestras nS=10 el valor de k’ será: k’=10k=10(5)=50

Por lo que se escogen 10 números aleatorios entre el 1 y el 50 que fueron: 13, 35, 2, 40, 26, 7, 31, 45, 5, 46

Los automóviles con estos números forman los puntos de inicio aleatorio para las muestras sistemáticas.

Observe en la tabla la cantidad es el promedio de personas por automóvil para la primera muestra (fila), es el promedio para la segunda muestra y así sucesivamente entonces la estimación de µ será:

16

.

4

10

38

.

4

...

38

.

3

75

.

3

(

ˆ

1

=

+

+

+

=

=

=  s n i s i

n

 y

µ 

Realicemos ciertos cálculos previos para estimar la varianza

= = =

 



 



 

 

=

 s s s n i n i n i i  s i i

y

n

 y

 y

1 1 2 1 2 2

1

)

ˆ

(

µ 

Sustituyendo:

=

=

=

 s n i i

 y

1 2 2

104

.

4

)

63

.

41

(

10

1

41

.

177

)

ˆ

(

µ 

Por lo tanto la varianza estimada de será:

0365

.

0

)

9

(

10

104

.

4

400

80

400

)

1

(

)

ˆ

(

)

ˆ

(

ˆ

1 2

=

 

 

 

 

=

 

 

 

  −

=

=  s  s n i i

n

n

 y

 N 

n

 N 

 s

µ 

µ 

Entonces el límite para el error de estimación sería:

38

.

0

0365

.

0

2

=

=

 B

(17)

Por lo que decimos que nuestra mejor estimación del promedio de personas por automóvil es de 4.16 personas, por lo que con un 95% de confianza podemos decir que el verdadero valor del parámetro se encuentra en el intervalo (4.16±0.38)

Referencias

Documento similar

Los planes de muestreo indican el número de unidades del producto que han de inspeccionarse de cada lote, es decir, el tamaño de la muestra, así, como el criterio para determinar

Se dice que la Administración no está obligada a seguir sus pre- cedentes y puede, por tanto, conculcar legítimamente los principios de igualdad, seguridad jurídica y buena fe,

Es aquello que una persona se traza con el fin de conseguir uno o varios propósitos para su existencia, se asocia al concepto de autorrealización, que define conscientemente

1. LAS GARANTÍAS CONSTITUCIONALES.—2. C) La reforma constitucional de 1994. D) Las tres etapas del amparo argentino. F) Las vías previas al amparo. H) La acción es judicial en

La selección de los informantes ha consistido en un muestreo de tipo intencional y teórico (10, 11) : se ha invitado a participar en las entrevistas a las

Próxima implantación de Tribunales especializados para la propiedad industrial, competencia desleal y derecho de autor, y designación de los Tribunales de

Su adopción, prevista en 2013, ofrecerá a los Estados miembros y a las agencias de la UE un marco común para un intercambio de información casi en tiempo real y una cooperación

Los regímenes de certificación de la UE abarcan tanto el cumplimiento de las normas mínimas de producción obligatorias como los requisitos suplementarios relacionados con la