• No se han encontrado resultados

Distribuciones Muestrales

N/A
N/A
Protected

Academic year: 2021

Share "Distribuciones Muestrales"

Copied!
30
0
0

Texto completo

(1)

Estadística II / Funciones Variables Aleatorias.

Ing. Deny González

Distribuciones Muestrales

Muestreo Aleatorio

Población

Muestra

Herramientas Estadísticas

Mediana Muestral

2 ) 1 ) 2 / (( ) 2 / ( 2 / ) 1 (    n n n ; n es impar ; n es par

x=

x=

Media Muestral

n

x

x

n i i

1

n

f

x

x

k i i i

1

*

Moda

Variancia Muestral

1 ) ( 1 2 2   

n x x S n i i ) 1 ( * ) ( * 2 1 1 2 2   

n n x x n S n i i n i i

Desviación estándar muestral (S)

Variancia Muestral

(Datos agrupados)

) 1 ( * * * * 1 2 1 2 2           

  n n f x f x n S k i k i i i i i

Media Poblacional

N x N x x x    N

i  1 2 ... 

1,2,3,4,4,4,5,6,7

(2)

Estadística II / Funciones Variables Aleatorias.

Distribuciones Muestrales

Ejemplo:

El

número

de

respuestas

incorrectas

en

una

prueba

de

competencia de falso o verdadero para una muestra aleatoria de 15

estudiantes fueron los siguientes: 2,1,3,0,1,3,6,0,3,3,5,2,1,4 y 2. Encuentre: a)

la media, b) la mediana c) la moda, d) varianza y desviación estándar.

a)

n

f

x

x

k i i i

1

*

4

.

2

15

)

1

*

6

(

)

1

*

5

(

)

1

*

4

(

)

4

*

3

(

)

3

*

2

(

)

3

*

1

(

)

2

*

0

(

x

b)

(n1)/2

es impar x(15+1)/2 = x

8

= 2

Ordenar datos: 0,0,1,1,1,2,2,2,3,3,3,3,4,5,6

c)

0,0,1,1,1,2,2,2,3,3,3,3,4,5,6

d)

x f x2 x2 *f x*f 0 2 0 0 0 1 3 1 3 3 2 3 4 12 6 3 4 9 36 12 4 1 16 16 4 5 1 25 25 5 6 1 36 36 6

9714 . 2 ) 1 15 ( * 15 ) 36 ( ) 128 * 15 ( 2 2    S ) 1 ( * * * * 1 2 1 2 2           

  n n f x f x n S k i k i i i i i

e)

S = 1.7237

(3)

5,5,5,6,9,10,10,10,11,15

Estadística II / Funciones Variables Aleatorias.

Ing. Deny González

Distribuciones Muestrales

Ejemplo: Los periodos de tiempo, en minutos, que 10 pacientes esperaron

en un consultorio médico antes de recibir tratamiento fueron: 5, 11, 9, 5, 10,

15, 6, 10, 5, y 10. Tratando los datos como una muestra aleatoria, encuentre.

a) la media, b) la mediana c) la moda, d) varianza y desviación estándar.

a)

n f x x k i i i

  1 *

.

min

6

.

8

10

)

1

*

6

(

)

1

*

15

(

)

1

*

11

(

)

3

*

10

(

)

1

*

9

(

)

1

*

6

(

)

3

*

5

(

x

b)

es impar [x(5)+X(5+1)]/2 = (9+10)/2 = 9.5

Ordenar datos: 5,5,5,6,9,10,10,10,11,15

c)

d)

x x2 5 25 5 25 5 25 6 36 9 81 10 100 10 100 10 100 11 121 15 225 86 838

93 . 10 ) 1 10 ( * 10 7396 ) 838 * 10 ( 2    S

e)

S = 3.30

2 ) 1 ) 2 / (( ) 2 / (nn  ) 1 ( * ) ( * 2 1 1 2 2   

  n n x x n S n i i n i i

(4)

Estimador

Un estimador de un parámetro poblacional es una función de los datos

muestrales. En pocas palabras, es una fórmula que depende de los valores

obtenidos de una muestra, para realizar estimaciones.

Por ejemplo, un estimador de la media poblacional,

μ, sería la media

muestral, , según la siguiente fórmula:

Donde (x

1

, x

2

, ..., x

n

) sería el conjunto de datos de la muestra.

El estimador es una variable aleatoria que asigna a cada valor de la función

su probabilidad de aparición, esto es, la probabilidad de la muestra de la que

se extrae.

ESTIMACIÓN ESTADÍSTICA Y DISTRIBUCIONES DE MUESTREO

(5)

Ing. Deny González

POBLACION Y MUESTREO

Estadística II / Estimación Estadística.

MUESTREO PROBABILISTICO

Los métodos de muestreo probabilísticos son aquellos que se basan

en el principio de equiprobabilidad. Es decir, aquellos en los que todos

los individuos tienen la misma probabilidad de ser elegidos para

formar parte de una muestra y, consiguientemente, todas las posibles

muestras de tamaño n tienen la misma probabilidad de ser

seleccionadas.

TIPOS MUESTREOS PROBABILISTICOS

Muestreo aleatorio simple

Muestreo aleatorio sistematico

Muestreo aleatorio estratificado

(6)

POBLACION Y MUESTREO

Estadística II / Estimación Estadística.

MUESTREO NO PROBABILISTICO

En este tipo de muestreo, puede haber clara influencia de la persona o personas que seleccionan la muestra o simplemente se realiza atendiendo a razones de comodidad. Salvo en situaciones muy concretas en la que los errores cometidos no son grandes, debido a la homogeneidad de la población, en general no es un tipo de muestreo riguroso y científico, dado que no todos los elementos de la población pueden formar parte de la muestra

TIPOS DE MUESTREO NO PROBABILISTICOS

Muestreo por cuotas

Muestreo intencional o por conveniencia

Bola de nieve.

(7)

En la estadística tiene un papel destacado la noción de MUESTRA ALEATORIA.

Una muestra aleatoria de tamaño n es:

Una colección de n variables aleatorias. Todas con la misma distribución.

Todas independientes.

Esta definición idealiza la operación de repetir n veces la observación de la misma variable aleatoria, siendo las repeticiones independientes una de otra.

La colección de donde extraemos la muestra aleatoria, se denomina POBLACIÓN. Nuestra intención al tomar una muestra, es la de hacer INFERENCIA. Este término lo usamos en estadística para denotar al procedimiento con el que hacemos afirmaciones acerca de valores generales de la población mediante los números que observamos en la muestra.

Ing. Deny González

ESTIMACIÓN ESTADÍSTICA Y DISTRIBUCIONES DE MUESTREO

(8)

Suponga que observamos el proceso de fabricación de las ``bolitas'' que se le ponen al envase de los desodorantes ``roll on''. No todas las bolitas van a tener el mismo diámetro, si escogemos, al azar una bolita, tendremos un valor para el diámetro que es una variable aleatoria. Podemos suponer que los diámetros tienen la distribución normal, debido a nuestra experiencia con el proceso, conocemos que la desviación estándar de la población es de 4 mm (aproximadamente). Pero, también por experiencia, sabemos que el diámetro promedio puede variar por desajuste de la maquinaria productora. De modo que tenemos:

una POBLACIÓN, que son todas las bolitas que se producen.

un PARÁMETRO de la población conocido (o casi) que es la desviación estándar. otro PARÁMETRO cuyo valor es desconocido: la media .

ESTIMACIÓN ESTADÍSTICA Y DISTRIBUCIONES DE MUESTREO

(9)

Si la población es finita, es decir conocemos el total de la población y deseásemos saber cuántos del total tendremos que estudiar la respuesta seria:

Ing. Deny González

ESTIMACION DE TAMAÑO DE MUESTREO

Estadística II / Estimación Estadística.

Donde:

N = Total de la población

Z

a2

= 1.96

2

(si la seguridad es del 95%)

p = proporción esperada (en este caso 5% = 0.05)

q = 1 – p (en este caso 1-0.05 = 0.95)

d = precisión (en este caso deseamos un 3%).

(10)

¿A cuántas personas tendría que estudiar de una población de 15.000 habitantes para conocer la prevalencia de diabetes?

Seguridad = 95%; Precisión = 3%; proporción esperada = asumamos que puede ser próxima al 5% ; si no tuviese ninguna idea de dicha proporción utilizaríamos el valor p = 0.5 (50%) que maximiza el tamaño muestral.

ESTIMACION DE TAMAÑO DE MUESTREO

Estadística II / Estimación Estadística.

Donde:

N = Total de la población

Z

a2

= 1.96

2

(si la seguridad es del 95%)

p = proporción esperada (en este caso 5% = 0.05)

q = 1 – p (en este caso 1-0.05 = 0.95)

d = precisión (en este caso deseamos un 3%).

(11)

Si la población es finita, también podemos aplicar la siguiente ecuación

Ing. Deny González

ESTIMACION DE TAMAÑO DE MUESTREO

Estadística II / Estimación Estadística.

Según diferentes seguridades el coeficiente de Z

a

varía, así:

Si la seguridad Z

a

fuese del 90% el coeficiente sería 1.645

Si la seguridad Z

a

fuese del 95% el coeficiente sería 1.96

Si la seguridad Z

a

fuese del 97.5% el coeficiente sería 2.24

Si la seguridad Z

a

fuese del 99% el coeficiente sería 2.576

Donde

(12)

Distribución Muestrales de media (Teorema de Limite Central)

Supóngase que una muestra aleatoria de n observaciones se toma de una población normal con media

y variancia2. Cada observación de la muestra aleatoria tiene la

misma distribución normal, por lo que,

Tiene una distribución normal con media

Y variancia:

La suma de una gran numero de variables aleatorias idénticas e independientes n cada una de ellas con media poblacionaly variancia finita2 tiene una función de

densidad de probabilidad igual a:

Estadística II / Funciones Variables Aleatorias.

n

x

Z

La aproximación normal parax generalmente será buena si n > 30.

n X X X X  1 2 ... n

n

x

...

n x 2 2   

(13)

Ejemplo: Una compañía fabrica focos que tiene un periodo de vida que esta

distribuido aproximadamente en forma normal, con media igual a 800 horas y

una desviación estándar de 40 horas. Encuentre la probabilidad de que una

muestra aleatoria de 16 focos tenga una vida promedio de menos de 775

horas.

Ing. Deny González

Estadística II / Funciones Variables Aleatorias.

5

.

2

16

40

800

775

Z

Distribución Muestrales de media (Teorema de Limite Central)

La distribución muestral de

X será aproximadamente normal con

= 800.

Correspondiendo a

x = 775.

Y por lo tanto, P(X < 775) = P(Z<-2.5), por tabla P(X < 775) = 0.0062

800 775

(14)

Ejemplo:

supongamos que se sabe que el peso de los sujetos de una

determinada población sigue una distribución aproximadamente normal,

con una media de 80 kg y una desviación estándar de 10 kg. ¿Podremos

saber cual es la probabilidad de que una persona, elegida al azar, tenga

un peso superior a 100 kg?

Estadística II / Funciones Variables Aleatorias.

2

1

10

80

100

Z

Distribución Muestrales de media (Teorema de Limite Central)

Datos:

= 80 kg /

x = 100 /

= 10 kg / n = 1.

Y por lo tanto, como el área total bajo la curva es igual a 1, se puede deducir que: P(X > 100) = 1- P(Z<2), por tabla

P(X > 100) = 1-0.9772 = 0.0228

Por lo tanto, la probabilidad buscada de que una persona elegida aleatoriamente de eso población tenga un peso mayor de 100 Kg , es de aproximadamente de un 2.3%

(15)

Distribución Muestrales de media

Si se sacan al azar muestras independientes de tamaños n1 y n2 de dos poblaciones discretas o continuas, con medias

1 y

2 y variancias2

1 y22, respectivamente,

entonces la distribución muestral de la diferencia de medias X1 y X2, esta distribuida aproximadamente en forma normal con media y variancias:

Ing. Deny González

Estadística II / Funciones Variables Aleatorias.









2 2 2 1 2 1 2 1 2 1

)

(

)

(

n

n

x

x

Z

De aquí que, 2 2 2 1 2 1 2 1 2 2 1 2 1

n

n

x x x x

 

(16)

Distribución Muestrales de media

Ejemplo: Una muestra de tamaño n1=5 se saca aleatoriamente de una población que esta normalmente distribuida con media

1=50 y variancia2

1 = 9 y se registra la media

muestral x1. Una segunda muestra aleatoria de tamaño n2=4 se selecciona, independiente de la primera muestra, de una población diferente que también esta normalmente distribuida, con media

2 = 40 y variancia2

2, = 4 y se registra la media

muestral x2. Encuentre P(X1-X2 < 8.2).

Se sabe que la distribución es normal con media:

Estadística II / Funciones Variables Aleatorias.

08

.

1

8

.

2

10

2

.

8

Z

De aquí que,

10

40

50

2 1 2 1

x x P(X1- X2 < 8.2) = P(Z<-1.08) = 0.1401

8

.

2

4

4

5

9

2 2 2 1 2 1 2 1 2

n

n

x x

(17)

Ing. Deny González

(18)

Estadística II / Funciones Variables Aleatorias.

Si la seguridad Z

a

fuese del 95% el coeficiente sería 1.96

Si la seguridad Z

a

fuese del 99% el coeficiente sería 2.576

a)

(19)

Ing. Deny González

Estadística II / Funciones Variables Aleatorias.

(20)

Estadística II / Funciones Variables Aleatorias.

(21)

Distribución Chi cuadrado

Si s2 es la varianza es la varianza de una muestra aleatoria de tamaño n tomada de una

población normal cuya variancia es , entonces,

Es un valor de una variable aleatoria que tiene la distribución chi-cuadrada con parámetro v=n-1.

V es denominado número de grados de libertad.

Observación: A diferencia de la distribución t, es necesario tabular los valores de2

para> 0.5, porque la distribución chi cuadrada no es simétrica.

La probabilidad de que una muestra aleatoria produzca un valor chi cuadrado mas grande que cualquier valor especificado es igual al área bajo la curva a la derecha de este valor.

Ing. Deny González

Estadística II / Funciones Variables Aleatorias.

2 2 2 ( 1)*

   ns

(22)

Distribución Chi cuadrado

Para utilizar una prueba de hipótesis chi cuadrada, debemos tener un tamaño de muestra lo suficientemente grande para garantizar la similitud entre la distribución teórica correcta y nuestra distribución de muestreo de x2, estadística chi cuadrada.

Cuando las frecuencias esperadas son muy pequeñas el valor de x2 estará

sobrestimado y se tendrá como resultado demasiados rechazos de la hipótesis nula, para evitar incurrir en inferencias incorrectas de la prueba de hipótesis chi cuadrada. Siga la regla general que dice que una frecuencia esperada de menos de cinco en una celda de una tabla de contingencia es demasiado pequeña para utilizarse.

GRAFICA DISTRIBUCION JI CUADRADA PARA V= 2, 5, Y 10 GRADOS DE LIBERTAD

(23)

Distribución Chi cuadrado

Ing. Deny González

Estadística II / Funciones Variables Aleatorias.

26

.

3

1

815

.

0

*

)

1

5

(

2

Ejemplo: Un fabricante de baterías para automóvil garantiza que sus baterías

duraran, un promedio, 3 años con una desviación estándar de un año. Si 5 de

estas tienen desviaciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años, ¿ Esta el fabricante

convencido aún de que sus baterías tienen una desviación estándar de 1año?

Solución: S

2

= 0.815,

2

= 1 y n = 5

v = N-1 = 4, El valor mas cercano a 3.26 que se encuentra en la tabla es 2.195 y

3.357 y sus probabilidades son 0.7 y 0.5, lo que significa que la probabilidad es

alta, el fabricante no tiene razón para sospechar que la

es diferente de 1.

(24)

Ejemplo: Suponga que el espesor de un componente de un semiconductor es

una dimensión crítica. El proceso de producción de tal característica se

distribuye normalmente con una desviación estándar de 0.6 milésimas de

pulgada. Para controlar el proceso se toman muestras periódicas de veinte

piezas, y se define un límite de control con base en una probabilidad de 0.01 de

que la varianza muestral exceda dicho límite, si el proceso está bajo control.

Qué se puede concluir si para una muestra dada la desviación estándar es 0.84

milésimas de pulgada?

Solución: S = 0.84,

= 0.6 y n = 20. Por tabla

= 36.19

Distribución Chi cuadrado

Estadística II / Funciones Variables Aleatorias.

Por lo tanto el criterio de decisión se puede expresar en una de las dos formas

siguientes:

a) Como X

2

= 37.24 > 36.19 la muestra no proviene de un proceso con una

desviación estándar de 0.60.

b) Se calcula S

2

= 0.842 = 0.7056. Como 0.7056 > 0.6857 se llega a la misma

conclusión de que no es probable que la muestra tomada provenga de una

población con una desviación estándar de 0.60 milésimas de pulgada.

24

.

37

6

.

0

84

.

0

*

)

19

(

2

2

2

(25)

Distribución t

Para valores pequeños de n a menos de que supongamos que la muestra proviene de una población normal. Bajo esta condición,

Six es la media de una muestra aleatoria de tamaño n tomada de una población normal que tiene mediay variancia2 , entonces

Es el valor de una variable aleatoria con distribución t y parámetro v=n-1.

La forma global de la distribución t es similar a la de una distribución normal (ambas tienen forma de campana y son simétricas con respecto al origen).

No es necesario tabular los valores de t para

> 0.50, pues por la simetría de la distribución t1- = - t. Por lo tanto, el valor de t corresponde al área de la cola situada a la izquierda de

es - t .

Ing. Deny González

Estadística II / Funciones Variables Aleatorias.

n

s

x

t

(26)

Distribución t

Estadística II / Funciones Variables Aleatorias.

19

.

3

20

48

.

2

4

.

12

63

.

10

t

Ejemplo: Un fabricante de fusibles asegura que con una sobrecarga del 20%,

sus fusibles se fundirán al cabo de 12.4 min en promedio. Para probar esta

afirmación una muestra de 20 fusibles fue sometida a una sobre carga de un

20% y los tiempos que tardaron en fundirse tuvieron una media de 10.63 min y la

desviación estándar de 2.48 min. Si se supone que los datos constituyen una

muestra aleatoria de una población normal. ¿ Se tiende a apoyar o a refutar la

afirmación del fabricante?.

Solución: S = 2.48, n = 20,

= 12.4,

x = 10.63

v = N-1 = 19, El valor mas cercano a 3.19 es 2.81 y su probabilidad es 0.005 baja,

por lo tanto los datos tienden a refutar la afirmación del fabricante.

(27)

Distribución t

Ing. Deny González

Estadística II / Funciones Variables Aleatorias.

38

.

8

16

1

.

2

12

4

.

16

t

Ejemplo: En un recorrido de prueba de una hora cada uno, el consumo promedio de gasolina de un motor fue 16.4 galones, con una desviación estándar de 2.1 galones. Se quiere saber si es cierta la afirmación de que "el consumo promedio de gasolina es 12 galones/hora".

Solución: S = 2.1, n = 16,= 12,x = 16.4

Para responder la pregunta debemos verificar que tan probable es que una muestra de 16.4 galones pertenezca a una distribución con una media de 12. Por lo tanto, debemos calcular la probabilidad de que la media muestral sea mayor o igual que 16.4 si la verdadera media de donde proviene dicha muestra es 12 galones. Esto es:

n

s

x

t

Buscando en la tabla de la distribución t con 15 grados de libertad, tenemos que para una probabilidad de 0.005 el respectivo valor de t es 2.947, lo cual implica que la probabilidad para t = 8.38 es cero). Por lo tanto, concluimos que la probabilidad de obtener una muestra con una media de 16.4 de una población cuya media es 12.0 es cero, es decir, que "el consumo promedio de gasolina no es 12 galones/hora", sino que es superior

.

(28)

Distribución t

Estadística II / Funciones Variables Aleatorias.

Ejemplo: El valor de t con v= 14 grados de libertad que tiene un área de 0.025 a la izquierda, y por lo tanto un area de 0.975 a la derecha, es:

Solución: t0.975 = - t0.025 = - 2.145 Ejemplo: Encuentre P(-t0.025< T < - t0.05). Solución: Area a la derecha 0.05 Area a la izquierda 0.0025 Area total = 1- 0.05 - 0.025 = 0.925

(29)

Distribución f

Se define como la relación de dos variables aleatorias chi cuadrada independientes, cada una dividida por su numero de grados de libertad. De aquí que puede escribirse:

Donde U y V son variables aleatorias independientes que tiene una distribución chi cuadrada con v1 y v2 grados de libertad, respectivamente.

Teorema 1. Si se escribe f (v1,v2 ) para f con v1 y v2 grados de libertad, se obtiene

Teorema 2. Si S2

1 y S22 son las variancias de variables aleatorias independientes de

tamaños n1 y n2 que se sacan de poblaciones normales con variancias de2

1 y22,

respectivamente, entonces,

Tiene una distribución F con v1= n1-1 y v2=n2-1 grados de libertad. Ing. Deny González

Estadística II / Funciones Variables Aleatorias.

2 1 v V v U

f

) , ( 1 ) , ( 1 2 2 1 1 v v f v v f     2 2 2 1 2 1 2 2

*

*

S

S

F

(30)

Ejemplo 2: Encuéntrese el valor de F0.95 para v1=10 y v2=20 grados de liberad

Ejemplo 1: Si dos muestras aleatorias independientes de tamaño n1= 7 y n2=13

se toman de una población normal, ¿Cuál es la probabilidad de que la variancia

de la primera sea al menos tres veces mas grande que la de la segunda?

Solución: Por tabla para v

1

=7-1=6 y v

2

=13-1=12 (se intercepta) y encontramos

que f

0.05

= 3 por lo tanto, la probabilidad deseada es 0.05.

Otra forma de verlo

S

12

=3S

22 ,

busca en tabla y la probabilidad es 0.05

12

=

22

Distribución f

Estadística II / Funciones Variables Aleatorias.

36 . 0 77 . 2 1 ) 10 , 20 ( 1 ) , ( 05 . 0 2 1 1    f v v f

3

3

*

*

2 2 2 2 2 2 2 1 2 1 2 2

S

S

S

S

F

Referencias

Documento similar

&#34;No porque las dos, que vinieron de Valencia, no merecieran ese favor, pues eran entrambas de tan grande espíritu […] La razón porque no vió Coronas para ellas, sería

(1886-1887) encajarían bien en una antología de textos históricos. Sólo que para él la literatura es la que debe influir en la historia y no a la inversa, pues la verdad litera- ria

entorno algoritmo.

Habiendo organizado un movimiento revolucionario en Valencia a principios de 1929 y persistido en las reuniones conspirativo-constitucionalistas desde entonces —cierto que a aquellas

BUBER'NEUaiAMN, Margarete ¡ Von Potsáam ndch Moskau. SMíionen eines Irftveges. Stuttgart, 1957; Deutsche Verlags-Anstalt, 480 págs... DAHM: Deutsches Reckt. Die geschichüichen

En el año 1985 hubo una distribu- ción más abundante del patógeno en la re- gión, siendo notable su escasa presencia du- rante el año 86; ello es similar a lo sucedido con la Roya

A la luz de lo expuesto, se comprende fácilmente la vulneración cometida con motivo de las pasadas elecciones para concejales en Pamplona por la Administración, al ordenar

Unido a lo anterior, resulta de gran relevancia conocer no solo el léxico en lengua materna del alumnado, sino también en lengua extranjera y cómo este puede estar