Ensayo de Rendimiento
DISTRIBUCIÓN DE
Objetivo: conocer propiedades de una población a partir de una muestra
Muestreo
Propiedades Parámetros
Los estadísticos muestrales sirven como
estimación (aproximación) de los
Muestreo
Los parámetros son constantes
Los estadísticos son variables aleatorias y poseen distribución
Distribución de estadísticos muestrales: objetivos
•
Comprender la naturaleza aleatoria delos estadísticos muestrales.
•
Estudiar las propiedades estadísticasde la media y la varianza muestrales.
•
Adquirir destrezas en el cálculo deprobabilidades asociadas a estos estadísticos.
Distribución de estadísticos muestrales
Las distribuciones de los estadísticos muestrales se estudian suponiendo
Distribución de los estadísticos muestrales
Muestreo aleatorio con reposición: las unidades seleccionadas pueden repetirse dentro de la muestra y entre muestras.
Muestreo aleatorio sin reposición: las unidades seleccionadas no se repiten dentro de la muestra y entre muestras.
Distribución del estadístico media muestral: ejemplo
Se tiene una población (finita) de cuatro plantas de zapallos (N=4), donde la característica de interés es el número de zapallos por planta.
Se realizará un muestreo aleatorio simple con reposición, para muestras de tamaño 2.
Objetivo: estudiar la distribución de la
Distribución del estadístico media muestral Planta X = Nº de frutos f(xi) P1 3 1/4 P2 2 1/4 P3 1 1/4 P4 4 1/4 1 2 3 4 Número de frutos 0.00 0.25 0.50 f( x )
Función de densidad del número de frutos en una población de 4 plantas de zapallo.
Distribución del estadístico media muestral ( ) i i i x f x
1 1 1 1 1 2 3 4 1 2 3 4 2.5 4 4 4 4 4 La esperanza será:Distribución del estadístico media muestral
2 2 ( ) i i i x f x
2 2 2 2 2 1 1 1 1 2.5 2 2.5 3 2.5 4 4 4 1 4 2.5 1.25 4 = + La varianza será:Distribución del estadístico media muestral
Tomando muestras de dos plantas con
reposición, hay N2 muestras posibles
Distribución del estadístico media muestral
Muestra Plantas Nro. de frutos
Media muestral
Muestra Plantas Nro. de frutos Media muestral 1 P1P1 3; 3 3.0 9 P3P1 1; 3 2.0 2 P1P2 3; 2 2.5 10 P3P2 1; 2 1.5 3 P1P3 3; 1 2.0 11 P3P3 1; 1 1.0 4 P1P4 3; 4 3.5 12 P3P4 1; 4 2.5 5 P2 P1 2; 3 2.5 13 P4P1 4; 3 3.5 6 P2 P2 2; 2 2.0 14 P4P2 4; 2 3.0 7 P2 P3 2; 1 1.5 15 P4P3 4; 1 2.5 8 P2 P4 2; 4 3.0 16 P4P4 4; 4 4.0
Espacio muestral generado por muestreo aleatorio con muestras de tamaño n=2, con reposición, de una población de cuatro plantas de zapallo.
Distribución del estadístico media muestral
Valores que asume la variable aleatoria “media muestral del número de frutos” en muestras de tamaño n=2 y sus
densidades. Media Muestral 1,0 1.(1/16) = 0,0625 1,5 2.(1/16) = 0,1250 2,0 3.(1/16) = 0,1875 2,5 4.(1/16) = 0,2500 3,0 3.(1/16) = 0,1875 3,5 2.(1/16) = 0,1250 4,0 1.(1/16) = 0,0625
Distribución del estadístico media muestral 1.0 1.5 2.0 2.5 3.0 3.5 4.0 Medias muestrales 0.05 0.10 0.15 0.20 0.25 f(x ) Función de densidad de la variable aleatoria media muestral del número de frutos.
Distribución del estadístico media muestral
2.5
x
2 2 1.25 0.625 2 x n
2 2 x EE n
Error Estándar Error EstándarDistribución del estadístico media muestral
Si se hubieran utilizado muestras de mayor tamaño, se vería que la función de densidad se aproxima más aún a la gráfica de una densidad normal, con idéntica esperanza y varianza inversamente proporcional al tamaño muestral.
Este comportamiento no es casual sino la consecuencia de un importantísimo resultado que se resume en el siguiente teorema: 1.0 1.5 2.0 2.5 3.0 3.5 4.0 Medias muestrales 0.05 0.10 0.15 0.20 0.25 f(x )
Sea X una variable aleatoria con esperanza µ y
varianza finita 2. Sea la media muestral de una
muestra aleatoria de tamaño n y Z la variable aleatoria
definida como: X Z n
Teorema Central del Límite
entonces, la distribución de Z se aproxima a la
distribución normal estándar cuando n se aproxima a
Ejemplo de un muestreo aleatorio sin reposición desde una población finita
Rendimientos de un híbrido de maíz (N=15) 99.04 94.98 101.52 95.74 96.42 85.44 102.64 111.75 112.86 107.66 103.49 104.93 104.48 101.24 104.31 = 101.77 2 = 44.67 Sin reposición
Muestreo
Muestreo: todas las muestras
posibles de tamaño
n
Estadísticos: media y varianza
Distribución de las medias de muestras con n=2 89.00 92.43 95.86 99.29 102.71 106.14 109.57 113.00 Media (n=2) 0.00 0.09 0.19 0.28 0.37 fre cu e n ci a re la ti va Ajuste: Normal(101.766,20.940)
Distribución de las medias de muestras con n=3 90.89 93.22 95.56 97.90 100.24 102.57 104.91 107.25 109.59 111.92 Media (n=3) 0.00 0.06 0.13 0.19 0.26 fre cu e n ci a re la ti va Ajuste: Normal(101.766,12.792)
Distribución de las medias de muestras con n=5 89.0 91.0 93.0 95.0 97.0 99.0 101.0 103.0 105.0 107.0 109.0 111.0 113.0 Media (n=5) 0.00 0.05 0.10 0.15 0.20 fre cu e n ci a re la ti va Ajuste: Normal(101.766,6.384)
Distribución de las medias de muestras con n=8 89.00 92.43 95.86 99.29 102.71 106.14 109.57 113.00 Media (n=8) 0.00 0.04 0.09 0.13 0.18 fre cu e n ci a re la ti va Ajuste: Normal (101.766, 2.792)
Distribución del estadístico media muestral
Cuando se hace un muestreo aleatorio sin
reposición desde una población finita las
expresiones para obtener la esperanza y la varianza de la variable media muestral son: x
2 21
x nN
n
N
Corrección por finitudEn síntesis:
2 2 1 44.67 15 2 2 15 1 2 x 101.766 x N n 20.94 n N n
2 2 1 44.67 15 3 3 15 1 3 x 101.766 x N n 12.76 n N n
2 2 1 44.67 15 5 5 15 1 5 x 101.766 x N n 6.38 n N n
2 2 1 44.67 15 8 8 15 1 8 x 101.766 x N n 2.76 n N n En síntesis: 90.8993.2295.5697.90100.24102.57104.91107.25109.59111.92 Media (n=3) 0.00 0.06 0.13 0.19 0.26 fre cu e n ci a re la ti va Ajuste: Normal(101.766,12.792) 89.00 92.43 95.86 99.29 102.71 106.14 109.57 113.00 Media (n=2) 0.00 0.09 0.19 0.28 0.37 fre cu e n ci a re la ti va Ajuste: Normal(101.766,20.940) 89.091.093.095.097.099.0101.0103.0105.0107.0109.0111.0113.0 Media (n=5) 0.00 0.05 0.10 0.15 0.20 fre cu e n ci a re la ti va Ajuste: Normal(101.766,6.384) 89.00 92.43 95.86 99.29 102.71 106.14 109.57 113.00 Media (n=8) 0.00 0.04 0.09 0.13 0.18 fre cu e n ci a re la ti va Ajuste: Normal (101.766, 2.792) n=3 n=2 n=5 n=8
Conclusión
Cuando el tamaño de la muestra aumenta, la varianza de las medias disminuye
2 2 x EE n
Error Estándar Recordando…Ejemplo
El diámetro de las tortas de girasol se distribuye normalmente con media 18 cm y desviación estándar de 6 cm.
En una muestra de 10 tortas, ¿cuál es la probabilidad de encontrar tortas con diámetro
Ejemplo
16 16 18 1.05 0.14885 0.15 6 10 P X P Z P Z ¿Cuál es la probabilidad, en una muestra con n=10, de encontrar tortas con diámetro inferior a 16 cm. si la distribución del diámetro se aproxima a una N (18;36/10)?
0 4 7 11 14 18 21 25 28 32 35
Ejemplo
Tabla de Cuantiles de la Distribución Normal
z área z área z área quantil z
-3.25 0.00058 -1.00 0.15866 1.25 0.89435 0.00001 -4.265 -3.20 0.00069 -0.95 0.17106 1.30 0.90320 0.0001 -3.719 -3.15 0.00082 -0.90 0.18406 1.35 0.91149 0.001 -3.090 -3.10 0.00097 -0.85 0.19766 1.40 0.91924 0.00 -2.576 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . -1.20 0.11507 1.05 0.85314 3.30 0.99952 0.995 2.576 -1.15 0.12507 1.10 0.86433 3.35 0.99960 0.999 3.090 -1.10 0.13567 1.15 0.87493 3.40 0.99966 0.9999 3.719 -1.05 0.14686 1.20 0.88493 3.45 0.99972 0.99999 4.265 Área: P(Zz)
Distribución del estadístico media muestral 1 n X T S n T
Observación: los grados de libertad de la T se corresponden con el tamaño de la muestra con la que se calculó S.
Cuando no se conoce la varianza
poblacional:
Grados de libertad
Distribución T de Student
-5 -4 -3 -2 -1 0 1 2 3 4 5 0.00 0.11 0.23 0.34 0.45 D e n s id a d Dist. Normal Dist. TEjemplo
Si la producción diaria de leche se aproxima a una distribución normal y se tiene la siguiente muestra de producciones diarias de leche (en litros):
67.9 69.3 70.0 74.8 75.3 69.6 67.3 65.8 70.5
¿Cuál es la probabilidad que una variable T, con los grados de libertad apropiados para este problema, exceda el valor de T obtenido a partir de los datos anteriores, si se supone que la producción promedio de leche en la población es de 67 litros?
Ejemplo
70.06 67 2.87 0.01 3.19 9 X P T P T P T S n 70.0556 lts. S = 3.1887 lts. n = 9 = 67 lts. X -5.0 -4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0 5.0Ejemplo
Tabla de Cuantiles de la Distribución T
0.700 0.725 0.750 0.775 0.800 0.825 0.850 0.875 0.900 0.925 0.950 0.975 0.990 0.995 1 0.727 0.854 1.000 1.171 1.376 1.632 1.963 2.414 3.078 4.165 6.314 12.71 31.82 63.66 2 0.617 0.713 0.816 0.931 1.061 1.210 1.386 1.604 1.886 2.282 2.920 4.303 6.965 9.925 . . . . . . . . . . . . . . . 8 0.546 0.624 0.706 0.794 0.889 0.993 1.108 1.240 1.397 1.592 1.860 2.306 2.896 3.355 9 0.543 0.621 0.703 0.790 0.883 0.986 1.100 1.230 1.383 1.574 1.833 2.262 2.821 3.250 10 0.542 0.619 0.700 0.786 0.879 0.980 1.093 1.221 1.372 1.559 1.812 2.228 2.764 3.169 11 0.540 0.617 0.697 0.783 0.876 0.976 1.088 1.214 1.363 1.548 1.796 2.201 2.718 3.106 . . . . . . . . . . . . . . . 49 0.528 0.602 0.680 0.762 0.849 0.944 1.048 1.164 1.299 1.462 1.677 2.010 2.405 2.680 50 0.528 0.602 0.679 0.761 0.849 0.943 1.047 1.164 1.299 1.462 1.676 2.009 2.403 2.678 0.300 0.275 0.250 0.225 0.200 0.175 0.150 0.125 0.100 0.075 0.050 0.025 0.010 0.005
Distribución asociada al estadístico varianza muestral
Espacio muestral generado por muestreo aleatorio con muestras de tamaño n=2, con reposición, de una población de cuatro plantas de zapallo.
Muestra Plantas Nº de frutos
Varianza Muestra Plantas Nº de frutos Varianza 1 P1P1 3-3 0.0 9 P3P1 1-3 2.0 2 P1P2 3-2 0.5 10 P3P2 1-2 0.5 3 P1P3 3-1 2.0 11 P3P3 1-1 0.0 4 P1P4 3-4 0.5 12 P3P4 1-4 4.5 5 P2P1 2-3 0.5 13 P4P1 4-3 0.5 6 P2P2 2-2 0.0 14 P4P2 4-2 2.0 7 P2P3 2-1 0.5 15 P4P3 4-1 4.5 8 P2P4 2-4 2.0 16 P4P4 4-4 0.0
Distribución del estadístico varianza muestral
Valores que asume la variable aleatoria “varianza muestral del número de frutos” en muestras de tamaño
n=2 y sus densidades. Varianza Muestral 0 4.(1/16) = 0.25 0.5 6.(1/16) = 0.375 2 4.(1/16) = 0.25 4.5 2.(1/16) = 0.125 2 2 P S s
Distribución del estadístico varianza muestral
Función de densidad de la variable aleatoria varianza muestral del número de frutos. 0.00 1.50 3.00 4.50 S2 0.00 0.10 0.20 0.30 0.40 F(s2)
Distribución de las varianzas de muestras con n=3 0.0 28.1 56.2 84.3 112.4 140.4 168.5 196.6 224.7 252.8 VarianzaC(n=3) 0.00 0.13 0.27 0.40 0.54 fre cu e n ci a re la ti va Estadística descriptiva
Variable Media Var(n) VarianzaC(n=3) 44.67 1977.49
Distribución de las varianzas de muestras con n=5 0.0 12.6 25.2 37.9 50.5 63.1 75.7 88.4 101.0 113.6 126.2 138.8 VarianzaC(n=5) 0.00 0.06 0.12 0.18 0.24 fre cu e n ci a re la ti va Estadística descriptiva
Variable Media Var(n) VarianzaC(n=5) 44.67 873.27
Para calcular probabilidades asociadas a varianzas muestrales se utiliza la distribución de la variable:
Distribución Ji-cuadrado (
2)
2 2 2 1(
1)
nS n
Grados de libertadDistribución Ji-cuadrado
0 4 8 11 15 0.00 0.12 0.24 0.36 0.48 D e n si d a d 2 gl 4 gl 6 glEjemplo
Un fitomejorador desea controlar la variabilidad de los brotes comerciales de espárrago, ya que las normas de embalaje establecen una longitud máxima de cajas de 23,5 cm.
La variable largo del brote de espárrago sigue una distribución normal, con una
Ejemplo
¿Cuál es la probabilidad que una muestra de 5 cajas, tenga una desviación estándar que exceda a 2 cm, si la verdadera desviación estándar es de 1,5 cm? 2 2 2 2 2 1 4 4 2 4 2.25 S n P S P S P P 2 2 7.11 1 7.11 1 0.85 0.15 P P 0.0 2.0 4.0 6.0 8.1 10.1 12.1 14.1 16.1 18.1
Ejemplo
Tabla de Cuantiles de la Distribución Chi-Cuadrado
0.010 0.025 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50 1 0.0002 0.0010 0.0039 0.0158 0.0358 0.0642 0.1015 0.1485 0.2059 0.2750 0.3573 0.4549 . . . . . . . . . . . . . 4 0.2971 0.4844 0.7107 1.0636 1.3665 1.6488 1.9226 2.1947 2.4701 2.7528 3.0469 3.3567 . . . . . . . . . . . . . 49 28.9407 31.5549 33.9303 36.8182 38.8588 40.5344 42.0104 43.3664 44.6491 45.8895 47.1114 48.3350 0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.999 1 0.5707 0.7083 0.8735 1.0742 1.3233 1.6424 2.0723 2.7055 3.8415 5.0239 6.6349 10.8278 . . . . . . . . . . . . . 4 3.6871 4.0446 4.4377 4.8784 5.3853 5.9886 6.7449 7.7794 9.4877 11.1433 13.2767 18.4670 . . . . . . . . . . . . . 49 49.5796 50.8659 52.2186 53.6697 55.2653 57.0786 59.2411 62.0375 66.3386 70.2224 74.9194 85.3511