Distribuciones
Muestrales
INFERENCIA ESTADÍSTICA
JTP. JUAN PABLO QUIROGA
Temario
vMuestras AleatoriasvTeorema del Limite Central
vLa distribución muestra de la media muestral
vLa distribución muestral de la proporción muestral
vPlanes muestrales y diseños experimentales. vEstadísticas y distribuciones muestrales.
Muestras Aleatorias
La forma en que una muestra se selecciona recibe el nombre de Plan Muestral o Diseño experimental y determina la cantidad de información de una muestra. Saber el plan muestral empleado permite determinar la confiabilidad de la Inferencia.
Muestreo aleatorio simple: Si una muestra de n elementos se selecciona de entre una población de N elementos, usando un plan muestral en el que cada una de las posibles muestras tiene la misma probabilidad de selección.
Muestreo aleatorio estratificado: Consiste en seleccionar una muestra aleatoria simple de cada uno de uno de un número dado de subpoblaciones o estratos.
Muestreo aleatorio Conglomerado: Es una muestra aleatoria simple tomada de los conglomerados disponibles en la población.
Muestras Aleatorias
Muestreo Aleatorio Sistemático 1 en k: involucra la selección aleatoria de uno de los primeros k elementos de una población ordenada y luego la selección sistemática de cada k-esimo elemento de ahí en adelante.
Estadística y Distribuciones Muestrales
La definición muestral de una estadística es la distribución de probabilidad para los posibles valores de la estadística, que resulta cuando muestras aleatorias de tamaño n se sacan
repetidamente de la población
Existen tres formas para hallar la distribución muestral de estadística
1. Deducir matemáticamente usando leyes de probabilidad.
2. Usar una simulación para aproximar la distribución (Sacar un gran número de muestras de tamaño n, calculando el valor de la estadística à Tabular à Histograma de frecuencia
relativa. à Nos da muy cerca de distribución muestral teorica.
Teorema del Limite Central
El teorema del limite central establece que , en condiciones mas bien generales, las sumas y medias de muestras aleatorias de mediciones tomadas de una población tienden a tener una distribución aproximadamente normal.
“Si muestras aleatorias de n observaciones se sacan de una población no normal con media finita µ desviación estándar s, entonces, cuando n es grande, la distribución de muestreo de la media muestral x esta distribuida normalmente en forma aproximada, con media µ y desviación estándar s “
𝜎 √𝑛
La aproximación se hace mas precisa cuando n se hace grande. Y las probabilidades se calculan usando la variable aleatoria estándar: 𝑧 = 𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 − 𝑚𝑒𝑑𝑖𝑎 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 = 𝑥̅ − 𝜇 𝜎 √𝑛
Error Estándar
La desviación estándar de una estadística empelada como estimador de un parámetro poblacional también se denomina error estándar del estimador (SE) por que se refiere a la precisión del estimador. Por lo tanto la desviación estándar de Escriba aquí la ecuación.
𝑆𝐸 𝑥̅ = 𝜎 √𝑛
Ejercicio
El CI de los alumnos de un centro, se distribuye normalmente con media 80 y desviación estándar (𝜎) 10. Si extraemos una muestra aleatoria simple de 25 alumnos:
a) Si se extrae un sujeto al azar ¿cuál es la probabilidad de que obtenga como mínimo una puntuación en CI de 75?
b) Cual es la probabilidad de que su media aritmética sea mayor de 75?
c) ¿cuál es la probabilidad de que su media aritmética sea como máximo 83?
d) ¿qué valor debería tomar la media aritmética para que la probabilidad de obtenerlo en esa muestra sea como máximo 0,85?
Resolución
a) 𝑃 𝑋 ≥ 75 = 𝑃 𝑧 ≥ O̅PQ R = P z ≥ UVPWX YX = 𝑃 𝑧 ≥ −0,5 = 0,6915 b) 𝑃 𝑋 ≥ 75 = 𝑃 𝑧 ≥ O̅PQ_ √` = P z ≥ UVPWX YX/V = 𝑃 𝑧 ≥ −2,5 = 0,9938 c) 𝑃 𝑋 ≤ 83 = 𝑃 𝑧 ≤ O̅PQ_ √` = P z ≤ WfPWX YX/V = 𝑃 𝑧 ≤ 1,5 = 0,9332 d) 𝑃 𝑋 ≤ 𝑋𝑖 = 0,85 → 𝑧0,85 = 1,04 = OjPWX YX/V = 𝑋𝑖 = 1,04 ∗ YX V + 80 = 82,08Resolver
La duración de la enfermedad de Alzheimer desde el principio de los síntomas hasta el fallecimiento varia de 3 a 20 años; el promedio es de 8 años con una desviación estándar de 4 años. El administrador de un centro medico selecciona al azar los registros médicos de 30 pacientes de Alzheimer ya fallecidos, de la base de datos del centro medico y anota la duración. Encuentre las probabilidades aproximadas de estos eventos:
1. La duración Promedio es menor a 7 años.
2. La duración promedio excede a 7 años
Resolución
Como se sacaron muestras aleatorias de la base de datos, se pueden sacar conclusiones acerca delos pacientes pasados, presentes o futuros de Alzheimer de el centro medico, si el centro medico es representativo ( gran Muestra) es posible sacar conclusiones de mas alcance.
La muestra no es simétrica, ya que la media no esa a la mitad de los valores mínimos y máximos, como la media esta mas cerca del mínimo, la muestra esta sesgada a la derecha., con unos pocos pacientes viviendo largo
tiempo después de iniciada la enfermedad. 1. 𝑃 𝑋 < 7 = 𝑃 𝑧 < O̅PQ_
√`
= P z < n/√fXUPW = 𝑃 𝑧 < −1.37 = 0,0853
Usamos la Ro en la formula para sacar z por que estamos buscando un área bajo la distribución normal para xmedia, no bajo l adistribución d eprobabilidad para x.
1. El evento de que x exceda de 7 es el complemento del evento de que x sea menor que 7, entonces: 𝑃 𝑥̅ > 7 = 1 − 𝑃 𝑥̅ < 7 = 1 − 0,0853 = 0,917
La probabilidad de que x se encuentre a no mas de 1 año de 𝜇 = 8.
El valor de z para x = 7 es de -1,37 y z para x=9 es:
𝑧 = O̅PQ_ √`
= rPW
n/√fX = 1.37
Resolver 2
Supongamos que el profesorado de una universidad, con el rango de profesor en instituciones publicas que imparten carreras de dos años, ganan en promedio 71802 pesos por año con una desviación estándar de 4000 pesos. En un intento por verificar este nivel de salario se selecciono una muestra aleatoria de 60 profesores de entre una base de datos del personal para todas las instituciones de dos años en Argentina.
1. Describa la distribución muestral de la media muestral 𝑥̅
2. ¿Dentro de que limites se esperaría que este el promedio mensual con probabilidad de .95?
3. Calcule la probabilidad de que la media muestral 𝑥̅ sea mayor que 73000 pesos.
4. Si su muestra aleatoria en realidad produjo una media de 73000 pesos ¿Consideraría que esto es poco común? ¿qué conclusiones Obtendría?
Resolver 3
Un articulo en el American Demographics dice que mas del doble de compradores salen de compras los fines de semana que durante la semana. No solo eso, porque esos compradores tambien gastan mas dinero en sus compras en sábados y domingos. Suponga que la cantidad de dinero gastada en centros comerciales, entre las 4 pm y 6 pm los domingos tiene una
distribución normal con media de $85 y una desviación estándar de $20. Un comprador se
selecciona al azar un domingo entre las 4pm y las 6pm y se le pregunta sobre su forma de gastar.
a) ¿cuál es la probabilidad de que el haya gastado mas de $95 en el centro comercial?
b) ¿cuál es la probabilidad de que el haya gastado entre $95 y $115?
c) Si dos compradores se seleccionan al azar ¿cuál es la probabilidad de que ambos compradores hayan gastado mas de $115 en el centro comercial?
Distribución Muestral de la Proporción
Muestral
Si una muestra aleatoria de n observaciones se selecciona de una población binomial con parámetro p, entonces la distribución muestral de la proporción muestral:
𝑝̂ = O
o
Y tendrá una media 𝑝
Y una desviación estándar
𝑆𝐸 𝑝̂ = √u.v
o donde 𝑞 = 1 − 𝑝
Cuando el tamaño muestral de n es grande, la distribución muestral de𝑝̂ puede ser aproximada por una distribución normal. La aproximación será adecuada si n.p > 5 y n.q > 5
Resolver
En una encuesta se pregunto a 500 madres y padres sobre la importancia del deporte para hijos e hijas. De los padres entrevistados 60% estuvo de acuerdo en que los géneros son iguales y deben tener iguales oportunidades de participar en deportes.
Describa la distribución muestral de la proporción muestral p de padres que están de acuerdo en que los géneros son iguales y deben tener iguales oportunidades.
Resolución
Se puede suponer que los 500 padres representan una muestra aleatoria de los padres de todos los hijos e hijas de Argentina y que la verdadera proporción de la población es igual a algún
valor desconocido que se puede llamar p.
La distribución muestral de𝑝̂, puede ser aproximada por una distribución muestral con media igual a p, ya que si se verifican las condiciones que permiten la aproximación normal a la
distribución de p, se puede ver que n=500 es adecuado para valores de p cercanos a 0,6 por que tanto n.p = 300 como n.q =200 son mayores que 5
𝑆𝐸(𝑝̂) = u.vo ≈ uy.vy
o =
X,zX .(X,nX)
Como calcular probabilidades para la
proporción muestral
𝑝̂
1. Encuentre los valores necesarios de n y p.
2. Verifique si la aproximación normal a la distribución binomial es apropiada ( n.p>5 y n.q>5)
3. Escriba el evento de interés en términos de 𝑝̂ y localice el área apropiada en la curva normal.
4. Convierta los valores necesarios de 𝑝̂ en valores de z usando:
𝑧 = 𝑝̂. 𝑝 𝑝. 𝑞
𝑛
Resolver
En una encuesta se pregunto a 500 madres y padres sobre la importancia del deporte para hijos e hijas. De los padres entrevistados 60% estuvo de acuerdo en que los géneros son iguales y deben tener iguales oportunidades de participar en deportes.
Describa la distribución muestral de la proporción muestral p de padres que están de acuerdo en que los géneros son iguales y deben tener iguales oportunidades.
Ahora el dato de p = 0,55
¿Cuál es la probabilidad de observar una proporción muestral igual de grande o mayor que el valor observado de 𝑝̂ = 0,60
Resolución
p = 0,55 y
SE= u.vo = X,VV .(X.nV)VXX = 0,22
Para encontrar el área bajo la curva, primero se debe calcular el valor de z correspondiente a 𝑝̂ = 0,60 𝑧 = uyPu {.| ` = X,zX P(X,VV)X,}}} = 2.25 P(𝑝̂>0,60) ≈ 𝑃 𝑧 > 2.25 = 1 − 0,9878 = 0.0122
Por lo tanto si seleccionáramos una muestra aleatoria de n= 500 observaciones de una
población con proporción p = 0,55, la probabilidad de que la proporción muestral 𝑝̂ fuera tan grande o mayor que 0,60 es de solo 0,0122
Ejercicios a resolver
1- Una Muestra aleatoria de n observaciones se selecciona de una población con desviación estándar σ = 1. Calcule el error estándar de la media (SE) para estos valores de n
n=1 ; n=2; n=4
2. Se selecciona una muestra aleatoria de tamaño n=49 de una población con media µ=53 y desviación estándar σ =21
¿Cuál será la forma aproximada de la distribución muestral de 𝑥̅?
¿Cuáles serán la media y la desviación estándar de la distribución muestral 𝑥̅?
3. Se selecciona una muestra aleatoria de tamaño n=40 de una población con media µ=100 y desviación estándar σ=20
¿Cuál será la forma aproximada de la distribución muestral de 𝑥̅?
Ejercicios a resolver:
4.- Suponga que se selecciona una muestra aleatoria de n= 25 observaciones de una población que esta distribuida normalmente, con media igual a 106 y desviación estándar igual a 12.
◦ Dé la media y desviación estándar de la distribución muestral de la media muestral 𝑥̅ ◦ Encuentre la probabilidad de que 𝑥̅ exceda 110
◦ Encuentre la probabilidad de que la media muestral se desvíe de la media poblacional µ = 106 en no mas de 4
5.- Se seleccionaron muestras aleatorias de tamaño n de poblaciones binomiales con parámetros
poblacionales p dados aquí. Encuentre la media y la desviación estándar de la distribución muestral de la proporción 𝑝̂ en cada caso:
a) n= 100; p=0,3
b) n= 400; p=0,1
Ejercicios a resolver
6.- Se seleccionaron muestras aleatorias de tamaño n = 75 de una población binomial con p= 0,4. Use la distribución normal para aproximar las siguientes probabilidades:
a) P(𝑝̂ ≤ 0,43)
b) P(0,35 ≤ 𝑝̂ ≤ 0,43)
7) Calcule 𝑆𝐸(𝑝̂) para n= 100 y estos valores de p:
a) p= 0,01 b) p= 0,10 c) p= 0,30 d) p= 0,50 e) p= 0,70 f) p= 0,90 g) p= 0,99
¿Para que valor de p es máxima la desviación estándar de la distribución muestral de 𝑝̂? ¿Qué ocurre al error estándar cuando p es cercano a 0 o 1?
Ejercicios a resolver
8.- Se selecciona una muestra aleatoria de tamaño n=80 de una distribución binomial con proporción poblacional p = 0,25
a) ¿Cuál será la forma aproximada de la distribución muestral de 𝑝̂?
b) ¿Cuáles serán la media y la desviación estándar ( o error estándar) de la distribución muestral de 𝑝̂?