• No se han encontrado resultados

Distribuciones Muestrales INFERENCIA ESTADÍSTICA JTP. JUAN PABLO QUIROGA

N/A
N/A
Protected

Academic year: 2021

Share "Distribuciones Muestrales INFERENCIA ESTADÍSTICA JTP. JUAN PABLO QUIROGA"

Copied!
25
0
0

Texto completo

(1)

Distribuciones

Muestrales

INFERENCIA ESTADÍSTICA

JTP. JUAN PABLO QUIROGA

(2)

Temario

vMuestras Aleatorias

vTeorema del Limite Central

vLa distribución muestra de la media muestral

vLa distribución muestral de la proporción muestral

vPlanes muestrales y diseños experimentales. vEstadísticas y distribuciones muestrales.

(3)

Muestras Aleatorias

La forma en que una muestra se selecciona recibe el nombre de Plan Muestral o Diseño experimental y determina la cantidad de información de una muestra. Saber el plan muestral empleado permite determinar la confiabilidad de la Inferencia.

Muestreo aleatorio simple: Si una muestra de n elementos se selecciona de entre una población de N elementos, usando un plan muestral en el que cada una de las posibles muestras tiene la misma probabilidad de selección.

Muestreo aleatorio estratificado: Consiste en seleccionar una muestra aleatoria simple de cada uno de uno de un número dado de subpoblaciones o estratos.

Muestreo aleatorio Conglomerado: Es una muestra aleatoria simple tomada de los conglomerados disponibles en la población.

(4)

Muestras Aleatorias

Muestreo Aleatorio Sistemático 1 en k: involucra la selección aleatoria de uno de los primeros k elementos de una población ordenada y luego la selección sistemática de cada k-esimo elemento de ahí en adelante.

(5)

Estadística y Distribuciones Muestrales

La definición muestral de una estadística es la distribución de probabilidad para los posibles valores de la estadística, que resulta cuando muestras aleatorias de tamaño n se sacan

repetidamente de la población

Existen tres formas para hallar la distribución muestral de estadística

1. Deducir matemáticamente usando leyes de probabilidad.

2. Usar una simulación para aproximar la distribución (Sacar un gran número de muestras de tamaño n, calculando el valor de la estadística à Tabular à Histograma de frecuencia

relativa. à Nos da muy cerca de distribución muestral teorica.

(6)

Teorema del Limite Central

El teorema del limite central establece que , en condiciones mas bien generales, las sumas y medias de muestras aleatorias de mediciones tomadas de una población tienden a tener una distribución aproximadamente normal.

“Si muestras aleatorias de n observaciones se sacan de una población no normal con media finita µ desviación estándar s, entonces, cuando n es grande, la distribución de muestreo de la media muestral x esta distribuida normalmente en forma aproximada, con media µ y desviación estándar s

𝜎 √𝑛

La aproximación se hace mas precisa cuando n se hace grande. Y las probabilidades se calculan usando la variable aleatoria estándar: 𝑧 = 𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 − 𝑚𝑒𝑑𝑖𝑎 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 = 𝑥̅ − 𝜇 𝜎 √𝑛

(7)

Error Estándar

La desviación estándar de una estadística empelada como estimador de un parámetro poblacional también se denomina error estándar del estimador (SE) por que se refiere a la precisión del estimador. Por lo tanto la desviación estándar de Escriba aquí la ecuación.

𝑆𝐸 𝑥̅ = 𝜎 √𝑛

(8)

Ejercicio

El CI de los alumnos de un centro, se distribuye normalmente con media 80 y desviación estándar (𝜎) 10. Si extraemos una muestra aleatoria simple de 25 alumnos:

a) Si se extrae un sujeto al azar ¿cuál es la probabilidad de que obtenga como mínimo una puntuación en CI de 75?

b) Cual es la probabilidad de que su media aritmética sea mayor de 75?

c) ¿cuál es la probabilidad de que su media aritmética sea como máximo 83?

d) ¿qué valor debería tomar la media aritmética para que la probabilidad de obtenerlo en esa muestra sea como máximo 0,85?

(9)

Resolución

a) 𝑃 𝑋 ≥ 75 = 𝑃 𝑧 ≥ O̅PQ R = P z ≥ UVPWX YX = 𝑃 𝑧 ≥ −0,5 = 0,6915 b) 𝑃 𝑋 ≥ 75 = 𝑃 𝑧 ≥ O̅PQ_ √` = P z ≥ UVPWX YX/V = 𝑃 𝑧 ≥ −2,5 = 0,9938 c) 𝑃 𝑋 ≤ 83 = 𝑃 𝑧 ≤ O̅PQ_ √` = P z ≤ WfPWX YX/V = 𝑃 𝑧 ≤ 1,5 = 0,9332 d) 𝑃 𝑋 ≤ 𝑋𝑖 = 0,85 → 𝑧0,85 = 1,04 = OjPWX YX/V = 𝑋𝑖 = 1,04 ∗ YX V + 80 = 82,08

(10)

Resolver

La duración de la enfermedad de Alzheimer desde el principio de los síntomas hasta el fallecimiento varia de 3 a 20 años; el promedio es de 8 años con una desviación estándar de 4 años. El administrador de un centro medico selecciona al azar los registros médicos de 30 pacientes de Alzheimer ya fallecidos, de la base de datos del centro medico y anota la duración. Encuentre las probabilidades aproximadas de estos eventos:

1. La duración Promedio es menor a 7 años.

2. La duración promedio excede a 7 años

(11)

Resolución

Como se sacaron muestras aleatorias de la base de datos, se pueden sacar conclusiones acerca delos pacientes pasados, presentes o futuros de Alzheimer de el centro medico, si el centro medico es representativo ( gran Muestra) es posible sacar conclusiones de mas alcance.

La muestra no es simétrica, ya que la media no esa a la mitad de los valores mínimos y máximos, como la media esta mas cerca del mínimo, la muestra esta sesgada a la derecha., con unos pocos pacientes viviendo largo

tiempo después de iniciada la enfermedad. 1. 𝑃 𝑋 < 7 = 𝑃 𝑧 < O̅PQ_

√`

= P z < n/√fXUPW = 𝑃 𝑧 < −1.37 = 0,0853

Usamos la Ro en la formula para sacar z por que estamos buscando un área bajo la distribución normal para xmedia, no bajo l adistribución d eprobabilidad para x.

1. El evento de que x exceda de 7 es el complemento del evento de que x sea menor que 7, entonces: 𝑃 𝑥̅ > 7 = 1 − 𝑃 𝑥̅ < 7 = 1 − 0,0853 = 0,917

(12)

La probabilidad de que x se encuentre a no mas de 1 año de 𝜇 = 8.

El valor de z para x = 7 es de -1,37 y z para x=9 es:

𝑧 = O̅PQ_ √`

= rPW

n/√fX = 1.37

(13)

Resolver 2

Supongamos que el profesorado de una universidad, con el rango de profesor en instituciones publicas que imparten carreras de dos años, ganan en promedio 71802 pesos por año con una desviación estándar de 4000 pesos. En un intento por verificar este nivel de salario se selecciono una muestra aleatoria de 60 profesores de entre una base de datos del personal para todas las instituciones de dos años en Argentina.

1. Describa la distribución muestral de la media muestral 𝑥̅

2. ¿Dentro de que limites se esperaría que este el promedio mensual con probabilidad de .95?

3. Calcule la probabilidad de que la media muestral 𝑥̅ sea mayor que 73000 pesos.

4. Si su muestra aleatoria en realidad produjo una media de 73000 pesos ¿Consideraría que esto es poco común? ¿qué conclusiones Obtendría?

(14)

Resolver 3

Un articulo en el American Demographics dice que mas del doble de compradores salen de compras los fines de semana que durante la semana. No solo eso, porque esos compradores tambien gastan mas dinero en sus compras en sábados y domingos. Suponga que la cantidad de dinero gastada en centros comerciales, entre las 4 pm y 6 pm los domingos tiene una

distribución normal con media de $85 y una desviación estándar de $20. Un comprador se

selecciona al azar un domingo entre las 4pm y las 6pm y se le pregunta sobre su forma de gastar.

a) ¿cuál es la probabilidad de que el haya gastado mas de $95 en el centro comercial?

b) ¿cuál es la probabilidad de que el haya gastado entre $95 y $115?

c) Si dos compradores se seleccionan al azar ¿cuál es la probabilidad de que ambos compradores hayan gastado mas de $115 en el centro comercial?

(15)

Distribución Muestral de la Proporción

Muestral

Si una muestra aleatoria de n observaciones se selecciona de una población binomial con parámetro p, entonces la distribución muestral de la proporción muestral:

𝑝̂ = O

o

Y tendrá una media 𝑝

Y una desviación estándar

𝑆𝐸 𝑝̂ = √u.v

o donde 𝑞 = 1 − 𝑝

Cuando el tamaño muestral de n es grande, la distribución muestral de𝑝̂ puede ser aproximada por una distribución normal. La aproximación será adecuada si n.p > 5 y n.q > 5

(16)

Resolver

En una encuesta se pregunto a 500 madres y padres sobre la importancia del deporte para hijos e hijas. De los padres entrevistados 60% estuvo de acuerdo en que los géneros son iguales y deben tener iguales oportunidades de participar en deportes.

Describa la distribución muestral de la proporción muestral p de padres que están de acuerdo en que los géneros son iguales y deben tener iguales oportunidades.

(17)

Resolución

Se puede suponer que los 500 padres representan una muestra aleatoria de los padres de todos los hijos e hijas de Argentina y que la verdadera proporción de la población es igual a algún

valor desconocido que se puede llamar p.

La distribución muestral de𝑝̂, puede ser aproximada por una distribución muestral con media igual a p, ya que si se verifican las condiciones que permiten la aproximación normal a la

distribución de p, se puede ver que n=500 es adecuado para valores de p cercanos a 0,6 por que tanto n.p = 300 como n.q =200 son mayores que 5

𝑆𝐸(𝑝̂) = u.vo ≈ uy.vy

o =

X,zX .(X,nX)

(18)

Como calcular probabilidades para la

proporción muestral

𝑝̂

1. Encuentre los valores necesarios de n y p.

2. Verifique si la aproximación normal a la distribución binomial es apropiada ( n.p>5 y n.q>5)

3. Escriba el evento de interés en términos de 𝑝̂ y localice el área apropiada en la curva normal.

4. Convierta los valores necesarios de 𝑝̂ en valores de z usando:

𝑧 = 𝑝̂. 𝑝 𝑝. 𝑞

𝑛

(19)

Resolver

En una encuesta se pregunto a 500 madres y padres sobre la importancia del deporte para hijos e hijas. De los padres entrevistados 60% estuvo de acuerdo en que los géneros son iguales y deben tener iguales oportunidades de participar en deportes.

Describa la distribución muestral de la proporción muestral p de padres que están de acuerdo en que los géneros son iguales y deben tener iguales oportunidades.

Ahora el dato de p = 0,55

¿Cuál es la probabilidad de observar una proporción muestral igual de grande o mayor que el valor observado de 𝑝̂ = 0,60

(20)

Resolución

p = 0,55 y

SE= u.vo = X,VV .(X.nV)VXX = 0,22

Para encontrar el área bajo la curva, primero se debe calcular el valor de z correspondiente a 𝑝̂ = 0,60 𝑧 = uyPu {.| ` = X,zX P(X,VV)X,}}} = 2.25 P(𝑝̂>0,60) ≈ 𝑃 𝑧 > 2.25 = 1 − 0,9878 = 0.0122

Por lo tanto si seleccionáramos una muestra aleatoria de n= 500 observaciones de una

población con proporción p = 0,55, la probabilidad de que la proporción muestral 𝑝̂ fuera tan grande o mayor que 0,60 es de solo 0,0122

(21)

Ejercicios a resolver

1- Una Muestra aleatoria de n observaciones se selecciona de una población con desviación estándar σ = 1. Calcule el error estándar de la media (SE) para estos valores de n

n=1 ; n=2; n=4

2. Se selecciona una muestra aleatoria de tamaño n=49 de una población con media µ=53 y desviación estándar σ =21

¿Cuál será la forma aproximada de la distribución muestral de 𝑥̅?

¿Cuáles serán la media y la desviación estándar de la distribución muestral 𝑥̅?

3. Se selecciona una muestra aleatoria de tamaño n=40 de una población con media µ=100 y desviación estándar σ=20

¿Cuál será la forma aproximada de la distribución muestral de 𝑥̅?

(22)

Ejercicios a resolver:

4.- Suponga que se selecciona una muestra aleatoria de n= 25 observaciones de una población que esta distribuida normalmente, con media igual a 106 y desviación estándar igual a 12.

◦ Dé la media y desviación estándar de la distribución muestral de la media muestral 𝑥̅ ◦ Encuentre la probabilidad de que 𝑥̅ exceda 110

◦ Encuentre la probabilidad de que la media muestral se desvíe de la media poblacional µ = 106 en no mas de 4

5.- Se seleccionaron muestras aleatorias de tamaño n de poblaciones binomiales con parámetros

poblacionales p dados aquí. Encuentre la media y la desviación estándar de la distribución muestral de la proporción 𝑝̂ en cada caso:

a) n= 100; p=0,3

b) n= 400; p=0,1

(23)

Ejercicios a resolver

6.- Se seleccionaron muestras aleatorias de tamaño n = 75 de una población binomial con p= 0,4. Use la distribución normal para aproximar las siguientes probabilidades:

a) P(𝑝̂ ≤ 0,43)

b) P(0,35 ≤ 𝑝̂ ≤ 0,43)

7) Calcule 𝑆𝐸(𝑝̂) para n= 100 y estos valores de p:

a) p= 0,01 b) p= 0,10 c) p= 0,30 d) p= 0,50 e) p= 0,70 f) p= 0,90 g) p= 0,99

¿Para que valor de p es máxima la desviación estándar de la distribución muestral de 𝑝̂? ¿Qué ocurre al error estándar cuando p es cercano a 0 o 1?

(24)

Ejercicios a resolver

8.- Se selecciona una muestra aleatoria de tamaño n=80 de una distribución binomial con proporción poblacional p = 0,25

a) ¿Cuál será la forma aproximada de la distribución muestral de 𝑝̂?

b) ¿Cuáles serán la media y la desviación estándar ( o error estándar) de la distribución muestral de 𝑝̂?

(25)

Referencias

Documento similar

a) hay un total de 93 compuestos (193 fragmentos) en disposición cabeza- cabeza y un total de 308 compuestos (477 fragmentos) en disposición cabeza-cola que cumplen

T y F, no sirven cuando U n-1 (término de error con ruido blanco)residuos violan el supuesto de µ=0 y σ 2¨ =1 no tienen una tendencia normal como tampoco cuando µ i muestra

gareis , qual Icaro , deshechas las alas de mi prefumpcíon al Solde vueiha eloquencia, precípicarme en las abífmos de mi igIio.... Y afsi (a ga laiicca el Efpiricu

Talla media y desviación estándar de candelilla para el área con distribución potencial (General) y entre los tipos de vegetación, tipo de suelo y pendiente del terreno en el norte

a) La desviación típica de la distribución. b) Los límites del intervalo simétrico con respecto a la media que contiene el 70% de los valores de dicha población. De una población

El muestreo es un proceso o conjunto de métodos para obtener una muestra finita de una población finita o infinita, con el fin de estimar valores de parámetros o corroborar

OBSERVACIONES N°

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..