Introducción a la Estadística
E
SCUELA
N
ACIONAL DE
E
STUDIOS
S
UPERIORES
U
NIDAD
M
ORELIA
Noviembre, 2015
Licenciatura en Ciencias AmbientalesUnidad 4:
Bases de la inferencia estadística
¨
A través de la
estimación
, tratamos de acceder a los
parámetros con base en los estadísticos.
¨
La estimación se hace a través de 2 procesos:
¨
1. Obtener un valor específico de la muestra, llamado estimador puntual
¨
Cuando calculamos una media muestral, o cualquier
otra medida estadística muestral, queremos saber
qué tan confiable es esa estimación del parámetro .
Para ello se construyen
intervalos de confianza
.
¨
El
nivel de confianza
es la probabilidad de que el parámetro a estimar
¨se encuentre en el intervalo de confianza.
¿Cómo construimos un CI?
¨
Partimos de los conocimientos que ya adquirimos:
¨
A) La media muestral es una variable aleatoria contínua que se
distribuye de manera normal cuando la población se distribuye
de manera normal, o cuando la muestra es grande (<30).
¨
B)
µ
X=
µ
y
σ
X=
σ
/
n
Margen de error
Nivel de confianza
Área en cada cola, α/2
Valor crítico, zα/2
90% 0.05 1.645
95% 0.025 1.96
99% 0.005 2.575
2.5% de las medias muestrales
2.5% de las medias muestrales
µ-1.96σx µ+1.96σx
x
Ejemplo
¨
Se conoce que las pruebas de IQ están distribuidas
de manera normal con una
µ
= 100 y una
σ
=16.
¨
Imagina que obtenemos 20 muestras con n=15
Generalizando…
µ-zα/2· σn µ+zα/2· σn
α/2 · 100% α/2 · 100%
X
µ
(1−α) · 100%
< µ <
X-zα/2· σ
n X+zα/2· σ
n
Nivel de confianza
Área en cada cola, α/2
Valor crítico, zα/2
90% 0.05 1.645
95% 0.025 1.96
¨
Sabemos que la velocidad de autos en una carretera sigue una
distribución normal con una
σ
=8 millas/h.
a) Calcular CI con un nivel de confianza del 95% con n=12, y X=59.62 millas/h b) Calcular CI con un nivel de confianza del 90% con n=12, y X=59.62 millas/h c) Calcular CI con un nivel de confianza del 99% con n=12, y X=59.62 millas/h d) Calcular CI con un nivel de confianza del 95% n=48, y X=59.69 millas/h
__ __
¿Y cuando no conocemos
σ
?
z
=
X-
µ
σ
/ n
t
=
X-
µ
s/ n
Propiedades de la distribución
t
-Student
- El área bajo la curva = 1.
- La curva se acerca pero nunca toca la horizontal.
- El área en las colas de la distribución es algo
mayor que el área en las colas de Z.
- A medida que aumenta n la curva de t se
aproxima a la normal, esto debido a que los
valores de s se acercan más a
σ
a medida que n
aumenta. Para n = infinito, t=Z.
Normal estándar z
t con n=15
t con n=5
0
- La forma depende de los grados de libertad.
Encuentre el valor de t que en una distribución
t
-Student tiene a su derecha es 0.1, asumiendo 15 df. Es decir t0.10 con 15 gl.Área=α
¿Cómo estimamos el CI?
< µ <
X-tα/2· σ
n X+tα/2· σn
s s
¨
Intervalos de confianza con
t
0.025
¤
n
= 6, X
±
2.571 •
s
/
√
6
¤
n = 16, X
±
2.131 •
s
/
√
16
¤
n
= 31, X
±
2.042 •
s
/
√
31
¤
n
= 101, X
±
1.984 •
s
/
√
101
¨
Un botánico quiere determinar el DAP promedio de
encinos adultos. Toma una muestra aleatoria de
n=7 y obtiene las siguientes mediciones
¨
¿Cuál sería el CI con un nivel de confianza del 95?
¿Cuál sería el CI con un nivel de confianza del 99?
¨
En un estudio se encuestaron a 1028 adolescentes y
se les preguntó el número de horas semanales que
veían TV.
¨
X=13 horas; s=2.3 horas
¨ ¿Cuál sería el CI con un nivel de confianza del 95?
¨ ¿Cuál sería el CI con un nivel de confianza del 99?
¨
En un estudio se encuestaron a 1028 adolescentes y
se les preguntó el número libros que leyeron el año
pasado
¨
X=13.4 libros; s=16.6
¨ ¿Cuál sería el CI con un nivel de confianza del 95?
¨ ¿Cuál sería el CI con un nivel de confianza del 99?
s
2y
s
también pueden considerarse variables aleatorias continuas,
y por lo tanto tienen una distribución, la cual puede usarse para
calcular intervalos de confianza.
¿Por qué nos podría interesar estimar σ2?
Considera una máquina de café que algunas veces llena
mucho una taza y otras veces la llena muy poco. Seguramente el usuario no estará muy contento cuando no deposite la
cantidad de la media.
CI para
s
2
Si una muestra aleatoria simple de tamaño n es obtenida de una población con distribución normal con media µ y desviación estándar σ, entonces
χ2= (n-1) s
2
σ2
Empleamos una Distribución chi-cuadrado (x2)
Distribución chi-cuadrada
1. No es simétrica
2. La forma de la distribución depende de los grados de libertad
3. A medida que los grados de libertad
aumentan, la distribución se hace cada vez más simétrica
4. La distribución toma valores mayores o iguales a 0 (χ2≥0)
χ2
p(
χ
¨
Dado que
χ
2no es simétrica,
NO
podemos construir el CI para
σ
2como:
¨
Estimador puntual ± Margen de error
¨
Encuentra los valores críticos para un nivel de confianza de
confianza del 90% de la distribución
χ
2, con 15 gl.
Área=0.90
Área=0.05
Área=0.05
χ2
0.95 χ
2
χ2
0.95
χ2
0.05
=7.261
Construyendo el CI
α/2
χ2 α
(1-α)·100% de los valores de (n-1)s
2
σ2 caen en esta región
α/2 2 1- χ 2 α 2 2 α 2 1- 2 α 2
σ
2
(n-1)s2 (n-1)s2