Introducción a la Estadística
E
SCUELA
N
ACIONAL DE
E
STUDIOS
S
UPERIORES
U
NIDAD
M
ORELIA
Noviembre, 2015
Licenciatura en Ciencias AmbientalesUnidad 4:
Bases de la inferencia estadística
¨
Proponen tentativamente
respuestas
a las preguntas de investigación.
¨
Deben referirse a una situación real, para ser sometidas a prueba, y
deben estar relacionadas con técnicas disponibles para probarlas.
¨
Los términos de la hipótesis y la relación planteada entre ellos, deben ser
observables y medibles, o tener referentes en la realidad.
• Proposición que no ha sido comprobada empíricamente, y que intenta describir o justificar un sistema o fenómeno
Hipótesis
H
ip
ót
es
La prueba de hipótesis…
¨
… proceso mediante el cual se intenta comprobar si una
afirmación sobre alguna propiedad poblacional puede ser
sostenida a la luz de la información muestral disponible.
Con las pruebas de hipótesis tratamos de resolver la siguiente pregunta:
Pasos
Pr
ue
b
a
d
e
hi
p
ót
es
is
Hacemos una afirmación sobre cierta característica
de la población o poblaciones
Colectamos datos
Analizamos datos con la prueba adecuada para determinar qué tan
Hipótesis nula
H
ip
ót
es
is
es
ta
d
ís
tic
a
s
Una afirmación de
status quo
(condición existente)
o de “no diferencia” y siempre contiene una
afirmación de igualdad. Muchas veces se formula
con la intención de rechazarla. Se asume que H
0es verdadera hasta que se encuentra suficiente
evidencia para rechazarla
Hipótesis alterna
Plantea que los valores observados en el Universo,
en la muestra o en una variable, no son equivalentes
a los encontrados en otro Universo, muestra o
variable de interés.
Lo que significa que SI existe una
verdadera diferencia en los valores. Es la afirmación
para la cual buscamos evidencia.
Si encontramos
dicha evidencia, rechazamos H
0
y aceptamos H
1
.
H1 Hipótesis de diferencia
H
ip
ót
es
is
es
ta
d
ís
tic
a
¨
En un juicio, el acusado se asume como inocente hasta que se
demuestre lo contrario.
¨
Dado que se busca evidencia para su culpabilidad, ésta es la
hipótesis alternativa. Su inocencia es la hipótesis nula.
¨
H0=El acusado es inocente
¨H1= El acusado es culpable
Pr
ue
b
a
d
e
hi
p
ót
es
Pr
ue
b
a
d
e
hi
p
ót
es
is
Cuando la H
1no indica ninguna dirección, hablamos de una prueba de 2 colas
Pr
ue
b
a
d
e
hi
p
ót
es
is
Cuando la H
1indica dirección hablamos de una prueba de hipótesis de 1 cola
Por lo general, para hacer una prueba de 1 cola, se debe tener conocimiento previo que la justifique
Cola izquierda
H0: Parámetro = cierto valor H1: Parámetro < cierto valor
Cola derecha
Errores
¨
Dado que la decisión de rechazar o no rechazar la hipótesis nula está
basada en información incompleta (a partir de la muestra), siempre existe
la posibilidad de tomar una decisión incorrecta.
H
ip
ót
es
is
es
ta
d
ís
tic
a
s
! H0!es!verdadera H1!es!verdadera
Aceptar!H0
Decisión(
correcta
Error(.po(II
Rechazar!H0
Error(.po(I
Decisión(
correcta
Realidad
De
ci
sió
n
Rechazamos la hipótesis nula cuando es
verdadera
No rechazamos la hipótesis nula
Ejemplo
¨
Considera una prueba de embarazo
Pr
ue
b
a
d
e
hi
p
ót
es
is
Estas pruebas trabajan buscando la presencia de la hormona hCG que es secretada por la placenta después de que los óvulos son fertilizados en el útero de una mujer
Si consideramos el lenguaje de las pruebas de hipótesis
H0= La mujer no está embarazada
(Esto es lo que asumimos como verdadero hasta que otra evidencia se aporte)
H1= La mujer está embarazada
! No!embarazada Embarazada
Aceptar!H0 Decisión(
correcta Error(.po(II
Rechazar!H0
Error(.po(I Decisión(correcta
Falso positivo
Otros ejemplos de Error tipo I
Pr
ue
b
a
d
e
hi
p
ót
es
is
Se considera que el paciente está enfermo, a pesar de que en realidad está sano; hipótesis nula: El paciente está sano.
¨
Asignamos las letras
α
y
β
a las probabilidades de
cometer error tipo I y error tipo II, respectivamente.
¨
Debido a la importancia que se le da a
α
, lo fijamos
a priori
.
Para minimizar el valor de
β
para un valor determinado de
α
,
el investigador debe escoger el
n
más grande que el tiempo,
el dinero y otros recursos le permitan.
Pr
ue
b
a
d
e
hi
p
ót
es
is
¨
El cálculo de
β
generalmente se hace
a posteriori
,
es decir, después del análisis y se reporta
generalmente su complemento:
¨
1 –
β
= probabilidad de rechazar H
0
cuando ésta
es falsa = PODER estadístico de una prueba.
Pr
ue
b
a
d
e
hi
p
ót
es
Establecemos conclusiones
¨
Una vez que tomamos la decisión de rechazar o no-rechazar
la hipótesis nula, el investigador debe indicar su conclusión. Es
importante reconocer que nunca
aceptamos
la hipótesis nula.
Decimos que hay suficiente evidencia estadística para
rechazar la hipótesis nula o que no hay suficiente evidencia
estadística para rechazarla.
¨
Pr
ue
b
a
d
e
hi
p
ót
es
Pr
ue
b
a
d
e
hi
p
ót
es
is
Estimando µ con σ conocida
Para realizar una prueba de hipótesis paramétrica sobre µ necesitamos 2 requerimientos
a) El muestro se llevó a cabo con un método aleatorio
b) La población de la que obtuvimos la muestra se distribuye aproximadamente normal o el tamaño de la muestra es grande (n≥30).
Un consumidor de papas Sabritas cree que la empresa está engañando a los clientes, pues indica que una bolsa contiene 12.5 onzas, pero él cree que en realidad contienen menos.
En la prueba de hipótesis asumimos que la empresa no es culpable H0: µ= 12.5
H1: µ< 12.5
El consumidor hace un muestreo aleatorio con una n= 36, obteniendo una X=12.45 onzas y una σ=0.12
¿Este resultado proporciona suficiente evidencia estadística para rechazar la hipótesis nula?
Pr
ue
b
a
d
e
hi
p
ót
es
¨ Podemos asumir que la distribución de x es normal (n>30)
¨ Tomamos la µ como la µx =12.5 (asumimos que H0 es cierto, hasta que se demuestre lo contrario) ¨ σ=0.12
¨ Calculamos σx= 0.02 onzas
¨ Un criterio es utilizar la distancia (en desviaciones estándar) a las que se encuentra el valor
de x de µ
Pr
ue
b
a
d
e
hi
p
ót
es
is
x
_
12.5 12.52 12.48
x
_
12.5 12.52 12.48
12.45
P(x≤12.45)
z=
x-
µ
σ
/ n
= -2.5Pr
ue
b
a
d
e
hi
p
ót
es
is
P(x _ ≤ 12.45) = P(Z ≤ -2.5)= 0.0062
P-value
Usamos el P-value para cuantificar qué tan probable es la media muestral ( x ) en la distribución.
Regla de decisión
¨
Rechazamos la hipótesis si el valor de P es menor
que el nivel de significancia,
α
.
Pr
ue
b
a
d
e
hi
p
ót
es
is
En nuestro caso P=0.0062
Asumiendo H0 como verdadero, la
De acuerdo con Telcel, el gasto medio mensual en teléfono fue de $50.64 (σ=18.49) en 2004 . Tu crees que el gasto hoy en día es diferente, pero no estás seguro si es mayor o menor. Para probarlo, haces un muestreo aleatorio simple y obtienes los siguientes resultados:
94.25 38.94 79.15 56.78 70.07 115.59 77.56 37.01 55.00 76.05 27.29 52.48
Pr
ue
b
a
d
e
hi
p
ót
es
is
-2.69 2.69
La suma de las áreas de las 2 colas es el P-value
Pr
ue
b
a
d
e
hi
p
ót
es
¨ De acuerdo con la administración de carreteras de EUA, el número medio de millas
conducidas anualmente por persona es 12200 con una σ=3800 millas.
¨ Patricia cree que los residentes del estado de Montana conducen más que el
promedio nacional. Ella obtiene una muestra aleatoria simple de 30 residentes de una lista de los conductores del estado. El número medio de millas conducido por persona es 12895.9
¨
¨
¿A qué conclusión llega Patricia?
Pr
ue
b
a
d
e
hi
p
ót
es
Z0= 1.08
P-value
Pr
ue
b
a
d
e
hi
p
ót
es
Generalizando
-|z0| |z0|
C C
La suma de las áreas de las 2 colas es el P-value
Pr
ue
b
a
d
e
hi
p
ót
es
is
2 colas
1 cola
P-value P-value
z0 z0
P-value= 2P(Z>|z0|)
En excel
= PRUEBA.Z. (matrix, x, sigma)
Datos de la
muestra µ σ
Resultado: P-value de 1 cola
Pr
ue
b
a
d
e
hi
p
ót
es
¿Si no conozco
σ
?
-|t0| |t0|
C C
La suma de las áreas de las 2 colas es el P-value 2 colas
1 cola
P-value P-value
t0 t0
P-value= 2P(T>|t0|)
Utilizo distribución t-Student
Pr
ue
b
a
d
e
hi
p
ót
es
¨ De acuerdo con un estudio, los fumadores activos, fuman en promedio
18.1 cigarrillos/día. Tu crees que la población de adultos mayores fuma menos que la población en general.
¨ n=40 adultos mayores, x=16.8 cigarrillos/día, s=4.7 cigarrillos
Pr
ue
b
a
d
e
hi
p
ót
es
is
_t0= x - µ
s/ n
______
Estadístico de prueba
Región crítica
-t0.1=-1.304
Prueba de t
Pr
ue
b
a
d
e
hi
p
ót
es
is
Utilizamos una prueba de t cuando estamos comparando 2 muestras
t
0
=
x
1
- x
2
s
1
s
2
n
1
n
2
_
+
_
_
_
2 2
Imagina que haces un estudio sobre la herbivoría de una especie de tu interés, pero tú crees que ésta es diferente en el sotobosque que en claros.
¿Habrá un efecto?
¿Cuáles son las hipótesis estadísticas?
Pr
ue
b
a
d
e
hi
p
ót
es
is
α=0.05
Sotobosque Claro
3 5
6 10
14 16
6 8
13 14
17 19
21 23