• No se han encontrado resultados

22. Prueba de hipótesis.pdf

N/A
N/A
Protected

Academic year: 2020

Share "22. Prueba de hipótesis.pdf"

Copied!
31
0
0

Texto completo

(1)

Introducción a la Estadística

E

SCUELA

N

ACIONAL DE

E

STUDIOS

S

UPERIORES

U

NIDAD

M

ORELIA

Noviembre, 2015

Licenciatura en Ciencias Ambientales

Unidad 4:

Bases de la inferencia estadística

(2)

¨

Proponen tentativamente

respuestas

a las preguntas de investigación.

¨

Deben referirse a una situación real, para ser sometidas a prueba, y

deben estar relacionadas con técnicas disponibles para probarlas.

¨

Los términos de la hipótesis y la relación planteada entre ellos, deben ser

observables y medibles, o tener referentes en la realidad.

• Proposición que no ha sido comprobada empíricamente, y que intenta describir o justificar un sistema o fenómeno

Hipótesis

H

ip

ót

es

(3)

La prueba de hipótesis…

¨

… proceso mediante el cual se intenta comprobar si una

afirmación sobre alguna propiedad poblacional puede ser

sostenida a la luz de la información muestral disponible.

Con las pruebas de hipótesis tratamos de resolver la siguiente pregunta:

(4)

Pasos

Pr

ue

b

a

d

e

hi

p

ót

es

is

Hacemos una afirmación sobre cierta característica

de la población o poblaciones

Colectamos datos

Analizamos datos con la prueba adecuada para determinar qué tan

(5)

Hipótesis nula

H

ip

ót

es

is

es

ta

d

ís

tic

a

s

Una afirmación de

status quo

(condición existente)

o de “no diferencia” y siempre contiene una

afirmación de igualdad. Muchas veces se formula

con la intención de rechazarla. Se asume que H

0

es verdadera hasta que se encuentra suficiente

evidencia para rechazarla

(6)

Hipótesis alterna

Plantea que los valores observados en el Universo,

en la muestra o en una variable, no son equivalentes

a los encontrados en otro Universo, muestra o

variable de interés.

Lo que significa que SI existe una

verdadera diferencia en los valores. Es la afirmación

para la cual buscamos evidencia.

Si encontramos

dicha evidencia, rechazamos H

0

y aceptamos H

1

.

H1 Hipótesis de diferencia

H

ip

ót

es

is

es

ta

d

ís

tic

a

(7)

¨

En un juicio, el acusado se asume como inocente hasta que se

demuestre lo contrario.

¨

Dado que se busca evidencia para su culpabilidad, ésta es la

hipótesis alternativa. Su inocencia es la hipótesis nula.

¨

H0=El acusado es inocente

¨

H1= El acusado es culpable

Pr

ue

b

a

d

e

hi

p

ót

es

(8)

Pr

ue

b

a

d

e

hi

p

ót

es

is

Cuando la H

1

no indica ninguna dirección, hablamos de una prueba de 2 colas

(9)

Pr

ue

b

a

d

e

hi

p

ót

es

is

Cuando la H

1

indica dirección hablamos de una prueba de hipótesis de 1 cola

Por lo general, para hacer una prueba de 1 cola, se debe tener conocimiento previo que la justifique

Cola izquierda

H0: Parámetro = cierto valor H1: Parámetro < cierto valor

Cola derecha

(10)

Errores

¨

Dado que la decisión de rechazar o no rechazar la hipótesis nula está

basada en información incompleta (a partir de la muestra), siempre existe

la posibilidad de tomar una decisión incorrecta.

H

ip

ót

es

is

es

ta

d

ís

tic

a

s

! H0!es!verdadera H1!es!verdadera

Aceptar!H0

Decisión(

correcta

Error(.po(II

Rechazar!H0

Error(.po(I

Decisión(

correcta

Realidad

De

ci

sió

n

Rechazamos la hipótesis nula cuando es

verdadera

No rechazamos la hipótesis nula

(11)

Ejemplo

¨

Considera una prueba de embarazo

Pr

ue

b

a

d

e

hi

p

ót

es

is

Estas pruebas trabajan buscando la presencia de la hormona hCG que es secretada por la placenta después de que los óvulos son fertilizados en el útero de una mujer

Si consideramos el lenguaje de las pruebas de hipótesis

H0= La mujer no está embarazada

(Esto es lo que asumimos como verdadero hasta que otra evidencia se aporte)

H1= La mujer está embarazada

! No!embarazada Embarazada

Aceptar!H0 Decisión(

correcta Error(.po(II

Rechazar!H0

Error(.po(I Decisión(correcta

Falso positivo

(12)

Otros ejemplos de Error tipo I

Pr

ue

b

a

d

e

hi

p

ót

es

is

Se considera que el paciente está enfermo, a pesar de que en realidad está sano; hipótesis nula: El paciente está sano.

(13)

¨

Asignamos las letras

α

y

β

a las probabilidades de

cometer error tipo I y error tipo II, respectivamente.

¨

Debido a la importancia que se le da a

α

, lo fijamos

a priori

.

Para minimizar el valor de

β

para un valor determinado de

α

,

el investigador debe escoger el

n

más grande que el tiempo,

el dinero y otros recursos le permitan.

Pr

ue

b

a

d

e

hi

p

ót

es

is

(14)

¨

El cálculo de

β

generalmente se hace

a posteriori

,

es decir, después del análisis y se reporta

generalmente su complemento:

¨

1 –

β

= probabilidad de rechazar H

0

cuando ésta

es falsa = PODER estadístico de una prueba.

Pr

ue

b

a

d

e

hi

p

ót

es

(15)

Establecemos conclusiones

¨

Una vez que tomamos la decisión de rechazar o no-rechazar

la hipótesis nula, el investigador debe indicar su conclusión. Es

importante reconocer que nunca

aceptamos

la hipótesis nula.

Decimos que hay suficiente evidencia estadística para

rechazar la hipótesis nula o que no hay suficiente evidencia

estadística para rechazarla.

¨

Pr

ue

b

a

d

e

hi

p

ót

es

(16)

Pr

ue

b

a

d

e

hi

p

ót

es

is

Estimando µ con σ conocida

Para realizar una prueba de hipótesis paramétrica sobre µ necesitamos 2 requerimientos

a) El muestro se llevó a cabo con un método aleatorio

b) La población de la que obtuvimos la muestra se distribuye aproximadamente normal o el tamaño de la muestra es grande (n≥30).

(17)

Un consumidor de papas Sabritas cree que la empresa está engañando a los clientes, pues indica que una bolsa contiene 12.5 onzas, pero él cree que en realidad contienen menos.

En la prueba de hipótesis asumimos que la empresa no es culpable H0: µ= 12.5

H1: µ< 12.5

El consumidor hace un muestreo aleatorio con una n= 36, obteniendo una X=12.45 onzas y una σ=0.12

¿Este resultado proporciona suficiente evidencia estadística para rechazar la hipótesis nula?

Pr

ue

b

a

d

e

hi

p

ót

es

(18)

¨ Podemos asumir que la distribución de x es normal (n>30)

¨ Tomamos la µ como la µx =12.5 (asumimos que H0 es cierto, hasta que se demuestre lo contrario) ¨ σ=0.12

¨ Calculamos σx= 0.02 onzas

¨ Un criterio es utilizar la distancia (en desviaciones estándar) a las que se encuentra el valor

de x de µ

Pr

ue

b

a

d

e

hi

p

ót

es

is

x

_

12.5 12.52 12.48

(19)

x

_

12.5 12.52 12.48

12.45

P(x≤12.45)

z=

x-

µ

σ

/ n

= -2.5

Pr

ue

b

a

d

e

hi

p

ót

es

is

P(x _ ≤ 12.45) = P(Z ≤ -2.5)= 0.0062

P-value

Usamos el P-value para cuantificar qué tan probable es la media muestral ( x ) en la distribución.

(20)

Regla de decisión

¨

Rechazamos la hipótesis si el valor de P es menor

que el nivel de significancia,

α

.

Pr

ue

b

a

d

e

hi

p

ót

es

is

En nuestro caso P=0.0062

Asumiendo H0 como verdadero, la

(21)

De acuerdo con Telcel, el gasto medio mensual en teléfono fue de $50.64 (σ=18.49) en 2004 . Tu crees que el gasto hoy en día es diferente, pero no estás seguro si es mayor o menor. Para probarlo, haces un muestreo aleatorio simple y obtienes los siguientes resultados:

94.25 38.94 79.15 56.78 70.07 115.59 77.56 37.01 55.00 76.05 27.29 52.48

Pr

ue

b

a

d

e

hi

p

ót

es

is

(22)

-2.69 2.69

La suma de las áreas de las 2 colas es el P-value

Pr

ue

b

a

d

e

hi

p

ót

es

(23)

¨ De acuerdo con la administración de carreteras de EUA, el número medio de millas

conducidas anualmente por persona es 12200 con una σ=3800 millas.

¨ Patricia cree que los residentes del estado de Montana conducen más que el

promedio nacional. Ella obtiene una muestra aleatoria simple de 30 residentes de una lista de los conductores del estado. El número medio de millas conducido por persona es 12895.9

¨

¨

¿A qué conclusión llega Patricia?

Pr

ue

b

a

d

e

hi

p

ót

es

(24)

Z0= 1.08

P-value

Pr

ue

b

a

d

e

hi

p

ót

es

(25)

Generalizando

-|z0| |z0|

C C

La suma de las áreas de las 2 colas es el P-value

Pr

ue

b

a

d

e

hi

p

ót

es

is

2 colas

1 cola

P-value P-value

z0 z0

P-value= 2P(Z>|z0|)

(26)

En excel

= PRUEBA.Z. (matrix, x, sigma)

Datos de la

muestra µ σ

Resultado: P-value de 1 cola

Pr

ue

b

a

d

e

hi

p

ót

es

(27)

¿Si no conozco

σ

?

-|t0| |t0|

C C

La suma de las áreas de las 2 colas es el P-value 2 colas

1 cola

P-value P-value

t0 t0

P-value= 2P(T>|t0|)

Utilizo distribución t-Student

Pr

ue

b

a

d

e

hi

p

ót

es

(28)

¨ De acuerdo con un estudio, los fumadores activos, fuman en promedio

18.1 cigarrillos/día. Tu crees que la población de adultos mayores fuma menos que la población en general.

¨ n=40 adultos mayores, x=16.8 cigarrillos/día, s=4.7 cigarrillos

Pr

ue

b

a

d

e

hi

p

ót

es

is

_

t0= x - µ

s/ n

______

Estadístico de prueba

Región crítica

-t0.1=-1.304

(29)

Prueba de t

Pr

ue

b

a

d

e

hi

p

ót

es

is

Utilizamos una prueba de t cuando estamos comparando 2 muestras

t

0

=

x

1

- x

2

s

1

s

2

n

1

n

2

_

+

_

_

_

2 2

(30)

Imagina que haces un estudio sobre la herbivoría de una especie de tu interés, pero tú crees que ésta es diferente en el sotobosque que en claros.

¿Habrá un efecto?

¿Cuáles son las hipótesis estadísticas?

Pr

ue

b

a

d

e

hi

p

ót

es

is

α=0.05

Sotobosque Claro

3 5

6 10

14 16

6 8

13 14

17 19

21 23

(31)

Referencias

Documento similar

El diagnóstico es endoscópico y requiere la exclusión de otras causas de eosinofilia colónica, como la enfermedad inflamatoria intestinal entre otras.. Los criterios diagnósticos

Aplicada la estadística sobre la muestra de estudio, los resultados describen respecto a la prueba de hipótesis general y conforme al análisis estadístico que, la

Los resultados obtenidos para la hipótesis general, sometido a la prueba estadística de Wilcoxon, con respecto al contraste de la prueba de hipótesis, los

“somos nosotros mismos los que vamos a reconstruir a Puerto Rico y tenemos que tener paciencia, que a lo mejor quisiéramos resolverlo todo con una varita mágica de hoy para mañana,

Grupo B2: carcinógenos humanos probables, con evidencia suficiente de estudios realizados en animales y evidencia inadecuada o inexistente a partir de

a) hipótesis nula (H 0 ), denominación que no debe entenderse como suposición del cero, sino, prueba de diferencia estadística cero y, en general, determina que no existe relación

Por lo tanto se indica que hay suficiente evidencia estadística para rechaza la hipótesis nula y afirmar que la psicomotricidad gruesa y la motivación, tienen relación positiva

Al elaborar la prueba de hipótesis el valor de significancia ha obtenido 0,000 son menores que las asignadas lo que nos permite rechazar la hipótesis nula (Ho) y aceptar la