12. Contraste de hipótesis

(1)

1

"Es una verdad muy cierta que, cuando no esté a

nuestro alcance determinar lo que es verdad,

deberemos seguir lo que es más probable".

Descartes, en su

Discurso del Método

(2)

2

Contraste de hipótesis:

¿Qué es una hipótesis estadística?

• Es una conjetura o creencia acerca de una o

varias poblaciones. Normalmente en referencia

a sus parámetros: la media, la varianza o una

proporción, por ejemplo.

• Si queremos contrastarla, debe establecerse

antes del análisis. Después se utilizan los

datos de las muestras para obtener evidencias

que confirmen o no la hipótesis propuesta.

(3)

3

Hipótesis científica: Escuchar la música de Mozart tiene

un efecto sobre el CI diferente al de la música de El Fari.

Experimento: De la población española seleccionamos

20 niños al azar en dos grupos de 10. Un grupo

escuchará Mozart antes de hacer el test de CI. El otro escuchará a El Fari. Después de realizar los test, se

calculan las medias y cuasivarianzas en cada uno de los dos grupos.

Veamos un ejemplo:

El efecto "Mozart vs. El Fari":

Se sospecha que los individuos rinden más en un test de

inteligencia tras escuchar música de Mozart que cuando han

(4)

4

Supongamos que la media del CI del grupo de

Mozart fue 110 con cuasivarianza = 100, mientras

que la media del grupo de El Fari fue de 102

y cuasivarianza = 64.

Entonces: ¿Podemos decir que hay diferencias

a nivel poblacional entre ambos grupos?

Para tomar tal decisión necesitaremos plantear

DOS hipótesis estadísticas:

(5)

5

Hipótesis estadísticas:

-Hipótesis nula. Es la que proporciona la solución "más

sencilla". En nuestro ejemplo sería que la media

poblacional de ambos grupos es la misma. Es decir, que no hay un efecto de la música sobre el CI.

H

₀

:

µ

₁

=

µ

₂

-Hipótesis alternativa. Es la hipótesis complementaria (y "más compleja"). En nuestro caso sería que la media poblacional de ambos grupos es diferente. Es decir, que hay un efecto de la música sobre el CI.

H

₁

:

µ

₁

≠ µ

₂

¿Cómo decidimos

entre ambas hipótesis?

Veamos otros ejemplos.

(6)

6

Otro ejemplo:

Sometamos a la reina de

Inglaterra al siguiente

experimento:

Se le presentan 8 tazas de té

con leche, idénticas en su

aspecto. En 4 de ellas la

leche se añadió a la taza

con anterioridad al té. Y en

las 4 restantes, se añadió la

leche después.

La reina las prueba y

dictamina, acertadamente, las tazas en las que se

sirvió primero la leche.

¿Chiripa?

(7)

7

¿Cuántas posibilidades había?

La reina debía escoger 4 tazas de las 8. Sin tener

en cuenta el orden tenía 70 posibilidades distintas

(Combinaciones de 8 elementos tomados de 4 en 4).

Si supusiéramos que respondió al azar, su probabilidad

de acertar hubiera sido de 1/70.

¿Cuáles son aquí las hipótesis estadísticas? -Hipótesis nula: La reina acertó por chiripa.

H

₀

: p

= 1/70

-Hipótesis alternativa: La reina tiene un paladar sobrenatural.

(8)

8

Parece razonable en este caso rechazar la

hipótesis nula.

¿Por qué nos parece razonable rechazarla?

Hemos supuesto que la reina juzgaba al azar

(hipótesis nula). Por tanto hemos supuesto una

distribución de probabilidad : cualquier

combinación de las cuatro tazas tenía la misma

probabilidad de ser elegida: p = 1/70

(una distribución uniforme).

Con esa distribución la reina tenía 69/70 de

probabilidad de no acertar. Y sin embargo la reina

acertó…

(9)

“The title comes from the "lady tasting tea", an example from the famous book, The Design of Experiments, by Ronald A. Fisher”.

(10)

10

Otro ejemplo más (lo tenéis en detalle en el libro

de Marta y Jose):

Pasados 2 años cierta vacuna solo es eficaz en un

25% de los casos.

Se experimenta con una nueva vacuna que tal vez

prolongue la eficacia.

Se inyecta a 20 sujetos experimentales.

Si más de 8 sujetos superan el periodo de dos años

sin contraer el virus, la nueva vacuna se considera

mejor que la anterior.

El número 8 es un tanto arbitrario, pero parece

razonable teniendo en cuenta que esperaríamos

5 casos para la vacuna anterior.

(11)

11

¿Quién es H

₀

?

• Hipótesis nula H

₀

: ambas vacunas son iguales.

• Hipótesis alternativa H

₁

: la nueva vacuna es mejor.

Con la vacuna antigua cada paciente tiene una

probabilidad p = 1/4 de no contraer la enfermedad

pasados 2 años.

_H

0

: p = 1/4 y H

1

: p > 1/4

¿Podemos rechazar la hipótesis nula, que las dos

vacunas son igualmente eficaces?

El estadístico de prueba es

X = número de individuos

de la prueba que reciben protección contra el

virus más allá de dos años

. Y se distribuye como

(12)

12

Dividiremos los posibles valores de

X

(de 0 a 20) en

dos grupos:

(1) Menores o iguales a 8 (Región de aceptación).

(2) Mayores a 8 (Región crítica o de rechazo).

8 es el valor crítico en este caso.

Si x es el número de pacientes experimentales que

no se han infectado después de 2 años, entonces:

Si x > 8 rechazamos H

₀

a favor de la hipótesis

(13)

13

El procedimiento descrito nos puede conducir

a las siguientes conclusiones erróneas:

(1) La nueva vacuna realmente no es mejor

que la antigua (hemos rechazado la hipótesis

nula y cometido

un error de tipo I

).

(2) Concluimos que la nueva vacuna no es mejor

que la anterior, cuando realmente sí lo es (hemos

aceptado la hipótesis nula y cometido

un error

(14)

14

La probabilidad de cometer un error de tipo I

se llama nivel de significación o tamaño de la

región crítica y se representa por α.

En nuestro ejemplo:

Se dice que la hipótesis nula, p = 1/4, se está

probando con un nivel de significación de

α = 0.0409. Nivel de significación bastante

pequeño, por tanto poco probable que hayamos

cometido un error de tipo I.

∑

= −

=





































=

>

=

20 9 20 0 0

0409

.

0

4

3

4

1

20 )

4 /

1 |

8 (

)

cierta

es

H

|

H

Rechazar

(

)

I

tipo

de

error

(

x x x

x

p

X

P

α

(15)

15

La probabilidad de cometer un error de tipo II

se representa por β. Sólo podemos calcularla

si tenemos una hipótesis alternativa “concreta”.

Por ejemplo en nuestro caso podíamos haber

tomado como hipótesis alternativa: p = 0.5.

En nuestro ejemplo:

2517

.

0

2

1

2

1

20 )

2 /

1 |

8 (

)

falsa

es

H

|

H

Aceptar

(

)

II

tipo

de

error

(

8 0 20 0 0

∑

= −

=





































=

≤

=

x x x

x

p

X

P

β

(16)

(17)

(18)

18

Contraste de hipótesis:

Los tres pasos básicos para contrastar una

hipótesis serán:

1- Formular dos hipótesis H

₀

y H

₁

.

2- Derivar un estadístico de contraste a partir

de la muestra de observaciones e identificar su

distribución muestral bajo la hipótesis nula.

3- Derivar una regla de decisión y elegir una de

las dos hipótesis en base a la evidencia de una

muestra. Una regla de decisión que selecciona

una de las dos sentencias siguientes:

(19)

19

Contrastes para la media de una población

Población normal (o n > 30) y

σ

conocida. Hipótesis bilateral H_o: µ = µ₀ H₁: µ ≠ µ₀ Estadístico:

n

x

z

σ

µ

−

=

-

z

_α/2 +

z

_α/2 1 -

α

σ

µ

α α



=

−











₋

_<

−

_<

1 /

/2 0 2 /

z

n

x

z

P

Si la media muestral está fuera de este intervalo

rechazamos H₀. No rechazamos H₀ en caso contrario.













₋

₊

2 / 0 2 / 0 α

,

α

σ

µ

σ

µ

z

n

z

n

Región de aceptación. Región de aceptación

(20)

20

• Hipótesis:

• Estadístico y distribución:

0

3 μ

:

H

y

30 μ

:

H

_o

=

₁

≠

Ejemplo: Sea una población normal con

σ

2

= 20

µ

₀

= 30, n = 10 , y α = 0.05.

)

1 ,

0 (

N

n

x

z

=

−

≡

σ

µ

27 =

x

95 . 0 / /2 2 /  =     ₋ _< − _< α α σ µ z n x z P -

z

_α/2 +

z

_α/2 1 -

α

= 0.95 α_{/2 = 0.025} α/2 = 0.025

95 .

0

2 / 2 /



=











₋

_<

₊

α α

σ

µ

σ

z

n

x

z

n

x

P

Para calcular intervalo de confianza:

Conociendo el tamaño de la muestra, la desviación poblacional y la media muestral, podemos determinar un intervalo de confianza al 95%.

(21)

21

Valor crítico del estadístico de prueba: Se

busca en la tabla z, y nos preguntamos qué

valor de z tiene una probabilidad igual a α/2 =

0.025 y resulta ser z = -1.96.

- 1.96 + 1.96

1 -

α

= 0.95 α_{/2 = 0.025}

(22)

22

Pero ahora estamos haciendo una hipótesis: que la media poblacional es µ₀ = 30, e intentando

contrastarla a partir de la media muestral que es 27. 12 . 2 4142 . 1 3 10 / 20 30 27 − = − = − = z - 2.12 - 1.96 + 1.96 1 -

α

= 0.95 Región de aceptación Regla de decisión: H_o se rechaza si z cae en la zona de rechazo (fuera de la zona de aceptación), utilizando α = 0.05 (error de tipo I) que está dividida en dos partes iguales (α/2 = 0.025).

Decisión estadística: Se puede rechazar H_o porque -2.12 está en la región de rechazo con un nivel de significación de α = 0.05.

(23)

HIPOTESIS A CONTRASTAR

datos de la muestra

Se definen:

 medida de discrepancia con una distribución de probabilidad conocida

 Regla de decisión(nivel de significación α)

 Valor crítico o tabulado

Se calcula una medida de discrepancia Valor calculado

Se comparan los valores calculado con tabulado

¿se rechaza Ho? NO SI H₁ Se extraen conclusiones

(24)

24

Contrastes para la media de una población

Población normal (o n > 30) y

σ

conocida. Hipótesis unilateral por la izquierda. H_o: µ = µ₀ H₁: µ < µ₀ Estadístico

n

x

z

_c

σ

µ

−

=

α

σ

µ

α



=

−











−

_>

₋

1 /

0

_z

n

x

P

Si la media muestral está fuera de este intervalo, rechazamos H₀.

Aceptamos H₀en caso contrario.



_









₋

₊

_∞

,

0 α

σ

µ

z

n

Región de aceptación: -

z

_α 1 -

α

(25)

25

• Los datos y suposiciones se mantienen. • Hipótesis:

(hipótesis nula e hipótesis alternativa)

• Cálculo del estadístico de prueba:

• Regla de decisión: Si el z_calc cae en la zona de rechazo se rechaza H_o. Como es una prueba de una cola o unilateral, se busca en la tabla qué valor de z tiene una probabilidad de 0.05 y es igual a -1.645.

• Decisión estadística y conclusión: Como -2.12 es menor que -1.645 se rechaza H_o y se concluye que la media de la población es menor de 30.

0

3 μ

:

H

y

30 μ

:

H

_o

≥

_a

<

12 .

2

10 /

20

30

27 /

0

=

−

=

−

=

n

x

z

σ

µ

(26)

26

Región crítica y nivel de significación

Región crítica

• Valores ‘improbables’ si...

• Es conocida antes de realizar el experimento: resultados

experimentales que refutarían H₀

Nivel de significación: α

• Número pequeño: 1% , 5%, ... • Fijado de antemano por el

investigador • Es la probabilidad de rechazar H₀ cuando es cierta No rechazo H₀ Reg. Crit. Reg. Crit. α=5% Η₀: µ = 40

(27)

27

Contrastes: unilateral y bilateral

La posición de la región crítica depende de la hipótesis alternativa

Unilateral Unilateral

Bilateral

H₁: µ < 40 H₁: µ > 40

(28)

La variable aleatoria poblacional X de nuestro interés es la duración de un componente. Esta variable se distribuye en la población como una exponencial: X = Exp(λ).

(a) Nos piden como contraste de hipótesis:

H₀: µ=300 H₁: µ<300

Disponemos de una muestra de n = 100 elementos. Para cada componente se ha medido su duración: {x₁, x₂, ... , x₁₀₀}. Y sabemos que la media

muestral, que la vida media de los 100 componentes es:

∑

= = = 100 1 260 100 1 i i x x

(29)

29

Usaremos como estimador a la media muestral:

∑

= = n i i x n x 1 1

Recuerda que es una variable aleatoria, de la que nosotros disponemos de un valor particular: el que nos da nuestra muestra.

¿Qué distribución tiene nuestro estimador?

El de la suma de 100 variables aleatorias distribuidas exponencialmente. En principio sería una Erlang, pero puesto que el número de variables es mayor que 30, podemos utilizar una aproximación normal:

(

n

)

N

x

≡

µ

,

σ

/

Observa que para el caso particular de la exponencial, la media coincide con la desviación típica y podemos escribir:

(

n

)

N

x

≡

µ

,

µ

/

Tipifiquemos el estimador para que se distribuya como una N(0,1):

)

1 ,

0 (

N

n

x

z

=

−

≡

µ

(30)

30 a = 250.65 1 -

α

) 1 , 0 ( N n x z = − ≡

µ

Región de aceptación Región crítica

α

05 .

0

100 /

300

300 )

300 |

(

cierta)

H

|

H

Rechazar

(

05 .

0

₀ ₀

=













_≤

−

=

≤

=

a

z

P

a

x

P

µ

α

65 .

250

645 .

1

100 /

300

300 ₌

₋

_⇒

₌

−

=

a

z

_crit 0

H

rechazamos

No

aceptación

de

Región

65 .

250

260 ⇒

∈

⇒

>

=

x

(31)

31

Si en realidad µ = 250 y la hipótesis nula es que µ = 300, "detectarlo" supondría rechazar la hipótesis:

(

0 .

03 )

0 .

512

100 /

250

65 .

250 )

250 |

(

)

250 |

H

Rechazar

(

₀

=

≤

=













−

≤

=

≤

=

z

P

z

P

a

x

P

µ

Si queremos elevar esta última probabilidad hasta el 70%:

             − ≤ = = ≤ = = =       − ≤ = = ≤ = = = n b z P b x P P n b z P b x P P / 300 300 ) 300 | ( ) 300 | H Rechazar ( 05 . 0 / 250 250 ) 250 | ( ) 250 | H Rechazar ( 70 . 0 0 0 µ µ µ µ 157 125 . 156 645 . 1 / 300 300 525 . 0 / 250 250 ≈ = ⇒       − = − = − n n b n b

(32)

32

La variable aleatoria poblacional X de nuestro interés es el número de accidentes de tráfico en una semana. Esta variable se distribuye en la población como una poisson: X = P(λ=2.5).

(a) Nos piden como contraste de hipótesis:

H₀: λ=10 (reducir el límite de velocidad no influye)

H₁: λ<10 (reducir el límite de velocidad disminuye el número de accidentes) Pero observa que contrastaremos las hipótesis con la variable aleatoria

(33)

33

∑

= ₌ − = = ≤ = = ≥ a x x I tipo Error x e a Y P P 0 ₁₀ 0 0 ! ) 10 | ( ) cierta H | H Rechazar ( 1 . 0 λ λ λ λ           

Mirando en las tablas encontramos que a = 5. Si el número de accidentes observado en las cuatro semanas es menor o igual que 5, entonces

rechazamos H₀.

∑

= ₌ − ₌ ₋ ₌ − = = = ≤ − = = > = = = 5 0 ₈ 1 81 . 0 19 . 0 1 ! 1 ) 8 | 5 ( 1 ) 8 | 5 ( ) 8 | H Rechazar ( x x II tipo Error x e Y P Y P P λ λ

λ

_        

Si el número de accidentes disminuyó a 2 por semana, entonces disminuyó a 8 accidentes por cada cuatro semanas

(34)

Ejemplo: Se tiene interés en la rapidez de combustión de un agente propulsor para los sistemas de salida de emergencia en aeronaves. Esta rapidez es una variable aleatoria con alguna distribución de probabilidad. Especialmente interesa decidir si la rapidez de

combustión promedio, que es un parámetro µ de dicha distribución es o no 50 cm/seg.

Hipótesis Nula: H

₀

: µ = 50 cm/seg

Hipótesis Alternativa: H

₁

: µ ≠ 50 cm/seg

48.5 50 51.5

Región Crítica Región de aceptación Región Crítica Se acepta H₁ Se acepta H₀ Se acepta H₁

µ ≠ 50 µ = 50 µ ≠ 50

(35)

Condición real

Decisión H0 verdadera H0 falsa

Rechazar H₀ Error Tipo I ok

Aceptar H₀ ok Error Tipo II

α = P(error Tipo I)= P(rechazar H

₀

| H

₀

es verdadera)

Si calculamos α para el ejemplo de la rapidez de combustión para una muestra de n = 10 datos, suponiendo que σ = 2.5 cm/seg, obtenemos:

α = P( x caiga en la región crítica | µ = 50 )=

= P( x < 48.5) + P( x > 51.5) = 0,0576

Esto significa que el 5,76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis H₀: µ = 50 cm/seg, cuando ésta es verdadera.

(36)

β_{= P(error Tipo II) = P(aceptar H}₀_{| H}₀_{es falsa)}

Recordemos que no es posible calcular β si no se tiene una hipótesis alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valores.

Por ejemplo, supongamos que es importante rechazar H₀ si la rapidez promedio de

combustión µ es mayor que 52 cm/seg o

menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar H₀: µ = 50 cuando el valor verdadero es µ = 52.

45 46 47 48 49 50 51 52 53 54 55 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 H₀: µ = 50 H152 : µ = De acuerdo a la figura: β _{= P(48.5 ≤ x ≤ 51.5 | µ = 52) = 0.2643} La probabilidad de obtener un error de tipo II aumenta muy rápido a medida que el valor verdadero µ tiende al valor Hipotético. Por ejemplo, si suponemos que µ=50.5, y recalculamos β,

obtenemos 0,8923.

β también depende del tamaño de la muestra, por ejemplo, si n = 16

obtenemos, cuando µ = 52:

σ = 0.625, por lo tanto β = 0,2119. Es decir, β disminuye cuando n aumenta, excepto si el valor real de µ está muy cerca del hipotético.

(37)

Es por eso que el rechazo de H₀ siempre se considera como una

Conclusión Fuerte (los datos aportan fuerte evidencia de que H₀

es falsa).

Como uno puede elegir los valores críticos del intervalo de aceptación, controlamos el valor de α, controlamos la

probabilidad de rechazar de manera errónea H₀.

La decisión de aceptar H₀ se considera una Conclusión Débil, a

menos que se sepa que β es considerablemente pequeño.

Por esto en lugar de decir: “se acepta H₀”, se prefiere decir “no rechazamos H₀”, es decir, no se ha encontrado evidencia

suficiente para rechazar H₀.

No quiere decir que exista gran evidencia de que H₀ sea cierta, sino que no hay gran evidencia de que sea falsa.

(38)

Hipótesis Unilaterales

H

₀

: µ = 50 cm/seg

H

₁

: µ < 50 cm/seg

En el ejemplo, supongamos que si la rapidez media de

combustión es menor que 50 cm/seg se desea demostrar esto con una conslusión fuerte. ¿Cómo deben plantearse las

hipótesis?

Nótese que, aunque H₀ está planteada como una igualdad, se

sobrentiende que incluye cualquier valor de µ no especificado por H₁. Es decir, la incapacidad de rechazar H₀, no significa que µ = 50, sino que no se tiene evidencia fuerte que apoye a H₁. Es decir,

(39)

Ejemplo: Un embotellador de refresco desea estar seguro de que las botellas que usa tienen en promedio un valor que supera el mínimo de presión de estallamiento de 200 psi. El embotellador puede formular una prueba de hipótesis de dos maneras:

H

₀

: µ = 200 psi H

₀

: µ = 200 psi

H

(1)

₁

: µ > 200 psi H

(2)

₁

: µ < 200 psi

Con el planteamiento (1) Como el rechazo de H₀es una conclusión fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que las botellas soportan mayor presión que 200 psi. Con el

planteamiento (2) si se rechaza H₀ se concluye que las botellas no soportan los 200 psi, es decir, se concluye que las botellas son

satisfactorias a menos que haya evidencia fuerte en sentido contrario. ¿Cuál planteamiento es el correcto?

En la Hipótesis alternativa se debe poner la proposición sobre la cuál es importante llegar a una conclusión fuerte.

(40)

Conclusiones Fuerte y Débil

Es por eso que el rechazo de H₀ siempre se considera como una

Conclusión Fuerte: los datos aportan fuerte evidencia de que H₀

es falsa.

Como uno puede elegir los valores críticos del intervalo de

aceptación, i.e. controlamos el valor de α. Uno puede entonces controlar la probabilidad de rechazar de manera errónea H₀.

La decisión de aceptar H₀ se considera una Conclusión Débil, a menos que se sepa que β es considerablemente pequeño.

Por esto en lugar de decir “se acepta H₀” se prefiere decir

“incapaz de rechazar H₀”, es decir, no se ha encontrado evidencia suficiente para rechazar H₀. O sea, no quiere decir que exista

gran evidencia de que H₀ sea cierta sino que no hay gran evidencia de que sea falsa.

(41)

41

Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito

• H₀: Hipótesis nula

– Es inocente

• H₁: Hipótesis alternativa

– Es culpable

Los datos pueden refutarla. La que se acepta si las

pruebas no indican lo contrario.

Rechazarla por error tiene graves consecuencias.

Riesgos al tomar decisiones

No debería ser aceptada sin una gran evidencia a favor.

Rechazarla por error tiene consecuencias consideradas menos graves que la anterior.

(42)

42

Tipos de error al tomar una decisión

(Ejemplo 1) Realidad Inocente Culpable

Veredicto

Inocente

_OK

_Error

Menos grave Culpable

_Error

Muy grave

OK

(43)

43

Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados

Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal

• H₀: Hipótesis nula

– (Ej.1) Es inocente

– (Ej.2) El nuevo tratamiento no tiene efecto – (Ej.3) No hay nada que destacar

• H₁: Hipótesis alternativa

– (Ej.1) Es culpable

– (Ej.2) El nuevo tratamiento es útil – (Ej. 3) Hay una situación anormal

Riesgos al contrastar hipótesis

No especulativa

(44)

44

Tipos de error al contrastar hipótesis

Realidad

H₀ cierta H₀ falsa

No rechazo H₀

Correcto

El tratamiento no tiene efecto y así se determina.

Error de tipo II

El tratamiento sí tiene efecto pero no lo percibimos. Probabilidad

β

Rechazo H₀ Acepto H₁ Error de tipo I El tratamiento no tiene efecto pero se decide que sí.

Probabilidad α

Correcto

El tratamiento tiene efecto y el experimento lo confirma.

(45)

45

Para cualquier tipo de test de contraste hay 3

resultados posibles:

(1) - Se toma una decisión correcta.

Es decir se rechaza una hipótesis falsa o no se rechaza una

hipótesis verdadera.

(2) - Se rechaza una hipótesis verdadera.

El error de rechazar H₀ cuando es verdadera se

denomina ERROR DE TIPO I (con probabilidad α).

(3) - No se rechaza una hipótesis falsa.

El error de no rechazar H₀ cuando es falsa se denomina

(46)

(47)

(48)

(49)

Contrastes para la media de una población

Población normal y

σ

desconocida. Hipótesis bilateral H_o: µ = µ₀ H₁: µ ≠ µ₀ Estadístico 1 −

≡

−

=

_n c

t

n

s

x

t

µ

α

µ

α α



=

−











−

_<

<

−

1 /

/2 0 2 /

t

n

s

x

t

P

Si la media muestral está fuera de este intervalo rechazamos H₀.

Aceptamos en caso contrario.

        ₋ > = − ₋ n s x t P _n ₁ 0 p Valor

µ













₋

₊

2 / 0 2 / 0 α

,

µ

α

µ

z

n

s

z

n

s

Región de aceptación.

(50)

50

• Hipótesis:

• Estadístico de prueba: dado que se desconoce la varianza de la población, utilizaremos s2.

• Distribución del estadístico de prueba es una t de Student con n-1 grados de libertad.

• Regla de decisión: A un nivel de significancia de α = 0.05, si el valor de t_calc es mayor que t_crítico (2.1604) entonces se rechaza H₀.

• Cálculo del estadístico de prueba:

• Decisión estadística: -1.58 cae en la zona de no rechazo, por lo tanto no se rechaza H₀.

35 μ

:

H

y

35 μ

:

H

_o

=

_a

≠

58 . 1 14 / 64 . 10 35 5 . 30 − = − = t

(51)

(52)

(53)

(54)

(55)

(56)

(57)

(58)

(59)

(60)

(61)

(62)

(63)

(64)

(65)

(66)

(67)

(68)

Ejemplo para contraste en poblaciones

normales y de varianza conocida

Se quiere saber si hay diferencias en la concentración de ácido úrico en sujetos normales y con síndrome de Down. Se realizó la medición en 12 pacientes con Down y su media fue de 4.5 mg/ml y en 15 individuos sanos cuya media fue de 3.4 mg/ml.

• Datos:

•Supuestos: los datos provienen de poblaciones con distribuciones normales y se conocen sus varianzas.

• Hipótesis:

15 n

y

12 n

1.5;

,

4 .

3 ;

1 ,

5 .

4

₁2 ₂ ₂2 ₁ ₂ 1

=

σ

=

x

=

σ

=

x

0 :

H

y

0 :

₁ ₂ _A ₁ ₂ 0

µ

−

µ

=

µ

−

µ

≠

H

(69)

• Estadístico de prueba:

• Distribución del estadístico: normal estándar.

• Regla de decisión: H₀ se rechaza a menos que el valor de z_calc entre los valores críticos, si z_crítico está entre ±1.96, es decir, que -1,96 < z_calc< 1,96.

• Decisión estadística: Se rechaza H₀ porque 2,57 > 1,96.

• Conclusión: Con los datos disponibles es posible detectar diferencias estadísticamente significativas entre las dos concentraciones de ácido úrico de ambas poblaciones (Down y normal). 57 . 2 15 5 . 1 12 1 0 ) 4 . 3 5 . 4 ( ) ( ) ( 2 2 2 1 2 1 0 2 1 2 1 = + − − = + − − − = n n x x z σ σ µ µ

(70)

Ejemplo con poblaciones normales y

varianzas desconocida.

Se quiere saber si los fumadores sufren mas daños pulmonares que los no fumadores.

• Datos:

•Supuestos : la destrucción pulmonar sigue una distribución normal y no se conocen las varianzas poblacionales, pero se suponen que son iguales.

16 ,

8492

.

4 ,

4 .

12 ;

9 ,

4711

.

4 ,

5 .

17 =

=

nf nf nf f f f

n

s

x

n

s

x

(71)

• Hipótesis:

• Estadística de prueba:

Y la varianza combinada se calcula como.

nf f nf f

H

₀

:

µ

≤

µ

,

H

_A

:

µ

>

µ

6573

.

2

9 2165

.

21

16 2165

.

21

0 )

4 .

12

5 .

17 (

)

(

)

(

2 2 1 2 0 2 1 2 1

=

+

−

=

+

−

=

n

s

n

s

x

t

p p

µ

2 )

1 (

)

1 (

2 1 2 2 2 2 1 1 2

−

+

−

+

−

=

n

s

n

s

n

s

_p

(72)

• Distribución de la estadística de prueba: Sigue una distribución t de Student con n₁+ n₂ - 2 grados de libertad. • Regla de decisión: Se rechaza H₀ a menos que el t_calc

esté entre los valores críticos. En este caso, si t_crítico es ±1.7139, luego -1.7139 < t_calc< 1.7139.

• Decisión estadística: Se rechaza H₀ porque 2.6573 > 1.7139 y cae en la zona de rechazo.

• Conclusión: Con los datos experimentales se puede concluir que sí hay más daño pulmonar en los fumadores que en los no fumadores.

(73)

(74)

74

(75)

75

(76)

(77)

(78)

(79)

(80)

(81)

(82)

(83)

(84)

(85)

(86)

(87)

(88)

(89)

(90)

(91)

(92)

(93)

(94)

(95)

(96)

(97)

Valor-p de un contraste

Observa que el resultado de un test depende fuertemente de α... El valor-p es la probabilidad de

obtener un resultado de la muestra que sea al menos tan improbable como lo que se observa.

Este valor corresponde al valor de la probabilidad asignada al z calculado a partir del valor numérico sometido a la prueba de hipótesis.

Si p es menor al nivel de significación

predefinido se debe rechazar H₀

Dos posibles valores de un

estadístico (puntos en la gráfica) que conducen a rechazar la

hipótesis nula, aunque la evidencia del rechazo es muy distinta según el caso.

En una prueba bilateral se determina el valor-p duplicando el área en la cola, para poder comparar el valor de p directamente con α y mantener así la misma regla de rechazo.

(98)

(99)

Significación: p

H₀: µ=40

(100)

Significación: p

43 = X No se rechaza H₀: µ = 40 H₀: µ = 40

α

(101)

Significación: p

43 = X No se rechaza H₀: µ=40

Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra.

Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H₀. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.

p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>α

P

α

(102)

Significación : p

α

50 = X Se rechaza H₀: µ = 40 Se acepta H₁: µ > 40

(103)

Significación : p

P

α

50 = X Se rechaza H₀: µ=40 Se acepta H₁: µ>40

El contraste es estadísticamente significativo cuando p <

α.

Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori.

(104)

Resumen: α, p y criterio de rechazo

• Sobre α

– Es número pequeño, preelegido al diseñar el experimento.

– Conocido α sabemos todo sobre la región crítica.

• Sobre p

– Es conocido tras realizar el experimento.

– Conocido p sabemos todo sobre el resultado del

experimento.

• Sobre el criterio de rechazo

(105)

(106)

(107)