ESTADÍSTICA TEÓRICA: CONTRATES DE HIPÓTESIS INTERVALOS DE CONFIANZA

112  Descargar (0)

Texto completo

(1)

Gestión Aeronáutica: Estadística Teórica

Facultad Ciencias Económicas y Empresariales Departamento de Economía Aplicada

Profesor: Santiago de la Fuente Fernández

ESTADÍSTICA TEÓRICA:

CONTRATES DE HIPÓTESIS INTERVALOS DE CONFIANZA

       

(2)
(3)

RELACIÓN: INTERVALOS CONFIANZA - CONTRASTE HIPÓTESIS

Intervalo de confianza para la media  de una distribución normal N(, ) de varianza conocida:

z n x

z n n x

z

z n n x

z x

z n x

) ( I

2 2 2

2 muestralerror 2

2 muestral media

1



Hipótesis sobre la media de una población con 2 conocida : REGIÓN DE RECHAZO

0 0:

H H1: 0





z n x

R 0 /2 bilateral (compuesta)

H0: 0 H1: 1 0





z n x

R 0 unilateral (simple)

H0: 0 H1: 1 0





z n x

R 1

z1 z

0 unilateral (simple)

Intervalo de confianza para la media  de una distribución normal )

, (

N de varianza desconocida con muestras pequeñas n  30





x t n 1

n t s

x )

(

I x

) 1 n ( 2,

1 n

2x n

2x s

2x s ) 1 n 2 ( n x muestral error

x ) 1 n ( 2, muestral media

1    



 

 

n t s

n x t s

n t s

n x t s

x x

) 1 n ( 2, x

) 1 n ( 2, x

) 1 n ( 2, x

) 1 n (

2,

n t s

x x

) 1 n ( 2,

Hipótesis sobre la media de una población con 2 desconocida : REGIÓN DE RECHAZO H0: 0 H1: 0

n t s

x

R 0 /2;(n 1) x bilateral (compuesta)

H0: 0 H1: 1 0





n t s

x

R 0 ;(n 1) x unilateral (simple)

H0: 0 H1: 1 0





n t s

x

R 1 ;(n 1) x

n

; t1 n t ;

0 unilateral (simple)

(4)

Intervalo de confianza para la diferencia de medias (1 2) de dos distribuciones normales N(1, 1), N(2, 2) con varianzas poblacionales conocidas:





 

 





muestral error

2 22

1 21

2 muestral

diferencia

2 1

1 ( ) (x y) z n n

I

de donde,

2 22

1 21

2 2

1

2 22

1 21

2 2

2 1 22

1 21

2

n z n

) (

) y x (

n z n

) y x ( ) n (

z n ) y x (

(5)

Contraste de igualdad de medias de dos poblaciones normales con varianzas conocidas:

REGIÓN DE RECHAZO H0: 1 2





2 22

1 21

2 n n

z 0 ) y x (

R bilateral

H0: 1 2 k





2 22

1 21 2

/ n n

z k y x

R bilateral

H0: 1 2 k





2 22

1 12

n z n

k y x

R unilateral

H0: 1 2 k





2 22

1 12

1 n n

z k y x

R unilateral

H0: 1 2





2 22

1 12

n z n

y x

R unilateral

H0: 1 2





2 22

1 12 1

z1 z

n z n

y x

R unilateral

CONTRASTE HIPÓTESIS

Contraste de la media de una población normal N(,) con varianza 2 conocida:

a) CONTRASTE BILATERAL o DE DOS COLAS

Hipótesis nula: H0: 0 Hipótesis alternativa: H1: 0

Como la hipótesis alternativa es 0 en la decisión que hayamos de tomar deberán ser válidos los valores de  mayores o menores que 0, por lo cual el contraste debe ser bilateral o de dos colas.

Regla de decisión



) chazo Re

gión (Re H

nula hipótesis la

rechaza se

k x Si

) Aceptación gión

(Re H

nula hipótesis la

acepta se

k x Si

0 0

De otra parte, en la distribución del muestreo

N , n

x , que bajo la hipótesis nula

N , n

x 0 , con lo que la variable

n

x 0

es N(0, 1).

(6)

El valor crítico k se calcula mediante el error de significación :

 

K

n P x

, n N / k x P cierta es

H / H chazar Re

P 0 0 0 0

2 K 2

n P x

n K P x

n K K x

n P x

) 1 , 0 ( N simetría 0

0 0

0

La región crítica será





R x z n

n z x

2 0

0 2

En otras palabras,

Se acepta H0 si 0 z 2 n

x

Se rechaza H0 si 0 z 2 n

x

b) CONTRASTE UNILATERAL o DE UNA COLA

Hipótesis nula: H0: 0 Hipótesis alternativa: H1: 1 0

Como la hipótesis alternativa es 1 0 en la decisión que hayamos de tomar solo son válidos los valores de 1mayores que 0, por lo cual el contraste debe ser unilateral o de una cola.

Regla de decisión

) chazo Re

gión (Re H

nula hipótesis la

rechaza se

k x Si

) Aceptación gión

(Re H

nula hipótesis la

acepta se

k x Si

0 0

De otra parte, en la distribución del muestreo

N , n x

Bajo la hipótesis nula:

N , n

x 0

Bajo la hipótesis alternativa:

N , n

x 1

(7)

Para hallar el valor crítico K recurrimos al Error Tipo I:

   

K

n P x

, n N / k x P cierta es

H / H chazar Re

P I ET

P 0 0 0 0

La región crítica será





R x z n

n z x

0 0

En otras palabras,

Se acepta H0 si

z

n

x 0

Se rechaza H0 si

z

n

x 0

Contraste de igualdad de medias de dos poblaciones normales con varianzas conocidas

a) CONTRASTE BILATERAL o DE DOS COLAS

Hipótesis nula: H0:12 0 Hipótesis alternativa: H1:12 0

La regla de decisión será:



) RC ( H

rechaza se

k y x Si

) RA ( H

rechaza se

no k y x Si

0 0

La región crítica de dos colas xy k es función de la diferencia de las medias muestrales. En esta línea, las distribuciones en el muestreo de las medias son:

1 1 1

, n N

x ,

2 2 2

, n N

y , con lo cual, la diferencia de medias muestrales,

bajo la hipótesis nula H0:12 0, se distribuye:

2 22

1 21

n , n

0 N y x

El valor crítico k se determina mediante el error tipo I:

P(ET I) P(RechazarH0 H0 cierta) P

x y k/H0:12 0

(8)

K

) n ( ) n (

0 ) y x P (

2 2 2 2 1

1









K

) n ( ) n (

y K x

) n ( ) n (

y P x

2 2 2 2 1

1 2 2

2 2 1

1

K 2 2

) n ( ) n (

y P x

) K n ( ) n (

y P x

2 2 2 2 1

1 2 2

2 2 1

1









(simetría)

La región crítica es

2

2 2 2 2 1

1

) z n ( ) n (

y x





2 22

1 12

2 n n

z ) y x ( R

En otras palabras, se acepta la hipótesis nula H0 si:

teórico o estadístic

2

observadoo estadístic

2 2 2 2 1

1

) z n ( ) n (

y x

se rechaza la hipótesis nula H0 si:

teórico o estadístic

2

observadoo estadístic

2 2 2 2 1

1

) z n ( ) n (

y x

b) CONTRASTE UNILATERAL o DE UNA COLA

Hipótesis nula: H0:12 Ko Hipótesis alternativa: H1:12 Ko

La regla de decisión será:

) RC ( H

rechaza se

k ) y x ( Si

) RA ( H

rechaza se

no k ) y x ( Si

0 0

La región crítica de una cola (xy) k es función de la diferencia de las medias muestrales. En esta línea, las distribuciones en el muestreo de las medias son:

1 1 1

, n N

x ,

2 2 2

, n N

y , con lo cual, la diferencia de medias muestrales,

2 22

1 21 2

1 ), n n

( N y

x , bajo la hipótesis nula H0:12 Ko,

2 22

1 12

o, n n

K N y x

(9)

El valor crítico K se determina mediante el nivel de significación :

P(ET I) P(RechazarH0 H0 cierta) P

(x y) k/H0:12 Ko

) n ( ) n (

K z k

) P n ( ) n (

K k )

n ( ) n (

K ) y x P (

2 2 2 2 1

1

o 2 2

2 2 1

1

o 2 2

2 2 1

1

o

con lo cual, el valor crítico se despeja

z

) n ( ) n (

K k

2 2 2 2 1

1

o .

Comprobando después si se verifica o no la evidencia empírica (xy) k

De otra parte, la región crítica

z

) n ( ) n (

K ) y x (

2 2 2 2 1

1

o

por tanto, la región de rechazo: R (x y)Ko z (21 n1)(22 n2)

(10)

CÁLCULO DEL ERROR TIPO I, DEL TIPO II Y POTENCIA, DADAS LAS HIPÓTESIS SIMPLES

) Contraste Potencia

( falsa siendo H

nula hipótesis la

rechazar de

ad probabilid

) II Tipo Error ( falsa siendo H

nula hipótesis la

aceptar de

ad probabilid

) I Tipo Error ( cierta siendo H

nula hipótesis la

rechazar de

ad probabilid

0 0

0

1

Los errores están relacionados, al disminuir el uno aumenta el otro:

1 ) I Tipo Error ( H

siempre chazar

Re 0

) II Tipo Error (

1 ) II Tipo Error ( H

siempre chazar

Re 0

) I Tipo Error (

P P

P P

0 1

Un contraste debería buscar simultáneamente el nivel de significación más bajo posible y la potencia 1 más alta posible.

Fijado el nivel de significación, se determina la región de rechazo cuya potencia es mayor entre todos los contrastes cuyo tamaño sea el fijado a priori.

La única posibilidad para conseguir que un contraste mejore su potencia 1, sin aumentar el nivel de significación , es incrementar el tamaño de la muestra.

Al aumentar el tamaño de la muestra, varía la ley de distribución del estadístico de contraste, y generalmente disminuye la varianza. Generalmente, las propiedades del contraste mejoran.

Antes de la universalización del ordenador se utilizaban como más representativos los valores del 1%, 5%, y 10%. La metodología más razonable es tomar un nivel de

significación de acuerdo con la experiencia y después obtener el llamado p-valor.

(11)







 

0 0

0

H rechaza Se

valor p

H acepta Se

valor p

. actual muestra la

con H nula hipótesis la

rechazaría se

todavía que

el

para , escoger puede

se que posible pequeño

más ión

significac de

nivel

Si Si valor

p

El p-valor es el menor que permite aceptar la hipótesis alternativa H .1

El p-valor tiene la ventaja de permitir que se decida que hipótesis se acepta, esto no es posible cuando se indica sólo el resultado del contraste (si se acepta o se rechaza H0 con un fijo.

En otras palabras, los CRITERIOS GENERALES para los CONTRASTES:

Calcular una cantidad experimental Qexp a partir de los datos

Calcular una cantidad teórica Q a partir de las tablas

Si Qexp Q Se acepta H0 Si Qexp Q Se rechaza H0

EL NIVEL MÍNIMO DE SIGNIFICACIÓN (P-valor) es el error de la primera región crítica de rechazo. Es decir, el área que deja a la derecha la cantidad

experimental Qexp

(12)

CÁLCULO DEL NIVEL DE SIGNIFICACIÓN. POTENCIA DEL CONTRASTE.

1. - La edición de un libro se considera buena si el número medio de erratas por página no supera el 0,1 (H ). Dadas las pruebas de imprenta, se eligen 10 páginas al azar, y se0 rechazan las pruebas si se observan 2 ó más erratas. Se supone que el número de erratas por página sigue una distribución de Poisson.

¿Qué nivel de significación tiene el contraste? ¿Con qué probabilidad se aceptara un libro si realmente tiene una media de 0,2 erratas por página?

Solución:

Se tiene una muestra aleatoria (X1,X2,,Xn), de tamaño 10, donde X = ‘número de erratas por página’, con XP().

Nos interesa el número medio de erratas por página E(Númeroerratasporpágina) .

) X (

E

La región de rechazo de la hipótesis nula:

 

10

1

i Xi 2

2 páginas diez

en erratas de

total Número R

El nivel de significación: 



X 2 H : 0,1

P 10 0

1

i i

Considerando que se verifica la hipótesis nula (H0 : 0,1), tenemos que )

1 1 , 0 . 10 ( P

10 X

1

i i

, con lo cual:

0,3679 0,3679

0,2642 1

) 1 X ( P ) 0 X ( P 1 2 X P

1 1 2 X

P 10

1 i

10 1

i i

1 i

1 10

1

i i

1 10

1

i i













   

Por otra parte, un libro que tiene generalmente una media de 0,2 erratas por página, es un libro para el que 0,2, con lo que 10 X P( 10.0,2 2)

1

i i

, por tanto la

probabilidad de aceptar un libro en estas condiciones es:

4060 , 0 2707 , 0 1353 , 0 ) 1 X ( P ) 0 X ( P 2 1 X

P 10

1 i

10 1

i i

i 2 2 10

1

i i 







 

Figure

Actualización...

Referencias

Actualización...