• No se han encontrado resultados

PRUEBAS DE HIPÓTESIS

N/A
N/A
Protected

Academic year: 2018

Share "PRUEBAS DE HIPÓTESIS"

Copied!
12
0
0

Texto completo

(1)

UNIVERSIDAD NACIONAL DEL CALLAO

FACULTAD DE INGENIER´IA MEC ´ANICA - ENERG´IA PRUEBAS DE HIP ´OTESIS

Prof. V.Contreras T. En los temas anteriores se explic´o como estimar un par´ametro a partir de datos muestrales. Sin embargo, en muchos problemas de ingenier´ıa es necesario decidir si se acepta o se rechaza un enuncuado acerca de alg´un par´ametro. Al enunciado se llama hip´otesis y al procedimiento para tomar decisiones acerca de la hip´otesis se le llama prueba de hip´otesis. Se trata de uno de los aspectos m´as ´utiles de la inferencia estad´ıstica, ya que muchos problemas de toma de decisiones, pruebas o experimentos en el mundo de la ingenier´ıa pueden formularse como problemas de prueba de hip´otesis. Hip´otesis Estad´ıstica

Una hip´otesis estad´ıstica es un enunciado acerca de los par´ametros de una o m´as poblaciones. Son ejemplos de hip´otesis estad´ıstica:

1. la longitud media de un tipo de objetos de 10 cent´ımetros 2. la varianza de la longitud de cierto objeto es 0,25cm2

Hip´otesis simple y compuesta

Definici´on Se denomina hip´otesis simple a cualquier hip´otesis estad´ıstica que especifica completamente la distribuci´on de la poblaci´on, es decir especi-fica la forma de la distribuci´on y el valor de sus par´ametros.

Si una hip´otesis no especifica completamente la distribuci´on de la poblaci´on se dice que es una hip´otesis compuesta.

Por ejemplo, la hip´otesis que establece que el ingreso mensual promedio de los empleados de cierta ciudad esµ= 500 d´olares, suponiendo que los ingresos mensuales se distribuyen normalmente con σ = 30 d´olares es una hip´otesis simple, ya que especifica completamente la distribuci´on de la poblaci´on. Si se supondr´ıa que σ= 30 d´olares yµ6= 500 ´o µ <500 ´o µ >500, entonces la hip´otesis referente a la media es una hip´otesis compuesta, pues no especifica la media de la poblaci´on de los ingresos.

Hip´otesis nula y alternativa

Definici´on Se denomina hip´otesis nula Ho a la hip´otesis que es aceptable provisionalmente como verdadera y cuya validez ser´a sometida a compro-baci´on experimental; y la hip´otesis alternativa H1 es una contradicci´on a la

(2)

Por ejemplo, si se asume queθoes un valor del par´ametro desconocidoθde una poblaci´on cuya distribuci´on se supone conocida, entonces son hip´otesis nulas y alternativas respectivamente las siguientes afirmaciones:

1. Ho : θ =θo y H1 : θ 6=θo 2. Ho : θ ≤θo y H1 : θ > θo

3. Ho : θ ≥θo y H1 : θ < θo

Prueba de una hip´otesis estad´ıstica

Para tomar decisiones estad´ısticas se requieren las dos hip´otesis: Ho y H1

referente a un par´ametro θ.

Tipos de pruebas de hip´otesis

El tipo de prueba depende b´asicamente de la hip´otesis alternativaH1.

1. Ho : θ =θo y H1 : θ 6=θo Prueba bilateral o de dos colas.

2. Ho : θ ≤θo y H1 : θ > θo Prueba unilateral de cola a la derecha. 3. Ho : θ ≥θo y H1 : θ < θo Prueba unilateral de cola a la izquierda.

Errores de tipo I, tipo II y nivel de significancia

Definici´on Se denomina error de tipo I, al error que se comete al rechazar una hip´otests nula Ho cuando ´esta es verdadera.

Definici´onSe denomina error de tipo II, al error que se comete al aceptar una hip´otests nula Ho cuando en realidad es falsa.

Decisi´on Ho verdadera H1 verdadera

Aceptar Ho decis´ıon correcta Error tipo II RechazarHo Error tipo I decis´ıon correcta

La probabilidad de cometer un error tipo I se denota porα. Entonces, α= P[error tipo I]

α= P[rechazar Ho cuandoHo es verdadera]

La probabilidad de cometer un error tipo II se donota por β. Entonces, β = P[error tipo II]

(3)

Definici´on Se denomina nivel de significancia de una prueba de hip´otesis a la probabilidad de cometer un error de tipo I(α)

Definici´on La POTENCIA de una prueba es la probabilidad de tomar la decisi´on acertada de rechazarHocuando ´esta es falsa ´o de aceptarH1 cuando

´esta es verdadera. La potencia de una prueba es calculada por 1−β.

El nivel de significancia se fija previamente por lo general en α = 0,05 ´o α= 0,01. Si para un valor dado de α, se rechaza la hip´otesisHo, entonces se dice que los resultados muestrales obtenidos no solo son diferentes por efectos del azar sino que son realmente significativamente diferentes al nivel α×100 %.

Para una muestra aleatoria de tama˜no n seleccionado de la poblaci´on en estudio, si α aumenta, entonces β disminuye, y si β aumenta, entonces α disminuye.

Regi´on cr´ıtica y regla de decisi´on

La regla de decisi´on implica la divis´on de la distribuci´on muestral Θ de la prueba en dos partes mutuamente excluyentes: la regi´on de rechazo o regi´on cr´ıtica (R.C) deHo y la regi´on de aceptaci´on (R.A) o no rechazo deHo. Esta divisi´on depende de la hip´otesis alternativa H1, del nivel de significaci´onα y

de la distribuci´on muestral del estadistico.

1. Sea la prueba bilateral Ho : θ=θo contra H1 : θ 6=θo. Dada el nivel

de significaci´on α, esto es la probabilidad de rechazar Ho cuando esta es verdadera, en la distribuci´on de Θ se pueden encontrar los valores cr´ıticos θc1 y θc2 tales que P< θc1) = α/2 y P> θc2) = α/2 de

donde se concluye que el intervalo R.C = h−∞, θc1i ∪ hθc2,∞i es la

regi´on de rechazo ´o regi´on cr´ıtica de la prueba.

Por otra parte 1−α es la probabilidad de aceptar Ho cuando esto es verdadera, luego de Pc1 Θ θc2) = 1 −α. Se concluye que el

(4)

2. Sea la prueba unilateral de cola derechaHo : θ ≤θo contra H1 : θ >

θo Dado el nivel de significaci´on α, en la distribuci´on de Θ se puede encontrar el valor cr´ıticoθctal queP> θc] =α, de donde se concluye que el intervalo R.C =hθc,∞i es la regi´on de rechazo ´o regi´on cr´ıtica de la prueba.

Por otra parte 1−α, es la probabilidad de aceptar Ho cuando esta es verdadera. Luego de P θc] = 1−α se concluye que el intervalo R.A=h−∞, θc] es la regi´on de aceptaci´on de la prueba.

3. Sea la prueba unilateral de cola a la izquierdaHo : θ≥θo contra H1 :

θ < θo. Dado el nivel de significaci´onα, en la distribuci´on de Θ se puede encontrar el valor cr´ıticoθctal queP< θc] =α, de donde se concluye que el intervalo R.C =h−∞, θc] es la regi´on de rechazo ´o regi´on cr´ıtica de la prueba.

Por otra parte 1−α, es la probabilidad de aceptar Ho cuando esta es verdadera. Luego de P θc] = 1−α se concluye que el intervalo R.A= [θc,∞ies la regi´on de aceptaci´on de la prueba.

Estad´ıstica de prueba

(5)

de dicha estad´ıstica. Una estad´ıstica de prueba tiene la siguiente constituci´on:

Estadistica de prueba= Estadistica relevante−parametro supuesto error estandar de la estadistica relevante Por ejemplo, la estad´ıstica de prueba para la media poblacional es:

E.P = X−µo σX para una distribuci´on normal se tiene: σX = σ

n

Etapas de una prueba de hip´otesis estad´ıstica 1. FijarH0 y H1

2. Fijar el nivel de significancia.

3. Fijar la estad´ıstica de prueba.

4. Se determinan las regiones de rechazo y aceptaci´on. 5. Se determina el valor de la estad´ıstica de prueba (EP).

6. Se compara la estad´ıstica de prueba con los valores cr´ıticos (en el eje horizontal Θ). A base de la comparaci´on se toma la decisi´on de rechaz-ar o no la hip´otesis nula. Si se rechaza la hip´otesis nula se acepta la hip´otesis alternativa.

NOTA

Decisi´on por el m´etodo del valor de la probabilidad p. Considere el valor de zk en valor absoluto.

p=P[Z > zk] (prueba unilateral cola derecha o izquierda) p= 2P[Z > zk] (prueba bilateral)

La regla de decisi´on con la probabilidad pes:

Se rechaza Ho si p < α. No se rechaza Ho en caso contrario. Ejemplo

(6)

suficiente evidencia para decir que la duraci´on media no es 800? Utilice un nivel de significancia del 0,04.

Soluci´on

Se tienen los siguientes datos:

µ = 800 horas σ = 40 horas X = 788 horas

n = 30 α = 0,04 1. H0 :µ= 800 , H1 :µ6= 800

2. Nivel de significancia α= 0,04 3. La estad´ıstica de prueba es:

Z = X−σ µ0

n

4. Regi´on cr´ıtica: para α= 0,04

z1−α

2 =z0,98= 2,05

Luego

R.C.=]− ∞;2,05[]2,05;[ 5. Calculemos el estad´ıstico de prueba (E.P.):

zk =

X−µ0

σ

n

= 78840800

30

(7)

6. Decisi´on: comozk =1,643 pertenece a la region de aceptaci´on, no se rechaza Ho y se concluye con un nivel de significancia del 0,04 que la duraci´on media de las bater´ıas no ha cambiado.

Ejemplo

Una muestra aleatoria de 100 muertes registradas en Estados Unidos el a˜no pasado muestra una vida promedio de 71,8 a˜nos. Suponga una desviaci´on est´andar poblacional de 8,9 a˜nos. Queremos probar si la vida media hoy en d´ıa es mayor a 70 a˜nos con base en esa muestra. La muestra parecer´ıa indicar que es as´ı pero ¿Cu´al es la probabilidad de que la media de la muestra no refleje la verdadera media de la poblaci´on?. Utilizar un nivel de significancia de 0.05.

Soluci´on

Se tienen los siguientes datos:

µ = 70 a˜nos σ = 8,9 a˜nos X = 71,8 a˜nos

n = 100 α = 0,05 1. H0 :µ= 70 , H1 :µ >70

2. Nivel de significancia α= 0,05 3. La estad´ıstica de prueba es:

Z = X−σ µ0

n

4. Regi´on cr´ıtica: para α= 0,05

P(Z ≥θc) = α⇒P(Z ≥θc) = 0,05⇒P(Z ≤θc) = 0,95⇒θc= 1,64 Luego

R.C. =]1,64;[ 5. Calculemos el estad´ıstico de prueba (E.P.):

zk =

X−µ0

σ

n

= 71,88,9 70

100

(8)

6. Decisi´on: como zk = 2,02> 1,64 se rechaza Ho y se concluye con un nivel de significancia del 0,05 que la vida media hoy en d´ıa es mayor que 70 a˜nos.

Ejemplo

Se afirma que en el ´ultimo ciclo de estudios de la UNAC no m´as del 30 % de alumnos trabajan y estudia. Para verificar esta sentencia se toma una muestra aleatoria de 300 alumnos del ´ultimo ciclo de estudios donde se encontr´o que 75 trabajan y estudian. ¿Se puede seguir manteniendo la primera afirmaci´on con un 95 % de seguridad?

Soluci´on

Se tienen los siguientes datos: P = 0,30 P = 75

300 = 0,25 n = 300

1−α = 0,95⇒α= 0,05 1. H0 :P = 0,30 , H1 :P < 0,30

2. Nivel de significancia α= 0,05 3. La estad´ıstica de prueba es:

Z = qP −P P(1−P)

n

4. Regi´on cr´ıtica: para α= 0,05

P(Z ≤θc) = α⇒P(Z ≤θc) = 0,05⇒θc=1,64 Luego

(9)

5. Calculemos el estad´ıstico de prueba (E.P.):

zk=

P −P q

P(1−P)

n

= q0,250,30

0,30(1−0,30) 300

=1,889≈ −1,9

6. Decisi´on: como zk = 1,9 < 1,64 se rechaza Ho y se concluye que los alumnos del ´ultimo ciclo de la UNAC trabajan y estudian con una seguridad del 95 %.

Ejemplo

Un fabricante de tornillos asegura que la longitud de un tipo especial de sus tornillos de alta precisi´on tiene distribuci´on normal con una desviaci´on estandar igual a 0,2 mm. Para probar la especificaci´on de la varaici´on se tom´o una muestra aleatoria de 10 de estos tornillos observandose las sigu-ientes longitudes en milimetros:

20,50 20,80 20,26 20,72 20,69 20,37 20,70 20,32 20,96 20,40

1. al nivel de significancia de 0,05 y con una prueba unilateral, ¿satisface esta producci´on la especificaci´on de la variabilidad de la longitud? 2. obtenga la probabilidad de detectar un incremento de 0,3 mm en la

desviaci´on estandar especificada. Soluci´on

1. De los datos se obtiene: ˆS2 = 0,05457

a) H0 :σ2 = 0,22 , H1 :σ2 >0,22

b) Nivel de significancia α = 0,05

c) La estad´ıstica de prueba es:

χ2(n1) = (n1) ˆS2

σ2

(10)

d) Regi´on cr´ıtica: para α= 0,05 Recordemos que si la prueba es de:

cola a la izquierda,R.C. = (−∞, χ2

α,n−1)

cola a la derecha, R.C.= (χ2

1−α,n−1,∞)

cola bilateral, R.C.= (−∞, χ2

α/2, n−1)(χ21−α/2, n−1,∞)

En nuestro caso la prueba es de cola a la derecha, entonces: χ2

1−α =χ20,95 ; 9 = 16,92

Luego

R.C.= (16,92 ; )

e) Calculemos el estad´ıstico de prueba (E.P.):

χ2

k =

9 (0,05457)

0,22 = 12,278

f) Decisi´on: como χ2

k = 12,278 <16,92 se acepta Ho y se concluye con un nivel de significancia del 0,05 , que la producci´on satisface la especificaci´on de la variabilidad de la longitud.

NotaLa regi´on cr´ıtica tambien es: 9 ˆS2

0,22 >16,92 entonces ˆS2 >0,0752

luego R.C. = (0,0752,). El ˆS2 = 0,05457 obtenido de los datos no

pertenece a la R.C, por lo tanto no se debe rechazar Ho

2. La probabilidad de que la prueba detecte un incremento de 0,3mm en la variabilidad de la longitud es:

1−β =P[ ˆS2 >0,0752/ σ= 0,2 + 0,3] De donde se obtiene:

β =P[ ˆS2 0,0752/ σ = 0,5] = P[9 ˆS2

(0,5)2

9 (0,0752)

(0,5)2 ] = P[χ2(n1)

2,7072] = 0,0252

(11)

Prueba estad´ıstica para dos par´ametros.

Prueba de la raz´on de las varianzas de dos poblaciones Sean varianzas ˆS2

1 y ˆS22 muestrales aleatorias independientes de tama˜nos

n1 y n2 escogidos de una poblaci´on normal 1 y 2 respectivamente, cuyas

varianzas σ2

1 y σ22 se desconocen.

Para docimar Ho : σ21 =σ22 contra H1 : σ21 > σ22 ´o σ21 < σ22 ´o σ21 6= σ22,

Se utiliza la estad´ıstica F (Fisher)con r1 =n11 y r2 =n21 grados de

libertad dada por

F = ˆ S2 1 σ2 1 ˆ S2 2 σ2 2

La regi´on de rechazo de Ho en la prueba es: F > f1−α , r1,r2 si H1 :σ

2 1 > σ22

F < fα , r1,r2 si H1 :σ

2 1 < σ22

F < fα/2, r1,r2 ´o F > f1−α/2, r1,r2 si H1 :σ

2 1 6=σ22

donde

f1−α , r1,r2 es el valor de F ∼F(r1, r2)/ P[F > f1−α , r1, r2] =α

f1−α/2, r1,r2 es el valor de F ∼F(r1, r2)/ P[F > f1−α/2, r1, r2] =α/2

Recordemos que:

fα , r1,r2 =

1 f1−α , r2,r1

fα/2, r1,r2 =

1 f1−α/2, r2,r1

Ejemplo

Un corredor de valores de la bolsa de Lima realiz´o un estudio de los porcentajes de rendimiento de las empresas del sector minero y del sector financiero, concluyendo que las tasas de los rendimientos de cada sector tienen distribuci´on normal con variabilidad mayor en el sector minero al nivel de significaci´on 0,05. Para comprobar la hip´otesis acerca de la variabilidad, un grupo de trabajo escogi´o dos muestras aleatorias de las tasas de 10 empresas del sector minero (M) y de 8 empresas del sector financiero (F) observando los siguientes valores de rendimiento en porcentajes:

(12)

¿Cree usted que el grupo de trabajo refutar´a el informe en lo que respecta a la variabilidad?

Soluci´on

De los datos se tiene:n1 = 10 , Sˆ21 = 11,0516 yn2 = 8 , Sˆ22 = 1,88495

1. H0 :σ21 =σ22 , H1 :σ21 > σ22

2. Nivel de significancia α= 0,05 3. La estad´ıstica de prueba es:

Fk =

ˆ

S2 1

σ2 1

ˆ

S2 2

σ2 2

∼F(9,7)

4. Regi´on cr´ıtica: para α= 0,05

f1−0,05 ; 9,7 = 3,68

R.C.= (3,68, ) 5. Calculemos el estad´ıstico de prueba (E.P.):

Fk= 5,8629

Referencias

Documento similar

Gastos derivados de la recaudación de los derechos económicos de la entidad local o de sus organis- mos autónomos cuando aquélla se efectúe por otras enti- dades locales o

Como la hip´ otesis que se quiere comprobar es que utilizando la informaci´ on de las detecciones de una c´ amara en el resto de c´ amaras del sistema (dos en este caso), se

Fuente de emisión secundaria que afecta a la estación: Combustión en sector residencial y comercial Distancia a la primera vía de tráfico: 3 metros (15 m de ancho)..

dente: algunas decían que doña Leonor, &#34;con muy grand rescelo e miedo que avía del rey don Pedro que nueva- mente regnaba, e de la reyna doña María, su madre del dicho rey,

Traba- jar con esta muestra permitir´ a que los resultados obtenidos se extiendan a estrellas tanto del disco como del halo de la Galaxia, pudiendo estudiar as´ı sus similitudes

Consecuentemente, en el siglo xviii hay un cambio en la cosmovi- sión, con un alcance o efecto reducido en los pueblos (periferia), concretados en vecinos de determinados pueblos

La campaña ha consistido en la revisión del etiquetado e instrucciones de uso de todos los ter- mómetros digitales comunicados, así como de la documentación técnica adicional de

Amplitud y secci´ on eficaz de dispersi´ on. Aproximaci´ on de Born. Dispersi´ on por ´ atomos con nube electr´ onica. Teor´ıa de la dispersi´ on por ondas parciales.