• No se han encontrado resultados

El cliente quiere que la probabilidad de seguir comprando a esta empresa cuando las semillas no son de la variedad pedida sea 0.05.

N/A
N/A
Protected

Academic year: 2021

Share "El cliente quiere que la probabilidad de seguir comprando a esta empresa cuando las semillas no son de la variedad pedida sea 0.05."

Copied!
7
0
0

Texto completo

(1)

Estad´ıstica (m) Pr´actica 8 A) Tests de Neyman-Pearson para hip´otesis simples.

1. Una empresa vende dos variedades de soja. La variedad 1 tiene un rendimiento por ha. que puede considerarse una variable aleatoria con distribuci´on N(37,25),

y la variedad 2 tiene un rendimiento por ha. que puede considerarse N(40,25). Un cliente realiz´o una compra de semillas de la variedad 2 y antes de continuar comprando a esta empresa, quiere asegurarse de que las semillas que le enviaron realmente pertenecen a esa variedad. Con ese fin, cultiva 10 parcelas de 1 ha. y obtiene los siguientes rendimientos:

37 39.5 41.7 42 40 41.25 43 44.05 38 38.5

El cliente quiere que la probabilidad de seguir comprando a esta empresa cuando las semillas no son de la variedad pedida sea 0.05.

(a) Plantear el test MP para este problema. ¿Qu´e decisi´on se toma? (b) Hallar el valor p.¿Se hubiera rechazado H0 para α= 0.01?

(c) Calcular la probabilidad del error de tipo II.

(d) Determinar el n´umeronde parcelas a cultivar para que el error de tipo II tenga probabilidad menor o igual que 0.05.

2. Consideremos dos funciones de probabilidad puntual P0(x) y P1(x) dadas por la siguiente tabla:

x1 x2 x3 x4

P0 0.05 0.00 0.05 0.90

P1 0.00 0.05 0.90 0.05

Se observa una v.a. X y se quiere testear H0 :X ∼P0 vs H1 :X ∼P1.

(a) Encontar los 4 tests no aleatorizados de nivel α= 0.05 para este problema. (b) Entre estos 4 tests de nivel α, ¿cu´al es el mejor?

(c) Probar que el test hallado en el inciso anterior es el m´as potente de nivel α.

(d) ¿Hay alg´un test no aleatorizado de nivel menor que α? ¿Qu´e potencia tiene? (e) Encontrar el test m´as potente de nivel α= 0.10.

3. Sea X1, . . . , Xn una m.a. que puede provenir de dos poblaciones: la hip´otesis nula es que Xi tiene distribuci´onU(0,50) y la alternativa es que tiene densidad

f(x) = x

1250I[0,50](x). Encontrar el test MP para este problema.

(Sugerencia: Analizar la distribuci´on de −ln (X/50).)

4. Sea X1, . . . , Xn una m.a. de una distribuci´on F (x, θ) y sea T (X) un estad´ıstico suficiente para θ. Si Φ (X) es el test m´as potente de nivel α para

H :θ =θ1 vs K :θ=θ2

mostrar que Φ (X) est´a basado en T (X), o esa depende de la muestra solo a trav´es de T (X).

(2)

5. Sea X ∼C(θ,1), mostrar que el test Φ (X) =

(

1 si 1< X < 3 0 en otro caso es el mejor para su nivel para testear

H :θ = 0 vs K :θ = 1.

6. Sea Φ el mejor test de nivel α (0< α <1) para

H :θ=θ0 vs K :θ =θ1. Mostrar que

Eθ1(Φ (X)) =βΦ(θ1)> α, salvo que Pθ0 =Pθ1.

B) Tests para familias con cociente de verosimilitud mon´otono.

1. Probar que las siguientes familias son de cociente de verosimilitud mon´otono: (a) U(θ, θ+ 1)

(b) Las familias exponenciales a un par´ametro con densidad o probabilidad

p(x|θ) =a(θ)h(x) exp(c(θ)t(x))

siempre que c(θ) sea estrictamente creciente. Luego las familias: binomial, binomial negativa, Poisson, Gamma, Beta y Normal (estas 3 ultimas con-siderando uno de los par´ametros fijos) son de CVM.

(c) H(n, m, M) dondem es el ´unico par´ametro desconocido, siendo

PX(x) = m x ! M −m n−x ! M n ! y x= max{0, m+n−M}, . . . ,min{m, n}

(d) La familia doble exponencial

f(x|α, β) = 1 2β exp ( −|x−α| β ) con β desconocido.

(e) La familia exponencial negativa

(3)

2. (a) Dada X1, . . . , Xn una m.a. de una distribuci´on E(λ), hallar el test UMP de nivel α para H0 :λ≥λ0 vs H1 :λ < λ0.

(b) Se sabe que el tiempo de duraci´on de cierto tipo de lamparitas sigue una distribuci´onE(λ).La empresa garantiza que el tiempo medio de vida es mayor que 50 d´ıas y quiere asegurarse que la producci´on satisface este requerimiento antes de sacarla a la venta. Para ello toma una muestra de 10 lamparitas y observa un tiempo promedio de duraci´on de 41 d´ıas.

i. Si se quiere tener un 95% de seguridad de no vender cuando no se satisfacen los requerimientos, ¿qu´e decisi´on se toma en base a estos datos?

ii. Acotar el valorp.

iii. ¿Cu´al es la probabilidad de no sacar la producci´on a la venta si el tiempo medio de vida es de 57 d´ıas?

3. (a) Sea X1, . . . , Xnuna m.a. de una poblaci´onN(µ0, σ2) con µ0 conocido. Encon-trar el test UMP de nivel α para H0 :σ2 ≥σ02 vs H1 :σ2 < σ20.

(b) Para medir la concentraci´on de una sustancia en una soluci´on se conoce un m´etodo cuyo error es una v.a. con distribuci´on N(0,1). Se propone un nuevo m´etodo cuyo error tambi´en es normal con media cero pero varianza descono-cida; se adoptar´a este nuevo m´etodo si es m´as preciso que el anterior. Se tomaron 21 mediciones y se obtuvo ˜s2 = 0.60.

i. Se quiere que la probabilidad de cambiar de m´etodo si el nuevo en realidad es menos preciso sea a lo sumo del 1%. ¿Adoptar´ıa o no el nuevo m´etodo? ii. Acotar el valorp.

iii. Acotar la probabilidad de quedarse con el viejo m´etodo de medici´on cuando la varianza del nuevo es en realidad 0.80.

4. (a) Sea X1, . . . , Xnuna m.a. de una distribuci´onBi(1, p). Encontrar el test UMP de nivel α para H0 :p≤p0 vs H1 :p > p0.

(b) Para curar cierta enfermedad se emplea actualmente un tratamiento que tiene un 40% de ´exito. Un nuevo tratamiento es probado en 10 pacientes elegidos al azar y 9 de ellos se curan.

i. Si se quiere que la probabilidad de adoptar el nuevo tratamiento cuando no es mejor que el actual sea 0.05, ¿qu´e decisi´on se toma?

ii. Calcular el valor p.

iii. ¿Cu´al es la probabilidad de no cambiar de tratamiento si el nuevo en realidad tiene una probabilidad de ´exito del 45%?

(c) Seis estudiantes se pusieron a dieta para bajar de peso, con los siguientes resultados:

Nombre Abdul Ed Jim Max Phil Ray

Peso antes (X) 87 95 94 91 100 94

Peso despu´es (Y) 83 93 91 89 102 90

¿Puede concluirse que esta dieta es efectiva? ¿Cu´al es el valor p para estos datos?

(4)

5. (a) Probar que la familia de densidades de la forma

pθ(x) =a(θ)h(x) I(−∞,θ)(x) tiene CVM en X(n).

(b) Si X1, . . . , Xn es una m.a. de una distribuci´onU(0, θ), encontrar el test UMP de nivel α para H0 :θ≤θ0 vs H1 :θ > θ0.

C) Tests del cociente de m´axima verosimilitud.

1. Se dise˜n´o un sistema de riego de manera que el tiempo promedio de activaci´on sea a lo sumo 25 segundos. Se lo prob´o 11 veces, obteni´endose los siguientes tiempos de activaci´on:

27 41 22 27 23 35 30 24 27 28 22

Se supone que el tiempo de activaci´on es una v.a. con distribuci´on normal. (a) A nivel 0.05, ¿contradicen estos datos las especificaciones del sistema? (b) Acotar el valor p.

2. (a) Sea X1, . . . , Xn una m.a. de una distribuci´onN(µ1, σ2) e Y1, . . . , Ym una m.a. de una distribuci´on N(µ2, σ2) independiente de la anterior. Si llamamos ∆ =

µ1−µ2,probar que el test de CMV de nivel α para H0 : ∆ = 0 vs H1 : ∆6= 0 rechaza H0 si y s´olo si X¯ −Y¯ Sp q 1 n + 1 m > tn+m−2,α/2.

(b) Un terreno se divide en 20 lotes semejantes. Se pone a prueba un nuevo fer-tilizante (I) coloc´andolo por aspersi´on en 10 lotes elegidos al azar. En los otros 10 lotes se utiliza como control un fertilizante de uso corriente (II). En cada parcela se planta el mismo n´umero de plantas de tomate, y se observa el rendimiento (en kg/ha) en cada lote, obteni´endose

¯

X = 130 sX = 10 para el fertilizante I ¯

Y = 120 sY = 8 para el fertilizante II

Se supone que los datos provienen de muestras aleatorias con distribuci´on nor-mal y varianzas iguales.

i. Testear a nivel 0.05 si hay diferencia entre los rendimientos. ii. Acotar el valorp. ¿Qu´e decisi´on se hubiera tomado a nivel 0.01?

3. Sea X1, . . . , Xn una m.a. de una distribuci´on N(µ1, σ12) e Y1, . . . , Ym una m.a. de una distribuci´onN(µ2, σ22) independiente de la anterior. Probar que el test de CMV de nivel α para H0 :σ21/σ 2 2 = 1 vs H1 :σ21/σ 2 2 6= 1 rechaza H0 si y s´olo si s2 1 s2 2 > k1 ´o s2 1 s2 2 < k2

(5)

4. El riesgo de inversiones alternativas es evaluado generalmente por la varianza de las ganancias asociadas a cada inversi´on. La distribuci´on de las ganancias anuales de dos inversiones alternativas A y B se supone normal. En base a la informaci´on de 10 a˜nos pasados en el caso de la inversi´on A y de 16 a˜nos en el caso de la inversi´on B, se calcularon las varianzas estimadas de las ganancias para las dos inversiones, obteni´endoses2

A= 3.2 y s 2

B = 7.5. ¿Puede decirse a nivel 0.05 que la inversi´on B es tan riesgosa como la A?¿Y a nivel 0.10?

5. Se tomaron aleatoriamente 8 pares de pollos hermanos y se eligi´o al azar dentro de cada par cual iba a la muestra A y cual a la B. Los pollos de la muestra A han sido criados en encierro, mientras que los de la muestra B al aire libre. Los datos siguientes corresponden al peso de los pollos de 7 semanas:

Muestra A 255 481 360 368 425 283 311 368 Muestra B 226 425 311 311 255 340 311 284 Suponiendo normalidad de los datos,

(a) ¿existe alguna diferencia en el peso medio a las 7 semanas entre los m´etodos de crianza? Testear a nivel 0.01.

(b) Acotar el valor p.

D) Tests con nivel de significaci´on asint´otico.

1. Se supone que en cierta poblaci´on de insectos la cantidad de hembras es igual a la de machos. Para poner a prueba esta creencia, un entom´ologo tom´o una muestra de 100 de estos insectos, resultando machos 43 de ellos.

(a) Utilizando un test de nivel asint´otico, decidir si hay suficiente evidencia a nivel 0.05 para rechazar la suposici´on. Calcular el valor paproximado.

(b) Si el porcentaje de hembras fuera 0.55, ¿cu´al ser´ıa la probabilidad de tomar una decisi´on incorrecta?

2. El n´umero de personas que llega a la boleter´ıa de una estaci´on de trenes entre las 14 y 14:30 hs. tiene distribuci´on de Poisson. El jefe de la estaci´on est´a evaluando la posibilidad de abrir otra ventanilla en ese horario y considera que es necesario s´olo si la media de arribos es superior a 20 individuos. Adem´as, quiere que la probabilidad de abrir una nueva ventanilla cuando en realidad no es necesario sea a lo sumo 0.01. Durante 45 d´ıas se observa el n´umero de personas que arriba en dicho horario y se calcula una media muestral de 21 individuos.

(a) Proponer un test para este problema. ¿Qu´e decisi´on toma en base a estos datos? ¿Cu´al es el valor paproximado?

(b) ¿Cu´al es la probabilidad de dejar una sola boleter´ıa cuando en realidad la media verdadera es de 22 personas?

(c) Si se hubiera querido que la probabilidad calculada en (b) fuera a lo sumo 0.05, ¿qu´e tama˜no muestral deber´ıa haberse tomado?

(6)

3. Se ha tomado una muestra aleatoria de tama˜no 30 de los d´ıas que demora una empresa en instalar una l´ınea telef´onica a partir del momento de su solicitud. Los datos obtenidos fueron los siguientes:

3, 4, 5, 3, 2, 7, 6, 4, 6, 4, 7, 2, 3, 4, 6,

7, 3, 5, 6, 6, 4, 5, 5, 7, 3, 2, 2, 4, 3, 5.

La compa˜n´ıa, por contrato, debe tener un valor medio de demora no mayor que 4 d´ıas. El gobierno le inici´o juicio a la compa˜n´ıa porque cree que ´esta no cumpli´o con el contrato. El juez considera que su veredicto debe ser hecho de manera tal que la probabilidad de fallar contra la compa˜n´ıa cuando ´esta ha cumplido con lo estipulado en el contrato sea aproximadamente 0.05.

(a) Suponiendo que la distribuci´on de los tiempos de espera es E(λ), encontrar el test asint´otico en el cual el juez debe basar su decisi´on y el veredicto al que arribar´ıa con la muestra dada.

(b) Expresar la funci´on de potencia del test en t´erminos de una funci´on de dis-tribuci´on conocida.

(c) ¿Qu´e tama˜no de muestra deber´ıa utilizarse si se quiere que la probabilidad de condenar a la compa˜n´ıa sea 0.99 cuando el valor medio de la demora es de 5 d´ıas?

4. Un dado se tira 600 veces y se obtienen los siguientes resultados:

N´umero 1 2 3 4 5 6

Frecuencia 87 96 108 89 122 98

¿Puede decirse que el dado no es balanceado? Calcular el valor p aproximado.

E) Tests IUMP.

1. Sean X1, . . . , Xn es una m.a. de una distribuci´on Paretto, o sea la densidad de X1 esta dada por

f(x, θ) =θx−θ−1I(1,+∞)(x) 0< θ

Hallar el test IUMP para: (a) H0 :θ =θ0 vs H1 :θ 6=θ0 (b) H0 :θ ≤θ0 vs H1 :θ > θ0

2. Sean X1, . . . , Xn es una m.a. de una distribuci´on P(λ) hallar el test IUMP para: (a) H0 :λ=λ0 vs H1 :λ6=λ0

(b) H0 :λ≤λ0 vs H1 :λ > λ0

3. Sean X e Y v.a. distribuci´on conjunta

fXY(x, y) =λµexp{−λx−µy}I(0,+∞)(x) I(0,+∞)(y)

(7)

(a) H0 :λ≤µ+ 1 vs H1 :λ > µ+ 1 (b) H0 :λ=µvs H1 :λ6=µ

(c) H0 :λ≤2µvs H1 :λ <2µ

4. Sean X e Y v.a. independientes con distribuci´on geom´etrica

pXY(x, y) = (1−θ1)(1−θ2)θxy 2

x ∈ IN ∪ {0} y ∈ IN ∪ {0} siendo 0 < θ1 < 1 0 < θ2 < 1 Hallar un test UMP de nivel 0.2 para testear:

(a) H0 :θ1 ≤θ2 vs H1 :θ1 > θ2 (b) H0 :θ1 =θ2 vs H1 :θ1 6=θ2

Para qu´e funciones ϕ(θ1, θ2) los m´etodos para tests UMP insesgados garantizan la existencia de un test UMP insesgado para testear H0 : ϕ(θ1, θ2) = 0 vs H1 :

ϕ(θ1, θ2)6= 0 ?

5. Sean X1, . . . ,Xn y Y1, . . . ,Ym m.a. independientes de distribuciones N(µ, σ2) y

N(η, σ2) respectivamente. Hallar un test UMP insesgado de nivel α para testear

H0 :µ≤η vs H1 :µ > η

F) Adicionales.

1. Sean Y1, . . . , Yn v.a. independientes con distribuci´on U(0.θ). Muestre que el test dado por Φ (Y) = ( 1 si Y(n) > θ0 o Y(n)≤θ0α 1 n 0 si θ0α 1 n < Y(n) ≤θ0 ,

es UMP de nivel α para testear H0 :θ =θ0 vs H0 :θ 6=θ0 2. Sean X1, . . . , Xn es una m.a. de una distribuci´on U(θ, θ+ 1),

(a) Hallar la distribuci´on del estad´ıstico suficiente T = (T1, T2) = (X(1), X(n)). (b) Mostrar que existe un test UMP de nivel α para H0 :θ ≤θ0 vs H1 :θ > θ0. Y

tiene la forma,

Φ0(t1, t2) =

(

0 si t1 < k y t2 <1 1 en otro caso , (c) Hallar el valor de k para obtener un test de nivel α.

3. Generalizaci´on de Neyman-Pearson: sean (fk(x)) n

k=0 funciones integrables en IR cualquier funci´on integrable de la forma

Φ0(X) =      1 si f0(x)>Pni=1kifi(x) γ(x) si f0(x) =Pni=1kifi(x) 0 si f0(x)<Pni=1kifi(x) ,

0 ≤ γ(x) ≤ 1. Sea Φ0(X) maximiza R Φ (X) f0(x) dx entre las funciones Φ, 0≤Φ≤1, tales que:

Z

Φ (x)fj(x)dx=

Z

Φ0(x)fj(x)dx, j = 1, . . . , n. Sikj ≥0, j = 1, . . . , n, entonces maximiza entre las funciones tales que:

Z

Φ (x)fj(x)dx≤

Z

Referencias

Documento similar