Estad´ıstica (m) Pr´actica 8 A) Tests de Neyman-Pearson para hip´otesis simples.
1. Una empresa vende dos variedades de soja. La variedad 1 tiene un rendimiento por ha. que puede considerarse una variable aleatoria con distribuci´on N(37,25),
y la variedad 2 tiene un rendimiento por ha. que puede considerarse N(40,25). Un cliente realiz´o una compra de semillas de la variedad 2 y antes de continuar comprando a esta empresa, quiere asegurarse de que las semillas que le enviaron realmente pertenecen a esa variedad. Con ese fin, cultiva 10 parcelas de 1 ha. y obtiene los siguientes rendimientos:
37 39.5 41.7 42 40 41.25 43 44.05 38 38.5
El cliente quiere que la probabilidad de seguir comprando a esta empresa cuando las semillas no son de la variedad pedida sea 0.05.
(a) Plantear el test MP para este problema. ¿Qu´e decisi´on se toma? (b) Hallar el valor p.¿Se hubiera rechazado H0 para α= 0.01?
(c) Calcular la probabilidad del error de tipo II.
(d) Determinar el n´umeronde parcelas a cultivar para que el error de tipo II tenga probabilidad menor o igual que 0.05.
2. Consideremos dos funciones de probabilidad puntual P0(x) y P1(x) dadas por la siguiente tabla:
x1 x2 x3 x4
P0 0.05 0.00 0.05 0.90
P1 0.00 0.05 0.90 0.05
Se observa una v.a. X y se quiere testear H0 :X ∼P0 vs H1 :X ∼P1.
(a) Encontar los 4 tests no aleatorizados de nivel α= 0.05 para este problema. (b) Entre estos 4 tests de nivel α, ¿cu´al es el mejor?
(c) Probar que el test hallado en el inciso anterior es el m´as potente de nivel α.
(d) ¿Hay alg´un test no aleatorizado de nivel menor que α? ¿Qu´e potencia tiene? (e) Encontrar el test m´as potente de nivel α= 0.10.
3. Sea X1, . . . , Xn una m.a. que puede provenir de dos poblaciones: la hip´otesis nula es que Xi tiene distribuci´onU(0,50) y la alternativa es que tiene densidad
f(x) = x
1250I[0,50](x). Encontrar el test MP para este problema.
(Sugerencia: Analizar la distribuci´on de −ln (X/50).)
4. Sea X1, . . . , Xn una m.a. de una distribuci´on F (x, θ) y sea T (X) un estad´ıstico suficiente para θ. Si Φ (X) es el test m´as potente de nivel α para
H :θ =θ1 vs K :θ=θ2
mostrar que Φ (X) est´a basado en T (X), o esa depende de la muestra solo a trav´es de T (X).
5. Sea X ∼C(θ,1), mostrar que el test Φ (X) =
(
1 si 1< X < 3 0 en otro caso es el mejor para su nivel para testear
H :θ = 0 vs K :θ = 1.
6. Sea Φ el mejor test de nivel α (0< α <1) para
H :θ=θ0 vs K :θ =θ1. Mostrar que
Eθ1(Φ (X)) =βΦ(θ1)> α, salvo que Pθ0 =Pθ1.
B) Tests para familias con cociente de verosimilitud mon´otono.
1. Probar que las siguientes familias son de cociente de verosimilitud mon´otono: (a) U(θ, θ+ 1)
(b) Las familias exponenciales a un par´ametro con densidad o probabilidad
p(x|θ) =a(θ)h(x) exp(c(θ)t(x))
siempre que c(θ) sea estrictamente creciente. Luego las familias: binomial, binomial negativa, Poisson, Gamma, Beta y Normal (estas 3 ultimas con-siderando uno de los par´ametros fijos) son de CVM.
(c) H(n, m, M) dondem es el ´unico par´ametro desconocido, siendo
PX(x) = m x ! M −m n−x ! M n ! y x= max{0, m+n−M}, . . . ,min{m, n}
(d) La familia doble exponencial
f(x|α, β) = 1 2β exp ( −|x−α| β ) con β desconocido.
(e) La familia exponencial negativa
2. (a) Dada X1, . . . , Xn una m.a. de una distribuci´on E(λ), hallar el test UMP de nivel α para H0 :λ≥λ0 vs H1 :λ < λ0.
(b) Se sabe que el tiempo de duraci´on de cierto tipo de lamparitas sigue una distribuci´onE(λ).La empresa garantiza que el tiempo medio de vida es mayor que 50 d´ıas y quiere asegurarse que la producci´on satisface este requerimiento antes de sacarla a la venta. Para ello toma una muestra de 10 lamparitas y observa un tiempo promedio de duraci´on de 41 d´ıas.
i. Si se quiere tener un 95% de seguridad de no vender cuando no se satisfacen los requerimientos, ¿qu´e decisi´on se toma en base a estos datos?
ii. Acotar el valorp.
iii. ¿Cu´al es la probabilidad de no sacar la producci´on a la venta si el tiempo medio de vida es de 57 d´ıas?
3. (a) Sea X1, . . . , Xnuna m.a. de una poblaci´onN(µ0, σ2) con µ0 conocido. Encon-trar el test UMP de nivel α para H0 :σ2 ≥σ02 vs H1 :σ2 < σ20.
(b) Para medir la concentraci´on de una sustancia en una soluci´on se conoce un m´etodo cuyo error es una v.a. con distribuci´on N(0,1). Se propone un nuevo m´etodo cuyo error tambi´en es normal con media cero pero varianza descono-cida; se adoptar´a este nuevo m´etodo si es m´as preciso que el anterior. Se tomaron 21 mediciones y se obtuvo ˜s2 = 0.60.
i. Se quiere que la probabilidad de cambiar de m´etodo si el nuevo en realidad es menos preciso sea a lo sumo del 1%. ¿Adoptar´ıa o no el nuevo m´etodo? ii. Acotar el valorp.
iii. Acotar la probabilidad de quedarse con el viejo m´etodo de medici´on cuando la varianza del nuevo es en realidad 0.80.
4. (a) Sea X1, . . . , Xnuna m.a. de una distribuci´onBi(1, p). Encontrar el test UMP de nivel α para H0 :p≤p0 vs H1 :p > p0.
(b) Para curar cierta enfermedad se emplea actualmente un tratamiento que tiene un 40% de ´exito. Un nuevo tratamiento es probado en 10 pacientes elegidos al azar y 9 de ellos se curan.
i. Si se quiere que la probabilidad de adoptar el nuevo tratamiento cuando no es mejor que el actual sea 0.05, ¿qu´e decisi´on se toma?
ii. Calcular el valor p.
iii. ¿Cu´al es la probabilidad de no cambiar de tratamiento si el nuevo en realidad tiene una probabilidad de ´exito del 45%?
(c) Seis estudiantes se pusieron a dieta para bajar de peso, con los siguientes resultados:
Nombre Abdul Ed Jim Max Phil Ray
Peso antes (X) 87 95 94 91 100 94
Peso despu´es (Y) 83 93 91 89 102 90
¿Puede concluirse que esta dieta es efectiva? ¿Cu´al es el valor p para estos datos?
5. (a) Probar que la familia de densidades de la forma
pθ(x) =a(θ)h(x) I(−∞,θ)(x) tiene CVM en X(n).
(b) Si X1, . . . , Xn es una m.a. de una distribuci´onU(0, θ), encontrar el test UMP de nivel α para H0 :θ≤θ0 vs H1 :θ > θ0.
C) Tests del cociente de m´axima verosimilitud.
1. Se dise˜n´o un sistema de riego de manera que el tiempo promedio de activaci´on sea a lo sumo 25 segundos. Se lo prob´o 11 veces, obteni´endose los siguientes tiempos de activaci´on:
27 41 22 27 23 35 30 24 27 28 22
Se supone que el tiempo de activaci´on es una v.a. con distribuci´on normal. (a) A nivel 0.05, ¿contradicen estos datos las especificaciones del sistema? (b) Acotar el valor p.
2. (a) Sea X1, . . . , Xn una m.a. de una distribuci´onN(µ1, σ2) e Y1, . . . , Ym una m.a. de una distribuci´on N(µ2, σ2) independiente de la anterior. Si llamamos ∆ =
µ1−µ2,probar que el test de CMV de nivel α para H0 : ∆ = 0 vs H1 : ∆6= 0 rechaza H0 si y s´olo si X¯ −Y¯ Sp q 1 n + 1 m > tn+m−2,α/2.
(b) Un terreno se divide en 20 lotes semejantes. Se pone a prueba un nuevo fer-tilizante (I) coloc´andolo por aspersi´on en 10 lotes elegidos al azar. En los otros 10 lotes se utiliza como control un fertilizante de uso corriente (II). En cada parcela se planta el mismo n´umero de plantas de tomate, y se observa el rendimiento (en kg/ha) en cada lote, obteni´endose
¯
X = 130 sX = 10 para el fertilizante I ¯
Y = 120 sY = 8 para el fertilizante II
Se supone que los datos provienen de muestras aleatorias con distribuci´on nor-mal y varianzas iguales.
i. Testear a nivel 0.05 si hay diferencia entre los rendimientos. ii. Acotar el valorp. ¿Qu´e decisi´on se hubiera tomado a nivel 0.01?
3. Sea X1, . . . , Xn una m.a. de una distribuci´on N(µ1, σ12) e Y1, . . . , Ym una m.a. de una distribuci´onN(µ2, σ22) independiente de la anterior. Probar que el test de CMV de nivel α para H0 :σ21/σ 2 2 = 1 vs H1 :σ21/σ 2 2 6= 1 rechaza H0 si y s´olo si s2 1 s2 2 > k1 ´o s2 1 s2 2 < k2
4. El riesgo de inversiones alternativas es evaluado generalmente por la varianza de las ganancias asociadas a cada inversi´on. La distribuci´on de las ganancias anuales de dos inversiones alternativas A y B se supone normal. En base a la informaci´on de 10 a˜nos pasados en el caso de la inversi´on A y de 16 a˜nos en el caso de la inversi´on B, se calcularon las varianzas estimadas de las ganancias para las dos inversiones, obteni´endoses2
A= 3.2 y s 2
B = 7.5. ¿Puede decirse a nivel 0.05 que la inversi´on B es tan riesgosa como la A?¿Y a nivel 0.10?
5. Se tomaron aleatoriamente 8 pares de pollos hermanos y se eligi´o al azar dentro de cada par cual iba a la muestra A y cual a la B. Los pollos de la muestra A han sido criados en encierro, mientras que los de la muestra B al aire libre. Los datos siguientes corresponden al peso de los pollos de 7 semanas:
Muestra A 255 481 360 368 425 283 311 368 Muestra B 226 425 311 311 255 340 311 284 Suponiendo normalidad de los datos,
(a) ¿existe alguna diferencia en el peso medio a las 7 semanas entre los m´etodos de crianza? Testear a nivel 0.01.
(b) Acotar el valor p.
D) Tests con nivel de significaci´on asint´otico.
1. Se supone que en cierta poblaci´on de insectos la cantidad de hembras es igual a la de machos. Para poner a prueba esta creencia, un entom´ologo tom´o una muestra de 100 de estos insectos, resultando machos 43 de ellos.
(a) Utilizando un test de nivel asint´otico, decidir si hay suficiente evidencia a nivel 0.05 para rechazar la suposici´on. Calcular el valor paproximado.
(b) Si el porcentaje de hembras fuera 0.55, ¿cu´al ser´ıa la probabilidad de tomar una decisi´on incorrecta?
2. El n´umero de personas que llega a la boleter´ıa de una estaci´on de trenes entre las 14 y 14:30 hs. tiene distribuci´on de Poisson. El jefe de la estaci´on est´a evaluando la posibilidad de abrir otra ventanilla en ese horario y considera que es necesario s´olo si la media de arribos es superior a 20 individuos. Adem´as, quiere que la probabilidad de abrir una nueva ventanilla cuando en realidad no es necesario sea a lo sumo 0.01. Durante 45 d´ıas se observa el n´umero de personas que arriba en dicho horario y se calcula una media muestral de 21 individuos.
(a) Proponer un test para este problema. ¿Qu´e decisi´on toma en base a estos datos? ¿Cu´al es el valor paproximado?
(b) ¿Cu´al es la probabilidad de dejar una sola boleter´ıa cuando en realidad la media verdadera es de 22 personas?
(c) Si se hubiera querido que la probabilidad calculada en (b) fuera a lo sumo 0.05, ¿qu´e tama˜no muestral deber´ıa haberse tomado?
3. Se ha tomado una muestra aleatoria de tama˜no 30 de los d´ıas que demora una empresa en instalar una l´ınea telef´onica a partir del momento de su solicitud. Los datos obtenidos fueron los siguientes:
3, 4, 5, 3, 2, 7, 6, 4, 6, 4, 7, 2, 3, 4, 6,
7, 3, 5, 6, 6, 4, 5, 5, 7, 3, 2, 2, 4, 3, 5.
La compa˜n´ıa, por contrato, debe tener un valor medio de demora no mayor que 4 d´ıas. El gobierno le inici´o juicio a la compa˜n´ıa porque cree que ´esta no cumpli´o con el contrato. El juez considera que su veredicto debe ser hecho de manera tal que la probabilidad de fallar contra la compa˜n´ıa cuando ´esta ha cumplido con lo estipulado en el contrato sea aproximadamente 0.05.
(a) Suponiendo que la distribuci´on de los tiempos de espera es E(λ), encontrar el test asint´otico en el cual el juez debe basar su decisi´on y el veredicto al que arribar´ıa con la muestra dada.
(b) Expresar la funci´on de potencia del test en t´erminos de una funci´on de dis-tribuci´on conocida.
(c) ¿Qu´e tama˜no de muestra deber´ıa utilizarse si se quiere que la probabilidad de condenar a la compa˜n´ıa sea 0.99 cuando el valor medio de la demora es de 5 d´ıas?
4. Un dado se tira 600 veces y se obtienen los siguientes resultados:
N´umero 1 2 3 4 5 6
Frecuencia 87 96 108 89 122 98
¿Puede decirse que el dado no es balanceado? Calcular el valor p aproximado.
E) Tests IUMP.
1. Sean X1, . . . , Xn es una m.a. de una distribuci´on Paretto, o sea la densidad de X1 esta dada por
f(x, θ) =θx−θ−1I(1,+∞)(x) 0< θ
Hallar el test IUMP para: (a) H0 :θ =θ0 vs H1 :θ 6=θ0 (b) H0 :θ ≤θ0 vs H1 :θ > θ0
2. Sean X1, . . . , Xn es una m.a. de una distribuci´on P(λ) hallar el test IUMP para: (a) H0 :λ=λ0 vs H1 :λ6=λ0
(b) H0 :λ≤λ0 vs H1 :λ > λ0
3. Sean X e Y v.a. distribuci´on conjunta
fXY(x, y) =λµexp{−λx−µy}I(0,+∞)(x) I(0,+∞)(y)
(a) H0 :λ≤µ+ 1 vs H1 :λ > µ+ 1 (b) H0 :λ=µvs H1 :λ6=µ
(c) H0 :λ≤2µvs H1 :λ <2µ
4. Sean X e Y v.a. independientes con distribuci´on geom´etrica
pXY(x, y) = (1−θ1)(1−θ2)θx1θ y 2
x ∈ IN ∪ {0} y ∈ IN ∪ {0} siendo 0 < θ1 < 1 0 < θ2 < 1 Hallar un test UMP de nivel 0.2 para testear:
(a) H0 :θ1 ≤θ2 vs H1 :θ1 > θ2 (b) H0 :θ1 =θ2 vs H1 :θ1 6=θ2
Para qu´e funciones ϕ(θ1, θ2) los m´etodos para tests UMP insesgados garantizan la existencia de un test UMP insesgado para testear H0 : ϕ(θ1, θ2) = 0 vs H1 :
ϕ(θ1, θ2)6= 0 ?
5. Sean X1, . . . ,Xn y Y1, . . . ,Ym m.a. independientes de distribuciones N(µ, σ2) y
N(η, σ2) respectivamente. Hallar un test UMP insesgado de nivel α para testear
H0 :µ≤η vs H1 :µ > η
F) Adicionales.
1. Sean Y1, . . . , Yn v.a. independientes con distribuci´on U(0.θ). Muestre que el test dado por Φ (Y) = ( 1 si Y(n) > θ0 o Y(n)≤θ0α 1 n 0 si θ0α 1 n < Y(n) ≤θ0 ,
es UMP de nivel α para testear H0 :θ =θ0 vs H0 :θ 6=θ0 2. Sean X1, . . . , Xn es una m.a. de una distribuci´on U(θ, θ+ 1),
(a) Hallar la distribuci´on del estad´ıstico suficiente T = (T1, T2) = (X(1), X(n)). (b) Mostrar que existe un test UMP de nivel α para H0 :θ ≤θ0 vs H1 :θ > θ0. Y
tiene la forma,
Φ0(t1, t2) =
(
0 si t1 < k y t2 <1 1 en otro caso , (c) Hallar el valor de k para obtener un test de nivel α.
3. Generalizaci´on de Neyman-Pearson: sean (fk(x)) n
k=0 funciones integrables en IR cualquier funci´on integrable de la forma
Φ0(X) = 1 si f0(x)>Pni=1kifi(x) γ(x) si f0(x) =Pni=1kifi(x) 0 si f0(x)<Pni=1kifi(x) ,
0 ≤ γ(x) ≤ 1. Sea Φ0(X) maximiza R Φ (X) f0(x) dx entre las funciones Φ, 0≤Φ≤1, tales que:
Z
Φ (x)fj(x)dx=
Z
Φ0(x)fj(x)dx, j = 1, . . . , n. Sikj ≥0, j = 1, . . . , n, entonces maximiza entre las funciones tales que:
Z
Φ (x)fj(x)dx≤
Z