• No se han encontrado resultados

LIBRO DE PRÁCTICAS DEL SEGUNDO SEMESTRE ESTADISTICA II CURSO 2009 CONTENIDO

N/A
N/A
Protected

Academic year: 2021

Share "LIBRO DE PRÁCTICAS DEL SEGUNDO SEMESTRE ESTADISTICA II CURSO 2009 CONTENIDO"

Copied!
59
0
0

Texto completo

(1)

LIBRO DE PRÁCTICAS DEL SEGUNDO SEMESTRE

ESTADISTICA II

CURSO 2009

CONTENIDO

PRÁCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES... 1

PRÁCTICA 10: ESTIMACIÓN PUNTUAL ... 5

PRÁCTICA 11: ESTIMACIÓN POR INTERVALO ... 9

PRÁCTICA 12: PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS... 15

PRÁCTICA 13: PRUEBA DE HIPOTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA ... 26

PRÁCTICA 14: MUESTREO DE POBLACIONES FINITAS ... 32

PRÁCTICA 15: MODELO DE REGRESIÓN SIMPLE ... 37

PRÁCTICA 16: MODELO DE REGRESIÓN MÚLTIPLE ... 50

(2)

PRÁCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES

1

PRÁCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES

EJERCICIO 1

Sea X1, X2, X3 y X4 una MAS c/r de tamaño cuatro de X ~FX(x;μ con ) E(X)

desconocida y V(X )=σ2 <∞.

1. De las siguientes estadísticas ¿cuáles son estimadores insesgados de μ?

(

1 2

) (

3 4

)

1 3 1 6 1 X X X X T = + + +

(

1 2 3 4

)

2 2 3 4 5 1 X X X X T = + + +

(

1 2 3 4

)

3 4 1 X X X X T = + + +

(

1 4

)

4 2 1 X X T = +

2. Entre los estimadores insesgados de μ hallados, ¿cuál es el que tiene la varianza más pequeña? ¿Cuáles son las eficiencias relativas de los demás estimadores insesgados con respecto al que tiene la varianza más pequeña?

EJERCICIO 2

Sea X1, X2,..., Xn una muestra aleatoria simple con reposición de una cierta población

con media μ y varianza σ2

.

1. Demostrar que es un estimador insesgado de μ para cualquier conjunto de constantes conocidas tales que (i=1,2,..., n).

= = = i n i i iX a T 1

= = = n i i i a 1 1 2. Si

, demostrar que V(T) se minimiza si

= = = n i i i a 1 1 i n ai = ∀ 1

Sugerencia: observar que

= = = n i i i a 1 2 n n a n i i i 1 1 2 1 + ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ −

= = , cuando

= = = n i i i a 1 1

3. Dada X1, X2, X3, X4 MAS c/r de X ∼ Fx(x), se define el estadístico:

(

0.2X1 0.1X2 0.4X3 0.3X4

)

T = + + +

como estimador de μ. Analizar el ECM(T).

4. Se define otro estimador de μ, T* = 2, cualquiera sea la muestra. Sabiendo además que E(X2) = 2 μ2, comparar el ECM(T) y el ECM(T*). ¿Cuál de los dos estimadores elegiría Ud., T ó T*?

(3)

PRÁCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES EJERCICIO 3

Sea X1, X2,..., Xn MAS c/r de una variable aleatoria X con densidad dada por:

⎩ ⎨ ⎧ θ < θ ≥ = θ θ− x x ke ) , x ( f x 0 Se pide:

1. Determinar k de modo que sea efectivamente una densidad. 2. Para el k hallado, calcular E(X) y V(X)

3. Hallar la función de densidad de Z= mín {X1, X2, ...,Xn}

4. Determinar E(Z) 5. Demostrar que n Z *= −1 θ es un estimador insesgado de θ. 6. Sabiendo que V(Z) = 12 n , comparar θ* con θ** = Xn−1 __ como estimadores de θ. EJERCICIO 4

Sea X ∼ U(0,b) con b > 0 y X1, X2,..., Xn una MAS c/r de una variable aleatoria X. Se

proponen como estimadores de b: T1 = 2Xn

__

T2 = máx {X1, X2, ...,Xn}

Se pide:

1. Comparar el ECM de T1 y T2.

2. Encontrar la distribución exacta de T2.

3. Para n suficientemente grande encontrar la distribución aproximada de T1.

4. Comparar los resultados hallados en 2. y 3.

EJERCICIO 5 (Canavos 8.7)

Se muestrea una población cuya distribución es exponencial con una densidad dada por: f(x,θ) = ⎪⎧ − >0 1 x ) x exp(

(4)

PRÁCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES

3

EJERCICIO 6

Sea una MAS c/r de una variable aleatoria X discreta con función de cuantía dada por:

(

)

⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ = θ = − = θ − = 0 1 1 1 2 1 x si x ó x si ) x ( pX

donde θ ∈ [0,1] es un parámetro desconocido.

Se considera

= = θ n i i Y n * 1 1 con Yi = ⎩ ⎨ ⎧ ≠ = 0 0 0 1 i i X X Se pide:

1. Mostrar que θ* es un estimador insesgado para θ. 2. Mostrar que θ* es de mínima varianza.

3. Mostrar que θ* es asintóticamente eficiente, asintóticamente normal y hallar su media y su varianza asintótica.

EJERCICIO 7 (Novales 9.8)

Demostrar que la media muestral es un estimador suficiente para el parámetro de la densidad exponencial.

EJERCICIO 8 (Novales 9.9)

Demostrar que la media muestral es un estimador suficiente para el parámetro de la distribución de Poisson. EJERCICIO 9 Sean X~N

(

μ,σ2

)

y X1, X2,..., Xn MAS c/r de X Se pide: 1. Investigar la eficiencia de Xn __ como estimador de μ? 2. Si σ2 = 1 ¿Es Xn __

suficiente como estimador de μ? 3. Probar que (Xn

__

)3 es suficiente como estimador de μ, mientras que (Xn __

)2 no lo es. 4. Si μ = 0 ¿Es S2 suficiente como estimador de σ2

(5)

PRÁCTICA 9: PROPIEDADES DESEABLES DE LOS ESTIMADORES EJERCICIO 10 (Novales 9.31)

Utilice la desigualdad de Chebychev y la descomposición del ECM en suma de varianza y sesgo al cuadrado para probar que si la varianza de un estimador asintóticamente insesgado tiende a cero al aumentar el tamaño muestral, dicho estimador es consistente.

EJERCICIO 11 Demostrar que Xn

__

calculado en base a X1, X2,..., Xn, MAS c/r de X es consistente

como estimador de E(X) si: a) X ∼ Bernoulli (p).

b) X ∼ Fx(x) con μ y σ2 finitas

EJERCICIO 12

Dada X1, X2,..., Xn MAS c/r de X ∼ Fx(x) se define:

{

= ≤ Ι = n i a X * n(a) n i F 1 1 } con a constante. Se pide:

1. ¿Qué se requiere para que

F

n*

(

a

)

sea un estadístico? 2. Calcular su esperanza y varianza en función de p = P(X≤ a)

(6)

PRÁCTICA 10: ESTIMACIÓN PUNTUAL

PRÁCTICA 10: ESTIMACIÓN PUNTUAL

EJERCICIO 1

Determinar los estimadores máximo verosímiles y los estimadores por el método de los momentos de los siguientes parámetros:

1. p en una distribución B(x,n,p), con n conocido y tamaño de muestra m 2. λ en una distribución Poisson(λ)

3. λ en una distribución Exponencial de media 1/λ 4. a en una U(a,1)

5. μ y σ2

en una N

(

μ,σ2

)

. EJERCICIO 2

Una variable discreta toma los valores 0,1 y 2 con función de cuantía: pX(0,p) = p2 pX (1,p) = 2p (1-p) pX (2,p) = (1-p) 2

siendo p, 0<p<1, un parámetro desconocido. Estimar p aplicando máxima verosimilitud y el método de los momentos, a partir de una muestra de tamaño 100 en la que se ha presentado 22 veces el 0, 53 veces el 1 y 25 veces el 2.

EJERCICIO 3 (Segunda Revisión 1989)

Se desea estimar el parámetro θ en base a una MAS c/r de tamaño 3. El espacio paramétrico es Θ = {0,1,2,3}. De la muestra se determinó que:

⎪ ⎪ ⎩ ⎪ ⎪ ⎨ ⎧ = θ = θ = θ = θ = = = = 3 2 1 2 3 1 1 4 1 0 5 1 ) x X , x X , x (X P 1 1 2 2 3 3 si / si / si / si /

Determinar la estimación máximo verosímil de θ. Fundamentar. EJERCICIO 4

Sea X una variable aleatoria con densidad dada por:

+ ∈ θ ⎪ ⎪ ⎩ ⎪⎪ ⎨ ⎧ θ ≤ ≤ θ θ − θ θ < < θ = con R x si x x si x ) x ( fX 2 2 0 2 2 Se pide: 1. Hallar MV para X ∧ θ 1 de X (MAS de tamaño 1). 2. Hallar MM. ∧ θ

(7)

PRÁCTICA 10: ESTIMACIÓN PUNTUAL

EJERCICIO 5 (Examen de Marzo de 1995)

Sea X ~ U(θ-1/2 , θ+1/2) y sea X1, X2, ..., Xn una MAS c/r de tamaño n de la v.a. X.

Sea T = máx {X1, X2, ..., Xn}.

Se pide:

1. Hallar la distribución en el muestreo de T ∀ t ∈ Rec(T). 2. Probar que: 1 2 1 + + − θ = n n ) T ( E

3. Sea T* = T-1/2 un estimador de θ. Probar que T* es asintóticamente insesgado. 4. Sea T** el estimador de θ por el método de los momentos. Estudiar la eficiencia asintótica de T**.

EJERCICIO 6

Sea X una variable aleatoria tal que:

⎪⎩ ⎪ ⎨ ⎧ = θ = = − = − = θ − = θ 0 2 , 1 , 1 , 2 4 1 ) , ( x si x x x x si x pX

Una MAS c/r de X de tamaño n=50 arrojó estos resultados: 10 observaciones valieron -2 10 observaciones valieron -1 20 observaciones valieron 0 5 observaciones valieron 1 5 observaciones valieron 2 Se pide:

1. Hallar el campo de variación de θ, es decir el espacio paramétrico, Θ. 2. Hallar MV.

∧ θ

3. Para calcular el estimador de θ por el método de los momentos se presenta un problema con el momento de primer orden. ¿Cuál es ese problema y cómo podríamos calcular una estimación de θ por el método de los momentos?.

(8)

PRÁCTICA 10: ESTIMACIÓN PUNTUAL

EJERCICIO 7

Sea X una variable aleatoria con función de densidad:

⎪⎩ ⎪ ⎨ ⎧ ≤ ≤ = caso otro en 0 0 3 ) ( 3 2 a x a x x fX Se pide:

1. Hallar la función de verosimilitud L(a) para una MAS c/r de tamaño n de X y mostrar que L(a) es decreciente.

2. Probar que el estimador máximo verosímil de a es aMV = máx {X ∧

1, X2, ...,Xn}

3. Determinar la función de densidad deaMV. ∧

4. Demostrar que aMVes sesgado. Hallar su sesgo y mostrar que su ECM es: ∧ ) n )( n ( a ) a ( ECM 2 3 1 3 2 2 + + = ∧

5. Hallar aMM y demostrar que es insesgado. ∧

6. Determinar a partir de qué valor de n se cumple que: ECM(aMV ) ECM(aMM ) ∧ ∧

<

7. Si estuviéramos trabajando con una MAS c/r de tamaño n =100 ¿qué estimador de los anteriores elegiríamos? Justificar.

EJERCICIO 8 (Novales 9.28)

Utilizar el método de los momentos para obtener el estimador del parámetro θ en la función de densidad: ⎩ ⎨ ⎧θ < < <θ<∞ = θ θ− caso otro en 0 0 1 0 ) / ( 1 con x si x x f

EJERCICIO 9 (Segunda Revisión 1998) Sea X~N

(

0,σ2

)

y X1, X2,..., Xn MAS c/r de X

Se pide:

1. Hallar el estimador de σ2

por el método de los momentos. 2. Demostrar que el estimador de σ2

por el método de máxima verosimilitud coincide con el de los momentos.

3. Hallar el sesgo y varianza del estimador obtenido (sugerencia: recordar que si X ~ 2 se tiene que V(X) = 2).

1 χ

4. Dado el estimador alternativo para σ2

,

= − = n i __ n i X ) X ( n M 1 2 2 1 , obtener su error cuadrático medio y compararlo con el del estimador estudiado en las partes anteriores.

(9)

PRÁCTICA 10: ESTIMACIÓN PUNTUAL

EJERCICIO 10 (Novales 9.9)

Sea Xi una variable aleatoria que puede tomar k valores numéricos: x1, x2, ..., xk con

probabilidades: p1, p2, ... pk, con Esta es la distribución multinomial. Si se

extrae una muestra de tamaño n, en la que se obtienen n . p k i i 1 1 =

= 1 valores de x1, n2 valores de

x2, ... nk valores de xk, con , probar que el estimador de máxima

verosimilitud del vector p = ( p

n n k i i =

=1 1, p2, ... pk ) es ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ = ∧ n n , , n n , n n p k L 2 1 . EJERCICIO 11

Sean X, Y variables aleatorias normales tales que X ~N

(

μ ,1 σ2

)

y Y~

(

)

2 2 σ μ ,

N .

1. Probar que con muestras independientes con reposición de tamaño n1 y n2, el

estimador máximo verosímil de la varianza común es:

2 1 2 2 2 2 1 1 2 n n s n s n s + + = donde

y son las varianzas muestrales de la primera y segunda muestra respectivamente.

2 1

s s22

2. Probar que s2 es sesgado y que

2 2 1 2 2 2 2 1 1 2 − + + = n n s n s n * s es insesgado para σ2.

EJERCICIO 12 (Segunda Revision 2000)

El nivel de las ventas mensuales de un refresco (X) puede modelarse adecuadamente por la función de densidad:

[

]

⎪⎩ ⎪ ⎨ ⎧ λ λ λ λ = λ caso otro en 0 4 9 2 2 (x ) si x , ) , x ( fX λ ∈ ℜ+

donde λ es un parámetro que mide el gasto en publicidad del refresco (el cual se supone constante mes a mes).

(10)

PRÁCTICA 11: ESTIMACIÓN POR INTERVALO

PRÁCTICA 11: ESTIMACIÓN POR INTERVALO

EJERCICIO 1

Sea X ~N

(

μ,25

)

y X1, X2, ..., Xn una MAS c/r de tamaño 100 de X.

Se pide:

1. Construir un intervalo aleatorio que contenga a μ con un 0.95 de probabilidad. 2. Elegida una muestra, resultó = 20. Determinar un intervalo de confianza al

95% para μ.

n __

x

3. Explicar el significado de este intervalo de confianza.

EJERCICIO 2

En una elección los votantes deben elegir entre dos candidatos A y B. Un estudio reciente reveló que 1400 personas de un total de 2500 seleccionadas aleatoriamente, tienen preferencia por el candidato A.

a) Obtener un intervalo de confianza al 99% para la verdadera proporción de votantes a favor del candidato A. Con base en este resultado, ¿podría usted afirmar que es probable que A gane la elección? ¿Por qué?

b) Supóngase que se selecciona aleatoriamente una muestra de 225 personas con la misma proporción muestral a favor del candidato A. ¿Son los resultados diferentes a los del literal a)?

c) En este caso, ¿son razonables las suposiciones para los intervalos de confianza aproximados del 99%?

EJERCICIO 3

El precio del refresco mediano en restaurantes es una variable aleatoria normal con desvío estándar igual a $2. Una muestra de precios en 20 restaurantes arrojó los siguientes resultados: 30, 30, 30, 25, 35, 25, 35, 30, 40, 35, 40, 37, 28, 30, 30, 25, 28, 28, 30, 29.

a) Construir un intervalo para el parámetro precio promedio del refresco mediano en restaurantes al 90% de confianza.

b) Si en realidad se desconoce el valor de σ, obtener nuevamente un intervalo al 90% para dicho parámetro. ¿Por qué este intervalo tiene mayor amplitud que el que se obtuvo en el punto anterior?

(11)

PRÁCTICA 11: ESTIMACIÓN POR INTERVALO EJERCICIO 4

En una investigación de mercado sobre un nuevo producto se quiere seleccionar una MAS c/r de consumidores tal que si tomamos el porcentaje de consumidores que está a favor del producto como estimación del verdadero porcentaje poblacional no queremos "errar" por más de un 1% del valor verdadero con una "seguridad" del 95% El enunciado anterior puede interpretarse de dos maneras:

• Si el verdadero porcentaje poblacional es 100p queremos que el valor inferido para p esté en el intervalo ( p-0.01, p+0.01) con una probabilidad mayor o igual a 0.95.

• Si el verdadero porcentaje poblacional es 100p queremos que el valor inferido para p esté en el intervalo ( p-0.01p, p+0.01p) con una probabilidad mayor o igual a 0.95.

a) Utilizar la desigualdad de Tchebychev para determinar la relación entre el tamaño de muestra (n) y el verdadero valor poblacional (p) para ambas interpretaciones y comparar los resultados graficando n como función de p en ambos casos.

b) Observar el comportamiento de n cuando p está cercano a 0 y a 1. ¿Cómo cambian los resultados si se utiliza el TCL?

EJERCICIO 5 (Canavos 8.24)

Una tienda de donas se interesa en estimar su volumen de ventas diarias. Supóngase que el valor de la desviación estándar es de $50.

a) Si el volumen de ventas se encuentra aproximado por una distribución normal, ¿cuál debe ser el tamaño de la muestra para que con una probabilidad de 0.95 la media muestral se encuentre a no más de $20 del verdadero volumen de ventas promedio?

b) Si no es posible suponer que la distribución es normal, obtener el tamaño necesario de la muestra para la pregunta anterior.

EJERCICIO 6

Se desea estimar el parámetro proporción de fumadores entre los 10.000 estudiantes de una universidad. A esos efectos se selecciona una MAS c/r de 400 alumnos. A la pregunta “¿Es Ud. fumador?”, 80 estudiantes responden afirmativamente y 320 por la negativa.

(12)

PRÁCTICA 11: ESTIMACIÓN POR INTERVALO EJERCICIO 7

Sea X una variable aleatoria absolutamente continua y X1, X2, ...,Xn una MAS c/r de

X.

Sabiendo que (20 ≤ μ ≤ 30) es un intervalo de confianza al 99% para μ = E(X). Se pide:

a) A partir del intervalo de confianza obtenido y sabiendo que X se distribuye N(μ,σ2) y que n=25, deducir la estimación puntual de μ y el valor de σ2

.

b) Indicar en cada una de las afirmaciones siguientes cuál es verdadera y cuál es falsa. En este último caso explicar cuál es el error.

AFIRMACIÓN 1: Si se extraen 100 muestras al azar, habrá 99 medias muestrales que pertenecerán a dicho intervalo.

AFIRMACIÓN 2: Si se extraen muchas muestras, en el 99% de los casos las medias poblacionales pertenecerán al intervalo de confianza.

AFIRMACIÓN 3: De cada 100 intervalos correspondientes a otras tantas muestras, promedialmente 99 de ellos contendrán a la media poblacional.

EJERCICIO 8 (Canavos 8.34)

Se espera tener una cierta variación aleatoria nominal en el espesor de las láminas de plástico que una máquina produce. Para determinar cuándo la variación en el espesor se encuentra dentro de ciertos límites, cada día se seleccionan en forma aleatoria 12 láminas de plástico y se mide en milímetros su espesor. Los datos que se obtuvieron son los siguientes: 12.6, 11.9, 12.3, 12.8, 11.8, 11.7, 12.4, 12.1, 12.3, 12.3, 12.5, 12.9. Si se supone que el espesor es una variable aleatoria distribuida normal, obtener los intervalos de confianza estimados del 90, 95 y 99% para la varianza desconocida del espesor. Si no es aceptable una varianza mayor de 0.9 mm2 ¿existe alguna razón para preocuparse con base en esta evidencia?

EJERCICIO 9 (Canavos 8.32)

Cierto metal se produce, por lo común, mediante un proceso estándar. Se desarrolla un nuevo proceso en el que se añade una aleación a la producción del metal. Los fabricantes se encuentran interesados en estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan 12 especímenes y cada uno de éstos se somete a una tensión hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de los especímenes en kilogramos por centímetro cuadrado:

Proceso estándar 428 419 458 439 441 456 463 429 438 445 441 463 Proceso nuevo 462 448 435 465 429 472 453 459 427 468 452 447

(13)

PRÁCTICA 11: ESTIMACIÓN POR INTERVALO EJERCICIO 9 (continuación)

Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e independientes con varianzas iguales, obtener los intervalos de confianza estimados del 90, 95 y 99% para μE - μN Con base en los resultados, ¿se estaría inclinado a

concluir que existe una diferencia real entre μE y μN?

EJERCICIO 10 (Canavos 8.38)

Una agencia estatal tiene la responsabilidad de vigilar la calidad del agua para la cría de peces con fines comerciales. Esta agencia se encuentra interesada en comparar la variación de cierta sustancia tóxica en dos estuarios cuyas aguas se encuentran contaminadas por desperdicios industriales provenientes de una zona industrial cercana. En el primer estuario se seleccionan 11 muestras y en el segundo 8, las cuales se enviaron a un laboratorio para su análisis. Las mediciones en ppm (partes por millón) que se observaron en cada muestra se exponen en la tabla. Si se supone que el muestreo se hizo sobre dos poblaciones independientes distribuidas normales, obtener un intervalo de confianza estimado del 90% para el cociente de las dos varianzas no conocidas σ2

1/σ22. Con base en este resultado, ¿se podría concluir que

las dos varianzas son diferentes? ¿Por qué? Niveles de una sustancia tóxica (ppm):

Estuario 1 Estuario 2 10 11 10 8 12 9 13 7 9 10 8 8 12 8 12 10 10 14 8 EJERCICIO 11 (Novales 10.9)

Sean X e Y los miligramos de nicotina por cigarrillo con filtro y sin filtro, de una determinada marca. Suponga que ambas cantidades siguen una distribución Normal. Se analizaron 9 cigarrillos con filtro y 11 sin filtro, con los resultados:

(14)

PRÁCTICA 11: ESTIMACIÓN POR INTERVALO

EJERCICIO 12 (Canavos 8.40)

Se desea estudiar el efecto de una nueva vacuna para la gripe. Una MAS con reposición de 500 personas vacunadas revela que 150 de ellas se engriparon en el último invierno, mientras que en una MAS con reposición de 1000 personas no vacunadas se engriparon 400.

Suponiendo que las poblaciones son independientes, construir un intervalo de confianza al 95% para la diferencia entre las proporciones de personas que se engripan de las dos poblaciones. ¿Qué diría sobre la efectividad de la vacuna?

EJERCICIO 13 (Examen)

Una empresa de la industria manufacturera produce un tubo de imagen para PC, cuya duración en el tiempo (X) tiene la siguiente distribución de probabilidad:

⎪⎩ ⎪ ⎨ ⎧α α = caso otro en x si x ) x ( fX 0 2

donde el parámetro α (α > 0) se mide en unidades de tiempo y se interpreta como la duración mínima garantizada por el fabricante.

Se pide:

1. Demostrar que el estimador máximo verosímil de α es T = mín{X1, X2, ...,Xn}, a

partir de una MAS c/r de X de tamaño n.

2. Se observó una MAS c/r de 20 tubos de imagen de PC, vendidos hace 10 años, de los cuales:

5 de ellos se rompieron a los 2 años 4 se rompieron a los 3 años

2 se rompieron a los 4 años 2 se rompieron a los 5 años

los restantes seguían funcionando luego de 5 años. Hallar una estimación de α a partir de la muestra observada

3. Hallar la distribución en el muestreo de T (la función de densidad de T). 4. Determinar b (en función de α y n) tal que P(α < T < b) = 0.95

5. A partir del intervalo (α, b) hallado:

5.1. Hallar un intervalo aleatorio al 95% para α. 5.2. Hallar un intervalo de confianza al 95% para α.

5.3. ¿Cuál es la diferencia conceptual entre los intervalos hallados en 5.1 y 5.2? 6. Estudiar la consistencia de T como estimador de α.

(15)

PRÁCTICA 11: ESTIMACIÓN POR INTERVALO

EJERCICIO 14 (Segundo Control 2000)

Para conocer la proporción de mujeres adolescentes con hijos se realizó una encuesta a 1.015 mujeres de 14 a 19 años, mediante muestreo sin reposición. La precisión en la estimación del parámetro es muy relevante, porque el objetivo de la investigación consiste en cuantificar el número total de madres adolescentes para proporcionarles ayuda económica. Un estadístico analiza los resultados de la investigación y proporciona los siguientes resultados:

Estimación puntual: 0,12

Intervalo de confianza: [0,10 – 0,14]

Un segundo investigador revisa los datos aportados por el estadístico y concluye que los resultados están equivocados, por los siguientes motivos:

a) En primer lugar, las adolescentes con hijos en la muestra son 121, por lo que la estimación correcta de “p” es 0,119.

b) En segundo lugar, el nivel de confianza utilizado por el primer estadístico parece excesivo, y propone en su lugar un 92%.

c) En tercer lugar, al bajar el nivel de confianza se obtiene un intervalo de amplitud más reducida, lo cual es coherente con el principio de la “mínima amplitud esperada” para construir intervalos de confianza.

SE PIDE:

1. ¿Cuál es el nivel de confianza utilizado por el primer estadístico para construir el intervalo [0,10 – 0,14]?

2. Calcular el intervalo de confianza que propone el segundo investigador (aproximar con 3 decimales).

(16)

PRÁCTICA 12 PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS

PRÁCTICA 12: PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS

EJERCICIO 1

Para los siguientes problemas de decisión, definir el “Error de tipo I” y el “Error de tipo II”, y en función de ello proponer las hipótesis nula y alternativa.

1. El gerente de una compañía de ómnibus debe decidir sobre la frecuencia diaria entre dos localidades. Tradicionalmente la compañía viaja 4 veces por día y algunas veces se llegan a agotar los boletos. El gerente está pensando en incrementar la frecuencia a 6 viajes diarios para lograr un mayor número de boletos vendidos a costa de las compañías competidoras, pero con el riesgo de viajar con muchos asientos vacíos en alguna de las frecuencias con la consiguiente pérdida de imagen frente a sus clientes habituales (principal preocupación de la compañía). Cada ómnibus carga como máximo 40 pasajeros. El número medio de pasajeros transportados hasta la fecha es 150 y se espera que con las nuevas frecuencias dicho número ascenderá a 210.

2. Un fabricante de heladeras las pinta de color blanco o celeste en las proporciones del 60% y del 40% respectivamente. Últimamente se ha notado un aumento en la demanda del color celeste al punto que se han perdido algunas ventas por falta de stock y a la inversa, se nota un incremento del stock de heladeras blancas. El gerente de producción opina que rápidamente deberían alterarse las proporciones de heladeras que se pintan de blanco y celeste (por ej. 50% y 50%). El gerente de comercialización no está de acuerdo pues cree que la propensión a demandar el celeste es una moda pasajera. Para tomar la decisión se consultará con una muestra aleatoria de clientes antiguos sobre el color que habrán de elegir cuando decidan cambiar de heladera. Elaborar la regla de decisión del punto de vista del gerente de comercialización.

EJERCICIO 2

En una prueba se da un cuestionario con 15 preguntas de respuesta VERDADERO o FALSO. Se quiere probar que un estudiante contesta al azar. Para ello se adopta la siguiente regla de decisión:

- Si 12 o más respuestas son correctas el estudiante no está contestando al azar; - Si menos de 12 son correctas el estudiante está contestando al azar.

Se pide:

1. Plantear las hipótesis a comprobar. (El peor error es decir que el estudiante estudió, cuando realmente está adivinando).

2. Con la regla de decisión adoptada, ¿cuál es el nivel de significación de la prueba?

(17)

PRÁCTICA 12 PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS

EJERCICIO 3

Para realizar la siguiente prueba: H0) θ = θ 0

H1) θ = θ 1

Se sabe que considerando la región crítica RC1: P ( Error tipo I) = 0.10

P ( Error tipo II) = 0.30

y que considerando la región crítica RC2: P (Error tipo I) = 0.30 P ( Error tipo II) = 0.10 Se pide:

1. ¿Cuál de las regiones críticas utilizará para realizar la prueba? Fundamente. 2. Calcular la potencia de la prueba para la región crítica elegida.

EJERCICIO 4 (Novales 10.3)

Un profesor recrimina sistemáticamente a un colega suyo por el nivel de exigencia, por lo que éste último le ofrece corregir por separado los mismos exámenes, que se acaban de celebrar, y comparar los porcentajes de alumnos que aprueban. Tras la corrección, el primer profesor aprueba a 248 de los 400 alumnos mientras que el segundo aprueba a 214.

a) ¿Qué concluiría usted a un nivel de significación del 5% ? b) ¿Y al 10%?

EJERCICIO 5

Sea X1, X2, ...., Xn una MAS c/r de una variable X∼Bernoulli (p) elegida para probar

H0) p=0,49 contra H1) p=0,51. Usando la aproximación normal, determinar n para

que la probabilidad de ambos tipos de error no supere 0,01. EJERCICIO 6

En una población normal con una media desconocida y varianza igual a 25 se desea someter a prueba H0) μ = 10 contra H1) μ = 12 a partir de una muestra de tamaño n y

con un nivel de significación α.

1. Hallar la forma de la RC óptima.

2. Determinar dicha RC y el valor de n para que las probabilidades de ambos tipos de error no superen 0.01.

(18)

PRÁCTICA 12 PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS

EJERCICIO 7 (Canavos 9.1)

Suponga que usted desea probar la hipótesis H0) θ = 5 contra la alternativa H1) θ = 8

por medio de un solo valor que se observa en una variable aleatoria con densidad de probabilidad dada por:

⎪⎩ ⎪ ⎨ ⎧ ≤ > θ − θ = θ 0 0 0 1 x x ) x exp( ) , x ( f

Si el tamaño máximo del error de tipo I que puede tolerarse es de 0.15, ¿cuál de las siguientes reglas de decisión es la mejor para escoger entre las dos hipótesis?

Rechazar H0 si X

9

Rechazar H0 si X

10

Rechazar H0 si X

11

EJERCICIO 8 (Canavos 9.4 y 9.5)

La cantidad promedio que se coloca en un recipiente en un proceso de llenado se supone que es de 20 onzas. En forma periódica, se escogen al azar 25 recipientes y el contenido de cada uno de éstos se pesa. Se juzga al proceso como fuera de control cuando la media muestral Xn

__

es menor o igual a 19.8 o mayor o igual a 20.2 onzas. Se supone que la cantidad que se vacía en cada recipiente se encuentra aproximada, en forma adecuada, por una distribución normal con una desviación estándar de 0.5 onzas.

a) Enúnciense las hipótesis nula y alternativa que son propias para esta situación.

b) Obtener la probabilidad del error de tipo I.

c) Obtener y graficar la función de potencia para los siguientes valores medios de llenado: 19.5, 19.6, 19.7, 19.8, 19.9, 20.0, 20.1, 20.2, 20.3, 20.4 y 20.5. d) Como una prueba alternativa, considérese el rechazo de H0 cuando

5 19. Xn__ o cuando Xn ≥20.5 __

. Si el tamaño máximo del error de tipo I es de 0.05, ¿cuál de las dos pruebas es la mejor?

e) Supóngase ahora que el tamaño de la muestra se aumenta a 36 recipientes. Dados los mismos tamaños del error de tipo I para las pruebas propuestas, obtener los nuevos valores críticos y comparar las funciones de potencia de las dos pruebas.

EJERCICIO 9 (Novales 10.5)

Un analista cree que la cotización peseta/dólar USA puede representarse por una distribución N

(

μ,16

)

, pero no está seguro de que haya descendido en el último mes por debajo de su nivel medio, que cree que ha permanecido estable en 82.5 ptas./dólar. Por tanto, se quiere constatar H0) µ = 82.5 frente a H1) µ < 82.5, y está

dispuesto a rechazar la hipótesis nula de estabilidad en el tipo de cambio, si obtiene una media muestral inferior a 80.5 ptas./dólar. (Suponer que dispone de una muestra con 25 observaciones).

(19)

PRÁCTICA 12 PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS

EJERCIO 9 (continuación) Se pide:

a) ¿Cuál es el nivel de significación del contraste? b) ¿Cuál es su función de potencia? Dibújela.

c) ¿Cuál debería ser la región crítica para tener un nivel de significación del 10%? d) ¿Cuál sería la función de potencia en tal caso? Dibújela junto con la anterior. EJERCICIO 10 (Canavos 9.8)

Sea X1, X2, ..., Xn, una muestra aleatoria de tamaño n de una distribución de Poisson

con parámetro λ desconocido. Obtener la mejor región crítica de tamaño α para probar:

H0: λ = λ0

H1: λ = λ1< λ0

EJERCICIO 11 (Novales 10.12)

Hallar la forma de la región crítica óptima para el contraste de hipótesis nula H0) p = p0, frente a H1) p = p1, en una población B(p).

EJERCICIO 12 (Canavos 9.12)

Un contratista ordena un gran número de vigas de acero con longitud promedio de 5 metros. Se sabe que la longitud de una viga se encuentra normalmente distribuida con una desviación estándar de 0.02 metros. Después de recibir el embarque, el contratista selecciona 16 vigas al azar y mide sus longitudes. Si la media muestral tiene un valor más pequeño que el esperado, se tomará la decisión de enviar el embarque al fabricante.

a) Si la probabilidad de rechazar un embarque bueno es de 0.04, ¿cuál debe ser el valor de la media muestral para que el embarque sea regresado al fabricante?

b) Si la longitud promedio real es de 4.98 metros, ¿cuál es la potencia de la prueba en el inciso a)?

EJERCICIO 13 (Canavos 9.16)

En cierto condado de Iowa, la cosecha promedio de maíz por acre fue de 100 toneladas por acre. Para un año dado en el que el clima fue particularmente bueno, se seleccionaron 12 parcelas en forma aleatoria y éstas arrojaron una cosecha promedio de 106 toneladas por acre, para la misma variedad de maíz. Si la producción por acre se modela en forma adecuada por una distribución normal con una desviación estándar de 8 toneladas por acre, ¿existe alguna razón para creer que este año la producción será mejor que la producción promedio normal?. Empléese α = 0.01.

(20)

PRÁCTICA 12 PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS

EJERCICIO 14 (continuación)

2. Dada la prueba de hipótesis H0) μ≤μ0 contra H1) μ > μ0 donde la región crítica es

{todas las muestras / x≥ } k

a) No se puede calcular el nivel de significación de la prueba porque la hipótesis nula es compuesta.

b) El valor de la potencia no es único porque la hipótesis alternativa es compuesta. c) Para calcular el valor p se necesita el valor de k.

d) Ninguna de las anteriores.

3. En una prueba de hipótesis en la cual H0) μ = 5 contra H1) μ ≠ 5, ¿cuál los

siguientes valores para el tamaño de muestra (n) y el nivel de significación (α) dará una probabilidad de error II menor?

a) n = 100 y α = 0.01. b) n = 200 y α = 0.02. c) n = 200 y α = 0.03. d) Ninguna de las anteriores. EJERCICIO 15

Una empresa está estudiando comprar los derechos de distribución de las camisetas de las "Tortillas Nunga". Las utilidades mensuales provenientes de esta concesión están aproximadamente modeladas por una distribución normal con media y varianza desconocidas. El problema que se presenta es la variabilidad mensual de las utilidades, dado que dicha variabilidad es una medida del riesgo que se asume en el negocio. La empresa, asesorada por un especialista en inversiones, decide no comprar si la desviación típica de las utilidades es de U$S 800 o más.

Para decidir se toma una MAS c/r de 12 meses, en los cuales se investigan las utilidades en cada uno de ellos y se obtiene quesx = 600 y

__

x = 2.200.

Se pide: (Fundamentando sus respuestas)

1. Explicar sucintamente, por qué la desviación típica es una medida del riesgo que se asume.

2. Definir el peor error que la empresa puede cometer y en base a éste realice una prueba de hipótesis, con el fin de determinar si la empresa compra o no, los derechos de distribución. Utilice un nivel de significación del 5%.

3. Con los resultados utilizados en 2, construir un intervalo de confianza para la varianza de las utilidades de Tortillas Nunga.

Mark Eting, técnico en comercialización de productos, en un informe elevado a la gerencia, indica que la marca "Tortillas Nunga” ya no es tan popular como antes y sugiere como alternativa que se compren los derechos de distribución del fusil de asalto AK 74 de Pambo, ya que el estreno de "Pambo XXXII - En busca de su bisnieto” ha aumentado la popularidad del personaje. La distribución de las utilidades mensuales se puede modelar adecuadamente.

(21)

PRÁCTICA 12 PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS EJERCICIO 15 (continuación)

4. por una normal de media y varianza desconocida. Para tratar de resolver el problema se toma una muestra al azar de 20 meses donde se encuentra que:

000 . 42 20 1 =

= i i x

= = 20 1 2 000 . 200 . 97 i i x

Construir un intervalo de confianza para la varianza de las utilidades al 95%. 5. Obsérvese que la estimación del valor de la varianza del producto de Pambo

es mayor que la de las Tortillas Nungas; ¿por qué, para un 95% de confianza, el riesgo que se asume, en la peor situación, es menor?

EJERCICIO 16 (Canavos 9.30)

Se cree que el promedio para el número de respuestas correctas para la prueba SAT para las mujeres es mayor que el de los hombres por más de diez puntos. Las muestras aleatorias para ambos sexos arrojaron los siguientes resultados:

Mujeres: n1 = 125; Xn1 =480 __ y Sx1 =60. Hombres: n2 = 100; Xn2 =460 __ y Sx2 =52.

a) Si se muestrearon dos poblaciones independientes normales, ¿se encuentra la creencia apoyada por la evidencia muestral con α = 0.05? ¿Cuál es el valor-p?

b) Supóngase que la verdadera diferencia es de 15 puntos. ¿Cuál es la potencia de la prueba anterior?

EJERCICIO 17 (Canavos 9.33)

Se espera que dos operadores produzcan, en promedio, el mismo número de unidades terminadas en el mismo tiempo. Los siguientes datos son los números de unidades terminadas para ambos trabajadores en una semana de trabajo:

Operador 1: 12; 11; 18; 16; 13 Operador 2: 14; 18; 18; 17; 16

Si se supone que el número de unidades terminadas diariamente por los dos trabajadores son variables aleatorias independientes distribuidas normales con

(22)

PRÁCTICA 12 PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS

EJERCICIO 19 (Examen Setiembre 1997)

El jefe de personal de una empresa sospecha que los empleados de más edad pierden más días de trabajo al año por enfermedad que los trabajadores jóvenes. Decide probar esta hipótesis y elige al azar los registros de 10 empleados de 40 años o más y de 10 empleados de menos de 40 años. Se sabe que ambas poblaciones tienen una distribución normal con la misma varianza. Los resultados son:

40 años o más 37 19 21 35 16 4 0 12 63 25 Menos de 40 años 24 42 18 15 0 9 10 20 22 13 Sean:

μ1 = ‘promedio anual de días perdidos por enfermedad de trabajadores de 40 años o

más’.

μ2 = ‘promedio anual de días perdidos por enfermedad de trabajadores de menos de

40 años’. Se pide:

1. Establecer la hipótesis nula y la alternativa para este problema, sabiendo que el peor error es afirmar que los empleados de 40 años o más pierden más días de trabajo por enfermedad que los empleados menores de 40 años cuando en realidad no es cierto.

2. Proponer un estadístico apropiado para la prueba.

3. Entre la curva normal y la distribución t, ¿cuál es la distribución en el muestreo adecuada? Fundamente su respuesta.

4. Establecer la regla de decisión con un nivel de significación del 5%. 5. ¿Cuál debe ser la conclusión del jefe de personal?

6. Obtener el valor-p de esta prueba y explicar su significado. EJERCICIO 20

Una empresa que se dedica a comercializar válvulas realiza sus ventas en lotes de 10.000 unidades. Los compradores consideran aceptables lotes que no contengan más de un 10% de defectuosas.

Como norma, cada venta se realiza luego de analizar los lotes a través del porcentaje de defectuosas existentes en una muestra de tamaño n.

Solamente en el 2.5% de los casos la empresa está dispuesta a no vender lotes aceptables para los compradores. Al mismo tiempo se tratará de minimizar la probabilidad de que el lote se venda cuando el porcentaje de válvulas defectuosas supere el 10%.

Se pide:

1. Definir el riesgo del comprador y el del vendedor.

2. Plantear una prueba de hipótesis adecuada para decidir si la empresa vende el lote.

3. Encontrar una región crítica óptima para dicha prueba en base a una muestra de 600 válvulas con reposición.

(23)

PRÁCTICA 12 PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS

EJERCICIO 20 (continuación)

4. Si un lote contiene el 13% de válvulas defectuosas, ¿cuál sería el riesgo que correría un determinado comprador? (n = 600).

5. Calcular cuál debiera ser el tamaño de la muestra para que la potencia de la prueba sea k = 0,95 para el mismo nivel de significación.

EJERCICIO 21

Una empresa desea lanzar un nuevo producto al mercado pero no está segura qué canal de distribución utilizar: almacenes mayoristas o minoristas. La empresa optará por los minoristas si más de la mitad de los consumidores potenciales (600.000 personas) conocen la marca del producto.

Se pide:

1. ¿Qué método estadístico sugeriría utilizar? Fundamente su respuesta.

2. ¿Qué información necesitaría suministrarle la empresa para que Ud. pueda trabajar?

3. Plantear la hipótesis nula y la hipótesis alternativa y la forma de la región crítica.

4. Si α = 0.05 n = 600 X600=300/600. ¿Qué canal de distribución utilizaría la empresa?

5. Identifique el peor error que se puede cometer y su probabilidad máxima. 6. Calcular la función de potencia para p = 0.7 e interpretar el resultado

obtenido. EJERCICIO 22

Una empresa comercial recibe del fabricante lotes de 10.000 artículos iguales que deben respetar determinadas normas:

a) Cada artículo del lote se clasifica como bueno o defectuoso según cumpla o no con las normas preestablecidas.

b) Un lote es aceptable si tiene un porcentaje de artículos defectuosos que no supera el 10%.

Para decidir acerca de la compra de un lote, el comprador elige una muestra (MAS c/r) de 600 artículos del lote y cuenta el número de defectuosos. Si al seleccionar la muestra encuentra 66 artículos defectuosos.

(24)

PRÁCTICA 12 PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS

EJERCICIO 23 (Novales 10.14)

Halle el contraste de razón de verosimilitudes para el contraste de la hipótesis nula: H0) μ = μ0, frente a la alternativa compuesta H1) μ ≠ μ0 en una población N

(

μ,σ2

)

,

con desconocida. Pruebe que este contraste coincide con el contraste habitual basado en el estadístico de la t de Student.

2 σ

EJERCICIO 24 (Novales 10.15)

Halle el contraste de razón de verosimilitudes para el contraste de la hipótesis nula: H0) 20, frente a la alternativa compuesta H

2 =σ

σ 1) en una población, con μ

asimismo desconocida. Pruebe que este contraste coincide con el contraste habitual basado en el estadístico de la chi-cuadrado.

2 0 2 ≠σ σ

EJERCICIO 25 (Examen 7/10/96)

Las diferentes partes de este ejercicio son independientes entre sí. PARTE I

Es común que los vendedores cometan errores en las facturas, por ejemplo al escribir los precios de los productos, las cantidades vendidas y en las sumas. En una empresa se tiene la política de sancionar a un vendedor si este produce más del 10 % de facturas con errores, porque pasado este límite se considera que el vendedor trabaja "mal".

Una muestra aleatoria simple con reposici6n de 1000 facturas del vendedor Juan contiene 150 facturas con errores y su supervisor decidió sancionarlo.

Plantear:

1. La hipótesis nula y la hipótesis alternativa considerando que el "peor error" que se puede cometer es decidir que el vendedor trabaja "mal" cuando en realidad trabaja “bien”.

2. Plantear el estadístico a utilizar y su distribución en el muestreo. 3. Hallar la región crítica si se utiliza un nivel de significación del 1%. 4. ¿La decisión del supervisor es consistente con el resultado de la muestra? 5. Si en realidad el vendedor confecciona el 12 % de las facturas con error,

(25)

PRÁCTICA 12 PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS

EJERCICIO 25 (continuación) PARTE II

Se desea estimar el consumo medio mensual de cerveza por persona en la población montevideana. Para ello se tomó una muestra de tamaño 1000 personas (MAS c/r) en 1985 y se obtuvo el siguiente intervalo de confianza al 95%:

(1.58; 1.82) litros por persona por mes. Se pide:

1. Probar la hipótesis nula de que el consumo promedio mensual per capita de cerveza en la población de Montevideo es 1.8 litros contra la hipótesis de que es diferente de 1.8 en 1995. Utilice un nivel de significación de 2%.

2. Probar la hipótesis nula de que el consumo promedio mensual per capita de cerveza en la población de Montevideo es 1.8 litros contra la hipótesis alternativa de que es menor que 1.8 en 1995 para un nivel de significación del 10%.

3. En su opinión, ¿a qué se debe que ambas pruebas conduzcan a decisiones diferentes?

EJERCICIO 26 (Segunda Revisión 2000)

En una institución de salud la Dirección Técnica controla periódicamente la cantidad de medicamentos que se consumen en la consulta en policlínicas. Se considera razonable un consumo promedio de 1,5 medicamentos por consulta. Si en un período el promedio excede de 1,5 entonces los médicos que más recetaron son sancionados con suspensión.

En cada período la Dirección Técnica selecciona al azar por MAS C/R 400 pacientes que consultaron en Policlínicas y analiza el número de medicamentos que les fueron recetados en la última consulta.

La Dirección Técnica adopta la siguiente regla de decisión: si el promedio de medicamentos por consulta en la muestra es mayor que 1,6 entonces se asumirá que en la población de pacientes de Policlínicas el promedio supera 1,5 y se procederá a sancionar con suspensión a los médicos más recetadores. Para la Dirección Técnica el peor error consiste en sancionar a los médicos cuando en realidad no debería hacerlo.

(26)

PRÁCTICA 12 PRUEBA DE HIPÓTESIS DE SIGNIFICACIÓN DE PARÁMETROS

EJERCICIO 26 (continuación)

4. Modificar la regla de decisión (con el mismo tamaño de muestra) para que la probabilidad de error de tipo I no supere 2,5%.

5. Con esta prueba, ¿es posible realizar afirmaciones acerca de una posible reducción en el consumo promedio de medicamentos por consulta? Fundamentar la respuesta.

EJERCICIO 27 (Segunda Revisión 2001)

Una prueba de matemática de múltiple opción consta de 10 preguntas, con tres opciones de respuesta cada una, una sola correcta. Por cada respuesta correcta se obtienen 4 puntos y por cada respuesta equivocada –2. Es obligatorio responder las 10 preguntas. El puntaje mínimo para aprobar la prueba es 16 puntos.

Sean: X = ’puntaje de la prueba’ e Y = ‘número de respuestas correctas’.

1. Hallar la relación entre X e Y. Hallar el mínimo del Rec(X) e interpretar su significado.

2. Plantear una prueba de hipótesis para el parámetro p = ‘probabilidad de contestar bien’, sabiendo que el peor error es que el estudiante aprueba la prueba cuando en realidad está adivinando. Se tiene que indicar: H0), H1), la región crítica y el nivel de

significación.

3. Plantear, sin calcular, la función de potencia de la prueba en función del parámetro definido en el punto 2.

4. Un alumno estudioso tiene probabilidad constante e igual a 0.7 de responder correctamente a cada pregunta. Calcular la probabilidad de que un alumno estudioso apruebe la prueba (aproximar con 3 decimales).

5. Si 300 alumnos rinden la prueba y todos ellos son ‘estudiosos’ y no pueden copiarse, ¿cuál es el número esperado de alumnos que aprobarán la prueba? Fundamente la respuesta.

(27)

PRÁCTICA 13: PRUEBA DE HIPÓTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA

PRÁCTICA 13: PRUEBA DE HIPOTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA

EJERCICIO 1 (Canavos 10.2)

El número de nacimientos observados por mes en un hospital fue:

Ene Feb Mar Abr May Jun Jul Ago Set Oct Nov Dic 95 105 95 105 90 95 105 110 105 100 95 100 Si α = 0.01, ¿existe alguna razón para creer que el número de nacimientos no se encuentra distribuido en forma uniforme durante todos los meses del año? ¿Cuál es el valor-p?

EJERCICIO 2 (Segunda revisión de 1998)

La información que a continuación se presenta es una tabulación del número de goles por partido (en los noventa minutos de juego) que se registraron en el mundial de fútbol de Francia ' 98. CANTIDAD DE GOLES NUMERO DE PARTIDOS 0 5 1 10 2 13 3 19 4 11 5 5 6 0 7 1 Total 64

1. Con un nivel de significación del 5%. ¿el número de goles por partido podría distribuirse Poisson con parámetro λ? (El parámetro λ se determinará apropiadamente).

2. El valor-p de la prueba ¿es menor o mayor que 0.10? Fundamente su respuesta.

EJERCICIO 3

Someter a prueba la hipótesis de que los puntajes de una prueba se distribuyen aproximadamente normal, con un nivel de significación del 1% a partir de los datos

(28)

PRÁCTICA 13: PRUEBA DE HIPÓTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA

EJERCICIO 4 (Canavos 10.6)

Durante un período de 30 años se llevó a cabo un estudio médico para determinar, entre otras cosas, si los hábitos de fumador pueden influenciar en el desarrollo de la enfermedad cardíaca. Durante este período, 160 hombres desarrollaron alguna enfermedad cardíaca. Estos hombres fueron clasificados como fumadores agudos (más de dos cajas de cigarros al día), fumadores moderados (una a dos cajas al día), fumadores ocasionales (menos de una caja al día) o no fumadores. El número de hombres en cada categoría que desarrolló alguna enfermedad cardíaca es el siguiente:

Fumador agudo Fumador Moderado Fumador Ocasional No fumador Total 58 54 36 12 160

a) Si se supone que al comienzo del estudio había una cantidad igual de hombres en cada una de las cuatro categorías, ¿existe alguna razón a un nivel de α = 0.01 para creer que las proporciones en estas categorías no son las mismas?

b) ¿Cómo se podría prevenir al investigador médico del uso de la prueba de bondad de ajuste chi-cuadrado en esta situación?

EJERCICIO 5 (Examen Febrero 1999)

Un odontólogo atiende sus pacientes de lunes a viernes en jornadas de 6 horas. El odontólogo se queja, últimamente, de un creciente cansancio, debido a que los jueves y viernes atiende más pacientes que de lunes a miércoles. La probabilidad de que un paciente que asiste al dentista durante cierta semana, lo haga en cada uno de los días es la siguiente:

Día de la semana Día Nº Probabilidad Lunes 1 0.16 Martes 2 0.16 Miércoles 3 0.16

Jueves 4 0.26 Viernes 5 0.26

Por consejo de un estadístico, el odontólogo anuncia a sus pacientes que a partir del mes siguiente aumentará el horario de atención a 7 horas de lunes a miércoles, y lo reducirá a 5 horas los jueves y viernes. Transcurridos dos meses de los cambios, se selecciona una semana al azar y se obtienen los siguientes resultados:

Día de la semana Día Nº Pacientes atendidos

Lunes 1 10

Martes 2 9

Miércoles 3 11

Jueves 4 14

(29)

PRÁCTICA 13: PRUEBA DE HIPÓTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA

EJERCICIO 5 (continuación)

Se pide:

1. Plantear las hipótesis nula y alternativa de los dos problemas siguientes: 1.1. Se desea saber si la distribución nueva de pacientes es uniforme

(discreta).

1.2. Se desea saber si la distribución nueva de pacientes no cambió.

2. Indicar en el caso de la prueba 1.2 el estadístico de la prueba y su distribución aproximada en el muestreo bajo H0.

3. Decidir en la prueba 1.2 para un nivel de significación del 5%. Trabajar con 3 dígitos.

4. Indicar qué significa el concepto de Error Tipo II de la prueba de hipótesis desarrollada.

EJERCICIO 6 (Segunda Revisión 1996)

El gerente de producción de una empresa asegura que la demanda total semanal del producto X se distribuye aleatoriamente con función de densidad:

[

)

[ ]

⎪ ⎪ ⎪ ⎩ ⎪ ⎪ ⎪ ⎨ ⎧ ∈ − + − ∈ = caso otro en 0 2 1 si 6 10 2 7 1 0 si 2 2 2 , x x x , x x ) x ( fX

donde X se mide en Kg. de producto.

Para verificar la afirmación del Gerente de Producción, se tomó una MAS c/r de la demanda en 400 semanas con el siguiente resultado:

Demanda Número de semanas 0.0 – 0.5 9 0.5 – 1.0 61 1.0 – 1.5 195 1.5 – 2.0 135

(30)

PRÁCTICA 13: PRUEBA DE HIPÓTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA

EJERCICIO 7 (Canavos 10.14)

Se toma una muestra aleatoria de 25 hombres casados y se les pregunta la edad que tenían cuando se casaron. Se obtienen los siguientes datos: 24, 19, 20, 22, 50, 23, 23, 21, 25, 27, 45, 27, 26, 26, 35, 29, 28, 30, 31, 32, 31, 33, 34, 38, 41. Úsese la estadística de Kolmogorov-Smirnov para probar la hipótesis nula de que la distribución de las edades de los hombres cuando contrajeron sus primeras nupcias es una distribución gama con θ = 2 y α = 16. Úsese α = 0.05. (Sugerencia: para calcular las probabilidades gama, véase una tabla de la función gama incompleta determinada por 5.55).

EJERCICIO 8

Se desea investigar si existe asociación o independencia entre ciertas categorías de la PEA y la edad de dicha población. A esos efectos se eligió una muestra aleatoria de 1000 personas activas obteniéndose los siguientes resultados:

EDAD

CATEGORÍA DE LA PEA Menos de 25 Entre 25 - 60 Más de 60

Ocupados en industria manufacturera 50 220 40

Ocupados en el comercio 60 150 20

Ocupados en los servicios 50 250 30

Desocupados 40 80 10

Someter a prueba la hipótesis de independencia entre la edad y la categoría de la PEA para un nivel de significación α = 3%.

EJERCICIO 9 (Segunda Revisión 1997)

Se efectuó una encuesta entre 483 amas de casa que compran habitualmente yogur para determinar si existe alguna relación entre la marca que compran más frecuentemente y la característica principal que debe tener un "buen yogur". Las marcas de yogur que existen en el mercado son: A, B, C, D y E. Las características de un "buen yogur" son: buen sabor, nutritivo, barato, sin aditivos y calidad.

Se quiere saber si existe dependencia entre la marca de yogur comprada más frecuentemente y la característica principal que debe tener un "buen yogur".

Con la información obtenida en la encuesta se elaboraron los siguientes cuadros de valores observados y esperados.

(31)

PRÁCTICA 13: PRUEBA DE HIPÓTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA

EJERCICIO 9 (continuación)

Cuadro de valores observados Característica

principal Sabor Nutritivo Barato

Sin

aditivos Calidad Total

Marca A 30 30 20 15 28 123 Marca B 28 28 18 16 26 116 Marca C 15 10 15 23 9 72 Marca D 14 13 16 27 18 88 Marca E 16 12 25 24 7 84 Total 103 93 94 105 88 483

Cuadro de valores esperados

Característica

principal Sabor Nutritivo Barato

Sin aditivos Calidad Marca A α β γ 26.7 22.4 Marca B 24.7 22.3 22.6 25.2 21.1 Marca C 15.4 13.9 14 15.7 13.1 Marca D 18.8 16.9 17.1 19.1 16 Marca E 17.9 16.2 16.3 18.3 15.3 Se pide:

1. Determinar los valores de α, β y γ de la tabla de valores esperados. (Aproximar con un decimal).

2. Plantear las hipótesis nula y alternativa para esta prueba.

3. Sabiendo que el valor del estadístico Chi-cuadrado en la muestra es 40.45, ¿qué decisión adoptaría para un nivel de significación del 5%?

4. El valor-p ¿será mayor, igual o menor que el 5%? Fundamente la respuesta.

(32)

PRÁCTICA 13: PRUEBA DE HIPÓTESIS DE BONDAD DE AJUSTE E INDEPENDENCIA

EJERCICIO 10

Para estudiar la posible asociación o independencia entre la condición de fumador y el fallecimiento por cáncer pulmonar, se seleccionó una muestra de 10.000 personas fallecidas en el último año y se encontraron los siguientes resultados.

CONDICIÓN DE FUMADOR CAUSA DEL FALLECIMIENTO SI NO TOTAL Cáncer de pulmón 200 200 400 Otras causas 800 8.800 9.600 TOTAL 1.000 9.000 10.000

1. Probar si existe independencia entre los atributos condición de fumador y causa de fallecimiento, para un nivel de significación del 1%. ¿Y al 5%? 2. Estimar, a partir de los resultados de la muestra, las probabilidades de morir

de cáncer de pulmón condicionadas por la condición de fumador.

EJERCICIO 11 (Canavos 10.22)

Se llevó a cabo una encuesta con respecto a la preferencia del consumidor para determinar si existía alguna predilección para tres marcas competitivas (A, B y C) dependiendo de la región geográfica en la que habita el consumidor. Con base en una muestra aleatoria de consumidores, se obtuvo la siguiente información para tres distintas regiones.

Región 1 Región 2 Región 3

Marca A 40 52 25

Marca B 52 70 35

Marca C 68 78 60

Con base en esta información, ¿la preferencia por una determinada marca depende de la región geográfica a un nivel α = 0.05?

(33)

PRÁCTICA 14: MUESTREO DE POBLACIONES FINITAS

PRÁCTICA 14: MUESTREO DE POBLACIONES FINITAS

EJERCICIO 1

Sea Ω = {w1, w2, w3, w4, w5, w6, w7, w8}. Se elige una MAS S/R de tamaño 3.

Se pide:

1. ¿Cuántas muestras diferentes pueden formarse? 2. ¿Cuál es la probabilidad de una muestra cualquiera?

3. ¿Cuál es la probabilidad de que w8 pertenezca a la muestra?

4. ¿Cuál es la probabilidad de que w7 y w8 pertenezcan a la muestra?

5. Sea X la edad de cada individuo de la población: X(wi) = i ∀ i.

5.1. ¿Cuál es la media de las edades en la población?

5.2. ¿Cuál es la cuasi-varianza de las edades en la población? 6. Se eligió una muestra y resultó (w3, w5, w7).

6.1. ¿Cuál es un estimador insesgado de la media poblacional a partir de dicha muestra? Calcular la estimación.

6.2. ¿Cuál es un estimador insesgado de la cuasi-varianza poblacional a partir de dicha muestra? Calcular la correspondiente estimación.

7. Supongamos ahora otra variable Y tal que:

Y(w1) = 10; Y(w2) = Y(w3) = 11; Y(w4) = 14; Y(w5) = Y(w6) = Y(w7) = 20;

Y(w8) = 25

7.1. Calcular media y cuasi-varianza poblacionales. 7.2. Calcular P( |Y - μ | < ε) con ε = 1, ε = 3, ε = 5. EJERCICIO 2

Considere una población Ω = {w1, w2, w3}.

Sean s1 = {w1, w2}, s2 = {w1, w3}, s3 = {w2, w3}, s4 = {w1, w2, w3} las muestras

posibles con probabilidades p1 = 0.4, p2 = 0.3, p3 = 0.2, p4 = 0.1.

Se pide:

1. Calcular la probabilidad de que el elemento wi salga en la muestra seleccionada ∀

wi ∈ Ω.

2. Calcular la probabilidad de que el par (wi , wj) con i ≠ j salga seleccionado en la

muestra ∀ (wi , wj) ∈ Ω.

(34)

PRÁCTICA 14: MUESTREO DE POBLACIONES FINITAS

EJERCICIO 3 (continuación) Se pide:

1. Estimar el gasto promedio diario de los 10.000 turistas.

2. Sabiendo que la estadía de todos los turistas en "Las Cañas" es de 3 días, estimar el gasto total de los turistas en dicho balneario.

3. Hallar un intervalo de confianza al 95% para el gasto promedio diario de los turistas.

4. Hallar un intervalo de confianza al 90% para el gasto total de los turistas. 5. Utilizando los datos de la muestra para estimar la cuasi-varianza

poblacional, ¿cuál debió ser el tamaño de la muestra (MAS S/R) para estimar el gasto promedio diario de los turistas con una precisión de $20 y una seguridad del 95%?

EJERCICIO 4

Para estimar la proporción de hogares unipersonales en una ciudad de 20.000 hogares, se seleccionará una MAS S/R. Sabiendo que en el último Censo dicha proporción era del 11%, y que de ninguna manera puede superar el 15%, determinar el tamaño de la muestra para tener una precisión del 1% y una seguridad del 99%.

EJERCICIO 5

A los efectos de estimar el ingreso medio de los hogares de una región, se decide seleccionar una MAS S/R de una población de 500.000 hogares.

Se pide:

1. Determinar el tamaño de la muestra necesario para una precisión de 50 unidades monetarias y una confianza del 95% (se supone que la varianza del ingreso de los hogares es de aproximadamente 1.0002).

2. Realizada la encuesta con el tamaño antes calculado, se obtuvo la siguiente distribución de la muestra:

Ingreso Frecuencia relativa 100 - 200 0.3

200 - 500 0.4 500 - 1000 0.2 1000 - 2000 0.1

2.1. Estimar el ingreso medio por hogar y el ingreso total de la región. 2.2. Construir intervalos de confianza para dichos parámetros al 95%.

(35)

PRÁCTICA 14: MUESTREO DE POBLACIONES FINITAS EJERCICIO 6

Se desea estimar el ingreso medio de los hogares de una ciudad que tiene 4 barrios a partir de una muestra de 1000 hogares. Se dispone además de la siguiente información:

Estrato Nº de hogares Varianza de los ingresos (de encuestas anteriores)

1 10.000 2.500

2 20.000 900

3 30.000 225

4 40.000 100

Se pide:

1. Asignar la muestra por estratos por MAEP y MAEO.

2. Calcular V en ambos casos y comparar la eficiencia relativa de ambos métodos. ⎟ ⎠ ⎞ ⎜ ⎝ ⎛∧ MAE Y t EJERCICIO 7

Se considera una población de 12:500.000 personas activas. Se desea estimar la proporción de desocupados. La población se clasifica en dos estratos: N1 = 9:000.000

y N2 = 3:500.000 se utilizará MAE para seleccionar una muestra de 12.500 personas

activas. Se pide:

1. Determinar el tamaño de muestra en cada estrato, usando asignación proporcional.

2. Al realizar la encuesta se encontraron las siguientes tasas de desempleo en la muestra: d1 = 5% y d2 = 6%.

3. Estimar el porcentaje de desocupados en la población.

4. Estimar el total de desocupados en cada estrato y en la población. 5. Estimar la varianza del estimador de la proporción de desocupados.

6. Hallar un intervalo de confianza al 95% para el total de desocupados en la población.

(36)

PRÁCTICA 14: MUESTREO DE POBLACIONES FINITAS

EJERCICIO 8

A fin de estimar la media μ de una cierta variable X, se decide muestrear una población de N = 10.000 elementos, y tomar la media muestral obtenida como estimador de μ . Para ello, se dispone de dos diseños:

DISEÑO 1: MAS S/R de n = 200 elementos.

DISEÑO 2: MAE de n = 200 elementos, con las siguientes características: Se divide la población en dos estratos.

El estrato 1 tiene N1 = 5.000 elementos, y el estrato 2 tiene N2 = 5.000 elementos.

La muestra se distribuye así: n1 = 150 elementos en el estrato 1 y n2 = 50 elementos

en el estrato 2. Se sabe que, siendo la varianza poblacional del estrato 1, la del estrato 2 y la varianza total de la población, se cumple la siguiente relación:

2 1 σ 2 2 σ 2 σ 2 2 2 2 1 4σ 0.9σ σ = = Se pide:

1. Estimar la varianza de la media muestral en ambos diseños y concluir cuál de ellos es más eficiente. (Se supone que los costos no juegan).

2. Calcular la eficiencia relativa estimada del estimador de la media mediante el MAE con respecto al MAS en este caso.

EJERCICIO 9 (Segunda Revisión 1995)

Una población de N = 1000 individuos se dividió en dos estratos de tamaño N1 = 200

y N2 = 800.

Se pide:

1. Mostrar que si las cuasi-varianzas poblacionales de dichos estratos están en la relación, 1 2

3 8 σ

σ′ = ′ , entonces, para una muestra total de tamaño n se verifica que: el tamaño de la muestra del estrato 1 (n1) por asignación

óptima resulta el doble del n1 que se obtendría mediante la asignación

proporcional. Calcular ambos ni en función de n y verificar la proposición

(37)

PRÁCTICA 14: MUESTREO DE POBLACIONES FINITAS

EJERCICIO 10 (Examen Febrero 1992)

Una población de 300.000 animales está a punto de entrar en epidemia de una cierta enfermedad. Experiencias realizadas con anterioridad muestran que:

Sobre una muestra (MAS s/r) de 1.000 animales no vacunados en ocasión de la epidemia anterior, murieron 250 y,

Sobre una muestra (MAS s/r) de 400 animales vacunados murieron sólo 40. Se pide:

1. Construir un intervalo de confianza al 95% para el número de animales que se espera que mueran:

1.1. Si no hay vacunación.

1.2. Si se vacuna a toda la población.

2. Plantear la forma del intervalo aleatorio utilizado para construir los intervalos de confianza del punto anterior.

3. El costo de cada animal muerto es de $ 1.000 y el costo de cada vacuna es de $ 100. Hallar el casto total esperado en caso de epidemia:

3.1. Si no hay vacunación.

3.2. Si se vacuna a toda la población.

4. Un estudio profundo por parte del Organismo de Control Sanitario ha mostrado la existencia de dos zonas de riesgo en caso de epidemia:

Zona de alto riesgo:

Población: 100.000 animales

Una muestra (MAS s/r) de 500 animales vacunados en la última epidemia estimó la probabilidad de muerte en 0.20.

Zona de menor riesgo: Población: 200.000 animales

Una muestra (MAS s/r) de 500 animales no vacunados en la última epidemia estimó la probabilidad de muerte en 0.15.

Si se sigue la estrategia de vacunar sólo a la población de animales de la zona de alto riesgo:

4.1. Estimar el número esperado de animales que habrán de morir en caso de epidemia (con la nueva estrategia).

4.2. Hallar el costo esperado de esta estrategia. ¿Es más conveniente que las anteriores?

(38)

PRÁCTICA 15: MODELO DE REGRESIÓN SIMPLE

PRÁCTICA 15: MODELO DE REGRESIÓN SIMPLE

EJERCICIO 1

A continuación se realizan una serie de afirmaciones sobre modelos lineales; discutir la validez de las mismas.

1. Las relaciones entre variables explicativas de un modelo pueden ser siempre linealizadas y por lo tanto aplicar las técnicas de modelos lineales.

2. Los supuestos clásicos en los que se basa la estimación de modelos lineales son únicamente una primera aproximación al tema, pues son simplificadores de la realidad.

3. El diagrama de dispersión es una herramienta muy útil para ver qué clase de relación mantienen dos variables.

4. Dado el modelo lineal simple: Yi01Xii: 4.1. Los llamados supuestos clásicos son:

E(ε )i =0 2 2 =σ ε ) ( E i j i ) , ( COV εi εj =0 ∀ ≠ i

X son valores fijos

4.2. Bajo los supuestos clásicos, los estimadores mínimo cuadráticos de β0 y β1 coinciden con los estimadores máximo verosímiles.

5. En el modelo lineal simple y bajo los supuestos clásicos, y son los parámetros del modelo, y:

0 β β1

= = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = β n i ___ i n i ___ i ___ i ^ X X X X Y Y 1 2 1 1 y ___ ^ ___ ^ X Y 1 0 = −β β

son los estimadores que se obtienen por el método de los mínimos cuadrados. 5.1. Los estimadores mínimo cuadráticos son insesgados.

5.2. Los estimadores mínimo cuadráticos son los que tienen menor varianza. 6. Como el modelo de regresión visto en el curso es solamente aplicable a relaciones lineales:

6.1. El modelo Yi01Xii no es estimable por mínimos cuadrados. 6.2. El modelo Yi01Xi2 +εi no es estimable por mínimos cuadrados.

6.3. El modelo Yi =

(

β +β log(Xi )

)

(1/β0)i no es estimable por mín cuadrados. 1

0

6.4. El modelo Yi β .Xiβ1.εi no es estimable por mínimos cuadrados. 0

=

6.5. El modelo Yi β .βXi.εi no es estimable por mínimos cuadrados. 1

0 =

Referencias

Documento similar

Proporcione esta nota de seguridad y las copias de la versión para pacientes junto con el documento Preguntas frecuentes sobre contraindicaciones y

[r]

Hasta en los moros de Granada habríamos de suponer conocimiento de los vaticinios del adivino céltico, si hubiéramos de tener por auténtica la «carta que el moro de Granada sabidor

Y tendiendo ellos la vista vieron cuanto en el mundo había y dieron las gracias al Criador diciendo: Repetidas gracias os damos porque nos habéis criado hombres, nos

E Clamades andaua sienpre sobre el caua- 11o de madera, y en poco tienpo fue tan lexos, que el no sabia en donde estaña; pero el tomo muy gran esfuergo en si, y pensó yendo assi

diabetes, chronic respiratory disease and cancer) targeted in the Global Action Plan on NCDs as well as other noncommunicable conditions of particular concern in the European

De hecho, este sometimiento periódico al voto, esta decisión periódica de los electores sobre la gestión ha sido uno de los componentes teóricos más interesantes de la

Las manifestaciones musicales y su organización institucional a lo largo de los siglos XVI al XVIII son aspectos poco conocidos de la cultura alicantina. Analizar el alcance y