Intervalos de confianza y contrastes de hipótesis. Intervalo de confianza de la media.

Texto completo

(1)

R PR ´ACTICA IV

Intervalos de confianza y contrastes de hip´otesis

Secci´onIV.1

Intervalo de confianza de la media.

44. Cargar (abrir) el conjunto de Datos Pulso.rda. Se pide:

a) Calcular el intervalo de confianza para el peso medio de todos los individuos con α = 0.05.

b) Calcular el intervalo de confianza para el peso medio de las mujeres con α = 0.05.

c) Estudios recientes afirman que la altura media de las mujeres de esta poblaci´on es µ = 167 cm. A la vista de estos datos, ¿podemos aceptar dicha hip´otesis?

p-valor

d) Calcular el intervalo de confianza para el Pulso1 medio de las mujeres que no fuman.

intervalo

e) Calcular el intervalo de confianza para la media del incremento del pulso (Pulso2-Pulso1) para los individuos que corrieron.

intervalo

45. Se espera que la resistencia en kg/cm2de cierto material suministrado por un proveedor se distribuya normalmente, con media 220 y desviaci´on t´ıpica 7.75. Se toma una muestra de 9 elementos y se obtiene: 203, 229, 215, 220, 223, 233, 208, 228, 209. Se pide:

a) Contrastar la hip´otesis µ = 220 y σ cualquiera. p-valor b) Contrastar la hip´otesis σ = 7.75 y µ cualquiera. p-valor

(2)

46. El pH del suelo es una variable importante cuando se dise˜nan estructuras que estar´an en contacto con el terreno. El propietario de un solar posible lugar de construcci´on afirma que el pH del suelo es 6.5. Se han tomado 9 muestras del suelo del terreno, obteni´endose los resultados que se recogen en el archivo de datos pH.txt. Suponiendo que la variable pH sigue una distribuci´on normal, responde las siguientes cuestiones: Se pide:

a) Hallar un intervalo de confianza para el pH medio con un nivel de significaci´on del 10 %.

b) ¿Se acepta como verdadera afirmaci´on del propietario del solar con un riesgo de α = 0.05 ?

Secci´onIV.2

Intervalos de confianzas y contraste para proporciones.

IV.2.1. Significado del intervalo de confianza para p

¿Es p = 0.5 la probabilidad de obtener cara al lanzar una moneda?.

Lanzamos la moneda 20 veces, y estimamos p con la proporci´on bp =pest de caras obtenidas (Simulando con R)

n=20; p = .5;pest = rbinom(1,n,p)/n

Realizamos el lanzamiento de las 20 monedas m = 50 veces n=20; p = .5;m=50;pest = rbinom(m,n,p)/n

Fijamos el nivel de confianza 1 − α = 0.90 y calculamos los intervalos

p ± zb 1−α/2

rp(1 − bb p) n

alpha = 0.10;zstar = qnorm(1-alpha/2);SE = sqrt(pest*(1-pest)/n) Representamos los m = 50 intervalos

matplot(rbind(pest - zstar*SE, pest + zstar*SE),rbind(1:m,1:m),type=l”,lty=1)”

Marcamos la l´ınea para p = 0.5.

abline(v=p)

47. Cargar (abrir) el conjunto de Datos Pulso.rda. Se pide:

a) Calcular el estimador puntual de la proporci´on p de individuos que fuman.

b) Calcular el intervalo de confianza para la proporci´on pF de individuos que fuman con α = 0.05.

c) Calcular el intervalo de confianza para la proporci´on pF |M de mujeres fumadoras con α = 0.05.

(3)

CAP´ITULO IV. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIP ´OTESIS

Figura IV.1: 50 intervalos de confianza dellanzamiento de 20 monedas

d) Calcular el intervalo de confianza para la proporci´on pp2>100|C de individuos con el Pulso2 superando las 100 pulsaciones de entre los que corrieron, con α = 0.05.

intervalo

e) Calcular el intervalo de confianza para la proporci´on p de individuos con altura superior a 180 y peso superior a 85 kg con α = 0.05.

(4)

intervalo

48. Calcular un intervalo de confianza para la proporci´on de piezas conformes p producidas en una f´abrica, usando un nivel de confianza de 0,95. Supongamos que disponemos de una muestra en la que se han observado 79 piezas conformes de un total de 80 piezas analizadas. En primer lugar, vemos que x = 79, n = 80 y α = 0.05.

(Comprobar que la soluci´on aportada por R, coincide con la f´ormula (7.7) p. 316 del libro de texto de A.Luce˜no- Fco J.Glez Ortiz)

49. Cierta medicina, en tabletas, ha sido comprobada eficaz en el alivio de una alergia en mas del 60 % de los pacientes. El fabricante ha desarrollado una version soluble del producto y desear comprobar si la medicina en esta forma es igual de eficaz. Se toma una muestra de 40 personas que tienen la alergia, el nuevo producto alivio a 32 de ellos. Hay suficiente evidencia para sugerir que la introducci´on de la version soluble ha alterado la eficacia de la medicina? Realiza el contraste relevante usando α = 0.01 ? Encuentra el nivel critico (p-valor).

Secci´onIV.3

Intervalo de confianza y contrastes para la diferencia de dos medias o dos proporciones.

50. Una empresa tiene en su poder dos dispositivos para mejorar la eficiencia de los sistemas de cale- facci´on en los hogares; uno de ellos funciona con energ´ıa el´ectrica (sistema 1) y el otro con energ´ıa t´ermica (sistema 2). Se quiere estudiar si ambos dispositivos son igualmente efectivos, para lo cual se compara el consumo de energ´ıa en 90 hogares que tienen uno u otro sistema; los datos del estudio se recogen en el archivo energ´ıa.rda. Suponiendo que se ha llevado a cabo un test de igualdad de varianzas en el cual no se han encontrado evidencias que hagan pensar que dichas varianzas son distintas y para un nivel de confianza del 95 %, responde a las siguientes cuestiones:

a) Intervalo de confianza para la diferencia de medias.

b) Valor del estad´ıstico t de contraste.

c) Valor del p-valor.

d) Contrastar la igualdad de la variabilidad (varianzas) de ambos sistemas.

51. Supongamos que en 8 f´abricas similares se ha medido el n´umero de horas×trabajador que se ha perdido durante un a˜no. Posteriormente se ha implantado un programa de seguridad en todas estas f´abricas y se ha vuelto a medir en cada una de ellas el n´umero de horas×trabajador perdidas durante otro a˜no. A partir de estos datos puede obtenerse un intervalo de confianza al nivel de confianza 0,95 para la diferencia entre el n´umero medio de horas perdidas antes y despu´es de implantar el programa de seguridad.

(5)

CAP´ITULO IV. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIP ´OTESIS

umero de horas×trabajador f´abrica antes despu´es

1 88.80 76.29

2 67.71 51.74

3 80.67 60.65

4 84.79 72.08

5 81.58 66.60

6 72.21 53.71

7 89.50 75.61

8 82.18 67.13

intervalo p-valor

52. Cargar (abrir) el conjunto de Datos Pulso.rda. Se pide:

a) Determinar si hay diferencia significativa entre la proporci´on de hombres y mujeres que fuman con un nivel de significaci´on α = 0.05. p-valor

b) Calcular un intervalo de confianza para la diferencia de medias del pulso1 y del pulso2 para la poblaci´on de los que corrieron.

c) Calcular un intervalo de confianza para la diferencia de medias del pulso1 entre hombres que fuman y no fuman.

d) Contrastar si hay diferencia significativa en el incremento del pulso (increpulso) para hombres y mujeres que se sometieron a la prueba de correr.

p-valor

53. La cantidad de defectos de un lote de n1= 100 unidades del proveedor A es 8, mientras que en un lote de n2= 150 unidades de B la cantidad de defectos es 15. Estudiar si hay evidencia suficiente de diferencias entre los proveedores al nivel 0.95.

intervalo p-valor

(6)

Secci´onIV.4

Contraste de varianzas.

54. Se han hecho cuatro determinaciones qu´ımicas en dos laboratorios A y B con los resultados A : 26, 24, 28, 27; B : 20, 34, 23, 22. Se pide:

a) Comparar las varianzas de las dos muestras con nivel de significaci´on 5 %, y determinar el p-valor.

55. El fichero parqueeolico.dat, contiene datos de la velocidad del viento, registrados durante 730 horas de forma simult´anea, en dos localizaciones alternativas (Parque1 y Parque2). Se tratar´a de establecer la localizaci´on m´as aconsejable para la instalaci´on de un parque de producci´on de energ´ıa e´olica.

a) Importar el fichero de datos a R teniendo en cuenta que el car´acter decimal del fichero es una coma.

b) La estructura de losdatos es de dos columnas. Resulta m´as manejable si es transformada en dos variables, una continua que contenga las mediciones de viento y otra factor que indique la localizaci´on. Esto se realiza desde el men´u

Datos -> Conjunto de datos activo-> Apilar variablesdel conjunto de datos activo ... En la ventana de di´alogo se pide el nombre de la nueva base de datos que llamaremos eolico2, el nombre de la variable apilada, velocidad, y el nombre de la nueva variable factor, parque, cuyas clases se han denominado Parque1 y Parque2.

c) Compara gr´aficamente la velocidad de los 2 parques.

d) Contrastar la igualdad de la variabilidad (varianzas) de ambos parques.

e) Contrastar la igualdad de la velocidad media del viento en ambos parques.

Soluciones

44. a) 63.67-68.13 b) 54.12-58.29 c) p-valor = 0.4273 d ) 70.36-78.83 e) 13.74-24.08 45. a) p-valor =0.5265 b) p-valor =0.06416552

46. a) 6.114-6.663 b) p-valor = 0.4732

47. a) 0.304 b) 0.2197-0.405 c) 0.1206-0.3902 d ) 0.186-0.480 e) 0.017-0.1065 48. (0.9325373 − 0.9977900

50. a) -1.450; 0.9796 b) t = -0.3848 c) p-valor = 0.7013 d ) p-valor = 0.5578

52. a) p-valor = 0.3152 b) 11.42-26.407 c) -2.645663 ; 8.770663 d) p-valor = 0.0003391 53. confidence interval: (−0.0916; 0.0516) p-valor = 0.592

Figure

Actualización...

Referencias

Actualización...

Related subjects :