Intervalos de Confianza

Texto completo

(1)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

1 1.- Se quiere estudiar la vida útil de unas nuevas pilas que se van a lanzar al mercado.

Para ello se examina la duración de 40 de ellas, resultando una media de 63 horas.

Suponiendo que el tiempo de vida de las pilas sigue una distribución normal, y que la varianza se puede tomar la misma que las fabricadas anteriormente que era 38,44, se pide:

a) Intervalo de confianza del 95% de la duración media de las nuevas pilas.

b) Intervalo de confianza del 99% de la duración media de las nuevas pilas.

c) Tamaño de la muestra necesario para que con una confianza del 95%, la duración media estimada no difiera de la real en más de una hora.

2.- Durante 15 días se estudió el número de alumnos que pasaban por el almacén de la Escuela, obteniéndose los siguientes resultados:

70, 78, 71, 62, 78, 67, 64, 76, 73, 65, 58, 72, 74, 67, 75

Suponiendo Normalidad de la distribución, calcular: Intervalo de confianza del 95%

del número medio de usuarios del almacén.

3.- Para estudiar el número de pulsaciones por minuto de personas entre 20 y 30 años, se eligen 400 al azar, obteniéndose una media de 75 por minuto y una desviación típica de 9. Calcular:

a) Intervalo de confianza del 95% del número medio de pulsaciones por minuto en dicha población.

b) Tamaño de la muestra necesario para obtener el intervalo de confianza de la misma amplitud que el anterior y con nivel de confianza del 99%.

4.- Una agencia de alquiler de automóviles necesita estimar el número medio de kilómetros diarios que realizas su flota de automóviles; toma los recorridos de 100 vehículos y obtiene una media de 165 km/día y una varianza muestral de 36 km/día. Se pide:

a) Intervalo de confianza para la media al 95%

b) Intervalo de confianza para la varianza al 95%

5.- Si el coeficiente medio de inteligencia de la población universitaria de la U.P.M. es µ = 95 y σ =14, y se extrae una muestra de 49 estudiantes de esa población.

a) ¿Qué probabilidad hay de que resulte una media muestral igual o inferior a 92?

b) Hallar un Intervalo de confianza al 95% para la media de la población universitaria, para la muestra de media 92.

c) ¿Podemos aceptar la hipótesis de ser la media µ = 95?

(2)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

2 6.- Se desea estudiar el gasto semanal en euros, de los estudiantes de Madrid. Para ello se ha elegido una muestra aleatoria de 9 de estos estudiantes:

100 150 90 70 75 105 200 120 80

Se supone que la variable aleatoria sigue una distribución normal de desviación típica conocida e igual a 12. Determinar un Intervalo de confianza al 95% para la media del gasto semanal por estudiante.

7.- Se realiza una encuesta sobre el nivel de conocimientos generales de los estudiantes de bachillerato de los diferentes centros de Madrid. Para ello se ha elegido una muestra aleatoria de 9 de estos estudiantes a los que se ha realizado el examen. Las calificaciones obtenidas han sido las siguientes:

7,8 6,5 5,4 7,1 5 8,3 5,6 6,6 6,2

Se supone que la variable aleatoria sigue una distribución normal de desviación típica conocida e igual a 1. Se pide:

a) Un Intervalo de confianza al 98% para la media de las calificaciones en el examen.

b) El tamaño mínimo que debería tener la muestra en el caso de admitir un error máximo de 0,5 puntos con un nivel de confianza del 95%.

8.- Se ha tomado una muestra de tamaño 10 del tiempo T, en minutos, entre el paso de dos autobuses en una parada, con los siguientes resultados 9, 10, 6, 4, 15, 6, 1, 5, 4, 10.

Si la función de distribución del tiempo es: F(t)= −1 e−λt a) Estimar, por máxima verosimilitud el valor de λ.

b) Calcular la probabilidad estimada de esperar al autobús más de 10 minutos.

9.- Se han escogido al azar 15 probetas de un determinado acero, cuya resistencia a la compresión se supone que se distribuye normalmente, y se ha medido ésta en las unidades adecuadas, habiéndose observado los siguientes resultados:

40,15 65,10 49,5 22,4 38,2 60,4 43,4 26,35 31,2 55,6 47,25 73,2 35,9 49,25 52,4

a) Estimar la resistencia media del acero y su varianza, utilizando estimadores centrados.

b) Hallar un Intervalo de confianza del 99% para la resistencia media.

c) Hallar un Intervalo de confianza del 99% para la varianza.

10.- La altura de los individuos de una población sigue una distribución normal, de media µ y desviación típica 0,075. Si en una muestra aleatoria simple de tamaño 12 de dicha población se obtuvo una media muestral de 1,75. Se pide:

a) Determinar un Intervalo de confianza para µ con un nivel de confianza del 95%.

b) ¿Qué tamaño muestral sería necesario para que el intervalo de confianza del mismo nivel tuviese longitud menor que 0,01?

(3)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

3 11.- Supuesto que una población se compone de cinco valores: 2, 3, 6, 8, 11.

Considérense todas las muestras posibles de tamaño dos que puedan extraerse con reemplazamiento de esta población. Se pide:

a) La media y desviación típica de la población.

b) La distribución de la media muestral.

c) La media y la desviación típica de la distribución de la media muestral.

d) Calcular un Intervalo de confianza al 80% para la media de la población si se obtienen muestras de tamaño 3.

12.- Las edades en que se produce la muerte, para una muestra aleatoria de 19

individuos fallecidos por una determinada edad dan una media de 50 años. Suponiendo normal la distribución, hallar un Intervalo de confianza para la media al 99%

suponiendo conocido el valor de la varianza de la población σ2 =38.

13.- Se quieren estudiar la vida útil de unas baterías para móviles. Si admitimos que la varianza de la distribución normal de la vida de las baterías es igual a 1,44, ¿qué tamaño muestral deberíamos utilizar para que la amplitud del Intervalo de confianza para la media del 95% no sea superior al 0,4?

14.- Suponiendo que la producción de trigo por hectárea es una variable aleatoria con distribución normal, sabiendo que en 25 fincas elegidas al azar se produjeron de media 3200 kg por ha, y la desviación típica fue de 40 kg por ha, calcular:

a) Intervalo de confianza al 95% de la producción media de trigo por ha.

b) Intervalo de confianza al 95% de la varianza.

15.- Se han recogido firmas para una petición, en cada hoja caben 42 firmas, pero existen hojas que no están firmadas totalmente. Para una muestra de 50 hojas se tienen los resultados 1471 2

x y S 229

= 50 = . Se pide dar un intervalo de confianza para la media al 80%.

16.- Sea X la v. a. número de errores al realizar una nivelación. Se estudian 40 nivelaciones escogidas al azar. Los resultados son: X = 18.5 y S = 4. Se pide:

a) Intervalo de confianza del 95% para la media.

b) Intervalo de confianza para la varianza con un nivel de significación de α =0.01

17.- Se han realizado 15 mediciones de una misma magnitud, se supone que se distribuye normalmente, habiéndose observado los siguientes resultados:

40,15 40,10 40,5 40,4 40,2 40,4 40,4 40,35 40,2 40,6 40,25 40,2 40,9 40,25 40,4 a) Hallar un Intervalo de confianza del 99% para la varianza.

b) ¿Cuántas mediciones deberían haberse utilizado si se requiere una precisión en la media de ±0,1 y una confianza del 95%?

(4)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

4

(5)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

5 1.- Se quiere estudiar la vida útil de unas nuevas pilas que se van a lanzar al mercado. Para ello se examina la duración de 40 de ellas, resultando una media de 63 horas. Suponiendo que el tiempo de vida de las pilas sigue una distribución normal, y que la varianza se puede tomar la misma que las fabricadas anteriormente que era 38,44, se pide:

a) Intervalo de confianza del 95% de la duración media de las nuevas pilas.

b) Intervalo de confianza del 99% de la duración media de las nuevas pilas.

c) Tamaño de la muestra necesario para que con una confianza del 95%, la duración media estimada no difiera de la real en más de una hora.

Solución:

La duración de las pilas sigue una distribución N

(

µ, 38.44

)

El intervalo de confianza para una población normal de varianza conocida es:

1 / 2

X z

−α n

± σ a) Para nuestros datos:

X=63;σ = 38.44=6.2; n=40;α =0.05 Tenemos X

Z N(0,1)

n

= − µ ≡ σ

(

1 / 2 1 / 2

)

1 / 2

(

1 / 2

)

P −z−α < <Z z−α = − α = −1 1 0.05=0.95⇒F(z−α )=P Z<z−α =0.975

DERIVE:

#1: NSOLVE(NORMAL(z) = 0.975, z, Real)

#2: z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,95996279

O directamente

=INTERVALO.CONFIANZA(0,05;6,2;40) 1,92136343

1 / 2

X z 63 1, 92136343

−α n

± σ = ±

SPSS: IDF. NORMAL(0.975, 0,1) 1,96

0.05

6.2 6.2

I 63 1.96 , 63 1.96

40 40

α=

 

⇒ = − + =

(

61.08, 64.92

)

b) Cambia el nivel de confianza

x=63;σ = 38.44=6.2; n=40;α =0.01 Tenemos Z X N(0,1)

n

= − µ ≡ σ

(

1 / 2 1 / 2

)

1 / 2

(

1 / 2

)

P −z−α < <Z z−α = − α = −1 1 0.01=0.99⇒F(z−α )=P Z<z−α =0.995 DERIVE:

#1: NSOLVE(NORMAL(z) = 0.995, z, Real)

#2: z = 2.575829327

(6)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

6 EXCEL: =DISTR.NORM.INV(0,995;0;1) 2,5758313

O directamente

=INTERVALO.CONFIANZA(0,01;6,2;40) 2,5251031

1 / 2

X z 63 2.5251031

−α n

± σ = ±

SPSS: IDF. NORMAL(0.995, 0,1) 2,58

0.01

6.2 6.2

I 63 2.58 , 63 2.58

40 40

α=

 

⇒ = − + =

(

60.47, 65.53

)

c)

Para que la duración estimada no difiera de la real en más de una hora, se tiene que:

( ) (

2

)

2

1 / 2 1 / 2

z 1 n z 1, 96 6, 2 147, 67

−α n −α

σ = ⇒ = ⋅σ = ⋅ =

Por lo que el tamaño de la muestra será de 148 pilas.

(7)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

7 2.- Durante 15 días se estudió el número de alumnos que pasaban por el almacén de la Escuela, obteniéndose los siguientes resultados:

70, 78, 71, 62, 78, 67, 64, 76, 73, 65, 58, 72, 74, 67, 75

Suponiendo Normalidad de la distribución, calcular: intervalo de confianza del 95% del número medio de usuarios del almacén.

Solución:

Calculamos los parámetros estadísticos:

( )

i

2 2 i

x 1050

X 70.13

n 15

x X 506

S 36.14285714 S 36.14285714 6.011892975

n 1 14

= = =

= − = = ⇒ = =

Se trata de una población que sigue una distribución Normal de varianza desconocida, y muestras pequeñas, por lo que el intervalo de confianza es:

1 / 2

X t S

−α n

±

X=70;S=6; n=15;α =0.05

Buscaremos en la tabla un valor tα/ 2 tal que P

(

−tα/ 2 <tn 1 <tα/ 2

)

= − α . 1

(

n 1 1 / 2

) (

n 1 1 / 2

) (

14 1 / 2 0,975

)

P t <t−α = − α ⇔1 P t >t−α = α ⇒P t >t−α = =0, 05⇒ =t 2,145

DERIVE:

#1: NSOLVE(STUDENT(t, 14) = 0.975, t)

#2: t = 2.144786715 EXCEL: =INV.T.2C(0,05;14) 2,144788596

SPSS: IDF.T(0.975,14) 2,145

0.05

6 6

I 70 2.145 , 70 2.145

15 15

α=

 

⇒ = − + =

 

(

66.67698028, 73.32301971

)

(8)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

8 3.- Para estudiar el número de pulsaciones por minuto de personas entre 20 y 30 años, se eligen 400 al azar, obteniéndose una media de 75 por minuto y una desviación típica de 9. Calcular:

a) Intervalo de confianza del 95% del número medio de pulsaciones por minuto en dicha población.

b) Tamaño de la muestra necesario para obtener el intervalo de confianza de la misma amplitud que el anterior y con nivel de confianza del 99%.

Solución:

Por ser el tamaño de la muestra suficientemente grande podemos considerar N , n

µ σ 

 

 

El intervalo de confianza para una población normal es:

1 / 2

X z

−α n

± σ a) Para nuestros datos:

X=75;σ ≈ =S 9; n=400;α =0.05 Tenemos Z X N(0,1)

n

= − µ ≡ σ

(

1 / 2 1 / 2

)

1 / 2

(

1 / 2

)

P −z−α < <Z z−α = − α = −1 1 0.05=0.95⇒F(z−α )=P Z<z−α =0.975

DERIVE:

#1: NSOLVE(NORMAL(z) = 0.975, z, Real)

#2: z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628

O directamente

=INTERVALO.CONFIANZA(0,05;9;400) 0,88198379

1 / 2

X z 75 0,88198379

−α n

± σ = ±

SPSS: IDF. NORMAL(0.975, 0,1) 1,96

0.05

9 9

I 75 1.96 , 75 1.96

400 400

α=

 

⇒ = − + =

(

74.118, 75.882

)

(9)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

9 b) P

(

−z1−α/ 2< <Z z1−α/ 2

)

= − α = −1 1 0.01=0.99⇒F(z1−α/ 2)=P Z

(

<z1−α/ 2

)

=0.995 DERIVE:

#1: NSOLVE(NORMAL(z) = 0.995, z, Real)

#2: z = 2.575829327 EXCEL: =DISTR.NORM.INV(0,995;0;1) 2,5758313 SPSS: IDF. NORMAL(0.995, 0,1) 2,58

2 2

1 / 2 1 / 2

z 2, 58 9

z 0,88198379 n 693.1125238

0,88198379 0,88198379 n

−α −α

⋅σ

σ = ⇒ =  = ⋅  =

   

Por lo que el tamaño de la muestra será de 694.

(10)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

10 4.- Una agencia de alquiler de automóviles necesita estimar el número medio de kilómetros diarios que realizas su flota de automóviles; toma los recorridos de 100 vehículos y obtiene una media de 165 km/día y una varianza muestral de 36 km/día. Se pide:

a) Intervalo de confianza para la media al 95%.

b) Intervalo de confianza para la varianza al 95%.

Solución:

Por ser el tamaño de la muestra suficientemente grande podemos considerar N , n σ

µ 

 

 

El intervalo de confianza para una población normal es:

1 / 2

X z

−α n

± σ a) Para nuestros datos:

2 2

X=165;σ =S =36; n=100;α =0.05 Tenemos Z X N(0,1)

n

= − µ ≡ σ

(

1 / 2 1 / 2

)

1 / 2

(

1 / 2

)

P −z−α < <Z z−α = − α = −1 1 0.05=0.95⇒F(z−α )=P Z<z−α =0.975

DERIVE:

#1: NSOLVE(NORMAL(z) = 0.975, z, Real)

#2: z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628

O directamente

=INTERVALO.CONFIANZA(0,05;6;100) 1,1759777

1 / 2

X z 165 1,1759777

−α n

± σ = ±

SPSS: IDF. NORMAL(0.975, 0,1) 1,96

0.05

6 6

I 165 1.96 ,165 1.96

100 100

α=

 

⇒ = − + =

 

(

163.82,166.18

)

b)

2 2

2

2 1

(n 1).S (n 1).S

P 1

k k

 − < σ < − = − α

 

 

Buscaremos los valores de k1 y k2 tales que:

( )

( )

2

99 1

2

99 2

P k 0.025

P k 0.975

χ < =

χ < = en las tablas e interpolando, obtenemos k1=73,361y k2= 128,422.

(11)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

11 EXCEL:

=INV.CHICUAD (0,025;99) 73,361103

=INV.CHICUAD (0,975;99) 128,42193 en la prueba de la chi se utiliza la cola de la derecha

SPSS: IDF. CHISQ(0.975,99) 128,422 : IDF. CHISQ(0.025,99) 73,361

99 36 2 99 36

P 0, 95

128.42193 0, 216

⋅ ⋅

 < σ < = ⇒

 

 

27.75< σ <2 48.58

(12)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

12 5.- Si el coeficiente medio de inteligencia de la población universitaria de la U.P.M.

es µ =95 y σ=14, y se extrae una muestra de 49 estudiantes de esa población.

a) ¿Qué probabilidad hay de que resulte una media muestral igual o inferior a 92?

b) Hallar un intervalo de confianza al 95% para la media de la población universitaria, para la muestra de media 92.

c) ¿Podemos aceptar la hipótesis de ser la media µ =95? Solución:

La distribución de la media muestral es X N , N 95, 14 N 95, 2

( )

n 49

σ  

 

≡ µ =  =

a) F(92)=P X

(

92

)

≈ 0.06680720126 DERIVE: #1: NORMAL(92,95,2)

#2: 0.06680720126

EXCEL: =DISTR.NORM.(92;95;2;1) 0,0668072 SPSS: CDF. NORMAL(92,95,2) ,06680720 b) El intervalo de confianza para una población normal es:

1 / 2

X z

−α n

± σ

Para nuestros datos: X=92;σ =14; n =49;α =0.05 Tenemos Z X N(0,1)

n

= − µ ≡ σ

(

1 / 2 1 / 2

)

1 / 2

(

1 / 2

)

P −z−α < <Z z−α = − α = −1 1 0.05=0.95⇒F(z−α )=P Z<z−α =0.975

DERIVE: #1: NSOLVE(NORMAL(z) = 0.975, z, Real)

#2: z = 1.959963962

EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 O diretamente

=INTERVALO.CONFIANZA(0,05;14;49) 3,91992797

1 / 2

X z 92 3,919927969

−α n

± σ = ±

SPSS: IDF. NORMAL(0.975, 0,1) 1,96

0.05

14 14

I 92 1.96 , 92 1.96

49 49

α=

 

⇒ = − + =

(

88.08, 95.92

)

c) µ =95∈Iα=0.05 =

(

88.08, 95.92 , SÍ SE ACEPTA

)

(13)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

13 6.- Se desea estudiar el gasto semanal en euros, de los estudiantes de Madrid. Para ello se ha elegido una muestra aleatoria de 9 de estos estudiantes:

100 150 90 70 75 105 200 120 80

Se supone que la variable aleatoria sigue una distribución normal de media desconocida y desviación típica conocida e igual a 12. Determinar un intervalo de confianza al 95%

para la media del gasto semanal por estudiante.

Solución:

El gasto sigue una distribución N

(

µ,12

)

El intervalo de confianza para una población normal de varianza conocida es:

1 / 2

X z

−α n

± σ Para nuestros datos:

100 150 90 70 75+105+200 120 80

X 110; 12; n 9; 0, 05

9

+ + + + + +

= = σ = = α =

Tenemos Z X N(0,1) n

= − µ ≡ σ

(

1 / 2 1 / 2

)

1 / 2

(

1 / 2

)

P −z−α < <Z z−α = − α = −1 1 0.05=0.95⇒F(z−α )=P Z<z−α =0.975

DERIVE:

#1: NSOLVE(NORMAL(z) = 0.975, z, Real)

#2: z = 1.959963962

EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 O directamente

=INTERVALO.CONFIANZA(0,05;1;9) 7,8398559

1 / 2

X z 110 7,8398559

−α n

± σ = ±

SPSS: IDF. NORMAL(0.975, 0,1) 1,96

0.02

12 12

I 110 1, 96 ,110 1, 96

9 9

α=

 

⇒ = − + =

(

102.16,117.84

)

(14)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

14 7.- Se realiza una encuesta sobre el nivel de conocimientos generales de los estudiantes de bachillerato de los diferentes centros de Madrid. Para ello se ha elegido una muestra aleatoria de 9 de estos estudiantes a los que se ha realizado el examen. Las calificaciones obtenidas han sido las siguientes:

7,8 6,5 5,4 7,1 5 8,3 5,6 6,6 6,2

Se supone que la variable aleatoria sigue una distribución normal de desviación típica conocida e igual a 1. Se pide:

a) Un intervalo de confianza al 98% para la media de las calificaciones en el examen.

b) El tamaño mínimo que debería tener la muestra en el caso de admitir un error máximo de 0,5 puntos con un nivel de confianza del 95%

Solución:

La calificación del examen sigue una distribución N

( )

µ,1

a) El intervalo de confianza para una población normal de varianza conocida es:

1 / 2

X z

−α n

± σ Para nuestros datos:

7,8 65 5, 4 7,1 5 8, 3 5, 6 6, 6 6, 2

X 6, 5; 1; n 9; 0.02

9

+ + + + + + + +

= = σ = = α =

Tenemos Z X N(0,1) n

= − µ ≡ σ

(

1 / 2 1 / 2

)

1 / 2

(

1 / 2

)

P −z−α < <Z z−α = − α = −1 1 0.02=0.98⇒F(z−α )=P Z<z−α =0.99

DERIVE:

#1: NSOLVE(NORMAL(z) = 0.99, z, Real)

#2: z = 2.326347902 EXCEL: =DISTR.NORM.INV(0,99;0;1) 2,3263479

O directamente

=INTERVALO.CONFIANZA(0,02;1;9) 0,7754493

1 / 2

X z 6, 5 0, 7754493

−α n

± σ = ±

SPSS: IDF. NORMAL(0.99, 0,1) 2,33

0.02

1 1

I 6, 5 2, 33 , 63, 5 2, 33

9 9

α=

 

⇒ = − + =

 

(

5.73, 7.27

)

(15)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

15 b) Para un nivel de confianza del 95%

Tenemos Z X N(0,1) n

= − µ ≡ σ

(

1 / 2 1 / 2

)

1 / 2

(

1 / 2

)

P −z−α < <Z z−α = − α = −1 1 0.05=0.95⇒F(z−α )=P Z<z−α =0.975

DERIVE:

#1: NSOLVE(NORMAL(z) = 0.975, z, Real)

#2: z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 SPSS: IDF. NORMAL(0.975, 0,1) 1,96 Con un error del 0,5:

1 / 2

1 1, 96

0, 5 z 1, 96 n 3, 92 n 15, 3

n n 0, 5

−α

= σ = ⇒ = = ⇒ =

Debemos tomar una muestra de tamaño n=16

(16)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

16 8.- Se ha tomado una muestra de tamaño 10 del tiempo T, en minutos, entre el paso de dos autobuses en una parada, con los siguientes resultados 9, 10, 6, 4, 15, 6, 1, 5, 4, 10.

Si la función de distribución del tiempo es: F(t)= −1 e−λt a) Estimar, por máxima verosimilitud el valor de λ.

b) Calcular la probabilidad estimada de esperar al autobús más de 10 minutos.

Solución:

a)

La función de densidad de la distribución de T es: f (t)=F '(t)= λe−λt La función de verosimilitud será:

1 n 1 n

n t t n ( t ... t )

1 n 1 n i 1 i

L(t ...t / ) f (t ...t / ) f (t ) e−λ .... e−λ e−λ + +

λ = λ = Π= = λ λ = λ

Tomando logaritmos neperianos

(

1 n

) ( ) (

1 n

)

ln L(t ...t / )λ =n ln λ − λ t + +... t Buscamos el máximo

(

1 n

) (

1 n

)

ln L(t ...t / ) n

t ... t 0

∂ λ

= − + + = ⇒

∂λ λ 1 n

n t ... t λ =

+ + Así para nuestra muestra es: 10

9 10 6 4 15 6 1 5 4 10

λ = =

+ + + + + + + + +

1 7 b)

Para nuestros datos la función de distribución será:

1t

t 7

F(t)= −1 e−λ = −1 e

110 7

10/7

P(T 10) 1 P(T 10) 1 F(10) 1 1 e 1

e

> = − < = − = − − = ≈

  0.2396510364

(17)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

17 9.- Se han escogido al azar 15 probetas de un determinado acero, cuya resistencia a la compresión se supone que se distribuye normalmente, y se ha medido ésta en las unidades adecuadas, habiéndose observado los siguientes resultados:

40,15 65,1 49,5 22,4 38,2 60,4 43,4 26,35 31,2 55,6 47,25 73,2 35,9 49,25 52,4

a) Estimar la resistencia media del acero y su varianza, utilizando estimadores centrados.

b) Hallar un intervalo de confianza del 99% para la resistencia media.

c) Hallar un intervalo de confianza del 99% para la varianza.

Solución:

a)

El estimador de máxima verosimilitud de la media, es la media muestral, que es un estimador centrado, luego X 46, 02

µ = = . Pero para la varianza utilizaremos la

cuasivarianza muestral, ya que es centrado,

( )

n 2

i

2 i 1

x X

S 202, 532429

n 1

=

= =

b)

Se trata de una población que sigue una distribución Normal de varianza desconocida, y muestras pequeñas, por lo que el intervalo de confianza es:

1 / 2

X t S

−α n

±

X=46.02;S 14, 2313888; n= =15;α =0, 01

Buscaremos en la tabla un valor tα/ 2 tal que P

(

−t1−α/ 2 <tn 1 <t1−α/ 2

)

= − α1 .

( ) ( ) ( )

( )

n 1 1 / 2 n 1 1 / 2 14 0,995

14 0,995

P t t 1 P t t P t t 0, 01

P t t 0.995

< −α = − α ⇔ > −α = α ⇒ > = ⇒

≤ =

DERIVE:

#1: NSOLVE(STUDENT(t, 14) = 0.995, t)

#2: t = 2.976842746 EXCEL: =INV.T.2C(0,01;14) 2,9768427

SPSS: IDF.T(0.995,14) 2,98

0.01

14.2313888 14, 2313888

I 46.02 2.98 , 46.02 2.98

15 15

α=

 

⇒ = − + =

 

(

35.0699042, 56.9700958

)

(18)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

18 c)

Sabiendo que (n ).S

n

−1 2

2 1

2

σ χ si la población de partida es N( , )µ σ

2 2

2

2 1

(n 1).S (n 1).S

P 1

k k

 − < σ < − = − α

 

 

Buscaremos los valores de k1 y k2 tales que:

( )

( )

2

14 1

2

14 2

P k 0.005

P k 0.995

χ < =

χ < =

EXCEL:

=INV.CHICUAD (0,005;14) 4,074675

=INV.CHICUAD (0,995;14) 31,31935 en la prueba de la chi se utiliza la cola de la derecha

SPSS: IDF. CHISQ(0.995,14) 31,32 : IDF. CHISQ(0.005,14) 4,07

14 202, 532429 2 14 202, 532429

P 0, 99

31,32 4, 07

⋅ ⋅

 < σ < = ⇒

 

 

90, 5317369< σ <2 696, 671744

(19)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

19 10.- La altura de los individuos de una población sigue una distribución normal, de media µ y desviación típica 0,075. Si en una muestra aleatoria simple de tamaño 12 de dicha población se obtuvo una media muestral de 1,75. Se pide:

a) Determinar un intervalo de confianza para µ con un nivel de confianza del 95%.

b) ¿Qué tamaño muestral sería necesario para que el intervalo de confianza del mismo nivel tuviese longitud menor que 0,01?

Solución:

a)

Se trata de una población que sigue una distribución Normal de varianza conocida, y muestras pequeñas, por lo que el intervalo de confianza es:

1 / 2

X z

−α n

± σ

X=1.75;S=0.075; n=12;α =0, 05 Tenemos Z X N(0,1)

n

= − µ ≡ σ

(

1 / 2 1 / 2

)

1 / 2

(

1 / 2

)

P −z−α < <Z z−α = − α = −1 1 0.05=0.95⇒F(z−α )=P Z<z−α =0.975

DERIVE:

#1: NSOLVE(NORMAL(z) = 0.975, z, Real)

#2: z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 SPSS: IDF. NORMAL(0.975, 0,1) 1,96

0.05

0.075 0.075

I 1.75 1.96 ,1.75 1.96

12 12

α=

 

⇒ = − + =

(

1.707564755,1.792435244

)

O directamente con EXCEL

=INTERVALO.CONFIANZA(0,05;0,075;12) 0,0424345

1 / 2

X z 1, 75 0, 0424345

−α n

± σ = ±

b)

El intervalo de confianza en general es I X z / 2 , X z / 2

n n

α α α

σ σ

 

= − − 

 , en nuestro

caso

0.05

0.075 0.075

I 1.75 1.96 ,1.75 1.96

n n

α=

 

⇒ = − +  para n desconocido, cuya longitud es

0.075 0.075 0.075

1.96 1.96 2 1.96 0.01 n 29.4

n n n

⇒ + = ⋅ < ⇒ >

Debemos tomar una muestra de tamaño n=865

(20)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

20 11.- Supuesto que una población se compone de cinco valores: 2, 3, 6, 8, 11.

Considérense todas las muestras posibles de tamaño dos que puedan extraerse con reemplazamiento de esta población. Se pide: a) La media y desviación típica de la población. b) La distribución de la media muestral. c) La media y la desviación típica de la distribución de la media muestral. d) Calcular un intervalo de

confianza al 80% para la media de la población si se obtienen muestras de tamaño 3.

Solución:

La población está formada por

{

2, 3, 6,8,11

}

a) 2 3 6 8 11 5

+ + + +

µ = = 6

2 4 9 36 64 121 54

5 36 5

+ + + +

σ = − = =10.8⇒ σ = 10.8≈ 3.29

b) Calculemos las medias de todas las posibles muestras de tamaño 2

2 3 6 8 11

2 2 2.5 4 5 6.5

3 2.5 3 4.5 5.5 7

6 4 4.5 6 7 8.5

8 5 5.5 7 8 9.5

11 6.5 7 8.5 9.5 11 c)

x i n i i i

n x n xi i2

2 1 2 4

2,5 2 5 12,5

3 1 3 9

4 2 8 32

4,5 2 9 40,5

5 2 10 50

5,5 2 11 60,5

6 1 6 36

6,5 2 13 84,5 7 4 28 196

8 1 8 64

8,5 2 17 144,5 9,5 2 19 180,5 11 1 11 121 25 150 1035

Media: x x1 x2 ... xn 150 6

N 25

+ + +

= = =

Varianza: 1 2 n

2 2 2

2 2

x

x x ... x 1035

x 36 5.4

N 25

+ + +

σ = − = − =

Obsérvese que X= µ = y que 6 2x 2 10.8 n 2 5.4

σ =σ = = ⇒ σ =x 5.4≈ 2.32

(21)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

21 d) Sabemos que el estadístico X

S n

− µ sigue una distribución t de Student con n-1 grados

de libertad. Así pues: X 6 3 1 t 16.2

3

− = , ya que S2 N 2 510.8 13.5

N 1 4

= σ = =

− .

Buscaremos el intervalo 1 / 2 S 1 / 2 S

I X t , X t

n n

α −α −α

 

= − + 

 , es decir,

1 / 2 1 / 2

S S

P X t X t 1

n n

−α −α

 − < µ < + = − α

 

  .

En nuestro caso, queda:

0.2

13.5 13.5

I 6 1.88561812 , 6 1.88561812

3 3

α=

 

= − + =

 

(

2,10

)

DERIVE: NSOLVE(STUDENT(t, 2) = 0.8) t = 1.885618120 EXCEL: =INV.T.2C(0,2;2) 1,8856

(22)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

22 12.- Las edades en que se produce la muerte, para una muestra aleatoria de 19 individuos fallecidos por una determinada edad dan una media de 50 años.

Suponiendo normal la distribución, hallar un intervalo de confianza para la media al 99% suponiendo conocido el valor de la varianza de la población σ =2 38.

Solución:

Tenemos una distribución normal y varianza conocida:

1 / 2 1 / 2

I X z , X z

n n

α −α −α

σ σ

 

= − + 

Datos: n=19; X=50 ; σ =2 38;1− α =0.99 y en la distribución normal

Z X N(0,1)

n

= − µ ≡ σ

1 / 2 1 / 2

F(Z z ) 1 0.995 z 2.575

−α 2 −α

< = + − α =α ⇒ =

0.01

38 38

I 50 2.575 , 50 2.575

19 19

α=

 

⇒ = − + =

(

46.3584, 53.6416

)

DERIVE:

#1: NSOLVE(NORMAL(z) = 0.995, z, Real)

#2: z = 2.575829327 EXCEL: =DISTR.NORM.INV(0,995;0;1) 2,5758313 SPSS: IDF. NORMAL(0.995, 0,1) 2,58

(23)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

23 13.- Se quieren estudiar la vida útil de unas baterías para móviles. Si admitimos que la varianza de la distribución normal de la vida de las baterías es igual a 1,44,

¿qué tamaño muestral deberíamos utilizar para que la amplitud del intervalo de confianza para la media del 95% no sea superior al 0,4?

Solución:

Supongamos que el error máximo que queremos admitir es ε . El intervalo será

(

µ ε µ ε , +

)

y con nivel de significación α , comparando con el intervalo de confianza,

1 / 2 1 / 2

I X z , X z

n n

α −α −α

σ σ

 

= − +  tenemos que:

2

1 / 2 1 / 2

1 / 2

z z

z n n

n

−α −α

−α

σ σ

σ = ε ⇔ = ε ⇔ =  ε  Para nuestros datos:

2ε =0, 4;σ =2 1, 44;1− α =0, 95

2 2

1 / 2

z 1, 96 1, 2

n 138, 2976

0, 2

−α σ  ⋅ 

 

= ε  =  = .

Luego necesitamos que n sea igual a 139 Tenemos X

Z N(0,1)

n

= − µ ≡ σ

(

1 / 2 1 / 2

)

1 / 2

(

1 / 2

)

P −z−α < <Z z−α = − α = −1 1 0, 05=0, 95⇒F(z−α )=P Z<z−α =0, 975

DERIVE:

#1: NSOLVE(NORMAL(z) = 0.975, z, Real)

#2: z = 1.959963962 EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,9599628 SPSS: IDF. NORMAL(0.975, 0,1) 1,96

(24)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

24 14.- Suponiendo que la producción de trigo por hectárea es una variable aleatoria con distribución normal, sabiendo que en 25 fincas elegidas al azar se produjeron de media 3200 kg por ha, y la desviación típica fue de 40 kg por ha, calcular:

a) Intervalo de confianza al 95% de la producción media de trigo por ha.

b) Intervalo de confianza al 95% de la varianza.

Solución:

La producción de trigo por hectárea sigue una distribución N

(

µ, 40

)

El intervalo de confianza para una población normal de varianza conocida es:

1 / 2

X z

−α n

± σ a) Para nuestros datos:

X=3200;σ =40; n=25;α =0.05 Tenemos Z X N(0,1)

n

= − µ ≡ σ

(

1 / 2 1 / 2

)

1 / 2

(

1 / 2

)

P −z−α < <Z z−α = − α = −1 1 0.05=0.95⇒F(z−α )=P Z<z−α =0.975 DERIVE:

#1: NSOLVE(NORMAL(z) = 0.975, z, Real)

#2: z = 1.959963962

EXCEL: =DISTR.NORM.INV(0,975;0;1) 1,95996279 O directamente

=INTERVALO.CONFIANZA(0,05;6,2;40) 1,92136343

1 / 2

X z 3200 15, 6797119

−α n

± σ = ±

SPSS: IDF. NORMAL(0.975, 0,1) 1,96

0.05

40 40

I 3200 1.96 , 3200 1.96

25 25

α=

 

⇒ = − + =

 

(

3184.320, 3215.68

)

(25)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

25 b)

2 2

2

2 1

(n 1).S (n 1).S

P 1

k k

 − − 

< σ < = − α

 

 

Buscaremos los valores de k1 y k2 tales que:

( )

( )

2

24 1

2

24 2

P k 0.025

P k 0.975

χ < =

χ < = , obtenemos k1=12,4011503y k2= 39,3640771.

2 2

24 40 2 24 40

P 0, 95

39, 3640771 12, 4011503

 ⋅ < σ < ⋅ = ⇒

 

 

975, 508709< σ <2 3096, 48695

DERIVE:

#1: NSOLVE(CHI_SQUARE(k, 24) = 0.025, k, 0, 40)

#2: k = 12.40115026

#3: NSOLVE(CHI_SQUARE(k, 24) = 0.975, k, 0, 40)

#4: k = 39.98770495 EXCEL:

=INV.CHICUAD (0,025;24) 12,4011503

=INV.CHICUAD (0,975;24) 39,3640771

SPSS: IDF. CHISQ(0.975,24) 12,4 IDF. CHISQ(0.025,24) 39,36

(26)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

26 15.- Se han recogido firmas para una petición, en cada hoja caben 42 firmas, pero existen hojas que no están firmadas totalmente. Para una muestra de 50 hojas se tienen los resultados 1471 2

x y S 229

= 50 = . Se pide dar un intervalo de confianza para la media al 80%.

Solución:

Tenemos una muestra de tamaño grande (n=50) y varianza desconocida de una distribución normal:

1 / 2 1 / 2

S S

I X z , X z

n n

α −α −α

 

= − + 

Datos: 1471 2

X ; S 229; 1 0.8

= 50 = − α =

y en la distribución normal F(z1 / 2) 1 0.9 z1 / 2 1.28

−α 2 −α

= + − α =α ⇒ =

DERIVE:

#1: NSOLVE(NORMAL(z, 0, 1) = 0.9, z, Real)

#2: z = 1.281551569 EXCEL: =DISTR.NORM.INV(0,9;0;1) 1,281552 O directamente

=INTERVALO.CONFIANZA(0,2;raiz(229);50) 2,742640919

/ 2

S 1471

X z 2, 742640919

n 50

± α = ±

SPSS: IDF. NORMAL(0.9, 0,1) 1,2815515655

WOLFRAMALPHA: normal distribution, mean=0,sd=1 1.28155 (Percentil 90)

0.2

1471 229 1471 229

I 1.28 , 1.28

50 50 50 50

α=

 

⇒ = − + =

(

26.68, 32.16

)

(27)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

27 16.- Sea X la v. a. número de errores al realizar una nivelación. Se estudian 40 nivelaciones escogidas al azar. Los resultados son: X = 18.5 y S = 4. Se pide:

a) Intervalo de confianza del 95% para la media.

b) Intervalo de confianza para la varianza con un nivel de significación de α =0.01 Solución:

a) Tenemos una muestra de tamaño grande (n=40) y varianza desconocida de una distribución normal:

1 / 2 1 / 2

S S

I X z , X z

n n

α −α −α

 

= − + 

Datos: X=18.5 ; S= α =4; 0.05 y en la distribución normal

/ 2 / 2

F(Z z ) 1 0.975 1.96

α 2 α

< = + − α =α ⇒ λ =

0.05

4 4

I 18.5 1.96 ,18.5 1.96

40 40

α=

 

⇒ = − + =

 

(

17.867545,19.132455

)

b)

2 2

2

2 1

(n 1).S (n 1).S

P 1

k k

 − < σ < − = − α

 

 

Datos: S= α =4; 0.01 y en la distribución Chi-cuadrado

Buscaremos los valores de k1 y k2 tales que:

( )

( )

2

39 1

2

39 2

P k 0.005

P k 0.995

χ < =

χ < = , obtenemos k1= 19,9958679 y k2= 65,4755709

2 2

39 4 2 39 4

P 0, 99

65,4755709 19,99586787

 ⋅ ⋅ 

< σ < = ⇒

 

 

9, 53< σ <2 31, 21

(28)

Intervalos de Confianza

Unidad Docente de Matemáticas de la E.T.S.I.T.G.C. de la U.P.M.

28 17.- Se han realizado 15 mediciones de una misma magnitud, se supone que se distribuye normalmente, habiéndose observado los siguientes resultados:

40,15 40,10 40,5 40,4 40,2 40,4 40,4 40,35 40,2 40,6 40,25 40,2 40,9 40,25 40,4

c) Hallar un Intervalo de confianza del 99% para la varianza.

d) ¿Cuántas mediciones deberían haberse utilizado si se requiere una precisión en la media de ±0,1 y una confianza del 95%?

Solución:

X=40, 353;S2 =0, 04195238; n=15;α =0, 01 a) Sabiendo que (n ).S

n

−1 2

2 1

2

σ χ si la población de partida es N( , )µ σ

2 2

2

2 1

(n 1).S (n 1).S

P 1

k k

 − − 

< σ < = − α

 

 

Buscaremos los valores de k1 y k2 tales que:

( )

( )

2

14 1

2

14 2

P k 0.005

P k 0.995

χ < =

χ < = k2 =31,3193496; k1 = 4,07467497

14 0, 04195238 2 14 0, 04195238

P 0, 99

31, 3193496 4, 07467497

⋅ ⋅

 < σ < = ⇒

 

 

0, 01875305< σ <2 0,14414238 b) 1 / 2 S

X t

−α n

±

Buscaremos el percentil t1−α/ 2 tal que P

(

−t1−α/ 2 <tn 1 <t1−α/ 2

)

= − α . 1

( ) ( ) ( )

( )

n 1 1 / 2 n 1 1 / 2 14 0,975

14 0,975 0,975

P t t 1 P t t P t t 0, 05

P t t 0, 05 t 2,14478669

< −α = − α ⇔ > −α = α ⇒ > =

≤ = ⇒ =

Para que la precisión en la media sea de 0,1, se tiene que:

2 2 2

1 / 2 1 / 2 2

1 / 2

t S t

S 2,14478669

t 0,1 n S 0, 04195238 19,29855577

0,1 0,1 0,1

n

−α −α

−α

 ⋅     

= ⇒ =  =  ⋅ =  =

Por lo que el tamaño de la muestra será de 20.

(29)

U.D. de Matemáticas de la E.T.S.I. en Topografía, Geodesia y Cartografía 103 Intervalos de confianza para la media

a) Población normal con varianza conocida.

Sabemos que   

 

 N

n

, , luego   

  

n N( , )0 1 . Queremos calcular un intervalo  de forma que la P



 1 .

A 1  se le llama nivel de confianza

A  se le llama nivel de significación y es la probabilidad de que el parámetro no esté en el intervalo.

Buscaremos en la N(0,1) un valor z1/2 de forma que P

z1/ 2   z1/ 2

  1 como  , y n son conocidos, tenemos el intervalo 

 

   

n z

, n

z1 /2 1 /2 .

El intervalo de confianza sería:X z1 / 2

 n

 

b) Población cualquiera de varianza finita y muestras grandes.

Sabemos que   

 N( , n) . Razonando igual que antes, si la varianza es conocida el

intervalo será  

 

    1 n z

n z

P 1 /2 1 /2 para n>30.

Si la varianza es desconocida la estimamos por la varianza muestral, y queda:



 

  1 n z S

n z S

P 1 /2 1 /2 para n>100 y el intervalo es 1 / 2 S X z

 n

 .

c) Población normal con varianza desconocida.

Buscaremos en un valor t1/2 tal que P

t1/ 2 tn 1 t1/ 2

  1 y el correspondiente intervalo de confianza será: 1 / 2 S 1 / 2 S

P t t 1

n n

 

         

 

 

Para una muestra concreta: 1 / 2 S X t

 n

 y si queremos determinar el tamaño muestral n,

resulta 1 / 2 S t

 n   de donde

2 1 / 2

t .S n  

    .

(30)

Intervalos de confianza para la varianza

Se sabe que (n ).S

n

1 2

2 1

2

  si la población de partida es N( , )  . Por tanto, para tomar el intervalo de confianza de nivel de significación , buscamos los valores k1 y k2, tal que:

P k n S

1 k

2

2 2

1 1

 

 

 

   ( ).

 .

Se nos plantea el problema de que la distribución n12 no es simétrica (como ocurría con la Normal y la t de Student) por lo que no es posible determinar con exactitud los valores k1 y k2 para que el intervalo esté centrado en S2.

Una solución aproximada y generalmente buena es determinar k1 y k2 con las condiciones: P

n21k1

2 y P

n21k2

2

(31)

Método de máxima verosimilitud

Método de inferencia estadística que consiste en elegir el valor del parámetro que hace más probables (más verosímiles) los valores obtenidos en la muestra.

Este método fue usado por Gauss en el caso especial de la distribución Normal para justificar el método de los mínimos cuadrados y posteriormente desarrollado por R. A.

Fisher en sus aspectos esenciales.

Si tomamos una muestra  1, 2,...,n de una población que depende de unos parámetros  1, 2,...,n, sabemos que cada i tiene la misma distribución que la población:

 

f xi, 1, 2,...,n .

La probabilidad de que salga una muestra  1, 2,...,n viene dada por:

       

f x n f xn n f xi n L x x

i n

n n

1 1 2 1 2 1 2

1

1 1 2

, , ,..., ... , , ,...,  , , ,...,  ,..., , , ,...,

que es la llamada función de verosimilitud.

La idea de este método es coger como estimadores los valores que hacen máxima esta función, basándose en el principio lógico de suponer que los parámetros toman los valores que hacen máxima la probabilidad de obtener cada muestra.

Es más cómodo manejar log L, y lo podemos hacer ya que los valores que maximicen L, maximizan log L (por ser el logaritmo una función monótona creciente). En la mayoría de los casos, basta con hallar los valores que anulan su derivada:



logL

i

 0. Estas ecuaciones que deben satisfacer los parámetros son las ecuaciones de máxima verosimilitud.

Observación: El método de máxima verosimilitud no siempre produce estimadores insesgados.

Figure

Actualización...

Referencias

Actualización...

Related subjects :