• No se han encontrado resultados

Ejercicios de Estadistica II

N/A
N/A
Protected

Academic year: 2021

Share "Ejercicios de Estadistica II"

Copied!
409
0
0

Texto completo

(1)

1

UNIVERSIDAD NACIONAL DEL CALLAO

VICERECTORADO DE INVESTIGACIÓN

FACULTAD DE CIENCIAS ECONÓMICAS

TEXTO DE PROBLEMAS DE

INFERENCIA ESTADÍSTICA

AUTOR:

JUAN FRANCISCO BAZÁN BACA

(Resolución Rectoral 940-2011-R del 22-9-11) 01-09-11 al 31-08-13

CALLAO – PERÚ

(2)

2

ÍNDICE

Pág.

INDICE 2

INTRODUCCIÓN 5

Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA DEL LÍMITE

CENTRAL 6

1.1 Distribución normal 6

1.2 Distribución normal estándar 7 1.3 Propiedad reproductiva de la distribución normal 9

1.4 Teorema del límite central 10

1.5 Ejercicios resueltos 13

1.6 Ejercicios propuestos 29

Capítulo 2. DISTRIBUCIONES MUESTRALES 33 2.1 Distribución muestral de la media 37 2.2 Distribución muestral del total (conocida la media) 39 2.3 Distribución de la diferencia de medias muestrales 40 2.4 Distribución muestral de la proporción 43 2.5 Distribución muestral del total (conocida la proporción) 47 2.6 Distribución muestral de la diferencia de proporciones 48

2.7 Ejercicios resueltos 52

2.8 Ejercicios propuestos 73

Capítulo 3. DISTRIBUCIONES ESPECIALES 77

3.1 Distribución Chi-cuadrado 77

3.2 Distribución t de student 86

3.3 Distribución muestral de la media (n < 30) 92 3.4 Distribución de la diferencia de medias muestrales con varianzas

desconocidas pero iguales 93

3.5 Distribución F de Snedecor 94 3.6 Distribución de la razón de dos varianzas muestrales 98

(3)

3

3.8 Ejercicios propuestos 119

Capítulo 4. ESTIMACIÓN PUNTUAL 122

4.1 Estimadores. Propiedades 123

4.2 Métodos de Estimación Puntual 130 4.3 Método de Máxima Verosimilitud 130

4.4 Método de los Momentos 132

4.5 Método de los mínimos cuadrados 133

4.6 Ejercicios resueltos 135

4.7 Ejercicios propuestos 152

Capítulo 5. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 155 5.1 Intervalo de confianza para la media y tamaño de muestra 160 5.2 Intervalo de confianza para el total (conocida la media) 162 5.3 Intervalo de confianza para la proporción y tamaño de muestra 164 5.4 Intervalo de confianza para el total (conocida la proporción) 167 5.5 Intervalo de confianza para la diferencia de medias 168 5.6 Intervalo de confianza para la diferencia de proporciones 170 5.7 Intervalo de confianza para la media (n < 30) 173 5.8 Intervalo de confianza para la varianza 175 5.9 Intervalo de confianza para la razón de varianzas 177 5.10 Intervalo de confianza para la diferencia de medias (n y m <30) 179

5.11 Ejercicios resueltos 187

5.12 Ejercicios propuestos 235

Capítulo 6. CONTRASTE DE HIPÓTESIS ESTADÍSTICAS PARAMÉTRICAS 245 6.1 Prueba de hipótesis para la media (con varianza conocida) 251 6.2 Prueba de hipótesis para la media (con varianza desconocida) 258 6.3 Prueba de hipótesis acerca de una varianza 263 6.4 Prueba de hipótesis para la razón de varianzas 270 6.5 Prueba de hipótesis acerca de dos medias (varianzas conocidas) 276 6.6 Prueba de hipótesis acerca de dos medias (varianzas desconocidas) 281 6.7 Prueba de hipótesis para la proporción 290

(4)

4

6.8 Prueba de hipótesis para la diferencia de proporciones 293

6.9 Ejercicios resueltos 299

6.10 Ejercicios propuestos 348

Capítulo 7. PRUEBA DE HIPÓTESIS NO PARAMÉTRICAS 355 7.1 Uso de la distribución Chi-cuadrado. Test de independencia 356

7.2 Test de bondad de ajuste 362

7.3 Test de Wilcoxon 364 7.4 Test de signos 367 7.5 Test de la mediana 374 7.6 Ejercicios resueltos 379 7.7 Ejercicios propuestos 395 REFERENCIAS BIBLIOGRÁFICAS 398 Apéndice 400

Tabla 1. Distribción acumulativa normal estándar 401 Tabla 2. Distribución acumulativa chi-cuadrado 403 Tabla 3. Distribución acumulativa T de student 407 Tabla 4. Distribución acumulativa F 408 Tabla 5. De Wilcoxon para n ≤ 40 y  = 0.05 o 0.01 409 Tabla 6. Valores críticos para la prueba del signo S 409

(5)

5

INTRODUCCIÓN

La ciencia económica para poder realizar las mediciones económicas recurre permanentemente a la inferencia estadística, ya que las deducciones y conjeturas económicas acerca de los parámetros están basadas en muestras aleatorias tratadas por esta disciplina.

Con el propósito de poder contribuir al proceso de enseñanza aprendizaje de la estadística para economistas en la Universidad Nacional del Callao (UNAC), hemos creído conveniente elaborar un “Texto de problemas de inferencia estadística” que de manera sencilla ayude a estudiantes de la especialidad a desarrollar competencias conceptuales y procedimentales, mediante la asimilación de la terminología propia de la estadística, así como las correspondientes aplicaciones a la economía.

El texto consta de siete capítulos. En el primero, se desarrolla la distribución normal y el teorema del límite central; el capítulo dos, presenta las distribuciones muestrales para muestras grandes (n ≥ 30) y en el capítulo tres, se desarrollan las distribuciones muestrales especiales ligadas a muestras pequeñas (n < 30) como la chi-cuadrado, t de student y F.

En los capítulos cuatro y cinco se desarrollan los temas relacionados a la estimación puntual y la estimación por intervalos de confianza respectivamente.

En el capítulo seis, se desarrollan los contrastes de hipótesis estadísticas paramétricas, poniendo especial énfasis en la determinación del valor-P (probabilidad mínima para rechazar la hipótesis nula) usado en los cálculos computacionales modernos. Finalmente, en el capítulo siete se presentan las pruebas de hipótesis no paramétricas.

Gratitud eterna a nuestra querida UNAC, por el continuo apoyo ofrecido para alcanzar estos logros que permiten sistematizar conocimientos e incorporar temas para la discusión en clases. El reconocimiento especial a los estudiantes de economía de la FCE-UNAC, ya que gracias a su esfuerzo y comprensión en los últimos años se han puesto en práctica los resultados de este modesto trabajo.

(6)

6

Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA

CENTRAL DEL LÍMITE

“Sólo cabe progresar cuando se piensa en grande, sólo es posible avanzar

cuando se mira lejos”. José Ortega y Gasset

CONTENIDO

1.1 Distribución normal.

1.2 Distribución normal estándar.

1.3 Propiedad reproductiva de la distribución normal. 1.4 Teorema del límite central.

1.5 Ejercicios resueltos. 1.6 Ejercicios propuestos.

1.1 DISTRIBUCIÓN NORMAL

La teoría de probabilidades nos ofrece la distribución normal como una de las distribuciones más importantes, junto al teorema central del límite, con múltiples aplicaciones para la inferencia estadística, sobre todo en lo concerniente a las distribuciones muestrales. Por ello a continuación hacemos un breve repaso de la distribución normal y la presentación del teorema central del límite.

Definición.- una variable aleatoria continua X tiene distribución normal con media

μ y varianza σ2

, si su función de densidad de probabilidad esta dada por: 2 2 ( ) 2 2 1 ( ) 2 X f x e        - ∞ < x < ∞

donde: π = 3.14159265.... y e = 2.71828184 (la base de los logaritmos neperianos).

Notación.- una notación muy común para la distribución normal es: X ~ N(μ , σ2 ) Que se lee “la variable aleatoria X se distribuye normalmente con media μ y varianza σ2

”.

Características geométricas.-

(7)

7

Es una función creciente en el intervalo (- ∞ , μ).

Es una función decreciente en el intervalo (μ , ∞).

 Tiene sus puntos de inflexión en μ – σ y μ + σ.

Características estadísticas.-  Media: E (X) = μ

 Varianza: V (X) = σ2

Si X ~ N(μ , σ2 ). Entonces, la variable aleatoria Y = a + b X también se distribuye normalmente con media: E(Y) = a + bμ y varianza: V(Y) = b2 σ2 . Es decir: Y ~ N(a + bμ , b2 σ2 )

Si X ~ N(μ , σ2 ) el cálculo de probabilidades se efectúa realizando el proceso de estandarización siguiente:

Z = (X - μ ) / σ ~ N(0, 1) y decimos que la v.a. Z tiene distribución normal estándar.

1.2 DISTRIBUCIÓN NORMAL ESTÁNDAR

Definición.- Se dice que una variable aleatoria Z, es una variable aleatoria normal

estándar, si tiene distribución normal con media cero (μ = 0) y varianza uno (σ2

= 1) y su función de densidad de probabilidades es:

2/2 2 1 ) (z e z f    - ∞ < z < ∞

La función de distribución acumulativa de Z se denota por Φ (z) o F(z) y se calcula así: 0 5 10 15 20 25 30 35 40 μ - 3σ μ - 2σ μ - σ μ μ + σ μ + 2σ μ + 3σ X DISTRIBUCIÓN NORMAL

(8)

8 Φ (z) = F(z) = P [Z  z] =

   z t dt e 2/2 2 1 

Esta probabilidad nos da el área bajo la curva normal desde - ∞ hasta el valor z. Entonces, conocidos los valores de la media μ y la varianza σ2 de una variable aleatoria X ~ N(μ , σ2

) utilizando el proceso de estandarización Z = (X - μ ) / σ , se puede efectuar el cálculo de probabilidades tales como:

 P[a  X  b] = P[ (a - μ ) / σ  (X - μ ) / σ  (b - μ ) / σ ] = P[ (a - μ ) / σ  Z  (b - μ ) / σ ]

= Φ [(b - μ ) / σ ] - Φ [(a - μ ) / σ ]

 P[X  a] = P[(X - μ ) / σ  (a - μ ) / σ ] = P[Z  (a - μ ) / σ ] = Φ [(a - μ ) / σ ]

 P[X > a] = 1 – P[X  a] = 1 - Φ [(a - μ ) / σ ]

Los valores de la función de distribución acumulativa normal estándar, Φ (z) o F(z), han sido reproducidos en la Tabla 1 del Anexo utilizando la hoja de cálculo Excel.

Uso de la Tabla de la distribución normal estándar

a) Para calcular probabilidades.- en la tabla 1, conocido el valor de z, hallar Φ

(z) = F(z) = P [Z  z]. Por ejemplo, para z = 1.96, tenemos que:

Φ (1.96) = F (1.96) = P [Z  1.96] = 0.97500.

b) Para hallar valores de z.- es un proceso inverso al anterior, ya que conocida la

probabilidad Φ (z) = F (z) = P [Z  z] = α , en la tabla 1, se debe hallar el valor de z que acumule en probabilidad α y que denotaremos como z = Zα .

Para el mismo ejemplo, sí Φ (z) = F (z) = P [Z  z] = 0.97500, esto implica que, en la tabla 1, a la probabilidad 0.97500, le corresponde z = Z0.97500 1.96 .

Una característica importante de la distribución normal es que:

 Entre μ – σ y μ + σ se encuentra el 68.27% de las observaciones. Es decir que : P(μ – σ  X  μ + σ) = 

  

            1 1 Z P X P           = Φ (1) - Φ (-1) = 0.84134 –0.15866 = 0.68268

(9)

9

 Entre μ – 2σ y μ + 2σ se encuentra el 95.45% de las observaciones, puesto que: P(μ – 2σ  X  μ + 2σ) = 

  

         2 2 2 2 Z P Z P         = Φ (2) - Φ (-2) = 0.97725 –0.02275 = 0.9545

 Entre μ – 3σ y μ + 3σ se encuentra el 99.73% de las observaciones. Es decir que: P(μ – 3σ  X  μ + 3σ) = 

  

           3 3 3 3 Z P Z P         = Φ (3) - Φ (-3) = 0.99865 – 0.00135 = 0.9973

 Entre μ – 4σ y μ + 4σ se encuentra el 99.9937% de las observaciones. Es decir que: P(μ – 4σ  X  μ + 4σ) = P  4  Z  4  P

4 Z 4

                = Φ (4) - Φ (-4) = 0.999968 – 0.000031 = 0.999937

 Entre μ – 5σ y μ + 5σ se encuentra el 99.999942% de las observaciones. Es decir que: P(μ – 5σ  X  μ + 5σ) = P  5  Z  5  P

5 Z 5

                 = Φ (5) - Φ (-5) = 0.99999971 – 0.00000029 = 0.99999942

 Entre μ – 6σ y μ + 6σ se encuentra el 99.9999998% de las observaciones. Es decir que: P(μ – 6σ  X  μ + 6σ) = P  6  Z  6  P

6 Z 6

                 = Φ (6) - Φ (-6) = 0.999999999 – 0.000000001 = 0.999999998

1.3 PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIÓN NORMAL

Sean X1 , X2 , .... , Xn , n variables aleatorias independientes distribuidas

normalmente con media μi y varianza σi2 . Es decir: Xi ~ N(μi , σi2 ) i = 1, 2, 3,

.... , n . Si Y es una combinación lineal de las v.a. Xi : Y = a0 + a1 X1 + a2 X2 + .... +

an Xn . Entonces, la variable aleatoria Y ~ N [a0 +

n i i i a 1  ,

n i i i a 1 2 2 ]

(10)

10 Puesto que:

 μY = E(Y) = E (a0 + a1 X1 + a2 X2 + .... + an Xn ) =

= E(a0 ) + E (a1 X1 ) + E (a2 X2 ) + .... + E (an Xn ) =

= a0 + a1 E(X1 ) + a2 E(X2 ) + .... + an E(Xn ) =

= a0 + a1 μ1 + a2 μ2 + .... + an μn = a0 +

n i i i a 1   Y2 = V(Y) = V (a0 + a1 X1 + a2 X2 + .... + an Xn ) =

= V(a0 ) + V(a1 X1 ) + V(a2 X2 ) + .... + V(an Xn ) =

= 0 + a12 V(X1 ) + a22 V(X2 ) + .... + an2 V(Xn ) = = a12 σ12 + a22 σ22 + .... + a2n σn2 =

n i i i a 1 2 2

1.4 TEOREMA DEL LÍMITE CENTRAL

Sean X1 , X2 , .... , Xn , n variables aleatorias independientes con media y varianza finitas

dadas por: E(Xi) = μi y V(Xi ) = σi2 .

Si: Yn = X1 + X2 + .... + Xn =

n i i X 1

, entonces bajo ciertas condiciones generales, la variable aleatoria Zn definida por:

       n i i n i n i i i n n n n X Y V Y E Y Z 1 2 1 1 ) ( ) (  

tiene aproximadamente una distribución normal estándar N(0, 1).

Nota.-

(11)

11 = μ1 + μ2 + .... + μn =

n i i 1  .  V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) = = σ12 + σ22 + .... + σn2 =

n i i 1 2  . Observaciones.- 1. La variable aleatoria Yn =

n i i X 1

(suma de v.a. independientes) puede ser aproximada por una v.a. distribuida normalmente, cualquiera que sea la distribución de las Xi .

2. Las condiciones generales indicadas en el teorema están referidas a que los términos Xi tomados individualmente, contribuyen con una cantidad despreciable a la

variación de la suma, y no es probable que un simple término tenga una gran contribución a la suma.

Una aplicación importante de estas condiciones generales del teorema central del límite, se da en los modelos de regresión: Yi = β0 + β1 X1i + β2 X2i + .... + βk Xki + ei

Donde la variable explicada o dependiente Y es función de un conjunto de variables explicativas o independientes (X1 , X2 , .... , Xk ) más un error e. La aplicación del

teorema central del límite se da cuando se asume que los errores ei se distribuyen

normalmente, debido a que estos errores recogen la suma de las contribuciones despreciables de todas las variables dejadas de considerar en el modelo.

Por ejemplo, en los modelos de demanda Qi = a – b Pi + ei , se asume que las

cantidades demandadas (Q) de un bien o servicio dependen fundamentalmente del precio (P) del bien. Efectivamente, pero existen otras variables independientes (gastos de publicidad, precio del bien sustituto, gustos y preferencias, etc.) que también podrían explicar dicha demanda, sin embargo, sus contribuciones a explicar la demanda son despreciables, por lo que la suma de sus contribuciones, reflejadas en los errores ei se aproximan a la distribución normal.

(12)

12

3. Una situación especial del teorema central del límite se presenta cuando cada Xi

tiene la misma distribución (que es el caso de la definición de muestra aleatoria, como veremos más adelante) y que permita encontrar la distribución de una media muestral. La propuesta es la siguiente:

Sean X1 , X2 , .... , Xn , n variables aleatorias independientes, idénticamente

distribuidas con media y varianza común y finitas dadas por: E(Xi) = μ y V(Xi ) = σ2.

Si: Yn = X1 + X2 + .... + Xn =

n i i X 1

, entonces la variable aleatoria Zn dada

por : n X n n X Y V Y E Y Z n n i i n n n n / ) ( ) ( 1         

tiene aproximadamente distribución normal estándar N(0 , 1). Donde

  n i i n X n X 1 1 es la media muestral de las Xi .

Nota.-  E(Yn ) = E (X1 + X2 + .... + Xn ) = E (X1 ) + E (X2 ) + .... + E (Xn ) = = μ + μ + .... + μ = n μ .  V(Yn ) = V (X1 + X2 + .... + Xn ) = V(X1 ) + V(X2 ) + .... + V(Xn ) = = σ2 + σ2 + .... + σ2 = n σ2

(13)

13

1.5 EJERCICIOS RESUELTOS

1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)]. Hallar

las probabilidades siguientes: a) P(Z > 1.13) ; b) P(1.00 < Z < 1.42) c) P(-1.5 < Z < 0.50) ; d) P(-1.65 < Z < -1.00) ; e) P(Z < -1.52) ; f) P(0 < Z < 1.25) y g) P(-1.63 < Z < 0).

Solución.-Usando la tabla 1 del anexo se tiene:

a) P(Z > 1.13) = 1 - P(Z ≤ 1.13) = 1 – Φ(1.13) = 1 – 0.8708 = 0.1292 b) P(1.00 < Z < 1.42) = Φ(1.42) - Φ(1.00) = 0.9222 – 0.8413 = 0.0809

Para obtener los gráficos en Minitab ver Bazán, Juan (2010)

0.4 0.3 0.2 0.1 0.0 Z D en si da d 1 0.0809 1.42 0 En Minitab: P(1.00 < Z < 1.42) 0.4 0.3 0.2 0.1 0.0 Z D en si da d -1.5 0.6247 0.5 0 P(-1.5  Z < 0.5) c) P(-1.5  Z < 0.5) = Φ(0.50) - Φ(-1.5) = 0.6915 – 0.0668 = 0.6247 d) P(-1.65  Z  -1.00) = Φ(-1.00) - Φ(-1.65) = 0.1587 – 0.0495 = 0.1092 e) P(Z < -1.52) = Φ(-1.52) = 1 - Φ(1.52) = 1 – 0.9357 = 0.0643 f) P(0  Z  1.25) = Φ(1.25) - Φ(0) = 0.8944 – 0.5000 = 0.3944 g) P(-1.63 < Z  0) = Φ(0) - Φ(-1.63) = 0.5000 – 0.0516 = 0.4484

2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z

para los casos siguientes: a) Φ(z) = 0.9500; b) Φ(z) = 0.9772; c) Φ(z) = 0.9987; d) el área entre –z y z es 0.95; e) el área a la izquierda de z es 0.01; y

(14)

14 Solución

a) Sí Φ (z) = F (z) = P [Z  z] = 0.9500, esto implica que, en la tabla 1, a la probabilidad 0.9500, le corresponde z = Z0.9500 = 1.645 aproximadamente.

b) Sí Φ (z) = F (z) = P [Z  z] = 0.9772, esto implica que, en la tabla 1, a la probabilidad 0.9772, le corresponde z = Z0.9772 = 2.00 aproximadamente.

c) Sí Φ (z) = F (z) = P [Z  z] = 0.9987, esto implica que, en la tabla 1, a la probabilidad 0.9987, le corresponde z = Z0.9987 = 3.00aproximadamente.

d) Si 0.95 = P [-z  Z  z] = Φ (z) - Φ (-z) = Φ (z) – [1 - Φ (z)] = 2 Φ (z) – 1. Entonces, Φ (z) = 0.9750 y en la tabla le corresponde a z = Z0.9750 = 1.96.

e) Si 0.01 = Φ (z) = P [Z  z], esto implica que, en la tabla 1, a la probabilidad 0.01, le corresponde z = Z0.01 = -2.33 aproximadamente.

f) Si 0.05 = P [Z ≥ z] = 1 - Φ (z), entonces Φ (z) = 0.9500 y de acuerdo a lo

visto en la parte a) de este problema le corresponde a z = Z0.9500 = 1.645.

3. El monto de las solicitudes de préstamo de los comerciantes que recibe un

Banco, está distribuido aproximadamente en forma normal con μ = S/. 10,000 y σ = S/. 1,000. Calcule e interprete la probabilidad de que el monto del préstamo solicitado: a) Esté entre S/. 8,500 y 12,000; b) Sea menor que S/. 8,000; c) Mayores de que cantidad será el 20 % de los préstamos?

Solución

Sea X = monto de las solicitudes de préstamo.

Se sabe que X ~ N(10000 , 10002), entonces Z = (X – 10000)/ 1000 ~ N(0, 1). Luego, las probabilidades solicitadas son:

a) P(8500 ≤ X ≤ 12000) = 8500 10000 10000 12000 10000 1000 1000 1000 X P         = = P(-1.5 ≤ Z ≤ 2.0) = Φ(2.00) - Φ(-1.50) = 0.97725 – 0.06681 = 0.91044 Rpta.

Interpretación: el 91.04% de los montos de préstamo solicitados por los comerciantes fluctúa entre S/. 8,500 y 12,000.

(15)

15 b) P(X ≤ 8000) = 10000 8000 10000 1000 1000 X P       = = P(Z ≤ -2.0) = Φ(-2.00) = 0.02275 Rpta.

Interpretación: el 2.28% (ó en 228 de cada 10000 solicitudes) de los montos de préstamo solicitados por los comerciantes es menor a S/. 8,000.

0.0004

0.0003

0.0002

0.0001

0.0000

X = monto del préstamo

D en si da d 8000 0.0228 10000

Normal, Media=10000, Desv.Est.=1000

Distribución del monto de préstamo

Resultado gráfico en Minitab

c) Sea C la cantidad de préstamo buscada, entonces:

0.20 = P(X > C) = 1 - 10000 1000 C P Z      0.80 = 10000 1000 C       0 . 8 0 10000 0.84 1000 C Z     C = S/. 10840 Rpta.

Interpretación: el 20% de los montos de préstamo solicitados por los comerciantes es mayor a S/. 10,840.

(16)

16 0.0004 0.0003 0.0002 0.0001 0.0000

X = monto del préstamo

D en si da d 10840 0.20 10000

Normal, Media=10000, Desv.Est.=1000

Distribución del monto de préstamo

4. Para cierto examen la calificación vigesimal tiene distribución normal con media

11 y desviación estándar 2. Se desea desaprobar al 40% de los examinados. ¿Cuál debe ser la calificación máxima desaprobatoria? Interprete el resultado. Solución

Sea X = calificación vigesimal de los examinados.

Se sabe que X ~ N(11 , 22), entonces Z = (X – 11)/ 2 ~ N(0, 1). Sea M la máxima nota desaprobatoria buscada, entonces:

0.40 = P(X < M) = 11 2 M P Z      = 11 2 M       11 0.40 0.25 2 M Z    M = 10.5 Rpta.

Interpretación: el 40% de los examinados desaprobados tiene nota menor a 10.5.

5. Los ingresos de los trabajadores tiene distribución normal con media µ= S/.

1000 y desviación estándar σ = S/. 200. Si se selecciona a 2000 de estos trabajadores, calcule e interprete:

a) ¿Cuántos trabajadores tienen ingreso menor a S/. 600? b) ¿Cuántos trabajadores tienen ingreso entre S/. 850 y 1300?

(17)

17

Si X = ingreso de los trabajadores ~ N(1000, 2002), Z = (X – 1000)/ 200 ~ N(0, 1).

Para determinar cuántos de los n = 2000 trabajadores tienen ingresos en los intervalos dados, primero se determina la probabilidad P y después multiplica por n. Se pide: a) P = P(X < 600) = 1000 600 1000 200 200 X P       = P(Z < -2.0) = Φ(-2.0) = 0.02275

Luego nP = 0.02275 x 2000 = 45.5 trabajadores Rpta.

Interpretación: 46 trabajadores (2.28%) tienen ingreso menor a S/. 600.

b) P = P(850 ≤ X ≤ 1300) = 850 1000 1000 1300 1000 200 200 200 X P         = = P(-0.75 ≤ Z ≤ 1.5) = Φ(1.5) - Φ(-0.75) = 0.93319 – 0.22663 = 0.70656 0.0020 0.0015 0.0010 0.0005 0.0000 X = ingreso D en si da d 850 0.7066 1300 1000

Normal, Media=1000, Desv.Est.=200Distribución del ingreso

Luego nP = 0.70656 x 2000 = 1413.12 trabajadores Rpta.

Interpretación: alrededor de 1413 trabajadores (70.66%) tienen ingreso entre S/. 850 y 1300.

6. El volumen de negociaciones diarias (en millones de nuevos soles) para las

acciones comercializadas en la bolsa de Lima tiene distribución normal con media µ= 800 y desviación estándar σ = 100. En un período de 60 días, calcule e interprete:

a) ¿En cuántos días el volumen de negociaciones es de 600 o menos millones? b) ¿En cuántos días el volumen de negociaciones es mayor de 900 millones?

(18)

18 Solución

Si X = volumen diario de negociaciones en millones de S/. ~ N(800, 1002)

 Z = (X – 800)/ 100 ~ N(0, 1).

Para determinar en cuántos de los n = 60 días el volumen de las negociaciones está en los intervalos dados, primero se determina la probabilidad P y después multiplica por n. Se pide:

a) P = P(X ≤ 600) = 800 600 800 100 100 X P       = P(Z < -2.0) = Φ(-2.0) = 0.02275

Luego nP = 0.02275 x 60 = 1.4 días Rpta.

Interpretación: en alrededor de 1.4 días (2.28%) el volumen de negociaciones es de 600 o menos millones de nuevos soles.

b) P = P(X > 900) = 800 900 800

100 100

X

P    

  = P(Z > 1.0) = 1 - Φ(1.0) =

= 1 – 0.84134 = 0.15866. Luego nP = 0.15866 x 60 = 9.5días Rpta.

Interpretación: en alrededor de 9.5 días (15.87%) el volumen de negociaciones es mayor de 900 millones de nuevos soles.

7. El peso de los pernos fabricados se distribuye normalmente con media µ= 80 gr.

y desviación estándar σ = 5 gr. Si se almacenan 2000 pernos, calcule e interprete ¿qué cantidad de pernos pesan: a) menos de 70 gramos? y b) entre 75 y 90 gramos?

Solución

Si X = peso de los pernos ~ N(80, 52)  Z = (X – 80)/ 5 ~ N(0, 1).

Para determinar cuántos de los n = 2000 pernos tienen un peso en los intervalos dados, primero se determina la probabilidad P y después multiplica por n. Se pide: a) P = P(X < 70) = 80 70 80 5 5 X P       = P(Z < -2.0) = Φ(-2.0) = 0.02275

Luego nP = 0.02275 x 2000 = 46 pernos Rpta.

Interpretación: alrededor de 46 pernos (2.28%) pesan menos de 70 gramos.

b) P = P(75 ≤ X ≤ 90) = 75 80 80 90 80

5 5 5

X

P      

(19)

19 = Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859. 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00 X = peso D en si da d 75 0.8186 90 80

Normal, Media=80, Desv.Est.=5

Distribución del peso de los pernos

Resultado gráfico en Minitab Luego nP = 0.81859 x 2000 = 1637 pernos Rpta.

Interpretación: alrededor de 1637 pernos (81.86%) pesan entre 75 y 90 gramos.

8. El tiempo necesario para terminar un examen se distribuye normalmente con

media µ= 80 minutos y desviación estándar σ = 10 minutos. En un curso de 60 alumnos, calcule e interprete cuántos alumnos terminan el examen:

a) ¿en una hora o menos?

b) ¿en más de 60 minutos, pero en menos de 75 minutos?

c) ¿Cuántos alumnos no terminan el examen, si éste dura 90 minutos?

Solución

Si X = tiempo para terminar un examen ~ N(80, 102)

 Z = (X – 80)/ 10 ~ N(0, 1).

Para determinar cuántos de los n = 60 alumnos terminan el examen en los intervalos dados, primero se determina la probabilidad P y después multiplica por n. Se pide: a) P = P(X ≤ 60) = 80 60 80 10 10 X P       = P(Z ≤ -2.0) = Φ(-2.0) = 0.02275.

(20)

20

Interpretación: alrededor de 1.4 alumnos (2.28%) terminan el examen en una hora o menos. b) P = P(60 ≤ X ≤ 75) = 60 80 80 75 80 10 10 10 X P         = P(-2 ≤ Z ≤ -0.5) = = Φ(-0.50) - Φ(-2.0) = 0.30854 – 0.02275 = 0.28579. Resultado gráfico en Minitab

0.04

0.03

0.02

0.01

0.00

X = tiempo duración examen

D en si da d 60 0.286 75 80

Normal, Media=80, Desv.Est.=10

Distribución tiempo duración examen

Luego nP = 0.28579 x 60 = 17 alumnos Rpta.

Interpretación: alrededor de 17 alumnos (28.6%) terminan el examen en más de 60 minutos, pero en menos de 75 minutos.

c) P = P(X > 90) = 80 90 80 10 10 X P       = P(Z > 1.0) = 1 - Φ(1.0) = = 1 – 0.84134 = 0.15866.

Luego nP = 0.15866 x 60 = 9.5 alumnos Rpta.

Interpretación: alrededor de 10 alumnos (15.87%) no terminan el examen, si éste dura 90 minutos.

9. Suponga que el ingreso familiar mensual (X) en una comunidad tiene

distribución normal con media $400 y desviación estándar $50. Si los gastos de consumo familiar (C) están dados por la relación C = 0.80 X + 50, ¿calcule e interprete la probabilidad de que los gastos de consumo familiar sean inferiores a $320?

(21)

21

Si X = ingreso familiar mensual ~ N(400, 502),  Z = (X – 400)/ 50 ~ N(0, 1). Se pide: P(C < 320) = P(0.80 X + 50 < 320) = P(X < 337.5) = = 400 337.5 400 50 50 X P       = P(Z < -1.25) = Φ(-1.25) = 0.10565 Rpta.

Otra forma de resolver es usando la propiedad reproductiva de la distribución normal. Sí C = 0.80 X + 50, entonces la media y la varianza de C son:

 CE C( )0.8 ( ) 50E X  0.8(400) 50 370   2

 

2 2 (0.8 50) 0.8 ( ) 0.64(2500) 1600 40 C Var X Var X        Luego C ~ N(370, 402),  Z = (C – 370)/ 40 ~ N(0, 1). Entonces: P(C < 320) = 370 320 370 40 40 C P       = P(Z < -1.25) = Φ(-1.25) = 0.10565 Rpta.

Interpretación: el 10.6% de (ó en 1057 de cada 10000 familias) los gastos de consumo familiar en la comunidad son menores a S/. 320.

10. Sean Xl , X2 y X3 variables a1eatorias independientes tales que: X1 ~ N (10 , 3 )

; X2 ~ N (12 , 4 ) y X3 ~ N (14 , 6). Si Y = X1 - 2 X2 + X3 . Se pide:

a) Hallar la media y la varianza de Y ; b) Ca1cule e interprete P

  8 Y 10

Solución X1 ~ N (10 , 3 ) 1 10 ; 3 2 1   X2 ~ N (12 , 4 ) 2 12 ; 4 2 2   X3 ~ N (14 , 6 ) 314 ; 2 3 6  

a) Cálculo de la media y la varianza de Y

 YE Y

 

E X

12X2X3

E X( 1) 2 ( E X2)E X( 3)= 1 2 2 3 10 2(12) 14 0 Y          Rpta.  2 1 2 3 1 2 3 ( ) ( 2 ) ( ) 4 ( ) ( ) Y V Y V X X X V X V X V X         Y2 1242232  3 4(4) 6 25 Rpta.

(22)

22 b) Cálculo de la P

  8 Y 10

Sabemos que Y 0 y Y2 25  Y 5. Además Y ~ N [0, 25]  Z = (Y – 0)/ 5 ~ N(0, 1). Luego:

8 0 0 10 0

8 10 1.6 2 5 5 5 Y P   YP      P   Z    = Φ(2.0) - Φ(-1.60) = 0.97725 – 0.05480 = 0.92245 Rpta. Interpretación: alrededor del 92.25% de los valores observados de Y se encuentran entre -8 y 10.

11. Sean X1, X2, X3 y X4 variables aleatorias normales independientes con μ1

30; μ2 = 25 ; μ3 = 12 ; μ4 = 8 ; 2 1  = 8 ; 2 2  = 6 ; 2 3  = 6 ; 2 4  = 2. Sí: Y =      4 2 2 1 X X - 3 4 2 XX       Calcule e interprete: a) P

8 Y 14

y b) P  Y 12 Solución: Y =    4 2 2 1 X X - 3 4 2 XX      = 3 1 2 4 4 2 2 2 X X X X  μY = E(Y) =

 

1

 

2

 

3

 

4 1 1 1 1 4E X 2E X 2E X 2E X = 1(30) 1(25) 1(12) 1(8) 10 4 2 2 2   Y2= V (y) = 1 2 3 4 1 1 1 1 ( ) ( ) ( ) ( ) 16V X 4V X 4V X 4V X = 1 (8) 1(6) 1(6) 1(2) 4 16 4 4 4 

Siendo Y una combinación lineal de las variables independientes Xi cada una con distribución normal, entonces por la propiedad reproductiva de la distribución normal se cumple que Y ~ N [10, 4]  Z = (Y – 10)/ 2 ~ N(0, 1). Luego: a) P

8 Y 14

= 8 10 10 14 10 2 2 2 Y P         = P (-1.0 ≤ Z ≤ 2.0) = = Φ(2.0) - Φ(-1.0) = 0.97725 – 0.15866 = 0.81859 Rpta.

(23)

23

Interpretación: el 81.86% de los valores de Y se encuentran entre 8 y 14.

b) P  Y 12 = P

  12 Y 12

= 12 10 10 12 10 2 2 2 Y P         = = P (-11.0 ≤ Z ≤ 2.0) = Φ(2.0) - Φ(-11.0) = = 0.97725 – 0.00000 = 0.0.97725 Rpta.

Interpretación: alrededor del 97.73% de los valores absolutos de Y son menores o iguales a 12.

12. En el proceso de fabricación de condensadores, varias pruebas han demostrado

que la temperatura más alta (en °C) que pueden soportar es N(125, 9). En los sistemas en que se utilizan, la temperatura máxima (en °C) a que se sujeta un condensador individual es N(116, 16). ¿Qué proporción de condensadores fallará por sobre calentamiento? Interprete el resultado.

Solución

Sean: F = temperatura más alta de fabricación ~ N(125, 9) y U = temperatura máxima de uso ~ N(116, 16)

Habrá falla por sobrecalentamiento (S) cuando S = F < U = F – U < 0.

Para hallar la proporción solicitada mediante P(S) = P(F < U) = P(F – U < 0) determinamos la distribución de F – U usando la propiedad reproductiva de la distribución normal, así:

F – U ~ N(9, 25)  Z = ( F – U – 9)/ 5 ~ N(0, 1). Entonces: P(S) = P(F < U) = P(F – U < 0) = 80 0 9 5 5 F U P        = = P(Z ≤ -1.8) = Φ(-1.8) = 0.03593 Rpta.

Interpretación: alrededor del 3.59% de los (ó 359 de cada 10000) condensadores fabricados falla por sobrecalentamiento en los sistemas en que se utilizan.

13. En una de las etapas de un proceso de ensamble un tapón cilíndrico tiene que

ajustarse a una abertura circular seleccionando cada elemento al azar en un suministro continuo. Los diámetros del tapón y de los casquillos en mm, son N(24.9, 0.032 ) y N(25, 0.042 ) respectivamente. Si para que el ajuste sea

(24)

24

satisfactorio se requiere un claro de diámetro de cuando menos 0.02 mm, ¿en qué proporción de los casos el ajuste no será satisfactorio? Interprete el resultado. (claro del diámetro = diámetro del casquillo – diámetro del tapón) Solución

Sean: T = diámetro del tapón ~ N(24.9, 0.032) y C = diámetro del casquillo ~ N(25, 0.042)

Si X = claro del diámetro = C – T, usando la propiedad reproductiva de la distribución normal se tiene que:

µX = E(X) = E(C – T) = E(C) – E(T) = 25.0 – 24.9 = 0.10

σ2

X = V(X) = V(C – T) = V(C) + V(T) = 0.0009 +0.0016 = 0.0025 = 0.052.

Luego: X = claro del diámetro = C – T ~ N(0.10, 0.052)

 Z = (X – 0.10)/ 0.05 ~ N(0, 1).

Que el ajuste no sea satisfactorio implica que X < 0.02. Entonces: P(X < 0.02) = 0.10 0.02 0.10 0.05 0.05 X P       = P(Z ≤ -1.8) = Φ(-1.6) = 0.0548 Rpta.

Interpretación: en alrededor del 5.48% de los (ó en 548 de cada 10000) ensambles el tapón no se ajusta al casquillo.

14. Las pastillas metálicas cilíndricas que se utilizan en un reactor se fabrican en

serie y puede suponerse que sus longitudes siguen una distribución normal con media 0.290 cm. y desviación estándar 0.016cm. Nueve de estas pastillas deben ajustarse, extremo con extremo, en un recipiente que ocupa una longitud no mayor de 2.670 cm. Si las nueve pastillas se ensamblan al azar, ¿qué proporción de estos no se ajustará en el espacio requerido? Interprete el resultado.

Solución

Sean: Xi = diámetro de las pastillas ~ N(0.29, 0.0162) y L = longitud del recipiente con 9 pastillas =

9 1 i i X

.

Por la propiedad reproductiva de la distribución normal, se tiene que: E(L) = E( 9 1 i i X

) = 9 1 ( i) i E X

= 9 1 0.29 i

= 9 x 0.29 = 2.61 cm.

(25)

25 V(L) = V( 9 1 i i X

) = 9 1 ( i) i V X

= 9 2 1 0.016 i

= 9 x 0.0162 = 0.002304 cm2. Luego:

L = longitud del recipiente con 9 pastillas =

9 1 i i X

~ N(2.61, 0.0002304)  Z = (L – 2.61)/ 0.048 ~ N(0, 1).

Las 9 pastillas no se ajustan al espacio requerido si L > 2.67. Por lo tanto: P(L > 2.67) = 1 – P(L ≤ 2.67) = 1 - 2.61 2.67 2.61 0.048 0.048 L P       = = 1 - P(Z ≤ 1.25) = 1 - Φ(1.25) = 1 - 0.89435 = 0.10565 Rpta. Interpretación: en alrededor del 10.56% de los (ó en 1056 de cada 10000) recipientes con 9 pastillas, éstas no se ajustan en el espacio requerido.

15. Suponga que las variables aleatorias X1 , X2 , .... , X50 representan la vida útil de

50 tubos electrónicos; los mismos que se usan de la siguiente manera: tan pronto como falla el primer tubo, empieza a funcionar el segundo y cuando falla el segundo empieza a funcionar el tercero, etc. Suponga que los Xi, i = 1, 2, …., 50 tienen distribución exponencial con parámetro λ = 1/500. ¿Cuál es la probabilidad que el tiempo de funcionamiento de los 50 tubos esté comprendido entre 20 000 y 30 000 horas? Interprete el resultado.

Solución

Sea Xi = tiempo de funcionamiento del tubo i ~ Exponencial (λ = 1/500)

Entonces µ = E(Xi) = 1/ λ = 500 , σ2 = 1/ λ2 = 5002] i = 1, 2, …., 50. Sea Y50 = tiempo de funcionamiento de los 50 tubos =

= 50 1 2 50 1 ... i i X X X X     

Entonces, por el teorema del límite central la probabilidad solicitada es: P(20 000 ≤ Y50 ≤ 30 000) = = 50 1 50 500 20000 50 500 30000 50 500 500 50) 500 50) 500 50) i i X x x x P x x x               

= P(-1.41 ≤ Z ≤ 1.41)

(26)

26

= Φ(1.41) - Φ(-1.41) = 0.92073 – 0.07927 = 0.84146 Rpta.

Interpretación: en alrededor del 84.15% de los (ó en 8415 de cada 10000) tiempos de funcionamiento de 50 tubos estará comprendido entre 20 000 y 30 000 horas.

16. Las botellas de aceite vegetal “Primor” tienen un contenido medio de 1 litro y

una desviación estándar de 0.04. Para la distribución se acomodan en cajas de 36 botellas, Calcule e interprete la probabilidad que una caja contenga más de 36.6 litros.

Solución

Sea Xi = contenido de las botellas de aceite ~ [µ = 1, σ = 0.04 lts.]

Sea Y36 = contenido por caja de las 36 botellas =

= 36 1 2 36 1 ... i i X X X X     

Entonces, por el teorema del límite central la probabilidad solicitada es:

P(Y36 > 36.6) = 1 - P(Y36 ≤ 36.6) = 1 - 36 1 36 1 36.6 36 1 0.04 36 0.04 36 i i X x x P              

= = 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta.

Interpretación: alrededor del 0.62% de las (ó en 62 de cada 10000) cajas con 36 botellas de aceite el contenido es de más de 36.6 litros.

17. En una ciudad grande el 20% de los hogares no tiene desagüe. Si se eligen 100

hogares al azar, calcule e interprete la probabilidad de que más de 30 hogares no tengan desagüe.

Solución

Sea Xi = 1, si el hogar no tiene desagüe ~ Bernoulli [p = 0.20]

Sea Y100 = el total de hogares sin desagüe, entre los 100 elegidos =

= 100 1 2 100 1 ... i i X X X X     

~ B[n = 100, p = 0.20] ó N[np = 20, npq = 16]

(27)

27 P(Y100 > 30) = 1 - P(Y100 ≤ 30) = 1 - 100 1 100 0.20 30 100 0.20 0.20 0.80 100 0.20 0.80 100 i i X x x P x x              

= = 1 – P(Z ≤ 2.5) = 1- Φ(2.5) = 1 – 0.99379 = 0.00621 Rpta.

Interpretación: en alrededor del 0.62% de los (ó en 62 de cada 10000) grupos de 100 hogares escogidos, más de 30 hogares no tienen desagüe.

18. Un lote de 10 000 pavos tiene un peso medio de 7 Kg. y una desviación

estándar de 0.15 Kg. Este lote debe ser entregado a los vendedores minoristas a razón de 100 cada uno. ¿Cuál es la probabilidad de que un vendedor cualquiera de estos tomados al azar, reciba un peso total de menos de 697 kilos? Interprete su resultado.

Solución

Sea Xi = peso de los pavos ~ [µ = 7, σ = 0.15 Kg.]

Sea Y100 = peso total de los 100 pavos =

100 1 2 100 1 ... i i X X X X     

Entonces, por el teorema del límite central la probabilidad solicitada es:

P(Y100 < 697) = 100 1 100 7 697 100 7 0.15 100 0.15 100 i i X x x P              

= = P(Z < -2.0) = Φ(-2.0) = 0.02275 Rpta.

Interpretación: alrededor del 2.28% de los (ó 228 de cada 10000) vendedores minoristas recibe un peso total menor a 697 Kg.

19. La Constructora “Techito” estima que el peso promedio de las personas que

vivirán en un edificio de apartamentos es de 68 Kg., con una desviación estándar de 15 Kg. De acuerdo con la estimación, instala en el edificio un ascensor para 36 personas con capacidad máxima de 2700 Kg. Si la estimación es correcta, calcule e interprete la probabilidad de que un cupo completo exceda la capacidad del ascensor.

(28)

28

Sea Xi = peso de las personas ~ [µ = 68, σ = 15 Kg.]

Sea Y36 = peso total de las 36 personas =

36 1 2 36 1 ... i i X X X X     

Entonces, por el teorema del límite central la probabilidad solicitada es:

P(Y36 > 2700) = 1 - P(Y36 ≤ 2700) = 1 - 36 1 36 68 2700 36 68 15 36 15 36 i i X x x P              

= = 1 – P(Z ≤ 2.8) = 1- Φ(2.8) = 1 – 0.99744 = 0.00256 Rpta.

Interpretación: alrededor del 0.26% de los (ó en 256 de cada 10000) cupos completos del ascensor con 36 personas exceden su capacidad máxima de 2700 Kg.

20. Las botellas de ron “Pepito” tienen un contenido medio de 2 litros y una

desviación estándar de 0.018. Para la distribución se acomodan en cajas de 36 botellas, Calcule e interprete la probabilidad que una caja contenga más de 72.36 litros.

Solución

Sea Xi = contenido de las botellas de ron ~ [µ = 2, σ = 0.018 lts.]

Sea Y36 = contenido por caja de las 36 botellas =

36 1 2 36 1 ... i i X X X X     

Entonces, por el teorema del límite central la probabilidad solicitada es:

P(Y36 > 72.36) = 1 - P(Y36 ≤ 72.36) = 1 - 36 1 36 2 72.36 36 2 0.018 36 0.018 36 i i X x x P              

= = 1 – P(Z ≤ 3.33) = 1- Φ(3.33) = 1 – 0.99957 = 0.00043 Rpta. Interpretación: alrededor del 0.04% de las (ó en 4 de cada 10000) cajas con 36 botellas de ron contienen más de 72.36 litros.

(29)

29

EJERCICIOS PROPUESTOS

1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)].

Hallar las probabilidades siguientes:

a) P(Z ≤ 2.15) b) P(0.80 < Z < 1.96) c) P(-2.45 < Z ≤ 1.65) d) P(-2.75 ≤ Z ≤ -0.65) e) P(Z ≥ -1.38) f) P(-2.57 ≤ Z < 0) g) P(0 ≤ Z < 2.33).

2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z

para los casos siguientes:

a) Φ(z) = 0.8665 b) Φ(z) = 0.9222 c) Φ(z) = 0.9972 d) el área entre –z y z es 0.99 e) el área a la izquierda de z es 0.05 f) el área a la derecha de z es 0.025

3. El contenido en las botellas de cierta gaseosa tiene distribución normal con

media µ= 1000 ml. y desviación estándar σ = 5 ml. Calcule e interprete la probabilidad de que una botella de gaseosa tenga:

a) Entre 990 y 1005 ml. b) Menos de 985 ml.

4. El precio que pagan los hogares por el kilo de pescado en una gran ciudad tiene

distribución normal con media µ= S/. 12 y desviación estándar σ = S/. 0.80. Calcule e interprete la probabilidad de que el precio pagado por el kilo de pescado:

a) Sea menor de S/. 10.

b) Se encuentre entre S/. 10.50 y 13.50.

(30)

30

5. El tiempo que dura la atención a los clientes de un negocio se distribuye

normalmente con media µ= 30 minutos y desviación estándar σ = 4 minutos. Calcule e interprete la probabilidad de que el tiempo de atención a los clientes:

a) dure entre 25 y 40 minutos.

b) Entre que límites simétricos alrededor de µ dura el 95% de las atenciones. 6. El peso de las cajas de mango se distribuye normalmente con media µ= 20 Kg. y

desviación estándar σ = 0.5 Kg. Si se almacenan 2000 cajas, calcule e interprete ¿qué cantidad de cajas pesan:

a) menos de 19 kilos? b) entre 19.5 y 21 kilos?

7. El peso de los huevos de gallina producidos por una avícola se distribuye

normalmente con media µ= 65 gr. y desviación estándar σ = 5 gr. Si se almacenan 2000 huevos, calcule e interprete ¿qué cantidad de huevos pesan:

a) Menos de 70 gramos? b) Entre 55 y 60 gramos?

8. La duración de ciertos focos eléctricos tiene distribución normal con media µ=

1000 horas y desviación estándar σ = 200 horas. Si compra 2000 de estos focos, calcule e interprete:

a) ¿Cuántos focos durarán menos de 600 horas? b) ¿Cuántos focos durarán entre 850 y 1300 horas?

9. El volumen de ventas diarias de bolsas de azúcar de la comercializadora

“Yapatera” tiene distribución normal con media µ= 800 bolsas y desviación estándar σ = 100. En un período de 60 días, calcule e interprete:

a) ¿En cuántos días el volumen de ventas es de 600 o menos bolsas de azúcar? b) ¿En cuántos días el volumen de ventas es mayor de 900 bolsas de azúcar? 10. Sean X1 y X2 variables aleatorias independientes distribuidas normalmente con

μ1 50; μ2 = 35; 2 1  = 10; 2 2  = 6. Si: Y = X 1 - X2. Calcule e interprete: a) La media y la varianza de Y b) P

10 Y 25

(31)

31

11. Sean X1, X2 y X3 variables aleatorias independientes distribuidas normalmente

con μ1 10; μ2 = 15; μ3 = 12; 2 1  = 3; 2 2  = 4; 2 3  = 6. Sí: Y = X1 + 2 X2 - X3 Calcule e interprete: a) P

20 Y 40

b) P

Y 18

12. Los teléfonos celulares A y B tienen una duración (en días) que son N(2190,

2002 ) y N(2878, 2502 ) respectivamente. Si se prueba la vida de cada uno de los teléfonos correspondientes a cada una de las marcas, ¿cuál es la probabilidad que los A duren un año o más que los B? Interprete su resultado.

13. En una ciudad grande el 20% de hogares no tiene agua. Si se escogen 100

hogares, calcule e interprete la probabilidad que más de 30 no tengan agua.

14. Al lanzar una moneda 100 veces, calcule e interprete la probabilidad de obtener

entre 40 y 60 caras.

15. Las cajas con limón tienen un peso medio de 20 Kg. y una desviación estándar

de 750 gr. Calcule e interprete la probabilidad de que el peso de 410 cajas recibidas al azar y cargadas en un camión, supere su capacidad máxima que es de 8,250 kg.

16. Los pesos de los sacos de algodón Pima cosechados tienen una media de 50

kilos y una desviación estándar de 1.4 kilos. Calcule e interprete la probabilidad de que el peso de 100 paquetes seleccionados al azar sea menor de 4975 kilos.

17. Las cajas con naranja tienen un peso medio de 15 Kg. y una desviación estándar

de 0.5 kilos. Calcule e interprete la probabilidad de que el peso de 400 cajas tomadas al azar sea menor de 5,980 kg.

18. Un lote de 10 000 pollos para parrilla tiene un peso medio de 1 Kg. y una

desviación estándar de 0.05 Kg. Este lote debe ser entregado a las pollerías a razón de 100 cada una. ¿Cuál es la probabilidad de que una pollería, cualquiera

(32)

32

de estas tomada al azar, reciba un peso total de menos de 98.5 kilos? Interprete su resultado.

19. Los pesos de los paquetes recibidos en las tiendas Ripley tienen una media de

580 libras y una desviación estándar de 80 libras. Calcule e interprete la probabilidad de que el peso de 49 paquetes recibidos al azar y cargados en un montacargas, supere su capacidad de 30 000 libras.

20. Un lote muy grande de cajas con palta tiene un peso medio μ = 20 Kg. y una

desviación estándar σ = 0.5 Kg. Este lote debe ser entregado a los supermercados a razón de 100 cajas cada uno. Calcule e interprete ¿la probabilidad de que un supermercado cualquiera, reciba un peso total de menos de 1 990.2 Kg.?

(33)

33

Capítulo 2. DISTRIBUCIONES MUESTRALES

“¿Hace falta remarcar que un país que no conoce su demografía, tampoco conoce su economía? No se puede saber lo que un país produce y ahorra si se ignora esta cosa fundamental: la población. .... En un país donde no se puede contar a los hombres, menos aún se puede contar la producción. Se desconoce el primero de sus factores: el factor humano, el factor trabajo..”

José Carlos Mariátegui

CONTENIDO

2.1 Distribuciones muestral de la media.

2.2 Distribución muestral del total (conocida la media) 2.3 Distribución de la diferencia de medias muestrales. 2.4 Distribución muestral de la proporción.

2.5 Distribución muestral del total (conocida la proporción) 2.6 Distribución muestral de la diferencia de proporciones. 2.7 Ejercicios resueltos.

2.8 Ejercicios propuestos.

La estadística es una ciencia importante porque permite el conocimiento de la población basándose en muestras aleatorias representativas. El principal problema de la estadística es estudiar una población con función de cuantía o función de densidad, f(x, θ) conocida o supuestamente conocida, con parámetro θ desconocido. Si se conoce θ, la distribución de probabilidad queda determinada. Para ello, se toma una muestra aleatoria de tamaño n (X1 , X2 , .... , Xn ) de una población de tamaño N y se

busca alguna función de esta muestra que estime el parámetro desconocido θ, problema que será abordado con mayor detalle en el capítulo de estimación.

En este capítulo se desarrollan las distribuciones muestrales para muestras grandes (n ≥ 30 ) referidas a la media, a la diferencia de medias, a la proporción, a la diferencia de proporciones y a los totales (conocida la distribución de la media y la proporción). Cabe resaltar que el conocimiento de estas distribuciones muestrales es el soporte fundamental para poder comprender el desarrollo de la estimación por intervalos y la docimasia de hipótesis a tratar capítulos más adelante. A continuación se desarrolla cada uno de los conceptos importantes de las distribuciones muestrales.

(34)

34

Población.- es el conjunto de todas las unidades de análisis (individuos u objetos) a

ser observadas y que poseen una característica común. Es decir, es el conjunto de todas las observaciones posibles que puede tomar una variable aleatoria X. Por ejemplo, en todas las empresas podemos estudiar: el número de trabajadores, las ventas, etc.; en todos los hogares podemos estudiar: los ingresos, los gastos, etc.

Muestra.- es una parte representativa de la población. La representatividad implica

adecuado: método de muestreo, tamaño de muestra, selección de la muestra y propuesta de estimadores (fórmulas). Relacionado al ejemplo anterior, la muestra vendría dada por una parte representativa de empresas u hogares.

Muestra Aleatoria.- Sea X una variable aleatoria con distribución de probabilidad

f(x) (función de cuantía o función de densidad) con media μ y varianza σ2

. Una muestra aleatoria (m.a.) de tamaño n de X, es un conjunto de n variables aleatorias (X1 , X2 , .... , Xn ) que cumplen:

1. Cada Xi (i = 1, 2, .... , n) tiene la misma distribución que X. Es decir, tienen la

misma distribución de probabilidades fX (x) fX(x)

i  , la misma función de

distribución acumulativa FX (x) FX(x)

i  , la misma media Xi= E(Xi) = E(X)

= μ con N X N i i

  1  y la misma varianza 2 I X  = V(Xi ) = V(X) = N X N i i

   1 2 2 ) (   .

2. Las variables aleatorias Xi (i = 1, 2, .... , n) son independientes. Por lo tanto la

función de probabilidad conjunta de la muestra aleatoria X1 , X2 , .... , Xn está

dada por:

   n i i X n X X X n X X X X X X f X f X f X f X f n 1 2 1 2 1 ,...., , 2 ( , ,...., ) ( ) ( ).... ( ) ( ) 1 .

Esta probabilidad de ocurrencia de la muestra observada, es importante en estimación puntual, ya que allí representa la función de verosimilitud a maximizar.

(35)

35

 La definición de m.a. se cumple cuando la muestra proviene de una población infinita (discreta o continua) y cuando la muestra se extrae con reemplazo de una población finita.

 La definición de m.a. no se cumple cuando el muestreo es sin reemplazo de una población finita, ya que las v.a. X1 , X2 , .... , Xn no son independientes. Sin

embargo, si el tamaño n de la muestra es muy pequeño en comparación con el tamaño N de la población (n < 5% N ) se cumple aproximadamente la definición.

Ejemplo 1.-

Si se toma una m.a. de tamaño n, de una población X con distribución de Poisson, con parámetro λ, hallar la función de probabilidad conjunta (función de verosimilitud) para dicha muestra.

Solución:

Como la v.a. X ~ Poisson (λ), entonces Xi ~ Poisson (λ) y su función de

probabilidad es: i n X e X f i X i X i ,...., 2 , 1 , ! ) (      ; Xi = 0, 1, 2, 3, ...

Luego la función de probabilidad conjunta (función de verosimilitud) será: ) ( ).... ( ) ( ) ,...., , ( 1 2 1 2 ,...., , 2 1X X n X X X n X X X X f X f X f X f n  =

  n i i X X e i 1 !   =       ! 1 1 X e X          ! 2 2 X e X  

 

....       ! n X X e n   = =

    n i i n X X e n i i 1 ! 1   , Xi = 0, 1, 2, 3, ... ;  i = 1, 2, .... , n . Rpta. Ejemplo 2.-

Si se toma una m.a. de tamaño n, de una población X con distribución N(μ , σ2

), hallar la función de probabilidad conjunta (función de verosimilitud) para dicha muestra.

(36)

36 Como la v.a. X ~ N(μ , σ2

), entonces Xi ~ N(μ , σ2 ) y su función de probabilidad

está dada por:    ; , 2 1 ) ( ( )2/2 2 2 i X i X X e X f i    i = 1, 2, 3, .... , n.

Luego la función de densidad conjunta (función de verosimilitud) será: ) ( ).... ( ) ( ) ,...., , ( 1 2 1 2 ,...., , 2 1X X n X X X n X X X X f X f X f X f n  = =      2 2 1 ) /2 ( 2 2 1    X e      2 2 2 ) /2 ( 2 2 1    X e

 

....      2 2 2 / ) ( 2 2 1    n X e = =        , ; 2 1 2 1( )2/2 2 2 i X n x e n i i    i = 1, 2, 3, .... , n. Rpta.

Estadístico.- es una variable aleatoria que depende sólo de la muestra observada.

Así, si X1 , X2 , .... , Xn es una m.a. de una población X, entonces la media muestral

( X ) y la varianza muestral (s2 ) son estadísticos. Donde:

n X X n i i

  1 y 1 ) ( 1 2 2   

n X X s n i i

Distribución muestral.- es la distribución de probabilidad de un estadístico.

Error estándar de un estadístico.- es la desviación estándar de la distribución

muestral de un estadístico.

Error relativo de un estadístico.- es el coeficiente de variación de la distribución

muestral de un estadístico.

Teorema 1.- Sea X1 , X2 , .... , Xn una muestra aleatoria de tamaño n de una

población X, con media E(X) = μ y varianza Var (X) = σ2

. Sea n X X n i i

  1 la media muestral, entonces: E(X) y

n X Var X 2 2 ) (     .

Teorema 2.- Sea X1 , X2 , .... , Xn una muestra aleatoria sin reemplazo de tamaño n

de una población X de tamaño N, con media E(X) = E(Xi ) = μ y varianza Var (X)

= Var (Xi) = σ2. Entonces: E(X)  y                   N n N n S N n N n X Var X 2 2 2 1 ) (   .

(37)

37 Donde: 1 ) ( 1 2 2   

N X S N i i

, representa la cuasivarianza poblacional y el factor

1   N n N

se llama factor de corrección para poblaciones finitas (f.c.p.f.) el mismo que es descartado cuando la fracción de muestreo (f )

1 1 97 . 0 05 . 0        N n N N n f .

A continuación presentamos las distribuciones muestrales de la media, del total (conocida la media), de la diferencia de medias muestrales, de la proporción, del total (conocida la proporción) y de la diferencia de proporciones. Todas ellas de suma importancia en el diario quehacer de muchos campos de la investigación científica, ya que como estudiaremos más adelante, van a permitir la determinación de intervalos de confianza y la verificación de hipótesis para los parámetros poblacionales.

2.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA

Teorema 3.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n de una

población X, con media E(X) = μ y varianza Var (X) = σ2

. Entonces, por el

teorema central del límite, la media muestral

n X X n i i

  1 tiene aproximadamente

distribución normal con media μ y varianza σ2

/n. XN(,2/n). Y la variable aleatoria n X Z / ) (   

 tiene aproximadamente distribución N(0, 1).

Este teorema es válido para cualquier población finita o infinita, discreta o continua, cuando el tamaño de la muestra n ≥ 30. Si la población es normal, se cumple cualquiera sea el tamaño n de la muestra.

Cuando la población es finita de N elementos y el muestreo es sin reemplazo, la variables aleatorias Xi no son independientes, entonces la distribución de X es

hipergeométrica, con:   ) (X E y           1 ) ( 2 2 N n N n X Var X   . Luego:

(38)

38

Teorema 4.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n extraida sin

reemplazo de una población X finita de tamaño N, con media E(X) = μ y varianza

Var (X) = σ2

. Entonces, la media muestral

n X X n i i

  1 tiene aproximadamente

distribución normal con media μ y varianza           1 ) ( 2 2 N n N n X Var X   . Y la variable aleatoria 1 ) (     N n N n X Z  

tiene aproximadamente distribución N(0, 1).

Ejemplo 3.-

En Lima Metropolitana la botella de aceite “primor” de un litro tiene un precio promedio de S/. 5.00 y una desviación estándar de S/. 0.40. Si se toman muestras aleatorias de 50 precios, se pide calcular e interpretar: a) la probabilidad que el precio promedio muestral se encuentre entre S/. 4.85 y 5.10; b) la probabilidad que el precio medio muestral sea inferior a S/. 4.80; y c) dentro de que límites simétricos alrededor del precio promedio verdadero se encontrará el 95 % de los precios promedios muestrales.

Solución.-

Como datos del problema se tiene que: μ = S/. 5.00 , σ = S/. 0.40 y n = 50.

n X Var X 2 2 ( )     = (0.40)2 / 50 = 0.0032 X 0.057.S/. Luego: XN(5.00;0.0032) y (0,1) 057 . 0 ) 00 . 5 ( N X Z    . Nos piden: a) P(4.85  X  5.10) =            057 . 0 00 . 5 10 . 5 057 . 0 00 . 5 057 . 00 . 5 85 . 4 X P = = P(-2.63  Z  1.75) =  (1.75) -  (-2.63) = = 0.95994 – 0.00427 = 0.95567 Rpta.

Interpretación.- el 95.567% de los precios promedios muestrales de las botellas de aceite “primor” de un litro, se encuentran entre S/. 4.85 y 5.10, para muestras de 50 precios. b) P( X < 4.80) = ) ( 3.51) 0.00022 057 . 0 00 . 5 80 . 4 057 . 0 00 . 5 (X    P Z   P

Referencias

Documento similar

CUARTA La prueba ANOVA indica que existe diferencia estadística significativa en los promedios de los ángulos goniaco total superior e inferior, así como en la media de la altura de

b Calcular, para cada una de estas distribuciones, la energía total del colectivo, la energía media por sistema, E = ∑4i=1pi Ei, donde pi = Mi/M es la probabilidad de que el sistema i