Cecilia Larraín Modelos de probabilidad continuos Página 1
ALGUNOS MODELOS CONTINUOS DE DISTRIBUCIÓN DE
PROBABILIDAD
Vamos a estudiar con más detalles algunos modelos de probabilidad de variables aleatorias continuas que serán de gran utilidad en la práctica.
Debemos seleccionar un modelo o función de probabilidad ya existente en la literatura estadística para describir el comportamiento de una variable aleatoria real, ya que es muy difícil elaborar un modelo en forma exacta de un problema concreto.
Con métodos estadísticos se puede validar si el modelo utilizado es adecuado para describir nuestros datos.
DISTRIBUCIÓN UNIFORME
La función de densidad uniforme se define como: X ~ U[a , b]
1
; a x b f(x)= b - a
0 ; en o.c.
Donde a y b son constante reales con a < b.
Media y varianza de la distribución Uniforme
b
x=a
1 a + b
E(X) = x dx=
b - a 2
Lo que es obvio por simetría
2
b 2
2
x=a
1 a + b (b - a)
V(X) = x dx - =
b - a 2 12
Función de distribución: F(X) = P(X < x)
P(X x)
0 ; x<a x - a
F(X) = ; a x < b
b - a
Cecilia Larraín Modelos de probabilidad continuos Página 2 Ejemplo: Las ganancias (Mill $) de una empresa se comportan según la siguiente función: G= 0,2X – 500.
La variable aleatoria X expresa la cantidad de unidades vendidas del producto que fabrica la empresa. Esta variable se distribuye según una U[2000 , 7000]
(a) ¿Cuál es la probabilidad de que la ganancia sea por lo menos $100.000.000?
(b) ¿Cuál es la probabilidad de tener pérdidas?
(c) Determine la ganancia esperada.
DISTRIBUCIÓN EXPONENCIAL
La función de densidad exponencial se define como: X ~ Exp(α)
-αx
αe ; x > 0 f(x)=
0 ; en o.c.
α > 0
Media y varianza de la distribución Exponencial
-αx
x=0
1 E(X) = x αe dx=
α
2 ¥
2 -αx
2 x=0
1 1
V(X) = x αe dx - =
α α
Función de distribución: F(X) = P(X < x)
-αx
F(x) = 1- e , x > 0
Cecilia Larraín Modelos de probabilidad continuos Página 3
Ejemplo: La vida en miles de horas de un instrumento electrónico se distribuye exponencialmente con media 1.
El costo de fabricación estos instrumentos es de $4000 y se venden en $9000. Calcule la utilidad esperada, si en la venta se garantiza la devolución del dinero si la duración es menor a 500 horas.
La distribución Normal
Muchas variables como el peso, estatura, edad, presión arterial, puntaje de un test psicológico, mediciones de calidad en muchos procesos industriales, … , se distribuyen Normal. Este modelo se caracteriza por tener un recorrido teórico que es el eje de todos los números reales y una función de densidad que tiene un gráfico acampanado y que se individualiza mediante dos parámetros:
µ representa a la media y σ2
Cecilia Larraín Modelos de probabilidad continuos Página 4 Algunas características de la distribución N(µ,σ2) (E(X) = μ, V(X) = σ2
)
- La función de densidad es simétrica, mesocúrtica y unimodal: P(X < μ) = P(X > μ) = 0,5
- Media, mediana y moda coinciden
- Entre la media y una desviación estándar hay aproximadamente un 68,2% de probabilidad. P( |X – μ| < σ) = 0,682
- Entre la media y dos desviaciones estándar hay aproximadamente un 95,4% de probabilidad P( |X – μ| < 2σ) = 0,954
- Entre la media y tres desviaciones estándar hay aproximadamente un 99,7% de probabilidad P( |X – μ| < 3σ) = 0,997
- Entre todos los modelos normales existentes destaca aquel que tiene media µ = 0 y varianza σ2 = 1 conocido como distribución normal estandar (o normal típica) para la cual
existen tablas (de probabilidades) muy completas.
Si la v.a. tiene distribución N(µ,σ2 )
entonces la v.a. Z = X - μ
σ tiene distribución nomal estandar. Esta propiedad facilita el cálculo de probabilidades
Ejemplo: El CI en seres humanos está distribuido normal con media 100 y desviación estándar 10. Si una persona es elegida al azar:
a. ¿cuál es la probabilidad de que su CI sea inferior a 115?
X = CI de un sujeto
P(X < 115) = 115 100
10 X - μ
σ
P = P(Z < 1,5) = 0,93319
Distribución Normal estandarizada N(0, 1) P(Z < z0)
z Prob. z Prob. z Prob. z Prob
. . .
-1,66 0,04846 -1,20 0,11507 -0,74 0,22965 -0,28 0,38974
-1,65 0,04947 -1,19 0,11702 -0,73 0,23270 -0,27 0,39358
-1,64 0,05050 -1,18 0,11900 -0,72 0,23576 -0,26 0,39743
. . .
0,45 0,67364 0,91 0,81859 1,37 0,91466 1,83 0,96638
. . .
0,57 0,71566 1,03 0,84849 1,49 0,93189 1,95 0,97441
0,58 0,71904 1,04 0,85083 1,50 0,93319 1,96 0,97500
0,59 0,72240 1,05 0,85314 1,51 0,93448 1,97 0,97558
. . .
0,62 0,73237 1,08 0,85993 1,54 0,93822 2,00 0,97725
Cecilia Larraín Modelos de probabilidad continuos Página 5 b. ¿Cuál es la probabilidad de que su CI supere 118 puntos
c. Determine la probabilidad de que su CI se encuentre entre 95 y 110 puntos.
d. Si se sabe que el sujeto seleccionado supera los 105 puntos de CI, determine la probabilidad de que su CI sea inferior a 120
Aplicaciones de modelos continuos a ingeniería
Modelo Parámetros Función de densidad
f(x) Media Varianza
Uniforme a , b
b > a
1
; a x b f(x)= b - a
0 ; en o.c.
a + b 2
2
(b - a) 12
Exponencial α > 0
-αx
αe , x > 0 f(x)=
o , en o.c
1
α 2
1 α
Normal
μ , σ σ > 0 μ
2
1 2
1 f(x) =
2
x
e
- < x <
μ σ2
Ejercicio 1
Cecilia Larraín Modelos de probabilidad continuos Página 6 Ejercicio 2
El tiempo de duración de los chips producidos por un fabricante de semiconductores es una variable aleatoria cuya distribución es aproximadamente normal con media 5·106 horas y desviación estándar 5·105 horas.
a. Un fabricante de computadores está dispuesto a comprar una gran cantidad de chips siempre que al menos el 95% del lote tenga un tiempo de vida superior a 4·106. ¿Qué decisión debería tomar en vista de la información disponible?
b. Determine entre que valores (duraciones) se encuentra el 50% central de la variable.
Ejercicio 3
La resistencia a la tracción de un papel esta modelada por una distribución Normal con media 35 libras por pulgada cuadrada y desviación estándar de 2 libras por pulgada cuadrada.
a. Las especificaciones requieren que la resistencia se encuentre en un intervalo centrado en la media y de amplitud dos desviaciones estándar. ¿Qué porcentaje de las hojas de papel serán rechazadas por no cumplir las especificaciones?
b. ¿Cuál es la resistencia mínima del 60% de los papeles que tienen mayor resistencia a la tracción?
Ejercicio 4
La duración ininterrumpida de un equipo electrónico tipo A es una variable aleatoria distribuida normalmente con media 1400 horas y varianza 800 horas2, y la duración ininterrumpida de un equipo tipo B se distribuye exponencialmente con media 1500 horas.
¿Qué tipo de equipo es más conveniente elegir si se necesita realizar un proceso que dure al menos 1340 horas, sin interrupción?
Ejercicio 5 (modelo exponencial)
Una empresa suministra una serie de componentes con una vida media de
30000 horas. El riesgo de rotura de los mismos crece a lo largo del tiempo según una función exponencial (α = 0,0003)
Cecilia Larraín Modelos de probabilidad continuos Página 7 b.1. Si los componentes tienen una garantía de un mes, calcule la probabilidad de que un componente se rompa estando en garantía. (resp.: 0,1943)
b.2. En un lote de 50 componentes, ¿cuántas se esperan que se devuelvan estando en garantía? (resp.: ≈10)
Ejercicio 6
En una distribución normal el 31% de los elementos están bajo de 45 y el 8% sobre 64. Determine , y P65.
Ejercicio 7
En cierta comuna el 12,10% de las familias tienen un consumo de energía eléctrica superior a 260 kwh y el 2,28% de las familias gastan a lo más 4089 um mensuales en electricidad. Si el consumo mensual de energía eléctrica, por familia es una v.a. con distribución normal y la compañía eléctrica cobra 16,4 um por kwh más un costo adicional fijo de 317 um , ¿qué porcentaje de las familias de la comuna gasta más de 4100 um mensuales en energía eléctrica?
Ejercicio 8
Una cajera de supermercado demora en promedio 100 segundos en atender a un cliente. Si se establecen como válidos los supuestos de Poisson:
¿Cuál es la probabilidad que la cajera atienda a más de 20 cliente en 25 minutos? (Utilice Excel)
Ejercicio 9
La duración X en minutos de las conexiones a un servidor web sigue una distribución Normal de la que se sabe:
P(X < 9) = 0,879 P(X < 2,32) = 0,015
a. Determinar la probabilidad de que una conexión dure más de 4 minutos
b. Qué valor (minutos) supera el 30% de las conexiones?
Cecilia Larraín Modelos de probabilidad continuos Página 8 Ejercicio 10
Cierto tipo de transistor deberá utilizarse en cierta aplicación por lo menos durante 50 horas. Se dispone de dos marcas de transistores. La duración de un transistor marca I tiene una distribución normal con media 46 hr. y desviación estándar de 6 hr, en cambio la duración de los transistores marca II tienen un comportamiento normal con media 40 hr. y desviación estándar de 14 horas. a. ¿Qué marca de transistor recomendaría Ud.? Justifique su respuesta.
b. Se seleccionan al azar y en forma independiente cinco transistores de la marca II. ¿Cuál es la probabilidad de que por lo menos uno dure más de 50 horas?
c. Si un transistor de la marca I lleva funcionando más de 50 h, ¿cuál es la probabilidad de que dures menos de 65 horas?
Ejercicio 11
La resistencia de un cable eléctrico de alta tensión se considera una variable aleatoria con distribución normal con una media de 36 (ohmios) y una varianza de 0,64 (ohmios)2. Un cable se considera defectuoso si su resistencia es inferior a 35 (ohmios).
a. De los cables que tienen una resistencia superior a 34 (ohmios) ¿Qué proporción de cables se consideran defectuosos?
Sol: X = resistencia de un cable eléctrico de alta tensión
X ~ N(μ = 36 , σ2 = 0,64)
P(X < 35 / X > 34) = P(34 < X < 35) P(X > 34) =
Z Z
Z
F (-1,25) - F (-2,5)
1 - F (-2,5) =
0,1057 0,0062 1 0,0062
= 0,1001
b. Se eligen al azar y en forma independiente 10 cables, ¿Cuál es la probabilidad que más de 2 cables resulten defectuosos?
Sol: Y = n° de cables defectuosos en la muestra
Y ~ B(n = 10 , p = 0,1057) p = P(X < 35) = 0,1057 q = 0,8943
10
10
( ) (0,1057) (0,8943)y y ; y = 0,1,2, ...,10
p y y
P(Y > 2) = 1 – P(Y < 2)
= 1 – [P( Y = 0) + (P = 1) + P(Y = 2)] = 1 – (0,3272 + 0,3867 + 0,2057)
= 1 – 0,9186
Cecilia Larraín Modelos de probabilidad continuos Página 9
Ejercicio 12
La velocidad de los microprocesadores de una determinada marca fabricados en una planta es una variable aleatoria que se distribuye según una normal de media 3 GHz, además el 97,725% de los microprocesadores tienen velocidad inferior a 3,03 GHz . Para poder proceder a su venta, se consideran aceptables los microprocesadores que tienen una velocidad mayor que 2,98 GHz y menor que 3,05 GHz
a. Determine la probabilidad de que un microprocesador elegido al azar sea aceptable.
X = velocidad de un microprocesador GHz X ~ N(μ = 3 , σ2
= ?)
Calculo de σ: P(X < 3,03) = 0,97725
P 3,03 - 3
σ = 0,97725
3,03 - 3
= 2 σ = 0,015
σ
P(aceptable) = P(2,98 < X < 3,05) = P(-1,33 < Z < 3,33) = FZ(3,33) – FZ(-1,33) = 0,99957 – 0,09176
= 0,90781
b. Si se toma una muestra aleatoria al azar de cuatro microprocesadores, ¿cuál es la probabilidad de que por lo menos uno no sea aceptable?
Y = Número de microprocesadores no aceptable en la muestra
Y ~ B(n = 4 , p =0,09219) p = P(2,98 < X < 3,05)C = 1- 0,90781
= 0,09219 → q = 0,90781
P(pedida) = P(Y > 1) = 1 - P(Y = 0)
0 4
4
= 1- (0,09219) (0,90781)
Cecilia Larraín Modelos de probabilidad continuos Página 10 Ejercicio 13
En la red informática de una empresa hay 3 sistemas multiusuario, que se identificarán como S1, S2 y S3. Las peticiones de conexión que se realizan a estos equipos se reparten de forma que, el 60% se efectúan sobre S1, el 30% sobre S2 el 10% sobre S3.
Los tiempos de respuestas a estas peticiones son variables aleatorias, expresadas en segundos, tal que:
i) El tiempo (X1) de respuesta de S1, en segundos, se distribuye
exponencialmente en media 5 seg.
ii) El tiempo (X2) de respuesta de S2, se segundos, tiene una distribución
normal con media 6 seg y desviación estándar de 2 seg.
iii) El tiempo (X3) de respuesta de S3, en segundos, se distribuye uniforme
entre 4 seg. y 8 seg.
Si el tiempo de respuesta de una petición de conexión supera los 7 segundos, se dice que la petición es fallida, y en otro caso se considera petición atendida.
a) Calcule la probabilidad de que una petición seleccionada aleatoriamente
sea fallida. Resp.: 0,2655 b) En 10 peticiones de conexión al sistema S2, seleccionadas
aleatoriamente y de forma independiente entre sí, determine la probabilidad de que resulten al menos una petición de las que se consideran atendidas.
Resp.: 0,999
PROPIEDAD REPRODUCTIVA DE LA DISTRIBUCIÓN NORMAL
Sea X ~ N( 2 X
μ ,σx) e Y ~ N( 2 Y
μ ,σY) v.a. independientes
Entonces X + Y ~ N( 2 2
X Y
μ μ ,σ + σX Y )
Sea X1, X2, …Xn n variables aleatorias independientes idénticamente
distribuidas f(x) con E(X) = μ y V(X) = σ2
Entonces X1 + X2 + … + Xn se aproxima a una distribución N(n μ , n σ2)
cuando n→
f(x) puede ser modelo discreto o continuo
Cecilia Larraín Modelos de probabilidad continuos Página 11 Ejercicio 14
El diámetro interior de una tuerca (X) es un variable aleatoria que se distribuye normal con media 12,4 mm y una desviación estándar de 1,0 mm. Por otro lado el diámetro de los pernos (Y) se distribuye normal con una media de 12 mm y una desviación estándar de 0,8 mm.
a. El 16,6% de los pernos serán retirados puesto que poseen un diámetro demasiado grande para que ajusten a una tuerca. ¿Cuál es el diámetro máximo que debe tener un perno para no ser retirado de la partida?
b. Si se toma un perno y una tuerca al azar, ¿Cuál es la probabilidad que diámetro de la tuerca sea mayor al diámetro del perno en más de 0,02 mm?
Ejercicio 15
En una industria que fabrica estructuras metálicas modulares, se define la resistencia (Y) a la tensión y la carga (X) a que son sometidas, tal que X e Y son variables aleatorias independientes, distribuidas:
N ( y = 960 kg ; 2y = (72 kg) 2
) N ( x = 710 kg ; 2x = (84 kg) 2
)
a. Determine el porcentaje de estructuras metálicas modulares que pueden soportar la carga a que son sometidas (Y > X).
b. Se eligen al azar estructuras metálicas modulares y se someten a prueba hasta encontrar tres estructuras con resistencia a la tensión de a lo más 865 kg.
Cecilia Larraín Modelos de probabilidad continuos Página 12
TALLER
Problema 1
Ciertos tornillos son clasificado como defectuosos si su largo (X) o su radio (Y) están fuera de los límites de tolerancia especificado a continuación:
19,80 mm < largo < 20,20 mm y 4,78 mm < radio < 5,22 mm. Basados en la historia se determinó que:
X ~ N( 2
X X
(μ 20; σ = 0,02) , Y ~ N( 2
Y Y
(μ 5 ; σ ) y el 97,725% de los tornillos tienen radios inferior a 5,36 mm.
Si se asume que X e Y son variables aleatoria estadísticamente independientes,
a. Calcule la probabilidad de que un tornillo elegido al azar sea defectuoso
b. Determine la probabilidad de que en una muestra de 10 tornillos, elegidos de distintos lotes, resulten más de tres con los radios fuera del límite de tolerancia.
c. Determine e interprete el valor de x0 tal que la P( X < x0) = 0,975 Problema 2
El diámetro (X) de cierto fruto exportado se considera una v.a. distribuida normal, con media 5 cm. y desviación estándar 0.5 cm. Se supone que los diámetros de los frutos son independientes.
a. Los frutos exportados con diámetro inferior a 4 cm. representan una pérdida de $10 por fruto, en cambio los frutos con diámetro superior o igual a 4 cm. representan una utilidad de $50 por fruto, además los frutos con diámetros superior a 6 cm. el comprador bonifica el precio en $30. ¿Cuál es la utilidad esperada por fruto exportado?.
b. Se desea encontrar un fruto cuyo diámetro mida entre 5,12 y 5,85 cm, para lo cual se miden uno a uno los diámetros de los frutos hasta encontrarlo.
Calcule la probabilidad de que se deban hacer más de tres mediciones. c. Se miden los diámetros de 10 frutos elegidos independientemente. ¿Cuál es
la probabilidad de que por lo menos dos frutos tengan un diámetro inferior a 5 cm?
Problema 3
Se supone que el n° de bacterias por mm3 de agua es un estanque es una variable aleatoria función de probabilidad Poisson de parámetro 0,5:
a. ¿Cuál es la probabilidad de que no haya bacterias en 1 mm3 de agua. b. ¿Si se sabe que en un tubo hay bacterias, ¿Cuál es la probabilidad de que
haya menos de tres bacterias por mm3 de agua en dicho tubo.