binomial negativa (opcional)
3.8 La distribución de probabilidad de Poisson
Suponga que deseamos hallar la distribución de probabilidad del número de accidentes auto- movilísticos ocurridos en un crucero particular durante un periodo de una semana. A primera vista esta variable aleatoria, el número de accidentes, no parece estar ni remotamente relacio- nada con una variable aleatoria binomial, pero veremos que existe una relación interesante.
Considere el periodo, una semana en este ejemplo, como dividido entre n subintervalos, cada uno de los cuales es tan pequeño que a lo sumo un accidente podría ocurrir en él con probabilidad diferente de cero. Denotando con p la probabilidad de un accidente en cualquier subintervalo, tenemos, para todos los fi nes prácticos,
P(no ocurren accidentes en un subintervalo) = 1 – p, P(ocurre un accidente en un subintervalo) =p, P(ocurre más de un accidente en un subintervalo) = 0.
Entonces el número total de accidentes en la semana es precisamente el número total de su- bintervalos que contienen un accidente. Si la ocurrencia de accidentes puede ser considerada como independiente de un intervalo a otro, el número total de accidentes tiene una distribu- ción binomial.
Aun cuando no hay una forma única de seleccionar los subintervalos y por tanto no co- nocemos ni n ni p, parece razonable que cuando dividimos la semana en un número ma- yor de n subintervalos, disminuye la probabilidad p de un accidente en uno de estos su- bintervalos más cortos. Haciendo l= np y tomando el límite de la probabilidad binomial
p(y)= ny py(1−p)n−ycuandonS q , tenemos lím nS q n y p y (1−p)n−y= lím nS q n(n−1) (n−y+1) y! l n y 1−l n n−y = lím nS q ly y! 1− l n n n(n−1) (n−y+1) ny 1− l n −y = ly y!nlímS q 1− l n n 1−l n −y 1−1 n × ⋅⋅⋅ ⋅⋅⋅ 1− 2 n × ⋅⋅⋅× 1− y−1 n . Si observamos que lím nS q 1− l n n =e−l
y todos los otros términos a la derecha del límite tienen un límite de 1, obtenemos
p(y)=l y
y!e
−l.
(Nota:e= 2.718….) Se dice que las variables aleatorias que poseen esta distribución tienen una distribución de Poisson. En consecuencia, Y, el número de accidentes por semana, tiene la distribución de Poisson que acabamos de deducir.
Debido a que la función de probabilidad binomial converge a la de Poisson, las probabilida- des de Poisson se pueden usar para calcular sus similares binomiales para n grande, p pequeña y
l=np menor que, aproximadamente, 7. El Ejercicio 3.134 pide al estudiante calcular proba- bilidades binomiales y de Poisson correspondientes y demostrará lo adecuado del cálculo.
Es frecuente que la distribución de probabilidad de Poisson brinde un buen modelo para la distribución de probabilidad del número Y de eventos raros que ocurren en el espacio, tiempo, volumen o cualquier otra dimensión, donde l es el valor promedio de Y. Como hemos obser- vado, proporciona un buen modelo para la distribución de probabilidad del número Y de acci- dentes automovilísticos, industriales y otros tipos en una unidad de tiempo determinada. Otros ejemplos de variables aleatorias con distribuciones aproximadas de Poisson son el número de llamadas telefónicas manejadas por un conmutador en un intervalo, el número de partículas radiactivas que se desintegran en un periodo particular, el número de errores que comete una mecanógrafa al escribir una página y el número de automóviles que usan una rampa de acceso a una autopista en un intervalo de diez minutos.
DEFINICIÓN3.11 Se dice que una variable aleatoria Y tiene distribución de probabilidad de Poisson si y sólo si p(y)= y y!e −l, y l l =0, 1, 2, . . . > 0.
Como veremos en el Teorema 3.11, el parámetro l que aparece en la fórmula para la dis- tribución de Poisson es en realidad la media de la distribución.
EJEMPLO 3.18 Demuestre que las probabilidades asignadas por la distribución de probabilidad de Poisson satisfacen los requisitos de que 0 ≤p(y) ≤ 1 para toda y y yp(y) = 1.
Solución Como l > 0, es obvio que p(y) > 0 para y= 0, 1, 2,..., y que p(y) = 0 de otro modo. Además, q y=0 p(y)= q y=0 y l l l l y l l !e − =e− q y=0 y y! =e − e =1
porque la suma infi nita q y=0
y/y
l ! es una expansión de serie de el. En el Apéndice A1.11 se dan sumas de series especiales. Q
EJEMPLO3.19 Suponga que se diseña un sistema aleatorio de patrulla de policía para que un ofi cial de patru- lla pueda estar en un lugar de su ruta Y= 0, 1, 2, 3, . . . veces por periodo de media hora, con cada lugar visitado un promedio de una vez por periodo. Suponga que Y posee, aproximada- mente, una distribución de probabilidad de Poisson. Calcule la probabilidad de que el ofi cial de patrulla no llegue a un lugar determinado durante un periodo de media hora. ¿Cuál es la probabilidad de que el lugar sea visitado una vez? ¿Dos veces? ¿Al menos una vez?
W-cap-03.indd 132
Solución Para este ejemplo el periodo es media hora y el número medio de visitas por intervalo de media hora es l= 1. Entonces
p(y)= (1)
ye−1
y! =
e−1
y! y=0, 1, 2, . . .
El evento de que un lugar determinado no sea visitado en un periodo de media hora corres- ponde a (Y= 0), y P(Y =0) =p(0) =e −1 0! =e −1= .368. Del mismo modo,
p(1) =e −1 1! =e −1= .368, y p(2) =e −1 2! = e−1 2 = .184.
La probabilidad de que el lugar sea visitado al menos una vez es el evento (Y≥ 1). Entonces
P(Y ≥1)= q y=1
p(y)=1−p(0)=1−e−1=.632. Q
Si Y tiene una distribución de Poisson con media l, P(Y= y0) =p(y0) se pueden hallar con el uso del comando dpois(y0,l). de R (o s-Plus). Si deseáramos usar R para obtener p(2) en el Ejemplo 3.19, usamos el comando dpois(2,1). Alternativamente, P(Y≤y0) se encuentra con el uso del comando de ppois(y0,l)R (o S-Plus).
EJEMPLO3.20 Cierto tipo de árbol tiene plantas que han crecido de semillas dispersas al azar en una super- fi cie grande, con la densidad media de plantas siendo aproximadamente de cinco por yarda cuadrada. Si esa zona un guardabosques localiza al azar diez regiones de muestreo de 1 yar- da cuadrada, encuentre la probabilidad de que ninguna de las regiones contenga plantas que hayan crecido de semillas.
Solución Si las plantas realmente están dispersas al azar, el número de plantas por región, Y, se puede modelar como una variable aleatoria de Poisson con l = 5. (La densidad promedio es de cinco por yarda cuadrada.) Entonces,
P(Y =0)= p(0) =l 0e− 0! =e −5 l =.006738.
La probabilidad de que Y = 0 en diez regiones seleccionadas de manera independiente es (e–5)10 porque la probabilidad de la intersección de eventos independientes es igual al pro- ducto de las probabilidades respectivas. La probabilidad resultante es en extremo pequeña. Entonces, si este evento ocurriera en realidad, cuestionaría seriamente la suposición de alea- toriedad, la densidad promedio de plantas expresada o ambos. Q
Para comodidad del estudiante, damos en la Tabla 3, Apéndice 3, las sumas parciales a
y=0p(y) para la distribución de probabilidad de Poisson para muchos valores de l entre
.02 y 25. Esta tabla se ha elaborado de manera similar a la tabla de sumas parciales para la distribución binomial, Tabla 1, Apéndice 3. El siguiente ejemplo ilustra el uso de la Tabla 3 y demuestra que la distribución de probabilidad de Poisson puede aproximar la distribución de probabilidad binomial.
EJEMPLO3.21 Suponga que Y posee una distribución binomial con n= 20 y p= .1. Encuentre el valor exacto de P(Y≤ 3) usando la tabla de probabilidades binomiales, Tabla 1, Apéndice 3. Use la Tabla 3, Apéndice 3, para aproximar esta probabilidad, usando una probabilidad correspondiente dada por la distribución de Poisson. Compare los valores exacto y aproximado para P(Y≤ 3). Solución De acuerdo con la Tabla 1, Apéndice 3, el valor exacto (hasta tres lugares decimales) de P(Y≤ 3)
= .867. Si W es una variable aleatoria con distribución de Poisson con l=np= 20(.1) = 2, los análisis previos indican que P(Y≤ 3) es aproximadamente igual a P(W≤ 3). La Tabla 3, Apéndice 3, [o el comando ppois(3,2)de R], da P(W≤ 3) = .857. Entonces, se puede ver que la aproximación de Poisson es bastante buena, dando un valor que difi ere del valor
exacto en sólo .01. Q
En nuestra deducción de la media y la varianza de una variable aleatoria con distribución de Poisson, de nuevo usamos la propiedad fundamental que yp(y) = 1 para cualquier dis- tribución de probabilidad discreta.
TEOREMA3.11 Si Y es una variable aleatoria que posee una distribución de Poisson con parámetro l, entonces
m =E(Y) = y 2=V(Y) =l. Demostración Por defi nición,
E(Y) = y yp(y) = q y=0 l yl ye− y! .
Observe que el primer término de esta suma es igual a 0 (cuando y= 0) y, por tanto,
E(Y)= q y=1 y ye−l l y l l ! = q y=1 ye− (y−1)!.
Así como está, esta cantidad no es igual a la suma de los valores de una función de pro- babilidad p(y) para todos los valores de y, pero podemos cambiarla a la forma apropiada al factorizar l de la expresión y haciendo z=y – 1. Entonces los límites de sumatoria se convierten en z= 0 (cuando y= 1) y z=q (cuando y=q), y
E(Y)= q y l l =1 y−1e− (y−1)!=l q z=0 ze l l l − z! . W-cap-03.indd 134 W-cap-03.indd 134 27/7/09 02:02:0927/7/09 02:02:09
Observe que p(z) =lze–l/z! es la función de probabilidad para una variable aleatoria
de Poisson, y qz=0p(z) = 1. Por tanto, E(Y) =l. Entonces, la media de una variable
aleatoria de Poisson es el parámetro individual l que aparece en la expresión para la función de probabilidad de Poisson.
Dejamos la obtención de la varianza como Ejercicio 3.138.
Una forma común de encontrar una variable aleatoria con una distribución Poisson es por medio de un modelo llamado proceso Poisson, que es un modelo apropiado para si- tuaciones como la que se describe al principio de esta sección. Si observamos un proce- so Poisson y l es el número medio de sucesos por unidad (longitud, área, etc.), entonces Y = número de sucesos en a unidades tiene una distribución Poisson con media al. Una suposición clave en el desarrollo de la teoría del proceso Poisson es la independencia de los números de sucesos en intervalos inconexos (áreas, etc.). Vea en la obra de Hogg, Craigla, y McKean (2005) un desarrollo teórico del proceso Poisson.
EJEMPLO3.22 Ocurren accidentes industriales de acuerdo con un proceso Poisson con un promedio de tres accidentes por mes. Durante los últimos dos meses ocurrieron diez accidentes. ¿Este número parece altamente improbable si el número medio de accidentes por mes, m, es todavía igual a 3? ¿Indica un aumento en el número medio de accidentes por mes?
Solución El número de accidentes en dos meses, Y, tiene una distribución de probabilidad de Poisson con media l*= 2(3) = 6. La probabilidad de que Y sea de hasta 10 es
P(Y ≥10) = q
y=10
6ye−6 y! .
El tedioso cálculo necesario para hallar P(Y≥ 10) se puede evitar con el uso de la Tabla 3, Apéndice 3, de software como R [ppois (9, 6)da P(Y≤ 9)] o la regla empírica. Del Teorema 3.11,
m= l*= 6, s2= l*=6, s=√6=2.45.
La regla empírica nos dice que deberíamos esperar que Y tome valores en el intervalo m ± 2 con una alta probabilidad.
Advierta que m + 2= 6 + (2)(2.45) = 10.90. El número observado de accidentes, Y= 10, no está a más de 2 de m, pero está cerca de la frontera. Por tanto, el resultado observado no es altamente improbable, pero puede ser sufi cientemente improbable para garantizar una investigación. Vea en el Ejercicio 3.210 la probabilidad exacta P(|Y – l|≤ 2). Q
Ejercicios
3.121 Denote con Y una variable aleatoria que tenga una distribución de Poisson con media l= 2. Encuentre
a P(Y =4).
b P(Y ≥4).
c P(Y <4).
d P(Y ≥4Y≥2).
3.122 Llegan clientes a un mostrador de salida en una tienda de departamentos de acuerdo con una distribución de Poisson, a un promedio de siete por hora. Durante una hora determinada, ¿cuáles son las probabili- dades de que
a no lleguen más de tres clientes?, b lleguen al menos dos clientes?, c lleguen exactamente cinco clientes?
3.123 La variable aleatoria Y tiene una distribución de Poisson y es tal que p(0) =p(1). ¿Cuál es p(2)?
3.124 Aproximadamente 4% de las obleas de silicio producidas por un fabricante tienen menos de dos defec- tos grandes. Si Y, el número de defectos por oblea, tiene una distribución de Poisson, ¿qué proporción de las obleas tiene más de cinco defectos grandes? [Sugerencia: use la Tabla 3, Apéndice 3.]
3.125 Consulte el Ejercicio 3.122. Si se requieren alrededor de diez minutos para servir a cada cliente, encuen- tre la media y la varianza del tiempo total de servicio para clientes que lleguen durante un periodo de 1 hora. (Suponga que hay un número sufi ciente de dependientes para que el cliente no tenga que esperar ser atendido.) ¿Es probable que el tiempo total de servicio exceda de 2.5 horas?
3.126 Consulte el Ejercicio 3.122. Suponga que ocurren llegadas de acuerdo con un proceso de Poisson con un promedio de siete por hora. ¿Cuál es la probabilidad de que exactamente dos clientes lleguen en dos horas entre
a las 2:00 p.m. y las 4:00 p.m. (un periodo continuo de dos horas)?,
b la 1:00 p.m. y las 2:00 p.m. o entre las 3:00 p.m. y las 4:00 p.m. (dos periodos de una hora separados que totalizan dos horas)?
3.127 El número de errores mecanográfi cos hechos por una secretaria tiene una distribución de Poisson con un promedio de cuatro errores por página. Si en una página se dan más de cuatro errores, la secretaria debe volver a escribir toda la página. ¿Cuál es la probabilidad de que una página seleccionada al azar no tenga que volver a ser escrita?
3.128 Llegan autos a una caseta de pago de peaje de acuerdo con un proceso de Poisson con media de 80 autos por hora. Si el empleado hace una llamada telefónica de 1 minuto, ¿cuál es la probabilidad de que al menos 1 auto llegue durante la llamada?
3.129 Consulte el Ejercicio 3.128. ¿Cuánto puede durar la llamada telefónica del empleado si la probabilidad es al menos .4 de que no lleguen autos durante la llamada?
3.130 Un lote de estacionamiento tiene dos entradas. Llegan autos a la entrada I de acuerdo con una distri- bución de Poisson a un promedio de tres por hora y a la entrada II de acuerdo con una distribución de Poisson a un promedio de cuatro por hora. ¿Cuál es la probabilidad de que un total de tres autos lleguen al lote de estacionamiento en una hora determinada? (Suponga que los números de autos que llega a las dos entradas son independientes.)
3.131 El número de nudos en un tipo particular de madera tiene una distribución de Poisson con un promedio de 1.5 nudos en 10 pies cúbicos de madera. Encuentre la probabilidad de que un bloque de 10 pies cú- bicos de madera tenga a lo sumo 1 nudo.
3.132 El número medio de automóviles que entran al túnel de una montaña por periodo de dos minutos es uno. Un número excesivo de autos que entren al túnel durante un breve tiempo produce una situación peligrosa.
W-cap-03.indd 136
Encuentre la probabilidad de que el número de autos que entran durante un periodo de dos minutos exceda de tres. ¿El modelo de Poisson parece razonable para este problema?
3.133 Suponga que el túnel del Ejercicio 3.132 se observa durante diez intervalos de dos minutos, dando así diez observaciones independientes Y1, Y2, … ,Y10, en la variable aleatoria de Poisson. Encuentre la pro- babilidad de que Y> 3 durante al menos uno de los diez intervalos de dos minutos.
3.134 Considere un experimento binomial para n= 20, p= .05. Use la Tabla 1, Apéndice 3, para calcular las probabilidades binomiales para Y= 0, 1, 2, 3 y 4. Calcule las mismas probabilidades usando la aproxi- mación de Poisson con l=np. Compare.
3.135 Un vendedor ha encontrado que la probabilidad de una venta en un solo contacto es aproximadamente .03. Si el vendedor hace contacto con 100 posibles clientes, ¿cuál es la probabilidad aproximada de hacer al menos una venta?
3.136 Más investigación y análisis se han concentrado en el número de enfermedades en las que aparece el organismo Escherichia coli (10257:H7), que causa una ruptura de células sanguíneas y hemorragia in- testinal en sus víctimas (http://www.hsus.org/ace/11831, marzo 24, de 2004). Esporádicos brotes de E.coli han aparecido en Colorado a razón de aproximadamente 2.4 por 100,000 durante un periodo de dos años.
a Si este índice no ha cambiado y si 100,000 casos de Colorado se revisan para este año, ¿cuál es la probabilidad de que se observen al menos 5 casos de E.coli?
b Si 100,000 casos de Colorado se revisan para este año y el número de casos de E.coli excede de 5, ¿es de esperarse que haya cambiado la media estatal del índice de E.coli? Explique.
3.137 La probabilidad de que un ratón inoculado con un suero contraiga cierta enfermedad es .2. Usando la aproximación de Poisson, encuentre la probabilidad de que al menos 3 de entre 30 ratones inoculados contraigan la enfermedad.
3.138 Sea Y que tiene una distribución de Poisson con media l. Encuentre E[Y(Y – 1)] y luego use esto para demostrar que V(Y) =l.
3.139 En la producción diaria de cierta clase de cuerda, el número de defectos por pie Y se supone que tiene una distribución de Poisson con media l= 2. La utilidad por pie cuando se venda la cuerda está dada por X, donde X= 50 – 2Y – Y 2. Encuentre la utilidad esperada por pie.
*3.140 El propietario de una tienda ha abarrotado cierto artículo y decide usar la siguiente promoción para dis- minuir la oferta. El artículo tiene un precio marcado de $100. Por cada cliente que compre el artículo du- rante un día en particular, el propietario reducirá el precio en un factor de un medio. Entonces, el primer cliente pagará $50 por el artículo, el segundo pagará $25 y así sucesivamente. Suponga que el número de clientes que compren el artículo durante el día tiene una distribución de Poisson con media 2. Encuentre el costo esperado del artículo al fi nal del día. [Sugerencia: el costo al fi nal del día es 100(1/2)Y, donde Y es el número de clientes que han comprado el artículo.]
3.141 Un fabricante de alimentos usa una máquina de moldeo por inyección (que produce galletas del tamaño de un bocado y botanas) que proporciona un ingreso para la empresa a razón de $200 por hora cuando está en operación. No obstante, la máquina se descompone a un promedio de dos veces por cada día que trabaja. Si Y denota el número de descomposturas por día, el ingreso diario generado por la máquina es R= 1600 – 50Y2. Encuentre el ingreso diario esperado por usar la máquina.
*3.142 Denote con p(y) la función de probabilidad asociada con una variable aleatoria de Poisson con media l.
a Demuestre que la relación entre probabilidades sucesivas satisface la igualdad p(y) l
p(y−1) = y, para y= 1, 2, . . .
c Observe que el resultado del inciso a implica que las probabilidades de Poisson aumentan por un tiempo cuando y aumenta y disminuyen de ahí en adelante. Demuestre que p(y) es maximizada cuan- do y= al máximo entero menor o igual que l.
3.143 Consulte el Ejercicio 3.142 c. Si el número de llamadas telefónicas al departamento de bomberos, Y, en un día tiene una distribución de Poisson con media de 5.3, ¿cuál es el número más probable de llamadas telefónicas al departamento de bomberos en cualquier día?
3.144 Consulte los ejercicios 3.142 y 3.143. Si el número de llamadas telefónicas al departamento de bombe- ros, Y, en un día tiene una distribución Poisson con media 6, demuestre que p(5) =p(6) de modo que 5 y 6 son los dos valores más probables para Y.
3.9 Momentos y funciones generadoras
de momento
Los parámetros m y son medidas descriptivas numéricas signifi cativas que ubican el centro y describen la dispersión asociada con los valores de una variable aleatoria Y, pero no dan una caracterización única de la distribución de Y. Muchas distribuciones diferentes poseen las mismas medias y desviaciones estándar. A continuación consideramos un conjunto de medidas descriptivas numéricas que (al menos en ciertas condiciones) determinan p(y) de manera única.
DEFINICIÓN3.12 El k-ésimo momento de una variable aleatoria Y tomada alrededor del origen se defi ne como E(Yk) y se denota con
k m .
Observe en particular que el primer momento alrededor del origen es E(Y)=m1=m y que
2=E
m (Y2) se emplea en el Teorema 3.6 para hallar s2.
Otro momento útil de una variable aleatoria es el tomado alrededor de su media. DEFINICIÓN3.13 El k-ésimo momento de una variable aleatoria Y tomado alrededor de su media o el
k-ésimo momento central de Y, se defi ne como E[(Y – m)k] y está denotado por m k.
En particular, 2= m 2.
Concentremos nuestra atención en los momentos mk alrededor del origen donde k= 1, 2, 3, . . . Suponga que dos variables aleatorias Y y Z poseen momentos fi nitos con
1Y
m = m1Y,m2Y =m2Z, . . . ,mj Y=mj Z , donde j puede tomar cualquier valor entero. Esto
es, las dos variables aleatorias poseen momentos correspondientes idénticos alrededor del ori- gen. En algunas condiciones más bien generales, se puede demostrar que Y y Z tienen distribu- ciones de probabilidad idénticas. Así, un uso importante de los momentos es para calcular la distribución de probabilidad de una variable aleatoria (por lo general un estimador o tomador de decisiones). Por tanto, los momentos mk., donde k= 1, 2, 3, . . . , son principalmente de valor teórico para k> 3.
Otra expectativa interesante es la función generadora de momento para una variable aleatoria, que hablando en forma fi gurada, compacta todos los momentos para una variable aleatoria en
W-cap-03.indd 138
una sola expresión. Defi niremos primero la función generadora de momento y luego vamos a explicar la forma en que trabaja.
DEFINICIÓN3.14 La función generadora de momento m(t) para una variable aleatoria Y se defi ne como m(t) =E(etY). Decimos que una función generadora de momento para Y existe si existe una constante positiva b tal que m(t) es fi nita para |t|≤b.
¿Por qué E(etY) recibe el nombre de función generadora de momento para Y? De una ex- pansión de serie para ety, tenemos
et y =1+t y+(t y) 2 2! + (t y)3 3! + (t y)4 4! + ⋅⋅⋅. Entonces, suponiendo que m'k es fi nita para k= 1, 2, 3, … , tenemos
E(etY)= y et yp(y)= y 1+t y+(t y) 2 2! + (t y)3 3! +⋅ ⋅ ⋅ p(y) = y p(y)+ t y yp(y)+t 2 2! y y 2p(y)+t3 3! y y 3p(y)+ ⋅ ⋅ ⋅ =1+tm1+t 2 2!m2+ t3 3!m3+ ⋅ ⋅ ⋅.
Este argumento comprende un intercambio de sumatorias, que es justifi cable si m(t) existe.