Tema 5
Modelos de distribuciones discretas
En este cap´ıtulo estudiaremos las distribuciones discretas m´as importantes. De nuevo, esa importancia es doble, por las aplicaciones y por su relevancia conceptual.
5.1
Distribuci´
on uniforme discreta
Ejercicio 5.1.1 Consideremos el conjunto E ={1, 2, . . . , n}.
(a) Definid una variable discreta X que asigne a cada punto de E igual probabilidad. (b) Hallad su funci´on de masa y su funci´on de distribuci´on.
(c) Hallad E(X), 2, CV y la mediana.
Soluci´on:
(a) Hay muchas variables discretas que se pueden definir de esta manera. Por ejemplo, escoger un n´umero al azar en E. Si E ={1, . . . , 6}, la variable podr´ıa ser el resultado de tirar un dado no cargado.
(b) El rango de valores de la variable ser´a E y la funci´on de masa P (X = i) = 1n, para i = 1, . . . , n.
(c) Para la esperanza, tenemos E(X) = n X i=1 i· 1 n = 1 n n X i=1 i = 1 n · n(n + 1) 2 = n + 1 2
Este resultado es bastante l´ogico. Si pensamos en t´erminos de la media como representante del conjunto E, con cada punto con la misma probabilidad, este valor es lo esperable. Para 2 tenemos: 2 =E(X2) E(X)2 = n X i=1 i2· 1 n ✓ n + 1 2 ◆2 87
El sumatorio Pni=1i2 es n3
3 + n2
2 + n
6. Lo sustituimos en la expresi´on anterior. 2 =1 n ✓ n3 3 + n2 2 + n 6 ◆ ✓ n + 1 2 ◆2 = n 2 3 + n 2 + 1 6 ✓ n2+ 2n + 1 4 ◆ =4n 2+ 6n + 2 3n2 6n 3 12 = n2 1 12 El coeficiente de variaci´on es CV = µ = q n2 1 12 n+1 2 = q (n+1)(n 1) 12 n+1 2 = s 4(n + 1)(n 1) 12· (n + 1)2 = 1 p 3 r n 1 n + 1 Como p1 3 ⇡ 0,5773 y como q n 1
n+1 tiende a 1 seg´un n tiende a infinito, la dispersi´on
respecto a la media aumenta seg´un crece n.
Por ´ultimo, la mediana Me es el valor que cumple F (Me) = 1/2. Si n es par, la mediana puede ser cualquier valor en el intervalo [n/2, n/2 + 1). Si n es impar, la mediana es directamente n+12 .
Problema 5.1.2 Supongamos ahora que E ={x1, x2, . . . , xn}, un conjunto arbitrario, donde
xi 2 R. Generalizad los resultados del problema anterior.
Soluci´on: Ahora se supone que E es un conjunto arbitrario de n´umeros. Su funci´on de masa ser´a todav´ıa P (X = xi) = n1, para todo i = 1, . . . , n. La media E(X) y la varianza son
E(X) = n X i=1 xi· 1 n, 2 = n X i=1 (xi µ)2· 1 n, CV = qPn i=1(xi µ)2· 1 n Pn i=1xi· n1 = p nPni=1(xi µ)2 Pn i=1xi
La mediana Me sigue siendo el valor que cumple F (Me) = 1/2, pero ahora no es posible dar una expresi´on cerrada para el caso general.
5.2
Procesos de Bernouilli
Definici´on 5.2.1 Procesos de Bernouilli Sea un experimento aleatorio que cumple las siguientes propiedades:
(a) El experimento solo puede dar dos resultados posibles, que llamaremos A y B. (b) La probabilidad p de obtener A no cambia con el tiempo.
Un proceso de Bernouilli es una variable aleatoria X definida sobre este experimento tal que X toma el valor 1 si sale A y 0 si sale B.
5.2. Procesos de Bernouilli 89 Si una variable aleatoria X modeliza un proceso de Bernouilli se escribe X B(1, p). Con frecuencia, los resultados del experimento se interpretan en un sentido muy general como ´exito y fracaso. Por ejemplo, en el contexto de control de calidad, A es una pieza que pasa los controles y B es una pieza defectuosa.
Ejercicio 5.2.2 Sea X B(1, p).
(a) Hallad la funci´on masa y la funci´on de distribuci´on de X. (b) Hallad E(X), 2 y CV .
Soluci´on:
(a) La variable toma los valores 1 y 0 con probabilidades P (X = 1) = p y P (X = 0) = 1 p. (b) E(X) = p· 1 + (1 p)· 0 = p. En cuanto a la varianza (designamos a 1 p por q):
2 =(1 p)2
· p + (0 p)2· (1 p) = (1 p)2· p + p2· (1 p) =(1 p)p(1 p + p) = (1 p)p = pq
Para el coeficiente de variaci´on: CV = p p(1 p) p = r 1 p p
Cuando p tiende a uno CV se acerca a cero y la media es m´as representativa.
Definici´on 5.2.3 Distribuci´on binomial Consideremos un conjuntos de variables aleatorias Xi B(1, p), con i = 1, . . . , n. Si las variables Xi son independientes entre s´ı, la variable
X = X1+ . . . + Xn se llama distribuci´on binomial y se escribe X B(n, p).
En general, si tenemos dos variables aleatorias X B(n1, p) e Y B(n2, p), la variable
X + Y sigue una distribuci´on B(n1 + n2, p). El resultado es falso si la probabilidad p no es
com´un en ambas distribuciones binomiales. Problema 5.2.4 Sea X B(n, p).
(a) Si interpretamos A como el suceso tener ´exito, ¿qu´e mide la variable X? (b) Hallad su funci´on de masa y probad que suma 1.
(c) Hallad E(X), 2 y CV .
(d) Sabiendo que el coeficiente de asimetr´ıa de Fisher es CAF =
1 2p
p
np(1 p)
describid la asimetr´ıa de la distribuci´on binomial. Dibujad aproximadamente la funci´on de masa en cada caso.
Soluci´on:
(a) La variable mide el n´umero de ´exitos en n repeticiones independientes del experimento en un proceso de Bernouilli.
(b) Los resultados de los n experimentos de Bernouilli consecutivos e independientes se pueden identificar con las sucesiones de unos y ceros de longitud n, donde 1 representa ´exito y 0 fracaso. Para una sucesi´on con k unos, existen nk posibilidades de colocar los unos en dicha sucesi´on. Tanto unos y ceros se colocan de modo independiente con probabilidad p y q, respectivamente. Por tanto,
P (X = k) = ✓ n k ◆ pkqn k
(c) Para hallar los momentos pedidos, vamos a definir las variables aleatorias Xi ´exito en el
i-´esimo experimento. Se sigue que X = X1+ . . . + Xn. Para la media, tenemos
E(X) = E(X1+ . . . + Xn) = E(X1) + . . . + E(Xn) = np
Para la varianza, vamos usar la propiedad de que, cuando las variables son independientes, se cumple que 2 = V (X) = V (X 1+ . . . + Xn) = V (X1) + . . . + V (Xn) Como V (Xi) es pq, entonces V (X) = npq. Por ´ultimo, CV = pnpq np = r 1 p np
Si n se hace grande, el coeficiente de variaci´on se hace peque˜no y la distribuci´on se agrupa m´as alrededor de la esperanza. Lo mismo pasa cuando p tiende a 1.
(d) Dado el coeficiente CAF =
1 2p
p
np(1 p), se sigue que la asimetr´ıa es m´axima cuando el numerador de esta fracci´on es cero. Eso ocurre cuando p = 1/2. Si n tiende a infinito, el coeficiente tambi´en tiende a cero y la distribuci´on se hace m´as sim´etrica.
La funci´on de masa es como se sale en la figura de abajo. Se observa c´omo la distribuci´on se hace m´as sim´etrica seg´un crece n. La funci´on de masa tiene un solo m´aximo, que ocurre en bn/2c o en dn/2e.
5.2. Procesos de Bernouilli 91
Figura 5.1: Funci´on de masa de la distribuci´on binomial
Las probabilidades de la binomial son tediosas de calcular a mano. En la pr´actica se calculan por v´ıa del ordenador, con alg´un paquete estad´ıstico (Statgraphics, Matlab, SPSS), o bien mediante tablas. Las tablas se pueden encontrar en el Moodle (fichero Formularios y tablas). En la figura 5.2 se encuentra elementos de la tabla de la distribuci´on binomial. Por ejemplo, si en una binomial X B(4, 0,15) queremos hallar la probabilidad de que X tome el valor 2, consultando la tabla encontramos que tal valor es 0,988.
Figura 5.2: Tabla de la distribuci´on binomial
El lector se habr´a dado cuenta de que en la tabla solo aparece los valores de probabilidad para distribuciones con 0 < p 0,5. ¿Qu´e ocurre cuando p > 0,5? El siguiente problema da cuenta de esa cuesti´on.
Problema 5.2.5 Sea X B(n, p) e Y B(n, 1 p). Probad que P (X = k) = P (Y = n k)
Soluci´on: Vamos a describir la funci´on de masa de X en t´erminos de la de Y . P (X = k) = ✓ n k ◆ pkqn k (1)= ✓ n n k ◆ pkqn k (2)= ✓ n n k ◆ qn kpn (n k) = P (Y = n k)
donde: (1) es consecuencia de la simetr´ıa de los n´umeros combinatorios; en (2) se ha sumado y restado n para identificar la funci´on de masa de X con la funci´on de masa de Y .
Ejercicio 5.2.6 Un dado se tira 4 veces. ¿Cu´al es la probabilidad de sacar exactamente un 6? Resolved el problema usando una binomial.
Soluci´on: Sea X es el n´umero de seises en las cuatro tiradas. La probabilidad de sacar un 6, que se interpreta como ´exito, es constante en el tiempo. Adem´as, las tiradas son independientes entre s´ı. Estamos, pues, ante un proceso de Bernouilli. La probabilidad pedida es P (X = 1) =
4 1 1 6( 5 6) 3 = 125 324.
Ejercicio 5.2.7 Como parte de un plan estrat´egico de negocio, el 20% de los nuevos suscriptores a un servicio de internet recibir´an una promoci´on especial del proveedor del servicio. Un grupo de 10 vecinos se apuntan al servicio. ¿Cu´al es la probabilidad de que al menos 4 reciben la promoci´on?
Soluci´on: Se considera ´exito recibir la promoci´on del proveedor del servicio. La oferta no cambia en el tiempo y su probabilidad es p = 0,20. Se trata, pues, de una binomial X B(10, 0,2). Se pide P (X 4) y mir´andola en la tabla sale P (X 4)⇡ 0,1208.
Problema 5.2.8 Un examen, que consta de 10 preguntas, se aprueba si se contestan correctamente 6 o m´as. Cada pregunta tiene 3 apartados y la respuesta se considera correcta si se contestan bien 2 o m´as apartados. Sabiendo que la probabilidad de que un alumno estudioso conteste bien cada apartado es 0,7, independientemente de lo que conteste en el resto de los apartados, calculad:
(a) La probabilidad de que dicho alumno apruebe el examen y la nota esperada.
(b) Sabiendo que este alumno ha aprobado el examen, calculad la probabilidad de que haya contestado correctamente 7 preguntas.
Soluci´on:
(a) Primero, observamos el fen´omeno de las preguntas y los apartados. Hay una pregunta contestada correctamente. Por las hip´otesis del problema, que son la independencia y la probabilidad constante de ´exito, sabemos que es un proceso de Bernouilli. Sea X1 el
n´umero de apartados contestados correctamente en una pregunta cualquiera; entonces, X1 B(3, 0,7). Por tanto, P (X1 2) = ✓ 3 2 ◆ 0,72· 0,3 + ✓ 3 3 ◆ 0,73 ⇡ 0,784
Si se mira en la tabla, tendr´ıamos que considerar una binomial Y B(3, 1 0.7) = B(3, 0.3):
5.2. Procesos de Bernouilli 93 Sea X2 la variable aleatoria n´umero de preguntas contestadas correctamente. Esta
variable es una binomial tambi´en. Si llamamos p a P (X1 2), entonces X2 B(10, p).
Se pide P (X 6), que es aproximadamente 0,9554. La esperanza de X2 es µ = np = 10· 0,9554 = 9,554.
(b) Se est´a pidiendo una probabilidad condicionada: P (X = 7|X 6) = P ({X = 7} \ {X 6}) P (X 6) = 10 7 (0,784) 7(1 0,784)3 0,9554 ⇡ 0,23
Problema 5.2.9 En un huerto con 100 calabazas, la probabilidad de recolectar una sin pipas es 0005.
(a) Calcular las probabilidades de los siguientes sucesos:
(i) Obtener m´as de 6 calabazas con pipas al recolectar las 10 primeras. (ii) Encontrar la primera calabaza sin pipas al recolectar la d´ecima. (iii) Recolectar en todo el huerto 10 calabazas sin pipas.
(iv) Recolectar en todo el huerto m´as de 7 calabazas sin pipas. (b) Hallar el n´umero esperado de calabazas sin pipas en el huerto.
Soluci´on: Recolectar calabazas sin pipas se considera un proceso de Bernouilli donde el ´exito es que no tenga pipas. Se supone que las calabazas salen sin pipas de modo independiente y que la probabilidad de no tener pipas es constante en el tiempo.
(a) Este apartado se resuelve definiendo una binomial adecuada para cada caso.
(i) Obtener m´as de 6 calabazas con pipas al recolectar las 10 primeras es una variable binomial X1 B(10, 0,95) y la probabilidad pedida es P(X1 > 6), que es
aproximadamente 10 6.
(ii) En este caso no tenemos una binomial, pero con las condiciones del problema se puede calcular la probabilidad pedida, que es
(0,95)9· 0,05 ⇡ 0,0315
(iii) Si consideramos el huerto entero, que tiene 100 calabazas, entonces usaremos una variable X2 B(100, 0,05). La probabilidad pedida es P(X2 = 10). Mirando en las
tablas, obtenemos 0,0167.
(iv) Usando la misma variable de antes, tenemos que calcular P (X2 > 7), que es
aproximadamente 0,1279.
(b) Dado que X2 B(100, 0,05), la esperanza es np = 5.
Problema 5.2.10 Supongamos que 2000 puntos se seleccionan al azar e independientemente del cuadrado S = {(x, y)|0 x, y 1}. Sea X el n´umero de puntos que caen en el conjunto A = {(x, y)|x2 + y2 < 1}. ¿Qu´e distribuci´on tiene X? Halla su media, su desviaci´on t´ıpica y
Soluci´on: Este problema profundiza en la idea de la probabilidad uniforme y extiende la idea de Laplace —probabilidad uniforme discreta—a conjuntos m´as generales. En este caso, tenemos un cuadrado y seleccionamos puntos al azar en ´el. Hay un conjunto, A, que en la figura es el sector circular blanco, que tiene ´area ⇡/4. El cuadrado total tiene ´area 1 y se considera el espacio muestral. La probabilidad de A ser´a precisamente su ´area.
Ahora nos enfrentamos a una variable binomial, donde A es el suceso ´exito y p = P (A) = ⇡/4. Obs´ervese que la probabilidad de A no cambia en el tiempo y que el problema establece que los puntos se eligen independientemente unos de otros. Entonces, la variable X n´umero de puntos que caen en A de los 2000 es X B(2000, ⇡/4). Las medidas pedidas son:
µ = 2000· ⇡/4 ⇡ 1.570,7963, = 2000· ⇡/4 · 3⇡
4 ⇡ 1178,0972, CV = µ ⇡ 0,75
5.3
Distribuci´
on geom´
etrica
Consideremos de nuevo un proceso de Bernouilli que se repite de modo independiente. Queremos medir el n´umero de veces que hay que repetir el experimento antes de salir el primer ´exito o suceso A. La correspondiente variable aleatoria se llama geom´etrica y se escribe X G(p), donde p es la probabilidad de que salga A.
Problema 5.3.1 Sea X G(p).
(a) Hallad la funci´on de masa de X y probad que suma 1. (b) Hallad E(X).
(c) Sabiendo que el coeficiente de asimetr´ıa de Fisher es CAF =
2 p
p
1 p
describid la asimetr´ıa de la distribuci´on geom´etrica. Dibujad aproximadamente la funci´on de masa.
5.3. Distribuci´on geom´etrica 95 Soluci´on:
(a) Dado que en la descripci´on de la variable pone n´umero de veces antes repetir el experimento, X toma valores en los n´umeros naturales, incluido el 0. Cada valor k de la variable est´a asociado con una sucesi´on de k 1 fracasos y un ´ultimo ´exito. Como hay independencia, tenemos:
P (X = k) = (1 p)k· p
Veamos que esta funci´on de masa suma 1, que no es m´as que la suma de una serie geom´etrica. 1 X k=0 (1 p)k· p = p · 1 1 (1 p) = 1
(b) Para hallar E(X) recurriremos a un resultado de series de potencias. Si una serie es convergente, entonces se puede derivar y su derivada es la derivada de la serie simplemente.
E(X) = 1 X k=0 k(1 p)k· p(1)= 1 X k=1 k(1 p)k· p(2)= 1 X k=1 (1 p)· k(1 p)k 1· p (3) = 1 X k=1 (1 p)· (1 p)k 0 · p(4)= p(1 p)· 1 X k=1 (1 p)k !0 (5) = p(1 p)· ✓ 1 p p ◆0 (6) = p(1 p)· 1 p2 = 1 p p
donde: (1) el t´ermino k = 0 se puede quitar; (2) se quita un factor a (1 p)k; (3) porque
la derivada de (1 p)k 0 es k(1 p)k 1; (4) por el mencionado resultado de las series convergentes; (5) sumando la serie geom´etrica del interior de la derivada; (6) efectuando la derivada.
(c) El coeficiente de asimetr´ıa de Fisher es CAF =
2 p
p
1 p. Como el m´aximo valor de p es 1, el coeficiente siempre ser´a positivo y la funci´on de masa ser´a asim´etrica a la derecha respecto a la media. La funci´on de masa de la Poisson se puede ver en la figura 5.3. Se puede ver que se trata de una cola a la derecha y que es siempre asim´etrica a la derecha. La varianza y el coeficiente de variaci´on de de la distribuci´on geom´etrica son, respectivamente, V (X) = 1 p p2 , CV = 1 p 1 p
Otra variable asociada a los procesos de Bernouilli es el n´umero de veces que se repite el experimento hasta que sale el primer ´exito. Esta variable es similar a la anterior y sus momentos se calculan de modo an´alogo.
Figura 5.3: La funci´on de masa de la distribuci´on geom´etrica
Ejercicio 5.3.2 Un dado se tira hasta que aparece un 4. ¿Cu´al es la probabilidad de tirar el dado 10 veces antes de sacar 4? ¿Cu´al es la probabilidad de sacar 4 en la d´ecima tirada? Resolved el problema usando una variable geom´etrica.
Soluci´on: Este problema se deja al lector.
Teorema 5.3.3 Sea X una variable aleatoria G(p). La probabilidad de repetir el experimento k veces m´as antes de sacar el primer ´exito no depende del n´umero previo de veces que hayamos realizado el experimento.
Prueba: Sea h > 0 y supongamos que se ha realizado el experimento k veces. El teorema establece que las probabilidades P (X = k + h|X k) y P (X = k + h) son iguales. Esto es equivalente a decir que los resultados de los k primeros experimentos no influyen en los resultados que vienen a continuaci´on. Si se ha realizado el experimento al menos k veces significa que X es mayor o igual que k; de lo contrario, ya se habr´ıa acabado el experimento. Tenemos que calcular cu´anto vale P (X = k + h|X k).
P (X = k + h|X k) =P ({X = k + h} \ {X k}) P (X k) = P (X = k + h) P1 i=k(1 p)i· p =(1 p) k+h· p (1 p)k·p p = (1 p)h· p = P (X = h)
Problema 5.3.4 Supongamos que en un juego de azar (que no sea hacer un examen de estad´ıstica), la probabilidad de ganar es p, con 0 < p < 1. ¿C´omo se interpreta el teorema anterior en el contexto de los juegos de azar?
Soluci´on: La interpretaci´on en t´erminos de un juego viene a decir que el juego no tiene memoria de los resultados previos para la probabilidad de los resultados futuros.
5.4. Distribuci´on de Poisson 97 Problema 5.3.5 En una red ATM los mensajes se env´ıan en r´afagas de celdas de 53 octetos. Un mensaje tendr´a tantas celdas como quiera y sabremos que hemos llegado al final del mensaje porque en los bits de control de la ´ultima celda as´ı se indica. Se sabe que la variable aleatoria X que cuenta el n´umero de celdas enviadas en la transmisi´on de un mensaje antes de la celda que marca el final del mensaje es geom´etrica de par´ametro p.
(a) Si sabemos que el n´umero medio de celdas por mensaje sin incluir la ´ultima celda es 7, calculad la probabilidad de que el n´umero de celdas enviadas en la transmisi´on de un mensaje, excluyendo la ´ultima, sea menor que 3.
(b) Calculad la probabilidad de que el n´umero de celdas enviadas en la transmisi´on de un mensaje, sin incluir la ´ultima celda, sea mayor que 7 si sabemos que es mayor que 4. (c) Se transmiten 10 mensajes de forma independiente. Obtened la probabilidad de que en
4 mensajes o m´as el n´umero total de celdas enviadas por mensaje, sin incluir la ´ultima celda, sea menor que 3.
Soluci´on: La variable n´umero de celdas enviadas antes de la ´ultima es una geom´etrica X G(p), dadas las hip´otesis asumidas en el problema. El par´ametro p es desconocido, pero dado que sabemos la media, podemos despejar su valor. Aqu´ı estamos usando de manera impl´ıcita que los momentos muestrales tienden a los momentos poblacionales.
1 p
p = 7; 1 p = 7p; p =
1 8 (a) En este apartado se pide P (X < 3):
P (X < 3) = P (X 2) = ✓ 1 1 8 ◆0 · 1 8+ ✓ 1 1 8 ◆1 ·1 8 + ✓ 1 1 8 ◆2 · 1 8 ⇡ 0,33 (b) Se trata de calcular la probabilidad P (X > 7|X > 4). Para ello, usaremos el
teorema 5.3.3, que establece que la probabilidad anterior es simplemente P (X > 3). P (X > 7|X > 4) = P (X > 3) = 1 P (X 2) = 1 0,33 = 0,67
(c) Ahora se ha fijado un n´umero de mensajes a 10. El experimento aleatorio es distinto y la variable aleatoria pasa a ser una binomial X1 B(10, p), donde p = P(X < 3), y
donde X es el n´umero de mensajes en esos 10 que tienen un n´umero de celdas menor que 3. Obs´ervese que las condiciones para una variable binomial y una geom´etrica son las mismas; solo son variables que miden distintos aspectos cuantitativos del fen´omeno.
P (X2 4) = 4 X k=0 ✓ 10 k ◆ (0,33)k· (1 0,33)10 k ⇡ 0,2339
5.4
Distribuci´
on de Poisson
La distribuci´on se cuenta entre la m´as importantes entre las discretas, principalmente por su ubicuidad. Es capaz de modelizar eficazmente un gran abanico de situaciones muy dispares
entre s´ı. Sim´eon Poisson (1781–1840) la introdujo por primera vez como parte de su teor´ıa de la probabilidad en 1837. Apareci´o en una obra suya en que investigaba la probabilidad de ciertos hechos en juicios penales y civiles. Poisson se preguntaba sobre el n´umero de condenas injustas en un pa´ıs, variable que sigue ciertamente la distribuci´on que lleva su nombre.
¿Por qu´e es tan ubicua la distribuci´on de Poisson? Definamos primero qu´e es un experimento de Poisson y ello nos har´a entender el porqu´e.
Definici´on 5.4.1 Experimento de Poisson. Consideremos un experimento con las siguientes propiedades:
(1) Los resultados del experimento se pueden clasificar en ´exito o fracaso, esto es, solo hay dos resultados posibles.
(2) Se observa el n´umero de ´exitos por unidad de cierta magnitud (tiempo, longitud, ´area, volumen, etc.).
(3) El n´umero medio de ´exitos en una regi´on dada es conocido; en otras palabras, se conoce la media de ´exitos por unidad de magnitud. Adem´as, este valor medio es constante en el tiempo.
(4) La probabilidad de ´exito es proporcional al tama˜no de la regi´on (aqu´ı regi´on se refiere a la magnitud en cuesti´on).
(5) La probabilidad de ´exito en intervalos extremadamente peque˜nos es cero. Esto asegura que la probabilidad de que dos sucesos ocurran a la vez es cero.
(6) Los sucesos ocurren de manera independiente.
Una objeci´on que se puede hacer a la definici´on anterior es que, en la pr´actica, esas condiciones son dif´ıciles de comprobar exhaustivamente. Ello es cierto en muchas ocasiones. De lo que se trata entonces es de suponer que son razonablemente ciertas las hip´otesis anteriores y ver c´omo el modelo explica los resultados de ulteriores experimentos.
Para que el lector tome consciencia de la importancia de la distribuci´on de Poisson, he aqu´ı una lista de modo alguno exhaustiva de situaciones en que aparece esta distribuci´on:
(a) El n´umero de coces dadas por los caballos del ej´ercito prusiano. Esta fue la primera aplicaci´on de la distribuci´on de Poisson de la que se tiene constancia hist´orica.
(b) El n´umero de part´ıculas alfa emitidas por una sustancia radioactiva por unidad de tiempo. (c) El n´umero de bombas lanzadas por bombarderos a´ereos en el sur de Londres durante la
Segunda Guerra Mundial.
(d) El n´umero de accidentes en cierto punto de una carretera por d´ıa. (e) El n´umero de erratas por p´agina.
(f) El n´umero de pasas por cent´ımetro c´ubico en un plumcake.
(g) El n´umero de cambios cromos´omicos en una c´elula como consecuencia de la exposici´on a los rayos X.
5.4. Distribuci´on de Poisson 99 (h) El n´umero de alumnos con verdadera pasi´on por la inform´atica por grupo.
(i) El n´umero de pelos encontrados en las hamburguesas de McDonalds (o de cualquier otra cadena de comida basura).
(j) El n´umero de fallos en una m´aquina por mes.
(k) El n´umero de llamadas a un servicio de atenci´on al cliente por hora.
Si solo queremos centrarnos en ejemplos con sabor netamente inform´atica, aqu´ı va otra lista similar, m´as corta pero suficientemente representativa; el lector puede construir su propia lista:
(a) El n´umero de peticiones a un servidor por unidad de tiempo.
(b) El n´umero de errores de codificaci´on que comete un equipo de programadores por semana. (c) El n´umero de fallos de un disco duro por mes.
(d) El n´umero de mensajes que llegan a la unidad de proceso de un ordenador por segundo. (e) El n´umero de cuelgues de un sistema operativo por semana.
(f) El n´umero de mensajes de correo basura que llegan por semana. (g) El n´umero de programas compilados por un ordenador por d´ıa.
La variable de Poisson es n´umero de sucesos por unidad de magnitud y su funci´on de masa de la distribuci´on de Poisson est´a dada por la expresi´on de m´as abajo
P (X = k) = e
k
k!
donde el rango de valores es k 2 N (el n´umero de sucesos por unidad de magnitud puede ser cualquier n´umero natural). La figura 5.4 muestra la funci´on de masa para distintos valores de
.
Problema 5.4.2 Comprobad que la funci´on de masa dada anteriormente lo es efectivamente. Usad la siguiente f´ormula, consecuencia del desarrollo de Taylor (¡ah, qu´e tiempo aquellos de AM!) y que es v´alida para todo x2 R:
ex = 1 X n=0 xn n!
Soluci´on: No es m´as que aplicar la serie anterior para probar que suma 1.
1 X k=0 e k k! =e 1 X k=0 k k! = e e = e 0 = 1
Figura 5.4: La funci´on de masa de la distribuci´on de Poisson
El c´alculo efectivo de una probabilidad en una distribuci´on de Poisson se hace tambi´en a trav´es de la consulta de tablas o del ordenador.
Suponemos que el lector estar´a un tanto desorientado ante esa funci´on de masa. ¿De d´onde sale una expresi´on tan complicada? Obviamente, Poisson no se la invent´o de la nada ni tuvo un acceso de inspiraci´on y dijo “¡ah!, todos estos fen´omenos siguen esta distribuci´on con esta funci´on de masa tan intricada”. Poisson obtuvo esta distribuci´on a partir de la binomial B(n, p) imponiendo las condiciones de m´as arriba en el experimento y haciendo tender n a infinito y p a cero con ciertas restricciones. El siguiente teorema que, excepcionalmente damos con demostraci´on, muestra el trabajo original de Poisson y da, adem´as, una explicaci´on l´ogica y org´anica de d´onde sale la funci´on de masa.
Teorema 5.4.3 Sean X B(n, p) una variable aleatoria binomial. Supongamos que se dan las siguientes condiciones:
(a) El par´ametro n tiende a infinito; (b) np permanece constante e igual a .
Entonces la funci´on de masa de la binomial tiende a la de una Poisson.
Prueba: Teniendo en cuenta que en todo momento np = , tenemos la siguiente demostraci´on (cons´ultese las explicaciones de los pasos de los c´alculos m´as abajo):
5.4. Distribuci´on de Poisson 101 l´ım n!1P (X = k) = l´ımn!1 ✓ n k ◆ · pk(1 p)n k (1)= l´ım n!1 n! k!(n k)! · p k(1 p)n k (2) = l´ım n!1 n! k!(n k)! · ✓ n ◆k✓ 1 n ◆n k (3) = k k! n!1l´ım n· (n 1)· . . . · (n (k 1)) nk · ✓ 1 n ◆n k (4) = k k! ✓ l´ım n!1 n· (n 1)· . . . · (n (k 1)) nk ◆ · l´ım n!1 ✓ 1 n ◆n k! (5) = k k! ✓ l´ım n!1 n· (n 1)· . . . · (n (k 1)) nk ◆ · l´ım n!1 ✓ 1 n ◆n · ✓ 1 n ◆ k! (6) = k k! · 1 · e · 1 = k k!e
donde: en (1) se ha aplicado la definici´on de n´umero combinatorio; en (2) se ha sustituido p por /n; en (3) se ha sacado fuera del l´ımite el t´ermino
k
k! y reordenado el resto de t´erminos; en (4) se han separado en dos l´ımites el producto de (3); en (5) se ha separado el segundo l´ımite en dos productos para facilitar su c´alculo; en (6) se han calculado los l´ımites entre par´entesis. El primer l´ımite de (6) da 1 puesto que en el numerador y el denominador hay k factores en n. El siguiente l´ımite da e por la definici´on de n´umero e y el ´ultimo l´ımite tiende claramente a 1.
Problema 5.4.4 ¿C´omo se llega del teorema anterior a la definici´on de experimento de Poisson? Dad una explicaci´on conceptual de esa relaci´on.
Soluci´on:
Problema 5.4.5 Si X P( ), calculad E(X), V (X) y el coeficiente de variaci´on.
Soluci´on: Presentamos los c´alculos por separado con las explicaciones despu´es de cada uno. • Para la esperanza: E(X) = 1 X k=0 ke k k! (1) = e 1 X k=1 k k k! (2) = · e 1 X k=1 k 1 (k 1)! (3) = · e 1 X k=0 k k! (4) = · e e = · e0 =
donde: (1) el t´ermino k = 0 se puede quitar y e se puede sacar fuera del sumatorio; (2) dividimos por k dentro del sumatorio y sacamos un factor de k; (3) hacemos un cambio
• Para la varianza, calcularemos primero E(X2): E(X2) = 1 X k=0 k2e k k! (1) = e 1 X k=1 k2 k k! (2) = · e 1 X k=1 k k 1 (k 1)! (3) = · e 1 X k=0 (k + 1) k k! = · e 1 X k=0 k k k! + · e 1 X k=0 k k! (4) = · + · 1 = 2+
donde: (1) el t´ermino k = 0 se puede quitar y e se puede sacar fuera del sumatorio; (2) dividimos por k dentro del sumatorio y sacamos un factor de k; (3) hacemos un cambio
de ´ındice en el sumatorio; (4) el primer t´ermino es la media calculada antes y el segundo es la suma de la funci´on de masa.
Por tanto, V (X) = E(X2) E(X)2 = 2+ 2 = • Por ´ultimo, el CV es CV = µ = p = p1
La dispersi´on en la Poisson disminuye seg´un aumenta el valor de .
Ejercicio 5.4.6 El coeficiente de asimetr´ıa de la variable Poisson es p1 . Interpretad dicho
coeficiente.
Soluci´on: Este ejercicio se deja al lector.
Teorema 5.4.7 Sean X1 P( 1) y X2 P( 2) dos variables aleatorias independientes con
distribuci´on de Poisson. Entonces la variable X = X1 + X2 sigue una distribuci´on X
P ( 1 + 2).
Prueba: Sea X = X1+ X2 la suma de dos variables independientes distribuidas seg´un Poisson
X1 P( 1) y X2 P( 2). Si k 2 N, podemos escribir el suceso X = k como la uni´on de
los sucesos X1 = k i y X2 = i para i = 0, . . . , k y adem´as dicha uni´on coge todos los casos
posibles. P (X = k) = k X i=0 P (X1 = k i)· P (X2 = i) (1) = k X i=0 e 1 k i 1 (k i)!· e 2 i 2 i! (2) =e 1e 2 k X i=0 k i 1 (k i)!· i 2 i! (3) = e ( 1+ 2) k! k X i=0 k! k i 1 (k i)!· i 2 i! (4) =e ( 1+ 2) k! k X i=0 ✓ k i ◆ k i 1 · i2 (5) = e ( 1+ 2) k! ( 1 + 2) k
donde: (1) se hace uso de las funciones de masa de X1 y X2; (2) sacamos las exponenciales
fuera del sumatorio; (3) se divide y multiplica la expresi´on por k! con el fin de generar el n´umero combinatorio del sumatorio; (4) identificamos (k i)!i!k! con ki ; (5) aplicamos el binomio de Newton. La ´ultima expresi´on obtenida es la funci´on de masa para X P( 1+ 2).
5.4. Distribuci´on de Poisson 103 La propiedad que prueba este teorema se llama reproductividad.
Ejercicio 5.4.8 El n´umero de peticiones que llegan a un servidor sigue una distribuci´on de Poisson. Si la media de ese n´umero es de 10 mensajes por segundo, ¿cu´al es la probabilidad de que no haya ninguna petici´on en un segundo? ¿Y de que haya 15 o menos en un segundo? Soluci´on: Nos dicen directamente que estamos en presencia de un proceso de Poisson. La esperanza es = 10, que es tambi´en el par´ametro de la distribuci´on. Nos piden primero P (X = 0), que es e 10 ⇡ 0,000045. Despu´es piden
P (X 15) = 15 X k=0 e 1010 k k! ⇡ 0,9512
Problema 5.4.9 Sabiendo que un ordenador compila, en promedio, 5 programas cada 10 minutos, calculad la probabilidad de que compile:
(a) M´as de 2 programas y menos de 6 en 10 minutos. (b) 25 programas en una hora.
Soluci´on: El problema da pocos datos, pero es razonable suponer que la media no cambia en el tiempo, esto es, en cualquier periodo de 10 minutos la media es 5 programas. Supondremos tambi´en que la compilaci´on de los programas es independiente entre s´ı. Por ´ultimo, como es una medida por unidad de tiempo, esto sugiere que sigue una distribuci´on de Poisson. Llamaremos X P(5) a nuestra variable. (a) Se pide P (2 < X < 6): P (2 < X < 6) = 5 X i=3 e 55 k k! = F (5) F (3)⇡ 0,61596 0,26503 = 0,35093
(b) Como la media es constante, el n´umero de programas compilados en una hora sigue una Poisson P (30); llam´emosla Y
P (Y = 25) = e 30· 30
25
25! ⇡ 0,05112
Problema 5.4.10 Una f´abrica suelta un vertido contaminante 2 veces al mes en promedio. La f´abrica se revisa cuando hay m´as de 8 vertidos contaminantes en un trimestre. La f´abrica se para si un trimestre hay m´as de 1 mes con al menos 4 vertidos. Calculad:
(a) La probabilidad de que un trimestre haya que revisar la f´abrica. (b) El n´umero esperado de vertidos contaminantes en un trimestre.
(c) La probabilidad de que la f´abrica funcione 5 trimestres antes de ser revisada.
(d) El n´umero medio de trimestres que tienen que transcurrir antes de que la f´abrica tenga que ser revisada.
(e) La probabilidad de que un mes haya al menos 4 vertidos contaminantes. (f) La probabilidad de que un trimestre haya que parar la f´abrica.
Soluci´on: Estamos ante una variable que mide el n´umero de sucesos por unidad de tiempo. Supondremos que sigue una distribuci´on de Poisson. Como nos dan el promedio de vertidos por mes, se trata de una variable X P(2), donde X es el n´umero de vertidos contaminantes por mes.
(a) La probabilidad de que un trimestre haya que revisar la f´abrica corresponde a calcular P (X1 > 8), donde X1 es el n´umero de vertidos contaminantes por trimestre, que es
X1 P(6).
P (X1 > 8) = 1 P (X1 8) ⇡ 1 0,8472 = 0,1528
(b) Se pide la esperanza de X1, que es una distribuci´on de Poisson. Por tanto, E(X1) = 6.
(c) La variable X2, n´umero de trimestres antes de la primera revisi´on, sigue una distribuci´on
geom´etrica de par´ametro p, donde el ´exito es que la f´abrica no se revise y su probabilidad es P (X1 8). Esa probabilidad se calcul´o en un apartado anterior y vale 0,8472. Se nos
pide la probabilidad P (X2 = 5).
P (X2 = 5) = P (X1 8)5· (1 P (X1 8)) = 0,0666
(d) Se nos pide la esperanza de una geom´etrica de par´ametro 0,8472. Esta ser´ıa E(X3) = 1 p
p = 0,1867 trimestres.
(e) En este apartado se pide la probabilidad de que un mes haya al menos 4 vertidos contaminantes. Esto corresponde a la probabilidad P (X 4), que es aproximadamente 0,14287.
(f) Si X3 es el n´umero de paradas de la f´abrica en 3 meses, por las hip´otesis del problema,
se sigue que X3 B(3, P(X 4)). Se quiere calcular la probabilidad P (X3 1).
P (X3 1) = 1 P (X3 0) = 1 P (X < 4)3 ⇡ 0,3702
Problema 5.4.11 Construye el mapa conceptual de este tema. Soluci´on: El mapa se encuentra en la siguiente hoja.
5.4. Distribuci´on de Poisson 105 Modelos d iscr etos Los modelos d iscr etos se obt ienen del estud
io del fenómeno de inter
és Uniforme d iscr eta Asigna pr obabil idades
iguales a todos los valor
es de la variable Uniforme d iscr eta sobr e el conjunto {1,2,…,n} Momentos: Uniforme d iscr eta arbitraria Momentos Binomiales Pr oceso de Bernouil li: (1) El
experimento solo puede dar dos r
esul tados posibles, que l lamar emos A y B. (2) La pr obabil idad p de obtener A no cambia con el t iempo. Variable Bernoul li X~B(1,p): V ale 1 si sale A y 0 si no sale A. Momentos: Binomial B(n,p): r epet iciones independ ientes de pr ocesos de Bernouil li Momentos: Pr opiedad: Gráfica: Función de masa: k toma valor es entr e 0 y n Geométrica
Recuento del númer
o de experimentos
real
izados
hasta
el primer éxito
Se puede definir también incluyendo el primer éxito
Momentos: Pr opiedad de la fal ta de memoria: La pr obabil idad de r epet ir el experimento k
veces más antes de sacar el primer éxito no depende del númer
o pr
evio de veces que
hayamos r
eal
izado el experimento.
Función de masa: toma valor
es en los númer os naturales Gráfica: Poisson Experimento de Poisson: (1) Los r esul
tados del experimento se pueden
clasificar en éxito o fracaso. (2) Se observa el númer
o de éxitos por
unidad de cierta magnitud (t
iempo, longitud,
ár
ea, volumen, etc.). (3) El númer
o med
io de éxitos en una r
egión
dada es conocido. Además, este valor med
io es constante en el t iempo. (4) La pr obabil idad de éxito es pr opor cional al tamaño de la r egión. (5) La pr obabil
idad de que dos sucesos
ocurran a la vez es cer
o.
(6) Los sucesos ocurr
en de manera independ iente Función de masa: Gráfica: Apr
oximación de la binomial por una Poisson:
Momentos:
La suma de d
istribuciones de Poisson
independ
ientes es otra Poisson de parámetr
o
la suma de los parámetr