• No se han encontrado resultados

Modelos de distribuciones discretas

N/A
N/A
Protected

Academic year: 2021

Share "Modelos de distribuciones discretas"

Copied!
19
0
0

Texto completo

(1)

Tema 5

Modelos de distribuciones discretas

En este cap´ıtulo estudiaremos las distribuciones discretas m´as importantes. De nuevo, esa importancia es doble, por las aplicaciones y por su relevancia conceptual.

5.1

Distribuci´

on uniforme discreta

Ejercicio 5.1.1 Consideremos el conjunto E ={1, 2, . . . , n}.

(a) Definid una variable discreta X que asigne a cada punto de E igual probabilidad. (b) Hallad su funci´on de masa y su funci´on de distribuci´on.

(c) Hallad E(X), 2, CV y la mediana.

Soluci´on:

(a) Hay muchas variables discretas que se pueden definir de esta manera. Por ejemplo, escoger un n´umero al azar en E. Si E ={1, . . . , 6}, la variable podr´ıa ser el resultado de tirar un dado no cargado.

(b) El rango de valores de la variable ser´a E y la funci´on de masa P (X = i) = 1n, para i = 1, . . . , n.

(c) Para la esperanza, tenemos E(X) = n X i=1 i· 1 n = 1 n n X i=1 i = 1 n · n(n + 1) 2 = n + 1 2

Este resultado es bastante l´ogico. Si pensamos en t´erminos de la media como representante del conjunto E, con cada punto con la misma probabilidad, este valor es lo esperable. Para 2 tenemos: 2 =E(X2) E(X)2 = n X i=1 i2· 1 n ✓ n + 1 2 ◆2 87

(2)

El sumatorio Pni=1i2 es n3

3 + n2

2 + n

6. Lo sustituimos en la expresi´on anterior. 2 =1 n ✓ n3 3 + n2 2 + n 6 ◆ ✓ n + 1 2 ◆2 = n 2 3 + n 2 + 1 6 ✓ n2+ 2n + 1 4 ◆ =4n 2+ 6n + 2 3n2 6n 3 12 = n2 1 12 El coeficiente de variaci´on es CV = µ = q n2 1 12 n+1 2 = q (n+1)(n 1) 12 n+1 2 = s 4(n + 1)(n 1) 12· (n + 1)2 = 1 p 3 r n 1 n + 1 Como p1 3 ⇡ 0,5773 y como q n 1

n+1 tiende a 1 seg´un n tiende a infinito, la dispersi´on

respecto a la media aumenta seg´un crece n.

Por ´ultimo, la mediana Me es el valor que cumple F (Me) = 1/2. Si n es par, la mediana puede ser cualquier valor en el intervalo [n/2, n/2 + 1). Si n es impar, la mediana es directamente n+12 .

Problema 5.1.2 Supongamos ahora que E ={x1, x2, . . . , xn}, un conjunto arbitrario, donde

xi 2 R. Generalizad los resultados del problema anterior.

Soluci´on: Ahora se supone que E es un conjunto arbitrario de n´umeros. Su funci´on de masa ser´a todav´ıa P (X = xi) = n1, para todo i = 1, . . . , n. La media E(X) y la varianza son

E(X) = n X i=1 xi· 1 n, 2 = n X i=1 (xi µ)2· 1 n, CV = qPn i=1(xi µ)2· 1 n Pn i=1xi· n1 = p nPni=1(xi µ)2 Pn i=1xi

La mediana Me sigue siendo el valor que cumple F (Me) = 1/2, pero ahora no es posible dar una expresi´on cerrada para el caso general.

5.2

Procesos de Bernouilli

Definici´on 5.2.1 Procesos de Bernouilli Sea un experimento aleatorio que cumple las siguientes propiedades:

(a) El experimento solo puede dar dos resultados posibles, que llamaremos A y B. (b) La probabilidad p de obtener A no cambia con el tiempo.

Un proceso de Bernouilli es una variable aleatoria X definida sobre este experimento tal que X toma el valor 1 si sale A y 0 si sale B.

(3)

5.2. Procesos de Bernouilli 89 Si una variable aleatoria X modeliza un proceso de Bernouilli se escribe X B(1, p). Con frecuencia, los resultados del experimento se interpretan en un sentido muy general como ´exito y fracaso. Por ejemplo, en el contexto de control de calidad, A es una pieza que pasa los controles y B es una pieza defectuosa.

Ejercicio 5.2.2 Sea X B(1, p).

(a) Hallad la funci´on masa y la funci´on de distribuci´on de X. (b) Hallad E(X), 2 y CV .

Soluci´on:

(a) La variable toma los valores 1 y 0 con probabilidades P (X = 1) = p y P (X = 0) = 1 p. (b) E(X) = p· 1 + (1 p)· 0 = p. En cuanto a la varianza (designamos a 1 p por q):

2 =(1 p)2

· p + (0 p)2· (1 p) = (1 p)2· p + p2· (1 p) =(1 p)p(1 p + p) = (1 p)p = pq

Para el coeficiente de variaci´on: CV = p p(1 p) p = r 1 p p

Cuando p tiende a uno CV se acerca a cero y la media es m´as representativa.

Definici´on 5.2.3 Distribuci´on binomial Consideremos un conjuntos de variables aleatorias Xi B(1, p), con i = 1, . . . , n. Si las variables Xi son independientes entre s´ı, la variable

X = X1+ . . . + Xn se llama distribuci´on binomial y se escribe X B(n, p).

En general, si tenemos dos variables aleatorias X B(n1, p) e Y B(n2, p), la variable

X + Y sigue una distribuci´on B(n1 + n2, p). El resultado es falso si la probabilidad p no es

com´un en ambas distribuciones binomiales. Problema 5.2.4 Sea X B(n, p).

(a) Si interpretamos A como el suceso tener ´exito, ¿qu´e mide la variable X? (b) Hallad su funci´on de masa y probad que suma 1.

(c) Hallad E(X), 2 y CV .

(d) Sabiendo que el coeficiente de asimetr´ıa de Fisher es CAF =

1 2p

p

np(1 p)

describid la asimetr´ıa de la distribuci´on binomial. Dibujad aproximadamente la funci´on de masa en cada caso.

(4)

Soluci´on:

(a) La variable mide el n´umero de ´exitos en n repeticiones independientes del experimento en un proceso de Bernouilli.

(b) Los resultados de los n experimentos de Bernouilli consecutivos e independientes se pueden identificar con las sucesiones de unos y ceros de longitud n, donde 1 representa ´exito y 0 fracaso. Para una sucesi´on con k unos, existen nk posibilidades de colocar los unos en dicha sucesi´on. Tanto unos y ceros se colocan de modo independiente con probabilidad p y q, respectivamente. Por tanto,

P (X = k) = ✓ n k ◆ pkqn k

(c) Para hallar los momentos pedidos, vamos a definir las variables aleatorias Xi ´exito en el

i-´esimo experimento. Se sigue que X = X1+ . . . + Xn. Para la media, tenemos

E(X) = E(X1+ . . . + Xn) = E(X1) + . . . + E(Xn) = np

Para la varianza, vamos usar la propiedad de que, cuando las variables son independientes, se cumple que 2 = V (X) = V (X 1+ . . . + Xn) = V (X1) + . . . + V (Xn) Como V (Xi) es pq, entonces V (X) = npq. Por ´ultimo, CV = pnpq np = r 1 p np

Si n se hace grande, el coeficiente de variaci´on se hace peque˜no y la distribuci´on se agrupa m´as alrededor de la esperanza. Lo mismo pasa cuando p tiende a 1.

(d) Dado el coeficiente CAF =

1 2p

p

np(1 p), se sigue que la asimetr´ıa es m´axima cuando el numerador de esta fracci´on es cero. Eso ocurre cuando p = 1/2. Si n tiende a infinito, el coeficiente tambi´en tiende a cero y la distribuci´on se hace m´as sim´etrica.

La funci´on de masa es como se sale en la figura de abajo. Se observa c´omo la distribuci´on se hace m´as sim´etrica seg´un crece n. La funci´on de masa tiene un solo m´aximo, que ocurre en bn/2c o en dn/2e.

(5)

5.2. Procesos de Bernouilli 91

Figura 5.1: Funci´on de masa de la distribuci´on binomial

Las probabilidades de la binomial son tediosas de calcular a mano. En la pr´actica se calculan por v´ıa del ordenador, con alg´un paquete estad´ıstico (Statgraphics, Matlab, SPSS), o bien mediante tablas. Las tablas se pueden encontrar en el Moodle (fichero Formularios y tablas). En la figura 5.2 se encuentra elementos de la tabla de la distribuci´on binomial. Por ejemplo, si en una binomial X B(4, 0,15) queremos hallar la probabilidad de que X tome el valor 2, consultando la tabla encontramos que tal valor es 0,988.

Figura 5.2: Tabla de la distribuci´on binomial

El lector se habr´a dado cuenta de que en la tabla solo aparece los valores de probabilidad para distribuciones con 0 < p  0,5. ¿Qu´e ocurre cuando p > 0,5? El siguiente problema da cuenta de esa cuesti´on.

Problema 5.2.5 Sea X B(n, p) e Y B(n, 1 p). Probad que P (X = k) = P (Y = n k)

(6)

Soluci´on: Vamos a describir la funci´on de masa de X en t´erminos de la de Y . P (X = k) = ✓ n k ◆ pkqn k (1)= ✓ n n k ◆ pkqn k (2)= ✓ n n k ◆ qn kpn (n k) = P (Y = n k)

donde: (1) es consecuencia de la simetr´ıa de los n´umeros combinatorios; en (2) se ha sumado y restado n para identificar la funci´on de masa de X con la funci´on de masa de Y .

Ejercicio 5.2.6 Un dado se tira 4 veces. ¿Cu´al es la probabilidad de sacar exactamente un 6? Resolved el problema usando una binomial.

Soluci´on: Sea X es el n´umero de seises en las cuatro tiradas. La probabilidad de sacar un 6, que se interpreta como ´exito, es constante en el tiempo. Adem´as, las tiradas son independientes entre s´ı. Estamos, pues, ante un proceso de Bernouilli. La probabilidad pedida es P (X = 1) =

4 1 1 6( 5 6) 3 = 125 324.

Ejercicio 5.2.7 Como parte de un plan estrat´egico de negocio, el 20% de los nuevos suscriptores a un servicio de internet recibir´an una promoci´on especial del proveedor del servicio. Un grupo de 10 vecinos se apuntan al servicio. ¿Cu´al es la probabilidad de que al menos 4 reciben la promoci´on?

Soluci´on: Se considera ´exito recibir la promoci´on del proveedor del servicio. La oferta no cambia en el tiempo y su probabilidad es p = 0,20. Se trata, pues, de una binomial X B(10, 0,2). Se pide P (X 4) y mir´andola en la tabla sale P (X 4)⇡ 0,1208.

Problema 5.2.8 Un examen, que consta de 10 preguntas, se aprueba si se contestan correctamente 6 o m´as. Cada pregunta tiene 3 apartados y la respuesta se considera correcta si se contestan bien 2 o m´as apartados. Sabiendo que la probabilidad de que un alumno estudioso conteste bien cada apartado es 0,7, independientemente de lo que conteste en el resto de los apartados, calculad:

(a) La probabilidad de que dicho alumno apruebe el examen y la nota esperada.

(b) Sabiendo que este alumno ha aprobado el examen, calculad la probabilidad de que haya contestado correctamente 7 preguntas.

Soluci´on:

(a) Primero, observamos el fen´omeno de las preguntas y los apartados. Hay una pregunta contestada correctamente. Por las hip´otesis del problema, que son la independencia y la probabilidad constante de ´exito, sabemos que es un proceso de Bernouilli. Sea X1 el

n´umero de apartados contestados correctamente en una pregunta cualquiera; entonces, X1 B(3, 0,7). Por tanto, P (X1 2) = ✓ 3 2 ◆ 0,72· 0,3 + ✓ 3 3 ◆ 0,73 ⇡ 0,784

Si se mira en la tabla, tendr´ıamos que considerar una binomial Y B(3, 1 0.7) = B(3, 0.3):

(7)

5.2. Procesos de Bernouilli 93 Sea X2 la variable aleatoria n´umero de preguntas contestadas correctamente. Esta

variable es una binomial tambi´en. Si llamamos p a P (X1 2), entonces X2 B(10, p).

Se pide P (X 6), que es aproximadamente 0,9554. La esperanza de X2 es µ = np = 10· 0,9554 = 9,554.

(b) Se est´a pidiendo una probabilidad condicionada: P (X = 7|X 6) = P ({X = 7} \ {X 6}) P (X 6) = 10 7 (0,784) 7(1 0,784)3 0,9554 ⇡ 0,23

Problema 5.2.9 En un huerto con 100 calabazas, la probabilidad de recolectar una sin pipas es 0005.

(a) Calcular las probabilidades de los siguientes sucesos:

(i) Obtener m´as de 6 calabazas con pipas al recolectar las 10 primeras. (ii) Encontrar la primera calabaza sin pipas al recolectar la d´ecima. (iii) Recolectar en todo el huerto 10 calabazas sin pipas.

(iv) Recolectar en todo el huerto m´as de 7 calabazas sin pipas. (b) Hallar el n´umero esperado de calabazas sin pipas en el huerto.

Soluci´on: Recolectar calabazas sin pipas se considera un proceso de Bernouilli donde el ´exito es que no tenga pipas. Se supone que las calabazas salen sin pipas de modo independiente y que la probabilidad de no tener pipas es constante en el tiempo.

(a) Este apartado se resuelve definiendo una binomial adecuada para cada caso.

(i) Obtener m´as de 6 calabazas con pipas al recolectar las 10 primeras es una variable binomial X1 B(10, 0,95) y la probabilidad pedida es P(X1 > 6), que es

aproximadamente 10 6.

(ii) En este caso no tenemos una binomial, pero con las condiciones del problema se puede calcular la probabilidad pedida, que es

(0,95)9· 0,05 ⇡ 0,0315

(iii) Si consideramos el huerto entero, que tiene 100 calabazas, entonces usaremos una variable X2 B(100, 0,05). La probabilidad pedida es P(X2 = 10). Mirando en las

tablas, obtenemos 0,0167.

(iv) Usando la misma variable de antes, tenemos que calcular P (X2 > 7), que es

aproximadamente 0,1279.

(b) Dado que X2 B(100, 0,05), la esperanza es np = 5.

Problema 5.2.10 Supongamos que 2000 puntos se seleccionan al azar e independientemente del cuadrado S = {(x, y)|0  x, y  1}. Sea X el n´umero de puntos que caen en el conjunto A = {(x, y)|x2 + y2 < 1}. ¿Qu´e distribuci´on tiene X? Halla su media, su desviaci´on t´ıpica y

(8)

Soluci´on: Este problema profundiza en la idea de la probabilidad uniforme y extiende la idea de Laplace —probabilidad uniforme discreta—a conjuntos m´as generales. En este caso, tenemos un cuadrado y seleccionamos puntos al azar en ´el. Hay un conjunto, A, que en la figura es el sector circular blanco, que tiene ´area ⇡/4. El cuadrado total tiene ´area 1 y se considera el espacio muestral. La probabilidad de A ser´a precisamente su ´area.

Ahora nos enfrentamos a una variable binomial, donde A es el suceso ´exito y p = P (A) = ⇡/4. Obs´ervese que la probabilidad de A no cambia en el tiempo y que el problema establece que los puntos se eligen independientemente unos de otros. Entonces, la variable X n´umero de puntos que caen en A de los 2000 es X B(2000, ⇡/4). Las medidas pedidas son:

µ = 2000· ⇡/4 ⇡ 1.570,7963, = 2000· ⇡/4 · 3⇡

4 ⇡ 1178,0972, CV = µ ⇡ 0,75

5.3

Distribuci´

on geom´

etrica

Consideremos de nuevo un proceso de Bernouilli que se repite de modo independiente. Queremos medir el n´umero de veces que hay que repetir el experimento antes de salir el primer ´exito o suceso A. La correspondiente variable aleatoria se llama geom´etrica y se escribe X G(p), donde p es la probabilidad de que salga A.

Problema 5.3.1 Sea X G(p).

(a) Hallad la funci´on de masa de X y probad que suma 1. (b) Hallad E(X).

(c) Sabiendo que el coeficiente de asimetr´ıa de Fisher es CAF =

2 p

p

1 p

describid la asimetr´ıa de la distribuci´on geom´etrica. Dibujad aproximadamente la funci´on de masa.

(9)

5.3. Distribuci´on geom´etrica 95 Soluci´on:

(a) Dado que en la descripci´on de la variable pone n´umero de veces antes repetir el experimento, X toma valores en los n´umeros naturales, incluido el 0. Cada valor k de la variable est´a asociado con una sucesi´on de k 1 fracasos y un ´ultimo ´exito. Como hay independencia, tenemos:

P (X = k) = (1 p)k· p

Veamos que esta funci´on de masa suma 1, que no es m´as que la suma de una serie geom´etrica. 1 X k=0 (1 p)k· p = p · 1 1 (1 p) = 1

(b) Para hallar E(X) recurriremos a un resultado de series de potencias. Si una serie es convergente, entonces se puede derivar y su derivada es la derivada de la serie simplemente.

E(X) = 1 X k=0 k(1 p)k· p(1)= 1 X k=1 k(1 p)k· p(2)= 1 X k=1 (1 p)· k(1 p)k 1· p (3) = 1 X k=1 (1 p)· (1 p)k 0 · p(4)= p(1 p)· 1 X k=1 (1 p)k !0 (5) = p(1 p)· ✓ 1 p p ◆0 (6) = p(1 p)· 1 p2 = 1 p p

donde: (1) el t´ermino k = 0 se puede quitar; (2) se quita un factor a (1 p)k; (3) porque

la derivada de (1 p)k 0 es k(1 p)k 1; (4) por el mencionado resultado de las series convergentes; (5) sumando la serie geom´etrica del interior de la derivada; (6) efectuando la derivada.

(c) El coeficiente de asimetr´ıa de Fisher es CAF =

2 p

p

1 p. Como el m´aximo valor de p es 1, el coeficiente siempre ser´a positivo y la funci´on de masa ser´a asim´etrica a la derecha respecto a la media. La funci´on de masa de la Poisson se puede ver en la figura 5.3. Se puede ver que se trata de una cola a la derecha y que es siempre asim´etrica a la derecha. La varianza y el coeficiente de variaci´on de de la distribuci´on geom´etrica son, respectivamente, V (X) = 1 p p2 , CV = 1 p 1 p

Otra variable asociada a los procesos de Bernouilli es el n´umero de veces que se repite el experimento hasta que sale el primer ´exito. Esta variable es similar a la anterior y sus momentos se calculan de modo an´alogo.

(10)

Figura 5.3: La funci´on de masa de la distribuci´on geom´etrica

Ejercicio 5.3.2 Un dado se tira hasta que aparece un 4. ¿Cu´al es la probabilidad de tirar el dado 10 veces antes de sacar 4? ¿Cu´al es la probabilidad de sacar 4 en la d´ecima tirada? Resolved el problema usando una variable geom´etrica.

Soluci´on: Este problema se deja al lector.

Teorema 5.3.3 Sea X una variable aleatoria G(p). La probabilidad de repetir el experimento k veces m´as antes de sacar el primer ´exito no depende del n´umero previo de veces que hayamos realizado el experimento.

Prueba: Sea h > 0 y supongamos que se ha realizado el experimento k veces. El teorema establece que las probabilidades P (X = k + h|X k) y P (X = k + h) son iguales. Esto es equivalente a decir que los resultados de los k primeros experimentos no influyen en los resultados que vienen a continuaci´on. Si se ha realizado el experimento al menos k veces significa que X es mayor o igual que k; de lo contrario, ya se habr´ıa acabado el experimento. Tenemos que calcular cu´anto vale P (X = k + h|X k).

P (X = k + h|X k) =P ({X = k + h} \ {X k}) P (X k) = P (X = k + h) P1 i=k(1 p)i· p =(1 p) k+h· p (1 p)k·p p = (1 p)h· p = P (X = h)

Problema 5.3.4 Supongamos que en un juego de azar (que no sea hacer un examen de estad´ıstica), la probabilidad de ganar es p, con 0 < p < 1. ¿C´omo se interpreta el teorema anterior en el contexto de los juegos de azar?

Soluci´on: La interpretaci´on en t´erminos de un juego viene a decir que el juego no tiene memoria de los resultados previos para la probabilidad de los resultados futuros.

(11)

5.4. Distribuci´on de Poisson 97 Problema 5.3.5 En una red ATM los mensajes se env´ıan en r´afagas de celdas de 53 octetos. Un mensaje tendr´a tantas celdas como quiera y sabremos que hemos llegado al final del mensaje porque en los bits de control de la ´ultima celda as´ı se indica. Se sabe que la variable aleatoria X que cuenta el n´umero de celdas enviadas en la transmisi´on de un mensaje antes de la celda que marca el final del mensaje es geom´etrica de par´ametro p.

(a) Si sabemos que el n´umero medio de celdas por mensaje sin incluir la ´ultima celda es 7, calculad la probabilidad de que el n´umero de celdas enviadas en la transmisi´on de un mensaje, excluyendo la ´ultima, sea menor que 3.

(b) Calculad la probabilidad de que el n´umero de celdas enviadas en la transmisi´on de un mensaje, sin incluir la ´ultima celda, sea mayor que 7 si sabemos que es mayor que 4. (c) Se transmiten 10 mensajes de forma independiente. Obtened la probabilidad de que en

4 mensajes o m´as el n´umero total de celdas enviadas por mensaje, sin incluir la ´ultima celda, sea menor que 3.

Soluci´on: La variable n´umero de celdas enviadas antes de la ´ultima es una geom´etrica X G(p), dadas las hip´otesis asumidas en el problema. El par´ametro p es desconocido, pero dado que sabemos la media, podemos despejar su valor. Aqu´ı estamos usando de manera impl´ıcita que los momentos muestrales tienden a los momentos poblacionales.

1 p

p = 7; 1 p = 7p; p =

1 8 (a) En este apartado se pide P (X < 3):

P (X < 3) = P (X  2) = ✓ 1 1 8 ◆0 · 1 8+ ✓ 1 1 8 ◆1 ·1 8 + ✓ 1 1 8 ◆2 · 1 8 ⇡ 0,33 (b) Se trata de calcular la probabilidad P (X > 7|X > 4). Para ello, usaremos el

teorema 5.3.3, que establece que la probabilidad anterior es simplemente P (X > 3). P (X > 7|X > 4) = P (X > 3) = 1 P (X  2) = 1 0,33 = 0,67

(c) Ahora se ha fijado un n´umero de mensajes a 10. El experimento aleatorio es distinto y la variable aleatoria pasa a ser una binomial X1 B(10, p), donde p = P(X < 3), y

donde X es el n´umero de mensajes en esos 10 que tienen un n´umero de celdas menor que 3. Obs´ervese que las condiciones para una variable binomial y una geom´etrica son las mismas; solo son variables que miden distintos aspectos cuantitativos del fen´omeno.

P (X2 4) = 4 X k=0 ✓ 10 k ◆ (0,33)k· (1 0,33)10 k ⇡ 0,2339

5.4

Distribuci´

on de Poisson

La distribuci´on se cuenta entre la m´as importantes entre las discretas, principalmente por su ubicuidad. Es capaz de modelizar eficazmente un gran abanico de situaciones muy dispares

(12)

entre s´ı. Sim´eon Poisson (1781–1840) la introdujo por primera vez como parte de su teor´ıa de la probabilidad en 1837. Apareci´o en una obra suya en que investigaba la probabilidad de ciertos hechos en juicios penales y civiles. Poisson se preguntaba sobre el n´umero de condenas injustas en un pa´ıs, variable que sigue ciertamente la distribuci´on que lleva su nombre.

¿Por qu´e es tan ubicua la distribuci´on de Poisson? Definamos primero qu´e es un experimento de Poisson y ello nos har´a entender el porqu´e.

Definici´on 5.4.1 Experimento de Poisson. Consideremos un experimento con las siguientes propiedades:

(1) Los resultados del experimento se pueden clasificar en ´exito o fracaso, esto es, solo hay dos resultados posibles.

(2) Se observa el n´umero de ´exitos por unidad de cierta magnitud (tiempo, longitud, ´area, volumen, etc.).

(3) El n´umero medio de ´exitos en una regi´on dada es conocido; en otras palabras, se conoce la media de ´exitos por unidad de magnitud. Adem´as, este valor medio es constante en el tiempo.

(4) La probabilidad de ´exito es proporcional al tama˜no de la regi´on (aqu´ı regi´on se refiere a la magnitud en cuesti´on).

(5) La probabilidad de ´exito en intervalos extremadamente peque˜nos es cero. Esto asegura que la probabilidad de que dos sucesos ocurran a la vez es cero.

(6) Los sucesos ocurren de manera independiente.

Una objeci´on que se puede hacer a la definici´on anterior es que, en la pr´actica, esas condiciones son dif´ıciles de comprobar exhaustivamente. Ello es cierto en muchas ocasiones. De lo que se trata entonces es de suponer que son razonablemente ciertas las hip´otesis anteriores y ver c´omo el modelo explica los resultados de ulteriores experimentos.

Para que el lector tome consciencia de la importancia de la distribuci´on de Poisson, he aqu´ı una lista de modo alguno exhaustiva de situaciones en que aparece esta distribuci´on:

(a) El n´umero de coces dadas por los caballos del ej´ercito prusiano. Esta fue la primera aplicaci´on de la distribuci´on de Poisson de la que se tiene constancia hist´orica.

(b) El n´umero de part´ıculas alfa emitidas por una sustancia radioactiva por unidad de tiempo. (c) El n´umero de bombas lanzadas por bombarderos a´ereos en el sur de Londres durante la

Segunda Guerra Mundial.

(d) El n´umero de accidentes en cierto punto de una carretera por d´ıa. (e) El n´umero de erratas por p´agina.

(f) El n´umero de pasas por cent´ımetro c´ubico en un plumcake.

(g) El n´umero de cambios cromos´omicos en una c´elula como consecuencia de la exposici´on a los rayos X.

(13)

5.4. Distribuci´on de Poisson 99 (h) El n´umero de alumnos con verdadera pasi´on por la inform´atica por grupo.

(i) El n´umero de pelos encontrados en las hamburguesas de McDonalds (o de cualquier otra cadena de comida basura).

(j) El n´umero de fallos en una m´aquina por mes.

(k) El n´umero de llamadas a un servicio de atenci´on al cliente por hora.

Si solo queremos centrarnos en ejemplos con sabor netamente inform´atica, aqu´ı va otra lista similar, m´as corta pero suficientemente representativa; el lector puede construir su propia lista:

(a) El n´umero de peticiones a un servidor por unidad de tiempo.

(b) El n´umero de errores de codificaci´on que comete un equipo de programadores por semana. (c) El n´umero de fallos de un disco duro por mes.

(d) El n´umero de mensajes que llegan a la unidad de proceso de un ordenador por segundo. (e) El n´umero de cuelgues de un sistema operativo por semana.

(f) El n´umero de mensajes de correo basura que llegan por semana. (g) El n´umero de programas compilados por un ordenador por d´ıa.

La variable de Poisson es n´umero de sucesos por unidad de magnitud y su funci´on de masa de la distribuci´on de Poisson est´a dada por la expresi´on de m´as abajo

P (X = k) = e

k

k!

donde el rango de valores es k 2 N (el n´umero de sucesos por unidad de magnitud puede ser cualquier n´umero natural). La figura 5.4 muestra la funci´on de masa para distintos valores de

.

Problema 5.4.2 Comprobad que la funci´on de masa dada anteriormente lo es efectivamente. Usad la siguiente f´ormula, consecuencia del desarrollo de Taylor (¡ah, qu´e tiempo aquellos de AM!) y que es v´alida para todo x2 R:

ex = 1 X n=0 xn n!

Soluci´on: No es m´as que aplicar la serie anterior para probar que suma 1.

1 X k=0 e k k! =e 1 X k=0 k k! = e e = e 0 = 1

(14)

Figura 5.4: La funci´on de masa de la distribuci´on de Poisson

El c´alculo efectivo de una probabilidad en una distribuci´on de Poisson se hace tambi´en a trav´es de la consulta de tablas o del ordenador.

Suponemos que el lector estar´a un tanto desorientado ante esa funci´on de masa. ¿De d´onde sale una expresi´on tan complicada? Obviamente, Poisson no se la invent´o de la nada ni tuvo un acceso de inspiraci´on y dijo “¡ah!, todos estos fen´omenos siguen esta distribuci´on con esta funci´on de masa tan intricada”. Poisson obtuvo esta distribuci´on a partir de la binomial B(n, p) imponiendo las condiciones de m´as arriba en el experimento y haciendo tender n a infinito y p a cero con ciertas restricciones. El siguiente teorema que, excepcionalmente damos con demostraci´on, muestra el trabajo original de Poisson y da, adem´as, una explicaci´on l´ogica y org´anica de d´onde sale la funci´on de masa.

Teorema 5.4.3 Sean X B(n, p) una variable aleatoria binomial. Supongamos que se dan las siguientes condiciones:

(a) El par´ametro n tiende a infinito; (b) np permanece constante e igual a .

Entonces la funci´on de masa de la binomial tiende a la de una Poisson.

Prueba: Teniendo en cuenta que en todo momento np = , tenemos la siguiente demostraci´on (cons´ultese las explicaciones de los pasos de los c´alculos m´as abajo):

(15)

5.4. Distribuci´on de Poisson 101 l´ım n!1P (X = k) = l´ımn!1 ✓ n k ◆ · pk(1 p)n k (1)= l´ım n!1 n! k!(n k)! · p k(1 p)n k (2) = l´ım n!1 n! k!(n k)! · ✓ n ◆k✓ 1 n ◆n k (3) = k k! n!1l´ım n· (n 1)· . . . · (n (k 1)) nk · ✓ 1 n ◆n k (4) = k k! ✓ l´ım n!1 n· (n 1)· . . . · (n (k 1)) nk ◆ · l´ım n!1 ✓ 1 n ◆n k! (5) = k k! ✓ l´ım n!1 n· (n 1)· . . . · (n (k 1)) nk ◆ · l´ım n!1 ✓ 1 n ◆n · ✓ 1 n ◆ k! (6) = k k! · 1 · e · 1 = k k!e

donde: en (1) se ha aplicado la definici´on de n´umero combinatorio; en (2) se ha sustituido p por /n; en (3) se ha sacado fuera del l´ımite el t´ermino

k

k! y reordenado el resto de t´erminos; en (4) se han separado en dos l´ımites el producto de (3); en (5) se ha separado el segundo l´ımite en dos productos para facilitar su c´alculo; en (6) se han calculado los l´ımites entre par´entesis. El primer l´ımite de (6) da 1 puesto que en el numerador y el denominador hay k factores en n. El siguiente l´ımite da e por la definici´on de n´umero e y el ´ultimo l´ımite tiende claramente a 1.

Problema 5.4.4 ¿C´omo se llega del teorema anterior a la definici´on de experimento de Poisson? Dad una explicaci´on conceptual de esa relaci´on.

Soluci´on:

Problema 5.4.5 Si X P( ), calculad E(X), V (X) y el coeficiente de variaci´on.

Soluci´on: Presentamos los c´alculos por separado con las explicaciones despu´es de cada uno. • Para la esperanza: E(X) = 1 X k=0 ke k k! (1) = e 1 X k=1 k k k! (2) = · e 1 X k=1 k 1 (k 1)! (3) = · e 1 X k=0 k k! (4) = · e e = · e0 =

donde: (1) el t´ermino k = 0 se puede quitar y e se puede sacar fuera del sumatorio; (2) dividimos por k dentro del sumatorio y sacamos un factor de k; (3) hacemos un cambio

(16)

• Para la varianza, calcularemos primero E(X2): E(X2) = 1 X k=0 k2e k k! (1) = e 1 X k=1 k2 k k! (2) = · e 1 X k=1 k k 1 (k 1)! (3) = · e 1 X k=0 (k + 1) k k! = · e 1 X k=0 k k k! + · e 1 X k=0 k k! (4) = · + · 1 = 2+

donde: (1) el t´ermino k = 0 se puede quitar y e se puede sacar fuera del sumatorio; (2) dividimos por k dentro del sumatorio y sacamos un factor de k; (3) hacemos un cambio

de ´ındice en el sumatorio; (4) el primer t´ermino es la media calculada antes y el segundo es la suma de la funci´on de masa.

Por tanto, V (X) = E(X2) E(X)2 = 2+ 2 = • Por ´ultimo, el CV es CV = µ = p = p1

La dispersi´on en la Poisson disminuye seg´un aumenta el valor de .

Ejercicio 5.4.6 El coeficiente de asimetr´ıa de la variable Poisson es p1 . Interpretad dicho

coeficiente.

Soluci´on: Este ejercicio se deja al lector.

Teorema 5.4.7 Sean X1 P( 1) y X2 P( 2) dos variables aleatorias independientes con

distribuci´on de Poisson. Entonces la variable X = X1 + X2 sigue una distribuci´on X

P ( 1 + 2).

Prueba: Sea X = X1+ X2 la suma de dos variables independientes distribuidas seg´un Poisson

X1 P( 1) y X2 P( 2). Si k 2 N, podemos escribir el suceso X = k como la uni´on de

los sucesos X1 = k i y X2 = i para i = 0, . . . , k y adem´as dicha uni´on coge todos los casos

posibles. P (X = k) = k X i=0 P (X1 = k i)· P (X2 = i) (1) = k X i=0 e 1 k i 1 (k i)!· e 2 i 2 i! (2) =e 1e 2 k X i=0 k i 1 (k i)!· i 2 i! (3) = e ( 1+ 2) k! k X i=0 k! k i 1 (k i)!· i 2 i! (4) =e ( 1+ 2) k! k X i=0 ✓ k i ◆ k i 1 · i2 (5) = e ( 1+ 2) k! ( 1 + 2) k

donde: (1) se hace uso de las funciones de masa de X1 y X2; (2) sacamos las exponenciales

fuera del sumatorio; (3) se divide y multiplica la expresi´on por k! con el fin de generar el n´umero combinatorio del sumatorio; (4) identificamos (k i)!i!k! con ki ; (5) aplicamos el binomio de Newton. La ´ultima expresi´on obtenida es la funci´on de masa para X P( 1+ 2).

(17)

5.4. Distribuci´on de Poisson 103 La propiedad que prueba este teorema se llama reproductividad.

Ejercicio 5.4.8 El n´umero de peticiones que llegan a un servidor sigue una distribuci´on de Poisson. Si la media de ese n´umero es de 10 mensajes por segundo, ¿cu´al es la probabilidad de que no haya ninguna petici´on en un segundo? ¿Y de que haya 15 o menos en un segundo? Soluci´on: Nos dicen directamente que estamos en presencia de un proceso de Poisson. La esperanza es = 10, que es tambi´en el par´ametro de la distribuci´on. Nos piden primero P (X = 0), que es e 10 ⇡ 0,000045. Despu´es piden

P (X  15) = 15 X k=0 e 1010 k k! ⇡ 0,9512

Problema 5.4.9 Sabiendo que un ordenador compila, en promedio, 5 programas cada 10 minutos, calculad la probabilidad de que compile:

(a) M´as de 2 programas y menos de 6 en 10 minutos. (b) 25 programas en una hora.

Soluci´on: El problema da pocos datos, pero es razonable suponer que la media no cambia en el tiempo, esto es, en cualquier periodo de 10 minutos la media es 5 programas. Supondremos tambi´en que la compilaci´on de los programas es independiente entre s´ı. Por ´ultimo, como es una medida por unidad de tiempo, esto sugiere que sigue una distribuci´on de Poisson. Llamaremos X P(5) a nuestra variable. (a) Se pide P (2 < X < 6): P (2 < X < 6) = 5 X i=3 e 55 k k! = F (5) F (3)⇡ 0,61596 0,26503 = 0,35093

(b) Como la media es constante, el n´umero de programas compilados en una hora sigue una Poisson P (30); llam´emosla Y

P (Y = 25) = e 30· 30

25

25! ⇡ 0,05112

Problema 5.4.10 Una f´abrica suelta un vertido contaminante 2 veces al mes en promedio. La f´abrica se revisa cuando hay m´as de 8 vertidos contaminantes en un trimestre. La f´abrica se para si un trimestre hay m´as de 1 mes con al menos 4 vertidos. Calculad:

(a) La probabilidad de que un trimestre haya que revisar la f´abrica. (b) El n´umero esperado de vertidos contaminantes en un trimestre.

(c) La probabilidad de que la f´abrica funcione 5 trimestres antes de ser revisada.

(d) El n´umero medio de trimestres que tienen que transcurrir antes de que la f´abrica tenga que ser revisada.

(18)

(e) La probabilidad de que un mes haya al menos 4 vertidos contaminantes. (f) La probabilidad de que un trimestre haya que parar la f´abrica.

Soluci´on: Estamos ante una variable que mide el n´umero de sucesos por unidad de tiempo. Supondremos que sigue una distribuci´on de Poisson. Como nos dan el promedio de vertidos por mes, se trata de una variable X P(2), donde X es el n´umero de vertidos contaminantes por mes.

(a) La probabilidad de que un trimestre haya que revisar la f´abrica corresponde a calcular P (X1 > 8), donde X1 es el n´umero de vertidos contaminantes por trimestre, que es

X1 P(6).

P (X1 > 8) = 1 P (X1  8) ⇡ 1 0,8472 = 0,1528

(b) Se pide la esperanza de X1, que es una distribuci´on de Poisson. Por tanto, E(X1) = 6.

(c) La variable X2, n´umero de trimestres antes de la primera revisi´on, sigue una distribuci´on

geom´etrica de par´ametro p, donde el ´exito es que la f´abrica no se revise y su probabilidad es P (X1  8). Esa probabilidad se calcul´o en un apartado anterior y vale 0,8472. Se nos

pide la probabilidad P (X2 = 5).

P (X2 = 5) = P (X1  8)5· (1 P (X1  8)) = 0,0666

(d) Se nos pide la esperanza de una geom´etrica de par´ametro 0,8472. Esta ser´ıa E(X3) = 1 p

p = 0,1867 trimestres.

(e) En este apartado se pide la probabilidad de que un mes haya al menos 4 vertidos contaminantes. Esto corresponde a la probabilidad P (X 4), que es aproximadamente 0,14287.

(f) Si X3 es el n´umero de paradas de la f´abrica en 3 meses, por las hip´otesis del problema,

se sigue que X3 B(3, P(X 4)). Se quiere calcular la probabilidad P (X3 1).

P (X3 1) = 1 P (X3  0) = 1 P (X < 4)3 ⇡ 0,3702

Problema 5.4.11 Construye el mapa conceptual de este tema. Soluci´on: El mapa se encuentra en la siguiente hoja.

(19)

5.4. Distribuci´on de Poisson 105 Modelos d iscr etos Los modelos d iscr etos se obt ienen del estud

io del fenómeno de inter

és Uniforme d iscr eta Asigna pr obabil idades

iguales a todos los valor

es de la variable Uniforme d iscr eta sobr e el conjunto {1,2,…,n} Momentos: Uniforme d iscr eta arbitraria Momentos Binomiales Pr oceso de Bernouil li: (1) El

experimento solo puede dar dos r

esul tados posibles, que l lamar emos A y B. (2) La pr obabil idad p de obtener A no cambia con el t iempo. Variable Bernoul li X~B(1,p): V ale 1 si sale A y 0 si no sale A. Momentos: Binomial B(n,p): r epet iciones independ ientes de pr ocesos de Bernouil li Momentos: Pr opiedad: Gráfica: Función de masa: k toma valor es entr e 0 y n Geométrica

Recuento del númer

o de experimentos

real

izados

hasta

el primer éxito

Se puede definir también incluyendo el primer éxito

Momentos: Pr opiedad de la fal ta de memoria: La pr obabil idad de r epet ir el experimento k

veces más antes de sacar el primer éxito no depende del númer

o pr

evio de veces que

hayamos r

eal

izado el experimento.

Función de masa: toma valor

es en los númer os naturales Gráfica: Poisson Experimento de Poisson: (1) Los r esul

tados del experimento se pueden

clasificar en éxito o fracaso. (2) Se observa el númer

o de éxitos por

unidad de cierta magnitud (t

iempo, longitud,

ár

ea, volumen, etc.). (3) El númer

o med

io de éxitos en una r

egión

dada es conocido. Además, este valor med

io es constante en el t iempo. (4) La pr obabil idad de éxito es pr opor cional al tamaño de la r egión. (5) La pr obabil

idad de que dos sucesos

ocurran a la vez es cer

o.

(6) Los sucesos ocurr

en de manera independ iente Función de masa: Gráfica: Apr

oximación de la binomial por una Poisson:

Momentos:

La suma de d

istribuciones de Poisson

independ

ientes es otra Poisson de parámetr

o

la suma de los parámetr

Referencias

Documento similar

2.- Aunque, para elaborar un comentario completo, debemos formular varias preguntas, en los ejercicios pedagógicos es preferible que reduzcamos, sobre todo al principio,

Cedulario se inicia a mediados del siglo XVIL, por sus propias cédulas puede advertirse que no estaba totalmente conquistada la Nueva Gali- cia, ya que a fines del siglo xvn y en

No había pasado un día desde mi solemne entrada cuando, para que el recuerdo me sirviera de advertencia, alguien se encargó de decirme que sobre aquellas losas habían rodado

De acuerdo con Harold Bloom en The Anxiety of Influence (1973), el Libro de buen amor reescribe (y modifica) el Pamphihis, pero el Pamphilus era también una reescritura y

En junio de 1980, el Departamento de Literatura Española de la Universi- dad de Sevilla, tras consultar con diversos estudiosos del poeta, decidió propo- ner al Claustro de la

[r]

SVP, EXECUTIVE CREATIVE DIRECTOR JACK MORTON

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación