• No se han encontrado resultados

Tema 6. Algunos modelos de distribuciones discretas

N/A
N/A
Protected

Academic year: 2020

Share "Tema 6. Algunos modelos de distribuciones discretas"

Copied!
28
0
0

Texto completo

(1)

Algunos modelos de distribuciones discretas.

Una vez expuesta la teor´ıa general sobre variables aleatorias y sus distribuciones de probabi-lidad, vamos a describir algunas distribuciones particulares que han demostrado, emp´ıricamente, ser modelos apropiados para situaciones que ocurren en la vida real. A pesar de ello tales dis-tribuciones presentan un car´acter te´orico en el sentido de que sus funciones de probabilidad o de densidad se deducen matem´aticamente en base a ciertas hip´otesis que se suponen v´alidas para los fen´omenos aleatorios.

La elecci´on de una distribuci´on de probabilidad para representar un fen´omeno de inter´es pr´actico debe estar motivada tanto por la comprensi´on de la naturaleza del fen´omeno en s´ı, como por la posible verificaci´on de la distribuci´on seleccionada a trav´es de la evidencia emp´ırica. En todo momento debe evitarse aceptar de manera t´acita una determinada distribuci´on de probabilidad como modelo de un problema pr´actico.

Una distribuci´on de probabilidad est´a caracterizada, de forma general, por una o m´as can-tidades que reciben el nombre de par´ametros de la distribuci´on. Un par´ametro puede tomar cualquier valor de un conjunto dado y, en ese sentido, se define una familia de distribuciones de probabilidad que tendr´an la misma funci´on gen´erica de probabilidad o funci´on de densidad. En este tema estudiaremos varias distribuciones de tipo discreto de gran utilidad en apli-caciones. En cada caso, se expondr´a detalladamente c´omo surgen (el modelo probabil´ıstico subyacente) y se deducir´an sus momentos, funci´on generatriz de momentos y otras caracter´ısti-cas de inter´es

1. Distribuci´

on degenerada

La distribuci´on discreta m´as sencilla es la correspondiente a una variable aleatoria degenerada o constante, es decir, la asociada a un experimento aleatorio que da lugar siempre al mismo resultado. Por tanto, dicha variable aleatoria tomar´a un ´unico valor c.

Sufunci´on masa de probabilidad es

P[X =x] =

1 x=c

0 x6=c Algunas de sus caracter´ısticas son:

Funci´on de distribuci´on:

F(x) = P[X ≤x] =

0 x < c

1 x≥c

(2)

Momentos no centrados:

mk =E[Xk] =ckP[X =c] =ck, k= 1,2,· · ·

Y, en particular, la MEDIA

E[X] =c. Momentos centrados:

µk =E[(X−c)k] = 0, k= 1,2,· · ·

Y, en particular, la VARIANZA

Var[X] = 0.

Esta propiedad caracteriza a las distribuciones degeneradas; es decir, una variable alea-toria tiene varianza cero si y solamente si es degenerada en un punto (Propiedades de la varianza).

Funci´on generatriz de momentos:

M(t) =E[etX] = etc ∀t ∈R. Notas

Si una variable aleatoria tiene funci´on generatriz de momentos MX(t) = e5t ∀t∈R

entonces, dado que la f.g.m. determina de forma ´unica la distribuci´on de la variable, X tiene una distribuci´on degenerada en el punto 5, es decir

P[X = 5] = 1

Si una variable aleatoria tiene funci´on generatriz de momentos MX(t) = 1 ∀t∈R

entonces, dado que la f.g.m. determina de forma ´unica la distribuci´on de la variable, X tiene una distribuci´on degenerada en el punto 0, es decir

(3)

2. Distribuci´

on uniforme discreta

Esta es la distribuci´on de probabilidad de una variable aleatoria discreta que toma un n´umero finito de valores que son equiprobables y se utiliza para modelizar variables aleatorias aso-ciadas a experimentos aleatorios que tienen un n´umero finito de posibles resultados que son equiprobables. Su funci´on masa de probabilidad es

P[X =xi] =

1

n, i= 1,2,· · · , n

Se dice entonces que la variable aleatoria X se distribuye uniformemente sobre los puntos x1, x2,· · · , xn y se notar´a X ∼U(x1, x2, . . . , xn).

Ejemplo

La variable aleatoria asociada al experimento aleatorio de lanzar un dado al aire (tiene seis resultados posibles y equiprobables si el dado est´a bien construido)

P[X =i] = 1

6, i= 1,2,· · · ,6 Algunas de sus caracter´ısticas son:

Funci´on de distribuci´on:

F(x) = 1

n(N´umero de valores xi ≤x) =

     

     

0 si x < x1 i

n si xi ≤x < xi+1, i= 1, . . . , n−1 1 si x≥xn

Momentos no centrados:

mk = E[Xk] =

1 n

n

X

i=1

xki, k = 1,2,· · ·

Y, en particular, la MEDIA

E[X] = 1 n

n

X

i=1

xi = ¯x.

Momentos centrados:

µk = E[(X−EX)k] =

1 n

n

X

i=1

(4)

Y, en particular, la VARIANZA

Var[X] = 1 n

n

X

i=1

(xi−x)¯ 2.

Funci´on generatriz de momentos:

M(t) = E[etX] = 1 n

n

X

i=1

etxi t

R.

En el caso particular xi =i, i= 1,2, . . . , n

E[X] = n1Pn

i=1i= 1

n n(n+1)

2 =

n+1 2

E[X2] = n1Pn

i=1i 2 = 1

n

n(n+1)(2n+1) 6 =

(n+1)(2n+1) 6

Var[X] = (n+1)(26n+1) − (n+1)4 2 = n212−1

3. Distribuci´

on de Bernoulli

Supongamos un experimento aleatorio que da lugar, ´unicamente, a dos posibles resultados que son mutuamente excluyentes y exhaustivos. Los dos posibles resultados se denotan como:

- ´exito (E), que ser´a el suceso objeto de estudio, y - fracaso (F), que es el complementario de E. Evidentemente

E, F ⊂Ω, E ∪F = Ω, E∩F =∅.

A este tipo de experimentos aleatorios se les llamaexperimentos o pruebas de Bernou-lli.

Asociado a un experimento o prueba de Bernoulli y a su correspondiente espacio muestral Ω ={E, F}, se define la variable aleatoria con distribuci´on de Bernoulli como

X =

1 si ocurre el suceso E

0 si no ocurre el suceso E (ocurre F)

Si se denota por p a la probabilidad del suceso ´exito (E) y, por tanto, la probabilidad del suceso fracaso ser´a 1−p, la funci´on masa de probabilidad de esta variable aleatoria ser´a

(5)

P[X =x] =px(1−p)1−x, x= 0,1; 0< p <1

y se notar´a como X ∼B(1, p). (Los casos p= 0 yp= 1 dan lugar a variables degeneradas) Ejemplos

- La variable aleatoria asociada al experimento aleatorio de lanzar una moneda (si la moneda est´a bien construida p= 1/2)

- La variable aleatoria asociada a contabilizar ocurrencias, por ejemplo si una persona es votante de un partido o no, si una pieza manufacturada es defectuosa o no (variables indicado-ras).

Algunas de sus caracter´ısticas son: Funci´on de distribuci´on

F(x) =

    

    

0 x <0 1−p 0≤x <1

1 x≥1

Momentos no centrados:

mk=p, k = 1,2,· · ·

Y, en particular,

E[X] =p, E[X2] =p Momentos centrados:

µk= (1−p)kp+ (−p)k(1−p), k = 1,2,· · ·

Y, en particular,

Var[X] = E[X2]−(E[X])2 =p−p2 =p(1−p) Funci´on generatriz de momentos:

(6)

Nota

Si una variable aleatoria tiene funci´on generatriz de momentos MX(t) = 0,8et+ 0,2 ∀t∈R

entonces, dado que la f.g.m. determina de forma ´unica la distribuci´on de la variable, X tiene una distribuci´onB(1,0,8).

Ejemplo.-Un agente de seguros dedicado a la venta de seguros de vida, realiza visitas a posibles clientes con el fin de contratar un seguro de vida. Se sabe de su trayectoria como agente que en el 60% de las visitas logra contratar un seguro. Definir la variable aleatoria asociada a este experimento aleatorio y obtener su media y varianza.

Tenemos un experimento aleatorio o prueba de Bernoulli que consiste en realizar una visita a un cliente e intentar contratarle un seguro. Los dos posibles resultados ser´an:

- El cliente contrata el seguro, suceso ´exito. - El cliente no contrata el seguro, suceso fracaso.

La variable aleatoria asociada al experimento se define como

X =

1 si el cliente contrata el seguro (ocurre el suceso E) 0 si el cliente no contrata el seguro (no ocurre el suceso E)

En este caso la probabilidad de ´exito es p= 0,6 y de aqu´ı que la funci´on masa de probabilidad de la variable aleatoria X es

P[X = 1] =P(E) = 0,6 = p P[X = 0] =P(E) = 0,4 = 1−p La media y la varianza son

E[X] =p= 0,6

Var[X] =p(1−p) = 0,6·0,4 = 0,24

4. Distribuci´

on binomial

Una generalizaci´on de la distribuci´on de Bernoulli se obtiene cuando:

- El experimento o prueba de Bernoulli se repite n veces de forma independiente. - La probabilidad de ´exitop permanece constante en cada repetici´on del experimento. Se define ahora una variable aleatoriaXcomo el n´umero de ´exitos en lasnrepeticiones indepen-dientes del experimento que puede tomar los valoresk = 0,1,· · · , n. Calculemos la probabilidad de que dicha variable tome cada uno de esos valores; esto es, P[X = k], k = 0,1,· · · , n, o lo que es lo mismo, la probabilidad de obtener k ´exitos (o realizaciones del suceso E) en las n pruebas de Bernoulli.

(7)

EE· · k)EE¯E¯· · n−k)E¯

Al ser las pruebas independientes, la probabilidad de la intersecci´on de losn sucesos anteriores ser´a el producto de las probabilidades de cada uno de los sucesos; esto es

pp· · k)p(1−p)(1−p)· · n−k)(1−p) = pk(1−p)n−k

Ahora habr´a que multiplicar esta probabilidad por el n´umero de posibles ordenaciones de los k´exitos y los n−k fracasos, que es el n´umero de permutaciones de n elementos con repetici´on dek elementos de un tipo y n−k de otro

n! k!(n−k)! =

n k

Por tanto

P[X =x] =

n x

px(1−p)n−x, x= 0,1,· · · , n

Definici´on.- Se dice que una variable aleatoria X sigue una distribuci´on binomial de par´ametrosn y p,n ∈N,p∈(0,1) si modeliza el n´umero de ´exitos en n repeticiones indepen-dientes de un ensayo de Bernoulli con probabilidad p de ´exito, manteni´endose ´esta constante en lasn repeticiones del experimento; o bien, si su funci´on masa de probabilidad es

P[X =x] =

n x

px(1−p)n−x, x= 0,1,· · · , n. Se notar´a comoX ∼B(n, p).

Nota.-Observemos que la distribuci´on de Bernoulli no es m´as que un caso particular de la distribuci´on binomial con n= 1.

Probemos que, en efecto, es una funci´on masa de probabilidad. En primer lugar, son valores mayores o iguales que cero y, en segundo lugar, su suma vale uno. En efecto, teniendo en cuenta el binomio de Newton

n

X

x=0

P[X =x] =

n

X

x=0

n x

px(1−p)n−x = [p+ (1−p)]n= 1

Ejemplo: N´umero de caras al lanzar una monedan veces de forma independiente. Aplicaciones

(8)

- N´umero de unidades defectuosas en un proceso de fabricaci´on. En un proceso de manu-factura se produce un determinado producto en el que algunas unidades son defectuosas. Si la proporci´on de unidades defectuosas producidas por este proceso es constante durante un perio-do razonable y si, como procedimiento de rutina, se seleccionan aleatoriamente un determinaperio-do n´umero de unidades, entonces el n´umero de art´ıculos defectuosos en dicha muestra se puede modelizar mediante el empleo de la distribuci´on binomial.

- En aplicaciones de publicidad para la venta de un art´ıculo, tambi´en puede considerarse la distribuci´on binomial, si se supone que la probabilidad de venta es constante para todas las personas consideradas.

- En Medicina, por ejemplo, para estudiar el n´umero de individuos que contraen una enfer-medad, si para un grupo determinado de la poblaci´on la probabilidad de contraer tal enfermedad se mantiene constante.

Algunas de sus caracter´ısticas son: Funci´on de distribuci´on:

F(x) = P[X ≤x] =

    

    

0 x <0

P[X = 0] +. . .P[X =i] i≤x < i+ 1; i= 1,2, . . . , n−1

1 x≥n

o bien,

F(x) =

       

       

0 x <0

[x]

X

k=0

n k

pk(1−p)n−k 0≤x < n

1 x≥n

donde [x] denota la parte entera de x. Dicha funci´on de distribuci´on es una funci´on escalonada con n+ 1 saltos en los puntos 0,· · · , n de longitudes P[X = 0], . . . ,P[X =n] Funci´on generatriz de momentos

M(t) = (pet+ (1−p))n ∀t∈R

(9)

M(t) = E

etX

=

n

X

x=0 etx

n x

px(1−p)n−x

=

n

X

x=0

n x

(pet)x(1−p)n−x = [pet+ (1−p)]n

Momentos: Dado que la variable est´a acotada, existen los momentos de todos los ´ordenes, pero nos limitaremos a calcular hasta los de orden dos.

Media

E[X] =np

lo cual se puede probar, o bien a partir de la funci´on generatriz de momentos o bien, directamente. Veamos la obtenci´on directa

E[X] =

n

X

x=0 x

n x

px(1−p)n−x =

n

X

x=0

x n! x!(n−x)!p

x(1p)n−x=

n

X

x=1

n!

(x−1)!(n−x)!p

x

(1−p)n−x =np

n

X

x=1

(n−1)! (x−1)!(n−x)!p

x−1

(1−p)n−x

Tomando y=x−1 y m=n−1, entonces

E[X] =np

m

X

y=0

m! y!(m−y)!p

y

(1−p)m−y =np

dado que los t´erminos de la ´ultima suma corresponden a la funci´on masa de probabilidad de una B(m, p) y, por tanto, suman uno.

Varianza

Var[X] =np(1−p)

dado que el momento no centrado de orden dos es m2 = E[X2] =n(n−1)p2+np. Este se puede obtener a partir de la funci´on generatriz de momentos o bien directamente. Veamos esta ´ultima forma

(10)

E[X(X−1)] =

n

X

x=0

x(x−1)

n x

px(1−p)n−x =

n

X

x=0

x(x−1) n! x!(n−x)!p

x

(1−p)n−x

n

X

x=2

n!

(x−2)!(n−x)!p

x(1p)n−x =n(n1)p2

n

X

x=2

(n−2)! (x−2)!(n−x)!p

x−2(1p)n−x

Tomando ahora y=x−2 ym =n−2, de forma an´aloga a la media , se obtiene

E[X(X−1)] =n(n−1)p2

m

X

y=0

m! y!(m−y)!p

y(1p)m−y =n(n1)p2

dado que los t´erminos de la ´ultima suma corresponden a la funci´on masa de probabilidad de una B(m, p) y, por tanto suman uno.

Propiedad de simetr´ıa.- Si X ∼B(n, p), entonces la variable aleatoria que contabiliza el n´umero de fracasos, Y =n−X ∼B(n,1−p) y, adem´as

P[X =x] = P[Y =n−x] Se puede probar calculando la funci´on generatriz de momentos.

MY(t) = E[et(n−X)] = etnMX(−t) = etn pe−t+ (1−p)

n

= (1−p)et+pn.

C´alculo de probabilidades y representaciones gr´aficas

(Ver apuntes y scripts de R, y applets de Java con Geogebra)

EJERCICIOS

1.- Un club nacional de automovilistas comienza una campa˜na telef´onica con el prop´osito de aumentar el n´umero de miembros. En base a experiencia previa, se sabe que una de cada 20 personas que reciben la llamada se une al club. Si en un d´ıa, 25 personas reciben la llamada telef´onica, ¿cu´al es la probabilidad de que por lo menos dos de ellas se inscriban al club? ¿Cu´al es el n´umero esperado?

Soluci´on: Si cada persona que recibe la llamada se une o no al club, independientemente del resto, entonces,

(11)

X ∼B(25,1/20)

P[X ≥2] = 1−P[X <2] = 1−[P[X = 0] + P[X = 1]] =

= 1− "

25 0

1 20

0

19 20

25

+

25 1

1 20

1

19 20

24#

= 0.3576

E[X] =np = 25 1

20 = 1.25

2.-Un representante realiza cinco visitas cada d´ıa a los comercios de su ramo y, por experiencia anterior, sabe que la probabilidad de que le hagan un pedido en cada visita es 0.4. Calcular a) La distribuci´on del n´umero de pedidos por d´ıa.

b) Media y varianza del n´umero de pedidos por d´ıa.

c) Probabilidad de que el n´umero de pedidos que realiza durante un d´ıa sea 4. d) La probabilidad de que realice por lo menos dos pedidos.

e) La probabilidad de que el n´umero de pedidos que realiza durante un d´ıa est´e comprendido entre 1 y 3.

Soluci´on: Supuesto que en cada visita se hace un pedido o no independientemente de lo que se haga en otra visita:

a)X : N´umero de pedidos diarios∼B(5,0.4)

b)E[X] = 5×0.4 = 2, V ar[X] = 5×0.4×0.6 = 1.2 c)P(X = 4) = 540.440.61 = 0.0768.

Con R, dbinom(4,5,0.4)=0.0768.

d)P(X ≥2) = 1−P(X <2) = 1−P(X ≤1) = 1−(P(X = 0) +P(X = 1)) = 0.66304. Con R, 1-pbinom(1,5,0.4)=0.66304, o bien, dado queP(X ≥2) =P(X >1),

pbinom(1,5,0.4,lower.tail=FALSE)=0.66304.

e)P(1≤X≤3) = P(X = 1)+P(X = 2)+P(X = 3) = 51

0.410.64+ 5 2

0.420.63+ 5 3

0.430.62 = 0.2592 + 0.3456 + 0.2304 = 0.8352.

Con R, sum(dbinom(1:3,5,0.4))=0.8352, o bien, pbinom(3,5,0.4)-pbinom(0,5,0.4)=0.8352. 3.- Se env´ıan 20 invitaciones a los representantes estudiantiles para asistir a una conferencia. De experiencias anteriores se sabe que la probabilidad de aceptar la invitaci´on es 0.8. Si las decisiones de aceptar estas invitaciones son independientes, determinar la probabilidad de que como m´ınimo 17 estudiantes acepten la invitaci´on.

Soluci´on:

(12)

P(X ≥17) =P(X = 17) +P(X = 18) +P(X = 19) +P(X = 20) Con R, pbinom(16,20,0.8,lower.tail=FALSE)=0.4114489.

5. Distribuci´

on de Poisson

Esta distribuci´on sirve para representar el n´umero de ocurrencias de un determinado su-ceso durante un periodo de tiempo fijo o en una regi´on fija del espacio, cuando el n´umero de ocurrencias sigue unas determinadas pautas:

El n´umero de ocurrencias en un intervalo o regi´on especificada debe ser independiente del n´umero de ocurrencias en cualquier otro intervalo o regi´on.

Si se considera un intervalo de tiempo muy peque˜no (o una regi´on muy peque˜na), la probabilidad de una ocurrencia es proporcional a la longitud del intervalo (al volumen de la regi´on) y la probabilidad de dos o m´as ocurrencias es pr´acticamente nula (despreciable). Definici´on: Una variable aleatoriaX tiene distribuci´on de Poisson de par´ametroλ (λ >0) si su funci´on masa de probabilidad es

P[X =x] = e−λλ

x

x!, x= 0,1, . . . Se notaX ∼ P(λ).

Probemos que en efecto es una funci´on masa de probabilidad. En primer lugar, son valores mayores o iguales que cero y, en segundo lugar, su suma vale uno. En efecto, teniendo en cuenta el desarrollo de la exponencial

X

x=0

P[X =x] =

X

x=0 e−λλ

x

x! = e

−λ

X

x=0 λx

x! = e

−λeλ = 1

Aplicaciones

Esta distribuci´on sirve para representar, por ejemplo:

- N´umero de accidentes que ocurren durante un determinado espacio de tiempo en una determinada carretera.

- N´umero de llamadas telef´onicas a una oficina (en un determinado intervalo de tiempo). - N´umero de bacterias en un cultivo.

En general, las situaciones reales en las que se usa la distribuci´on de Poisson se caracterizan porque la probabilidad del suceso cuyo n´umero de ocurrencias se contabiliza es peque˜na y por ello suele denominarse la LEY DE LOS SUCESOS RAROS.

(13)

Funci´on de distribuci´on

F(x) =

   

   

0 x <0 [x]

X

k=0 e−λλ

k

k! x≥0 donde [x] denota la parte entera de x.

Funci´on generatriz de momentos

M(t) = eλ(et−1) ∀t∈R

En efecto

M(t) =

X

x=0

etxe−λλ

x

x! = e

−λ

X

x=0 (etλ)x

x! = e

−λeetλ

= eλ(et−1)

Media

E[X] =λ

lo cual se puede probar o bien directamente, o a partir de la funci´on generatriz de mo-mentos. Veamos la obtenci´on directa

E[X] =

X

x=0

xe−λλ

x

x! =λe

−λ

X

x=1

λx−1

(x−1)! =λe

−λeλ =λ

Por tanto, el par´ametro λ de la distribuci´on es el n´umero medio de ocurrencias en el intervalo de tiempo o regi´on del espacio considerada.

Varianza

Var[X] =λ

Razonando de forma an´aloga a la binomial y calculando E[X(X−1)]

E[X(X−1)] =

X

x=0

x(x−1)e−λλ

x

x! =λ 2e−λ

X

x=2

λx−2 (x−2)! =λ

2e−λeλ =λ2

(14)

Relaci´on entre las distribuciones binomial y de Poisson

La distribuci´on de Poisson se puede obtener como l´ımite de una distribuci´on binomial: Consi-deramos una variable que modeliza el n´umero de sucesos ocurridos en un intervalo de tiempo, y dividimos dicho intervalo enn subintervalos tan peque˜nos de forma que en cada uno de ellos pueda ocurrir a lo sumo un suceso con probabilidad no nula, a la que llamaremos p. De esta forma el n´umero de sucesos que ocurren en cada subintervalo tiene una distribuci´onB(1, p) y, al ocurrir los sucesos de forma independiente en los subintervalos, el n´umero de sucesos en el intervalo es unaB(n, p).

Claramente, cuando n aumenta, p disminuye ya que al aumentar n disminuye la amplitud de los intervalos y, por tanto, la probabilidad de que ocurra un suceso en ´el.

En consecuencia, considerando un n´umerongrande de pruebas de Bernoulli independientes, con probabilidad de ocurrencia p peque˜na, y tomando λ = np, se obtiene la distribuci´on de Poisson como l´ımite de la binomial cuando n → ∞. Es decir, si n → ∞, p → 0 y np → λ la distribuci´on binomial tiende a una Poisson, es decir

l´ım

n→∞

p→0

np→λ

n x

px(1−p)n−x

= e−λλ

x

x! x= 0,1,· · · En efecto,

P[X =x] =

n x

px(1−p)n−x = n! x!(n−x)!

(np)x

nx (1−p) n−x =

= (np)

x

x!

n(n−1)· · ·(n−x+ 1)

nx (1−p) n−x

Ahora tomando l´ımites cuandon → ∞, p→0 de forma que np→λ, se tiene l´ım

n→∞

p→0

np→λ

n x

px(1−p)n−x

= e

−λλx

x! dado que

l´ım

np→λ

(np)x x! =

λx x!

l´ım

n→∞

n(n−1)· · ·[n−(x−1)]

nx = 1

l´ım

n→∞

p→0

(1−p)n−x = el´ım(n−x)(−p) = e−λ

C´alculo de probabilidades y representaciones gr´aficas

(15)

EJERCICIOS

1.-En una cierta empresa constructora el n´umero de accidentes es por t´ermino medio de 3 por mes. Calcular:

a) La probabilidad de que no ocurra ning´un accidente en un mes dado. b) La probabilidad de que ocurran menos de 5 accidentes en un mes dado. c) La probabilidad de que ocurran m´as de 3 accidentes en un mes dado. d) La probabilidad de que ocurran exactamente 3 accidentes en un mes dado.

Si suponemos que los accidentes cuando ocurren son independientes unos de otros y adem´as, que ocurren con una tasa de ocurrencia constante, la variable aleatoria n´umero de accidentes en un mes dado tiene una distribuci´on de Poisson. Dado que el n´umero medio de accidentes al mes es 3 y el par´ametroλde una Poisson es el valor medio (λ= 3), la distribuci´on considerada es unaP(3). Las probabilidades solicitadas son

a) P[X = 0] = 30!0e−3 = 0.0498 Con R, dpois(0,3)=0.04978707.

b) P[X <5] = P[X ≤4] = P[X = 0] + P[X = 1] + P[X = 2] + P[X = 3] + P[X = 4] = =e−λλ

0 0! +e

−λλ1

1! +e

−λλ2

2! +e

−λλ3

3! +e

−λλ4

4! = = 0.0498 + 0.1494 + 0.2240 + 0.2240 + 0.1680 = 0.8152. Con R, ppois(4,3)=0.8152632.

c) P[X >3] = 1−P[X ≤3]

Con R, 1-ppois(3,3) o ppois(3,3,lower.tail=FALSE)=0.3527681. d) P[X = 3] = 0.2240.

Con R, dpois(3,3)=0.2240418.

2.- Desde el a˜no 1980 el n´umero medio de empresas, con m´as de 100 trabajadores, que han presentado suspensi´on de pagos ha sido de 6.8 por a˜no, y admitimos que el n´umero de empresas con m´as de 100 trabajadores, X, que han presentado suspensi´on de pagos durante un periodo determinado de tiempo sigue una distribuci´on de Poisson. Obtener

a) La probabilidad de que ninguna empresa de m´as de 100 trabajadores presente suspensi´on de pagos durante un trimestre.

b) La probabilidad de que por lo menos dos empresas de m´as de 100 trabajadores presenten suspensi´on de pagos durante un determinado a˜no.

(16)

6.8 4 = 1.7

Luego la variable Y, n´umero de empresas con m´as de 100 trabajadores que han presentado suspensi´on de pagos durante un trimestre es una Poisson de par´ametroλ= 1.7 y la probabilidad pedida

P[Y = 0] = e−1.71.7 0

0! = 0.1827 Con R, dpois(0,1.7)= 0.1826835.

b) Para obtener ahora la probabilidad de que por lo menos dos empresas de m´as de 100 traba-jadores presenten suspensi´on de pagos durante un determinado a˜no consideraremos la variable aleatoria X ∼ P(6.8). Luego

P[X ≥2] = 1−P[X = 0]−P[X = 1] = 1−0.0011−0.0076 = 0.9913 Con R, ppois(1,6.8, lower.tail=FALSE)=0.9913126, o bien 1-ppois(1,6.8).

3.-A una calculadora le fallan, por t´ermino medio en cada hora de trabajo, dos transistores. Se sabe que el n´umero de fallos de los transistores sigue una distribuci´on de Poisson. La calculadora deja de funcionar cuando se le aver´ıan seis o m´as transistores. Calcular la probabilidad de que una operaci´on de tres horas se pueda realizar sin aver´ıa.

X: N´umero de fallos en tres horas ∼ P(6) Se pide

P(X <6) = P(X ≤5) = 5

X

x=0

P(X =x) = 5

X

x=0 e−66

x

x = 0.0025 + 0.0149 + 0.0446 + 0.0892 + 0.1339 + 0.1606 = 0.4457

Con R, ppois(5,6)=0.4456796.

6. Distribuci´

on binomial negativa

(17)

P[Y =n] = P[X =n−k].

La variable aleatoria X puede tomar los valores x = 0,1,2, . . . y k debe ser un entero positivo, es decir, k = 1,2, . . . .

Calculemos la funci´on masa de probabilidad de la variable aleatoria binomial negativa; esto es,

P[X =x], x= 0,1,2, . . .

Uno de los posibles sucesos para el cual ocurre {X = x} ser´ıa que en las x primeras repeticiones apareciera “fracaso”, en lask−1 siguientes “´exito” y en la ultima “´exito”

E . . . Ex) |E k. . . E−1) |E

y como las repeticiones de las pruebas de Bernoulli son independientes, la probabilidad del suceso anterior ser´a

PhE . . . EEx) . . . Ek) i = P(E)· · ·x) P(E)·P(E)· · ·k) P(E) = (1−p)xpk

Pero la obtenci´on de losxfracasos y losk−1 ´exitos se pueden obtener de tantas maneras como las permutaciones con repetici´on de x+k−1 elementos en los que hay iguales x y k−1, es decir

x+k−1 x

= (x+k−1)! x!(k−1)!

Por tanto, la funci´on masa de probabilidad de esta variable aleatoria es

P[X =x] =

x+k−1 x

(1−p)xpk, x= 0,1,2,· · · (k = 1,2,· · ·; 0 ≤p <1) y se notar´a como X ∼BN(k, p).

Comprobemos que es, en efecto, una funci´on masa de probabilidad. Para ello tengamos en cuenta lo siguiente

∀α ∈R, α0

= 1

∀α ∈R, x∈N, αx= α(α−1)···x(!α−x+1) (1 +t)α =P∞

x=0

α x

tx, |t|<1, ∀α∈R

Propiedad:“Para cualquier n´umero real α >0

−α

r

= (−1)r

α+r−1 r

(18)

En primer lugar, es evidente que P[X =x]≥0, x= 0,1,2, . . . y

X

x=0

P[X =x] =

X

x=0

k+x−1 x

(1−p)xpr

= ∞ X x=0 k x

[−(1−p)]xpk=pk[1−(1−p)]−k =pkp−k = 1

Observemos que, de hecho, otra expresi´on de la funci´on masa de probabilidad de la binomial negativa es

P[X =x] =

−k

x

[−(1−p)]xpk

Ejemplos

- N´umero de preguntas falladas en un examen tipo test antes de tener el d´ecimo acierto. - N´umero de unidades defectuosas antes de obtener un n´umero concreto de correctas. Algunas de las caracter´ısticas de la distribuci´on binomial negativa son:

Funci´on de distribuci´on:

F(x) = P[X ≤x] =

        

0 x <0

[x]

X

i=0

i+k−1 i

(1−p)ipk x≥0 Funci´on generatriz de momentos:

M(t) =

p 1−(1−p)et

k

∀t <−ln(1−p) En efecto,

EetX=

X

x=0

etxP[X =x] =

∞ X x=0 etx k x

(−(1−p))xpk que converge si |et(−(1−p))|<1 ⇔ et(1−p)<1 ⇔ t <−ln(1−p)

= ∞ X x=0 k x

(−(1−p)et)xpk =pk

∞ X x=0 k x

(−(1−p)et)x

(19)

Momentos: Existen todos dado que existe la funci´on generatriz de momentos. Nos limitaremos a obtener los momentos de primer y segundo orden.

Media

E[X] = k(1−p) p Veamos la obtenci´on de forma directa:

E[X] =

X

x=0 x

−k

x

(−(1−p))xpk =pk

X

x=1

x(−k)(−k−1)· · ·(−k−x+ 1)

x(x−1)! (−(1−p))

x

=

pk(−(1−p))

X

x=1 (−k)

k−1 x−1

(−(1−p))x−1 =k(1−p)pk(1−(1−p))−k−1 = k(1−p) p Varianza

Var[X] = k(1−p) p2 Razonando de forma an´aloga al caso binomial, se obtiene

E[X2] = k(k+ 1)(1−p) 2

p2 +

k(1−p) p , de donde se deduce la expresi´on de la varianza.

Relaci´on entre las distribuciones binomial y binomial negativa

SiX es una variable aleatoria con distribuci´onBN(k, p), el suceso{X =x} significa la inter-secci´on de los sucesos

A= {se han obtenido k−1 ´exitos en los primeros k+x−1 ensayos de una serie de pruebas independientes de Bernoulli}

B = {se ha obtenido un ´exito en el siguiente ensayo de la serie}

El suceso A equivale a {Y = k−1}, con Y ∼ B(k+x−1, p), y el segundo es independiente del primero y ocurre con probabilidadp. Entonces

P[X =x] = P[Y =k−1]·p

Caso particular: Distribuci´on Geom´etrica

(20)

P[X =x] = (1−p)xp, x= 0,1,2,· · · (0< p <1) y se notar´a como X ∼G(p).

Sus caracter´ısticas m´as relevantes son Funci´on de distribuci´on:

F(x) = P[X ≤x] =

   

   

0 x <0 [x]

X

i=0

(1−p)ip x≥0

Pero como 1 [x]

X

i=0

(1−p)ip=p [x]

X

i=0

(1−p)i =p1−(1−p) [x]+1

1−(1−p) = 1−(1−p) [x]+1

se puede reescribir la funci´on de distribuci´on como

F(x) = P[X ≤x] =

0 x <0 1−(1−p)[x]+1 x0 Funci´on generatriz de momentos:

M(t) =

p 1−(1−p)et

∀t <−ln(1−p) Media:

E[X] = 1−p p Varianza:

Var[X] = 1−p p2

1Recordemos que la suma de los nerminos de una progresi´on geom´etricaa

n de raz´onres

Sn =

a1−an·r

(21)

Propiedad de olvido o falta de memoria:

Esta propiedad se formula de la siguiente forma: Si X es una variable aleatoria con distribuci´on geom´etrica de par´ametrop, G(p), entonces se verifica que

P[X ≥h+k|X ≥h] = P[X ≥k], h, k = 0,1,2, . . .

“Si se ha realizado la h-´esima repetici´on del experimento o prueba de Bernoulli y no se ha obtenido ning´un ´exito, entonces la probabilidad de que se realicen por lo menos otras k repeticiones sin que se presente ning´un ´exito, es decir que se realicen por lo menosh+k repeticiones, es la misma que si consideramos que la primera repetici´on es lah+ 1-´esima; es decir, esa probabilidad es la misma que la probabilidad de que realicemos al menos k repeticiones sin obtener el primer ´exito, y por consiguiente se olvidan las h repeticiones realizadas inicialmente.

Vamos a demostrarla, si X ∼G(p)

P[X ≥x] = 1−P[X < x] = 1−F(x−1) = 1−(1−(1−p)x) = (1−p)x. Por tanto, si k, h,∈N

P[X ≥h+k|X ≥h] = P[X ≥h+k, X ≥h]

P[X ≥h] =

P[X ≥h+k] P[X ≥h] =

(1−p)h+k

(1−p)h = (1−p)

k = P[X k]

Esta propiedad, adem´as, caracteriza a la distribuci´on geom´etrica como la ´unica entero valuada (positiva) que la cumple.

La distribuci´on de probabilidad geom´etrica se aplica frecuentemente en el estudio de la distribu-ci´on de la duraci´on de tiempos de espera. As´ı pues, si las repeticiones del experimento se realizan a intervalos regulares de tiempo, entonces la variable aleatoria con distribuci´on geom´etrica nos dar´a el n´umero de intervalos de tiempo transcurridos hasta que aparezca el primer ´exito. EJERCICIOS

1.- Un examen de Estad´ıstica consta de 20 preguntas tipo test y se conoce de experiencias anteriores que un alumno tiene probabilidad 0.7 de contestar bien cada pregunta. Obtener: a) La probabilidad de que la primera pregunta que contesta bien sea la cuarta.

b) Sabiendo que para aprobar el examen es necesario contestar bien a 10 preguntas, ¿cu´al es la probabilidad de que apruebe al contestar la pregunta duod´ecima?

(22)

P[X = 3] = (0.3)30.7 = 0.0189 Con R, dgeom(3,0.7)=0.0189.

b)X= N´umero de fallos antes del d´ecimo ´exito, X ∼BN(10,0.7) P[X = 2] =

2 + 10−1 2

(0.3)2(0.7)10=

11 2

(0.3)2(0.7)10. Con R, dnbinom(2,10,0.7)=0.1398252.

Esta probabilidad se puede obtener mediante la relaci´on con la binomial Y= N´umero de ´exitos en las 11 primeras pruebas, Y ∼B(11,0.7)

P[X = 2] =P[Y = 9]·0.7

2.-Una m´aquina dedicada a la fabricaci´on de piezas de alta precisi´on produce las piezas de una en una, siendo independiente la fabricaci´on de cada pieza. La probabilidad de fabricar una pieza defectuosa es 0.15. Obtener

a) La probabilidad de que la primera pieza defectuosa durante ese d´ıa sea la n´umero 40. b) Sabiendo que en la fabricaci´on de cada pieza se tardan 20 segundos ¿cu´al ser´a el tiempo medio que hay que esperar hasta que sea producida la primera pieza defectuosa?

c) Probabilidad de que las ocho primeras piezas fabricadas sean todas buenas.

a)X= N´umero de piezas buenas antes de la primera defectuosa, X ∼G(0.15) P[X = 39] = (0.85)39·0.15

Con R, dgeom(39,0.15)= 0.000265112.

b) EX = 1−pp = 0.850.15 = 5.666. que es el n´umero medio de piezas buenas antes de la primera defectuosa. Por tanto, el tiempo pedido es 20×(5.666 + 1) = 133.33 segundos.

c)P[X ≥8] = 1−F(7) = 1−P[X ≤7]

Con R, 1-pgeom(7,0.15) o pgeom(7,0.15, lower.tail=FALSE)= 0.2724905. Si consideramos Y = N´umero de piezas buenas en las 8 primeras, Y ∼B(8,0.85)

P[Y = 8] Con R, dbinom(8,8,0.85)= 0.2724905.

7. Distribuci´

on hipergeom´

etrica

Se denominapoblaci´on a cualquier colecci´on de individuos, objetos o elementos arbitrarios y una muestra de tama˜no n de esa poblaci´on es cualquier subconjunto con n elementos.

(23)

MUESTRA ALEATORIA CON REEMPLAZAMIENTO (CON DEVOLUCI ´ON O SIMPLE). Se selecciona al azar un elemento de la poblaci´on (suponiendo que todos tienen la misma probabilidad de ser seleccionado), se devuelve a la poblaci´on (despu´es de anotar las caracter´ısti-cas de inter´es) y se selecciona otro tambi´en de forma aleatoria; se continua el proceso hasta completar el tama˜no muestral deseado.

Notemos que una muestra aleatoria con reemplazamiento puede contener elementos repeti-dos y, en ciertas ocasiones, esto no es conveniente (incluso puede no ser posible, por ejemplo, al estudiar la duraci´on de vida de cierto tipo de bombillas).

MUESTRA ALEATORIA SIN REEMPLAZAMIENTO (SIN DEVOLUCI ´ON).

Se selecciona al azar un elemento de la poblaci´on (suponiendo que todos tienen la misma probabilidad de ser seleccionado); a continuaci´on, sin devolverlo a la poblaci´on, se selecciona otro suponiendo que los restantes tienen la misma probabilidad de ser elegidos y as´ı sucesiva-mente.

Notemos que ahora todos los elementos de la muestra ser´an distintos.

El muestreo sin reemplazamiento es ´util en muchas situaciones pr´acticas. Por ejemplo, con-sideremos una poblaci´on con N individuos que deben elegir entre dos candidatos A y B a cierto puesto. Con objeto de realizar un sondeo de opini´on antes de la elecci´on se efect´ua un muestreo de n individuos para ver su preferencia. En una situaci´on de este tipo parece l´ogico hacer un muestreo sin reemplazamiento, que proporcionar´a m´as informaci´on sobre la intenci´on de voto al tener todos los individuos diferentes.

Observemos que si en la poblaci´on hay N1 votantes de A y la muestra se elige con reempla-zamiento, cada elemento de la muestra tiene probabilidadN1/N de ser votante de A. Por tanto, la selecci´on de la muestra equivale a la repetici´on de n pruebas de Bernoulli independientes con probabilidad constante de ´exito (ser votante de A) y la variable X: N´umero de votantes de A en la muestra∼B(n, N1N )

Por el contrario, si el muestreo se realiza sin reemplazamiento, la probabilidad de ´exito var´ıa despu´es de cada selecci´on y las pruebas de Bernoulli no son independientes:

La probabilidad de que el primer individuo seleccionado vote al candidato A es N1

N

La probabilidad de que el segundo individuo seleccionado vote al candidato A depende de lo que haya ocurrido en la primera prueba

P(2A/1A) = N1 −1

N −1, P(2A/1B) = N1 N −1.

Por tanto, la variable X: N´umero de votantes de A en la muestra, no tiene ahora una distribuci´on binomial, sino que su distribuci´on es la denominada HIPERGEOM´ETRICA.

(24)

de la poblaci´on, suponiendo que todos los subconjuntos den elementos tienen la misma proba-bilidad de ser elegidos.

En efecto, si la selecci´on se realiza simult´aneamente no cabe distinguir entre dos muestras que tengan los mismos elementos (no se tiene en cuenta el orden) y hay en total Nn mues-tras distintas y la probabilidad de elegir una cualquiera de ellas (esto es, que n individuos determinados formen parte de la muestra) es 1

(N n)

.

Por otra parte, si la selecci´on se realiza elemento a elemento, dos muestras con los mismos elementos en distinto orden ser´an distintas y, en total, hayN(N −1)· · ·(N −n+ 1) muestras distintas; la probabilidad de que una muestra est´e formada por n individuos concretos es

n!

N(N−1)· · ·(N −n+ 1) = 1

N n

que es igual a la anterior. Definici´on

Supongamos una poblaci´on de N individuos divididos en dos categor´ıas de N1 y N2(= N−N1) individuos cada uno. Se elige una muestra de n individuos de la poblaci´on (sin reem-plazamiento o simult´aneamente). La variable aleatoria X que contabiliza el n´umero de indivi-duos de la primera categor´ıa en la muestra se dice que tiene distribuci´onhipergeom´etricade par´ametrosN, N1 y n y se nota

X ∼H(N, N1, n), n, N1, N ∈N− {0}, n, N1 ≤N Funci´on masa de probabilidad

Evidentemente, un valor de la variable X debe ser un n´umero natural (debe incluirse el cero) verificando

m´ax(0, n−(N −N1))≤x≤m´ın(n, N1)

pues como hay N1 elementos en la primera subpoblaci´on y N2 en la segunda subpoblaci´on se tiene que cumplir

x≤n, x≤N1 ⇒ x≤m´ın(n, N1)

x≥0, n−x≤N2 ⇒ x≥m´ax(0, n−N2)

Obtengamos la funci´on masa probabilidad de dicha variable aleatoria, esto es la P[X =x], para los diferentes valores posibles de x.

P{X =x}=

       

       

(N1

x)( N−N1

n−x )

(N n)

Muestra simult´anea (Regla de Laplace)

N1 N

N1−1

N−1 · · ·

N1−(x−1)

N−(x−1)

N−N1 N−x

N−N1−1

N−x−1 · · ·

N−N1−(n−x−1)

N−n+1

n x

Muestra con reemp. = (

N1

x)( N−N1

n−x )

(25)

Luego la funci´on masa de probabilidad de esta variable aleatoria ser´a

P[X =x] =

N1 x

N−N1 n−x

N n

m´ax(0, n−(N −N1))≤x≤m´ın(n, N1)

Probemos que es una funci´on masa de probabilidad. En efecto, las probabilidades son no nega-tivas y adem´as 2

m´ın(n,N1)

X

x=m´ax(0,n−(N−N1))

P[X =x] =

m´ın(n,N1)

X

x=m´ax(0,n−(N−N1))

N1 x

N−N1 n−x

N n

=

N1+N−N1 n

N n

=

N n

N n

= 1

Ejemplos y/o aplicaciones

La distribuci´on hipergeom´etrica se aplica en el control estad´ıstico de calidad de una fabri-caci´on en serie. As´ı pues, si el lote bajo control contiene N1 elementos buenos y N2 =N −N1 elementos defectuosos, cuando tomamos una muestra de tama˜no n sin reemplazamiento esta-remos interesados en saber el n´umero de elementos buenos que han aparecido en la muestra de tama˜non para as´ı determinar la calidad del proceso de fabricaci´on.

En sondeos de opini´on tambi´en tiene aplicaci´on la distribuci´on hipergeom´etrica. Podemos realizar una encuesta para intentar conocer si los individuos de una poblaci´on tienen o no intenci´on de votar en las pr´oximas elecciones de tal manera que el n´umero de individuos, de una muestra sin reemplazamiento, que tienen intenci´on de votar sigue una distribuci´on hipergeom´etrica.

Algunas de sus caracter´ısticas son:

2Usando que dados dos n´umeros cualesquieraayby un entero positivon, se verifica

n

X

x=0

a

x b

n−x

=

a+b

n

aunque realmente, dado que ax= 0 six > aal haber un t´ermino nulo ena(a−1)· · ·(a−x+ 1) se debe tomar

x≤a, y dado que nbx

= 0 si n−x > bse debe tomarx≥n−b. Por tanto la suma parte de m´ax(0, n−b) y llega a m´ın(n, a) y realmente se tiene

m´ın(n,a)

X

x=m´ax(0,n−b)

a

x b

n−x

=

a+b

(26)

Funci´on de distribuci´on:

F(x) =

            

0 x <m´ax(0, n−(N −N1))

P[x]

i=0 (N p

i )( N(1−p)

n−i )

(N n)

m´ax(0, n−(N−N1))≤x≤m´ın(n, N1)

1 x >m´ın(n, N1) Funci´on generatriz de momentos:

Existe ∀t∈R porque la variable toma un n´umero finito de valores.

MX(t) =

m´ın(n,N1)

X

x=m´ax(0,n−(N−N1)) etx

N1 x

N−N1 n−x

N n

No se conoce una forma funcional espec´ıfica. Media:

E[X] =nN1 N En efecto,

EX =

m´ın(n,N1)

X

x=m´ax(0,n−(N−N1) x

N1 x

N−N1 n−x

N n = 1 N n

m´ın(n,N1)

X

x=m´ax(1,n−(N−N1) N1

N1−1 x−1

N −N1 n−x

=

haciendo x−1 =k

= NN1

n

m´ın(n−1,N1−1)

X

k=m´ax(0,(n−1)−(N−N1)

N1−1 k

N −N1 (n−1)−k

= NN1

n

N −1 n−1

= nN1 N

Varianza:

Var[X] = n(N −n)N1(N −N1) N2(N 1)

Para ello, calculemos en primer lugar el momento no centrado de orden dos; es decir

(27)

E[X(X−1)] =

m´ın(n,N1)

X

x=m´ax(2,n−(N−N1)

x(x−1)

N1 x

N−N1 n−x

N n

=

= N1(NN1−1)

n

m´ın(n,N1)

X

x=m´ax(2,n−(N−N1)

N1−2 x−2

N −N1 n−x

=

haciendo x−2 =k

= N1(NN1−1)

n

m´ın(n−2,N1−2)

X

k=m´ax(0,(n−2)−(N−N1)

N1 −2 k

N −N1 (n−2)−k

=

= N1(NN1−1)

n

N −2 n−2

= n(n−1)N1(N1−1) N(N −1)

E[X2] = n(n−1)N1(N1−1) N(N −1) +

nN1 N de donde se deduce la expresi´on de la varianza.

V ar[X] = n(n−1)N1(N1−1) N(N −1) +

nN1 N −

n2N2 1 N2 =

n(N −n)N1(N −N1) N2(N 1) EJERCICIOS

1.- Sea una baraja de 40 cartas. De ella se toma una muestra de 5 cartas sin reemplazamiento. Obtener la probabilidad de obtener al menos dos ases.

Tenemos 40 cartas, de las cuales 4 son ases y se realiza un muestreo de tama˜no 5 sin reemplazamiento.

X: N´umero de ases en la muestra ∼H(40,4,5) y se pide

P[X ≥2] = 1−P[X = 0]−P[X = 1] = 1−

4 0 36 5 40 5 − 4 1 36 4 40 5 = 0,06899

(28)

realizar todas las pruebas de selecci´on, entre las 20 personas seleccionadas est´en los 10 mejores de las 40 personas que se presentaron.

Consideramos la variable aleatoriaX: N´umero de los mejores vendedores entre los 20 selec-cionados.

X ∼H(40,10,20) Nos piden

P[X = 10] = 10 10

30 10

40 20

= 0,000217

Referencias

Documento similar