Algunos aspectos teóricos de la distribución binomial

Texto completo

(1)

U

niversidad

V

eracruzana

FACULTAD DE ESTADISTICA E INFORMATICA

ESPECIALIZACION EN METODOS ESTADISTICOS

ALGUNOS ASPECTOS TEORICOS

DE LA DISTRIBUCION BINOMIAL

TRABAJO R E C E P C IO N A L

(MONO GR AFI A)

Q U E COMO R EQ U IS IT O P A R C IA L PA R A O B T E N E R E L D IPLO M A D E E S T A E S P E C IA L IZ A C IO N

P R E S E N T A :

Rocio Chimal Bernal

T U TO R :

(2)

E l C om ite A cadem ico de la E sp ecializacion en M etodos E sta d istico s y el

tu to r de este trab ajo recep cion al, au to rizan la im presion y la con stitu cion

del ju ra d o p a ra la defensa.

COMITE ACADEMICO

L .E . Ju lia n Felipe Diaz C am ach o COORDINADOR D E LA

ESPECIALIZACION

M .C. A lm a R o sa G arcia G aona DIRECTORA D E LA FACULTAD D E

(3)

D A T O S D E L A U T O R

Rocio Chimal Bemal, nacio en la ciudad de Cordoba, Veracruz, el dia 18 de

agosto de 1976. Curso sus estudios basicos, medio y superior en la ciudad de

Xalapa. En el 2000 egreso de la carrera de Licenciado en Matematicas de la

(4)

A D IO S :

Gracias por todo.

A G R A D E C IM IE N T O S

A mis padres:

Sra. Zoila Bernal Chavez. Sr. Moises Chimal Molina. Por haberme apoyado y guiado.

A mis hermanas:

Maricruz y Luz Aurora Por sus consejos.

A mis maestros:

Mat. Pedro Torres Mejia

M. en C. Luis Felipe Gonzalez Galvez Por su ayuda

(5)

G EN ERA CIO N : 2001 SED E: Xalapa

T IT U L O :

Algunos aspectos teoricos de la distribution binomial.

A U TO R :

Rotio Chimal Bernal

T U T O R :

Mat. Pedro Torres Mejia

R ESU M EN :

En este trabajo se presenta el dearrollo matematico de la distribution binomial. Se da su definition, se obtiene su fruition generadora de momentos, su media y varianza; posteriormente, se muestran sus propiedades mas importantes, por ultimo se analizan las relaciones y aproximaciones con otras distribuciones.

T IP O :

Reporte Monografia o TFE Desarrollo

M ETO D O LO G IA ESTADISTTCA:

A) Diseno: Muestreo Experimento

Estudio observacional Series de tiempo

B ) Analisis Exploratorio Descriptivo basico Inferencia basico Metodos multivariados Regresion

ANOVAy ANCOVA Control de calidad

(6)

C O N T E N I D O

Pag.:

I. INTRODUCCION 1

II. LA D ISTRIBU CIO N BIN O M IA L 3

II. 1 Definition de la distribution binomial 3

11.2 Funcion de distribution acumulada 7

11.3 Media y varianza de la distribution binomial 8

11.3.1 Momentos de una distribution 8

11.3.1 Funcion generadora de momentos 10

11.4 Funcion caracteristica. 11

in.

PR O PIED A D ES D E LA D ISTR IBU C IO N BIN O M IA L 16

III. 1 Sesgo de una distribution 16

III.2 Modo de la distribution binomial 24

IV . A PRO XIM A C IO N ES A O TRA S D ISTR IBU C IO N ES 28

VI. 1 Distribution Pascal 28

VI. 1.1 Relation entre la distribution Pascal y binomial 29

VI.2 Distribution hipergeometrica 30

V I.2.1 Aproximacion de la distribution hipergeometrica 31

mediante la distribution binomial

VI.3 Aproximacion de la distribution binomial mediante 35

la distribution Poisson

VIA Aproximacion de la distribution binomial mediante 39

la distribution normal

V. B IB LIO G R A FIA 46

(7)

L INTRJOD UCCION

La notion de distribution de probabilidades surge ai considerar un experimento

aleatorio particular y preguntarse acerca de su comportamiento estadistico: ^Cuales

son los eventos de interes?, ^Cuales son las probabilidades asociadas a estos eventos ?,

^Cuales son los parametros que caracterizan al experimento?,etc. (Kreyszing, 1989).

Existen cuatro tipos de distribuciones de probabilidad: continuas, discretas, mix-

tas y singulares; de estas las continuas y discretas abarcan la inmensa mayoria de las

aplicaciones.

E n estadistica las distribuciones discretas de mayor peso son: la distribution bino­

mial, la Poisson y la hipergeometrica. La base de esta familia de distribuciones son los

experimentos Bemuolli, en honor al matematico frances Jacobo Bernoulli (1654-1705)

quien realizo experimentos binomiales a fines del siglo X V II.

Un ensayo o experimento Bernoulli es conceptualmente bastante simple; consiste

en un experimento que tiene dos posibles resultados a uno de ellos se le llama arbi-

trariamente exito y al otro fracaso. E l ejemplo mas comun es lanzar una moneda al

(8)

Cuando se repite un numero fijo de ensayos Bernoulli donde cada ensayo es in-

dependiente de los anteriores y la probabilidad de cada ensayo permanece constante,

surge el modelo de la distribucion binomial (Meyer,1986).

La distribucion binomial es usada en diversos problemas, por ejemplo al controlar

la dureza sobre o bajo un cierto valor estandar, asi como el nivel del ruido de un

sistema de comunicaciones sobre o bajo un margen asignado.

Actualmente existe gran variedad de textos que abordan el tem a de la distribucion

binomial, sin embargo algunos de estos solo se limitan a definir el concepto de la

distribucion binomial y no profundizan.

En este trab ajo se analiza la distribucion binomial, su objetivo es poner al al-

cance de todos los estudiantes y usuarios de la estadistica los principales resultados

de esta distribucion junto con su respectiva justification teorica. E sta dividido en

tres partes, en la primera se da la definition de distribucion binomial, se obtiene

su funcion generadora de momentos, su media y varianza, en la segimda parte se

muestran sus propiedades mas importantes y por ultimo se analizan las relaciones

y aproximaciones con otras distribuciones. Cada parte enuncia las correspondientes

(9)

II. D I S T R I B U C I O N B I N O M I A L

II. 1 D efinicion d e la d istrib u cio n bin om ial

Supongase que los articulos de una lfnea de distribucion se clasifican como defec-

tuosos (D) o no defectuosos (N). Si se eligen al azar tres articulos de la production

de un dfa y se clasifican de acuerdo a este criterio, el espacio muestral para este

experimento, S , puede expresarse asf:

S = {D D D , D D N, D N D , N D D , N N D , N D N , D N N , N N N }

Si la probabilidad de un articulo defectuoso es 0.2, entonces la probabilidad de un

artfculo no defectuoso sera de 0.8. Supongase que esas probabilidades son iguales para

cada artfculo y que la clasificacion de cualquier artfculo particular es independiente

de la clasificacion de cualquier otro artfculo. De estas suposiones, se deducen que las

probabilidades asociadas con los resultados del espacio muestral S son, respectiva-

mente:

(

0

.

2

)

3

, (

0

.

8

)(

0

.

2

)2, (

0

.

8

)(

0

.

2

)2, (

0

.

8

)(

0

.

2

)2, (

0

.

2

)(

0

.

8

)2, (

0

.

2

)(

0

.

8

)2, (

0

.

2

)(

0

.

8

)2, (

0

.

8)3

E l interes de este ejemplo no se enfoca hacia los resultados individuales de S,

sino que simplemente, se desea saber cuantos articulos defectuosos se encuentran (sin

(10)

X que asigna a cada uno de los resultados s G 5 el niimero de articulos defectuosos

encontrados en s. Por tanto el conjunto de valores posibles de X es { 0 , 1 , 2 , 3 } .

Podemos obtener la distribution de probabilidades para X , P ( X = Xi) como sigue:

X = 0 si y solo si ocurre NNN

X = 1 si y solo si ocurre DNN, NDN, o NND

X = 2 si y solo si ocurre DDN, DND, o NDD

X = 3 si y solo si ocurre DDD

Por lo tanto

P ( X = 0) = (0.8)3

P ( X = 1) = 3(0.2)(0.8)2

P ( X = 2) = 3(0.2)2(0.8)

P ( X = 3) = (0.2)3

Notese que la suma de estas probabilidades es igual a 1, ya que esta suma puede

escribirse como (0.8 -f 0.2)3.

(11)

D efin icio n : Sea e un experimento y A un suceso asociado a e. Supongase que

P {A ) = p y por lo tanto P (A C) = 1 — p. Considerense n repeticiones independi-

entes de e. Por lo tanto el espacio muestral consta de todas las sucesiones posibles

{a\CL2i en donde cada a* es A o bien A c, segun que A o A c ocurra en la

i-esima repetition de e. Aun mas, supongase que P (A ) = p es el mismo para todas las

repeticiones. Defmase la variable aleatoria X como sigue:

X = al numero de veces que ocurrio el suceso A.

A X se la llama variable a leato ria bin om ial con parametros n y p. Sus valores

posibles obviamente son 0 , 1 , 2 , n. Se dice en forma equivalente que X tiene una

distribu cion binom ial, y las repeticiones individuates de e se llaman en sayos B ernoulli.

A la ocurrencia de A se le llama exito y a la no ocurrencia de A fracaso.

T e o re m a : Sea X una variable binomial basada en n repeticiones. Entonces

P { X = X) = i ^ p xqn- x (2.1)

D em ostracidn :

La variable binomial X puede tomar los valores 0,1, ...,n y se desea determinar

las probabilidades correspondientes, es decir:

(12)

Consideremos el evento X = x, que significa que en x de los n ensayos ocurre A

y en las otras n — x pruebas no ocurre, esto se puede ver como sigue:

A A ...A AcAc: ..Acj (2.2)

x n—x

Los ensayos son independientes, es decir no influyen el uno sobre el otro. Entonces

como P (A ) = p y P (A C) = q vemos que (2.2) tiene la probabilidad:

p p ...p q q ...q = p B<fl x

x n—x

Pero exactamente la misma probabilidad estaria asociada con cualquier otro

re-n

sultado para el cual X = x. E l numero total de tales resultados es igual a ^ j , por

lo tanto se tiene:

p (x = * ) =

En ocasiones, por comodidad, se ocupara a f ( x ) para denotar a P ( X — x).

El nombre de distribucion binomial parte del hecho de que los valores de f ( x ) son

(13)

} ( x ) es una funcion de probabilidades es, decir:

i) /0 ) > 0

H) f (x ) = 1

En efecto,

n

i) I j > 0 por definicion y p, q > 0 por ser probabilidades, luego

n

x \ p xqn~x > 0

t i ) ' E f ( x ) = £ 3 = ?n + 1 + (

2

) ^ ^ 2 + - + p" = (p + q)n =

l n = X.

I I .2 F u n cio n d e d istrib u cio n acu m u la d a

D efinicion: Sea X una variable aleatoria discreta o continua. Se define a F (x )

como la fu n cio n de distribucion acum ulada de la variable aleatoria X como:

F ( z ) = P ( X < x)

De la definicion anterior, se desprende que si X es una variable aleatoria discreta,su

(14)

F ( X) = £ P ( X = k)

k<x

Por otro lado, si X es una variable aleatoria continua con f.d.p / su funcion de

distribucion acumulada es:

F(:z) = r f ( s ) d i

J —oo

De acuerdo con lo anterior la funcion de distribucion acumulada para la binomial

es:

= E

II.3 M e d ia y varian za d e la d istrib u cio n bin om ial

I I.3 .1 M o m en to s d e u n a d istrib u cio n

D efinicion: El k-esimo momento de la variable aleatoria X se define como:

E ( X k ) = y , x kf ( x j ) si X es discreta i

/

oo x kf ( x ) d x si X es continua -oo

(15)

M = E ( X )

D efin icio n : E l k-esimo momento central de la variable aleatoria X se define como:

E — (i)k = ^ (xi — fi)k f (Xi) si X es discreta

i

E — fi)k =

f

(x — fi)kf( x ) d x si X es continua

El segundo momento central, cuando k = 2, es la varianza de la distribution.

<j2 = E [(X - /,)2]

desarrollando

E [(X - /i)2] = E [X 2 - 2X fi + /x2] =

= E { X 2) - 2 /iE (X ) + fj,2

= E ( X 2) - 2 fi2 + fi 2 =

= E { X 2) - n 2

Luego

(16)

En algunos casos se puede calcular la media y varianza de una variable aleatoria

con las definiciones anteriores, sin embargo estos calculos se facilitan si se usa la

siguiente funcion auxiliar.

I I .3 .2 F u n cio n g e n e ra d o ra de m o m e n to s

D e fin icio n : La esperanza de e tx recibe el nombre de funcion generadora de

momentos y se denota como G (t).

G (t) = E ( e t x ) = £ i

G {t) = E ( e tx ) = r e txf ( x ) d x J —oo

si X es discreta

si X es continua

Supongase que G (t) es una funcion diferenciable. Para el caso discreto la primera

y segunda derivada de G (t) es, respectivamente:

G'{t) = i

G"(t) = i

Derivando k-veces

(17)

Para el caso continuo la primera y segunda derivada de G {t) es:

/

oo x e txf( x ) d x -oo

/

oo

x 2etxf( x ) d x ■oo

Derivando k-veces

/ OO

x ketxf( x ) d x ■OO

Por lo tanto la k-esima derivada de la funcion generadora de momentos es:

Gw (t) =

i

G (k)(t) = r x ke txf ( x ) d x J—OO

si X es discreta

si X es continua

Ahora cuando t = 0 tenemos que:

G w (0) = E ( X k) (2.3)

En efecto

G (fc)(0) = x f e ° f ( x j ) = Y , x!?f(xi) ~ E ( X k ) si X es discreta

i i

(18)

T e o re m a : La funcion generadora de momentos de la distribution binomial es:

o { t ) = { iv + , ) »

D em ostracion :

G (t) = E ( e ta)

= (eV + g ) " «

Obtenida la funcion generadora de momentos de la distribution binomial se en-

contrara su media y varianza. E n la section II.3.1 se hizo la observation que la media

es el primer momento.

A* = E { X )

Por la expresion (2), la media es la derivada de la funcion generadora de momentos

evaluada en t = 0

(19)

derivando G (t) = {etp + q)n se obtiene

G'(t) — n p et(etp + q)n 1

G^O) = n pe°(e°p + q)” -1 = np

Luego la m edia de la distribu tion binom ial es:

p = np

Anteriormente se demostro que la varianza se puede calcular por la siguiente

formula.

cr2 = E ( X 2) — p?

Ademas tenemos que

E { X 2) = G "(0)

Derivando G ’(t) — n pet (etp + q)71' 1, obtenemos

G "(t) = n p et(etp + + n (n — 1 )p2e 2t(etp + q)n~2

G (0) — n p e°(e°p + q)n 1 + n (n — 1 )p2e°(e°p + q)n 2 =

(20)

Por lo tanto

— np + n (n — 1 )p2 =

= np + n2p2 — np2

a2 — np 4- ^2p2 — np2 — n 2p 2 =

= n p + n p2 —

= n p (l — p) =

= npq

Asf la varian za de la distribu tion bin om ial es:

a 2 = npq

II.4 F u n cio n caraterfstica

D e fin itio n : A la esperanza de e xtx recibe el nombre de fu n cio n caracteristica, y

se denota como ’J'(t).

tf(i) = £ ( e itx )

(21)

Teorem a: La funcion caracteristica para la distribution binomial es :

'lr(f) = (el£p + $ ) n

D em ostracion :

(22)

I I I . P R O P I E D A D E S D E L A D I S T R I B U C I O N B I N O M IA L

I I I . l Sesg o de la d is trib u c io n b in o m ia l

La siguiente expresion se considera una medida de asim etna de las distribuciones.

7 = ~3 E (X

-CP L

7 es llamado sesgo o coeficien te de a sim etn a de X o de la distribucion correspon-

diente.

Como es sabido, si una distribucion es simetrica, 7 es cero; toma un valor positivo

para una distribucion que tiene una gran cola del lado derecho (asimetrica positiva)

y tom a un valor negativo para una distribucion con una gran cola del lado izquierdo

(asimetrica negativa).

A continuacion se obtendra 7 para el caso de la distribucion binomial

T e o re m a : E l sesgo de la distribucion binomial es:

7 1 - 2p

s f t m

D em ostracion :

7 = ^ E \ ( X - » f

(23)

= ^ [ £ ( X 3) - 3p ,E (X 2) + ^i2E ( X ) - /

= i [ £ ( X 3) - 3/.iE ( X 2) + 3/x3 - //

= ^

[E (X 3) - 3fj,E(X2)

+

2a

/

Por otro lado

E { X 2) = G "{0) = n (n - 1 )p2 + np

E ( X 3) = G(3^(0) = n (nl)(n 2)p3 + 3n(n — l) p 2 + np

Luego

7 = ~ jn(n — l ) ( n — 2)p3 + 3n(n — 1 )p2 + np — 3n p (n (n — 1 )p2 + n p j + 2n3p3J

~ ~3 [n (n2^n + 2^ p3 + 3n 2p 2 — 3np2 + n p — 3n p (n 2p 2 — np2 + np^ + 2n3p3j

= [n3p3 — 3n2p3 + 2np3 + 3n2p2 — 3np2 + np — 3n3p3 + 3n2p3 — 3n 2p 2 + 2n3p3j

= [2np3 — 3np2 + npj

= J 0 £ _ ^,p2 _ 3p _|_ i j

n p q a L J

= i - [ (2p - l ) ( p - l ) ] q a

= ^ [ ( 2 p - l ) ( l - g - l ) ]

1 — 2p

(24)

1 - 2p ^ /n pqm

T eorem a: La distribution binomial es simetrica si y solo si p= \ .

D em ostracion :

Supongase que la distribution binomial es simetrica, esto implica que su sesgo es

cero, es decir,

7 = 0

Luego

1 - 2 p

— ■■ = 0 1 — 2p = 0

y fr m

Por lo tanto

Supongase que p = Se debe demostrar que f ( x ) es simetrica, es decir,

(25)

f { v + x) =

Por otro lado

' n Kfi + x j

' n ' Kti + x /

f n N <fi + x J

^ + x gn -f,-x

^pfi+x+n-fi—x

\pn

n\

pues p = q

(p + x)\(n — p — x)!

n\

P

(up + x)! (n — n p — x)!

n\

P

.(2 + I ) ! ( ” — 2 — X) !-n\

_2» ( f + * ) ! ( = - * ) ! _

l \ n

(*)

pues p — np

- x ) = ' n

Kp - X/

* n

kP - X j ' n '

| p p - xqn~t1+x

j pfj—x+n—/x+x

P

n\

(p — x ) ! ( n — p + x)\

n\

P

(np — x)! (n — n p 4- x)!

n\

P

. ( ? - x ) ! [ n ~ l + X)\

1\"

n\

(26)

asi (*) = ( * ’) es decir

f ( l i + x) = f ( ( i - x)

Luego f ( x ) simetrica*

P ara ilustrar el teorema anterior se muestran los valores de la distribucion binomial

con p — | ,n = 5 y p = ^ ,n = 6.

Tabla I I I . l . l . Funcion de probabilidad de la distribucion binomial con p = n = 5.

2

X P(X=x)

0 0.0313

1 0.1563

2 0.3125

3 0.3125

4 0.1563

5 0.0313

(27)

Tabla I I I .1.2. Funcion de probabilidad de la distribution binomial,con p = —,n = 6

z

X P(X=x)

0 0.0156

1 0.0938

2 0.2344

3 0.3125

4 0.2344

5 0.0938

6 0.0156

Figura I I I.1.2. Grafica de la funcion de probabilidades correspondiente a la Tabla I I I.1.2

T e o re m a : La distribution binomial es asimetrica positiva si p <

D em ostracion :

Supongase que la distribution binomial es asimetrica positiva, esto implica que su

(28)

7 > 0

Por lo tanto

1 - 2p

V npq > 0 =4* 1 — 2p > 0

Por lo tanto

A continuation se muestran los valores de la distribution binomial con p = 0.2, n = 7.

Tabla I I I.1.3. Funcion de probabilidad de ladistribucion binomial, p = 0.2, n = 7.

X P(X=x;

0 0.2097

1 0.367

2 0.2753

3 0.1147

4 0.0287

5 0.0043

6 0.004

(29)

j */

:.3-] i .

°] i 3 * 5 6 7

Figura III. 1.3. Grafica de la funcion de probabilidades correspondiente a la Tabla III.1.3.

T e o re m a : Si la distribucion binomial es asim etrica negativa entonces p >

D em ostracion :

Supongase que la distribucion binomial es asim etrica negativa, esto implica que

su coeficiente de asimetria es menor que cero, es decir

7 < 0

1 - 2 p

7 = —---< 0 =>- 1 — 2p < 0

Por lo tanto

(30)

Tabla III. 1.4. Funcion de probabilidad de la distribution binomial,p = 0.8, n = 10.

X P(X=x)

0 <0.001 1 <0.001 2 <0.001

3 0.0008

4 0.0055

5 0.0264

6 0.0881

7 0.2013

8 0.3019

9 0.268

10 0.1073

Figura I I I.1.4. Grafica de la funcion de probabilidades correspondiente a la Tabla I I I .1.4

III. 2 M o d o d e la d is trib u tio n bin om ial

E l modo o numero mas probable de exitos, es el valor de x que corresponde a

(31)

por lo menos igual a las probabilidades correspondientes a los numeros de exitos que

preceden o siguen a x , esto es,

< f ( x )

Desarrollando la primera expresion:

/ ix - !)

n x —1

ip* - y - z + i

n x —1

Dividiendo por n

x V

n\

(x —1)! (n — x + 1)! ^ n\

x\(n — x)\ ^ x\ (n — x)\q (x — 1)! (n — x + l)!p

x q (n — x + l ) p

x q

x q + xp

x

Desarrollando la segunda expresion:

/ ( x + 1) < f ( x )

< f ( x )

< 1

< 1

< 1

< (n — x + l ) p

< np + p

(32)

/ ( z + 1) < f ( x ) n

x + 1

jp*+i » - * - ! < n

x I Pxqn~x

n Dividiendo por I j q

x n+ i ) p ^ U q

n\

(x + 1 )\(n — x — 1)! n\

•Q *V

x\ (n — x)\ x l (n — x)\p (x

+

1

)!

(n — x

1

)!

(n — x) p

< 1

< 1

< 1

( x + l ) q

p n — xp < x q + q

p n — q < x

Por lo tanto si x es el modo, es claro que debe satisfacer la siguiente expresion:

p n ~ q < x < n p + p

o bien

p ( n + 1) — 1 < x < p ( n + 1) (3.1)

(33)

f ( p ( n + l) - 1) = f ( p ( n + 1))

es decir, habra dos valores modales adyacentes con igual probabilidad.

Por otro lado si p (n + 1) no es un entero, solo habra un modo, es decir, existe un

unico entero que satisface (3.1).

Por lo que se puede concluir, que el modo (M o) de la distribution binomial es:

M o = p (n + l),p (n + 1) — 1 s i p ( n - f l ) E Z +

M o = \p(n + 1)] si p {n + 1) f Z+

(34)

I V . A P R O X I M A C I O N E S A O T R A S D I S T R I B U C I O N E S

I V . 1 L a D is tr ib u tio n P ascal

Supongase que un experimento se continua hasta que un ensayo particular A

ocurre por k-esima vez.

Donde P (A ) = p P (A C) = q en cada una de las repeticiones.

Definamos la variable aleatoria Y de la siguiente manera.

Y es el numero de repeticiones necesarias a fin de que A ocurra exactam ete k veces.

Ahora Y — n si y solo si A ocurre en la n-esima repeticion y precisamente A

ocurrio (k — 1) veces en las (n — 1) repeticiones previas.

(35)

I V . 1 . 1 R e la cio n en tre la d istrib u cio n P a s c a l y binom ial

En el caso de la binomial P ( X = x) da la probabilidad de x exitos en n ensayos.

En la distriducion Pascal P ( Y — n) da la probabilidad de k exitos despues de (n — k)

fracasos. Para mostrar las relaciones entre estas dos ditribuciones utilicese a k como

simbolo para los exitos en ambos casos, esto es, sustituyase todas las x por k en la

funcion de probabilidad binomial.

Si ahora se reescribe la funcion de probabilidad binomial, la semejanza es evidente.

P ( X = k) = ( f y p kqn- k

Dividiendo una funcion por la otra , se puede establecer matematicamente la

relacion entre las dos.

P ( Y = n) P ( X = k)

n ~ l , k - 1

,n—k

71 k j

n —1

k - 1

0

in ~ 1)T

-(fc — 1)! (n — 1 — fe + 1)!

n\ k\(n — k)\ k\ (n — fc)! (n — 1)!

(36)

k n

Por lo tanto

P ( Y = n) = - P ( X = k) n

o sea la probabilidad de k exitos despues de n — k fracasos (en la distribucion de

pascal) es igual a la probabilidad de k exitos en n ensayos (en la distribucio binomial)

multiplicada por la razon de los exitos a los ensayos

I V .2 L a d istrib u cio n h ip erge o m etrica

Supongase que se tiene un lote de N articulos, de los cuales M son defectuosos y

(N — M ) no son defectuosos.

Supongase que se escoge, al azar, n artfculos del lote (n < N ), sin sustitucion.

Defmase la variable alaetoria X de la siguiente manera:

X es el numero de articulos defectuosos encontrados en los n artfculos.

Puesto que X = x si y solo se obtiene exactamente x articulos defectuosos y

(n — x) no defectuosos, tenemos

x = 0,1,2, ...n

(37)

Observese que la funcion de probabilidades puede ser cero para algunos valores de

x = 0,1,2, ...,n.

I V .2 .1 A p ro x im a cio n d e la d is trib u tio n h ip erge o m etrica m ed ian te

la d istibu cio n binom ial

Sea X una variable aleatoria con distribucion hipergeometrica, como en la section

anterior. Si el tamano del lote es suficientemente grande, la distribucion X puede ser

aproximada por la distribucion binomial, es decir,

P (X = x) ~ ( n \pxqn x donde p = —

paxa N grande.

En efecto, para probarlo primero se demostrara que la distribucion hipergeometrica

esta acotada, es decir,

x

U' ' p - ^ Y < P ( X = x ) < l n )p xqn- x ( l - 71

N N x N (3.41)

donde p =

A continucion se deducira la primera desigualdad

P ( X = x)

(38)

Ml ( N - M ) l

x\ (M — x)\ (n — x)\(N — M — n + a:)!

AH

n\ (N — 77.)!

nl Ml (N — n)\ (N - M)l x l ( n - x ) \ ‘ ( M - x ) \ ’ AH * (N — M — n + x)\

0 (M - x + 1) (M - x + 2)... (M ) (N - M - n + x + 1) (N - M - n + x + 2)... (N - M )

( A T - n + 1 ) (TV - r i H - 2 ) ... (A/-)

Tenemos que

( M - x + l ) { M - x + 2 ) ...( M ) > (.M - x ) x

( J V - n + l ) ( J V - n + 2)...(AT) < N n

(■N - M - n + x + l ) ( N - M - n + x + 2 ) . . . ( N - M ) > (AT — M — n + x )n~x

por lo tanto

P ( X = x) > 'w\ (M - x f (N - M - n + x ) n~x

x:c J N n

fn \ (M - x f (N - M - n + x )n~x

\ X J f f n - x + x

( n \ ( M - x f (N — M — n + x ) n~

X N 2 frfn—x

'n \ / M x \ X ( 1 Af n - x \ n~x

x \ N N J V N ~ N

n\ ( x

V N

(39)

De aqui, se concluye

La primera desigualdad se ha probado.

n—x

< P ( X = x)

A continuation se deducira la segunda desigualdad.

Por lo anterior

P { X = x) n\ (M — x + 1).... (M ) (N — M — n + x -f 1) (N — M — n 4- x 4- 2)... (N — M )

x ) {N ~ n + l ) ( N - n + 2 ) ...( N )

Tenemos que

(M — x + 1) (M — x + 2) ... (M ) < M x

(N — n + 1) (N — ti + 2) ... (TV) > (N — n )n

( N - M ~ n + x + l ) ( N - M - n + x + 2 ) . . . ( N ~ M ) < (N — M )n~x

Por lo tanto

P ( X = x) < n\ M x (N - M )n~x x ) (N - n )n

n\ M x (N - M )n~x (N - n)~n

% J J\Jx—x + n —n

n\ / M \ x / N - M \ n~x ( N - n \

(40)

n \ / M \ x A M \ n x </ n \ ' n x \n ) v1 _ ] v y v1 “ iv/

Asi se ha concluido

n

x Ip xqn~x

n

N

—n

P ( X = x) < n x

p X g n -x

1 - — N

Mantenganse n y x fijos, y hagase que N y M se aproximen a infinito de manera

que p = ^ se aproxime a un valor comprendido entre 0 y 1. Entonces la primera y

ultim a de las expresiones de (3.41) se aproximan a la distribucion binomial.

Tabla IV .2.1.1. Valores de las funciones de probabilidades de la distribucion

binomial con n = 100 y p = 0.02 y de ladistribucion hipergeometrica con

M = 20, N = 1000 y n = 100.

X

Distribuci6n Binomial

Distribuci6n Hipergeometrica

0 0.133 0.119

1 0.271 0.27

2 0.273 0.288

3 0.182 0.192

4 0.09 0.089

5 0.035 0.031

6 0.011 0.008

7 0.003 0.002

(41)

0.4

0.3

0 2

0.1

oo

3 4 0

inr^-K .

e 7 e Bo»mul

K -*

Figura IV .2.1.1. Valores de la Tabla IV .2.1.1

I V .3 A p ro x im a cio n d e la d istrib u cio n b in o m ia l m ed ian te

la d istib u cio n Poisson

E l siguiente teorema, esencialmente, dice que se puede aproximar las probabili-

dades binomiales con las probabilidades de la distribucion de Poisson siempre que

n sea grande y p pequeno. Cuando n es muy grande los coeficientes binomiales son

(42)

T e o re m a : Sea X una variable aleatoria distribuida binomialmente con parametros

n y p . Supongase que cuando n —* oo, y p —> 0 se tiene que np —► a . Entonces

lim P ( X = x)

n—»oo ' '

‘or x\

que es la distribucion de Poisson con parametro a .

D em ostracion :

Como X tiene distribucion binomial entonces

P ( X = x) = Q p ^

-- 5

= n ( n - l ) ( n ~ 2) - ( n - j + l ) x\

haciendo n p = a tenemos que

P = - (i)

sustituyendo (1) en (*)

p ^ X — x ) ' n (n ~ ! ) ( n ~ 2)...(n - x + 1) / a \n-x xi

a x\

X

n (n — l ) ( n — 2 )...(n — x + 1)

nJ n

(43)

Por otro lado, puesto que

lim

n —* oo 1 + - n = e

entonces

lim

n —»oo 1- -n

—a

Por tanto

lim P ( X

-r»_* x) = limn —kx> a J

xl n —limkx) .X

a

x\(l ) ( e ° ) (1) = a xe —a

2 n

x — 1

n 1

a \ n

n. 1

a: n. x —1

n n —*oolim 1

a n

n

lim

n —»oo n

—x

(44)

Tabla IV.3.1. Valores de las funciones de probabilidades de la distribution

binomial con n = 100 y p = y de la distribution de Poisson con fi = 1.

Distribution Distribution

X Binomial de Poisson

0 0.366 0.368

1 0.37 0.368

2 0.185 0.184

3 0.061 0.061

4 0.015 0.015

5 0.003 0.003

S 3 BINOMIAL m p o is s o n

(45)

. I V .4 A p ro x im a cio n d e la d is tr ib u tio n b in o m ia l m e d ia n te

la d istrib u cio n n o rm al

El siguien'te tebrema se llama teorema de lirnite de De Moivre y Laplace.

Cuando n es muy grande resulta poco conveniente calcuiar los coeficientes bino-

miales y las potehcias de la distribucion binomial, de aqui la importancia de esta

aproximacion.

T e o re m a : Sea 0 < p < 1. Entonces para n grande, la distribucion binomial se

puede aproximar por medio de la distribucion normal con media — np y varianza

a 2 = npq, es decir

lim P ( X = x ) —

y/2n -Jn pqe »

D em ostracidn:

Usando la formula de Stirling (aproximacion de n!) para los factoriales que apare-

cen en la distribucion binomial se demuestra el teorema.

k \ k e

Formula de Stirling k!=\/2Hk I — ) e*** 0 < 6 < 1 e

(46)

---:---vxa n~x

x\(n — x)\

i ( ffi 6'> \

nn+2e' 12n 12* ~~ 12(n-i) J ^/27r (n — x )xx + 2 {n — rc)” 1

haciendo r = ■£*— ^12n 12x 12(n —* ),

0 < 0* <

_______ nw+2e y f a_______

(n — x)* x x+% (n — x )n~x

nn + le rp xqn-x

s/27r (rc, — x)z x x+i (n — x)n~x - i er

\/27rxx+2 (n — x )n~xJr5

71n+2px+i g”~x+l eT ns1

V^7rp 2^5 2^+5 (n — £ )n-X+2 n21

nn+2 -~x+xp xH qn~xH eTnh

y/27T7ipqXX+5 (n — £ ) re-3H~2

(47)

n u + 5 ■- x n x + 2p x + 2 q n - x + 5 e r

V^7mpgxz+ 2 (?z — x ) n x+2

e ( np \\ ®+£ nq n -x+ i

y/2irnpq \ x J \n — x

- ( W l l y

n — x

e T ( x \ ~(x+*) /r> _ - ( ra- x+i)

y/2im pq \ n p j \ n q )

Nota: recuerdese que e Inv = v (pues son funciones inversas), y dos propiedades

de los logaritmos In (a b ) = In (a ) -f I n (6), I n ( a ) b = b ln ( a)

por lo tanto

y/2im pq

In

e L

: 6 L np.

x

nq

- H O /„ _

/n ---- + I n

---\ n pj \ nq

y/2irnpq

&T f H x+ l) /ra( ^ ) - ( n" J+ i ) /ra(I^ ) l y/2irnpq

Sea h = l x

+ l ) I n { £ ) + { n - x + l ) I n { n — x

nq

Luego

P ( X = x) = e Te h y/2im pq

ahora 2 = —-■ ^ despejando x x = n p 4- z J n p q

(48)

por lo que

h = (n p 4- Zyfnpq + ^ I n + ( n - n p - Zyfnpq 4- ^ /n ^1\ ( n — np — z^/npq n q

n p + - + z

np + - + z

I n [ l + z \ l i ) + { n q + 2 ~ 2

I n [

1 4-zW— ) 4- (ng

+

^ —

2

V V nP / V 2

^ /nq-z^/^tpgX

71V / I n i 1 — z

Por hipotesis \z\ es acotado y para n suficientemente grande tenemos

< 1 < 1

Nota: recordemos que

r /i \ v2 1,3 v4

I n (1 + v) = v - — + — - — + ... \v\ < 1

Asf

I n ( 1 + z j — np

I n i 1 - 2,/— nq

2 np np

n#

z 2 p

2 nq

sustituyendo en h

h = (n p 4- ^ + z z w A _ ^ J L + . . W ? +

n p 2 np I \ 2 —z

z2 p n<? 2 ng

(49)

h n p z j--- - z 2q + ... + - J —q I n z [ q

np 2 2 V np

9 1 , q ___ / p 1

+ — + z Q ~ 7^z ' -^~\JnPq + ••• — z n q , -

---1 2 Q

4 np 2 np

V 1 2 P 1 3 P

- -«/ ---7 2 --- --- + z p + - z — y/npq + ...

2 V n q 4 nq 2 nq

k < " + «>+ 5

i

P ng

z 2 q p] z 3 r

An ----p 1---q + +

h =

+n.z

1

, q I P P i--- Q\,n p — — Qav nq /— +

O 2

z 2 -+•

2y /n

z 2yjn An^Jn

l + l

p q + 2>/ri p P\ ~ - 9 i

V 9

+

ft =

ng

^ ( - + - ) + ^ ( p / - W - ) + ^ ( ^ - ^ P ) +

4\/ri I p W 2 V V ? VP /

ip q .

^ . , . H---p j - - q * 1 + ...

4 - ^ \^p g ,/ 2 \ V Q VP

Por lo tanto, h se puede escribir de la siguiente manera

h = \ z 2 + ^ = R

2 y/n

En esta igualdad R es una funcion que sigue acotada en valor absoluto cuando n

tiende a infinito. En consecunecia:

lim e h = e ^ n—>oo

Como

(50)

entonces

de aqui

Por otro lado

a < z

a < x — np y/npq

cxy/npq < x — np

< x

< X

< X

Oiy/npq — np

x np

1

a

z < P

x — np

< P y/npq

x — np < fiyjnpq .

x < Py/npq 4- np

(51)

n — x > —j3y/npq — n (1 — q) + n

n — x > —p y /n p q — n + nq + n

n — x > n q 1 - / 3

luego

1 { $ ! 9

12 n n — x 0 < ft < 1

■ i 1 / 1 1 1

r < — (

---12 \n x n — x < 12 n 1

-p ( a , / - 2- 4- 1 r \ \f np

Por lo tanto

r — ► 0

n —♦ oo

Luego

lim er = 1

Ti—>00

lim P ( X = a) = lim

n —t-oo ' n —>oo

e

y/2im pq

_*2

e 2

(52)

V . B IB L IO G R A F fA

Cramer, H. (1986). E le m e n to s e n la T e o r ia d e P ro b a b ilid a d e s y A p lica -

cio n e s. Editorial Aguilar, Madrid, Espana.

Feller, W. (1975). I n tr o d u c tio n a la T e o r ia d e P ro b a b ilid a d e s y sus A p li-

ca c io n e s. Editorial Limusa, Mexico D .F .

Johnson L. N., Kotz S. (1969). U n iv a ria te D is c r e te D is trib u tio n s . Wiley-

Interscience Publication, New York.

Khazanie R . (1976). B a s ic P r o b a b ility T h e o ry . Goodyear Publishing Com­

pany, California.

Kreyszing E. (1973). E s ta d id tic a M a te m a t ic a P rin c ip io s y M e to d o s. Edi­

torial Limusa, Mexico D .F.

Meyer P. L. (1986). P r o b a b ilid a d y A p lic a c io n e s E s ta d is tic a s . Editorial

Iberoamericana, Mexico D .F.

Mode B. E. (1970). E le m e n to s d e P r o b a b ilid a d Y E s ta d fs tic a . Editorial

Reverte, Mexico D .F.

Parzen E. (1964). M o d e rn P r o b a b ility T h e o r y a n d its A p p lic a tio n s. Wiley-

Interscience Pubbcation, New York

Quirin L. W . (1978). P r o b a b ility a n d S t a tis t ic s . Itaper & Row, publishers,.

(53)

A N E X O

D is trib u c io n b in o m ial.

Sea s un experimento y A n n suceso asociado a e. Supongase que P {A ) = p y

por lo tanto P (A C) = 1 — p. Considerense n repeticiones independientes de e. Por

lo tanto el espacio muestral consta de todas las sucesiones posibles {<21,02) o„,}, en

donde cada a, es A o bien Ac, segun que A o A c ocurra en la i-esima repetition de e.

Aun mas, supongase que P {A ) = p es el mismo para todas las repeticiones. Definase

la variable aleatoria X como sigue:

jj^sibles obviamente son 0 , 1 , 2 , Se dice en forma equivalente que X tiene una

distribucion binom ial, y las repeticiones individuates de e se llaman en sayos B ernoulli. X = al numero de veces que ocurrio el suceso A.

A X se la llama variable a leato ria bin om ial con parametros n y p. Sus valores

A la ocurrencia de A se le llama exito y a la no ocurrencia de A fracaso.

Sea X una variable binomial basada en n repeticiones. Entonces su funcion de

(54)

Tabla A l. Propiedades de la distribution binomial.

Media II ■§

Varianza a 2 = npq

Desviacion Estandar a = y/rvpq

I Modo M o = p ( n + l ) , p ( n + 1) — 1 sip(n + l ) G Z+

[ p ( n - f l ) ] W si p (n -f-1) ^ Z+

| Funcion de distribucion acumulada F ( * ) = £ ( f \ ^ q n~k k<x \K/

| Funcion generadora de momentos G ( t) = (e‘p + q ) n

Funcion caractenstica = (<s“p + q)n

Coeficiente de asimetria

[rrr] es el mayor entero que no excede a x

/ L a distribucion binomial es simetrica si y solo si p=\

/ L a distribucion binomial es asimetrica positiva si p <

/ S i la distribucion binomial es asimetrica negativa entonces p >

A p ro xim acio n es a otras d istribu cion es.

<0>Aproximacion d e la d istrib u cio n h ip erg e o m etrica m ed ian te la dis-

tib u c io n binom ial.

(55)

lote es suficientemente grande, la distribution X puede ser aproximada por la dis­

tribution binomial, es decir,

P ( X = x) ~ ( J VX(f x donde p =

para N grande.

En general, la aproximacion de la distribucion hipergeometrica mediante la dis­

tribution binomial es muy buena si ~ < 0.1

0A p ro x im a cio n d e la d is trib u c io n b in o m ia l m e d ia n te la d istib u cio n

P o isso n .

E l siguiente teorema, esencialmente, dice que se puede aproximar las probabili-

dades binomiales con las probabilidades de la distribucion de Poisson siempre que n

sea grande y p pequeno.

T e o re m a : Sea X una variable aleatoria distribuida binomialmente con parametros

n y p. Supongase que cuando n —* oo, y p —* 0 se tiene que n p —> a . Entonces

p ry lim P ( X = x) =

n -^ o o

que es la distribucion de Poisson con parametro a .

O A p ro x im a cio n de la d is trib u c io n b in o m ia l m e d ia n te la d istrib u c io n

n o rm a l.

(56)

Cuando n es muy grande resulta poco conveniente calcular los coeficientes bino-

miales y las potencias de la distribucion binomial, de aqui la importancia de esta

aproximaci on.

La aproximacion es conveniente mientras np > 5 cuando p < 0.5 y n q > 5 cuando

p > 0.5

T eorem a: Sea 0 < p < 1. Entonces para n grande, la distribucion binomial se

puede aproximar por medio de la distribucion normal con media p = np y varianza

a2 = npq, es decir

1 *2 lim P ( X = x) = —^ — e 2

Figure

Actualización...

Referencias

Actualización...