• No se han encontrado resultados

Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W

N/A
N/A
Protected

Academic year: 2021

Share "Daniels Capítulo 4 Bioestadística: base para el análisis de las ciencias de la salud . Daniel Wayne W"

Copied!
41
0
0

Texto completo

(1)

4.1

INTRODUCCION

En el capitulo anterior se presentaron los conceptos basicos de probabilidad y los metodos para ca1cular la probabilidad de un eventQ. En este capitulo se amplla,n estos conceptos y se exploran form as para calcular las probabilidades de un evento bajo condiciones un poco mas complicadas. En este capitulo se estudian las relaciones entre los valores de la variable aleatoria y las probabilidades de que su ocurrencia pueda resumirse por medio de un mecanismo Hamado dislt"ibuci6n de probabilidad. La distribucion de probabilidad se puede expresar forma de tabla, grafica 0 formula. Conocer la distribucion de probabilidades para la variable aleatoria proporciona al medico y al investigador herramientas podero­ sas para simplificar y describir un conjunto de datos, y para llegar a conclusiones acerca de la poblacion de datos sobre la base de una muestra de datos extraidos de lapoblacion.

4.2

DISTRIBUCION DE PROBABllIDAD

DE VARIABLES DISCRETAS

Para iniciar el estudio de las distribuciones de probabilidad, se cbnsidera en primer lugar la distribucion de probabilidad de una variable discreta, ·la cual se define comosigue:

(2)

-DEFINICION

La distribucion de probabilidad de una variable aleatoria discreta es una tabla, unagratica, una fannula u otro sistelDa utilizado para especificar todos losvalores posibles de una variable aleatoria discreta junto con sus probabilidades respectivas.

EJEMPLO 4.2.1

..--~

En un articulo de la revistaAmericanJournal o/Obstetrics and Gynecology, Buitendijk y Bracken (A-I) aseguran que durante 25 afios se ha tornado mayor conciencia de los efectos potencialmente dafiinos de los medicamentos y quimicos en el desarrollo de los fetos. En una poblaci6n de mujeres dadas de alta en maternidad, en un hospital del este de EUA, entre 1980 y 1982, los autores valoraron y estudiaron la asociaci6n del uso d~ medicamentos con varias caracteristicas de la madre, por ejemplo uso de alcohol, tabaco y adicci6n a farmacos. Sus hallazgos sugieren quela

TABIA4.2.1 Prevalencia del

CODSUIDO de medicmnentos

prescritosy no prescritos durante el embarazo enUelllujeres dadas de alta depues del parto enunhospital del estede EUA

·N6mero de medicamentos Frecuencia

o

1425 1 1351 2 793 3 348 4 156 5 58 6 28 7 15 8 6 9 3

FUENTE: Simone Buitendijk y Michael B. Brac­ 10

ken, "Medication in Early Pregnancy: Prevalence 12 of Use and Relationship to Maternal Characte­

ristics", AmericanJournal ofObstetrics and Gyneco­

Total 4185

logy, 165,33-40..

mujer que muestra un comportamiento mas propenso a correr riesgos durante e1 embarazo, tambien esta mas propensa a utilizar medicamentos durante el mismo. La tabla 4.2.1 muestra la prevalencia del consurno de medicamentos prescritos y no prescritos durante el embarazo entre las mujeres estudiadas.

(3)

4.2 DISTRIBUCION DE PRQBABILIDAD DE VARIABLES DISCRETAS

85

TABlA 4.2.2 Distribucion de

probabilldad del nUrnero de

medicamentos consumidos conysin prescripcion durante el embarazo entre las mujeres desClitas en el ejemplo 4.2. t Numero de medicamentos (x) P(X

=

x) 0 .3405 I .3228 2 .1895 3 .0832 4 .0373 5 .0139 6 .0067 7 .0036 8 .0014 9 .0007 10 .0002 12 .0002 Total 1.0000

Se pretende construir la distribuci6n de probabilidad de la variable discreta X, donde X = nurnero de rnedicarnentos prescritos y no prescritos consurnidos por los individuos estudiados.

Soluci6n: Los valores de X son XI

=

0, x2 1, ... , XlI

= lOy

X 12

=

12. Se calculan las probabilidades para estos valores dividiendo sus respectivas frecuencias entre el total, 4185. Asl, porejemplo. P(X x)

=

1425/4185

=

.3405. EI resultado se rnuestra en la tabla 4.2.2 que representa la distribuci6n de

probabilidades deseada. •

Altemativarnente. se puede presentar esta distribuci6n de probabilidad en forma grafica, como en la figura 4.2.1. En dicha figura, la longitud de cada barra vertical indica la probabilidad para el valor correspondiente de x.

En la tabla 4.2.2 se observa que los valores de P(X = x) son todos positivos. rnenores que 1. y la surna de los rnismos es igual a 1. Estas no son caracterfsticas particulares de este ejernplo, sino que son caracterfsticas para todas las distribu­ ciones de probabilidad de variable discreta. Por 10 tanto, se dan las siguientes propiedades indispensables en una distribuci6n de probabilidad para una varia­ ble discreta:

1) 0.::;; P(X = x).::;; 1 2)

LP(X=

x)

=

1

(4)

.35 .34 .33 .32 .31 .30 .29 .28 .27 .26 .25 .24 .23 .22 .21 .20 "0 ,19 '" J,l .18 :0 ~ .17 a: .16 ,15 .14 .13 .12 .11 .10 .09 .08 .07 .06 .05 .04 " .03 .02 ,01 o 2 3 4 x (numero de medicamentos)

FIG,URA 4.2.1 Representaci6n grafica de la distribuci6n de probabilidad de la tabla 4.2.1.

Tambien se observa que cada una de las probabilidades de la tabla 4.2.2 es la frecuencia relativa de ocurrencia de cada valor de X.

Cuando se tiene disponible la distribuci6n de probabilidad, es posible hacer afir­ maciones acerca de la variable aleatoria X. Se muestra con los siguientes ejemplos.

(5)

4.2 DISTRIBUCI6N DE PROBABILIDAD DE VARIABLES DISCRETAS 87

EJEMPLO 4.2.2 .

. ~ . .

~Cual esla probabilipad d~,que una mujer seleq:ionada aleatoriamente sea una de las que consumieron tres medicamentos con 0 sin .prescripci6n?

Solucion: Se puede escribir la probabilidad deseada comoP(X = 3). En la tabla 4.2.2 se puede ver que la respuesta es .0832. •

EJEMPLO 4.2.3

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente haya con­ sumido uno 0 dos medicamentos?

Solucion: Para responder a la pregunta, se utiliza la regIa de adici6n para eventos mutuamente excluyentes. Mediante el uso de la notaci6n de probabili­ dad y los resultados de la tabla 4.2.21a respuesta se escribe como P(l

u

2) P(l)

+

P(2) .3228

+

.1895 = .5123.. •

lJiStrihuciOlles acumulqdas. AIgunas veces es mas conveniente trab~jar con la distribuci6n de probabilidad acumulada de una variable aleatoria. La distribuci6n de probabilidadacumuladaparala variable discreta cuya distribuci6n de probabilidad esta dada en la tabla 4.2.2 puede obtenerse sum'ando sucesivamente las probabili­ dades, P(X = x), que aparecen en la ultima columna. La probabilidad acumulada para Xi se escribe como F(x) P(X:<;; x). Estoda la probabilidad de que X sea menor

o igual a un valor espedfico xi'

La distribuci6n de probabilidad acumulada resultante se muestra en la tabla 4.2.3. La grafica de la distribuci6n de probabilidad acumuladase muestra en la figura 4.2.2. A una grafica de este tipo se Ie llama ojiva. La grafica de F(x) consiste solamente en las lineas horizontales. Las lfneas verticales s610 Ie dan una aparien­ cia conectada. La longitud de cada linea vertical representa la misma probabilidad que la de la linea correspondiente en la figura 4.2.1. Por ejemplo, la longitud de la lfnea vertical en X 3 de la figura 4.2.2 representa la misma probabilidad que la longitud de la linea levantada en X 3 de la figura 4.2.1, 0 .0832 en la escala vertical.

AI consultar la distribuci6n de probabilidad acumulada es posible responder rapidamente a las preguntas de los ejemplos siguientes: .

EJEMPLO 4.2.4

~Cual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de

las que consumieron dos 0 menos medicamentos?

.. Solucion: La probahilidad buscadase puede locaJizar directamente en la tabla 4.2.3, en ellado opuesto a x = 2, donde se observa que es .8528. Es decir, P(x

:<;; 2)

=

.8528. Tambien se puede localizar la respuesta examinando la

figura 4.2.2 y determinando la altura de la grafica (medida sobre el eje

(6)

TABlA 4.2.3 Distribucion de probabilidad acumulada del numero de medicamentos con y sin prescripcion utilizados durante el

embann:o entre las mujeres descritas en el ejetUplo 4.2.1

Numero de medicamentos (x) Frecuencia acumulada P(X:'; 2)

o

1 2 3 4 5 6 7 8 9 10 12 .3405 .6633 .8528 .9360 .9733 .9872 .9939 .9975 .9989 .9996 .9998 1.0000 1.00 .95 .90 .85 .80 .75 .70 .65 .60 .55 .50 ~ r.... .45 .40 .35 .30 .25 .20 .15 .10 .05 2 3 4 5 7

o

8 9 10 11 12 x (numero de medicamenlos)

FIGURA 4.2.2 Distribuci6n deprobabilidad acumulada del numero de medicamentos con 0

(7)

39

4.3 DISTRIBUCION BINOMIAL

EJEMPIJO 4.2.5

~GuaJ. es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que, consumieron menos de dos medicamentos?

SoIudon:Puesto que una mujer que consumio menos de dos medicamentos indica que consumio uno 0 ninguno, la respuesta es la probabilidad acumulada para 1, esdecir, P(x < 2)

=

P(x S 1) == .6633. •

EJEMPLO 4.2.6

~Guales la probabilidad de que una mujer seleccionada aleatoriamente haya con­ sumido cinco 0 mas medicamentos?

Soludon: Para encontrar la respuesta se utiliza el conceptode probabilidad com­

plementaria. EI conjunto de mujeres que consumen cinco 0 mas medi­ c<:l.mentos es el complemento del conjllllto de mujeres que consumen menos de cinco (es decir, cuatro 0 menos). La suma de las probabilida­ des asociadas coneste conjunto es igual a 1. Esta relacion escrita en notacion de probabilidad es P(x 2 5)

+

P(x

s

,4) == 1. Por 10 tanto, P(x 2

5) = 1 - P(x

s

4)

=

1-.9733

=

.0267. •

EJEIUPLO 4.2.7

~Gual es la probabilidad de que una mujer seleccionada aleatoriamente sea una de las que consumieron entre tres y cinco medicamentos, inclusive?

Soludon: P(x

s

5)

=

.9872 es la probabilidad de que una mujer haya consumido entre cero y 5 medicamentos, inclusive. Para obtener la probabilidad de entre 3 y 5, se resta de .9872 la probabilidad de 2 0 menos. La respuesta escrita en notacion de probabilidad queda como: P(3 S x

s

5) P(x

s

5) - P(x

s

2)

=

.9872 - .8528

=

.1344. •

La distribuci6n de probabilidad dada en la tabla 4.2.1 esta desarrollada a partir de la experiencia real, asi que de encontrar otra variable siguiendo esta distributi6n , seria s6lo por casualidad. Sin embargo, las distribuciones de probabilidad de mu­

chas variables de interes pueden determinarse 0 asumirse sobre la base de conside­ raciones te6ricas. En las siguientes secciones, se estudian con detall,e tres de estas distribuciones te6ricas de probabilidad: binomial, Poisson y normal.

4.3

DISTRIBUCION

BINOMIAL

La distribuciOn binomial es una de las distribuciones utilizadas mas ampliamente en estadistica aplicada. La distribuci6n se deriva de llll procedimiento conocido como ensayo de Bernoulli, nombrado as! en honor del matematico suizo James Bernoulli (1654-1705), quien realiz6 contribuciones importantes en el campo de la probabi­ lidad, induyehdo, particularmente, la distribucion binomial. Guanda en un proce­ so aleatorio 0 experimento, llamado ensayo, puedeocurrir solo uno de dos resultados mutuamente excluyentes, como vida 0 muerte, enfermo 0 sano, masculino 0 feme­ nino, el ensayo se llama ensayo de Bernoulli.

(8)

Proceso de Bernoulli Una secuencia de ensayos deB-ernoulli forma un proce­

so de Bernoulli, si se cumplen las siguientes condiciones:

1. En cada ensayo ocurre uno de dos posibles resultados, IIiuWamente excluyentes. Uno delos posibles resultados.se.denota (arbitrariamente) como un exito y el

otro., como fracaso. ," "

2. La probabilidad de un exito, denotado porp, permanece constante de un ensayo a otro, y la probabilidad de fracaso, 1 -

p,

se denota con q.

3. Los ensayos son independientes, es decir, el resultado de alglin ensayo en particular no es afectado por el resultado de cualquier otro ensayo.

EJEMPLO 4.3.1

Se desea calcular la probabilidadde x exitos en n ensayos de Bernoulli. Por ejem­ plo, suponga que en cierta poblacion 52 por ciento de todos los nacimientos que se registraron son varones. La interpretacion de esto es que la probabilidad del naci­ miento de un varon registrado es de .52. Si aleatoriamente se escogen cinco regis­ tros de nacimiento dentro de esa poblacion, ~cual es la probabilidad de que exactamente tres de ellos pertenezcan a varones?

Solucion: Designe la ocurrencia de un registro para el nacimiento de un varon

como "exito", y se aclara que esta es una designaciori arbitraria con fines de claridad y conveniencia y no refleja ninguna opinion respecto a la preferencia relativa del nacimiento de varones frente a m:ujeres. La ocu­ rrencia de un registro de nacimiento para un varon se designa como exito, puesto que 10 que se busca son registros de nacimientos de varo­ nes. Sise buscasen registros denacimientos de mujeres, estos sedan de­ signados como exitos, y el registro de nacimientos de varones sedan

designados como fracasos. .

Tambien es conveniente asignar el numero 1 a un exito (registro del nacimiento de un varon) y un 0 para un fracasb (registro de naci­ miento de una mujer).

El proceso que finalmente resulta en un registro de nacimiento se considera como un proceso de Bernoulli.

Suponga que, de los cinco registros de nacimiento seleccionados, resulta esta secuencia de sexos:

VMVVM

En forma codificada se escribe de la siguiente forma: .

. .

10110

Puesto que la probabilidad de un exito .~e denota con pyla probabi­ lidad de un fracaso se denota con q, la probabilidad dela secuencia de los resultados anteriQres se calcula por medio de la regIa de multiplicacion:

(9)

91 4.3 DISTRIBUCION BINOMIAL

La regia de lamultiplicacion resulta adecuada para calcular esta proba­ bilidad, puesto que sebusca la probabilidad de un varon, una mujer, un varon, un varon y una mujer, en ese orden. En otras palabras, se requie­ re la probabilidad con junta de cinco eventos. Por razones de sencillez, se utili zan las comas en lugar de la notacion de interseccion, para separar 10s resultados de los eventos en la expresion de la probabilidad .

. La probabilidad resultante es la de obtener la secuencia espedfica en el orden en que se muestran. Sin embargo, el interes no esta en el orden de ocurrencia de los registros. del nacimiento de varones y muje­ res, sino, como .se ha manifestado previamente, en la probabilidad de ocurrencia exacta de tres registros de nacimiento de varones de entre cinco registros seleccionados aleatoriamente"En lugar de ocurrir en la secuencia mostrada con anterioridad (secuencia numero I), los tres exi­ tos y dos fracasos pueden ocurrir tambien en alguna de las secuencias adicionales dadas en la tabla adjunta.

Numero Secuencia 2 11100 3 10011 4 11010 5 11001 6 10101. 7 01110 8 00111 9 01011 10 01101

Cada una de estas secuencias tiene la misma probabilidad de ocu­ rrir yes igual a

q2p3,

probabilidad calculada para laprimera secuencia mencionada.

Cuando se extrae una sola muestra de cinco elementos a partir de una poblacion espedfica, solo se obtiene una secuencia de exitos 0 fra­ casos. La pregunta, ahora, es: ,cual es la probabilidad de obtener la secuencia numero 1; la secuencia numero 2 ... 0 la secuencia numero 10? Con la regIa de adicion se sabe que esta probabilidad es igual a la suma de las probabilidades individuales. En este ejemplo se requiere sumar las 10

q2p3,

10 que equivale a multiplicar

q2p3

por 10. Ahora se puede responder a la pregunta original: ~cual es la probabilidad de observar tres exitos (registros de nacimiento de un varon) y dos fracasos (registros de nacimiento de una mujer) en la muestra aleatoria de 5 elementos extrafda de la poblacion especificada? Puesto que en Ia poblacion,

p

=

.52 Y

q

= (l -

P)

(1 - .52) .48, la respuesta a la pregunta es:

(10)

Uso de la combinaci6n como procedimiento en maestros grandes

Facilmente se puede anticipar que hacer una lista del numero de secuencias se hace mas y mas diffcil y tedioso segtin crece el tamano de la muestra, por 10 cual es necesario un metodo sencillo para contar el numero de secuencias. Este meto­ do es proporcionado por la formula de conteo que permite determinar rapida­ mente cuantos subcoIYuntos de objetos pueden formarse cuando en diferentes subconjuntos se utili zan numeros de objetos que componen el conjunto del cual se extraen. Cuando el orden de los objetos dentro de un subconjunto es inmaterial, el subconjunto se llama combinacion de objetos. Si un conjunto consta de n objetos y se pretende formar un subconjunto de x objetos, sin ver el orden de los objetos dentro del subconjunto, el resultado se llama combinaci6n. Por ejemplo, se define la combinacion como sigue cuando la combinacion se forma tomando x objetos de un conjunto de n objetos:

DEFINICION

Una cornbinaci6n de n objetos tornados x a la vez es un subconjunto desordenado de x de los n objetos.

EI numero de combinaciones de n objetos que imeden formarse tomando x a la vez esta dado por:

n!

.GN = - - - - (4.3.1)

x!(n-x)!

donde: x!, que se lee x factorial, es el producto de todos los numeros enteros de x

hasta 1. Es decir, xl = x(x - l)(x 2) ... (1). Observe que, por definicion, 01 1. En el ejemplo se tiene una muestra de n = 5 nacimientos y se tiene inten~s en encontrar la probabilidad de que tres de elIos sean nadmientos de varones.

EI numero de secuencias para el ejemplo se caIcula con la ecuacion 4.3.1 como sigue:

120 10 12

En el ejemplo, x

=

3 es el numero de exitos, as! que n - x 2 representa el numero de fracasos. Luegose escribe la probabilidad de obtener exactamente x exitos en n ensayos:

j(x)

=

nGxqn-xpx = nG/jrqn-N para x = 0, 1, 2, ... , n

= 0, en caso contrario (4.3.2)

A esta expresion se Ie llama distribudon binomial. En la ecuacion 4.3.2fix)

(11)

93 4.3 DISTRIBUCION BINOMIAL

TABlA 4.3.1 Distribucion binomial

Numero de exitos, x Probabilidad,f(x)

o

"Coq"-0pO 1 "C1qn-lpl 2 nC2qn-2p2 x n Total 1

utilizaj{x) en Iugar de P(X x) porque es muy compacta y porque es de uso casi universal.

La distribuci6n binomial se puede presentar en forma tabular como se mues­ tra en la tabla 4.3.1.

Se establece que Ia ecuacion 4.3.2 es una distribuci6n de probabilidad al mostrar 10 siguiente:

1. j{x) ~ 0 para todos los valores reales de x. Esto proviene del hecho de que n y

p

no son nfuneros negativos, por 10 que n

ex'

px

y (1-p)" -

x

tampoco 10 son, por

10 tanto sus productos son mayores 0 iguales a cero.

2. 2.,j{x)

=

1. Esto se considera cierto al reconocer que 2.,,,C

x

q"

-x px

es igual a [(1 ­

p)

+ p]" =

I"

=

1, que es la expresi6n binomial familiar. Si el binomio (q

+ p)n

es desarrollado se tiene:

+ ... +nql

pn-l

+

pn

Si los terminos de la expansion son comparados, termino a termino, con los fix) de la tabla 4.3.1 se aprecia que son equivalentes, termino a termino,

porque: f(O):::: "c~n-O

pO

f{l):::: C q"-l pt ::::nqn-lpl n 1 . n(n 1) 2

(12)

FJEJ\tIPLO 4.3.2

Otro ejemplo del uso de la distribucion binomial. Suponga que se sabe que 30 por ciento de cierta poblacion es inmune a alguna enfermedad. Si se escoge una mues­ tra aleatoria de 10 elementos de entre esta poblacion, ~cu<il es la probabilidad de que dicha muestra contenga exactamente cuatro personas inmunes?

Solucion: Se tiene que la probabilidad de elegir una persona inmune es de .3. AI utilizar la ecuacion 4.3.1 se encuentra que:

f(4)

=

IOC4 (.7)6(.3)4

= 10! (.1l7649)(.0081) 416!

=.2001

Tabla binomial El calculo de una probabilidad empleando la ecuacion 4.3.1 puede ser una labor tediosa si el tamafio de la muestra es grande. Por fortuna, las probabilidades para diferentes valores de n, pyx ya estan tabuladas, por 10 que solo es necesario consultar la tabla conveniente para obtener la probabilidad de­ seada. La tabla B del apendice es una de muchas tab las disponibles. Dicha tabla presenta la probabilidad de que x sea menor 0 igual a alglin valor espedfico. Es decir, la tabla presenta las probabilidades acumul~tivas desde x = 0 hasta alglin numero positivo especffico de exitos.

El uso de la tabla se muestra utilizando el ejemplo 4.3.2, en el que se requiere calcular la probabilidad de x = 4 cuando n 10 y

P

=.3. De acuerdo con el estudio de la distribticion de probabilidad acumulada de la seccion anterior, se sabe que P(x 4) puede calcularse restando P(X ~ 3) de P(X ~ 4). Si en la tabla B se localiza a

p

.3 para n = 10, se encuentra que P(X ~ 4) .8497 y P(X ~ 3) = .6496. La resta del primero menos el segundo es igual a .8497 .6496 = .2001, 10 cual coincide con el calculo manual.

Con frecuencia el interes radica no solo en determinar las probabilidades para valores especfficos de X, sino para intervalos donde la probabilidad de X este entre, digamos, 5 y 10. Con el siguiente ejemplo se muestra 10 anterior:

r\JEJ\tIPLO 4.3.3

Suponga que se sabe que en cierta poblacion 10 por ciento es daltonica. Si se extrae una muestra aleatoria de 25 personas de esa poblacion, con la tabla B del apendice, encuentre la probabilidad de que:

a) Existan cinco 0 menos daltonicos.

Solucion: La probabilidad esta en una de las entradas de la tabla. Sin la necesidad de sumar ni res tar, la probabilidad P(X ~ 5)

=

.9666.

b) Existan seis 0 mas daltonicos.

Soluci6n: Esta probabilidad no se puede encontrar directamente en la tabla. Para encontrar la respuesta, se utiliza el concepto de probabilidades comple­ mentarias. La probabilidad de que existan seis 0 mas daltonicos es el

(13)

95

4.3DISTRIBUCION BINOMIAL

complemento de la probabilidad de que, existan cinco 0 menos. Es decir, este con junto es el complemento del con junto especificado en el inciso a; por 10 tanto: '

P(X?:. 1 - P(X::; 5) == I .9666 .0334

c) Existan entre seis y nueve daltonicos, inclusive.

Soludon: Esta probabilidad se encuentra restando la probabilidad de que X sea me­

, nor 0 igual a 5 de la probabilidad de que X sea mayor 0 igual a 9. Es decir:

P(6::; X::; 9) P(X::; 9) - P(X::; 5) .9999 .9666 .0333

d) Existandos, tres 0 cuatro daltonicos:

Soludou:' Esta es la probabilidad de que X este entre 2 y 4, inclusive.

P(X::; X::; 4) P(X::; 4)-P(X::; 1) .9020-.2712 = .6308 •

Ulilizar la labia B cuandop > .5 La tabla B no da las probabilidades para valores de

p

mayores a .5. Sin embargo, pueden obtenerse las probabilidades a partir de la tabla B replanteando el problema en terminos de probabilidad de fra­ caso, I

-p,

en lugar de en terminos de probabilidadde exito

p.

Como parte del

r:ep~antt::amiento, se debe pensar, tambien, en terrninos del numero de fracasos, n x, mas que en terrninos de exitos x. Esta idea se resume de lasiguiente manera:

P(X xln,p> .50)

=

P(X n-xln,I-p) (4.3.3)

Puesta en palabras, la ecuacion 4.3.3 dice que: "La probabilidad de que X sea igual a algu.n valor especffico dado el tamano de la muestra y una probabilidad mayor que .5, es igual ala probabilidad de que X sea igual a n ~x dado el tamano de la muestra y la probabilidad de un fracaso I-p". Con la finalidad de utilizar la tabla binomial, la probabilidad de un fracaso se trato como la probabilidad de un exito. _Cuando pes mayor que .5, las probabilidades acumuladas pueden obtenerse a par­

tir de la tabla B empleando la siguiente relacion:

P(X::; x

I

n, p > .5)

=

P(X ?:. n - x In, 1 - p) (4.3.4) Finalmente, al utilizar la tabla B para calcular la probabilidad de que X sea mayor 0 igual a alguna x cuando P > .5, se utiliza la siguiente relacion:

P(X?:. xln,p > .5) P(X::; n-xln, I-P) (4.3.5)

E,JEMPLO 4.3.4

Encierta comunidad, en una tarde dada, en 85 por cientode las farnilias, alguno de los miembros esta en casa. Un equipo de investigacion sanitaria selecdona una muestra aleatoria de 12 familias para realizaruna encuesta via telefonica. Con la tabla B, calcule la probabilidad de que:

(14)

a) EI equipo encuentre a alguien en casa en 7 familias exactamente.

Soluci6n: EI replanteamiento del problema es como sigue: Si en 15 por ciento de las familias no hay nadie en casa, ~cua:l es la probabilidad de que el equipo que realiza la encuesta no obtenga respuesta en 5 de 12 llama­ das? La respuesta se calcula como sigue:

P(X = 51n= 12, 15) P(Xs 5)-P(Xs 4) =.9954 - .9761 .0193 b) EI equipo encuentre a alguien en casa en 5 familias 0 menos. Soluci6n: La probabilidad que se busca es:

P(X S 51n = 12,p =.85) = P(X 212 51n = 12,p =.15)

P(X271n 12,p .15)

= 1 P(Xs 61n 12,p =.15)

=

1 - .9993 .0007 c) EI equipo encuentre a alguien en casa en 80 mas familias.

, .

Soluci6n: La probabilidad que se busca es:

P(X 2 81n

=

12,p =.85)

=

P(X S 41n

=

12,p =.15) = .9761 •

La figura 4.3.1 muestra una representaci6n visual de la soluci6n para los tres incisos del ejemplo 4.3.4.

N6mero posible Numero posible

de exitos (alguien de fracasos (nadie

en casal = x Condici6n de en casal = n -x, Condici6n de

P(JtxITo)

=

.85 prohabilidad P(FRACASO)

=

.15 probabilidad

Inciso b P(X ~ 5112, .~5) 6 6 Inciso a

CD

P(X == 7112, .85)

®

Inciso c P(X ~ 8112, .85) 11 12

®

0

P(X~ 7112, .15) P(X == 7112, .15 ) p(X~4112, .15)

FIGURA 4.3.1 Representaci6n esquematica de la soluci6n del ejemplo 4.3.4 (dentro de los 6valos se encuentra el numero relevantede exitos y fracasos en cada caso).

(15)

FJERCICIOS

EJERCICIOS 97

Parameiros bilWmiales La distribucion binomial dene dos parametros, n y

p.

Son parametros en el sentido de que son suficientes para especificar una distri­ bucion binomial. La distribucion binomial es en realidad una familia de distribu­ ciones con cada uno de los valores posibles de n y

p

designando a un miembro diferente de la familia. La media y la variancia de la distribucion binomial son J.l = np y ()2

=

np(1 -P), respectivamente.

La distribucion binomial, formalmente hablando, es aplicable en situaciones donde el muestreo se realiza a partir de una poblacion infinita 0 a partir de una poblacion fin ita con restitucion. Puesto que en la pnictica real las muestras son normalmente seleccionadas sin restitucion a partir de una poblacion finita, logica­ mente surge la pregunta respecto a la conveniencia de una distribucion binomial en estas cirrunstancias. La conveniencia del uso de esta distribucion depende de que tan drastico es el efecto de esas condiciones en la invariabilidad de

p

de un ensayo a otro. Normalmente se considera que ruando n es pequeno en relacion con

N, el modelo binomial es aderuado. Algunos autores coinciden en que n es peque­ no en relacion con N si N es al menos 10 veces mas grande que n.

Se dispone de muchos programas de softwareestadfstico para realizar los calculos de la probabilidad binomial en computadoras personales. Por ejemplo, MINITAB calcula las probabilidades individualmente 0 en forma acumulada para valores espedficos de x, n y

p.

Suponga que se pretende encontrar las probabili­ dades individuales desde x

=

0 hasta x

=

6 cuando n

=

6 Y

P

.3. Se meten los numeros desde 0 hasta 6 en la columna 1 y se procede como 10 muestra la figura 4.3.2. Si la pretension es encontrar las probabilidades acumuladas, se procede como en la figura 4.3.3.

En cada uno de los siguientes ejercicios, suponga que N es suficientemente grande con rela­ ci6n any que es posible utilizar la distribuci6n binomial para calcular las probabilidades que se piden.

4.3.1 Sobre la base del amilisis de datos recolectados por el National Center for Health Statistics, Najjar y Rowland (A-2) informaron que 25.7 por ciento (redondear a 26 por ciento para prop6sitos del calculo) de personas adultas de EVA tienen sobrepeso. Si se extrae una mues­ tra aleatoria simple de 20 adultos, encuentre la probabilidad de que el numero de personas con sobrepeso, dentro de la muestra, sean:

a) Exactamente tres personas b) Tres 0 mas personas c) Menos de tres d) Entre tres y siete, inclusive

4.3.2 Consulte el ejercicio 4.3.1. ~Cuantos adultos con sobrepeso se espera encontrar en la mues­ tra de 20?

4.3.3 Consulte el ejercicio 4.3.1. Suponga que se extrae una muestra aleatoria simple de cinco adultos. Con la ecuaci6n 4.3.2 encuentre la probabilidad de que el numero de personas con sobrepeso en la muestra sea:

a) Cero b) Mas de una

c) Entre uno y tres, inclusive d) Dos 0 menos e) Cinco

(16)

Datos:

C1: 0 1 2 3 4 5 6

Caja de dialogo: Comandos de la sesi6n:

Calc> Probability Distributions> Binomial

MTB > SUBC>

PDF C1;

BINOMIAL 6 0.3.

Seleccionar Probability. Teclear 6 en Number of trials. Teclear 0.3 en Probability of success. Se­ leccionar Input column y teclear Cl. Clic OK.

Resultados:

Probability Density Function Binomial with n = 6 and p

x P(X

=

x) 0.00 0.1176 1.00 0.3025 2.00 0.3241 3.00 0.1852 4.00 0.0595 5.00 0.0102 6.00 0.0007

=

0.300000

FIGURA 4.3.2 Calculo efectuado por el paquete MINITAB de la probabilidad binomial individual para x = 0 hasta x = 6, cuando n 6 y

P

.3.

4.3.4 Un informe del National Center for Health Statistics, bas ado en los datos de 1985, afirma que 30 por ciento de la poblaciDn adulta de EUA son fumadores (A-3). Considere una mues­ tra aleatoria simple de 15 adultos seleccionados en ese momento. Encuentre la probabilidad de que el numero de fumadores en la muestra sean:

a) Tres b) Menos de cinco

c) Entre cinco y nueve, inclusive d) Mas de cinco, pero menos de 10 e) Seis 0 mas

4.3.5 Consulte el ejercicio 4.3.4 y encuentre la media y variancia del numero de fumadores en la muestra de tamafio 15.

4.3.6 En referencia al ejercicio 4.3.4, suponga que se toma una muestra aleatoria simple de 25 adultos hoy dia y se encuentra que dos son fumadores. tRace sospechar este resultado que el numero de fumadores ha disminuido desde 1985? iPor que sf 0 por que no?

(17)

EJERCICIOS 99

Datos:

C1: 0 1 2 3 4 5 6

Caja de dialogo: Comandos de la sesi6n:

Calc> Probability Distributions>

MTB > CDF C1; Binomial

SUBC> BINOMIAL 6 0 • 3 • Seleccionar Cumulative probability. Teclear 6 en

Number of trials. Teclear 0.3 en Probability of success. Seleccionar Input column y .teclear CI. Clic OK

Resultados:

Cumulative Distribution Function

Binomial with n = 6 and p = 0.300000 x P(X = x) 0.00 0.1176 1.00 0.4202 2.00 0.7443 3.00 0.9295 4.00 0.9891 5.00 0.9993 6.00 1.0000

FIGURA 4.3.3 Calculo efectuado por el paquete MINITAB de la probabilidad binomial acumulada para x

=

0 hasta x = 6, cuando n

=

6 Y

P

=

.3.

4.3.7 La probabiJidad de que una persona que sufre de migrana tenga alivio con un farmaco especffico es de-,9, Se seleccionan aleatoriamente a tres personas con migrana a las que se les administra el farmaco. Encuentre la probabilidad de que el numero de personas que logran alivio sean:

a) Exactamente cero b) Exactamente uno c) Mas de uno

d) Dos 0 menos e) Dos 0 tres f) Exactamente tres

4.3.8 En una investigaci6n realizada entre estudiantes de enfermerfa aspirantes al grade de maes­ tria, 75 por ciento declararon que esperaban ser promovidos a un puesto mas alto un mes despues de obtener el grado, Si este porcentaje representa a toda la poblaci6n, encontrar, para una muestra de 15, la probabilidad de que el numero de personas que esperan una promoci6n un mes despues de obtener eI grado sean:

a) Seis b) AI menos siete c) No mas de cinco d) Entre seis y nueve, inclusive 4.3.9 Dado el parametro binomial p

=

,8 Yn

=

3, muestre mediante el desarrollo binomial dado

(18)

4.4

DISTRIBUCION DE POISSON

La siguiente distribuci6n discreta a considerar es la distribuci6n de Poisson, Hamada asf en honor del matematico frances Simeon Denis Poisson (1781-1840), quien tiene amplio reconocimiento por la publicaci6n de su trabajo en 1837. Esta distri­ bud6n ha sido empleada extensamente en biologfa y medicina como modelo de probabilidad. Haight (1), en el capitulo 7 de sulibro, presenta un repertorio muy amplio de aplicaciones.

Si x es el numero de ocurrencias de algiin evento aleatorio en un intervalo de espacio 0 tiempo (0 algiin volumen de materia), la probabilidad de que x ocurra es dada por

e-l.'),,;

f(x)=--, x=0,1,2 ... (4.4.1 )

x!

La letra griega A (lambda) es el parametro de la distribuci6n y es el numero promedio de ocurrencias del evento aleatorio dentro del intervalo (0 volumen). EI sfmbolo e, es la constante (con cuatro decimales) 2.7183.

Se puede mostrar que fix) ~ 0 para cada x y que

r

x f (x) 1; por 10 tanto, la

distribuci6n satisface los requerimientos para la distribuci6n de probabilidad.

Proceso tk Poisson Como se ha visto, la distribuci6n binomial resuita de un conjunto de suposiciones acerca de un proceso impHcito para formar un conjunto de observaciones numericas. Lo mismo ocurre en el caso de la distribuci6n de Poisson. Las siguientes afirmaciones describen 10 que se conoce como proceso de Poisson.

1. Las ocurrencias de los eventos son independientes. La ocurrencia de un even­ to en un intervalol de espacio 0 tiempo no tiene efecto en la probabilidad de una segunda ocurrencia del evento en el mismo, 0 en algiin otro intervalo. 2. Te6ricamente, debe ser posible la ocurrencia de un evento en un numero

infinito de veces dentro del intervalo.

3. La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensi6n del intervalo.

4. En cualquier fracci6n infinitesimal del intervalo, la probabilidad de mas de una ocurrencia del eVf"nto es insignificante.

Una caracterfstica interesante de la distribuci6n de Poisson es que la media y la variancia son iguales.

Cuundo utilizur el modelo de Poisson La distribuci6n de Poisson se em-plea cuando se cuentan los eventos 0 entidades, distribuidos al azar en espacio 0 tiempo. Es facil intuir cuando cierto proceso obedece a la ley de Poisson, y bajo esta suposici6n se puede calcular la ocurrencia de eventos 0 entidades en alguna unidad

1 Por comodidad, la distribuci6n de Poisson se estudia en terminos de intervalos, aunque tambien inter­

(19)

101

4.4 DISTRIBUCION DE POISSON

de espacio 0 tiempo. Por ejemplo, suponiendo que la distribuci6n de alglin parasi­ to entre miembros individuales huespedes sigue la ley de Poisson, y conociendo el parametro A, se puede calcular la probabilidad de que al seleccionar aleatoriamente un huesped individual este produzcax nfunero de parasitos. En el siguiente capitu­ lo se aprendera c6mo decidir si es recomendable suponer que un proceso especffi­ co obedece la ley de Poisson.

Se consideran los siguientes ejemplos que muestran el uso de la distribuci6n de Poisson para el calculo de probabilidades:

FJEMPLO 4.4.1

En un estudio de suicidas, Gibbons et al. (A-4) encontraron que la distribuci6n men­ sual de adolescentes suicidas en el condado de Cook, Illinois, entre 1977 y 1987 sigui6 una distribuci6n de Poisson con parametro A 2.75. Encuentre la probabili­ dad de que un mes seleccionado aleatoriamente sea uno en el que ocurri6 el suici­ dio de tres adolescentes.

Solucion: Con la ecuaci6n 4.4.1 se encuentra que la respuesta es: e-2.75 2.753 (.063928)(20.796875)

P ( X = 3 ) = : : : : .221584

3! 6

FJEMPLO 4.4.2

En referencia al ejemplo 4.4.1, suponga que eI suicidio futuro de adolescentes en la poblaci6n analizada seguira una distribuci6n de Poisson. ~Cual es la probabilidad de que un mes seleccionado aleatoriamente sea uno en eI que ocurriran tres 0 cuatro suicidios?

Solucion: Puesto que los dos eventos son mutuamente exduyentes, se utiliza la regIa de la adici6n: e-2.75 2.754 P(X =3) +P(X

=

4) = .221584+--­ 4!

.221584 + .152338 = .373922

En los ejemplos anteriores las probabilidades se evah1an directamente con la ecua­ ci6n. Sin embargo, se puede utilizar la tabla C del apendice; en ella se encuentran las probabilidades acumuladas para varios valores de A y X.

FJEMPLO 4.4.3

Durante eI estudio de cierto organismo acuatico, se tom6 un gran numero de mues­ tras de una laguna, y se cont6 eI numero de organismos en cada muestra. EI nume­ ro promedio de organismos encontrados por muestra fue de dos. Suponga que el numero de organismos sigue una distribuci6n de Poisson, y calcule la probabilidad de que la pr6xima muestra que se tome tenga un organismo 0 menos.

Solucion: En la tabla C se aprecia que cuando A

=

2, la probabilidad de que X S; 1

(20)

E,JEMPLO 4.4.4

Consulte el ejemplo 4.4.3 y calcule la probabilidad de que la siguiente muestra tenga exactamente tres organismos.

Solucion: P(X ~ 312) P(X ~ 3) - P(X ~ 2) .857 - .677 := .180

E,JEMPLO 4.4.5

Consulte el ejemplo 4.4.3 y encuentre la probabilidad de que la siguiente muestra tenga mas de cinco organismos.

Solucion: Puesto que el conjunto de mas de cinco organismos no inc1uye cinco, la

pregunta se refiere a la probabilidad de observar seis 0 mas organismos. La respuesta se obtiene al restar la probabilidad de observar cinco 0 me­ nos (organismos) de 1. Esto es:

P(X> 512):= 1 P(X~ 5):= 1 .983:= .017

Datos:

Cl: 0 1 2 3 4 5 6

Gaja de dialogo: Comandos de la sesi6n:

Calc> Probability Distributions> Poisson MTB SUBC> > PDF Cl; Poisson .70.

Seleccionar Probability. Tec1ear .70 en Mean. Seleccionar Input column y teclear Cl. Clk OK.

Resultados:

Probability Density Function Poisson with mu

=

0.700000 x P(X = x) 0.00 0.4966 1.00 0.3476 2.00 0.1217 3.00 0.0284 4.00 0.0050 5.00 0.0007 6.00 0.0001

.FIGURA 4.4.1 Cileulo efectuado por el paquete MINITAB de la probabilidad de Poisson

(21)

EJERCICIOS 103 Muchos paquetes de software estadisticos calculan las probabilidades de Poisson, y para este prop6sito se utiliz6 el paquete MINITAB. Suponga que se quiere encon­ trar la probabilidad individual para x desde x 0 hasta x = 6, cuando 'A = .7. Se meten los datos de x en la columna 1 y se procede como se muestra en la figura 4.4.1. Se obtienen las probabilidades acumuladas para los mismos valores de x y A. como se muestra en la figura 4.4.2.

EJERCICIOS

4.4.1 Suponga que se sabe que en cierta area de una gran ciudad el numero promedio de ratas por

manzana es de cinco. Suponga que el numero promedio de ratas sigue una distribuci6n de Poisson, y calcule la probabilidad de que en una manzana elegida aleatoriamente:

a) Existan exactamente cinco ratas. b) Existan mas de cinco ratas. c) Existan menos de cinco ratas.

d) Existan entre cinco y siete ratas, inclusive.

Datos:

Cl: 0 1 2 3 4 5 6

Caja de dialogo: Comandos de la sesi6n:

Calc> Probability Distributions> Poisson MTB > CDF Cl;

Seleccionar Cumulative probability. Teclear .70 SUBC> Poisson .70. en Mean. Seleccionar Input column y teclear Cl.

Clic OK. Resultados:

Probability Distribution Function

Poisson with mu

=

0.700000 x P(X = x) 0.00 0.4966 1.00 0.8442 2.00 0.9659 3.00 0.9942 4.00 0.9992 5.00 0.9999 6.00 1.0000

FIGURA 4.4.2 Calculo efectuado par el paquete MINITAB de la probabilidad de Poisson

(22)

4.4.2 Suponga que en un periodo de varios aftos el nfunero promedio de muertes por cierta enfer­ medad no contagiosa es de 10. Si el numero de muertes por esa enfermedad sigue la distri­ buci6n de Poisson, emil es la probabilidad de que durante el ano en curso:

a) Exactamente siete personas mueran por esa enfermedad b) Diez 0 mas personas mueran por esa enfermedad

c) No haya muertes por esa enfermedad

4.4.3 Si el numero promedio de accidentes graves por ano en una fibrica grande (donde el nfunero de empleados es constante) es de cinco, calcule la probabilidad de que en el ano en curso haya: a) Exactamente siete accidentes b) Diez 0 mas accidentes

c) Cero accidentes d) Menos de cinco accidentes

4.4.4 En un estudio sobre a la efectividad de un insecticida contra cierto insecto, se fumig6 una gran area de tierra que, mas tarde, se examin6 por cuadrantes elegidos aleatoriamente y en la que se cont6 el numero de insectos vivos por secci6n. Experiencias previas han demostra­ do que el numero promedio de insectos vivos por cuadrante, despues de fumigar, es de .5. Si el numero de insectos vivos por secci6n sigue una distribuci6n de Poisson, emil es la probabi­ lidad de que cierto cuadrante elegido tenga:

a) Exactamente un insecto vivo b) Cero insectos vivos c) Exactamente cuatro insectos vivos d) Uno 0 mas insectos vivos

4.4.5 En cierta poblaci6n, cada ano se diagnostica un promedio de 13 nuevos casos de cancer esofagico. Si la incidencia anual de este tipo de cancer sigue una distribuci6n de Poisson, calcule la probabilidad de que en un ano determinado el numero de nuevos casos diagnosti­ cados de cancer sea:

a) Exactamente 10 b) AI menos ocho

c) No mas de 12 d) Entre nueve y IS, inclusive e) Menos de siete

4.5

DISmmUCIONES DE

PROBABHIDAD CONTINUA

Las distribuciones de probabilidad consideradas hasta aqui, binomial y de Poisson, son distribuciones de variable discreta. Ahora se consideran las distribuciones de variable aleatoria continua. En el capitulo 1 se dijo que una variable continua es aquella que puede asumir cualquier valor en un intervalo espedfico de valores. Consecuentemente, entre cualesquiera dos valores asumidos por la variable conti­ nua existe un m1mero infinito de valores.

Para comprender, la naturaleza de la distribuci6n de una variable aleatoria continua, considere los datos presentados en la tabla 1.4.1 yen la figura 2.3.2. En la tabla hay 169 valores para la variable aleatoria edad. EI histograma de la figura 2.3.2 esta construido con puntos espedficos localizados sobre una linea, que repre­ senta la medici6n de interes y que forma una serie de rectangulos, cuyas bases son las distancias entre dos puntos espedficos, sobre la linea y cuyas alturas representan el numero de val ores de la variable que caen entre los dos puntos especificados. Los intervalos delimitados por cualquier par de puntos especificados consecutivos se llaman intervalos de clase.

(23)

105 4.5 DISTRIBUCIONES DE PROBABILIDAD CONTINUA

fIx)

x

FIGURA 4.5.1 Histograma resultante de un gran numero de valo­ res y c1ases de intervalos pequenos.

Como se estudi6 en el capitulo 2, las subareas del histograma corresponden a las frecuencias de ocurrencia de los valores de la variable entre los lfmites de la esc ala horizontal de esas subareas. Esto proporciona un metodo para calcular la frecuen­ cia relativa de ocurrencia de valores entre dos puntos especfficos; tan s610 es nece­ sario determinar la proporci6n del area total del histograma que se encuentra entre los puntos especificados. Esto se puede hacer mas convenientemente consultando las columnas de frecuencia relativa 0 frecuencia relativa acumulada en la tabla 2.3.2. Imagine ahora una situaci6n donde el numero de valores de la variable aleatoria es muy grande y la amplitud de los intervalos de clase es muy pequefia. EI histograma resultante seria como el que se muestra en la figura 4.5.1.

Si se conectan los puntos medios de las celdas del histograma en la figura 4.5.1 para formar un poligono de frecuencia, se obtendra una figura mas suave que el polfgono de frecuencia de la figura 2.3.4.

En general, cuanto mas se aproximan a infinito el numero de n observacio­ nes, y la amplitud de los intervalos de clase se aproximan acero, el polfgono de frecuencia se aproxima a una curva mas suave como la que se muestra en la figura 4.5.2. Estas curvas suaves se utili zan para representar gnlficamente las distribucio­

fIx)

(24)

fIx)

a x

FIGURA 4.5.3 Gratica de una distribuci6n continua que muestra el area entre a y b.

nes de las variables aleatorias continuas. Esto tiene algunas consecuencias imp or­ tantes cuando se trabaja con distribuciones de probabilidad. Primero, el area total bajo la curva es igual a uno, como 10 es para el histograma, y la frecuencia relativa de ocurrencia de los valores entre dos puntos especfficos cualesquiera, sobre el eje de las x, es igual al area total delimitada por la curva, el eje de las x y las rectas perpen­ diculares levantadas sobre ambos puntos del eje de las x, tal como 10 muestra la figura 4.5.3. La probabilidad de cualquier valor especifico de la variable aleatoria es cera. Esto es logico, puesto que un valor especffico se representa como un punto sobre el eje de las x y el area por encima de ese punto es cero.

COIRO encontrar el area bajo la curva En un histograma, seg(tn se ha visto, las subareas de interes se calculan sumando areas representadas por las co­ lumnas (celdas). En el caso de una curva, esta no presenta celdas, por 10 que se debe buscar un metodo para calcular las subareas. Este metodo es suministrado por el cileu­ 10 integral. Para calcular el area bajo la curva entre dos puntos cualesquiera a y b, se integra lafunci6n de densidad de a a b. Unafunci6n de densidad es una formula em­ pleada para representar la distribuci6n de una variable aleatoria continua. La inte­ gracion es el caso lfmite de la sumatoria, aunque aqui no se efectua ninguna integracion, puesto que las materna tic as involucradas estan mas aHa del alcance de este Iibro. Tambien, como se ve mas adelante, para todas las distribuciones conti­ nuas a considerar existe una forma mas fadl para calcular el area bajo la curva.

Aunque la definicion de distribucion de probabilidad para una variable aleatoria continua esta implfcita en el estudio anterior, a modo de resumen se pre· senta como sigue en forma mas concreta.

DEFINICION

A una funci6n no negativaf(x) se Ie llama distribucion de probabilidad (tambien llamada, algunas veces, funci6n de densidad de probabilidad) para la variable aleatoria continua X, si el area total deliInitada por su curva y el eje de las x es igual a 1 y si la subarea delimitada por la curva, el eje de las x, y por las lineas perpendiculares levantadas sobre dos puntos cualesquiera a y b da la probabilidad de que X este entre los puntos a y b.

(25)

4.6 DISTRIBUCI6N NORMAL

107

4.6

DISTRIBUCION NORMAL

A continuaci6n se estudia la distribuci6n mas importante en toda la estadistica: la distribucwn normal. La f6rmula para esta distribuci6n fue publicada por Abraham De Moivre (1667-1754) el 12 de noviembre de 1733. Muchos otros matem:hicos destacan en la historia de la distribuci6n normal, induyendo a Carl Friedrich Gauss (1777-1855). A esta distribuci6n frecuentemente se Ie llamadistribuciOn de Gauss como reconocimiento a las contribuciones de este matematico.

La densidad normal esta dada por

/20')

oo<X<oo

f(X) = (4.6.1)

En la ecuaci6n 4.6.1, 1t Yeson constantes conocidas, 3.14159 ... y 2.71828 .. " respectivamente, que se utilizan con frecuencia en matematicas. Los dos parametros de la distribuci6n son: ~, la media, y (J la desviaci6n est;indar. Para el objetivo de esta secci6n se puede pensar que ~y (J son medidas de tendencia central y disper­ si6n para la distribuci6n normal, respectivamente, tal como se estudia en el capitu­ lo 2. Sin embargo, debido a que la variable aleatoria distribuida normalmente es continua y toma valores entre 00 y

+ "",

su media y desviaci6n estandar se pueden

definir de manera mas rigurosa, aunque estas definiciones no pueden darse sin utilizar el calculo. La grafica de la distribuci6n normal produce la ya conocida cur­ va en forma de campana, tal como se muestra en la figura 4.6.1.

Caracleristicas de la distribuci6n normal Las siguientes caracteristicas son las mas importantes para la distribuci6n normal.

1. Es simetrica respecto a su media)1. Tal como se muestra en la figura 4.6.1, la curva hacia cualquiera de los lados de ~es una imagen de espejo de la del otro lado.

2. La media, la mediana y la moda son todas iguales.

3. EI area total bajo la curva sobre el de las x es una unidad de area. Esta caracterfstica se deduce del hecho de que la distribuci6n normal es una distri­ buci6n de probabilidad. Debido a la simetria mencionada anteriormente, 50

x JL

(26)

por ciento del area esta a la derecha de la perpendicular levantada sobre Ia

media, y el otro 50 por ciento dellado izquierdo.

4. Si se levantan perpendiculares a una distancia de una desviaci6n est<indar des­ de la media hacia ambos lados, el area de1imitada por esas perpendiculares, eI eje de las x y la curva sera de 68 por ciento del area total, aproximadamente. Si los lfmites laterales se extienden ados desviaciones estandar en ambos lad os de la media, estara induido aproximadamente 95 por ciento del area, y extendiendolos a una distancia de tres desviaciones esrandar, aproximada­ mente 99.7 del area total estara englobada. Las areas aludidas se muestran en la figura 4.6.2. ,u-1u,u,u+1u x (a) .025 ,u .025 x (b) .0015 .0015 ,u-3u ,u ,u+ 30' x {el

FIGURA 4.6.2 Subdivision del area bajo la curva normal

(27)

109 4.6 DISTRIBUCION NORMAL

x

FIGURA 4.6.3 Tres distribuciones normales con diferente media, pero con la misma va­

riabilidad.

5. Los parametros J..l y cr determinan completamente la distribuci6n normal. En otras palabras, por cada valor diferente de J..l y cr se especifica una distribuci6n normal distinta. Los valores diferentes de J..l desplazan la grafica de la distribu­ ci6n a 10 largo del eje de las x, tal como se muestra en la figura 4.6.3. Los valores de cr determinan el grado de aplanamiento 0 levantamiento de la grafica de la distribuci6n, tal como se muestra en la figura 4.6.4.

DistribuciOn normal esttindar La ultima caracteristica mencionada de la distribuci6n implica que la distribuci6n normal es realmente una familia de dis­ tribuciones en la que un miembro se distingue de otro seglin los valores de J..l y cr. EI miembro mas importante de esta familia es la distribucion normal estdndar 0 distribucion normal unitaria, Hamada as! en ocasiones porque tiene una media igual a cero yuna desviaci6n estandar igual a 1. Esta distribuci6n se puede obtener a partir de la ecuaci6n 4.6.1, creando una variable aleatoria z = (x - J..l )/cr. La ecuaci6n para la distribuci6n normal estandar se escribe:

/2, _ 00 < z < 00

(4.6.2)

x

FIGURA 4.6.4 Tres distribuciones normales con diferente desviaci6n estandar pero con

(28)

FIGllRA 4.6.5 Distribuci6n normal estindar.

La grafica de la distribuci6n normal estandar se muestra en la figura 4.6.5. Para calcular la probabilidad de que

z

tome un valor entre dos puntos cuales­ quiera sobre el eje de las z, por ejemplo Zo y se debe calcular el area delimitada por las perpendiculares levantadas en esos puntos, la curva y el eje horizontal. Tal como se mendon6 anteriormente, las areas bajo la curva de una distribuci6n conti­ nua se calculan integrando la funci6n entre dos valores de la variable. Entonces, en el caso de la normal estandar, para calcular directamente el area entre Zo Yz,' es necesario calcular la siguiente integral:

r~-Z'f2dz

zo&

Afortunadamente, no hay nada que ver con las integrales porque existen tablas disponibles en las que se puede consultar el resultado de todas las integraciones que aqul puedan necesitarse. La tabla D, del apendice, es un ejemplo de estas ta­ bIas. En el cuerpo de Ia tabla D se encuentran las areas bajo la curva entre O<:J y los

valores de z mostrados en Ia columna izquierda de la tabla. EI area sombreada de Ia figura 4.6.6 representa el area que aparece como Iista en la tabla, para los valores entre O<:J y zo' donde Zo es el valor espedfico de z.

Ahora, con los siguientes ejemplos se muestra el uso de la tabla D.

(29)

111 4.6 DISTRIBUCION NORMAL

EJEMPLO 4.6.1

Dada la distribucion normal estandar, calcular el area bajo la curva, arriba del eje z, entre z = - 00 y z = 2.

Soluci6n: Resulta utH dibujar la grafica de la distribudon normal estandar y som­ brear el area que se pide tal como se muestra en la figura 4.6.7. Si se localiza z 2 en la tabla D y se lee el valor correspondiente en el cuerpo de la tabla, se encuentra que el area solicitada es .9772. Esta area se puede interpretar de diferentes formas: como la probabilidad de que una z elegida aleatoriamente de entre una pobladon de val ores de z este entre - 00 y 2, como la frecuencia relativa de ocurrenda (0 pro­

pordon) de valores de z entre -ooy 2, 0 bien se puede decir que 97.72 por ciento de los valores de z estan entre 00 y 2. •

o

2 z

FIGUR-\' 4.6.7 Distribuci6n normal estandar que muestra el

areaentrez = coy z = 2.

EJEMPLO 4.6.2

~Cual es la probabilidad de que una z, tomada al azar de entre los valores de z, este entre -2.55 y

+

2.55?

Soluci6n: La figura 4.6.8 muestra e 1 area que se pide. En la tabla D se da el area entre 00 y 2.55, que se obtiene localizando el valor de 2.5 en la prime­

ra columna de la izquierda de la tabla y buscando sobre el renglon hasta

o

2.55 x

Curva normal estandar para mostrar P(-2.55 < z < 2.55). -2.55

(30)

eneontrar la entrada de la columna eneabezada por 0.05. EI area es de .9946. Si se observa la grafiea dibujada es posible apreciar que el area es mayor que la que se pide, por 10 que es neeesario restar de .9946 el area a la izquierda de -2.55. AI consultar la tabla D, esta muestra que el area a la izquierda de -2.55 es .0054. Porlo tanto, la probabilidad que se busea es:

P(-2.55 < z < 2.55) = .9946 - .0054 .9892

Suponga que se pide calcular la probabilidad de que z esta entre -2.55 y 2.55 inclu­ sive. La probabilidad que se pide se expresa como P(-2.55 :s; z ~ 2.55). Como se mencion6 en la seeei6n 4.5, P(z = zo) = 0, entonees, P(-2.55 :s; z :s; 2.55) = P(-2.55

< z < 2.55)

=

.9892.

EJEMPLO 4.6.3

~Cuantos valores de z estan entre -2.74 y 1.53?

Soindon: La figura 4.6.9 muestra e1 area que se pide. En la tabla D se encuentra que el area que esta entre 00 y 1.53 es .9370, y el area entre - 00 y -2.74

es .0031. Para obtener la probabilidad se resta .0031 a .9370. Esto es,

P(-2.74:S; z:s; 2.153) .9370 - .0031 = .9339

-2.74 o 1.53 z

FlGUR!\ 4.6.9 CUIva normal estfuldar para mostrar la pro­

porci6n de los valores de z entre z -2.74 y z 1.53.

EJEMPLO 4.6.4

Dada la distribuci6n normal estandar, calcular P(z ;;:: 2.71).

Soindon: EI area deseada se muestra en la figura 4.6.10. Para obtener el area a la

derecha de z 2.71 se resta el area entre "" y 2.71 de 1. Asi,

P(z;;:: 2.71) = I-P(z:S; 2.71)

=

1- .9966 .0034

(31)

EJERCICIOS

113

o

2.71 z

FIGUM 4.6.10 Distribuci6n normal estindar para mostrar P(z ~ 2.71).

EJEMPLO 4.6.5

Dada la distribuci6n normal estandar, calcule P(.84 S z s2.45).

Soluci6n: EI area que se desea calcular se muestra en la figura 4.6.11. Primero se

obtiene el area entre 00 y 2.45 a Ia que se Ie resta el area entre - 00 y .84.

En otras pa]abras, P(.84 s z s 2.45)

=

P(z s 2.45) P(z s .84) = .9929 - .7995 = .1934

FJERCICIOS

Curva normal esUindar para mostrar P(.84::;; z::;; 2.45).

FIGUM 4.6.11

Dada la distribuci6n normal estandar, calcule: 4.6.1

4.6.2 4.6.3

EI area bajo la curva entre z 0 y z 1.43.

La probabilidad de que una z, sacada al azar, tenga un valor entre z

=

-2.87 Yz

P(z ~ .55). 4.6.4 pez 2: - .55).

(32)

4.6.5 P(Z < -2.33). 4.6.6 P(z < 2.33). 4.6.7 P(-1.96S; Z S; l.!'J). 4.6.8 P(-2.58 $ Z S; 2.58).

4.6.9 P(-1.65:::; Z S; 1.65). 4.6.10 P(z = .74). Dadas las siguientes probabilidades, calcule Zj:

4.6.11 P(z S; Zj) .0055. 4.6.12 P(-2.67 S; Z S; Zl) =.9718. 4.6.13 P(z>Zj) =.0384. 4.6.14P(zjS;z$2.98)=.11l7. 4.6.15 P(-Zj$ Z S;Zj) .8132.

4.7 APLICACIONES DE DISTRIBUCION NORMAL

Aunque su importancia en el campo de la estadfstica es indiscutible, uno puede darse cuenta de que la distribucion normal no es una ley inherente a todas las caracterfsticas mesurables que ocurren en la naturaleza. Sin embargo, es verdad que muchas de estas caracterfsticas tienen una distribucion aproximadamente nor­ mal. En consecuencia, aun cuando no existe variable alguna que en la practica se encuentre distribuida con precision, la distribucion normal se puede utilizar como modelopara normalizar la distribucion de muchas variables de interes. Al utilizar la distribucion normal como modelo, es posible establecer afirmaciones de proba­ bilidad mas utiles y mucho mas convenientes para algunas variables que si se utili­ zara un modelo mas complicado. _

La estatura y;la inteligencia humana son consideradas frecuentemente como ejemplos de variables que tienen aproximadamente una distribuci6n normal. En otras palabras, muchas distribuciones importantes para el campo de la salud no se pueden describir correctamente mediante una distribucion normal.Sin embargo, si se sabe que la variable aleatoria sigue una distribucion aproximadamente normal 0, en el caso de ignorarlo, se considera razonable hacer esta suposicion, la distribu­ cion normal es de gran ayuda para el estadfstico en su esfuerzo para resolver pro­ blemas practicos relativos a esa variable. Sin embargo, se debe tener en mente que 10 normal en este contexto se refiere a las propledades estadfsticas para el conjunto de datos, y de ninguna manera implica normalidad en el sentido de condiciones medicas 0 de salud.

Existen varias razonesmas pot las que la distribuci6n normal es muy impor­ tante en estadfstica, las cuales seran consideradas a su debido tiempo. Por ahora, se consider a la forma de responder a preguntas sencillas de probabilidad acerca de variables aleatorias cuando se sabe, 0 es razonable suponer, que estas presentan una distribuci6n aproximadamente normal.

FJEl\IPLO 4.7.1

Como parte de un estudio de la enfermedad de Alzheimer, Dusheiko (A-5) report6 datos que son compatibles con la hip6tesis de que los pesos de los cerebros de las vfctimas de esa enfermedad siguen 4na distribucion normal. A partir de los datos develados, se puede calcular la media de 1076.80 gramos con una desviaci6n estandar de 105.76 gramos. Si se asume que estos resultados son aplicables a todas

(33)

4.7 APLICACIONES DE DISTRIBUCION NORMAL

t15

FIGURA 4. 7.1 De una distribuci6n normal a una distribu­

ci6n aproximada de pesos de los cerebros de pacientes enfer­ mos de Alzheimer (con estimaci6n de media y desviaci6n estandar).

las vfctimas de Alzheimer, encuentre la probabilidad de que una victima selecciQna­ da al azar tengaun c~rebro que pese menos de 800 gramus.

Soludom En la figura 4.7.1 se puede apreciar la gnifita que describe la distribu­

ci6nyel area sQmbreadaque cQrresPQnde a laprQbabilidad sQlicitada. Si la distribuci6n fuera una distribuci6n normal estandar CQn una media de 0 y una desviaci6n estandar de 1, serfa PQsible utilizar la tabla D para eilcQntrar la probabilidad CQn PQCQ esfuerzQ.AfQrtunadamente, es factible para cualquier distribuci6n nQrmaltransfQrmarla CQn facili­ dad en una distribuci6n nQrmal estandar. EstQse IQgra transfQrmandQ tQdus IQS valores de X en IQS valQres cQrrespondientes de z. EstQ significa que la media deX se puedevolver 0, la media de z; Enla figura 4.7.2 se muestran ambas distribuciQnes. Se puede determinar que e1 valor de z,

z -2.62 0

FIGURA 4.7.2 Distrihuci6n normal del peso de los

(34)

por decir ZO' corresponde a una x de 800. Esto se hace con la siguiente formula:

x z=

(j (4.7.1)

que transforma cualquier valor de x en cualquier distribucion normal para los valores ccirrespondientes de z en la distribucion normal estandar. Para este ejemplo se tiene:

z = 800 -1076.80 = -2.62 105.76

Entonces, el valor buscado para Zo es -2.62.

AI ex~ullinar esta relacion minuciosamente, se observa que la distancia de la media, 1076.80, hasta el valor de x, 800, es 800 1076.80 -276.80, que representa una distancia de 2.62 unidades de desviacion est<indar. Cuando se transforman los valo­ res correspondientes al peso del cerebro, la distancia del valor de z desde su media, O,es igual a la distancia del valor x correspondiente desde su media, 1076.80, en unidades de desviacion est<indar. A esto se refiere la distancia anterior de 2.62 uni­ dadesdedesviaci6n est<indar. En la distribuci6n z, uI).adesviacion estandar es igual a 1,. y, en consecuencia, el punto en la escala dez se localiza a una dis.tancia de 2.62 unidades de desviaci6n estandar antes de 0, es decir,

z

-2.62, resultado que se obtiene con la formula. AI consultar la tabla D, se encuentra que el area a la izquier­ da de z= -2.62 es .0044. Se puede resumir este analisis como sigue:

P(x < 800)

=

p(z < 800 1076.80)

=

P(z < -2.62) .0044 105.76

Para responder a la pregunta original, se dice que la probabilidad de que un paciente seleccionado al azar tenga un cerebro que pese mehos de 800 gramos es de .0044.

EJEMPLO 4.7.2

Suponga que se sabe que la estatura de cierta poblacion de individuos sigue una distribuci6n aproximadamente normal con media de 70 pulgadas y una desviaci6n estandar de 3 pulgadas. ~Cual es la probabilidad de que una persona seleccionada al azar de este grupo tenga una estatura entre 65 y 74 pulgadas?

Solucion: En la figura 4.7.3 se muestra la distribuci6n de las estaturas y la distribu­ cion

z

que resulta de transformar los valores originales para determinar las probabilidades deseadas. Se encuentra que el valor z correspondien­ te para una x de 65 es:

65-70 =-1.67 ...•.

z

(35)

117 4.7 APLICACIONES DE DISTRIBUCIONNQRMAL

65 70 x

-1.67

o

1.33 z

FIGURA 4.7.3 Distribuci6n de estaturas (x) y la distribuci6n normal estandar correspondiente (z).

AnaIogamente, para x = 74 se tiene

74-70

=

1.33 z

3

En la tabla D se encuentra que el area entre - 00 y -1.67 es de .0475 y el

area entre - 00 y 1.33 es .9082. El area deseada es la diferencia entre

.9082 .0475 = .8607. En resumen, 74 P(65::; x::; 74 p(65;70< z::; 3 7

°)

P(- 1.67::; z::; 1.33) . P(- 00::; z::; 1.33) -P(- 00::; z::; 1.67) .9082 .0475 .8607

Por 10 tanto, la probabilidad .8607 responde a la pregunta original. •

E,JEMPLO 4.7.3

En una poblacion de 10,000 de las personas descritas en el ejemplo 4.7.2, ~cmintas personas se espera que tengan una estatura de 6 pies y 5 pulgadas 0 mas?

(36)

Soluci6n: Primero se calcula la probabilidad de que una persona, elegida al azar entre esa poblacion, tenga una estatura de 6 pies y 5 pulgadas; esto es,

P(x? 77)

p[

z? 77;70)

=

P(z? 2.33)

=

1- .9901

=

.0099

Se puede esperar que de las 10,000 personas: 10,000(.0099) = 99 ten­ gan una estatura de 6 pies y 5 pulgadas (77 pulgadas) 0 mas. •

Se puede utilizar el paquete MINITAB para calcular la probabilidad normal estandar acumulada. Suponga que se pretende encontrar la probabilidad acumulada para los siguientes valores de z: -3, -2, -1, 0,2 Y 3. Se meten los valores de zen la columna 1 y se procede como se muestra en la figura 4.7.4.

Datos:

C 1: -3 -2 -I 0 1 2 3

Caja de dialogo: Comandos de la sesi6n:

Calc> Probability Distributions> Normal MTB > PDF Cl;

SUBC> Normal

o

1. Seleccionar Cumulative probability. Seleccionar

Input column y teclear Cl. Clic OK.. R.esultados:

. . .

Cumulative Distribution Function

Normal with mean

=

0 and standard deviation = 1.00000 x P{X = x} -3.0000 0.0013 -2.0000 0.0228 -1.0000 0.1587 0.0000 0.5000 LoOOO 0.8413 2.0000 0.9772 3.0000 0.9987

. FIGURA 4.t4 Calculos con el paquete MINITAB de-las probabilidades normales estindar acumuladas.

(37)

EJERCICIOS 119

FJERCICIOS

4.7.1 Suponga que las edades deinicio de cierta enfermedad tienen una distribuci6n aproximadac

mente normal, con una media de 11.5 anos y una desviaci6n estandar de 3 anos. Un nino contrae recientemente la enfermedad. Cual es la probabilidad de que la edad del nino sea: a) Entre 8.5 y 14.5 anos

b) Mas de 10 afios c) Menos de 12

4.7.2 En un estudio de dactilografia, unacaracteristica cuantitativa.muy importante es el total de surcos en los 10 dedos de unindividuo. Suponga que el total de surcos en los dedos de los individuoS'en determinada poblaci6n tienen distribuci6n aproximadamente normal con una media de 140 y una desviaci6n estandar de 50. Calcule la probabilidad de que un individuo, . elegido al azar entre esa poblaci6n, tenga un total de surcos en los dedos:

a) De 200 0 mas b) Menos de 100

c) Entre 100 y 200 d) Entre 200 y 250

e) En una poblacion de 10,000 personas,~Cuantos puede esperarse que tengan un total de 200 surcos 0 mas?

4.7.3 Si la capacidad de la cavidad craneana de una. poblacion tiene una distribuci6n aproximada­ mente normal, con una media de 1400 cc y una desviacion estandar de 125 cc, calcule la probabilidad de que una persona, elegida al azar entre esa poblaci6n, tenga una capacidad de cavidad craneana:

a) Mayor que 1450 cc b) Menor que 1350 cc c) Entre 1300 y 1500 cc

4.7.4. Suponga que el tiempo promedio de permanencia hospitalaria por enfermedad cronica para un tipo de paciente es de 60 dias, con una desviaci6n esmndar de 15. Si es razonable suponer que se tiene una distribuci6n aproximadamente normal para el tiempo de hospita­ lizacion, calcule la probabilidad de que un paciente, elegido aleatoriamente entre ese grupo, tenga una hospitalizacion:

a) Mayor que 50 dias b) Menor que 30 dias

c) Entre 30 y 60 dias d) De mas de 90 dias

4.7.5 Si el nive! total de cole sterol en cierta poblaci6n tiene una distribuci6n aproximadamente normal, con una media de 200 mgl100 m! y una desviaci6n estandar de 20 mg/lOO m!, calcule la probabilidad de que un individuo, elegido al azar de entre esa poblaci6n, tenga un nivel de colestero!:

a) Entre 180 y 200 mg/100 mi b) Mayor que 225 mg/lOO m! c) Menor que 150 mg/lOO ml d) Entre 190 y 210 mg/IOO mi

4.7.6 Dada un:a pobla:cion con distribuci6n normal, con una media de75 y una variancia de 625, calcule:

a) P(50:::; x:s; 100) b) P(x > 90) . c) P(x < 60) d) P(x ~ 85)

Referencias

Documento similar