Tema III
Distribuciones discretas y continuas
En este tema analizaremos dos importantes temas de la inferencia estadística: las distribuciones discretas y las distribuciones continuas. Las distribuciones discretas son aquellas en las que la variable aleatoria puede pude tomar un número determinado de valores. Por ejemplo, el número de trabajadores en cada uno de los departamentos de un centro comercial o el número de automóviles ensamblados por día en la planta Ford de Hermosillo.
Las distribuciones continuas son aquellas que la variable aleatoria puede tomar un número infinito de posibles valores. Por ejemplo, el peso promedio de las bolsas de 1 kg de café mexicano para exportación puede tomar una infinidad de valores en un intervalo (0.995kg, 0.996kg., 09965kg., 0.998 kg., 0.9985 kg, …, 1.001 kg, 1.005 kg, 1.010 kg., etc.). Como se mencionó en el tema II, una tabla, gráfico o expresión matemática que dé las probabilidades con que una variable aleatoria toma diferentes valores, se llama distribución de la variable aleatoria. La inferencia estadística se relaciona con las conclusiones que se pueden sacar acerca de una población de observaciones basándose en una muestra de observaciones. Entonces intervienen las probabilidades en el proceso de la selección de la muestra; en este caso se desea saber algo sobre una distribución con base en una muestra aleatoria de esa distribución. De tal manera vemos que trabajamos con muestras aleatorias de una población que es más grande que la muestra obtenida; tal muestra aleatoria aislada no es más que una de muchas muestras diferentes que se habrían podido obtener mediante el proceso de selección. Este concepto es realmente importante en estadística.
3.1. Distribuciones discretas.
Muchas cuestiones de probabilidad, de gran importancia para los gerentes, comprenden resultados aleatorios numéricos. Por ejemplo, el número de pasajeros que no hacen uso de una reservación en una línea aérea es de suma importancia al fijar las políticas de la empresa en lo relativo a este aspecto. El número de pasajeros que no se presentan es aleatorio, varía de un vuelo a otro, como de un día a otro en el mismo vuelo. El número de pasajeros que no toman el vuelo es una variable numérica, y hablar del número promedio de pasajeros que no se presentaron tiene un sentido muy claro. El concepto de variable aleatoria es la idea central para entender los resultados numéricos aleatorios.
Variables aleatorias discretas.
Para definir el concepto de variable aleatoria discreta, nos basaremos en el siguiente problema: Suponga que se lanzan dos dados sobre una mesa y nuestro objetivo es obtener la probabilidad de que la suma de los puntos en los dados sea 11 o 7. Si suponemos que todos los resultados observados al tirar los dados son equiprobables (tienen la misma posibilidad de salir) entonces el espacio de muestra del experimento, con 36 resultados posibles es
TABLA 3.1 ESPACIO DE MUESTRA DEL LANZAMIENTO DE DOS DADOS.
Como nuestro interés es la suma de los puntos observados, si obtenemos el resultado (4 ,3) le asignamos el valor 7, el cual corresponde a la suma de 4 y 3. Podemos calcular la probabilidad de que la suma sea igual a 7 contando todos los resultados donde la suma es 7 y dividiendo este valor entre el número de casos posibles (36). El evento de que la suma es 7 contiene 6 resultados (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) por lo tanto, la probabilidad de obtener la suma de 7 es 366
61. Podemos repetir el proceso para cada uno de los resultados y obtener la tabla siguiente:TABLA 3.2. DISTRIBUCIÓN DE PROBABILIDAD DE LA SUMA OBSERVADA EN EL LANZAMIENTO DE DOS DADOS.
Resultado 2 3 4 5 6 7 8 9 10 11 12 Probabilidad 36 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1
Hemos encontrado la distribución de probabilidad de los valores posibles de la suma al lazar dos dados si D1 representa el resultado observado en el dado 1 y D2 el resultado que se obtiene en el dado 2, podemos expresar el valor que nos interesa así: X = D1 + D2. Antes de lanzar los dados, no se sabe qué valores se observarán para D1 y D2, por lo tanto tampoco se sabe el valor para X.
El valor que X tomará puede variar de tirada en tirada sujeto a la distribución especificada en la tabla 3.2. Así X es una variable, que asume un número finito de valores sujeto a una distribución de probabilidad. Este es un ejemplo de una variable aleatoria discreta. Otros ejemplos son las variables D1 y D2. En general, si S es un espacio de muestra con una medida de probabilidad P, se define una variable aleatoria como una función que asigna un número real a cada uno de los elementos de S. Es decir, X es una función cuyo dominio es el espacio de muestra S y su rango es el conjunto de los números reales , en la notación usual
X :
S
.Así, por ejemplo X = 7 se interpretará como el evento de que se observó el resultado 7 al tirar los dos dados, esto es el evento (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) ocurrió. Por lo tanto, vemos que P(X = 7) = P( (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) ) = 366
61. Nótese que no obstante de que X es una función, usualmente no se escribe el argumento de la función, es decir, si s es un elemento del espacio de muestra S, en lugar de escribir X(s), sólo escribimos X. Es común denotar las variables aleatorias por letras mayúsculas y los valores que puede tomar por letras minúsculas.En este caso, la variable X puede asumir un valor de entre un conjunto finito de valores posibles. Cualquier variable que pueda tomar un número finito de valores decimos que es una variable aleatoria discreta. También son variables aleatorias discretas aquellas que pueden asumir un número muy grande o infinito de valores que potencialmente podrían ser contados, tal como el número de latas de atún producidas por la empresa Guaymex, el número de clientes que han comprado en las tiendas Mazon desde su apertura, el número de estrellas en el firmamento, el número de hojas en los árboles, el número de granos de arena en Bahía de Kino etc.
1 2 3 4 5 6 1 (1, 1) (1, 2) (1, 3) (1, 4) (1, 5) (1, 6) 2 (2, 1) (2, 2) (2, 3) (2, 4) (2,5) (2, 6) 3 (3, 1) (3, 2) (3, 3) (3, 4) (3, 5) (3, 6) 4 (4, 1) (4, 2) (4, 3) (4, 4) (4, 5) (4, 6) 5 (5, 1) (5, 2) (5, 3) (5, 4) (5,5) (5, 6) 6 (6, 1) (6, 2) (6, 3) (6, 4) (6, 5) (6, 6)
D
a
d
o
1
D a d o 2
Ejercicio 3.1. Dé 6 ejemplos de variables aleatorias discretas. Indique cuáles pueden tomar un número finito de valores
distintos y cuáles un número infinito de valores.
Ejercicio 3.2. Dé 3 ejemplos de variables aleatorias que no sean discretas.
En la tabla 3.2 observamos que a cada valor posible de X, le asignamos un número correspondiente a su probabilidad. De esta forma podemos definir otra función:
f
(
x
)
P
(
X
x
),
para cada número x en el campo de valores de la variable X. Esta función se llama función de probabilidad o distribución de probabilidad de la variable X. Para el ejemplo que estamos tratando de la suma en el lanzamiento de dos dados, los valores de esta función están dados en la tabla 3.3, la cual podemos rescribir utilizando los conceptos estudiados.TABLA 3.3. DISTRIBUCIÓN DE PROBABILIDAD DE LA SUMA OBSERVADA EN EL LANZAMIENTO DE DOS DADOS.
x
2 3 4 5 6 7 8 9 10 11 12)
( x
f
361 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1Ejercicio 3.3. Examine la tabla 3.3 y usa la definición de
f
( x
)
para deducir algunas propiedades de esta función. Podemos observar quef
( x
)
nunca adquiere un valor menor que cero. Esto se debe a quef
( x
)
representa una probabilidad, la cual nunca puede ser negativa. De igual maneraf
( x
)
nunca puede ser mayor que 1. Si sumamos todos los valores que puede tomarf
( x
)
obtenemos 1, debido a que estamos sumando las probabilidades de que la variable aleatoria tome uno de los valores establecidos. Por definición, la función de probabilidad tiene las siguientes características:1.
f
( x
)
0 para todo valor x en el dominio.2.
x
x
f
(
)
1
donde la sumatoria se extiende sobre todos los valores x en el dominio de f.Ejercicio 3.4. Verifica que la función
15
x
x
f
(
)
es una función de probabilidad para x = 1, 2, 3, 4, 5. Indique su dominio y su campo de valores.Ejercicio 3.5. Considera el lanzamiento de 4 monedas al aire. Defina la variable aleatoria Y como el número de sellos
observados. Construya la función de probabilidad de Y.
Ejercicio 3.6. Considera el lanzamiento de dos dados al aire. Defina la variable aleatoria X como la diferencia de los
puntos observados en los dados. Construya la función de probabilidad de X.
Los valores de la función de probabilidad, para el caso “sumar los resultados al lanzar dos dados”, se pueden representar en una gráfica como lo muestra la Figura3.1.
Figura 3.1. Histograma de probabilidad de x.
La probabilidad de observar un valor particular de la variable aleatoria, por ejemplo X = 4 está dado por la altura de la barra sobre el 4, es decir
4
1210
08
3
36
3
.
)
(
X
P
. De manera similar, en lugar de asociar la altura de la barra con la probabilidad, podemos ver que el área de la barra sobre el 4 es1
1210
08
3
36 3 36 3
.
, ya que la altura de la barra es de 1210
08
3
363
.
y su ancho es 1. Utilizar el área de las barras para representar la probabilidad es muy útil para extender la noción de probabilidad a otras variables.Ejercicio 3.7. Encuentre las siguientes probabilidades: P( X = 11 ), P( X < 5 ), P( X 6 ), P(X 4.5) y P(X = 7.3) para el ejemplo anterior.
Podemos usar el histograma de probabilidad para calcular probabilidades tal como P( X 5 ). Vemos que P(X 5 ).= P(X = 2 ó X = 3 ó X = 4 ó X =5) = P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5), ya que los eventos donde X = 2, X = 3, X =
4 y X = 5 son disjuntos o ajenos, se tiene que P(X 5 ).= 361
362
363
364
1036, que se obtiene sumando las áreas de las barras que están sobre el 5 y a su izquierda. Se debe ser muy cuidadoso con las desigualdades ya que P(X 5 ).=18 5 36 10
, mientras que P( X < 5 ) = 6 1 36 6
.Si extendemos la idea de probabilidades acumulativas, podemos definir otra función partiendo de la distribución de probabilidad. Si X es una variable aleatoria discreta, definimos la función de distribución de X o función acumulativa
de X de la manera siguiente:
F(x) = P(X
x ) =
para
x t
t
f
(
)
x
Ejercicio 3.8. Calcule la función de distribución acumulativa de la suma de los puntos de dos dados.
Ejercicio 3.9. Use las propiedades de la función de probabilidad para encontrar algunas propiedades de la función de
distribución acumulativa.
La tabla 3.4 presenta la función de distribución acumulativa del resultado observado al tirar dos dados.
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 P ( X = x)
Valor observado de la variable x
TABLA 3.4. FUNCIÓN DE DISTRIBUCIÓN ACUMULATIVA DEL TOTAL OBSERVADO AL TIRAR DOS DADOS.
x
2 3 4 5 6 7 8 9 10 11 12)
( x
F
361 36 3 36 6 36 10 36 15 36 21 36 26 36 30 36 33 36 35 36 36De esa tabla podemos deducir algunas propiedades. Por ejemplo, observamos que
F(4)
F(5), es decir si el valor en
que se evalúa la función es mayor, el valor de la función también será mayor.Ejercicio 3.10. ¿Esta propiedad es siempre cierta? Examine que sucede con
x
= 5,x
= 6 y con x5.7.A pesar de que el valor de la función de la distribución acumulativa para
x
= 5.7 no está incluida entre los valores en la tabla, podemos utilizar la definición para obtenerlo F(x) = P(X x ), así F(5.7) =
P(X 5.7 ). Cuando escribimos esta
última probabilidad nos preguntamos ¿cuál es la probabilidad de observar que el total de puntos de dos dados es menor o igual que 5.7? Por la naturaleza del experimento, vemos que no es posible observar valores distintos a 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, por esta razón los resultados que pueden observarse y que son menores o iguales a 5.7 son 2, 3, 4, 5, se tiene que, F(5.7) = P(X 5.7) =
F(5) = 1036
185 .Esto demuestra que la propiedad que habíamos visto antes, en la que establecimos que si a y b son dos números reales con a b entonces F(a) F(b) no siempre es cierta. La que si es cierta es que si tenemos dos números reales a y b, tal que a b entonces F(a) F(b). Por la definición de probabilidad y por esta propiedad, vemos que el valor más grande que puede tener F(x) es 1 y el valor más pequeño de esta función es 0. Hagamos un resumen de las propiedades encontradas.
1. F(-) = 0 2. F() = 1
3. Si a y b son números reales a b, entonces F(a) F(b). Esto significa, en el lenguaje matemático, que F es una función no decreciente.
4. F(x) es una función continua por la derecha: si a es un número real, entonces
F
(
x
)
F
(
a
)
a
x
lim
.
La gráfica de F(x) parece una escalera tal y como se muestra en la Figura3.2. Podemos observar la razón por la cual esta gráfica debe ser de esta manera si examinamos los valores de la función de distribución en un intervalo tal como [6, 7]. Vemos que F(6) = 3615 si escogemos un número
x
mayor que 6, pero menor que 7, tenemos que F(x
) = 3615. Sin embargo, al evaluar la función enx
= 7 vemos que F(7) = 3621
127 , por esta razón la gráfica muestra un salto en ese punto. También podemos notar que el tamaño del salto en x = 6 nos dice la probabilidad de X = 7. Para valores dex
entre 6 y 7 (sin incluir el 7) tenemos que F(x
) = 3615, como habíamos visto y luego F(7
) = 3621, así el tamaño del salto enX = 6
es6 1 36 6 36 15 36
21
.
Este último valor es la probabilidad de que el total de puntos en dos dados, X sea igual a 7, es decir,P(X = 7) = 61.
Visto de otra manera, P(X = 7) = P(X 7) P(X 7). Esto es igual a P(X 7) P(X 6) = 3621
3615
366
61. En
general, el tamaño del salto de la función de distribución en un valor particular, nos da la probabilidad de que la variable aleatoria sea igual a ese valor.Ejercicio 3.11. Utilice la función de distribución para encontrar P(X = 9.8)
Valor esperado de variables aleatorias discretas.
Sea
X
una variable aleatoria con función de probabilidadf
( x
),
entonces el valor esperado deX
es.
)
(
)
(
xx
f
x
X
E
Ilustremos esta fórmula mediante dos ejemplos.Ejemplo 3.12. Si
X
es el número de puntos obtenidos al lanzar un dado de seis caras, obtenemos el valor esperado de la variable aleatoriaY
X
2.La función de probabilidad de
X
esf
( x
)
16 six
1,2,3,4,5,6
.
La función de probabilidad de 2X
Y
es entoncesf
( y
)
61 siy
1,4,9,16,25,36
,
así
. ) (Y P x1 4P x2 9P x3 16P x4 25P x5 36P x6 E 36 6 1 25 6 1 16 6 1 9 6 1 4 6 1 1 6 1 ) ( Y E1P(X 1)22P(X 2)32P(X 3)
42P(X 4)52P(X 5)62P(X 6)
(
)
.
xx
X
P
x
2Ejemplo 3.11.2 Si
X
es una variable aleatoria que tiene función de probabilidadf
( x
)
61 si
2,-1,0,1,2,3
x
yY
X
2. La función de probabilidad deY
esf
( y
)
26 si y
1,4 yf
( y
)
61 si
0, 9 . y Entonces ( ) 9. 6 1 0 6 1 4 6 2 1 6 2 Y. ) ( 9 6 1 0 6 1 4 6 2 1 6 2 Y E 1P(Y 1)4P(Y 4)0P(Y 0)9P(Y 1) 12P(X 1 ó X 1)22P(X 2 ó X 2)02P(X 0)32P(X 3). 12P(X 1)(1)2P(X 1)22P(X 2)(-2)2
P
(
X 2) + 02P(X 0)32 P(X 3).
(
)
.
xx
X
P
x
2A través de estos ejemplos, e visualiza que no es necesario calcular la función de probabilidad de
Y
, sólo se tiene que usar la función de probabilidad deX
y los valores obtenidos al aplicar la funciónY
g
(
X
)
X
2.
Esto es cierto aún en el caso en que la función no es uno a uno. Esto conduce al teorema siguiente cuya prueba se omite.Nota. Todas las demostraciones de los teoremas se omitirán, por no estar dentro de los intereses de este texto.
Teorema 3.1. Si
X
es una v. a. discreta yf
( x
)
es su función de linealidad,Y
g
( X
)
es una función a valores reales, es decir,Y
es una variable aleatoria, entonces su valor esperado es x x f x g x g E Y E( ) ( ( )) ( ) ( ).
En particular se puede utilizar este teorema en el caso especial en que la función
g
( X
)
es lineal, es decir,
)
(
X
aX
b
g
Y
dondea
,
b
.
Así se obtiene xb P X x x ax b P X x xax P X x b aX E Y E( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) aE(X) b. xP X x b xxP X x a
Este resultado nos lleva al siguiente teorema.
Teorema 3.2. Si a y b son constantes reales y
g
(
X
)
aX
b
es una función a valores reales, entonces.
)
(
)
(
aX
b
aE
X
b
E
Corolario 3.1. Si a es una constante real, entonces
E
(
aX
)
aE
(
X
).
Corolario 3.2. Si b es una constante real, entonces
E
(
b
)
b
.
Teorema 3.3. Si
c
1,
c
2,
,
c
n son constantes reales, yg
1(
X
),
g
2(
X
),
,
g
n(
X
),
son funciones reales de X, entonces
n i i i n i i ig
X
c
E
g
X
c
E
1 1))
(
(
)
(
Existen casos especiales de la función
g
( X
)
las cuales requieren más atención. En nuestro caso, nos interesa el comportamiento deE
(
g
(
X
))
cuandog
(
X
)
X
r para r = 0, 1, 2, 3,... . La expresión(
r)
X
E
se conoce como elerrésimo momento de X alrededor del origen de la variable aleatoria X. Se tiene que
E
(
X
)
x
f
(
x
).
x r
r
El primer momento
E
( X
)
se conoce como la media (poblacional) de la variable aleatoria X y se indica usualmente por la letra griega
(se lee mu ),
E
( X
).
Otros momentos nos permiten describir la forma de la distribución de X. Elerrésimo momento de X alrededor de la media es
x r rx
f
x
X
E
(
)
(
)
(
),
para r = 0, 1, 2, ...El segundo momento alrededor de la media es de gran interés en estadística y se conoce como la varianza (poblacional) de la variable X. La varianza se denota a menudo mediante la letra griega
(sigma minúscula) elevada al cuadrado:
(
))
2
(
)
2
.
2
E
X
E
X
E
X
Su raíz cuadrada positiva,
, se conoce como la desviación estándar (poblacional) de X.Frecuentemente es más fácil calcular la varianza a partir del primer y segundo momento alrededor del origen.
Teorema 3.4.
Var
(
X
)
2
E
(
X
2)
E
(
X
)
2
E
X
2
2.
Teorema 3.5. Si X es una variable aleatoria con varianza
2,
entonces.
)
(
)
(
2 2 2Var
Var
aX
b
a
X
a
La varianza es un valor muy útil para estudiar la distribución de una variable aleatoria. En particular, nos ofrece información sobre la probabilidad de observar valores extremos de X. Esta relación se establece en el siguiente teorema.
Teorema 3.6. (Teorema de Chebyshev). Si X es una variable aleatoria con varianza
2 y media
, entonces para cualquier constante positiva k, se tiene que
21
1
k
k
X
P
.
3.1.1. Distribuciones discretas más comunes.
En el estudio de las variables aleatorias, por lo general nos interesan las probabilidades de que puedan tomar diversos valores posibles, es decir, sus distribuciones de probabilidad, en esta sección se mencionan las más importantes.
Distribución uniforme discreta.
La variable aleatoria X tiene una distribución uniforme discreta si su función de probabilidad está dada por
1para , , , , ( ,si ). ) ( x x1 x2 x x x i j k x f k x f k i j Donde, k i x X E k i 1 1 ) ( y k x k i i 1 2 1 2
) ( Las aplicaciones de las variables aleatorias distribuidas uniformemente se encuentran en el desarrollo de las loterías y otras formas de juegos de azar; en la generación de números aleatorios para experimentos de ingeniería o de simulación y en la evaluación de “probabilidades previas” de una persona en relación con el resultado de algún evento futuro para la toma de decisiones.
Ejemplo 3.10. La probabilidad de que en el lanzamiento de un dado legal aparezca un 5 es 61 y , es la misma que la probabilidad de obtener un 3, o un 7, o un 2, etc.
Ejercicio 3.12. El número de productos empaquetados por un trabajador en una hora oscilan entre 10 a 18 unidades y se
piensa que están distribuidos uniformemente. ¿Cuál es la probabilidad de que se empaqueten entre 12 y 15 productos en una hora determinada?
Distribución Bernoulli
A esta distribución también se le conoce como binomial punto. Si una variable aleatoria discreta X sólo tiene dos valores posibles, como sucede por ejemplo en experimentos en los que sólo existen dos resultados posibles, fracaso o éxito, se le asigna 0 a fracaso y 1 a éxito; si le llamamos p a la probabilidad de éxito, la probabilidad de fracaso es 1- p, que generalmente se le llama q, por lo que la densidad de X es:
f(x)q, x0
p, x1
= 0 de otro modo.
Esta función se puede resumir de la manera siguiente:
1 , 0 para p) -(1 ) (x px 1-x x f
Cualquier variable aleatoria discreta X, cuya densidad se ajuste a esta patrón, se dirá que se distribuye Bernoulli, con parámetro p, denotándose esto por:
Ejemplo 3.11.. La probabilidad de que un presunto cliente elegido aleatoriamente realice una compra es 0.20. Por lo
tanto, la probabilidad de que el cliente elegido no realice la compra será de 1 – 0.20 = 0.80.
Distribución Binomial.
La distribución binomial es una distribución de probabilidad discreta, aplicable cada vez que suponga que un proceso de muestreo conforma un proceso de Bernoulli. Un proceso de Bernoulli es un proceso de muestreo en el cual:
i) Hay dos resultados posibles mutuamente excluyentes en cada ensayo u observación. Estos resultados obtenidos se denominan éxito y fracaso.
ii) La serie de ensayos u observaciones constituyen evento independientes.
iii) La probabilidad de éxito, designada por p, permanece constante de ensayo a ensayo. Es decir, el proceso es estacionario
En una distribución Binomial, se realizan n repeticiones independientes de un experimento de Bernoulli. La variable X representa el número de éxitos obtenidos en las n repeticiones. Nos preguntamos sobre la probabilidad de obtener x éxitos en las n repeticiones, así, la función de probabilidad es:
). ( . , , , , ) ( ) ( ) (X x f x k Cxnpx p n x x n np np p P 1 1 2
y
2 1Ejemplo 3.12. Suponga que un lote de 300 fusibles eléctricos contiene 5% defectuosos. Determine la probabilidad de
que se pueda encontrar al menos un fusible defectuoso en una muestra de cinco fusibles.
Solución. Es pertinente suponer que X, número de fusibles defectuosos observados, tenga aproximadamente una
distribución binomial debido a que el lote es grande. Así
P(al menos uno defectuoso) = 5
0 5 1 ) 0 ( 1 p q
1
0.95
5 10.7740.226obsérvese que existe una probabilidad bastante grande de obtener al menos uno defectuoso, aunque la muestra sea relativamente pequeña.
Ejercicio 3.13. Muchos jefes se dan cuenta de que algunas personas que contrataron no son lo que pretenden ser.
Detectar personas que solicitan un trabajo y que falsifican la información en su solicitud ha generado un nuevo negocio: agencias investigadoras de antecedentes. Una revista nacional, notificó sobre este problema mencionando que una agencia, en un periodo de dos meses, encontró que el 35% de los antecedentes examinados habían sido alterados. Supóngase que usted ha contratado la semana pasada a cinco nuevos empleados y que la probabilidad de que un empleado haya falsificado la información en su solicitud de trabajo es 0.35. ¿Cuál es la probabilidad de que al menos una de las cinco solicitudes haya sido falsificada?
Distribución Geométrica.
Se efectúan tantas repeticiones independientes de un experimento de Bernoulli como sean necesarias para obtener el primer éxito. Si la probabilidad de éxito es p, la de fracaso es 1 - p, entonces la función de probabilidad de X, el número de repeticiones hasta observar el primer éxito es:
,
,
,
,
)
(
)
(
)
(
X
x
f
x
p
p
1
p
1x
1
2
3
P
x Su valor esperado es p X E( ) 1 y su varianza es igual a 2 2 1 ) ( p p Y V .Una variable aleatoria geométrica no tiene memoria, es decir:
P
(
X
n
m
X
n
)
P
(
X
m
)
:
Utilizando la definición de probabilidad condicional obtenemos:).
/
(
)
(
/
,
(
)
(
X
n
m
X
n
P
X
n
m
X
n
P
X
n
P
X
n
m
P
n
P
Ahora obtenemos el denominador:
n x xp
p
n
X
P
n
X
P
1 11
1
1
(
)
(
)
)
(
1 01
1
1
1
1
1
n x n xp
p
p
p
p
(
)
(
)
np )
(
1
Así tenemos que
nnmp
p
p
n
X
P
m
n
X
P
n
X
P
n
X
m
n
X
P
)
(
)
(
)
(
)
(
)
(
/
,
(
1
1
1).
(
)
(
p
P
X
m
p
m
11
Ejemplo 3.13. Suponga que la probabilidad de que un motor falle durante cualquier periodo de una hora es p0.02. a) Encuentre la probabilidad de que dicho motor funcione bien durante 2 horas.
b) Halle la media y la desviación estándar de Y.
P(de funcionar bien por dos horas) =
3 3 y x p X P Como
1, 1
y x pP(de funcionar bien por dos horas) =
3 1 y x p = 1pqp10.02
0.98
0.02
0.9604b) Se tiene que la media =
p X E( ) 1 y su varianza es igual a 2 2 1 ) ( p p X V . Así que 50 02 . 0 1 ) (X
E , esto significa que se tendrá que esperar muchas horas hasta que ocurra la primera falla. Por oto lado,
0.02
2,450 02 . 0 1 ) ( 2 2 V X , entonces la desviación estándar de Y es
2,45049.497.Ejercicio 3.14. Se supone que el 30% de los aspirantes para cierto trabajo industrial tiene un entrenamiento avanzado de
programación computacional. Los aspirantes son entrevistados, uno tras otro, y son seleccionados al azar del conjunto de aspirantes.
a) Determine la probabilidad de que se encuentre el primer aspirante con un entrenamiento avanzado en programación en la quinta entrevista.
b)
¿Cuál es el número esperado de aspirantes que hay que entrevistar para encontrar el primer aspirante con un entrenamiento avanzado en programación?Distribución Binomial Negativa.
En esta distribución se hacen tantas repeticiones independientes de un experimento de Bernoulli como sean necesarias para obtener k éxitos. Si la probabilidad de éxito es p, la de fracaso es 1 - p y la función de probabilidad de Y, el número de repeticiones necesarias hasta observar k éxitos es:
, 2 , 1 , , ) 1 ( ) , ( ) ( 1 1 x f x p k p p x k k k X P x k x k k
C
La media de X es p k X E ( ) y la varianza es
2 2 1 ) ( p p k Y V .Ejemplo 3.14. Un estudio geológico indica que un pozo exploratorio, perforado en una región particular, debería manar
petróleo con una probabilidad de 0.20.
a) Encuentre la probabilidad de que el tercer encuentro de petróleo ocurra en el quinto pozo que se perfora.
b)
Halle la media y la desviación estándar.Solución. a) Sea Y el número de la prueba en la cual ocurre el tercer descubrimiento de petróleo, suponiendo
perforaciones independientes con una probabilidad de 0.2 de encontrar petróleo en cualquier paso. Entonces es razonable suponer que Y tiene una distribución binomial negativa con
p
0
.
2
. Así
0.2 0.8 0.0307 2 4 5 5 3 2 p Y P b) Como la media de Y es p k Y E ( ) y la varianza es
2 2 1 ) ( p p k Y V , se tiene que 15 2 . 0 3 p k . Esto indica que se espera perforar 15 pozos antes de que emane petróleo de alguno de ellos y
12 2 . 0 2 . 0 1 3 2 por lo que 123.464.Ejercicio 3.15. Se aplican análisis a los obreros de una empresa que fabrica material aislante, a fin de detectar la
existencia de asbesto en sus pulmones. La fábrica tiene que mandar tres obreros, con indicaciones positivas de asbesto, a un centro médico para realizar más pruebas. Si el 40% de los trabajadores tienen indicaciones positivas de asbesto en los pulmones,
a) Encuentre la probabilidad de que se tengan que examinar a diez operarios para encontrar “tres” positivos.
b) Si cada prueba cuesta 200 pesos, obtenga el valor esperado y la varianza del costo total de la realización de las pruebas necesarias para localizar tres empleados “positivos”.
Distribución hipergeométrica.
En esta distribución se tiene una población finita de N elementos de los cuales k son de un tipo (digamos éxitos) y N - k son fracasos. Seleccionamos n elementos sin reemplazo de la población de N. Nos interesa la probabilidad de obtener x éxitos entre los n elementos seleccionados. La función de probabilidad de Y, el número de éxitos obtenidos entre los n elementos seleccionados está dada por:
. , ; , , 2 , 1 , 0 para , ) , , ) (X x fx n N k x n x k n x N k P
C
C
C
N n k N x n k x La media de X, o valor esperado es:
N nk X E( ) y la varianza de X es
.
)
(
)
)(
(
1
2 2
N
N
n
N
k
N
nk
Ejemplo 3.15. Un problema importante que enfrentan los jefes de personal y otras personas encargadas de la selección
de los mejores de un conjunto finito de elementos se describe mediante la situación siguiente. Se seleccionan 10 personas para un trabajo de un grupo de 20 ingenieros con doctorado.
a) ¿Cuál es la probabilidad de que el grupo de los 10 ingenieros seleccionados incluya a los cinco mejores del grupo de 20?
b) Encuentre la media y la varianza para el grupo de los 20 ingenieros.
Solución. a) Para este ejemplo N20, n10 y k5, es decir, hay solamente cinco en el conjunto de los 5 mejores ingenieros y nosotros buscamos la probabilidad de que X5, siendo X el número de los mejores entre los 10
seleccionados. Entonces
0.162 292 , 1 21 20 10 10 10 5 15 10 20 5 15 5 5 5 Pb) Dado que la media de Y es
N nk X E( ) y la varianza ) 1 ( ) )( ( 2 2 N N n N k N nk , entonces
2.5 20 5 10 ) (Y E esto significa que en el grupo seleccionado de 10 ingenieros, se espera que 2 o 3 de ellos sean de
los mejores. Como
0.9868,600 , 7 500 , 7 ) 1 20 ( 20 ) 10 20 )( 5 20 ( 5 10 2 2 entonces 0.98680.9934
Ejercicio 3.16. Un producto industrial particular se embarca en lotes de 50. La prueba para determinar si el artículo es
defectuoso es costosa y por lo tanto el productor selecciona una muestra de su producción en lugar de usar un plan de inspección al 100%. Un proyecto de muestreo elaborado para minimizar el número de artículos defectuosos surtidos a los consumidores exige un muestreo de 10 artículos de cada lote y el rechazo del lote si se encuentra más de dos artículos defectuosos. (En el caso de ser rechazados el lote, se prueba cada artículo de éste). Si un lote contiene 6 artículos defectuosos, ¿Cuál es la probabilidad de que sea rechazado? ¿Cuál es el número esperado de defectuosos en la muestra de tamaño 10? ¿Cuál es la varianza del número de defectuosos en la muestra de tamaño 10?
Distribución de Poisson.
En esta distribución se observan eventos a través del tiempo o espacio con las siguientes propiedades; la probabilidad de observar un evento en una unidad de tiempo o espacio
t
es
t
para algún 0. La probabilidad de observar dos o más eventos simultáneamente es muy pequeña. A los procesos que ocurren en un espectro continuo de tiempo y espacio se le denomina proceso de Poisson; es similar al proceso de Bernoulli visto en la sección 3.2.3 excepto que los eventos suceden en un espectro continuo en vez de ocurrir en ensayos u observaciones fijas. Un ejemplo de tal proceso es la llegada de personas a la cola de una ventanilla bancaria. Tal como en el proceso de Bernoulli, se supone que los eventos son independientes y que el proceso es estacionario.Sea X la variable aleatoria que nos dice el número de eventos observados en un intervalo de tiempo o de espacio de longitud t, entonces su función de probabilidad viene dada por:
! ) ( ) , ( x t t x f t x
e
, x = 0, 1, 2, ... 0La media de X es E(X)t y su varianza es 2 t.
En el caso particular cuando el periodo de tiempo y espacio es t1 (digamos 1 mes, una semana, un metro, un kilómetro, etc) se tiene que
! ) ( ) ( x x f
e
x , x = 0, 1, 2, ... 0La media de X es E(X) y su varianza es
2
.Ejemplo 3.16. El promedio mensual de accidentes en una fábrica resulta ser igual a 3. Durante el mes pasado hubo 6
accidentes. ¿Consideraría este número demasiado alto (muy poco probable si es todavía 3) e indicador de un aumento en la media ?
Solución. El número de accidentes X tendría posiblemente una distribución de probabilidad de Poisson con 3. La probabilidad de que X sea de 6 es
5 0 3 6 3 ! 3 1 ) 6 ( 1 ! 3 ) 6 ( x x x x x e X P x e X P Así,
0.0498 0.1498 0.1494 0.2240 0.2240 0.1680 0.1008
1 ) 6 (X P 084 . 0 916 . 0 1 Además, se tiene que
3 , 23 y 31.73.Una regla empírica indica que hay que esperar que Y tome valores en el intervalo
2
con una alta probabilidad. Obsérvese que 23
2 1.73 6.46. El número de accidentes observado X = 6, no se encuentra a más de 2de , pero está cerca de la frontera. Por lo tanto, el resultado observado no es muy improbable, pero puede tener la suficiente improbabilidad para justificar una investigación.
Ejercicio 3.17. En un almacén particular, los clientes llegan al mostrador de caja de acuerdo a una distribución de
Poisson con un promedio de 7 por hora. En una hora determinada, ¿Cuál es la probabilidad de que:
a) no lleguen más de tres clientes? b) Lleguen al menos dos clientes? c) Lleguen exactamente 5 clientes?
3.2. Distribuciones continuas
Surgen espacios de muestra continuos siempre que se manejan cantidades que se miden en escala continua (por ejemplo cuando medimos la velocidad de fabricación de un producto, el peso neto de un paquete de comida, la pureza de un producto, la cantidad de alcohol que contiene una bebida o el tiempo de duración de un artículo eléctrico). En casos como éstos existen continuidades de posibilidades y en la práctica lo que realmente interesa son probabilidades asociadas con intervalos o regiones, no números o puntos individuales de un espacio de muestra. Por ejemplo podríamos desear conocer la probabilidad de que un tipo dado de maquinaria empaque entre 500 y 600 productos por hora (no exactamente 550.5) o que un paquete de comida congelada pese más de 750 gramos (no exactamente 800.6 gramos)
En esta sección conoceremos las distribuciones de probabilidad de las variables continuas más comunes así como sus funciones de densidad las cuales son modelos teóricos para la distribución de frecuencias de una población de mediciones.
Variables aleatorias continuas.
El tipo de variable aleatoria que toma cualquier valor en un intervalo se llama variable continua, por ejemplo, el tiempo de producción de un producto en un proceso de ensamblaje y el tiempo de duración de una lavadora. El intervalo sobre el cual se definen estas dos variables es la parte positiva de la línea de los números reales. Esto no significa que al observar suficientes lavadoras, se observaría en algún momento cada número real positivo como al menos un resultado. No obstante, lo importante es que no puede descartarse algún número real como un posible resultado de una observación de la durabilidad de una lavadora.
Forma de las distribuciones continuas.
La distribución de probabilidad de una variable aleatoria discreta siempre se puede obtener asignando una probabilidad positiva a cada uno de los posibles valores que puede tomar la variable. Naturalmente se tiene que estar seguro de que la suma de las probabilidades asignadas sea siempre igual a 1. Desafortunadamente, la distribución de probabilidad de una variable aleatoria continua no puede establecerse de la misma manera. Es matemáticamente imposible asignar probabilidades diferentes de cero a todos los puntos de un intervalo real y al mismo tiempo satisfacer el requisito de que la suma de probabilidades de los distintos valores posibles tiene que ser 1. Por lo que se debe desarrollar un método diferente para describir la distribución de probabilidad para una variable aleatoria continua.
Para obtener una definición formal de una variable aleatoria continua debemos definir primero una función de distribución (o función de distribución acumulativa).
Definición 3.1. Sea Y cualquier variable aleatoria. La función de distribución de Y, denotada por F(y) está dada por F(y)
= P(Y y), para y.
La naturaleza de una función de distribución asociada a una variable aleatoria se utiliza para determinar si la variable aleatoria es continua o discreta. Las funciones de distribución de variables aleatorias discretas siempre son funciones escalonadas, puesto que la función de distribución acumulativa solamente se incrementa en un conjunto numerable de puntos.
Como la función de distribución asociada a cualquier variable aleatoria se define tal que F(y)P(Y y), es claro que en la práctica P(Y )F() tiene que ser cero. Si se consideran dos valores y1 y2, entonces
) (
)
(Y y1 P Y y2
P . Es decir, F(y1)F(y2); esto significa que la función F(y) es una función monótona, no decreciente. Además, es claro que P(Y )F()1. Estas tres características definen las propiedades de cualquier función de distribución.
Definición 3.2
.
Sea Y una variable aleatoria con una función de distribución F(y). Se dice que Y es continua si F(y) es continua, para y.Definición 3.3. Sea F(y) la función de distribución de una variable continua Y. Entonces f( y), dado por
) ( ) ( ) ( F y dy y dF y f
siempre y cuando exista la derivada, se denomina la función de densidad de probabilidad para la variable aleatoria Y.
De las definiciones 3.2 y 3.3 se deduce que F(y) se puede escribir como
y f t dt y
F( ) ( )
en donde f( y) es la función de densidad de probabilidad y t se utiliza como la variable para la integración. La representación gráfica de esta relación entre la función de distribución y la función de densidad está dada en la figura 3.3.
Como la función F(y) para cualquier variable aleatoria tiene ciertas propiedades , también las funciones de densidad tendrán algunas propiedades correspondientes. Como F(y) es una función no decreciente, la derivada f( y) nunca es negativa. Además, se sabe que F()1 y por esto, que
(
)
1
f
t
dt
. f( y) F(y0) y0 y Figura 3.3.Valor esperado de variables aleatorias continuas.
En esta sección veremos cómo se calculan las medias, las varianzas y desviaciones estándar de las variables aleatorias continuas y de esta manera la obtención las medidas numéricas descriptivas de sus funciones de densidad.
Definición 3.4. El valor esperado de una variable aleatoria continua es
yf y dy
Y
E( ) ( )
siempre que exista la integral.
La varianza y la desviación estándar podemos encontrarla mediante la relación
2 2 2 ) ( ) ( ) (Y E Y E Y V 3.2.1. Distribuciones continuas más comunes.
Varias distribuciones de probabilidad continua específicas son aplicables a una gran variedad de variables continuas bajo circunstancias designadas. Por lo tanto se han preparado tablas de probabilidad para algunas de estas distribuciones continuas para que el estadístico no se vea involucrado en la integración de áreas bajo curvas de probabilidad. Las distribuciones de probabilidad continua específicas descritas en esta sección son las distribuciones de probabilidad más comunes.
Distribución uniforme.
Sea y una variable aleatoria continua cuya densidad sea una constante dentro de un intervalo (a, b) (no importa si es abierto o cerrado), entonces su función densidad será:
b y a a b y f , ) ( 1 = 0 de otra manera
Así, cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye uniforme, con parámetros
a
yb
, denotándose esto:) , ( ~U a b
Y .
La media y la varianza vienen dadas por las fórmulas
Media 2 b a
y Varianza
12 2 b a Ejercicio 3.18
.
Investigue cómo son las gráficas de las distribuciones de probabilidad uniformes de una variable aleatoria continuaEjemplo 3.17: el precio medio del kilo de aguacate durante el próximo año se estima que puede oscilar entre 10 y 15
pesos . Podría ser, por tanto, de 11 pesos., o de 12.5 pesos., o de 12.56 pesos., o de 12.95 pesos, etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad.
Solución. Su función de densidad, nos permite conocer la probabilidad que tiene cada punto del intervalo, en el ejemplo, b : es el extremo superior del intervalo, 15 pesos; a :es el extremo inferior del intervalo, 10 pesos.
Por lo tanto, la función de distribución es:
20 0 10 15 1 . ) ( y f
Es decir, que el valor final esté entre 10 pesos. y 11 pesos. tiene un 20% de probabilidad, que esté entre 11 y 12, otro 20%, etc.
El valor medio de esta distribución se calcula:
2 b a y E( ) En el ejemplo: 5 12 2 10 15 . ) (y E
Por lo tanto, el precio medio esperado del aguacate para el próximo año es de 12.5 pesos.
Ejercicio 3.19. El volumen de precipitaciones estimado para el próximo año en la ciudad de Hermosillo va a oscilar entre 40 y 50 litros por metro cuadrado. Calcular la función de distribución y la precipitación media esperada:
Distribución normal.
Sea y una variable aleatoria continua con densidad:
2
2 1(
)
exp
2
1
)
(
2
y
y
f
, y.Así, cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye normal, con parámetros y 2, denotándose esto: Y ~ N( , 2). La distribución normal es muy importante en la investigación, por eso conviene mencionar sus características:
1. Tiene forma de campana
2. Es simétrica con respecto a la media 3. La media, la moda y la mediana coinciden 4. La p( - < y < + ) = 0.6826 5. La p( - 2 < y < + 2 ) = 0.9544 6. La p( - 3 < y < + 3 ) = 0.9974 7. Fue desarrollada por Carl F.Gauss
Distribución normal estándar.
Sea y una variable aleatoria continua tal que Y ~ N( , 2) y sea Z= ) -(X , entonces: Z ~ N(0 , 1)
De lo anterior deducimos que Z es un caso particular de la Distribución Normal.
Nota: Cualquier variable que siga la distribución normal se puede transformar a una Z; dada esta cualidad, esto ha traído
como resultado que se pueden efectuar comparaciones entre variables normales, aunque tengan distintos parámetros. La Tabla I trae la integral a la derecha para cualquier valor de Z positivo (los negativos se evitan, por la simetría, ya que la media de la distribución es cero).
Ejemplo 3.19. Sea Z una variable aleatoria normal con media 0 y desviación estándar 1. Determinar
a) P(Z 2).
b) P(2Z 2).
c) P(0Z1.73).
Solución.
a) Se procede hacia abajo en la primera columna (z) en la Tabla I, y se lee el área frente al valor z = 2.0. Esta área, denotada por el símbolo A(z), es A(z = 2.0) = 0.0228. Entonces P(Z 2)0.0228
b) En la parte a) se determinó que A1 = A(Z =2.0) = 0.0228. Como la función de densidad es simétrica con
respecto a la media,
0, tenemos que A2 = A1 = 0.0228 y se tiene entonces que
00228
09544 2 1 1 2 2 ) 1 2 . . ( Z A A Pc) Obsérvese que P(0Z 1.73)0.5A
1.73 en donde A(1.73) se obtiene al proceder hacia abajo en la columna z de la Tabla I hasta la hilera "1.7" y después se va a la parte superior de la tabla hasta la columna marcada "0.03", en donde se lee A(1.73) = 0.0418. Entonces4582
.
0
0418
.
0
5
.
0
)
73
.
1
0
(
Z
P
Ejemplo 3.20
.
Los resultados de un examen de admisión en un colegio de bachilleres de la localidad tiene una distribución normal con media 75 y desviación estándar 10. ¿Qué fracción de resultados queda entre 80 y 90?Solución. z representa la distancia de la media de una distribución normal expresada en unidades de la desviación
estándar. Así, ) -(y z
Entonces la fracción buscada de la población está dada por el área entre
5 0 10 ) 75 -(80 . z y
1
.
5
10
)
75
-(90
z
Se tiene que AA
0.5 A1.5 0.30850.06680.2417Ejercicio 3.21.1. Utilice la Tabla I para encontrar las probabilidades siguientes para una variable aleatoria normal
estándar Z. a) P
0Z 1.2
b) P
0.9Z0
c) P
0.3Z 1.56
d) P
0.2Z 0.2
e) P
1.56Z0.2
Ejercicio 3.21.2. Se observó durante un largo periodo que la cantidad semanal gastada en el mantenimiento y en las
reparaciones en cierta fabrica tiene aproximadamente una distribución normal con una media de 4 mil pesos y una desviación estándar de 200 pesos. Si el presupuesto para la próxima semana es de 4 mil 500 pesos,
a) ¿Cuál es la probabilidad de que los costos reales sean mayores que la cantidad presupuestada?
b) ¿De cuánto tendría que ser el presupuesto para reparaciones semanales y mantenimiento, para que la cantidad presupuestada solamente se rebasara con una probabilidad de 0.1?
Distribución lognormal.
Sea Y una variable aleatoria continua, se dice que la variable tiene una distribución log-normal si Xln
Y tiene una distribución normal. (el símbolo ln indica logaritmo natural.). En este caso Y no debe ser negativo. La ecuación de la función de densidad lognormal es
0
,
0
2
1
)
(
2 2 2 ) (ln
y
e
y
y
f
y
en cualquier otro
punto
Así, cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye logaritmo normal o simplemente lognormal, con parámetros y , denotándose: Y ~ LN (, ) .
Ya que
ln(Y
)
es una función monótona de y,
Y y
P
Y
y
P
X
y
P ln ln ln
En donde X tiene una distribución normal con media y varianza 2
La distribución lognormal se usa con frecuencia en las ciencias biológicas y físicas como modelo de magnitudes, de volumen de peso, de diversas cantidades, tales como partículas de carbón molido, cultivos, colonias de bacterias y animales individuales.
Ejercicio 3.22. Si Y tiene distribución log-normal con
4 y 2 1,, encuentre, a) P
Y4
y b) P
Y8
Distribución gamma.
Sea y una variable aleatoria continua con densidad:
0 0 1 1 , , ) ( ) (y y e y f y
= 0 en cualquier otro punto.
en donde
0 1dy
e
y
y
. La cantidad
se conoce como la función gamma. La integración directa da que
1 1
. La integración por partes indica
1
1
para cualquier
1y que
n n1
!, para un
número entero n. Si no es un número entero, es imposible encontrar la antiderivada del integrando de la expresión
d cy
e
dy
c
d
y0
)
(
1
1
y por lo tanto es imposible encontrar las áreas bajo la función de densidad tipo gamma mediante la integración directa. Para estos casos, se hace una aproximación mediante las sumas de probabilidades de Poisson.
Cualquier variable aleatoria continua y, cuya densidad se ajuste a este patrón, se dirá que se distribuye gamma, con parámetros