VARIABLES ALEATORIAS Y DISTRIBUCIÓN DE PROBABILIDADES
HAMLET MATA MATA PROF. DE LA UNIVERSIDAD POLITÉCNICA DE EL TIGRE-VENEZUELA
Variable Aleatoria es una función que asocia un número real, perfectamente definido, a cada punto muestral. A veces las variables aleatorias (va) están ya implícitas en los puntos muestrales.
Ejemplo 1: Sea el evento, la experiencia relacionada con la medición de la estatura de 100 individuos. Un punto muestral (resultado de un experimento) es ya un número (estatura). La va está implícita.
Ejemplo 2: Sea el evento, lanzar una moneda 3 veces al aire. Si se representa la cara con c y el sello con s, entonces el espacio muestral será:
Espacio Muestral = {ccc, ccs, csc, scc, css, scs, ssc, sss}
La probabilidad de cada suceso elemental es 1/8. Por ejemplo p(ccc) = 1/8, ya que la probabilidad de sacar cara en una tirada es 1/2 según la definición clásica y las tiradas son independientes.
Definimos la va X: número de caras, que puede tomar los valores {0, 1, 2, 3}. Se buscan todos los puntos muestrales que dan lugar a cada valor de la variable y a ese valor se le asigna la probabilidad del suceso correspondiente.
x Sucesos px
0 {zzz} 1/8
1 {czz, zcz, zzc} 3/8 2 {ccz, czc, zcc} 3/8
3 {ccc} 1/8
En el caso de las variables discretas, como en el ejemplo, es una función que para cada valor de la variable da su probabilidad.
Ejemplo 3. Sea el evento experimental, lanzar al aire 2 monedas. Se sabe que el espacio muestral de este experimento contiene 4 puntos muestra les.
S = {(c, c), (c, s), (s, c), (s, s)}, donde el primer elemento de cada par indica si se obtuvo cara (c) o sello (s) en la primera moneda, y el segundo lo mismo con respecto a la segunda moneda. La probabilidad de cada punto muestral es entonces 1/4. Ahora bien, normalmente no estamos interesados en los puntos muestrales, sino en cierta magnitud asociada con los puntos muestrales. Por Ej.
Se podría estar interesado en el número de caras que hay en cada punto muestral. Si definimos una variable Xi como el número de caras en el punto
muestral si, Xi tomará los valores X1 = 2, X2 = 1, X3 = 1, X4 = 0. Por lo tanto, Xi es una variable aleatoria.
Una variable X es una variable aleatoria si es una magnitud susceptible de tomar diversos valores con determinadas probabilidades. Es una regla que asocia un número con cada evento simple en el espacio muestra de un experimento. Por lo general, esta regla se simboliza por medio de las mayúsculas X, Y o Z.
Definición
Una variable aleatoria es una función que asocia un número real a cada elemento del espacio muestral.
O también,
Una Variable Aleatoria es una función que asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio.
Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio. Esta variable aleatoria puede ser discreta o continua. Si puede tomar sólo un número limitado de valores, entonces es una variable aleatoria discreta. En el otro extremo, si puede tomar cualquier valor dentro de un intervalo dado, entonces se trata de una variable aleatoria continua.
La distribución de probabilidad X se describe por una fórmula que enuncia la probabilidad como una función de x. Es decir, la distribución de X está especificada por la función fx(x) P(X x). El subíndice de fx(x) revela la variable aleatoria de interés. El subíndice se omitirá cuando no halla ninguna confusión sobre la probabilidad del resultado. Puesto que fx(x) está definida como una probabilidad,
) (x
fx es una función que va del conjunto de valores posibles de la variable aleatoria al intervalo [0, 1].
Definición
La función fx(xk) P(Xxk),
k1,2,3,...
que va del conjunto de los valores posibles de la variable aleatoria discreta X al intervalo [0, 1] recibe el nombre de función de probabilidad.Para una variable aleatoria X,fx(x) satisface las siguientes propiedades:
x
k x
k x
k k
x
1 ) x ( f ....
3
,...
0 ) x ( f ....
2
) x X ( P ) x ( f ...
1
Para todo x.
Se ha esgrimido el término experimento estadístico para representar cualquier proceso a través del cual se generan diversas observaciones al azar. Con frecuencia no interesan los detalles asociados con cada punto muestral, sino simplemente alguna descripción numérica del resultado. Por ejemplo, el espacio muestral que da una descripción detallada de cada uno de los resultados posibles de los alumbramientos de una mujer en 3 ocasiones, pueden escribirse así:
S = (Espacio Muestral) = {HHH, HHM, HMH, MHH, HMM, MHM, MMH, MMM}
Si lo que interesa es sólo el número de hembras que alumbra la mujer, entonces se podría asignar un valor numérico de 0, 1, 2 ó 3 a cada uno de los puntos muestrales.
Los números 0, 1, 2 y 3 son cantidades aleatorias que se determinan a través del resultado del experimento. Se podría pensar como los valores que toma alguna variable aleatoria X, que en este caso representa el número hembras que nacen cuando la mujer tiene 3 alumbramientos.
Definición
Si un espacio muestral contiene un número finito de posibilidades o una secuencia sin final con igual número de elementos que números enteros, se le denomina variable aleatoria discreta (espacio muestral discreto). A una variable aleatoria se le denomina variable aleatoria discreta si su conjunto de posibles resultados es contable. Las distribuciones discretas son aquellas en las que la variable puede pude tomar un número determinado de valores.
Las variables aleatorias discretas representan datos que se refieren, tales como el número de artículos defectuosos en una muestra de m de ellos o el número de accidentes en carreteras por año en un estado determinado.
Ejemplo: si se lanza una moneda al aire puede salir cara o cruz; si se tira un dado puede salir un número de 1 al 6; en una ruleta el número puede tomar un valor del 1 al 32.
El resultado de un experimento estadístico que puede no ser finito ni contable. Un ejemplo de este paradigma ocurre cuando se produce una investigación para medir las distancias que recorre cierta marca de automóvil en una distancia de prueba especificado con 5 litros de gasolina. Asumiendo que el trayecto es una variable que se puede medir con cualquier grado de precisión, entonces resulta claro que se tiene un número infinito de distancias posibles en el espacio muestral y que no puede igualarse al número de números enteros. Si se registrara también la cantidad de tiempo en que se efectúa el recorrido de la diferentes marcas, da nueva cuenta de los intervalos de tiempos posibles que conforman el espacio muestral serian infinitos en número e incontables. Se observa con esto que no todos los espacios muestrales son necesariamente discretos.
Definición
Si un espacio muestral contiene un número infinito de posibilidades iguales al número de puntos que se encuentran en un segmento de línea, se le denomina variable aleatoria continua (espacio muestral continuo).
Las distribuciones continuas son aquellas que presentan un número infinito de posibles soluciones. Cuando una variable aleatoria puede tomar valores en una escala continua, se le denomina variable aleatoria continua.
Ejemplo: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro de cierto intervalo (42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza media de vida de una población (72,5 años, 7,513 años, 72, 51234 años).
Con frecuencia, los valores posibles de una variable aleatoria continua son precisamente los mismos valores contenidos en el espacio muestral continuo. Tal es el caso de aquella variable aleatoria que representa la distancia que cierta marca de automóvil puede recorrer, en un camino de prueba, con 5 litros de gasolina. En la mayoría de los problemas prácticos, las variables aleatorias continuas representan datos medidos, tales como alturas, pesos, temperaturas, distancias o períodos de vida posibles.
Se puede especular en una variable aleatoria como un valor o una magnitud que cambia de un desarrollo a otra, sin seguir una secuencia predecible. Por ejemplo, en un hospital para tratamiento del cáncer de pulmón no se tiene manera de saber con exactitud cuántos hombres van a ser atendidas en un día cualquiera. Si los registros diarios del hospital indican que los valores de la variable aleatoria van desde 100 hasta 115 pacientes diarios, entonces ésta es una variable aleatoria discreta.
Una variable aleatoria es discreta cuando únicamente puede tomar un determinado número de valores en un intervalo. Por ejemplo, la variable aleatoria N° de caras obtenidas al lanzar 2 monedas, es una variable aleatoria discreta en el intervalo (0,2). Solo puede tomar los valores 0, 1 y 2. Si el espacio muestral consiste en un Conjunto discontinuo de sucesos, entonces una variable asociada con ese conjunto se le llama discreta; de otra manera, se le llama continua.
Una variable aleatoria es continua cuando puede tomar cualquier valor en un intervalo. Supongamos el experimento de lanzar una moneda hacia una línea marcada en el suelo. Supongamos que la distancia máxima a que puede caer la moneda de la marca es 1 metro (entendiendo como distancia la del centro de la moneda a la línea). Si definimos una variable aleatoria X que represente esa distancia, X puede tomar cualquier valor en el intervalo [0,1].
Distribuciones de Probabilidad
DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS
Una variable aleatoria es un evento numérico cuyo valor se determina mediante un proceso al azar. Cuando se asignan valores de probabilidad a todos los datos numéricos posibles de una variable aleatoria X, ya sea mediante un listado o a través de una función matemática, se obtiene como resultado una distribución de probabilidad. La suma de las probabilidades para todos los resultados numéricos posibles debe ser Igual a 1.0. Pueden denotarse los valores de probabilidad individuales mediante el símbolo f(x), lo cual implica que hay implícita una función matemática; mediante P(x = X), lo cual implica que la variable aleatoria puede asumir diversos valores específicos, o simplemente mediante P(X).
Para una variable aleatoria discreta, se pueden enumerar todos los valores numéricos posibles de la variable en una tabla con las probabilidades correspondientes. Existen diversas distribuciones estándar de probabilidad que pueden utilizarse como modelos para una amplia gama de variables aleatorias discretas en aplicaciones de negocios.
Para una variable aleatoria continua no es posible enumerar todos los posibles valores fraccionarios de la variable y, por lo tanto, las probabilidades que se determinan a través de una función matemática se ilustran en forma gráfica mediante una función de densidad de probabilidad o curva de probabilidad.
EJEMPLO 1. En la Tabla A se muestra el número de camionetas que se han solicitado para rentar en una arrendadora de automóviles, en un periodo de 50 días. En la última columna de la Tabla se incluyen las frecuencias observadas en este periodo de 50 días. En la última columna de la tabla se incluyen las frecuencias observadas en ese periodo de 50 días, convertidas en probabilidad.
Así, puede observarse que la probabilidad de que se hayan solicitado exactamente siete camionetas en un día elegido al azar en ese periodo es de 0.20, y que la probabilidad de que se hayan solicitado seis o más es de 0.28 + 0.20 + 0.08 = 0.56.
Tabla B. Demanda diaria de arrendamiento de camionetas durante un periodo de 50 días.
Demandas
Posibles X Número de Días
Probabilidad
P(X)
Valor Ponderado
X. XP( )
3 3 0.06 0.18
4 7 0.14 0.56
5 12 0.24 1.20
6 14 0.28 1.68
7 10 0.20 1.40
8 4 0.08 0.64
TOTALES 50 1.00 E(X)5.66
Distribuciones de probabilidad para variables discretas
Las variables aleatorias, son aquellas que se relacionan con la ocurrencia de un fenómeno aleatorio. Cuando una de esas variables aleatorias toma diversos valores, la probabilidad asociada a cada uno de tales valores puede ser organizada como una distribución de probabilidad, lo que se denomina distribución de las probabilidades asociadas a cada uno de los valores de la variable aleatoria. Las distribuciones de probabilidad logran representarse a través de una tabla, una gráfica o una fórmula, en cuyo caso tal regla de correspondencia se le denomina función de probabilidad.
Una variable aleatoria discreta adquiere cada uno de sus valores con cierta probabilidad. En el proceso del lanzamiento de una moneda 3 veces, la variable X, que representa el número de sellos, toma el valor 2 con una probabilidad de 3/8, puesto que 3 de los puntos muestrales igualmente probables dan como resultado 2 sellos y 1 cara. Si se suponen arreglos iguales para los eventos simples del siguiente ejemplo:
Un empleado de un depósito le regresa, en forma aleatoria, tres herramientas de seguridad, previamente revisados, a tres obreros de un taller. Si Saúl, Jesús y Boris, en ese orden, reciben una de las tres herramientas, enumere los puntos muestrales para los órdenes posibles de devolución de las herramientas y calcule los valores b de la variable aleatoria B que representa el número de agrupaciones correctas.
Solución.- Si S, J y B representan las herramientas de Saul, Jesús y Boris respectivamente, luego los arreglos posibles en los que podrían devolverse las herramientas y el número de agrupaciones correctas serán:
b 3 1 1 0 0 1
Espacio
Muestral SJB SBJ JSB JBS BSJ BJS
La probabilidad de que ningún obrero reciba de nuevo la herramienta que tenía, es decir, la probabilidad de que B tome el valor de cero, es 1/3. Los posibles valores b de B y sus probabilidades están dados por
b 0 1 3
P(B =
b)
3 1
2 1
6 1
Obsérvese que los valores de b agotan todos los casos posibles y por ello las probabilidades suman 1.
Con frecuencia, resulta conveniente representar todas las probabilidades de una variable aleatoria X a través de una fórmula. Esta fórmula seria necesariamente función de los valores numéricos x, que se denotarán por f(x), g(x), r(x) y así sucesivamente. Por lo tanto, se escribe f(x) = P(X= x); es decir f(3)P(X3). Al conjunto de pares ordenados (x, f(x)) se le denomina función de probabilidad o distribución de probabilidad de la variable aleatoria discreta X.
Definición
El conjunto de pares ordenados (x, f(x)) es una función de probabilidad o una distribución de probabilidad de la variable aleatoria discreta X si, para cada posible resultado x,
. 0 ) ( .
1 f x
( ) 1. .
2 f x
).
( ) ( .
3 P X x f x
Ejemplo.- Un envió de ocho computadoras similares para un distribuidor contiene tres defectuosas. Si un comerciante hace una compra aleatoria de dos de esas computadoras, localice la distribución de probabilidad para el número de computadoras imperfectas.
Solución.- Sea X una variable aleatoria cuyos valores de x son los números posibles de computadoras defectuosas adquiridas por el comerciante. Luego, x puede se cualquiera de los números 0, 1 y 2. Entonces:
28 ) 3
2 X ( P ) 2 ( f.
28,..
) 15 1 X ( P ) 1 ( f 28,..
) 10 0 X ( P ) 0 ( f
8 2
5 0 3 2
8 2
5 1 3 1 8
2 5 2 3 0
Por lo tanto, la distribución de probabilidad de X es:
x 0 1 2
f(x)
28 10
28 15
28 3
Ejemplo: Analice la variable aleatoria X, como la cantidad de caras observadas cuando se lanzan dos monedas al aire. El espacio muestral es el conjunto {CC, CS, SC, SS} y se puede observar que la variable X puede tomar como valores 0, 1 y 2.
Calculando las probabilidades tenemos:
P(de no observar
caras) = P(SS) = P(X=0) = ¼
P(de observar una
cara) = P(SC o
CS) = P(X=1) = 2/4
P(de observar dos
caras) = P(CC) = P(X=2) = ¼
Si ahora se organizan estos resultados en el siguiente cuadro:
X 0 1 2
P(X=x) ¼ 2/4 ¼
Se alcanzará explicar por qué se
usa el nombre "distribución de probabilidad". Con esta información se puede construir un histograma como el siguiente:
Problema
Se Lanzan dos dados al aire. ¿Cuál es probabilidad de que la suma de los puntos en los dados sea menor que 8?
SOLUCIÓN: Si asumimos que todos los resultados observados al lanzar los dos dados son equiprobables (si todos los sucesos elementales que lo integran tienen la misma probabilidad) entonces el espacio muestral del experimento, con treinta y seis posibles resultados, se presentan a continuación:
Tabla 1. Espacio muestral resultante al lanzar dos dados
1 2 3 4 5 6
1 1,1 2,1 3,1 4,1 5,1 6,1 2 1,2 2,2 3,2 4,2 5,2 6,2 3 1,3 2,3 3,3 4,3 5,3 6,3 4 1,4 2,4 3,4 4,4 5,4 6,4 5 1,5 2,5 3,5 4,5 5,5 6,5 6 1,6 2,6 3,6 4,6 5,6 6,6
Como nos interesa la suma de los puntos observados, si obtenemos el resultado (3, 5) le asignamos el valor 8, correspondiente a la suma de 3 y 5. Podemos calcular la probabilidad de que la suma sea igual a 8, contando todos los resultados donde la suma es ocho. El evento de que la suma es ocho contiene 5 resultados: {(2,6), (3,5), (4,4), (5, 3), (6,2)}; por lo tanto la probabilidad deseada es 5/36. Podemos repetir este proceso con cada uno de los resultados para obtener las siguientes sumas probables al lanzar dos de acuerdo con la tabla 2.
Tabla 2. Distribución de probabilidad del total de las sumas observadas al lanzar dos dados.
Sumas 2 3 4 5 6 7 8 9 10 11 12
Probabilidades
36 1
36 2
36 3
36 4
36 5
36 6
36 5
36 4
36 3
36 2
36 1
Hemos encontrado la distribución de probabilidad de los valores posibles de la suma al tirar dos dados. Si R representa el resultado observado en el dado rojo y V el resultado que se observará en el dado verde, podemos expresar el valor que nos interesa así: X = R + V. Antes de lanzar los dados no sabemos qué valores observaremos para R y V, por lo tanto tampoco lo sabemos para X.
El valor que asumirá X puede variar de lanzada en lanzada, sujeto a la distribución especificada en la tabla de arriba. Así X es una variable, que asume un número finito de valores sujeto a una distribución de probabilidad. Este es un ejemplo de una variable aleatoria discreta. Otros ejemplos son las variables R y V. En general, si S es un espacio muestral con una medida de probabilidad P, definimos una variable aleatoria como una función que asigna un número real a cada uno de los elementos de S.
Interpretamos, por ejemplo X = 8 como el evento de que se observó el resultado 8 al lanzar los dos dados, es decir el evento {(2,6), (3,5), (4,4), (5, 3), (6,2)}
ocurrió. También asignamos a X = 8 la probabilidad de ese evento. Así vemos que P(X = 8) = P({ (2,6), (3,5), (4,4), (5, 3), (6,2)}) = 5/36= 0.14. Es usual denotar las variables aleatorias por letras mayúsculas y los valores que puede asumir por letras minúsculas.
En este caso la variable X puede asumir un valor entre un conjunto finito de valores posibles. Cualquier variable que pueda asumir un número finito de valores decimos es una variable aleatoria discreta. También son variables aleatorias discretas aquellas que pueden asumir un número muy grande o infinito de valores que potencialmente podrían ser contados, tal como el número de habitantes del planeta, el número de granos de maíz producidos en el planeta en una fecha determinada, el número de los árboles de un país.
En la Tabla 2 vemos que a cada valor posible de X, le asignamos un número correspondiente a su probabilidad. Así podemos definir otra función: f(x) = P(X = x), para cada número x en el campo de valores de la variable X. Esta función se llama la función de probabilidad o distribución de probabilidad de la variable X. Para el ejemplo de la suma de los puntos al tirar dos dados, los valores de esta función están dados en la Tabla 2, la cual se puede reescribir usando los conceptos estudiados.
Tabla 3. Distribución de probabilidad del total
de las sumas observadas al lanzar dos dados.
x 2 3 4 5 6 7 8 9 10 11 12
) x (
f 36
1
36 2
36 3
36 4
36 5
36 6
36 5
36 4
36 3
36 2
36 1
Vemos que f(x) nunca adquiere un valor menor de cero. Esto se debe a que f(x) representa una probabilidad, la cual nunca puede ser menor de cero. De igual manera f(x) nunca puede ser menor de 1. Si sumamos todos lo valores que puede tener f(x) obtenemos 1, debido a que estamos sumando las probabilidades de que la variable aleatoria asuma uno de los valores establecidos. Por su definición, la función de probabilidad tiene las siguientes características:
1. f(x)0 para todo valor x en su dominio.
2.
x
) x (
f 1
( donde la sumatoria se extiende sobre todos los valores x
en el dominio de f.
Los valores de la función de probabilidad se pueden representar en una gráfica como la siguiente:
Diagrama de la distribucion de probabilidad de la suma de dos dados
0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0,18
1 2 3 4 5 6 7 8 9 10 11 12
Sumas de dos dados
Probabilidades
La probabilidad de observar (En la grafica) un valor particular de la variable aleatoria, digamos X = 3 está dado por la altura de la barra sobre el 3, es decir, P(X = 3) = 2/36 = 0.056. De igual manera, en vez de asociar la altura de la barra con la probabilidad, podemos ver que el área de la barra sobre el 3 es 2/36 1
= 2/36 = 0.056 ya que la altura de la barra es 2/36 y su ancho es 1. Usar el área de las barras para representar la probabilidad es muy útil para extender la noción de probabilidad a otras variables.
Podemos usar el histograma de probabilidad para calcular probabilidades tal como P(X 4). Vemos que P(X 4) = P(X =2 ó X =3 ó X =4) = P(X = 2) + P(X = 3) + P(X = 4) , ya que los eventos donde X = 2, X = 3 y X = 4 son disjuntos.
Entonces P(X 4) = 1/36 + 2/36 + 3/36 = 6/36, sumando las áreas de la
barras que están sobre el 4 y a su izquierda. Debemos ser muy cuidadosos con las desigualdades, ya que P(X 4) = 6/36, mientras que P(X< 4) = 3/26.
Extendiendo esta idea de probabilidades acumulativas, podemos definir otra función partiendo de la distribución de probabilidad. Si X es una variable aleatoria discreta, definimos la función de distribución de X o función de distribución acumulativa de X de la siguiente manera:
i x
i x) f(x),..Para....
X ( p ) x (
f <x<
Las propiedades de las distribuciones de variables discretas son dos, y que posteriormente, al hablar de las distribuciones de variables continuas, se repetirán de manera muy similar:
a) Todos los valores de la distribución son mayores o iguales que cero, y además son menores o iguales que uno.
0 ≤ P(X=x) ≤ 1.
b) La suma de todas las probabilidades de la distribución es la unidad. Esta demostración es para mostrar que la distribución probabilística binomial cumple con tales propiedades.
f(x)P(X=x) = 1.De donde se puede afirmar que: la suma de todas las probabilidades de los eventos posibles de una variable aleatoria es igual a la unidad. Hay que recalcar que estas propiedades se enuncian suponiendo que conocemos el valor de la probabilidad, pero en la realidad esto no ocurre, es decir, que no sabemos la probabilidad y lo que se hace es trabajar con estimaciones. Se puede observar que en ningún caso las combinaciones toma valores negativos, y como p y q son positivos o cero, entonces todos los valores de la distribución probabilística son positivos o cero. Precisamente esto conlleva a modelos teóricos que estiman los resultados, y los principales, son los que a continuación se exhiben:
Modelos de distribuciones de probabilidad de variables discretas
Uniforme. Es la distribución donde todos los eventos elementales tienen la misma probabilidad. Por ejemplo: tirar un dado, donde la función P(X=x)= 1/6 para valores de x = {1, 2, 3, 4, 5, 6}
Binomial. Es la que manipula la distribución de la probabilidad de obtener cierta cantidad de éxitos al realizar una cantidad de experimentos con probabilidad de éxito constante y con ensayos independientes.
Geométrica. Es la distribución de la probabilidad de realizar cierto número de experimentos antes de obtener un éxito.
Hipergeométrica. Es similar a la binomial, pero con un tamaño de muestra grande en relación al tamaño de la población.
De Poisson. Es la distribución de la probabilidad de que ocurra un evento raro en un periodo de tiempo, un espacio o un lugar.
La que más nos interesará de estas será la distribución binomial que explicaremos posteriormente.
Media y desviación estándar de una distribución de probabilidad para variables discretas
En una distribución de frecuencias para datos agrupados se calculaba la media, utilizando la fórmula, n
xf
, donde, (
) es la media de la población, la cual puede expresarse como
X nf .Considerando la definición de probabilidad de un evento, P(X) es el cociente de la frecuencia entre el número total de eventos (probabilidad frecuencial de ocurrencia), por lo que la media de una distribución de probabilidad de una variable discreta es:
x.P(x)
Por ejemplo: Consideremos la variable X del ejemplo de caras observadas en dos lanzamientos de monedas. Es decir, X tal que su distribución de probabilidad sea:
X 0 1 2
P(X=x) ¼ 2/4 ¼
Entonces, para calcular su media ()
se realiza la siguiente operación:
4 1 .1 2 2 .1 4 1 .1 0 ) (
2 0
x
x
xP
Análogamente, la varianza se definió como n x
f
2
2 ( )
, y haciendo un
procedimiento semejante al anterior se tiene:
n
) f x
(
2 2
Finalmente, la varianza de una distribución de probabilidad de una variable discreta será:
Entonces, la desviación estándar de una distribución de probabilidad de una variable discreta es:
) x ( P ) x
(
2
Por ejemplo: Considerando la misma distribución de probabilidad del ejemplo anterior, su desviación estándar se calcula:
( ) ( ) ( ) . . . 2 .
2 2 1 4 1 4 1 4 1 1 2 0 1 4 1 1 4 1 1 2 2
1 1 4 1
1 1
0 2 2 2
ESPERANZA MATEMÁTICA O VALOR ESPERADO DE UNA VARIABLE ALEATORIA DISCRETA
Valor esperado de una variable aleatoria discreta
Si X es una variable aleatoria, y el experimento aleatorio que determina el valor de X se repite muchas veces, entonces se obtiene una secuencia de valores para X. Puede emplearse un resumen de estos valores, tal como el promedio (x), para identificar el valor central de la variable aleatoria. La función de probabilidad de X puede interpretarse como la proporción de ensayos en los que X = x. En consecuencia, no es necesario realizar el experimento muchas veces con la finalidad de determinar el valor medio de X. La media de X puede calcularse corno el promedio ponderado de los valores posibles de X, asignando al resultado x un factor de ponderación fx(x)P(X x).
La media (x) de una distribución de probabilidad es el valor esperado de su variable aleatoria.
El valor esperado o Esperanza Matemática de una variable aleatoria discreta se puede considerar como su promedio ponderado sobre todos los resultados posibles siendo las ponderaciones la probabilidad relacionada con cada uno de los resultados.
Esta medida de resumen se puede obtener multiplicando cada resultado posible Xi por su probabilidad correspondiente P(Xi) y después sumando los productos resultantes. Por lo tanto el valor esperado de la variable aleatoria discreta X, representada como E(X), se puede expresar con la siguiente formula matemática:
) ( )
(
1
i N
i i
x E X
X P X
, donde:
X = Variable aleatoria de Interés.
Xi = Resultado i de X.
) (Xi
P Probabilidad de ocurrencia del evento i de X.
i= 1, 2, 3, ....,N.
También, se puede decir que:
La media, Esperanza Matemática o valor esperado de una variable aleatoria discreta X, expresada por x o E(X),es:
) ( )
(X xf x
E
x x
x
o ( ) ( )
1 i
N
i i
x E X
X P X
.
La media de X puede interpretarse como el centro de la masa del rango de los valores de X. Esto es, si se coloca una masa igual a fx(x) en cada punto x de la recta real, entonces E(X) es el punto donde la recta queda en equilibrio. Por consiguiente, el término función de probabilidad puede interpretarse mediante esta analogía con la mecánica.
Media de una variable aleatoria
Si se tiran dos monedas al aire 16 veces y X representa el número de caras que ocurren por lanzamiento, entonces los valores d e X pueden ser 0, 1 y 2.
Supóngase que en el experimento se obtienen cero caras 4 veces, una cara 7 veces y dos caras 5 veces. El promedio de caras por lanzamiento de las dos monedas es entonces
. 06 . 16 1
) 5 )(
2 ( ) 7 )(
1 ( ) 4 )(
0
(
Este es un valor promedio y no necesariamente un resultado posible del experimento. Por ejemplo, el ingreso mensual promedio de un vendedor no es probable que sea igual a alguno de sus cheques de pago mensuales.
Reestructúrese ahora el cálculo para el número promedio de caras resultantes, de modo que tenga la siguiente forma equivalente
1.06.16 2 5 16 1 7 16
0 4
Los números 4/16, 7/16 y 5/16 son las fracciones del total de lanzamientos que resulta en 0, 1 y 2 caras, respectivamente. Estas fracciones son también las frecuencias relativas que corresponden a los diferentes valores de X en el experimento. En efecto, se puede calcular entonces la media o el promedio de un conjunto de datos, si se conocen los distintos valores que intervienen y sus frecuencias relativas, sin conocimiento alguno del número total de observaciones en el conjunto de datos. Por consiguiente, si 4/16 ó 1/4 de los lanzamientos resultan 0 caras; 7/16, una cara; y 5/16, dos caras, el número medio de caras por lanzamiento seria 1.06, sin importar que el número total de lanzamientos sea de 16, 1 000 o aun de 10 000.
Utilícese ahora este método de las frecuencias relativas para calcular a la larga el número promedio de caras por lanzamiento de dos monedas que podría esperarse.
Este valor promedio se conoce como media de la variable aleatoria X o media de la distribución de probabilidad de X, y se representa como x, o simplemente como , cuando esté claro de que variable aleatoria se trata.
También es común entre los estadísticos designar a este valor como Esperanza o Expectativa Matemática, o bien como valor esperado de la variable X, y representarla como E(X).
Suponiendo que se tiran al aire dos monedas normales, se tiene que el espacio muestra1 para el experimento es
S = {CC, CS, SC, SS}
Donde es C cara y S sello.
Puesto que los 4 puntos muestrales son igualmente probables, se deduce que P(X = 0) = P(SS) = 14.
P(X = l) = P(SC) + P(CS) = 14. P(X = 2) = P(HH) = 14.
Donde un elemento, por ejemplo, SC, indica que de la primera tirada resultó Sello, seguida de una cara en la segunda tirada. Ahora bien, estas probabilidades son justamente las frecuencias relativas que a la larga corresponden a los eventos dados. Por consiguiente,
1.0.4 2 1 2 1 1 4 0 1 )
(
E X
Esto significa que una persona que tira al aire 2 monedas una y otra vez, logrará en promedio 1 cara por tirada.
EL método descrito para calcular el número esperado de caras en cada tirada de 2 monedas, indica que la media o valor esperado de una variable aleatoria discreta puede obtenerse multiplicando cada uno de los valores x1,x2,...,xn, de la variable aleatoria X por su probabilidad correspondiente f(x1),f(x2),..., f(xn), y sumando luego los resultados. Sin embargo, esto se verifica sólo si la variable aleatoria es discreta. En el caso de variables aleatorias continuas, la definición del valor esperado es en esencia la misma, sólo que las sumatorias se reemplazan por integrales.
Ejemplo. Determine el número esperado de químicos en un comité de tres personas seleccionado al azar de un grupo de 4 químicos y 3 biólogos.
Solución. Se considera que X representa el número de químicos en el comité. La distribución de probabilidad de X está dada por
, )
x (
f x x
7
3 3 3 4
para x = 0, 1, 2, 3.
Aplicando la formula se calculan los diferentes f(xi) así:
35 ) 4
3 ( 35,..
) 18 2 ( 35;..
) 12 1 ( 35;..
) 1 0
( 7
3 3
3 3 4
3 7
3 3
2 3 4
2 7
3 3
1 3 4
1 7
3 3
0 3 4
0
f f f
f
Los cálculos obtenidos son:
f(0) = 1/35, f(l) = 12/35, f(2) = 18/35, y f(3) = 4/35. Entonces,
1.70.7 12 35 60 35 3 4 35 2 18 35
1 12 35 0 1 )
(
E X
Por lo tanto, si se selecciona al azar una y otra vez un comité de 3 miembros a partir de un grupo de 4 químicos y 3 biólogos, el mismo contendría en promedio 1.7 químicos.
Ejemplo. En un juego de azar de un casino, se le paga a una persona 5 dólares si al tirar a aire 3 monedas obtiene solo caras o sellos, mientras que esta persona deberá pagar 3 dólares si obtiene sólo una o dos caras. ¿Cuál es la ganancia esperada de jugador?
Solución. El espacio muestral formado por todos los posibles resultados que pueden obtenerse cuando se lanzan 3 monedas de manera simultánea, o en forma equivalente si la moneda se lanzan 3 veces sucesivamente (C = cara, S = sello), es
S = {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}. Se puede argumentar que cada una de estas posibilidades es igualmente posibles y ocurre con una probabilidad igual a 1/8. Un enfoque alternativo seria aplicar la regla multiplicativa de probabilidad para sucesos independientes con cada uno de los elementos del espacio muestral (S), así:
8. 1 2 1 2 1 2 ) 1 ( ) ( ) ( )
(
P C P C P S CCS
P Recuerde que la probabilidad de salir cara es
igual ala de salir sello, es decir, ½.
La variable aleatoria de interés es X, que es la cantidad que el jugador puede ganar; y los valores posibles de X 5 $ si ocurre el evento E1
CCC,SSS
y - 3$ si ocurre el evento E2
CCS,CSC,SCC;CSS,SCS,SSC
.Si se observa que E1 y E2 se presentan con probabilidad de ¼ y ¾ , respectivamente, se concluye que
1.4 3 3 4
5 1 )
(
E X
Por lo tanto en este juego el apostador, en promedio, perderá 1 $ al lanzar las 3 monedas.
Un juego de azar se considera justo si en el promedio el jugador termina sin perdida o ganancia. Por lo tanto, un juego justo se define como aquel donde hay una ganancia esperada de cero, es decir, 0.
Se puede pensar en una variable aleatoria como un valor o una magnitud que cambia de una presentación a otra, sin seguir una secuencia predecible. Por ejemplo, en una clínica para tratamiento del cáncer de mamas no se tiene manera de saber con exactitud cuántas mujeres van a ser atendidas en un día cualquiera.
De modo que el número de pacientes del día siguiente es una variable aleatoria.
Los valores de una variable aleatoria son los valores numéricos correspondientes a cada posible resultado del experimento aleatorio. Si los registros diarios de la clínica indican que los valores de la variable aleatoria van desde 100 hasta 115 pacientes diarios, entonces ésta es una variable aleatoria discreta.
En la tabla B se ilustra el número de veces que se ha alcanzado cada nivel durante los últimos l00 días. Observe que en la tabla aparece una distribución de frecuencias. Hasta donde creamos que la experiencia de los pasados 100 días es un comportamiento típico, podemos utilizar este registro para asignar una probabilidad a cada número posible de pacientes y encontrar una distribución de probabilidad. Hemos hecho esto en la tabla B mediante la normalización de la distribución de frecuencias observadas (en este caso, dividimos cada valor que aparece en la columna de las frecuencias (fi) de la tabla B , el número total de días en que se tomaron los registros (número atendido). La distribución de probabilidad para la variable aleatoria “número de atenciones diarias” se presenta de manera gráfica en la figura I. Note que la distribución de probabilidad para una variable aleatoria proporciona una probabilidad para cada valor posible y que estas probabilidades deben sumar 1. De la misma forma en esa tabla se registra el valor esperado o esperanza matemática que es simplemente la multiplicación de los valores posibles de la variable aleatoria por la probabilidad de que la variable aleatoria tome esos valores. En la tabla B mostramos que ambos requisitos se cumplen. Además, tanto la tabla B como la figura I nos dan información acerca de la frecuencia de presentación a la larga del número de pacientes atendidos diariamente que esperaríamos observar si este “experimento” aleatorio se efectuara de nuevo.
TABLA B
NÚMERO DE MUJERES ATENDIDAS DIARIAMENTE DURANTE 100 DÍAS EN UNA CLÍNICA PARA LA ATENCIÓN DE CÁNCER DE MAMA.
Valores
posibles de la Variable
Aleatoria.
(1)
Número de días que se observa este nivel (fi).
(2)
Probabilidad de que la variable aleatoria tome estos valores.
(3)
Esperanza Matemática.
(1)x(3)
100 1 0.01 1.00
101 2 0.02 2.02
102 3 0.03 3.06
103 5 0.05 5.15
104 6 0.06 6.24
105 7 0.07 7.35
106 9 0.09 9.54
107 10 0.10 10.70
108 12 0.12 12.96
109 11 0.11 11.99
110 9 0.09 9.90
110 8 0.08 8.88
112 6 0.06 6.72
113 5 0.05 5.65
114 4 0.04 4.56
115 2 0.02 2.30
TOTALES 100 108.02
El valor esperado de la variable aleatoria “número diario de mujeres atendidas en una clinica”, es igual 108.02.
Grafica correspondiente a la distribucion de probabilidad para la variable aleatoria discreta,
"número diario de pacientes atendidos en una clinica"
0 0,02 0,04 0,06 0,08 0,1 0,12 0,14
10 100 101
102 103
104 105
106 107
108 109
110 111
112 113
114 115 Números diarios de mujeres atendidas
PROBABILIDAD
Si un agente de seguros afirma que puede esperarse que una mujer de 45 años de edad viva otros 33 años, esto no significa que cualquier persona espere realmente que una mujer de 45 años siga viviendo hasta cumplir los 78 años y muera al día siguiente. En lo concerniente a esa afirmación, ciertas mujeres de 45 años vivirán 12 años más, otras sobrevivirán 25 años, otras vivirán 38 años más, . . . , y la expectativa de vida de “33 años más” se debe interpretar como una especie de promedio particular, llamado valor esperado o esperanza
matemática. Originalmente, el concepto de la esperanza matemática apareció en relación con juegos de azar y, en su forma más simple, se determina con el producto de la cantidad que un jugador deposita para ganar y la probabilidad de que gane dicha cantidad.
EJEMPLO ¿Cuál es nuestra esperanza matemática, si apostamos para ganar 500 bolívares, si y sólo si sale cara, al lanzar al aire una moneda equilibrada?
SOLUCIÓN: La moneda está equilibrada, de manera que la probabilidad de que salga cara es ½, entonces nuestra esperanza matemática es 500x0.5 = 250 bolívares.
EJEMPLO ¿Cuál es nuestra esperanza matemática, si compramos uno de los 1000 boletos de una rifa, en la que se ofrece como premio un televisor a color, que vale 480000 bolívares?
Solución: La probabilidad de que nos ganemos el televisor es 1000 1
, entonces nuestra esperanza matemática es
480000x 480
1000 480000 1000
1
, es decir, 480 bolívares. Por lo tanto, en un sentido estrictamente monetario, seria irracional pagar más de 480 bolívares por el boleto.
PROBLEMA. Sean 0.24, 0.35, 0.29 y 0.12 las probabilidades de que un usurero pueda vender en un año un lote subdividido, con las respectivas ganancias de Bs.1250000, Bs. 800000 o de Bs. 100000 o con una pérdida de Bs. 250000.
¿Cuál es la utilidad o ganancia esperada?
SOLUCIÓN: Si se sustituye
12 0 25
0 35
0 24
0
250000 100000
800000 1250000
4 3
2 1
4 3
2 1
. P ..
y ..
. P ,..
. P ,..
. P
,..
x ,..
x ,..
x ,...
x
.
Si ahora se aplica la fórmula matemática para la obtención de la Esperanza Matemática se tiene:
) ( )
(
1
i N
i i
x E X
X P X
.
579000 .
) 12 . 0 ( 25000 )
29 . 0 ( 10000 )
35 . 0 ( 80000 24
. 0 (
125000 Bs
E . Este resultado indica
que el usurero espera ganar 579000 Bs. Con su usura.
PROBLEMA. La distribución de probabilidad de la variable aleatoria discreta X es
0 4 ,
3 4 ) 1
(
3 3
x x
f
x x
x ,1, 2, 3. Encuentre la esperanza matemática.
Solución:
64 1 4
3 4 ) 1
3 (
64 9 4 3 4 ) 1
2 ( 64,..
27 4
3 4 ) 1
1 ( 64,...
27 4
3 4 ) 1
0 (
0 3 3
3
3 2 2 3 2
1 3
3 0 0
f
f f
f
Con estos datos se puede formar la siguiente distribución de probabilidad:
x 0 1 2 3
) (x
f 2764 2764
964
164
Aplicando la siguiente formula : ( ) ( )
1
i N
i i
x E X
X P X
. Se tiene:
0.75.4 3 64 48 64
1 ) 3 ( 9 ) 2 ( 27 64 3 1 64 2 9 64 1 27 64
0 27
E
Luego la esperanza matemática buscada es de 0.75.
LA DISTRIBUCIÓN BINOMIAL
El nombre que recibe esta distribución se debe a la similitud existente entre la distribución de las probabilidades de obtener 0, 1, 2, 3,…..elementos considerados como “éxito” de una muestra de tamaño n, y los términos sucesivos del desarrollo binomial ( pq)n, donde p expresa la probabilidad de éxito de un solo ensayo (situación experimental), y q es la probabilidad de
“fracaso” (tal que, p + q = 1). En este caso, éxito significa encontrarse con cierta clase de evento, mientras que fracaso significa no encontrarse con dicho evento. En esta guía se hará un breve reposo del Teorema del binomio o Binomio de Newton. El teorema del binomio, o Binomio de Newton por haber sido éste quien propuso el método general para su desarrollo, es un binomio elevado a una potencia n, que en su caso más simple es un número natural.
En términos generales, el teorema del binomio establece que para a, b R y
n N, se tiene que:
. b a b
ab ....
b a a
) b a
( n i i
n
i n
i n n
n n n
n n n
n n
n
1 1
1 1
1 0
Para el caso concreto de esta guía, se cambiará la notación y se utilizará la propiedad de conmutatividad de los números reales:
La probabilidad Px de que un evento ocurra EXACTAMENTE x veces en n intentos esta dada por la ecuación:
x qn px n . x x
P
.
La probabilidad Px de que un evento se presente POR LO MENOS x veces en
n intentos esta expresada por la ecuación:
x n x x
x
x x
n x n
x
x x
x .p q
P
.
TRIÁNGULO DE PASCAL
Los coeficientes de los términos del desarrollo de cualquier potencia de un binomio se pueden encontrar en forma inmediata utilizando el llamado triángulo de Pascal. Los coeficientes del desarrollo de cualquier potencia de un binomio son los números que se hallan en la fila horizontal en donde después del 1 esta el exponente del binomio. Ejemplo: Los coeficientes del desarrollo del binomio
)5
b a
( son aquellos números que se encuentran en la fila horizontal, del triángulo de Pascal, en donde después del 1 esta el 5, es decir, 1, 5, 10, 10, 5, 1. De igual manera se procede para ubicar los coeficientes de cualquier binomio.
El triángulo se forma de la siguiente manera: En la primera fila horizontal se coloca 1. En la segunda fila se coloca 1 y 1. Desde la tercera fila en adelante se comienza por 1 y cada número posterior al 1 se obtiene sumando en la fila anterior el primer número con el segundo, el segundo con el tercero, el tercero con el cuarto, cuarto con el quinto, el quinto con el sexto y así sucesivamente hasta obtener los coeficientes de la potencia buscada, recuerde que el ultimo número de la fila horizontal siempre tiene que ser 1 (ver triángulo).
11 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 28 56 70 56 28 8 1
1 9 36 84 126 126 84 36 9
11 10 45 120 210 252 210 120 45
10 1
Ejemplo: Sean los binomios (2x3y)5y (xy)5, desarrolle los mismos aplicando el triángulo de Pascal:
. y xy
y x y
x y
x x
) y x (
) y ( ) y )(
x ( ) y ( ) x ( ) y ( ) x ( y ) x ( ) x ( ) y x (
5 4
3 2 2
3 4
5 5
5 4
3 2 2
3 4
5 5
243 810
1080 720
240 32
3 2
3 3
2 5 3
2 10 3
2 10 3 2 5 2
3 2
. y xy y
x y
x y
x y x x ) y x
( 6 66 5 15 4 2 20 3 315 2 45 5 6
PROPIEDADES DE LA DISTRIBUCIÓN BINOMIAL
1.- El experimento se fundamenta en n ensayos repetidos.
2.- Cada ensayo proporciona un resultado que puede clasificarse como éxito o fracaso. Cuando es éxito la variable toma el valor 1 y cuando es fracaso toma el valor 0.
3.- La probabilidad de éxito, designada por p, permanece constante de un ensayo a otro.
4.- Los ensayos son independientes.
EJEMPLOS 1: La Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); la probabilidad de ser admitido en una universidad (o te admiten o no te admiten); la probabilidad de acertar un Kino (o aciertas o no aciertas).
Al haber únicamente dos soluciones se trata de sucesos complementarios:
A la probabilidad de éxito se le denomina "p"
A la probabilidad de fracaso se le denomina "q"
Verificándose que:
p + q = 1.
EJEMPLOS 2: Probabilidad de salir cara al lanzar una moneda al aire:
Probabilidad de que salga cara: p = 0,5.
Probabilidad de que no salga cara: q = 0,5.
p + q = 0,5 + 0,5 = 1.
Ejemplo 3: Probabilidad de ser admitido en la universidad:
Probabilidad de ser admitido: p = 0,25.
Probabilidad de no ser admitido: q = 0,75.
p + q = 0,25 + 0,75 = 1.
Ejemplo 4: Probabilidad de acertar un número de lotería de 100000:
Probabilidad de acertar: p = 0,00001.
Probabilidad de no acertar: q = 0,99999.
p + q = 0,00001 + 0,99999 = 1.
Considérense los siguientes experimentos y variables aleatorias
1. Lanzar una moneda diez veces. Sea X = número de caras obtenidas.
2. IJna máquina herramienta desgastada produce 1 % ¡de partes defectuosas.
Sea X = número de partes defectuosas en las siguientes 25 que se produzcan.
3. La posibilidad de que cada muestra de aire contenga una molécula rara es 10%. Sea X = número de muestras de aire que contienen la molécula rara en las siguientes 18 muestras por analizar.
4. De todos los bits transmitidos por un canal de transmisión digital, el 10 % se reciben con error. Sea X = número de bits con error en los siguientes cinco por transmitir.
5. Un examen de opción múltiple contiene diez preguntas, cada una con cuatro opciones, y se pide a una persona que adivine las respuestas. Sea X = número de respuestas contestadas de manera correcta.
6. De los siguientes 20 nacimientos en un
hospital, sea X = número de niñas.
7. De todos los pacientes que padecen una enfermedad en particular, el 35 % experimenta una mejora con cierto medicamento. Para los siguientes 30 pacientes a los que se les administrará el medicamento, sea X = número de pacientes que experimentan mejoría.