VARIABLES ALEATORIAS Y DISTRIBUCIÓN DE
PROBABILIDADES
HAMLET MATA MATA PROF. DE LA UNIVERSIDAD POLITÉCNICA DE EL TIGRE-VENEZUELA http://hamletyestadisticaspss.jimdo.com/
Variable Aleatoria es una función que asocia un número real, perfectamente definido, a cada punto muestral. A veces las variables aleatorias (va) están ya implícitas en los puntos muestrales.
EJEMPLO 1: Sea el evento, la experiencia relacionada con la medición de la estatura de 100 individuos. Un punto muestral (resultado de un experimento) es ya un número (estatura). La va está implícita.
EJEMPLO 2: Sea el evento, lanzar una moneda 3 veces al aire. Si se representa la cara con c y el sello con s, entonces el espacio muestral será:
Espacio Muestral = {ccc, ccs, csc, scc, css, scs, ssc, sss}
La probabilidad de cada suceso elemental es 1/8. Por ejemplo p(ccc) = 1/8, ya que la probabilidad de sacar cara en una tirada es 1/2 según la definición clásica y las tiradas son independientes.
DEFINIMOS LA VARIABLE ALEATORIA X: número de caras, que puede tomar los valores {0, 1, 2, 3}. Se buscan todos los puntos muestrales que dan lugar a cada valor de la variable y a ese valor se le asigna la probabilidad del suceso correspondiente.
x Sucesos px 0 {zzz} 1/8 1 {czz, zcz, zzc} 3/8 2 {ccz, czc, zcc} 3/8 3 {ccc} 1/8
En el caso de las variables discretas, como en el ejemplo, es una función que para cada valor de la variable da su probabilidad.
EJEMPLO 3. Sea el evento experimental, lanzar al aire 2 monedas. Se sabe que el espacio muestral de este experimento contiene 4 puntos muestra les.
S = {(c, c), (c, s), (s, c), (s, s)}, donde el primer elemento de cada par indica si se obtuvo cara (c) o sello (s) en la primera moneda, y el segundo lo mismo con respecto a la segunda moneda. La probabilidad de cada punto muestral es entonces 1/4. Ahora bien, normalmente no estamos interesados en los puntos muestrales, sino en cierta magnitud asociada con los puntos muestrales. Por Ej. Se podría estar interesado en el número de caras que hay en cada punto muestral. Si definimos una variable Xi como el número de caras en el punto muestral si, Xi tomará los valores X1 = 2, X2 = 1, X3 = 1, X4 = 0. Por lo tanto, Xi es una variable aleatoria.
Una variable X es una variable aleatoria si es una magnitud susceptible de tomar diversos valores con determinadas probabilidades. Es una regla que asocia un número con cada evento simple en el espacio muestra de un experimento. Por lo general, esta regla se simboliza por medio de las mayúsculas X, Y o Z.
DEFINICIÓN: Una variable aleatoria es una función que asocia un número real a cada elemento del espacio muestral. O también, Una Variable Aleatoria es una función que asigna un número real a cada resultado en el espacio muestral de un experimento aleatorio.
Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio. Esta variable aleatoria puede ser discreta o continua. Si puede tomar sólo un número limitado de valores, entonces es una variable aleatoria discreta. En el otro extremo, si puede tomar cualquier valor dentro de un intervalo dado, entonces se trata de una variable aleatoria continua.
La distribución de probabilidad X se describe por una fórmula que enuncia la probabilidad como una función de x. Es decir, la distribución de X está especificada por la función fx(x)P(X x). El subíndice de fx(x) revela la variable aleatoria de interés. El subíndice se omitirá cuando no halla ninguna confusión sobre la probabilidad del resultado. Puesto que fx(x) está definida como una probabilidad,
) (x
fx es una función que va del conjunto de valores posibles de la variable aleatoria al intervalo [0, 1].
DEFINICIÓN: La función
f
x(
x
k)
P
(
X
x
k),
k
1
,
2
,
3
,...
que va del conjunto de los valores posibles de la variable aleatoria discreta X al intervalo [0, 1]recibe el nombre de función de probabilidad. Para una variable aleatoria
)
(
,
f
x
X
x satisface las siguientes propiedades:
x k x k x k k x 1 ) x ( f .... 3 ,... 0 ) x ( f .... 2 ) x X ( P ) x ( f ... 1 Para todo x.Se ha esgrimido el término experimento estadístico para representar cualquier proceso a través del cual se generan diversas observaciones al azar. Con frecuencia no interesan los detalles asociados con cada punto muestral, sino simplemente alguna descripción numérica del resultado. Por ejemplo, el espacio muestral que da una descripción detallada de cada uno de los resultados posibles de los alumbramientos de una mujer en 3 ocasiones, pueden escribirse así:
S = (Espacio Muestral) = {HHH, HHM, HMH, MHH, HMM, MHM, MMH, MMM}
Si lo que interesa es sólo el número de hembras que alumbra la mujer, entonces se podría asignar un valor numérico de 0, 1, 2 ó 3 a cada uno de los puntos muestrales.
Los números 0, 1, 2 y 3 son cantidades aleatorias que se determinan a través del resultado del experimento. Se podría pensar como los valores que toma alguna variable aleatoria X, que en este caso representa el número hembras que nacen cuando la mujer tiene 3 alumbramientos.
DEFINICIÓN: Si un espacio muestral contiene un número finito de posibilidades o una secuencia sin final con igual número de elementos que números enteros, se le denomina variable aleatoria discreta (espacio muestral discreto). A una variable aleatoria se le denomina variable aleatoria discreta si su conjunto de posibles resultados es contable. Las distribuciones discretas son aquellas en las que la variable puede pude tomar un número determinado de valores.
Las variables aleatorias discretas representan datos que se refieren, tales como el número de artículos defectuosos en una muestra de m de ellos o el número de accidentes en carreteras por año en un estado determinado.
EJEMPLO: si se lanza una moneda al aire puede salir cara o cruz; si se tira un dado puede salir un número de 1 al 6; en una ruleta el número puede tomar un valor del 1 al 32.
El resultado de un experimento estadístico que puede no ser finito ni contable. Un ejemplo de este paradigma ocurre cuando se produce una investigación para medir las distancias que recorre cierta marca de automóvil en una distancia de prueba especificado con 5 litros de gasolina. Asumiendo que el trayecto es una variable que se puede medir con cualquier grado de precisión, entonces resulta claro que se tiene un número infinito de distancias posibles en el espacio muestral y que no puede igualarse al número de números enteros. Si se registrara también la cantidad de tiempo en que se efectúa el recorrido de la diferentes marcas, da nueva cuenta de los intervalos de tiempos posibles que conforman el espacio muestral serian infinitos en número e incontables. Se observa con esto que no todos los espacios muestrales son necesariamente discretos.
DEFINICIÓN: Si un espacio muestral contiene un número infinito de posibilidades iguales al número de puntos que se encuentran en un segmento de
línea, se le denomina variable aleatoria continua (espacio muestral
continuo). Las distribuciones continuas son aquellas que presentan un número
infinito de posibles soluciones. Cuando una variable aleatoria puede tomar valores en una escala continua, se le denomina variable aleatoria continua.
EJEMPLO: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro de cierto intervalo (42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza media de vida de una población (72,5 años, 7,513 años, 72, 51234 años).
Con frecuencia, los valores posibles de una variable aleatoria continua son precisamente los mismos valores contenidos en el espacio muestral continuo. Tal es el caso de aquella variable aleatoria que representa la distancia que cierta marca de automóvil puede recorrer, en un camino de prueba, con 5 litros de gasolina. En la mayoría de los problemas prácticos, las variables aleatorias
continuas representan datos medidos, tales como alturas, pesos, temperaturas,
distancias o períodos de vida posibles.
Se puede especular en una variable aleatoria como un valor o una magnitud que cambia de un desarrollo a otra, sin seguir una secuencia predecible. Por ejemplo, en un hospital para tratamiento del cáncer de pulmón no se tiene manera de saber con exactitud cuántos hombres van a ser atendidas en un día cualquiera. Si los registros diarios del hospital indican que los valores de la variable aleatoria van desde 100 hasta 115 pacientes diarios, entonces ésta es una variable aleatoria discreta.
Una variable aleatoria es discreta cuando únicamente puede tomar un determinado número de valores en un intervalo. Por ejemplo, la variable aleatoria N° de caras obtenidas al lanzar 2 monedas, es una variable aleatoria discreta en el intervalo (0,2). Solo puede tomar los valores 0, 1 y 2. Si el espacio muestral consiste en un Conjunto discontinuo de sucesos, entonces una variable asociada con ese conjunto se le llama discreta; de otra manera, se le llama continua.
Una variable aleatoria es continua cuando puede tomar cualquier valor en un intervalo. Supongamos el experimento de lanzar una moneda hacia una línea marcada en el suelo. Supongamos que la distancia máxima a que puede caer la moneda de la marca es 1 metro (entendiendo como distancia la del centro de la moneda a la línea). Si definimos una variable aleatoria X que represente esa distancia, X puede tomar cualquier valor en el intervalo [0,1].
DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES
ALEATORIAS
Una variable aleatoria es un evento numérico cuyo valor se determina mediante un proceso al azar. Cuando se asignan valores de probabilidad a todos los datos numéricos posibles de una variable aleatoria X, ya sea mediante un listado o a través de una función matemática, se obtiene como resultado una distribución de probabilidad. La suma de las probabilidades para todos los resultados numéricos posibles debe ser Igual a 1.0. Pueden denotarse los valores de probabilidad individuales mediante el símbolo f(x), lo cual implica que hay implícita una función matemática; mediante P(x = X), lo cual implica que la variable aleatoria puede asumir diversos valores específicos, o simplemente mediante P(X).
Para una variable aleatoria discreta, se pueden enumerar todos los valores numéricos posibles de la variable en una tabla con las probabilidades correspondientes. Existen diversas distribuciones estándar de probabilidad que pueden utilizarse como modelos para una amplia gama de variables aleatorias discretas en aplicaciones de negocios.
Para una variable aleatoria continua no es posible enumerar todos los posibles valores fraccionarios de la variable y, por lo tanto, las probabilidades que se determinan a través de una función matemática se ilustran en forma gráfica mediante una función de densidad de probabilidad o curva de probabilidad.
EJEMPLO 1. En la Tabla A se muestra el número de camionetas que se han solicitado para rentar en una arrendadora de automóviles, en un periodo de 50 días. En la última columna de la Tabla se incluyen las frecuencias observadas en este periodo de 50 días. En la última columna de la tabla se incluyen las frecuencias observadas en ese periodo de 50 días, convertidas en probabilidad. Así, puede observarse que la probabilidad de que se hayan solicitado exactamente siete camionetas en un día elegido al azar en ese periodo es de 0.20, y que la probabilidad de que se hayan solicitado seis o más es de 0.28 + 0.20 + 0.08 = 0.56.
Tabla B. Demanda diarios de arrendamiento de camionetas Durante un periodo de 50 días.
Demandas
Posibles X Número de Días Probabilidad
) ( X P Valor Ponderado
X.P(X)
3 3 0.06 0.18 4 7 0.14 0.56 5 12 0.24 1.20 6 14 0.28 1.68 7 10 0.20 1.40 8 4 0.08 0.64 TOTALES 50 1.00 E(X)5.66DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES
DISCRETAS
Las variables aleatorias, son aquellas que se relacionan con la ocurrencia de un fenómeno aleatorio. Cuando una de esas variables aleatorias toma diversos valores, la probabilidad asociada a cada uno de tales valores puede ser organizada como una distribución de probabilidad, lo que se denomina distribución de las probabilidades asociadas a cada uno de los valores de la variable aleatoria. Las distribuciones de probabilidad logran representarse a través de una tabla, una gráfica o una fórmula, en cuyo caso tal regla de correspondencia se le denomina función de probabilidad.
VARIABLES ALEATORIAS DISCRETA: La variable aleatoria X se dice que es
discreta si los números asignados a los sucesos elementales de E son puntos
aislados. Sus posibles valores constituyen un conjunto finito o infinito numerable. Por ejemplo, supongamos el experimento consistente en lanzar tres veces una moneda no trucada; si consideramos la variable aleatoria X = ”número de caras obtenidas en los tres lanzamientos”, los valores que puede tomar esta variable aleatoria son finitos (0,1,2,3).
Entonces, una variable aleatoria discreta adquiere cada uno de sus valores con cierta probabilidad. En el proceso del lanzamiento de una moneda 3 veces, la variable X, que representa el número de sellos, toma el valor 2 con una probabilidad de 3/8, puesto que 3 de los puntos muestrales igualmente probables dan como resultado 2 sellos y 1 cara. Si se suponen arreglos iguales para los eventos simples del siguiente ejemplo:
Un empleado de un depósito le regresa, en forma aleatoria, tres herramientas de seguridad, previamente revisados, a tres obreros de un taller. Si Saúl (S), Jesús (J) y Boris (B), en ese orden, reciben una de las tres herramientas, enumere los puntos muestrales para los órdenes posibles de devolución de las herramientas y calcule los valores b de la variable aleatoria B que representa el número de agrupaciones correctas.
SOLUCIÓN.- Si S, J y B representan las herramientas de Saul, Jesús y Boris respectivamente, luego los arreglos posibles en los que podrían devolverse las herramientas y el número de agrupaciones correctas serán:
b 3 1 1 0 0 1
Espacio Muestral SJB SBJ JSB JBS BSJ BJS
La probabilidad de que ningún obrero reciba de nuevo la herramienta que tenía, es decir, la probabilidad de que B tome el valor de cero, es 1/3. Los posibles valores b de B y sus probabilidades están dados por
b 0 1 3 P(B = b) 3 1 2 1 6 1
Obsérvese que los valores de b agotan todos los casos posibles y por ello las probabilidades suman 1.
Con frecuencia, resulta conveniente representar todas las probabilidades de una variable aleatoria X a través de una fórmula. Esta fórmula seria necesariamente función de los valores numéricos x, que se denotarán por f(x), g(x), r(x) y así sucesivamente. Por lo tanto, se escribe f(x) = P(X= x); es decir f(3)P(X3). Al conjunto de pares ordenados (x, f(x)) se le denomina función de probabilidad o distribución de probabilidad de la variable aleatoria discreta X.
DEFINICIÓN: El conjunto de pares ordenados (x, f(x)) es una función de probabilidad o una distribución de probabilidad de la variable aleatoria discreta X si, para cada posible resultado x,
. 0 ) ( . 1 f x
( ) 1. . 2 f x ). ( ) ( . 3 P X x f xEJEMPLO.- Un envió de ocho computadoras similares para un distribuidor contiene tres defectuosas. Si un comerciante hace una compra aleatoria de dos de esas computadoras, localice la distribución de probabilidad para el número de computadoras imperfectas.
SOLUCIÓN.- Sea X una variable aleatoria cuyos valores de x son los números posibles de computadoras defectuosas adquiridas por el comerciante. Luego, x puede se cualquiera de los números 0, 1 y 2. Entonces:
28 3 ) 2 X ( P ) 2 ( f . ,.. 28 15 ) 1 X ( P ) 1 ( f ,.. 28 10 ) 0 X ( P ) 0 ( f 8 2 5 0 3 2 8 2 5 1 3 1 8 2 5 2 3 0
Por lo tanto, la distribución de probabilidad de X es:
x 0 1 2 f(x) 28 10 28 15 28 3
EJEMPLO: Analice la variable aleatoria X, como la cantidad de caras observadas cuando se lanzan dos monedas al aire. El espacio muestral es el conjunto {CC, CS, SC, SS} y se puede observar que la variable X puede tomar como valores 0, 1 y 2. Calculando las probabilidades tenemos:
P(de no observar caras) = P(SS) = P(X=0) = ¼ P(de observar una cara) = P(SC o CS) = P(X=1) = 2/4
P(de observar dos caras) = P(CC) = P(X=2) = ¼ Si ahora se organizan estos resultados en el siguiente cuadro:
Se alcanzará explicar por qué se usa el nombre "distribución de probabilidad". Con esta información se puede construir un histograma como el siguiente:
PROBLEMA
X 0 1 2
P(X=x) ¼ 2/
Se Lanzan dos dados al aire. ¿Cuál es probabilidad de que la suma de los puntos en los dados sea menor que 8?
SOLUCIÓN: Si asumimos que todos los resultados observados al lanzar los dos dados son equiprobables (si todos los sucesos elementales que lo integran tienen la misma probabilidad) entonces el espacio muestral del experimento, con treinta y seis posibles resultados, se presentan a continuación:
Tabla 1. Espacio muestral resultante al lanzar dos dados
Como nos interesa la suma de los puntos observados, si obtenemos el resultado (3, 5) le asignamos el valor 8, correspondiente a la suma de 3 y 5. Podemos calcular la probabilidad de que la suma sea igual a 8, contando todos los resultados donde la suma es ocho. El evento de que la suma es ocho contiene 5 resultados: {(2,6), (3,5), (4,4), (5, 3), (6,2)}; por lo tanto la probabilidad deseada es 5/36. Podemos repetir este proceso con cada uno de los resultados para obtener las siguientes sumas probables al lanzar dos de acuerdo con la tabla 2.
Tabla 2. Distribución de probabilidad del total de las sumas observadas al lanzar dos dados
Sumas 2 3 4 5 6 7 8 9 10 11 12
Probabilidades 361 362 363 364 365 366 365 364 363 362 361
Hemos encontrado la distribución de probabilidad de los valores posibles de la suma al tirar dos dados. Si R representa el resultado observado en el dado rojo y V el resultado que se observará en el dado verde, podemos expresar el valor que nos interesa así: X = R + V. Antes de lanzar los dados no sabemos qué valores observaremos para R y V, por lo tanto tampoco lo sabemos para X.
El valor que asumirá X puede variar de lanzada en lanzada, sujeto a la distribución especificada en la tabla de arriba. Así X es una variable, que asume un número finito de valores sujeto a una distribución de probabilidad. Este es un ejemplo de una variable aleatoria discreta. Otros ejemplos son las variables R y V. En general, si S es un espacio muestral con una medida de probabilidad P, definimos una variable aleatoria como una función que asigna un número real a cada uno de los elementos de S.
Interpretamos, por ejemplo X = 8 como el evento de que se observó el resultado 8 al lanzar los dos dados, es decir el evento {(2,6), (3,5), (4,4), (5, 3), (6,2)} ocurrió. También asignamos a X = 8 la probabilidad de ese evento. Así vemos que P(X=8) = P({ (2,6), (3,5), (4,4), (5, 3), (6,2)}) = 5/36= 0.14. Es usual denotar las variables aleatorias por letras mayúsculas y los valores que puede asumir por letras minúsculas. 1 2 3 4 5 6 1 1,1 2,1 3,1 4,1 5,1 6,1 2 1,2 2,2 3,2 4,2 5,2 6,2 3 1,3 2,3 3,3 4,3 5,3 6,3 4 1,4 2,4 3,4 4,4 5,4 6,4 5 1,5 2,5 3,5 4,5 5,5 6,5 6 1,6 2,6 3,6 4,6 5,6 6,6
En este caso la variable X puede asumir un valor entre un conjunto finito de valores posibles. Cualquier variable que pueda asumir un número finito de valores decimos es una variable aleatoria discreta. También son variables aleatorias discretas aquellas que pueden asumir un número muy grande o infinito de valores que potencialmente podrían ser contados, tal como el número de habitantes del planeta, el número de granos de maíz producidos en el planeta en una fecha determinada, el número de los árboles de un país.
En la Tabla 2 vemos que a cada valor posible de X, le asignamos un número correspondiente a su probabilidad. Así podemos definir otra función:
f(x) = P(X = x), para cada número x en el campo de valores de la variable X. Esta función se llama la función de probabilidad o distribución de probabilidad de la variable X. Para el ejemplo de la suma de los puntos al tirar dos dados, los valores de esta función están dados en la Tabla 2, la cual se puede reescribir usando los conceptos estudiados.
Tabla 3. Distribución de probabilidad del total de las sumas observadas al lanzar dos dados.
x 2 3 4 5 6 7 8 9 10 11 12 ) x ( f 36 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1
Vemos que f(x) nunca adquiere un valor menor de cero. Esto se debe a que f(x) representa una probabilidad, la cual nunca puede ser menor de cero. De igual manera f(x) nunca puede ser menor de 1. Si sumamos todos los valores que puede tener f(x) obtenemos 1, debido a que estamos sumando las probabilidades de que la variable aleatoria asuma uno de los valores establecidos. Por su definición, la función de probabilidad tiene las siguientes características:
1. f(x)0 para todo valor x en su dominio.
2.
x
) x (
f 1 ( donde la sumatoria se extiende sobre todos los valores x en el dominio de f.
Los valores de la función de probabilidad se pueden representar en una gráfica como la siguiente:
Diagrama de la distribucion de probabilidad de la suma de dos dados
0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 0,16 0,18 1 2 3 4 5 6 7 8 9 10 11 12 Sumas de dos dados
Proba bi li da de s
La probabilidad de observar (En la grafica) un valor particular de la variable aleatoria, digamos X = 3 está dado por la altura de la barra sobre el 3, es decir, P(X = 3) = 2/36 = 0.056. De igual manera, en vez de asociar la altura de la barra con la probabilidad, podemos ver que el área de la barra sobre el 3 es 2/36 1 = 2/36 = 0.056 ya que la altura de la barra es 2/36 y su ancho es 1. Usar el área de las barras para representar la probabilidad es muy útil para extender la noción de probabilidad a otras variables.
Podemos usar el histograma de probabilidad para calcular probabilidades tal como P(X 4). Vemos que P(X 4) = P(X =2 ó X =3 ó X =4) = P(X = 2) + P(X = 3) + P(X = 4) , ya que los eventos donde X = 2, X = 3 y X = 4 son disjuntos. Entonces P(X 4) = 1/36 + 2/36 + 3/36 = 6/36, sumando las áreas de la barras que están sobre el 4 y a su izquierda. Debemos ser muy cuidadosos con las desigualdades, ya que P(X 4) = 6/36, mientras que P(X< 4) = 3/26.
Extendiendo esta idea de probabilidades acumulativas, podemos definir otra función partiendo de la distribución de probabilidad. Si X es una variable aleatoria discreta, definimos la función de distribución de X o función de distribución acumulativa de X de la siguiente manera:
i x ix
f
x
Para
X
p
x
f
(
)
(
)
(
),..
....
<x<Las propiedades de las distribuciones de variables discretas son dos, y que posteriormente, al hablar de las distribuciones de variables continuas, se repetirán de manera muy similar:
a) Todos los valores de la distribución son mayores o iguales que cero, y además son menores o iguales que uno.
0 ≤ P(X=x) ≤ 1.
b) La suma de todas las probabilidades de la distribución es la unidad. Esta demostración es para mostrar que la distribución probabilística binomial cumple con tales propiedades.
f(x)P(X=x) = 1.De donde se puede afirmar que: la suma de todas las probabilidades de los eventos posibles de una variable aleatoria es igual a la unidad. Hay que recalcar que estas propiedades se enuncian suponiendo que conocemos el valor de la probabilidad, pero en la realidad esto no ocurre, es decir, que no sabemos la probabilidad y lo que se hace es trabajar con estimaciones. Se puede observar que en ningún caso las combinaciones toma valores negativos, y como p y q son positivos o cero, entonces todos los valores de la distribución probabilística son positivos o cero. Precisamente esto conlleva a modelos teóricos que estiman los resultados, y los principales, son los que a continuación se exhiben:
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD DE
VARIABLES DISCRETAS
UNIFORME. Es la distribución donde todos los eventos elementales tienen la misma probabilidad. Por ejemplo: tirar un dado, donde la función P(X=x)= 1/
6 para valores de x = {1, 2, 3, 4, 5, 6}
BINOMIAL. Es la que manipula la distribución de la probabilidad de obtener cierta cantidad de éxitos al realizar una cantidad de experimentos con probabilidad de éxito constante y con ensayos independientes.
GEOMÉTRICA. Es la distribución de la probabilidad de realizar cierto número de experimentos antes de obtener un éxito.
HIPERGEOMÉTRICA. Es similar a la binomial, pero con un tamaño de muestra grande en relación al tamaño de la población.
DE POISSON. Es la distribución de la probabilidad de que ocurra un evento raro en un periodo de tiempo, un espacio o un lugar. Modelos de distribuciones de probabilidad de variables discretas
UNIFORME. Es la distribución donde todos los eventos elementales tienen la misma probabilidad. Por ejemplo: tirar un dado, donde la función P(X=x)= 1/6 para valores de x = {1, 2, 3, 4, 5, 6}
BINOMIAL. Es la que manipula la distribución de la probabilidad de obtener cierta cantidad de éxitos al realizar una cantidad de experimentos con probabilidad de éxito constante y con ensayos independientes.
Geométrica. Es la distribución de la probabilidad de realizar cierto número de experimentos antes de obtener un éxito.
HIPERGEOMÉTRICA. Es similar a la binomial, pero con un tamaño de muestra grande en relación al tamaño de la población.
De Poisson. Es la distribución de la probabilidad de que ocurra un evento raro en un periodo de tiempo, un espacio o un lugar.
La que más nos interesará de estas será la distribución binomial que explicaremos posteriormente.
MEDIA Y DESVIACIÓN ESTÁNDAR DE UNA
DISTRIBUCIÓN DE PROBABILIDAD PARA VARIABLES
DISCRETAS
En una distribución de frecuencias para datos agrupados se calculaba la media, utilizando la fórmula,
n xf
, donde, () es la media de la población, la cual puede expresarse como
n f X
.
Considerando la definición de probabilidad de un evento, P(X) es el cociente de la frecuencia entre el número total de eventos (probabilidad frecuencial de ocurrencia), por lo que la media de una distribución de probabilidad de una variable discreta es:
x.P(x)
POR EJEMPLO: Consideremos la variable X del ejemplo de caras observadas en dos lanzamientos de monedas. Es decir, X tal que su distribución de probabilidad sea:
Entonces, para calcular su media () se realiza la siguiente operación:
1
4
1
.
2
2
1
.
1
4
1
.
0
)
(
2 0
xx
xP
Análogamente, la varianza se definió como
n
x
f
2 2(
)
, y haciendo unprocedimiento semejante al anterior se tiene:
n f ) x (
2 2Finalmente, la varianza de una distribución de probabilidad de una variable discreta será:
Entonces, la desviación estándar de una distribución de probabilidad de una variable discreta es:
) x ( P ) x (
2POR EJEMPLO: Considerando la misma distribución de probabilidad del ejemplo anterior, su desviación estándar se calcula:
( ) ( ) ( ) . . . . 2 2 2 1 4 1 4 1 4 1 1 2 1 0 4 1 1 4 1 1 2 2 1 1 1 4 1 1 0 2 2 2 X 0 1 2 P(X=x) ¼ 2/ 4 ¼
ESPERANZA MATEMÁTICA O VALOR ESPERADO DE UNA
VARIABLE ALEATORIA DISCRETA
Valor esperado de una variable aleatoria discreta
Si X es una variable aleatoria, y el experimento aleatorio que determina el valor de X se repite muchas veces, entonces se obtiene una secuencia de valores para X. Puede emplearse un resumen de estos valores, tal como el promedio (x), para identificar el valor central de la variable aleatoria. La función de probabilidad de X puede interpretarse como la proporción de ensayos en los que X = x. En consecuencia, no es necesario realizar el experimento muchas veces con la finalidad de determinar el valor medio de X. La media de X puede calcularse corno el promedio ponderado de los valores posibles de X, asignando al resultado x un factor de ponderación fx(x)P(X x).
La media (x) de una distribución de probabilidad es el valor esperado de su variable aleatoria.
El valor esperado o Esperanza Matemática de una variable aleatoria discreta se puede considerar como su promedio ponderado sobre todos los resultados posibles siendo las ponderaciones la probabilidad relacionada con cada uno de los resultados.
Esta medida de resumen se puede obtener multiplicando cada resultado posible Xi por su probabilidad correspondiente P(Xi) y después sumando los productos resultantes. Por lo tanto el valor esperado de la variable aleatoria discreta X, representada como E( X), se puede expresar con la siguiente formula
matemática: ) ( ) ( 1 i N i i x E X
X P X , donde:X = Variable aleatoria de Interés. Xi = Resultado i de X.
) (Xi
P Probabilidad de ocurrencia del evento i de X.
i= 1, 2, 3, ....,N.
También, se puede decir que:
La media, Esperanza Matemática o valor esperado de una variable aleatoria
discreta X, expresada por
x o E( X),es:)
(
)
(
X
xf
x
E
x x x
o(
)
(
)
1 i N i i xE
X
X
P
X
.La media de X puede interpretarse como el centro de la masa del rango de los valores de X. Esto es, si se coloca una masa igual a fx(x) en cada punto x de la recta real, entonces E(X) es el punto donde la recta queda en equilibrio. Por consiguiente, el término función de probabilidad puede interpretarse mediante esta analogía con la mecánica.
MEDIA DE UNA VARIABLE ALEATORIA
Si se tiran dos monedas al aire 16 veces y X representa el número de caras que ocurren por lanzamiento, entonces los valores de X pueden ser 0, 1 y 2. Supóngase que en el experimento se obtienen cero caras 4 veces, una cara 7 veces y dos caras 5 veces. El promedio de caras por lanzamiento de las dos monedas es entonces
.
06
.
1
16
)
5
)(
2
(
)
7
)(
1
(
)
4
)(
0
(
Este es un valor promedio y no necesariamente un resultado posible del experimento. Por ejemplo, el ingreso mensual promedio de un vendedor no es probable que sea igual a alguno de sus cheques de pago mensuales.
Reestructúrese ahora el cálculo para el número promedio de caras resultantes, de modo que tenga la siguiente forma equivalente
1.06. 16 5 2 16 7 1 16 4 0 Los números 4/16, 7/16 y 5/16 son las fracciones del total de lanzamientos que resulta en 0, 1 y 2 caras, respectivamente. Estas fracciones son también las frecuencias relativas que corresponden a los diferentes valores de X en el experimento. En efecto, se puede calcular entonces la media o el promedio de un conjunto de datos, si se conocen los distintos valores que intervienen y sus frecuencias relativas, sin conocimiento alguno del número total de observaciones en el conjunto de datos. Por consiguiente, si 4/16 ó 1/4 de los lanzamientos resultan 0 caras; 7/16, una cara; y 5/16, dos caras, el número medio de caras por lanzamiento seria 1.06, sin importar que el número total de lanzamientos sea de 16, 1 000 o aun de 10 000.
Utilícese ahora este método de las frecuencias relativas para calcular a la larga el número promedio de caras por lanzamiento de dos monedas que podría esperarse. Este valor promedio se conoce como media de la variable aleatoria X o media de la distribución de probabilidad de X, y se representa como x, o simplemente como , cuando esté claro de que variable aleatoria se trata. También es común entre los estadísticos designar a este valor como Esperanza o Expectativa Matemática, o bien como valor esperado de la variable X, y representarla como E(X).
Suponiendo que se tiran al aire dos monedas normales, se tiene que el espacio muestra1 para el experimento es
S = {CC, CS, SC, SS}
Donde es C cara y S sello.
Puesto que los 4 puntos muestrales son igualmente probables, se deduce que
P(X = 0) = P(SS) = . 4 1 P(X = l) = P(SC) + P(CS) = . 4 1 P(X = 2) = P(HH) = . 4 1
Donde un elemento, por ejemplo, SC, indica que de la primera tirada resultó Sello, seguida de una cara en la segunda tirada. Ahora bien, estas probabilidades son justamente las frecuencias relativas que a la larga corresponden a los eventos dados. Por consiguiente,
1
.
0
.
4
1
2
2
1
1
4
1
0
)
(
E
X
Esto significa que una persona que tira al aire 2 monedas una y otra vez, logrará en promedio 1 cara por tirada.
EL método descrito para calcular el número esperado de caras en cada tirada de 2 monedas, indica que la media o valor esperado de una variable aleatoria discreta puede obtenerse multiplicando cada uno de los valores x1,x2,...,xn, de la variable aleatoria X por su probabilidad correspondiente
f
(
x
1),
f
(
x
2),...,
f
(
x
n),
y sumando luego los resultados. Sin embargo, esto se verifica sólo si la variable aleatoria es discreta. En el caso de variables aleatorias continuas, la definición del valor esperado es en esencia la misma, sólo que las sumatorias se reemplazan por in-tegrales.EJEMPLO. Determine el número esperado de químicos en un comité de tres personas seleccionado al azar de un grupo de 4 químicos y 3 biólogos.
SOLUCIÓN. Se considera que X representa el número de químicos en el comité. La distribución de probabilidad de X está dada por
,
)
x
(
f
x x
7 3 3 3 4 para x = 0, 1, 2, 3.Aplicando la formula se calculan los diferentes f(xi) así:
35 4 ) 3 ( ,.. 35 18 ) 2 ( ;.. 35 12 ) 1 ( ;.. 35 1 ) 0 ( 7 3 3 3 3 4 3 7 3 3 2 3 4 2 7 3 3 1 3 4 1 7 3 3 0 3 4 0 f f f f
Los cálculos obtenidos son:
f(0) = 1/35, f(l) = 12/35, f(2) = 18/35, y f(3) = 4/35. Entonces,
1
.
70
.
7
12
35
60
35
4
3
35
18
2
35
12
1
35
1
0
)
(
E
X
Por lo tanto, si se selecciona al azar una y otra vez un comité de 3 miembros a partir de un grupo de 4 químicos y 3 biólogos, el mismo contendría en promedio 1.7 químicos.
EJEMPLO. En un juego de azar de un casino, se le paga a una persona 5 dólares si al tirar a aire 3 monedas obtiene solo caras o sellos, mientras que esta persona deberá pagar 3 dólares si obtiene sólo una o dos caras. ¿Cuál es la ganancia esperada de jugador?
SOLUCIÓN. El espacio muestral formado por todos los posibles resultados que pueden obtenerse cuando se lanzan 3 monedas de manera simultánea, o en forma equivalente si la moneda se lanzan 3 veces sucesivamente (C = cara, S = sello), es
S = {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}. Se puede argumentar que cada una de estas posibilidades es igualmente posibles y ocurre con una probabilidad igual a 1/8. Un enfoque alternativo seria aplicar la regla multiplicativa de probabilidad para sucesos independientes con cada uno de los elementos del espacio muestral (S), así:
. 8 1 2 1 2 1 2 1 ) ( ) ( ) ( ) ( P C P C P S CCS
P Recuerde que la probabilidad de salir cara es
igual a la de salir sello, es decir, ½.
La variable aleatoria de interés es X, que es la cantidad que el jugador puede ganar; y los valores posibles de X 5 $ si ocurre el evento E1
CCC,SSS
y - 3 $ si ocurre el evento E2
CCS,CSC,SCC;CSS,SCS,SSC
.Si se observa que E1 y E2 se presentan con probabilidad de ¼ y ¾ , respectivamente, se concluye que
1. 4 3 3 4 1 5 ) ( E X Por lo tanto en este juego el apostador, en promedio, perderá 1 $ al lanzar las 3 monedas.
Un juego de azar se considera justo si en el promedio el jugador termina sin pérdida o ganancia. Por lo tanto, un juego justo se define como aquel donde hay una ganancia esperada de cero, es decir, 0.
Se puede pensar en una variable aleatoria como un valor o una magnitud que cambia de una presentación a otra, sin seguir una secuencia predecible. Por ejemplo, en una clínica para tratamiento del cáncer de mamas no se tiene manera de saber con exactitud cuántas mujeres van a ser atendidas en un día cualquiera. De modo que el número de pacientes del día siguiente es una variable aleatoria. Los valores de una variable aleatoria son los valores numéricos correspondientes a cada posible resultado del experimento aleatorio. Si los registros diarios de la clínica indican que los valores de la variable aleatoria van desde 100 hasta 115 pacientes diarios, entonces ésta es una variable aleatoria discreta.
En la tabla B se ilustra el número de veces que se ha alcanzado cada nivel durante los últimos l00 días. Observe que en la tabla aparece una distribución de frecuencias. Hasta donde creamos que la experiencia de los pasados 100 días es un comportamiento típico, podemos utilizar este registro para asignar una probabilidad a cada número posible de pacientes y encontrar una distribución de probabilidad. Hemos hecho esto en la tabla B mediante la normalización de la distribución de frecuencias observadas (en este caso, dividimos cada valor que aparece en la columna de las frecuencias (fi) de la tabla B , el número total de días en que se tomaron los registros (número atendido). La distribución de probabilidad para la variable aleatoria “número de atenciones diarias” se presenta de manera gráfica en la figura I. Note que la distribución de probabilidad para una variable aleatoria proporciona una probabilidad para cada valor posible y que estas probabilidades deben sumar 1. De la misma forma en esa tabla se registra el valor esperado o esperanza matemática que es simplemente la multiplicación de los valores posibles de la variable aleatoria por la probabilidad de que la variable aleatoria tome esos valores. En la tabla B mostramos que ambos requisitos se cumplen. Además, tanto la tabla B como la figura I nos dan información acerca de la frecuencia de presentación a la larga del número de pacientes atendidos diariamente que esperaríamos observar si este “experimento” aleatorio se efectuara de nuevo.
TABLA B
NÚMERO DE MUJERES ATENDIDAS DIARIAMENTE DURANTE 100 DÍAS EN UNA CLÍNICA PARA LA ATENCIÓN DE CÁNCER DE MAMA.
Valores posibles de la Variable Aleatoria. (1) Número de días que se observa este nivel (fi). (2) Probabilidad de que la variable aleatoria tome estos valores.
(3) Esperanza Matemática. (1)x(3) 100 1 0.01 1.00 101 2 0.02 2.02 102 3 0.03 3.06 103 5 0.05 5.15 104 6 0.06 6.24 105 7 0.07 7.35 106 9 0.09 9.54 107 10 0.10 10.70 108 12 0.12 12.96 109 11 0.11 11.99 110 9 0.09 9.90 110 8 0.08 8.88 112 6 0.06 6.72 113 5 0.05 5.65 114 4 0.04 4.56 115 2 0.02 2.30 TOTALES 100 108.02
El valor esperado de la variable aleatoria “número diario de mujeres atendidas en una clinica”, es igual 108.02.
Grafica correspondiente a la distribucion de probabilidad para la variable aleatoria discreta, "número diario de pacientes atendidos en una clinica"
0 0,02 0,04 0,06 0,08 0,1 0,12 0,14 10 100101102103104105106 107 108 109110111112113114115
Números diarios de mujeres atendidas
P R O B A B ILI D A D
Si un agente de seguros afirma que puede esperarse que una mujer de 45 años de edad viva otros 33 años, esto no significa que cualquier persona espere
real-mente que una mujer de 45 años siga viviendo hasta cumplir los 78 años y muera al día siguiente. En lo concerniente a esa afirmación, ciertas mujeres de 45 años vivirán 12 años más, otras sobrevivirán 25 años, otras vivirán 38 años más, . . . , y la expectativa de vida de “33 años más” se debe interpretar como una especie de promedio particular, llamado valor esperado o esperanza matemática. Originalmente, el concepto de la esperanza matemática apareció en relación con juegos de azar y, en su forma más simple, se determina con el producto de la cantidad que un jugador deposita para ganar y la probabilidad de que gane dicha cantidad.
EJEMPLO ¿Cuál es nuestra esperanza matemática, si apostamos para ganar 500 bolívares, si y sólo si sale cara, al lanzar al aire una moneda equilibrada?
SOLUCIÓN: La moneda está equilibrada, de manera que la probabilidad de que salga cara es ½, entonces nuestra esperanza matemática es 500x0.5 = 250 bolívares.
EJEMPLO ¿Cuál es nuestra esperanza matemática, si compramos uno de los 1000 boletos de una rifa, en la que se ofrece como premio un televisor a color, que vale 480000 bolívares?
SOLUCIÓN: La probabilidad de que nos ganemos el televisor es 1000
1 , entonces nuestra esperanza matemática es
480000x 480
1000 480000 1000
1 , es decir, 480 bolívares. Por lo tanto, en un sentido estrictamente monetario, seria irracional pagar más de 480 bolívares por el boleto.
PROBLEMA. Sean 0.24, 0.35, 0.29 y 0.12 las probabilidades de que un usurero pueda vender en un año un lote subdividido, con las respectivas ganancias de Bs.1250000, Bs. 800000 o de Bs. 100000 o con una pérdida de Bs. 250000. ¿Cuál es la utilidad o ganancia esperada?
SOLUCIÓN: Si se sustituye 12 . 0 .. .. 25 . 0 ,.. 35 . 0 ,.. 24 . 0 ,.. 250000 ,.. 100000 ,.. 800000 ,... 1250000 4 3 2 1 4 3 2 1 P y P P P x x x x .
Si ahora se aplica la fórmula matemática para la obtención de la Esperanza Matemática se tiene: ) ( ) ( 1 i N i i x E X
X P X . 579000 . ) 12 . 0 ( 25000 ) 29 . 0 ( 10000 ) 35 . 0 ( 80000 24 . 0 ( 125000 BsE . Este resultado indica
que el usurero espera ganar 579000 Bs. Con su usura.
PROBLEMA. La distribución de probabilidad de la variable aleatoria discreta X es
0 , 4 3 4 1 ) ( 3 3 x x f x x x
SOLUCIÓN: 64 1 4 3 4 1 ) 3 ( 64 9 4 3 4 1 ) 2 ( ,.. 64 27 4 3 4 1 ) 1 ( ,... 64 27 4 3 4 1 ) 0 ( 0 3 3 3 2 3 2 2 3 1 3 0 3 0 f f f f
Con estos datos se puede formar la siguiente distribución de probabilidad:
x 0 1 2 3 ) (x f 64 27 64 27 64 9 64 1
Aplicando la siguiente formula : ( ) ( )
1 i N i i x E X
X P X . Se tiene:
0.75. 4 3 64 48 64 1 ) 3 ( 9 ) 2 ( 27 64 1 3 64 9 2 64 27 1 64 27 0 ELuego la esperanza matemática buscada es de 0.75.
FUNCIÓN DE DISTRIBUCIÓN ACUMULADA
En la teoría de probabilidades y estadísticas, la función de distribución
acumulativa (FDA), o simplemente función de distribución, describe la
probabilidad de que un valor real variable aleatoria X con una determinada distribución de probabilidad se encontrará en un valor menor o igual que x. Las funciones de distribución acumulativa también se utilizan para especificar la distribución de múltiples variables aleatorias. Diremos que F es la Función de
distribución acumulada de probabilidad de X.
Si X es una variable aleatoria, entonces para cualquier número real x0, existe la
probabilidad P(X x0)del evento X x0(X toma cualquier valor menor o igual a
x0). La probabilidad P(X x0)que depende de la elección de x0 es la probabilidad
acumulada hasta x0 que es la función distribución o distribución acumulada y
se denota por F(x0). Entonces, F(x0) es igual a:
(
)
)
(
0 0
0
i x Xx
p
x
X
P
x
F
OBSERVACIONES1. F(xo) = P[X ≤ xo] = p(x1) + p(x2) + ... + p(xo)
2. Si X: 0, 1, 2, 3, 4 entonces F(0) = P[X ≤ 0] = P(X < 0 ) + P(X = 0) = 0 + p(0) = p(0) F(1) = P[X ≤ 1] = P(X ≤ 0) + P(X = 1) = p(0) + p(1) F(2) = P[X ≤ 2] = P(X ≤ 1) + P(X = 2) = p(0) + p(1) + p(2) F(3) = P[X ≤ 3] = P(X ≤ 2) + P(X = 3) = p(0) + p(1) + p(2) + p(3) etc. En general:
F(x) = P[X ≤ x-1] + P(X = x) = F(x-1) + p(x) 3. Si X: 0, 1, 2, 3, ..., n entonces: F(x) = 0 si X < 0. La acumulada siempre empieza en 0. Siendo función de probabilidad, no puede tomar valores negativos. F(x) = 1 si X ≥ n. Como en el caso anterior, siendo una función de probabilidad no puede ser mayor que 1.
FORMA DE PRESENTAR LA DISTRIBUCIÓN ACUMULADA
Si la función de probabilidad de X viene dada por:
X x1 x2 x3 x4
p( x ) p( x1 ) p( x2 ) p( x3 ) p( x4 ) La función de distribución acumulada F será:
CONSIDERACIONES A TOMARSE EN CUENTA EN LA DISTRIBUCIÓN ACUMULADA
(
)
)
(
i x X i i iP
X
x
p
x
x
F
EJEMPLOSSea X una variable aleatoria discreta cuya función de probabilidad viene dada por:
X 0 1 2 3
p(x) 1/8 3/8 3/8 1/8
a) Obtenga la función de distribución acumulada de X
b) Usando la distribución acumulada, encuentre P(X ≤ 2); P(X > 2); b) P(1 ≤ X ≤ 2) y P(1 < X ≤ 2)
c) d)
SOLUCIÓN
a) Recordemos que para todo valor de X menor que el mínimo valor implica que: F(x) = 0
Del mismo modo, para X mayor o igual que el máximo valor de X, se tendrá F(x) = 1
Tomando en cuenta estos criterios, la función acumulada viene dada por:
b)Puesto que F(a) = P(X ≤ a), entonces:
P(X ≤ 2) = F(2) = 7/8
Usando complemento: P(X > 2) = 1 . P(X >2) = 1 - F(2) = 1 - 7/8 = 1/8 Usando propiedades: P(1 ≤ X ≤ 2) = F(2) - F(1) + P(X = 1) = 7/8 - 4/8 +
3/8 = 6/8
Del mismo modo, P(1 < X ≤ 2) = F(2) - F(1) = 7/8 - 4/8 = 3/8
Si X es una variable aleatoria, entonces para cualquier número real x0, existe la
probabilidad P(X x0)del evento X x0(X toma cualquier valor menor o igual a
x0).
La probabilidad P(X x0)que depende de la elección de x0 es la probabilidad
acumulada hasta x0 que es la función distribución o distribución acumulada y
se denota por F(x0). F(x0)P(X x0)
Ejemplo 7: Encuentre los valores de la función distribución acumulada F(X) de la
variable aleatoria X descrita en el ejemplo 3.
X f(X) F(X) 2 1/36 1/36 3 2/36 3/36 4 3/36 6/36 5 4/36 10/36 6 5/36 15/36
7 6/36 21/36 8 5/36 26/36 9 4/36 30/36 10 3/36 33/36 11 2/36 35/36 12 1/36 36/36 Obsérvese que F(X=5) = f(X=2) + f(X=3) + f(X=4) + f(X=5) =
La gráfica de la función distribución acumulada de una variable discreta es siempre una gráfica escalonada.
Fig. 6 Función distribución para la variable aleatoria del ejemplo 4.3
EJEMPLO 8: Halle los valores de la función distribución acumulada, F(X), de la variable aleatoria X del ejemplo 5.
X f(X) F(X) 0 15/45 15/45 1 24/45 39/45 2 6/45 45/45
Ahora demostraremos que la probabilidad de un evento se
puede expresar en términos de la función distribución acumulada F(X), donde x1 y
x2 son dos de los valores cualesquiera .
Obsérvese que y son eventos mutuamente exclusivos, su unión es
el evento .
P( ) = P( ) + P( )
Despejando P se tiene
P = P( ) - P( ) = F(x2) - F(x1)
En consecuencia, F(x) determina en forma única la distribución de probabilidades de la variable aleatoria correspondiente.
FUNCIÓN DISTRIBUCIÓN PARA VARIABLES ALEATORIAS
CONTINUAS:
Si X es una variable aleatoria continua, entonces la regla de la correspondencia que define la función distribución acumulada F(X) es:
Hemos usado v para representar la variable de integración, ya que x se usa para representar al límite superior de la integración. El integrando f es la función densidad de probabilidad, y al derivar la expresión anterior (Teorema Fundamental del Cálculo) se tiene que
La función distribución acumulada es
F(x0) =
PROPIEDADES DE LA FUNCIÓN DISTRIBUCIÓN ACUMULADA
2. , si X es discreta
Fig. 4.7 Función distribución
3. , si X es continua.
4. Si X es continua
EJEMPLO 4.9: Determinar el valor de la constante c tal que f(x) defina una función densidad en el intervalo dado y determinar la regla de correspondencia de la función de distribución acumulada correspondiente.
a. ,
b. ,
SOLUCIÓN: La integral sobre todo el intervalo es la probabilidad del espacio
muestral, que es igual a 1. Una vez evaluada la integral definida se despeja la constante c, lo cual garantizará que la función obtenida es una función densidad de probabilidad.
a. b.
Sustituyendo el valor de c se obtiene la función densidad
La función distribución es entonces la integral de la función densidad para cualquier intervalo (0,x), la cual permitirá calcular probabilidades para cualquier intervalo.
c. Para el segundo caso se hará lo mismo que para el anterior con la diferencia que tenemos una integral impropia.
La función densidad es entonces
Las propiedades de la función distribución acumulada son:
2. , si X es discreta
, si X es continua.
3. , si X es continua.
DISTRIBUCIONES DE VARIABLE DISCRETAS MÁS
IMPORTANTES
DISTRIBUCIÓN POISSON: La Distribución de Poisson es una distribución de probabilidad discreta que enuncia, a partir de una frecuencia de ocurrencia media, la probabilidad de ocurrencia de un determinado número de eventos durante cierto periodo de tiempo. La función de masa de la distribución de Poisson es
Dónde: k es el número de ocurrencias del evento o fenómeno (la función origina la probabilidad de que el evento suceda precisamente
k veces). λ es un parámetro positivo que significa el número de veces que se
espera que ocurra el fenómeno durante un intervalo dado. Por ejemplo, si el suceso analizado ocurre en promedio 4 veces por minuto y estamos interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo de distribución de Poisson con λ = 10×4 = 40. e es la base de los logaritmos naturales (e = 2,71828 ...)
DISTRIBUCIÓN GEOMÉTRICA: La distribución geométrica es cualquiera de las dos distribuciones de probabilidad discretas siguientes: la distribución de probabilidad del número X del ensayo de Bernoulli necesaria para obtener un éxito, contenido en el conjunto { 1, 2, 3,...} o la distribución de probabilidad del número Y = X − 1 de fallos antes del primer éxito, contenido en el conjunto { 0, 1, 2, 3,... }. Cuál de éstas es la que uno llama "la distribución geométrica”, es una cuestión de convención y conveniencia. Si la probabilidad de éxito en cada ensayo es p, entonces la probabilidad de que x ensayos sean necesarios para
obtener un éxito es , para x = 1, 2, 3,....
Equivalentemente, la probabilidad de que haya x fallos antes del primer éxito es para x = 0, 1, 2, 3,....
DISTRIBUCIÓN HIPERGEOMÉTRICA: La distribución hipergeométrica es
una distribución discreta relacionada con muestreos aleatorios y sin reemplazo. Imagínese que se posee una población de N elementos de los cuales, d pertenecen a la categoría A y N-d a la B. La distribución hipergeométrica mide la probabilidad de obtener x ( ) elementos de la categoría A en una muestra de n elementos de la población original. La función de probabilidad de una variable aleatoria con distribución hipergeométrica puede deducirse a través de razonamientos combinatorios y es igual a
donde N es el tamaño de población, n es el tamaño de la muestra extraída, d es el número de elementos en la población original que pertenecen a la categoría deseada y x es el número de elementos en
la muestra que pertenecen a dicha categoría. La notación N n hace referencia al coeficiente binomial, es decir, el número de combinaciones posibles al seleccionar n elementos de un total N.
DISTRIBUCIÓN UNIFORME DISCRETA: En teoría de la probabilidad, una distribución uniforme discreta es una distribución de probabilidad que toma un número finito de valores con la misma probabilidad, donde los elementos de un conjunto finito son equiprobables. Si la distribución asume los valores reales
, su función de probabilidad es:
y su función de distribución la función escalonada
Su media estadística es
y su varianza
LA DISTRIBUCIÓN BINOMIAL
LA DISTRIBUCIÓN BINOMIAL es una distribución de probabilidad discreta que
mide el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Estos experimento de Bernoulli se caracterizan por ser dicotómico, vale decir, que únicamente son posibles dos resultados. A uno se le designa como éxito y presenta una probabilidad de ocurrencia p y al otro se le llama fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli. Para representar que una variable aleatoria X sigue una distribución binomial de parámetros n y p, se escribe:
La función de probabilidad es
Donde y Siendo las combinaciones
de en ( elementos tomados de en ).
El nombre que recibe esta distribución se debe a la similitud existente entre la distribución de las probabilidades de obtener 0, 1, 2, 3,…..elementos considerados como “éxito” de una muestra de tamaño n, y los términos sucesivos del desarrollo binomial n
) q p
( , donde p expresa la probabilidad de
éxito de un solo ensayo (situación experimental), y q es la probabilidad de
“fracaso” (tal que, p + q = 1). En este caso, éxito significa encontrarse con
cierta clase de evento, mientras que fracaso significa no encontrarse con dicho evento. En esta guía se hará un breve reposo del Teorema del binomio o
Binomio de Newton. El teorema del binomio, o Binomio de Newton por haber
sido éste quien propuso el método general para su desarrollo, es un binomio elevado a una potencia n, que en su caso más simple es un número natural.
En términos generales, el teorema del binomio establece que: . b a b ab .... b a a ) b a ( n i i n i n i n n n n n n n n n n n
1 1 1 1 1 0Para el caso concreto de esta guía, se cambiará la notación y se utilizará la propiedad de conmutatividad de los números reales:
La probabilidad Px de que un evento ocurra EXACTAMENTE x veces en n
intentos esta dada por la ecuación:
.
p
x
q
n
x
n
x
x
P
.La probabilidad Px de que un evento se presente POR LO MENOS x veces
en n intentos esta expresada por la ecuación:
x n x x x x x n x n x x x x
.
p
q
P
.TRIÁNGULO DE PASCAL
Los coeficientes de los términos del desarrollo de cualquier potencia de un binomio se pueden encontrar en forma inmediata utilizando el llamado triángulo de Pascal. Los coeficientes del desarrollo de cualquier potencia de un binomio son los números que se hallan en la fila horizontal en donde después del 1 esta el exponente del binomio. Ejemplo: Los coeficientes del desarrollo del binomio
5
) b a
( son aquellos números que se encuentran en la fila horizontal, del triángulo
de Pascal, en donde después del 1 esta el 5, es decir, 1, 5, 10, 10, 5, 1. De igual manera se procede para ubicar los coeficientes de cualquier binomio.
El triángulo se forma de la siguiente manera: En la primera fila horizontal se coloca 1. En la segunda fila se coloca 1 y 1. Desde la tercera fila en adelante se comienza por 1 y cada número posterior al 1 se obtiene sumando en la fila anterior el primer número con el segundo, el segundo con el tercero, el tercero con el cuarto, cuarto con el quinto, el quinto con el sexto y así sucesivamente hasta obtener los coeficientes de la potencia buscada, recuerde que el último número de la fila horizontal siempre tiene que ser 1 (ver triángulo).
1 1 1 1 2 1 1 3 3 1 1 4 6 4 1 1 5 10 10 5 1 1 6 15 20 15 6 1 1 7 21 35 35 21 7 1