DISTRIBUCIONES DE PROBABILIDAD
Distribuciones estadísticas
Gráficos: diagramas de barras e histogramas.
Observemos las dos distribuciones dadas gráficamente a la izquierda. Ambas son distribuciones de frecuencia de variables cuantitativas (numéricas).
La de arriba corresponde a una variable discreta, pues solo puede tomar valores aislados (el número de aciertos puede ser, por ejemplo, 5 o 6, pero no un valor intermedio). Por eso la hemos representado mediante barras estrechas situadas sobre esos puntos y separadas unas de otras. Es un diagrama de barras. En él, las alturas de las barras son proporcionales a las respectivas frecuencias.
En la segunda distribución la variable es continua: cada individuo puede tener un valor situado en un punto cualquiera del intervalo al que pertenece. Por eso, en vez de barras, levantamos rectángulos que ocupan todo el intervalo. El gráfico se llama histograma.
En un histograma, las frecuencias correspondientes a los intervalos son proporcionales a las áreas de los respectivos rectángulos. Por eso, si las bases de los rectángulos son iguales, sus alturas son también proporcionales a las frecuencias.
Cálculo de los parámetros
x
y
Cuando la distribución viene dada mediante una tabla de frecuencias, las fórmulas para el cálculo de los parámetros adoptan las siguientes formas:
VARIANZA
TÍPICA
DESVIACIÓN
x
f
x
f
x
f
f
f
x
f
x
f
x
f
bien
O
f
x
x
f
f
f
f
x
x
f
x
x
f
x
x
f
VARIANZA
f
x
f
f
f
f
x
f
x
f
x
f
x
MEDIA
i i i
n n n
i i i
n
n n i
i i
n n n
:
...
...
,
...
...
:
...
...
:
2 2 2
2 1
2 2
2 2 2 1 1 2
2
2 1
2 2
2 2 2 1 1 2
2 1
2 2 1 1
Distribuciones de probabilidad de variable discreta
Las distribuciones de probabilidad son idealizaciones teóricas de las distribuciones de frecuencias relativas, que se obtienen empíricamente (experimentando u observando). Cuando la variable es discreta, unas y otras se representan mediante diagramas de barras.
Cadapiesunnúmerocomprendidoentre 0y1: 0pi1 Lasumadetodoslospies1: p1 p2...pn
pi1 Serepresentamedianteundiagramadebarras
Parámetros. Se definen de forma similar a los parámetros de las distribuciones estadísticas:
2 2 2
2 2 2
2 2
2 2 2 1 1 2
2 2
2 2 2 2 1 1 2
2 2 1 1
: ...
... :
... :
i i i
i i i n
n
i i n
n i i n n
x p x
p VARIANZA
TÍPICA DESVIACIÓN
x p x
p x
p x p bien o
x p x
p x
p x
p VARIANZA
x p x p x p x p MEDIA
Observemos las dos fórmulas de la varianza:
En la primera se ve claro el significado de la varianza: es una suma ponderada de los cuadrados de las diferencias de cada valor a la media.
La segunda es mucho más cómoda para calcular la varianza a partir de los datos. Pero, naturalmente, ambas con equivalentes.
La distribución binomial
Experiencia dicotómica
Si en una experiencia aleatoria destacamos un suceso A y prestamos atención, exclusivamente, a si ocurre A o su contrario, Ac, se trata de una experiencia dicotómica.
Al suceso A se le denomina éxito,y a su probabilidad, p(A) =p. La probabilidad de su contrario es p(Ac) = 1 – p=q
Ejemplos.
1.- Lanzar una moneda.
2.- Lanzar un dado y ver si sale 5. 3.- Lanzar una chincheta.
4.- Extraer una carta de una baraja y ver si es figura.
Distribución Binomial
Partimos de una experiencia dicotómica en la que p es la probabilidad de éxito. La repetimos n veces y observamos el número, x, de éxitos que se consiguen (la variable x es discreta porque toma los valores 0, 1, 2, …, n).
La distribución de probabilidad de x se llama distribución binomialB(n,p).
Ejemplos
1.- Lanzamos 10 monedas y nos preguntamos por el número de caras.
Lanzar una moneda es una experiencia dicotómica. Éxito: cara; p(cara) = p = 0,5
Lanzar 10 monedas es equivalente a lanzar 10 veces una moneda. Es, por tato, una distribución binomial B(10; 0,5).
2.- Lanzamos 6 dados correctos y nos preguntamos por el número de “cincos”. Es una distribución binomial con n=6, p=1/6. Es, por tanto, una distribución B(6, 1/6).
3.- Dejamos caer al suelo 100 chinchetas y contamos cuántas caen con la punta hacia arriba.
Suponemos que las chinchetas son todas del mismo tipo. Si es una binomial con n = 100 y p(caer
hacia arriba) = 0,3, entonces será B(100;0,3).
4.- Extraemos una carta de una baraja, observamos si es o no figura y la devolvemos al mazo. Barajamos y volvemos a extraer. Repetimos cinco veces la experiencia.
Cálculo de probabilidades en una distribución B(n, p)
Si x es una variable B(n,p), la probabilidad de obtener k éxitos es:
k nk q p k n k xP
Se obtiene así la siguiente distribución de probabilidad:
VARIABLE x PROBABILIDAD
x k
p n n q q p n 0 0…….. k n k
q p k n ……
… n pnq pn n 0
Los parámetros de esta distribución son:
npq TÍPICA
DESVIACIÓN np
MEDIA: :
Distribuciones de probabilidad de variable continua
Las distribuciones de probabilidad de variable continua son idealizaciones de las distribuciones estadísticas de variable continua. Estas se obtienen empíricamente (experimentando u observando) Por ejemplo, estaturas, pesos, tiempos…, son variables continuas.
Las distribuciones de probabilidad de variable continua se definen por medio de una función, y=f(x), que se llama función de probabilidad o función de densidad cuyas condiciones describimos a continuación.
Para que f(x) sea la función de densidad o función de probabilidad de una variable aleatoria, es necesario que: 1 ) ( 0 ) ( : ) ( a igual sea x f y curva la bajo área El x todo para x f negativa no sea x f
a x b
Pa x b
Parámetros
La media , y la desviación típica
, tienen los mismos significados que en las distribuciones estadísticas:.
.
:
:
:
:
media
la
de
respecto
valores
los
de
separación
de
grado
el
Cuantifica
dispersión
la
de
medida
TÍPICA
DESVIACIÓN
ón
distribuci
la
de
gravedad
de
centro
MEDIA
Cálculo de probabilidades de la función de densidad y = f(x)
Ya sabemos que para calcular probabilidades en distribuciones de probabilidad de variable continua, hay que hallar las áreas bajo la curva que representa la función de densidad y= f(x). Pero, ¿cómo calcularlo de forma exacta cuando f(x) viene dada mediante su expresión analítica? El instrumento matemático que permite realizarlo es el cálculo integral. Sin embargo, hay distribuciones sencillas para las cuales la tarea es fácil. Por ejemplo, si la distribución es uniforme,
f(x)=k
, (gráfica delmargen), la P
axb
es el área de un rectángulo de base b-a y altura k:
a x b
P = (b-a) . k
La distribución normal
La
curva normal
es una función de probabilidad
continua
y
simétrica
, cuyo máximo
coincide con la media,
.Esta curva fue descrita por el matemático alemán Carl Friedrich Gauss. Llegó a ella estudiando los errores que se producen al medir reiteradamente una cierta magnitud. Estas son su ecuación y su representación gráfica:
2 2 1
2
1
x e y
Por su forma acampanada se llama campana deGauss.
La gran importancia de esta distribución se debe a la enorme frecuencia con que aparece en las situaciones más variadas. Entre las muchas variables que se distribuyen “normalmente”, podemos citar:
Caracteres morfológicos de individuos: tallas, pesos, envergaduras, etc. Caracteres fisiológicos: efectos de un fármaco, de un abono, etc.
Caracteres sociológicos. Consumo de ciertos productos.
Caracteres físicos: resistencia a la rotura de piezas aparentemente idénticas.
Y, en general, cualquier característica que se obtenga como suma de muchos factores.
Reparto del área bajo la curva normal
Por ser una distribución de probabilidad, el área bajo una curva normal cualquiera es 1. Pero esta Área se distribuye del siguiente modo:
Esto significa que, por ejemplo, si el cociente intelectual (C.I.) de las personas de un cierto colectivo se distribuye N(112, 6), entonces:
El 68,26% de ellos tienen un C.I. entre 106 y 118.
El 95,44% de ellos tienen un C.I. entre 100 y 124.
El 99,74% de ellos tienen un C.I. entre 94 y 130.
Todas las curvas normales son esencialmente iguales
Si en lugar de tomar 0,5 desviaciones típicas a la izquierda y 1,2 a la derecha de la media hubiéramos tomado otras dos constantes, las mismas en las dos curvas también las áreas serían iguales.
Esto significa que, en esencia, todas las curvas normales son idénticas, salvo un cambio de origen y de escala.
Esta coincidencia permite conocer la distribución de áreas bajo una curva normal cualquiera si se conoce la de una de ella. Concretamente, la más sencilla, la normal de media 0 y desviación típica 1. Las áreas bajo la curva normal N(0,1), es decir, sus probabilidades, son conocidas y están tabuladas. Con ellas podremos calcular probabilidades en una normal cualquiera, N(,
).Tabla de áreas bajo la curva normal N(0,1)
Para facilitar las expresiones en los cambios de variable, en la distribución N(0,1), a la variable se la suele designar por la letra z. A las
probabilidades de k, se las llama: (k):
, 0,1))
(k Pzk z se distribuye N
Recordemos que en una distribución de variable continua las probabilidades puntuales son nulas:
xk
0Cálculo de probabilidades en una distribución N(0,1)
1
1
(
)
,
,
)
(
1
1
)
(
,
0
k
k
z
P
k
z
P
k
z
P
simétrica
es
curva
la
que
recordamos
negativas
abcisas
las
Para
k
k
z
P
k
z
P
tablas
las
en
te
directamen
encuentran
se
k
k
z
P
k
z
P
ades
probabilid
las
k
Si
Ejemplos
1.-
P
z1,73
1P
z1,73
1
(1,73)10,95820,04182.-
P
0,2z1,73
(1,43)
(0,21)0,90990,58320,32673.-
7860 , 0 1 7967 , 0 9893 , 0 1 ) 83 , 0 ( ) 3 , 2 ( ) ) 83 , 0 ( 1 ( ) 3 , 2 ( 83 , 0 ) 3 , 2 ( 83 , 0 3 , 2 3 , 2 83 , 0
P z
z P z P z P
4.-
P
1,95z1
P1z1,95
1,95)(1))0,97440,84130,1331Cálculo de probabilidades en una distribución N(
,)Para establecer la relación con la N(0,1), habrá que expresar los extremos de los intervalos en número de desviaciones típicas que se separan de la media. A eso se llama tipificar la variable.
Si x es N(,
), para calcular la probabilidad
k
z
h
P
k
x
h
P
manera
siguiente
la
de
procede
se
k
x
h
P
:
k
k
cambio
El
se llama tipificación de la variable .La variable ya tipificada, z, sigue una distribución N(0,1)
La distribución binomial se aproxima a la normal
Para ciertos valores de n y p, las distribuciones binomiales tienen un extraordinario parecido con las correspondientes distribuciones normales.
En general, una binomial B(n, p) se parece a una curva normal tanto más cuanto mayor es el producto np (o nq, si q<p).
Cuando np y nq son ambos mayores que 3, la aproximación es bastante buena. Y si superan a 5, la aproximación es casi perfecta.
Naturalmente, la curva normal a la cual se aproxima tiene la misma media y la misma desviación típica que la binomial, es decir:
npq
np
Regla práctica para calcular probabilidades mediante el paso de una binomial a una
normal
Si x es B(n, p) y se parece mucho a x, N(np, npq), el cálculo de probabilidades de x puede hacerse
a partir de x del siguiente modo:
P
xk
Pk0,5xk0,5
Es decir, a cada valor puntual de x (0, 1, 2, …, k, …, n) se le asocia xun intervalo centrado en k y de radio 0,5. Por tanto:
axb
Pa0,5xb0,5
P
axb
Pa0,5xb0,5
P
a x
Pa x
Ejemplos
3 5
3 4 5
2,5 5,5
5 , 4 5
, 3 4 5
3
5 , 4 5
, 2 4 3
5 3
x P
x o x o x P x
P
x P
x P x
P
x P
x o x P x