DISTRIBUCIONES DE PROBABILIDAD
MAT II
1. DISTRIBUCIONES ESTADÍSTICAS
1.1. Gráficos: diagramas de barras e histogramas.
Observemos las dos distribuciones dadas gráficamente a la izquierda. Ambas son
distribuciones de frecuencia de variables cuantitativas (numéricas).
La de arriba corresponde a una variable discreta, pues solo puede tomar valores aislados (el número de aciertos puede ser, por ejemplo, 5 o 6, pero no un valor intermedio). Por eso la hemos representado mediante barras estrechas situadas sobre esos puntos y separadas unas de otras. Es un diagrama de barras. En él, las alturas de las barras son proporcionales a las respectivas frecuencias.
En la segunda distribución la variable es continua: cada individuo puede tener un valor situado en un punto cualquiera del intervalo al que pertenece. Por eso, en vez de barras, levantamos rectángulos que ocupan todo el intervalo. El gráfico se llama histograma.
En un histograma, las frecuencias correspondientes a los intervalos son
proporcionales a las áreas de los respectivos rectángulos. Por eso, si las bases de los rectángulos son iguales, sus alturas son también proporcionales a las frecuencias.
1.2.
Cálculo de los parámetros
¯
x y σ
Cuando la distribución viene dada mediante una tabla de frecuencias, las fórmulas para el cálculo de los parámetros adoptan las siguientes formas:
MEDIA
:
¯
x
=
f
1x
1+
f
2x
2+
...
+
f
nx
nf
1+
f
2+
...
+
f
n=
∑
f
ix
i∑
f
iVARIANZA
:
σ
2=
f
1(
x
1− ¯
x
)
2+
f
2(
x
2− ¯
x
)
2+
...
+
f
n(
x
n− ¯
x
)
2f
1+
f
2+
...
+
f
n=
∑
f
i(
x
i− ¯
x
)
2∑
f
i=
∑
f
ix
i2∑
f
i− ¯
x
2
DESVIACIÓN TÍPICA
:
σ
=
√
VARIANZA
2. DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE DISCRETA
2. 1. DEFINICIÓN.
Las distribuciones de probabilidad son idealizaciones de las distribuciones de frecuencias relativas (que se obtienen experimentando).
Una distribución de probabilidad de variable discreta es el resultado de asignar a cada valor de la variable xi, su probabilidad pi.
Cada pi es un número comprendido entre 0 y 1.
0≤
p
i≤1
La suma de todas pi es 1.
∑
p
i=
1
2. 2. PARÁMETROS.
Se definen de forma similar a los parámetros de las distribuciones estadísticas
MEDIA
μ
=
∑
p
i· x
iVARIANZA σ
2
=
∑
pi·(xi−μ)2=∑
pi· xi2−μ
2
DESVIACIÓN TÍPICA
σ
=
√
var
ianza
=
√
∑
p
i·
(
x
i−
μ
)
2=
√
∑
p
i· x
i2
−
μ
2
2.3. LA DISTRIBUCIÓN BINOMIAL
Si en una experiencia aleatoria destacamos un suceso A y prestamos atención exclusivamente a si ocurre A o su
contrario, A´, se trata de una experiencia dicotómica.
Al suceso A se le llama éxito y a su probabilidad
p
(
A
)=
p
La probabilidad de su contrario, que se llama fracaso, es
p
(
A ´
)=1−
p
=
q
Por ejemplo son experiencias dicotómicas las siguientes:a) Lanzar una moneda y ver si sale cara: A =”cara”, A´= ”no cara” = “ cruz”
p
=
p
(
cara
)=1/
2
q
=
p
(
cruz
)=1/
2
b) lanzar un dado y ver si sale 5:
A
=
{
5
}
,
A ´
=
{
1,2,3,4,6
}
p
=
p
(
A
)=1/
6
q
=
p
(
A ´
)=5/6
c) Extraer una carta de una baraja y ver si es figura:
A
=
{as,sota ,caballo,rey
},
A ´
=
{
1,2,3,4,6,7
}
p
=
p
(
figura
)=16/
40=0
´
4
q
=
p
(
nofigura
)=0
´
6
Partimos de una experiencia dicotómica en la que p es la probabilidad de éxito. La repetimos n veces y observamos el
número xide éxitos que se consiguen (la variable es discreta porque toma valores 0, 1, 2, …, n).
La distribución de probabilidad de x se llama distribución binomial B(n, p).
Ej:
Son distribuciones binomiales las siguientes:
a) Lanzamos 10 monedas y nos preguntamos por el número de caras.
Lanzar una moneda es una experiencia dicotómica. Éxito: cara; p(cara) = p = 0,5
Lanzar 10 monedas es equivalente a lanzar 10 veces una moneda. Es, por tato, una distribución binomial B(10; 0,5).
c) Dejamos caer al suelo 100 chinchetas y contamos cuántas caen con la punta hacia arriba.
Suponemos que las chinchetas son todas del mismo tipo. Si es una binomial con n = 100 y p(caer hacia arriba) = 0,3, entonces será B(100;0,3).
d) Extraemos una carta de una baraja, observamos si es o no figura y la devolvemos al mazo. Barajamos y volvemos a extraer. Repetimos cinco veces la experiencia.
Es una distribución binomial: n = 5, p = 0,4, entonces será B(5; 0,4).
3.1. CÁLCULO DE PROBABILIDADES EN UNA DISTRIBUCIÓN B(n, p)
Si x es una variable
B(n, p), la probabilidad de k éxitos es
p
[
x
=
k
]=
(
n
k
)
p
k
·q
n−kSe obtiene la siguiente distribución de probabilidad
Variable x
0
…
K
…
n
Probabilidad
p[x=k]
(
n
0
)
p
0
·q
n−0=
q
n(
n
k
)
p
k
·q
n−k(
n
n
)
p
n
·q
n−n=
p
nLos parámetros de esta distribución son
MEDIA μ=n·p
DESVIACIÓN TÍPICA
σ
=
√
n·p·q
Recuerda:
(
n
k
)
=
n!
k
!·
(
n
−
k
)
!
Ejemplo: La última novela de un autor ha tenido un gran éxito, hasta el punto que el 80% de los lectores ya la han
leído. Un grupo de 4 amigos son aficionados a la lectura.
a) ¿Cuál es la probabilidad de que dos personas del grupo hayan leído la novela?
n = 4, p = 0´8, q = 1 – 0´8 = 0´2
B(4, 0´8)
p
[
x
=
2
]=
(
4
2
)
·
0
´
8
2
·
0
´
2
4−2=
4
·
3
2
·
0
´
64
·
0
´
02
=
0
´
1536
b) ¿y cómo máximo 2?
p
[
x
≤
2
]=
p
[
x
=
0
]+
p
[
x
=
1
]+
p
[
x
=
2
]=
(
4
0
)
·
0
´
8
0
·
0
´
2
4−0+
(
4
1
)
·
0
´
8
1
·
0
´
2
4−1+
(
4
2
)
·
0
´
8
2
·
0
´
2
4−2Ejemplo: La probabilidad de que un artículo producido por una fábrica sea defectuoso es 0´02. Se envió un
cargamento de 10 000 artículos a unos almacenes. Hallar el número esperado de artículos defectuosos y la
desviación típica.
μ
=
10000
·
0
´
02
=
200
σ
=
√
10000
·
0
´
02
·
0
´
98
=
14
3. DISTRIBUCIONES DE PROBABILIDAD DE VARIABLE CONTINUA
3. 1. DEFINICIÓN.
Las distribuciones de probabilidad de variable continua son idealizaciones de las distribuciones estadísticas de variable continua. Estas se obtienen empíricamente (experimentando u observando) Por ejemplo, estaturas, pesos, tiempos…, son variables continuas.
Las distribuciones de probabilidad de variable continua se definen por medio de una función, y=f(x), que se llama función de probabilidad o función de densidad cuyas condiciones describimos a continuación.
Para que f(x) sea la función de densidad o función de probabilidad de una variable aleatoria, es necesario que:
¿ f(x) sea no negativa: f(x) ≥0 para todo x
¿ Par a hallar la probabilidad P
[
a≤x≤b]
, obtenemos el área que hay bajola curva en el intervalo
[
a, b]
:P
[
a≤x≤b]
=área bajo la curva en[
a , b]
¿ Las probabilidades de los sucesos puntuales son cero:
P
[
x=a]
=0, P[
x=b]
=0,...Por tanto:
P
[
a≤x≤b]
=P[
a<x<b]
3.2. PARÁMETROS
La media μ , y la desviación típica σ , tienen los mismos significados que en las distribuciones estadísticas:
MEDIA
:
μ
:
centro de gravedad de la distribución
DESVIACIÓN TÍPICA
:
σ
:
medida de la dispersión
.
Cuantifica el grado de separación de los valores
respecto de la media
.
3.3. CÁLCULO DE PROBABILIDADES DE LA FUNCIÓN DE DENSIDAD y = f(x)
Ya sabemos que para calcular probabilidades en distribuciones de probabilidad de variable continua, hay que hallar las áreas bajo la curva que representa la función de densidad y= f(x). Pero, ¿cómo calcularlo de forma exacta cuando f(x) viene dada mediante su expresión analítica? El instrumento matemático que permite realizarlo es el cálculo integral. Sin embargo, hay distribuciones sencillas para las cuales la tarea es fácil. Por ejemplo, si la distribución es
uniforme,
[
f(x)= k]
, (gráfica del margen), laP
[
a
≤
x
≤
b
]
es el área de un rectángulo de base b-a y altura k:P
[
a
≤
x
≤
b
]
= (b-a) · k3.4. LA DISTRIBUCIÓN NORMAL
La
curva normal
es una función de probabilidad
continua
y
simétrica
, cuyo máximo coincide con la media
μ .
Esta curva fue descrita por el matemático alemán Carl Friedrich Gauss. Llegó a ella estudiando los errores que se producen al medir reiteradamente una cierta magnitud. Estas son su ecuación y su representación gráfica:
y= 1
σ
√
2π e−1 2
(
x−μ σ
)
2
Por su forma acampanada se llama campana deGauss.
La gran importancia de esta distribución se debe a la enorme frecuencia con que aparece en las situaciones más variadas. Entre las muchas variables que se distribuyen “normalmente”, podemos citar:
Caracteres morfológicos de individuos: tallas, pesos, envergaduras, etc. Caracteres fisiológicos: efectos de un fármaco, de un abono, etc. Caracteres sociológicos. Consumo de ciertos productos.
Caracteres físicos: resistencia a la rotura de piezas aparentemente idénticas.
Para cada valor de μ (media), y cada valor de σ (desviación típica), hay una curva normal que se designa N( μ ,
σ )
Reparto del área bajo la curva normal
Por ser una distribución de probabilidad, el área bajo una curva normal cualquiera es 1. Pero esta Área se distribuye del siguiente modo:
Esto significa que, por ejemplo, si el cociente intelectual (C.I.) de las personas de un cierto colectivo se distribuye N(112, 6), entonces:
El 68,26% de ellos tienen un C.I. entre 106 y 118.
El 95,44% de ellos tienen un C.I. entre 100 y 124.
El 99,74% de ellos tienen un C.I. entre 94 y 130.
Todas las curvas normales son esencialmente iguales
Si en lugar de tomar 0,5 desviaciones típicas a la izquierda y 1,2 a la derecha de la media hubiéramos tomado otras dos constantes, las mismas en las dos curvas también las áreas serían iguales.
Esto significa que, en esencia, todas las curvas normales son idénticas, salvo un cambio de origen y de escala.
Esta coincidencia permite conocer la distribución de áreas bajo una curva normal cualquiera si se conoce la de una de ella. Concretamente, la más sencilla, la normal de media 0 y desviación típica 1.
Las áreas bajo la curva normal N(0,1), es decir, sus probabilidades, son conocidas y están tabuladas. Con ellas podremos calcular probabilidades en una normal cualquiera, N( μ , σ ).
Tabla de áreas bajo la curva normal N(0,1)
Para facilitar las expresiones en los cambios de variable, en la distribución N(0,1), a la variable se la suele designar por la letra z. A las probabilidades de k, se las llama:
φ(k):
φ(k) =P
[
z≤k]
, z se distribuye N0,1)Recordemos que en una distribución de variable continua las probabilidades puntuales son nulas:
Cálculo de probabilidades en una distribución N(0,1)
¿
Si k
≥0
, las probabilidades P
[
z
≤
k
]
=
P
[
z
<
k
]
=
φ
(
k
)
se encuentran directamente en las tablas
⋅
P
[
z
≥
k
]
=
1
−
P
[
z
<
k
]
=
1
−
φ
(
k
)
⋅
Para las abcisas negativas , recordamos que la curva es simétrica ,
P
[
z
≤ −
k
]
=
P
[
z
≥
k
]
=
1
−
P
[
z
<
k
]
=
1
−
φ
(
k
)
Ejemplos
a)
P
[
z
≥1
,
73
]
=
1
−
P
[
z
<1
,
73
]
=
1
−
φ
(
1
,
73
) =
1
−
0
,
9582
=
0
,
0418
b)
P
[
0,2<
z
≤1
,
73
]
=
φ
(1
,
43
) −
φ
(
0
,
21)=
0
,
9099−
0
,
5832
=
0
,
3267
c)
P
[
−
0
,
83
<
z
≤
2,3
]
=
P
[
z
≤
2,3
]
−
P
[
z
≤−
0
,
83
]
=
φ
(
2,3
) −
P
[
z
≥
0
,
83
]
=
φ
(
2,3
) − (
1
−
φ
(
0
,
83
) ) =
φ
(
2,3
) +
φ
(
0
,
83
) −
1
=
0
,
9893
+
0
,
7967
−
1
=
0
,
7860
d)
P
[
−
1
,
95
<
z
< −
1
]
=
P
[
1
<
z
<−
1
,
95
]
=
φ
1
,
95
) −
φ
(
1
) ) =
0
,
9744
−
0
,
8413
=
0
,
1331
Cálculo de probabilidades en una distribución
N( μ , σ )Para establecer la relación con la N(0,1), habrá que expresar los extremos de los intervalos en número de desviaciones típicas que se separan de la media. A eso se llama tipificar la variable.
Si x es N( μ , σ ), para calcular la probabilidad
P
[
h
<
x
<
k
]
se procede de la siguiente manera
:
P
[
h
<
x
<
k
]
=
P
[
h
−
μ
σ
<
z
<
k
−
μ
σ
]
El cambio k
→
k
−
μ
σ
se llama tipificación de la variable .La variable ya tipificada, z, sigue una distribución N(0,1)
La distribución binomial se aproxima a la normal
Para ciertos valores de n y p, las distribuciones binomiales tienen un extraordinario parecido con las correspondientes distribuciones normales.
En general, una binomial B(n, p) se parece a una curva normal tanto más cuanto mayor es el producto np (o nq, si q<p).
Cuando np y nq son ambos mayores que 3, la aproximación es bastante buena. Y si superan a 5, la aproximación es casi perfecta.
Naturalmente, la curva normal a la cual se aproxima tiene la misma media y la misma desviación típica que la binomial, es decir:
μ
=
np
σ
=
√
npq
Regla práctica para calcular probabilidades mediante el paso de una binomial a una normal
Si x es B(n, p) y se parece mucho a x' ,
N
(
np,
√
npq
)
, el cálculo de probabilidades de x puede hacerse a partir dex'
del siguiente modo: