Variables aleatorias y distribuciones de probabilidad

(1)

Variables aleatorias y distribuciones de

probabilidad

1 Algunos de los conceptos más comúnes

1.1 Media

La media o esperanza matemática es una medida de localización, que indica el valor alrededor del cual uctúa la variable aleatoria X; si ésta es continua, la media se dene como

E[X] = Z ∞ −∞ xf (x)dx siendo E[X] =X xi xif (xi)

la denición en el caso discreto.

1.2 Momento central

A partir de la esperanza se denen los momentos centrales de orden n. En el caso continuo se denen mediante

E[(X − E[X])n] = Z ∞ −∞ (x − E[X])nf (x)dx y en el discreto por E[(X − E[X])n] =X xi (xi− E[X])nf (xi)

A partir de los momentos se calculan ciertos parámetros poblacionales que, junto con la media, aportan información importante sobre el modelo probabilís-tico de X.

1.3 Varianza y desviación típica

El momento central de orden 2 recibe el nombre de varianza y es una medida de dispersión, de manera que cuanto mayor sea ésta, más se dispersan las observa-ciones de X alrededor de su media; en cambio, cuanto menor sea la varianza, más se agrupan los datos entorno a su valor central. Se dene la desviación típica como la raíz cuadrada de la varianza,

DT [X] =pV [X] =pE[(X − E[X])2_]

(2)

que siendo también una medida de dispersión, goza de la ventaja de tener las mismas unidades que la media.

1.4 Coeciente de asimetría

El coeciente de asimetría es un parámetro de forma que da cuenta de en qué medida la densidad se reparte simétricamente a ambos lados de la media. Se dene como

Ca[X] =

E[(X − E[X])3] E[(X − E[X])2_]3/2

y es tal que si Ca < 0es mayor la dispersión hacia el lado izquierdo de la

media, y si Ca> 0la dispersión se traslada al lado derecho; nalmente, cuando

Ca = 0, la densidad es simétrica respecto de la media.

1.5 Coeciente de curtosis

El coeciente de curtosis, que se dene como Cc[X] =

E[(X − E[X])4] E[(X − E[X])2_]2 − 3

mide el achatamiento de la densidad, de manera que será tanto más positivo cuanto más puntiaguda sea ésta, y será más negativo al hacerse la densidad más aplastada. Cuando Cc = 0, su nivel de apuntamiento será equivalente al de una

distribución normal.

2 Variables contínuas

El comportamiento estocástico de una magnitud o variable aleatoria X queda determinado por su función de distribución

F (x) = Pr(X ≤ x),

que representa la probabilidad de que una observación de X tenga un valor menor o igual que el número real x. La probabilidad de que X se encuentre dentro del intervalo (x1, x2]es

Pr(x1< X ≤ x2) = F (x2) − F (x1).

Es habitual caracterizar F mediante su función de densidad f. En el caso de variables absolutamente continuas, la relación entre F y f es

F (x) = Z x

−∞

f (s)ds, ∀x ∈ R

2.1 Distribución beta

La distribución beta de parámetros a y b, ambos positivos, tiene como soporte el intervalo (0, 1), por lo que suele utilizarse en la modelización de variables que se encuentran dentro de este rango.

La función de densidad es f (x) = 1

B(a, b)x

(3)

y la de distribución F (x) =    0 si x ≤ 0 1 B(a,b) Rx 0 u a−1_{(1 − u)}b−1_du _{si x ∈ (0, 1)} 1 si x ≥ 1 siendo B(p, q) = Z 1 0 xp−1(1 − x)q−1dx

la función beta de Euler, con p y q ambos positivos.

La media y la varianza de esta distribución son, respectivamente, E[X] = a a + b y V [X] = ab (a + b)2_{(a + b + 1)}.

2.2 Distribución de Cauchy

La distribución de Cauchy, o de Lorentz, de parámetros a ∈ R y b > 0 es de uso frecuente en física para describir el patrón de impactos de partículas sobre una recta. También es de interés teórico por ser una distribución que carece de momentos. Su función de densidad es f (x) = b π[(x − a)2_{+ b}2_], ∀x ∈ R y la de distribución F (x) = 1 2+ 1 πarctan x − a b , ∀x ∈ R

Como queda dicho más arriba, la distribución de Cauchy no tiene ni media ni varianza.

2.3 Distribución χ

2

de Pearson

Si (X1, X2, . . . , Xn)son n variables aleatorias normales independientes de media

0 y varianza 1, la variable denida como Yn= X12+ X 2 2+ . . . + X 2 n= n X i=1 Xi2

se dice que tiene una distribución χ2 _{con n grados de libertad.}

Su función de densidad es f (x) = √ 1 2n_Γ n 2 x n 2−1e− x 2, ∀x > 0, siendo Γ(p) = Z ∞ 0 xp−1e−xdx

la función gamma de Euler, con p > 0. La función de distribución viene dada por

(4)

F (x) = Z x 0 1 √ 2n_Γ n 2 t n 2−1e− t 2dt,

que debe ser evaluada por métodos numéricos.

La media y varianza son E[X] = n y V [X] = 2n, respectivamente.

2.4 Distribución exponencial

Una variable aleatoria X tiene distribución exponencial de parámetro a > 0 si su función de densidad es

f (x) = ae−ax, ∀x ≥ 0.

Integrando, su función de distribución, o de probabilidad acumulada, es F (x) =

1 − e−ax si x ≥ 0 0 si x < 0

La interpretación del parámetro a es sencilla, pues coincide con la inversa de la esperanza de la variable aleatoria X.

Dentro del contexto del análisis de supervivencia, cuando X se interpreta como el tiempo necesario para que se produzca el fallo de un componente de una máquina, o el tiempo que transcurre hasta la muerte de un organismo biológico, tiene especial importancia la función

S(x) = Pr(X > x) = 1 − F (x) = e−ax

que recibe el nombre de función de supervivencia y que es la probabilidad de que el individuo no fallezca antes del instante x.

La esperanza de la distribución exponencial es E[X] = 1 a y su varianza V [X] = 1 a2.

2.5 Distribución F de Snedecor

La distribución F de Snedecor aparece en los contrastes asociados a compara-ciones entre las varianzas de dos poblacompara-ciones normales.

Si (X1, X2, . . . , Xm) y (Z1, Z2, . . . , Zn) son m + n variables aleatorias

nor-males independientes de media µ = 0 y varianza σ2_{, la variable}

Y = 1 m Pm i=1X 2 i 1 n Pn i=1Zi2

tiene una distribución Fm,nde Snedecor de m y n grados de libertad.

Su función de densidad es f (x) = Γ m+n 2 m n m/2 Γ m₂ Γ n 2 x m/2−1_{1 +} mx n −m+n2 , ∀x > 0, siendo Γ(p) = Z ∞ 0 xp−1e−xdx

(5)

La función de distribución viene dada por F (x) = Z x 0 Γ m+n₂ m n m/2 Γ m₂ Γ n 2 t m/2−1 1 + mt n −m+n2 dt, que debe ser evaluada por métodos numéricos.

La media es E[X] = n n − 2, ∀n > 2 y la varianza V [X] = 2n 2_{(m + n − 2)} m(n − 2)2_{(n − 4)}, ∀n > 4.

2.6 Distribución gamma

La distribución gamma de parámetros a y b es versátil como pocas, ya que otras distribuciones importantes son casos particulares de ésta; así, cuando a = 1, se reduce a la exponencial y cuando a = n/2 y b = 2, obtenemos la χ2_{de Pearson}

con n grados de libertad.

Las funciones de densidad y de distribución son f (x) = 1 ba_Γ(a)x a−1_e−x/b_{, ∀x ≥ 0} y F (x) = ( 1 Γ(a) Rx/b 0 u a−1_e−u_du _{si x ≥ 0} 0 si x < 0 respectivamente, siendo Γ(p) = Z ∞ 0 xp−1e−xdx

la función gamma de Euler, con p > 0.

La media es E[X] = ab y la varianza V [X] = ab2_.

2.7 Distribución logística

La distribución logística de parámetros a ∈ R y b > 0 se ha llegado a utilizar como sustituta de la normal debido a su forma acampanada y de más fácil manejo. Más frecuente es su uso en la modelización de respustas aleatorias binarias, como en la regresión logística.

La función de densidad logística toma la forma f (x) = exp − x−a b b 1 + exp −x−a_b , ∀x ∈R y su función de distribución es F (x) = 1 1 + exp −x−a b , ∀x ∈R

(6)

2.8 Distribución normal

La distribución normal o de Gauss es sin duda la más importante de cuantas hay, tanto por razones prácticas como teóricas.

Formalmente, una variable aleatoria X es normal de media µ y varianza σ2_,

lo que se expresa como N(µ, σ), si su función de densidad es f (x) = 1 σ√2πexp −(x − µ) 2 2σ2 , ∀x ∈ R.

La función de probabilidad acumulada, o función de distribución, tiene la forma F (x) = Φ x − µ σ =√1 2π Z x−µ_σ −∞ exp −u 2 2 du,

la cual sólo se puede evaluar numéricamente para los diferentes valores de x. Como queda indicado, la media y varianza de la variable aleatoria normal X son E[X] = µ y V [X] = σ2_{, respectivamente.}

2.9 Distribución lognormal

Cuando en una muestra con valores positivos se observa que el histograma dista de ser simétrico, suele ser útil una transformación logarítmica de los datos para que los valores resultantes tengan una apariencia más gaussiana, lo que permitirá utilizar después técnicas de análisis estándar. Se dice en estos casos que los datos originales tienen distribución lognormal.

Su función de densidad toma la forma f (x) = 1 σx√2πexp −(ln x − µ) 2 2σ2 , ∀x > 0,

en la que se observará su similitud con la función de densidad de la distribución normal, aunque tomando valores sólo en el semieje positivo de la recta real.

Su función de probabilidad acumulada es F (x) =

(

Φln x−µ_σ si x > 0 0 si x ≤ 0

siendo Φ la distribución normal tipicada (de media 0 y desviación típica 1). Finalmente, la esperanza de la variable aleatoria lognormal es

E[X] = exp µ +σ 2 2 y su varianza V [X] = exp 2µ + σ2 · exp(σ2) − 1

2.10 Distribución t de Student

Si (X, X1, X2, . . . , Xn) son n + 1 variables aleatorias normales independientes

de media 0 y varianza σ2_{, la variable denida como}

Yn= X q 1 n Pn i=1Xi2

(7)

se dice que tiene una distribución tn de Student con n grados de libertad. Su función de densidad es f (x) = √1 nπ Γ n+1 2 Γ n 2 1 +x 2 n −n+12 , ∀x ∈ R, siendo Γ(p) = Z ∞ 0 xp−1e−xdx

la función gamma de Euler, con p > 0. La función de distribución viene dada por F (x) = Z x −∞ 1 √ nπ Γ n+1₂ Γ n₂ 1 + t 2 n −n+12 dt, que debe ser evaluada por métodos numéricos.

La media de esta distribución es E[X] = 0 y su varianza viene dada por V [X] = n

n − 2, ∀n > 2.

Nótese que la varianza no existe para valores menores o iguales a 2. Esta distribución aparece en algunos contrastes del análisis sobre poblaciones normales.

2.11 Distribución uniforme

Una variable aleatoria X se dice que es uniforme en el intervalo (a, b) si su función de densidad es constante dentro de él.

La distribución uniforme modeliza de algún modo la incertidumbre más com-pleta sobre una variable aleatoria continua. Tiene especial importancia en el ám-bito computacional, pues es a partir de ella que se pueden realizar simulaciones de cualquier otra variable aleatoria.

La función de densidad de la distribución es f (x) = 1 b − a, ∀x ∈ (a, b) y la de distribución: F (x) =    0 si x ≤ a x−a b−a si a < x ≤ a 1 si x > b Su media y varianza son, respectivamente, E[X] = a + b 2 y V [X] = (b − a) 2 12

2.12 Distribución de Weibull

La variable aleatoria X tiene distribución de Weibull de parámetros a y b, ambos positivos, si su función de densidad es

f (x) = a b x b a−1 exp−x b a , ∀x ≥ 0.

(8)

La función de distribución, o de probabilidad acumulada, es F (x) = 0 si x < 0 P r(X ≤ x) = 1 − exp − x b a si x ≥ 0

La distribución de Weibull se suele utilizar como modelo en problemas de análisis de supervivencia. En este ámbito, es de interés la probabilidad de que se presente el fallo o muerte después de transcurrido un tiempo x; de ahí que se dena la función de supervivencia

S(x) = Pr(X > x) = 1 − F (x) = exp−x b

a

, ∀x ≥ 0.

Por último, la media y la varianza de esta distribución son, respectivamente, E[X] = b · Γ 1 a+ 1 y V [X] = b2 Γ 2 a+ 1 − Γ2 1 a+ 1 ,

donde Γ hace referencia a la función gamma de Euler.

3 DISCRETAS

Cuando la variable X es discreta, esto es, cuando solo toma valores en un conjunto numerable de valores, {xi}, nito o innito, entonces la relación es

F (x) = X

xi≤x

f (xi).

3.1 Distribución binomial

La distribución binomial aparece de forma natural al realizar n repeticiones independientes de cierto experimento cuyo resultado consiste en la presencia, con probabilidad p, de cierto atributo A. La probabilidad p permanece constante durante todo el proceso muestral.

Si Xi es la variable asociada a la i-ésima réplica, que tomará el valor 1 si se

verica A, y 0 en caso contrario, la variable S =

n

X

i=1

Xi

que representa el número de veces que aconteció A, tiene una distribución bino-mial de parámetros ny p, lo que se suele indicar como B(n, p), de forma que su función de probabilidad es f (x) = n x px(1 − p)n−x, x ∈ {1, 2, . . . , n}, siendo su función de distribución

F (x) =        0 si x < 0 P[x] k=0 n k pk_{(1 − p)}n−k _{si x ∈ [0, n]} 1 si x > n

(9)

La media de la distribución binomial es E[X] = np y su varianza V [X] = np(1 − p).

3.2 Distribución binomial negativa

En una secuencia de experimentos independientes con respuesta binaria (cierto suceso A se observa con probabilidad p y deja de observarse con probabilidad 1 − p), el número de veces que A no se verica antes de alcanzar n observaciones de A tiene una distribución binomial negativa, BN(n, p).

Para cada número natural x, la función de probabilidad se dene como f (x) = n + x − 1 x pn(1 − p)x_{, ∀x ∈ N,} siendo su función de distribución

F (x) =    0 si x < 0 P[x] k=0 n + k − 1 k pn_{(1 − p)}k _{si x ≥ 0}

La media de la distribución binomial negativa es E[X] = n(1 − p) p y su varianza V [X] = n(1 − p) p2 , respectivamente.

3.3 Distribución geométrica

En una secuencia de experimentos binarios independienetes (A se observa con probabilidad p y deja de observarse con probabilidad 1-p), el número de réplicas antes de la primera observación de A tiene una distribución geométrica o de Pascal, G(p).

Para cada número natural x, la función de probabilidad se dene como f (x) = p(1 − p)x_{, ∀x ∈ N}

siendo su función de distribución F (x) =

₀ _{si x < 0} 1 − (1 − p)[x]+1 _{si x ≥ 0}

donde [x] hace referencia a la parte entera de x. Su media es E[X] = 1 p− 1 y su varianza V [X] = 1 − p p2 .

De hecho, se trata de un caso especial de la distribución binomial negativa tomando n = 1.

(10)

3.4 Distribución hipergeométrica

Suele aparecer en procesos muestrales sin reemplazo, en los que se investiga la presencia o ausencia de cierta característica.

Si N1 es el número de cápsulas defectuosas en el lote y N2 el de aquéllas

dentro de las tolerancias establecidas, tomada una muestra al azar de tamaño n, la cantidad de unidades observadas no válidas, x, tiene una distribución hipergeométrica HG(N1, N2, n), cuya función de probabilidad es

f (x) = N1 x N2 n − x N1+ N2 n

siendo x un número natural tal que max(0, n − N2) ≤ x ≤ min(N1, n).

La función de distribución toma entonces la forma F (x) = [x] X k=0 N1 k N2 n − x N1+ N2 n

La media de la distribución hipergeométrica es E[X] = nN1 N1+ N2 y su varianza V [X] = nN1N2(N1+ N2− n) (N1+ N2)2(N1+ N2− 1) , respectivamente.

3.5 Distribución de Poisson

Esta distribución aparece en algunos procesos que tienen una dimensión tempo-ral o espacial, como el número de llamadas telefónicas que recibe un servicio de atención a urgencias durante un intervalo de tiempo determinado, o el número de cultivos infectados por una plaga en una cierta región geográca.

La función de probabilidad de una variable aleatoria de Poisson con media µ > 0, que simplicamos con la notación P (µ), es

f (x) = e

−µ_µx

x! , ∀x ∈ N, siendo su función de distribución

F (x) = ₀ si x < 0 P[x] k=0 e−µµk k! si x ≥ 0

Variables aleatorias y distribuciones de probabilidad