Probabilidad: recordatorio 2
PFG-JLF
UAM
Estad´ıstica I, 2018-2019
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 1 / 26
Modelo: vectores aleatorios
Caso discreto.
Definimos lafunci´on de masa conjuntadel vector (X1, . . . ,Xn) como la colecci´on de n´umeros (probabilidades conjuntas)
P(X1 =a1, . . . ,Xn=an)≥0, donde cadaai ∈ sop(Xi), para i = 1, . . . ,n, tales que
X
a1∈sop(X1)
· · · X
an∈sop(Xn)
P(X1 =a1, . . . ,Xn=an) = 1.
C´alculo de probabilidades: la probabilidad de que (X1, . . . ,Xn) tome valores en un cierto subconjuntoA⊂Rn viene dada por
X
(a1,...,an)∈A
P(X1 =a1, . . . ,Xn=an).
Marginales: la funci´on de masa de, por ejemplo, la coordenada X1, viene dada por
P(X1 =α) = X
a2∈sop(X2)
· · · X
an∈sop(Xn)
P(X1 =α,X2=a2, . . . ,Xn=an)
para cadaα∈ sop(X1).
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 3 / 26
C´alculo de medias: Dada una funci´onh:Rn→R, la media de la variable aleatoria
Z =h(X1, . . . ,Xn) es
E(Z) = X
a1∈sop(X1)
· · · X
an∈sop(Xn)
h(a1, . . . ,an)P(X1 =a1, . . . ,Xn=an).
Caso continuo.
El vector aleatorio (X1, . . . ,Xn) se define a trav´es de unafunci´on de densidad conjunta
f(X1,...,Xn)(x1, . . . ,xn) definida enRn tal que
(no negativa) f(X1,...,Xn)(x1, . . . ,xn)≥0;
(integral 1) Z ∞
−∞
· · · Z ∞
−∞
f(X1,...,Xn)(x1, . . . ,xn) dx1· · ·dxn= 1.
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 5 / 26
C´alculo de probabilidades: la probabilidad de que (X1, . . . ,Xn) tome valores en un cierto subconjuntoA⊂Rn viene dada por
Z
A
f(X1,...,Xn)(x1, . . . ,xn) dx1· · ·dxn.
Marginales: lasfunciones de densidad marginalde cada Xi se calculan
fXi(x) = Z ∞
−∞
· · · Z ∞
−∞
f(X1,...,Xn)(x1, . . . ,xi−1,x,xi+1, . . . ,xn)
·dx1· · ·dxi−1dxi+1· · ·dxn (se integra en todas las variables excepto lai-´esima).
C´alculo de medias: la media de la variable aleatoria
Z =h(X1, . . . ,Xn) se calcula en este caso como
E(Z) = Z ∞
−∞
· · · Z ∞
−∞
h(x1, . . . ,xn)f(X1,...,Xn)(x1, . . . ,xn)dx1· · ·dxn.
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 7 / 26
Independencia
Caso discreto: las variables (X1, . . . ,Xn) sonindependientes si P(X1 ∈A1, . . . ,Xn∈An) =P(X1 ∈A1)·P(X2 ∈A2)· · ·P(Xn∈An), para cualesquiera conjuntos (de Borel)A1, . . . ,An⊂R.
Caso continuo: las variables coordenadasXj son independientes si y s´olo si la funci´on de densidad conjunta f(X1,...,Xn) sefactoriza como producto de las funciones de densidad de las coordenadasXj:
f(X1,...,Xn)(x1, . . . ,xn) =fX1(x1)· · ·fXn(xn), para cada (x1, . . . ,xn)∈Rn.
Observaci´on: si las variables
(X1, . . . ,Xn)
son independientes, entonces las variables coordenadas del vector (Y1, . . . ,Yn) = (T1(X1), . . . ,Tn(Xn)),
dondeT1, . . . ,Tnson funciones medibles de RenR,tambi´en son independientes.
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 9 / 26
Covarianzas
Dado un vector aleatorio (X1, . . . ,Xn), la covarianza entre las variablesXi yXj se define como sigue:
cov(Xi,Xj) =E
(Xi−E(Xi))·(Xj−E(Xj))
=E(XiXj)−E(Xi)E(Xj).
(el casoi =j es varianza)
Independencia vs covarianza 0
SiXi yXj son independientes, entonces cov(Xi,Xj) = 0 (pero al rev´es no, en general).
Varianza de sumas
Para 1≤i,j ≤n se tiene que
V(Xi+Xj) =V(Xi) +V(Xj) + 2cov(Xi,Xj).
As´ı que, por ejemplo, siXi yXj son independientes (y por tanto tienen covarianza 0), entonces
V(Xi +Xj) =V(Xi) +V(Xj).
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 11 / 26
Varianza de combinaciones lineales
En general, sia1, . . . ,an∈R, entonces la combinaci´on lineal
n
X
j=1
ajXj
tiene varianza V
Xn
j=1
ajXj
= X
1≤i,j≤n
aiajcov(Xi,Xj)
=
n
X
j=1
aj2V(Xj) + X
1≤i6=j≤n
aiajcov(Xi,Xj).
Coeficientes de correlaci´ on
Elcoeficiente de correlaci´onentre Xi yXj es ρ(Xi,Xj) = cov(Xi,Xj)
pV(Xi)p V(Xj).
ρ(Xi,Xj) est´a definido s´olo si Xi yXj son variables no constantes, es decir, siV(Xi)6= 0 y V(Xj)6= 0.
Si ρ(Xi,Xj) = 0, se dice queXi yXj est´anincorreladas.
Xi yXj independientes implica incorreladas (al rev´es no, en general).
−1≤ρ(X,Y)≤1.
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 13 / 26
Notaci´ on matricial
X=
X1
... Xn
| {z }
vector aleatorio
, x=
x1
... xn
| {z }
vector deRn
, E(X) =
E(X1)
... E(Xn)
| {z }
vector de medias
.
(M´as generalmente, si M= (Xi,j)i,j es unamatriz de dimensiones n×m cuyas componentes son variables aleatorias, escribiremos E(M) para referirnos a la matriz (E(Xi,j))i,j de medias de esas variables.)
SiXes un vector aleatorio de dimensi´onn, si b es un vector de dimensi´onn, y siA es una matrizn×n, entonces
E(A +b) =AE( ) +b.
Matriz de covarianzas
Cov(X) = cov(Xi,Xj)
1≤i,j≤n
(denotandoV(Xi) = cov(Xi,Xi) para las varianzas).
Matricialmente,
Cov(X) =E (X−E(X))·(X−E(X))T .
SiAes una matrizn×n yb es un vector de dimensi´onn, entonces Cov(AX+b) =ACov(X)AT.
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 15 / 26
Matriz de correlaciones:
Σ(X) = ρ(Xi,Xj)
1≤i,j≤n,
La matriz de correlaciones tiene unos en la diagonal.
s´olo est´a definida cuandoV(Xj)6= 0, para 1≤j ≤n.
La matrizΣ(X) es la matriz de covarianzas del vector Xb, cuyas componentes son
Xbj = Xj −E(Xj) pV(Xj) . Matricialmente,
Σ(X) =D·Cov(X)·D, donde
D =
√ 1
V(X1) · · · 0 ... . .. ... 0 · · · √ 1
V(Xn)
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 17 / 26
Matrices de covarianzas y de correlaciones son (semi)definidas positivas
SeaXun vector aleatorio.
Tanto la matriz de covarianzasCov(X) como la matriz de correlacionesΣ(X) deXson
matrices sim´etricas ysemidefinidas positivas.
Basta observar que, para cualquieraT= (a1, . . . ,an)∈Rn, aTCov(X)a=
n
X
j=1
a2j V(Xj) +X
i6=j
cov(Xi,Xj)aiaj
=V(a1X1+· · ·+anXn)≥0.
Si no es definida positiva, es porque para alg´unaT= (a1, . . . ,an) no nulo, la variable aleatoria
a1X1+· · ·+anXn
es una constante.
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 19 / 26
Para la matriz de correlaciones,
aTΣ(X)a=bTCov(X)b≥0, dondebj = √aj
V(Xj) para 1≤j ≤n.
Funciones de densidad de transformaciones lineales
Sea Xun vector aleatorio, con funci´on de densidad conjunta fX(x).
Sea M una matrizn×n invertible, y seab un vectorn×1.
Sea Yel vector aleatorio dado porY=MX+b.
Entonces
fX(x) =fY(Mx+b)|det(M)|, para todox∈Rn, y tambi´en
fY(y) = 1
|det(M)| fX(M−1(y−b)), para todoy∈Rn.
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 21 / 26
Funciones de densidad de la suma
Sea (X,Y) un vector aleatorio con funci´on de densidad conjuntaf(X,Y)(x,y).
La variableZ =X +Y tiene funci´on densidad fX+Y(z) =
Z ∞
−∞
f(X,Y)(x,z−x)dx.
SiX eY son independientes, entonces fX+Y(z) =
Z ∞
−∞
fX(x)fY(z−x)dx.
Teorema central del l´ımite
SeaX una variable aleatoria conE(X2)<∞. Llamamos E(X) =µyV(X) =σ2.
Consideremos una sucesi´on (X1,X2, . . .) de variables aleatorias iid.
Interesa la variable
Sn =
n
X
j=1
Xj.
Su media y varianza son
E(Sn) =nµ, V(Sn) =nσ2.
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 23 / 26
Elteorema central del l´ımitenos dice que, cuandon→ ∞, Sn−nµ
√ nσ2
−−→ Nd (0,1).
La convergencia es en distribuci´on: para cadat ∈R, PSn−nµ
√
nσ2 ≤t
−→Φ(t) cuandon→ ∞.
Si la variable fuera
Zn= 1 n
n
X
j=1
Xj,
cuya media y varianza son
E(Zn) =µ, V(Zn) = σ2 n . el resultado ser´ıa el siguiente: cuandon → ∞,
Zn−µ pσ2/n
−−→ Nd (0,1).
PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 25 / 26
En este curso escribiremos que, para la variable promedio Zn= 1
n
n
X
j=1
Xj,
se tiene que, cuandon→ ∞,
√n Zn−µ d
−−→ N(0, σ2).