Probabilidad: recordatorio 2

(1)

Probabilidad: recordatorio 2

PFG-JLF

UAM

Estad´ıstica I, 2018-2019

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 1 / 26

(2)

Modelo: vectores aleatorios

Caso discreto.

Definimos lafunción de masa conjuntadel vector (X1, . . . ,Xn) como la colección de números (probabilidades conjuntas)

P(X1 =a1, . . . ,Xn=an)≥0, donde cadaa_i ∈ sop(X_i), para i = 1, . . . ,n, tales que

X

a1∈sop(X1)

· · · X

an∈sop(Xn)

P(X1 =a1, . . . ,Xn=an) = 1.

(3)

C´alculo de probabilidades: la probabilidad de que (X₁, . . . ,X_n) tome valores en un cierto subconjuntoA⊂Rⁿ viene dada por

X

(a1,...,an)∈A

P(X₁ =a₁, . . . ,X_n=a_n).

Marginales: la funci´on de masa de, por ejemplo, la coordenada X1, viene dada por

P(X₁ =α) = X

a2∈sop(X2)

· · · X

an∈sop(Xn)

P(X₁ =α,X₂=a₂, . . . ,X_n=a_n)

para cadaα∈ sop(X1).

(4)

C´alculo de medias: Dada una funci´onh:Rⁿ→R, la media de la variable aleatoria

Z =h(X1, . . . ,Xn) es

E(Z) = X

a1∈sop(X1)

· · · X

an∈sop(Xn)

h(a₁, . . . ,a_n)P(X₁ =a₁, . . . ,X_n=a_n).

(5)

Caso continuo.

El vector aleatorio (X1, . . . ,Xn) se define a trav´es de unafunci´on de densidad conjunta

f_(X₁_,...,X_n₎(x1, . . . ,xn) definida enRⁿ tal que

(no negativa) f_(X₁_,...,X_n₎(x₁, . . . ,x_n)≥0;

(integral 1) Z ∞

−∞

· · · Z ∞

−∞

f_(X₁_,...,X_n₎(x₁, . . . ,x_n) dx₁· · ·dx_n= 1.

(6)

C´alculo de probabilidades: la probabilidad de que (X₁, . . . ,X_n) tome valores en un cierto subconjuntoA⊂Rⁿ viene dada por

Z

A

f_(X₁_,...,X_n₎(x1, . . . ,xn) dx1· · ·dxn.

Marginales: lasfunciones de densidad marginalde cada Xi se calculan

fX_i(x) = Z ∞

−∞

· · · Z ∞

−∞

f_(X₁_,...,X_n₎(x1, . . . ,xi−1,x,xi+1, . . . ,xn)

·dx₁· · ·dxi−1dx_i₊₁· · ·dx_n (se integra en todas las variables excepto lai-´esima).

(7)

C´alculo de medias: la media de la variable aleatoria

Z =h(X1, . . . ,Xn) se calcula en este caso como

E(Z) = Z ∞

−∞

· · · Z ∞

−∞

h(x₁, . . . ,x_n)f_(X₁_,...,X_n₎(x₁, . . . ,x_n)dx₁· · ·dx_n.

(8)

Independencia

Caso discreto: las variables (X₁, . . . ,X_n) sonindependientes si P(X1 ∈A1, . . . ,Xn∈An) =P(X1 ∈A1)·P(X₂ ∈A2)· · ·P(Xn∈An), para cualesquiera conjuntos (de Borel)A1, . . . ,An⊂R.

Caso continuo: las variables coordenadasX_j son independientes si y s´olo si la funci´on de densidad conjunta f_(X₁_,...,X_n₎ sefactoriza como producto de las funciones de densidad de las coordenadasX_j:

f_(X₁_,...,X_n₎(x1, . . . ,xn) =fX1(x1)· · ·fXn(xn), para cada (x₁, . . . ,x_n)∈Rⁿ.

(9)

Observaci´on: si las variables

(X₁, . . . ,X_n)

son independientes, entonces las variables coordenadas del vector (Y1, . . . ,Yn) = (T1(X1), . . . ,Tn(Xn)),

dondeT₁, . . . ,T_nson funciones medibles de RenR,tambi´en son independientes.

(10)

Covarianzas

Dado un vector aleatorio (X₁, . . . ,X_n), la covarianza entre las variablesX_i yX_j se define como sigue:

cov(X_i,X_j) =E

(X_i−E(X_i))·(X_j−E(X_j))

=E(X_iX_j)−E(X_i)E(X_j).

(el casoi =j es varianza)

Independencia vs covarianza 0

SiXi yXj son independientes, entonces cov(Xi,Xj) = 0 (pero al rev´es no, en general).

(11)

Varianza de sumas

Para 1≤i,j ≤n se tiene que

V(Xi+Xj) =V(Xi) +V(Xj) + 2cov(Xi,Xj).

As´ı que, por ejemplo, siXi yXj son independientes (y por tanto tienen covarianza 0), entonces

V(X_i +X_j) =V(X_i) +V(X_j).

(12)

Varianza de combinaciones lineales

En general, sia₁, . . . ,a_n∈R, entonces la combinaci´on lineal

n

X

j=1

ajXj

tiene varianza V

Xⁿ

j=1

a_jX_j

= X

1≤i,j≤n

a_ia_jcov(X_i,X_j)

=

n

X

j=1

a_j²V(X_j) + X

1≤i6=j≤n

a_ia_jcov(X_i,X_j).

(13)

Coeficientes de correlaci´ on

Elcoeficiente de correlaci´onentre X_i yX_j es ρ(Xi,Xj) = cov(X_i,X_j)

pV(X_i)p V(X_j).

ρ(Xi,Xj) est´a definido s´olo si Xi yXj son variables no constantes, es decir, siV(X_i)6= 0 y V(X_j)6= 0.

Si ρ(X_i,X_j) = 0, se dice queX_i yX_j est´anincorreladas.

Xi yXj independientes implica incorreladas (al rev´es no, en general).

−1≤ρ(X,Y)≤1.

(14)

Notaci´ on matricial

X=





 X1

... Xn







| {z }

vector aleatorio

, x=





 x1

... xn







| {z }

vector deRⁿ

, E(X) =





 E(X1)

... E(Xn)







| {z }

vector de medias

.

(M´as generalmente, si M= (Xi,j)i,j es unamatriz de dimensiones n×m cuyas componentes son variables aleatorias, escribiremos E(M) para referirnos a la matriz (E(X_i,j))_i,j de medias de esas variables.)

SiXes un vector aleatorio de dimensi´onn, si b es un vector de dimensi´onn, y siA es una matrizn×n, entonces

E(A +b) =AE( ) +b.

(15)

Matriz de covarianzas

Cov(X) = cov(X_i,X_j)

1≤i,j≤n

(denotandoV(X_i) = cov(X_i,X_i) para las varianzas).

Matricialmente,

Cov(X) =E (X−E(X))·(X−E(X))^T .

SiAes una matrizn×n yb es un vector de dimensi´onn, entonces Cov(AX+b) =ACov(X)A^T.

(16)

Matriz de correlaciones:

Σ(X) = ρ(Xi,Xj)

1≤i,j≤n,

La matriz de correlaciones tiene unos en la diagonal.

s´olo est´a definida cuandoV(X_j)6= 0, para 1≤j ≤n.

(17)

La matrizΣ(X) es la matriz de covarianzas del vector Xb, cuyas componentes son

Xbj = Xj −E(Xj) pV(X_j) . Matricialmente,

Σ(X) =D·Cov(X)·D, donde

D =







√ 1

V(X1) · · · 0 ... . .. ... 0 · · · √ ¹

V(Xn)







(18)

Matrices de covarianzas y de correlaciones son (semi)definidas positivas

SeaXun vector aleatorio.

Tanto la matriz de covarianzasCov(X) como la matriz de correlacionesΣ(X) deXson

matrices sim´etricas ysemidefinidas positivas.

(19)

Basta observar que, para cualquiera^T= (a1, . . . ,an)∈Rⁿ, a^TCov(X)a=

n

X

j=1

a²_j V(X_j) +X

i6=j

cov(X_i,X_j)a_ia_j

=V(a₁X₁+· · ·+a_nX_n)≥0.

Si no es definida positiva, es porque para alg´una^T= (a₁, . . . ,a_n) no nulo, la variable aleatoria

a1X1+· · ·+anXn

es una constante.

(20)

Para la matriz de correlaciones,

a^TΣ(X)a=b^TCov(X)b≥0, dondeb_j = √^a^j

V(Xj) para 1≤j ≤n.

(21)

Funciones de densidad de transformaciones lineales

Sea Xun vector aleatorio, con funci´on de densidad conjunta f_X(x).

Sea M una matrizn×n invertible, y seab un vectorn×1.

Sea Yel vector aleatorio dado porY=MX+b.

Entonces

f_X(x) =f_Y(Mx+b)|det(M)|, para todox∈Rⁿ, y tambi´en

f_Y(y) = 1

|det(M)| f_X(M⁻¹(y−b)), para todoy∈Rⁿ.

(22)

Funciones de densidad de la suma

Sea (X,Y) un vector aleatorio con funci´on de densidad conjuntaf_(X_,Y₎(x,y).

La variableZ =X +Y tiene funci´on densidad f_X_+Y(z) =

Z ∞

−∞

f_(X_,Y₎(x,z−x)dx.

SiX eY son independientes, entonces fX+Y(z) =

Z ∞

−∞

fX(x)fY(z−x)dx.

(23)

Teorema central del l´ımite

SeaX una variable aleatoria conE(X²)<∞. Llamamos E(X) =µyV(X) =σ².

Consideremos una sucesi´on (X1,X2, . . .) de variables aleatorias iid.

Interesa la variable

S_n =

n

X

j=1

X_j.

Su media y varianza son

E(Sn) =nµ, V(Sn) =nσ².

(24)

Elteorema central del l´ımitenos dice que, cuandon→ ∞, Sn−nµ

√ nσ²

−−→ Nd (0,1).

La convergencia es en distribuci´on: para cadat ∈R, PS_n−nµ

√

nσ² ≤t

−→Φ(t) cuandon→ ∞.

(25)

Si la variable fuera

Z_n= 1 n

n

X

j=1

X_j,

cuya media y varianza son

E(Zn) =µ, V(Zn) = σ² n . el resultado ser´ıa el siguiente: cuandon → ∞,

Zn−µ pσ²/n

−−→ Nd (0,1).

(26)

En este curso escribiremos que, para la variable promedio Z_n= 1

n

X

j=1

X_j,

se tiene que, cuandon→ ∞,

√n Zn−µ d

−−→ N(0, σ²).