• No se han encontrado resultados

Probabilidad: recordatorio 2

N/A
N/A
Protected

Academic year: 2023

Share "Probabilidad: recordatorio 2"

Copied!
26
0
0

Texto completo

(1)

Probabilidad: recordatorio 2

PFG-JLF

UAM

Estad´ıstica I, 2018-2019

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 1 / 26

(2)

Modelo: vectores aleatorios

Caso discreto.

Definimos lafunci´on de masa conjuntadel vector (X1, . . . ,Xn) como la colecci´on de n´umeros (probabilidades conjuntas)

P(X1 =a1, . . . ,Xn=an)≥0, donde cadaai ∈ sop(Xi), para i = 1, . . . ,n, tales que

X

a1sop(X1)

· · · X

ansop(Xn)

P(X1 =a1, . . . ,Xn=an) = 1.

(3)

C´alculo de probabilidades: la probabilidad de que (X1, . . . ,Xn) tome valores en un cierto subconjuntoA⊂Rn viene dada por

X

(a1,...,an)∈A

P(X1 =a1, . . . ,Xn=an).

Marginales: la funci´on de masa de, por ejemplo, la coordenada X1, viene dada por

P(X1 =α) = X

a2sop(X2)

· · · X

ansop(Xn)

P(X1 =α,X2=a2, . . . ,Xn=an)

para cadaα∈ sop(X1).

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 3 / 26

(4)

C´alculo de medias: Dada una funci´onh:Rn→R, la media de la variable aleatoria

Z =h(X1, . . . ,Xn) es

E(Z) = X

a1sop(X1)

· · · X

ansop(Xn)

h(a1, . . . ,an)P(X1 =a1, . . . ,Xn=an).

(5)

Caso continuo.

El vector aleatorio (X1, . . . ,Xn) se define a trav´es de unafunci´on de densidad conjunta

f(X1,...,Xn)(x1, . . . ,xn) definida enRn tal que

(no negativa) f(X1,...,Xn)(x1, . . . ,xn)≥0;

(integral 1) Z

−∞

· · · Z

−∞

f(X1,...,Xn)(x1, . . . ,xn) dx1· · ·dxn= 1.

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 5 / 26

(6)

C´alculo de probabilidades: la probabilidad de que (X1, . . . ,Xn) tome valores en un cierto subconjuntoA⊂Rn viene dada por

Z

A

f(X1,...,Xn)(x1, . . . ,xn) dx1· · ·dxn.

Marginales: lasfunciones de densidad marginalde cada Xi se calculan

fXi(x) = Z

−∞

· · · Z

−∞

f(X1,...,Xn)(x1, . . . ,xi−1,x,xi+1, . . . ,xn)

·dx1· · ·dxi−1dxi+1· · ·dxn (se integra en todas las variables excepto lai-´esima).

(7)

C´alculo de medias: la media de la variable aleatoria

Z =h(X1, . . . ,Xn) se calcula en este caso como

E(Z) = Z

−∞

· · · Z

−∞

h(x1, . . . ,xn)f(X1,...,Xn)(x1, . . . ,xn)dx1· · ·dxn.

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 7 / 26

(8)

Independencia

Caso discreto: las variables (X1, . . . ,Xn) sonindependientes si P(X1 ∈A1, . . . ,Xn∈An) =P(X1 ∈A1)·P(X2 ∈A2)· · ·P(Xn∈An), para cualesquiera conjuntos (de Borel)A1, . . . ,An⊂R.

Caso continuo: las variables coordenadasXj son independientes si y s´olo si la funci´on de densidad conjunta f(X1,...,Xn) sefactoriza como producto de las funciones de densidad de las coordenadasXj:

f(X1,...,Xn)(x1, . . . ,xn) =fX1(x1)· · ·fXn(xn), para cada (x1, . . . ,xn)∈Rn.

(9)

Observaci´on: si las variables

(X1, . . . ,Xn)

son independientes, entonces las variables coordenadas del vector (Y1, . . . ,Yn) = (T1(X1), . . . ,Tn(Xn)),

dondeT1, . . . ,Tnson funciones medibles de RenR,tambi´en son independientes.

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 9 / 26

(10)

Covarianzas

Dado un vector aleatorio (X1, . . . ,Xn), la covarianza entre las variablesXi yXj se define como sigue:

cov(Xi,Xj) =E

(Xi−E(Xi))·(Xj−E(Xj))

=E(XiXj)−E(Xi)E(Xj).

(el casoi =j es varianza)

Independencia vs covarianza 0

SiXi yXj son independientes, entonces cov(Xi,Xj) = 0 (pero al rev´es no, en general).

(11)

Varianza de sumas

Para 1≤i,j ≤n se tiene que

V(Xi+Xj) =V(Xi) +V(Xj) + 2cov(Xi,Xj).

As´ı que, por ejemplo, siXi yXj son independientes (y por tanto tienen covarianza 0), entonces

V(Xi +Xj) =V(Xi) +V(Xj).

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 11 / 26

(12)

Varianza de combinaciones lineales

En general, sia1, . . . ,an∈R, entonces la combinaci´on lineal

n

X

j=1

ajXj

tiene varianza V

Xn

j=1

ajXj

= X

1≤i,j≤n

aiajcov(Xi,Xj)

=

n

X

j=1

aj2V(Xj) + X

1≤i6=j≤n

aiajcov(Xi,Xj).

(13)

Coeficientes de correlaci´ on

Elcoeficiente de correlaci´onentre Xi yXj es ρ(Xi,Xj) = cov(Xi,Xj)

pV(Xi)p V(Xj).

ρ(Xi,Xj) est´a definido s´olo si Xi yXj son variables no constantes, es decir, siV(Xi)6= 0 y V(Xj)6= 0.

Si ρ(Xi,Xj) = 0, se dice queXi yXj est´anincorreladas.

Xi yXj independientes implica incorreladas (al rev´es no, en general).

−1≤ρ(X,Y)≤1.

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 13 / 26

(14)

Notaci´ on matricial

X=

 X1

... Xn

| {z }

vector aleatorio

, x=

 x1

... xn

| {z }

vector deRn

, E(X) =

 E(X1)

... E(Xn)

| {z }

vector de medias

.

(M´as generalmente, si M= (Xi,j)i,j es unamatriz de dimensiones n×m cuyas componentes son variables aleatorias, escribiremos E(M) para referirnos a la matriz (E(Xi,j))i,j de medias de esas variables.)

SiXes un vector aleatorio de dimensi´onn, si b es un vector de dimensi´onn, y siA es una matrizn×n, entonces

E(A +b) =AE( ) +b.

(15)

Matriz de covarianzas

Cov(X) = cov(Xi,Xj)

1≤i,j≤n

(denotandoV(Xi) = cov(Xi,Xi) para las varianzas).

Matricialmente,

Cov(X) =E (X−E(X))·(X−E(X))T .

SiAes una matrizn×n yb es un vector de dimensi´onn, entonces Cov(AX+b) =ACov(X)AT.

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 15 / 26

(16)

Matriz de correlaciones:

Σ(X) = ρ(Xi,Xj)

1≤i,j≤n,

La matriz de correlaciones tiene unos en la diagonal.

s´olo est´a definida cuandoV(Xj)6= 0, para 1≤j ≤n.

(17)

La matrizΣ(X) es la matriz de covarianzas del vector Xb, cuyas componentes son

Xbj = Xj −E(Xj) pV(Xj) . Matricialmente,

Σ(X) =D·Cov(X)·D, donde

D =

1

V(X1) · · · 0 ... . .. ... 0 · · · √ 1

V(Xn)

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 17 / 26

(18)

Matrices de covarianzas y de correlaciones son (semi)definidas positivas

SeaXun vector aleatorio.

Tanto la matriz de covarianzasCov(X) como la matriz de correlacionesΣ(X) deXson

matrices sim´etricas ysemidefinidas positivas.

(19)

Basta observar que, para cualquieraT= (a1, . . . ,an)∈Rn, aTCov(X)a=

n

X

j=1

a2j V(Xj) +X

i6=j

cov(Xi,Xj)aiaj

=V(a1X1+· · ·+anXn)≥0.

Si no es definida positiva, es porque para alg´unaT= (a1, . . . ,an) no nulo, la variable aleatoria

a1X1+· · ·+anXn

es una constante.

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 19 / 26

(20)

Para la matriz de correlaciones,

aTΣ(X)a=bTCov(X)b≥0, dondebj = √aj

V(Xj) para 1≤j ≤n.

(21)

Funciones de densidad de transformaciones lineales

Sea Xun vector aleatorio, con funci´on de densidad conjunta fX(x).

Sea M una matrizn×n invertible, y seab un vectorn×1.

Sea Yel vector aleatorio dado porY=MX+b.

Entonces

fX(x) =fY(Mx+b)|det(M)|, para todox∈Rn, y tambi´en

fY(y) = 1

|det(M)| fX(M−1(y−b)), para todoy∈Rn.

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 21 / 26

(22)

Funciones de densidad de la suma

Sea (X,Y) un vector aleatorio con funci´on de densidad conjuntaf(X,Y)(x,y).

La variableZ =X +Y tiene funci´on densidad fX+Y(z) =

Z

−∞

f(X,Y)(x,z−x)dx.

SiX eY son independientes, entonces fX+Y(z) =

Z

−∞

fX(x)fY(z−x)dx.

(23)

Teorema central del l´ımite

SeaX una variable aleatoria conE(X2)<∞. Llamamos E(X) =µyV(X) =σ2.

Consideremos una sucesi´on (X1,X2, . . .) de variables aleatorias iid.

Interesa la variable

Sn =

n

X

j=1

Xj.

Su media y varianza son

E(Sn) =nµ, V(Sn) =nσ2.

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 23 / 26

(24)

Elteorema central del l´ımitenos dice que, cuandon→ ∞, Sn−nµ

√ nσ2

−−→ Nd (0,1).

La convergencia es en distribuci´on: para cadat ∈R, PSn−nµ

2 ≤t

−→Φ(t) cuandon→ ∞.

(25)

Si la variable fuera

Zn= 1 n

n

X

j=1

Xj,

cuya media y varianza son

E(Zn) =µ, V(Zn) = σ2 n . el resultado ser´ıa el siguiente: cuandon → ∞,

Zn−µ pσ2/n

−−→ Nd (0,1).

PFG-JLF (UAM) Probabilidad: recordatorio 2 Estad´ıstica I, 2018-2019 25 / 26

(26)

En este curso escribiremos que, para la variable promedio Zn= 1

n

n

X

j=1

Xj,

se tiene que, cuandon→ ∞,

√n Zn−µ d

−−→ N(0, σ2).

Referencias

Documento similar

En el caso de variables continuas la funci´ on de densidad ser´ a aquella funci´ on que para cualquier intervalo de valores [a, b] el ´ area que encierra la funci´ on entre a y b