• No se han encontrado resultados

Distribucions bivariants, independencia, covariància, correlació

N/A
N/A
Protected

Academic year: 2022

Share "Distribucions bivariants, independencia, covariància, correlació"

Copied!
29
0
0

Texto completo

(1)

Distribucions bivariants, independencia, covari` ancia, correlaci´ o

Albert Satorra

UPF

(2)

Continguts

1 Variables aleat`ories bivariants (discretes)

Distribucions conjuntes, marginals, condicionades, esperan¸ca condicional

Independencia entre variables

2 Associaci´o entre variables: Covari`ancia i correlaci´o Desigualtat de Cauchy-Schwarz, acotaci´o de ρXY

3 Exemples

(3)

Introducci´ o

Interessa la variaci´o conjunte de dues o m´es variables aleat`ories lligades al mateix espai mostral Ω. Primer ens centrarem en dues variables X i Y discretes. Motivem el tema amb un exemple.

Exemple: Tenim una caixa amb boles 1 2 3 de la que fem dues extraccions. Sigui X la bola de la primera extracci´o i Y la bola de la segona extracci´o. Considerem dos casos: i) extraccions sense restituci´o, i ii) extraccions amb restituci´o. En i), la distribuci´o de probabilitat conjunta PXY(x , y ) (les probabilitats p(x , y ) de les diferents combinacions dels valors de les variables ) ´es

PXY 1 2 3 PY(y )

1 0 1/6 1/6 1/3

2 1/6 0 1/6 1/3

3 1/6 1/6 0 1/3

PX(x ) 1/3 1/3 1/3 1

(4)

En ii), la distribuci´o de probabilitat conjunta PXY(x , y ) ´es

PXY 1 2 3 PY(y )

1 1/9 1/9 1/9 1/3

2 1/9 1/9 1/9 1/3

3 1/9 1/9 1/9 1/3

PX(x ) 1/3 1/3 1/3 1

(5)

Distribuci´ o bivariant discreta

Z = (X,Y) a valors un conjunt finit o infinit numerable Ω lligats a un experiment aleatori. Distribuci´o de Probabilitat Conjunta:

PXY(xi, yj) = P([X = xi] ∩ [Y = yj]) (probabilitats dels diferents valors de la variable). Tenim que

PXY(xi, yj) ≥ 0 P

x ,yPXY(xi, yj) = 1

De la conjunta obtenim les Distribucions Marginals:

PX(x ) =P

yPXY(x , y ), marginal de X PY(y ) =P

xp(x , y ) , marginal de Y

NOTA: de les marginals no podem obtenir la distribuci´o conjunta, llevat el cas en que X i Y s´on independents (ho veurem d’aqu´ı un moment).

(6)

Distribuci´ o condicionada (condicional), Y | X = x , X | Y = y

Si sabem s’ha produit X = x , modifica aquesta informaci´o la P(Y ) ? Parlarem de la variable Y condicionada a X = x, Y | X = x . Parlem de la distribuci´o de probabilitat condicionalPY |X

PY |X(y ) = PXY(x , y ) PX(x )

o, simplement, PX |Y Noteu que hi ha una distribuci´o condicional diferent per cada valor de la variable X. Podem considerar tamb´e l’ esperan¸ca condicionada E [Y | X ]

E (Y | X = x ) =X

j

yjP[yj | x]

que ´es una funci´o de x . A vegades, E (Y | X = x ) ´es linial en x, ´es a dir

(7)

Independencia entre X i Y :

Quan Y | X = x ´es igual a Y , o de forma equivalent, quan PY |X = PY, parlem de independ`encia entre X i Y.

Hi ha independ`encia entre X i Y si (i nom´es si) PXY(x , y ) = PX(x )PY(y )

´

es a dir, distribuci´o de probabilitat conjunta ´es el producte de les marginals. ´Es una propietat sim`etrica, independ`encia entre X i Y implica

(Y | X = x ) = Y i

(X | Y = y ) = X

(8)

Esperan¸ ca d’una funci´ o g (X , Y )

E (g (X , Y )) =X

x

X

y

g (x , y )P(x , y ) Ara podem demostrar E (X + Y ) = EX + EY :

E (X + Y ) =X

x

X

y

(x + y )P(x , y ) =X

x

X

y

xP(x , y ) +X

x

X

y

yP(x , y )

=X

x

x (X

y

P(x , y )) +X

y

y (X

x

P(x , y ))

=X

x

x (pX(x )) +X

y

y (pY(y )) = E (X ) + E (Y )

(9)

Exemple: E (XY )

E (XY ) =X

x

X

y

xyP(x , y )

Es verifica que E (XY ) = E (X )E (Y )?? Considereu dues variables X i Y i la varian¸ca de la variable (univariant) suma X + Y

V (X + Y ) = E ((X + Y )2) − (E (X + Y ))2 (E (X + Y ))2= (EX )2+ (EY )2+ 2(EX )(EY )

E (X + Y )2= E (X2+ Y2+ 2XY ) = E (X2) + E (Y2) + 2E (XY ) De manera que

V (X +Y ) = (E (X2)−(EX )2)+(E (Y2)−(EY )2)+2(E (XY )−(EX )(EY ))

= V (X ) + V (Y ) + 2 {E (XY ) − (EX )(EY )}

(10)

Associaci´ o entre variables: Covari` ancia, C (X , Y ), σ

XY

La σXY entre dues variables aleat`ories X i Y ´es

σXY = E (X − µX)(Y − µY) = E (XY ) − E (X )E (Y ) Mesura associaci´o (variaci´o conjunta) entre les dues variables X i Y . NOTEU: C(X,Y)= 0 no implica independ`encia entre X i Y.Per un exemple, considerem X: -1 0 1 amb distribuci´o uniforme (P[X=x] = 1/3), aleshores la va Y = X2no ´es independent de X i, en canvi, C (X , Y ) = 0

Ara podem enunciar una nova propietat de la vari`ancia.

(11)

Propietats de la vari` ancia de la suma i esperan¸ ca del producte el cas de independ` encia

Independ`encia entre X i Y implica EXY = EXEY (⇔ Cov (X , Y ) = 0)

Demostraci´o:

EXY =X x

X y

xyPXY(x , y ) =X x

X y

xyPX(x )PY(y )

= X

x xPX(x )

!

X

y yPY(y )

 = E (X )E (Y )

V (X + Y ) = VX + VY (Noteu que V (X − Y ) = VX + VY ) malgrat la indepen`encia, en general, V (X .Y ) 6= V (X )V (Y ) Independencia entre m´es de dues variables aleat`ories X1, . . . , XK:

PX1X2...XK(x1, . . . , xK) = PX1(x1) . . . PXK(xK) En aquest cas: E (X1X2. . . XK) = E (X1)E (X2) . . . E (XK).

(12)

Propietat fonamental:

V (X + Y ) = V (X ) + V (Y ) + 2Cov (X , Y )

V(X +Y) = V(X) + V(Y) + 2Cov(X,Y)

Demostraci´o

V (X + Y ) = E [(X + Y )2] − [E (X + Y )]2

= EX2+ EY2+ 2EXY − ((EX )2+ (EY )2+ 2(EX )(EY ))

= (EX2− (EX )2) + (EY2− (EY )2) + 2(EXY − (EX )(EY )) V (X ) + V (Y ) + 2C (X , Y )

Si X1, X2, . . . Xn s´on (mutuament) independents:

V (X1+ X2+ · · · + Xn) = V (X1) + V (X2) + · · · + V (Xn) E (X1× X2× · · · × Xn) = E (X1) × E (X2) × · · · × E (Xn)

(13)

Propietats del operador covari` ancia

Cov(X,Y) = Cov(Y,X)

Cov(k,Z) = 0 (aqu´ı k denota una variable aleatoria constant) V(X) = Cov(X,X)

Cov(kX,Y) = kCov(X,Y) (noteu que k pot esser negatiu, de manera que Cov(-2X,Y) = -2Cov(X,Y)

Cov(X+k,Y) = Cov(X,Y)

Cov(X+Y,Z) = Cov(X,Z) + Cov(Y,Z) .

(14)

Exemple

Tenim una caixa amb les boles 1 2 3 i efectuem dues extraccions.

Considerem dos casos: (i) amb restituci´o; (ii) sense restituci´o. X ´es el n´umero de la primera extracci´o i Y al n´umero corresponent a la segona extracci´o. Cal calcular Cov(X,Y) en els dos casos.

En ambdos casos (i) i (ii), tenim

EX = EY = (3 + 1)/2 = 2 V (X ) = V (Y ) = (2 × 4)/12 = 2/3

σX = σY =p 2/3 En el cas (ii):

EXY = 1×2×1/6+1×3×1/6+2×1×1/6+2×3×1/6+3×1×1/6+3×2×1/6

= (2 + 3 + 2 + 6 + 3 + 6)/6 = 22/6 = 11/3

(15)

Exemple (cont.)

De manera que

C (X , Y ) = 11/3 − 4 = 11/3 − 12/3 = −1/3 ρ(X , Y ) = −1/3

2/3 = −0.5

PY |X =1(1) = 0; PY |X =1(2) = 1/2; PY |X =1(3) = 1/2

⇒ E (Y | X = 1) = (2 + 3)/2 = 2.5

PY |X =2(1) = 1/2; PY |X =2(2) = 0; PY |X =2(3) = 1/2

⇒ E (Y | X = 2) = (1 + 3)/2 = 2

PY |X =3(1) = 1/2; PY |X =3(2) = 1/2; PY |X =3(3) = 0

⇒ E (Y | X = 3) = (1 + 2)/2 = 1.5

(16)

Independ` encia implica σ

XY

= ρ

XY

= 0

Si les variables X i Y s´on independents, aleshores E (XY ) = E (X )E (Y ) de manera que σXY = 0 i ρXY = σσXY

XσY = 0.

Tamb´e es pot veure que en el cas de independ`encia, E (Y | X ) = E (Y ), idem E (X | Y ) = E (X ); ´es a dir, les esperances condicionades s´on les mateixes que sense condicionar.

(17)

compte! σ

XY

= ρ

XY

= 0 NO implica Independ` encia

PXY 0 1 PX(x )

−1 0 1/3 1/3

0 1/3 0 1/3

1 0 1/3 1/3

PY(y ) 1/3 2/3 1

En aquest cas, Y = X2 ; ´es a dir, no s´on independents. Tot i aix`o, podem veure que σ12= ρ12= 0. ´Es a dir, que covari`ancia zero no guaranteix independ`encia. Solament en el cas (o veurem) de distribuci´o conjunta normal bivariant.

(18)

Exemple d’esperan¸ca condicional

Noteu que E (Y | X = x ) ´es una funci´o de x , que podem representar en el gr`afic de regressi´o seg¨uent:

Figure : La funci´o de regressi´o E (Y | X )

regressio Y | X

X E(Y | X) 0.00.51.01.52.02.53.0

1 2 3

(19)

Exemple (cont.)

En el cas (i) (amb restituci´o), tenim:

EXY = 1×2×(1/9)+1×3×(1/9)+2×1×(1/9)+2×3×(1/9)+3×1×(1/9)+3×2×(1/9)+1×1×(1/9)+2×2×(1/9)+3×3×(1/9) (2 + 3 + 2 + 6 + 3 + 6 + 1 + 4 + 9)/9 = 36/9 = 4

De manera que

C (X , Y ) = 4 − 4 = 0

En aquest cas (i), PY |X =x(y ) = PY(y ) = 1/3, de manera que

E (Y | X = x ) = E (Y ) = 2 per qualsevol valor de x , de manera que la funci´o de regressi´o E (Y | X = x ) ´es constant en x

(20)

Exemple (cont.): Esperan¸ ca condicional, E (Y | X )

E (Y | X = x ) ´es constant en x

Figure : La regressi´o E (Y | X )

regressio E(Y | X), cas (i) amb restitucio

X E(Y | X) 0.00.51.01.52.02.53.0

1 2 3

(21)

Correlaci´ o entre les variables X i Y , ρ(X , Y ), ρ

XY

, r

XY

ρXY = C (X , Y )

pV (X )V (Y ) = σXY σXσY

Noteu tamb´e que σXY = ρXYσXσY, de manera que podem obtenir la covari`ancia a partir de la correlaci´o i les desviacions est`andards. De fet, ρXY coincideix amb la covari`ancia si les X i Y s´on variables

estandarditzades (tipificades, amb esperan¸ca zero, i vari`ancia 1). Veurem que

−1 ≤ ρXY ≤ 1

amb igualtat (a 1 o −1) solament si hi ha relaci´o lineal exacta entre elles, si hi ha a, b, c tal que aX + bY = c. Independ`encia implica correlaci´o zero, per`o correlaci´o zero no implica independ`encia. Noteu que hi ha correlaci´o zero si i solament si la covari`ancia ´es zero.

(22)

Desigualtat de Cauchy-Schwarz i acotaci´ o de ρ

XY Si X i Y s´on dues variables aleat`ories lligades al mateix Ω i am valor esperat finit, aleshores:

(EXY )2 ≤ EX2EY2

Demostraci´o: Si Z = kX + Y , aleshores Z2= k2X2+ Y2+ 2kXY . Tenim que 0 ≤ E (Z2) = k2EX2+ 2kEXY + EY2, d’on obtenim ... (recordeu ax2+ bx + c = 0, el discriminant de l’equaci´o ∆ = b2− 4ac ≤ 0 . . . Si ∆ = 0 aleshores hi ha un k amb Z = kX + Y = 0, ´es a dir, Y = kX ).

Apliqueu la desigualtat anterior a les variables centrades X − µX i Y − µY, i obteniu

(Cov (X , Y ))2≤ V (X )V (Y ) De manera que

(Cov (X , Y ))2

V (X )V (Y ) = Cov (X , Y ) σXσy

2

= ρ2XY ≤ 1

(23)

. . . acotaci´ o −1 ≤ ρ

XY

≤ +1

amb igualtat si i solament si hi ha una dependencia linial exacta entre X i Y, si hi han a i b tals que Y = a + bX .

Noteu que obtenim igualtat (es a dir correlaci´o +1 o −1) en el cas

solament que hi hagi un valor de k pel que Y − µY = k(X − µX), ´es a dir, quan Y = (µY − kµX) + kX = a + bX .

Donades les variables X1 i X2 la matriu Σ =

 σ12 σ12 σ12 σ22



S’anomena matriu de var. -covar. del vector aleatoria (X1, X2). Per la desigualtat de Cauchy-Schwarz, el determinant d’aquest matriu σ212− σ21σ22 ≥ 0. Direm que Σ ´es una matriu semi-definida positiva.

(24)

Exemple:

Tenim una caixa amb boles 1 2 3 4 de la que fem dues extraccions.

Sigui X la bola de la primera extracci´o i Y la bola de la segona extracci´o.

Considerem dos casos a) extraccions sense restituci´o i b) extraccions amb restituci´o. Considerarem primer el cas a). En aquest cas la distribuci´o de probabilitat conjunta ser`a

PXY 1 2 3 4

1 0 1/12 1/12 1/12

2 1/12 0 1/12 1/12

3 1/12 1/12 0 1/12

4 1/12 1/12 1/12 0

(25)

Exemple:

Cal considerar les distribucions de probabilitat marginals que, en aquest exemple, seran distribucions uniformes de 1 a 4. En aquest cas a) les variables X i Y no s´on independents. Tamb´e podem considerar les corresponents distribucions de probabilitat condicionals. Y | X o X | Y . Tenim que la distribuci´o condicionada Y | X = 3 ser`a:

Y | X = 3 : 1 2 3 4 PY |X =3 : 1/3 1/3 0 1/3

(26)

exemple (cont.)

Tenim que E (Y | X = 3) = 7/3. De fet,

X : 1 2 3 4

E (Y | X ) 9/3 8/3 7/3 6/3

(fer una representaci´o gr`afica de E (Y | X = x ) que ´es linial en x Noteu que Cov (X , Y ) = EXY − EXEY = 35/6 − (2.5)(2.5) = −0.4166. La variancia de les marginals ´es:

V (X ) = EXX − EXEX = 30/4 − (2.5)(2.5) = 1.25 = 1.1092 Per tant, la correlaci´o ser`a: ρ = −0.41661.25×1.25 = −0.333

(27)

exemple (cont.)

Podem ara considerar el cas ii) d’ extraccions amb restituci´o. En aquest cas ´es f`acil veure que hi ha independ`encia entre X i Y , que les

distribucions marginals s´on iguals, que les esperances condicionades s´on iguals constants, que la covariancia i la correlaci´o s´on zero, etc.

(28)

Exemples:

Tenim dos valors de borsa X i Y cada un amb guany esperat 100 amb vari`ancia 10. Tenim l’opci´o de i) comprar-ne 2 valors de X o ii) comprar-ne un de X i un de Y . Quina de les dues inversions t´e m´es risc?. Comenteu els tres casos: Cov(X,Y) = 0, Cov(X,Y) positiva, Cov(X,Y) negativa.

(29)

1 Considerem els valors X i Y amb distribuci´o de probabilitat conjunta

PXY 1 2 3

1 0.2 0.1 0.1 2 0.4 0.1 0.1

Trobeu les distribucions de probabilitat condicionades, marginals, la covari`ancia, esperan¸ca condicional, etc.

2 Si invertim 100 euros, que t´e m´es vari`ancia (risc), comprar deu bons de 10 en el mateix actiu X , o comprar deu bonos de 10 en deu actius diferents X1, . . . , X10 independents. Suposeu que el valor esperat i la vari`ancia s´on iguals en tots els actius. Hi ha difer`encia entre valors esperats de les dues opcions?

Referencias

Documento similar

asilo a la luz del nuevo marco jurídico de la UE 901 miguel azpitarte sánchez Integración europea y legitimidad de la jurisdicción constitucio- nal941 rosario ogjinaga ruiz

ccLa vigente Ley de Procedimiento administrativo de 17 de julio de 1958, mediante sus artículos 129 a 132, instituye un procedimiento para la elaboración de las disposiciones

los hombres. Porque la insigne ohl';] de la encarnaciOll del Hijo y de la redencion del mundo, no podia darse á entender sino por unos hombres ilustrados por el Espíritu Santo. En

También se han llevado a cabo una serie de actividades para la difusión de la Ley 35/2011, como han sido la celebración de jornadas y ponencias sobre la titularidad compartida

De la intersección de la líneas de acción de esta fuerzas se construye el polígono de fuerzas que nos dará la línea de empujes correspondiente a las posiciones de E y R

(13) La preservación, el análisis y el almacenamiento de pruebas relativas al genocidio, los crímenes contra la humanidad, los crímenes de guerra y las infracciones penales

Desde 1990 es profesora de Historia del Arte en la Facultad de Bellas Artes de la Universidad Complutense de Madrid; y desde 2004 colabora con el Departamento de Educación del

Se definieron opciones de rediseño para cada uno de los orígenes identificados, con base en información a nivel internacional en tecnologías de la industria de producción de