Algebra Lineal Aplicada para Modelos Lineales

(1)

Algebra Lineal Aplicada para Modelos Lineales

Yuri Miranda Gonzáles

Universidad Mayor de San Andrés

Carrera de Estadística

Abril 2013

En el área de modelos lineales y econometría, la necesidad de contar con elementos teóricos sobre algebra lineal es imprescindible para una correcta com-prensión y aplicación de estas herramientas, el presente documento muestra un compendio de conceptos, teoremas y demostraciones necesarios para contar con las herramientas teóricas.

Es así que el principal objetivo del documento es la comprensión de los siguientes resultados:

Al multilpicar un vector por una matriz simétrica idempotente se obtiene la proyección ortogonal de este vector sobre el espacio vectorial generado por las columnas de la matriz.

SiY es un vector de variables N(0;1)dencomponentes, que se proyecta ortogonalmente sobre un espacio de dimensiónrentonces el cuadrado del módulo del vector proyectado 2₍_r₎_.

La descomposición de un vector den componentes como una suma de h

vectores ortogonales entre sí, y se expresa el vector como una suma de estos hvectores, entonces el cuadrado del módulo de cada vector de los componentes sigue una distribución 2₍_{a los del espacio donde se generó}₎_. Este compendio es el resultado de las clases impartidas en la Carrera de Estadística de la Universidad Mayor de San Andrés (UMSA), en base princi-palmente a las siguientes fuentes: Apéndice II de Regresión y Diseño de Ex-perimentos, Daniel Peña 2010; Apéndice de derivadas de matrices de Análisis Multivariante, Mardia 1991; Capítulo I Vectors of random variables de GAF Seber 1987, también el clásico libro de Algebra Lineal de Anton.

1 Vectores

1. Producto escalar (o interno) de dos vectores

X0Y =Y0X =Xxiyi

(2)

2. Norma o longitud de un vectorX

jX_j=pX0_X ₌qX_x2 i

3. Un conjunto dekvectores(X1; X2; : : : Xk)son linealmente independientes

(LI)si en la siguiente combinación lineal (cl)

c1X1+ +ckXk= 0 la única solucion esc1=c2= = 0.

4. Sea un conjunto de k vectores LI de n componentes, se llama espacio vectorial (E) generado por este, al que contiene todos los vectoresZ que pueden expresarse como combinación lineal de estos.

si z₂ E₎z=c1X1+ +ckXk

5. La dimensión del espacioEk = número de vectoresLI que lo generan.

1.1 Ortogonalidad en vectores

1. Dos vectores son ortogonales_{, j}X_{j j}Y_j= 0que es consecuecia de

X0Y =_jX_{j j}Y_jcos

cuando = 90o₎cos = 0

Por lo tanto: dos vectores son ortoganeles_,

X0_Y _{= 0}_ó _Y0_X _{= 0}

2. X es ortogonal aEp siX es ortogonal a todo vector deEp:por tanto

si Y ₂Ep)Y0X = 0

2 Matrices y formas cuadráticas

Algunas propiedades de transpuesta de matrices

(A0)0 = A;(A+B)0=A0+B0 ;(AB)0=B0A0

siA = A0 ₎Aes simétrica

2.1 Rango de una matriz

A cadaAn n se puede asociar unEp generado por sus vectores columna)el rango de la matriz es la dimensión de este espacio.

rango(A) =rango(A0)

el rango también es el máximo número de vectores columna o …laLI

(3)

2.2 Propiedades de inversa

1. (AB) 1₌_B 1_A 1_{para matrices cuadradas no singulares} 2. (ABC) 1₌_C1_B 1_A 1

3. (A0₎ 1_{= (}_A 1₎0

4. A 1 ₌_j_A_j 1

5. SiA es simétrica₎A 1 _también

2.3 Matriz ortogonal

Ces una matriz ortogonal si escuadrada y tal que:

CC0 ₌_C0_C₌_I

y como consecuencia se tiene:

C0 =C 1

por lo tanto las …las o columnas de una matriz ortogonal son vectores ortogonales entre si y de longitud 1. Claro...:

0 B @ C0 1 .. . C0 n 1 C A( C0 1 Cn0 ) = 0 B @ 1 0 . .. 0 1 1 C A= 0 B @ C0 1C1 0 . .. 0 C0 nCn 1 C A además: jC_j=_jC0_j= 1

2.4 Matriz de…nida positiva

Una matrizAes de…nida positiva si:

Z0_{AZ >}₀_donde_Z _{es un vector.}

Todos los valores propios deA, i >0

Propiedades:

1. Toda matrizAde…nida positiva es invertible yA 1 _{es de…nida positiva} 2. Toda matrizA de…nida positiva tiene al menos una matriz N cuadrada

tal que:

(4)

3 Forma cuadrática

Una forma cuadrática (F C) es un escalar con la siguiente expresión:

Y0AY = n X i=1 n X j=1 aijyiyj donde:Y = 0 B @ y1 .. . yn 1 C A; A=matriz de n n:EntoncesF C= Y0 1 n n nA nY1 UnaF C es semide…nida positiva entonces:

1. Y0_AY ₀

2. A es de…nida o semide…nida positiva. Recortar tambien que una matriz de…nida positiva cumple:

3. Se llama rango de una FC al rango de la matrizA

3.1 Diagonalización de matrices simétricas

1. Valores y vectores propios

Ax= x₎det( I A) = 0

los vectores propios de una matriz cuadrada son losxtal que:

( I A)x= 0

Nota: Una matriz simétrica tiene i2Ry autovectores ortogonales. 2. Diagonalización de matrices simétricas

Toda matrizAsimétrica puede diagonalizarse, mediante la transformación

C0AC=D

donde:

C es ortogonal y esta construida con los vectores …la con los autovectores deA

Los elementos deD serán sus atovalores.

Como_jC_j=_jC0_j_{= 1}₎_{el determinante de}_A_{será el producto de sus raices}

caracteristicas.

El rango de una matriz = al número de i6= 0

Por lo tanto "si se diagonaliza una matriz simétrica su rango será el número de elementos no nulos de la diagonal principal de la matriz D"

(5)

3.2 Una matriz importante: Matriz Idempotente

Es una matriz cuadrada simétrica que cumple:

AA=A=A0A

3.2.1 Nota

Una matriz idempotente o bien es singular o bien es matriz unidad (matriz singular,_jA_j= 0;rangor < norden de la matriz)

Claro...

1. Si_jA_{j 6}= 0_{) 9}A 1 _{y como}_A_{es idempotente}

AA=A

A 1_AA₌_A 1_A

IA=I₎A=I₎por tanto una matriz idempotente que no es laIsera singular.

Los i de una idempotente son cero o unos...

( I A)x = 0₎Ax= x AAx = A x Ax = Ax x = 2x x( 2 ) = 0 = 1; = 0

por lo tanto si se diagonaliza una idempotente se obtiene en la diagonal principal el número de unos= rango de la matriz, y el resto de elementos son cero.

3.2.2 Conclusiónes importantes:

1. (a) Una matriz idempotenteAes siempre semide…nida postiva. Dem. X0_AX₎_X0_A0_AX ₎₍_AX₎0₍_AX₎ ₀

(b) SiA es idempotente₎también seráI A

Dem. (I A) (I A) =I A IA+AA=I A

3.2.3 Traza de una matriz

1. SiCn n con elementoscij )tr(C) = n

X

i=1

cij y es un operador lineal, con las siguientes propiedades:

(a) tr(A+B) =tr(A) +tr(B)

(6)

(c) tr(ABC) =tr(CAB) =tr(BCA)

(d) Si A es idempotente su rango=tr(A):

3.3 Proyección Ortogonal

El vectorY den componentes y dimensionp, p < n. La proyección ortogonal deY sobreEp , es el vectorV , que cumple:

Ep V W Y Ep V W Y es decir: 1. Y =V +W con V ₂Ep 2. U0_W _{= 0} ₈_U ₂_E_p

3.4 Un ejemplo importante...

SeaY un vetor y seaEp un espacio vectorial de dimension1engendrado por el vectorX ,₎la proyección deY sobreX será:

X V=cX Y X V=cX Y V =cX (1)

dondeces un escalar. Para hallarV, se tiene

V +e=Y ₎e=Y V

el vectore=Y V debe ser ortogonal aV, por tanto aX, es decir

X0(Y V) = 0

X0Y X0cX = 0

X0Y = X0Xc

por tanto

(7)

De (1) se tiene: V =cX=Xc, entonces...

V =X(X0X) 1X0Y =AY

por tanto la proyección de un vector Y sobre X se obtiene multiplicando el vector por una matrizA=X(X0_X₎ 1_X0

La matriz A es cuadrada de n n , idempotente y de rango igual al del espacio sobre el que se proyecta que en este caso es uno. En efecto:

1. es cuadrada... Xn 1(X0X)1 11 X10 n =An n 2. es idempotente... (X(X0X) 1X0)(X(X0X) 1X0) =X(X0X) 1X0 3. es de rango uno... rg(A) =tr(A) =tr(X(X0X) 1X0) =tr(XX 1(X0) 1X0) =tr(I) = 1

Estas propiedades encontradas para proyecciones sobre una recta son val-idas en general, como se desarrolla e los siguietes teoremas:

Teorema 1 Sea el vector Y ₂Rn _y _X _{una matriz de} _n _p _{donde las …las de}

X son una base de un subespacio vectorialEp.

Se tiene la matriz Acomo:

A=X(X0X) 1X0

La proyección del vectorY sobre el espacio Ep es

AY

donde la matrizA es cuadrada, simetrica, idempotete y de rangop.

Demostración. Para la idempotencia, se tiene que comoV =AY es la

proyec-ción deY sobre el espacio vectorialR(A)generado por las columnas deA

entonces A es idempotente por que la proyección deV sobre R(A)será AV

(y tendrá que ser invariante ya queV esta dentro deR(A)).

V =AV

peroV =AY, entonces

AY =AAY

lo que quiere decir que tiene que cumplirseA=A2_{por tanto la matriz proyección}

tiene que ser idempotente.

Teorema 2 El cuadrado del modulo de la proyecció de Y sobreEp será:

Y0AY

donde A es idempotente

Demostración. El cuadrado del módulo de la proyección es:

(8)

4 Vectores y matrices aleatorias

De…nición.- Se tiene Z una matriz de variables aleatorias, y X y Y vectores aleatorios entonces:

E[Z] = [E]

Teorema.- si A = [(aij)], B = [(bij)]; C = [(cij)] matrices constantes, en-tonces:

E[AZB+C] =AE[Z]B+C E[AX] =AE[X]

E[AX+BY] =AE[X] +BE[Y]

De…nición.- La covaranza entre dos vectores aleatorios se de…ne como:

Cov[X; Y] = [(Cov[Xi; Yj])]

Teorema.-Cov[X; Y] =E[(X E[X])(Y E[Y])0]

V[Y] = [Cov[Yi; Yj]]

V[X] =E[XX0] (E[X])(E[X])0

Cov[AX; BY] =ACov[X; Y]B0 Cov[AX; Y] =ACov[X; Y]

Cov[X; BY] =Cov[X; Y]B0

V[AX] =Cov[AX; AX] =ACov[X; X]A0=AV[X]A0

Para profundizar los conceptos, demostraciones y ejemplos de estos resul-tados, puede ver capítuo 1 Vectors of Random Variables de Lineal Regression Analysis G.A.F. SEBER (1997)

5 Distribución normal

Se tiene y1; y2; :::; yn variables aleatorias indepedientes distribuidas N( ; 2): Entoces:

z = a0Y=a1y1+ +anyn

E(z) = Xai

V(z) = 2Xa2_i

(9)

Teorema 3 Si

z1 = a01Y

z2 = a02Y

dondeY N( ; 2_I₎_{. Las variables} _z

1 yz2 serán independientes si

a0₁a2= 0

Demostración. Como z1 y z2 son normales entonces, incorrelación implica

independencia por lo tanto se tiene que

Cov(z1; z1) = Cov(a01Y;a02Y)

= a1Cov(Y;Y)a02

= a1 2a02=a1a02 2

y sera cero solo cuando los vectoresa1;a2 sean ortogonales.

6 Distribución de formas cuadráticas de

vari-ables normales

En la forma cuadraticaY0_AY _{el vector}_Y _será_N₍₀_;_I₎_{, es decir los compoenentes}

deY serán independientes y con = 1

Teorema 4 Para que Y0AY se distribuya 2(r), entonces la condición nece-saria y su…ciente es queAsea idempotente de orden r

Demostración. Si se realiza la trasformación X =CY dondeC es ortogonal

y diagonaliza aA yX se distribuye normal.

Y = C 1X Y = C0X Y0AY = X0CAC0X = X0DX = r X i=1 x2_i 2(r) ) Y0AY 2(r)

Teorema 5 SiY N(0; I)se proyecta sobre un espacio vectorial de dimensión

r, el cuadrado del modulo de su proyección se distribuye chi cuadrado conrgl.

Demostración. El modulo de un vector es pX0_X:_{Como la proyección de un}

vector Y sobre un espacio vectorial es AY, Entoces el cuadrado de su modulo es: (AY)0AY = Y A0AY

= Y0AY 2(r)

Teorema 6 Dos formas cuadráticas Y0AY y Y0BY serán independientes si

(10)

7 Derivadas matriciales

Si X es un vector de variables xi ,entonces la derivada de una función que depende del vectorX es un vector donde sus componentes son las derivadas de

f respecto a cada componente. por ejemplo

Sif = 8x1+ 4x2+ 6x3) _@X@f = 0 @ 84 6 1 A 1. Sif =a0_X @(a0X) @X =a

2. Sif =X0AX , dondeAes una matriz cuadrada y simétrica

@(X0_AX₎

@X = 2AX

3. Sif =AX, dondeAes una matriz cualquiera

@(AX)

@X =A

0

4. Otras propiedades importantes: @lnjXj @X = (X0) 1 @traza(AB) @A =B 0 @jXj @X =jXj(X0) 1 @traza(A0BA) @A = 2BA

8 Inversa de una matriz particionada

Si

A= A11 A12

A21 A22

DondeA11 yA22son matrices cuadradas no singulares y se de…neB como:

B= (A11 A12A221A21) 1 se tiene: A 1₌ B BA12A221 A₂₂1A21B A221+A221A21BA12A221

9 Determinante

Si A= A11 A12 A21 A22

(11)

se tiene:

jA_j=_jA22j A11 A12A221A21 =jA11j A22 A21A111A12 Propiedades de inversas de sumas de matrices

Se tiene las matricesAyC no singulares, y la siguiente multiplicación:

(A+BCD) 1=A 1 A 1B(DA 1B+C 1) 1DA 1

como un caso particular conbydcomo vectores se tiene:

(A+bd0) 1=A 1 (1 +d0A 1b) 1(A 1b)(d0A 1)

10 Bibliogra…a

[1] Anton, "Algebra Lineal",

[2] Daniel Peña, "Regresión y Diseño de Experimentos", 2010 [3] G.A.F. Seber, "Linear Regression Analysis", 1997