Inversa generalizada e inversa condicional de matrices

(1)

Inversa generalizada e inversa condicional de matrices�

Este capítulo consta de cuatro secciones. Las dos primeras versan sobre la deﬁnición, propiedades y cálculo de la inversa generalizada de una matriz. La tercera sección trata sobre la deﬁnición y el cálculo de inversas condicionales de una matriz. En la última sección se verán algunas aplicaciones de la inversa generalizada y de la inversa condicional de una matriz a los sistemas de ecuaciones lineales y a los problemas de mínimos cuadrados.

5.1. Inversa generalizada de una matriz

La inversa generalizada de una matriz es una herramienta de gran utilidad en los cursos de modelos lineales (véase la sección 1.5 de [4]).

Antes de dar la deﬁnición de inversas generalizada de una matriz, veamos un par de teoremas que serán útiles en el desarrollo del resto del capítulo.

5.1.Teorema. SiA es una matrizm×nde rangor >0�entonces existen matrices invertiblesPm×m y Qn×ntales queP AQes igual a:

1. » Ir � � � – sir < nyr < m. 2. » Ir � – sir=n < m. 3. ˆ Ir � ˜ sir=m < n. 4. Irsir=n=m.

Demostración� _{Se hará aquí sólo la demostración del inciso (1). Si}Res la forma escalonada reducida deA�entoncesR=P A� P es un producto de matrices elementales, (véase el apartado 1.7). Las últimas m−rﬁlas deRson nulas yRtienen la estructura siguiente:

2 6 6 6 6 6 4 0 · · · 0 1 a1k · · · 0 a1k� · · · a1k�� 0 a1k�� · · · 0 · · · 0 0 0 · · · 1 a2k� · · · a2k�� 0 a2k�� · · · 0 · · · 0 0 0 · · · 0 0 · · · 0 1 a3k�� · · · .. . ... ... ... ... ... ... ... ... 0 · · · 0 0 0 · · · 0 0 0 0 0 · · · 3 7 7 7 7 7 5

(2)

5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional F= » Ir � � � –

Así queF=RQ�dondeQes un producto de marices elementales (por columnas). Por lo tanto;F=RQ=

P AQ, dondeP yQson matrices invertibles. �

5.2.Ejemplo. Considere la matriz

A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5

claramente las dos primeras filas son linealmente independientes, y la tercera es un múltiplo escalar de la primera fila deA.por lo tanto, el número máximo de filas linealmente independientes deAes 2; o sea,A tiene rango2.Por el teorema anterior existen matrices invertiblesP yQtales que

P AQ= » I2 � � � – = 2 4 1 0 0 0 0 1 0 0 0 0 0 0 3 5.

Ahora se procede a calcular las matrices invertibles P yQsiguiendo las pautas de la demostración del teorema anterior.

Paso 1: Se encuentra una matriz invertibleP tal queP A=R, dondeRes la forma escalonada reducida deA. [A|I3] = 2 4 1 2 1 3 1 0 0 −1 −2 0 −2 0 1 0 2 4 2 6 0 0 1 3 5 f ilas � 2 4 1 2 1 3 1 0 0 0 0 1 1 1 1 0 0 0 0 0 −2 0 1 3 5 f ilas � 2 4 1 2 0 2 0 −1 0 0 0 1 1 1 1 0 0 0 0 0 −2 0 1 3 5= [R|P ].

Paso 2: Se encuentra una matriz invertibleQtal queRQ=F�donde

F= » I2 � � � – .

(3)

[R|I4] = 2 6 6 6 4 1 2 0 2 0 0 1 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 3 7 7 7 5 col. � 2 6 6 6 4 1 0 2 2 0 1 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1 3 7 7 7 5 col. � 2 6 6 6 4 1 0 0 0 0 1 0 1 0 0 0 0 1 0 −2 −2 0 0 1 0 0 1 0 0 0 0 0 1 3 7 7 7 5 col. � 2 6 6 6 4 1 0 0 0 0 1 0 0 0 0 0 0 1 0 −2 −2 0 0 1 0 0 1 0 −1 0 0 0 1 3 7 7 7 5 = [F |Q]. Las matrices invertibles

P = 2 4 0 −1 0 1 1 0 −2 0 1 3 5 y Q= 2 6 6 4 1 0 −2 −2 0 0 1 0 0 1 0 −1 0 0 0 1 3 7 7 5

son tales que:

P AQ= » I2 � � � – = 2 4 1 0 0 0 0 1 0 0 0 0 0 0 3 5.

5.3.Teorema. SiA es una matriz m×nde rangor >0�entonces existen matricesBm×r yCr×n, de

rangor, tales queA=B·C.

Demostración� Considere distintas posibilidades para rango de la matrizA,ρ�A) =r. 1. Sir=m�entoncesA=BC, dondeB=IryC=A.

2. Sir=n�entoncesA=BC, dondeB=AyC=Ir.

3. Sir < nyr < m�entonces por el teorema 5.1(1) existen matrices invertiblesP yQtales que: P AQ= » Ir � � � – . De aquí que: A = P−1 » Ir � � � – Q−1 = P−1 » Ir � – ˆ Ir � ˜ Q−1 = BC�

(4)

5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional dondeB∈�_m×ryC∈�r×n son las matrices de rangor, dadas por

B=P−1 » Ir � – y C=ˆ Ir � ˜ Q−1_.

El teorema queda entonces demostrado. �

Una forma de calcular las matricesByCque aparecen en el teorema anterior, en el caso en quer < ny r < m�tal como aparece en la demostración, es calculando primero las matrices invertiblesP yQtales que:

P AQ= » Ir � � � – � después calcular las matricesP−1yQ−1, y por último obtener:

B=P−1 » Ir � – y C=ˆ Ir � ˜ Q−1.

Para el caso en que la matrizAno sea de rango ﬁla completo, existe una demostración alternativa, la cual presentamos a continuación. Como veremos, esta demostración facilitará un algoritmo más económico para calcular matricesByCadecuadas.

Demostración� [Otra prueba del teorema 5.3 parar < m]

Suponga queAes una matriz de rangor < m. SeaP una matriz invertible de ordenmtal queP A=R, dondeRes la forma escalonada reducida deA(véase apartado 1.7). Puesto quer < m,Rtiene la estructura siguiente: R= 2 4 C � 3 5�

dondeCes una matrizr×nde rangor.Ahora, si escribimosP−1_{particionada adecuadamente}

P−1=ˆ

B D ˜

� dondeBes una matrizm×rde rangor. Dado queP A=Rse tiene

A = P−1R = ˆ B D ˜ 2 4 C � 3 5 = BC � Ahora se presenta a continuación un método basado en esta demostración para calcular matricesByC, de rangor�tales queA=BC.

5.4.Algoritmo. Considere una matrizAde tamañom×n Paso 1 Forme la matriz[ Am×n | Im] .

Paso 2 Efectúe operaciones elementales en las ﬁlas deAhasta obtener su forma escalonada reducida, y en las columnas deIm, siguiendo las siguientes pautas:

i) Si se intercambian lasﬁlasiyj deA�entonces intercambie lascolumnasiyjdeIm. ii) Si se multiplica lai-ésima ﬁla deApor el númeroα�= 0,entonces se multiplica la i-ésima

(5)

iii) Si a laj-ésima ﬁladeAse le sumaαveces lai-ésima ﬁladeA(α�= 0),entonces a lai-ésima columna deImse le suma�−α) veces laj-ésima columnadeIm.

Al ﬁnal de este paso se obtiene la matriz[ R | P−1 _]

Paso 3 B=ˆ

Primerasr columnas deP−1˜

, C= [Primerasr ﬁlas deR]. 5.5.Ejemplo. La matriz del ejemplo 5.2

A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5

tiene rango2.Existen por lo tanto matricesB3×2yC2×4de rango2tales queA=BC.Las matricesBy

Cse pueden ahora calcular siguiendo los pasos indicados anteriormente. [A|I3] = 2 4 1 2 1 3 1 0 0 −1 −2 0 −2 0 1 0 2 4 2 6 0 0 1 3 5 → 2 4 1 2 0 2 1 1 0 0 0 1 1 −1 0 0 0 0 0 0 2 2 1 3 5 = [R|P−1].

Así, tomando las primeras 2 columnas deRy las 2 primeras ﬁlas deP−1 _{se obtiene respectivamente las}

matrices B= 2 4 1 1 −1 0 2 2 3 5 y C= » 1 2 0 2 0 0 1 1 – � las cuales tienen rango 2 y son tales que:

BC = 2 4 1 1 −1 0 2 2 3 5 » 1 2 0 2 0 0 1 1 – = 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5=A .

5.6.Deﬁnición (Inversa generalizada o pseudoinversa). Sea A una matrizm×n. Si M es una matriz n×mtal que:

1. AM es una matriz simétrica. 2. M Aes una matriz simétrica. 3. AM A=A.

4. M AM=M�

entonces se dice queM es una inversa generalizada (pseudoinversa) deA�o simplemente que M es una g-inversade A.

5.7.Ejemplo. Veriﬁque que la matrizM= 1 11 2 4 3 −7 2 −1 3 4 3

5es una g-inversa de la matrizA= » 1 1 2 −1 0 1 – . En efecto,

(6)

5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional 1. AM= 1 11 » 11 0 0 11 –

=I2es una matriz simétrica.

2. M A= 1 11 2 4 10 3 −1 3 2 3 −1 3 10 3

5es una matriz simétrica.

3. AM A=I2A=A. 4. M AM=M I2= 1 11 2 4 3 −7 2 −1 3 4 3 5. 5.8.Observación.

1. SiAes invertible, entonces la matrizA−1_{es una g-inversa de}_A.

2. SiA=�m×n�entonces la matrizM=�n×mes una g-inversa deA.

5.9.Teorema(Existencia de una g-inversa). Toda matrizA de tamañom×ntiene una inversa genera-lizada.

Demostración� _{De acuerdo con la observación 5.8(2), la demostración es trivial en el caso en que} A=�. Suponga ahora que queA�=�tiene rangor >0.Por el teorema 5.3, existen matricesBde tamaño m×ryCde tamañor×n, ambas de rangortales queA=BC.

Puesto queByCtiene rangor, las matricesBT_B_y_CCT_{son invertibles (véase el teorema 1.56). Finalmente,} se considera la matriz

M=CT`

CCT´−1`

BT_B´−1

BT_.

El resultado quedará comprobado, se se verifica queMes una g-inversa deA.Es decir, si se verifica que se satisfacen las condiciones de la definición 5.6. En efecto:

Las matricesAMyM Ason simétricas puesto que AM=BCCT` CCT´−1`BTB´−1BT =B` BTB´−1BT y M A=CT` CCT´−1` BT_B´−1 BT_BC₌_CT` CCT´−1 C De otro lado,AM A=B` BT_B´−1_BT_BC₌_BC₌_A�_y M AM = CT` CCT´−1CCT` CCT´−1`BTB´−1BT = CT` CCT´−1`BTB´−1BT =M.

Es decir,AM A=AyM AM=A, por lo tanto,M es una g-inversa deA. � 5.10.Teorema. [Unicidad de la g-inversa]Toda matrizAtiene una única g-inversa.

Demostración� _{Supongamos que}M1yM2son dos g-inversas de una matrizA.Utilizando la deﬁnición

de g-inversa de una matriz se obtiene la cadena siguiente de igualdades: AM2 = �AM1A)M2= �AM1)�AM2) = �AM1)T�AM2)T

= ��AM2)�AM1))T = ��AM2A)M1)T= �AM1)T=AM1.

De aquí queAM2=AM1. En forma análoga se obtiene queM2A=M1A.Por lo tanto

M1 = M1AM1= �M1A)M1= �M2A)M1=M2�AM1)

(7)

� 5.11.Nota. En lo sucesivo, la g-inversa de una matriz la se denotará con el nombre de la matriz y con el signo+como exponente. Por ejemplo, porA+� B+denotarán respectivamente las inversas generalizadas de las matricesAyB.

5.12.Teorema(Propiedades de la g-inversa). Para cualquier matrizAtiene que: a) �A+₎+₌_A.

b) �αA)+₌_α−1_A+_�_{para todo escalar}_α

� = 0. c) �AT₎+ = �A+)T d) �AAT₎+_{= �A}T₎+_A+ e) �AT_A)+₌_A+_�AT₎+

Demostración� _{Por el teorema anterior, toda matriz tiene una única g-inversa. Sólo resta verificar} en cada caso, que se satisfacen las condiciones de la definición 5.6. Para ello se hará la demostración sólo para el inciso (e) suponiendo, que las afirmaciones (a)-(d) son válidas (las verificaciones quedan a cargo del lector) y se aplicarán las propiedades de la definición 5.6:

1. Inicialmente se veriﬁca que la matriz`

AT_A´ `

A+�AT₎+´

es simétrica, para ello se muestra que para la matrizM=A+_�AT₎+_{se satisface la igualdad}`

AT_A´ M=A+_{A. En efecto:} “ ATA”M = “ATA” “A+�AT)+” �c) = AT_�AA+_)�A+₎T def.₌ AT_�AA+ )T_�A+ )T = ` A+AA+A+´T def.₌ ` A+A´T =A+A . 2. Ahora se veriﬁca que la matriz`

A+_�AT₎+´ `

AT_A´

es simétrica, para ello muestra como antes, de que la matrizM=A+_�AT₎+_{satisface la igualdad}_M`

AT_A´ =A+_{A. En efecto:} M“ATA” = “A+�AT)+” “ATA” �c) = A+�A+)T_AT_A def.₌ A+�AA+)T_A def.₌ A+AA+Adef.= A+A. 3. La matrizM=A+_�AT₎+_{satisface la igualdad}_�AT_A)M_�AT_{A) =}_AT_A.

�ATA)M�ATA) = “ATA” “A+�AT)+” “ATA”

�1) = ` A+A´“ AT_A”_{= �A}+ A)T_AT_A = ` A�A+A)´T Adef.= ` AA+A´T A=ATA.

(8)

5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional 4. La matrizM=A+_�AT₎+_{satisface la igualdad}_M�AT_A)M₌_M._{En efecto}

M�ATA)M=M = “A+�AT)+” “ATA” “A+�AT)+”

�2) = ` A+A´“ A+�AT₎+” = ` A+AA+´“AT”+ def.₌ A+�AT)+. � 5.13.Observación. No siempre es cierto que�AB)+₌_B+_A+_{. Para mostrar este hecho basta considerar}

un ejemplo (ver ejemplo siguiente). 5.14.Ejemplo. SiA=ˆ 1 1 ˜ yB= » 1 2 –

�entoncesAB= [3]. Por lo tanto�AB)+_{= 1/3. De acuerdo}

con el corolario 5.16,A+₌1 2 » 1 1 – yB+₌1 5 ˆ 1 2 ˜

, de donde se tiene que B+A+=1 5 ˆ 1 2 ˜1 2 » 1 1 – = 1 10[3] = [3/10]�= [3] = �AB) + . 5�1 Ejercicios

En los ejercicios 1 al 9, responda verdadero o falso justiﬁcando su respuesta.

1. Si las matricesB∈�_m×ryC∈�r×mtienen el mismo rango, entonces�BC)+=C+B+. 2. SiSes una matriz simétrica, entoncesS+_{es una matriz simétrica.}

3. SiSes una matriz simétrica tal queS2₌_S�_entonces_S+₌_S.

4. SiSes una matriz simétrica tal queS3₌_S�_entonces_S+₌_S.

5. Para toda matrizAse tiene queA+_{= �A}T_A)+_AT_. 6. Para toda matrizAse tiene queA+₌_AT_�AAT₎+_.

7. Para toda matrizAse tiene que�AA+₎2₌_AA+_y_�A+_A)2₌_A+_A.

8. SiA∈�_m×ntiene rangom�entonces el sistema de ecuaciones linealesAx=ytiene solución para cualquiery∈�_m×1.

9. SiA∈�_m×ntiene rangony si el sistema de ecuaciones linealesAx=ytiene solución, entonces el sistema tiene solución única.

En los ejercicios 10 al 21 demuestre la aﬁrmación correspondiente 10. SiBCT ₌_{�, entonces}_BC+₌_�_y_CB+₌_�. 11. SiA= » B C – yBCT₌_�_entonces_A+₌ˆ B+ _C+ ˜ .

12. SiBes una matriz simétricam×my siCT_B₌_��_donde_CT_{es la matriz}_CT₌ˆ

1 1 · · · 1 ˜ 1×m� entonces la g-inversa de la matriz:

A= » B CT – esA+₌ˆ B+ _{1/m C} ˜ .

(9)

13. SiD= [dij]_n×n es una matriz diagonal, entoncesD

+_=[aij]

n×nes una matriz diagonal, donde aij= ( 1/dii , si dii�= 0 0 � si dii= 0. 14. SiA= » B � � C – entoncesA+₌ » B+ _� � C+ – . 15. SiSes una matriz simétrica, entoncesSS+₌_S+_S.

16. SiAes una matriz tal queAT_A₌_AAT_�_entonces_A+_A₌_AA+_.

17. Si A es una matriz m×n, donde �A�ij = 1para i = 1�2� . . . � m y j = 1�2� . . . � n� entonces A+₌ 1

mnA.

18. SiP ∈�_n×n yQ∈�m×mson matices ortogonales, entonces para cualquier matrizm×n� A, se tiene que�P AQ)+₌_QT_A+_PT_.

19. SiSes una matriz simétrica no negativa, entoncesS+_{es una matriz no negativa.}

20. Para cada matrizm×n� A;AB=AA+siiBes tal queABA=AyABes simétrica. 21. SiBes una c-inversa deA�entonces la matrizBABtambién lo es.

5.2. Cálculo de la g-inversa de una matriz

En esta sección se verán algunos teoremas que pueden usarse para calcular la g-inversa de una matriz. Empezamos con el siguiente resultado, el cual se deduce de los teoremas 5.3, 5.9 y 5.10.

5.15.Teorema. SeaAuna matrizm×nde rangor >0. 1. Sir=n=m, entoncesAes invertible yA+₌_A−1_.

2. Sir=m < n, entoncesA+₌_AT`

AAT´−1_. 3. Sir=n < m, entoncesA+₌`

AT_A´−1_AT_.

4. Sir < nyr < m, entonces existen matricesB∈�_m×ryC∈�r×nde rangortales queA=B·C y

A+₌_CT`

CCT´−1`

BT_B´−1

BT_. 5.16.Corolario. Seaaun vector no nulo dencomponentes.

1. Si a∈�1×n�entoncesa+=`aaT´ −1

aT. 2. Sia∈�_n_×1�entoncesa+=`

aT_a´−1_aT_.

5.17.Ejemplo. Ilustre el teorema 5.15 con alguna matrices sencillas. 1. La matrizA=

»

1 2 1 3

–

es invertible, así queA+₌_A−1₌ » 3 −2 −1 1 – . 2. La matrizA= » 1 2 3 −1 −1 1 –

tiene rango 2, así que:

A+ = AT` AAT´−1= 2 4 1 −1 2 −1 3 1 3 5 1 42 » 3 0 0 14 – = 1 42 2 4 3 −14 6 −14 9 14 3 5

(10)

5.2. Cálculo de la g-inversa Inversa generalizada e inversa condicional 3. La matrizA= 2 4 1 2 3 4 5 6 3

5tiene rango 2, así que:

A+ = ` ATA´−1AT= 1 24 » 56 −44 −44 35 – » 1 3 5 2 4 6 – = 1 24 » −32 −8 16 26 8 −10 –

4. La matrizAdada por

A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5

Del ejemplo 5.5 se sabeρ�A) = 2y que las matrices B= 2 4 1 1 −1 0 2 2 3 5 y C= » 1 2 0 2 0 0 1 1 –

son tales queA=BC.Luego

A+ = CT` CCT´−1` BT_B´−1 BT_. = 1 24 2 6 6 4 −2 −20 −4 −4 −40 −8 9 55 18 5 15 10 3 7 7 5 5. Para la matrizA=ˆ 1 2 3 ˜ � =�se tiene que: a+ = “aaT ”−1 aT = 1 14 2 4 1 2 3 3 5 6. La matrizA= 2 4 1 1 1 3 5�=�se tiene que, a+ = “aTa ”−1 aT =1 3 ˆ 1 1 1 ˜ .

5.18.Teorema. SeaA∈�_m×n una matriz de rangor >0. Entonces la g-inversa deAse puede calcular siguiendo los pasos dados a continuación:

1. CalculeM=AT_A. 2. HagaC1=I.

3. CalculeCi+1=1

iTr�CiM)I−CiM�parai= 1�2� . . . � r−1. 4. Calcule r

Tr �CrM)CrA

T_�_{ésta es la matriz}_A+_.

Además, se tiene queCr+1M=�yTr �CrM)�= 0.

Para la demostración de este teorema, remitimos al lector a [3] (teorema 6.5.8). Obsérvese además, que la condiciónCr+1M=�permite proceder sin conocer de antemano el rango deA.

(11)

5.19.Ejemplo. Considere la matriz A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5

del ejemplo 5.17(4). CalculeA+utilizando el teorema anterior. Para ello se puede calcualarM=At_A._{Esto es,}

M= 2 6 6 4 6 12 5 17 12 24 10 34 5 10 5 15 17 34 15 49 3 7 7 5

y considereC1=I4. Entonces se tiene que:

C2= Tr �C1M)I−C1M= 2 6 6 4 78 −12 −5 −17 −12 60 −10 −34 −5 −10 79 −15 −17 −34 −15 35 3 7 7 5 .

ComoC3M=��entoncesρ�A) = 2�y además

A+= 2 Tr �C2M)C2A T = 2 140 2 6 6 4 −2 −20 −4 −4 −40 −8 9 55 18 5 15 10 3 7 7 5

El siguiente teorema presenta una forma alternativa para calcular la g-inversa de una matriz. Para su demostración, remitimos a [9] (véase páginas. 14-15).

5.20.Teorema. SeaA∈�_m×nuna matriz de rangor >0. La g-inversa deAse puede calcular mediante los siguientes pasos:

1. Forme la matriz[ A | Im ].

2. Efectúe operaciones elementales en las ﬁlas de la matriz anterior hasta conseguir la forma escalon-ada reducida deA.Al ﬁnal de este paso se obtiene una matriz que descrita por bloques queda así:

» Er×n Pr×m ��m−r)×n P�m−r)×m – si r < m ó ˆ Em×n | Pm×m ˜ si r=m . (Sir=m=n� Aes invertible,E=IyP =A−1₌_A+_). 3. Forme la matriz: » Er×nAT Er×n P�m−r)×m ��m−r)×n – si r < m ó ˆ Em×nAT | Em×n ˜ si r=m .

4. Efectúe operaciones elementales en las ﬁlas de la matriz anterior hasta conseguir la forma escalon-ada reducida. Al ﬁnal de este paso se obtiene la matriz

h

Im | `

A+´T i

(12)

5.2. Cálculo de la g-inversa Inversa generalizada e inversa condicional 5.21.Ejemplo. Considere de nuevo la matrizAdel ejemplo 5.19

A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5.

Con el objeto de calcularA+_{utilizando el teorema anterior, se forma la matriz}ˆ

A | I3 ˜y se aplican

operaciones elementales en las ﬁlas hasta encontrar la forma escalonada reducida deA.

[A|I3] = 2 4 1 2 1 3 1 0 0 −1 −2 0 −2 0 1 0 2 4 2 6 0 0 1 3 5 → 2 4 1 2 0 2 0 −1 0 0 0 1 1 1 1 0 0 0 0 0 −2 0 1 3 5 = » E2×4 P2×3 �1×4 P1×3 – .

Se construye ahora la matriz de la forma

»

E2×4AT E2×4

P1×3 �1×4 –

y se aplican de nuevo operaciones elementales en las ﬁlas, hasta obtener la matriz identidadI3en el lado

izquierdo de este arreglo

2 4 E2×4AT E2×4 P1×3 �1×4 3 5 = 2 4 11 −9 22 1 2 0 2 4 −2 8 0 0 1 1 −2 0 1 0 0 0 0 3 5 → 2 6 6 6 6 6 6 6 4 1 0 0 −1 35 − 2 35 9 70 1 14 0 1 0 −2₇ −4₇ 11₁₄ ₁₄3 0 0 1 −₃₅2 −₃₅4 ₃₅9 1₇ 3 7 7 7 7 7 7 7 5 = hI3|�A+)T i . Así que A+= 2 6 6 6 6 6 6 6 6 6 6 6 6 6 4 −₃₅1 −2₇ −₃₅2 −2 35 − 4 7 − 4 35 9 70 11 14 9 35 2 35 3 14 1 7 3 7 7 7 7 7 7 7 7 7 7 7 7 7 5 = 1 70 2 6 6 4 −2 −20 −4 −4 −40 −8 9 55 18 5 15 10 3 7 7 5

(13)

5.22.Ejemplo. Considere la matrizAdel ejemplo 5.17(2) A= » 1 2 3 −1 −1 1 – � y siga los pasos del ejemplo anterior (teorema 5.20) para calcularA+_.

[A|I2] = » 1 2 3 1 0 −1 −1 1 0 1 – → » 1 0 −5 −1 −2 0 1 4 1 1 – = ˆ E2×4 P2×3 ˜ . Se construye ahora la matrizˆ

E2×3AT | E2×3 ˜y se reduce para obtener

ˆ E2×3AT E2×3 ˜ = 2 4 −14 −6 1 0 −5 14 3 0 1 4 3 5 → 2 6 6 4 1 0 1 14 2 14 3 14 0 1 −1₃ −1₃ 1₃ 3 7 7 5 = hI2|�A+)T i . Así que A+₌ 2 6 6 6 6 6 6 6 4 1 14 − 1 3 2 14 − 1 3 3 14 1 3 3 7 7 7 7 7 7 7 5 = 1 42 2 6 6 6 6 4 3 −14 6 −14 9 14 3 7 7 7 7 5 5�2 Ejercicios

1. Para cualquier matrizAse tiene que:ρ�A) =ρ�A+_{) =}_ρ�AA+₎₌_ρ�A+_A).

2. Calcule la g-inversa de cada una de las matrices siguientes: �i) A1= ˆ 0 0 0 ˜ �ii) A2= » 1 2 3 5 – �iii) A1= ˆ 1 2 3 ˜ �iv) A4= 2 4 1 1 2 3 5

(14)

5.3. C-inversa Inversa generalizada e inversa condicional �v) A5= 2 4 7 7 7 7 7 7 7 7 7 3 5 �vi) A6= 2 4 1 0 0 0 5 0 0 0 0 3 5 �vii) A7= 2 6 6 4 1 2 3 4 0 0 0 0 3 7 7 5 �viii) A8= 2 6 6 4 1 2 0 0 1 2 0 0 0 0 3 3 0 0 3 3 3 7 7 5 �ix) A9= 2 6 6 6 6 4 2 −1 −1 −3 1 2 1 1 1 1 1 1 1 1 1 3 7 7 7 7 5

5.3. Inversa condicional de una matriz

Al igual que el concepto de inversa generalizada de una matriz, el concepto de inversa condicional es de gran utilidad en los cursos de modelos lineales (véase la sección 1.5 de [4]) y en la caracterización del conjunto solución de sistemas lineales de ecuaciones.

5.23.Deﬁnición. SeaAuna matrizm×n.SiM es una matrizn×mtal que: AM A=A�

entonces se dice queM es una inversa condicionaldeAo simplemente, queM es unac-inversadeA. 5.24.Observación. De acuerdo con el teorema 5.10, toda matrizAtiene una única inversa generalizada A+_{. ésta es a su vez por deﬁnición una c-inversa de}_{A. Así que, toda matriz}_A_{tiene al menos una}_c-inversa.

Se verá aquí, que una matrizApuede tener varias (incluso inﬁnitas) inversas condicionales, salvo cuando la matrizAes invertible, en cuyo casoA−1_{es la única c-inversa.}

Nota. El teorema 5.27 dará una caracterización del conjunto de todas las inversas condicionales de A (c-inversas deA).

5.25.Teorema. SeaA∈�_m×n una matriz de rangor. Entonces: 1. W={N∈�_n×m:AN A=�}es un subespacio de�n×m.

2. La dimensión del espacioWmencionado en (1) esm·n−r2_.

Demostración� _{Para demostrar el inciso (1) basta demostrar, según el teorema 1.15, que el conjunto} W_{es cerrado bajo la suma y la multiplicación por un escalar. En efecto,}

SeanN1 yN2dos elementos (matrices) del conjuntoW, entonces

A�N1+N2)A=AN1A+AN2A=�+�=��

esto implica queN1+N2∈W.ésto es,Wes cerrado bajo la suma.

De otro lado, para cualquier escalarα∈Rse tiene que

A�αN1)A=αAN1A=α�=��

ésto implica que,αN1∈W.Es decir,Wes cerrado bajo la multiplicación por un escalar. El conjuntoWes

(15)

Hagamos ahora la demostración del inciso (2) en el caso en la matriz A ∈ �_m×n tenga rango r con 0< r <m´ın{m� n}. Las demostraciones en los demás casos son similares.

Sea entoncesA una matrizm×nde rangor�con0< r <m´ın{m� n}. De acuerdo con el inciso (1) del teorema 5.1, existen matrices invertiblesP∈�_m×myQ∈�n×ntales que:

(5.1) P AQ= » Ir � � � – o A=P−1 » Ir � � � – Q−1.

Considere ahora matrices arbitrariasX ∈�_r×r� Y ∈�r×�m−r)� Z∈��n−r)×ryW∈��n−r)×�m−r)y la

matrizN∈�n×mdada por

N=Q » X Y Z W – P. AhoraN∈W_siiAN A=�. De (5.1) se sigue que

AN A = P−1 » Ir � � � – Q−1Q » X Y Z W – P P−1 » Ir � � � – Q−1 = P−1 » X � � � – Q−1.

De aquí se deduceAN A=�siiX=�.Esto es,N∈WsiiNes de la forma: N=Q » � Y Z W – P.

Ahora se demuestra que la dimensión deW_es_m_·_n₋_r2_{. Para ello, se hace uso del hecho que el espacio de} matrices�_k×jtiene dimensiónk·j. En efecto, considere los espacios�r×�m−r)��n−r)×ry��n−r)×�m−r)

con las bases respectivas �1��2��3, siendo �1 = {Y1� Y2� . . . � Yr·�m−r)},�1 = {Z1� Z2� . . . � Zr·�n−r)} y

�3={W1� W2� . . . � W�n−r)·�m−r)}. Es fácil mostrar entonces que el conjunto�={N� N2� . . . � Nm·n−r·r} con Ni = Q » � Yi � � – P; i= 1�2� . . . � m·r−r2 Nr�m−r)+j = Q » � � Zj � – P; j= 1�2� . . . � n·r−r2 Nr�m+n−2r)+k = Q » � � � Wk – P; k= 1�2� . . . ��n−r)·�m−r)� es una base deW. �

5.26.Teorema. SeaAuna matrizm×n. El conjuntoMc

Ade todas las c-inversas, Mc

A={M∈�n×m:AM A=A}� es una variedad lineal de dimensiónm·n−r2_.

Demostración� _{Por el teorema 5.16}_Mc_A_{es no vacío, sea entonces}M0un elemento deMcA. Se veriﬁca

entonces, queM∈ Mc

Asi y sólo siM se puede escribir como la suma deM0y un elementoN ∈W.Esto

es, si y sólo siM=M0+N para algúnN∈W, siendoWel conjunto dado en el teorema 5.25.

SiM=M0+N�conN∈W, entoncesAM A=AM0A+AN A=A+�=A. Esto es,M∈ McA. De otra

parte, siM∈ Mc

A�entonces se puede escribir

M = M+M0−M0

(16)

5.3. C-inversa Inversa generalizada e inversa condicional dondeN=M−M0.Puesto que

A�M−M0)A=AM A−AM0A=A−A=��

se tiene entonces queN=M−M0∈Wy de aquí se sigue que:

Mc

A={M+N� N∈W}.

� El teorema siguiente establece cómo determinar los elementos deMc_A.

5.27.Teorema. SeaAuna matrizm×nde rangor.SeanP ∈�_m×myQ∈�n×n matrices invertibles como en el teorema 5.1. 1. SiA=�, entoncesMc A=�n×m. 2. Sir=n=m, entoncesMc A= ˘ A+¯ =˘ A−1¯ . 3. Sir=m < n, entonces McA=  Q » Ir Y – P:Y ∈�_�_n−r)×m ﬀ . 4. Sir=n < m, entonces McA= ˘ Qˆ Ir X ˜ P :X∈�_n×�m−r) ¯ . 5. Si0< r < ny0< r < m�entonces el conjuntoMc

Aestá dado por McA=  Q » Ir X Y Z – P:Z∈�_�_n−r)×�m−r)� Y ∈�_�_n−r)×m� X∈�n×�m−r) ﬀ

Demostración� _{De acuerdo con los teoremas 5.25 y 5.26, se tiene que en cada caso}_Mc_A_{es una variedad} lineal de dimensiónmn−r2_{. De otro lado, se puede veriﬁcar que si}_M

∈ Mc_{A, entonces}_{AM A}₌_A. � 5.28.Ejemplo. Sea A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5�

la matriz del ejemplo 5.2. De dicho ejemplo se sabe que las matrices invertibles

P = 2 4 0 −1 0 1 1 0 −2 0 1 3 5 y Q= 2 6 6 4 1 0 −2 −2 0 0 1 0 0 1 0 −1 0 0 0 1 3 7 7 5

son tales queP AQ=

»

I2 �

� �

–

� ρ�A) =r= 2.En este caso, McA=  Q » I2 X Y Z – P:X∈�_2×1_{� Y} _∈�_2×2_{� Z}_∈�_2×1 ﬀ �

(17)

representará, el conjunto de todas las inversas condicionales deA�En particular, si tomamosX=�� Y =� yZ=��se tiene que una c-inversa deAes:

M0=Q » I2 0 0 0 – P = 2 6 6 4 0 −1 0 0 0 0 1 1 0 0 0 0 3 7 7 5 .

En lo que resta de esta sección se abordará un método alternativo para calcular una c-inversa de una matriz. Considere inicialmente el caso de matrices cuadradas. �

5.29.Deﬁnición. Una matriz cuadrada H = [hij]_n×n tiene la forma Hermite superior, si satisface las condiciones siguientes:

1. H es triangular superior.

2. h2ii=hii; esto es,hii= 0óhii= 1� i= 1�2� . . . � n. 3. Sihii= 0, entonces lai-ésima ﬁla es nula, esto es,Hi=�.

4. Sihii= 1, entonces el resto de los elementos de lai-ésima columna son nulos; es decir,Hi₌_Ii es la i-ésima columna de la matriz idéntica.

5.30.Ejemplo. La matriz H= 2 6 6 4 1 2 0 0 0 0 0 0 0 0 1 0 0 0 0 1 3 7 7 5

tiene la forma Hermite superior. �

El siguiente teorema establece que una matriz Hermite superior es idempotente. La demostración de dicho resultado es consecuencia directa de la deﬁnición y se deja como un ejercicio para el lector.

5.31.Teorema. SiH es una matriz que tiene la forma Hermite superior, entoncesH2₌_H.

Demostración� _SiA� B ∈ �_n×m son matrices triangulares superiores, entonces AB es triangular superior y�AB�ii=�A�ii�B�ii(ver ejercicio 2 de la sección 2.1). De esto se sigue que:

1. H2es triangular superior. 2. �H2�ii=�H�ii�H�ii=h2ii=hii. De otra parte, 3 Sihii= 0, entoncesHi=�yH2 i =HiH=�. 4 Sihii= 1, entoncesHi=Ii_y_�H2₎i₌_HHi₌_HIi₌_Hi₌_Ii_. � 5.32.Teorema. Para toda matriz cuadrada A existe una matriz invertibleB tal queBA =H tiene la forma Hermite superior.

(18)

5.3. C-inversa Inversa generalizada e inversa condicional

Demostración� SeaP una matriz invertible tal queP A=Res la forma escalonada reducida deA. SiRtiene la forma Hermite superior, entonces la matrizB=Psatisface la condición de queBA=R=H. SiRno tiene la forma Hermite superior, intercambiamos las filas deRhasta que el primer elemento no nulo (de izquierda a derecha) de cada fila no nula deR, sea un elemento de la diagonal. Así se tiene una matriz Hque tiene la forma Hermite superior. Así que existen matrices elementales (por filas)E1� E2� . . . � Ektales

que

E1E2· · ·EkR=H

o sea:

E1E2· · ·EkP A=H.

En consecuencia, la matriz invertibleB=E1E2· · ·EkPes tal queBA=Htiene la forma Hermite superior.

�

5.33.Ejemplo. Para la matriz cuadrada: A= 2 4 1 2 3 1 2 5 2 4 10 3 5� la matriz invertible P = 2 4 5/2 −3/2 0 −1/2 1/2 0 0 −2 1 3 5 es tal que P A=R= 2 4 1 2 0 0 0 1 0 0 0 3 5�

dondeRes la forma escalonada resucida deA.Intercambiando las ﬁlas2y 3 deRse obtiene la matriz: H= 2 4 1 2 0 0 0 0 0 0 1 3 5�

la cual tiene la forma Hermite superior. Además, B= 2 4 5/2 −3/2 0 0 −2 1 −1/2 1/2 0 3 5

es invertible y es tal queBA=H . �

5.34.Teorema. SeaAuna matriz cuadrada. SiBes una matriz invertible tal queBA=H tiene la forma Hermite superior, entoncesBes una c-inversa deA.

Demostración� _Como H tiene la forma Hermite superior, por el teorema 5.31,H2 ₌_H. _{Así que}

BABA=H2₌_H₌_BA�_{o sea:}

BABA=BA.

Premultiplicando los dos miembros de la última igualdad por la matrizB−1se obtiene: ABA=A�

(19)

5.35.Ejemplo. Considere la matrizAdel ejemplo 5.33, A= 2 4 1 2 3 1 2 5 2 4 10 3 5.

Se sabe de dicho ejemplo, que la matriz invertible B= 2 4 5/2 −3/2 0 0 −2 1 −1/2 1/2 0 3 5�

es tal queBA=Htiene la forma Hermite superior. Por lo tanto, por teorema anterior,Bes una c-inversa deA. �

El siguiente corolario presenta una forma de calcular una c-inversa para el caso de matrices rectangulares. 5.36.Corolario. SeaAuna matrizm×n

1. Sim > n, seaA∗

=ˆ

A � ˜

, donde�es la matriz nulam×�m−n). Sea ademásB∗

una matriz invertible tal queB∗

A∗

=H tiene la forma Hermite superior. Si escribimos la matrizB∗

entonces particionada así: B∗ = 2 4 B B1 3 5�

dondeBes una matrizn×m, entoncesBes una c-inversa deA. 2. Sin > m, seaA∗ = » A � –

, donde�es la matriz nula�n−m)×m. Sea ademásB∗

una matriz invertible tal queB∗

A∗

=H tiene la forma Hermite superior. Si escribimos la matrizB∗

entonces particionada así: B∗ =ˆ B B1 ˜ �

dondeBes una matrizn×m, entoncesBes una c-inversa deA.

Demostración� Se presenta aquí sólo la demostración del inciso (1). Para ello suponga queAes una matrizm×n, conm > ny considere la matriz cuadradaA∗

=ˆ

A � ˜

n×n. Según el teorema 5.32, existe una matriz invertibleB∗

�tal queB∗

A∗

=Htiene la forma Hermite superior. Dicha matrizB∗

es una c-inversa deA∗

(teorema 5.32), así que,A∗

B∗ A∗ =A∗ �o sea: A∗ B∗ A∗ = ˆ A � ˜ 2 4 B B1 3 5 ˆ A � ˜ = ˆ ABA � ˜ =ˆ A � ˜ =A∗ .

De esto se sigue queABA=A.Es decir,Bes una c-inversa deA. �

5.37.Ejemplo. Encontre una c-inversa para la matriz: A= 2 4 1 −1 2 −1 0 1 3 5 3×2 . SeaA∗ = 2 4 1 −1 0 2 −1 0 0 1 0 3 5 3×3 .

(20)

5.3. C-inversa Inversa generalizada e inversa condicional Efectuando los cálculos pertinentes se encuentra que la matriz invertible:

B∗ = 2 4 −1 1 0 −2 1 0 2 −1 1 3 5= 2 4 B B1 3 5 es tal queB∗ A∗

=Htiene la forma Hermite superior. Por lo tanto, por el corolario anterior, la matriz B= » −1 1 0 −2 1 0 – 2×3 es una c-inversa deA. � 5�3 Ejercicios

En los ejercicios 1 al 3, responda verdadero o falso justiﬁcando su respuesta. 1. Para toda c-inversaAc_de_A_{se tiene que}_�AAc₎2₌_AAc_y_�Ac_A)2₌_Ac_A. 2. SiAc_{es una c-inversa de}_{A, entonces}_A_{es una c-inversa de}_Ac_.

3. SiAc_{es una c-inversa de}_{A, entonces}_�Ac₎T _{es una c-inversa de}_AT_. En los ejercicios 4 al 9 haga la demostración correspondiente

4. SiAc_{es una c-inversa de}_{A, entonces}_ρ�Ac₎_≥_{ρ�A) =}_ρ�AAc_{) =}_ρ�Ac_A).

5. SiAc_{es una c-inversa de}_{A, entonces}_Tr�AAc_{) = Tr�A}c_{A) =}_ρ�A)._{(sugerencia véase el ejercicio 7} de la sección de ejercicios 3.2).

6. SeaAuna matrizm×n. Entoncesρ�A) =msii AA+=Isii AAc₌_I_{para cada c-inversa}_Ac_de A.

7. SeaAuna matrizm×n. Entoncesρ�A) =nsii A+A=IsiiAc_A₌_I_{para cada c-inversa}_Ac_de A.

8. SiBes una c-inversa deA�entonces también lo esBAB.

9. SiBc_y_Cc _{son c-inversas de las matrices}_B_y_C _{respectivamente, entonces una c-inversa de la} matriz A= » B � � C – es Ac₌ » Bc _� � Cc – . 10. Para la matrizA= 2 4 1 2 3 2 5 3 1 3 0 3

5�dé dos c-inversaAc1yAc2tales queρ�Ac1)> ρ�A)yρ�Ac2) =

ρ�A).

11. Determine el conjunto de todas las c-inversas de las matrices A1= » 1 1 1 1 – � A2= » 1 2 3 1 3 3 – � A3= 2 4 1 2 1 3 2 5 3 5� A4= » 1 2 1 3 – .

(21)

5.4. Sistemas de ecuaciones lineales: g-inversa y c-inversa de una matriz. mínimos cuadrados.

En esta sección se verán algunas aplicaciones de la g-inversa y la c-inversa de una matriz a los sistemas de ecuaciones lineales y al problema de los mínimos cuadrados.

5.38.Teorema. SeaA∈�_m×n una matriz y seay∈�m×1un vector. El sistema de ecuaciones lineales

Ax=yes consistente siiAAc_y₌_y_{para cada c-inversa}_Ac_de_A.

Demostración� _{Suponga que el sistema de ecuaciones lineales}Ax= yes consistente. ésto quiere decir, que existe al menos unx0tal que:

Ax0=y.

Sea ahoraAc_{una c-inversa de}_A�_entonces:

AAc_y ₌ _AAc_Ax

0

= Ax0

= y.

Suponga ahora, que para cada c-inversaAc_de_{A, se tiene que}_AAc_y₌_{y. Entonces para cada c-inversa}_Ac_, el vectorx0=Acyes una solución del sistema de ecuaciones linealesAx=y. Por lo tanto, el sistema es

consistente. �

5.39.Teorema. SeaAuna matrizm×ny seaAc_{una c-inversa de}_A._{Si el sistema de ecuaciones lineales} Ax=yes consistente, entonces su solución general es

(5.1) x=Acy+ �I−AcA)h� h∈�_n×1.

Demostración� Puesto que por hipótesis el sistema de ecuaciones linealesAx=yes consistente, entonces por el teorema anterior,AAc_y₌_{y. En consecuencia, para cada}_x_{de la forma (5.1):}

Ax = AAcy+A�I−AcA)h = y+ �A−A)h = y+�h = y� esto es,xes una solución del sistema dado.

De otro lado, six0es solución del sistema dado, entonces

Ax0=y.

Premultiplicando los miembros de la última igualdad porAc_{se obtiene} Ac_Ax

0=Acy�

de donde:

�=Acy₋AcAx0.

Sumandox0a los dos lados de la última igualdad se llega a:

x0 = Acy+x0−AcAx0

= Ac_y_{+ �I}

−Ac_A)x

0

= Acy+ �I−AcA)h�

dondeh=x0.Esto es,x0se puede expresar en la forma 5.1. �

(22)

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional 5.40.Corolario. SeaA una matriz m×n. Si el sistema de ecuaciones linealesAx=yes consistente, entones su solución general es

(5.2) x=A+y+ �I−A+A)h� h∈�_n×1.

Problema de los Mínimos Cuadrados

Como se estableció en el teorema 1.51(3), para un sistema de ecuacionesAx=yse presenta una y sólo una de las opciones siguientes:

(i) El sistema tiene inﬁnitas soluciones. (ii) El sistema tiene solución única. (iii) El sistema no tiene solución.

En el trabajo experimental generalmente se da generalmente la opción (iii), es decir, que el vectoryno es un elemento del espacio columna de la matrizA, (y∈ C/ �A)) (véase ﬁgura 5.1). En este caso se puede preguntar, si existe una solución aproximada del sistema, para una deﬁnición conveniente de solución aproximada. Un problema que se presenta con frecuencia en el trabajo experimental es:

y A x A x IR (A) � 0

.

A x0 m

Figura 5�1� _{Problema de los mínimos cuadrados} Dado una serie de puntos

�x1� y1); �x2� y2);. . .; �xn� yn).

obtener una relacióny =f�x)entre las dos variablesxyy�“adaptando” (en algún sentido) una curva a dicho conjunto de puntos.

Como los datos se obtienen experimentalmente, generalmente existe un �error� en ellos (errores de aproxi-mación), lo que hace prácticamente imposible encontrar una curva de la forma deseada que pase por todos los puntos. Por medio de consideraciones teóricas o simplemente por �acomodo� de los puntos, se decide la forma general de la curvay=f�x)que mejor se adapte. Algunas posibilidades son (ver ﬁgura 5.2):

1. Funciones lineales (rectas):y=f�x) =a+bx; a� b∈R 2. Polinomios de grado dos:y=f�x) =a+bx+cx2_; _{a� b� c}

∈R_. 3. Polinomios de grado tres:y=f�x) =a+bx+cx2₊_dx3_;_{a� b� c� d}

∈R_.

A. Adaptación de puntos a una línea recta

Considere los puntos�x1� y1); �x2� y2);. . .; �xn� yn)�los cuales se pretende ajustar mediante la gráﬁca de la

(23)

x y

y y

x x

(1) Aproximacion lineal

_´

(2) Aproximacion cuadratica

_´

(3) Aproximacion cubica

_´

Figura 5�2� _{Ajuste por mínimos cuadrados}

por todos losnpuntos y, en consecuencia, los coeﬁcientes desconocidosaybsatisfarían la ecuación de la recta. Esto es, se tendrían las siguientes igualdades:

y1 = a+bx1

y2 = a+bx2

..

. ... ... yn = a+bxn. Estas igualdades se pueden escribir, utilizando notación matricial, así:

(5.3) y= 2 6 6 6 4 y1 y2 .. . yn 3 7 7 7 5 = 2 6 6 6 4 1 x1 1 x2 .. . ... 1 xn 3 7 7 7 5 2 4 a b 3 5=Ax.

Si los puntos que corresponden a los datos no son colineales, es imposible encontrar coeﬁcientesaybque satisfagan (5.3). En este caso, independientemente de la forma en que se escojanayb, la diferencia

Ax−y�

entre los dos miembros de (5.3) no será cero. Entonces, el objetivo es encontrar un vectorx=

»

a∗

b∗ –

que minimice la longitud del vectorAx−y, esto es, que minimice

�Ax−y�� lo que es equivalente a minimizar su cuadrado,�Ax−y_�2_.

Six0= »

a∗

b∗ –

es un vector que minimiza tal longitud, a la línea rectay=a∗

+b∗

xse le denominarecta de ajuste por mínimos cuadradosde los datos. La ﬁgura 5.3 ilustra la adaptación de una línea recta por el método de los mínimos cuadrados. Se tiene que�Ax−y��y

�Ax−y_�2 = �a∗ +b∗ x1−y1)2+ �a∗+b∗x2−y2)2+ · · ·+ �a∗ +b∗ xn−yn)2

(24)

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional

son minimizados por el vectorx0= »

a∗

b∗ –

. En dicha ﬁgura se ve que|a∗

+b∗

xi−yi|corresponde a la “distancia vertical”,di�tomada desde el punto�xi� yi)hasta la rectay=a∗

+b∗

x. Si se toma adicomo el “error vertical” en el punto�xi� yi), la recta de ajuste minimiza la cantidad:

d21+d22+· · ·+d2n�

que es la suma de los cuadrados de los “errores verticales”. De allí el nombre de método de los mínimos cuadrados. d d 1 y x y=a+b x x , y ( ) ( ) d3 2 dn * * 2 x , y 2 ( ) x , y 1 1 3 x , y 3 ( )n n

Figura 5�3� _{Ajuste lineal por mínimos cuadrados}

A continuación se darán dos deﬁniciones motivadas por la discusión anterior. En el ejemplo 5.50 se ex-plicará cómo se adaptar, por mínimos cuadrados, una línea rectay = a+bxa una serien denpuntos �x1� y1); �x2� y2);. . .; �xn� yn)dados.

5.41.Deﬁnición(Solución M nima Cuadrada). Se dice que el vectorx0es una solución mínima cuadrada

(S.M.C.) del sistema de ecuaciones linealesAx=y�si para todo vectorxse tiene que: �Ax0−y� ≤ �Ax−y�.

5.42.Deﬁnición(Mejor Solución Aproximada). Se dice que el vectorx0es una mejor solución aproximada

(M.S.A.) del sistema de ecuaciones linealesAx=y�si: 1. Para todo vectorxse tiene que:

�Ax0−y� ≤ �Ax−y�.

2. Para todo vectorx∗

�

=x0tal que�Ax0−y�<�Ax∗−y�se tiene que

�x0�<�x∗�.

Nota. Observe que una M.S.A de un sistema de ecuaciones linealesAx=yes una S.M.C. del mismo. 5.43.Teorema. SeaAuna matrizm×ny seayun vectorRm_{. Si}_Ac_{es una c-inversa de}_A_{tal que}_AAc es simétrica, entonces para todo vectorx∈Rn_{se tiene que:}

�Ax−y�2=�Ax−AAc_y

�2+�AAc_y −y�2.

(25)

Demostración� Por hipótesisAAc_{= �AA}c₎T_._{Así que para todo vector}_x_{se tiene que:} �Ax−y�2 ₌ ��Ax−AAc_{y) + �AA}c_y −y)�2 = �Ax−AAc_y �2+ 2�Ax−AAc_y)T_�AAc_y −y) +�AAc_y −y�2

El teorema quedará demostrado si veriﬁcamos que el segundo término de esta igualdad es cero, esto es, si comprobamos la igualdad �Ax−AAc_y)T_�AAc_y −y) = 0. En efecto tenemos: �Ax−AAc_y)T_�AAc_y −y) = �x−Ac_y)T_AT_��AAc₎T −I)y = �x−Acy)T�AT�AAc)T−AT)y = �x−Ac_y)T_��AAc_A)T −AT_)y = �x−Ac_y)T_�AT −AT_)y₌_�_. � 5.44.Teorema. SeaAuna matrizm×ny seayun vectorRm_{. Si}_Ac_{es una c-inversa de}_A_{tal que}_AAc es simétrica, entoncesx0=Acyes una S.M.C. para el sistemaAx=y.

Demostración� _{Por hipótesis y por el teorema anterior se tiene que}x0=Acyes tal que:

�Ax−y�2=�Ax−Ax0�2+�Ax0−y�2≥ �Ax0−y�2.

Para todo vectorx.De aquí que para todo vectorx:

�Ax0−y� ≤ �Ax−y��

esto es,x0=Acyes una S.M.C. para el sistemaAx=y. �

5.45.Teorema. SeaAuna matrizm×ny seayun vectorRm. El sistema de ecuaciones linealesAx=y tiene una única M.S.A., a saber

x0=A+y.

Demostración� _{Por deﬁnición de g-inversa se tiene que}A+_{es en particular una c-inversa de}_A_que

satisface la propiedad de queAA+_{es una matriz simétrica, entonces por el teorema 5.43 se tiene para todo}

xque:

�Ax−y�2=�Ax−AA+y�2+�AA+y−y�2≥ �AA+y−y�2. De aquí que para todo vectorx:

(5.4) �AA+y−y� ≤ �Ax−y�

Esto es,x0=A+yes una S.M.C. para el sistemaAx=y.Se quiere demostrar ahorax0 =A+yque la

M.S.A. para ello se muestra, que six∗

�

=x0 es otra S.M.C. del sistemaAx=y(esto es six∗ satisface

Ax∗

=AA+_{y) entonces se tiene que}

�x0�<�x∗�.Para ello se veriﬁca primero que para todoxse satisface

la igualdad

(26)

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional En efecto se tiene que:

�A+y+ �I−A+A)x�2 = �A+y_�2+ 2�A+y)T�I−A+A)x+ ��I−A+A)x�2.

La igualdad (5.5) se obtendrá entonces si veriﬁca que el segundo término de la igualdad anterior es cero. Esto último se sigue fácilmente de

�A+y)T�I−A+A)x = yTh�A+)T−�A+)T�AA+)Tix = yT

h

�A+)T−�A+AA+)Tix = yT��)x=�

Tómese ahora un vectorx∗

�

=x0, tal queAx∗=AA+y. Multiplicando porA+obtenemosA+Ax∗=A+y.

De aquí y de (5.5) aplicada ax∗ se tiene que: �x∗ �2 = �A+y+x∗ −A+y�2 = �A+_y₊_x∗ −A+_Ax∗ �2 = �A+y+ �I−A+A)x∗ �2 = �A+y�2+��I−A+A)x∗ �2 > �A+y_�2=�x0�2. � 5.46.Observación. El teorema anterior establece que todo sistema de ecuaciones linealesAx=ytiene una única M.S.A.,x0 =A+y.Por esto, se hablará de aquí en adelante de la mejor solución aproximada

(M.S.A.) de un sistema de ecuaciones lineales.

Ahora bien, puesto que la mejor solución aproximada del sistema de ecuaciones linealesAx=yes una solución mínima cuadrada, se tiene el siguiente teorema.

5.47.Corolario. Todo sistema de ecuaciones linealesAx=ytiene al menos una S.M.C. 5.48.Ejemplo. Para el sistema de ecuaciones lineales

Ax= 2 4 1 1 1 1 1 1 3 5 » x y – = 2 4 1 2 3 3 5=y� se tiene quex0=A+y=1 6 » 1 1 1 1 1 1 – 2 4 1 2 3 3 5= » 1 1 – es la M.S.A. Además: �Ax0−y�= √ 2; así que para todo vectorxse tiene que: _√

2≤ �Ax−y�� y si existe un vectorx∗

tal que�Ax∗

−y�=√2, entonces se debe tener que: �x0�=

√ 2<�x∗

�. �

5.49.Teorema. SeaA una matriz m×ny sea yun vector Rm. Siρ�A) = n, entonces el sistema de ecuaciones linealesAx=ytiene una única S.M.C. que es justamente la M.S.A. dada por:

(27)

Demostración� Seax∗

una S.M.C. del sistema de ecuacionesAx=y.Por deﬁnición se tiene para todox∈Rn, entonces que_�Ax∗

−y� ≤ �Ax−y��en particular, para el vectorx0=A+yse tiene:

(5.6) �Ax∗

−y� ≤ �AA+y−y�.

De otra parte, comoA+es una c-inversa deAtal queAA+es simétrica, entonces se tiene (ver teorema 5.43) �Ax−y�2₌ �Ax−AA+_y �2₊ �AA+_y −y�2 ∀x∈Rn. En particular, para el vectorx∗

se tiene: �Ax∗ −y�2 = �Ax∗ −AA+y�2+�AA+y−y�2. (5.7) De (5.6) y (5.7) se sigue que: �AA+y₋y_�2 _{≤ �}Ax∗ −AA+y_�2+�AA+y₋y_�2 = �Ax∗ −y�2≤ �AA+y−y�2 De aquí que‚ ‚Ax ∗ −AA+_y‚ ‚ = 0y por lo tanto: Ax∗ =AA+y. Puesto queρ�A) =n, entoncesA+₌`

AT_A´−1

AT _{(teorema 5.15), en consecuencia:} Ax∗

=A“AT_A”−1_AT_y. Premultiplicando esta igualdad por`

AT_A´−1 AT_�_{se obtiene:} x∗ = “AT_A”−1_AT_Ax∗ = “AT_A”−1_AT_A“_AT_A”−1_AT_y “ AT_A”−1_AT_y₌_A+_y₌_x 0. � 5.50.Ejemplo. Encuentre una recta de ajuste, por mínimos cuadrados (ver ﬁgura 5.4), que se adapte a los puntos:

�0�1); �1�3); �2�4); �3�4).

Para ello se debe encontrar una S.M.C. del sistema de ecuaciones linealesAx=y, donde

A= 2 6 6 4 1 x1 1 x2 1 x3 1 x4 3 7 7 5 = 2 6 6 4 1 0 1 1 1 2 1 3 3 7 7 5 � y= 2 6 6 4 y1 y2 y3 y4 3 7 7 5 = 2 6 6 4 1 3 4 4 3 7 7 5

y el vector incógnitaxestá dada por

x= » a b – .

(28)

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional Puesto queρ�A) = 2�entonces por el teorema anterior, el sistema dado tiene una únicaS.M.C., a saber:

x0 = A+y= �ATA)−1ATy = 1 10 » 7 4 1 −2 −3 −1 1 3 – 2 6 6 4 1 3 4 4 3 7 7 5 = » 1.5 1 – = » a∗ b∗ –

En consecuencia, la recta de ajuste, por mínimos cuadrados, de los datos dados es:

y=a∗ +b∗ x= 1.5 +x. � (0,1) (1,3) (2,4) (3,4) y=1.5+x y x

Figura 5�4� _{Ajuste lineal ejemplo 5.50}

5.51.Ejemplo. Encuentre una recta de ajuste, por mínimos cuadrados, que se adapte a los puntos:

�1�1); �1�2).

Observe que en este caso los puntos dados pertenecen a la recta, de pendiente inﬁnita,x= 1.(ver ﬁgura 5.5(a))

(29)

x (1,2) (1,1) y x = 1 b) Ajuste por rectas de pendiente no infinita y x (1,2) (1,1) y=3/2x y=3/4+3/4x a) Ajuste por una recta de pendiente infinita

Figura 5�5� _{Ajuste lineal ejemplo 5.51}

Ahora bien, si se busca una rectay=a+bx�que no tenga pendiente inﬁnita, que se adapte por mínimos cuadrados, a los puntos dados, entonces se debe encontrar una S.M.C. del sistema de ecuaciones lineales (ver ﬁgura 5.5(b)) Ax = » 1 x1 1 x2 – » a b – = » 1 1 1 1 – » a b – = » 1 2 – = » y1 y2 – =y. Una S.M.C. del sistema dado es:

x0 = A+y=1 4 » 1 1 1 1 – » 1 2 – = » 3/4 3/4 – = » a∗ b∗ – . Así que una recta de ajuste, por mínimos cuadrados, de los puntos dados es:

y=a∗ +b∗ x=3 4+ 3 4x . De otra parte, la matriz

Ac₌

»

0 0

1/2 1/2

–

es una c-inversa deA,AAc_{es simétrica. En efecto,}

AAc₌ » 1/2 1/2 1/2 1/2 – . Por lo tanto, de acuerdo con el teorema 5.44,

x0=Acy= » 0 3/2 – = » ˆ a ˆ b –

es también una S.M.C. Así que otra recta de ajuste por mínimos cuadrados, de los puntos dados es (ver ﬁgura 5.5(b)):

y=a∗

+b∗

x=3

(30)

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional

B. Adaptación a polinomios de gradon.

La técnica descrita antes para adaptar una recta anpuntos dados, se generaliza fácilmente a la adaptación, por mínimos cuadrados, de un polinomio de cualquier grado a un conjunto de puntos dados.

A continuación se muestra cómo adaptar un polinomio de grado≤m� y=a0+a1x+a2x2+. . .+amxm

a un conjunto denpuntos�x1� y1); �x2� y2);. . .; �xn� yn)�mediante la técnica de los mínimos cuadrados.

Sustituyendo estosnvalores dexyyen la ecuación polinómica se obtienen lasnecuaciones siguientes:

2 6 6 6 4 y1 y2 .. . yn 3 7 7 7 5 = 2 6 6 6 4 1 x1 x21 · · · xm1 1 x2 x22 · · · xm2 .. . ... ... . .. ... 1 xn x2 n · · · xmn 3 7 7 7 5 2 6 6 6 4 a0 a1 .. . am 3 7 7 7 5

De lo que se trata nuevamente, es de encontrar una S.M.C. del sistema de ecuaciones linealesAx=y. 5.52.Ejemplo. Encontrar un polinomio de grado dos que mejor se ajuste, por mínimos cuadrados, a los puntos:

�−1�0); �0�−2); �1�−1); �2�0). Se debe encontrar una S.M.C. del sistema de ecuaciones lineales:

Ax = 2 6 6 4 1 −1 1 1 0 0 1 1 1 1 2 4 3 7 7 5 2 4 a1 a2 a3 3 5= 2 6 6 4 0 −2 −1 0 3 7 7 5 =y.

Puesto queρ�A) = 3�el sistema dado tiene una única S.M.C., la cual está dada por: x0 = A+y= �ATA)−1ATy = 1 20 2 4 3 11 9 −3 −1 3 7 1 5 −5 −5 5 3 5 2 6 6 4 0 −2 −1 0 3 7 7 5 = 1 20 2 4 −31 −13 15 3 5= 2 4 −1.55 −0.65 0.75 3 5

En consecuencia, existe un único polinomio de grado dos que se ajuste por mínimos cuadrados de los datos dados. Este polinomio está dado por (ver ﬁgura 5.6):

y=−1.55−0.65x+ 0.75x2

(31)

(2,0) (1,−1) (−1,0) x y (0,−2) y=−1.55−0.65x+0.75x2

Figura 5�6� Ajuste cuadrático ejemplo 5.52

5�4 Ejercicios

1. Si el sistema de ecuaciones linealesAx= ytiene solución, demuestre entonces que la solución x=A+yes únicasiiA+A=I�y en este casoA+y=Ac_y_{para toda c-inversa}_Ac_de_A.

2. Six1�x2� . . . �xn son soluciones del sistema de ecuaciones linealesAx=y, y siλ1� λ2� . . . � λn son

escalares tales quePn

i=1λi= 1, demuestre entonces

x= n

X

i=1

λixi es una solución del sistemaAx=y.

3. Seay = a+bxuna línea recta que se quiere adaptar, por mínimos cuadrados, a los puntos �x1� y1); �x2� y2);. . .; �xn� yn).Utilice el teorema 5.39 y la regla de Cramer para demostrar que

si para algúni y para algúnj,xi�=xj�entonces existe una única recta de ajuste, por mínimos cuadrados, a los puntos dados:

y=a∗ +b∗ x y quea∗ =Δa Δ yb ∗ =Δb Δ, donde: Δ = det 2 4 n Pn i=1xi Pn i=1xi Pn i=1x 2 i 3 5 Δa = det 2 4 Pn i=1yi Pn i=1xi Pn i=1xiyi Pn i=1x 2 i 3 5 Δb = det 2 4 n Pn i=1yi Pn i=1xi Pn i=1xiyi 3 5

(32)

5.4. Mínimos cuadrados Inversa generalizada e inversa condicional 4. Encuentre la M.S.A. del sistema de ecuaciones linealesAx=y�donde:

A= 2 6 6 4 2 2 2 2 2 2 1 −1 0 2 −2 0 3 7 7 5 y y= 2 6 6 4 1 2 3 4 3 7 7 5 .

5. Encuentre la M.S.A del sistema de ecuaciones lineales

8 > > > < > > > : x+ 2y = 1 −x+y = 1 2x−3y = 2 3x+y = 3.

6. Encuentre la ecuación de la recta que mejor se ajuste por mínimos cuadrados a los puntos: �0�1); �1�3); �2�2); �3�4).

7. Obtenga la ecuación del polinomio de grado dos que mejor se adapte, por mínimos cuadrados, a los puntos:

�−1�4); �0�2); �1�0); �2�1).

8. Dé, si las hay, dos S.M.C. diferentes del sistema de ecuaciones lineales: Ax= » 2 2 2 2 – » x y – = » 1 0 – .

9. Suponga que las variablesxyyse relacionan por medio de la ecuacióny=a·bx_;_{a >}_{0� b >}_0. a) Verique que dicha ecuación se puede transformar en la ecuación

y∗ =a∗ +b∗ x � dondey∗ = lny� a∗ = lnayb∗ = lnb.Y viceversa.

b) Determine, los valores de las constantesa >0� b >0 en el modeloy =a·bx _{que mejor se} adapte a los datos

x -1 1 2

y 1 6 10

Estime el valor deyparax= 5.Para ello encuentre la rectay∗

=a∗

+b∗

xque mejor se adapte, por mínimos cuadrados a los puntos de la forma�x�lny).

10. Determine la ecuación del planoz=a+bx+cyque mejor se adapte, por mínimos cuadrados, a los puntos�0�1�5)��1�0�2)��1�1�7)�(1,-1,-1).