Inversa generalizada e inversa condicional de matrices�
Este capítulo consta de cuatro secciones. Las dos primeras versan sobre la definición, propiedades y cálculo de la inversa generalizada de una matriz. La tercera sección trata sobre la definición y el cálculo de inversas condicionales de una matriz. En la última sección se verán algunas aplicaciones de la inversa generalizada y de la inversa condicional de una matriz a los sistemas de ecuaciones lineales y a los problemas de mínimos cuadrados.
5.1. Inversa generalizada de una matriz
La inversa generalizada de una matriz es una herramienta de gran utilidad en los cursos de modelos lineales (véase la sección 1.5 de [4]).
Antes de dar la definición de inversas generalizada de una matriz, veamos un par de teoremas que serán útiles en el desarrollo del resto del capítulo.
5.1.Teorema. SiA es una matrizm×nde rangor >0�entonces existen matrices invertiblesPm×m y Qn×ntales queP AQes igual a:
1. » Ir � � � – sir < nyr < m. 2. » Ir � – sir=n < m. 3. ˆ Ir � ˜ sir=m < n. 4. Irsir=n=m.
Demostración� Se hará aquí sólo la demostración del inciso (1). SiRes la forma escalonada reducida deA�entoncesR=P A� P es un producto de matrices elementales, (véase el apartado 1.7). Las últimas m−rfilas deRson nulas yRtienen la estructura siguiente:
2 6 6 6 6 6 4 0 · · · 0 1 a1k · · · 0 a1k� · · · a1k�� 0 a1k��� · · · 0 · · · 0 0 0 · · · 1 a2k� · · · a2k�� 0 a2k��� · · · 0 · · · 0 0 0 · · · 0 0 · · · 0 1 a3k��� · · · .. . ... ... ... ... ... ... ... ... 0 · · · 0 0 0 · · · 0 0 0 0 0 · · · 3 7 7 7 7 7 5
5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional F= » Ir � � � –
Así queF=RQ�dondeQes un producto de marices elementales (por columnas). Por lo tanto;F=RQ=
P AQ, dondeP yQson matrices invertibles. �
5.2.Ejemplo. Considere la matriz
A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5
claramente las dos primeras filas son linealmente independientes, y la tercera es un múltiplo escalar de la primera fila deA.por lo tanto, el número máximo de filas linealmente independientes deAes 2; o sea,A tiene rango2.Por el teorema anterior existen matrices invertiblesP yQtales que
P AQ= » I2 � � � – = 2 4 1 0 0 0 0 1 0 0 0 0 0 0 3 5.
Ahora se procede a calcular las matrices invertibles P yQsiguiendo las pautas de la demostración del teorema anterior.
Paso 1: Se encuentra una matriz invertibleP tal queP A=R, dondeRes la forma escalonada reducida deA. [A|I3] = 2 4 1 2 1 3 1 0 0 −1 −2 0 −2 0 1 0 2 4 2 6 0 0 1 3 5 f ilas � 2 4 1 2 1 3 1 0 0 0 0 1 1 1 1 0 0 0 0 0 −2 0 1 3 5 f ilas � 2 4 1 2 0 2 0 −1 0 0 0 1 1 1 1 0 0 0 0 0 −2 0 1 3 5= [R|P ].
Paso 2: Se encuentra una matriz invertibleQtal queRQ=F�donde
F= » I2 � � � – .
[R|I4] = 2 6 6 6 4 1 2 0 2 0 0 1 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 3 7 7 7 5 col. � 2 6 6 6 4 1 0 2 2 0 1 0 1 0 0 0 0 1 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1 3 7 7 7 5 col. � 2 6 6 6 4 1 0 0 0 0 1 0 1 0 0 0 0 1 0 −2 −2 0 0 1 0 0 1 0 0 0 0 0 1 3 7 7 7 5 col. � 2 6 6 6 4 1 0 0 0 0 1 0 0 0 0 0 0 1 0 −2 −2 0 0 1 0 0 1 0 −1 0 0 0 1 3 7 7 7 5 = [F |Q]. Las matrices invertibles
P = 2 4 0 −1 0 1 1 0 −2 0 1 3 5 y Q= 2 6 6 4 1 0 −2 −2 0 0 1 0 0 1 0 −1 0 0 0 1 3 7 7 5
son tales que:
P AQ= » I2 � � � – = 2 4 1 0 0 0 0 1 0 0 0 0 0 0 3 5.
5.3.Teorema. SiA es una matriz m×nde rangor >0�entonces existen matricesBm×r yCr×n, de
rangor, tales queA=B·C.
Demostración� Considere distintas posibilidades para rango de la matrizA,ρ�A) =r. 1. Sir=m�entoncesA=BC, dondeB=IryC=A.
2. Sir=n�entoncesA=BC, dondeB=AyC=Ir.
3. Sir < nyr < m�entonces por el teorema 5.1(1) existen matrices invertiblesP yQtales que: P AQ= » Ir � � � – . De aquí que: A = P−1 » Ir � � � – Q−1 = P−1 » Ir � – ˆ Ir � ˜ Q−1 = BC�
5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional dondeB∈�m×ryC∈�r×n son las matrices de rangor, dadas por
B=P−1 » Ir � – y C=ˆ Ir � ˜ Q−1.
El teorema queda entonces demostrado. �
Una forma de calcular las matricesByCque aparecen en el teorema anterior, en el caso en quer < ny r < m�tal como aparece en la demostración, es calculando primero las matrices invertiblesP yQtales que:
P AQ= » Ir � � � – � después calcular las matricesP−1yQ−1, y por último obtener:
B=P−1 » Ir � – y C=ˆ Ir � ˜ Q−1.
Para el caso en que la matrizAno sea de rango fila completo, existe una demostración alternativa, la cual presentamos a continuación. Como veremos, esta demostración facilitará un algoritmo más económico para calcular matricesByCadecuadas.
Demostración� [Otra prueba del teorema 5.3 parar < m]
Suponga queAes una matriz de rangor < m. SeaP una matriz invertible de ordenmtal queP A=R, dondeRes la forma escalonada reducida deA(véase apartado 1.7). Puesto quer < m,Rtiene la estructura siguiente: R= 2 4 C � 3 5�
dondeCes una matrizr×nde rangor.Ahora, si escribimosP−1particionada adecuadamente
P−1=ˆ
B D ˜
� dondeBes una matrizm×rde rangor. Dado queP A=Rse tiene
A = P−1R = ˆ B D ˜ 2 4 C � 3 5 = BC � Ahora se presenta a continuación un método basado en esta demostración para calcular matricesByC, de rangor�tales queA=BC.
5.4.Algoritmo. Considere una matrizAde tamañom×n Paso 1 Forme la matriz[ Am×n | Im] .
Paso 2 Efectúe operaciones elementales en las filas deAhasta obtener su forma escalonada reducida, y en las columnas deIm, siguiendo las siguientes pautas:
i) Si se intercambian lasfilasiyj deA�entonces intercambie lascolumnasiyjdeIm. ii) Si se multiplica lai-ésima fila deApor el númeroα�= 0,entonces se multiplica la i-ésima
iii) Si a laj-ésima filadeAse le sumaαveces lai-ésima filadeA(α�= 0),entonces a lai-ésima columna deImse le suma�−α) veces laj-ésima columnadeIm.
Al final de este paso se obtiene la matriz[ R | P−1 ]
Paso 3 B=ˆ
Primerasr columnas deP−1˜
, C= [Primerasr filas deR]. 5.5.Ejemplo. La matriz del ejemplo 5.2
A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5
tiene rango2.Existen por lo tanto matricesB3×2yC2×4de rango2tales queA=BC.Las matricesBy
Cse pueden ahora calcular siguiendo los pasos indicados anteriormente. [A|I3] = 2 4 1 2 1 3 1 0 0 −1 −2 0 −2 0 1 0 2 4 2 6 0 0 1 3 5 → 2 4 1 2 0 2 1 1 0 0 0 1 1 −1 0 0 0 0 0 0 2 2 1 3 5 = [R|P−1].
Así, tomando las primeras 2 columnas deRy las 2 primeras filas deP−1 se obtiene respectivamente las
matrices B= 2 4 1 1 −1 0 2 2 3 5 y C= » 1 2 0 2 0 0 1 1 – � las cuales tienen rango 2 y son tales que:
BC = 2 4 1 1 −1 0 2 2 3 5 » 1 2 0 2 0 0 1 1 – = 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5=A .
5.6.Definición (Inversa generalizada o pseudoinversa). Sea A una matrizm×n. Si M es una matriz n×mtal que:
1. AM es una matriz simétrica. 2. M Aes una matriz simétrica. 3. AM A=A.
4. M AM=M�
entonces se dice queM es una inversa generalizada (pseudoinversa) deA�o simplemente que M es una g-inversade A.
5.7.Ejemplo. Verifique que la matrizM= 1 11 2 4 3 −7 2 −1 3 4 3
5es una g-inversa de la matrizA= » 1 1 2 −1 0 1 – . En efecto,
5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional 1. AM= 1 11 » 11 0 0 11 –
=I2es una matriz simétrica.
2. M A= 1 11 2 4 10 3 −1 3 2 3 −1 3 10 3
5es una matriz simétrica.
3. AM A=I2A=A. 4. M AM=M I2= 1 11 2 4 3 −7 2 −1 3 4 3 5. 5.8.Observación.
1. SiAes invertible, entonces la matrizA−1es una g-inversa deA.
2. SiA=�m×n�entonces la matrizM=�n×mes una g-inversa deA.
5.9.Teorema(Existencia de una g-inversa). Toda matrizA de tamañom×ntiene una inversa genera-lizada.
Demostración� De acuerdo con la observación 5.8(2), la demostración es trivial en el caso en que A=�. Suponga ahora que queA�=�tiene rangor >0.Por el teorema 5.3, existen matricesBde tamaño m×ryCde tamañor×n, ambas de rangortales queA=BC.
Puesto queByCtiene rangor, las matricesBTByCCTson invertibles (véase el teorema 1.56). Finalmente, se considera la matriz
M=CT`
CCT´−1`
BTB´−1
BT.
El resultado quedará comprobado, se se verifica queMes una g-inversa deA.Es decir, si se verifica que se satisfacen las condiciones de la definición 5.6. En efecto:
Las matricesAMyM Ason simétricas puesto que AM=BCCT` CCT´−1`BTB´−1BT =B` BTB´−1BT y M A=CT` CCT´−1` BTB´−1 BTBC=CT` CCT´−1 C De otro lado,AM A=B` BTB´−1BTBC=BC=A�y M AM = CT` CCT´−1CCT` CCT´−1`BTB´−1BT = CT` CCT´−1`BTB´−1BT =M.
Es decir,AM A=AyM AM=A, por lo tanto,M es una g-inversa deA. � 5.10.Teorema. [Unicidad de la g-inversa]Toda matrizAtiene una única g-inversa.
Demostración� Supongamos queM1yM2son dos g-inversas de una matrizA.Utilizando la definición
de g-inversa de una matriz se obtiene la cadena siguiente de igualdades: AM2 = �AM1A)M2= �AM1)�AM2) = �AM1)T�AM2)T
= ��AM2)�AM1))T = ��AM2A)M1)T= �AM1)T=AM1.
De aquí queAM2=AM1. En forma análoga se obtiene queM2A=M1A.Por lo tanto
M1 = M1AM1= �M1A)M1= �M2A)M1=M2�AM1)
� 5.11.Nota. En lo sucesivo, la g-inversa de una matriz la se denotará con el nombre de la matriz y con el signo+como exponente. Por ejemplo, porA+� B+denotarán respectivamente las inversas generalizadas de las matricesAyB.
5.12.Teorema(Propiedades de la g-inversa). Para cualquier matrizAtiene que: a) �A+)+=A.
b) �αA)+=α−1A+�para todo escalarα
� = 0. c) �AT)+ = �A+)T d) �AAT)+= �AT)+A+ e) �ATA)+=A+�AT)+
Demostración� Por el teorema anterior, toda matriz tiene una única g-inversa. Sólo resta verificar en cada caso, que se satisfacen las condiciones de la definición 5.6. Para ello se hará la demostración sólo para el inciso (e) suponiendo, que las afirmaciones (a)-(d) son válidas (las verificaciones quedan a cargo del lector) y se aplicarán las propiedades de la definición 5.6:
1. Inicialmente se verifica que la matriz`
ATA´ `
A+�AT)+´
es simétrica, para ello se muestra que para la matrizM=A+�AT)+se satisface la igualdad`
ATA´ M=A+A. En efecto: “ ATA”M = “ATA” “A+�AT)+” �c) = AT�AA+)�A+)T def.= AT�AA+ )T�A+ )T = ` A+AA+A+´T def.= ` A+A´T =A+A . 2. Ahora se verifica que la matriz`
A+�AT)+´ `
ATA´
es simétrica, para ello muestra como antes, de que la matrizM=A+�AT)+satisface la igualdadM`
ATA´ =A+A. En efecto: M“ATA” = “A+�AT)+” “ATA” �c) = A+�A+)TATA def.= A+�AA+)TA def.= A+AA+Adef.= A+A. 3. La matrizM=A+�AT)+satisface la igualdad�ATA)M�ATA) =ATA.
�ATA)M�ATA) = “ATA” “A+�AT)+” “ATA”
�1) = ` A+A´“ ATA”= �A+ A)TATA = ` A�A+A)´T Adef.= ` AA+A´T A=ATA.
5.1. G-Inversa y C-inversa Inversa generalizada e inversa condicional 4. La matrizM=A+�AT)+satisface la igualdadM�ATA)M=M.En efecto
M�ATA)M=M = “A+�AT)+” “ATA” “A+�AT)+”
�2) = ` A+A´“ A+�AT)+” = ` A+AA+´“AT”+ def.= A+�AT)+. � 5.13.Observación. No siempre es cierto que�AB)+=B+A+. Para mostrar este hecho basta considerar
un ejemplo (ver ejemplo siguiente). 5.14.Ejemplo. SiA=ˆ 1 1 ˜ yB= » 1 2 –
�entoncesAB= [3]. Por lo tanto�AB)+= 1/3. De acuerdo
con el corolario 5.16,A+=1 2 » 1 1 – yB+=1 5 ˆ 1 2 ˜
, de donde se tiene que B+A+=1 5 ˆ 1 2 ˜1 2 » 1 1 – = 1 10[3] = [3/10]�= [3] = �AB) + . 5�1 Ejercicios
En los ejercicios 1 al 9, responda verdadero o falso justificando su respuesta.
1. Si las matricesB∈�m×ryC∈�r×mtienen el mismo rango, entonces�BC)+=C+B+. 2. SiSes una matriz simétrica, entoncesS+es una matriz simétrica.
3. SiSes una matriz simétrica tal queS2=S�entoncesS+=S.
4. SiSes una matriz simétrica tal queS3=S�entoncesS+=S.
5. Para toda matrizAse tiene queA+= �ATA)+AT. 6. Para toda matrizAse tiene queA+=AT�AAT)+.
7. Para toda matrizAse tiene que�AA+)2=AA+y�A+A)2=A+A.
8. SiA∈�m×ntiene rangom�entonces el sistema de ecuaciones linealesAx=ytiene solución para cualquiery∈�m×1.
9. SiA∈�m×ntiene rangony si el sistema de ecuaciones linealesAx=ytiene solución, entonces el sistema tiene solución única.
En los ejercicios 10 al 21 demuestre la afirmación correspondiente 10. SiBCT =�, entoncesBC+=�yCB+=�. 11. SiA= » B C – yBCT=�entoncesA+=ˆ B+ C+ ˜ .
12. SiBes una matriz simétricam×my siCTB=��dondeCTes la matrizCT=ˆ
1 1 · · · 1 ˜ 1×m� entonces la g-inversa de la matriz:
A= » B CT – esA+=ˆ B+ 1/m C ˜ .
13. SiD= [dij]n×n es una matriz diagonal, entoncesD
+=[aij]
n×nes una matriz diagonal, donde aij= ( 1/dii , si dii�= 0 0 � si dii= 0. 14. SiA= » B � � C – entoncesA+= » B+ � � C+ – . 15. SiSes una matriz simétrica, entoncesSS+=S+S.
16. SiAes una matriz tal queATA=AAT�entoncesA+A=AA+.
17. Si A es una matriz m×n, donde �A�ij = 1para i = 1�2� . . . � m y j = 1�2� . . . � n� entonces A+= 1
mnA.
18. SiP ∈�n×n yQ∈�m×mson matices ortogonales, entonces para cualquier matrizm×n� A, se tiene que�P AQ)+=QTA+PT.
19. SiSes una matriz simétrica no negativa, entoncesS+es una matriz no negativa.
20. Para cada matrizm×n� A;AB=AA+siiBes tal queABA=AyABes simétrica. 21. SiBes una c-inversa deA�entonces la matrizBABtambién lo es.
5.2. Cálculo de la g-inversa de una matriz
En esta sección se verán algunos teoremas que pueden usarse para calcular la g-inversa de una matriz. Empezamos con el siguiente resultado, el cual se deduce de los teoremas 5.3, 5.9 y 5.10.
5.15.Teorema. SeaAuna matrizm×nde rangor >0. 1. Sir=n=m, entoncesAes invertible yA+=A−1.
2. Sir=m < n, entoncesA+=AT`
AAT´−1. 3. Sir=n < m, entoncesA+=`
ATA´−1AT.
4. Sir < nyr < m, entonces existen matricesB∈�m×ryC∈�r×nde rangortales queA=B·C y
A+=CT`
CCT´−1`
BTB´−1
BT. 5.16.Corolario. Seaaun vector no nulo dencomponentes.
1. Si a∈�1×n�entoncesa+=`aaT´ −1
aT. 2. Sia∈�n×1�entoncesa+=`
aTa´−1aT.
5.17.Ejemplo. Ilustre el teorema 5.15 con alguna matrices sencillas. 1. La matrizA=
»
1 2 1 3
–
es invertible, así queA+=A−1= » 3 −2 −1 1 – . 2. La matrizA= » 1 2 3 −1 −1 1 –
tiene rango 2, así que:
A+ = AT` AAT´−1= 2 4 1 −1 2 −1 3 1 3 5 1 42 » 3 0 0 14 – = 1 42 2 4 3 −14 6 −14 9 14 3 5
5.2. Cálculo de la g-inversa Inversa generalizada e inversa condicional 3. La matrizA= 2 4 1 2 3 4 5 6 3
5tiene rango 2, así que:
A+ = ` ATA´−1AT= 1 24 » 56 −44 −44 35 – » 1 3 5 2 4 6 – = 1 24 » −32 −8 16 26 8 −10 –
4. La matrizAdada por
A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5
Del ejemplo 5.5 se sabeρ�A) = 2y que las matrices B= 2 4 1 1 −1 0 2 2 3 5 y C= » 1 2 0 2 0 0 1 1 –
son tales queA=BC.Luego
A+ = CT` CCT´−1` BTB´−1 BT. = 1 24 2 6 6 4 −2 −20 −4 −4 −40 −8 9 55 18 5 15 10 3 7 7 5 5. Para la matrizA=ˆ 1 2 3 ˜ � =�se tiene que: a+ = “aaT ”−1 aT = 1 14 2 4 1 2 3 3 5 6. La matrizA= 2 4 1 1 1 3 5�=�se tiene que, a+ = “aTa ”−1 aT =1 3 ˆ 1 1 1 ˜ .
5.18.Teorema. SeaA∈�m×n una matriz de rangor >0. Entonces la g-inversa deAse puede calcular siguiendo los pasos dados a continuación:
1. CalculeM=ATA. 2. HagaC1=I.
3. CalculeCi+1=1
iTr�CiM)I−CiM�parai= 1�2� . . . � r−1. 4. Calcule r
Tr �CrM)CrA
T�ésta es la matrizA+.
Además, se tiene queCr+1M=�yTr �CrM)�= 0.
Para la demostración de este teorema, remitimos al lector a [3] (teorema 6.5.8). Obsérvese además, que la condiciónCr+1M=�permite proceder sin conocer de antemano el rango deA.
5.19.Ejemplo. Considere la matriz A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5
del ejemplo 5.17(4). CalculeA+utilizando el teorema anterior. Para ello se puede calcualarM=AtA.Esto es,
M= 2 6 6 4 6 12 5 17 12 24 10 34 5 10 5 15 17 34 15 49 3 7 7 5
y considereC1=I4. Entonces se tiene que:
C2= Tr �C1M)I−C1M= 2 6 6 4 78 −12 −5 −17 −12 60 −10 −34 −5 −10 79 −15 −17 −34 −15 35 3 7 7 5 .
ComoC3M=��entoncesρ�A) = 2�y además
A+= 2 Tr �C2M)C2A T = 2 140 2 6 6 4 −2 −20 −4 −4 −40 −8 9 55 18 5 15 10 3 7 7 5
El siguiente teorema presenta una forma alternativa para calcular la g-inversa de una matriz. Para su demostración, remitimos a [9] (véase páginas. 14-15).
5.20.Teorema. SeaA∈�m×nuna matriz de rangor >0. La g-inversa deAse puede calcular mediante los siguientes pasos:
1. Forme la matriz[ A | Im ].
2. Efectúe operaciones elementales en las filas de la matriz anterior hasta conseguir la forma escalon-ada reducida deA.Al final de este paso se obtiene una matriz que descrita por bloques queda así:
» Er×n Pr×m ��m−r)×n P�m−r)×m – si r < m ó ˆ Em×n | Pm×m ˜ si r=m . (Sir=m=n� Aes invertible,E=IyP =A−1=A+). 3. Forme la matriz: » Er×nAT Er×n P�m−r)×m ��m−r)×n – si r < m ó ˆ Em×nAT | Em×n ˜ si r=m .
4. Efectúe operaciones elementales en las filas de la matriz anterior hasta conseguir la forma escalon-ada reducida. Al final de este paso se obtiene la matriz
h
Im | `
A+´T i
5.2. Cálculo de la g-inversa Inversa generalizada e inversa condicional 5.21.Ejemplo. Considere de nuevo la matrizAdel ejemplo 5.19
A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5.
Con el objeto de calcularA+utilizando el teorema anterior, se forma la matrizˆ
A | I3 ˜y se aplican
operaciones elementales en las filas hasta encontrar la forma escalonada reducida deA.
[A|I3] = 2 4 1 2 1 3 1 0 0 −1 −2 0 −2 0 1 0 2 4 2 6 0 0 1 3 5 → 2 4 1 2 0 2 0 −1 0 0 0 1 1 1 1 0 0 0 0 0 −2 0 1 3 5 = » E2×4 P2×3 �1×4 P1×3 – .
Se construye ahora la matriz de la forma
»
E2×4AT E2×4
P1×3 �1×4 –
y se aplican de nuevo operaciones elementales en las filas, hasta obtener la matriz identidadI3en el lado
izquierdo de este arreglo
2 4 E2×4AT E2×4 P1×3 �1×4 3 5 = 2 4 11 −9 22 1 2 0 2 4 −2 8 0 0 1 1 −2 0 1 0 0 0 0 3 5 → 2 6 6 6 6 6 6 6 4 1 0 0 −1 35 − 2 35 9 70 1 14 0 1 0 −27 −47 1114 143 0 0 1 −352 −354 359 17 3 7 7 7 7 7 7 7 5 = hI3|�A+)T i . Así que A+= 2 6 6 6 6 6 6 6 6 6 6 6 6 6 4 −351 −27 −352 −2 35 − 4 7 − 4 35 9 70 11 14 9 35 2 35 3 14 1 7 3 7 7 7 7 7 7 7 7 7 7 7 7 7 5 = 1 70 2 6 6 4 −2 −20 −4 −4 −40 −8 9 55 18 5 15 10 3 7 7 5
5.22.Ejemplo. Considere la matrizAdel ejemplo 5.17(2) A= » 1 2 3 −1 −1 1 – � y siga los pasos del ejemplo anterior (teorema 5.20) para calcularA+.
[A|I2] = » 1 2 3 1 0 −1 −1 1 0 1 – → » 1 0 −5 −1 −2 0 1 4 1 1 – = ˆ E2×4 P2×3 ˜ . Se construye ahora la matrizˆ
E2×3AT | E2×3 ˜y se reduce para obtener
ˆ E2×3AT E2×3 ˜ = 2 4 −14 −6 1 0 −5 14 3 0 1 4 3 5 → 2 6 6 4 1 0 1 14 2 14 3 14 0 1 −13 −13 13 3 7 7 5 = hI2|�A+)T i . Así que A+= 2 6 6 6 6 6 6 6 4 1 14 − 1 3 2 14 − 1 3 3 14 1 3 3 7 7 7 7 7 7 7 5 = 1 42 2 6 6 6 6 4 3 −14 6 −14 9 14 3 7 7 7 7 5 5�2 Ejercicios
1. Para cualquier matrizAse tiene que:ρ�A) =ρ�A+) =ρ�AA+)=ρ�A+A).
2. Calcule la g-inversa de cada una de las matrices siguientes: �i) A1= ˆ 0 0 0 ˜ �ii) A2= » 1 2 3 5 – �iii) A1= ˆ 1 2 3 ˜ �iv) A4= 2 4 1 1 2 3 5
5.3. C-inversa Inversa generalizada e inversa condicional �v) A5= 2 4 7 7 7 7 7 7 7 7 7 3 5 �vi) A6= 2 4 1 0 0 0 5 0 0 0 0 3 5 �vii) A7= 2 6 6 4 1 2 3 4 0 0 0 0 3 7 7 5 �viii) A8= 2 6 6 4 1 2 0 0 1 2 0 0 0 0 3 3 0 0 3 3 3 7 7 5 �ix) A9= 2 6 6 6 6 4 2 −1 −1 −3 1 2 1 1 1 1 1 1 1 1 1 3 7 7 7 7 5
5.3. Inversa condicional de una matriz
Al igual que el concepto de inversa generalizada de una matriz, el concepto de inversa condicional es de gran utilidad en los cursos de modelos lineales (véase la sección 1.5 de [4]) y en la caracterización del conjunto solución de sistemas lineales de ecuaciones.
5.23.Definición. SeaAuna matrizm×n.SiM es una matrizn×mtal que: AM A=A�
entonces se dice queM es una inversa condicionaldeAo simplemente, queM es unac-inversadeA. 5.24.Observación. De acuerdo con el teorema 5.10, toda matrizAtiene una única inversa generalizada A+. ésta es a su vez por definición una c-inversa deA. Así que, toda matrizAtiene al menos unac-inversa.
Se verá aquí, que una matrizApuede tener varias (incluso infinitas) inversas condicionales, salvo cuando la matrizAes invertible, en cuyo casoA−1es la única c-inversa.
Nota. El teorema 5.27 dará una caracterización del conjunto de todas las inversas condicionales de A (c-inversas deA).
5.25.Teorema. SeaA∈�m×n una matriz de rangor. Entonces: 1. W={N∈�n×m:AN A=�}es un subespacio de�n×m.
2. La dimensión del espacioWmencionado en (1) esm·n−r2.
Demostración� Para demostrar el inciso (1) basta demostrar, según el teorema 1.15, que el conjunto Wes cerrado bajo la suma y la multiplicación por un escalar. En efecto,
SeanN1 yN2dos elementos (matrices) del conjuntoW, entonces
A�N1+N2)A=AN1A+AN2A=�+�=��
esto implica queN1+N2∈W.ésto es,Wes cerrado bajo la suma.
De otro lado, para cualquier escalarα∈Rse tiene que
A�αN1)A=αAN1A=α�=��
ésto implica que,αN1∈W.Es decir,Wes cerrado bajo la multiplicación por un escalar. El conjuntoWes
Hagamos ahora la demostración del inciso (2) en el caso en la matriz A ∈ �m×n tenga rango r con 0< r <m´ın{m� n}. Las demostraciones en los demás casos son similares.
Sea entoncesA una matrizm×nde rangor�con0< r <m´ın{m� n}. De acuerdo con el inciso (1) del teorema 5.1, existen matrices invertiblesP∈�m×myQ∈�n×ntales que:
(5.1) P AQ= » Ir � � � – o A=P−1 » Ir � � � – Q−1.
Considere ahora matrices arbitrariasX ∈�r×r� Y ∈�r×�m−r)� Z∈��n−r)×ryW∈��n−r)×�m−r)y la
matrizN∈�n×mdada por
N=Q » X Y Z W – P. AhoraN∈WsiiAN A=�. De (5.1) se sigue que
AN A = P−1 » Ir � � � – Q−1Q » X Y Z W – P P−1 » Ir � � � – Q−1 = P−1 » X � � � – Q−1.
De aquí se deduceAN A=�siiX=�.Esto es,N∈WsiiNes de la forma: N=Q » � Y Z W – P.
Ahora se demuestra que la dimensión deWesm·n−r2. Para ello, se hace uso del hecho que el espacio de matrices�k×jtiene dimensiónk·j. En efecto, considere los espacios�r×�m−r)���n−r)×ry��n−r)×�m−r)
con las bases respectivas �1��2��3, siendo �1 = {Y1� Y2� . . . � Yr·�m−r)},�1 = {Z1� Z2� . . . � Zr·�n−r)} y
�3={W1� W2� . . . � W�n−r)·�m−r)}. Es fácil mostrar entonces que el conjunto�={N� N2� . . . � Nm·n−r·r} con Ni = Q » � Yi � � – P; i= 1�2� . . . � m·r−r2 Nr�m−r)+j = Q » � � Zj � – P; j= 1�2� . . . � n·r−r2 Nr�m+n−2r)+k = Q » � � � Wk – P; k= 1�2� . . . ��n−r)·�m−r)� es una base deW. �
5.26.Teorema. SeaAuna matrizm×n. El conjuntoMc
Ade todas las c-inversas, Mc
A={M∈�n×m:AM A=A}� es una variedad lineal de dimensiónm·n−r2.
Demostración� Por el teorema 5.16McAes no vacío, sea entoncesM0un elemento deMcA. Se verifica
entonces, queM∈ Mc
Asi y sólo siM se puede escribir como la suma deM0y un elementoN ∈W.Esto
es, si y sólo siM=M0+N para algúnN∈W, siendoWel conjunto dado en el teorema 5.25.
SiM=M0+N�conN∈W, entoncesAM A=AM0A+AN A=A+�=A. Esto es,M∈ McA. De otra
parte, siM∈ Mc
A�entonces se puede escribir
M = M+M0−M0
5.3. C-inversa Inversa generalizada e inversa condicional dondeN=M−M0.Puesto que
A�M−M0)A=AM A−AM0A=A−A=��
se tiene entonces queN=M−M0∈Wy de aquí se sigue que:
Mc
A={M+N� N∈W}.
� El teorema siguiente establece cómo determinar los elementos deMcA.
5.27.Teorema. SeaAuna matrizm×nde rangor.SeanP ∈�m×myQ∈�n×n matrices invertibles como en el teorema 5.1. 1. SiA=�, entoncesMc A=�n×m. 2. Sir=n=m, entoncesMc A= ˘ A+¯ =˘ A−1¯ . 3. Sir=m < n, entonces McA= Q » Ir Y – P:Y ∈��n−r)×m ff . 4. Sir=n < m, entonces McA= ˘ Qˆ Ir X ˜ P :X∈�n×�m−r) ¯ . 5. Si0< r < ny0< r < m�entonces el conjuntoMc
Aestá dado por McA= Q » Ir X Y Z – P:Z∈��n−r)×�m−r)� Y ∈��n−r)×m� X∈�n×�m−r) ff
Demostración� De acuerdo con los teoremas 5.25 y 5.26, se tiene que en cada casoMcAes una variedad lineal de dimensiónmn−r2. De otro lado, se puede verificar que siM
∈ McA, entoncesAM A=A. � 5.28.Ejemplo. Sea A= 2 4 1 2 1 3 −1 −2 0 −2 2 4 2 6 3 5�
la matriz del ejemplo 5.2. De dicho ejemplo se sabe que las matrices invertibles
P = 2 4 0 −1 0 1 1 0 −2 0 1 3 5 y Q= 2 6 6 4 1 0 −2 −2 0 0 1 0 0 1 0 −1 0 0 0 1 3 7 7 5
son tales queP AQ=
»
I2 �
� �
–
� ρ�A) =r= 2.En este caso, McA= Q » I2 X Y Z – P:X∈�2×1� Y ∈�2×2� Z∈�2×1 ff �
representará, el conjunto de todas las inversas condicionales deA�En particular, si tomamosX=�� Y =� yZ=��se tiene que una c-inversa deAes:
M0=Q » I2 0 0 0 – P = 2 6 6 4 0 −1 0 0 0 0 1 1 0 0 0 0 3 7 7 5 .
En lo que resta de esta sección se abordará un método alternativo para calcular una c-inversa de una matriz. Considere inicialmente el caso de matrices cuadradas. �
5.29.Definición. Una matriz cuadrada H = [hij]n×n tiene la forma Hermite superior, si satisface las condiciones siguientes:
1. H es triangular superior.
2. h2ii=hii; esto es,hii= 0óhii= 1� i= 1�2� . . . � n. 3. Sihii= 0, entonces lai-ésima fila es nula, esto es,Hi=�.
4. Sihii= 1, entonces el resto de los elementos de lai-ésima columna son nulos; es decir,Hi=Ii es la i-ésima columna de la matriz idéntica.
5.30.Ejemplo. La matriz H= 2 6 6 4 1 2 0 0 0 0 0 0 0 0 1 0 0 0 0 1 3 7 7 5
tiene la forma Hermite superior. �
El siguiente teorema establece que una matriz Hermite superior es idempotente. La demostración de dicho resultado es consecuencia directa de la definición y se deja como un ejercicio para el lector.
5.31.Teorema. SiH es una matriz que tiene la forma Hermite superior, entoncesH2=H.
Demostración� SiA� B ∈ �n×m son matrices triangulares superiores, entonces AB es triangular superior y�AB�ii=�A�ii�B�ii(ver ejercicio 2 de la sección 2.1). De esto se sigue que:
1. H2es triangular superior. 2. �H2�ii=�H�ii�H�ii=h2ii=hii. De otra parte, 3 Sihii= 0, entoncesHi=�yH2 i =HiH=�. 4 Sihii= 1, entoncesHi=Iiy�H2)i=HHi=HIi=Hi=Ii. � 5.32.Teorema. Para toda matriz cuadrada A existe una matriz invertibleB tal queBA =H tiene la forma Hermite superior.
5.3. C-inversa Inversa generalizada e inversa condicional
Demostración� SeaP una matriz invertible tal queP A=Res la forma escalonada reducida deA. SiRtiene la forma Hermite superior, entonces la matrizB=Psatisface la condición de queBA=R=H. SiRno tiene la forma Hermite superior, intercambiamos las filas deRhasta que el primer elemento no nulo (de izquierda a derecha) de cada fila no nula deR, sea un elemento de la diagonal. Así se tiene una matriz Hque tiene la forma Hermite superior. Así que existen matrices elementales (por filas)E1� E2� . . . � Ektales
que
E1E2· · ·EkR=H
o sea:
E1E2· · ·EkP A=H.
En consecuencia, la matriz invertibleB=E1E2· · ·EkPes tal queBA=Htiene la forma Hermite superior.
�
5.33.Ejemplo. Para la matriz cuadrada: A= 2 4 1 2 3 1 2 5 2 4 10 3 5� la matriz invertible P = 2 4 5/2 −3/2 0 −1/2 1/2 0 0 −2 1 3 5 es tal que P A=R= 2 4 1 2 0 0 0 1 0 0 0 3 5�
dondeRes la forma escalonada resucida deA.Intercambiando las filas2y 3 deRse obtiene la matriz: H= 2 4 1 2 0 0 0 0 0 0 1 3 5�
la cual tiene la forma Hermite superior. Además, B= 2 4 5/2 −3/2 0 0 −2 1 −1/2 1/2 0 3 5
es invertible y es tal queBA=H . �
5.34.Teorema. SeaAuna matriz cuadrada. SiBes una matriz invertible tal queBA=H tiene la forma Hermite superior, entoncesBes una c-inversa deA.
Demostración� Como H tiene la forma Hermite superior, por el teorema 5.31,H2 =H. Así que
BABA=H2=H=BA�o sea:
BABA=BA.
Premultiplicando los dos miembros de la última igualdad por la matrizB−1se obtiene: ABA=A�
5.35.Ejemplo. Considere la matrizAdel ejemplo 5.33, A= 2 4 1 2 3 1 2 5 2 4 10 3 5.
Se sabe de dicho ejemplo, que la matriz invertible B= 2 4 5/2 −3/2 0 0 −2 1 −1/2 1/2 0 3 5�
es tal queBA=Htiene la forma Hermite superior. Por lo tanto, por teorema anterior,Bes una c-inversa deA. �
El siguiente corolario presenta una forma de calcular una c-inversa para el caso de matrices rectangulares. 5.36.Corolario. SeaAuna matrizm×n
1. Sim > n, seaA∗
=ˆ
A � ˜
, donde�es la matriz nulam×�m−n). Sea ademásB∗
una matriz invertible tal queB∗
A∗
=H tiene la forma Hermite superior. Si escribimos la matrizB∗
entonces particionada así: B∗ = 2 4 B B1 3 5�
dondeBes una matrizn×m, entoncesBes una c-inversa deA. 2. Sin > m, seaA∗ = » A � –
, donde�es la matriz nula�n−m)×m. Sea ademásB∗
una matriz invertible tal queB∗
A∗
=H tiene la forma Hermite superior. Si escribimos la matrizB∗
entonces particionada así: B∗ =ˆ B B1 ˜ �
dondeBes una matrizn×m, entoncesBes una c-inversa deA.
Demostración� Se presenta aquí sólo la demostración del inciso (1). Para ello suponga queAes una matrizm×n, conm > ny considere la matriz cuadradaA∗
=ˆ
A � ˜
n×n. Según el teorema 5.32, existe una matriz invertibleB∗
�tal queB∗
A∗
=Htiene la forma Hermite superior. Dicha matrizB∗
es una c-inversa deA∗
(teorema 5.32), así que,A∗
B∗ A∗ =A∗ �o sea: A∗ B∗ A∗ = ˆ A � ˜ 2 4 B B1 3 5 ˆ A � ˜ = ˆ ABA � ˜ =ˆ A � ˜ =A∗ .
De esto se sigue queABA=A.Es decir,Bes una c-inversa deA. �
5.37.Ejemplo. Encontre una c-inversa para la matriz: A= 2 4 1 −1 2 −1 0 1 3 5 3×2 . SeaA∗ = 2 4 1 −1 0 2 −1 0 0 1 0 3 5 3×3 .
5.3. C-inversa Inversa generalizada e inversa condicional Efectuando los cálculos pertinentes se encuentra que la matriz invertible:
B∗ = 2 4 −1 1 0 −2 1 0 2 −1 1 3 5= 2 4 B B1 3 5 es tal queB∗ A∗
=Htiene la forma Hermite superior. Por lo tanto, por el corolario anterior, la matriz B= » −1 1 0 −2 1 0 – 2×3 es una c-inversa deA. � 5�3 Ejercicios
En los ejercicios 1 al 3, responda verdadero o falso justificando su respuesta. 1. Para toda c-inversaAcdeAse tiene que�AAc)2=AAcy�AcA)2=AcA. 2. SiAces una c-inversa deA, entoncesAes una c-inversa deAc.
3. SiAces una c-inversa deA, entonces�Ac)T es una c-inversa deAT. En los ejercicios 4 al 9 haga la demostración correspondiente
4. SiAces una c-inversa deA, entoncesρ�Ac)≥ρ�A) =ρ�AAc) =ρ�AcA).
5. SiAces una c-inversa deA, entoncesTr�AAc) = Tr�AcA) =ρ�A).(sugerencia véase el ejercicio 7 de la sección de ejercicios 3.2).
6. SeaAuna matrizm×n. Entoncesρ�A) =msii AA+=Isii AAc=Ipara cada c-inversaAcde A.
7. SeaAuna matrizm×n. Entoncesρ�A) =nsii A+A=IsiiAcA=Ipara cada c-inversaAcde A.
8. SiBes una c-inversa deA�entonces también lo esBAB.
9. SiBcyCc son c-inversas de las matricesByC respectivamente, entonces una c-inversa de la matriz A= » B � � C – es Ac= » Bc � � Cc – . 10. Para la matrizA= 2 4 1 2 3 2 5 3 1 3 0 3
5�dé dos c-inversaAc1yAc2tales queρ�Ac1)> ρ�A)yρ�Ac2) =
ρ�A).
11. Determine el conjunto de todas las c-inversas de las matrices A1= » 1 1 1 1 – � A2= » 1 2 3 1 3 3 – � A3= 2 4 1 2 1 3 2 5 3 5� A4= » 1 2 1 3 – .
5.4. Sistemas de ecuaciones lineales: g-inversa y c-inversa de una matriz. mínimos cuadrados.
En esta sección se verán algunas aplicaciones de la g-inversa y la c-inversa de una matriz a los sistemas de ecuaciones lineales y al problema de los mínimos cuadrados.
5.38.Teorema. SeaA∈�m×n una matriz y seay∈�m×1un vector. El sistema de ecuaciones lineales
Ax=yes consistente siiAAcy=ypara cada c-inversaAcdeA.
Demostración� Suponga que el sistema de ecuaciones linealesAx= yes consistente. ésto quiere decir, que existe al menos unx0tal que:
Ax0=y.
Sea ahoraAcuna c-inversa deA�entonces:
AAcy = AAcAx
0
= Ax0
= y.
Suponga ahora, que para cada c-inversaAcdeA, se tiene queAAcy=y. Entonces para cada c-inversaAc, el vectorx0=Acyes una solución del sistema de ecuaciones linealesAx=y. Por lo tanto, el sistema es
consistente. �
5.39.Teorema. SeaAuna matrizm×ny seaAcuna c-inversa deA.Si el sistema de ecuaciones lineales Ax=yes consistente, entonces su solución general es
(5.1) x=Acy+ �I−AcA)h� h∈�n×1.
Demostración� Puesto que por hipótesis el sistema de ecuaciones linealesAx=yes consistente, entonces por el teorema anterior,AAcy=y. En consecuencia, para cadaxde la forma (5.1):
Ax = AAcy+A�I−AcA)h = y+ �A−A)h = y+�h = y� esto es,xes una solución del sistema dado.
De otro lado, six0es solución del sistema dado, entonces
Ax0=y.
Premultiplicando los miembros de la última igualdad porAcse obtiene AcAx
0=Acy�
de donde:
�=Acy−AcAx0.
Sumandox0a los dos lados de la última igualdad se llega a:
x0 = Acy+x0−AcAx0
= Acy+ �I
−AcA)x
0
= Acy+ �I−AcA)h�
dondeh=x0.Esto es,x0se puede expresar en la forma 5.1. �
5.4. Mínimos cuadrados Inversa generalizada e inversa condicional 5.40.Corolario. SeaA una matriz m×n. Si el sistema de ecuaciones linealesAx=yes consistente, entones su solución general es
(5.2) x=A+y+ �I−A+A)h� h∈�n×1.
Problema de los Mínimos Cuadrados
Como se estableció en el teorema 1.51(3), para un sistema de ecuacionesAx=yse presenta una y sólo una de las opciones siguientes:
(i) El sistema tiene infinitas soluciones. (ii) El sistema tiene solución única. (iii) El sistema no tiene solución.
En el trabajo experimental generalmente se da generalmente la opción (iii), es decir, que el vectoryno es un elemento del espacio columna de la matrizA, (y∈ C/ �A)) (véase figura 5.1). En este caso se puede preguntar, si existe una solución aproximada del sistema, para una definición conveniente de solución aproximada. Un problema que se presenta con frecuencia en el trabajo experimental es:
y A x A x IR (A) � 0
.
A x0 mFigura 5�1� Problema de los mínimos cuadrados Dado una serie de puntos
�x1� y1); �x2� y2);. . .; �xn� yn).
obtener una relacióny =f�x)entre las dos variablesxyy�“adaptando” (en algún sentido) una curva a dicho conjunto de puntos.
Como los datos se obtienen experimentalmente, generalmente existe un �error� en ellos (errores de aproxi-mación), lo que hace prácticamente imposible encontrar una curva de la forma deseada que pase por todos los puntos. Por medio de consideraciones teóricas o simplemente por �acomodo� de los puntos, se decide la forma general de la curvay=f�x)que mejor se adapte. Algunas posibilidades son (ver figura 5.2):
1. Funciones lineales (rectas):y=f�x) =a+bx; a� b∈R 2. Polinomios de grado dos:y=f�x) =a+bx+cx2; a� b� c
∈R. 3. Polinomios de grado tres:y=f�x) =a+bx+cx2+dx3;a� b� c� d
∈R.
A. Adaptación de puntos a una línea recta
Considere los puntos�x1� y1); �x2� y2);. . .; �xn� yn)�los cuales se pretende ajustar mediante la gráfica de la
x y
y y
x x
(1) Aproximacion lineal
´
(2) Aproximacion cuadratica´
´
(3) Aproximacion cubica´
´
Figura 5�2� Ajuste por mínimos cuadrados
por todos losnpuntos y, en consecuencia, los coeficientes desconocidosaybsatisfarían la ecuación de la recta. Esto es, se tendrían las siguientes igualdades:
y1 = a+bx1
y2 = a+bx2
..
. ... ... yn = a+bxn. Estas igualdades se pueden escribir, utilizando notación matricial, así:
(5.3) y= 2 6 6 6 4 y1 y2 .. . yn 3 7 7 7 5 = 2 6 6 6 4 1 x1 1 x2 .. . ... 1 xn 3 7 7 7 5 2 4 a b 3 5=Ax.
Si los puntos que corresponden a los datos no son colineales, es imposible encontrar coeficientesaybque satisfagan (5.3). En este caso, independientemente de la forma en que se escojanayb, la diferencia
Ax−y�
entre los dos miembros de (5.3) no será cero. Entonces, el objetivo es encontrar un vectorx=
»
a∗
b∗ –
que minimice la longitud del vectorAx−y, esto es, que minimice
�Ax−y�� lo que es equivalente a minimizar su cuadrado,�Ax−y�2.
Six0= »
a∗
b∗ –
es un vector que minimiza tal longitud, a la línea rectay=a∗
+b∗
xse le denominarecta de ajuste por mínimos cuadradosde los datos. La figura 5.3 ilustra la adaptación de una línea recta por el método de los mínimos cuadrados. Se tiene que�Ax−y��y
�Ax−y�2 = �a∗ +b∗ x1−y1)2+ �a∗+b∗x2−y2)2+ · · ·+ �a∗ +b∗ xn−yn)2
5.4. Mínimos cuadrados Inversa generalizada e inversa condicional
son minimizados por el vectorx0= »
a∗
b∗ –
. En dicha figura se ve que|a∗
+b∗
xi−yi|corresponde a la “distancia vertical”,di�tomada desde el punto�xi� yi)hasta la rectay=a∗
+b∗
x. Si se toma adicomo el “error vertical” en el punto�xi� yi), la recta de ajuste minimiza la cantidad:
d21+d22+· · ·+d2n�
que es la suma de los cuadrados de los “errores verticales”. De allí el nombre de método de los mínimos cuadrados. d d 1 y x y=a+b x x , y ( ) ( ) d3 2 dn * * 2 x , y 2 ( ) x , y 1 1 3 x , y 3 ( )n n
Figura 5�3� Ajuste lineal por mínimos cuadrados
A continuación se darán dos definiciones motivadas por la discusión anterior. En el ejemplo 5.50 se ex-plicará cómo se adaptar, por mínimos cuadrados, una línea rectay = a+bxa una serien denpuntos �x1� y1); �x2� y2);. . .; �xn� yn)dados.
5.41.Definición(Solución M nima Cuadrada). Se dice que el vectorx0es una solución mínima cuadrada
(S.M.C.) del sistema de ecuaciones linealesAx=y�si para todo vectorxse tiene que: �Ax0−y� ≤ �Ax−y�.
5.42.Definición(Mejor Solución Aproximada). Se dice que el vectorx0es una mejor solución aproximada
(M.S.A.) del sistema de ecuaciones linealesAx=y�si: 1. Para todo vectorxse tiene que:
�Ax0−y� ≤ �Ax−y�.
2. Para todo vectorx∗
�
=x0tal que�Ax0−y�<�Ax∗−y�se tiene que
�x0�<�x∗�.
Nota. Observe que una M.S.A de un sistema de ecuaciones linealesAx=yes una S.M.C. del mismo. 5.43.Teorema. SeaAuna matrizm×ny seayun vectorRm. SiAces una c-inversa deAtal queAAc es simétrica, entonces para todo vectorx∈Rnse tiene que:
�Ax−y�2=�Ax−AAcy
�2+�AAcy −y�2.
Demostración� Por hipótesisAAc= �AAc)T.Así que para todo vectorxse tiene que: �Ax−y�2 = ��Ax−AAcy) + �AAcy −y)�2 = �Ax−AAcy �2+ 2�Ax−AAcy)T�AAcy −y) +�AAcy −y�2
El teorema quedará demostrado si verificamos que el segundo término de esta igualdad es cero, esto es, si comprobamos la igualdad �Ax−AAcy)T�AAcy −y) = 0. En efecto tenemos: �Ax−AAcy)T�AAcy −y) = �x−Acy)TAT��AAc)T −I)y = �x−Acy)T�AT�AAc)T−AT)y = �x−Acy)T��AAcA)T −AT)y = �x−Acy)T�AT −AT)y=�. � 5.44.Teorema. SeaAuna matrizm×ny seayun vectorRm. SiAces una c-inversa deAtal queAAc es simétrica, entoncesx0=Acyes una S.M.C. para el sistemaAx=y.
Demostración� Por hipótesis y por el teorema anterior se tiene quex0=Acyes tal que:
�Ax−y�2=�Ax−Ax0�2+�Ax0−y�2≥ �Ax0−y�2.
Para todo vectorx.De aquí que para todo vectorx:
�Ax0−y� ≤ �Ax−y��
esto es,x0=Acyes una S.M.C. para el sistemaAx=y. �
5.45.Teorema. SeaAuna matrizm×ny seayun vectorRm. El sistema de ecuaciones linealesAx=y tiene una única M.S.A., a saber
x0=A+y.
Demostración� Por definición de g-inversa se tiene queA+es en particular una c-inversa deAque
satisface la propiedad de queAA+es una matriz simétrica, entonces por el teorema 5.43 se tiene para todo
xque:
�Ax−y�2=�Ax−AA+y�2+�AA+y−y�2≥ �AA+y−y�2. De aquí que para todo vectorx:
(5.4) �AA+y−y� ≤ �Ax−y�
Esto es,x0=A+yes una S.M.C. para el sistemaAx=y.Se quiere demostrar ahorax0 =A+yque la
M.S.A. para ello se muestra, que six∗
�
=x0 es otra S.M.C. del sistemaAx=y(esto es six∗ satisface
Ax∗
=AA+y) entonces se tiene que
�x0�<�x∗�.Para ello se verifica primero que para todoxse satisface
la igualdad
5.4. Mínimos cuadrados Inversa generalizada e inversa condicional En efecto se tiene que:
�A+y+ �I−A+A)x�2 = �A+y�2+ 2�A+y)T�I−A+A)x+ ��I−A+A)x�2.
La igualdad (5.5) se obtendrá entonces si verifica que el segundo término de la igualdad anterior es cero. Esto último se sigue fácilmente de
�A+y)T�I−A+A)x = yTh�A+)T−�A+)T�AA+)Tix = yT
h
�A+)T−�A+AA+)Tix = yT��)x=�
Tómese ahora un vectorx∗
�
=x0, tal queAx∗=AA+y. Multiplicando porA+obtenemosA+Ax∗=A+y.
De aquí y de (5.5) aplicada ax∗ se tiene que: �x∗ �2 = �A+y+x∗ −A+y�2 = �A+y+x∗ −A+Ax∗ �2 = �A+y+ �I−A+A)x∗ �2 = �A+y�2+��I−A+A)x∗ �2 > �A+y�2=�x0�2. � 5.46.Observación. El teorema anterior establece que todo sistema de ecuaciones linealesAx=ytiene una única M.S.A.,x0 =A+y.Por esto, se hablará de aquí en adelante de la mejor solución aproximada
(M.S.A.) de un sistema de ecuaciones lineales.
Ahora bien, puesto que la mejor solución aproximada del sistema de ecuaciones linealesAx=yes una solución mínima cuadrada, se tiene el siguiente teorema.
5.47.Corolario. Todo sistema de ecuaciones linealesAx=ytiene al menos una S.M.C. 5.48.Ejemplo. Para el sistema de ecuaciones lineales
Ax= 2 4 1 1 1 1 1 1 3 5 » x y – = 2 4 1 2 3 3 5=y� se tiene quex0=A+y=1 6 » 1 1 1 1 1 1 – 2 4 1 2 3 3 5= » 1 1 – es la M.S.A. Además: �Ax0−y�= √ 2; así que para todo vectorxse tiene que: √
2≤ �Ax−y�� y si existe un vectorx∗
tal que�Ax∗
−y�=√2, entonces se debe tener que: �x0�=
√ 2<�x∗
�. �
5.49.Teorema. SeaA una matriz m×ny sea yun vector Rm. Siρ�A) = n, entonces el sistema de ecuaciones linealesAx=ytiene una única S.M.C. que es justamente la M.S.A. dada por:
Demostración� Seax∗
una S.M.C. del sistema de ecuacionesAx=y.Por definición se tiene para todox∈Rn, entonces que�Ax∗
−y� ≤ �Ax−y��en particular, para el vectorx0=A+yse tiene:
(5.6) �Ax∗
−y� ≤ �AA+y−y�.
De otra parte, comoA+es una c-inversa deAtal queAA+es simétrica, entonces se tiene (ver teorema 5.43) �Ax−y�2= �Ax−AA+y �2+ �AA+y −y�2 ∀x∈Rn. En particular, para el vectorx∗
se tiene: �Ax∗ −y�2 = �Ax∗ −AA+y�2+�AA+y−y�2. (5.7) De (5.6) y (5.7) se sigue que: �AA+y−y�2 ≤ �Ax∗ −AA+y�2+�AA+y−y�2 = �Ax∗ −y�2≤ �AA+y−y�2 De aquí que‚ ‚Ax ∗ −AA+y‚ ‚ = 0y por lo tanto: Ax∗ =AA+y. Puesto queρ�A) =n, entoncesA+=`
ATA´−1
AT (teorema 5.15), en consecuencia: Ax∗
=A“ATA”−1ATy. Premultiplicando esta igualdad por`
ATA´−1 AT�se obtiene: x∗ = “ATA”−1ATAx∗ = “ATA”−1ATA“ATA”−1ATy “ ATA”−1ATy=A+y=x 0. � 5.50.Ejemplo. Encuentre una recta de ajuste, por mínimos cuadrados (ver figura 5.4), que se adapte a los puntos:
�0�1); �1�3); �2�4); �3�4).
Para ello se debe encontrar una S.M.C. del sistema de ecuaciones linealesAx=y, donde
A= 2 6 6 4 1 x1 1 x2 1 x3 1 x4 3 7 7 5 = 2 6 6 4 1 0 1 1 1 2 1 3 3 7 7 5 � y= 2 6 6 4 y1 y2 y3 y4 3 7 7 5 = 2 6 6 4 1 3 4 4 3 7 7 5
y el vector incógnitaxestá dada por
x= » a b – .
5.4. Mínimos cuadrados Inversa generalizada e inversa condicional Puesto queρ�A) = 2�entonces por el teorema anterior, el sistema dado tiene una únicaS.M.C., a saber:
x0 = A+y= �ATA)−1ATy = 1 10 » 7 4 1 −2 −3 −1 1 3 – 2 6 6 4 1 3 4 4 3 7 7 5 = » 1.5 1 – = » a∗ b∗ –
En consecuencia, la recta de ajuste, por mínimos cuadrados, de los datos dados es:
y=a∗ +b∗ x= 1.5 +x. � (0,1) (1,3) (2,4) (3,4) y=1.5+x y x
Figura 5�4� Ajuste lineal ejemplo 5.50
5.51.Ejemplo. Encuentre una recta de ajuste, por mínimos cuadrados, que se adapte a los puntos:
�1�1); �1�2).
Observe que en este caso los puntos dados pertenecen a la recta, de pendiente infinita,x= 1.(ver figura 5.5(a))
x (1,2) (1,1) y x = 1 b) Ajuste por rectas de pendiente no infinita y x (1,2) (1,1) y=3/2x y=3/4+3/4x a) Ajuste por una recta de pendiente infinita
Figura 5�5� Ajuste lineal ejemplo 5.51
Ahora bien, si se busca una rectay=a+bx�que no tenga pendiente infinita, que se adapte por mínimos cuadrados, a los puntos dados, entonces se debe encontrar una S.M.C. del sistema de ecuaciones lineales (ver figura 5.5(b)) Ax = » 1 x1 1 x2 – » a b – = » 1 1 1 1 – » a b – = » 1 2 – = » y1 y2 – =y. Una S.M.C. del sistema dado es:
x0 = A+y=1 4 » 1 1 1 1 – » 1 2 – = » 3/4 3/4 – = » a∗ b∗ – . Así que una recta de ajuste, por mínimos cuadrados, de los puntos dados es:
y=a∗ +b∗ x=3 4+ 3 4x . De otra parte, la matriz
Ac=
»
0 0
1/2 1/2
–
es una c-inversa deA,AAces simétrica. En efecto,
AAc= » 1/2 1/2 1/2 1/2 – . Por lo tanto, de acuerdo con el teorema 5.44,
x0=Acy= » 0 3/2 – = » ˆ a ˆ b –
es también una S.M.C. Así que otra recta de ajuste por mínimos cuadrados, de los puntos dados es (ver figura 5.5(b)):
y=a∗
+b∗
x=3
5.4. Mínimos cuadrados Inversa generalizada e inversa condicional
B. Adaptación a polinomios de gradon.
La técnica descrita antes para adaptar una recta anpuntos dados, se generaliza fácilmente a la adaptación, por mínimos cuadrados, de un polinomio de cualquier grado a un conjunto de puntos dados.
A continuación se muestra cómo adaptar un polinomio de grado≤m� y=a0+a1x+a2x2+. . .+amxm
a un conjunto denpuntos�x1� y1); �x2� y2);. . .; �xn� yn)�mediante la técnica de los mínimos cuadrados.
Sustituyendo estosnvalores dexyyen la ecuación polinómica se obtienen lasnecuaciones siguientes:
2 6 6 6 4 y1 y2 .. . yn 3 7 7 7 5 = 2 6 6 6 4 1 x1 x21 · · · xm1 1 x2 x22 · · · xm2 .. . ... ... . .. ... 1 xn x2 n · · · xmn 3 7 7 7 5 2 6 6 6 4 a0 a1 .. . am 3 7 7 7 5
De lo que se trata nuevamente, es de encontrar una S.M.C. del sistema de ecuaciones linealesAx=y. 5.52.Ejemplo. Encontrar un polinomio de grado dos que mejor se ajuste, por mínimos cuadrados, a los puntos:
�−1�0); �0�−2); �1�−1); �2�0). Se debe encontrar una S.M.C. del sistema de ecuaciones lineales:
Ax = 2 6 6 4 1 −1 1 1 0 0 1 1 1 1 2 4 3 7 7 5 2 4 a1 a2 a3 3 5= 2 6 6 4 0 −2 −1 0 3 7 7 5 =y.
Puesto queρ�A) = 3�el sistema dado tiene una única S.M.C., la cual está dada por: x0 = A+y= �ATA)−1ATy = 1 20 2 4 3 11 9 −3 −1 3 7 1 5 −5 −5 5 3 5 2 6 6 4 0 −2 −1 0 3 7 7 5 = 1 20 2 4 −31 −13 15 3 5= 2 4 −1.55 −0.65 0.75 3 5
En consecuencia, existe un único polinomio de grado dos que se ajuste por mínimos cuadrados de los datos dados. Este polinomio está dado por (ver figura 5.6):
y=−1.55−0.65x+ 0.75x2
(2,0) (1,−1) (−1,0) x y (0,−2) y=−1.55−0.65x+0.75x2
Figura 5�6� Ajuste cuadrático ejemplo 5.52
5�4 Ejercicios
1. Si el sistema de ecuaciones linealesAx= ytiene solución, demuestre entonces que la solución x=A+yes únicasiiA+A=I�y en este casoA+y=Acypara toda c-inversaAcdeA.
2. Six1�x2� . . . �xn son soluciones del sistema de ecuaciones linealesAx=y, y siλ1� λ2� . . . � λn son
escalares tales quePn
i=1λi= 1, demuestre entonces
x= n
X
i=1
λixi es una solución del sistemaAx=y.
3. Seay = a+bxuna línea recta que se quiere adaptar, por mínimos cuadrados, a los puntos �x1� y1); �x2� y2);. . .; �xn� yn).Utilice el teorema 5.39 y la regla de Cramer para demostrar que
si para algúni y para algúnj,xi�=xj�entonces existe una única recta de ajuste, por mínimos cuadrados, a los puntos dados:
y=a∗ +b∗ x y quea∗ =Δa Δ yb ∗ =Δb Δ, donde: Δ = det 2 4 n Pn i=1xi Pn i=1xi Pn i=1x 2 i 3 5 Δa = det 2 4 Pn i=1yi Pn i=1xi Pn i=1xiyi Pn i=1x 2 i 3 5 Δb = det 2 4 n Pn i=1yi Pn i=1xi Pn i=1xiyi 3 5
5.4. Mínimos cuadrados Inversa generalizada e inversa condicional 4. Encuentre la M.S.A. del sistema de ecuaciones linealesAx=y�donde:
A= 2 6 6 4 2 2 2 2 2 2 1 −1 0 2 −2 0 3 7 7 5 y y= 2 6 6 4 1 2 3 4 3 7 7 5 .
5. Encuentre la M.S.A del sistema de ecuaciones lineales
8 > > > < > > > : x+ 2y = 1 −x+y = 1 2x−3y = 2 3x+y = 3.
6. Encuentre la ecuación de la recta que mejor se ajuste por mínimos cuadrados a los puntos: �0�1); �1�3); �2�2); �3�4).
7. Obtenga la ecuación del polinomio de grado dos que mejor se adapte, por mínimos cuadrados, a los puntos:
�−1�4); �0�2); �1�0); �2�1).
8. Dé, si las hay, dos S.M.C. diferentes del sistema de ecuaciones lineales: Ax= » 2 2 2 2 – » x y – = » 1 0 – .
9. Suponga que las variablesxyyse relacionan por medio de la ecuacióny=a·bx;a >0� b >0. a) Verique que dicha ecuación se puede transformar en la ecuación
y∗ =a∗ +b∗ x � dondey∗ = lny� a∗ = lnayb∗ = lnb.Y viceversa.
b) Determine, los valores de las constantesa >0� b >0 en el modeloy =a·bx que mejor se adapte a los datos
x -1 1 2
y 1 6 10
Estime el valor deyparax= 5.Para ello encuentre la rectay∗
=a∗
+b∗
xque mejor se adapte, por mínimos cuadrados a los puntos de la forma�x�lny).
10. Determine la ecuación del planoz=a+bx+cyque mejor se adapte, por mínimos cuadrados, a los puntos�0�1�5)��1�0�2)��1�1�7)�(1,-1,-1).