Departamento de Matem´atica Aplicada II.
Escuela Superior de Ingenieros. Universidad de Sevilla.
Tema 7.- Matrices sim´
etricas reales y formas cuadr´
aticas.
7.1.- Matrices sim´etricas reales.
Diagonalizaci´on. El teorema espectral. 7.2.- Formas cuadr´aticas.
Definici´on y matriz simtrica asociada. Rango y signo de una forma cuadr´atica. Reducciones a suma de cuadrados.
Ley de inercia de Sylvester. Clasificaci´on. 7.3.- C´onicas y cu´adricas (II).
Reducci´on de una c´onica girada. Reducci´on de una cu´adrica girada. 7.4.- Ejercicios.
7.5.- Ap´endice: MATLAB.
7.1.- Matrices sim´
etricas reales.
Las matrices sim´etricas reales constituyen uno de los tipos m´as importantes de matrices para las cuales puede garantizarse la diagonalizabilidad. Adem´as, dicha diagonalizaci´on se puede obtener matrices de paso ortogonales.
10.1.1.- Diagonalizaci´on.
Teorema. Sea A una matriz real sim´etrica. Entonces: (a) Todos los autovalores deA son reales.
(b) Si v1 y v2 son autovectores (reales) de A asociados a autovalores distintos λ1 y λ2,
entoncesv1 y v2 son ortogonales.
Teorema (espectral para matrices sim´etricas) Sea Auna matriz cuadrada real n×n. Son equivalentes:
(a) A es sim´etrica.
En ese caso, las columnas de la matriz{q1, . . . , qn}deQson un conjunto deautovectores deA que forman una Base Ortonormal deRn y, adem´as, tenemos que
A=QDQT =
2
6
4 q1 . . . qn 3
7 5
2
6 6 6 6 4
λ1 0 . . . 0
0 λ2 . . . 0
..
. ... . .. ... 0 0 . . . λn
3
7 7 7 7 5
2
6 6 6 4
qT
1
qT
2
. . . qT n
3
7 7 7 5
= λ1q1q1T +λ2q2q2T +· · ·+λnqnqnT.
Cada matriz qkqkT es la matriz de la proyecci´on ortogonal sobre el subespacio generado por el correspondiente vector {qk} (es una matriz de rango 1). As´ı, obtenemos la expresi´on
A=λ1q1q1T +λ2q2qT2 +· · ·+λnqnqnT,
que se llama descomposici´on espectral de A. Esta expresi´on nos da la matriz sim´etrica real A como una combinaci´on lineal de matrices de proyecci´on de rango 1.
A la hora de obtener una diagonalizaci´on ortogonal de una matriz sim´etrica realApueden aparecer dos situaciones distintas:
Todos los autovalores deAson simples.En este caso, los autovectores correspondientes tienen que ser ortogonales dos a dos y formar´an una base ortogonal de Rn. Norma-lizando dichos autovectores (dividiendo cada uno por su norma) seguiremos teniendo autovectores ortogonales que adem´as ser´an unitarios. Una matrizQque tenga a dichos autovectores ortonormales como columnas ser´a una matriz de paso que diagonaliza A ortogonalmente.
La matriz A tiene alg´un autovalor m´ultiple.En este caso, cuando calculemos los auto-vectores asociados a uno de los autovalores λ m´ultiples, obtendremos una base del espacio propio asociado Nul (A−λI). En general esta base puede no ser una base or-togonal de dicho subespacio. Oror-togonalizando primero y normalizando a continuaci´on, tendremos una base ortonormal de autovectores asociados a dicho autovalor m´ultiple. Haciendo esto con cada uno de los autovalores m´ultiples y normalizando los autovec-tores asociados a autovalores simples tendremos una base ortonormal de Rn formada por autovectores deA. Basta considerar una matrizQcuyas columnas sean los vectores de dicha base para obtener una diagonalizaci´on ortogonal deA.
7.2.- Formas cuadr´
aticas.
Una forma cuadr´atica no es otra cosa que la funci´on definida por un polinomio real homog´eneo de segundo gradoen varias variables. Es decir, una funci´onRn −→Rdefinida
por un polinomio real de varias variables en el que todos los sumandos no nulos son de segundo grado. Por ejemplo,
Las funciones definidas por 3x2−2xy+yzy por−xy+yz+2xz son formas cuadr´aticas.
Las funciones definidas por 2x2−3x+y2,−x2+y2+ 2 son funciones reales, de varias
las funciones definidas porx2y, xcos(y), x2
y2+1, ...NO son formas cuadr´aticas puesto que
ni siquiera est´an definidas por polinomios.
Una forma cuadr´atica en dos variables (x, y) ser´a una funci´on de la forma f(x, y) = a11x2+ 2a12xy +a22y2 donde a11, a12 y a22 son n´umeros reales.
7.2.1.- Definici´on y matriz sim´etrica asociada. Definici´on.
• Se llama forma cuadr´atica en(x1, x2, . . . , xn)a todo polinomio real homog´eneo de segundo
grado en las variables(x1, x2, . . . , xn), es decir a todo polinomio de la forma
ϕ(x1, x2, . . . , xn) =a11x21+2a12x1x2+· · ·+a22x22+· · ·+annx2n= n
X
k=1
akkx2k+
X
1≤i<j≤n
2aijxij
donde los coeficientes akk (1≤k ≤n) y aij (1≤i < j ≤n) son reales.
El denotar mediante 2aij al coeficiente dexixj cuandoi < jes una cuesti´on de conveniencia a la hora de asociar a la forma cuadr´atica una matriz sim´etrica.
• Se llama matriz asociada a la forma cuadr´atica a la matriz sim´etrica
A=
2
6 6 6 6 4
a11 a12 · · · a1n a12 a22 · · · a2n ... ... ... ... a1n a2n · · · ann
3
7 7 7 7 5
.
Es decir, en la matriz sim´etrica realA,
los elementos diagonalesa11, . . . , annson los coeficientes de los cuadradosx21, x22, . . . , x2n, los elementos no-diagonalesaij =aji son los coeficientes de los t´erminos cruzados xixj divididos por 2.
De esta forma la matriz sim´etricaAy la forma cuadr´aticaϕ est´an relacionadas mediante
ϕ(x1, x2, . . . , xn) = [x1 x2 · · · xn] A 2
6 6 6 6 4
x1
x2
... xn
3
7 7 7 7 5
=xTAx
siendo xel vector columna de las variables en un orden preestablecido. Notemos que
aii =ϕ(ei) = 1 2
∂2ϕ
∂x2
i
, aij = 1 2
∂2ϕ
Ejemplos.-(1) La matriz sim´etrica A asociada a la forma cuadr´atica definida por ϕ(x1, x2, x3) = −x21+ 2x22+ 5x23+x1x2 −3x1x3+ 6x2x3
esA=
2
6 4
−1 12 −32
1
2 2 3
−3
2 3 5
3
7 5.
(2) La forma cuadr´atica asociada a la matriz sim´etrica
A=
2
6 4
0 √5 3 √
5 −3 0
3 0 5
3
7 5
es
ϕ(x1, x2, x3) = 0x21+ 2
√
5x1x2+ 6x1x3−3x22 + 0x2x3+ 5x23
= 2√5x1x2+ 6x1x3−3x22+ 5x23.
Observaciones.
(1) Una vez que est´a fijado el orden de las variables (x1,· · · , xn), la matriz sim´etrica
A= [aij] asociada a la forma cuadr´atica es ´unica. (2) Dada una matriz cuadrada real M, la funci´on
ϕ :x∈Rn −→ϕ(x) =xTMx∈R
es una forma cuadr´atica, aunque la matrizM no sea sim´etrica. Por ejemplo,
ϕ(x) = xT
2
6 4
1 2 −1 −1 −3 1
3 0 5
3
7 5x=
= x2
1+ (2−1)x1x2 + (−1 + 3)x1x3−3x22+ (1 + 0)x2x3 + 5x23
es una forma cuadr´atica cuya matriz sim´etrica asociada es
A = 1 2
M +MT
=
2
6 4
1 12 1
1 2 −3
1 2
1 1
2 5
3
7 5.
7.2.2.- Rango y signo de una forma cuadr´atica.
Dada una forma cuadr´atica ϕ(x) =xTAx,(A matriz sim´etrica real de ordenn), notemos que para cualquier α∈R y cualquier x∈Rn se verifica que
ϕ(αx) =α2ϕ(x).
Por tanto, el signo de los valores que alcanza ϕ sobre los m´ultiplos no nulos, αx, de un vector prefijado, x6= 0, es constante. Si, por ejemplo, tenemos queϕ(x)>0, entonces, para cualquier α ∈R, α 6= 0 tenemos queϕ(αx) =α2ϕ(x)>0. Adem´as, en este caso, puesto que
ϕ(x)>0,
l´ım
α→±∞ϕ(αx) = +∞
y sobre los vectores αx (la recta en Rn que pasa por el origen y tiene a x como vector
direcci´on) la forma cuadr´atica puede alcanzar cualquier valor entre 0 = ϕ(0) y +∞ (de hecho cada valor lo alcanza dos veces en dicha recta):
0< c <+∞ ⇒
"
tomando α=±
q
c ϕ(x)
#
⇒ϕ(αx) =c.
Ejemplo.- Consideremos la forma cuadr´atica ϕ(x1, x2, x3) = 2x21 − 3x22 +x23. Tenemos
ϕ(1,0,0) = 2 (=⇒ ϕ(α,0,0) = 2α2) y ϕ(0,1,0) = −3 (=⇒ ϕ(0, β,0) = −3β2). Por
tan-to, una vez que conocemos alg´un punto en el que la forma cuadr´atica alcanza un valor de un determinado signo, podemos determinar puntos donde alcanza cualquier otro valor del mismo signo. Por ejemplo, si queremos determinar alg´un punto donde se verifique que ϕ(x1, x2, x3) = 7 bastar´a buscar puntos de la forma (x1, x2, x3) =α(1,0,0) para los cuales
ϕ(α,0,0) = 2α2 = 7⇐⇒α=± Ê
7 2.
Definici´on (Signo de una forma cuadr´atica).
Se dice que una forma cuadr´aticaϕ :x∈Rn −→ϕ(x) =xTAx∈Ry que la matriz sim´etrica
A asociada es:
(1) Definida positiva si ϕ(x) =xTAx >0,
∀x6= 0, x∈Rn.
(2) Definida negativa si ϕ(x) = xTAx < 0, ∀x 6= 0, x ∈ Rn. De forma equivalente, −ϕ(x) =xT(
−A)x es definida positiva.
(3) Indefinida si existen vectores en Rn para los que ϕ es positiva y otros para los que es negativa. Es decir, ∃v1 ∈Rn y∃v2 ∈Rn tales que
ϕ(v1) =vT1Av1 >0 y ϕ(v2) =v2TAv2 <0.
(4) Semidefinida positiva si ϕ(x) =xTAx≥0, ∀x∈Rn. (5) Semidefinida negativa si ϕ(x) = xTAx
≤ 0, ∀x ∈ Rn. De forma equivalente,
Nota.Con las definiciones dadas, los casos de formas cuadr´aticas semidefinidas (positiva o nega-tiva) incluyen a los casos de formas cuadr´aticas definidas (positiva o neganega-tiva). Para considerar situaciones disjuntas, en la definici´on de forma cuadr´atica semidefinida suele a˜nadirse que se cumpla
ϕ(v) = 0 para alg´un vector v6= 0. En caso de no existir tal vector v, siendo semidefinida (positiva o negativa) ser´a definida (positiva o negativa). En lo que sigue consideramos la definici´on dada m´as arriba con objeto de simplificar los enunciados.
Observaci´on.- Dada una forma cuadr´atica ϕ asociada a una matriz sim´etrica A, ϕ(x1,· · ·, xn) =a11x21+· · ·+ 2aijxixj+· · ·+annx2n=xTAx,
los coefiecientes aiide los cuadrados (los elementos diagonales deA) son valores que alcanza la forma cuadr´atica en los vectores/puntos can´onicos
e1 = (1,0, . . . ,0),· · · , ei= (0, . . . ,0,1,0, . . . ,0),· · · , en= (0,· · ·,0,1) =⇒.ϕ(ei) =aii. Por tanto, dichos valores nos dan alguna informaci´on sobre el signo de la forma cuadr´atica. Por ejemplo,
si todos los elementos diagonales son positivos a11,· · · , ann > 0, la forma cuadr´atica no podr´a ser ni definida ni semidefinida negativa;
si hay dos elementos digonales de distinto signo, la forma cuadr´atica es indefinida; si alguno de los elementos diagonales es nulo, la forma cuadr´atica no podr´a ser definida negativa ni definida positiva;
· · ·
Definici´on. El rango de una forma cuadr´atica en Rn se define como el rango de la matriz sim´etrica asociada.
Al hacer, en la forma cuadr´atica xTAx, un cambio de base x = P y (P matriz real no-singular), se obtiene
xTAx =yT(PTAP)y.
Es decir al expresar la forma cuadr´atica respecto a la base formada por los vectores columna deP, obtenemos que en las coordenadasy, respecto de dicha base, la forma cuadr´atica tiene asociada la matriz sim´etricaB =PTAP. Puesto queP yPT son matrices que tienen inversa, el rango deB is igual que el rango de A.
El estudio del signo y del rango de una forma cuadr´atica arbitraria lo reduciremos a los casos m´as simples posibles. Dichos casos se dan cuando la forma cuadr´atica consiste en una suma de cuadrados o, lo que es lo mismo, la matriz sim´etrica asociada es diagonal. En dichos casos la determinaci´on del rango y del signo es inmediata como se recoge en el siguiente resultado.
Proposici´on.-Sea ϕ:Rn−→R la forma cuadr´atica
ϕ(x) :=α1x21+α2x22+· · ·+αnx2n= [x1 · · · xn] 2
6 6 6 6 4
α1 0 · · · 0
0 α2 · · · 0
... ... ... ... 0 0 · · · αn
3
7 7 7 7 5
2
6 6 4
x1
... xn
3
(1) ϕ es definida positiva ⇐⇒α1 >0, α2 >0,· · · , αn>0. (2) ϕ es definida negativa ⇐⇒α1 <0, α2 <0,· · ·, αn <0. (3) ϕ es indefinida ⇐⇒ ∃ i, j tales que αi >0 y αj <0. (4) ϕ es semidefinida positiva ⇐⇒α1 ≥0, α2 ≥0,· · · , αn≥0. (5) ϕ es semidefinida negativa ⇐⇒α1 ≤0, α2 ≤0,· · · , αn≤0. El rango de ϕ es el n´umero de coeficientes αk 6= 0.
7.2.3.- Reducciones a suma de cuadrados.
En esta subsecci´on estudiamos c´omo reducir a suma de cuadradosuna forma cuadr´atica arbitraria. Es decir, dada una forma cuadr´atica
ϕ(x1,· · · , xn) =a11x21+ 2a12x1x2+· · ·
c´omo obtener un cambio de basex=P y (cambio de variables lineal,P matriz real que tiene inersa) de forma que en las nuevas variables la forma cuadrada se exprese como una suma de cuadrados ϕ(x1,· · · , xn) = α1y12+α2y22+· · ·+αnyn2.As´ı, para cada vector y ∈Rn tenemos un ´unico vector x=P y ∈Rn y viceversa, y=P−1x∈ Rn.
De esta forma, siendoDla matriz diagonal cuyos elementos diagonales son los coeficientes αk de los cuadrados tenemos que
xTAx=yT(PTAP)y =yTDy
y todos los datos/resultados/... que se obtienen sobre la forma cuadr´atica a partir de su ex-presi´on en las variables (y1,· · ·, yn) pueden traducirse a las variables (x1,· · · , xn) y viceversa
(x=P y, y=P−1x).
Cuando una forma cuadr´atica est´a expresada como suma de cuadrados se dice que est´a en forma reducida (o can´onica).
Definici´on.-Se dice que dos matrices A y B (cuadradas reales del mismo orden) son con-gruentes si existe alguna matriz real P no singular tal que B =PTAP.
La reducci´on de una forma cuadr´atica a suma de cuadrados se puede hacer de muchas formas distintas puesto que la ´unica restricci´on que hemos considerado para la matriz P es que sea no-singular. A continuaci´on describimos dos m´etodos para reducir a suma de cuadrados. Un m´etodo es matricial, consiste en obtener una diagonalizaci´on ortogonal de la matriz A. El otro es polin´omico, consiste en ir reducciendo el problema, paso a paso, a formas cuadr´aticas con una variable menos en cada paso.
Teorema (de los ejes principales). Sea A una matriz real sim´etrica, entonces existe un cambio de variables ortogonalx=Qy (es decir, con Qmatriz ortogonal) que reduce la forma cuadr´atica xTAx a suma de cuadrados
yTDy =λ
1y12+· · ·+λnyn2
En dicho caso las matrices A y D son semejantes (Q−1AQ = D) y congruentes
(QTAQ=D) siendo la matriz de paso la misma matriz P cuyas columnas son autovectores deA que forman una base ortonormal deRn. Los vectores columna de Q se denominan ejes principales de la forma cuadr´atica.
Ejemplos.
(1) Sea ϕ1 la forma cuadr´atica en R2 dada por
ϕ1(x) =xTAx=
x1 x2
1 3/2 3/2 −1
x1
x2
=x21+ 3x1x2−x22.
Si obtenemos una base una base ortonormal de R2 formada por autovectores de la
matrizA llegaremos a
ϕ1(x)
√ 13 2 w 2 1 − √ 13 2 w 2 2
puesto que los autovalores de A son ±√13/2. Por tanto, esta forma cuadr´atica es indefinida (y tiene rango 2). Toda matriz que represente a ϕ1 en alguna base de R2
tendr´a rango 2 y, si la matriz es diagonal, tendr´a un elemento positivo y uno negativo (y obviamente ninguno nulo).
ϕ1(x) =
x1 x2
1 3/2 3/2 −1
x1 x2 =
y1 y2
1 0
0 −13/4
y1 y2 =
z1 z2
13/4 0 0 −1
z1 z2 =
u1 u2
−1 0 0 13/4
u1 u2 =
v1 v2
−1 0 0 1 v1 v2 =
w1 w2
" √
13/2 0 0 −√13/2
# w1 w2 =...
(2) Sea ϕ2 la forma cuadr´atica en R2 dada por
ϕ2(x) =xTAx=
x1 x2
4 −2 −2 1
x1
x2
= 4x21−4x1x2+x22.
Completando cuadrados en la primera variable obtuvimos, en el Tema 3, la reducci´on de ´esta forma cuadr´atica a suma de cuadrados como ϕ2(x) = y12, mediante el cambio
de variables y1 = 2x1−x2, y2 =x2.
Puesto que los autovalores deAsonλ1 = 0 yλ2 = 5, si obtenemos una base ortonormal
de autovectores llegamos, por ejemplo, a la expresi´on ϕ2(x) = 5u22.
Esta forma cuadr´atica es semidefinida positiva (y de rango 1). Toda matriz que repre-sente a ϕ2 en alguna base de R2 tendr´a rango 1 y, si la matriz es diagonal, tendr´a un
elemento positivo y otro nulo (y ninguno negativo). (3) Sea ϕ3 la forma cuadr´atica en R2 dada por
ϕ3(x) =xTAx=
x1 x2
1 −2 −2 0
x1
x2
=x21−4x1x2.
Puesto que los autovalores deAson (1±√17)/2, podemos obtener, mediante una base ortonormal de R2 formada por autovectores de A,
ϕ3(x) =
1 +√17
2 w
2 1 +
1−√17
2 w
(4) Sea ϕ4 la forma cuadr´atica en R2 dada por
ϕ4(x) =xTAx=
x1 x2 0 2 2 0 x1 x2
= 4x1x2.
Puesto que los autovalores de A son ±2, podemos obtener la reducci´on a suma de cuadrados ϕ4(x) = 2w21−2w22.
(5) Consideremos la forma cuadr´atica en R3
ϕ5(x) =xTAx=
x1 x2 x3
2
6 4
3 2 0 2 2 2 0 2 1
3 7 5 2 6 4 x1 x2 x3 3 7 5= 3x
2
1+ 2x22+x23+ 4x1x2+ 4x2x3.
Puesto que los autovalores de A son 5,2,−1, podemos obtener la reducci´on ϕ5(x) = 5z12+ 2z22 −z23.
(6) Consideremos la forma cuadr´atica en R3
ϕ6(x) = xTAx=
x1 x2 x3
2
6 4
1 2 1 2 5 3 1 3 2
3 7 5 2 6 4 x1 x2 x3 3 7 5
= x21+ 5x22+ 2x23+ 4x1x2 + 2x1x3+ 6x2x3.
Puesto que los autovalores de A son 0,4±√13(dos positivos y uno nulo), podemos obtener la reducci´on a suma de cuadrados
ϕ6(x) = (4 +
√ 13)z2
2 + (4−
√ 13)z2
3.
Esta forma cuadr´atica es pues semidefinida positiva (y de rango 2). (7) Consideremos la forma cuadr´atica en R4
ϕ7(x) =xTAx= [x1 x2 x3 x4] 2
6 6 6 4
0 3/2 0 0 3/2 0 0 0 0 0 0 5/2 0 0 5/2 0
3 7 7 7 5 2 6 6 6 4 x1 x2 x3 x4 3 7 7 7 5
= 3x1x2 + 5x3x4.
Los autovalores de A son, ±3/2,±5/2 y por tanto mediante una base ortonormal de
R4 formada por autovectores deA podemos obtener
ϕ7(x) =
3 2w 2 1 − 3 2w 2 2+ 5 2w 2 3− 5 2w 2 4.
• M´etodo de Lagrange. (completar cuadrados)
El m´etodo polin´omico que hemos citado se debe, en parte, a J. L. Lagrange. La idea b´asica consiste en completar cuadrados a partir del cuadrado perfecto y los t´erminos cruzados en una de las variables. Cuando esto no sea posible, habr´a que conseguir un cuadrado perfecto utilizando que
suma por diferencia es igual a diferencia de cuadrados. Esencialmente la idea es la misma que utiliz´abamos a la ho-ra de completar cuadho-rados en la ecuaci´on de una c´onica o una cu´adrica para obtener su ecuaci´on reducida. Al completar cuadrados en una forma cuadr´atica habr´a varias posibilidades
de elecci´on sobre c´omo hacerlo. Joseph Louis Lagrange1736-1813 Antes de describir el m´etodo en forma gen´erica consideremos algunos ejemplos. Ejemplos:
(1) Consideremos la forma cuadr´atica en R2 dada por
ϕ1(x) =xTAx=
x1 x2
1 3/2 3/2 −1
x1
x2
=x2
1+ 3x1x2−x22.
Podemos completar el cuadrado en x1 con los t´erminos en los que aparece,
x21+ 3x1x2 =
x1+
3 2x2
2
−
3 2
2
x22.
Tenemos
ϕ1(x) =
x1+
3 2x2
2
− 94x22−x22 =
x1+
3 2x2
2
− 134 x22.
Es decir, mediante el cambio de variables y1 =x1 +32x2, y2 =x2 la forma cuadr´atica
se expresa como
ϕ1(x) =y12−
13 4 y
2 2.
Por tanto, la forma cuadr´atica es indefinida puesto que lo es en las coordenadas (y1, y2)
(pueden obtenerse f´acilmente puntos d´onde la forma cuadr´atica toma valores positivos y puntos d´onde toma valores negativos). Puesto que la relaci´on entre las variables (x1, x2) e (y1, y2) es uno-a-uno,
y1
y2
=
1 3 2
0 1
x1
x2
⇐⇒
x1
x2
=
1 3 2
0 1
−1
y1
y2
,
podremos obtener las correspondientes coordenadas (x1, x2) para las cuales la forma
cuadr´atica toma los valores citados. Por ejemplo tenemos
ϕ1(y1 = 1, y2 = 0) =ϕ1(x1 = 1, x2 = 0) = 1 y ϕ1(y1 = 0, y2 = 1) =−
Puesto que en ϕ1 tambi´en aparecen los t´erminos x22 y x1x2, podr´ıamos haber optado
por completar el cuadrado enx2:
ϕ1(x) = x21+ 3x1x2−x22 =−
x22−3x1x2
+x21 = −
x2−
3 2x1
2
+9 4x
2
1+x21 =−
x2−
3 2x1
2
+13 4 x
2 1
= −z22+ 13 4 z 2 1 = 13 4 z 2 1 −z22,
donde al final hemos hecho el cambioz1 =x1, z2 =x2−32x1. Si ahora hacemos el cambio
de Por otra parte, podr´ıamos considerar el cambio de variables u1 =
√
13
2 z1, u2 = z2
obtenemos ϕ1(x) =u21−u22.
Por tanto, hay muchas formas distintas de expresar la forma cuadr´atica como suma de cuadrados. Sin ambargo, siempre que reducimosϕ1 a una suma de cuadrados, aunque
se obtengan coeficientes distintos, aparecen un coeficiente positivo y uno negativo. Este hecho no es casualidad y su expresi´on para una forma cuadr´atica gen´erica se denomina ley de inercia de Sylvester. La expresi´on matricial de la forma cuadr´atica ϕ1 en las
distintas variables que hemos considerado es
ϕ1(x) =
x1 x2
1 3/2 3/2 −1
x1 x2 =
y1 y2
1 0
0 −13/4
y1 y2 =
z1 z2
13/4 0 0 −1
z1 z2 =
u1 u2
1 0 0 −1
u1
u2
.
(2) Consideremos la forma cuadr´atica en R2 dada por
ϕ2(x) =xTAx=
x1 x2
4 −2 −2 1
x1
x2
= 4x21−4x1x2+x22.
Podemos completar el cuadrado en x2, ϕ2(x) = (x2 −2x1)2. Haciendo el cambio de
variablesy1 =x1, y2 =x2 −2x1 obtenemos
ϕ2(x) =y22.
N´otese que tomamos, por simplicidad, y1 =x1, pero podr´ıamos elegiry1 =αx1+βx2
conα, β ∈R, α+2β6= 0 (para que tengamos realmente un cambio de variablesx=P y,
es decir, P sea una matriz no singular), y seguir´ıamos obteniendo ϕ2(x) =y22.
Por tanto, la forma cuadr´atica ϕ2 es semidefinida positiva por serlo en las variables
(y1, y2). Siempre que reduzcamos ϕ2 a una suma de cuadrados obtendremos un
coefi-ciente negativo y un coeficoefi-ciente nulo.
(3) Consideremos la forma cuadr´atica en R2 dada por
ϕ3(x) =xTAx=
x1 x2 0 2 2 0 x1 x2
= 4x1x2.
En este caso no podemos completar cuadrados ni en la primera ni en la segunda variable (pues no aparecen nix2
En esta situaci´on recurrimos a la idea de transformar el t´ermino mixto en unasuma por diferencia, que conseguimos, por ejemplo, mediante el cambiox1 =y1+y2, x2 =y1−y2:
ϕ3(x) = 4(y1+y2)(y1−y2) = 4y12−4y22.
De esta forma, ya tenemos una suma de cuadrados en la que aparecen un coeficiente positivo y uno negativo. Por tanto, la forma cuadr´atica es indefinida. La relaci´on entre las variables originales y las variables finales es
x1 x2 = 1 1 1 −1
y1 y2 ⇐⇒ y1 y2 = 1 1 1 −1
−1
x1
x2
.
(4) Consideremos la forma cuadr´atica en R3 dada por
ϕ4(x) =xTAx=
x1 x2 x3
2
6 4
3 2 0 2 2 2 0 2 1
3 7 5 2 6 4 x1 x2 x3 3 7 5= 3x
2
1+ 2x22+x23+ 4x1x2+ 4x2x3.
Completamos cuadrados en la variable x1 puesto que aparecen t´erminos en x21 y en
x1x2:
ϕ4(x) = 3
x21 +4 3x1x2
+ 2x22+x23+ 4x2x3
= 3
x1 +
2 3x2
2
− 4 3x
2
2+ 2x22+x23+ 4x2x3
= 3
x1 +
2 3x2
2
+2 3x
2
2+x23 + 4x2x3.
Completamos cuadrados enx2 tenemos
ϕ4(x) = 3
x1+
2 3x2
2
+2 3(x
2
2+ 6x2x3) +x23
= 3
x1+
2 3x2
2
+2
3(x2+ 3x3)
2
−6x23+x23 = 3
x1+
2 3x2
2
+2
3(x2+ 3x3)
2−5x2 3.
Finalmente, el cambio y1 =x1+ 23x2, y2 =x2+ 3x3, y3 =x3 nos lleva a
ϕ4(x) = 3y12+
2 3y
2
2 −5y23.
Puesto que hemos obtenido dos coeficientes positivos y uno negativo, esta forma cuadr´atica es indefinida.
(5) Consideremos la forma cuadr´atica en R3 dada por
ϕ5(x) =xTAx= [x1 x2 x3] 2
6 4
1 2 1 2 5 3 1 3 2
3 7 5 2 6 4 x1 x2 x3 3 7 5=x
2
Completamos cuadrados en la variablex1 puesto que aparecen t´erminos en x21, x1x2 y
x1x3:
ϕ5(x) = (x1+ 2x2+x3)2−4x22 −x23 −4x2x3+ 5x22+ 2x23+ 6x2x3
= (x1+ 2x2+x3)2+x22+x23+ 2x2x3.
A continuaci´on completamos cuadrados en la variablex2 (puesto que aparecen t´erminos
en x2
2 y x2x3):
ϕ5(x) = (x1+ 2x2+x3)2+ (x2 +x3)2 =y12+y22,
donde hemos hecho el cambio y1=x1+ 2x2+x3, y2 =x2 +x3, y3 =x3.
Puesto que hemos obtenido dos coeficientes positivos y uno nulo, la forma cuadr´atica es semidefinida positiva.
(6) Consideremos la forma cuadr´atica en R4 dada por
ϕ6(x) =xTAx=
x1 x2 x3 x4
2
6 6 6 4
0 3/2 0 0 3/2 0 0 0 0 0 0 5/2 0 0 5/2 0
3
7 7 7 5
2
6 6 6 4
x1
x2
x3
x4 3
7 7 7 5
= 3x1x2+ 5x3x4.
Puesto que no hay ning´un cuadrado, necesitamos recurrir a suma por diferencia. Lo hacemos, por ejemplo, mediante el cambio:
x1 =y1+y2, x2 =y1−y2, x3 =y3, x4 =y4
con lo que ϕ6(x) = 3(y1+y2)(y1−y2) + 5y3y4 = 3y12−3y22+ 5y3y4.
Ya tenemos suma de cuadrados en las dos primeras variables. Nuevamente, como no hay ning´un t´ermino al cuadrado en las variables restantes y2
3 ey42, necesitamos recurrir
asuma por diferencia. Lo hacemos, por ejemplo, mediante el cambio: y1 =z1, y2 =z2, y3 =z3+z4, y4 =z3 −z4,
y obtenemos ϕ6(x) = 3z21−3z22+ 5(z3 +z4)(z3−z4) = 3z12−3z22 + 5z32−5z42.
N´otese que ambos cambios de variables, en este caso sencillo, se podr´ıan haber hecho simult´aneamente:
x1 =z1 +z2, x2 =z1−z2, x3 =z3+z4, x4 =z3−z4,
con lo que habr´ıamos llegado, en un solo paso, al resultado final. Puesto que en la expresi´on como suma de cuadrados hemos obtenidos dos coeficientes positivos y dos negativos (y obviamente ninguno nulo), la forma cuadr´atica es indefinida.
A modo de resumen de lo que hemos hecho en los ejemplos anteriores. Si en una forma cuadr´atica
ϕ(x1, x2, . . . , xn) =a11x21+ 2a12x1x2+· · ·+a22x22+· · ·+annx2n el coeficiente de uno de los cuadrados x2
variable correspondiente. Si por ejemploa116= 0 y hay otros sumandos 2a12x1x2+· · · donde
aparece la variablex1, podemos completar el cuadradoa11x21 mediante
a11
x21+2a12 a11
x1x2+
2a13
a11
x1x3 +· · ·
=a11
x1+
a12
a11
x2+· · · 2
−
a12
a11
x2+· · ·
2
de forma que si desarrollamos el cuadrado anterior obtenemos todos los sumandos de la forma cuadr´atica en los que interviene x1 (el cuadrado perfecto y los productos cruzados)
m´as otros sumandos en las restantes variables x2, x3, . . . , xn.
Es posible que a la hora de completar cuadrados no se disponga de ning´un cuadrado (que no est´e ya completo) y que s´olo queden productos cruzados. Si por ejemplo tenemos x1x2,
este producto cruzado lo transformaremos en una suma×diferencia, x1x2 = (y1−y2)(y1+y2) =y12−y22
y podremos completar alguno de los cuadrados de la diferencia de cuadrados resultante. Este m´etodo, consistente en ir completando cuadradados haciendo cambios de variable en los que en cada paso cambia una (o a lo sumo dos) de las variables, puede esquematizarse como sigue:
M´etodo de Lagrange.
(1) Si para alg´un ´ındice i se tiene aii 6= 0, podemos completar cuadrados con todos los t´erminos que contengan a xi para obtener
Q(x) =aii
n
X
j=1
aij aii
xj
2
+ϕ1(x1,· · · , xi−1, xi+1,· · · , xn)
donde ϕ1 es una nueva forma cuadr´atica con n−1 variables a la que se le vuelve a
aplicar el proceso. El cambio de variables que se utiliza es
8
> <
> :
yi = n
X
j=1
aij aii
xj
yj =xj para j 6=i.
(2) Si a11 = a22 = · · · = ann = 0, elegimos un coeficiente aij 6= 0 (si todos fueran cero tendr´ıamos ϕ(x)≡0 y no habr´ıa nada que reducir). Haciendo el cambio de variables
8
> <
> :
xi =yi+yj xj =yi−yj
xk=yk para k 6=i, j,
obetenemos dos cuadrados que podemos completar pasando de nuevo al caso (1), pues 2aijxixj = 2aijyi2−2aijy2j.
7.2.4.- Ley de inercia de Sylvester. Clasificaci´on.
algunos de los Ejemplos (1) a (6) que hemos visto antes, se han completado cuadrados de dos maneras distintas para una misma forma cuadr´atica, obteniendo como resultado final una suma de cuadrados con coeficientes posiblemente distintos. A pesar de que puedan obtenerse coeficientes distintos, las dos expresiones finales como suma de cuadrados tienen en com´un los signos de los coeficientesde los cuadrados. Es decir, si tenemos una forma cuadr´atica, por ejemplo en tres variables, ϕ(x1, x2, x3) y al reducir (de alguna forma) a suma de cuadrados
obtenemos, por ejemplo, 2y2
1−5y22+0y32,entonces, al reducir a suma de cuadrados de cualquier
otra forma obtendremos una expresi´on del tipo αz2
1 +βz22+γz32 en la que, necesariamente,
uno de los coeficientes ser´a positivo, otro ser´a negativo y el otro ser´a nulo. Este hecho de conservaci´on de los signos en cualquiera de las reducciones a sumas de cuadrados es lo que expresa la llamada ley de inercia de Sylvester. Adem´as dichos signos tienen que coincidir con los signos de los autovalores de la matriz sim´etica asociada, contando cada uno seg´un su multiplicidad.
Teorema. (Ley de inercia de Sylvester)Sea Auna matriz sim´etrica real y ϕ(x) =xTAx la forma cuadr´atica asociada.
a) Al reducir ϕ a suma de cuadrados se obtienen tantos coefi-cientes positivos, negativos y nulos como autovalores posi-tivos, negativos y nulos, respectivamente, tengaA, contan-do las correspondientes multiplicidades.
b) Si D1 es una matriz diagonal congruente con A (existe una
matriz no-singular P1 tal que P1TAP1 = D1), en la
diago-nal deD1 hay tantos elementos positivos, negativos y nulos
como autovalores positivos, negativos y nulos, respectiva-mente, tenga A, contando las correspondientes
multiplici-dades. James Joseph Sylvester
1814-1897
Observaciones.
(a) Se suele llamarinercia de una matriz sim´etrica (real) A y de la forma cuadr´atica aso-ciadaϕ(x) =xTAx a la terna(pos, neg, nul) de coeficientes positivos (pos), negativos (neg) y nulos (nul) respectivamente que aparecen en una (cualquier) reducci´on deϕ a suma de cuadrados.
(b) Se verifica que
• pos + neg + nul =n = orden deA y • pos + neg = rango(A).
La primera igualdad es obvia y la segunda se basa en que cuando una matriz se multi-plica (por la derecha o por la izquierda) por una matriz que tiene inversa el rango no cambia.
(c) En relaci´on con las formas cuadr´aticas (y las matrices sim´etricas reales) tambi´en suele usarse el concepto de signatura (que nosotros no utilizaremos)
signatura = pos−neg.
(d) Para la determinaci´on del signo puede no ser imprescindible hacer la reducci´on a suma de cuadrados. Ya hemos visto que los elementos diagonales de A son valores que al-canza la forma cuadr´atica y, por tanto, aportan cierta informaci´on sobre su signo. M´as informaci´on puede obtenerse cuando en la expresi´on deϕ(x1, . . . , xn) anulamos ciertas
variables. Por ejemplo, si tomamosx3 =· · ·=xn = 0 tenemos la forma cuadr´atica en dos variables (x1, x2) dada por
ϕ1(x1, x2) =ϕ(x1, x2,0,· · · ,0).
La informaci´on que podamos obtener sobre dicha forma cuadr´atica ϕ1, o sobre varias
formas cuadr´aticas del mismo tipo, permite deducir alguna informaci´on sobre la forma cuadr´atica original.
Teorema. Sea A= [aij] una matriz real sim´etrica de orden n. Son equivalentes: (1) A es definida positiva. (1’) −A es definida negativa.
(2) Al reducir xTAx a suma de cuadrados, aparecen n coeficientes positivos. (3) Los autovalores de A son todos positivos.
(4) (Criterio de Sylvester o de los menores principales) Todos los menores principales de A son positivos, es decir, det (Ak)>0, k = 1,2, . . . , nsiendo Ak la matriz de ordenk
Ak =
2
6 6 4
a11 · · · a1k ..
. . .. ... ak1 · · · akk
3
7 7 5
Puesto que una matriz real y sim´etricaAes definida negativa si, y s´olo si,−Aes definida positiva, se obtiene el siguiente resultado.
Corolario. Sea A = [aij] una matriz real sim´etrica de orden n. Entonces las siguientes condiciones son equivalentes:
(1) A es definida negativa. (1’) −A es definida positiva.
(2) Al reducir xTAx a suma de cuadrados, aparecen n coeficientes negativos. (3) Los autovalores de A son todos negativos.
(4) (Criterio de Sylvester o de los menores principales) Los menores principales deAtienen signos alternos −,+,−,+, . . .
(−1)kdet (Ak)>0, k = 1,2, . . . , n.
teniendo en cuenta que los elementos diagonales deAson valores que alcanza la forma cuadr´atica,akk =ϕ(ek) =eTkAek. Si dos de estos valores son de distinto signo la forma cuadr´atica ser´a indefinida.
Si alguna submatriz diagonal de orden 2,
aii aij aji ajj
,tiene determinante negativo, la forma cuadr´atica es indefinida.
Si det (A)6= 0, y no se cumplen las condiciones dadas para formas cuadr´aticas definidas positivas o definidas negativas, entonces es indefinida.
. . .
Definici´on. Clasificar una forma cuadr´atica consiste en determinar su inercia (el n´umero de coeficientes positivos, negativos y nulos que aparecen en cualquier reducci´on a suma de cuadrados) as´ı como el signo correspondiente.
Se denominaforma can´onica/reducida de una forma cuadr´atica ϕ a cualquier expre-si´on de ϕ como suma de cuadrados (en variables independientes).
Para una forma cuadr´atica en dos variables, tenemos el siguiente teorema que permite determinar el signo (en este caso la inercia completa) en funci´on de los coeficientes de la matriz (sim´etrica) asociada.
Teorema.- Sea ϕ la forma cuadr´atica siguiente y A la matriz sim´etrica asociada, Q(x, y) =ax2+ 2bxy+cy2 = [x y]
a b b c
x y
, A=
a b b c
.
(a) ϕ es definida positiva si y s´olo si a >0 ydet (A) =ac−b2 >0.
(b) ϕ es definida negativa si y s´olo si a <0 y det (A) = ac−b2 >0.
(c) ϕ es indefinida si y s´olo si det (A) =ac−b2 <0.
D.−Separemos los casos en los que a6= 0 y los casos en los que a= 0.
•Si a6= 0, entonces podemos completar el cuadrado enx,
ax2+ 2bxy+cy2 = a
x2+ 2b
axy
+cy2 =a
x2+ 2b
axy+
b ay
2
−
b ay
2
+cy2
= a
x2+ 2b
axy+
b ay
2
−a
b ay
2
+cy2 =a
x+ b
ay 2
+
c−b
2
a
y2
= a x′2+
−b
2
a +c
y′2, siendo
¨
x′=x+b ay,
y′ =y.
Por tanto, en este caso, la forma cuadr´atica es:
(a) Definida positiva ⇐⇒ a >0 y −b2
a +c >0 ⇐⇒ a >0 y ac−b2 >0.
(b) Definida negativa ⇐⇒ a <0 y −b2
a +c <0 ⇐⇒ a <0 y ac−b2 >0.
(c) Indefinida ⇐⇒ a
−b2
a +c
• Si a = 0 y c 6= 0, tenemos que ϕ(x, y) = 2bxy +cy2 y podemos completar el cuadrado en
y. Estamos en un caso an´alogo al anterior. Notemos que en los casos en los que ϕ sea definida (positiva o negativa), ayctienen que tener el mismo signo.
• Si a =c = 0 tenemos ϕ(x, y) = 2bxy. Sea cual sea el signo de b 6= 0, esta forma cuadr´atica es
indefinida puesto que alcanza valores de distinto signo, por ejemplo ϕ(1,1) = 2b y ϕ(1,−1) =
−2b. En lo que se refiere a la reducci´on a suma de cuadrados, podemos transformar xy en una suma×diferencia
ϕ(x, y) = 2b xy =
siendo
¨
x=x′+y′ y=x′−y′
= 2b
x′2−y′2
.
Recopilando todos los casos obtenemos el enunciado.
Ejercicio.Estudia cuando es semidefinida la forma cuadr´atica ϕ(x, y) =ax2+ 2bxy+cy2.
Para una forma cuadr´atica ϕ en n variables (y para la matriz sim´etrica real A asociada) puede darse un criterio matricial en los casos en los que sea definida (positiva o negativa).
Dada una matriz sim´etrica A, se llaman submatrices principales de A a las matrices
Ak=
2
6 6 4
a11 · · · a1k ... ... ... a1k · · · akk
3
7 7
5, k = 1,2, . . . , n.
Se llaman menores principales de A a los determinantes de dichas submatrices ∆k = det(Ak), k = 1,2, . . . , n.
Teorema 4.-Criterio de los menores prinipales (o Criterio de Sylvester). (1) A es definida positiva ⇐⇒∆k = det(Ak)>0, ∀k = 1,2, . . . , n. (2) A es definida negativa ⇐⇒(−1)k∆k= det(
−Ak)>0, ∀k = 1,2, . . . , n.
7.3.- C´
onicas y cu´
adricas (II).
En el Tema 1 se estudiaron las (secciones) c´onicas y las cu´adricas desde el punto de vista m´etrico as´ı como los elementos representativos de cada una de ellas. Por otra parte, vimos la determinaci´on de la posici´on, del tipo de c´onica/cu´adrica y c´omo obtener los elementos caracter´ısticos cuando ´esta viene dada por una ecuaci´on en la que no aparecen productos cruzados. Ahora estudiaremos:
(a1) Que toda ecuaci´on polin´omica de segundo grado en dos variables a11x2+ 2a12xy+a22y2+ 2a1x+ 2a2y+a0 = 0
(alguno de los coeficientesa11, a12, a22 es distinto de cero) representa una c´onica. Entre
´estas estar´an los casos degenerados. Dicha ecuaci´on podr´a representar: •una elipse, una par´abola, una hip´erbola,
(a2) Que toda ecuaci´on polin´omica de segundo grado en tres variables
a11x2+a22y2+a33z2+ 2a12xy + 2a13xz+ 2a23yz+ 2a1x+ 2a2y+ 2a3z+a0 = 0,
(alguno de los coeficientes a11, a22, a33, a12, a13, a23 es distinto de cero) representa una
cu´adrica. Entre ´estas consideramos los casos degenerados. Dicha ecuaci´on podr´a rep-resentar:
•un elipsoide, un paraboloide (el´ıptico o hiperb´olico), •un hiperboloide (de una o de dos hojas), un cono, •un cilindro (el´ıptico, parab´olico o hiperb´olico) •un par de planos secantes/paralelos/coincidentes, •una recta, un punto, nada.
(b) C´omo determinar el tipo de c´onica/cu´adrica y sus elementos representativos cuando en la ecuaci´on aparecen t´erminos en productos cruzados. La presencia de ´estos t´erminos indica que la c´onica/cu´adrica est´a girada respecto a los ejes coordenados. La deter-minaci´on del correspondiente ´angulo de giro se har´a a partir del c´alculo de autova-lores y autovectores de la matriz asociada a la parte cuadr´atica de la ecuaci´on de la c´onica/cu´adrica. Es decir, se tratar´a de obtener la posici´on, los elementos caracter´ısticos y la representaci´on gr´afica en el sistema de ejes dado.
En cada una de las subsecciones siguientes consideraremos el problema de determinar el tipo de c´onica/cu´adrica y obtener la posici´on, los elementos caracter´ısticos y la representaci´on gr´afica en el sistema de ejes dado. El planteamiento para hacer la reducci´on de una cu´adrica ser´a el mismo para una c´onica. Tiene dos partes diferenciadas:
En primer lugar, mediante un cambio de variables ortogonal, hay que conseguir que en la parte cuadr´atica de la ecuaci´on:
c´onica : a11x2+ 2a12xy+a22y2,
cu´adrica : a11x2+ 2a12xy+ 2a13xz+a22y2+ 2a23yz+a33z2,
no aparezcan t´erminos cruzados. Para ello, tendremos que diagonalizar ortogonalmente la matriz (real sim´etrica) de la parte cuadr´atica de la ecuaci´on. Es decir, siendo A = [aij] la matriz sim´etrica de la parte cuadr´atica de la ecuaci´on, habr´a que calcular sus autovalores y una base ortonormal de Rn formada por autovectores de A. Dicha
base formada por autovectores nos permitir´a hacer un cambio de variables ortogonal x= Px′ de forma que en las variables x′ la ecuaci´on de la c´onica/cu´adrica no tenga
t´erminos cruzados. Esta es la situaci´on que se estudi´o en el Tema 2.
Una vez que hemos conseguido una ecuaci´on de segundo grado, sin t´erminos cruzados, mediante un cambio de variables dado por una matriz ortogonal (que esencialmente representar´a un giro en el plano o en el espacio), bastar´a hacer una traslaci´onx′′=x′−c
para obtener la ecuaci´on reducida de la c´onica/cu´adrica y la gr´afica en el sistema de ejesx′′.
Finalmente, para obtener los elementos caracter´ısticos y la representaci´on gr´afica en el sis-tema de ejes original, necesitaremos deshacer los cambios de variables:
7.3.1.- Reducci´on de una c´onica girada.
Definici´on. Una c´onica es el lugar geom´etrico de los puntos (x, y) ∈ R2 del plano que
satisfacen una ecuaci´on general de segundo grado:
f(x, y) = a11x2+ 2a12xy+a22y2+ 2a1x+ 2a2y+a0 = 0, (1)
donde alguno de los coeficientes a11, a12 oa22 es distinto de cero.
La ecuaci´on anterior, llamada ecuaci´on de la c´onica, se puede escribir en notaci´on vectorial de la forma:
f(x, y) = [x y]A
x y
+ 2 [a1 a2]
x y
+a0 = 0 siendoA=
a11 a12
a12 a22
.
N´otese que tambi´en puede escribirse,
f(x, y) = [x y 1]
2
6 4
a11 a12 a1
a12 a22 a2
a1 a2 a0 3
7 5
2
6 4
x y 1
3
7 5= 0.
El proceso general parallevar una c´onica a su ecuaci´on reducida(sabiendo cu´ales son los cambios de variables involucrados) puede separarse en dos etapas (si el coeficiente a12 6= 0,
si el coeficiente a12= 0 bastar´ıa con la segunda etapa):
(a) Determinaci´on de las direcciones de los ejes de la c´onica.Esto consiste endiagonalizar ortogonalmente la matriz (sim´etricaA) asociada a la parte cuadr´atica de la ecuaci´on
A=
a11 a12
a12 a22
.
Sean λ1 y λ2 los autovalores deA y v1 y v2 autovectores ortogonales correspondientes
(si λ1 6= λ2 dichos autovectores ser´an ortogonales necesariamente, y si λ1 = λ2
nece-sariamente A es una matriz diagonal, y no necesitamos hacer nada de esto). Conviene tomar los autovectoresv1 yv2 de manera que el ´angulo dev1 av2 sea de 900 en sentido
positivo (contrario a las agujas del reloj). Sin m´as que dividir los vectores v1 y v2 por
su norma, obtenemos una base ortonormal{u1, u2}deR2 formada por autovectores de
A y, por tanto,
P =
2
6
4 u1 u2 3
7 5⇒P
−1 =PT, PTAP =D=
λ1 0
0 λ2
.
Al sustituir en la ecuaci´on (en (x, y)) de la c´onica el cambio de variables tenemos
x y
=P
x′
y′
=⇒[x′ y′]PTAP
x′
y′
+ 2 [a1 a2]P
x′
y′
+a0 = 0.
Es decir, la ecuaci´on de la c´onica en las coordenadas (x′, y′) es
ecuaci´on en la que no aparece el producto cruzado x′y′. Notemos que
x y
=P
x′
y′
=
2
6
4 u1 u2 3
7 5
x′
y′
=⇒
x′
y′
=PT
x y
=
uT
1
uT
2
x y
.
Por tanto, los nuevos ejes son
X′ →ecuaci´on y′ = 0→uT
2
x y
= 0,
Y′ →ecuaci´on x′ = 0→uT
1
x y
= 0.
Es decir, los ejes x′ e y′ son las rectas que pasan por el origen de coordenadas y
tienen como vectores direcci´on respectivos los autovectores u1 y u2 de A. De hecho el
sistema de ejes OX′Y′ se obtiene del sistema OXY girando (con centro el origen de
coordenadas) el ´angulo que determinau1 con el semieje OX+.
(b) Una vez que tenemos la ecuaci´on
λ1x′2 +λ2y′2+ 2b1x′+ 2b2y′+a0 = 0,
en la que no aparece el producto cruzado x′y′, bastar´a completar los cuadrados que
aparezcan (mediante cambios del tipo x′′ = x′ −α e y′′ = y′ −β) para obtener una
ecuaci´on de uno de los siguientes tipos:
Caso el´ıptico. λ1λ2 >0 (es decir λ1 y λ2 son no-nulos y del mismo signo),
a2x′′2 +b2y′′2 =c
en cuyo caso tenemos una elipse (c >0), un punto (c= 0) o nada (c <0). Caso hiperb´olico. λ1λ2 <0 (es decir λ1 y λ2 son no-nulos y de distinto signo),
a2x′′2
−b2y′′2 =c
en cuyo caso tenemos una hip´erbola (c 6= 0) o un par de rectas que se cortan (c= 0).
Caso parab´olico. λ1λ2 = 0 (es decir uno de los autovalores es nulo, y el otro no).
Suponiendo que λ1 6= 0, λ2 = 0 puede obtenerse
a2x′′2+by′′ = 0 ´o a2x′′2+c= 0
Tendremos una par´abola (b 6= 0), o bien un par de rectas paralelas (c < 0) o coincidentes (c= 0) o nada (c >0).
Para obtener los elementos caracter´ısticos de la c´onica y su representaci´on gr´afica basta obtenerlos en las coordenadas (x′′, y′′) y deshacer los cambios de variables que se hayan hecho
(Traslaci´on)
¨
x′′ =x′−α
y′′=y′−β ⇒
¨
x′ =x′′+α
y′ =y′′+β
(Giro)
x y
=P
x′
y′
⇒
x′
y′
=PT
x y
Ejemplos.
(1) Vamos a obtener la ecuaci´on can´onica (reducida) y la representaci´on gr´afica de la c´onica 3x2+ 3y2−2xy + 2x−4y+ 1 = 0.
mediante los cambios de coordenadas adecuados.
Escribimos en forma matricial la parte cuadr´atica de la ecuaci´on de la c´onica:
[x y]
3 −1 −1 3
x y
+ 2x−4y+ 1 = 0.
Puesto que la ecuaci´on de la c´onica tiene t´ermino enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los t´erminos cuadr´aticos).
Calculamos los autovalores de A,
3−λ −1 −1 3−λ
=λ2−6λ+ 8 = 0 −→ λ1 = 4, λ2 = 2.
Los autovectores correspondientes son:
λ1 = 4 :
−1 −1 −1 −1
x y = 0 0
−→ x+y= 0 −→
x y =α 1 −1 ,
λ2 = 2 :
1 −1 −1 1
x y = 0 0
−→ x−y= 0 −→
x y =α 1 1 .
Construimos la matriz de paso ortogonal P (que diagonaliza A) mediante una base ortonormal de autovectores:
(√ 2 2 1 −1 , √ 2 2 1 1 ) .
El primer autovector da la direcci´on y sentido positivo del nuevo eje X′ (que
cor-responde a girar un ´angulo θ = −45o el eje X, pues del autovector sacamos que
tgθ = y/x = −1/1 = −1) y el segundo autovector (que hemos elegido en el sentido adecuado para que el eje Y′ se obtenga girando el X′ un ´angulo de 90o en sentido
positivo) marca la direcci´on y sentido del nuevo ejeY′. El cambio:
x=Px′ −→
x y = " √ 2 2 √ 2 2
−√22
√ 2 2 # x′ y′
eliminar´a el t´ermino mixtox′y′ dejando la parte cuadr´atica comoλ
1x′2+λ2y′2,
modi-ficar´a los coeficientes de los t´erminos lineales,x′ ey′, y no alterar´a el t´ermino
Completando cuadrados hacemos una traslaci´on:
4 x′2 +3
√ 2 4 x
′
!
+ 2 y′2
− √ 2 2 y ′ !
+ 1 = 0,
4 x′ +3
√ 2 8
!2
− 9
8 + 2 y
′− √ 2 4 !2 − 1
4 + 1 = 0, 4 x′+3
√ 2 8
!2
+ 2 y′−
√ 2 4
!2
= 3
8 −→ 4x
′′2+ 2y′′2 = 3
8, donde hemos realizado la traslaci´on
x′′ =x′ +3
√ 2 8 , y
′′ =y′−
√ 2 4 . Operando, llegamos a la ecuaci´on can´onica
x′′2 3 32
+y′′
2 3 16
= 1−→ x′′
2 1 4 È 3 2
2 +
y′′2 √
3 4
2 = 1.
Es decir, al haber tomado λ1 = 4 y λ2 = 2, el semieje mayor de la elipse est´a sobre el
ejeY′′ y el menor sobre el X′′, ya que 1 4 È 3 2 < √ 3 4 .
El centro C de la elipse es el origen en las coordenadas (x′′, y′′). Es decir, (x′′, y′′) =
(0,0)⇔(x′ =−3√2 8 , y′ =
√
2
4 ). En coordenadas (x, y) obtenemos
x= √
2
2 −
3√2 8 +
√ 2 4
!
=−1
8, y = √
2 2
3√2 8 + √ 2 4 ! = 5
8 −→ C=
−18,5 8
.
Para hacer el dibujo esquem´atico con una cierta precisi´on, puede sernos ´util el encontrar los puntos de corte (si los hay) de la elipse con los ejes coordenados (OX y OY). Al hacer x = 0 en la ecuaci´on de la c´onica se obtiene 3y2 −4y+ 1 = 0 que se verifica
paray = 1,1/3. Mientras que si hacemosy = 0, la ecuaci´on 3x2+ 2x+ 1 = 0 no tiene
soluci´on (real). Por tanto, la elipse corta al ejeOY en los puntos (0,1) y (0,1/3) y no corta al eje OX.
Con toda la informaci´on que hemos obtenido a lo largo del problema, comenzamos dibujando los ejes X′ e Y′ sabiendo que pasan por (x = 0, y = 0) y
tienen la direcci´on y sentido del autovector corres-pondiente aλ1 y λ2, respectivamente. Es decir, en
este caso, con la elecci´on que hicimos de autova-lores y autovectores, los ejes X′ e Y′ se obtienen
rotando un ´angulo de −45o a los ejes X e Y. A
continuaci´on, dibujamos los ejes X′′ e Y′′,
parale-los respectivamente a parale-los ejesX′ eY′, que resultan
de trasladar el origen al puntoC =
N´otese que si hubi´eramos elegido los autovalores en el otro orden posible, es decir, λ1 = 2 y λ2 = 4 y
tomamos como autovectores respectivos (1,1)T y (−1,1)T (el primero indica la direcci´on y sentido del ejeX′ y el segundo el del Y′), llegar´ıamos, tras
realizar el giro (en este caso de 45o) mediante el
cambio de coordenadas dado por la nueva matriz P y la traslaci´on adecuada, a la ecuaci´on can´onica:
x′′2 √
3 4
2 +
y′′2 1 4 È 3 2
2 = 1,
que nos llevar´ıa a la figura adjunta.
X ● ● Y 1 1/3 C ● Y’’ Y’ X’ X’’
(2) Vamos a obtener la ecuaci´on can´onica (reducida) y la representaci´on gr´afica de la c´onica x2−2xy+y2−2x+ 1 = 0
mediante los cambios de coordenadas adecuados.
Puesto que la ecuaci´on de la c´onica tiene t´ermino enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los t´erminos cuadr´aticos).
x y
1 −1 −1 1
x y
−2x+ 1 = 0, A=
1 −1 −1 1
Calculamos pues sus autovalores y despu´es sus autovectores. En primer lugar:
1−λ −1 −1 1−λ
=λ2−2λ = 0 −→ λ1 = 0, λ2 = 2.
Podemos pues calcular los autovectores: λ1 = 0 :
1 −1 −1 1
x y = 0 0
−→ x−y= 0 −→
x y =α 1 1 ,
λ2 = 2 :
−1 −1 −1 −1
x y = 0 0
−→ x+y= 0 −→
x y =α −1 1 .
Construimos la matrizP mediante la siguiente base ortonormal de autovectores:
(√ 2 2 1 1 , √ 2 2 −1 1 ) ,
donde el primer autovector da la direcci´on y sentido del nuevo ejeX′ (que corresponde
a girar un ´angulo θ= 45o el eje X, pues del autovector sacamos que tgθ =y/x= 1) y
el segundo autovector (que hemos elegido en el sentido adecuado para que el eje Y′ se
obtenga girando el eje X′ 90o en sentido positivo o antihorario) marca la direcci´on y
sentido del nuevo ejeY′. El cambio:
x=Px′ −→
eliminar´a el t´ermino mixtox′y′ dejando la parte cuadr´atica comoλ
1x′2+λ2y′2,
modi-ficar´a los coeficientes de los t´erminos lineales,x′ ey′, y no alterar´a el t´ermino
indepen-diente. Concretamente obtenemos:
2y′2−√2x′+√2y′+ 1 = 0.
Completando cuadrados eny′ y haciendo una traslaci´on tenemos
2 y′2+
√ 2 2 y
′
!
−√2x′+ 1 = 0, −→ 2 y′+
√ 2 4
!2
− 14 −√2x′+ 1 = 0,
2 y′+
√ 2 4
!2
−√2x′ +3
4 = 0, 2 y′+
√ 2 4
!2
−√2 x′− 3
√ 2 8
!
= 0, −→ 2y′′2
−√2x′′ = 0,
donde hemos realizado la traslaci´on x′′ =x′ −3
√ 2 8 , y
′′ =y′+
√ 2 4 .
Por tanto, la ecuaci´on can´onica a la que hemos llegado, tras la rotaci´on y la traslaci´on llevadas a cabo, es x′′ =√2y′′2.
El v´erticeV de la par´abola es el origen en las coordenadas (x′′, y′′). Es decir, (x′′, y′′) =
(0,0)⇔(x′ = 3√2
8 , y′ =−
√
2
4 ). En coordenadas (x, y) obtenemos
x= √
2 2
3√2 8 +
√ 2 4
!
= 5
8, y= √
2 2
3√2 8 −
√ 2 4
!
= 1
8, −→ V =
5 8,
1 8
.
Para hacer el dibujo esquem´atico con una cierta precisi´on, puede sernos ´util el encontrar los puntos de corte (si los hay) de la par´abola con los ejes coordenados (OX y OY). Al hacerx= 0 en la ecuaci´on de la c´onica se obtiene y2+ 1 = 0 que no tiene soluci´on
(real). Mientras que si hacemos y = 0 obtenemos x2 − 2x+ 1 = 0 que tiene como
soluci´on (doble) x = 1. Por tanto, la par´abola no corta al eje OY y toca sin cortar (pues es tangente, como se deduce de la ra´ız doble) al eje OX en el punto (1,0). Con toda la informaci´on que hemos obtenido a lo largo del problema, comenzamos dibujando los ejesX′ e Y′ sabiendo que pasan por el origen de las coordenadas X-Y y
que tienen la direcci´on y sentido del autovector correspondiente a λ1 y λ2,
respectiva-mente.
Es decir, en este caso, con la elecci´on que hicimos de autovalores y autovectores, los ejesX′ eY′ se
obtienen rotando un ´angulo de 45o a los ejesX e
Y. A continuaci´on, dibujamos los ejes X′′ e Y′′,
paralelos respectivamente a los ejesX′ eY′, que
resultan de trasladar el origen al v´ertice de la par´abola V =
−1 8,
5 8
. Finalmente, dibujamos la par´abola, que es muy f´acil de representar en las coordenadas (x′′, y′′). Teniendo en cuenta las
intersecciones con los ejesXeY obtenemos pues la figura adjunta.
●
V
●
1
X’’
Y’’
Y’
X X’
N´otese que si elegimos los autovalores en el mismo orden, λ1 = 0 y λ2 = 2, pero
tomamos los autovectores opuestos ((−1,−1)T fija el eje X′ y (1,−1)T marca el Y′),
llegamos, procediendo an´alogamente, ax′′ =−√2y′′2. En este situaci´on, estar´ıamos en
el caso (a) de la figura siguiente.
Sin embargo, si tomamos λ1 = 2 y λ2 = 0, y como autovectores correspondientes a
(1,−1)T (que determina el ejeX′) y (1,1)T (que marca el ejeY′), llegamos, procediendo
an´alogamente, a y′′ = √2x′′2. De esta forma, estar´ıamos en el caso (b) de la figura
siguiente.
Finalmente, la cuarta y ´ultima posibilidad ser´a tomarλ1 = 2 yλ2 = 0, pero trabajando
con los autovectores a (−1,1)T (fija el ejeX′) y (−1,−1)T (marca elY′). Entonces, se
llega, procediendo an´alogamente, a y′′ =−√2x′′2. Estar´ıamos entonces en el caso (c)
de la figura siguiente.
● V
●
1 X
Y
X’
Y’
X’’ Y’’
● V
●
1 X
Y Y’
X’
Y’’
X’’
● V
●
1 X
Y
X’
Y’ X’’
Y’’ (a)
Moraleja: la curva en el plano (X, Y) es obviamente la misma, aunque al comienzo del problema tenemos cuatro posibilidades distintas para elegir el ejeX′ (seg´un qu´e
auto-valor elijamos como primero y qu´e autovector de norma unidad elijamos para dicho autovalor). Tras esta elecci´on los ejesY′ (que queremos obtenerlo girando 90oen sentido
antihorario el ejeX′ ), X′′ e Y′′ ya quedan determinados.
(3) Vamos a obtener la ecuaci´on can´onica (reducida) y la representaci´on gr´afica de la c´onica 2xy−4x+ 2y−7 = 0
mediante los cambios de coordenadas adecuados.
Puesto que la ecuaci´on de la c´onica tiene t´ermino enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los t´erminos cuadr´aticos),
x y
0 1 1 0
x y
−4x+ 2y−7 = 0, A=
0 1 1 0
.
Calculamos los autovalores,
−λ 1 1 −λ
=λ2−1 = 0 −→ λ1 = 1, λ2 =−1.
Los autovectores correspondientes son: λ1 = 1 :
−1 1 1 −1
x y
=
0 0
−→ x−y= 0 −→
x y
=α
1 1
λ2 =−1 : 1 1 1 1 x y = 0 0
−→ x+y= 0 −→
x y =α −1 1 .
Construimos la matrizP mediante la siguiente base ortonormal de autovectores:
(√ 2 2 1 1 , √ 2 2 −1 1 ) ,
donde el primer autovector da la direcci´on y sentido del nuevo eje X′ y el segundo
autovector (que hemos elegido en el sentido adecuado para que el eje Y′ se obtenga
girando el eje X′ 90o en sentido positivo o antihorario) marca la direcci´on y sentido
del nuevo eje Y′. El cambio de variables:
x=Px′ −→
x y = " √ 2 2 − √ 2 2 √ 2 2 √ 2 2 # x′ y′
eliminar´a el t´ermino mixto x′y′ dejando la parte cuadr´atica como λ
1x′2 +λ2y′2,
po-dr´a modificar los coeficientes de los t´erminos lineales, x′ e y′, y no alterar´a el t´ermino
independiente. Concretamente obtenemos: x′2
−y′2
−√2x′ + 3√2y′−7 = 0.
Completando cuadrados enx′ e y′ y haciendo una traslaci´on:
x′− √
2 2
!2
− 12− y′− 3 √
2 2
!2
+ 9
2−7 = 0, x′−
√ 2 2
!2
− y′− 3
√ 2 2
!2
−3 = 0,
x′′2
−y′′2 = 3
−→ x
′′2
(√3)2 −
y′′2
(√3)2 = 1,
donde hemos realizado la traslaci´on x′′ =x′−
√ 2 2 , y
′′=y′− 3
√ 2 2 .
Deducimos que las as´ıntotas de la hip´erbola son las rectasy′′=±x′′ (perpendiculares
entre s´ı al ser la hip´erbola equilatera). Podemos deshacer los cambios (giro y traslaci´on) para obtener sus ecuaciones en las coordenadasx-y. As´ı,
y′′ =x′′ −→ y′− 3 √
2 2 =x
′ −
√ 2 2
y, teniendo en cuenta que x′ =PTx (pues x=P x′ y P es ortogonal), tenemos
x′ =
√ 2
2 (x+y), y
′ =
√ 2
2 (−x+y) llegamos a √
2
2 (−x+y)− 3√2
2 = √
2
2 (x+y)− √
2
Procediendo an´alogamente,y′′ =−x′′ se convierte en y= 2 (ambas as´ıntotas son pues
paralelas a los ejes Y y X, respectivamente).
El centroCde la hip´erbola es el origen en las coordenadas (x′′, y′′). Es decir, (x′′, y′′) =
(0,0)⇔(x′ = √2 2 , y′ =
3√2
2 ). En coordenadas (x, y) obtenemos
x = √
2 2
√ 2 2 −3
√ 2 2
!
=−1, y = √
2 2
√ 2 2 + 3
√ 2 2
!
= 2 −→ C = (−1,2).
Para hacer el dibujo con cierta precisi´on puede ser ´util calcular los puntos de corte (si los hay) de la hip´erbola con los ejes coordenados (OX y OY). Al hacer x = 0 en la ecuaci´on de la c´onica se obtiene 2y−7 = 0 que tiene como soluci´on y= 7/2. Adem´as, si hacemosy= 0 obtenemos−4x−7 = 0 que tiene como soluci´onx=−7/4. Por tanto, la par´abola corta al ejeOY en el punto (0,7/2) y al eje OX en el punto (−7/4,0). Con toda la informaci´on que hemos obtenido a lo largo del problema, comenzamos dibujando los ejesX′ e Y′ sabiendo que pasan por el origen de las coordenadas X-Y y
tienen la direcci´on y sentido de los autovectores correspondientes a λ1 y λ2,
respecti-vamente.
Es decir, en este caso, con la elecci´on que hicimos de autovalores y autovectores, los ejesX′ eY′ se
obtienen rotando un ´angulo de 45o a los ejesX e
Y. A continuaci´on, dibujamos los ejes X′′ e Y′′,
paralelos respectivamente a los ejesX′ eY′, que
resultan de trasladar el origen al centro de la hip´erbola C = (−1,2). Finalmente, dibujamos la hip´erbola, que es muy f´acil de representar en las coordenadas x′′-y′′, teniendo en cuenta sus
as´ıntotas y sus cortes con los ejes X e Y, para obtener un dibujo cualitativo lo m´as parecido posible al real.
●
Y’ Y’’
X’’ Y
C ●
●
2
X’
● −1
−7/4
●
7/2
X
(4) Vamos a obtener la ecuaci´on can´onica (reducida) y la representaci´on gr´afica de la c´onica −7x2+ 12xy+ 2y2+ 2x−16y+ 12 = 0
mediante los cambios de coordenadas adecuados.
Puesto que la ecuaci´on de la c´onica tiene t´ermino enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los t´erminos cuadr´aticos),
x y
−7 6 6 2
x y
+ 2x−16y+ 12 = 0, A=
−7 6 6 2
Calculamos los autovalores,
−7−λ 6 6 2−λ