7.1.- Matrices sim´

(1)

Departamento de Matem´atica Aplicada II.

Escuela Superior de Ingenieros. Universidad de Sevilla.

Tema 7.- Matrices sim´

etricas reales y formas cuadr´

aticas.

7.1.- Matrices sim´etricas reales.

Diagonalizaci´on. El teorema espectral. 7.2.- Formas cuadr´aticas.

Definici´on y matriz simtrica asociada. Rango y signo de una forma cuadr´atica. Reducciones a suma de cuadrados.

Ley de inercia de Sylvester. Clasificación. 7.3.- Cónicas y cuádricas (II).

Reducción de una cónica girada. Reducción de una cuádrica girada. 7.4.- Ejercicios.

7.5.- Ap´endice: MATLAB.

etricas reales.

Las matrices simétricas reales constituyen uno de los tipos más importantes de matrices para las cuales puede garantizarse la diagonalizabilidad. Además, dicha diagonalización se puede obtener matrices de paso ortogonales.

10.1.1.- Diagonalizaci´on.

Teorema. Sea A una matriz real sim´etrica. Entonces: (a) Todos los autovalores deA son reales.

(b) Si v1 y v2 son autovectores (reales) de A asociados a autovalores distintos λ1 y λ2,

entoncesv1 y v2 son ortogonales.

Teorema (espectral para matrices sim´etricas) Sea Auna matriz cuadrada real n_×n. Son equivalentes:

(a) A es sim´etrica.

(2)

En ese caso, las columnas de la matriz_{q1, . . . , qn}deQson un conjunto deautovectores deA que forman una Base Ortonormal deRn _{y, adem´as, tenemos que}

A=QDQT ₌

2

6

4 q1 . . . qn 3

7 5

2

6 6 6 6 4

λ1 0 . . . 0

0 λ2 . . . 0

..

. ... . .. ... 0 0 . . . λn

3

7 7 7 7 5

2

6 6 6 4

qT

1

qT

2

. . . qT n

3

7 7 7 5

= λ1q1q1T +λ2q2q2T +· · ·+λnqnqnT.

Cada matriz qkqkT es la matriz de la proyecci´on ortogonal sobre el subespacio generado por el correspondiente vector _{qk} (es una matriz de rango 1). As´ı, obtenemos la expresi´on

A=λ1q1q1T +λ2q2qT2 +· · ·+λnqnqnT,

que se llama descomposición espectral de A. Esta expresión nos da la matriz simétrica real A como una combinación lineal de matrices de proyección de rango 1.

A la hora de obtener una diagonalizaci´on ortogonal de una matriz sim´etrica realApueden aparecer dos situaciones distintas:

Todos los autovalores deAson simples.En este caso, los autovectores correspondientes tienen que ser ortogonales dos a dos y formarán una base ortogonal de Rn_. Norma-lizando dichos autovectores (dividiendo cada uno por su norma) seguiremos teniendo autovectores ortogonales que además serán unitarios. Una matrizQque tenga a dichos autovectores ortonormales como columnas será una matriz de paso que diagonaliza A ortogonalmente.

La matriz A tiene algún autovalor múltiple.En este caso, cuando calculemos los auto-vectores asociados a uno de los autovalores λ múltiples, obtendremos una base del espacio propio asociado Nul (A₋λI). En general esta base puede no ser una base or-togonal de dicho subespacio. Oror-togonalizando primero y normalizando a continuación, tendremos una base ortonormal de autovectores asociados a dicho autovalor múltiple. Haciendo esto con cada uno de los autovalores múltiples y normalizando los autovec-tores asociados a autovalores simples tendremos una base ortonormal de Rn _formada por autovectores deA. Basta considerar una matrizQcuyas columnas sean los vectores de dicha base para obtener una diagonalización ortogonal deA.

7.2.- Formas cuadr´

aticas.

Una forma cuadrática no es otra cosa que la función definida por un polinomio real homogéneo de segundo gradoen varias variables. Es decir, una funciónRn _−→R_definida

por un polinomio real de varias variables en el que todos los sumandos no nulos son de segundo grado. Por ejemplo,

Las funciones definidas por 3x2₋₂_xy₊_yz_{y por}₋_xy₊_yz₊₂_xz _{son formas cuadr´aticas.}

Las funciones definidas por 2x2₋₃_x₊_y2_,₋_x2₊_y2_{+ 2 son funciones reales, de varias}

(3)

las funciones definidas porx2_{y, x}_cos(_y₎_, x2

y2₊₁, ...NO son formas cuadr´aticas puesto que

ni siquiera est´an definidas por polinomios.

Una forma cuadrática en dos variables (x, y) será una función de la forma f(x, y) = a11x2+ 2a12xy +a22y2 donde a11, a12 y a22 son números reales.

7.2.1.- Definición y matriz simétrica asociada. Definición.

• Se llama forma cuadr´atica en(x1, x2, . . . , xn)a todo polinomio real homog´eneo de segundo

grado en las variables(x1, x2, . . . , xn), es decir a todo polinomio de la forma

ϕ(x1, x2, . . . , xn) =a11x21+2a12x1x2+· · ·+a22x22+· · ·+annx2n= n

X

k=1

akkx2k+

X

1≤i<j≤n

2aijxij

donde los coeficientes akk (1≤k ≤n) y aij (1≤i < j ≤n) son reales.

El denotar mediante 2aij al coeficiente dexixj cuandoi < jes una cuestión de conveniencia a la hora de asociar a la forma cuadrática una matriz simétrica.

• Se llama matriz asociada a la forma cuadr´atica a la matriz sim´etrica

A=

2

6 6 6 6 4

a11 a12 · · · a1n a12 a22 · · · a2n ... ... ... ... a1n a2n · · · ann

3

7 7 7 7 5

.

Es decir, en la matriz sim´etrica realA,

los elementos diagonalesa11, . . . , annson los coeficientes de los cuadradosx21, x22, . . . , x2n, los elementos no-diagonalesaij =aji son los coeficientes de los t´erminos cruzados xixj divididos por 2.

De esta forma la matriz simétricaAy la forma cuadráticaϕ están relacionadas mediante

ϕ(x1, x2, . . . , xn) = [x1 x2 · · · xn] A 2

6 6 6 6 4

x1

x2

... xn

3

7 7 7 7 5

=xTAx

siendo xel vector columna de las variables en un orden preestablecido. Notemos que

aii =ϕ(ei) = 1 2

∂2_ϕ

∂x2

i

, aij = 1 2

∂2_ϕ

(4)

Ejemplos.-(1) La matriz sim´etrica A asociada a la forma cuadr´atica definida por ϕ(x1, x2, x3) = −x21+ 2x22+ 5x23+x1x2 −3x1x3+ 6x2x3

esA=

2

6 4

−1 1₂ ₋3₂

1

2 2 3

−3

2 3 5

3

7 5.

(2) La forma cuadr´atica asociada a la matriz sim´etrica

A=

2

6 4

0 √5 3 √

5 ₋3 0

3 0 5

3

7 5

es

ϕ(x1, x2, x3) = 0x21+ 2

√

5x1x2+ 6x1x3−3x22 + 0x2x3+ 5x23

= 2√5x1x2+ 6x1x3−3x22+ 5x23.

Observaciones.

(1) Una vez que est´a fijado el orden de las variables (x1,· · · , xn), la matriz sim´etrica

A= [aij] asociada a la forma cuadrática es única. (2) Dada una matriz cuadrada real M, la función

ϕ :x_∈Rn _−→_ϕ₍_x_{) =}_xT_Mx_∈R

es una forma cuadr´atica, aunque la matrizM no sea sim´etrica. Por ejemplo,

ϕ(x) = xT

2

6 4

1 2 ₋1 −1 ₋3 1

3 0 5

3

7 5x=

= x2

1+ (2−1)x1x2 + (−1 + 3)x1x3−3x22+ (1 + 0)x2x3 + 5x23

es una forma cuadr´atica cuya matriz sim´etrica asociada es

A = 1 2

M +MT

=

2

6 4

1 1₂ 1

1 2 −3

1 2

1 1

2 5

3

7 5.

(5)

7.2.2.- Rango y signo de una forma cuadr´atica.

Dada una forma cuadr´atica ϕ(x) =xT_Ax,₍_A _{matriz sim´etrica real de orden}_n_{), notemos} que para cualquier α_∈R _{y cualquier} _x_∈Rn _{se verifica que}

ϕ(αx) =α2ϕ(x).

Por tanto, el signo de los valores que alcanza ϕ sobre los m´ultiplos no nulos, αx, de un vector prefijado, x₆= 0, es constante. Si, por ejemplo, tenemos queϕ(x)>0, entonces, para cualquier α _∈R_{, α} ₆_{= 0 tenemos que}_ϕ₍_αx_{) =}_α2_ϕ₍_x₎_>_{0. Adem´as, en este caso, puesto que}

ϕ(x)>0,

l´ım

α→±∞ϕ(αx) = +∞

y sobre los vectores αx (la recta en Rn _{que pasa por el origen y tiene a} _x _{como vector}

direcci´on) la forma cuadr´atica puede alcanzar cualquier valor entre 0 = ϕ(0) y +_∞ (de hecho cada valor lo alcanza dos veces en dicha recta):

0< c <+_{∞ ⇒}

"

tomando α=_±

q

c ϕ(x)

#

⇒ϕ(αx) =c.

Ejemplo.- Consideremos la forma cuadr´atica ϕ(x1, x2, x3) = 2x21 − 3x22 +x23. Tenemos

ϕ(1,0,0) = 2 (=_⇒ ϕ(α,0,0) = 2α2_{) y} _ϕ₍₀_,₁_,_{0) =} ₋_{3 (=}_⇒ _ϕ₍₀_{, β,}_{0) =} ₋₃_β2_{). Por}

tan-to, una vez que conocemos algún punto en el que la forma cuadrática alcanza un valor de un determinado signo, podemos determinar puntos donde alcanza cualquier otro valor del mismo signo. Por ejemplo, si queremos determinar algún punto donde se verifique que ϕ(x1, x2, x3) = 7 bastará buscar puntos de la forma (x1, x2, x3) =α(1,0,0) para los cuales

ϕ(α,0,0) = 2α2 _{= 7}_⇐⇒_α₌_± Ê

7 2.

Definici´on (Signo de una forma cuadr´atica).

Se dice que una forma cuadr´aticaϕ :x_∈Rn _−→_ϕ₍_x_{) =}_xT_Ax_∈R_{y que la matriz sim´etrica}

A asociada es:

(1) Definida positiva si ϕ(x) =xT_{Ax >}₀_,

∀x₆= 0, x_∈Rn_.

(2) Definida negativa si ϕ(x) = xT_{Ax <} ₀_, _∀_x ₆_{= 0}_{, x} _∈ _Rn_{. De forma equivalente,} −ϕ(x) =xT₍

−A)x es definida positiva.

(3) Indefinida si existen vectores en Rn _{para los que} _ϕ _{es positiva y otros para los que es} negativa. Es decir, _∃v1 ∈Rn y∃v2 ∈Rn tales que

ϕ(v1) =vT1Av1 >0 y ϕ(v2) =v2TAv2 <0.

(4) Semidefinida positiva si ϕ(x) =xT_Ax_≥₀_, _∀_x_∈_Rn_. (5) Semidefinida negativa si ϕ(x) = xT_Ax

≤ 0, _∀x _∈ Rn_{. De forma equivalente,}

(6)

Nota.Con las definiciones dadas, los casos de formas cuadráticas semidefinidas (positiva o nega-tiva) incluyen a los casos de formas cuadráticas definidas (positiva o neganega-tiva). Para considerar situaciones disjuntas, en la definición de forma cuadrática semidefinida suele añadirse que se cumpla

ϕ(v) = 0 para algún vector v₆= 0. En caso de no existir tal vector v, siendo semidefinida (positiva o negativa) será definida (positiva o negativa). En lo que sigue consideramos la definición dada más arriba con objeto de simplificar los enunciados.

Observación.- Dada una forma cuadrática ϕ asociada a una matriz simétrica A, ϕ(x1,· · ·, xn) =a11x21+· · ·+ 2aijxixj+· · ·+annx2n=xTAx,

los coefiecientes aiide los cuadrados (los elementos diagonales deA) son valores que alcanza la forma cuadr´atica en los vectores/puntos can´onicos

e1 = (1,0, . . . ,0),· · · , ei= (0, . . . ,0,1,0, . . . ,0),· · · , en= (0,· · ·,0,1) =⇒.ϕ(ei) =aii. Por tanto, dichos valores nos dan alguna informaci´on sobre el signo de la forma cuadr´atica. Por ejemplo,

si todos los elementos diagonales son positivos a11,· · · , ann > 0, la forma cuadr´atica no podr´a ser ni definida ni semidefinida negativa;

si hay dos elementos digonales de distinto signo, la forma cuadrática es indefinida; si alguno de los elementos diagonales es nulo, la forma cuadrática no podrá ser definida negativa ni definida positiva;

· · ·

Definición. El rango de una forma cuadrática en Rn _{se define como el rango de la matriz} simétrica asociada.

Al hacer, en la forma cuadr´atica xT_Ax_{, un cambio de base} _x ₌ _{P y} ₍_P _{matriz real} no-singular), se obtiene

xT_Ax ₌_yT₍_PT_AP₎_y.

Es decir al expresar la forma cuadrática respecto a la base formada por los vectores columna deP, obtenemos que en las coordenadasy, respecto de dicha base, la forma cuadrática tiene asociada la matriz simétricaB =PT_AP_{. Puesto que}_P _y_PT _{son matrices que tienen inversa,} el rango deB is igual que el rango de A.

El estudio del signo y del rango de una forma cuadrática arbitraria lo reduciremos a los casos más simples posibles. Dichos casos se dan cuando la forma cuadrática consiste en una suma de cuadrados o, lo que es lo mismo, la matriz simétrica asociada es diagonal. En dichos casos la determinación del rango y del signo es inmediata como se recoge en el siguiente resultado.

Proposici´on.-Sea ϕ:Rn_−→_R _{la forma cuadr´atica}

ϕ(x) :=α1x21+α2x22+· · ·+αnx2n= [x1 · · · xn] 2

6 6 6 6 4

α1 0 · · · 0

0 α2 · · · 0

... ... ... ... 0 0 _{· · ·} αn

3

7 7 7 7 5

2

6 6 4

x1

... xn

3

(7)

(1) ϕ es definida positiva _⇐⇒α1 >0, α2 >0,· · · , αn>0. (2) ϕ es definida negativa _⇐⇒α1 <0, α2 <0,· · ·, αn <0. (3) ϕ es indefinida _{⇐⇒ ∃} i, j tales que αi >0 y αj <0. (4) ϕ es semidefinida positiva _⇐⇒α1 ≥0, α2 ≥0,· · · , αn≥0. (5) ϕ es semidefinida negativa _⇐⇒α1 ≤0, α2 ≤0,· · · , αn≤0. El rango de ϕ es el n´umero de coeficientes αk 6= 0.

7.2.3.- Reducciones a suma de cuadrados.

En esta subsección estudiamos cómo reducir a suma de cuadradosuna forma cuadrática arbitraria. Es decir, dada una forma cuadrática

ϕ(x1,· · · , xn) =a11x21+ 2a12x1x2+· · ·

c´omo obtener un cambio de basex=P y (cambio de variables lineal,P matriz real que tiene inersa) de forma que en las nuevas variables la forma cuadrada se exprese como una suma de cuadrados ϕ(x1,· · · , xn) = α1y12+α2y22+· · ·+αnyn2.As´ı, para cada vector y ∈Rn tenemos un ´unico vector x=P y _∈Rn _{y viceversa,} _y₌_P−1_x_∈ Rn_.

De esta forma, siendoDla matriz diagonal cuyos elementos diagonales son los coeficientes αk de los cuadrados tenemos que

xT_Ax₌_yT₍_PT_AP₎_y ₌_yT_Dy

y todos los datos/resultados/... que se obtienen sobre la forma cuadr´atica a partir de su ex-presi´on en las variables (y1,· · ·, yn) pueden traducirse a las variables (x1,· · · , xn) y viceversa

(x=P y, y=P−1_x_).

Cuando una forma cuadrática está expresada como suma de cuadrados se dice que está en forma reducida (o canónica).

Definici´on.-Se dice que dos matrices A y B (cuadradas reales del mismo orden) son con-gruentes si existe alguna matriz real P no singular tal que B =PT_AP_.

La reducción de una forma cuadrática a suma de cuadrados se puede hacer de muchas formas distintas puesto que la única restricción que hemos considerado para la matriz P es que sea no-singular. A continuación describimos dos métodos para reducir a suma de cuadrados. Un método es matricial, consiste en obtener una diagonalización ortogonal de la matriz A. El otro es polinómico, consiste en ir reducciendo el problema, paso a paso, a formas cuadráticas con una variable menos en cada paso.

Teorema (de los ejes principales). Sea A una matriz real sim´etrica, entonces existe un cambio de variables ortogonalx=Qy (es decir, con Qmatriz ortogonal) que reduce la forma cuadr´atica xT_Ax _{a suma de cuadrados}

yT_Dy ₌_λ

1y12+· · ·+λnyn2

(8)

En dicho caso las matrices A y D son semejantes (Q−1_AQ ₌ _D_{) y} _congruentes

(QT_AQ₌_D_{) siendo la matriz de paso la misma matriz} _P _{cuyas columnas son autovectores} deA que forman una base ortonormal deRn_{. Los vectores columna de} _Q _{se denominan ejes} principales de la forma cuadr´atica.

Ejemplos.

(1) Sea ϕ1 la forma cuadr´atica en R2 dada por

ϕ1(x) =xTAx=

x1 x2

1 3/2 3/2 ₋1

x1

x2

=x2₁+ 3x1x2−x22.

Si obtenemos una base una base ortonormal de R2 _{formada por autovectores de la}

matrizA llegaremos a

ϕ1(x)

√ 13 2 w 2 1 − √ 13 2 w 2 2

puesto que los autovalores de A son _±√13/2. Por tanto, esta forma cuadr´atica es indefinida (y tiene rango 2). Toda matriz que represente a ϕ1 en alguna base de R2

tendr´a rango 2 y, si la matriz es diagonal, tendr´a un elemento positivo y uno negativo (y obviamente ninguno nulo).

ϕ1(x) =

x1 x2

1 3/2 3/2 ₋1

x1 x2 =

y1 y2

1 0

0 ₋13/4

y1 y2 =

z1 z2

13/4 0 0 ₋1

z1 z2 =

u1 u2

−1 0 0 13/4

u1 u2 =

v1 v2

−1 0 0 1 v1 v2 =

w1 w2

" √

13/2 0 0 ₋√13/2

# w1 w2 =...

ϕ2(x) =xTAx=

x1 x2

4 ₋2 −2 1

x1

x2

= 4x2₁₋4x1x2+x22.

Completando cuadrados en la primera variable obtuvimos, en el Tema 3, la reducción de ésta forma cuadrática a suma de cuadrados como ϕ2(x) = y12, mediante el cambio

de variables y1 = 2x1−x2, y2 =x2.

Puesto que los autovalores deAsonλ1 = 0 yλ2 = 5, si obtenemos una base ortonormal

de autovectores llegamos, por ejemplo, a la expresi´on ϕ2(x) = 5u22.

Esta forma cuadrática es semidefinida positiva (y de rango 1). Toda matriz que repre-sente a ϕ2 en alguna base de R2 tendrá rango 1 y, si la matriz es diagonal, tendrá un

elemento positivo y otro nulo (y ninguno negativo). (3) Sea ϕ3 la forma cuadr´atica en R2 dada por

ϕ3(x) =xTAx=

x1 x2

1 ₋2 −2 0

x1

x2

=x2₁₋4x1x2.

Puesto que los autovalores deAson (1_±√17)/2, podemos obtener, mediante una base ortonormal de R2 _{formada por autovectores de} _A_,

ϕ3(x) =

1 +√17

2 w

2 1 +

1₋√17

2 w

(9)

ϕ4(x) =xTAx=

x1 x2 0 2 2 0 x1 x2

= 4x1x2.

Puesto que los autovalores de A son _±2, podemos obtener la reducci´on a suma de cuadrados ϕ4(x) = 2w21−2w22.

(5) Consideremos la forma cuadr´atica en R3

ϕ5(x) =xTAx=

x1 x2 x3

2

6 4

3 2 0 2 2 2 0 2 1

3 7 5 2 6 4 x1 x2 x3 3 7 5= 3x

2

1+ 2x22+x23+ 4x1x2+ 4x2x3.

Puesto que los autovalores de A son 5,2,₋1, podemos obtener la reducci´on ϕ5(x) = 5z12+ 2z22 −z23.

(6) Consideremos la forma cuadr´atica en R3

ϕ6(x) = xTAx=

x1 x2 x3

2

6 4

1 2 1 2 5 3 1 3 2

3 7 5 2 6 4 x1 x2 x3 3 7 5

= x21+ 5x22+ 2x23+ 4x1x2 + 2x1x3+ 6x2x3.

Puesto que los autovalores de A son 0,4_±√13(dos positivos y uno nulo), podemos obtener la reducci´on a suma de cuadrados

ϕ6(x) = (4 +

√ 13)z2

2 + (4−

√ 13)z2

3.

Esta forma cuadr´atica es pues semidefinida positiva (y de rango 2). (7) Consideremos la forma cuadr´atica en R4

ϕ7(x) =xTAx= [x1 x2 x3 x4] 2

6 6 6 4

0 3/2 0 0 3/2 0 0 0 0 0 0 5/2 0 0 5/2 0

3 7 7 7 5 2 6 6 6 4 x1 x2 x3 x4 3 7 7 7 5

= 3x1x2 + 5x3x4.

Los autovalores de A son, _±3/2,_±5/2 y por tanto mediante una base ortonormal de

R4 _{formada por autovectores de}_A _{podemos obtener}

ϕ7(x) =

3 2w 2 1 − 3 2w 2 2+ 5 2w 2 3− 5 2w 2 4.

(10)

• M´etodo de Lagrange. (completar cuadrados)

El método polinómico que hemos citado se debe, en parte, a J. L. Lagrange. La idea básica consiste en completar cuadrados a partir del cuadrado perfecto y los términos cruzados en una de las variables. Cuando esto no sea posible, habrá que conseguir un cuadrado perfecto utilizando que

suma por diferencia es igual a diferencia de cuadrados. Esencialmente la idea es la misma que utilizábamos a la ho-ra de completar cuadho-rados en la ecuación de una cónica o una cuádrica para obtener su ecuación reducida. Al completar cuadrados en una forma cuadrática habrá varias posibilidades

de elección sobre cómo hacerlo. Joseph Louis Lagrange_1736-1813 Antes de describir el método en forma genérica consideremos algunos ejemplos. Ejemplos:

(1) Consideremos la forma cuadr´atica en R2 _{dada por}

ϕ1(x) =xTAx=

x1 x2

1 3/2 3/2 ₋1

x1

x2

=x2

1+ 3x1x2−x22.

Podemos completar el cuadrado en x1 con los t´erminos en los que aparece,

x21+ 3x1x2 =

x1+

3 2x2

2

−

3 2

2

x22.

Tenemos

ϕ1(x) =

x1+

3 2x2

2

− 9₄x2₂₋x2₂ =

x1+

3 2x2

2

− 13₄ x2₂.

Es decir, mediante el cambio de variables y1 =x1 +3₂x2, y2 =x2 la forma cuadr´atica

se expresa como

ϕ1(x) =y12−

13 4 y

2 2.

Por tanto, la forma cuadr´atica es indefinida puesto que lo es en las coordenadas (y1, y2)

(pueden obtenerse fácilmente puntos dónde la forma cuadrática toma valores positivos y puntos dónde toma valores negativos). Puesto que la relación entre las variables (x1, x2) e (y1, y2) es uno-a-uno,

y1

y2

=

1 3 2

0 1

x1

x2

⇐⇒

x1

x2

=

1 3 2

0 1

−1

y1

y2

,

podremos obtener las correspondientes coordenadas (x1, x2) para las cuales la forma

cuadr´atica toma los valores citados. Por ejemplo tenemos

ϕ1(y1 = 1, y2 = 0) =ϕ1(x1 = 1, x2 = 0) = 1 y ϕ1(y1 = 0, y2 = 1) =−

(11)

Puesto que en ϕ1 tambi´en aparecen los t´erminos x22 y x1x2, podr´ıamos haber optado

por completar el cuadrado enx2:

ϕ1(x) = x21+ 3x1x2−x22 =−

x2₂₋3x1x2

+x2₁ = ₋

x2−

3 2x1

2

+9 4x

2

1+x21 =−

x2−

3 2x1

2

+13 4 x

2 1

= ₋z₂2+ 13 4 z 2 1 = 13 4 z 2 1 −z22,

donde al final hemos hecho el cambioz1 =x1, z2 =x2−3₂x1. Si ahora hacemos el cambio

de Por otra parte, podr´ıamos considerar el cambio de variables u1 =

√

13

2 z1, u2 = z2

obtenemos ϕ1(x) =u21−u22.

Por tanto, hay muchas formas distintas de expresar la forma cuadr´atica como suma de cuadrados. Sin ambargo, siempre que reducimosϕ1 a una suma de cuadrados, aunque

se obtengan coeficientes distintos, aparecen un coeficiente positivo y uno negativo. Este hecho no es casualidad y su expresión para una forma cuadrática genérica se denomina ley de inercia de Sylvester. La expresión matricial de la forma cuadrática ϕ1 en las

distintas variables que hemos considerado es

ϕ1(x) =

x1 x2

1 3/2 3/2 ₋1

x1 x2 =

y1 y2

1 0

0 ₋13/4

y1 y2 =

z1 z2

13/4 0 0 ₋1

z1 z2 =

u1 u2

1 0 0 ₋1

u1

u2

.

ϕ2(x) =xTAx=

x1 x2

4 ₋2 −2 1

x1

x2

= 4x21−4x1x2+x22.

Podemos completar el cuadrado en x2, ϕ2(x) = (x2 −2x1)2. Haciendo el cambio de

variablesy1 =x1, y2 =x2 −2x1 obtenemos

ϕ2(x) =y22.

N´otese que tomamos, por simplicidad, y1 =x1, pero podr´ıamos elegiry1 =αx1+βx2

conα, β _∈R_{, α}₊₂_β₆_{= 0 (para que tengamos realmente un cambio de variables}_x₌_{P y}_,

es decir, P sea una matriz no singular), y seguir´ıamos obteniendo ϕ2(x) =y22.

Por tanto, la forma cuadr´atica ϕ2 es semidefinida positiva por serlo en las variables

(y1, y2). Siempre que reduzcamos ϕ2 a una suma de cuadrados obtendremos un

coefi-ciente negativo y un coeficoefi-ciente nulo.

ϕ3(x) =xTAx=

x1 x2 0 2 2 0 x1 x2

= 4x1x2.

En este caso no podemos completar cuadrados ni en la primera ni en la segunda variable (pues no aparecen nix2

(12)

En esta situaci´on recurrimos a la idea de transformar el t´ermino mixto en unasuma por diferencia, que conseguimos, por ejemplo, mediante el cambiox1 =y1+y2, x2 =y1−y2:

ϕ3(x) = 4(y1+y2)(y1−y2) = 4y12−4y22.

De esta forma, ya tenemos una suma de cuadrados en la que aparecen un coeficiente positivo y uno negativo. Por tanto, la forma cuadr´atica es indefinida. La relaci´on entre las variables originales y las variables finales es

x1 x2 = 1 1 1 ₋1

y1 y2 ⇐⇒ y1 y2 = 1 1 1 ₋1

−1

x1

x2

.

ϕ4(x) =xTAx=

x1 x2 x3

2

6 4

3 2 0 2 2 2 0 2 1

3 7 5 2 6 4 x1 x2 x3 3 7 5= 3x

2

1+ 2x22+x23+ 4x1x2+ 4x2x3.

Completamos cuadrados en la variable x1 puesto que aparecen t´erminos en x21 y en

x1x2:

ϕ4(x) = 3

x2₁ +4 3x1x2

+ 2x2₂+x2₃+ 4x2x3

= 3

x1 +

2 3x2

2

− 4 3x

2

2+ 2x22+x23+ 4x2x3

= 3

x1 +

2 3x2

2

+2 3x

2

2+x23 + 4x2x3.

Completamos cuadrados enx2 tenemos

ϕ4(x) = 3

x1+

2 3x2

2

+2 3(x

2

2+ 6x2x3) +x23

= 3

x1+

2 3x2

2

+2

3(x2+ 3x3)

2

−6x2₃+x2₃ = 3

x1+

2 3x2

2

+2

3(x2+ 3x3)

2₋₅_x2 3.

Finalmente, el cambio y1 =x1+ 2₃x2, y2 =x2+ 3x3, y3 =x3 nos lleva a

ϕ4(x) = 3y12+

2 3y

2

2 −5y23.

Puesto que hemos obtenido dos coeficientes positivos y uno negativo, esta forma cuadr´atica es indefinida.

ϕ5(x) =xTAx= [x1 x2 x3] 2

6 4

1 2 1 2 5 3 1 3 2

3 7 5 2 6 4 x1 x2 x3 3 7 5=x

2

(13)

Completamos cuadrados en la variablex1 puesto que aparecen t´erminos en x21, x1x2 y

x1x3:

ϕ5(x) = (x1+ 2x2+x3)2−4x22 −x23 −4x2x3+ 5x22+ 2x23+ 6x2x3

= (x1+ 2x2+x3)2+x22+x23+ 2x2x3.

A continuaci´on completamos cuadrados en la variablex2 (puesto que aparecen t´erminos

en x2

2 y x2x3):

ϕ5(x) = (x1+ 2x2+x3)2+ (x2 +x3)2 =y12+y22,

donde hemos hecho el cambio y1=x1+ 2x2+x3, y2 =x2 +x3, y3 =x3.

Puesto que hemos obtenido dos coeficientes positivos y uno nulo, la forma cuadr´atica es semidefinida positiva.

ϕ6(x) =xTAx=

x1 x2 x3 x4

2

6 6 6 4

0 3/2 0 0 3/2 0 0 0 0 0 0 5/2 0 0 5/2 0

3

7 7 7 5

2

6 6 6 4

x1

x2

x3

x4 3

7 7 7 5

= 3x1x2+ 5x3x4.

Puesto que no hay ning´un cuadrado, necesitamos recurrir a suma por diferencia. Lo hacemos, por ejemplo, mediante el cambio:

x1 =y1+y2, x2 =y1−y2, x3 =y3, x4 =y4

con lo que ϕ6(x) = 3(y1+y2)(y1−y2) + 5y3y4 = 3y12−3y22+ 5y3y4.

Ya tenemos suma de cuadrados en las dos primeras variables. Nuevamente, como no hay ning´un t´ermino al cuadrado en las variables restantes y2

3 ey42, necesitamos recurrir

asuma por diferencia. Lo hacemos, por ejemplo, mediante el cambio: y1 =z1, y2 =z2, y3 =z3+z4, y4 =z3 −z4,

y obtenemos ϕ6(x) = 3z21−3z22+ 5(z3 +z4)(z3−z4) = 3z12−3z22 + 5z32−5z42.

N´otese que ambos cambios de variables, en este caso sencillo, se podr´ıan haber hecho simult´aneamente:

x1 =z1 +z2, x2 =z1−z2, x3 =z3+z4, x4 =z3−z4,

con lo que habr´ıamos llegado, en un solo paso, al resultado final. Puesto que en la expresi´on como suma de cuadrados hemos obtenidos dos coeficientes positivos y dos negativos (y obviamente ninguno nulo), la forma cuadr´atica es indefinida.

A modo de resumen de lo que hemos hecho en los ejemplos anteriores. Si en una forma cuadr´atica

ϕ(x1, x2, . . . , xn) =a11x21+ 2a12x1x2+· · ·+a22x22+· · ·+annx2n el coeficiente de uno de los cuadrados x2

(14)

variable correspondiente. Si por ejemploa116= 0 y hay otros sumandos 2a12x1x2+· · · donde

aparece la variablex1, podemos completar el cuadradoa11x21 mediante

a11

x2₁+2a12 a11

x1x2+

2a13

a11

x1x3 +· · ·

=a11

x1+

a12

a11

x2+· · · 2

−

a12

a11

x2+· · ·

2

de forma que si desarrollamos el cuadrado anterior obtenemos todos los sumandos de la forma cuadr´atica en los que interviene x1 (el cuadrado perfecto y los productos cruzados)

m´as otros sumandos en las restantes variables x2, x3, . . . , xn.

Es posible que a la hora de completar cuadrados no se disponga de ningún cuadrado (que no esté ya completo) y que sólo queden productos cruzados. Si por ejemplo tenemos x1x2,

este producto cruzado lo transformaremos en una suma_×diferencia, x1x2 = (y1−y2)(y1+y2) =y12−y22

y podremos completar alguno de los cuadrados de la diferencia de cuadrados resultante. Este m´etodo, consistente en ir completando cuadradados haciendo cambios de variable en los que en cada paso cambia una (o a lo sumo dos) de las variables, puede esquematizarse como sigue:

M´etodo de Lagrange.

(1) Si para alg´un ´ındice i se tiene aii 6= 0, podemos completar cuadrados con todos los t´erminos que contengan a xi para obtener

Q(x) =aii

n

X

j=1

aij aii

xj

2

+ϕ1(x1,· · · , xi−1, xi+1,· · · , xn)

donde ϕ1 es una nueva forma cuadr´atica con n−1 variables a la que se le vuelve a

aplicar el proceso. El cambio de variables que se utiliza es

8

> <

> :

yi = n

X

j=1

aij aii

xj

yj =xj para j 6=i.

(2) Si a11 = a22 = · · · = ann = 0, elegimos un coeficiente aij 6= 0 (si todos fueran cero tendr´ıamos ϕ(x)_≡0 y no habr´ıa nada que reducir). Haciendo el cambio de variables

8

> <

> :

xi =yi+yj xj =yi−yj

xk=yk para k 6=i, j,

obetenemos dos cuadrados que podemos completar pasando de nuevo al caso (1), pues 2aijxixj = 2aijyi2−2aijy2j.

7.2.4.- Ley de inercia de Sylvester. Clasificaci´on.

(15)

algunos de los Ejemplos (1) a (6) que hemos visto antes, se han completado cuadrados de dos maneras distintas para una misma forma cuadrática, obteniendo como resultado final una suma de cuadrados con coeficientes posiblemente distintos. A pesar de que puedan obtenerse coeficientes distintos, las dos expresiones finales como suma de cuadrados tienen en común los signos de los coeficientesde los cuadrados. Es decir, si tenemos una forma cuadrática, por ejemplo en tres variables, ϕ(x1, x2, x3) y al reducir (de alguna forma) a suma de cuadrados

obtenemos, por ejemplo, 2y2

1−5y22+0y32,entonces, al reducir a suma de cuadrados de cualquier

otra forma obtendremos una expresi´on del tipo αz2

1 +βz22+γz32 en la que, necesariamente,

uno de los coeficientes será positivo, otro será negativo y el otro será nulo. Este hecho de conservación de los signos en cualquiera de las reducciones a sumas de cuadrados es lo que expresa la llamada ley de inercia de Sylvester. Además dichos signos tienen que coincidir con los signos de los autovalores de la matriz simética asociada, contando cada uno según su multiplicidad.

Teorema. (Ley de inercia de Sylvester)Sea Auna matriz sim´etrica real y ϕ(x) =xT_Ax la forma cuadr´atica asociada.

a) Al reducir ϕ a suma de cuadrados se obtienen tantos coefi-cientes positivos, negativos y nulos como autovalores posi-tivos, negativos y nulos, respectivamente, tengaA, contan-do las correspondientes multiplicidades.

b) Si D1 es una matriz diagonal congruente con A (existe una

matriz no-singular P1 tal que P1TAP1 = D1), en la

diago-nal deD1 hay tantos elementos positivos, negativos y nulos

como autovalores positivos, negativos y nulos, respectiva-mente, tenga A, contando las correspondientes

multiplici-dades. James Joseph Sylvester

1814-1897

Observaciones.

(a) Se suele llamarinercia de una matriz simétrica (real) A y de la forma cuadrática aso-ciadaϕ(x) =xT_Ax _{a la terna}_{(pos, neg, nul)} _{de coeficientes positivos (pos), negativos} (neg) y nulos (nul) respectivamente que aparecen en una (cualquier) reducción deϕ a suma de cuadrados.

(b) Se verifica que

• pos + neg + nul =n = orden deA y • pos + neg = rango(A).

La primera igualdad es obvia y la segunda se basa en que cuando una matriz se multi-plica (por la derecha o por la izquierda) por una matriz que tiene inversa el rango no cambia.

(c) En relación con las formas cuadráticas (y las matrices simétricas reales) también suele usarse el concepto de signatura (que nosotros no utilizaremos)

signatura = pos₋neg.

(16)

(d) Para la determinación del signo puede no ser imprescindible hacer la reducción a suma de cuadrados. Ya hemos visto que los elementos diagonales de A son valores que al-canza la forma cuadrática y, por tanto, aportan cierta información sobre su signo. Más información puede obtenerse cuando en la expresión deϕ(x1, . . . , xn) anulamos ciertas

variables. Por ejemplo, si tomamosx3 =· · ·=xn = 0 tenemos la forma cuadr´atica en dos variables (x1, x2) dada por

ϕ1(x1, x2) =ϕ(x1, x2,0,· · · ,0).

La informaci´on que podamos obtener sobre dicha forma cuadr´atica ϕ1, o sobre varias

formas cuadráticas del mismo tipo, permite deducir alguna información sobre la forma cuadrática original.

Teorema. Sea A= [aij] una matriz real sim´etrica de orden n. Son equivalentes: (1) A es definida positiva. (1’) ₋A es definida negativa.

(2) Al reducir xT_Ax _{a suma de cuadrados, aparecen} _n _{coeficientes positivos.} (3) Los autovalores de A son todos positivos.

(4) (Criterio de Sylvester o de los menores principales) Todos los menores principales de A son positivos, es decir, det (Ak)>0, k = 1,2, . . . , nsiendo Ak la matriz de ordenk

Ak =

2

6 6 4

a11 · · · a1k ..

. . .. ... ak1 · · · akk

3

7 7 5

Puesto que una matriz real y sim´etricaAes definida negativa si, y s´olo si,₋Aes definida positiva, se obtiene el siguiente resultado.

Corolario. Sea A = [aij] una matriz real sim´etrica de orden n. Entonces las siguientes condiciones son equivalentes:

(1) A es definida negativa. (1’) ₋A es definida positiva.

(2) Al reducir xT_Ax _{a suma de cuadrados, aparecen} _n _{coeficientes negativos.} (3) Los autovalores de A son todos negativos.

(4) (Criterio de Sylvester o de los menores principales) Los menores principales deAtienen signos alternos ₋,+,₋,+, . . .

(₋1)kdet (Ak)>0, k = 1,2, . . . , n.

(17)

teniendo en cuenta que los elementos diagonales deAson valores que alcanza la forma cuadrática,akk =ϕ(ek) =eTkAek. Si dos de estos valores son de distinto signo la forma cuadrática será indefinida.

Si alguna submatriz diagonal de orden 2,

aii aij aji ajj

,tiene determinante negativo, la forma cuadr´atica es indefinida.

Si det (A)₆= 0, y no se cumplen las condiciones dadas para formas cuadr´aticas definidas positivas o definidas negativas, entonces es indefinida.

. . .

Definición. Clasificar una forma cuadrática consiste en determinar su inercia (el número de coeficientes positivos, negativos y nulos que aparecen en cualquier reducción a suma de cuadrados) as´ı como el signo correspondiente.

Se denominaforma canónica/reducida de una forma cuadrática ϕ a cualquier expre-sión de ϕ como suma de cuadrados (en variables independientes).

Para una forma cuadrática en dos variables, tenemos el siguiente teorema que permite determinar el signo (en este caso la inercia completa) en función de los coeficientes de la matriz (simétrica) asociada.

Teorema.- Sea ϕ la forma cuadr´atica siguiente y A la matriz sim´etrica asociada, Q(x, y) =ax2+ 2bxy+cy2 = [x y]

a b b c

x y

, A=

a b b c

.

(a) ϕ es definida positiva si y s´olo si a >0 ydet (A) =ac₋b2 _>₀_.

(b) ϕ es definida negativa si y s´olo si a <0 y det (A) = ac₋b2 _>₀_.

(c) ϕ es indefinida si y s´olo si det (A) =ac₋b2 _<₀_.

D.₋Separemos los casos en los que a₆= 0 y los casos en los que a= 0.

•Si a₆= 0, entonces podemos completar el cuadrado enx,

ax2+ 2bxy+cy2 = a

x2+ 2b

axy

+cy2 =a

x2+ 2b

axy+

b ay

2

−

b ay

2

+cy2

= a

x2+ 2b

axy+

b ay

2

−a

b ay

2

+cy2 =a

x+ b

ay 2

+

c₋b

2

a

y2

= a x′2+

−b

2

a +c

y′2, siendo

¨

x′₌_x₊b ay,

y′ ₌_y.

Por tanto, en este caso, la forma cuadr´atica es:

(a) Definida positiva _⇐⇒ a >0 y ₋b2

a +c >0 ⇐⇒ a >0 y ac−b2 >0.

(b) Definida negativa _⇐⇒ a <0 y ₋b2

a +c <0 ⇐⇒ a <0 y ac−b2 >0.

(c) Indefinida _⇐⇒ a

−b2

a +c

(18)

• Si a = 0 y c ₆= 0, tenemos que ϕ(x, y) = 2bxy +cy2 y podemos completar el cuadrado en

y. Estamos en un caso an´alogo al anterior. Notemos que en los casos en los que ϕ sea definida (positiva o negativa), ayctienen que tener el mismo signo.

• Si a =c = 0 tenemos ϕ(x, y) = 2bxy. Sea cual sea el signo de b ₆= 0, esta forma cuadr´atica es

indefinida puesto que alcanza valores de distinto signo, por ejemplo ϕ(1,1) = 2b y ϕ(1,₋1) =

−2b. En lo que se refiere a la reducci´on a suma de cuadrados, podemos transformar xy en una suma_×diferencia

ϕ(x, y) = 2b xy =

siendo

¨

x=x′+y′ y=x′₋_y′

= 2b

x′2₋y′2

.

Recopilando todos los casos obtenemos el enunciado.

Ejercicio.Estudia cuando es semidefinida la forma cuadr´atica ϕ(x, y) =ax2+ 2bxy+cy2.

Para una forma cuadr´atica ϕ en n variables (y para la matriz sim´etrica real A asociada) puede darse un criterio matricial en los casos en los que sea definida (positiva o negativa).

Dada una matriz sim´etrica A, se llaman submatrices principales de A a las matrices

Ak=

2

6 6 4

a11 · · · a1k ... ... ... a1k · · · akk

3

7 7

5, k = 1,2, . . . , n.

Se llaman menores principales de A a los determinantes de dichas submatrices ∆k = det(Ak), k = 1,2, . . . , n.

Teorema 4.-Criterio de los menores prinipales (o Criterio de Sylvester). (1) A es definida positiva _⇐⇒∆k = det(Ak)>0, _∀k = 1,2, . . . , n. (2) A es definida negativa _⇐⇒(₋1)k_∆k_{= det(}

−Ak)>0, _∀k = 1,2, . . . , n.

7.3.- C´

onicas y cu´

adricas (II).

En el Tema 1 se estudiaron las (secciones) cónicas y las cuádricas desde el punto de vista métrico as´ı como los elementos representativos de cada una de ellas. Por otra parte, vimos la determinación de la posición, del tipo de cónica/cuádrica y cómo obtener los elementos caracter´ısticos cuando ésta viene dada por una ecuación en la que no aparecen productos cruzados. Ahora estudiaremos:

(a1) Que toda ecuaci´on polin´omica de segundo grado en dos variables a11x2+ 2a12xy+a22y2+ 2a1x+ 2a2y+a0 = 0

(alguno de los coeficientesa11, a12, a22 es distinto de cero) representa una c´onica. Entre

éstas estarán los casos degenerados. Dicha ecuación podrá representar: •una elipse, una parábola, una hipérbola,

(19)

(a2) Que toda ecuaci´on polin´omica de segundo grado en tres variables

a11x2+a22y2+a33z2+ 2a12xy + 2a13xz+ 2a23yz+ 2a1x+ 2a2y+ 2a3z+a0 = 0,

(alguno de los coeficientes a11, a22, a33, a12, a13, a23 es distinto de cero) representa una

cuádrica. Entre éstas consideramos los casos degenerados. Dicha ecuación podrá rep-resentar:

•un elipsoide, un paraboloide (el´ıptico o hiperbólico), •un hiperboloide (de una o de dos hojas), un cono, •un cilindro (el´ıptico, parabólico o hiperbólico) •un par de planos secantes/paralelos/coincidentes, •una recta, un punto, nada.

(b) Cómo determinar el tipo de cónica/cuádrica y sus elementos representativos cuando en la ecuación aparecen términos en productos cruzados. La presencia de éstos términos indica que la cónica/cuádrica está girada respecto a los ejes coordenados. La deter-minación del correspondiente ángulo de giro se hará a partir del cálculo de autova-lores y autovectores de la matriz asociada a la parte cuadrática de la ecuación de la cónica/cuádrica. Es decir, se tratará de obtener la posición, los elementos caracter´ısticos y la representación gráfica en el sistema de ejes dado.

En cada una de las subsecciones siguientes consideraremos el problema de determinar el tipo de cónica/cuádrica y obtener la posición, los elementos caracter´ısticos y la representación gráfica en el sistema de ejes dado. El planteamiento para hacer la reducción de una cuádrica será el mismo para una cónica. Tiene dos partes diferenciadas:

En primer lugar, mediante un cambio de variables ortogonal, hay que conseguir que en la parte cuadr´atica de la ecuaci´on:

c´onica : a11x2+ 2a12xy+a22y2,

cu´adrica : a11x2+ 2a12xy+ 2a13xz+a22y2+ 2a23yz+a33z2,

no aparezcan términos cruzados. Para ello, tendremos que diagonalizar ortogonalmente la matriz (real simétrica) de la parte cuadrática de la ecuación. Es decir, siendo A = [aij] la matriz simétrica de la parte cuadrática de la ecuación, habrá que calcular sus autovalores y una base ortonormal de Rn _{formada por autovectores de} _A_{. Dicha}

base formada por autovectores nos permitirá hacer un cambio de variables ortogonal x= Px′ _{de forma que en las variables} _x′ _{la ecuación de la cónica/cuádrica no tenga}

términos cruzados. Esta es la situación que se estudió en el Tema 2.

Una vez que hemos conseguido una ecuación de segundo grado, sin términos cruzados, mediante un cambio de variables dado por una matriz ortogonal (que esencialmente representará un giro en el plano o en el espacio), bastará hacer una traslaciónx′′₌_x′₋_c

para obtener la ecuación reducida de la cónica/cuádrica y la gráfica en el sistema de ejesx′′_.

Finalmente, para obtener los elementos caracter´ısticos y la representaci´on gr´afica en el sis-tema de ejes original, necesitaremos deshacer los cambios de variables:

(20)

7.3.1.- Reducci´on de una c´onica girada.

Definición. Una cónica es el lugar geométrico de los puntos (x, y) _∈ R2 _{del plano que}

satisfacen una ecuaci´on general de segundo grado:

f(x, y) = a11x2+ 2a12xy+a22y2+ 2a1x+ 2a2y+a0 = 0, (1)

donde alguno de los coeficientes a11, a12 oa22 es distinto de cero.

La ecuación anterior, llamada ecuación de la cónica, se puede escribir en notación vectorial de la forma:

f(x, y) = [x y]A

x y

+ 2 [a1 a2]

x y

+a0 = 0 siendoA=

a11 a12

a12 a22

.

N´otese que tambi´en puede escribirse,

f(x, y) = [x y 1]

2

6 4

a11 a12 a1

a12 a22 a2

a1 a2 a0 3

7 5

2

6 4

x y 1

3

7 5= 0.

El proceso general parallevar una cónica a su ecuación reducida(sabiendo cuáles son los cambios de variables involucrados) puede separarse en dos etapas (si el coeficiente a12 6= 0,

si el coeficiente a12= 0 bastar´ıa con la segunda etapa):

(a) Determinación de las direcciones de los ejes de la cónica.Esto consiste endiagonalizar ortogonalmente la matriz (simétricaA) asociada a la parte cuadrática de la ecuación

A=

a11 a12

a12 a22

.

Sean λ1 y λ2 los autovalores deA y v1 y v2 autovectores ortogonales correspondientes

(si λ1 6= λ2 dichos autovectores ser´an ortogonales necesariamente, y si λ1 = λ2

nece-sariamente A es una matriz diagonal, y no necesitamos hacer nada de esto). Conviene tomar los autovectoresv1 yv2 de manera que el ´angulo dev1 av2 sea de 900 en sentido

positivo (contrario a las agujas del reloj). Sin m´as que dividir los vectores v1 y v2 por

su norma, obtenemos una base ortonormal_{u1, u2}deR2 formada por autovectores de

A y, por tanto,

P =

2

6

4 u1 u2 3

7 5⇒P

−1 ₌_PT_, _PT_AP ₌_D₌

λ1 0

0 λ2

.

Al sustituir en la ecuaci´on (en (x, y)) de la c´onica el cambio de variables tenemos

x y

=P

x′

y′

=_⇒[x′ _y′_]_PT_AP

x′

y′

+ 2 [a1 a2]P

x′

y′

+a0 = 0.

Es decir, la ecuaci´on de la c´onica en las coordenadas (x′_{, y}′_{) es}

(21)

ecuaci´on en la que no aparece el producto cruzado x′_y′_{. Notemos que}

x y

=P

x′

y′

=

2

6

4 u1 u2 3

7 5

x′

y′

=_⇒

x′

y′

=PT

x y

=

uT

1

uT

2

x y

.

Por tanto, los nuevos ejes son

X′ _→_ecuaci´on _y′ _{= 0}_→_uT

2

x y

= 0,

Y′ _→_ecuaci´on _x′ _{= 0}_→_uT

1

x y

= 0.

Es decir, los ejes x′ _e _y′ _{son las rectas que pasan por el origen de coordenadas y}

tienen como vectores direcci´on respectivos los autovectores u1 y u2 de A. De hecho el

sistema de ejes OX′_Y′ _{se obtiene del sistema} _OXY _{girando (con centro el origen de}

coordenadas) el ´angulo que determinau1 con el semieje OX+.

(b) Una vez que tenemos la ecuaci´on

λ1x′2 +λ2y′2+ 2b1x′+ 2b2y′+a0 = 0,

en la que no aparece el producto cruzado x′_y′_{, bastar´a completar los cuadrados que}

aparezcan (mediante cambios del tipo x′′ ₌ _x′ ₋_α _e _y′′ ₌ _y′ ₋_β_{) para obtener una}

ecuaci´on de uno de los siguientes tipos:

Caso el´ıptico. λ1λ2 >0 (es decir λ1 y λ2 son no-nulos y del mismo signo),

a2_x′′2 ₊_b2_y′′2 ₌_c

en cuyo caso tenemos una elipse (c >0), un punto (c= 0) o nada (c <0). Caso hiperb´olico. λ1λ2 <0 (es decir λ1 y λ2 son no-nulos y de distinto signo),

a2x′′2

−b2y′′2 ₌_c

en cuyo caso tenemos una hip´erbola (c ₆= 0) o un par de rectas que se cortan (c= 0).

Caso parab´olico. λ1λ2 = 0 (es decir uno de los autovalores es nulo, y el otro no).

Suponiendo que λ1 6= 0, λ2 = 0 puede obtenerse

a2x′′2₊_by′′ _{= 0 ´o} _a2_x′′2₊_c_{= 0}

Tendremos una par´abola (b ₆= 0), o bien un par de rectas paralelas (c < 0) o coincidentes (c= 0) o nada (c >0).

Para obtener los elementos caracter´ısticos de la cónica y su representación gráfica basta obtenerlos en las coordenadas (x′′_{, y}′′_{) y deshacer los cambios de variables que se hayan hecho}

(Traslaci´on)

¨

x′′ ₌_x′₋_α

y′′₌_y′₋_β ⇒

¨

x′ ₌_x′′₊_α

y′ ₌_y′′₊_β

(Giro)

x y

=P

x′

y′

⇒

x′

y′

=PT

x y

(22)

Ejemplos.

(1) Vamos a obtener la ecuación canónica (reducida) y la representación gráfica de la cónica 3x2+ 3y2₋2xy + 2x₋4y+ 1 = 0.

mediante los cambios de coordenadas adecuados.

Escribimos en forma matricial la parte cuadrática de la ecuación de la cónica:

[x y]

3 ₋1 −1 3

x y

+ 2x₋4y+ 1 = 0.

Puesto que la ecuación de la cónica tiene término enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los términos cuadráticos).

Calculamos los autovalores de A,

3₋λ ₋1 −1 3₋λ

=λ2₋6λ+ 8 = 0 _−→ λ1 = 4, λ2 = 2.

Los autovectores correspondientes son:

λ1 = 4 :

−1 ₋1 −1 ₋1

x y = 0 0

−→ x+y= 0 _−→

x y =α 1 −1 ,

λ2 = 2 :

1 ₋1 −1 1

x y = 0 0

−→ x₋y= 0 _−→

x y =α 1 1 .

Construimos la matriz de paso ortogonal P (que diagonaliza A) mediante una base ortonormal de autovectores:

(√ 2 2 1 −1 , √ 2 2 1 1 ) .

El primer autovector da la direcci´on y sentido positivo del nuevo eje X′ _(que

cor-responde a girar un ´angulo θ = ₋45o _{el eje} _X_{, pues del autovector sacamos que}

tgθ = y/x = ₋1/1 = ₋1) y el segundo autovector (que hemos elegido en el sentido adecuado para que el eje Y′ _{se obtenga girando el} _X′ _{un ´angulo de 90}o _{en sentido}

positivo) marca la direcci´on y sentido del nuevo ejeY′_{. El cambio:}

x=Px′ _−→

x y = " √ 2 2 √ 2 2

−√22

√ 2 2 # x′ y′

eliminará el término mixtox′_y′ _{dejando la parte cuadrática como}_λ

1x′2+λ2y′2,

modi-ficará los coeficientes de los términos lineales,x′ _e_y′_{, y no alterará el término}

(23)

Completando cuadrados hacemos una traslaci´on:

4 x′2 ₊3

√ 2 4 x

′

!

+ 2 y′2

− √ 2 2 y ′ !

+ 1 = 0,

4 x′ ₊3

√ 2 8

!2

− 9

8 + 2 y

′₋ √ 2 4 !2 − 1

4 + 1 = 0, 4 x′₊3

√ 2 8

!2

+ 2 y′₋

√ 2 4

!2

= 3

8 −→ 4x

′′2_{+ 2}_y′′2 ₌ 3

8, donde hemos realizado la traslaci´on

x′′ ₌_x′ ₊3

√ 2 8 , y

′′ ₌_y′₋

√ 2 4 . Operando, llegamos a la ecuaci´on can´onica

x′′2 3 32

+y′′

2 3 16

= 1_−→ x′′

2 1 4 È 3 2

2 +

y′′2 √

3 4

2 = 1.

Es decir, al haber tomado λ1 = 4 y λ2 = 2, el semieje mayor de la elipse est´a sobre el

ejeY′′ _{y el menor sobre el} _X′′_{, ya que} 1 4 È 3 2 < √ 3 4 .

El centro C de la elipse es el origen en las coordenadas (x′′_{, y}′′_{). Es decir, (}_x′′_{, y}′′_{) =}

(0,0)_⇔(x′ ₌₋3√2 8 , y′ =

√

2

4 ). En coordenadas (x, y) obtenemos

x= √

2

2 −

3√2 8 +

√ 2 4

!

=₋1

8, y = √

2 2

3√2 8 + √ 2 4 ! = 5

8 −→ C=

−1₈,5 8

.

Para hacer el dibujo esquemático con una cierta precisión, puede sernos útil el encontrar los puntos de corte (si los hay) de la elipse con los ejes coordenados (OX y OY). Al hacer x = 0 en la ecuación de la cónica se obtiene 3y2 ₋₄_y_{+ 1 = 0 que se verifica}

paray = 1,1/3. Mientras que si hacemosy = 0, la ecuaci´on 3x2_{+ 2}_x_{+ 1 = 0 no tiene}

soluci´on (real). Por tanto, la elipse corta al ejeOY en los puntos (0,1) y (0,1/3) y no corta al eje OX.

Con toda la informaci´on que hemos obtenido a lo largo del problema, comenzamos dibujando los ejes X′ _e _Y′ _{sabiendo que pasan por (}_x _{= 0}_{, y} _{= 0) y}

tienen la direcci´on y sentido del autovector corres-pondiente aλ1 y λ2, respectivamente. Es decir, en

este caso, con la elecci´on que hicimos de autova-lores y autovectores, los ejes X′ _e _Y′ _{se obtienen}

rotando un ´angulo de ₋45o _{a los ejes} _X _e _Y_{. A}

continuaci´on, dibujamos los ejes X′′ _e _Y′′_,

parale-los respectivamente a parale-los ejesX′ _e_Y′_{, que resultan}

de trasladar el origen al puntoC =

(24)

N´otese que si hubi´eramos elegido los autovalores en el otro orden posible, es decir, λ1 = 2 y λ2 = 4 y

tomamos como autovectores respectivos (1,1)T _y (₋1,1)T _{(el primero indica la direcci´on y sentido} del ejeX′ _{y el segundo el del} _Y′_{), llegar´ıamos, tras}

realizar el giro (en este caso de 45o_{) mediante el}

cambio de coordenadas dado por la nueva matriz P y la traslación adecuada, a la ecuación canónica:

x′′2 √

3 4

2 +

y′′2 1 4 È 3 2

2 = 1,

que nos llevar´ıa a la figura adjunta.

X ● ● Y 1 1/3 C ● Y’’ Y’ X’ X’’

(2) Vamos a obtener la ecuación canónica (reducida) y la representación gráfica de la cónica x2₋2xy+y2₋2x+ 1 = 0

Puesto que la ecuación de la cónica tiene término enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los términos cuadráticos).

x y

1 ₋1 −1 1

x y

−2x+ 1 = 0, A=

1 ₋1 −1 1

Calculamos pues sus autovalores y despu´es sus autovectores. En primer lugar:

1₋λ ₋1 −1 1₋λ

=λ2₋2λ = 0 _−→ λ1 = 0, λ2 = 2.

Podemos pues calcular los autovectores: λ1 = 0 :

1 ₋1 −1 1

x y = 0 0

−→ x₋y= 0 _−→

x y =α 1 1 ,

λ2 = 2 :

−1 ₋1 −1 ₋1

x y = 0 0

−→ x+y= 0 _−→

x y =α −1 1 .

Construimos la matrizP mediante la siguiente base ortonormal de autovectores:

(√ 2 2 1 1 , √ 2 2 −1 1 ) ,

donde el primer autovector da la direcci´on y sentido del nuevo ejeX′ _{(que corresponde}

a girar un ´angulo θ= 45o _{el eje} _X_{, pues del autovector sacamos que tg}_θ ₌_y/x_{= 1) y}

el segundo autovector (que hemos elegido en el sentido adecuado para que el eje Y′ _se

obtenga girando el eje X′ ₉₀o _{en sentido positivo o antihorario) marca la direcci´on y}

sentido del nuevo ejeY′_{. El cambio:}

x=Px′ _−→

(25)

eliminará el término mixtox′_y′ _{dejando la parte cuadrática como}_λ

1x′2+λ2y′2,

modi-ficará los coeficientes de los términos lineales,x′ _e_y′_{, y no alterará el término}

indepen-diente. Concretamente obtenemos:

2y′2₋√2x′+√2y′+ 1 = 0.

Completando cuadrados eny′ _{y haciendo una traslaci´on tenemos}

2 y′2₊

√ 2 2 y

′

!

−√2x′_{+ 1 = 0}_, _−→ ₂ _y′₊

√ 2 4

!2

− 1₄ −√2x′_{+ 1 = 0}_,

2 y′₊

√ 2 4

!2

−√2x′ ₊3

4 = 0, 2 y′₊

√ 2 4

!2

−√2 x′₋ 3

√ 2 8

!

= 0, _−→ 2y′′2

−√2x′′ _{= 0}_,

donde hemos realizado la traslaci´on x′′ ₌_x′ ₋3

√ 2 8 , y

′′ ₌_y′₊

√ 2 4 .

Por tanto, la ecuación canónica a la que hemos llegado, tras la rotación y la traslación llevadas a cabo, es _x′′ ₌√₂_y′′2_.

El v´erticeV de la par´abola es el origen en las coordenadas (x′′_{, y}′′_{). Es decir, (}_x′′_{, y}′′_{) =}

(0,0)_⇔(x′ ₌ 3√2

8 , y′ =−

√

2

x= √

2 2

3√2 8 +

√ 2 4

!

= 5

8, y= √

2 2

3√2 8 −

√ 2 4

!

= 1

8, −→ V =

5 8,

1 8

.

Para hacer el dibujo esquemático con una cierta precisión, puede sernos útil el encontrar los puntos de corte (si los hay) de la parábola con los ejes coordenados (OX y OY). Al hacerx= 0 en la ecuación de la cónica se obtiene y2_{+ 1 = 0 que no tiene solución}

(real). Mientras que si hacemos y = 0 obtenemos x2 ₋ ₂_x_{+ 1 = 0 que tiene como}

solución (doble) x = 1. Por tanto, la parábola no corta al eje OY y toca sin cortar (pues es tangente, como se deduce de la ra´ız doble) al eje OX en el punto (1,0). Con toda la información que hemos obtenido a lo largo del problema, comenzamos dibujando los ejesX′ _e _Y′ _{sabiendo que pasan por el origen de las coordenadas} _X_-_Y _y

que tienen la direcci´on y sentido del autovector correspondiente a λ1 y λ2,

respectiva-mente.

Es decir, en este caso, con la elecci´on que hicimos de autovalores y autovectores, los ejesX′ _e_Y′ _se

obtienen rotando un ´angulo de 45o _{a los ejes}_X _e

Y. A continuaci´on, dibujamos los ejes X′′ _e _Y′′_,

paralelos respectivamente a los ejesX′ _e_Y′_{, que}

resultan de trasladar el origen al v´ertice de la par´abola V =

−1 8,

5 8

. Finalmente, dibujamos la par´abola, que es muy f´acil de representar en las coordenadas (x′′_{, y}′′_{). Teniendo en cuenta las}

intersecciones con los ejesXeY obtenemos pues la figura adjunta.

●

V

●

1

X’’

Y’’

Y’

X X’

(26)

N´otese que si elegimos los autovalores en el mismo orden, λ1 = 0 y λ2 = 2, pero

tomamos los autovectores opuestos ((₋1,₋1)T _{fija el eje} _X′ _{y (1}_,₋₁₎T _{marca el} _Y′_),

llegamos, procediendo an´alogamente, ax′′ ₌₋√₂_y′′2_{. En este situaci´on, estar´ıamos en}

el caso (a) de la figura siguiente.

Sin embargo, si tomamos λ1 = 2 y λ2 = 0, y como autovectores correspondientes a

(1,₋1)T _{(que determina el eje}_X′_{) y (1}_,₁₎T _{(que marca el eje}_Y′_{), llegamos, procediendo}

an´alogamente, a y′′ ₌ √₂_x′′2_{. De esta forma, estar´ıamos en el caso (b) de la figura}

siguiente.

Finalmente, la cuarta y ´ultima posibilidad ser´a tomarλ1 = 2 yλ2 = 0, pero trabajando

con los autovectores a (₋1,1)T _{(fija el eje}_X′_{) y (}₋₁_,₋₁₎T _{(marca el}_Y′_{). Entonces, se}

llega, procediendo an´alogamente, a y′′ ₌₋√₂_x′′2_. _{Estar´ıamos entonces en el caso (c)}

de la figura siguiente.

● V

●

1 X

Y

X’

Y’

X’’ Y’’

● V

●

1 X

Y _Y’

X’

Y’’

X’’

● V

●

1 X

Y

X’

Y’ X’’

Y’’ _(a)

Moraleja: la curva en el plano (X, Y) es obviamente la misma, aunque al comienzo del problema tenemos cuatro posibilidades distintas para elegir el ejeX′ _(seg´_{un qu´e}

auto-valor elijamos como primero y qu´e autovector de norma unidad elijamos para dicho autovalor). Tras esta elecci´on los ejesY′ _{(que queremos obtenerlo girando 90}o_{en sentido}

antihorario el ejeX′ _), _X′′ _e _Y′′ _{ya quedan determinados.}

(3) Vamos a obtener la ecuación canónica (reducida) y la representación gráfica de la cónica 2xy₋4x+ 2y₋7 = 0

Puesto que la ecuación de la cónica tiene término enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los términos cuadráticos),

x y

0 1 1 0

x y

−4x+ 2y₋7 = 0, A=

0 1 1 0

.

Calculamos los autovalores,

−λ 1 1 ₋λ

=λ2₋1 = 0 _−→ λ1 = 1, λ2 =−1.

Los autovectores correspondientes son: λ1 = 1 :

−1 1 1 ₋1

x y

=

0 0

−→ x₋y= 0 _−→

x y

=α

1 1

(27)

λ2 =−1 : 1 1 1 1 x y = 0 0

−→ x+y= 0 _−→

x y =α −1 1 .

Construimos la matrizP mediante la siguiente base ortonormal de autovectores:

(√ 2 2 1 1 , √ 2 2 −1 1 ) ,

donde el primer autovector da la direcci´on y sentido del nuevo eje X′ _{y el segundo}

autovector (que hemos elegido en el sentido adecuado para que el eje Y′ _{se obtenga}

girando el eje X′ ₉₀o _{en sentido positivo o antihorario) marca la direcci´on y sentido}

del nuevo eje Y′_{. El cambio de variables:}

x=Px′ _−→

x y = " √ 2 2 − √ 2 2 √ 2 2 √ 2 2 # x′ y′

eliminará el término mixto x′_y′ _{dejando la parte cuadrática como} _λ

1x′2 +λ2y′2,

po-drá modificar los coeficientes de los términos lineales, x′ _e _y′_{, y no alterará el término}

independiente. Concretamente obtenemos: x′2

−y′2

−√2x′ _{+ 3}√₂_y′₋_{7 = 0}_.

Completando cuadrados enx′ _e _y′ _{y haciendo una traslaci´on:}

x′₋ √

2 2

!2

− 1₂− y′₋ 3 √

2 2

!2

+ 9

2−7 = 0, x′₋

√ 2 2

!2

− y′₋ 3

√ 2 2

!2

−3 = 0,

x′′2

−y′′2 _{= 3}

−→ x

′′2

(√3)2 −

y′′2

(√3)2 = 1,

donde hemos realizado la traslaci´on x′′ ₌_x′₋

√ 2 2 , y

′′₌_y′₋ 3

√ 2 2 .

Deducimos que las as´ıntotas de la hip´erbola son las rectasy′′₌_±_x′′ _{(perpendiculares}

entre s´ı al ser la hip´erbola equilatera). Podemos deshacer los cambios (giro y traslaci´on) para obtener sus ecuaciones en las coordenadasx-y. As´ı,

y′′ =x′′ _−→ y′₋ 3 √

2 2 =x

′ ₋

√ 2 2

y, teniendo en cuenta que x′ ₌_PT_x _(pues _x₌_{P x}′ _y _P _{es ortogonal), tenemos}

x′ ₌

√ 2

2 (x+y), y

′ ₌

√ 2

2 (−x+y) llegamos a _√

2

2 (−x+y)− 3√2

2 = √

2

2 (x+y)− √

2

(28)

Procediendo an´alogamente,y′′ ₌₋_x′′ _{se convierte en} _y_{= 2 (ambas as´ıntotas son pues}

paralelas a los ejes Y y X, respectivamente).

El centroCde la hip´erbola es el origen en las coordenadas (x′′_{, y}′′_{). Es decir, (}_x′′_{, y}′′_{) =}

(0,0)_⇔(x′ ₌ √2 2 , y′ =

3√2

x = √

2 2

√ 2 2 −3

√ 2 2

!

=₋1, y = √

2 2

√ 2 2 + 3

√ 2 2

!

= 2 _−→ C = (₋1,2).

Para hacer el dibujo con cierta precisión puede ser útil calcular los puntos de corte (si los hay) de la hipérbola con los ejes coordenados (OX y OY). Al hacer x = 0 en la ecuación de la cónica se obtiene 2y₋7 = 0 que tiene como solución y= 7/2. Además, si hacemosy= 0 obtenemos₋4x₋7 = 0 que tiene como soluciónx=₋7/4. Por tanto, la parábola corta al ejeOY en el punto (0,7/2) y al eje OX en el punto (₋7/4,0). Con toda la información que hemos obtenido a lo largo del problema, comenzamos dibujando los ejesX′ _e _Y′ _{sabiendo que pasan por el origen de las coordenadas} _X_-_Y _y

tienen la direcci´on y sentido de los autovectores correspondientes a λ1 y λ2,

respecti-vamente.

Es decir, en este caso, con la elecci´on que hicimos de autovalores y autovectores, los ejesX′ _e_Y′ _se

obtienen rotando un ´angulo de 45o _{a los ejes}_X _e

Y. A continuaci´on, dibujamos los ejes X′′ _e _Y′′_,

paralelos respectivamente a los ejesX′ _e_Y′_{, que}

resultan de trasladar el origen al centro de la hipérbola C = (₋1,2). Finalmente, dibujamos la hipérbola, que es muy fácil de representar en las coordenadas x′′_-_y′′_{, teniendo en cuenta sus}

as´ıntotas y sus cortes con los ejes X e Y, para obtener un dibujo cualitativo lo m´as parecido posible al real.

●

Y’ Y’’

X’’ Y

C ●

●

2

X’

● −1

−7/4

●

7/2

X

(4) Vamos a obtener la ecuación canónica (reducida) y la representación gráfica de la cónica −7x2+ 12xy+ 2y2+ 2x₋16y+ 12 = 0

Puesto que la ecuación de la cónica tiene término enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los términos cuadráticos),

x y

−7 6 6 2

x y

+ 2x₋16y+ 12 = 0, A=

−7 6 6 2

Calculamos los autovalores,

−7₋λ 6 6 2₋λ