• No se han encontrado resultados

7.1.- Matrices sim´ - Tema 7

N/A
N/A
Protected

Academic year: 2018

Share "7.1.- Matrices sim´ - Tema 7"

Copied!
41
0
0

Texto completo

(1)

Departamento de Matem´atica Aplicada II.

Escuela Superior de Ingenieros. Universidad de Sevilla.

Tema 7.- Matrices sim´

etricas reales y formas cuadr´

aticas.

7.1.- Matrices sim´etricas reales.

Diagonalizaci´on. El teorema espectral. 7.2.- Formas cuadr´aticas.

Definici´on y matriz simtrica asociada. Rango y signo de una forma cuadr´atica. Reducciones a suma de cuadrados.

Ley de inercia de Sylvester. Clasificaci´on. 7.3.- C´onicas y cu´adricas (II).

Reducci´on de una c´onica girada. Reducci´on de una cu´adrica girada. 7.4.- Ejercicios.

7.5.- Ap´endice: MATLAB.

7.1.- Matrices sim´

etricas reales.

Las matrices sim´etricas reales constituyen uno de los tipos m´as importantes de matrices para las cuales puede garantizarse la diagonalizabilidad. Adem´as, dicha diagonalizaci´on se puede obtener matrices de paso ortogonales.

10.1.1.- Diagonalizaci´on.

Teorema. Sea A una matriz real sim´etrica. Entonces: (a) Todos los autovalores deA son reales.

(b) Si v1 y v2 son autovectores (reales) de A asociados a autovalores distintos λ1 y λ2,

entoncesv1 y v2 son ortogonales.

Teorema (espectral para matrices sim´etricas) Sea Auna matriz cuadrada real n×n. Son equivalentes:

(a) A es sim´etrica.

(2)

En ese caso, las columnas de la matriz{q1, . . . , qn}deQson un conjunto deautovectores deA que forman una Base Ortonormal deRn y, adem´as, tenemos que

A=QDQT =

2

6

4 q1 . . . qn 3

7 5

2

6 6 6 6 4

λ1 0 . . . 0

0 λ2 . . . 0

..

. ... . .. ... 0 0 . . . λn

3

7 7 7 7 5

2

6 6 6 4

qT

1

qT

2

. . . qT n

3

7 7 7 5

= λ1q1q1T +λ2q2q2T +· · ·+λnqnqnT.

Cada matriz qkqkT es la matriz de la proyecci´on ortogonal sobre el subespacio generado por el correspondiente vector {qk} (es una matriz de rango 1). As´ı, obtenemos la expresi´on

A=λ1q1q1T +λ2q2qT2 +· · ·+λnqnqnT,

que se llama descomposici´on espectral de A. Esta expresi´on nos da la matriz sim´etrica real A como una combinaci´on lineal de matrices de proyecci´on de rango 1.

A la hora de obtener una diagonalizaci´on ortogonal de una matriz sim´etrica realApueden aparecer dos situaciones distintas:

Todos los autovalores deAson simples.En este caso, los autovectores correspondientes tienen que ser ortogonales dos a dos y formar´an una base ortogonal de Rn. Norma-lizando dichos autovectores (dividiendo cada uno por su norma) seguiremos teniendo autovectores ortogonales que adem´as ser´an unitarios. Una matrizQque tenga a dichos autovectores ortonormales como columnas ser´a una matriz de paso que diagonaliza A ortogonalmente.

La matriz A tiene alg´un autovalor m´ultiple.En este caso, cuando calculemos los auto-vectores asociados a uno de los autovalores λ m´ultiples, obtendremos una base del espacio propio asociado Nul (AλI). En general esta base puede no ser una base or-togonal de dicho subespacio. Oror-togonalizando primero y normalizando a continuaci´on, tendremos una base ortonormal de autovectores asociados a dicho autovalor m´ultiple. Haciendo esto con cada uno de los autovalores m´ultiples y normalizando los autovec-tores asociados a autovalores simples tendremos una base ortonormal de Rn formada por autovectores deA. Basta considerar una matrizQcuyas columnas sean los vectores de dicha base para obtener una diagonalizaci´on ortogonal deA.

7.2.- Formas cuadr´

aticas.

Una forma cuadr´atica no es otra cosa que la funci´on definida por un polinomio real homog´eneo de segundo gradoen varias variables. Es decir, una funci´onRn −→Rdefinida

por un polinomio real de varias variables en el que todos los sumandos no nulos son de segundo grado. Por ejemplo,

Las funciones definidas por 3x22xy+yzy porxy+yz+2xz son formas cuadr´aticas.

Las funciones definidas por 2x23x+y2,x2+y2+ 2 son funciones reales, de varias

(3)

las funciones definidas porx2y, xcos(y), x2

y2+1, ...NO son formas cuadr´aticas puesto que

ni siquiera est´an definidas por polinomios.

Una forma cuadr´atica en dos variables (x, y) ser´a una funci´on de la forma f(x, y) = a11x2+ 2a12xy +a22y2 donde a11, a12 y a22 son n´umeros reales.

7.2.1.- Definici´on y matriz sim´etrica asociada. Definici´on.

• Se llama forma cuadr´atica en(x1, x2, . . . , xn)a todo polinomio real homog´eneo de segundo

grado en las variables(x1, x2, . . . , xn), es decir a todo polinomio de la forma

ϕ(x1, x2, . . . , xn) =a11x21+2a12x1x2+· · ·+a22x22+· · ·+annx2n= n

X

k=1

akkx2k+

X

1≤i<j≤n

2aijxij

donde los coeficientes akk (1≤k ≤n) y aij (1≤i < j ≤n) son reales.

El denotar mediante 2aij al coeficiente dexixj cuandoi < jes una cuesti´on de conveniencia a la hora de asociar a la forma cuadr´atica una matriz sim´etrica.

• Se llama matriz asociada a la forma cuadr´atica a la matriz sim´etrica

A=

2

6 6 6 6 4

a11 a12 · · · a1n a12 a22 · · · a2n ... ... ... ... a1n a2n · · · ann

3

7 7 7 7 5

.

Es decir, en la matriz sim´etrica realA,

los elementos diagonalesa11, . . . , annson los coeficientes de los cuadradosx21, x22, . . . , x2n, los elementos no-diagonalesaij =aji son los coeficientes de los t´erminos cruzados xixj divididos por 2.

De esta forma la matriz sim´etricaAy la forma cuadr´aticaϕ est´an relacionadas mediante

ϕ(x1, x2, . . . , xn) = [x1 x2 · · · xn] A 2

6 6 6 6 4

x1

x2

... xn

3

7 7 7 7 5

=xTAx

siendo xel vector columna de las variables en un orden preestablecido. Notemos que

aii =ϕ(ei) = 1 2

∂2ϕ

∂x2

i

, aij = 1 2

∂2ϕ

(4)

Ejemplos.-(1) La matriz sim´etrica A asociada a la forma cuadr´atica definida por ϕ(x1, x2, x3) = −x21+ 2x22+ 5x23+x1x2 −3x1x3+ 6x2x3

esA=

2

6 4

−1 12 32

1

2 2 3

−3

2 3 5

3

7 5.

(2) La forma cuadr´atica asociada a la matriz sim´etrica

A=

2

6 4

0 √5 3 √

5 3 0

3 0 5

3

7 5

es

ϕ(x1, x2, x3) = 0x21+ 2

5x1x2+ 6x1x3−3x22 + 0x2x3+ 5x23

= 2√5x1x2+ 6x1x3−3x22+ 5x23.

Observaciones.

(1) Una vez que est´a fijado el orden de las variables (x1,· · · , xn), la matriz sim´etrica

A= [aij] asociada a la forma cuadr´atica es ´unica. (2) Dada una matriz cuadrada real M, la funci´on

ϕ :xRn −→ϕ(x) =xTMxR

es una forma cuadr´atica, aunque la matrizM no sea sim´etrica. Por ejemplo,

ϕ(x) = xT

2

6 4

1 2 1 −1 3 1

3 0 5

3

7 5x=

= x2

1+ (2−1)x1x2 + (−1 + 3)x1x3−3x22+ (1 + 0)x2x3 + 5x23

es una forma cuadr´atica cuya matriz sim´etrica asociada es

A = 1 2

€

M +MTŠ

=

2

6 4

1 12 1

1 2 −3

1 2

1 1

2 5

3

7 5.

(5)

7.2.2.- Rango y signo de una forma cuadr´atica.

Dada una forma cuadr´atica ϕ(x) =xTAx,(A matriz sim´etrica real de ordenn), notemos que para cualquier αR y cualquier xRn se verifica que

ϕ(αx) =α2ϕ(x).

Por tanto, el signo de los valores que alcanza ϕ sobre los m´ultiplos no nulos, αx, de un vector prefijado, x6= 0, es constante. Si, por ejemplo, tenemos queϕ(x)>0, entonces, para cualquier α R, α 6= 0 tenemos queϕ(αx) =α2ϕ(x)>0. Adem´as, en este caso, puesto que

ϕ(x)>0,

l´ım

α→±∞ϕ(αx) = +∞

y sobre los vectores αx (la recta en Rn que pasa por el origen y tiene a x como vector

direcci´on) la forma cuadr´atica puede alcanzar cualquier valor entre 0 = ϕ(0) y + (de hecho cada valor lo alcanza dos veces en dicha recta):

0< c <+∞ ⇒

"

tomando α=±

q

c ϕ(x)

#

⇒ϕ(αx) =c.

Ejemplo.- Consideremos la forma cuadr´atica ϕ(x1, x2, x3) = 2x21 − 3x22 +x23. Tenemos

ϕ(1,0,0) = 2 (= ϕ(α,0,0) = 2α2) y ϕ(0,1,0) = 3 (= ϕ(0, β,0) = 3β2). Por

tan-to, una vez que conocemos alg´un punto en el que la forma cuadr´atica alcanza un valor de un determinado signo, podemos determinar puntos donde alcanza cualquier otro valor del mismo signo. Por ejemplo, si queremos determinar alg´un punto donde se verifique que ϕ(x1, x2, x3) = 7 bastar´a buscar puntos de la forma (x1, x2, x3) =α(1,0,0) para los cuales

ϕ(α,0,0) = 2α2 = 7⇐⇒α=± Ê

7 2.

Definici´on (Signo de una forma cuadr´atica).

Se dice que una forma cuadr´aticaϕ :xRn −→ϕ(x) =xTAxRy que la matriz sim´etrica

A asociada es:

(1) Definida positiva si ϕ(x) =xTAx >0,

∀x6= 0, xRn.

(2) Definida negativa si ϕ(x) = xTAx < 0, x 6= 0, x Rn. De forma equivalente, −ϕ(x) =xT(

−A)x es definida positiva.

(3) Indefinida si existen vectores en Rn para los que ϕ es positiva y otros para los que es negativa. Es decir, v1 ∈Rn y∃v2 ∈Rn tales que

ϕ(v1) =vT1Av1 >0 y ϕ(v2) =v2TAv2 <0.

(4) Semidefinida positiva si ϕ(x) =xTAx0, xRn. (5) Semidefinida negativa si ϕ(x) = xTAx

≤ 0, x Rn. De forma equivalente,

(6)

Nota.Con las definiciones dadas, los casos de formas cuadr´aticas semidefinidas (positiva o nega-tiva) incluyen a los casos de formas cuadr´aticas definidas (positiva o neganega-tiva). Para considerar situaciones disjuntas, en la definici´on de forma cuadr´atica semidefinida suele a˜nadirse que se cumpla

ϕ(v) = 0 para alg´un vector v6= 0. En caso de no existir tal vector v, siendo semidefinida (positiva o negativa) ser´a definida (positiva o negativa). En lo que sigue consideramos la definici´on dada m´as arriba con objeto de simplificar los enunciados.

Observaci´on.- Dada una forma cuadr´atica ϕ asociada a una matriz sim´etrica A, ϕ(x1,· · ·, xn) =a11x21+· · ·+ 2aijxixj+· · ·+annx2n=xTAx,

los coefiecientes aiide los cuadrados (los elementos diagonales deA) son valores que alcanza la forma cuadr´atica en los vectores/puntos can´onicos

e1 = (1,0, . . . ,0),· · · , ei= (0, . . . ,0,1,0, . . . ,0),· · · , en= (0,· · ·,0,1) =⇒.ϕ(ei) =aii. Por tanto, dichos valores nos dan alguna informaci´on sobre el signo de la forma cuadr´atica. Por ejemplo,

si todos los elementos diagonales son positivos a11,· · · , ann > 0, la forma cuadr´atica no podr´a ser ni definida ni semidefinida negativa;

si hay dos elementos digonales de distinto signo, la forma cuadr´atica es indefinida; si alguno de los elementos diagonales es nulo, la forma cuadr´atica no podr´a ser definida negativa ni definida positiva;

· · ·

Definici´on. El rango de una forma cuadr´atica en Rn se define como el rango de la matriz sim´etrica asociada.

Al hacer, en la forma cuadr´atica xTAx, un cambio de base x = P y (P matriz real no-singular), se obtiene

xTAx =yT(PTAP)y.

Es decir al expresar la forma cuadr´atica respecto a la base formada por los vectores columna deP, obtenemos que en las coordenadasy, respecto de dicha base, la forma cuadr´atica tiene asociada la matriz sim´etricaB =PTAP. Puesto queP yPT son matrices que tienen inversa, el rango deB is igual que el rango de A.

El estudio del signo y del rango de una forma cuadr´atica arbitraria lo reduciremos a los casos m´as simples posibles. Dichos casos se dan cuando la forma cuadr´atica consiste en una suma de cuadrados o, lo que es lo mismo, la matriz sim´etrica asociada es diagonal. En dichos casos la determinaci´on del rango y del signo es inmediata como se recoge en el siguiente resultado.

Proposici´on.-Sea ϕ:Rn−→R la forma cuadr´atica

ϕ(x) :=α1x21+α2x22+· · ·+αnx2n= [x1 · · · xn] 2

6 6 6 6 4

α1 0 · · · 0

0 α2 · · · 0

... ... ... ... 0 0 · · · αn

3

7 7 7 7 5

2

6 6 4

x1

... xn

3

(7)

(1) ϕ es definida positiva ⇐⇒α1 >0, α2 >0,· · · , αn>0. (2) ϕ es definida negativa ⇐⇒α1 <0, α2 <0,· · ·, αn <0. (3) ϕ es indefinida ⇐⇒ ∃ i, j tales que αi >0 y αj <0. (4) ϕ es semidefinida positiva ⇐⇒α1 ≥0, α2 ≥0,· · · , αn≥0. (5) ϕ es semidefinida negativa ⇐⇒α1 ≤0, α2 ≤0,· · · , αn≤0. El rango de ϕ es el n´umero de coeficientes αk 6= 0.

7.2.3.- Reducciones a suma de cuadrados.

En esta subsecci´on estudiamos c´omo reducir a suma de cuadradosuna forma cuadr´atica arbitraria. Es decir, dada una forma cuadr´atica

ϕ(x1,· · · , xn) =a11x21+ 2a12x1x2+· · ·

c´omo obtener un cambio de basex=P y (cambio de variables lineal,P matriz real que tiene inersa) de forma que en las nuevas variables la forma cuadrada se exprese como una suma de cuadrados ϕ(x1,· · · , xn) = α1y12+α2y22+· · ·+αnyn2.As´ı, para cada vector y ∈Rn tenemos un ´unico vector x=P y Rn y viceversa, y=P−1x Rn.

De esta forma, siendoDla matriz diagonal cuyos elementos diagonales son los coeficientes αk de los cuadrados tenemos que

xTAx=yT(PTAP)y =yTDy

y todos los datos/resultados/... que se obtienen sobre la forma cuadr´atica a partir de su ex-presi´on en las variables (y1,· · ·, yn) pueden traducirse a las variables (x1,· · · , xn) y viceversa

(x=P y, y=P−1x).

Cuando una forma cuadr´atica est´a expresada como suma de cuadrados se dice que est´a en forma reducida (o can´onica).

Definici´on.-Se dice que dos matrices A y B (cuadradas reales del mismo orden) son con-gruentes si existe alguna matriz real P no singular tal que B =PTAP.

La reducci´on de una forma cuadr´atica a suma de cuadrados se puede hacer de muchas formas distintas puesto que la ´unica restricci´on que hemos considerado para la matriz P es que sea no-singular. A continuaci´on describimos dos m´etodos para reducir a suma de cuadrados. Un m´etodo es matricial, consiste en obtener una diagonalizaci´on ortogonal de la matriz A. El otro es polin´omico, consiste en ir reducciendo el problema, paso a paso, a formas cuadr´aticas con una variable menos en cada paso.

Teorema (de los ejes principales). Sea A una matriz real sim´etrica, entonces existe un cambio de variables ortogonalx=Qy (es decir, con Qmatriz ortogonal) que reduce la forma cuadr´atica xTAx a suma de cuadrados

yTDy =λ

1y12+· · ·+λnyn2

(8)

En dicho caso las matrices A y D son semejantes (Q−1AQ = D) y congruentes

(QTAQ=D) siendo la matriz de paso la misma matriz P cuyas columnas son autovectores deA que forman una base ortonormal deRn. Los vectores columna de Q se denominan ejes principales de la forma cuadr´atica.

Ejemplos.

(1) Sea ϕ1 la forma cuadr´atica en R2 dada por

ϕ1(x) =xTAx= ”

x1 x2 —

–

1 3/2 3/2 1

™–

x1

x2 ™

=x21+ 3x1x2−x22.

Si obtenemos una base una base ortonormal de R2 formada por autovectores de la

matrizA llegaremos a

ϕ1(x)

√ 13 2 w 2 1 − √ 13 2 w 2 2

puesto que los autovalores de A son ±√13/2. Por tanto, esta forma cuadr´atica es indefinida (y tiene rango 2). Toda matriz que represente a ϕ1 en alguna base de R2

tendr´a rango 2 y, si la matriz es diagonal, tendr´a un elemento positivo y uno negativo (y obviamente ninguno nulo).

ϕ1(x) = ”

x1 x2 —

–

1 3/2 3/2 1

™– x1 x2 ™ = ”

y1 y2 —

–

1 0

0 13/4

™– y1 y2 ™ = ”

z1 z2 —

–

13/4 0 0 1

™– z1 z2 ™ = ”

u1 u2 —

–

−1 0 0 13/4

™– u1 u2 ™ = ”

v1 v2 —

–

−1 0 0 1 ™– v1 v2 ™ = ”

w1 w2 —

" √

13/2 0 0 √13/2

# – w1 w2 ™ =...

(2) Sea ϕ2 la forma cuadr´atica en R2 dada por

ϕ2(x) =xTAx= ”

x1 x2 —

–

4 2 −2 1

™–

x1

x2 ™

= 4x214x1x2+x22.

Completando cuadrados en la primera variable obtuvimos, en el Tema 3, la reducci´on de ´esta forma cuadr´atica a suma de cuadrados como ϕ2(x) = y12, mediante el cambio

de variables y1 = 2x1−x2, y2 =x2.

Puesto que los autovalores deAsonλ1 = 0 yλ2 = 5, si obtenemos una base ortonormal

de autovectores llegamos, por ejemplo, a la expresi´on ϕ2(x) = 5u22.

Esta forma cuadr´atica es semidefinida positiva (y de rango 1). Toda matriz que repre-sente a ϕ2 en alguna base de R2 tendr´a rango 1 y, si la matriz es diagonal, tendr´a un

elemento positivo y otro nulo (y ninguno negativo). (3) Sea ϕ3 la forma cuadr´atica en R2 dada por

ϕ3(x) =xTAx= ”

x1 x2 —

–

1 2 −2 0

™–

x1

x2 ™

=x214x1x2.

Puesto que los autovalores deAson (1±√17)/2, podemos obtener, mediante una base ortonormal de R2 formada por autovectores de A,

ϕ3(x) =

1 +√17

2 w

2 1 +

1√17

2 w

(9)

(4) Sea ϕ4 la forma cuadr´atica en R2 dada por

ϕ4(x) =xTAx= ”

x1 x2 — – 0 2 2 0 ™– x1 x2 ™

= 4x1x2.

Puesto que los autovalores de A son ±2, podemos obtener la reducci´on a suma de cuadrados ϕ4(x) = 2w21−2w22.

(5) Consideremos la forma cuadr´atica en R3

ϕ5(x) =xTAx= ”

x1 x2 x3 —

2

6 4

3 2 0 2 2 2 0 2 1

3 7 5 2 6 4 x1 x2 x3 3 7 5= 3x

2

1+ 2x22+x23+ 4x1x2+ 4x2x3.

Puesto que los autovalores de A son 5,2,1, podemos obtener la reducci´on ϕ5(x) = 5z12+ 2z22 −z23.

(6) Consideremos la forma cuadr´atica en R3

ϕ6(x) = xTAx= ”

x1 x2 x3 —

2

6 4

1 2 1 2 5 3 1 3 2

3 7 5 2 6 4 x1 x2 x3 3 7 5

= x21+ 5x22+ 2x23+ 4x1x2 + 2x1x3+ 6x2x3.

Puesto que los autovalores de A son 0,4±√13(dos positivos y uno nulo), podemos obtener la reducci´on a suma de cuadrados

ϕ6(x) = (4 +

√ 13)z2

2 + (4−

√ 13)z2

3.

Esta forma cuadr´atica es pues semidefinida positiva (y de rango 2). (7) Consideremos la forma cuadr´atica en R4

ϕ7(x) =xTAx= [x1 x2 x3 x4] 2

6 6 6 4

0 3/2 0 0 3/2 0 0 0 0 0 0 5/2 0 0 5/2 0

3 7 7 7 5 2 6 6 6 4 x1 x2 x3 x4 3 7 7 7 5

= 3x1x2 + 5x3x4.

Los autovalores de A son, ±3/2,±5/2 y por tanto mediante una base ortonormal de

R4 formada por autovectores deA podemos obtener

ϕ7(x) =

3 2w 2 1 − 3 2w 2 2+ 5 2w 2 3− 5 2w 2 4.

(10)

• M´etodo de Lagrange. (completar cuadrados)

El m´etodo polin´omico que hemos citado se debe, en parte, a J. L. Lagrange. La idea b´asica consiste en completar cuadrados a partir del cuadrado perfecto y los t´erminos cruzados en una de las variables. Cuando esto no sea posible, habr´a que conseguir un cuadrado perfecto utilizando que

suma por diferencia es igual a diferencia de cuadrados. Esencialmente la idea es la misma que utiliz´abamos a la ho-ra de completar cuadho-rados en la ecuaci´on de una c´onica o una cu´adrica para obtener su ecuaci´on reducida. Al completar cuadrados en una forma cuadr´atica habr´a varias posibilidades

de elecci´on sobre c´omo hacerlo. Joseph Louis Lagrange1736-1813 Antes de describir el m´etodo en forma gen´erica consideremos algunos ejemplos. Ejemplos:

(1) Consideremos la forma cuadr´atica en R2 dada por

ϕ1(x) =xTAx= ”

x1 x2 —

–

1 3/2 3/2 1

™–

x1

x2 ™

=x2

1+ 3x1x2−x22.

Podemos completar el cuadrado en x1 con los t´erminos en los que aparece,

x21+ 3x1x2 =

x1+

3 2x2

2

3 2

2

x22.

Tenemos

ϕ1(x) =

x1+

3 2x2

2

− 94x22x22 =

x1+

3 2x2

2

− 134 x22.

Es decir, mediante el cambio de variables y1 =x1 +32x2, y2 =x2 la forma cuadr´atica

se expresa como

ϕ1(x) =y12−

13 4 y

2 2.

Por tanto, la forma cuadr´atica es indefinida puesto que lo es en las coordenadas (y1, y2)

(pueden obtenerse f´acilmente puntos d´onde la forma cuadr´atica toma valores positivos y puntos d´onde toma valores negativos). Puesto que la relaci´on entre las variables (x1, x2) e (y1, y2) es uno-a-uno,

–

y1

y2 ™

=

–

1 3 2

0 1

™–

x1

x2 ™

⇐⇒

–

x1

x2 ™

=

–

1 3 2

0 1

™

−1–

y1

y2 ™

,

podremos obtener las correspondientes coordenadas (x1, x2) para las cuales la forma

cuadr´atica toma los valores citados. Por ejemplo tenemos

ϕ1(y1 = 1, y2 = 0) =ϕ1(x1 = 1, x2 = 0) = 1 y ϕ1(y1 = 0, y2 = 1) =−

(11)

Puesto que en ϕ1 tambi´en aparecen los t´erminos x22 y x1x2, podr´ıamos haber optado

por completar el cuadrado enx2:

ϕ1(x) = x21+ 3x1x2−x22 =− €

x223x1x2 Š

+x21 =

x2−

3 2x1

2

+9 4x

2

1+x21 =−

x2−

3 2x1

2

+13 4 x

2 1

= z22+ 13 4 z 2 1 = 13 4 z 2 1 −z22,

donde al final hemos hecho el cambioz1 =x1, z2 =x2−32x1. Si ahora hacemos el cambio

de Por otra parte, podr´ıamos considerar el cambio de variables u1 =

13

2 z1, u2 = z2

obtenemos ϕ1(x) =u21−u22.

Por tanto, hay muchas formas distintas de expresar la forma cuadr´atica como suma de cuadrados. Sin ambargo, siempre que reducimosϕ1 a una suma de cuadrados, aunque

se obtengan coeficientes distintos, aparecen un coeficiente positivo y uno negativo. Este hecho no es casualidad y su expresi´on para una forma cuadr´atica gen´erica se denomina ley de inercia de Sylvester. La expresi´on matricial de la forma cuadr´atica ϕ1 en las

distintas variables que hemos considerado es

ϕ1(x) = ”

x1 x2 —

–

1 3/2 3/2 1

™– x1 x2 ™ = ”

y1 y2 —

–

1 0

0 13/4

™– y1 y2 ™ = ”

z1 z2 —

–

13/4 0 0 1

™– z1 z2 ™ = ”

u1 u2 —

–

1 0 0 1

™–

u1

u2 ™

.

(2) Consideremos la forma cuadr´atica en R2 dada por

ϕ2(x) =xTAx= ”

x1 x2 —

–

4 2 −2 1

™–

x1

x2 ™

= 4x21−4x1x2+x22.

Podemos completar el cuadrado en x2, ϕ2(x) = (x2 −2x1)2. Haciendo el cambio de

variablesy1 =x1, y2 =x2 −2x1 obtenemos

ϕ2(x) =y22.

N´otese que tomamos, por simplicidad, y1 =x1, pero podr´ıamos elegiry1 =αx1+βx2

conα, β R, α+2β6= 0 (para que tengamos realmente un cambio de variablesx=P y,

es decir, P sea una matriz no singular), y seguir´ıamos obteniendo ϕ2(x) =y22.

Por tanto, la forma cuadr´atica ϕ2 es semidefinida positiva por serlo en las variables

(y1, y2). Siempre que reduzcamos ϕ2 a una suma de cuadrados obtendremos un

coefi-ciente negativo y un coeficoefi-ciente nulo.

(3) Consideremos la forma cuadr´atica en R2 dada por

ϕ3(x) =xTAx= ”

x1 x2 — – 0 2 2 0 ™– x1 x2 ™

= 4x1x2.

En este caso no podemos completar cuadrados ni en la primera ni en la segunda variable (pues no aparecen nix2

(12)

En esta situaci´on recurrimos a la idea de transformar el t´ermino mixto en unasuma por diferencia, que conseguimos, por ejemplo, mediante el cambiox1 =y1+y2, x2 =y1−y2:

ϕ3(x) = 4(y1+y2)(y1−y2) = 4y12−4y22.

De esta forma, ya tenemos una suma de cuadrados en la que aparecen un coeficiente positivo y uno negativo. Por tanto, la forma cuadr´atica es indefinida. La relaci´on entre las variables originales y las variables finales es

– x1 x2 ™ = – 1 1 1 1

™– y1 y2 ™ ⇐⇒ – y1 y2 ™ = – 1 1 1 1

™

−1–

x1

x2 ™

.

(4) Consideremos la forma cuadr´atica en R3 dada por

ϕ4(x) =xTAx= ”

x1 x2 x3 —

2

6 4

3 2 0 2 2 2 0 2 1

3 7 5 2 6 4 x1 x2 x3 3 7 5= 3x

2

1+ 2x22+x23+ 4x1x2+ 4x2x3.

Completamos cuadrados en la variable x1 puesto que aparecen t´erminos en x21 y en

x1x2:

ϕ4(x) = 3

x21 +4 3x1x2

+ 2x22+x23+ 4x2x3

= 3

x1 +

2 3x2

2

− 4 3x

2

2+ 2x22+x23+ 4x2x3

= 3

x1 +

2 3x2

2

+2 3x

2

2+x23 + 4x2x3.

Completamos cuadrados enx2 tenemos

ϕ4(x) = 3

x1+

2 3x2

2

+2 3(x

2

2+ 6x2x3) +x23

= 3

x1+

2 3x2

2

+2

3(x2+ 3x3)

2

−6x23+x23 = 3

x1+

2 3x2

2

+2

3(x2+ 3x3)

25x2 3.

Finalmente, el cambio y1 =x1+ 23x2, y2 =x2+ 3x3, y3 =x3 nos lleva a

ϕ4(x) = 3y12+

2 3y

2

2 −5y23.

Puesto que hemos obtenido dos coeficientes positivos y uno negativo, esta forma cuadr´atica es indefinida.

(5) Consideremos la forma cuadr´atica en R3 dada por

ϕ5(x) =xTAx= [x1 x2 x3] 2

6 4

1 2 1 2 5 3 1 3 2

3 7 5 2 6 4 x1 x2 x3 3 7 5=x

2

(13)

Completamos cuadrados en la variablex1 puesto que aparecen t´erminos en x21, x1x2 y

x1x3:

ϕ5(x) = (x1+ 2x2+x3)2−4x22 −x23 −4x2x3+ 5x22+ 2x23+ 6x2x3

= (x1+ 2x2+x3)2+x22+x23+ 2x2x3.

A continuaci´on completamos cuadrados en la variablex2 (puesto que aparecen t´erminos

en x2

2 y x2x3):

ϕ5(x) = (x1+ 2x2+x3)2+ (x2 +x3)2 =y12+y22,

donde hemos hecho el cambio y1=x1+ 2x2+x3, y2 =x2 +x3, y3 =x3.

Puesto que hemos obtenido dos coeficientes positivos y uno nulo, la forma cuadr´atica es semidefinida positiva.

(6) Consideremos la forma cuadr´atica en R4 dada por

ϕ6(x) =xTAx= ”

x1 x2 x3 x4 —

2

6 6 6 4

0 3/2 0 0 3/2 0 0 0 0 0 0 5/2 0 0 5/2 0

3

7 7 7 5

2

6 6 6 4

x1

x2

x3

x4 3

7 7 7 5

= 3x1x2+ 5x3x4.

Puesto que no hay ning´un cuadrado, necesitamos recurrir a suma por diferencia. Lo hacemos, por ejemplo, mediante el cambio:

x1 =y1+y2, x2 =y1−y2, x3 =y3, x4 =y4

con lo que ϕ6(x) = 3(y1+y2)(y1−y2) + 5y3y4 = 3y12−3y22+ 5y3y4.

Ya tenemos suma de cuadrados en las dos primeras variables. Nuevamente, como no hay ning´un t´ermino al cuadrado en las variables restantes y2

3 ey42, necesitamos recurrir

asuma por diferencia. Lo hacemos, por ejemplo, mediante el cambio: y1 =z1, y2 =z2, y3 =z3+z4, y4 =z3 −z4,

y obtenemos ϕ6(x) = 3z21−3z22+ 5(z3 +z4)(z3−z4) = 3z12−3z22 + 5z32−5z42.

N´otese que ambos cambios de variables, en este caso sencillo, se podr´ıan haber hecho simult´aneamente:

x1 =z1 +z2, x2 =z1−z2, x3 =z3+z4, x4 =z3−z4,

con lo que habr´ıamos llegado, en un solo paso, al resultado final. Puesto que en la expresi´on como suma de cuadrados hemos obtenidos dos coeficientes positivos y dos negativos (y obviamente ninguno nulo), la forma cuadr´atica es indefinida.

A modo de resumen de lo que hemos hecho en los ejemplos anteriores. Si en una forma cuadr´atica

ϕ(x1, x2, . . . , xn) =a11x21+ 2a12x1x2+· · ·+a22x22+· · ·+annx2n el coeficiente de uno de los cuadrados x2

(14)

variable correspondiente. Si por ejemploa116= 0 y hay otros sumandos 2a12x1x2+· · · donde

aparece la variablex1, podemos completar el cuadradoa11x21 mediante

a11

x21+2a12 a11

x1x2+

2a13

a11

x1x3 +· · ·

=a11 ‚

x1+

a12

a11

x2+· · · 2

a12

a11

x2+· · ·

de forma que si desarrollamos el cuadrado anterior obtenemos todos los sumandos de la forma cuadr´atica en los que interviene x1 (el cuadrado perfecto y los productos cruzados)

m´as otros sumandos en las restantes variables x2, x3, . . . , xn.

Es posible que a la hora de completar cuadrados no se disponga de ning´un cuadrado (que no est´e ya completo) y que s´olo queden productos cruzados. Si por ejemplo tenemos x1x2,

este producto cruzado lo transformaremos en una suma×diferencia, x1x2 = (y1−y2)(y1+y2) =y12−y22

y podremos completar alguno de los cuadrados de la diferencia de cuadrados resultante. Este m´etodo, consistente en ir completando cuadradados haciendo cambios de variable en los que en cada paso cambia una (o a lo sumo dos) de las variables, puede esquematizarse como sigue:

M´etodo de Lagrange.

(1) Si para alg´un ´ındice i se tiene aii 6= 0, podemos completar cuadrados con todos los t´erminos que contengan a xi para obtener

Q(x) =aii

„

n

X

j=1

aij aii

xj

Ž 2

+ϕ1(x1,· · · , xi−1, xi+1,· · · , xn)

donde ϕ1 es una nueva forma cuadr´atica con n−1 variables a la que se le vuelve a

aplicar el proceso. El cambio de variables que se utiliza es

8

> <

> :

yi = n

X

j=1

aij aii

xj

yj =xj para j 6=i.

(2) Si a11 = a22 = · · · = ann = 0, elegimos un coeficiente aij 6= 0 (si todos fueran cero tendr´ıamos ϕ(x)0 y no habr´ıa nada que reducir). Haciendo el cambio de variables

8

> <

> :

xi =yi+yj xj =yi−yj

xk=yk para k 6=i, j,

obetenemos dos cuadrados que podemos completar pasando de nuevo al caso (1), pues 2aijxixj = 2aijyi2−2aijy2j.

7.2.4.- Ley de inercia de Sylvester. Clasificaci´on.

(15)

algunos de los Ejemplos (1) a (6) que hemos visto antes, se han completado cuadrados de dos maneras distintas para una misma forma cuadr´atica, obteniendo como resultado final una suma de cuadrados con coeficientes posiblemente distintos. A pesar de que puedan obtenerse coeficientes distintos, las dos expresiones finales como suma de cuadrados tienen en com´un los signos de los coeficientesde los cuadrados. Es decir, si tenemos una forma cuadr´atica, por ejemplo en tres variables, ϕ(x1, x2, x3) y al reducir (de alguna forma) a suma de cuadrados

obtenemos, por ejemplo, 2y2

1−5y22+0y32,entonces, al reducir a suma de cuadrados de cualquier

otra forma obtendremos una expresi´on del tipo αz2

1 +βz22+γz32 en la que, necesariamente,

uno de los coeficientes ser´a positivo, otro ser´a negativo y el otro ser´a nulo. Este hecho de conservaci´on de los signos en cualquiera de las reducciones a sumas de cuadrados es lo que expresa la llamada ley de inercia de Sylvester. Adem´as dichos signos tienen que coincidir con los signos de los autovalores de la matriz sim´etica asociada, contando cada uno seg´un su multiplicidad.

Teorema. (Ley de inercia de Sylvester)Sea Auna matriz sim´etrica real y ϕ(x) =xTAx la forma cuadr´atica asociada.

a) Al reducir ϕ a suma de cuadrados se obtienen tantos coefi-cientes positivos, negativos y nulos como autovalores posi-tivos, negativos y nulos, respectivamente, tengaA, contan-do las correspondientes multiplicidades.

b) Si D1 es una matriz diagonal congruente con A (existe una

matriz no-singular P1 tal que P1TAP1 = D1), en la

diago-nal deD1 hay tantos elementos positivos, negativos y nulos

como autovalores positivos, negativos y nulos, respectiva-mente, tenga A, contando las correspondientes

multiplici-dades. James Joseph Sylvester

1814-1897

Observaciones.

(a) Se suele llamarinercia de una matriz sim´etrica (real) A y de la forma cuadr´atica aso-ciadaϕ(x) =xTAx a la terna(pos, neg, nul) de coeficientes positivos (pos), negativos (neg) y nulos (nul) respectivamente que aparecen en una (cualquier) reducci´on deϕ a suma de cuadrados.

(b) Se verifica que

• pos + neg + nul =n = orden deA y • pos + neg = rango(A).

La primera igualdad es obvia y la segunda se basa en que cuando una matriz se multi-plica (por la derecha o por la izquierda) por una matriz que tiene inversa el rango no cambia.

(c) En relaci´on con las formas cuadr´aticas (y las matrices sim´etricas reales) tambi´en suele usarse el concepto de signatura (que nosotros no utilizaremos)

signatura = posneg.

(16)

(d) Para la determinaci´on del signo puede no ser imprescindible hacer la reducci´on a suma de cuadrados. Ya hemos visto que los elementos diagonales de A son valores que al-canza la forma cuadr´atica y, por tanto, aportan cierta informaci´on sobre su signo. M´as informaci´on puede obtenerse cuando en la expresi´on deϕ(x1, . . . , xn) anulamos ciertas

variables. Por ejemplo, si tomamosx3 =· · ·=xn = 0 tenemos la forma cuadr´atica en dos variables (x1, x2) dada por

ϕ1(x1, x2) =ϕ(x1, x2,0,· · · ,0).

La informaci´on que podamos obtener sobre dicha forma cuadr´atica ϕ1, o sobre varias

formas cuadr´aticas del mismo tipo, permite deducir alguna informaci´on sobre la forma cuadr´atica original.

Teorema. Sea A= [aij] una matriz real sim´etrica de orden n. Son equivalentes: (1) A es definida positiva. (1’) A es definida negativa.

(2) Al reducir xTAx a suma de cuadrados, aparecen n coeficientes positivos. (3) Los autovalores de A son todos positivos.

(4) (Criterio de Sylvester o de los menores principales) Todos los menores principales de A son positivos, es decir, det (Ak)>0, k = 1,2, . . . , nsiendo Ak la matriz de ordenk

Ak =

2

6 6 4

a11 · · · a1k ..

. . .. ... ak1 · · · akk

3

7 7 5

Puesto que una matriz real y sim´etricaAes definida negativa si, y s´olo si,Aes definida positiva, se obtiene el siguiente resultado.

Corolario. Sea A = [aij] una matriz real sim´etrica de orden n. Entonces las siguientes condiciones son equivalentes:

(1) A es definida negativa. (1’) A es definida positiva.

(2) Al reducir xTAx a suma de cuadrados, aparecen n coeficientes negativos. (3) Los autovalores de A son todos negativos.

(4) (Criterio de Sylvester o de los menores principales) Los menores principales deAtienen signos alternos ,+,,+, . . .

(1)kdet (Ak)>0, k = 1,2, . . . , n.

(17)

teniendo en cuenta que los elementos diagonales deAson valores que alcanza la forma cuadr´atica,akk =ϕ(ek) =eTkAek. Si dos de estos valores son de distinto signo la forma cuadr´atica ser´a indefinida.

Si alguna submatriz diagonal de orden 2,

–

aii aij aji ajj

™

,tiene determinante negativo, la forma cuadr´atica es indefinida.

Si det (A)6= 0, y no se cumplen las condiciones dadas para formas cuadr´aticas definidas positivas o definidas negativas, entonces es indefinida.

. . .

Definici´on. Clasificar una forma cuadr´atica consiste en determinar su inercia (el n´umero de coeficientes positivos, negativos y nulos que aparecen en cualquier reducci´on a suma de cuadrados) as´ı como el signo correspondiente.

Se denominaforma can´onica/reducida de una forma cuadr´atica ϕ a cualquier expre-si´on de ϕ como suma de cuadrados (en variables independientes).

Para una forma cuadr´atica en dos variables, tenemos el siguiente teorema que permite determinar el signo (en este caso la inercia completa) en funci´on de los coeficientes de la matriz (sim´etrica) asociada.

Teorema.- Sea ϕ la forma cuadr´atica siguiente y A la matriz sim´etrica asociada, Q(x, y) =ax2+ 2bxy+cy2 = [x y]

–

a b b c

™–

x y

™

, A=

–

a b b c

™

.

(a) ϕ es definida positiva si y s´olo si a >0 ydet (A) =acb2 >0.

(b) ϕ es definida negativa si y s´olo si a <0 y det (A) = acb2 >0.

(c) ϕ es indefinida si y s´olo si det (A) =acb2 <0.

D.Separemos los casos en los que a6= 0 y los casos en los que a= 0.

•Si a6= 0, entonces podemos completar el cuadrado enx,

ax2+ 2bxy+cy2 = a

x2+ 2b

axy

+cy2 =a –

x2+ 2b

axy+

b ay

2

b ay

+cy2

= a –

x2+ 2b

axy+

b ay

2 ™

−a

b ay

2

+cy2 =a

x+ b

ay 2

+

‚ cb

2

a Œ

y2

= a x′2+

‚

−b

2

a +c Œ

y′2, siendo

¨

x′=x+b ay,

y′ =y.

Por tanto, en este caso, la forma cuadr´atica es:

(a) Definida positiva ⇐⇒ a >0 y b2

a +c >0 ⇐⇒ a >0 y ac−b2 >0.

(b) Definida negativa ⇐⇒ a <0 y b2

a +c <0 ⇐⇒ a <0 y ac−b2 >0.

(c) Indefinida ⇐⇒ a €

−b2

a +c

Š

(18)

• Si a = 0 y c 6= 0, tenemos que ϕ(x, y) = 2bxy +cy2 y podemos completar el cuadrado en

y. Estamos en un caso an´alogo al anterior. Notemos que en los casos en los que ϕ sea definida (positiva o negativa), ayctienen que tener el mismo signo.

• Si a =c = 0 tenemos ϕ(x, y) = 2bxy. Sea cual sea el signo de b 6= 0, esta forma cuadr´atica es

indefinida puesto que alcanza valores de distinto signo, por ejemplo ϕ(1,1) = 2b y ϕ(1,1) =

−2b. En lo que se refiere a la reducci´on a suma de cuadrados, podemos transformar xy en una suma×diferencia

ϕ(x, y) = 2b xy =

–

siendo

¨

x=x′+y′ y=x′y

™

= 2b €

x′2y′2 Š

.

Recopilando todos los casos obtenemos el enunciado.

Ejercicio.Estudia cuando es semidefinida la forma cuadr´atica ϕ(x, y) =ax2+ 2bxy+cy2.

Para una forma cuadr´atica ϕ en n variables (y para la matriz sim´etrica real A asociada) puede darse un criterio matricial en los casos en los que sea definida (positiva o negativa).

Dada una matriz sim´etrica A, se llaman submatrices principales de A a las matrices

Ak=

2

6 6 4

a11 · · · a1k ... ... ... a1k · · · akk

3

7 7

5, k = 1,2, . . . , n.

Se llaman menores principales de A a los determinantes de dichas submatrices ∆k = det(Ak), k = 1,2, . . . , n.

Teorema 4.-Criterio de los menores prinipales (o Criterio de Sylvester). (1) A es definida positiva ⇐⇒∆k = det(Ak)>0, k = 1,2, . . . , n. (2) A es definida negativa ⇐⇒(1)k∆k= det(

−Ak)>0, k = 1,2, . . . , n.

7.3.- C´

onicas y cu´

adricas (II).

En el Tema 1 se estudiaron las (secciones) c´onicas y las cu´adricas desde el punto de vista m´etrico as´ı como los elementos representativos de cada una de ellas. Por otra parte, vimos la determinaci´on de la posici´on, del tipo de c´onica/cu´adrica y c´omo obtener los elementos caracter´ısticos cuando ´esta viene dada por una ecuaci´on en la que no aparecen productos cruzados. Ahora estudiaremos:

(a1) Que toda ecuaci´on polin´omica de segundo grado en dos variables a11x2+ 2a12xy+a22y2+ 2a1x+ 2a2y+a0 = 0

(alguno de los coeficientesa11, a12, a22 es distinto de cero) representa una c´onica. Entre

´estas estar´an los casos degenerados. Dicha ecuaci´on podr´a representar: •una elipse, una par´abola, una hip´erbola,

(19)

(a2) Que toda ecuaci´on polin´omica de segundo grado en tres variables

a11x2+a22y2+a33z2+ 2a12xy + 2a13xz+ 2a23yz+ 2a1x+ 2a2y+ 2a3z+a0 = 0,

(alguno de los coeficientes a11, a22, a33, a12, a13, a23 es distinto de cero) representa una

cu´adrica. Entre ´estas consideramos los casos degenerados. Dicha ecuaci´on podr´a rep-resentar:

•un elipsoide, un paraboloide (el´ıptico o hiperb´olico), •un hiperboloide (de una o de dos hojas), un cono, •un cilindro (el´ıptico, parab´olico o hiperb´olico) •un par de planos secantes/paralelos/coincidentes, •una recta, un punto, nada.

(b) C´omo determinar el tipo de c´onica/cu´adrica y sus elementos representativos cuando en la ecuaci´on aparecen t´erminos en productos cruzados. La presencia de ´estos t´erminos indica que la c´onica/cu´adrica est´a girada respecto a los ejes coordenados. La deter-minaci´on del correspondiente ´angulo de giro se har´a a partir del c´alculo de autova-lores y autovectores de la matriz asociada a la parte cuadr´atica de la ecuaci´on de la c´onica/cu´adrica. Es decir, se tratar´a de obtener la posici´on, los elementos caracter´ısticos y la representaci´on gr´afica en el sistema de ejes dado.

En cada una de las subsecciones siguientes consideraremos el problema de determinar el tipo de c´onica/cu´adrica y obtener la posici´on, los elementos caracter´ısticos y la representaci´on gr´afica en el sistema de ejes dado. El planteamiento para hacer la reducci´on de una cu´adrica ser´a el mismo para una c´onica. Tiene dos partes diferenciadas:

En primer lugar, mediante un cambio de variables ortogonal, hay que conseguir que en la parte cuadr´atica de la ecuaci´on:

c´onica : a11x2+ 2a12xy+a22y2,

cu´adrica : a11x2+ 2a12xy+ 2a13xz+a22y2+ 2a23yz+a33z2,

no aparezcan t´erminos cruzados. Para ello, tendremos que diagonalizar ortogonalmente la matriz (real sim´etrica) de la parte cuadr´atica de la ecuaci´on. Es decir, siendo A = [aij] la matriz sim´etrica de la parte cuadr´atica de la ecuaci´on, habr´a que calcular sus autovalores y una base ortonormal de Rn formada por autovectores de A. Dicha

base formada por autovectores nos permitir´a hacer un cambio de variables ortogonal x= Px′ de forma que en las variables xla ecuaci´on de la c´onica/cu´adrica no tenga

t´erminos cruzados. Esta es la situaci´on que se estudi´o en el Tema 2.

Una vez que hemos conseguido una ecuaci´on de segundo grado, sin t´erminos cruzados, mediante un cambio de variables dado por una matriz ortogonal (que esencialmente representar´a un giro en el plano o en el espacio), bastar´a hacer una traslaci´onx′′=xc

para obtener la ecuaci´on reducida de la c´onica/cu´adrica y la gr´afica en el sistema de ejesx′′.

Finalmente, para obtener los elementos caracter´ısticos y la representaci´on gr´afica en el sis-tema de ejes original, necesitaremos deshacer los cambios de variables:

(20)

7.3.1.- Reducci´on de una c´onica girada.

Definici´on. Una c´onica es el lugar geom´etrico de los puntos (x, y) R2 del plano que

satisfacen una ecuaci´on general de segundo grado:

f(x, y) = a11x2+ 2a12xy+a22y2+ 2a1x+ 2a2y+a0 = 0, (1)

donde alguno de los coeficientes a11, a12 oa22 es distinto de cero.

La ecuaci´on anterior, llamada ecuaci´on de la c´onica, se puede escribir en notaci´on vectorial de la forma:

f(x, y) = [x y]A

–

x y

™

+ 2 [a1 a2] –

x y

™

+a0 = 0 siendoA= –

a11 a12

a12 a22 ™

.

N´otese que tambi´en puede escribirse,

f(x, y) = [x y 1]

2

6 4

a11 a12 a1

a12 a22 a2

a1 a2 a0 3

7 5

2

6 4

x y 1

3

7 5= 0.

El proceso general parallevar una c´onica a su ecuaci´on reducida(sabiendo cu´ales son los cambios de variables involucrados) puede separarse en dos etapas (si el coeficiente a12 6= 0,

si el coeficiente a12= 0 bastar´ıa con la segunda etapa):

(a) Determinaci´on de las direcciones de los ejes de la c´onica.Esto consiste endiagonalizar ortogonalmente la matriz (sim´etricaA) asociada a la parte cuadr´atica de la ecuaci´on

A=

–

a11 a12

a12 a22 ™

.

Sean λ1 y λ2 los autovalores deA y v1 y v2 autovectores ortogonales correspondientes

(si λ1 6= λ2 dichos autovectores ser´an ortogonales necesariamente, y si λ1 = λ2

nece-sariamente A es una matriz diagonal, y no necesitamos hacer nada de esto). Conviene tomar los autovectoresv1 yv2 de manera que el ´angulo dev1 av2 sea de 900 en sentido

positivo (contrario a las agujas del reloj). Sin m´as que dividir los vectores v1 y v2 por

su norma, obtenemos una base ortonormal{u1, u2}deR2 formada por autovectores de

A y, por tanto,

P =

2

6

4 u1 u2 3

7 5⇒P

−1 =PT, PTAP =D=

–

λ1 0

0 λ2 ™

.

Al sustituir en la ecuaci´on (en (x, y)) de la c´onica el cambio de variables tenemos

–

x y

™

=P

–

x′

y′

™

=[x′ y]PTAP

–

x′

y′

™

+ 2 [a1 a2]P –

x′

y′

™

+a0 = 0.

Es decir, la ecuaci´on de la c´onica en las coordenadas (x′, y) es

(21)

ecuaci´on en la que no aparece el producto cruzado x′y. Notemos que

–

x y

™

=P

–

x′

y′

™

=

2

6

4 u1 u2 3

7 5 –

x′

y′

™

=

–

x′

y′

™

=PT

–

x y

™

=

–

uT

1

uT

2 ™–

x y

™

.

Por tanto, los nuevos ejes son

X′ ecuaci´on y= 0uT

2 –

x y

™

= 0,

Y′ ecuaci´on x= 0uT

1 –

x y

™

= 0.

Es decir, los ejes x′ e yson las rectas que pasan por el origen de coordenadas y

tienen como vectores direcci´on respectivos los autovectores u1 y u2 de A. De hecho el

sistema de ejes OX′Yse obtiene del sistema OXY girando (con centro el origen de

coordenadas) el ´angulo que determinau1 con el semieje OX+.

(b) Una vez que tenemos la ecuaci´on

λ1x′2 +λ2y′2+ 2b1x′+ 2b2y′+a0 = 0,

en la que no aparece el producto cruzado x′y, bastar´a completar los cuadrados que

aparezcan (mediante cambios del tipo x′′ = xα e y′′ = yβ) para obtener una

ecuaci´on de uno de los siguientes tipos:

Caso el´ıptico. λ1λ2 >0 (es decir λ1 y λ2 son no-nulos y del mismo signo),

a2x′′2 +b2y′′2 =c

en cuyo caso tenemos una elipse (c >0), un punto (c= 0) o nada (c <0). Caso hiperb´olico. λ1λ2 <0 (es decir λ1 y λ2 son no-nulos y de distinto signo),

a2x′′2

−b2y′′2 =c

en cuyo caso tenemos una hip´erbola (c 6= 0) o un par de rectas que se cortan (c= 0).

Caso parab´olico. λ1λ2 = 0 (es decir uno de los autovalores es nulo, y el otro no).

Suponiendo que λ1 6= 0, λ2 = 0 puede obtenerse

a2x′′2+by′′ = 0 ´o a2x′′2+c= 0

Tendremos una par´abola (b 6= 0), o bien un par de rectas paralelas (c < 0) o coincidentes (c= 0) o nada (c >0).

Para obtener los elementos caracter´ısticos de la c´onica y su representaci´on gr´afica basta obtenerlos en las coordenadas (x′′, y′′) y deshacer los cambios de variables que se hayan hecho

(Traslaci´on)

¨

x′′ =xα

y′′=yβ

¨

x′ =x′′+α

y′ =y′′+β

(Giro)

–

x y

™

=P

–

x′

y′

™

–

x′

y′

™

=PT

–

x y

™

(22)

Ejemplos.

(1) Vamos a obtener la ecuaci´on can´onica (reducida) y la representaci´on gr´afica de la c´onica 3x2+ 3y22xy + 2x4y+ 1 = 0.

mediante los cambios de coordenadas adecuados.

Escribimos en forma matricial la parte cuadr´atica de la ecuaci´on de la c´onica:

[x y]

–

3 1 −1 3

™–

x y

™

+ 2x4y+ 1 = 0.

Puesto que la ecuaci´on de la c´onica tiene t´ermino enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los t´erminos cuadr´aticos).

Calculamos los autovalores de A,

3λ 1 −1 3λ

=λ26λ+ 8 = 0 −→ λ1 = 4, λ2 = 2.

Los autovectores correspondientes son:

λ1 = 4 : ‚

−1 1 −1 1

Œ‚ x y Œ = ‚ 0 0 Œ

−→ x+y= 0 −→

‚ x y Œ =α ‚ 1 −1 Œ ,

λ2 = 2 : ‚

1 1 −1 1

Œ‚ x y Œ = ‚ 0 0 Œ

−→ xy= 0 −→

‚ x y Œ =α ‚ 1 1 Œ .

Construimos la matriz de paso ortogonal P (que diagonaliza A) mediante una base ortonormal de autovectores:

(√ 2 2 ‚ 1 −1 Œ , √ 2 2 ‚ 1 1 Œ ) .

El primer autovector da la direcci´on y sentido positivo del nuevo eje X′ (que

cor-responde a girar un ´angulo θ = 45o el eje X, pues del autovector sacamos que

tgθ = y/x = 1/1 = 1) y el segundo autovector (que hemos elegido en el sentido adecuado para que el eje Y′ se obtenga girando el Xun ´angulo de 90o en sentido

positivo) marca la direcci´on y sentido del nuevo ejeY′. El cambio:

x=Px′ −→

– x y ™ = " √ 2 2 √ 2 2

−√22

√ 2 2 # – x′ y′ ™

eliminar´a el t´ermino mixtox′ydejando la parte cuadr´atica comoλ

1x′2+λ2y′2,

modi-ficar´a los coeficientes de los t´erminos lineales,x′ ey, y no alterar´a el t´ermino

(23)

Completando cuadrados hacemos una traslaci´on:

4 x′2 +3

√ 2 4 x

!

+ 2 y′2

− √ 2 2 y ′ !

+ 1 = 0,

4 x′ +3

√ 2 8

!2

− 9

8 + 2 y

√ 2 4 !2 − 1

4 + 1 = 0, 4 x′+3

√ 2 8

!2

+ 2 y′

√ 2 4

!2

= 3

8 −→ 4x

′′2+ 2y′′2 = 3

8, donde hemos realizado la traslaci´on

x′′ =x+3

√ 2 8 , y

′′ =y

√ 2 4 . Operando, llegamos a la ecuaci´on can´onica

x′′2 3 32

+y′′

2 3 16

= 1−→ x′′

2 € 1 4 È 3 2

Š2 +

y′′2 √

3 4

2 = 1.

Es decir, al haber tomado λ1 = 4 y λ2 = 2, el semieje mayor de la elipse est´a sobre el

ejeY′′ y el menor sobre el X′′, ya que 1 4 È 3 2 < √ 3 4 .

El centro C de la elipse es el origen en las coordenadas (x′′, y′′). Es decir, (x′′, y′′) =

(0,0)(x′ =3√2 8 , y′ =

2

4 ). En coordenadas (x, y) obtenemos

x= √

2

2 −

3√2 8 +

√ 2 4

!

=1

8, y = √

2 2

3√2 8 + √ 2 4 ! = 5

8 −→ C=

−18,5 8

.

Para hacer el dibujo esquem´atico con una cierta precisi´on, puede sernos ´util el encontrar los puntos de corte (si los hay) de la elipse con los ejes coordenados (OX y OY). Al hacer x = 0 en la ecuaci´on de la c´onica se obtiene 3y2 4y+ 1 = 0 que se verifica

paray = 1,1/3. Mientras que si hacemosy = 0, la ecuaci´on 3x2+ 2x+ 1 = 0 no tiene

soluci´on (real). Por tanto, la elipse corta al ejeOY en los puntos (0,1) y (0,1/3) y no corta al eje OX.

Con toda la informaci´on que hemos obtenido a lo largo del problema, comenzamos dibujando los ejes X′ e Ysabiendo que pasan por (x = 0, y = 0) y

tienen la direcci´on y sentido del autovector corres-pondiente aλ1 y λ2, respectivamente. Es decir, en

este caso, con la elecci´on que hicimos de autova-lores y autovectores, los ejes X′ e Yse obtienen

rotando un ´angulo de 45o a los ejes X e Y. A

continuaci´on, dibujamos los ejes X′′ e Y′′,

parale-los respectivamente a parale-los ejesX′ eY, que resultan

de trasladar el origen al puntoC =

(24)

N´otese que si hubi´eramos elegido los autovalores en el otro orden posible, es decir, λ1 = 2 y λ2 = 4 y

tomamos como autovectores respectivos (1,1)T y (1,1)T (el primero indica la direcci´on y sentido del ejeX′ y el segundo el del Y), llegar´ıamos, tras

realizar el giro (en este caso de 45o) mediante el

cambio de coordenadas dado por la nueva matriz P y la traslaci´on adecuada, a la ecuaci´on can´onica:

x′′2 √

3 4

2 +

y′′2 € 1 4 È 3 2

Š2 = 1,

que nos llevar´ıa a la figura adjunta.

X ● ● Y 1 1/3 CY’’ Y’ X’ X’’

(2) Vamos a obtener la ecuaci´on can´onica (reducida) y la representaci´on gr´afica de la c´onica x22xy+y22x+ 1 = 0

mediante los cambios de coordenadas adecuados.

Puesto que la ecuaci´on de la c´onica tiene t´ermino enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los t´erminos cuadr´aticos).

”

x y

— –

1 1 −1 1

™–

x y

™

−2x+ 1 = 0, A=

–

1 1 −1 1

™

Calculamos pues sus autovalores y despu´es sus autovectores. En primer lugar:

1λ 1 −1 1λ

=λ22λ = 0 −→ λ1 = 0, λ2 = 2.

Podemos pues calcular los autovectores: λ1 = 0 :

–

1 1 −1 1

™– x y ™ = – 0 0 ™

−→ xy= 0 −→

– x y ™ =α – 1 1 ™ ,

λ2 = 2 : –

−1 1 −1 1

™– x y ™ = – 0 0 ™

−→ x+y= 0 −→

– x y ™ =α – −1 1 ™ .

Construimos la matrizP mediante la siguiente base ortonormal de autovectores:

(√ 2 2 – 1 1 ™ , √ 2 2 – −1 1 ™ ) ,

donde el primer autovector da la direcci´on y sentido del nuevo ejeX′ (que corresponde

a girar un ´angulo θ= 45o el eje X, pues del autovector sacamos que tgθ =y/x= 1) y

el segundo autovector (que hemos elegido en el sentido adecuado para que el eje Y′ se

obtenga girando el eje X′ 90o en sentido positivo o antihorario) marca la direcci´on y

sentido del nuevo ejeY′. El cambio:

x=Px′ −→

(25)

eliminar´a el t´ermino mixtox′ydejando la parte cuadr´atica comoλ

1x′2+λ2y′2,

modi-ficar´a los coeficientes de los t´erminos lineales,x′ ey, y no alterar´a el t´ermino

indepen-diente. Concretamente obtenemos:

2y′2√2x′+√2y′+ 1 = 0.

Completando cuadrados eny′ y haciendo una traslaci´on tenemos

2 y′2+

√ 2 2 y

!

−√2x′+ 1 = 0, −→ 2 y+

√ 2 4

!2

− 14 −√2x′+ 1 = 0,

2 y′+

√ 2 4

!2

−√2x′ +3

4 = 0, 2 y′+

√ 2 4

!2

−√2 x′ 3

√ 2 8

!

= 0, −→ 2y′′2

−√2x′′ = 0,

donde hemos realizado la traslaci´on x′′ =x3

√ 2 8 , y

′′ =y+

√ 2 4 .

Por tanto, la ecuaci´on can´onica a la que hemos llegado, tras la rotaci´on y la traslaci´on llevadas a cabo, es x′′ =2y′′2.

El v´erticeV de la par´abola es el origen en las coordenadas (x′′, y′′). Es decir, (x′′, y′′) =

(0,0)(x′ = 3√2

8 , y′ =−

2

4 ). En coordenadas (x, y) obtenemos

x= √

2 2

3√2 8 +

√ 2 4

!

= 5

8, y= √

2 2

3√2 8 −

√ 2 4

!

= 1

8, −→ V =

5 8,

1 8

.

Para hacer el dibujo esquem´atico con una cierta precisi´on, puede sernos ´util el encontrar los puntos de corte (si los hay) de la par´abola con los ejes coordenados (OX y OY). Al hacerx= 0 en la ecuaci´on de la c´onica se obtiene y2+ 1 = 0 que no tiene soluci´on

(real). Mientras que si hacemos y = 0 obtenemos x2 2x+ 1 = 0 que tiene como

soluci´on (doble) x = 1. Por tanto, la par´abola no corta al eje OY y toca sin cortar (pues es tangente, como se deduce de la ra´ız doble) al eje OX en el punto (1,0). Con toda la informaci´on que hemos obtenido a lo largo del problema, comenzamos dibujando los ejesX′ e Ysabiendo que pasan por el origen de las coordenadas X-Y y

que tienen la direcci´on y sentido del autovector correspondiente a λ1 y λ2,

respectiva-mente.

Es decir, en este caso, con la elecci´on que hicimos de autovalores y autovectores, los ejesX′ eYse

obtienen rotando un ´angulo de 45o a los ejesX e

Y. A continuaci´on, dibujamos los ejes X′′ e Y′′,

paralelos respectivamente a los ejesX′ eY, que

resultan de trasladar el origen al v´ertice de la par´abola V =

€

−1 8,

5 8 Š

. Finalmente, dibujamos la par´abola, que es muy f´acil de representar en las coordenadas (x′′, y′′). Teniendo en cuenta las

intersecciones con los ejesXeY obtenemos pues la figura adjunta.

V

1

X’’

Y’’

Y’

X X’

(26)

N´otese que si elegimos los autovalores en el mismo orden, λ1 = 0 y λ2 = 2, pero

tomamos los autovectores opuestos ((1,1)T fija el eje Xy (1,1)T marca el Y),

llegamos, procediendo an´alogamente, ax′′ =2y′′2. En este situaci´on, estar´ıamos en

el caso (a) de la figura siguiente.

Sin embargo, si tomamos λ1 = 2 y λ2 = 0, y como autovectores correspondientes a

(1,1)T (que determina el ejeX) y (1,1)T (que marca el ejeY), llegamos, procediendo

an´alogamente, a y′′ =2x′′2. De esta forma, estar´ıamos en el caso (b) de la figura

siguiente.

Finalmente, la cuarta y ´ultima posibilidad ser´a tomarλ1 = 2 yλ2 = 0, pero trabajando

con los autovectores a (1,1)T (fija el ejeX) y (1,1)T (marca elY). Entonces, se

llega, procediendo an´alogamente, a y′′ =2x′′2. Estar´ıamos entonces en el caso (c)

de la figura siguiente.

V

1 X

Y

X’

Y’

X’’ Y’’

V

1 X

Y Y’

X’

Y’’

X’’

V

1 X

Y

X’

Y’ X’’

Y’’ (a)

Moraleja: la curva en el plano (X, Y) es obviamente la misma, aunque al comienzo del problema tenemos cuatro posibilidades distintas para elegir el ejeX′ (seg´un qu´e

auto-valor elijamos como primero y qu´e autovector de norma unidad elijamos para dicho autovalor). Tras esta elecci´on los ejesY′ (que queremos obtenerlo girando 90oen sentido

antihorario el ejeX′ ), X′′ e Y′′ ya quedan determinados.

(3) Vamos a obtener la ecuaci´on can´onica (reducida) y la representaci´on gr´afica de la c´onica 2xy4x+ 2y7 = 0

mediante los cambios de coordenadas adecuados.

Puesto que la ecuaci´on de la c´onica tiene t´ermino enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los t´erminos cuadr´aticos),

”

x y

— –

0 1 1 0

™–

x y

™

−4x+ 2y7 = 0, A=

–

0 1 1 0

™

.

Calculamos los autovalores,

−λ 1 1 λ

=λ21 = 0 −→ λ1 = 1, λ2 =−1.

Los autovectores correspondientes son: λ1 = 1 :

–

−1 1 1 1

™–

x y

™

=

–

0 0

™

−→ xy= 0 −→

–

x y

™

–

1 1

™

(27)

λ2 =−1 : – 1 1 1 1 ™– x y ™ = – 0 0 ™

−→ x+y= 0 −→

– x y ™ =α – −1 1 ™ .

Construimos la matrizP mediante la siguiente base ortonormal de autovectores:

(√ 2 2 – 1 1 ™ , √ 2 2 – −1 1 ™ ) ,

donde el primer autovector da la direcci´on y sentido del nuevo eje X′ y el segundo

autovector (que hemos elegido en el sentido adecuado para que el eje Y′ se obtenga

girando el eje X′ 90o en sentido positivo o antihorario) marca la direcci´on y sentido

del nuevo eje Y′. El cambio de variables:

x=Px′ −→

– x y ™ = " √ 2 2 − √ 2 2 √ 2 2 √ 2 2 # – x′ y′ ™

eliminar´a el t´ermino mixto x′ydejando la parte cuadr´atica como λ

1x′2 +λ2y′2,

po-dr´a modificar los coeficientes de los t´erminos lineales, x′ e y, y no alterar´a el t´ermino

independiente. Concretamente obtenemos: x′2

−y′2

−√2x′ + 32y7 = 0.

Completando cuadrados enx′ e yy haciendo una traslaci´on:

x′

2 2

!2

− 12− y′ 3 √

2 2

!2

+ 9

2−7 = 0, x′

√ 2 2

!2

− y′ 3

√ 2 2

!2

−3 = 0,

x′′2

−y′′2 = 3

−→ x

′′2

(√3)2 −

y′′2

(√3)2 = 1,

donde hemos realizado la traslaci´on x′′ =x

√ 2 2 , y

′′=y 3

√ 2 2 .

Deducimos que las as´ıntotas de la hip´erbola son las rectasy′′=±x′′ (perpendiculares

entre s´ı al ser la hip´erbola equilatera). Podemos deshacer los cambios (giro y traslaci´on) para obtener sus ecuaciones en las coordenadasx-y. As´ı,

y′′ =x′′ −→ y′ 3 √

2 2 =x

√ 2 2

y, teniendo en cuenta que x′ =PTx (pues x=P xy P es ortogonal), tenemos

x′ =

√ 2

2 (x+y), y

=

√ 2

2 (−x+y) llegamos a

2

2 (−x+y)− 3√2

2 = √

2

2 (x+y)− √

2

(28)

Procediendo an´alogamente,y′′ =x′′ se convierte en y= 2 (ambas as´ıntotas son pues

paralelas a los ejes Y y X, respectivamente).

El centroCde la hip´erbola es el origen en las coordenadas (x′′, y′′). Es decir, (x′′, y′′) =

(0,0)(x′ = √2 2 , y′ =

3√2

2 ). En coordenadas (x, y) obtenemos

x = √

2 2

√ 2 2 −3

√ 2 2

!

=1, y = √

2 2

√ 2 2 + 3

√ 2 2

!

= 2 −→ C = (1,2).

Para hacer el dibujo con cierta precisi´on puede ser ´util calcular los puntos de corte (si los hay) de la hip´erbola con los ejes coordenados (OX y OY). Al hacer x = 0 en la ecuaci´on de la c´onica se obtiene 2y7 = 0 que tiene como soluci´on y= 7/2. Adem´as, si hacemosy= 0 obtenemos4x7 = 0 que tiene como soluci´onx=7/4. Por tanto, la par´abola corta al ejeOY en el punto (0,7/2) y al eje OX en el punto (7/4,0). Con toda la informaci´on que hemos obtenido a lo largo del problema, comenzamos dibujando los ejesX′ e Ysabiendo que pasan por el origen de las coordenadas X-Y y

tienen la direcci´on y sentido de los autovectores correspondientes a λ1 y λ2,

respecti-vamente.

Es decir, en este caso, con la elecci´on que hicimos de autovalores y autovectores, los ejesX′ eYse

obtienen rotando un ´angulo de 45o a los ejesX e

Y. A continuaci´on, dibujamos los ejes X′′ e Y′′,

paralelos respectivamente a los ejesX′ eY, que

resultan de trasladar el origen al centro de la hip´erbola C = (1,2). Finalmente, dibujamos la hip´erbola, que es muy f´acil de representar en las coordenadas x′′-y′′, teniendo en cuenta sus

as´ıntotas y sus cortes con los ejes X e Y, para obtener un dibujo cualitativo lo m´as parecido posible al real.

Y’ Y’’

X’’ Y

C

2

X’

−1

−7/4

7/2

X

(4) Vamos a obtener la ecuaci´on can´onica (reducida) y la representaci´on gr´afica de la c´onica −7x2+ 12xy+ 2y2+ 2x16y+ 12 = 0

mediante los cambios de coordenadas adecuados.

Puesto que la ecuaci´on de la c´onica tiene t´ermino enxy necesitamos hacer un giro para colocar los ejes en las direcciones de los autovectores de la matriz A (la que recoge los t´erminos cuadr´aticos),

”

x y

— –

−7 6 6 2

™–

x y

™

+ 2x16y+ 12 = 0, A=

–

−7 6 6 2

™

Calculamos los autovalores,

−7λ 6 6 2λ

Referencias

Documento similar

Se presenta un panorama epidemiológico de la lactancia en México, los principales constituyentes de la leche, los beneficios de ama- mantar, tanto para el bebé como para la madre,

T ) Or ccmifsion y mandato de los feñores del Confejo de fu A K cezavhe viftocidiícurío que ha hecho Don f rancifco deMiranr da y p3z,Capdlan de fu Mageíbd^en ia Real Capilla de

De esta forma, suponiendo la existencia de una familia de soluciones que mostrara estas caracter´ısticas y que fuera est´atica y esf´ericamente sim´etrica 26 , se pone de manifiesto

pero ni esas definiciones estatales pueden quedar al margen de toda hipo- tética controversia ni su omisión —sobre todo— debe llevar a alterar el carácter necesariamente limitado

Para los dos modelos biol´ ogicos que estudiamos a continuaci´ on, daremos criterios para saber si la matriz asociada al problema tiene valor propio dominate, sin necesidad de tener

Esta doctrina precisó la fijada en STS de 5 de abril de 2010 RC núm. 455/2006 en relación con las letras de cambio, en la que se estableció que la omisión, por parte de quien firma

El Centro de juventud y familia del colegio Santa Mariana de Jesús orienta, guía y acompaña a la comunidad Marianita dinamizando espacios para la formación en liderazgo,

1. LAS GARANTÍAS CONSTITUCIONALES.—2. C) La reforma constitucional de 1994. D) Las tres etapas del amparo argentino. F) Las vías previas al amparo. H) La acción es judicial en