Tema 14: Cálculo diferencial de funciones de varias variables II

(1)

Tema 14: Cálculo diferencial de funciones de varias variables II

1 Desarrollos de Taylor en varias variables

Vamos ahora a generalizar los desarrollos de Taylor que vimos para funciones de una variable. La idea es similar, pues intentamos aproximar una función por un polinomio, ahora en varias variables, utilizando para ello las derivadas parciales de la función. El motivo es idéntico al que exponíamos en aquel momento: las funciones más manejables son los polinomios, ya que involucran solamente operaciones elementales básicas (sumas, restas y productos). Enunciamos a continuación el teorema de Taylor para funciones de varias variables.

Teorema 1.1 Sea f : Rⁿ → R una función de clase C^k+1(B, R), donde B es una bola centrada en un punto x0 = (a1, ..., an). Entonces para cada punto x = (x1, ..., xn) ∈ B existe un punto ”intermedio” c entre x⁰ y x verificando

f (x) = f (x0) + 1 1!

Xn i=1

∂f

∂xi

(x0)(xi− aⁱ) + 1 2!

Xn i,j=1

∂²f

∂xi∂xj

(x0)(xi− aⁱ)(xj− a^j) + · · ·

· · · + 1 k!

Xn i1,i2,...,ik=1

∂^kf

∂x_i₁∂x_i₂· · · ∂xik

(x₀)(x_i₁− ai1)(x_i₂− ai2) · · · (xik− aik) + · · ·

· · · + 1 (k + 1)!

Xn i1,i2,...,ik+1=1

∂^k+1f

∂xi1∂xi2· · · ∂xⁱk+1

(c)(x_i₁− ai1)(x_i₂− ai2) · · · (xik+1− aik+1)

Observación 1.2 Cuando hablamos en el enunciado de un punto ”intermedio” c lo que se quiere decir es que dicho punto está en el segmento que une x0 con x (dicho segmento es el conjunto {x⁰+ t(x − x⁰) : 0 ≤ t ≤ 1}).

Observación 1.3 El polinomio de Taylor de orden k de f en x₀es la expresión anterior salvo el último término (el que va con el índice k + 1), el cual corresponde al resto de orden k, y que nos da una estimación del error que se comete al aproximar la función por el polinomio de Taylor. La expresión de f como suma de ambas cosas es lo que se conoce como fórmula o desarrollo de Taylor:

f (x) = pk(x) + Rk(x) Observación 1.4 Con las notaciones anteriores podemos poner

f (x) = T0(x) + T1(x) + ... + Tk(x) + Rk(x) siendo cada T_i(x) el término que recoge los sumandos de grado i. Así:

T0(x) = f (x0) T1(x) = 1

1!

Xn i=1

∂f

∂xi

(x0)(xi− aⁱ)

T2(x) = 1 2!

Xn i,j=1

∂²f

∂x_i∂x_j(x0)(xi− aⁱ)(xj− a^j) ...

T_k(x) = 1 k!

Xn i1,i2,...,ik=1

∂^kf

∂xi1∂xi2· · · ∂xⁱk

(x₀)(x_i₁− ai1)(x_i₂− ai2) · · · (xik− aik)

Rk(x) = 1 (k + 1)!

Xn i1,i2,...,ik+1=1

∂^k+1f

∂xi1∂xi2· · · ∂xⁱk+1

(c)(xi1− aⁱ1)(xi2− aⁱ2) · · · (xⁱk+1− aⁱk+1)

Observación 1.5 Escribimos a continuación los casos particulares más frecuentes:

(2)

1. Sea f : R²→ R. Entonces el polinomio de Taylor de grado 1 en el punto x⁰= (a, b) es f (a, b) +∂f

∂x(a, b)(x − a) +∂f

∂y(a, b)(y − b) El desarrollo de Taylor de grado 1 es

f (a, b) +∂f

∂x(a, b)(x − a) +∂f

∂y(a, b)(y − b) +1 2[∂²f

∂x²(c)(x − a)²+∂²f

∂y²(c)(y − b)²+ 2 ∂²f

∂x∂y(c)(x − a)(y − b)]

(incluido el resto), para cierto punto c del segmento que une (a, b) y (x, y) (observemos que la derivada cruzada lleva un 2 delante porque hay dos, _∂x∂y^∂²^f y _∂y∂x^∂²^f ). El polinomio de Taylor de grado 2 es

f (a, b) +∂f

∂x(a, b)(x − a) +∂f

∂y(a, b)(y − b) +1 2[∂²f

∂x²(a, b)(x − a)²+∂²f

∂y²(a, b)(y − a)²+ 2 ∂²f

∂x∂y(a, b)(x − a)(y − b)]

El resto para el grado 2 sería pues 1

6[∂³f

∂x³(c)(x − a)³+∂³f

∂y³(c)(y − b)³+ 3 ∂³f

∂x²∂y(c)(x − a)²(y − b) + 3 ∂³f

∂x∂y²(c)(x − a)(y − b)²]

para cierto punto c del segmento que une (a, b) y (x, y) (observemos que las derivadas cruzadas van de tres en tres, por eso llevan delante un 3). Finalmente el polinomio de Taylor grado 3 sería

f (a, b) +∂f

∂x(a, b)(x − a) +∂f

∂y(a, b)(y − b) +1 2[∂²f

∂x²(a, b)(x − a)²+ +∂²f

∂y²(a, b)(y − b)²+ 2 ∂²f

∂x∂y(a, b)(x − a)(y − b)] +1 6[∂³f

∂x³(a, b)(x − a)³+ +∂³f

∂y³(a, b)(y − b)³+ 3 ∂³f

∂x²∂y(a, b)(x − a)²(y − b) + 3 ∂³f

∂x∂y²(a, b)(x − a)(y − b)²] 2. Sea f : R³→ R. Entonces el polinomio de Taylor de grado 1 en el punto (a1, a₂, a₃) es

f (a1, a2, a3) +∂f

∂x(a1, a2, a3)(x − a¹) +∂f

∂y(a1, a2, a3)(y − a²) +∂f

∂z(a1, a2, a3)(z − a³) con resto 1

2[∂²f

∂x²(c)(x − a¹)²+∂²f

∂y²(c)(y − a²)²+∂²f

∂z²(c)(z − a³)²+ 2 ∂²f

∂x∂y(c)(x − a¹)(y − a²)+

+2 ∂²f

∂x∂z(c)(x − a¹)(z − a³) + 2 ∂²f

∂y∂z(c)(y − a²)(z − a³)]

para cierto punto c del segmento que une (a₁, a₂, a₃) y (x, y, z). El polinomio de Taylor de grado 2 es

f (a1, a2, a3) +∂f

∂x(a1, a2, a3)(x − a¹) +∂f

∂y(a1, a2, a3)(y − a²) +∂f

∂z(a1, a2, a3)(z − a³)+

+1 2[∂²f

∂x²(a₁, a₂, a₃)(x − a1)²+∂²f

∂y²(a₁, a₂, a₃)(y − a2)²+∂²f

∂z²(a₁, a₂, a₃)(z − a3)²+ +2 ∂²f

∂x∂y(a₁, a₂, a₃)(x − a1)(y − a2) + 2 ∂²f

∂x∂z(a₁, a₂, a₃)(x − a1)(z − a3) + 2∂²f

∂y∂z(a₁, a₂, a₃)(y − a2)(z − a3)]

Ejemplo 1.6 1. Consideremos la función f (x, y) = x cos y − y sin x Las derivadas parciales primeras de f son

∂f

∂x = cos y − y cos x ^∂f_∂y = −x sin y − sin x El polinomio de Taylor de orden 1 de f en el punto (−π, 0) es

p₁(x, y) = f (−π, 0) +∂f

∂x(−π, 0) · (x + π) +∂f

∂y(−π, 0) · y = −π + (x + π)

(3)

Las derivadas parciales segundas de f son

∂²f

∂x² = y sin x _∂x∂y^∂²^f = − sin y − cos x ^∂∂y²^f² = −x cos y El polinomio de Taylor de orden 2 de f en el punto (−π, 0) es

p2(x, y) = −π + (x + π) +1 2[∂²f

∂x²(−π, 0) · (x + π)²+ 2 ∂²f

∂x∂y(−π, 0) · (x + π)y +∂²f

∂y²(−π, 0) · y²] =

= −π + (x + π) + (x + π)y +π 2y²

Normalmente no se desarrollarán los paréntesis en las expresiones del tipo (x − x0) ó (y − y0) (en este caso no lo haremos con (x + π)).

2. Consideremos la función f (x, y, z) = ^x_y − ze^x

Si hallamos las derivadas parciales primeras, nos resultan

∂f

∂x = ¹_y− ze^x ^∂f∂y = −y^x²

∂f

∂z = −e^x

Si queremos calcular el polinomio de Taylor de orden 1 de f en el punto (1, 1, 0), puesto que f (1, 1, 0) = 1 ^∂f_∂x(1, 1, 0) = 1 ^∂f_∂y(1, 1, 0) = −1 ^∂f_∂z(1, 1, 0) = −e obtendremos que

p1(x, y, z) = f (1, 1, 0) +∂f

∂x(1, 1, 0) · (x − 1) +∂f

∂y(1, 1, 0) · (y − 1) + ∂f

∂z(1, 1, 0) · z =

= 1 + (x − 1) − (y − 1) − ez

Para hallar el polinomio de Taylor de orden 2 hallaremos las derivadas parciales de orden 2:

∂²f

∂x² = −ze^x ∂x∂y^∂²^f = −y¹²

∂²f

∂x∂z= −e^x ^∂∂y²^f² =^2x_y3

∂²f

∂y∂z = 0 ^∂_∂z²^f2 = 0 Así el polinomio de Taylor es

p2(x, y, z) = 1 + (x − 1) − (y − 1) − ez+

+1 2[∂²f

∂x²(1, 1, 0) · (x − 1)²+∂²f

∂y²(1, 1, 0) · (y − 1)²+∂²f

∂z²(1, 1, 0) · z²+ +2 ∂²f

∂x∂y(1, 1, 0) · (x − 1)(y − 1) + 2 ∂²f

∂x∂z(1, 1, 0) · (x − 1)z + 2 ∂²f

∂y∂z(1, 1, 0) · (y − 1)z] =

= 1 + (x − 1) − (y − 1) − ez + (y − 1)²− (x − 1)(y − 1) − e(x − 1)z 3. Consideremos la función

f (x, y) = (x − y)e^x²^+y² Si hallamos las derivadas parciales primeras, nos resultan

∂f

∂x = (1 + 2x²− 2xy)e^x²^+y² ^∂f∂y = (−1 + 2xy − 2y²)e^x²^+y²

Si lo que queremos es calcular el polinomio de Taylor de orden 1 de f en el punto (1, −2), puesto que f (1, −2) = 3e⁵ ^∂f_∂x(1, −2) = 7e⁵ ^∂f_∂y(1, −2) = −13e⁵

tendremos que

p1(x, y) = f (1, −2) +∂f

∂x(1, −2) · (x − 1) +∂f

∂y(1, −2) · (y + 2) =

= 3e⁵+ 7e⁵(x − 1) − 13e⁵(y + 2).

Para hallar el polinomio de Taylor de orden 2 calcularemos antes las derivadas parciales de orden 2, que son las siguientes:

∂²f

∂x² = (6x − 2y + 4x³− 4x²y)e^x²^+y² ^∂_∂y²^f2 = (2x − 6y + 4xy²− 4y³)e^x²^+y²

(4)

∂²f

∂x∂y =_∂y∂x^∂²^f = (−2x + 2y + 4x²y − 4xy²)e^x²^+y² Cuando evaluemos en el punto (1, −2) obtendremos que

∂²f

∂x²(1, −2) = 22e⁵ ^∂∂y²^f²(1, −2) = 62e⁵ ∂x∂y^∂²^f (1, −2) = ∂y∂x^∂²^f (1, −2) = −30e⁵ Entonces el polinomio de Taylor es

p₂(x, y) = f (1, −2) +∂f

∂x(1, −2)(x − 1) +∂f

∂y(1, −2)(y + 2)+

1 2[∂²f

∂x²(1, −2) · (x − 1)(x − 1) + ∂²f

∂x∂y(1, −2) · (x − 1)(y + 2)+

+ ∂²f

∂y∂x(1, −2) · (y + 2)(x − 1) +∂²f

∂y²(1, −2) · (y + 2)(y + 2)] =

= 3e⁵+ 7e⁵(x − 1) − 13e⁵(y + 2) + 11e⁵(x − 1)²− 30e⁵(x − 1)(y + 2) + 31e⁵(y + 2)². 4. Consideremos la función f (x, y) = (x²− 3x)e^y²

Calculemos su polinomio de Taylor de grado 3 en el punto (0, 0).

Las derivadas parciales de órdenes 1, 2 y 3 son:

∂f

∂x = (2x − 3)e^y² ^∂f∂y = 2y(x²− 3x)e^y²

∂²f

∂x² = 2e^y² ^∂_∂y²^f2 = 2(x²− 3x)(1 + 2y²)e^y² _∂x∂y^∂²^f = _∂y∂x^∂²^f = (2x − 3)2ye^y²

∂³f

∂x³ = 0 _∂x∂y^∂³^f2 =_∂y∂x∂y^∂³^f = _∂y^∂³2^f∂x = 2(2x − 3)(1 + 2y²)e^y²

∂³f

∂x²∂y = _∂x∂y∂x^∂³^f =_∂y∂x^∂³^f2 = 4ye^y² ^∂_∂y³^f3 = 4y(x²− 3x)(2y²+ 3)e^y² Evaluando en el punto (0, 0) tendremos que

f (0, 0) = 0 ^∂f_∂x(0, 0) = −3 ^∂f∂y(0, 0) = 0

∂²f

∂x²(0, 0) = 2 ^∂_∂y²^f2(0, 0) = 0 _∂x∂y^∂²^f (0, 0) =_∂y∂x^∂²^f (0, 0) = 0

∂³f

∂x³(0, 0) = 0 _∂x^∂³2^f∂y(0, 0) = _∂x∂y∂x^∂³^f (0, 0) =_∂y∂x^∂³^f2(0, 0) = 0

∂³f

∂x∂y²(0, 0) = _∂y∂x∂y^∂³^f (0, 0) =_∂y^∂³2^f∂x(0, 0) = −6 ^∂∂y³^f³(0, 0) = 0 Entonces el polinomio de Taylor es

p₃(x, y) = f (0, 0) +∂f

∂x(0, 0) · x +∂f

∂y(0, 0) · y +1 2[∂²f

∂x²(0, 0) · x²+ 2 ∂²f

∂x∂y(0, 0) · x · y +∂²f

∂y²(0, 0) · y²]+

+1 6[∂³f

∂x³(0, 0) · x³+ 3 ∂³f

∂x²∂y(0, 0) · x²· y + 3 ∂³f

∂x∂y²(0, 0) · x · y²+∂³f

∂y³(0, 0) · y³] =

= 0 − 3x + 0y +1

2[2x²+ 2 · 0xy + 0y²] + 1

6[0x³+ 3 · 0x²y + 3 · (−6)xy²+ 0y³] = −3x + x²− 3xy²

2 Máximos y mínimos

Nos vamos a ocupar en este bloque del estudio de extremos (máximos y mínimos) de funciones reales de varias variables.

Hay varios conceptos distintos que debemos tratar. En primera instancia vamos a ocuparnos de los extremos relativos.

(5)

2.1 Extremos relativos

Diremos que una función f : Rⁿ → R definida en un entorno de un punto x0 presenta un máximo relativo en x₀ cuando exista una bola centrada en x0 de manera que f (x0) es el valor más grande de todos los valores de f en los puntos de la bola. Esto significa que ∃r > 0 tal que f(x0) ≥ f(x) ∀x ∈ B(x0, r). De modo similar se define el concepto de mínimo relativo cuando ∃r > 0 tal que f(x⁰) ≤ f(x) ∀x ∈ B(x⁰, r), es decir, si f (x0) es el valor más pequeño de todos los valores de f en los puntos de alguna bola.

La ideal intuitiva de los extremos relativos es alcanzar el máximo o el mínimo valor localmente, en un entorno.

Así, en una cadena montañosa, en la cima de cada montaña existirá un máximo relativo. En la superficie que aparece a continuación desde distintos puntos de vista se alcanzan diversos máximos y mínimos relativos (en la última gráfica que se ve de perfil se observan todos).

Este problema puede estudiarse mejor si la función f es de clase C¹ , pues en este caso obtenemos la siguiente condición necesaria (similar a la que se tenía para funciones de una variable):

Propiedad: Supongamos que tenemos una función f : Rⁿ → R diferenciable definida en una bola B. Si f tiene en x0 ∈ B un extremo relativo (sea máximo o mínimo) entonces df(x⁰) = 0, es decir, todas las derivadas parciales de orden 1 de f se anulan en x₀ (o sea, _∂x^∂f

i(x₀) = 0 para todo i = 1, 2, ..., n).

El resultado anterior nos da una condición necesaria para que una función f tenga en un punto un extremo relativo, la cual no es una condición suficiente, pues hay casos en los que la diferencial se anula y sin embargo no hay extremo relativo (como ocurrirá, por ejemplo, con los puntos de silla en funciones de dos variables, como después veremos).

Por lo tanto para buscar los extremos relativos de f buscaremos entre los puntos que anulen a todas las derivadas parciales (éstos los llamaremos puntos críticos), los cuales serán los candidatos a ser extremos relativos, pues los extremos relativos (si los hay) estarán entre ellos. Y para hallar los puntos críticos deberemos resolver el sistema de ecuaciones

∂f

∂x1 = 0 _∂x^∂f

2 = 0 ... _∂x^∂f

n = 0

A continuación veremos herramientas que, bajo ciertas condiciones, nos asegurarán si en un punto crítico se alcanza verdaderamente un extremo relativo, y en su caso, si se alcanza un máximo o mínimo relativo. Para ello necesitamos estudiar lo que vamos a denominar matriz hessiana de f en x0 (cuando f es de clase C²), que es la siguiente

Hf (x₀) =

⎛

⎜⎜

⎝

f_x₁_x₁(x₀) f_x₁_x₂(x₀) · · · fx1xn(x₀) fx2x1(x0) fx2x2(x0) · · · f^x2xn(x0)

· ·

fxnx1(x0) fxnx2(x0) · · · f^xnxn(x0)

⎞

⎟⎟

⎠

Como vemos la matriz hessiana es la que está formada por todas las derivadas parciales segundas de la función. A continuación vamos considerando la sucesión de menores principales de la matriz hessiana (denominados también menores hessianos):

∆₁f (x₀) = f_x₁_x₁(x₀) ∆₂f (x₀) =

¯¯

¯

fx1x1(x0) fx1x2(x0) f_x₂_x₁(x₀) f_x₂_x₂(x₀)

¯¯

¯

∆₃f (x₀) =

¯¯

¯

f_x₁_x₁(x₀) f_x₁_x₂(x₀) f_x₁_x₃(x₀) fx2x1(x0) fx2x2(x0) fx2x3(x0) fx3x1(x0) fx3x2(x0) fx3x3(x0)

¯¯

¯

... ∆_nf (x₀) = |Hf(x0)|

(6)

Suponiendo que x0es un punto crítico de f se tiene entonces que:

1) Si todos los menores hessianos son estrictamente positivos se tiene que f presenta en x0un mínimo relativo.

2) Si la sucesión de menores hessianos es alternada en el siguiente sentido

∆1f (x0) < 0 ∆2f (x0) > 0 ∆3f (x0) < 0 ... (−1)ⁿ∆nf (x0) > 0 se tiene que f presenta en x0un máximo relativo.

3) Si no estamos ante ninguno de los dos casos anteriores y el determinante de la matriz hessiana es no nulo, podemos garantizar que no se alcanza ni máximo ni mínimo.

4) Si el determinante de la matriz hessiana es nulo, entonces se tiene una indeterminación, es decir, este criterio no nos aporta información suficiente para deducir el carácter del punto crítico.

Por su simplicidad y por su mayor aplicación en la práctica resulta interesante estudiar el caso particular de funciones de dos variables, o sea, cuando n = 2, en el que la matriz hessiana es

Ã f_x₁_x₁(x₀) f_x₁_x₂(x₀) fx2x1(x0) fx2x2(x0)

!

En esta situación particular se tiene que:

1) Si ∆1f (x0) > 0 y |Hf(x⁰)| > 0, entonces f tiene en x⁰un mínimo relativo.

2) Si ∆₁f (x₀) < 0 y |Hf(x0)| > 0, entonces f tiene en x0un máximo relativo.

3) Si se cumple que |Hf(x⁰)| < 0, en esta situación el punto no es un extremo relativo, pues puede comprobarse que en toda bola centrada en x₀ hay puntos en los que la función toma valores menores que f (x₀) y otros en los que la función toma valores mayores que f (x0). En este caso particular se dice que f tiene en x0 un punto de silla.

4) Si se cumple |Hf(x0)| = 0, no podemos afirmar nada sobre lo que ocurre en x0, y para determinar qué es lo que ocurre en el punto crítico será necesario estudiar el comportamiento de la función en un entorno del punto.

Ejemplo 2.1 Hallar los puntos en los que las siguientes funciones presentan extremos relativos:

1.

f (x, y) = −x²+ 2xy − 2y²

Las derivadas parciales son fx= −2x + 2y fy = 2x − 4y Entonces al resolver el sitema de ecuaciones

−2x + 2y = 0 2x − 4y = 0

se tiene que el único punto que es solución del sistema anterior (el único punto crítico) es el (0, 0). La matriz hessiana resulta entonces

Hf (0, 0) =

Ã f_xx(0, 0) f_xy(0, 0) fyx(0, 0) fyy(0, 0)

!

=

Ã −2 2

2 −4

!

con lo que obtenemos que ∆₁f (0, 0) = −2 < 0 ∆₂f (0, 0) = 4 > 0 y deducimos entonces que f tiene en (0, 0) un máximo relativo.

2.

f (x, y) = x²− 4xy + 3y² Su único punto crítico es el (0, 0), siendo su matriz hessiana

Hf (0, 0) =

Ã 2 −4

−4 6

!

con lo que ∆₁f (0, 0) = 2 > 0 ∆₂f (0, 0) = −4 < 0

y entonces f alcanza en él un punto de silla, y no un extremo relativo (de hecho en el punto (0, 0) la función vale 0; si consideramos puntos distintos del (0, 0) de la forma x = 2y la función es negativa y para puntos distintos del (0, 0) de la forma y = 0 la función es positiva).

(7)

3.

f (x, y) = (x − 1)²y²+ (x − 1)²+ y² Las derivadas parciales son

fx= 2(x − 1)y²+ 2(x − 1) = 2(x − 1)(y²+ 1) fy= 2y(x − 1)²+ 2y = 2y[(x − 1)²+ 1]

con lo que el único punto crítico de f es el (1, 0). Y como se tiene que las derivadas segundas valen fxx= 2(y²+ 1) fxy= fyx= 4(x − 1)y fyy= 2[(x − 1)²+ 1]

la matriz hessiana de f es la siguiente Hf (x, y) =

Ã 2(y²+ 1) 4(x − 1)y 4(x − 1)y 2[(x − 1)²+ 1]

!

con lo que en el punto en cuestión tenemos

Hf (1, 0) =

Ã 2 0 0 2

!

y entonces ∆1f (1, 0) = 2 > 0 ∆2f (1, 0) = 4 > 0 así que la función f tiene en el punto (1, 0) un mínimo relativo.

4.

f (x, y) = x³+ y²− xy Las derivadas parciales son

fx= 3x²− y fy = 2y − x Entonces al resolver el sitema de ecuaciones

3x²− y = 0 2y − x = 0 Despejando de la segunda ecuación

x = 2y y sustituyendo esto en la primera se obtiene1

12y²− y = 0

con lo que nos sale que y puede tomar los valores 0,₁₂¹, y por tanto nos salen los puntos críticos (0, 0), (1

6, 1 12) Las derivadas segundas salen

f_xx= 6x f_xy= f_yx= −1 f_yy= 2 y la matriz hessiana de f es la siguiente

Hf (x, y) =

Ã 6x −1

−1 2

!

con lo que en los puntos críticos vale

Hf (0, 0) =

Ã 0 −1

−1 2

!

Hf (1 6, 1

12) =

Ã 1 −1

−1 2

!

Así en el primer punto se tiene ∆₁f (0, 0) = 0 ∆₂f (0, 0) = −1 < 0 por tanto hay punto de silla, y en el segundo punto se tiene

∆1f (¹₆,₁₂¹) = 1 > 0 ∆2f (¹₆,₁₂¹) = 1 > 0 por tanto se alcanza un mínimo relativo.

(8)

5.

f (x, y, z) = x²+ y²+ 4z²− 2xz + 2z + 2yz − 3 Las derivadas parciales son f_x= 2x − 2z f_y= 2y + 2z 8z − 2x + 2 + 2y luego los puntos críticos resultan de resolver el sistema

2x − 2z = 0 2y + 2z = 0 8z − 2x + 2 + 2y = 0

De las dos primeras obtenemos que x = z = −y lo que al sustituir en la última nos permite obtener z = −¹2, x = −¹2 e y = ¹₂ teniendo así el único punto crítico P = (−¹2,¹₂, −¹2) Al calcular las derivadas segundas obtenemos la matriz hessiana

Hf (x, y, z) =

⎛

⎜⎝

2 0 −2

0 2 2

−2 2 8

⎞

⎟⎠

que al ser constante es válida también para P . En definitiva los determinantes hessianos valen 2, 4, 16 por lo que f presenta en P un mínimo relativo.

6.

f (x, y, z) = x²+ 2y²+ 2z²− 2xz + 2z − 4yz − 3

Las derivadas parciales son

fx= 2x − 2z fy= 4y − 4z 4z − 2x + 2 − 4y luego los puntos críticos resultan de resolver el sistema

2x − 2z = 0 4y − 4z = 0 4z − 2x + 2 − 4y = 0

De las dos primeras obtenemos que x = z = y, lo que al sustituir en la última nos da x = 1, y = 1, z = 1 Así el único punto crítico es P = (1, 1, 1) Al calcular las derivadas segundas obtenemos la matriz hessiana

Hf (x, y, z) =

⎛

⎜⎝

2 0 −2

0 4 −4

−2 −4 4

⎞

⎟⎠

que al ser constante es válida también para P . En definitiva los determinantes hessianos valen 2, 8, −16 por lo que el criterio de la matriz hessiana nos dice que en P la función f no presenta ni un máximo ni un mínimo relativo.

7.

f (x, y) = 3(x + 1)²+ (y − 2)⁴

Esta función tiene como único punto crítico al (−1, 2). Sin embargo si hallamos la matriz hessiana tenemos que

Hf (−1, 2) =

Ã 6 0 0 0

!

con lo que ∆₁f (−1, 2) = 6 > 0 ∆₂f (−1, 2) = 0

(9)

por lo que nuestro criterio no nos proporciona información de la naturaleza de este punto crítico. Para casos como éste podríamos intentar ver de modo directo (usando la definición) si un punto crítico es o no un máximo o un mínimo relativo:

En nuestro caso puede comprobarse que en este punto la función f alcanza un mínimo relativo, pues f (−1, 2) = 0 y para cualquier punto (x, y) 6= (−1, 2) se tiene que

f (x, y) = 3(x + 1)²+ (y − 2)⁴> 0

Nota: En el apéndice veremos este método aplicado con más detalle a otros ejemplos.

8.

f (x, y) = −x²y²

Las derivadas parciales primeras son fx= −2xy² fy= −2yx² con lo que los puntos críticos de f son los de la forma (a, 0) y (0, b), para a, b ∈ R. Las derivadas parciales segundas de f son

fxx= −2y² fxy= fyx= −4xy fyy= −2x² por lo que se cumple que la matriz hessiana de f es

Hf (x, y) =

Ã −2y² −4xy

−4xy −2x²

!

con lo que en los puntos de la forma (a, 0) se verifica que

Hf (a, 0) =

Ã 0 0

0 −2a²

!

y en puntos de la forma (0, b) tenemos que

Hf (0, b) =

Ã −2b² 0

0 0

!

En ambas situaciones tenemos que ∆₂f (0, 0) = 0 así que el criterio de la matriz hessiana no nos aporta información suficiente para saber qué es lo que ocurre en estos puntos críticos. Ahora bien, es claro que

f (a, 0) = f (0, b) = 0

y que para todo punto (x, y) se tiene que f (x, y) ≤ 0 por lo que es obvio que f presenta en todos estos puntos un máximo relativo.

9.

f (x, y) = xy⁴

Las derivadas parciales primeras son f_x= y⁴ f_y= 4xy³ con lo que los puntos críticos de f son los de la forma (a, 0), para a ∈ R. Las derivadas parciales segundas de f son

fxx= 0 fxy= fyx= 4y³ fyy= 12xy² por lo que se cumple que la matriz hessiana de f es

Hf (x, y) =

Ã 0 4y³ 4y³ 12xy²

!

con lo que en los puntos de la forma (a, 0) se verifica que Hf (a, 0) =

Ã 0 0 0 0

!

(10)

En este caso el criterio de la matriz hessiana no nos aporta información suficiente para saber qué es lo que ocurre en estos puntos críticos (para cualquier a se tiene que ∆2f (a, 0) = 0). Debemos realizar un estudio directo en los puntos de la forma (a, 0). En primer lugar decir que todos ellos se tiene que

f (a, 0) = 0

Caso 1: a < 0 Como f (a, 0) = 0 y f (x, y) ≤ 0 para todo punto cercano se tiene que f presenta en el punto un máximo relativo.

Caso 2: a > 0 Como f (a, 0) = 0 y f (x, y) ≥ 0 para todo punto cercano se tiene que f presenta en el punto un mínimo relativo.

Caso 3: a = 0 Primero se tiene que f (0, 0) = 0 Si tomamos (x, y) cercano al origen con x > 0, y 6= 0 se tiene que f (x, y) > 0 Si tomamos (x, y) cercano al origen con x < 0, y 6= 0 se tiene que f(x, y) < 0 Así vemos que toda bola centrada en el punto (0, 0) tiene puntos con valores mayores que él y otros puntos con valores menores que él. Por ello se tiene que f no presenta en el punto ni máximo relativo ni un mínimo relativo.

2.2 Extremos absolutos

Ocupémonos finalmente de los extremos absolutos, es decir, de los valores máximo y mínimo que alcanza una función a lo largo de un conjunto.

Definición 2.2 Diremos que una función f : Rⁿ → R definida en un conjunto Ω presenta en un punto x0 ∈ Ω el máximo absoluto en Ω cuando f (x0) es el valor más grande de todos los valores de f en los puntos de Ω, es decir f (x₀) ≥ f(x) ∀x ∈ Ω. De modo similar se define el concepto de mínimo absoluto en Ω, cuando f(x0) es el valor más pequeño de todos los valores de f en los puntos de Ω, es decir f (x0) ≤ f(x) ∀x ∈ Ω.

En la primera superficie, que está vista de perfil, tenemos una situación (ya vista anteriormente, cuando obser- vábamos los extremos relativos) donde se presentan diversos máximos y mínimos relativos, alcanzándose el máximo y el mínimo absoluto en los picos que están en la parete derecha. En la superficie que se ve en la segunda de las gráficas que vienen a continuación se alcanza el máximo absoluto en el ”pico” que se observa al fondo (aunque haya varios máximos relativos en el interior). En la tercera se observa la misma superficie en otro dominio más amplio, donde el máximo absoluto se alcanza en diversos puntos tanto de la parte posterior como de la anterior.

Los conjuntos con los que más vamos a trabajar van a ser de dos tipos:

Primer tipo: conjuntos dados por restricciones o ligaduras. En R² serían conjuntos como segmentos, curvas, trozos de curvas o unión de éstos (de tipo unidimensional). Para el caso de R³ serían, además de los anteriores (de tipo unidimensional), superficies, trozos de ellas o unión de éstos (de tipo bidimensional). En general son conjuntos dados por una o varias restricciones o ligaduras en forma de ecuaciones.

Segundo tipo: conjuntos compactos que son unión de un abierto y su frontera (o borde), siendo ésta un conjunto de los que hemos considerado del primer tipo.

Veamos cuáles son los puntos candidatos para que la función alcance en ellos un extremo absoluto:

Para los conjuntos del primer tipo serán, por un lado, los puntos especiales que posea el conjunto, como picos o vértices (en muchas ocasiones estos puntos especiales aparecen porque alguna de las restricciones del conjunto no

(11)

es una curva entera sino un trozo de curva definida en un intervalo, y entonces el punto que está al final del trozo de curva es uno de esos puntos especiales), y por otro puntos en los que la función presenta lo que se denomina un extremo relativo condicionado por las restricciones del conjunto. De este último tipo no hemos estudiado ningún caso aún. Aunque lo veremos en los diversos ejemplos y en el apéndice está muy desarrollada esta cuestión, para lo que nos atañe, los extremos absolutos solamente, no es necesaria la extensión y el detalle expuestos en el apéndice. Diremos que, con carácter general, el problema consiste en que de la ecuación o ecuaciones se despejan unas variables en función de otras, se sustituyen estos despejes en la función a maximizar o minimizar y para esta nueva función, dependiente ahora de menos variables, se calculan los extremos relativos.

Para los conjuntos del segundo tipo serán, además de los que se calculen en la frontera (y que como ésta es un conjunto del primer tipohemos comentado ya en el apartado anterior cómo se hace), los puntos del conjunto que sean candidatos a que en ellos la función alcance un extremo relativo, o, más sencillamente, los puntos críticos de la función que pertenezcan al conjunto.

Finalmente una vez obtenidos todos estos candidatos se calcula el valor que toma la función en todos ellos, y en los que dicho valor sea mayor (respectivamente, menor) la función alcanzará el máximo (respectivamente, el mínimo) absoluto en el conjunto.

Observación 2.3 Cuando calculemos los puntos críticos no será preciso ver si en ellos la función presenta o no máximos o mínimos relativos (o condicionados), pues sólo nos interesará saber si en ellos se alcanza un máximo o mínimo absoluto, para lo cual sólo tenemos que calcular el valor que toma la función en ellos.

Ejemplo 2.4 En todos los apartados hallar los extremos absolutos de las funciones que se dan y los puntos en los que se alcanzan.

1.

f (x, y) = x³+ y³− 6xy en el conjunto

Ω = {(x, y) : −1 ≤ x ≤ 4, y = 2}

Este conjunto es un segmento; concretamente el segmento de la recta y = 2 comprendido entre x = −1 y x = 4.

De este modo los extremos absolutos se tendrán que alcanzar o bien en los extremos del segmento, en los puntos (−1, 2) y (4, 2), o en algún otro punto, en el que forzosamente la función debería alcanzar un extremo relativo condicionado por la ligadura y = 2. Por ello consideramos la función de una variable

g(x) = f (x, 2) = x³+ 8 − 12x

(pero únicamente para x en el intervalo [−1, 4]). Los puntos críticos de g son los que cumplen la ecuación 0 = g⁰(x) = 3x²− 12

es decir, los puntos x = ±2. Como el valor x = −2 está fuera de nuestro rango (pues −1 ≤ x ≤ 4), éste no nos sirve de manera que el único punto crítico de g que tomaremos es x = 2. Luego un candidato a que f alcance en él un extremo absoluto de Ω se tiene para x = 2, y = 2, es decir, el punto (2, 2). Finalmente hallamos el valor de la función en los candidatos:

f (2, 2) = −8 f (−1, 2) = 19 f (4, 2) = 24

Esto significa que en Ω el máximo absoluto de f se alcanza en el punto (4, 2) con un valor de f (4, 2) = 24 y el mínimo absoluto se alcanza en el punto (2, 2) con un valor de f (2, 2) = −8.

2.

f (x, y) = x²y + 2xy²+ 2xy en el conjunto

Ω = {(x, y) : −1 ≤ x ≤ 1, −1 ≤ y ≤ 1}