NOTAS DE CLASE
CÁLCULO III
Doris Hinestroza
Diego L. Hoyos
Índice general
1. Funciones Vectoriales 5
1.1. El Espacio Rn . . . . 5
1.2. Funciones Vectoriales . . . 7
1.2.1. Operaciones algebraicas. . . 8
1.2.2. Límites, derivadas e integrales. . . 9
1.2.2.1. Teoremas básicos . . . 10
1.3. Curvas y Tangentes . . . 12
1.4. Longitud de arco y reparametrización de una curva. . . 14
1.5. Curvatura . . . 17
1.5.1. Triedro de Frenet . . . 19
1.5.2. El vector aceleración. . . 20
1.5.3. *Ecuaciones de Frenet para una curva plana. . . 21
2. Campos Escalares en R2 y R3 24 2.1. Gráfica de z = f (x, y). Curvas y superficies de nivel. . . 24
2.1.1. Superficies cuádricas. . . 31 2.2. Límites y Continuidad . . . 31 2.3. Funciones Diferenciables . . . 34 2.3.1. Derivadas parciales . . . 34 2.3.2. Superficies parametrizadas . . . 35 2.3.3. El plano tangente . . . 38 2.3.4. El concepto de diferenciabilidad . . . 39 2.4. La Regla de la Cadena . . . 44 2.4.1. El vector gradiente . . . 46 2.5. Derivadas Direccionales . . . 48 2.6. Máximos y Mínimos. . . 51
2.6.1. Criterio para determinar extremos de funciones de dos variables . . . 53
2.6.2. Extremos condicionados. . . 55
2.7. *Temas de Lectura . . . 65
2.7.2. Derivada en una dirección de un campo escalar en Rn.
Derivadas direccionales y parciales. . . 66
2.7.3. Diferenciabilidad de un campo escalar en Rn. . . . 68
2.7.4. Regla de la cadena para campos escalares en Rn. . . . . 71
2.7.5. Derivada en una dirección de un campo vectorial. Deriva-da direccional . . . 73
2.7.6. Diferenciabilidad de un campo vectorial . . . 74
2.7.7. Regla de la cadena para campos vectoriales. . . 76
2.7.8. Fórmula de Taylor de orden dos para campos escalares . 80 2.7.9. Naturaleza de un punto crítico teniendo como criterio los valores propios de la matriz Hessiana . . . 82
2.7.10. Criterio para determinar extremos de funciones de dos variables . . . 84
2.7.11. Ley de la conservación de la energía. Campos conservativos 85 3. Integrales Múltiples 87 3.1. Integrales Dobles . . . 87
3.1.1. Propiedades de la Integral doble . . . 88
3.1.2. Integración en regiones más generales . . . 89
3.1.3. Cálculo de integrales dobles: áreas y volúmenes. . . 91
3.1.4. Cambio de variable . . . 95
3.1.4.1. La fórmula del cambio de variable . . . 97
3.2. Integrales Triples . . . 101
3.2.1. Regiones más generales . . . 102
3.2.2. Cambio de variable en integrales triples. . . 104
3.2.2.1. Coordenadas cilíndricas. . . 105
3.2.2.2. Coordenadas esféricas. . . 106
3.3. Aplicaciones de las integrales múltiples. . . 107
3.3.1. Momentos y centros de masa. . . 107
3.3.2. Densidad y masa. . . 109
3.3.3. Momento de Inercia. . . 112
3.3.4. Probabilidad. . . 116
3.3.4.1. Valores esperados . . . 116
4. Integrales de Línea. Áreas de Superficies e Integrales de Su-perficie 117 4.1. Integral de Línea . . . 117
4.1.1. Propiedades de la Integrales de línea . . . 119
4.2. El concepto de trabajo como integral de línea . . . 121
4.3. Campos conservativos y funciones potenciales . . . 123
4.4. El teorema de Green . . . 124
4.5. Área de una superficie . . . 130
4.6.1. Integral de superficie de una función escalar . . . 133 4.6.2. Integral de superficie de un campo vectorial . . . 134
Capítulo 1
Funciones Vectoriales
En este cap´ítulo combinaremos el álgebra lineal y los métodos fundamentales del cálculo para estudiar algunas aplicaciones de las curvas y algunos problemas de Mecánica.
1.1.
El Espacio R
nEl espacio Rn es el conjunto de todas las n-uplas de números reales:
Rn=
{(x1, x2, ..., xn) : xi ∈ R, i = 1, 2, 3, ...n)} .
Los elementos de Rn se le llaman vectores.
En Rndefinimos la suma de vectores y producto por escalares. Si −→a = (x
1, x2, ..., xn)
y −→b = (y1, y2, ..., yn) entonces −→a +−→b es el elemento de Rn dado por
−
→a +−→b = (x1+ y1, x2+ y2, ..., xn+ yn). Para cada escalar λ ∈ R, el vector λ−→a es definido por
λ−→a = (λx1, λx2, ..., λxn).
El producto escalar entre dos vectores de Rn está definido por
−
→a ·−→b =Xn
i=1
xiyi.
−
→a ·−→b = −→b · −→a
(−→a +−→b )· −→c = →−a · −→c +−→b · −→c −→
λa·−→b = λ−→a ·−→b= −→a ·−→λb La longitud o norma de un vector de Rn es definida por
||−→a|| =√−→a .−→a = q (x1)2+ (x2)2+ ... + (xn)2 o ||−→a||2= −→a · −→a . La distancia entre −→a y −→b se define por
dist(−→a ,−→b ) =k−→a −−→bk, para cada −→a y −→b ∈ Rn
Propiedades importantes de la definición de longitud o norma son las siguientes:
||−→a|| ≥ 0, ∀−→a ∈ Rn ||λ−→a|| = |λ| ||−→a|| ||−→a +−→b|| ≤ ||−→a|| + ||−→b|| −→a · − →b ≤ ||−→a|| || − →b ||
El ángulo θ entre los vectores −→a y−→b está dado por la relación. cos θ = −→a ·
−→b k−→ak k−→bk
En el caso que −→a y−→b ∈ R3 definiremos otro producto entre vectores conocido
como producto vectorial que se denota por −→a ×−→b y lo definimos como − →a ×−→b = i j k x1 x2 x3 y1 y2 y3 = (x2y3− x3y2, x3y1− x1y3, x1y2− x2y1).
Recordemos algunas propiedades del producto vectorial − →a ×−→b ⊥ −→a y −→a ×−→b ⊥−→b − →a ×−→b = −−→b × −→a (−→a +−→b )× −→c = −→a × −→c +−→b × −→c − →a ×−→ b × −→c = (−→a · −→c )−→b −−→a ·−→b−→c (λ−→a )×−→b = λ−→a ×→−b = −→a ×λ−→b (−→a ×−→b )· −→c = −→a ·−→b × −→c. La norma de −→a ×−→b está dada por
||−→a ×−→b|| = ||−→a|| ||−→b||sen θ donde θ es el ángulo comprendido entre estos vectores.
1.2.
Funciones Vectoriales
Una −→F : J→ Rn donde J es un conjunto de números reales, se llama función
vectorial.
El valor de la función −→F en t lo designaremos corrientemente por−→F (t). Puesto que −→F (t)∈ Rn
−
→F (t) = (f
1(t), f2(t), ..., fn(t))
donde cada fi es una función real fi : J → R, i = 1, 2, ...n. Las funciones
fi son llamadas las componentes de la función vectorial −→F . As´í, cada función
vectorial da origen a n funciones reales f1, f2,...,fn. Indicaremos esta relación
por −→F = (f1, f2,..,fn). Llamamos a la variable t el parámetro de la función.
La ecuación −→x = −→F (t) donde −→x = (x1, x2, ..., xn)∈ Rn, nos permite definir
las ecuaciones x1= f1(t) x2= f2(t) .. . xn = fn(t)
llamadas ecuaciones paramétricas con parámetro t.
En algunos casos representaremos las funciones vectoriales como combinación lineal de la base usual en Rn. Por ejemplo cuando n = 2 algunas veces
y j = (0, 1) y cuando n = 3 utilizaremos −→F (t) = (x(t),y(t),z(t)) =x(t)i + y(t)j+z(t)k donde i = (1, 0, 0), j = (0, 1, 0), k =(0, 0, 1).
Ejemplo 1.2.1 Consideremos el caso de la ecuación de una recta que pasa por el punto P0= (a, b, c) y tiene vector director −→a = (l, m, n) . Las ecuaciones
paramétricas de la recta están dadas por x = a + lt, y = b + mt, z = c + nt.
Estas variables las podemos escribir en forma vectorial de la siguiente manera −−→
F (t) = (x(t), y(t), z(t)) = (a+lt, b+mt, c+nt) = (a, b, c)+t(l, m, n) = P0+t−→a ,
donde el parámetro t∈ R. As´í, la ecuación vectorial de la recta define la función vectorial
− →F (t) = P
0+ t−→a .
Ejemplo 1.2.2 Si consideramos las ecuaciones paramétricas dadas por x = cos t y y = sent, 0≤ t ≤ 2π, obtenemos la función vectorial
−
→F (t) = cos ti + sen tj. La norma o longitud de−−→F (t) para cada t está dada por
− →F (t) = p cos2t + sen2t = 1.
El vector −→F (t) describe una circunferencia de radio 1 en sentido contrario a las manecillas del reloj dando una vuelta completa cuando t aumenta de 0 a 2π.
1.2.1.
Operaciones algebraicas.
Las operaciones algebraicas de los vectores pueden aplicarse para las funciones vectoriales. Sean −→F ,−→G , funciones vectoriales definidas sobre un dominio común y f una función real, entonces definimos las funciones −→F +−→G , f−→F , −→F ·−→G , mediante −→ F +−→G(t) =−−→F (t) +−−→G(t), f−→F (t) = f (t)−→F (t), −→ F ·−→G(t) =−→F (t)·−→G (t).
(El producto aqu´í considerado es el de producto escalar).
Observemos que el producto escalar de funciones vectoriales es una función real.
Además en el caso de que −→F y−→G tengan sus valores enR3 podemos definir el
producto vectorial
−→
F ×−→G(t) =−→F (t)×−→G (t).
1.2.2.
Límites, derivadas e integrales.
Los conceptos fundamentales de l´ímite, continuidad, derivadas e integral pueden generalizarse naturalmente para funciones vectoriales.
Si −→F = (f1, f2,..,fn) es una función vectorial y L = (l1, l2, ..., ln)∈ Rn, definimos
el l´ímite por l´ım t→a − →F (t) = L ⇐⇒ l´ım
t→af1(t) = l1, t→al´ımf2(t) = l2, t→al´ımfn(t) = ln
siempre que los l´ímites existan.
Diremos que −→F es continua en a si l´ım
t→a
−
→F (t) =−→F (a). Es decir,−→F es continua en a si y solo si cada componente es continua en a.
Si una función vectorial continua está definida en el intervalo [a, b], entonces ca-da componente real es continua en [a, b] y por lo tanto integrable. As´í podemos definir Z b a − →F (t)dt = Z b a f1(t)dt, Z b a f2(t)dt, ..., Z b a fn(t)dt !
Igualmente, la derivada−F→0(t) de una función vectorial −→F (t) se define
exacta-mente de la misma forma que la derivada de una función real, es decir −→F (t) es diferenciable en t, si −→ F0(t) = l´ım h→0 − →F (t + h) −−→F (t) h
existe. De acuerdo a la definición del l´ímite para funciones vectoriales podemos decir que la función vectorial−−→F (t) es diferenciable si y sólo si cada componente es diferenciable. En este caso
−→
F0(t) = (f10(t), f20(t), ..., fn0(t))
Diremos que −→F es continua, derivable o integrable en un intervalo si cada com-ponente lo es. De acuerdo a estas definiciones muchos de los resultados sobre l´ímites, continuidad, derivación e integración de funciones reales son válidos para las funciones vectoriales.
Denotaremos las derivadas por −→
F0(t) = Dt−→F =
d−→F dt .
En el caso de n = 2, si −→F (t) = (x(t), y(t)) = x(t)i + y(t)j, −→ F0(t) = Dt−→F = d − →F dt = dx dt, dy dt = dx dti+ dy dtj. En el caso de n = 3, si −→F (t) = (x(t), y(t), z(t)) = x(t)i + y(t)j+z(t)k,
−→ F0(t) = D t−→F = d−→F dt = dx dt, dy dt, dz dt = dx dti+ dy dtj+ dz dtk. 1.2.2.1. Teoremas básicos
Teorema 1.2.1 Si −→F , −→G , funciones vectoriales y f una función real son diferenciables, entonces lo mismo ocurre con las funciones−→F +−→G , f→−F ,−→F·−→G , y tenemos
(→−F +−→G )0 = F−→0+−G→0 (f−→F )0 = f0−→F + f−F→0 −→
F ·−→G0 = −F→0·−→G +−→F ·−G→0 Si−→F y−→G tienen valores enR3, entonces
−→
F ×−→G0=−F→0×−→G +−→F ×−→G0
Demostración. Vamos a demostrar la segunda propiedad. Las demás se prue-ban de manera similar.
(f−→F )0 = ((f f
1)0, (f f2)0, ..., (f fn)0)
= (f0f1+ f f10, f0f2+ f f20, ..., f0fn+ f fn0)
= f0(f1, f2, ..., fn) + f (f10, f20, ..., fn0)
= f0−→F + f−F→0
El siguiente es un teorema muy importante y caracteriza las funciones vectori-ales que tienen longitud constante.
Teorema 1.2.2 Una función vectorial −→F (t) diferenciable tiene longitud con-stante en un intervalo abierto I, si y sólo si−→F (t)·−F→0(t) = 0. Esto significa que
los vectores−→F (t) y−F→0(t) son perpendiculares para cada t∈ I.
Demostración. Vamos inicialmente a suponer que la longitud de −→F (t) es constante. Definamos la función g(t) = ||−→F (t)||2 =−→F (t)
·−→F (t). De acuerdo a la hipótesis g(t) = c para todo t ∈ I donde c es una constante. Por lo tanto g0(t) = 0 en I. Como g es un producto escalar, tenemos que
g0(t) =−F→0(t)·−→F (t) +−→F (t)·−F→0(t) = 2−→F (t)·−F→0(t) = 0, entonces −→F (t)·−F→0(t) = 0 en I.
Para mostrar el rec´íproco consideremos que −→F (t)·−F→0(t) = 0 en I y definamos
g(t) = − →F (t) 2
. Derivando g(t) tenemos que g0(t) = 2−→F (t)·−F→0(t) y aplicando
la hipótesis tenemos que g0(t) = 0 para todo t∈ I. As´í la longitud de−→F (t) es
constante.
Los siguientes teoremas se demuestran teniendo en cuenta las propiedades de los vectores y los teoremas básicos de derivadas de una variable como la regla de la cadena y los teoremas fundamentales del cálculo.
Teorema 1.2.3 (Regla de la cadena para funciones vectoriales). Sea −
→G =−→F
◦ u donde−→F es una función vectorial y u es una función real. Si u es continua en t y−→F es continua en u(t) entonces G es continua en t. Además si u es diferenciable en t y−→F es diferenciable en u(t) entonces−→G es diferenciable en t y
−→
G0(t) =−F→0(u(t))u0(t).
Teorema 1.2.4 (Primer Teorema Fundamental del Calculo para funciones Vectoriales) Sea−→F : [a, b]→ Rn una función vectorial continua y definamos
− →A (t) =Z t a − →F (s)ds, a ≤ t ≤ b Entonces−A→0 existe y−A→0(t) =−→F (t).
Teorema 1.2.5 (Segundo Teorema Fundamental del Calculo para funciones Vectoriales). Supongamos que la función−→F tiene derivada continua −F→0 en un
intervalo I. Entonces para cada t∈ I tenemos Z t
a
−→
o − →F (t) =−→F (a) +Z t a −→ F0(s)ds.
1.3.
Curvas y Tangentes
A las funciones vectoriales diferenciables las llamaremos curvas y las denotare-mos con la letra −→r en lugar de la letra−→F . Así, una curva enRnes una función
−
→r : I → Rn diferenciable; la curva es regular, si−→r0(t)6=−→0 para todo t. A no
ser que se diga lo contrario, nuestras curvas siempre serán regulares. También llamaremos curva o trayectoria al rango o conjunto imagen de la función −→r , esto es, al conjunto C definido por
C ={−→x : −→x = −→r (t) para algún t∈ I}.
En este caso, la función −→r se denomina parametrización de C, y diremos que la curva C está descrita paramétricamente (o parametrizada) por −→r . Cuando n = 2 ó 3 podemos representar geométricamente la curva. Por ejemplo, en el caso de n = 3, la curva descrita por −→r (t) = P + t−→a es una l´ínea recta que pasa por el punto P y tiene vector director −→a .
Observación 1.3.1 El gráfico de cualquier función real y = f(x) puede ser dado en forma paramétrica mediante las ecuaciones: x = t y = f (t) o en forma vectorial como
−
→r (t) = (t, f (t)).
Definición 1.3.1 La derivada−→r0(t0) de una curva −→r en t0está ligada al
con-cepto de tangencia, como en el caso de una función real. Formamos el cociente de Newton
−
→r (t0+ h)− −→r (t0)
Investigamos el comportamiento de este cociente cuando h → 0. El cociente es el producto del vector −→r (t0+ h)− −→r (t0) por el escalar 1/h. Observemos que
el numerador es paralelo a este cociente. Si hacemos que h → 0 tenemos que l´ım h→0 − →r (t0+ h)− −→r (t0) h = − → r0(t0)
suponiendo que este l´ímite exista. La interpretación geométrica sugiere la sigu-iente definición.
Definición 1.3.2 Sea C la curva parametrizada por −→r = −→r (t). Si la derivada −
→
r0 existe y no es nula, la ecuación de la recta tangente que pasa por el punto
−
→r (t0) y tiene vector director−→r0(t0) está dada por −→r (t) = −→r (t0) + t−→r0(t0). El
vector−→r0(t0) se llama vector tangente a C en −→r (t0).
Ejemplo 1.3.1 Recta. Consideremos la función vectorial −→r (t) = P + t−→a , siendo −→a 6=−→0 , tenemos que−→r0 = −→a , as´í que la recta tangente coincide con la
curva de −→r .
Ejemplo 1.3.2 Circunferencia. Si −→r (t) describe una circunferencia de radio R y centro en el punto P , entonces ||−→r (t)− P || = R. El vector −→r (t)− P geométricamente representa un vector que va desde el punto P al punto −→r (t). Puesto que este radio vector tiene longitud constante, tenemos que −→r (t)− P y su derivada (−→r (t)− P )0 =−→r0(t) son perpendiculares y por lo tanto el radio
vector es perpendicular a la recta tangente. As´í pues, para una circunferencia la definición de tangente coincide con aquella dada en la geometríáa elemental. Puede pensarse que la curva C es la trayectoria de una partícula que se mueve en el espacio a medida que transcurre el tiempo t, así, −→r (t) es la posición de la partícula en el tiempo t. −→r0(t) es entonces la velocidad de la partícula,
rapidez de la curva y se denota v(t). La segunda derivada−→r00(t) es la aceleración
de la curva y se denota −→a (t).
Si conocemos la aceleración de una partícula en un tiempo t y si también sabe-mos su velocidad y su posición en un tiempo específico t0, entonces podemos
conocer su velocidad y su posición en cualquier tiempo t, como se muestra en el siguiente ejemplo.
Ejemplo 1.3.3 Se sabe que la aceleración de una partícula que se mueve en el espacio está dada por −→a (t) = 2t−→i + sent−→j + cos 2t−→k . Si su velocidad y posición en t = 0 están dados por −→v (0) =−→i y −→r (0) =−→j , hallar su posición en cualquier tiempo t.
Solución. Puesto que −→a (t) =−→v0(t), entonces
− →v (t) =R−→ a (t)dt =R (2t−→i +sent−→j +cos 2t−→k )dt = t2−→i −cos t−→j +1 2sen2t− →k +−→c , donde la constante −→c = (c1, c2, c3). Por un lado −→v (0) = (0,−1, 0)+(c1, c2, c3) =
(c1, c2−1, c3) y por otro lado, −→v (0) = (1, 0, 0), de tal manera que c1= 1, c2= 1
y c3= 0, y la velocidad es entonces −→v (t) = (t2+ 1)−→i + (1−cos t)−→j +12sen2t−→k .
Ya podemos hallar su posición puesto que
− →r (t) =Z −→v (t)dt = (t3 3 + t) − →i + (t− sent)−→j −1 4cos 2t − →k + (c 1, c2, c3)
y puesto que por hipótesis −→r (0) = (0, 1, 0), y por otro lado −→r (0) = (c1, c2,−14+
c3) tenemos que la posición en un tiempo t está dada por −→r (t) = (
t3 3 + t) − →i + (t− sent + 1)−→j + (14−1 4cos 2t) − →k .
1.4.
Longitud de arco y reparametrización de una
curva.
Sea C una curva parametrizada por −→r = −→r (t), t∈ [a, b]. Si reemplazamos t por una función diferenciable h : [c, d] → [a, b], creciente o decreciente de otra variable u, t = h(u), obtenemos una nueva parametrización de −→r de la forma −
→α (u) = −→r (h(u)), esto es, la composición de r con h.
Nota: A veces, para simplificar la notación y cuando no haya peligro de con-fusión, denotaremos la reparametrización −→α con la misma letra −→r y en lugar de escribir t = h(u) escribimos t = t(u) así: −→r (u) = −→r (t(u)); lo mismo para la inversa u = h−1(t) escribimos u = u(t). Si h es creciente, diremos que el
h invierte la orientación.
Ejemplo 1.4.1 Sabemos que la ecuación y = √1− x2, x ∈ [−1, 1]
repre-senta la mitad superior de un círculo de radio 1. Podemos parametrizar di-cho semicírculo por −→r (t) = (t, √1− t2), t ∈ [−1, 1] con orientación del
punto (−1, 0) al punto (1, 0). Escribiendo t = t(u) = cos u obtenemos la reparametrización −→r (u) = (cos u, √1− cos2u) = (cos u, sen u). Si tomamos
u∈ [0, π] = [arc cos(1), arc cos(−1)] obtenemos una reparametrización que in-vierte la orientación pues en dicho intervalo cos es decreciente.
La longitud de una curva −→r = −→r (t) para t∈ [a, b] se define por L(−→r ) =
b
Z
a
||−→r0(t)||dt
En los casos n = 2 y n = 3, esto es, cuando −→r (t) = (x(t), y(t)) y −→r (t) = (x(t), y(t), z(t)), sus longitudes son
L(−→r ) = Z b a px0(t)2+ y0(t)2dt y L(−→r ) = Z b a px0(t)2+ y0(t)2+ z0(t)2dt
Por ejemplo, en el círculo −→r (t) = (acost, asent), para t∈ [0, 2π], tenemos que −
→r0(t) = (−asent, acost) y ||−→r0(t)|| = a por lo que su longitud es
L(−→r ) = Z 2π
0
adt = 2πa
y en el caso de la hélice −→r (t) = (acost, asent, bt), su longitud desde el punto (1, 0, 0) hasta el punto (1, 0, 2π) es
Z 2π
0
p
a2+ b2dt = 2πpa2+ b2.
Nótese que al reparametrizar una curva, ni su forma ni su longitud cambian. Esto último se deduce del hecho de que haciendo t = h(u) y suponiendo h creciente d Z c − → α0(u) du = d Z c − → r0(h(u))h0(u) du = d Z c ||−→r0(h(u))||h0(u)du = b Z a − → r0(t) dt
El estudiante puede hacer algo análogo para h decreciente. Sin embargo, escribiendo −→r (u) = −→r (t(u)) se tiene que
d−→r du = d−→r dt dt du lo que muestra que su rapidez sí cambia por el factor
dudt
; incluso la velocidad puede invertir su sentido en el caso en que t = t(u) sea decreciente pues en este caso dt
du < 0.
Pregunta: Se podrá reparametrizar una curva cualquiera de tal manera que su rapidez sea constante? La respuesta es sí, como veremos a continuación. Sea −→r = −→r (t), t∈ [a, b] una curva cualquiera, y sea s = s(t) =Rt
a − → r0(u) du. s = s(t) se denomina función longitud de arco y mide la longitud de −→r desde a hasta t. Puesto que ds
dt = − → r0(t)
> 0, s(t) es una función creciente y como s(a) = 0 y s(b) = L (su longitud total), su inversa t = t(s) es creciente con dominio [0, L]. Utilizando esta inversa como cambio de parámetro, obtenemos la parametrización −→r (s) = −→r (t(s)) en donde el parámetro es la longitud del arco s. La velocidad de esta parametrización es
d−→r ds = d−→r dt dt ds Como dt ds = 1 ds dt = 1 − →r0(t) , tenemos que d−→r ds
= 1. Así vemos que cuando la curva está parametrizada por longitud de arco, su rapidez es constante e igual a 1. Recíprocamente, si −→r = −→r (t) es una curva tal que
− →r0(t) = 1, entonces s =Rt 0 − → r0(u) du = Rt
0du = t, es decir el parámetro t es la longitud del arco
s. Hemos demostrado el siguiente teorema:
Teorema 1.4.1 Una curva −→r = −→r (t) está parametrizada por longitud de arco si y solo si − →r0(t) = 1.
Ejemplo 1.4.2 Parametrizar por longitud de arco el círculo de radio a, −→r (t) = (a cos(t), a sen(t)),t∈ [0, 2π].
Tenemos que−→r0(t) = (−a sen(t), a cos(t)) y − → r0(t) = a. Así, s = Rt 0 − → r0(u) du = Rt
0a du = at. Despejando t tenemos que t =
s a y reemplazando obtenemos − →r (s) = (a cos(s a), a sen( s a)) es la parametrización pedida.
1.5.
Curvatura
La curvatura es el concepto más importante de la teoría de curvas y mide qué tanto se dobla una curva en un punto determinado. Puesto que la forma como se dobla una curva tiene que ver con su concavidad, es apenas natural pensar que la segunda derivada tiene que estar involucrada, esto es, la razón de cambio del vector tangente. Definiremos inicialmente la curvatura de una curva parametrizada por la longitud de arco s y luego deduciremos una fórmula para la curvatura de una curva con cualquier parámetro t.
Definición 1.5.1 Sea C una curva parametrizada por −→r = −→r (s) donde s = Rt 0 − → r0(u)
du. Definimos la curvatura de C por k(s) = − → r00(s) (1.1)
Ejemplo 1.5.1 Calcular la curvatura del círculo de radio a, −→r (t) = (a cos t, asent). En el ejemplo anterior vimos que la parametrización por longitud de arco del círculo es −→r (s) = (a cos(s
a), a sen( s
a)). Tenemos entonces que la segunda derivada de −→r es −→r00(s) = −1acos(s a),− 1 asen( s a) y por lo tanto k(s) = − → r00(s) = 1 a. Nota.
Esta definición solo es válida para curvas parametrizadas por longitud de arco y no sirve como definición de curvatura de una curva con cualquier parámetro t (es decir, escribir k(t) =
− → r00(t)
). Para ver porqué esto es así, vea el ejercicio y la observación al final de esta sección.
En principio, si queremos calcular la curvatura de una curva con cualquier parámetro t, deberíamos primero reparametrizarla por longitud de arco y aplicar la ecuación 1.1 como se hizo en el ejemplo anterior. Esto no es práctico por la dificultad en el cálculo de la integral involucrada o porque a menudo es muy difícil o virtualmente imposible invertir dicha integral. Para encontrar una fór-mula de la curvatura con cualquier parámetro t, definamos el vector tangente unitario de una curva parametrizada por −→r = −→r (t) así:
− →T (t) = −→r0(t) − → r0(t) (1.2) Reparametrizando entonces por longitud de arco, tenemos que −→r (s) = −→r (t(s)) donde t = t(s) es la inversa de la función longitud de arco s = s(t); se tiene
en-tonces también que el vector tangente unitario tiene la forma −→T (s) =−→T (t(s)). Entonces−→r0(s) =−→T (s) y la segunda derivada de −→r es
− → r00(s) =−→T0(s) = d − →T dt dt ds = − →T0(t) − →r0(t)
y puesto que la curvatura es la norma de este vector, tenemos que k(t) = − →T0(t) − → r0(t) . (1.3)
Esta fórmula nos permite calcular la curvatura de una curva cualquiera sin tener que reparametrizarla por longitud de arco. Podemos encontrar una fórmula más sencilla que sólo involucre r y sus derivadas (y no el vector −→T ) dada en el siguiente teorema. Teorema 1.5.1 k(t) = − →r0(t) ×−→r00(t) − →r0(t) 3 (1.4) Demostración. Escribiendo v(t) = − → r0(t) tenemos que − → r0(t) = v(t)−→T (t); derivando obtenemos − → r00(t) = v0(t)−→T (t) + v(t)−→T0(t) . Entonces − → r0 ×−→r00= v−→T ×v0−→T + v−→T0 = vv0−→T ×−→T + v2−→T ×−T→0 = v2−→T ×−→T0 Por lo tanto −→ r0 ×−→r00 = v 2 − →T ×−T→0 = − → r0 2 − →T − → T0 sen(π/2)
puesto que −→T es perpendicular a−→T0. Y como − →T
− → r0 ×−→r00 = − → r0 2 − → T0 .
Dividiendo a ambos lados de esta última ecuación por − → r0 3 se obtiene la fór-mula deseada.
La curvatura de una curva con cualquier parámetro t está bien definida por la ecuación 1.3, en el sentido de que es independiente de la parametrización elegida, es decir, que para calcular la curvatura no interesa qué parametrización tomemos. Esto se demuestra de la siguiente manera: si −→α es una reparametrización de −→r , esto es,−→α (u) = −→r (h(u)) con h(u) = t y llamamos kα,kr,Tαy Tr a las
curvaturas y al vector tangente unitario en las dos parametrizaciones, entonces:
kα(u) = −→ T0 α(u) − → α0(u) = − → T0 r(h(u))h0(u) − →r0(h(u))h0(u) = − → T0 r(t) − →r0(t) = kr(t)
Note que si en la ecuación 1.3 hacemos t = s obtenemos la ecuación 1.1. Puede probarse fácilmente que si la curvatura de una curva es cero en todos sus puntos, dicha curva es una linea recta, que es efectivamente lo que nos dice la intuición. Para ello notemos que como la curvatura es independiente de la parametrización, podemos suponer
− →r0(t)
= 1. Si k = 0, entonces por la ecuación 1.1 debe ser −→r00(t) = 0. Integrando entre t
0 y t se obtiene que
−
→r0(t) =−→r0(t
0) e integrando de nuevo obtenemos −→r (t)− −→r (t0) = (t− t0)−→r0(t0)
esto es, −→r (t) = (t− t0)−→r0(t0) + −→r (t0) que ciertamente es una línea recta.
1.5.1.
Triedro de Frenet
Para una curva −→r = −→r (t) definimos el vector normal unitario por − →N (t) = −→T0(t) − → T0(t) (1.5) Note que −→N ⊥−→T puesto quekT k = 1. Definimos también el vector binormal por
−
→B (t) =−→T (t) ×−→N (t)
vector que es perpendicular tanto a −→T como a−→N . La triplan−→T ,−→N ,−→Bose de-nomina triedro de Frenet y juega un papel central en el estudio de la geometría de curvas.
El plano generado por el parn−→T ,−→Nose denomina plano osculador . El plano generado por el parn−→N ,−→Bose denomina plano normal. El plano generado por el parn−→T ,−→Bose denomina plano rectificante. Las ecuaciones de dichos planos en un punto −→r (t0) son
plano osculador: (−→x − −→r (t0))·−→B (t0) = 0. plano normal: (−→x − −→r (t0))·−→T (t0) = 0. plano rectificante: (−→x − −→r (t0))·−→N (t0) = 0.
1.5.2.
El vector aceleración.
Si escribimos −→v =−→r0y v = − → r0 , tenemos que−→v = v − →T . Derivando a ambos lados de esta ecuación, obtenemos:− → v0 = −→a = v0−→T + v−→T0 Como−→T0= − → T0 − →N = kv−→N , entonces − →a = v0−→T + kv2−→N
Escribiendo aT = v0y aN = kv2tenemos que la aceleración es una combinación
lineal de los vectores −→T y −→N de la forma −→a = aT−→T + aN−→N , lo que nos dice
que el vector aceleración está siempre sobre el plano osculador.
Podemos encontrar expresiones para aT y aN en términos solamente de las
derivadas de −→r así: − →v · −→a = v−→T· v0−→T + kv2−→N = vv0−→T ·−→T + kv3−→T ·−→N = vv0 Así, aT = v0= − →v · −→a v = − → r0 ·−→r00 − → r0 .
Para aN, observemos que aN = kv2=
− → r0 ×−→r00 − → r0 2 − → r0 3 = − → r0 ×−→r00 − → r0 .
El estudiante puede demostrar fácilmente que también se tiene que k−→ak2 = a2
T + a2N.
1.5.3.
*Ecuaciones de Frenet para una curva plana.
Las ecuaciones de Frenet expresan la variación de los vectores −→T y −→N en tér-minos de ellos mismos y desempeñan un papel fundamental en el estudio de la geometría de las curvas. Deduciremos estas ecuaciones en el caso de una curva plana. De la ecuación 1.5 obtenemos −→T0 = − → T0 − →N y reemplazando − → T0 por lo dado en la ecuación 1.3 tenemos que
−→ T0 = vk−→N (1.6) donde v = − → r0 .
Esta es la primera ecuación de Frenet. Por otro lado como − → N
= 1 tenemos que −→N0 ⊥ N y como la curva es plana, entonces −→N0 es paralelo a −→T y por lo
tanto existe un escalar λ tal que −→N0 = λ−→T . Al multiplicar a ambos lados de
esta ecuación por −→T , obtenemos que λ =−→T ·−→N0. Por otro lado, derivando la
ecuación −→T ·−→N = 0 obtenemos −→T0·−→N +−→T ·−→N0 = 0 lo que es equivalente a
kv−→N ·−→N +−→T ·−→N0 = 0 por la primera ecuación de Frenet (ecuación 1.6) y así,
−→
N0=−vk−→T (1.7)
Las ecuaciones 6 y 7, llamadas Ecuaciones de Frenet se pueden escribir en la forma matricial − → T0 −→ N0 ! = − → r0 0 k −k 0 −→ T − →N ! Ejercicio
Demostrar que si una curva tiene curvatura k = 1
a (constante) entonces es un círculo de radio a (con centro en algún punto −→P ).
Puesto que la curvatura es independiente de la parametrización, podemos suponer v(t) =
− →r0(t)
= 1. Para demostrar que −→r es un círculo de radio a con centro en −→P , debemos probar que −→r (t) + a−→N (t) = −→P pues entonces − →r (t)−−→P = −a−→N (t) y así, −→r (t)− − →P
= a, como se observa en la figura abajo.
Para ver esto, observe que d
dt(−→r (t) + a −
→N (t)) = −→
r0(t) + a−→N0(t). Pero la
se-gunda ecuación de Frenet (ecuación 1.7) es −→N0(t) = −1
a − →T (t), por lo tanto − → r0(t) + a−→N0(t) =−→T (t)− a.1 a −
→T (t) = 0 y por lo tanto −→r (t) + a−→N (t) =constante. Llamando −→P a dicha constante, se tiene lo que se quiere demostrar.
Se definió la curvatura de una curva parametrizada por longitud de arco como la norma del cambio en el vector tangente (ecuación 1.1). Esta definición no funciona para una curva con cualquier parámetro t. Para ver esto basta observar que
− → r00(t)
= 2 (constante) para la parábola−→r (t) = t, t
2
, lo que significaría que la parábola es un círculo!!
Capítulo 2
Campos Escalares en R
2
y R
3
Una función de n variables ó campo escalar, es una función f : U ⊆ Rn
→ R. Si (x1, x2, . . . , xn)∈ U, su imagen por f es un número real xn+1= f (x1, x2, . . . , xn).
En este curso solo estudiaremos los casos n = 2 y n = 3 y entonces escribire-mos z = f (x, y) y w = f (x, y, z) respectivamente. U es el dominio de f y es un subconjunto del plano ó del espacio.
Ejemplo 2.0.2 Hallar el dominio de f(x, y) = x ln y.
Es claro que xpuede tomar cualquier valor real, mientras que ysolo puede tomar valores positivos; por lo tanto el dominio de f es el conjunto U ={(x, y)|x ∈ R, y ∈ R+
}, esto es, el semiplano superior del plano R2.
Ejemplo 2.0.3 Hallar el dominio de f(x, y) =p1 − x2− y2.
Puesto que 1− x2− y2≥ 0, f solo puede ser calculado en los puntos del disco
x2+ y2≤ 1.
2.1.
Gráfica de z = f(x, y). Curvas y superficies
de nivel.
La gráfica de una función de dos variables es un subconjunto de R3y se define
por
Graf (f ) ={(x, y, f(x, y))|(x, y) ∈ U} ⊂ R3
La gráfica de z = f (x, y) la denominamos superficie. Dibujar "a mano" una su-perficie es difícil y lo mejor es recurrir a un computador. Sin embargo, podemos hacernos una idea de cómo es una superficie (o por lo menos las más utilizadas en la práctica), viendo las curvas que se forman al cortar la superficie con planos paralelos a los planos coordenados, llamadas trazas. En particular, las trazas
con planos paralelos al plano xy se denominan curvas de nivel, que se obtienen intersectando la gráfica de f con los planos z = c (constante), esto es, la curva de nivel en el nivel c es el subconjunto del plano definido por
Lf(c) ={(x, y)|f(x, y) = c} ⊂ R2
Para las trazas con planos paralelos a los planos coordenados xz y yz hacemos y = c y x = c. Veamos algunos ejemplos.
Ejemplo 2.1.1 Sea f : R2
→ R definida por z = f (x, y) = x2+ y2.
Dado un número real c, la curva de nivel al nivel c de f está dada por Lf(c) ={(x, y) : x2+ y2= c}.
Claramente si c < 0, Lf(c) = ∅ (vacío); si c = 0, Lf(c) = {(0, 0)}; para
cualquier c > 0, los conjuntos de nivel son circunferencias con centro en el origen de radio√c. La figura muestra las circunferencias concéntricas
En el ejemplo anterior, las curvas de nivel son círculos que se expanden a medida que aumentamos el valor de c. En la siguiente gráfica, a la derecha vemos una imagen tridimensional de estos círculos; cada uno de ellos está sobre el plano z = c.
Sin embargo, esto no es suficiente. Necesitamos ver las trazas con los planos coordenados yz y xz. Para ver el corte con el plano yz, hacemos x = 0 en la función f ; tenemos entonces que dicho corte es la parábola z = y2. Igualmente,
para el corte con el plano xz, hacemos y = 0 para obtener la parábola z = x2.
Abajo puede verse la gráfica de dicha función, llamada paraboloide.
Ejemplo 2.1.2 Hagamos la gráfica de la función z = f(x, y) =px2+ y2.
Las curvas de nivel están dadas por el conjunto Lf(c) ={(x, y) :
p
x2+ y2= c} = {(x, y) : x2+ y2= c2
} esto es, círculos concéntricos de radio c.
Observe que esta gráfica aparentemente es igual a la del paraboloide, sin em-bargo la gráfica de f no es un paraboloide como lo muestran los cortes con los otros planos coordenados: Si x = 0, obtenemos z =py2=|y|, esto es, las dos
rectas z = y y z = −y. De la misma manera, si y = 0 obtenemos las rectas z = x, y z =−x. Vemos la gráfica abajo, que evidentemente es un cono.
Ejemplo 2.1.3 Veamos ahora la función z = y2
− x2.
Las curvas de nivel son las hipérbolas y2
− x2= c, como se observa en la figura
Note que en el caso c = 0 obtenemos la hipérbola degenerada x2 = y2 que
corresponde a las dos rectas y = x y y =−x.
El corte con el plano yz es la parábola z = y2 y el corte con el plano xz es
la parábola z = −x2. Esta gráfica se llama paraboloide hiperbólico o silla de
montar y tiene el aspecto que se muestra abajo.
Ejemplo 2.1.4 Veamos la gráfica de la superficie dada por la ecuación z = y2.
todos los valores reales. Superficies de este tipo se llaman cilindros. ¿Cuales son las curvas de nivel? Su gráfica puede verse abajo.
Para el caso de una función de tres variables w = f (x, y, z), su gráfica se define por el conjunto
Grf (f ) ={(x, y, z, f(x, y, z)) |(x, y, z) ∈ U} ⊂ R4
Por supuesto no podemos hacer un dibujo de ella por estar en el espacio cu-atridimensional R4. Sin embargo tenemos el concepto de superficie de nivel
definido de forma análoga al de curva de nivel así:
Sf(c) ={(x, y, z) |f(x, y, z) = c} ⊂ R3
y aunque no podamos despejar z explícitamente en términos de x y de y, sí podemos encontrar las trazas con los planos coordenados. Veamos ejemplos de esto.
Ejemplo 2.1.5 Consideremos la función de tres variables w = f(x, y, z) = x2+ y2 + z2. La superficie de nivel en el nivel 1 es el conjunto
{(x, y, z) : x2+ y2+ z2= 1
}. Haciendo z = c, obtenemos círculos x2+ y2= 1
−c2de radio
√
1− c2 por lo que debemos tener −1 ≤ c ≤ 1. En la figura abajo se muestran
De la misma manera obtenemos círculos al cortar la superficie con planos par-alelos a los otros dos planos coordenados. La figura obtenida es una esfera de radio 1.
Ejemplo 2.1.6 Las superficies de nivel de la función f(x, y, z) = x2+ y2
− z2
es el conjunto de nivel{x, y, z) : x2+ y2
−z2= c
}. El lector no tendrá dificultad en comprobar que las gráficas que se muestran abajo corresponden a c = 1, c = 0, c = −1 respectivamente, llamadas hiperboloide de una hoja, doble cono e hiperboloide de dos hojas.
Observemos que la gráfica de una función de dos variables puede verse como la superficie de nivel de una función de tres variables. Si f : Ω ⊂ R2
→ R, recordemos que la gráfica de f es
Gf = {(x, y, z) ∈ R3: z = f (x, y), (x, y)∈ Ω}
Gf = {(x, y, z) ∈ R3: (x, y)∈ Ω, z − f(x, y) = 0 } = Lg(0)
donde g(x, y, z) = z − f(x, y). Así la gráfica de una función de dos variables es una superficie de nivel de una función de tres variables.
2.1.1.
Superficies cuádricas.
Consideremos las funciones de tres variables sobre R3que son de tipo polinomial
f (x, y, z) = Ax2+ By2+ Cz2+ Dxy + Exz + F yz + Hx + Iy + Jz + K, donde A, B, C, D, E, F, G, H, I, J, K son constantes. Si A, B.C, D, E, F no son simultáneamente cero las superficies de nivel
Lf(c) ={(x, y, z) ∈ R3: Ax2+By2+Cz2+Dxy+Exz+F yz+Hx+Iy+Jz+K = c
se llaman superficies cuádricas.
Si A = B = C = D = E = F = 0, tenemos que la superficie de nivel de f determina como superficie un plano dado por Hx + Iy + Jz + K = c
En general estas superficies cuádricas pertenecen a nueve tipos diferentes: El elipsoide, el hiperboloide de una hoja, el hiperboloide de dos hojas, el cono, el paraboloide elíptico, el paraboloide hiperbólico, el cilindro elíptico, el cilindro hiperbólico.
2.2.
Límites y Continuidad
Utilizamos la notación l´ım
(x,y)→(x0,y0)
f (x, y) = L para indicar que podemos aprox-imar la función f (x, y) tanto como queramos a un número L siempre y cuan-do tomemos (x, y) suficientemente cerca del punto (x0, y0) pero con (x, y) 6=
(x0, y0). En otras palabras, f (x, y) está cerca de L si (x, y) está cerca de (x0, y0)
y entre más cerca esté (x, y) de (x0, y0), más cerca está f (x, y) de L. Esto
sig-nifica que podemos tomar la distancia entre f (x, y) y L tan pequeña como queramos siempre y cuando la distancia entre (x, y) y (x0, y0) sea lo
suficien-temente pequeña. Tenemos entonces la equivalencia l´ım
(x,y)→(x0,y0)
f (x, y) = L⇔ l´ım
||(x,y)−(x0,y0)||→0|f(x, y) − L| = 0
que podemos escribir también en la forma
f (x, y)→ L cuando (x, y) → (x0, y0)⇔|f(x, y) − L| → 0 cuando
p(x − x0)2+ (y− y0)2→ 0.
Así, el límite de una función de dos variables se reduce al límite usual del cálculo de una variable, y es por esta razón que las propiedades usuales de los límites unidimensionales también son válidas para límites de funciones de dos variables. Claramente se ve que la definición anterior de límite es válida para cualquier campo escalar en Rn, con solo reemplazar la pareja (x, y) por un
vector −→x ∈ Rn y la pareja (x
0, y0) por cualquier vector −→a ∈ Rn.
Las propiedades de los límites y de la continuidad las resumimos en los sigu-ientes teoremas: Teorema 2.2.1 Si l´ım − →x →−→af (−→x ) = b y l´ım→−x →−→ag(−→x ) = c, entonces 1. l´ım−→ x →−→a(f (− →x ) + g(−→x )) = b + c, 2. l´ım − →x →−→aλf (−
→x ) = λb para todo escalar λ, 3. l´ım − →x →−→af (− →x )g(−→x ) = b· c, 4. l´ım−→ x →−→a|f(− →x )| = |b| ,
Definición 2.2.1 Diremos que un campo escalar f es continuo en −→a si l´ım
−
→x →−→af (−→x ) =
f (−→a ).
Así como con las funciones de una sola variable, también son continuas las sumas, productos y cocientes de funciones continuas (una vez que, en el último caso, se evite la división entre cero).
Teorema 2.2.2 Si una función g de n-variables es continua en −→a y una fun-ción f de una variable es continua en g(−→a ), entonces la función compuesta f◦ g, definida por (f ◦ g)(−→x ) = f (g(−→x )) es continua en −→a .
Decir que f es continua sobre un conjunto U significa que f (−→x ) es continua en cada punto del conjunto.
Para calcular un límite, existe la dificultad de que (x, y) puede aproximarse a (x0, y0) por muchos caminos, (contrario al caso unidimensional en el cual solo
existen dos caminos de acercamiento: por la izquierda y por la derecha) y para que el límite exista, debe ser el mismo para todos los caminos de acercamiento. Es claro entonces, que el límite no existe si por dos caminos distintos se ob-tienen límites diferentes, como se ve en el siguiente ejemplo.
Ejemplo 2.2.1 Para probar que l´ım
(x,y)→(0,0) x2 − y2 x2+ y2 (que es de la forma 0 0) no existe, observamos resultados distintos si nos acercamos al origen por el eje x y por el eje y así:
Acercamiento por el eje x: tomamos y = 0 l´ım
(x,0)→(0,0)f (x, 0) = l´ımx→0
x2
x2 = 1
Acercamiento por el eje y: tomamos x = 0 l´ım
(0,y)→(0,0)f (0, y) = l´ımy→0
−y2
y2 =−1
Son continuas las funciones f (x, y) = x, f (x, y) = y, todos los polinomios de la forma f (x, y) =X
aijxiyj y en general todas las posibles combinaciones de
sumas, productos, cocientes y composiciones de las funciones elementales, con excepción posiblemente de los puntos en donde los denominadores sean cero o el límite no exista. Por ejemplo, la función F (x, y) = cos(x3− 4xy + y2) es
continua en todo punto del plano, puesto que la función g(x, y) = x3
− 4xy + y2
es continua (como un polinomio) en toda su extensión y también f (t) = cos t es continua para todo número t ∈ R. Por supuesto, la función dada en el ejemplo anterior no es continua en el origen.
Ahora introducimos algunos conceptos relativos a conjuntos en el espacio de Rn . Sean −→a
∈ Rn y r > 0. El conjunto
B(x; r) ={−→x ∈ Rn :
k−→x − −→ak < r}.
se llama una n-bola abierta de radio r y centro −→a . En el espacioR2, una
bola abierta es el “interior” de un c´írculo; en R3 es el interior de una esfera. Un
punto −→a es un punto interior de un conjunto U si existe una bola abierta B(−→a ; r) contenida en U. Todos los puntos interiores de U forman el interior de U. Por otra parte, −→a es un punto frontera de U si toda bola abierta con centro en −→a contiene puntos que pertenecen a U y otros que no pertenecen. Todos los puntos de frontera de U forman la frontera de U. Finalmente, un conjunto
es abierto si todos sus puntos son interiores y un conjunto es cerrado si contiene todos sus puntos frontera. Por ejemplo en los números reales , R, los tipos más sencillos de conjuntos abiertos son los intervalos abiertos. La unión de dos o más intervalos abiertos es también abierto. El intervalo [a, b] es un intervalo cerrado. El conjunto U = (x, y) : x2+ y2
≤ 1 es un conjunto cerrado en R2 .
2.3.
Funciones Diferenciables
De la misma manera que la existencia de una recta tangente está íntimamente relacionado con el concepto de diferenciabilidad de una función de una variable, la existencia de un plano tangente, que definiremos más adelante, tiene que ver con el concepto de diferenciabilidad de una función de dos variables. Para llegar a este concepto definiremos inicialmente las derivadas parciales.
2.3.1.
Derivadas parciales
Si en una función de dos variables z = f (x, y) consideramos una variable, por ejemplo y, como constante, obtenemos una función que depende exclusiva-mente de la variable x. Así, si escribimos y = y0 (constante) y h(x) = f (x, y0),
la derivada h0(x0) se denomina derivada parcial de f con respecto a x en el
punto (x0, y0) y se denota
∂f
∂x(x0, y0) ó ∂f
∂x|(x0,y0). De la misma manera, si
es-cribimos g(y) = f (x0, y), entonces la derivada parcial de f con respecto a y en
el punto (x0, y0) será la derivada g0(y0) y se denota
∂f
∂y(x0, y0) ó ∂f ∂y|(x0,y0).
Notación. Si las derivadas parciales se calculan en un punto genérico (x, y), escribimos ∂f ∂x y ∂f ∂y en lugar de ∂f ∂x(x, y) y ∂f
∂y(x, y). Estas derivadas también se denotan fx y fy ó, Dxf y Dyf .
Recordemos que la definición usual de derivada es h0(x0) = l´ım
4x→0
h(x0+4x) − h(x0)
4x Al escribir dicha fórmula en términos de f obtenemos
∂f
∂x(x0, y0) = l´ım4x→0
f (x0+4x, y0)− f(x0, y0)
4x (2.1)
∂f
∂y(x0, y0) = l´ım4y→0
f (x0, y0+4y) − f(x0, y0)
4y . (2.2)
Puesto que las derivada parciales son también funciones de las variables x y y, podemos también derivarlas parcialmente para obtener derivadas parciales de segundo orden denotadas como se muestra a continuación:
∂ ∂x ∂f ∂x = ∂ 2f ∂x2, ∂ ∂y ∂f ∂y = ∂ 2f ∂y2, ∂ ∂x ∂f ∂y = ∂ 2f ∂x∂y, ∂ ∂y ∂f ∂x = ∂ 2f ∂y∂x. Las derivadas parciales que involucran las dos variables x y y se denominan derivadas parciales mixtas. Un hecho importante es que bajo ciertas condiciones estas derivadas mixtas son iguales como lo dice el siguiente teorema.
Teorema 2.3.1 Si las derivadas parciales mixtas son continuas en un conjunto abierto U que contiene un punto (x0, y0), entonces
∂2f
∂x∂y(x0, y0) = ∂2f
∂y∂x(x0, y0).
Las derivadas parciales de z = f (x, y) se interpretan geométricamente como las pendientes de las tangentes a las curvas intersección de la gráfica de f con los planos x =constante y y =constante como se observa en las gráficas abajo.
2.3.2.
Superficies parametrizadas
En el capítulo anterior definimos curva (parametrizada) en el espacio como una función −→r : I ⊆ R → R3. En este caso, como el dominio es un subconjunto de
la recta real, tenemos un solo parámetro que denotamos con la letra t y escribi-mos −→r (t) = (x(t), y(t), z(t)). Análogamente tenemos el concepto de superficie parametrizada como una función −→r : U ⊆ R2
→ R3. Como el dominio es un
subconjunto del plano, tenemos ahora dos parámetros que denotamos con las letras u y v, y escribimos
−
→r (u, v) = (x(u, v), y(u, v), z(u, v))
x, y y z son por supuesto, funciones de U enR. Las ecuaciones x = x(u, v), y = y(u, v), z = z(u, v) son las ecuaciones paramétricas. La gráfica abajo ilustra la situación.
Ejemplo 2.3.1 1. El cilindro.
Un cilindro de radio a se puede parametrizar en la forma −
→r (u, v) = (a cos u, a sen u, v), u∈ [0, 2π], −∞ < v < ∞
La secuencia siguiente muestra cómo se transforma el rectángulo [0, 2π]× [0, 1] en el cilindro.
2. La esfera.
En el triángulo rectángulo4OAB se tiene que x = h cos θ y y = h sen θ y en el triángulo rectángulo4OBC se tiene que z = a cos ϕ. Pero de nuevo en4OBC se tiene que h = a sen ϕ, de manera que las ecuaciones paramétricas de la esfera son
x = a cos θ sen ϕ y = a sen θ sen ϕ z = a cos ϕ
en donde θ∈ [0, 2π] y ϕ ∈ [0, π]. Así la función −→r tiene la forma −
→r (θ, ϕ) = (a cos θ sen ϕ, a sen θ sen ϕ, a cos ϕ) 3. La gráfica de z = f (x, y).
Análogo a la parametrización de la gráfica de una función de una variable y = f (x) como la curva −→r (t) = (t, f (t)), la gráfica de una función de dos variables z = f (x, y) se puede ver como una superficie parametrizada solo con tomar x = u, y = v, z = f (u, v), esto es,
−
→r (u, v) = (u, v, f (u, v)) 4. Ejercicio (para los curiosos).
Pruebe que una parametrización del hiperboloide de una hoja x2+y2
−z2=
1 está dada por las ecuaciones
x = cos u cosh v y = sen u cosh v z = senh v
para u∈ [0, 2π], −∞ < v < +∞.
2.3.3.
El plano tangente
En una superficie parametrizada, −→r (u, v) = (x(u, v), y(u, v), z(u, v)) con (u, v)∈ U , las rectas u = u0(constante) y v = v0(constante) se convierten por la acción
de −→r en las curvas sobre la superficie −→r (u) = −→r (u, v0) y −→r (v) = −→r (u0, v)
como se observa en la gráfica abajo.
Dichas curvas se denominan curvas coordenadas. Los vectores tangentes en el punto u0y v0son respectivamente−→r0(u0) = ∂−
→r ∂u(u0, v0) y − → r0(v0) =∂−→r ∂v (u0, v0) y se definen por ∂−→r ∂u(u0, v0) = ∂x ∂u(u0, v0), ∂y ∂u(u0, v0), ∂z ∂u(u0, v0) ∂−→r ∂v (u0, v0) = ∂x ∂v(u0, v0), ∂y ∂v(u0, v0), ∂z ∂v(u0, v0)
Si dichos vectores son linealmente independientes, entonces generan un plano que pasa por el punto −→r (u0, v0) denominado plano tangente, con vector normal
∂−→r
∂u(u0, v0)× ∂−→r
∂v (u0, v0). Por lo tanto, si −→r (u0, v0) = (x0, y0, z0), la ecuación del plano tangente en ese punto es
(x− x0, y− y0, z− z0)·∂−
→r
∂u (u0, v0)× ∂−→r
En el caso particular en el que tenemos la gráfica de z = f (x, y), con la parametrización −→r (x, y) = (x, y, f (x, y)) tenemos que ∂−→r
∂x× ∂−→r ∂y = 1, 0,∂f ∂x × 0, 1,∂f ∂y = −∂f∂x,−∂f∂y, 1
. Si escribimos z0 = f (x0, y0), la ecuación del
plano tangente es z = f (x0, y0) +∂f ∂x(x0, y0)(x− x0) + ∂f ∂y(x0, y0)(y− y0) (2.3)
2.3.4.
El concepto de diferenciabilidad
Recordamos inicialmente el concepto de diferenciabilidad para una función de una variable y = f (x), para luego, de forma análoga, abordar el caso z = f (x, y).
Diferenciabilidad de y = f(x).
Sabemos que en el caso de una función de una variable de la forma y = f (x), la derivada de f en un punto x0se define como
f0(x0) = l´ım 4x→0
f (x0+4x) − f(x0)
4x
en caso de que dicho límite exista. Si esto último es cierto, la pendiente de la recta secante está cercana a la pendiente de la tangente si 4x es pequeño así:
f (x0+4x) − f(x0)
4x ≈ f
0(x 0)
El error cometido en la aproximación está dado por ε =f (x0+4x) − f(x0)
4x − f
0(x 0)
Entre más pequeño sea 4x, menor es el error. La expresión anterior se puede escribir en la forma
f (x0+4x) − f(x0)
4x = f
0(x 0) + ε
donde ε → 0 cuando 4x → 0. Si escribimos 4y = f(x0 +4x) − f(x0),
obtenemos la ecuación
4y = f0(x
0)4x + ε4x (2.4)
donde ε → 0 cuando 4x → 0.
Si escribimos x = x0+4x, entonces f(x) = f(x0) +4y y la ecuación 2.4 toma
la forma
f (x) = f (x0) + f0(x0)(x− x0) + ε(x− x0)
donde ε → 0 cuando x → x0. Podemos escribir entonces
f (x)≈ f(x0) + f0(x0)(x− x0)
si x está cerca de x0. Entre más cerca esté x de x0 más pequeño es el error
cometido en la aproximación . La expresión de la derecha en la aproximación anterior es lineal en x, esto es, la función
L(x) = f (x0) + f0(x0)(x− x0)
es una linea recta. Así,
f (x)≈ L(x)
cerca de x0y esta es exactamente la idea de diferenciabilidad:
Una función y = f (x) es diferenciable en un punto x0, si el incremento en y,
4y se puede escribir como en la ecuación 2.4, es decir, si localmente (esto es, en cualquier vecindad de x0) se puede aproximar por una recta, más
específi-camente, por la recta tangente en x0; hablando claro, si localmente, la gráfica
de f es "casi" una recta.
En un computador se puede comprobar esto. Dibuje la gráfica de, por ejemplo, f (x) = x2 con un programa de cálculo simbólico (MuPad por ejemplo) y haga
zoom cerca del origen de coordenadas. Se dará cuenta de que entre mayor sea el zoom, la gráfica de la parábola será cada vez más recta.
Esto no sucede por ejemplo con la función f (x) = |x| pues no importa qué tan cerca se esté del origen, la gráfica de f siempre se verá como una punta (dos rectas).
El primer sumando en el miembro derecho de la ecuación 2.4 se denomina diferencial de f y se denota df o más comúnmente dy, así, la diferencial en cualquier x es
dy = f0(x)4x
y se toma generalmente como una aproximación para 4y; entre más pequeño sea 4x mejor es la aproximación.
Diferenciabilidad de z = f(x, y).
De la misma manera como la diferenciabilidad de una función de una variable y = f (x) tiene que ver con la existencia de una función lineal (una recta) L(x) que aproxima a f en una vecindad de un punto x0, la diferenciabilidad de
z = f (x, y) en un punto (x0, y0) tiene que ver con la existencia de una función
lineal (un plano) L(x, y) que aproxima a f en una vecindad de (x0, y0), esto es,
algo como
f (x, y)≈ A + Bx + Cy.
Para encontrar tal aproximación, le aplicamos el mismo análisis anterior a las derivadas parciales, ecuaciones 2.1 y 2.2, y obtenemos formas análogas a la ecuación 2.4 para los incrementos parciales
f (x0+4x, y0)− f(x0, y0) = ∂f
∂x(x0, y0)4x + ε14x f (x0, y0+4y) − f(x0, y0) = ∂f
∂y(x0, y0)4y + ε24y donde ε1 y ε2→ 0 cuando 4x y 4y→ 0.
Tenemos así aproximaciones lineales para los incrementos parciales. Parece nat-ural pensar que el incremento de f en ambas variables simultáneamente, pueda aproximarse por la suma (ya que necesitamos que la aproximación sea lineal) de las dos aproximaciones parciales. Esto no siempre sucede, pero cuando es así, tenemos nuestra definición de diferenciabilidad:
incremento de z,4z = f(x0+4x, y0+4y) − f(x0, y0) puede escribirse en la
forma
4z =∂f∂x(x0, y0)4x +
∂f
∂y(x0, y0)4y + ε14x + ε24y (2.5) donde (ε1, ε2)→ (0, 0) cuando (4x,4y)→ (0, 0).
Si escribimos x = x0+4x y y = y0+4y, entonces la ecuación 2.5 toma
la forma
f (x, y) = f (x0, y0)+∂f
∂x(x0, y0)(x−x0)+ ∂f
∂y(x0, y0)(y−y0)+ε1(x−x0)+ε2(y−y0) (2.6) donde (ε1, ε2)→ (0, 0) cuando (x, y) → (x0, y0).
La ecuación 2.6 explica el concepto de forma clara: si escribimos L(x, y) = f (x0, y0) +
∂f
∂x(x0, y0)(x− x0) + ∂f
∂y(x0, y0)(y− y0) tenemos entonces la aproximación lineal
f (x, y)≈ L(x, y)
en una vecindad de (x0, y0). Note que la función L es precisamente el plano
tangente en el punto (x0, y0) (vea de nuevo la ecuación 2.3). Tenemos así, que
f es diferenciable si puede linealizarse localmente, esto es, si en una vecindad de un punto (x0, y0) la gráfica de f se ve “casi” plana, siendo dicho plano
precisamente el plano tangente.
Los dos primeros términos de la derecha de la ecuación 2.5 se denomina la diferencial de f y se denota df o más comúnmente dz así:
dz = ∂f
∂x(x0, y0)4x + ∂f
∂y(x0, y0)4y
y es una aproximación para el incremento 4z. Si le aplicamos esta definición a las variables independientes x y y obtenemos que dx = ∂x
∂x4x + ∂x
∂y4y = 4x y de la misma manera, dy = 4y. Por esta razón, es común que la diferencial en cualquier punto (x, y) se escriba en la forma
dz = ∂f ∂xdx +
∂f
∂ydy. (2.7)
dz = ∂z ∂xdx +
∂z ∂ydy
Si f es diferenciable en (x0, y0), de la ecuación 2.6 se deduce de forma inmediata
que f es continua en dicho punto pues claramente f (x, y) → f(x0, y0) cuando
(x, y)→ (x0, y0).
Contrario a lo que sucede en el caso de una variable en el que la existencia de la derivada es suficiente para garantizar la existencia de la recta tangente, para una función de dos variables la sola existencia de las derivadas parciales no implica la existencia del plano tangente. Por ejemplo, la función
f (x, y) =
( xy
x2+ y2 si (x, y) 6= (0, 0)
0 si (x, y) = (0, 0) no es diferenciable en (0, 0) pues aunque ∂f
∂x(0, 0) = ∂f
∂y(0, 0) = 0, la función no es continua en (0, 0). Abajo se muestra su gráfica generada por MuPad para x[−0.01, 0.01] y y[−0.01, 0.01]. −0.4 0.010 0.005 −0.005 x 0.005 y 0.000 0.000 −0.005 −0.010 −0.010 −0.2 0.0 z 0.2 0.4 0.010
El teorema siguiente establece las condiciones suficientes para la diferenciabil-idad.
Teorema 2.3.2 Si las derivadas parciales de z = f(x, y) existen y son contin-uas en (x0, y0) entonces f es diferenciable en dicho punto, es decir, 4z puede
2.4.
La Regla de la Cadena
Sea z = f (x, y) un campo escalar diferenciable en un conjunto abierto U ∈ R2,
y supongamos que x = x(t) y y = y(t) son funciones diferenciables de t. Se tiene entonces que z = z(t) = f (x(t), y(t)), esto es, tenemos la composición z(t) = f◦ h(t) donde h es la función vectorial definida por h(t) = (x(t), y(t)). El teorema siguiente establece la forma como se calcula la derivada z0(t):
Teorema 2.4.1 En las condiciones del comentario anterior, se tiene que dz dt = ∂f ∂x dx dt + ∂f ∂y dy dt (2.8)
Demostración. Puesto que f es diferenciable se tiene que 4z = ∂f∂x4x +∂f∂y4y + ε14x + ε24y
donde (ε1, ε2)→ (0, 0) cuando (4x, 4y) → (0, 0).
Dividiendo ambos miembros de la ecuación por 4t y tomando el límite cuando 4t → 0 obtenemos dz dt = ∂f ∂x4t→0l´ım 4x 4t + ∂f ∂y4t→0l´ım 4y 4t + l´ım4t→0ε1 4x 4t + l´ım4t→0ε2 4y 4t (2.9) donde (ε1, ε2)→ (0, 0) cuando (4x, 4y) → (0, 0).
Por un lado, l´ım 4t→0 4x 4t = dx dt y l´ım4t→0 4y 4t = dy
dt. Por otro lado, l´ım
4t→04x = l´ım4t→0x(t +4t) − x(t) = 0
puesto que x = x(t) es una función continua (por ser diferenciable). De la mis-ma mis-manera, l´ım
4t→04y = 0, lo que significa que l´ım4t→0ε1= l´ım4t→0ε2= 0 por lo que
la ecuación 2.9 se convierte en la ecuación 2.8.
Nota. A veces, por abuso de notación, la regla de la cadena se escribe así: dz dt = ∂z ∂x dx dt + ∂z ∂y dy dt
En el caso en que x y y sean funciones diferenciables de dos variables s y t, x = x(s, t), y = y(s, t), entonces z = z(s, t) = f (x(s, t), y(s, t)) y las derivadas parciales de z con respecto a s y t están dadas por:
∂z ∂s = ∂z ∂x ∂x ∂s + ∂z ∂y ∂y ∂s ∂z ∂t = ∂z ∂x ∂x ∂t + ∂z ∂y ∂y ∂t (2.10)
Podemos utilizar la regla de la cadena para encontrar dy
dx en el caso en que la ecuación F (x, y) = k defina y como función implícita de x. Derivando a ambos lados de la ecuación F (x, y(x)) = k (aplicando la ecuación 2.8 obtenemos
∂F ∂x dx dx + ∂F ∂y dy dx = 0 Así tenemos que
dy dx =− ∂F ∂x ∂F ∂y . (2.11)
Análogamente, si la ecuación F (x, y, z) = k define z como función implícita de x y y, podemos encontrar fórmulas para las derivadas parciales de z con respecto a x y y aplicando las fórmulas dadas por las ecuaciones 2.10 a la ecuación F (x, y, z(x, y)) = k para obtener
∂z ∂x = − ∂F ∂x ∂F ∂z ∂z ∂y =− ∂F ∂y ∂F ∂z Ejercicio. Si z(t) = f(x(t), y(t)), calcular d
2z dt2. Tenemos que dz dt = ∂z ∂x dx dt + ∂z ∂y dy
dt. Derivando a ambos lados de esta ecuación, aplicando la regla de la derivada de un producto, obtenemos:
d2z dt2 = d dt ∂z ∂x dx dt + ∂z ∂x d2x dt2 + d dt ∂z ∂y dy dt + ∂z ∂y d2y dt2 (2.12)
Para las derivadas con respecto a t de ∂z ∂x y
∂z
∂y, debemos aplicar de nuevo la regla de la cadena (ecuación 2.8) porque ∂z
∂x y ∂z
∂y son funciones de x y y y estas a su vez son funciones de t así:
d dt ∂z ∂x = ∂ 2z ∂x2 dx dt + ∂2z ∂y∂x dy dt
d dt ∂z ∂y = ∂ 2z ∂x∂y dx dt + ∂2z ∂y2 dy dt
reemplazando estas dos expresiones en la ecuación 2.12, asumiendo que las derivadas parciales mixtas son iguales y reduciendo términos semejantes, obten-emos la expresión d2z dt2 = ∂2z ∂x2 dx dt 2 + 2 ∂ 2z ∂x∂y dx dt dy dt + ∂2z ∂y2 dy dt 2 + ∂z ∂x d2x dt2 + ∂z ∂y d2y dt2
La regla de la cadena para una función de tres variables w = w(t) = f (x(t), y(t), z(t)) tiene una forma análoga a la ecuación 2.8:
dw dt = ∂w ∂x dx dt + ∂w ∂y dy dt + ∂w ∂z dz dt (2.13)
2.4.1.
El vector gradiente
Observe que la ecuación 2.8 puede escribirse en la forma dz dt = ∂f ∂x, ∂f ∂y · dxdt,dy dt El vector ∂f ∂x, ∂f ∂y
se denomina gradiente de f en (x, y) y se denota ∇f, así: ∇f = ∂f∂x,∂f
∂y
Nota. La notación ∇f significa ∇f(x, y).
Si calculamos el gradiente en un punto (x0, y0) escribimos
∇f(x0, y0) = ∂f ∂x(x0, y0), ∂f ∂y(x0, y0)
Si escribimos −→r (t) = (x(t), y(t)), entonces −→r0(t) = dx
dt, dy dt
y la ecuación 2.8, calculada en un punto t0, toma la forma
dz dt|t=t0 = d dt|t=t0f (−→r (t)) =∇f(−→r (t0))· − → r0(t0) (2.14)
Podemos utilizar la forma de la regla de la cadena como la expresa la ecuación 2.14 para probar que el vector gradiente de z = f (x, y) en un punto P = (x0, y0)
supongamos que dicha curva de nivel está descrita por la función vectorial −
→r (t) = (x(t), y(t)) que pasa por P en un tiempo t0, esto es, P = −→r (t0) = (x0, y0). Es claro entonces que debe ser f (x(t), y(t)) = f (−→r (t)) = k. Derivando
a ambos lados de esta ecuación tenemos que d
dtf (−→r (t)) = 0 (2.15) Aplicando la fórmula 2.14 para el lado izquierdo de la ecuación 2.15 en el punto P , tenemos que
∇f(x0, y0)·−→r0(t0) = 0
lo que prueba lo afirmado. La gráfica abajo ilustra la situación.
De la misma manera, el vector gradiente de una función de tres variables w = F (x, y, z) en un punto P = (x0, y0, z0) es perpendicular a la
superfi-cie de nivel S definida por la ecuación F (x, y, z) = k que pasa por P . Si −
→r (t) = (x(t), y(t), z(t)) es cualquier curva sobre S que pasa por P en un tiem-po t0, entonces F (−→r (t)) = k y de nuevo