Juan Manuel Tejeiro Sarmiento
Profesor Titular
Observatorio Astronómico Nacional
Facultad de Ciencias
Universidad Nacional de Colombia
Agosto de 2004
Índice general
Introducción VIII
Geometría diferencial
1
1. Fundamentos matemáticos 3 1.1. Espacios topológicos . . . 3 1.2. Espacios métricos . . . 5 1.3. Espacios vectoriales . . . 7 2. Variedades 15 2.1. Variedades diferenciales . . . 15 2.2. Espacio tangente . . . 19 2.3. TENSORES . . . 272.4. Transformaciones entre variedades . . . 33
2.5. Cálculo en variedades . . . 36
2.5.1. Derivada de Lie . . . 39
2.5.2. Conexión y derivada covariante . . . 41
2.5.3. Transporte paralelo . . . 44
2.5.4. Tensor de Riemann . . . 48
2.5.5. Tensor métrico . . . 50
2.5.6. Relación entre conexión y métrica . . . 53
2.5.7. Campos de Killing . . . 55
II
Relatividad General
59
3. Los postulados de la relatividad general 61 3.1. La ley de gravitación universal . . . 613.2. Postulados de la TGR . . . 64 iii
3.3. El tensor métrico y el postulado de causalidad . . . 66 3.4. Ecuaciones de campo de Einstein . . . 73
4. La solución de Schwarzschild 77
4.1. Métrica para simetría esférica . . . 77 4.1.1. Teorema de Birkhoff . . . 84 4.1.2. Características de la solución de Schwarzschild . . . . 86 4.2. Pruebas clásicas de la relatividad general . . . 88 4.2.1. Corrimiento del perihelio de Mercurio . . . 88 4.2.2. Desviación de la luz por el sol . . . 95
Prefacio
Notas de clase para el curso de Galaxias y Cosmología.
Introducción
En este libro se presentarán los fundamentos de la teoría general de la relatividad. La primera parte está dedicada a la fundamentación matemática necesaria para la formulación rigurosa de la teoría general de la relatividad. En la segunda parte formularemos los postulados de la relatividad y su aplicación a los agujeros negros. La tercera parte está centrada en el modelo estandar de la cosmología.
Geometría diferencial
Fundamentos matemáticos
1.1.
Espacios topológicos
En esta sección se darán algunas definiciones fundamentales sobre espa-cios topológicos y espaespa-cios métricos.
Definicion 1 Definición 1.1 Un espacio topológico T es una pareja (T, A), con T un conjunto y A una familia de subconjuntos de T , llamados los abier-tos, tales que:
T-1: φ, T ∈ A, es decir, el vacío φ y todo el conjunto T son abiertos. T-2: Dada cualquier colección de abiertos aα ∈ A,con α ∈ I, siendo I
un conjunto de índices, entonces ∪α∈Iaα ∈ A, es decir, unión arbitraria de
abiertos es un abierto.
T-3: Dada cualquier colección finita de abiertos ai ∈ A, i = 1, 2, ..., n,
entonces ∩ni=1ai ∈ A, es decir, intersección finita de abiertos es abierto.
A la familia de abiertos A se le llama la topología de T . Claramente a todo conjunto se le puede asociar una topología, pues basta con definir como los abiertos de T a cualquier subconjunto de T . Esta topología es conocida en la literatura como la topología discreta. Otra posibilidad para definir una topología sobre cualquier conjunto es la llamada topología trivial, cuyos abiertos se reducen al conjunto vacío y a todo el espacio. Estos dos casos extremos de espacios topológicos no son de utilidad práctica, pero nos sirven para ilustrar situaciones y conceptos especiales que surgen en el estudio de los espacios topológicos. Un ejemplo no trivial de una topología lo constituye los números reales R con la llamada topología usual, en donde los abiertos están conformados por todos los intervalos abiertos de la forma (a, b) ⊂ R, con la identificación (a, a) = φ y (−∞, ∞) = R.
Definicion 2 Sean T y R espacios topológicos. Una función
f : T −→ R (1.1)
se dice continua, si para cualquier abiertob de R, la imagen inversa f−1(b) es un abierto de T .
Más adelante relacionaremos esta definición de continuidad, con la defini-ción usualmente utilizada en espacios métricos, cuando relacionemos la es-tructura topológica de un espacio con su eses-tructura métrica.
Definicion 3 Sean T y R espacios topológicos. Una función
ϕ : T −→ R (1.2)
se llama un homeomorfismo, si la función ϕ es continua con inversa
ϕ−1 : R −→ T (1.3)
continua.
Así, todo homeomorfismo ϕ entre espacios topológicos transforma abier-tos de un espacio topológico en abierabier-tos del otro espacio, y en este caso dire-mos que los dos espacios topológicos son homeomorfos. Veadire-mos dos ejemplos que ilustran porqué los espacios topológicos extremos, el discreto y el trivial, no son de interes práctico. Dada una función
ϕ : T −→ R (1.4)
con R un espacio topológico cualquiera y T el espacio topológico discreto, entonces toda función ϕ es trivialmente continua, pues dado cualquier abier-to de R su imagen inversa es un subconjunabier-to de T , que por definición es un abierto, mientras que si T tiene la topología trivial, entonces ninguna función ϕ es continua, dado que los únicos abiertos de T son el vacío y todo el espacio.
Definicion 4 Un espacio topológico T se llama de Hausdorf o separable, si para todo par de puntos p, q ∈ T , con p 6= q, existen abiertos U y V de T , con p ∈ U y q∈ V tal que U ∩ V = φ.
Claramente el espacio topológico discreto es de Hausdorff, así como los números reales con la topología usual, mientras que un espacio topológico con la topología trivial no es un espacio topológico de Hausdorff.
Definicion 5 Sea T un espacio topológico y C ⊂ T un subconjunto cualquiera de T . Un recubrimiento abierto de C es una colección de abiertos aα de T
con α ∈ I, siendo I un conjunto de índices, tal que C ⊂ ∪α∈Iaα.
Definicion 6 Un subconjunto C ⊂ T , de un espacio topológico T se llama
compacto, si dado cualquier recubrimiento abierto de C, existe un subre-cubrimiento finito ai, i = 1, 2, ..., n de C, esto es C ⊂ ∪ni=1aα.
Definicion 7 Un subconjunto A ⊂ T , de un espacio topológico T se llama
cerrado, si su complemento, i.e., T \A, es abierto.
Claramente, dependiendo de la estructura topológica del espacio, hay conjuntos que son abiertos y cerrados a la vez, por ejemplo cualquier sub-conjunto de un espacio topológico discreto. También existen subsub-conjuntos que no son ni abiertos ni cerrados, por ejemplo, en los reales con la topología usual, cualquier intervalo semicerrado, es decir de la forma [a, b) o (a, b], no es abierto ni cerrado. Ahora, en todo espacio topológico el vacío y todo el espacio son subconjuntos abiertos y cerrados a la vez, pues ellos son mutua-mente complementarios. Se puede mostrar que en un espacio topológico de Hausdorff los únicos conjuntos abiertos y cerrados simultáneamente son el vacío y todo el espacio.
En el espacio de los números reales R con la topología usual, cualquier intervalo cerrado de la forma [a, b] es compacto, mientras que cualquier in-tervalo abierto no lo es. Más generalmente, en R con la topología usual, todo subconjunto cerrado y acotado es compacto.
En la siguiente sección se darán las definiciones fundamentales de espa-cios métricos y su relación con la estructura topológica.
1.2.
Espacios métricos
Definicion 8 Un espacio métrico M es un conjunto de puntos con una
función, llamada métrica,
d : M × M −→ R
(x, y) 7−→ d(x, y) (1.5)
tal que:
M-1: ∀x, y ∈ M, se tiene que d(x, y) ≥ 0, y d(x, y) = 0 ⇐⇒ x = y. M-2: ∀x, y ∈ M, se tiene que d(x, y) = d(y, x).
M-3: ∀x, y, z ∈ M, se satisface la desigualdad triangular, i.e.,
Uno de los ejemplos más importantes de espacio métrico lo constituye Rn con la llamada métrica usual, o euclideana, definida como:
d(x, y) :=p(x1− y1)2+ · · · + (xn− yn)2 (1.7)
en donde x = (x1, ..., xn), y = (y1, ..., yn). Sobre Rn también es posible definir otras métricas, de hecho infinitas métricas, pues la función
dp(x, y) = Ã n X i=1 (xi− yi)p !1/p (1.8)
para cada entero p satisface las propiedaes M −1 a M −3. El caso particular p = 2, corresponde a la métrica usual. Un caso particular de una métrica, definida como d(x, y) = 0 si x = y, y d(x, y) = 1, ∀x 6= y muestra que todo conjunto es metrizable. Esta métrica es trivial y se utiliza solamente para construir contraejemplos.
Definicion 9 Sea M un espacio métrico. Una bola abierta B(x; r) de radio r y centro x ∈ M es el conjunto de todos los puntos y ∈ M tales que d(x, y) < r.
Un subconjunto A ⊂ M se llama acotado si para todo par de puntos x, y ∈ A existe un número real positivo r tal que d(x, y) < r. Claramente para todo conjunto acotado de un espacio métrico se puede construir una bola centrada en cualquiera de los puntos que contenga al conjunto.
Definicion 10 Sean M y N espacios métricos con métricas dM y dN
re-spectivamente. Una función f : M → N se dice continua en un punto x ∈ M si dado cualquier real positivo > 0 simpre es posible encontrar un número real δ > 0 tal que dM(y, x) < δ implica que dN(f (x), d(y)) < . Una función
entre espacios métricos continua con inversa continua se llama un homeo-morfismo.
Para conectar la estructura de espacio métrico con la estructura de es-pacio topológico definamos:
Definicion 11 Sea A ⊂ M, con M un espacio métrico. Entonces A es un
subconjunto abierto de M si ∀x ∈ A existe una bola abierta B(x, r) contenida en A.
Es fácil probar, entonces, que los abiertos de un espacio métrico satis-facen las propiedades T − 1, T − 2 y T − 3 de la definición 1 y por lo tanto definen una topología sobre M , llamada la topología inducida. Así, toda métrica induce una topología, pero no toda topología proviene de alguna métrica. Por ejemplo, la métrica trivial d(x, y) = 0 si x = y, y d(x, y) = 1, ∀x 6= y induce la topología trivial, pero ninguna métrica induce la topología discreta. Además, la topología usual sobre Rnes la inducida por la métrica usual. De esta forma, cuando se trabaja con espacios métricos siempre se asume la topología inducida por la correspondiente métrica.
1.3.
Espacios vectoriales
Definicion 12 Un grupo (G, ◦) es un conjunto de elementos G sobre el cual está definida una operación interna ◦, es decir, una función de la forma:
◦ : G × G −→ G
(g1, g2) 7−→ g = g1◦ g2
(1.9) tal que
G-1: Exista un elemento e ∈ G, llamado la identidad, con la propiedad que para todo elemento g ∈ G, se cumpla que e ◦ g = g ◦ e = g.
G-2: Para todo elemento g ∈ G, exista un elemento g−1 ∈ G, llamado el elemento inverso, tal que: g ◦ g−1 = g−1◦ g = e.
G-3: ∀g1, g2, g3∈ G se cumple la asociatividad:
g1◦ (g2◦ g3) = (g1◦ g2) ◦ g3
En general se tiene que g1◦ g2 6= g2◦ g1, y cuando la igualdad se cumple
para todos los elementos del grupo, este se llama un grupo conmutativo. Ejemplos de grupos, los números reales R con la suma, o los números enteros Z con la suma. Otro ejemplo de mucha importancia en física, lo constituye el conjunto de transformaciones de simetría sobre un sistema, con la operación de grupo como la composición de transformaciones. Por una operación de simetría sobre un sistema entendemos una transformación que deja invari-ante al sistema. Por ejemplo, consideremos una molécula de amoniaco N H3,
constituida por tres átomos de hidrógeno y uno de nitrógeno. La configu-ración espacial de esta molécula es una pirámide cuya base es un triángulo equilátero determinado por los tres hidrógenos y el vértice lo determina el átomo de nitrógeno. Si rotamos esta molécula en un águlo de 120◦ o de 240◦
alrededor de un eje que pase por el átomo de nitrógeno y que sea perpendic-ular al plano determinado por los tres hidrógenos, entonces la configuración
espacial de la molécula no cambia, y se dice que la molécula posee el grupo de simetría conformado por los elementos:
G = {R(0◦), R(120◦), R(240◦)} (1.10)
en donde R(θ◦) significa rotar la molécula θ◦ alrededor de su eje de simetría. El elemento identidad es R(0◦) que significa no rotar, el producto de dos
rotaciones es otra rotación, R(θ◦) ◦ R(ϕ◦) = R(θ◦ + ϕ◦), e identificando R(0◦) ≡ R(360◦), los elementos del grupo R(120◦) y R(240◦) son mutua-mente inversos. Este ejemplo lo podemos generalizar al caso de las simetrías de un polígono regular de n lados. En este caso el grupo de simetrías, rota-ciones del polígono alrededor de un eje que pasa por su centro, tiene n elementos: G = {R(0◦), R(360 ◦ n ), R(2 360◦ n ) · · · R((n − 1) 360◦ n )} (1.11)
Consideremos ahora el caso límite de un polígono regular de infinitos lados, es decir el círculo. En este caso el grupo de simetrías contiene un número infinito no numerable de elementos y cada uno de los elementos está representado por una función R(θ◦) que representa una rotación en un ángulo θ◦, en donde θ◦ es un parámetro que toma valores en el intervalo [0, 360] y de nuevo se ha hecho la identificación R(0◦) ≡ R(360◦).
Estos ejemplos de grupos tratados, ilustran los tipos de grupos más co-munes que encontramos en diversas aplicaciones: Grupos con un número finito de elementos, como las rotaciones de un polígono regular de n la-dos, o grupos con un número infinito de elementos, pero numerable, como los enteros con la suma, y grupos con un número infinito no numerable de elementos. Esta última clase de grupos, caracterizados por un parámetro continuo (o varios parámetros continuos, como el grupo de rotaciones tridi-mensional) constituyen una clase particular de grupos llamados de Lie, los cuales juegan un papel muy importante en la matemática, y en especial en la física. Volveremos sobre ellos más adelante.
Definicion 13 Un cuerpo o campo (G, +, ×) es un conjunto de elementos G
sobre el cual están definidas dos operación internas +, y ×, llamadas suma y multiplicación respectivamente, tal que (G, +) forma un grupo abeliano, y la operación × satisface las siguientes propiedades:
C-1: Exista un elemento 1 ∈ G, llamado la identidad multiplicativa, con la propiedad que para todo elemento g ∈ G, se cumpla que 1 × g = g × 1 = g. C-2: Para cualesquiera tres elementos g1, g2, g3 ∈ G, se cumple que la
multiplicación se distribuye sobre la suma, i.e., g1× (g2+ g3) = g1× g2+
C-3: La multiplicación es asociativa y conmutativa, es decir, ∀g1, g2, g3∈
G, se cumple que: g1 × g2 = g2× g1, y g1× (g2× g3) = (g1× g2) × g3 =
g1× g2× g3.
El ejemplo más común, e importante de un campo lo constituyen los números reales con la suma y la multiplicación usuales. El concepto de campo es útil para nosotros en el contexto de la siguiente definición:
Definicion 14 Un espacio vectorial V, sobre un campo K, es un conjunto
de elementos, llamados vectores, con una operación interna + (suma de vectores) tal que:
V-1: La suma de vectores es conmutativa: ∀x, y ∈ V, se tiene que x+y = y + x.
V-2: La suma de vectores es asociativa: ∀x, y, z ∈ V, se tiene que x + (y + z) = (x + y) + z.
V-3: Existe el vector nulo 0 ∈ V, tal que ∀x ∈ V se cumple 0 + x = x. V-4: ∀x ∈ V, existe el vector −x ∈ V, tal que x + (−x) ≡ x − x = 0. Esto significa que el conjunto V con la suma de vectores forma un grupo abeliano. Sobre V está definida una operación externa (multiplicación por un escalar) con el campo K, llamado los escalares, es decir una función de la forma
· : K × G −→ G
(λ, g) 7−→ h = λ · g ≡ λg (1.12)
tal que:
V-5: λ(x+y) = λx+λy, para todo par de vectores x, y ∈ V y todo escalar λ ∈ K.
V-6: (α + β)x = αx + βy, para todo vector x, y todo par de escalares α, β.
V-6: α(βx) = (αβ)x, para todo vector x, y todo par de escalares α, β. V-7: 1x = x, 0x = 0 y (−1)x = −x, en donde 1 es la identidad multi-plicativa de K, 0 ∈ K la identidad aditiva y −1 ∈ K el inverso aditivo de 1.
El ejemplo más importante de espacio vectorial es Rn sobre los reales. Para construir otros ejemplos importantes por sus aplicaciones, considere-mos V y W dos espacios vectoriales sobre el cuerpo de los reales, y definaconsidere-mos una transformación lineal T como una función
T : V −→ W
tal que:
T (αv + βu) = αT (v) + βT (u); ∀v, u ∈ V y ∀α, β ∈ < (1.14)
Definamos sobre el conjunto de todas las transformaciones lineales de V en W, i.e.,
L(V, W) := {T : V → W | T es < − lineal} (1.15)
una suma y el producto por un real como:
(T1+ T2)(v) := T1(v) + T2(v); ∀T1, T2∈ L(V, W) y ∀v ∈ V (1.16)
(αT )(v) := αT (v); ∀T ∈ L(V, W) , ∀v ∈ V y ∀α ∈ < (1.17)
entonces, claramente T1+ T2 y αT también son transformaciones lineales,
i.e.,
T1+ T2, αT ∈ L(V, W) (1.18)
y por lo tanto el conjunto L(V, W) con estas operaciones es un espacio vec-torial real. Un caso de particular importancia es el espacio vecvec-torial L(V, <), llamado el espacio vectorial dual de V, que se denota por V∗ y sobre el cual volveremos más adelante.
Definicion 15 Un conjunto {v1, v2,..., vr} de r vectores de V, con vi 6= 0,
∀i = 1, 2, ..., r, se llama linealmente independiente si dada cualquier combi-nación lineal
r
X
i=1
αivi = 0 (1.19)
implica que todos los αi = 0.
Definicion 16 Al número máximo de vectores linealmente independientes
de V se le lllama la dimensión del espacio vectorial, y por lo tanto forman una base, i.e., cualquier vector del espacio se puede escribir como una com-binación lineal de estos vectores. Así, si {ei}, i = 1, 2, ..., n forman una base
del espacio vectorial V entonces todo v ∈ V lo podemos escribir como
v = v1e1+ v2e2+ · · · + vnen (1.20)
y los números v1, i = 1, 2, ..., n se le llaman las componentes del vector v en la base {ei}.
Definicion 17 Sea V un espacio vectorial real. Definamos una norma sobre V como una función
k · k V −→ R v 7−→ kvk (1.21) tal que: N-1: kvk > 0, si v 6= 0 y kvk = 0 si v = 0 N-2: kλvk =| λ | kvk N-3: kv + wk ≤ kvk + kwk
Toda norma sobre un espacio vectorial induce una métrica definida por:
d(v, w) := kv − wk (1.22)
La última estructura de gran importacia que se puede definir sobre un espacio vectorial es el producto punto, llamado también producto escalar o interno:
Definicion 18 Sea V un espacio vectorial real. Definamos un producto
in-terno sobre V como una función
h·, ·i V × V −→ R v, w 7−→ hv, wi (1.23) tal que: P-1: hv, vi > 0 si v 6= 0 y hv, vi = 0 si v = 0. P-2: hv, wi = hw, vi P-3: hλv, wi = λ hv, wi P-4: hv + w, zi = hv, zi + hw, zi
Las propiedades P-3 y P-4 significan que el producto punto es lineal en su primera componente, y P-2 implica que también es lineal en la segun-da componente. Dado un producto punto sobre un espacio vectorial real, entonces sobre él se induce una norma definida por:
kvk :=phv, vi (1.24)
y así se induce también una métrica y por ende una topología.
Con estas definiciones podemos introducir el concepto de base ortonor-mal {ei} i = 1, 2, ..., n de un espacio vectorial, en donde los vectores de la
base satisfacen la relación:
siendo δij el delta de Kronecker definido como 1 si i = j y cero en los demás
casos. De la desigualdad triangular, propiedad N-3 de la norma de obtiene la desigualdad de Cauchy-Schwarz:
| hv, wi |≤ kvkkwk (1.26)
la cual, a su vez, nos permite definir el concepto de ángulo θ entre dos vectores v y w, a través de la relación:
cos θ := hv, wi
kvkkwk (1.27)
lo cual justifica el nombre de base ortonormal, es decir vectores mutuamente ortogonales y de norma unitaria.
Para finalizar esta introducción veamos el concepto de espacio vectorial dual. Para este fin sea L(V,R) el conjunto de todas las transformaciones lineales del espacio vectorial sobre los reales, es decir:
L(V, <) := {f : V →< | f es lineal} (1.28)
y definamos sobre este conjunto la suma de fuciones y el producto de un número real por una función como:
(f + g)(v) := f (v) + g(v) (1.29)
(λf )(v) := λf (v) (1.30)
∀f, g ∈ L(V,<), ∀v ∈ V ∀λ ∈ <, entonces estas dos operaciones definen una estructura de espacio vectorial real sobre el espacio de funciones L(V,R). Este espacio claramente no es vacío, pues hv, ·i ∈ L(V,R), ∀v ∈ V, en donde hv, ·i significa el producto punto manteniendo la primera componente fija. Para conocer una función f del espacio L(V,R), es necesario conocer lo que la función le hace a cada vector v ∈ V, pero dado que el producto punto es lineal en cada componente, entonces para conocer f es suficiente conocer lo que la función le hace a los vectores de una base, pues sea {ei} i = 1, 2, ..., n
una base ortonormal de V, entonces si v ∈ V tenemos que v =
n
X
i=1
αiei (1.31)
en donde los coeficientes están dados por las proyecciones del vector v sobre los vectores de la base, es decir αj = hej, vi, entonces
f (v) = f ( n X i=1 αiei) = n X i=1 αif (ei) (1.32)
de esta forma conocer f (v) ∀v ∈ V es equivalente a conocer f(ei) ∀i =
1, 2, ..., n. Por otra parte, el teorema de representación de Ritz establece que para cada función f ∈ L(V,R) existe un vector w ∈ V tal que f(v) = hw, vi, entonces dada una base ortonormal {ei}de V las funciones hej, ·i := e∗i
definen una única base para el espacio L(V,<), llamada la base dual, pues hw, vi = * n X k=1 βkek, v + = n X k=1 βkhek, vi (1.33) = n X k=1 βk * ek, n X i=1 αiei + = n X k=1 n X i=1 βkαihek , ei i = n X k=1 n X i=1 βkαiδki= n X i=1 βiαi
En resumen, dado cualquier espacio vectorial real V, existe el espacio vectorial dual V∗, el espacio de las transformaciones lineales de V sobre los reales, con la misma dimensión y dada cualquier base {ei}i=1,...,nde V existe
una única base {e∗
j}j=1,...,n, la base dual, definida por la relación:
he∗k, eii = δki (1.34)
Se puede probar que el dual del dual V∗∗ de un espacio vectorial V es isomorfo al espacio vectorial original y por lo tanto se hace la identificación V ≡ V∗∗.
Variedades
2.1.
Variedades diferenciales
Definicion 19 Denotemos por Rn el espacio vectorial euclideano, i.e. al
conjunto de n-plas (x1, x2, · · ·, xn) con la métrica usual.
Definicion 20 Una función
ϕ : A ⊆ Rn −→ Rm
x 7−→ x0= ϕ(x) (2.1)
con A abierto de Rn, se llama de clase Cr si las coordenadas x0= (x01, x02, ·· ·, x0m) del punto imagen ϕ(x) son funciones r-veces continuamente diferen-ciables. Si la función ϕ es de clase Cr para todo r ≥ 0, entonces se dice que ϕ es suave o de clase C∞.
Definicion 21 Sea M un espacio topológico. Definimos una carta
coorde-nada Cα = (ϕα, Uα) sobre M como un homeomorfismo:
ϕα: Uα ⊆ M −→ Rn
p 7−→ x = ϕα(p) (2.2)
en donde Uα es un abierto de M, x = (x1, ···, xn) se llaman las coordenadas
del punto p y n es la dimensión de la carta.
Definicion 22 Sea M un espacio topológico. Un atlas A de clase Crsobre
M es una colección de cartas {Cα = (ϕα, Uα)}α∈I tal que:
A-i- Los abiertos Uα cubren M, i.e.:
M = [
α∈I
Uα (2.3)
A-ii- Si Uα∩ Uβ 6= φ entonces
ϕβ◦ ϕ−1α : ϕα(Uα∩ Uβ) ⊆ Rn −→ ϕβ(Uα∩ Uβ) ⊂ Rn
x = ϕα(p) 7−→ y = ϕβ(p) (2.4)
es un difeomorfismo de clase Cr.
Las funciones ϕβ◦ ϕ−1α y su inversa ϕα◦ ϕ−1β nos dan las ecuaciones de transformación entre las diferentes coordenadas.
Dos atlas A y B de clase Cr sobre un espacio topológico M se llaman
compatibles si la unión de los atlas es de nuevo un atlas de clase Cr, así la unión de todos los atlas compatibles sobre un espacio topológico forma un a clase de equivalencia de atlas, o un atlas maximal.
Definicion 23 Una Cr−variedad diferenciable M es un espacio topológico
de Hausdorff con un atlas maximal.
NOTA 1: Cada Uα es una vecindad coordenada local, es decir, si p ∈
Uα ⊂ M, entonces las coordenadas de p son las coordenadas del punto
imagen φα(p) ∈ Rn, asi notaremos φ
α(p) = (x1, x2, ..., xn) con xi= xi(p).
La condición A-ii exige que las vecindades coordenadas sean compati-bles, es decir: si p ∈ Uα∩ Uβ , entonces φα(p) = (x1, x2, ..., xn) y φβ(p) =
(x01, x02, ..., x0n) son dos coordenadas diferentes para el mismo punto, y que
las cartas (φα, Uα) y (φα, Uα) estén relacionadas por:
(φα◦ φ−1β )(x01, x02, ..., x0n) = (x1, x2, ..., xn) (φβ◦ φ−1α )(x1, x2, ..., xn) = (x01, x02, ..., x0n)
Es decir, las coordenadas xi = xi(x0 j) son funciones de clase Cr de las
coordenadas x0 j y viceversa x0 j = x0 j(xi).
NOTA 2: Otro atlas ∆0sobre M se dice Cr-compatible con ∆, Cr-atlas, sobre M si ∆ ∪ ∆0 es de nuevo un Cr-atlas sobre M . El atlas consistente
de la unión de todos los atlas compatibles con un atlas dado se llama el atlas maximal de M. Así un atlas maximal sobre M es el conjunto de todos los posibles sistemas coordenados que cubren a M. La compatibilidad de atlas es una relación de equivalencia. Una de estas clases de equivalencia es llamada una estructura diferenciable. Dada una variedad M es interesante preguntarse si ésta admite una única estructura diferenciable. Milnor en 1956 demostró que S7 posee 28 estructuras diferenciales diferentes. En 1984 se demostro que Rnadmite un número infinito de estructuras diferenciables.
NOTA 3: Una Cr-variedad con frontera se define de la misma manera cambiando Rn por 12Rn:= {x ∈ Rn| xn≥ 0}. El contorno de M, denotado por ∂M se define como el conjunto de todos los puntos de M cuya imagen bajo φαestán sobre el contorno de 12Rn. ∂M es una Cr-variedad sin frontera de dimensión n − 1.
Consideremos algunos ejemplos de variedades diferenciables:
R2 es una variedad bidimensional. Las coordenadas rectangulares (x, y : −∞ < x, y < ∞) cubren todo R2 . Las coordenadas polares (r, θ) cubren solo la vecindad cordenada (r > 0; 0 < θ < 2π). Así se necesitan por lo menos dos de tales cartas para para cubrir R2..
El cilindro bidimensional C2 es una variedad obtenida a partir de R2 identificando los puntos (x, y) con (x + 2π, y). Entonces (x, y) son coorde-nadas en la vecindad (0 < x < 2π, −∞ < y < ∞), así se necesitan por los menos dos de tales vecindades coordenadas para cubrir C2.. Similarmente la cinta de Möbius es obtenida identificando (x, y) con (x + 2π, −y)
La 2-esfera unidad S2 : {(x1, x2, x3) ∈ R3/ (x1)2 + (x2)2 + (x3)2 = 1}
es una variedad. Las coordenadas en cada punto de las regiones x1 > 0 y x1< 0 son:
(x2, x3); −1 < x2< 1; −1 < x3 < 1 Así se necesitan seis de tales cartas para cubrir S2.
Problema:
Mostrar que no se puede cubrir S2con un simple sistema de coordenadas. Otro ejemplo que generaliza a S2 es la n-esfera definida por
Sn:= {x ∈ Rn+1| (x0)2+ (x1)2+ · · · + (xn)2 = 1} (2.5) Para definir una estructura de variedad diferenciable, consideremos el hiper-plano H de Rn+1 definido por x0 = 0, consideremos el atlas definido por
las dos cartas (ϕ1, U1) y (ϕ2, U2), las dos proyecciones estereográficas de la
n−esfera sobre este plano H, definidas por:
ϕ1 : U1= Sn\{e0} −→ H ≡ Rn x 7−→ ϕ1(x) = x−x0e0 1−xo (2.6) ϕ2: U2 = Sn\{−e0} −→ H ≡ Rn x 7−→ ϕ2(x) = x−x0e0 1+xo (2.7) en donde e0 = (1, 0, ..., 0) ∈ Sn el ”polo norte ”de la n-esfera y −e0 el polo
menos el polo sur. Estas dos cartas son C∞ compatibles pues ϕ2◦ ϕ−11 (y) = y
kyk ; y ∈ R
n
y y 6= 0 (2.8)
No es difícil probar que la variedad Sn, a diferencia de Rn requiere por
lo menos dos cartas coordenadas para cubrir la variedad.
Definicion 24 Una variedad M se dice orientable si existe un atlas ∆ = {φα, Uα}α∈Λ
tal que en toda intersección no vacia Uα∩Uβ de abiertos, el determinante de
la matriz (∂xi/∂x0 j) es positivo, en donde (x1, x2, ..., xn) y (x01, x02, ..., x0n) son coordenadas en Uα y Uβ respectivamente.
Definicion 25 Un atlas ∆ = {φα, Uα}α∈Λ se dice localmente finito si todo
punto p de la variedad M tiene una vecindad abierta la cual intersecta solo
un número finito de vecindades Uβ.Una variedad M se llama paracompacta
si para todo atlas ∆ = {φα, Uα}α∈Λ existe un atlas localmente finito Γ =
{ψβ, Vβ}β∈Λ con cada Vβ contenido en algún Uα.
En lo sucesivo por variedad entenderemos una Cr-variedad de Hausdorff paracompacta.
A partir de variedades dadas es posible construir nuevas variedades di-ferenciables tomando el producto cartesianos entre ellas, pues dadas M y N variedades suaves de dimensiones m y n respectivamente, y sean A = {(Uα, ϕα)} y B = {(Vβ, ψβ)} sus atlas maximales, entonces
M × N := {(p, q) | p ∈ M, q ∈ N } (2.9)
el producto cartesiano es una variedad n + m dimensional, con el atlas max-imal definido como:
C := {(Uα× Vβ, ϕα× ψβ)} (2.10)
en donde
ϕα× ψβ : Uα× Vβ ⊂ M × N −→ Rm× Rn
(p, q) 7−→ (ϕα(p), ψβ(q)) (2.11)
Con esta definición podemos construir otras variedades de interés en física, como por ejemplo el cilindro bidimensional R × S1, o el toro S1× S1.
2.2.
Espacio tangente
El concepto de variedad surgió como una generalización de la teoría de superficies en R3. Así, por una parte se hace necesario generalizar el con-cepto de plano tangente a una superficie, y por otra parte, la noción de vector tangente a una variedad nos permitirá generalizar también los con-ceptos de derivadas direccionales en Rn. Existen varios caminos equivalentes para definir el concepto de vector tangente a una variedad. En estas notas seguiremos un camino, que si bien puede parecer abstracto en un comienzo, nos permitirá construir los conceptos necesarios para introducir la noción de derivada direccional sobre una variedad y de tensor, en una forma más directa.
Definicion 26 Sea M una variedad suave n−dimensional y
f : M −→ R
p 7−→ f(p) (2.12)
una función de valor real definida sobre la variedad. Entonces la función f
se dice de clase Ck en un punto p ∈ M si para toda vecindad coordenada
(Uα, ϕα) de p la función fα:= f ◦ ϕ−1α : ϕα(Uα) ⊂ Rn −→ R x = ϕα(q) 7−→ fα(x) = f (q) (2.13) es de clase Ck en el punto p ∈ U α ⊂ M. Llamemos F(M, R) := {f : M −→ R} (2.14)
al conjunto de todas las funciones de valor real definidas sobre la variedad. Sobre este conjunto podemos construir una estructura de espacio vectorial definiendo la suma de funciones y el producto de un real por una función en la forma:
(f + g)(p) := f (p) + g(p), ∀f, g ∈ F(M, R), ∀p ∈ M (2.15)
(λf )(p) := λf (p), ∀f ∈ F(M, R), ∀p ∈ M, ∀λ ∈ R (2.16)
La noción de diferenciabilidad de una función solo tiene sentido para funciones definidas sobre los reales (más generalmente sobre espacios de Banach) y por esta razón, la definición dada de diferenciabilidad se hace a través de las cartas coordenadas. Por lo tanto, para que esta definición
de diferenciabilidad tenga sentido es necesario mostrar que ella no depende de la carta coordenada utilizada. Así, sea (Uβ, ϕβ) otra carta con p ∈ Uβ,
entonces
fβ = f ◦ ϕ−1β = f ◦ ϕ−1α ◦ (ϕα◦ ϕ−1β ) = fα◦ (ϕα◦ ϕ−1β ) (2.17)
dado que las cartas son compatibles, esta relación implica que si la función f es diferenciable con respecto a la carta (Uα, ϕα) entonces también lo es
respecto a la carta (Uβ, ϕβ), y viceversa. Esta demostración de la
indepen-dencia de las cartas es el ingrediente fundamental para todas las definiciones u operaciones que se realicen sobre una variedad, en las cuales se involucren las cartas coordenadas.
Definicion 27 Sea M una variedad suave y p ∈ M. Un vector tangente vp
a la variedad M en el punto p es una función
vp : F(M, R) −→ R f 7−→ vp(f ) (2.18) tal que: T-1: vp es R−lineal, i.e., vp(f + λg) = vp(f ) + λvp(g), ∀f, g ∈ F(M, R), y ∀λ ∈ R T-2: vp es Leibnitziana, i.e., vp(f g) = f (p)vp(g) + vp(f )g(p).
Definamos por TpM al conjunto de todos los vectores tangentes a un
punto p ∈ M como el espacio tangente a la variedad en el punto p. Lemma 28 El espacio tangente TpM es un espacio vectorial real.
Para ver esto basta con definir la suma de vectores y el producto de un escalar (real) por un vector, y mostrar que estas operaciones están bien definidas, es decir satisfacen las propiedades T-1 y T-2. Sean vp, wp∈ TpM,
entonces definamos la suma y el producto por:
(vp+ wp)(f ) := vp(f ) + wp(f ), ∀f ∈ F(M, R) (2.19)
(λvp)(f ) := λvp(f ), ∀f ∈ F(M, <), ∀λ ∈ R (2.20)
La linealidad, propiedad T-1, es directa de probar pues
(vp+ λwp)(f + µg) = (vp)(f + µg) + λ(wp)(f + µg) (2.21)
por definición, luego vp+λwp∈ TpM. Para probar T-2, apliquemos vp+λwp
al producto f g, entonces, por definición de suma de vectores tenemos
puesto que vp y wp son vectores para los cuales vale T-2, y por lo tanto
(vp+ λwp)(f g) = f (p)vp(g) + vp(f )g(p) + λg(p)wp(g) + λwp(f )g(p)(2.23)
= f (p)(vp+ λwp)(g) + (vp+ λwp)(f )g(p)
como se quería probar.
Para mostrar que el espacio tangente tiene la misma dimensión que la variedad, veamos algunas definiciones y resultados importantes.
Definicion 29 Sea M una variedad suave y (Uα, ϕα) una vecindad
coor-denada de p ∈ M, y sea (x1, ..., xn) = ϕα(p) las coordenadas del punto p. Sea f ∈ F(M, R) y definamos la ”derivada parcial ” de la función f con respecto a las coordenadas xi, i = 1, ..., n en el punto p por
∂if (p) ≡ ∂f ∂xi(p) := ∂(fα) ∂xi (ϕα(p)) (2.24) entonces
Lemma 30 Las funciones
∂ ∂xi ¯ ¯ ¯ ¯p : F(M, R) −→ R (2.25)
son vectores tangentes de TpM.
Para demostrar este lema veamos que las funciones ∂i|psatisfacen T-1 y
T-2. Para este fin basta con recordar que las derivadas parciales son lineales y satisfacen la regla del producto. Sean f, g ∈ F(M, R) y λ ∈ R, entonces de la definición 29 tenemos ∂(f + λg) ∂xi (p) = ∂(fα+ λgα) ∂xi (ϕα(p)) (2.26) = ∂(fα) ∂xi (ϕα(p)) + λ ∂(gα) ∂xi (ϕα(p)) = ∂f ∂xi(p) + ∂g ∂xi(p)
lo cual prueba la linealidad, en donde en el segundo paso se ha hecho uso de la linealidad de las derivadas parciales. Para la propiedad T-2
∂(f g) ∂xi (p) = ∂(fαgα) ∂xi (ϕα(p)) (2.27) = fα(ϕα(p))( ∂(gα) ∂xi (ϕα(p)) + ∂(fαgα) ∂xi (ϕα(p))gα(ϕα(p)) = f (p)∂(g) ∂xi (p) + ∂(f ) ∂xi (p)g(p)
en donde para el tercer paso se ha utilizado la regla de la derivada de un producto de funciones.
El siguiente resultado muestra que las derivadas parciales∂x∂fi(p) definidas
en 29 son objetos locales, es decir solo dependen del comportamiento de las fuciones f en una vecindad del punto p ∈ M.
Lemma 31 Sea vp ∈ TpM un vector tangente y f, g ∈ F(M, R), entonces:
i.- Si f = g en alguna vecindad del punto p ∈ M, entonces vp(f ) = vp(g)
ii.- Si la función f es constante en una vecindad del punto p entonces vp(f ) = 0.
La prueba de este lema es sencilla pues toda transformación lineal trans-forma el cero en cero, y así
0 = vp(0) = vp(f − g) = vp(f ) − vp(g) (2.28)
además, si f = c = cons. entonces como
vp(1) = vp(1 · 1) = 1 · vp(1) + vp(1) · 1 = 2vp(1) (2.29)
se tiene que vp(1) = 0, y por lo tanto
vp(f ) = vp(c) = cvp(1) = 0 (2.30)
El siguiente teorema constituye el resultado central de esta sección.
Teorema 32 Sea (Uα, ϕα) una vecindad coordenada de un punto p ∈ M,
entonces los vectores coordenados ∂i |p i = 1, 2, ..., n conforman una base
para el espacio tangente TpM.
Así, TpM es un espacio vectorial real de la misma dimensión que la
var-iedad. Para probar este resultado veamos primero el concepto de funciones coordenadas. Las funciones
πi : Rn −→ R
x 7−→ xi (2.31)
para i = 1, 2, ..., n que a un punto de Rnle asocia su i−ésima coordenada se llaman funciones proyección o funciones coordenadas, las cuales son suaves. Entonces dada una carta (Uα, ϕα) de una variedad M definimos las funciones
coordenadas por
xi: M −→ R
las cuales asocian a cada punto p de la variedad la coordenada i−ésima bajo la carta (Uα, ϕα) pertenecen al espacio de las funciones reales definidas sobre
la variedad, i.e., xi ∈ F(M, R). Con esta definición podemos probar que los vectores tangente ∂i|p i = 1, 2, ..., n son linealmente independientes, pues
∂ixj |p= ∂(xjα) ∂xi (ϕα(p)) = ∂xj ∂xi = δ j i (2.33)
y por lo tanto cualquier combinación lineal nula de los vectores ∂i |p n
X
i=1
αi∂i |p= 0 (2.34)
al aplicarlas a las funciones coordenadas implican que αi = 0, ∀i = 1, 2, ..., n. Falta, entonces, probar que cualquier vector vp ∈ TpM se puede escribir
como una combinación lineal de los vectores coordenados ∂i|p i = 1, 2, ..., n,
esto es vp = n X i=1 vip(xi) ∂i |p≡ vpi ∂ ∂xi ¯ ¯ ¯ ¯ p (2.35) en donde en la última igualdad hemos utilizado la convención de suma de Einstein, es decir, toda expresión con dos índices iguales, uno como su-períndice y otro como subíndice implican una suma sobre los valores que toma el índice. Las cantidades reales vpi(xi) ≡ vpi son las componentes del vector tangente en la base coordenada. Para probar esto último haremos uso del siguiente resultado del cálculo. Si F : Rn→ R es una función suave en el punto a, entonces existen n funciones suaves Hk tales que para todo x ∈ Rn
se tiene que F (x) = F (a) + n X k=1 (xk− ak)Hk(x) (2.36) con Hk(a) = ∂F ∂xk ¯ ¯ ¯ ¯ x=a (2.37) Sea f ∈ F(M, R), entonces, aplicando este resultado a la función fα = f ◦ϕα
con a = ϕα(p) tenemos que para todo q ∈ Uα
f (q) = f (p) +
n
X
k=1
(xk◦ ϕα(q) − xk◦ ϕα(p))Hk(ϕα(q)) (2.38)
Sea vp ∈ TpM entonces, aplicando el vector tangente vp a la función
propiedad ii del Lema 5.3, obtenemos vp(f ) = vp(f (p)) + n X k=1 [ {(xk◦ ϕα(q) − xk◦ ϕα(p))} ¯ ¯ ¯ q=pvp(Hk◦ ϕα) + Hk◦ ϕα|pvp(x k ◦ ϕα(q) − xk◦ ϕα(p))] = n X k=1 [Hk◦ ϕα(p)]vp(xk◦ ϕα) (2.39)
de la ecuación (2.37) Hk◦ ϕα es justamente ∂if |p y por lo tanto para toda
función f ∈ F(M, R) tenemos que vp(f ) = vpi ∂f ∂xi ¯ ¯ ¯ ¯p (2.40)
como se quería probar. Los coeficientes de la expansión vip son los valores de la función vp aplicada a las funciones coordenadas xi.
Otra forma equivalente de introducir los vectores tangente es a través del concepto de derivada direccional. Para este fin definamos, primero, el concepto de curva sobre una variedad.
Definicion 33 Sea M una variedad suave. Una curva suave sobre la
var-iedad es una función
λ : I ⊂ R −→ M
t 7−→ λ(t) (2.41)
en donde I es un intervalo de los reales que contiene al cero y λ(0) = p, y si (Uα, ϕα) es una vecindad coordenada del punto p, entonces la curva
λα : I ⊂ R −→ Rn
t 7−→ λα(t) = ϕα◦ λ(t)
(2.42) sobre Rn es suave.
Sea un vector tangente vp ∈ TpM con componentes vip = vp(xi) en la
base coordenada (Uα, ϕα), i.e.,
vp= vpi∂i |p (2.43)
y definamos una curva λ por la curva en Rndefinida como
entonces esta curva pasa por el punto p ∈ M (i.e., pasa por el punto xi(p) = ϕα(p) ∈ Rn) para t = 0 y en este punto las componentes del vector tangente son vpi = dx i dt ¯ ¯ ¯ ¯ t=0 (2.45) así sobre la variedad M la curva pasa por p y tiene vector tangente vp ∈
TpM. Sea f ∈ F(M, R) una función de valor real sobre la variedad, entonces
vp(f ) = vip∂if |p= dxi dt ¯ ¯ ¯ ¯t=o ∂f ∂xi ¯ ¯ ¯ ¯p (2.46) = dx i(λ(t)) dt ¯ ¯ ¯ ¯ t=o ∂f ∂xi ¯ ¯ ¯ ¯ p = ∂f ∂t ¯ ¯ ¯ ¯ λ
es decir (∂/∂t)λ ∈ TpM y representa la derivada direccional de la función f
a lo largo de la curva λ.
De las ecuaciones diferenciales ordinarias se sigue que, dado un vector tangente vp ∈ TpM existe una única curva λ que pasa por el punto p ∈ M
y cuyo vector tangente en el punto p es vp. Así se puede visualizar a un
vector tangente vp ∈ TpM como una ”flecha ” en el punto p apuntando en
la dirección de una curva λ(t) con vector tangente vp en el punto p = λ(0).
En particular, dada una base coordenada para el espacio tangente ∂i |p las
correspondientes curvas son las curvas coordenadas.
Sea {Eα}α=1,2,...,n una base para el espacio tangente TpM, entonces
cualquier vector v ∈ TpM (en lo sucesivo escribiremos en negrilla los
vec-tores) se puede escribir como
v= vαEα (2.47)
en donde vα son las componentes del vector el la base {Eα}. En particular
si uno escoge los vectores base coordenados ∂i |p entonces las componentes
vi= v(xi) son las derivadas de las funciones coordenadas xi en la dirección del vector v. Definamos, ahora, el espacio vectorial dual de TpM.
Definicion 34 5.4 Sea M una variedad suave y TpM el espacio tangente
en un punto p. Una 1-forma ω (vector covariante cuyo nombre se justificará más adelante) en el punto p es una función lineal de valor real sobre TpM,
i.e.,
ω: TpM −→ R
v 7−→ ω(v) ≡ hω, vi (2.48)
i.- hω, x + zi = hω, xi + hω, zi ; ∀x, z ∈ TpM
ii.- hω, αxi = α hω, xi ; ∀x ∈ TpM y ∀α ∈ R.
Esto significa que las 1-formas sobre TpM pertenecen al conjunto de
L(V,R), es decir al conjunto de las transformaciones lineales de TpM sobre
los reales, y por tanto las 1-formas ω pertenecen al espacio vectorial dual Tp∗M del espacio tangente. Así, dada una base {Eα}α=1,2,...,n del espacio
TpM existe una única base (dual) {Eβ}β=1,2,...,n del espacio Tp∗M, el cual
lo llamaremos espacio cotangente, definida por: D
Eβ, Eα
E
= δβα (2.49)
Así, si ω ∈Tp∗M es una 1-forma y x ∈TpM es un vector, entonces
ω= ωβEβ (2.50)
x= xαEα (2.51)
y por lo tanto, aplicando linealidad y la relación 1-2.49, tenemos hω, xi = DωβEβ, xαEα E (2.52) = ωβxα D Eβ, Eα E = ωβxαδβα = ωαxα
Definicion 35 Cada función f ∈ F(M) define una 1-forma df en p dada
por:
< df , X >= Xf , ∀X ∈ TpM. (2.53)
A la 1-forma df la denominaremos la diferencial de f en p.
Si φα(p) = (x1, x2, ..., xn) son las coordenadas locales entonces las difer-enciales {dx1, dx2, ..., dxn} en p forman la base de 1-formas dual a la base coordenada {∂x∂1 |p,
∂ ∂x2 |p, ...,
∂
∂xn |p} de TpM, pués se cumple que:
< dxi, ∂
∂xj >= δ i
j (2.54)
En terminos de esta base {dxi} de Tp∗M la diferencial de una función f ∈ F(M) se puede escribir de la siguiente forma:
df = ∂f ∂xidx
i (2.55)
Observación:
Si df 6= 0, entonces las superficies f = cte son variedades de dimensión n-1. El subespacio de TpM consistente en todos los vectores X tales que
< df , X >=0 está formado por todos los vectores tangentes a las curvas que están en la superficie f = cte en el punto p. Así df se puede pensar como perpendicular o normal a la superficie f = cte en p.
2.3.
TENSORES
Definicion 36 Definimos el producto cartesiano Πsr de la siguiente forma:
Πsr:= Tp∗× Tp∗× Tp∗× · · · × Tp∗ | {z } r−veces × Tp× Tp× Tp× · · · × Tp | {z } s−veces (2.56)
Donde intervienen r factores T∗
p y s factores Tp, es decir:
Πsr= {(η1, ..., ηr, Y1, ..., Ys) | ηi∈ Tp∗, Yj ∈ Tp} (2.57)
Definicion 37 Un tensor T del tipo (r, s) en p ∈ M es una funcional
multilineal sobre Πsr, es decir:
T: Πsr−→ R
(η1, ..., ηr, Y1, ..., Ys) −→ T (η1, ..., ηr, Y1, ..., Ys) lineal en cada componente.
El espacio de todos los tensores es llamado el producto tensorial Tr s :
Tsr := Tp∗⊗ Tp∗⊗ Tp∗⊗ · · · ⊗ Tp∗⊗ Tp⊗ Tp⊗ Tp⊗ · · · ⊗ Tp (2.58)
Tsr= {f : Πsr→ R | f es lineal en todas sus componentes}
Donde intervienen r factores Tp∗ y s factores Tp.Tenemos que en particular
Definicion 38 Sean T y T0 ∈ Tsr(p) dos tensores del mismo tipo y defini-mos la suma por:
(T + T0)(η1, ..., ηr, Y1, ..., Ys) : = T(η1, ..., ηr, Y1, ..., Ys) (2.59) +T0(η1, ..., ηr, Y1, ..., Ys)
y el producto por un escalar α ∈ R como:
(αT)(η1, ..., ηr, Y1, ..., Ys) := αT(η1, ..., ηr, Y1, ..., Ys) (2.60) Con estas reglas Tsr(p) forma un espacio vectorial real de dimensión r +s. Sean Xi ∈ Tp (i = 1, ..., r) y ωj ∈ Tp∗(j = 1, ..., s). Denotemos por
X1⊗ X1⊗ · · · ⊗ Xr⊗ ω1⊗ ω2⊗ · · · ⊗ ωs
al elemento de Tsr(p) el cual transforma al elemento (η1, ..., ηr, Y1, ..., Ys) ∈ Πrs en el número
(X1⊗X1⊗ · · · ⊗Xr⊗ω1⊗ω2⊗ · · · ⊗ωs)(η1, ..., ηr, Y1, ..., Ys)(2.61)
: =< η1, X1> · · · < ηr, Xr>< ω1, Y1> · · · < ωs, Ys> Similarmente, si R ∈ Tsr(p) y S ∈ T
p
q(p), entonces denotaremos por R ⊗ S al
elemento de Ts+qr+p(p) el cual transforma al elemento (η1, ..., ηs+q, Y1, ..., Yr+p) en el número real
(R ⊗ S)(η1, ..., ηs+q, Y1, ..., Yr+p) (2.62)
: = R(η1, ..., ηs, Y1, ..., Yr)S(ηs+r, ..., ηs+q, Yr+1, ..., Yr+p Con este producto ⊗ el espacio de los tensores en p forma un álgebra sobre R.
Lemma 39 Sean {Eα} y {Eα} bases duales de Tp y Tp∗ respectivamente.
Entonces
{Eα1⊗Eα2⊗ · · · ⊗Eαr⊗E
β1⊗Eβ2⊗ · · · ⊗Eβs} (2.63)
con αi, βi = 1, 2, ...n es una base de Tsr(p). De esta forma, dado T ∈ Tsr(p)
escribimos:
T= Tα1····αr
β1···βsEα1⊗Eα2⊗ · · · ⊗Eαr⊗E
β1⊗Eβ2⊗ · · · ⊗Eβs (2.64)
Donde Tα1····αr
Usualmente T se llama un tensor r veces contravariante y s veces covari-ante, y las componentes están dadas por:
Tα1····αr
β1···βs = T(E
α1, ..., Eαr, E
β1, ..., Eβs) (2.65)
El álgebra del espacio vectorial Tr
s(p) se puede escribir en términos de las
componentes de los tensores en una base dada de la siguiente forma: (T + S)α1····αr β1···βs = T α1····αr β1···βs + S α1····αr β1···βs (2.66) (αT)α1····αr β1···βs = αT α1····αr β1···βs
y el álgebra del producto ⊗ como: (T ⊗ S)α1····αr+p β1···βs+q = T α1····αr β1···βsS αr+1····αr+p βs+1···βs+q (2.67)
Si {E0α} y {E0α} son otro par de bases duales de Tp y Tp∗, ellas pueden
ser expandidas en términos de las bases {Eα} y {Eα} en la forma:
Eα0 = φαα0 Eα (2.68)
Eα0 = φα0αEα (2.69)
Donde φαα0 y φα 0
α son matrices n × n no singulares. Puesto que las bases
{E0α} y {E0α} son duales, entonces:
δβ0α0 = < Eβ0, Eα0 >=< φβ 0 βE β, φ α α0 Eα > (2.70) = φβ0βφα0α< Eβ, Eα>= φ β0 βφ α α0 δβα = φβ0αφαα0 Es decir φα0α y φα 0
α son matrices mutuamente inversas.
Las componentes de un tensor T ∈ Tsr(p) con respecto a las bases {E0α}
y {E0α} son: Tα01····α0r β0 1···β0s = T(E α0 1, ..., Eα0r, E β01, ..., Eβ0s) (2.71)
y están relacionadas con las componentes de T en las bases duales {Eα} y
{ Eα} por: Tα01····α0r β01···β0s = φ α0 1 α1· · · φ α0 r αrφ β1 β01 · · · φ βs β0s T α1····αr β1···βs (2.72)
Definicion 40 La contracción de un tensor T del tipo (r, s) con compo-nentes Tα1····αr
β1···βs con respecto a las bases duales {Eα} y {E
α
} sobre el primer índice contravariante y el primer índice covariante es definido como el tensor C11(T) del tipo (r − 1, s − 1) cuyas componentes en las bases dadas sonTα1····αr α1β2···βs , es decir: C11(T) := Tα1····αr α1β2···βsEα2⊗ · · · ⊗Eαr⊗E β2 ⊗ · · · ⊗Eβs (2.73)
Veamos que esta operación de contracción es independiente de las bases usadas. Sean {E0α} y {E0α} otras bases duales, entonces:
C011(T) : = Tα01····α0r α0 1···β0sEα 0 2⊗ · · · ⊗Eα0r⊗E β0 2⊗ · · · ⊗Eβ0s = Tα01α2····αr α0 1β2···βsφ α0 2 α2· · · φ α0 r αrφ β2 β0 2 · · · φ βs β0 s T α0 1α2····αr α0 1β2···βs × ×φ γ2 α0 2 · · · φ γr α0 r φ β0 2 η2· · · φβ 0 s ηsEγ2 ⊗ · · · ⊗Eγr⊗E η2 ⊗ · · · ⊗Eηs = φα02 α2φ γ2 α0 2 · · · φ α0 r αrφ γr α0r φ β2 β0 2 φβ02 η2φ βs β0 s φ β0s ηsT α0 1α2····αr α0 1β2···βs ×
×Eγ2 ⊗ · · · ⊗Eγr⊗E
η2⊗ · · · ⊗Eηs = δ γ2 α2 · · · δ γr αr δ β2 η2φ βs ηsT α0 1α2····αr α0 1β2···βsEγ2⊗ · · · ⊗Eγr⊗E η2⊗ · · · ⊗Eηs = Tα01α2····αr α0 1β2···βsEα2 ⊗ · · · ⊗Eαr⊗E β2⊗ · · · ⊗Eβs = C1 1(T )
Similarmente se define la contracción sobre cualquier par de índices n y m, es decir Cnm(T ).
Definicion 41 La parte simétrica de un tensor T del tipo (2, 0) es el tensor S(T) ∈ T02(p) definido por: S(T)(η1, η2) : = (2.74) 1 2!{T(η1, η2) + T(η2, η1)}; ∀η1, η2 ∈ T ∗ p
Si denotamos las componentes de S(T)αβ por Tαβ, entonces:
S(T)αβ ≡ T(αβ)= S(T)(Eα, Eβ) (2.75) = 1 2!{T(E α, Eβ) + T(Eβ, Eα )} = 1 2! n Tαβ+ Tβαo
En general, se pueden definir las componentes simétricas de un tensor T∈Tsr(p) sobre cualquier número de índices covariantes o contravariantes, de la siguiente manera: Tα1····αr (β1···βs):= 1 s! X (β1···βs) T α1····αr β1···βs (2.76)
en donde la suma es sobre todas las permutaciones de los índices β1· · · βs, por ejemplo:
Tα(βγη)= 1 3!
©
Tαβγη+ Tαβηγ+ Tαγ βη+ Tαβγη+ Tαη βγ+ Tαηγβª (2.77) Un tensor se llama simétrico con respecto a ciertos índices si él coincide con su correspondiente parte simétrica, por ejemplo:
Tαβ = T(αβ)⇐⇒ Tβα = Tαβ (2.78)
Definicion 42 Similarmente a como se define la parte simétrica, definimos la parte antisimétrica A(T) de un tensor T ∈ T02(p) por:
A(T)αβ ≡ T[αβ]:= 1 2!
n
Tαβ− Tβαo (2.79)
y más generalmente de cualquier tensor T ∈ Tsr(p) como:
T[α1····αr] β1···βs := 1 r! X (α1····αr) (−1)pTα1····αr β1···βs (2.80)
donde p es el orden de la permutación. Por ejemplo:
T[βγη]= 1 3!{T
βγη
− Tβηγ+ Tγ βη− Tβγη+ Tη βγ− Tηγβ} (2.81) Un tensor se llama antisimétrico en ciertos índices, si éste es igual a su parte antisimétrica. Si Tαβ = T[αβ] es antisimétrico, entonces T(αβ) = 0. Además, dado T ∈ T02(p), se cumple siempre que;
Tαβ = T(αβ)+ T[αβ] (2.82)
Un subconjunto particularmente importante de tensores son los del tipo (0, q) los cuales son antisimétricos en todas sus q posiciones: Aq(p) ⊂ Tq0(p).
le llama el espacio de las formas sobre M en p. Si A y B son dos p- y q-formas, podemos definir la (p + q)-forma A ∧ Q, en donde ∧ es el producto tensorial antisimetrizado,
A∧ B :=A(A ⊗ B) (2.83)
es decir, A ∧ B es el tensor de tipo (0, p + q) cuyas componentes están dadas por:
(A ∧ B)α1····αpβ1···βq := A[α1····αpBβ1···βq] (2.84)
Por ejemplo, dados A, B ∈ A1(p), entonces:
(A ∧ B)αβ = A[αBβ] (2.85)
= 1
2!{AαBβ− AβBα} Por otro lado:
(B ∧ A)αβ = B[αAβ] (2.86) = 1 2!{BαAβ− BβAα} = (−1)1·1(A ∧ B)αβ En general : (A ∧ B) = (−1)p·q(B ∧ A) (2.87)
donde A es una p-forma y B es una q-forma.
Si consideramos los escalares como 0-formas, el producto ∧ llamado pro-ducto exterior, define un álgebra sobre el espacio de las formas, Λ(p) =
n
∪
p=0A(p), llamada el álgebra de Grassmann de las formas. Además, si {E α
} es una base de las 1-formas, entonces Eα1∧ · · · ∧Eαp es una base de las
p-formas, es decir, si A es una p-forma entoces podemos expresar A como A= Aα1...αpE
α1
∧ · · · ∧Eαp (2.88)
donde Aα1...αp = A[α1...αp]
Definicion 43 Un Ck-campo tensorial T del tipo (r, s) sobre un subconjun-to U ⊂ M es una función que asigna un elemensubconjun-to de Tsr(p) para cada p ∈ U,
tal que las componentes de T con repecto a alguna base cordenada definida sobre algun subconjunto abierto de U son funciones de clase Ck.
Denotaremos, como caso particular, por Ξ(M) al campo vectorial del tipo T01(p).
2.4.
Transformaciones entre variedades
Definicion 44 Sean M y N variedades m y n dimensionales. Una función
φ : M −→ N se llama de clase Cksi dados sistemas de coordenados (ψα, Uα)
y (ϕβ, Vβ) enM y N respectivamente, las coordenadas de φ(p) son funciones
de clase Ck de las coordenadas de p:
ϕβ◦ φ ◦ ψ−1α : ψα(Uα) ⊆ Rm −→ Rn
ψα(p) 7−→ ϕβ(φ(p)) (2.89)
Notemos que si m > n, entonces la funcion ϕβ ◦ φ ◦ ψ−1α no es uno a uno. Así, en general, esta función no tiene inversa, y en caso de que existiera ésta no será de clase Cr. Por ejemplo, sean M = N = R y sea φ(x) = x3,
entonces φ(x) ∈ C∞, y sin embargo φ−1(x) no es diferenciable en x = 0.
Definicion 45 Sea f ∈ F(N ) y φ : M −→ N . Entonces la función φ
induce una función ˜φ ˜
φ : F(N ) −→ F(M)
f 7−→ ˜φf (2.90)
definida por: ˜φf (p) := f (φ(p)).
De esta manera, φ transforma puntos de M en N y ˜φ convierte funciones de F(N ) en funciones de F(M) linealmente, pues:
˜
φ(αf + g)(p) = (αf + g)φ(p) (2.91)
= αf (φ(p)) + g(φ(p)) = α˜φf (p) + ˜φg(p)
Si λ(t) es una curva sobre M que pasa por p ∈ M, entonces la imagen φ(λ(t)) sobre N es una curva que pasa por φ(p).
Definicion 46 Dada φ : M −→ N definamos la transformación
φ∗: TpM −→ Tφ(p)N
X−→ φ∗X
de la siguiente manera: para cada f ∈ F(N ) definida en el punto en φ(p) y cada X ∈ TpM definimos φ∗X∈ Tφ(p)N así:
Claramente φ es lineal, pues:
φ∗(αX + Y)(f ) | φ(p)= (αX + Y)(˜φf ) |p (2.93)
= αX(˜φf ) |p +Y(˜φf ) |p
= αφ∗X(f ) |φ(p) +φ∗Y(f ) |φ(p)
Así, si (∂t∂)λ |pes el vector tangente a la curva λ en p ∈ M , entonces
φ∗(∂t∂)λ |φ(p)es el vector tangente a la curva φ ◦ λ en φ(p) ∈ N . φ∗ recibe el
nombre de diferencial de φ en p y en algunos textos se nota como dφ.
Definicion 47 Dada φ : M → N y usando la definición de φ∗ definimos la
función φ∗:
φ∗ : Tφ(p)∗ N −→ Tp∗M
De tal manera que la contracción de un vector y una 1-forma sea preserva-da bajo transformaciones. Es decir, preserva-dado Y ∈ Tφ(p)∗ N , entonces definimos
φ∗Y ∈ Tp∗M de manera que:
< φ∗Y, X >|p=< Y, φ∗X>|φ(p) (2.94)
Ahora, si consideramos las funciones F(M) como cero formas, identifi-caremos ˜φ ≡ φ∗.
Teorema 48 Una consecuencia de la definición de φ∗ es que:
φ∗(df ) = d(φ∗f ) (2.95) Demostracion: Sean X ∈TpM y f ∈ F(N), entonces: < φ∗(df ), X >|p=< df, φ∗X>|φ(p) (2.96) = φ∗Xf |φ(p)= X(˜φf ) |p ≡ X(φ∗f ) |p=< d(φ∗f ), X >|p
Como esto vale para todo X ∈ TpM se sigue que:
φ∗(df ) = d(φ∗f ) (2.97)
La transformacion φ∗ puede ser extendida naturalmente a tensores con-travariantes de M a N por las reglas:
T −→ φ∗T
definida por:
φ∗T (η1...ηr) := T (φ∗η1...φ∗ηr) |p; ∀ηi∈ Tφ(p)∗ N (2.99)
De la misma manera φ∗se generaliza a tensores covariantes de N a M así:
φ∗ : Ts0(φ(p)) −→ Ts0(p) (2.100)
T −→ φ∗T definida por:
φ∗T (X1...Xs) |p= T (φ∗X1...φ∗Xs) |φ(p) (2.101)
Definicion 49 La transformación φ : M −→ N se dice de rango s en p si
la dimensión de φ∗(TpM) es s. Así, si en p, s = m, entonces φ se llama
inyectiva y en este caso se debe cumplir que m ≤ n. Si en p, s = n, φ se llama sobreyectiva y se tiene que m ≥ n.
Definicion 50 Una Cr−transformación φ : M −→ N se llama una
inmer-sión si ∀p ∈ M, existe una vecindad U alrededor de p, tal que:
φ−1 : φ(U) ⊂ N −→ M (2.102)
es de clase Cr.
Por lo tanto si φ es una inmersión de M en N , entonces m ≤ n. Además, por el teorema de la función implícita φ es una inmersión si, y solo si, φ es inyectiva en todo punto p ∈ M, por lo tanto
φ∗ : TpM →φ∗(TpM) ⊂ Tφ(p)N (2.103)
es un isomorfismo. La imagen φ(M) es una subvariedead inmersa en N . Por ejemplo, toda curva λ : I ⊂ R −→ M es una inmersión si dxi(λ(t))dt
6= 0. Así una subvariedad inmersa en N puede intersectarse a si misma. Esto significa que φ : M −→ N no necesariamente es una función 1-1 de M sobre N , aún cuando φ si es uno a uno cuando se restringe a una vencidad suficientemente pequeña de M.
Definicion 51 Una inmersión φ : M → N se llama una inclusión si φ :
M → φ(M) ⊂ N es un homeomorfismo. De esta manera una inclusion es una inmersión que además es 1-1. Pero no toda inmersión uno a uno es una inclusión.
Definicion 52 Una transformación φ : M → N se llama un Cr-difeomorfismo
si φ es una Cr-transformación, uno a uno, y φ−1 : N → M es una Cr
-transformación.
En este caso m = n y φ es inyectiva y sobre.
Por el teorema de la función implícita se ve que si φ∗ es biyectiva en p, entonces φ es un difeomorfismo en una vecindad U de p.
Si φ : M → N es un difeomorfismo, entonces
φ∗ : TpM → Tφ(p)N (2.104)
y
(φ−1)∗ : Tp∗M → Tφ(p)∗ N (2.105)
son isomorfismos, y entonces podemos definir una transformación :
φ∗ : Tsr(p) −→ Tsr(φ(p)) (2.106)
por:
T (η1...ηs, X1...Xr) | p =: φ∗T ((φ−1)∗η1...(φ−1)∗ηs, φ∗X1...φ∗X(2.107)r)
∀ηi ∈ Tp∗M y Xi∈ TpM
Esta transformación envía tensores del tipo (r, s) sobre M a tensores del tipo (r, s) sobre N y preserva las relaciones de simetría y el álgebra tensorial. Por ejemplo c(φ∗T) = φ∗(cT).
2.5.
Cálculo en variedades
Definicion 53 El operador diferenciación exterior d es un operador lineal
d : Λr−→ Λr+1 (2.108)
definido por la forma en que el actúa sobre una 0-forma f ∈F(M)
< df , X >:= Xf ; ∀X ∈ TpM (2.109)
y actuando sobre un campo de r-formas A = Aα1···αrdx
α1 ∧ · · · dxα r da el campo de (r+1)-formas dA:= dAα1···αr∧dx α1 ∧ · · · dxα r (2.110)
Veamos que esta definición de dA es independiente de la base escogida. Consideremos otra base {x0 α}:
A= A0α1···αrdx0α1
∧ · · · dx0αr (2.111)
Donde las componentes A0α1···αrestán dadas por:
A0α1···αr = ∂x
α1
∂x0α1 · · ·
∂xαr
∂x0αrAα1···αr (2.112)
Así dA en la coordenada primada está dada por: dA = dA0α1···αr∧dx0α1∧ · · · dx0αr = = d(∂x α1 ∂x0α1 · · · ∂xαr ∂x0αrAα1···αr) ∧ dx 0α1 ∧ · · · dx0αr = ∂x α1 ∂x0α1 · · · ∂xαr ∂x0αrdAα1···αr∧dx 0α1 ∧ · · · dx0αr = ∂ 2xα1 ∂x0β1∂x0α1 ∂xα2 ∂x0α2 · · · ∂xαr ∂x0αrAα1···αrdx 0β1∧dx0α1 ∧ · · · dx0αr = ∂x α1 ∂x0α1 · · · ∂2xαr ∂x0β1∂x0αrAα1···αrdx 0β1∧dx0α1 ∧ · · · dx0αr (2.113)
Analicemos ahora un término que contenga segundas derivadas: ∂2xαr
∂x0β1∂x0αrdx
0β1∧dx0α1 (2.114)
∂2xαr
∂x0β1∂x0αr es simétrico en β1 y α1, mientras dx0β1∧dx0α1 es antisimétrico,
por lo tanto: ∂2xαr ∂x0β1∂x0αrdx 0β1∧dx0α1 = 0 (2.115) Entonces: dA = ∂x α1 ∂x0α1 · · · ∂xαr ∂x0αrdAα1···αr∧dx 0α1 ∧ · · · ∧ dx0αr = ∂x α1 ∂x0α1 · · · ∂xαr ∂x0αrdAα1···αr ∧ ∂x0α1 ∂xα1 dx α1 ∧ · · · ∧∂x 0αr ∂xαr dx αr = ∂x α1 ∂x0α1 ∂x0α1 ∂xα1 · · · ∂xαr ∂x0αr ∂x0αr ∂xαr dAα1···αr∧dx α1 ∧ · · · ∧ dxαr = dAα1···αr∧dx α1∧ · · · ∧ dxαr (2.116)
Notemos que esta definición no sería independiente de las coordenadas si en vez de usar el producto exterior ∧ se hiciera para el producto tensorial.
De la definición se sigue que:
d(A ∧ B) = dA ∧ B + (−1)rA∧ dB; ∀A ∈ Λr; ∀B ∈ Λs (2.117)
Dada una 0-forma f , tenemos que en una base coordenada:
df = ∂f ∂xidx i (2.118) entonces: d(df ) = ∂ 2f ∂xj∂xi | {z } sim´etrico dxj∧dxi | {z } antisim´etrico (2.119)
Teorema 54 Para toda p-forma:
d(dA) = 0 (2.120)
La demostración se deja como problema.
Lemma 55 Dado un campo vectorial X sobre M, existe una única curva
maximal λ(t) sobre M que pasa a través de cada p ∈ M tal que λ(0) = p y cuyo vector tangente en el punto λ(t) es el vector X |λ(t).
Demostración:
Si {xi} son coordenadas locales, tal que la curva λ(t) tiene coordenadas xi(t), y el vector X tiene componentes Xi en esta base, entonces la curva λ es solución del sistema de ecuaciones diferenciales:
dxi
dt = X
i(xi
(t) · · · xn(t)) (2.121)
Cuya solución está garantizada por el teorema general de las ecuaciones diferenciales ordinarias
Definicion 56 El flujo de un campo vectorial X sobre M es una
transfor-macion:
φ : M × R −→ M (p, t) −→ φ(p, t) := λp(t)
donde λp(t) es la curva integral maximal del campo X que en t = 0 pasa por
Si en φ(p, t), p es mantenido fijo, entonces φ(p, t) es justamente la cur-va integral λp(t). Por otro lado, si mantenemos t = cte, φ(p, t) define un
difeomorfismo:
φt: M −→ M
p −→ φt(p)
el cual envía un punto p de la variedad al punto φt(p), el cual está localizado una distancia paramétrica t sobre la curva integral λp(t).
Lemma 57 φtes un grupo local uniparamétrico de difeomorfismos, es decir φt satisface:
i.- φ0 es la identidad:
φ0 = id : M −→ M (2.122)
ii.- La ley de composición:
φt◦ φs= φt+s (2.123)
iii.- Existe un inverso:
φ−1t = φ−t (2.124)
De la definición de un Cr−difeomorfismo se sigue que si φ
t es un
difeo-morfismo, entonces:
(φt)∗: Tsr(p) −→ Tsr(φt(p)) T −→ (φt)∗T |φt(p)
2.5.1.
Derivada de Lie
Definicion 58 La derivada de Lie, LXT, de un campo tensorial T con
respecto al campo vectorial X es definida por:
LXT|p:= l´ım t→0
1
t{T |p−(φt)∗T|φt(p)} (2.125)
Lemma 59 Dados T1, T2 ∈ Tsr(M ), X, Y campos vectoriales sobre M y
f ∈ F(M), la derivada de Lie cumple las siguientes propiedades: 1.- LX es R-lineal:
LX(T1+ λT2) = LXT1+ λLXT2
2.- LX es una derivación, es decir, satisface la regla de Leibniz:
1. Lemma 60 3.- LX(Tsr(M )) ⊆ Tsr(M )
4.- LX conmuta con la operación de contracción.
5.- LXf = Xf =< df , X >
6.- Definiendo el conmutador de dos campos vectoriales por [X, Y](f ) := X(Yf ) − Y(Xf)
entonces el conmutador [X, Y] satisface la identidad de Jacobi: [[X, Y], Z] + [[Y, Z], X] + [[Z, X], Y]
Esta operacion de conmutación forma la llamada álgebra de Lie del espacio ℵ(M)
7.- Es fácil comprobar esta álgebra si trabajamos en una base coorde-nada {xi}, donde X=Xi∂i y Y=Yi∂i, entonces:
[X, Y]f = (Xi∂Y j ∂xi − Y i∂Xj ∂xi ) ∂f ∂xj (2.126)
Así, el vector [X, Y] tiene como componentes en la base coordenada {xi}: [X, Y] = (Xi∂Y j ∂xi − Y i∂Xj ∂xi ) ∂ ∂xj (2.127) entonces: LXY= [X, Y] (2.128) 8.- LX+λYT=LXT+ λLXT+ λLYT 9.- L[X,Y]= [LX, LY] = LX◦ LY− LY◦ LX
10.- Las siguientes tres proposiciones son equivalentes: i.- [X, Y] = 0
Lemma 61 ii.- LX◦ LY = LY◦ LX
iii.- Si φs y ψt son los difeomorfismos generados por los campos
X y Y respectivamente, entonces: