Relatividad General

Anuncio
Relatividad General
curso de maestrı́a
Olivier Sarbach
Instituto de Fı́sica y Matemáticas
Universidad Michoacana de San Nicolás de Hidalgo
27 de enero de 2011
2
Índice general
Prólogo
5
1. Introducción
1.1. Una breve historia de la gravitación . . . . . . . . . . . . . . . .
1.2. Teorı́a de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3. Relatividad especial . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1. Las transformaciones de Poincaré . . . . . . . . . . . . . .
1.3.2. Tensores de Lorentz . . . . . . . . . . . . . . . . . . . . .
1.3.3. Las ecuaciones de Maxwell en forma covariante . . . . . .
1.3.4. Las ecuaciones de movimiento para una partı́cula relativista
1.4. La estructura causal del espacio-tiempo . . . . . . . . . . . . . .
1.5. Apéndice: Transformaciones afines . . . . . . . . . . . . . . . . .
7
7
8
10
11
14
16
18
20
21
2. Teorı́as escalares de la gravedad
23
3. Geometrı́a diferencial
3.1. Variedades diferenciables . . . . . . . . . . . . . . . . . .
3.2. Campos vectoriales y tensoriales . . . . . . . . . . . . .
3.2.1. Vectores tangentes . . . . . . . . . . . . . . . . .
3.2.2. Transformaciones de coordenadas . . . . . . . . .
3.2.3. La diferencial de un mapeo . . . . . . . . . . . .
3.2.4. Campos vectoriales . . . . . . . . . . . . . . . . .
3.2.5. Campos de covectores . . . . . . . . . . . . . . .
3.2.6. Campos tensoriales . . . . . . . . . . . . . . . . .
3.3. Conexiones afines . . . . . . . . . . . . . . . . . . . . . .
3.3.1. La derivada covariante de campos tensoriales . .
3.3.2. El transporte paralelo a lo largo de una curva . .
3.3.3. Geodésicas . . . . . . . . . . . . . . . . . . . . .
3.4. Métricas pseudo-Riemannianas . . . . . . . . . . . . . .
3.4.1. La métrica como isomorfismo entre Tp M y Tp∗ M
3.4.2. La conexión de Levi-Civita . . . . . . . . . . . .
3.4.3. Integración de funciones sobre una variedad . . .
3.5. Derivada de Lie . . . . . . . . . . . . . . . . . . . . . . .
3.5.1. El flujo de un campo vectorial . . . . . . . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
27
27
31
31
34
34
35
39
41
45
49
51
55
57
60
61
65
70
70
4
ÍNDICE GENERAL
3.5.2. El pull-back y el push-forward de un difeomorfismo
3.5.3. La derivada de Lie . . . . . . . . . . . . . . . . . .
3.5.4. La interpretación geométrica de la derivada de Lie
3.6. Curvatura . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6.1. La interpretación geométrica de la curvatura . . .
3.6.2. La curvatura asociada a la conexión de Levi-Civita
3.7. Apéndice: Derivaciones . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
73
76
79
83
86
88
92
4. El principio de equivalencia
4.1. La formulación fı́sica del principio . . . . . . . . . . . . . . . . .
4.2. La formulación matemática del principio . . . . . . . . . . . . . .
4.3. Las ecuaciones de movimiento para una partı́cula . . . . . . . . .
4.4. El lı́mite Newtoniano . . . . . . . . . . . . . . . . . . . . . . . . .
4.5. Las ecuaciones de Maxwell en un fondo curvo . . . . . . . . . . .
4.5.1. La descripción a través de potenciales . . . . . . . . . . .
4.6. El lı́mite geométrico en un fondo curvo . . . . . . . . . . . . . . .
4.7. Campos estacionarios y estáticos . . . . . . . . . . . . . . . . . .
4.7.1. El principio de Fermat para campos estáticos . . . . . . .
4.8. El corrimiento al rojo . . . . . . . . . . . . . . . . . . . . . . . .
4.9. Sistemas de referencia no-rotantes . . . . . . . . . . . . . . . . .
4.9.1. La diferencia fı́sica entre espacio-tiempos estáticos y estacionarios . . . . . . . . . . . . . . . . . . . . . . . . . . . .
95
95
97
99
102
104
107
109
111
116
117
119
5. Las
5.1.
5.2.
5.3.
5.4.
5.5.
125
125
129
133
139
147
ecuaciones de Einstein
La interpretación fı́sica de la curvatura .
Las ecuaciones de Einstein en vacı́o . . .
Las ecuaciones de Einstein con materia .
Fluidos relativistas . . . . . . . . . . . .
El lı́mite Newtoniano . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
122
6. La solución de Schwarzschild
151
6.1. La derivación de la solución de Schwarzschild . . . . . . . . . . . 151
7. Campos gravitacionales débiles
153
8. Los universos de Friedmann-Lemaı̂tre
155
Prólogo
Estas notas se basan en gran parte en los cursos de relatividad general de los
Drs. Markus Heusler y Norbert Straumann de la Universidad de Zurich y en el
libro del Dr. Straumann, General Relativity and Relativistic Astrophysics [1]. En
particular, se trata de formular las leyes de la fı́sica en su forma independiente de
coordenadas locales, es decir, directamente sobre la variedad del espacio-tiempo.
Por esta razón, se introducen los conceptos de la geometrı́a diferencial que son
relevantes para la relatividad general.
Estas notas también contienen material que no se encuentra en todos los
libros estándares de relatividad general, como por ejemplo una teorı́a de integración de funciones sobre variedades pseudo-Riemannianas que evita la introducción de formas diferenciales, una formulación Lagrangiana de los fluidos
relativistas y (planeado) una derivación geométrica de la métrica de Schwarzschild.
Para referencias adicionales sobre la relatividad general, el lector puede consultar el libro de Wald [2], el libro de Misner, Thorne y Wheeler [3] o el libro
más reciente de Carroll [4].
Agradezco a mi esposa, Susana, y a mis estudiantes, sobre todo al Mtro.
Néstor Ortiz Madrigal por varias correcciones o sugerencias que ayudaron a
mejorar estas notas.
Morelia, 2011, Olivier Sarbach
5
6
ÍNDICE GENERAL
Capı́tulo 1
Introducción
1.1.
Una breve historia de la gravitación
1600: Galileo Galilei introduce la idea de sistemas de referencia en movimientos y encuentra que la aceleración de cuerpos en caı́da libre es universal.
1666: Isaac Newton formula la ley universal de la gravedad y las ecuaciones
de movimiento de la mecánica clásica.
1854: Georg Friedrich Bernhard Riemann interpreta el espacio como un
medio e introduce la noción de distancia a través de una métrica. Esto
llevará a la formulación de la geometrı́a diferencial.
1873: James Clerk Maxwell formula las ecuaciones completas de la electrodinámica. Además, la teorı́a de Maxwell ofrece un modelo de la luz como
un efecto electromagnético y predice la velocidad de la luz.
1887: Michelson y Morley muestran a través de experimentos que la existencia del éter queda descartada.
1905: Albert Einstein formula la teorı́a de la relatividad especial y revoluciona
los conceptos de espacio y de tiempo.
1915: Albert Einstein formula la teorı́a de la relatividad general que explica
la precesión del perihelio del mercurio. La relatividad general también
predice varios nuevos efectos (corrimiento al rojo, ondas gravitacionales)
algunos de ellos que son sorprendentes (agujeros negros, expansión del
universo).
1919: Eddington y Dyson miden la desviación de la luz durante un eclipse solar y encuentran que concuerda con la predicción de la relatividad general.
Einstein se vuelve famoso.
7
8
CAPÍTULO 1. INTRODUCCIÓN
La relatividad general juega un papel importante en varias ramas de la fı́sica
actual. Por ejemplo, es fundamental para entender el colapso de una estrella
y para entender el universo. También juega un papel importante en teorı́as
modernas de unificación de las fuerzas.
1.2.
Teorı́a de Newton
En la teorı́a de Newton existen sistemas de referencias (t, x) = (t, x, y, z)
preferidos que se llaman los sistemas inerciales. Están caracterizados por las
siguientes propiedades:
(i) Las partı́culas libres se mueven en trayectorias rectas,
d2 x
= 0.
dt2
(ii) Sean (t1 , x1 ) y (t2 , x2 ) dos eventos, entonces la cantidad
|t1 − t2 |
es independiente del sistema inercial.
Además, sean (t, x1 ) y (t, x2 ) dos eventos simultáneos, entonces la cantidad
|x1 − x2 |
es independiente del sistema inercial.
Las propiedades (i) y (ii) implican que dos sistemas inerciales (t̄, x̄) y (t, x)
están conectados por una transformación de coordenadas de la forma
t̄ = λ t + a,
(1.1)
x̄
(1.2)
= R x + v t + b,
donde λ = ±1, a ∈ R, b y v son vectores en R3 y R ∈ O(3) es una transformación
ortogonal. Para ver esto, observamos primero que la propiedad (i) implica que
la transformación L : (t, x) 7→ (t̄, x̄) mapea rectas sobre rectas. El Teorema 1
en el apéndice implica1 que L debe ser una transformación afı́n. Entonces la
propiedad (ii) lleva a la forma (1.1,1.2).
(1.1,1.2) se llaman transformaciones de Galilei. Forman un grupo de
dimensión 10.
Las ecuaciones de movimiento de Newton para una partı́cula en un potencial
gravitacional φ son
mi ẍ =
∆φ(t, x)
1 De
=
F (t, x) = −mg ∇φ(t, x),
(1.3)
4πGρ(t, x),
(1.4)
ahora en adelante, vamos a suponer que todas las transformaciones de coordenadas
son invertibles.
1.2. TEORÍA DE NEWTON
9
donde ρ es la densidad gravitacional de masa, mi es la masa inercial de la
partı́cula, mg su masa gravitacional,
G = 6,6743 × 10−11 m3 kg −1 s−2
la constante de Newton, ∇ = (∂x , ∂y , ∂z ) el operador nabla y ∆ = ∂x2 + ∂y2 + ∂z2
el operador de Laplace.
Ejemplo: Considere un objeto puntual de masa M en el origen. Entonces,
ρ(t, x) = M δ(x) y
GM
φ(t, x) = −
.
|x|
Entonces,
GM mg
F (t, x) = −
x.
|x|3
Los experimentos de Galilei surgieren que la aceleración es independiente de
la masa de los cuerpos, lo que implica que la masa inercial es igual a la masa
gravitacional,
mi = mg .
Es fácil ver que las ecuaciones de movimiento de Newton son invariantes
bajo transformaciones de Galilei. Hasta aqui todo está consistente. Un problema
aparece a la hora de considerar las ecuaciones de Maxwell,
1 ∂
(1.5)
B = 0,
c ∂t
1 ∂
1
∇ · E = ρc ,
∇∧B−
E = jc,
(1.6)
c ∂t
c
donde E y B denotan el campo eléctrico y magnético, c es la velocidad de la luz,
ρc la densidad de carga y j c la densidad de corriente eléctrica. En la ausencia de
fuentes (ρc = 0, j c = 0) las ecuaciones de Maxwell implican que las componentes
u de E y B satisfacen la ecuación de onda
∇ · B = 0,
∇∧E+
1 ∂2
u − ∆u = 0.
(1.7)
c2 ∂t2
En particular, la radiación electromagnética se propaga a la velocidad de la
luz. Por otro lado, las ecuaciones de Maxwell (1.5,1.6) no son invariantes bajo
transformaciones de Galilei. Por ejemplo, supongamos que E(t, x) y B(t, x)
satisfacen las ecuaciones de Maxwell, y sean Ē(t, x) = E(t, x − vt), B̄(t, x) =
B(t, x − vt) los campos transformados. Entonces
∇ ∧ Ē(t, x) +
1 ∂
B̄(t, x)
c ∂t
3
=
∇ ∧ E(t, x − vt) +
=
−
1 ∂B
1 X ∂B
(t, x − vt) −
(t, x − vt)vj
c ∂t
c j=1 ∂xj
(1.8)
3
1 X ∂B
(t, x − vt)vj ,
c j=1 ∂xj
(1.9)
10
CAPÍTULO 1. INTRODUCCIÓN
y obtenemos un término extra.
Fı́sicamente, la falta de invariancia de las ecuaciones de Maxwell bajo transformaciones de Galilei tiene que ver con el siguiente problema: Considere un
rayo de luz y un observador que viaja a la velocidad de la luz
c = 299, 792, 458 m/s,
en la misma dirección que el rayo de luz. El observador ve el rayo de luz (que
fue emitido en el sistema de reposo) como una onda estacionaria y no un rayo
de luz.
Geometricamente, esta falta de invariancia esta relacionada con la falta de
invariancia del cono de luz en un evento (t, x)
Ce := {(s, y) ∈ R4 : c|s − t| = |y − x|},
bajo transformaciones de Galilei. Si L es una transformación de Galilei que
lleva el evento e al evento e0 , entonces L(Ce ) solamente es igual a Ce0 para
transformaciones con v = 0.
1.3.
Relatividad especial
Para resolver este problema, Albert Einstein postuló en 1905:
(a) Los sistemas inerciales están caracterizados por las siguientes propiedades:
(i) Las partı́culas libres se mueven en trayectorias rectas,
d2 x
= 0.
dt2
(ii)’ La velocidad de la luz es independiente del sistema inercial.
(b) Las leyes de la mecánica y de la electrodinámica son las mismas en cada
sistema inercial
Como vemos, la propiedad (ii)’ reemplaza la propiedad (ii) en la teorı́a Newtoniana. Implica que el cono de luz en un evento e = (t, x),
Ce := {(s, y) ∈ R4 : c|s − t| = |y − x|},
es independiente del sistema inercial: Si L es una transformación entre dos
sistemas inerciales tal que L(e) = e0 , entonces L(Ce ) = Ce0 .
Los postulados de Einstein sugieren el siguiente programa: Primero, tenemos
que encontrar el grupo de transformaciones de un sistema inercial a otro, es decir, tenemos que encontrar las transformaciones de coordenadas (t, x) 7→ (t̄, x̄)
que son compatibles con los puntos (i) y (ii)’ arriba. Las transformaciones que
resultan se llaman las transformaciones de Poincaré y reemplazan las transformaciones de Galilei. Luego, tenemos que reformular las ecuaciones de movimiento de Newton (1.3,1.4) y las ecuaciones de Maxwell (1.5,1.6) en una forma que
es invariante bajo transformaciones de Poincaré.
1.3. RELATIVIDAD ESPECIAL
1.3.1.
11
Las transformaciones de Poincaré
Para encontrar las transformaciones que son compatibles con los puntos (i)
y (ii)’ es conveniente introducir la notación que sigue
x = (xµ ) = (ct, x),
(µ = 0, 1, 2, 3).
Además introducimos la matriz2 simétrica


−1 0 0 0
 0 1 0 0 

(ηµν ) := 
 0 0 1 0 .
0 0 0 1
Con esta notación, y el convenio de sumación sobre ı́ndices repetidos, podemos
caracterizar el cono de luz C por
0 = ηµν ∆xµ ∆xν = −c2 (∆t)2 + |∆x|2 ,
donde ∆xµ := xµ2 − xµ1 . ηµν define una forma bilineal (“producto escalar Lorentziano”),
(v, w) := ηµν v µ wµ = −v 0 w0 + v 1 w1 + v 2 w2 + v 3 w3 ,
v, w ∈ R4 ,
que no es positivo. El cono de luz consiste de los vectores ∆x ∈ R4 para los
cuales (∆x, ∆x) = 0. De hecho, no es difı́cil mostrar que cualquier otra forma
bilineal (., .)0 que caracteriza el cono de luz de esta manera está relacionada con
(., .) a través de una constante multiplicativa, es decir, existe α 6= 0 tal que
(v, w)0 = α(v, w)
para todos v, w ∈ R4 .
Ahora sea L : x 7→ x̄ una transformación de un sistema inercial a otro. Como
antes, la propiedad (i) implica que L mapea rectas sobre rectas y el Teorema 1
en el apéndice implica que L debe ser una transformación afı́n. Entonces existen
A ∈ GL(4, R) y a ∈ R4 tales que
x̄ = Lx = Ax + a.
Puesto que L debe dejar el cono de luz invariante (por la propiedad (ii)’), tenemos que
(Av, Aw) = α(v, w)
(1.10)
para todos v, w ∈ R4 , donde α 6= 0 es una constante. Esta constante debe
ser positiva porque de otra manera, la transformación lineal A mapearı́a el
interior, (v, v) < 0, del cono de luz (un conjunto desconectado) sobre el exterior,
(v, v) > 0, del cono de luz (un conjunto conectado) lo que no es posible dado
que A es continua.
2 Como
vamos a ver pronto, η no es realmente una matriz sino un tensor.
12
CAPÍTULO 1. INTRODUCCIÓN
En forma matricial, la condición (1.10) también se puede escribir como
vT AT ηAw = αvT ηw
para todos v, w ∈ R4 . Entonces, A tiene la forma
A = ΩΛ,
(1.11)
donde Ω > 0 es una constante positiva y Λ ∈ GL(4, R) satisface
ΛT ηΛ = η.
(1.12)
Una transformación lineal Λ : R4 → R4 que satisface (1.12) se llama transformación de Lorentz. El conjunto de todas estas transformaciones forma un
grupo que se llama el grupo de Lorentz. Elementos particulares de este grupo
son:
(1) Un boost (empuje) con velocidad v (|v| < c) en la dirección x:


γ γβ 0 0
 γβ
v
1
γ 0 0 
,
,
β= .
γ=p
Λ=
 0
2
0 1 0 
c
1−β
0
0 0 1
(2) Rotaciones:
Λ=
1
0
0T
R
R ∈ SO(3).
,
(3) Inversión del sentido del tiempo:

−1
 0
Λ=
 0
0
0
1
0
0
0
0
1
0

0
0 
.
0 
1
(3) Inversión de la paridad:

1
 0
Λ=
 0
0

0
0
0
−1
0
0 
.
0 −1
0 
0
0 −1
Se puede mostrar que cualquier transformación de Lorentz se puede escribir
como una composición de estos elementos particulares. Existe un boost y una
rotación en cada dirección, por lo tanto, el grupo de Lorentz es hexadimensional.
Ahora regresamos al resultado (1.11), A = ΩΛ. Queremos concluir que el
factor de escala, Ω, debe ser uno. Para mostrar esto vamos a suponer que cada
1.3. RELATIVIDAD ESPECIAL
13
sistema inercial posee una escala fija. Esto implica que Ω debe ser constante
para Λ fijo y que A solamente puede depender de Λ,
A = A(Λ) = Ω(Λ)Λ,
Ω(Λ) > 0.
Además, tenemos que A(Λ1 ) ◦ A(Λ2 ) = A(Λ1 ◦ Λ2 ) para todas las transformaciones de Lorentz Λ1 , Λ2 . Entonces,
Ω(Λ1 ) · Ω(Λ2 ) = Ω(Λ1 ◦ Λ2 )
(1.13)
para todas las transformaciones de Lorentz Λ1 , Λ2 . Pero esta condición y la
positividad de Ω implican que Ω(Λ) = 1 para todas las transformaciones de
Lorentz, como vamos a mostrar ahora: Primero, eligiendo Λ1 = Λ2 = I (la
identidad) en (1.13) obtenemos Ω(I) = 1. Luego, si Λ es una inversión de paridad
o del sentido del tiempo, tenemos que Λ2 = I y (1.13) implica que Ω(Λ) = 1.
Luego, sea Λ una rotación por el eje e, y sea S una rotación con el ángulo π por
un eje perpendicular a e. Entonces, S 2 = I y Λ−1 = SΛS. Por lo tanto, (1.13)
implica que Ω(Λ) = 1. De manera similar, sea Λ un boost en la dirección x y S la
rotación con el ángulo π por el eje z. Entonces S 2 = I y Λ−1 = SΛS y concluimos
que Ω(Λ) = 1, como antes. Finalmente, ya que cualquier transformación de
Lorentz se puede representar por la composición de transformaciones analizadas
hasta el presente, concluimos que Ω(Λ) = 1 para todas las transformaciones de
Lorentz.
Concluimos que las transformaciones L que llevan de un sistema inercial a
otro tienen la forma
Lx = Λx + a,
x ∈ R4 ,
(1.14)
donde Λ es una transformación de Lorentz y a ∈ R4 . El conjunto de todas
estas transformaciones generan un grupo de dimensión 10 llamado grupo de
Poincaré. Notamos que las rotaciones, las translaciones y la inversión de la
paridad y del sentido del tiempo también son elementos del grupo de Galilei.
Los boosts reemplazan las transformaciones de Galilei
t̄ = t,
x̄ = x + vt.
Por ejemplo, un boost en la dirección x tiene la forma
v t̄ = γ t + 2 x ,
c
x̄ = γ(x + vt)
(1.15)
(1.16)
(y ȳ = y, z̄ = z), donde γ = [1 − (v/c)2 ]−1/2 . Entonces recuperamos las transformaciones de Galilei en el lı́mite formal c → ∞. Para c finito ocurren efectos
cinemáticos que no se dan en la teorı́a Newtoniana:
(a) Dilatación del tiempo: Considere un reloj en reposo en el sistema inercial
(t, x), y sea ∆t una unidad de tiempo fija medida por este reloj. Un observador que se mueve en un sistema inercial (t̄, x̄) con velocidad v 6= 0
con respecto a (t, x) nota que ∆t̄ = γ∆t > ∆t.
14
CAPÍTULO 1. INTRODUCCIÓN
(b) Contracción del espacio: Considere un objeto de tamaño L que se encuentra en reposo en el sistema inercial (t, x). Un observador que se mueve en
un sistema inercial (t̄, x̄) con velocidad v 6= 0 con respecto a (t, x) mide
que el objeto tiene el tamaño L/γ < L.
(c) Adición de velocidades: Considere la composición de dos boosts
rección de x con velocidades v1 y v2 ,



γ2 γ2 β2 0
γ 1 γ 1 β1 0 0

 γ 1 β1

γ
β
γ2 0
γ
0
0
2 2
1
,
Λ2 = 
Λ1 = 


0
0 1
0
0 1 0 
0
0 0
0
0 0 1
2 −1/2
donde βm = vm /c, γm = (1 − βm
)
, m = 1, 2. Entonces,
 

γ
γ1 γ2 (1 + β1 β2 ) γ1 γ2 (β1 + β2 ) 0 0
 γ1 γ2 (β1 + β2 ) γ1 γ2 (1 + β1 β2 ) 0 0   γβ
=
Λ1 Λ2 = 

0
0 1 0   0
0
0
0 0 1
en la di
0
0 
,
0 
1

γβ 0 0
γ 0 0 
,
0 1 0 
0 0 1
donde β = (β1 + β2 )/(1 + β1 β2 ), γ = (1 − β 2 )−1/2 . Entonces, Λ1 Λ2 es un
boost con velocidad
v1 + v2
v = cβ =
.
(1.17)
1 + v1c2v2
En particular, |v| < c si |v1 | < c y |v2 | < c.
1.3.2.
Tensores de Lorentz
Definimos el espacio de Minkowki M := (R4 , (., .)), donde (., .) es el producto
(v, w) := ηµν v µ wµ = −v 0 w0 + v 1 w1 + v 2 w2 + v 3 w3 ,
v, w ∈ R4 .
Las definiciones que siguen podrı́an parecer un poco artificiales a primera vista.
Las transformaciones que se encuentran a continuación se volverán claras en el
contexto más general de tensores sobre variedades (ver el capı́tulo 3).
Definición 1 Sea x̄µ = Λµ ν xν + aµ una transformación de Poincaré, donde
Λµ ν denotan las componentes de la matriz Λ con respecto a la base canónica en
R4 .
1. Una función Φ : M → R se llama un escalar de Lorentz si
Φ̄(x̄) = Φ(x),
x ∈ M.
2. Un campo vectorial X : M → R4 se llama un vector de Lorentz (o cuadrivector) si
X̄ µ (x̄) = Λµ ν X ν (x),
x ∈ M.
Además, un cuadrivector v ∈ M se llama tipo tiempo si (v, v) < 0, tipo
espacio si (v, v) > 0, y nulo si (v, v) = 0.
1.3. RELATIVIDAD ESPECIAL
15
3. Un covector de Lorentz es un mapeo V : M → R4 tal que
V̄µ (x̄) = Λµ ν Vν (x),
x ∈ M,
donde Λµ ν denota las componentes de (Λ−1 )T . Notamos que Λα µ Λα ν =
Λµ α Λν α = δµ ν y que la contracción de un vector con un covector de Lorentz es un escalar de Lorentz:
X̄ µ V̄µ = Λµ α X α Λµ β Vβ = δα β X α Vβ = X α Vα .
4. De manera más general, un tensor de Lorentz del tipo (r, s) es un
mapeo T : M → R4(r+s) , x 7→ T µ1 µ2 ...µr ν1 ν2 ...νs (x) tal que
T̄ µ̄1 ...µ̄r ν̄1 ...ν̄s (x̄) = Λµ̄1 µ1 ···Λµ̄r µr Λν̄1 ν1 ···Λν̄s νs T µ1 ...µr ν1 ...νs (x),
x ∈ M.
Notamos que si T µ1 µ2 ...µr ν1 ν2 ...νs ≡ 0 en un sistema inercial, T̄ µ̄1 ...µ̄r ν̄1 ...ν̄s
también es cero en cualquier otro sistema inercial.
Ejemplos:
1. ηµν es un tensor de Lorentz (constante) del tipo (0, 2) dado que
η̄µ̄ν̄ = Λµ̄ µ Λν̄ ν ηµν = (Λ−1 )T ηΛ−1 µ̄ν̄ = ηµ̄ν̄ .
2. η µν := (η −1 )µν = ηµν es un tensor de Lorentz (constante) del tipo (2, 0)
puesto que
µ̄ν̄
Λµ̄ µ Λν̄ ν η µν = ΛηΛT
= η µ̄ν̄ .
3. Los tensores ηµν y η µν se pueden usar para “subir” y “bajar” los ı́ndices de
tensores. Por ejemplo, sea X µ (x) un campo vectorial de Lorentz, entonces
Vµ (x) := ηµν X ν (x)
es un covector de Lorentz:
V̄µ̄
= η̄µ̄ν̄ X̄ ν̄ = ηµ̄ν̄ Λν̄ ν X ν = [ηΛ]µ̄ν X ν
=
[(Λ−1 )T η]µ̄ν X ν = Λµ̄ α ηαν X ν = Λµ̄ α Vα .
De manera similar, X µ (x) := η µν Vν (x) es un campo vectorial de Lorentz
si Vµ (x) es un covector de Lorentz.
Ejercicio 1.
(a) Muestre que η µ ν = ην µ = δ µ ν , y que el tensor del tipo (2, 0) que se obtiene
al subir los ı́ndices de ηµν es consistente con la definición de η µν .
(b) Muestre que el operador
∂
(1.18)
∂xµ
se transforma como un covector de Lorentz bajo tansformaciones de Poincaré.
∂µ :=
16
CAPÍTULO 1. INTRODUCCIÓN
(c) Defina el siguiente

 +1,
−1,
εαβγδ :=

0,
tensor totalmente antisimétrico:
si αβγδ es una permutación par de 0123,
si αβγδ es una permutación impar de 0123,
de otra manera.
(1.19)
Muestre3 que εαβγδ se transforma como un tensor del tipo (0, 4) si nos
restringimos a las transformaciones de Poincaré con det(Λ) = 1.
(d) Sean S µ1 ...µr ν1 ...νs y T α1 ...αp β1 ...βq tensores de Lorentz del tipo (r, s) y
(p, q), respectivamente. Muestre que
(S ⊗ T )µ1 ...µr α1 ...αp ν1 ...νs β1 ...βq (x) := S µ1 ...µr ν1 ...νs (x) · T α1 ...αp β1 ...βq (x)
define un tensor de Lorentz del tipo (r + p, s + q).
1.3.3.
Las ecuaciones de Maxwell en forma covariante
Consideramos primero las ecuaciones de Maxwell homogéneas,
∇ · B = 0,
∇∧E+
1 ∂
B = 0.
c ∂t
Estas ecuaciones se pueden resolver introduciendo un potencial escalar Φ y un
potencial vectorial A tales que
B
= ∇ ∧ A,
(1.20)
E
1 ∂
= −∇Φ −
A.
c ∂t
(1.21)
Los potenciales (Φ, A) no son únicos; la transformación de norma
Φ 7→ Φ −
1 ∂
χ,
c ∂t
A 7→ A + ∇χ,
(1.22)
donde χ es una función diferenciable arbitraria, dejan E y B invariantes. Como
vemos de (1.22) es conveniente definir el cuadrivector
A = (Aµ ) ≡ (−Φ, A).
(1.23)
Con el operador (∂µ ) = (c−1 ∂t , ∇) definido en (1.18) la transformación (1.22)
se puede escribir como
Aµ 7→ Aµ + ∂µ χ.
(1.24)
3 Para
este ejercicio es conveniente mostrar la identidad
εαβγδ Aα µ Aβ ν Aγ τ Aδ ρ = det(A)εµντ ρ
para una matriz 4 × 4 A = (Aµ ν ) arbitraria.
1.3. RELATIVIDAD ESPECIAL
17
Por otro lado, las componentes de (1.20,1.21) son
B1
=
∂2 A3 − ∂3 A2 ,
y permutaciones cı́clicas de 123,
(1.25)
Ej
=
∂j A0 − ∂0 Aj ,
j = 1, 2, 3.
(1.26)
Entonces, si definimos
Fµν := ∂µ Aν − ∂ν Aµ ,
(1.27)
obtenemos

0
 E1
(Fµν ) = (−Fνµ ) = 
 E2
E3
−E1
0
−B3
B2
−E2
B3
0
−B1

−E3
−B2 
.
B1 
0
(1.28)
Puesto que el tensor εαβγδ definido en (1.19) es totalmente antisimétrico, tenemos que
εαβγδ ∂ β F γδ = 2εαβγδ ∂ β ∂ γ Aδ = 0.
Estas son las ecuaciones homogéneas de Maxwell.
Ahora consideramos las ecuaciones inhomogéneas,
∇ · E = ρc ,
∇∧B−
1 ∂
1
E = jc.
c ∂t
c
Definiendo el cuadrivector
(j µ ) := (cρc , j c )
(1.29)
no es difı́cil ver que se pueden escribir de la forma
∂β F αβ =
1 α
j .
c
(1.30)
Resumiendo, si consideramos E y B como componentes del tensor antisimétrico


0
E1
E2
E3
 −E1
0
B3 −B2 
,
(F µν ) = 
(1.31)
 −E2 −B3
0
B1 
−E3
B2 −B1
0
y si introducimos el cuadrivector (j µ ) := (cρc , j c ), las ecuaciones de Maxwell se
pueden escribir como
εαβγδ ∂ β F γδ =
1
∂β F αβ = j α .
c
0,
(1.32)
(1.33)
Pidiendo que F µν se transforme como un tensor de Lorentz del tipo (2, 0) y que
j µ se transforme como un vector de Lorentz, (1.32,1.33) se vuelven ecuaciones
entre tensores de Lorentz y por lo tanto tienen la misma forma en cualquier
sistema inercial.
18
CAPÍTULO 1. INTRODUCCIÓN
Observaciones
1. La ecuación de continuidad ∂t ρc + ∇j c = 0 es una consecuencia inmediata
de (1.33):
∂µ j µ = c∂µ ∂ν F µν = 0.
2. Aplicando la regla de transformación F̄ µν = Λµ α Λν β F αβ a un boost con
velocidad v = cβ en la dirección x,
x̄0
= γ(x0 + βx1 ),
x̄1
= γ(βx0 + x1 ),
γ = (1 − β 2 )−1/2 ,
y x̄2 = x2 , x̄3 = x3 , encontramos que
Ē1 = E1 ,
Ē2 = γ(E2 + βB3 ),
Ē3 = γ(E3 − βB2 ),(1.34)
B̄1 = B1 ,
B̄2 = γ(B2 − βE3 ),
B̄3 = γ(B3 + βE2 ).(1.35)
Entonces un boost mezcla el campo eléctrico con el campo magnético.
Por ejemplo, si q es una carga eléctrica en reposo con respecto al sistema
inercial (t, x) un observador que se mueve a una velocidad constante no
cero con respecto al sistema inercial (t, x) detecta un campo magnético
(B̄ 6= 0) aún si B = 0.
Ejercicio 2.
(a) Analice de que manera se transforman los campos E y B bajo rotaciones
y bajo la inversión de la paridad.
(b) ¿Cómo se transforman E, B, ρc y j c bajo la inversión del sentido del
tiempo?
1.3.4.
Las ecuaciones de movimiento para una partı́cula
relativista
Logramos formular las ecuaciones de Maxwell de tal manera que son invariantes bajo transformaciones de Poincaré. Ahora generalizamos la ecuación de
movimiento de Newton,
(1.36)
mi ẍ = F (t, x),
al caso relativista. Para esto, pensamos primero cómo definir la velocidad en
relatividad. Una posibilidad es dxµ /dt, pero el problema con esta definición es
que no resulta en un vector de Lorentz puesto que t no es un escalar de Lorentz.
Sea xµ (λ) la linea de mundo de una partı́cula con masa inercial mi , donde
λ es un parámetro de curva. Suponemos que la partı́cula se mueve con una
velocidad menor que la de la luz. Geometricamente, esto significa que para todo
1.3. RELATIVIDAD ESPECIAL
19
λ el cuadrivector dxµ /dλ es de tipo tiempo. En vez de t introducimos el tiempo
propio τ definido por
r
1
ds
dxµ dxν
dτ = ds,
:= −ηµν
.
(1.37)
c
dλ
dλ dλ
Por definición, τ es un escalar de Lorentz que no depende de la parametrización
λ de la curva. Entonces
dxµ
uµ :=
(1.38)
dτ
es un vector de Lorentz independiente de λ, llamado cuadrivelocidad. Las definiciones (1.37,1.38) son independientes del parámetro λ. Si usamos λ = t para
parametrizar la trayectoria de la partı́cula encontramos que
r
|v|2
dt
dτ = 1 − 2 dt =
c
γ
y por lo tanto, (uµ ) = γ(c, v), donde v := dx/dt. En el lı́mite Newtoniano
|v|/c 1 vemos que dτ ≈ dt y uj ≈ v j , j = 1, 2, 3.
Con estas definiciones es obvio cómo generalizar (1.36) al caso relativista:
Reemplazamos v = dx/dt por la cuadrivelocidad uµ = dxµ /dτ , el momento
lineal p = mi v por el cuadrimomento pµ = mi uµ y (1.36) por
dpµ
= F µ,
dτ
(1.39)
donde pedimos que F µ se transforme como un vector de Lorentz bajo transformaciones de Poincaré. La energı́a cinética relativista está definida por E = cp0 .
Puesto que
2
E
− |p|2 = −pµ pµ = m2i γ 2 (c2 − |v|2 ) = m2i c2 ,
c
encontramos que
q
E = c m2i c2 + |p|2 = γmi c2 .
La pregunta que queda es cómo elegir el cuadrivector F µ de fuerza. Para dar
un ejemplo, consideremos una partı́cula con masa inercial mi y carga q que se
mueve bajo la influencia de un campo electromagnético F µν . En un sistema
inercial tal que v(0) = dx/dt|t=0 = 0 (reposo momentáneo) la partı́cula no
siente el campo magnético al tiempo t = 0, y
d2 x mi 2 = qE(0, x(0)).
dt t=0
Esta ecuación es equivalente a
dpµ
q
= F µν uν
dτ
c
(1.40)
20
CAPÍTULO 1. INTRODUCCIÓN
al tiempo t = 0. No obstante, (1.40), siendo una ecuación para vectores de
Lorentz, vale en cualquier sistema inercial y por esta razón, F µ = qc−1 F µν uν .
Si v 6= 0, obtenemos
d
γmi c2
dt
d
γmi v
dt
= q v · E,
v
= q E+ ∧B .
c
(1.41)
(1.42)
La primera ecuación expresa la conservación de la energı́a. El lado derecho de
la segunda ecuación es la fuerza de Lorentz.
En los capı́tulos que siguen veremos cómo definir la fuerza relativista F µ para
una partı́cula que se mueve bajo la influencia de un potencial gravitacional.
1.4.
La estructura causal del espacio-tiempo
En la teorı́a Newtoniana, el tiempo es absoluto. Dado un evento e = (t, x),
cualquier otro evento ocurre o en el futuro de e, o en el pasado de e o bien al
mismo tiempo que el evento e. Existen las superficies distinguidas
Σt = {(t, x) : x ∈ R3 },
t∈R
que caracterizan el conjunto de eventos simultáneos. Los sistemas inerciales
están relacionados a través de las transformaciones de Galilei.
En la relatividad especial, la simultaneidad es una noción relativa. Las estructuras invariantes son los conos de luz
Ce := {(s, y) ∈ R4 : −c2 (s − t)2 + |y − x|2 = 0},
en cada evento e = (ct, x). Dado dos eventos e1 = (ct1 , x1 ) y e2 = (ct2 , x2 ), los
observadores inerciales solamente pueden ponerse de acuerdo si e1 y e2 están
relacionados de manera
causal: (e1 − e2 , e1 − e2 ) ≤ 0,
estrictamente causal: (e1 − e2 , e1 − e2 ) < 0,
acausal: (e1 − e2 , e1 − e2 ) > 0.
Los sistemas inerciales están relacionados a través de las transformaciones de
Poincaré.
La estructura causal del espacio-tiempo no es fija en la relatividad general
como en la teorı́a Newtoniana o en la relatividad especial, sino que está influenciada por la presencia de materia y de radiación. Como en la relatividad
especial, la estructura causal se define a través de un cono de luz
gµν X µ X ν = 0,
pero en la relatividad general el tensor métrico gµν (x) puede variar de un punto
del espacio-tiempo a otro. Además, la topologı́a del espacio-tiempo no tiene por
1.5. APÉNDICE: TRANSFORMACIONES AFINES
21
qué ser R4 , puede ser más complicada. Como vamos a ver, el tensor métrico gµν
no solamente describe la estructura causal del espacio-tiempo sino también el
campo gravitacional. Las ecuaciones de Einstein relacionan la (curvatura de) la
métrica con el tensor de energı́a-impulso. Una propiedad importante de la relatividad general es que no existen sistemas de referencia preferidos. Las ecuaciones
de campo valen en todos los sistemas de referencia.
1.5.
Apéndice: Transformaciones afines
En este apéndice demostramos el teorema siguiente:
Teorema 1 Sean n ≥ 2 y L : Rn → Rn una biyección de Rn que mapea
rectas sobre rectas. Entonces L es una transformación afı́n, es decir, existen
una transformación lineal A : Rn → Rn invertible y un vector b ∈ Rn tales que
L(x) = Ax + b
para todo x ∈ Rn .
Observación: El teorema no vale para n = 1 porque en este caso todas las
biyecciones de R a R mapean rectas sobre rectas.
Demostración del Teorema 14 .
Definimos la aplicación A : Rn → Rn , x 7→ A(x) := L(x)−L(0) que satisface
A(0) = 0. El objetivo consiste en demostrar que A es lineal.
Paso 1: Notamos primero que si R y R0 son dos rectas distintas paralelas, entonces
L(R) y L(R0 ) también son rectas distintas paralelas. De otra manera, L(R)
y L(R0 ) tendrı́an un punto en común lo que vioları́a la inyectividad de L.
Paso 2: Sean x, y ∈ Rn dos vectores linealmente independientes, y considere el
paralelogramo P con vértices 0, x, x + y, y. Dado que A mapea rectas paralelas sobre rectas paralelas, la imagen de P también es un paralelogramo
con vértices 0, A(x), A(x + y), A(y). Entonces, encontramos que
A(x + y) = A(x) + A(y),
para x, y ∈ Rn linealmente independientes.
Paso 3: Sea x ∈ Rn \ {0} y considere las rectas
R := {k x : k ∈ R},
R0 := A(R) = {k 0 A(x) : k 0 ∈ R}.
Entonces, la función A : R → R0 y la función inducida σ = σR : R → R,
k 7→ k 0 son biyectivas. Ahora mostramos que σ es un automorfismo, es
decir, satisface
σ(λ + µ) = σ(λ) + σ(µ),
4 Adaptado
de D. Giulini
σ(λ · µ) = σ(λ) · σ(µ)
de M. Berger, Geometry, Springer-Verlag, Volume 1 y de un comunicado privado
22
CAPÍTULO 1. INTRODUCCIÓN
para todos λ, µ ∈ R. Esto se puede ver de manera similar a la demostración
en el paso 2 tomando un punto y ∈ Rn \ R y usando el resultado del paso
1.
Paso 4: La función σ : R → R no depende de la recta R: Sea λ ∈ R \ {0} y
sean x, y ∈ Rn linealmente independientes. Considere la recta R que pasa
por los puntos 0, x y la recta R1 que pasa por los puntos 0, y. Entonces,
la recta que pasa a través de x y de y es paralela a la recta que pasa
a través de λx y λy. Dado el resultado del paso 1, la recta que pasa a
través de los puntos A(x) y A(y) es paralela a la recta que pasa a través
de los puntos A(λx) = σR (λ) A(x) y A(λy) = σR1 (λ) A(y). Entonces,
A(λy) = σR (λ) A(y) y σR1 (λ) = σR (λ).
Paso 5: De los pasos anteriores concluimos que A : Rn → Rn es una transformación
semi-lineal. Esto significa que existe un automorfismo σ : R → R tal que
A(λx + µy) = σ(λ) A(x) + σ(µ) A(y)
(1.43)
para todos x, y ∈ Rn , λ, µ ∈ R.
Paso 6: Sea σ : R → R un automorfismo de R. Entonces σ debe ser la identidad.
Para demostrar esta afirmación notamos primero que q ∈ R \ {0} implica
que σ(q) 6= 0. De otra manera, σ(p) = σ(q)σ(p/q) = 0 para todo p ∈ R
y σ serı́a identicamente cero. Luego, notamos que 0 + 0 = 0 y 1 · 1 =
1 implican que σ(0) = 0 y σ(1) = 1. Sea n = 1 + 1 + ... + 1 ∈ N.
Entonces σ(n) = σ(1) + σ(1) + ... + σ(1) = 1 + 1 + ... + 1 = n. Luego,
p + (−p) = 0 implica que σ(−p) = −σ(p) para todos p ∈ R. En particular,
σ(−n) = −σ(n) = −n para n ∈ N. Ahora, p · 1/p = 1 implica que
σ(1/p) = 1/σ(p) para p 6= 0. Entonces si m, n ∈ Z, n 6= 0, tenemos que
σ(m/n) = σ(m · 1/n) = σ(m)/σ(n) = m/n. Concluimos que σ : Q → Q
es la identidad.
Finalmente, sea p = q 2 > 0. Entonces σ(p) = σ(q)2 > 0. Esto muestra que
p1 < p2 implica que σ(p1 ) < σ(p2 ). Ahora sea p ∈ R arbitrario, y sean
ak y bk sucesiones en Q que convergen a p por debajo y por arriba de p,
respectivamente. Puesto que
ak = σ(ak ) < σ(p) < σ(bk ) = bk ,
k ∈ N,
obtenemos que σ(p) = p tomando el lı́mite k → ∞ a ambos lados. Esto
concluye la demostración del teorema.
Capı́tulo 2
Teorı́as escalares de la
gravedad
En este capı́tulo nos preguntamos si es posible reemplazar las ecuaciones de
movimiento de Newton,
mi ẍ
∆φ(t, x)
= F (t, x) = −mg ∇φ(t, x),
(2.1)
=
(2.2)
4πGρ(t, x),
por ecuaciones que son covariantes (es decir, su forma es invariante) bajo transformaciones de Poincaré. En la sección 1.3.4 ya encontramos una generalización
covariante de la primera parte de la ecuación (2.1),
mi
d2 xµ
= F µ,
dτ 2
donde τ es el tiempo propio de la partı́cula y F µ es un vector de Lorentz.
Para obtener una generalización covariante de (2.2) reemplazamos
∆
ρ
1 ∂2
+ ∆ = η µν ∂µ ∂ν (un escalar de Lorentz),
c2 ∂t2
= −η µν Tµν (un escalar de Lorentz),
por − ≡ −
por −T µ µ
donde Tµν es el tensor de energı́a-impulso de la materia. Entonces, obtenemos
Φ = 4πGT µ µ .
(2.3)
Si existe un sistema inercial (t, x) tal que Φ̇ = 0, T00 = ρ y T x x + T y y + T z z = 0,
entonces la ecuación (2.3) se reduce a la ecuación (2.2).
¿Cómo definir el cuadrivector de fuerzas, F µ ? Para esto notamos primero
que las trayectorias de partı́culas libres se pueden obtener a través del siguiente
principio variacional: Sean e1 = (ct1 , x1 ) y e2 = (ct2 , x2 ) dos eventos fijos
tales que (e1 − e2 , e1 − e2 ) < 0, y sea xµ : [0, 1] → M una curva causal que
23
24
CAPÍTULO 2. TEORÍAS ESCALARES DE LA GRAVEDAD
empieza en xµ (0) = e1 y termina en xµ (1) = e2 . Entonces la trayectoria fı́sica
está determinada por los puntos estacionarios del funcional
Ze2
µ
S[x (λ)] =
Z1
ds =
e1
ẋµ ≡
p
−ηµν ẋµ ẋν dλ,
dxµ
.
dλ
(2.4)
0
Notamos que para una curva xµ (λ) dada, la cantidad S[xµ (λ)]/c da el tiempo
propio de e1 a e2 . Entonces la trayectoria fı́sica es aquella que maximiza1 el
tiempo propio entre dos eventos e1 y e2 que son causalmente relacionados.
Sea xµ (λ) una curva que maximiza S. Podemos suponer que
p para esta curva
λ = τ /T es proporcional al tiempo propio de tal manera que −ηµν ẋµ ẋν = T c.
Ahora consideramos una variación δxµ (λ) de esta curva. Dado que e1 y e2 son
fijos, tenemos que δxµ (0) = δxµ (1) = 0. La variación de S da
0
=
1
δS[x (λ)] = −
cT
µ
Z1
ηµν ẋµ δ ẋν dλ
0
=
1
1
1
−
ηµν ẋµ δxν |λ=0 +
cT
cT
Z1
ηµν ẍµ δxν dλ
0
Z1
=
ηµν ẍµ δxν dλ,
0
donde hemos usado integración por parte en el segundo paso. Esto vale para
todas las variaciones δxµ (λ) con δxµ (0) = δxµ (1) = 0. Entonces, encontramos
que
d2 xµ
= 0,
(2.5)
dτ 2
la ecuación para una partı́cula libre en relatividad especial.
Ahora postulamos que una partı́cula que se mueve bajo la influencia del potencial gravitacional Φ obedece el principio variacional definido por (2.4) donde
reemplazamos ηµν por el tensor métrico2
gµν =
Φ
1+ 2
c
2
ηµν .
(2.6)
Entonces, buscamos curvas estacionarias del funcional
µ
Z1 S[x (λ)] =
1+
Φ
c2
p
−ηµν ẋµ ẋν dλ,
0
1 ¿Porqué
2 Notamos
se trata de un máximo y no de un mı́nimo?
que Φ tiene las unidades m2 /s2 .
ẋµ ≡
dxµ
.
dλ
(2.7)
25
Con respecto a un parámetro λ que es proporcional al tiempo propio τ , donde
ahora
dτ
1p
1
Φ p
µ
ν
=
−gµν ẋ ẋ =
1+ 2
−ηµν ẋµ ẋν ,
dλ
c
c
c
la variación de S da la ecuación de movimiento
"
#
2
d
Φ
d µ
η µν ∂ν Φ
1+ 2
x =−
.
dτ
c
dτ
1 + cΦ2
(2.8)
En el lı́mite Newtoniano donde |v|/c 1 y Φ c2 esta ecuación se reduce a
d2 x/dt2 = −∇Φ, la ecuación de Newton (2.1) con mi = mg .
Para resumir, las ecuaciones (2.8,2.3) ofrecen una generalización relativista
de las ecuaciones de movimiento de Newton (2.1,2.2). Teorı́as similares fueron
contempladas por el fı́sico teórico finlandés Gunnar Nordström en 1912 y 1913.
Sin embargo, la teorı́a que acabamos de describir debe ser descartada por las
siguientes razones experimentales:
1. Puesto que las geodésicas nulas son invariantes bajo transformaciones conformes de la métrica, gµν 7→ Ω2 gµν (como vamos a ver en el ejercicio 16,
los rayos de luz siguen rectas en la teorı́a de Nordström, y la teorı́a no
predice la desviación de la luz.
2. La precesión del perihelio de mercurio no concuerda con el experimento
(otro ejercicio en el futuro). Para un objeto que gira alrededor de una
estrella de masa M con momento angular L la teorı́a de Nordström predice
un ángulo de precesión
2
GM 2
1
∆φ = −π
= − ∆φEinstein
cL
6
por órbita. Para la órbita de mercurio alrededor del sol, se encuentra que
∆φ100y ≈ 4300 ≈ ∆φEinstein,100y ,
después de restar los efectos inducidos por los otros planetas.
3. Para campos materiales que satisfacen T µ µ = 0 (como el electromagnetismo, por ejemplo), la única solución estacionaria y asintóticamente plana
de (2.3) es la solución trivial, Φ ≡ 0. En este caso, las trayectorias de
partı́culas son rectas.
Ejercicio 3.
(a) Muestre que la ecuación (2.3) se puede obtener al variar la acción
Z
1
S[Φ] = L d4 x,
L = − ∂ µ Φ · ∂µ Φ + gΦT,
2
donde g = 4πG y T = T µ µ es la traza del tensor de energı́a-impulso de la
materia.
26
CAPÍTULO 2. TEORÍAS ESCALARES DE LA GRAVEDAD
(b) Muestre que el tensor de energı́a-impulso del campo gravitacional Φ está dado por
τ µν = −
∂L
1
∂ ν Φ + η µν L = ∂ µ Φ · ∂ ν Φ − η µν (∂ α Φ · ∂α Φ − 2gΦT ) .
∂(∂µ Φ)
2
(c) Muestre que para una configuración estática, la energı́a W =
está dada por
Z Z
T (x)T (y) 3 3
g2
d x d y.
W =−
8π
|x − y|
R
τ00 d3 x
En particular, la fuerza es atractiva si T es positivo.
(d) Considere la posibilidad de describir la gravitación a través de un campo
vectorial Aµ , como en la teorı́a de Maxwell:
Z
1
S[A] = L d4 x,
L = − F µν Fµν + gAµ Jµ ,
4
donde g es una constante de acoplamiento, Fµν := ∂µ Aν − ∂ν Aµ y Jµ describe las corrientes materiales. Muestre que para configuraciones estáticas
con distribución de masa ρ = J 0 positiva, la fuerza resultante es repulsiva.
Capı́tulo 3
Geometrı́a diferencial
El espacio-tiempo es un “medio cuadridimensional” en el sentido que se
necesitan cuatro números reales para caracterizar un evento. Entonces se ve
como R4 localmente. A pesar de esto, la topologı́a del espacio-tiempo puede ser
más complicada que R4 .
Una descripción matemática adecuada del espacio-tiempo está dada por la
definición de una variedad diferenciable. Esta definición que se discute en la sección 3.1 captura la idea de que el espacio-tiempo se ve como R4 localmente. Para
describir cantidades fı́sicas como la velocidad de partı́culas, el campo electromagnético, la estructura causal del espacio-tiempo etc. necesitamos introducir
campos tensoriales sobre la variedad, lo que se discute en la sección 3.2.
A continuación, analizaremos en la sección 3.3 como transportar vectores de
manera paralela a lo largo de una curva. Esto nos llevará a la noción de conexiones que también nos permite definir una derivada covariante para campos
tensoriales. Para medir la distancia entre dos puntos de una variedad se introduce una métrica. Como vamos a ver en la sección 3.4, dado una variedad con
una métrica existe una conexión preferida llamada la conexión de Levi-Civita o
conexión de Riemann. En relatividad general, es esta la conexión que se usa para
definir el transporte paralelo y la derivada covariante de campos tensoriales.
A parte de definir el transporte paralelo de vectores y tensores la conexión
también se puede usar para definir la curvatura de una variedad. Esto se explica
en la sección 3.6.
Las derivadas de Lie toman un papel importante para el estudio de simetrı́as
de variedades y se estudiarán en la sección 3.5.
Puesto que no hay ninguna ventaja en restringuirnos al caso de variedades
cuadridimensionales dejaremos la dimensión arbitraria.
3.1.
Variedades diferenciables
Definición 2 Sea n ∈ N. Una variedad (C ∞ –) diferenciable de dimensión
n es un conjunto M con una familia de mapeos biyectivos φα : Uα ⊂ M → Vα ⊂
27
28
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Rn de Uα ⊂ M sobre conjuntos abiertos Vα en Rn tal que
S
(i)
Uα = M ,
α
(ii) para todos α, β tales que Uαβ := Uα ∩ Uβ 6= ∅, los conjuntos φα (Uαβ ) y
φβ (Uαβ ) son abiertos en Rn y los mapeos
φαβ := φβ ◦ φ−1
α : φα (Uαβ ) → φβ (Uαβ )
son C ∞ –diferenciables.
(iii) La familia {(Uα , φα )} es máxima con respecto a las condiciones (i) y (ii),
es decir, si {(Vα , ψα )} es otra familia que satisface (i) y (ii), entonces
{(Vα , ψα )} ⊂ {(Uα , φα )}.
Cada par (Uα , φα ) se llama una carta local o un sistema local de coordenadas. Una familia de cartas locales {(Uα , φα )} que satisface los puntos (i) y
(ii) se llama un atlas diferenciable de M . Un atlas diferenciable de M que es
máximo en el sentido del punto (iii) se llama una estructura diferenciable
sobre M .
Observaciones
1. La condición (iii) en la definición de la variedad asegura que no se puede
obtener una nueva variedad al añadir o eliminar cartas locales. Dado un
atlas diferenciable {(Uα , φα )} es posible completarlo a un atlas diferenciable máximo tomando la unión de {(Uα , φα )} con el conjunto de todas las
cartas locales (U, φ) que satisfacen la condición (ii) con cualquiera de las
cartas (Uα , φα ).
2. Obviamente, tenemos que
φαα = id,
φβγ ◦ φαβ = φαγ ,
de tal manera que φ−1
αβ = φβα : φαβ : φβ (Uαβ ) → φα (Uαβ ) también es
C ∞ –diferenciable.
3. Dada una variedad diferenciable M existe una topologı́a natural sobre M :
Definimos que U ⊂ M es abierto si y sólo si φα (U ∩ Uα ) es abierto en Rn
para todo α.
No es difı́cil verificar que esto define una topologı́a sobre M con la propiedad que todos los conjuntos Uα son abiertos y tal que los mapeos
φα : Uα → Vα son continuos.
4. Por razones técnicas vamos a requerir que M satisfaga la condición de
Hausdorff y que M posee una base contable. La primera condición significa que para dos puntos distintos de M existen vecindades abiertas de
estos dos puntos que no se intersectan. La segunda condición significa que
M puede ser cubierta por un número contable de cartas locales. Estas
3.1. VARIEDADES DIFERENCIABLES
29
condiciones se necesitan para construir una partición de la unidad lo que
permite de globalizar varios resultados locales (ver la referencia [5]). Vamos a ver una aplicación de la partición de la unidad a la integración de
funciones sobre variedades en la sección 3.4.3.
Ejemplos de variedades diferenciables
1. M = Rn . Un atlas diferenciable se puede formar al tomar la única carta
local (Rn , id).
2. Cualquier subconjunto abierto U de Rn también es una variedad diferenciable (con el atlas diferenciable máximo obtenido al completar la carta
local (U, id)).
3. Sea
M = S 2 = {x ∈ R3 : x21 + x22 + x23 = 1}
la esfera con radio uno. S 2 es una variedad diferenciable de dimensión 2
que no se puede cubrir con una sola carta local. Para construir un atlas
introducimos las cartas locales que siguen:
Ui+ := {x ∈ S 2 : xi > 0},
φ1± (x) := (x2 , x3 ),
Ui− := {x ∈ S 2 : xi < 0},
φ2± (x) := (x1 , x3 ),
i = 1, 2, 3,
φ3± (x) := (x1 , x2 ),
para x ∈ S 2 . No es difı́cil verificar que las funciones de transición φi±j± =
∞
φj± ◦ φ−1
i± son C . Por ejemplo,
q
φ1− ◦ φ−1
(x
,
x
)
=
(
1 − x21 − x23 , x3 ),
x21 + x3 < 1, x1 < 0.
1
3
2+
Un atlas más “económico” de S 2 está dado por la proyección estereográfica:
Sean N := (0, 0, 1) y S := (0, 0, −1) el polo norte y el polo sur, y defina
x1
x2
2
U1 := S \ {N },
φ1 (x) :=
,
,
x ∈ U1 ,
1 − x3 1 − x3
x1
x2
U2 := S 2 \ {S},
φ2 (x) :=
,
,
x ∈ U2 .
1 + x3 1 + x3
Como se puede verificar, la función de transición φ12 = φ2 ◦ φ−1
: R2 \
1
2
{(0, 0)} → R \ {(0, 0)} está dada por
φ12 (X, Y ) =
X2
1
(X, Y ),
+Y2
(X, Y ) 6= (0, 0),
y es indefinidamente diferenciable.
4. Sean m > 0 y
+
Hm
:= {(t, x) ∈ R4 : t2 − x21 − x22 − x23 = m2 , t > 0}.
+
En los ejercicios se verifica que Hm
es una variedad diferenciable de dimensión 3. ¿Qué pasa para m = 0? ¿Es H0+ una varidad diferenciable?
30
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
5. Considere el conjunto
GL(2, R) := {A : R2 → R2 : A es lineal e invertible}.
(3.1)
Con la multiplicación definida por la composición de transformaciones
lineales, GL(2, R) es un grupo. Además, podemos identificar un elemento
de GL(2, R) con una matriz real de la forma
A=
a
c
b
d
,
det(A) = ad − bc 6= 0.
Con esto, obtenemos una carta global Φ : GL(2, R) → V ⊂ R4 , A 7→
(a, b, c, d), donde
V = {(a, b, c, d) ∈ R4 : ad − bc 6= 0}.
(3.2)
Puesto que V ⊂ R4 es abierto, concluimos que GL(2, R) es una variedad
diferenciable de dimensión 4. Es un ejemplo particular de un grupo de Lie.
Observación: Los ejemplos 3 y 4 son casos particulares de superficies de dimensión n − 1 en Rn . Para tratar estos casos tenemos el siguiente resultado:
Teorema 2 Sean n ≥ 2 y F : Rn → R una función C ∞ -diferenciable. Considere el conjunto
S := {x ∈ Rn : F (x) = 0} .
Entonces S define una variedad C ∞ -diferenciable de dimensión n − 1 si
∇F (x) 6= 0
para todo x ∈ S.
Demostración. Con el teorema de la función implı́cita.
Ejemplo: Para el caso de la esfera podemos definir F : R3 → R, x 7→ x21 + x22 +
x23 − 1. Entonces F es C ∞ -diferenciable, {x ∈ Rn : F (x) = 0} = S 2 y ∇F (x) =
2(x1 , x2 , x3 ) 6= 0 para todo x = (x1 , x2 , x3 ) ∈ S.
Definición 3 Sean M y N variedades diferenciables de dimensión m y n, respectivamente. Un mapeo continuo F : M → N se llama diferenciable en un
punto p ∈ M si dado una carta local (U, φ) con p ∈ U y una carta local (V, ψ)
con f (p) ∈ V , el mapeo
ψ ◦ F ◦ φ−1 : φ(F −1 (V ) ∩ U ) ⊂ Rm → Rn
(3.3)
es diferenciable en el punto φ(p).
F se llama C ∞ –diferenciable si dado una carta local (U, φ) de M y una
carta local (V, ψ) de N tal que F (U ) ∩ V 6= ∅ el mapeo (3.3) es indefinidamente
diferenciable.
3.2. CAMPOS VECTORIALES Y TENSORIALES
31
Observación: La condición (ii) en la definición de una variedad diferenciable
implica que la definición de la diferenciabilidad de F : M → N en un punto
p ∈ M es independiente de las cartas locales (U, φ) y (V, ψ).
Ejemplo: Sea M una variedad diferenciable de dimensión n, y sea (U, φ) una
carta local. Entonces las n funciones xi : U → R, p 7→ φi (p), i = 1, 2, ...n, son
C ∞ –diferenciables.
Definición 4 Sea F : M → N una función C ∞ –diferenciable y biyectiva con
la propiedad que F −1 : N → M también es C ∞ –diferenciable. Entonces F se
llama un difeomorfismo.
Ejemplo: Sean M = GL(2, R) la variedad definida en(3.1) y N = V el conjunto
a b
definido en (3.2). Entonces F : GL(2, R) → V , A =
7→ (a, b, c, d) es
c d
un difeomorfismo.
3.2.
3.2.1.
Campos vectoriales y tensoriales
Vectores tangentes
Definición 5 Sea M una variedad diferenciable. Sean p ∈ M y ε > 0. Una
función C ∞ –diferenciable
γ : (−ε, ε) → M,
γ(0) = p
se llama una curva (a través de p).
¿Cómo se puede definir el vector tangente de γ en el punto p?
Para responder esta pregunta supongamos primero que M = Rn . Si γ(t) =
(x1 (t), x2 (t), ..., xn (t)), t ∈ (−ε, ε) es una curva, entonces podemos definir el
vector tangente a γ en el punto p por el vector
X := γ̇(0) = (ẋ1 (0), ẋ2 (0), ..., ẋn (0)) ∈ Rn .
Ahora sea f : U → R una función diferenciable definida sobre una vecindad
U de p. La derivada direccional de f en el punto p con respecto al vector X
está definida por
∂f
d
i
i ∂
f (γ(t))
=
(p)X
=
X
f (p).
X[f ] :=
dt
∂xi
∂xi
t=0
Existe una correspondencia uno a uno entre la derivada direccional (visto como
un operador diferencial actuando sobre una función diferenciable y evaluado en
un punto p) y los vectores X en el punto p. Vamos a usar esta correspondencia
para definir vectores sobre variedades diferenciables.
32
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Definición 6 Sea M una variedad diferenciable y γ una curva que pasa a través
de un punto p ∈ M . Sea Dp el conjunto de funciones f : M → R que son C ∞ –
diferenciables en una vecindad del punto p. El vector tangente a la curva γ
en el punto p está definido como la función γ̇(0) : Dp → R dada por
d
,
f ∈ Dp .
(3.4)
f (γ(t))
γ̇(0)[f ] =
dt
t=0
Un vector tangente en el punto p es un vector tangente a alguna curva
en el punto p. Para lo que sigue, denotamos el conjunto de todos los vectores
tangentes en p ∈ M por Tp M . Tp M se llama el espacio tangente en el punto
p.
Un vector tangente Xp := γ̇(0) ∈ Tp M es una derivación en el punto p,
es decir, una función Dp → R que satisface las siguientes condiciones:
(i) Xp [af +bg] = aXp [f ]+bXp [g] para todos a, b ∈ R y f, g ∈ Dp (linealidad),
(ii) Xp [f · g] = f (p)Xp [g] + g(p)Xp [f ] para todos f, g ∈ Dp (regla de Leibnitz).
Por otro lado, se puede mostrar (ver el apéndice 3.7) que cualquier derivación
en el punto p se puede escribir como un vector tangente Xp en p. Entonces
otra definición equivalente de un vector tangente es una función Dp → R que
satisface las dos propiedades (i) y (ii) arriba. En particular, Tp M es un espacio
vectorial.
Para determinar la dimensión de Tp M elegimos una carta local (U, φ) de M
tal que p ∈ U y consideramos las curvas particulares a través de p definidas por
γi (t) := φ−1 (φ(p) + tei ),
|t| < ε,
i = 1, 2, ...n,
donde e1 = (1, 0, 0, ..., 0), e2 = (0, 1, 0, ..,0), ... , en = (0, 0, 0, ..., 1). Definimos
los vectores tangentes correspondientes
d
∂f ◦ φ−1
∂ −1
f
:=
γ̇
(0)[f
]
=
f
◦
φ
(φ(p)
+
te
=
(φ(p)),
(3.5)
)
i
i i
∂x p
dt
∂xi
t=0
para todo f ∈ Dp , donde notamos que f ◦ φ−1 : φ(U ) ⊂ Rn → R es una función
◦φ−1
de un subconjunto abierto de Rn a R, y que ∂f∂x
(φ(p)) es su i’ésima derivada
i
parcial en el punto φ(p).
∂ Lema 1 Los n vectores ∂x
, ∂ , ... , ∂x∂n p definidos en (3.5) forman una
1
p ∂x2 p
base de Tp M . En particular, dim Tp M = dim M = n.
Demostración. Primero vamos a demostrar que los vectores ∂ 1 , ... , ∂n ∂x
p
∂x
p
son linealmente independientes. Para esto, consideramos las funciones C ∞ –
diferenciables particulares xj : U → R, q 7→ φj (q), j = 1, 2, ...n. Usando (3.5)
encontramos que
∂ j
x = δi j ,
i, j = 1, 2, ...n,
(3.6)
∂xi p
3.2. CAMPOS VECTORIALES Y TENSORIALES
33
lo que implica la independencia lineal buscada. Por otro lado, sea Xp ∈ Tp M un
vector tangente en p y γ : (−ε, ε) → M una curva a través de p tal que γ̇(0) =
Xp . Denotando con (x1 (t), x2 (t), ..., xn (t)) = φ(γ(t)), |t| < ε, la proyección de
la curva sobre la carta local (U, φ), y usando (3.5) encontramos que
d
−1
f ◦ φ ◦ φ ◦ γ(t)
Xp [f ] =
dt
t=0
d
−1 1
2
n
=
f ◦ φ (x (t), x (t), ..., x (t))
dt
t=0
∂ i
= ẋ (0)
f,
∂xi p
para todo f ∈ Dp , lo que demuestra que los vectores
Tp M .
∂ ∂x1 p ,
... ,
∂ ∂xn p
generan
Resumiendo, un vector tangente Xp ∈ Tp M se puede expander de la forma
i ∂ Xp = Xp
(3.7)
∂xi p
∂ con respecto a una carta local (U, φ) tal que p ∈ U , donde los vectores ∂x
,
i
p
i = 1, 2, ..., n, están definidos en (3.5). Los n números reales Xp1 , Xp2 , ..., Xpn se
llaman las componentes del vector Xp con respecto a las coordenadas
locales (U, φ). Se pueden obtener usando la propiedad (3.6),
Xpi = Xp [xi ],
i = 1, 2, ...n.
(3.8)
Ejemplo: Sea M = S 2 las 2-esfera, y sea N = (0, 0, 1) el polo norte. Considere
la curva
γ(t) := cos(t) sen(t), sen2 (t), cos(t) ,
0 < t < 2π.
Vamos a calcular las componentes del vector tangente γ̇(s), 0 < s < 2π, en el
punto p = γ(s) con respecto a la carta local (U, φ) definida
por la proyección
x1
x2
2
2
1 2
estereográfica φ : U := S \ N → R , x 7→ (y , y ) := 1−x3 , 1−x
. De acuerdo
3
a (3.8) tenemos
Xp1
Xp2
d 1
d cos(t) sen(t) 1
= Xp [y ] =
y (γ(t))
=
= − cos(s) −
,
dt
dt
1
−
cos(t)
1
−
cos(s)
t=s
t=s
d 2
d sen2 (t) = Xp [y 2 ] =
y (γ(t))
=
= − sen(s),
dt
dt 1 − cos(t) t=s
t=s
1
y entonces
Xp =
1
− cos(s) −
1 − cos(s)
∂ ∂ − sen(s)
.
∂y 1 p
∂y 2 p
34
3.2.2.
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Transformaciones de coordenadas
Sean (U, φ) y (V, ψ) dos cartas locales que contienen el punto p ∈ M . Sea
q ∈U ∩V y
φ(q)
=
(x1 , x2 , ..., xn ) = x,
ψ(q)
=
(y 1 , y 2 , ..., y n ) = y,
entonces y = ψ ◦ φ−1 (x). Sea γ : (−ε, ε) → M una curva a través de p, y sean
x(t) = φ(γ(t)), y(t) = ψ(γ(t)). Sea Xp := γ̇(0) ∈ Tp M . Entonces por un lado
tenemos que
d
f ◦ ψ −1 (y(t))
Xp [f ] =
dt
t=0
d
−1
−1
=
f ◦ψ
ψ ◦ φ (x(t)) dt
t=0
∂
∂(ψ
◦ φ−1 )i j
−1
=
f ◦ψ
(y(0)) ·
ẋ (0)
∂y i
∂xj
p
i
∂y ∂ =
· Xpj
f.
∂xj p
∂y i p
Por otro lado, sabemos de (3.7) que
Xp =
Xpi
∂ i ∂ = Yp
.
∂xi p
∂y i p
Entonces, encontramos las siguientes reglas de transformaciones:
∂y i i
Yp =
Xj ,
(componentes de vectores)
∂xj p p
∂y i ∂ ∂ =
,
(regla de la cadena).
∂xj p
∂xj p ∂y i p
3.2.3.
(3.9)
(3.10)
La diferencial de un mapeo
Definición 7 Sean M y N variedades diferenciables, y sea F : M → N un
mapeo C ∞ –diferenciable. Sea g : N → R una función que es C ∞ –diferenciable
en la vecindad de un punto q = F (p), p ∈ M . Definimos el pull-back de g
como
F ∗ g := g ◦ F : M → R.
Dado que F es C ∞ –diferenciable, F ∗ g es C ∞ –diferenciable en una vecindad del
punto p y F ∗ : Dq → Dp . Definimos la diferencial de F en el punto p por el
mapeo dFp : Tp M → Tq N dado por
dFp (Xp )[g] := Xp [F ∗ g] = Xp [g ◦ F ],
donde Xp ∈ Tp M , g ∈ Dq .
3.2. CAMPOS VECTORIALES Y TENSORIALES
35
Observaciones
1. Obviamente, dFp : Tp M → TF (p) N es una transformación lineal.
2. Sea γ una curva en M a través de p, y sea Xp := γ̇(0) ∈ Tp M . Entonces
µ := F ◦ γ es una curva en N a través del punto q = F (p) y podemos
definir Yq := µ̇(0). Puesto que para g ∈ Dq ,
d
Yq [g] =
g ◦ µ(t)
dt
t=0
d
=
g ◦ F ◦ γ(t)
dt
t=0
d ∗
=
(F g)(γ(t))
dt
t=0
= Xp [F ∗ g]
(3.11)
encontramos que Yq [g] = dFp (Xp )[g], y entonces Yq = dFp (Xp ).
3. Otras notaciones comunes para dFp son
dFp ≡ F∗p ≡ Tp F.
Si F : M → N es un difeomorfismo también podemos definir dFq−1 : Tq N →
Tp M , y dFq−1 ◦ dFp = id. En este caso dFp es un isomorfismo. El siguiente
teorema muestra que si dFp : Tp M → Tq N es un isomorfismo, entonces F :
M → N es un difeomorfismo en una vecindad del punto p:
Teorema 3 Sea F : M → N una función C ∞ –diferenciable de una variedad
diferenciable a otra. Supongamos que en un punto p ∈ M , dFp : Tp M → TF (p) N
es un isomorfismo. Entonces, F es un difeomorfismo local en p, es decir, existe
una vecindad U de p tal que F |U : U → F (U ) ⊂ N es un difeomorfismo.
Demostración. Con el teorema de la función inversa.
3.2.4.
Campos vectoriales
Definición 8 Un campo vectorial sobre una variedad diferenciable M es una
función X que asocia a cada punto p ∈ M un vector Xp ∈ Tp M .
Sean (U, φ) una carta local y p ∈ U . De acuerdo a (3.7,3.8) tenemos que
i ∂ Xp = Xp
,
(3.12)
∂xi p
donde Xpi = Xp [xi ]. Las n funciones p 7→ Xpi , i = 1, 2, .., n, definidas sobre U
se llaman las componentes de X con respecto a la carta local (U, φ).
36
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Según la ley de transformación (3.9) las componentens X̄pi de X con respecto
a otra carta local (Ū , φ̄) que contiene el punto p son
∂ x̄i i
Xj .
X̄p =
∂xj p p
Definición 9 Un campo vectorial X se llama C ∞ –diferenciable si para cualquier carta local (U, φ) las funciones U → R, p 7→ Xpi , i = 1, 2, ..., n, son
C ∞ –diferenciables.
Observación: La propiedad (ii) de la definición de una variedad diferenciable
implica que si p 7→ Xpi es C ∞ –diferenciable con respecto a una carta local
(U, φ), entonces la función p 7→ X̄pi también es C ∞ –diferenciable con respecto a
otra carta local (Ū , φ̄) sobre la intersección U ∩ Ū . Una definición de un campo
vectorial diferenciable que no requiere el uso de coordenadas locales se puede
dar a través del fibrado tangente,
T M := {(p, v) : p ∈ M, v ∈ Tp M }.
T M posee una estructura diferenciable que se puede construir a partir de la
estructura diferenciable de la variedad diferenciable M . Con esto, T M es una
variedad diferenciable de dimensión 2n (ver [5] para más detalles). Entonces, un
campo vectorial diferenciable también se puede obtener a través de un mapeo
C ∞ –diferenciable M → T M .
Para lo que sigue, solamente consideramos campos vectoriales que son diferenciables y usamos la notación
F(M )
:
la clase de funciones M → R que son C ∞ –diferenciables,
X (M )
:
la clase de campos vectorial C ∞ –diferenciables sobre M .
Sean f ∈ F(M ) y X, Y ∈ X (M ). Entonces podemos definir los nuevos
campos vectoriales f · X y X + Y a través de
(f · X)p
(X + Y )p
:= f (p)Xp ,
:= Xp + Yp ,
para p ∈ M . Para f, g ∈ F(M ) y X, Y ∈ X (M ) tenemos que
f · (X + Y )
= f · X + f · Y,
(f + g) · X
= f · X + g · X,
f · (g · X)
=
(f · g) · X.
Definición 10 Sean f ∈ F(M ) y X ∈ X (M ), entonces definimos la función
Xf ∈ F(M ) a través de
(Xf )p := Xp [f ],
p ∈ M.
Xf se llama la derivada de f con respecto al campo vectorial X.
3.2. CAMPOS VECTORIALES Y TENSORIALES
37
Entonces también podemos interpretar un campo vectorial como un mapeo X :
F(M ) → F(M ). Se satisfacen las siguientes reglas:
(i) X(f + g) = Xf + Xg (linealidad),
(ii) X(f · g) = (Xf ) · g + f · (Xg) (regla de Leibnitz),
para X ∈ X (M ), f, g ∈ F(M ).
Con la interpretación de un campo vectorial como un operador sobre F(M )
también podemos considerar la composición X ◦ Y : F(M ) → F(M ) de dos
campos vectoriales X, Y ∈ X (M ). Sin embargo, X ◦ Y no necesariamente tiene
que ser un campo vectorial. Sean f, g ∈ F(M ), entonces las reglas (i) y (ii)
implican que
(X ◦ Y )(f · g)
=
X [(Y f ) · g + f · (Y g)]
=
(X ◦ Y f ) · g + f · (X ◦ Y )g + (Y f ) · (Xg) + (Xf ) · (Y g),
y la regla de Leibnitz para X ◦ Y solamente se satisface si la suma de los dos
últimos términos es cero. En cambio, el conmutador [X, Y ] := X ◦ Y − Y ◦ X
satisface la regla de Leibnitz.
Lema 2 Sean X, Y ∈ X (M ) dos campos vectoriales. Entonces el conmutador
[X, Y ] : F(M ) → F(M ), definido por
[X, Y ]f := X(Y f ) − Y (Xf ),
f ∈ F(M ),
es un campo vectorial. Además, el conmutador satisface las siguientes reglas:
(i) [X + Y, Z] = [X, Z] + [Y, Z] (linealidad)
(ii) [X, Y ] = −[Y, X] (antisimetrı́a)
(iii) [f · X, Y ] = f · [X, Y ] − (Y f ) · X
(iv) [X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y ]] = 0 (identidad de Jacobi)
para todos X, Y, Z ∈ X (M ) y f ∈ F(M ).
Ejercicio 4. Demostrar el Lema 2.
Observaciones
1. Las reglas (i)-(iv) implican que X (M ) forma una álgebra de Lie (de dimensión infinita) con respecto al conmutador [, ., ] : X (M )2 → X (M ).
2. Sea (U, φ) una carta local con respecto a la cuál
X
=
Y
=
∂
,
∂xi
∂
Yj j .
∂x
Xi
38
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Entonces, si f ∈ F(M ), obtenemos de acuerdo a (3.5),
(X ◦ Y )f = X(Y j
∂Y j ∂
∂ 2 f ◦ φ−1
∂
,
f ) = Xi i
f + X iY j
j
j
∂x
∂x ∂x
∂xi ∂xj
y
(X ◦ Y )f − (Y ◦ X)f =
Xi
∂Y j
∂X j
−Yi
i
∂x
∂xi
∂
f.
∂xj
Entonces,
[X, Y ] = [X, Y ]i
∂
,
∂xi
[X, Y ]i = X j
i
∂Y i
j ∂X
−
Y
.
∂xj
∂xj
(3.13)
3. Como vamos a ver en la sección 3.5, el conmutador [X, Y ] entre dos campos
vectoriales X y Y también se puede interpretar como el cambio infinitesimal de Y a lo largo del flujo generado por X.
Dado un campo vectorial X ∈ X (M ) diferenciable y dado un punto p ∈ M ,
existe una única curva γ a través de p tal que su vector tangente coincida con
X. Demostramos primero la versión local de esta afirmación.
Definición 11 Sea X ∈ X (M ), y sea p ∈ M . Una curva γ : (a, b) → M a
través de p que satisface
γ̇(t) = Xγ(t) ,
a < t < b,
(3.14)
se llama una curva integral de X a través del punto p.
Lema 3 Sea M una variedad diferenciable, y sea X ∈ X (M ) un campo vectorial diferenciable sobre M . Sea p ∈ M . Entonces existe una curva integral
γ : (−ε, ε) → M de X a través del punto p. Además, si µ : (a, b) → M
es otra curva integral de X a través de p, entonces µ(t) = γ(t) para todo
máx{a, −ε} < t < mı́n{b, ε}.
Demostración. Sea (U, φ) una carta local en una vecindad de p con coordenadas locales correspondientes x1 , ..., xn . Si parametrizamos (x1 (t), ..., xn (t)) =
∂
φ(γ(t)), |t| < ε, y expandemos X = X i ∂x
i , entonces la ecuación (3.14) para
|t| < ε es equivalente a
ẋi (t) = X i (φ−1 (x(t))),
|t| < ε.
Por los teoremas de existencia local para ecuaciones diferenciales ordinarias
(ver la referencia [6], por ejemplo) existe una única solución (x1 , x2 , ..., xn ) :
(−ε, ε) → Rn con (x1 , x2 , ..., xn )(0) = φ(p) si ε > 0 es suficientemente pequeño.
3.2. CAMPOS VECTORIALES Y TENSORIALES
3.2.5.
39
Campos de covectores
Nos acordamos del álgebra lineal: Sea V un espacio vectorial real de dimensión finita n. El espacio dual V ∗ está definido como el espacio vectorial
que consiste de todos los funcionales lineales η : V → R. Dada una base
B = {e1 , e2 , ..., en } de V , se definen los funcionales lineales particulares
η i (v) := v i ,
v = v i ei ,
para i = 1, 2, ..., n. Los elementos η 1 , η 2 , ... ,η n forman una base de V ∗ llamada la
base dual de B. Entonces V ∗ también es un espacio vectorial real de dimensión
n. Si ω ∈ V ∗ , entonces tenemos la expansión
ω = ωi η i ,
ωi = ω(ei ).
El doble dual, V ∗∗ , de V se puede identificar de manera natural con V mediante
el mapeo siguiente:
I : V → V ∗∗ ,
(Iv)(η) := η(v),
η ∈ V ∗,
v ∈ V.
(3.15)
No es difı́cil demostrar que I es lineal e invertible.
Si V posee una forma bilineal < ., . >: V × V → R no degenerada existe un
isomorfismo natural entre V y V ∗ dado por
J : V → V ∗,
Jv :=< v, . >,
v ∈ V.
En este caso, los espacios V y V ∗ también se pueden identificar.
Definición 12 Sea M una variedad diferenciable, y sea p ∈ M . El espacio dual
del espacio tangente Tp M en p se llama el espacio cotangente en p y se
denota por Tp∗ M .
Definición 13 Sea f : U ⊂ M → R una función diferenciable definida en un
subconjunto U abierto de M . Sea p ∈ U . Definimos la diferencial de f en el
punto p como
(df )p (Xp ) := Xp [f ],
Xp ∈ Tp M.
Entonces, (df )p ∈ Tp∗ M .
Observación: En la sección 3.2.3 definimos la diferencial de una función f :
M → N diferenciable de una variedad diferenciable M a otra N . En el caso
particular que N = R, esta definición implica que para una curva γ en M que
pasa a través del punto p con vector tangente Xp = γ̇(0),
d
Yq [g] = (df )p (Xp )[g] =
g ◦ f (γ(t))
= g 0 (q)Xp [f ],
dt
t=0
donde q = f (p), y g : R → R es una función que es diferenciable en q. Si
∂
identificamos Tq N con R a través de Tq R 3 Y = y ∂y
↔ y ∈ R, obtenemos
40
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
y = Xp [f ], y entonces (df )p (Xp ) = Xp [f ]. En este sentido, la definición de dfp ,
f : U ⊂ M → R, que acabamos de dar coincide con la definición dada en la
sección 3.2.3.
Sea (U, φ) una carta local en una vecindad de p ∈ M , y sea f : U → R
diferenciable en p. Entonces,
!
∂f ∂ =
.
(df )p
∂xi p
∂xi p
En particular, si f = xj : U → R es la función dada por xj (q) := φ(q)j ,
j = 1, 2, ..., n, obtenemos
!
∂
= δj i .
(3.16)
(dxj )p
∂xi p
Concluimos que {dx1p , dx2p , ..., dxnp } es la base de Tp∗ M que es dual a la base
∂ ∂ ∂ { ∂x
,
,
...,
} de Tp M . En particular, si ω ∈ Tp∗ M , tenemos la ex1
2
n
∂x
∂x
p
p
p
pansión
!
∂ j
ω = ωj dxp ,
ωj = ω
.
(3.17)
∂xj p
Los n números ω1 , ω2 , ..., ωn se llaman las componentes de ω con respecto a
las coordenadas locales (U, φ). Sea (V, ψ) otra carta local en una vecindad de
p, y considere las funciones y j : V → R, y j (q) := ψ(q)j , j = 1, 2, ..., n. Entonces,
!
∂y j ∂
j
(dy )p
=
,
∂xi p
∂xi p
y obtenemos las leyes de transformaciones
(dy j )p
=
∂ ∂y i p
=
∂y j (dxi )p ,
∂xi p
∂xj ∂ .
∂y i p ∂xj p
(3.18)
(3.19)
La ecuación (3.19) también se obtuvo en (3.10). Las ecuaciones (3.17) y (3.18)
implican que las componentes ηj y ωi de ω con respecto a las coordenadas locales
(V, ψ) y (U, φ), respectivamente, están relacionadas por
∂xi ηj =
ωi
(componentes de covectores).
(3.20)
∂y j p
Definición 14 Un campo de covector sobre una variedad diferenciable M
es una función ω que asocia a cada punto p ∈ M un covector ωp ∈ Tp∗ M .
Con respecto a una carta local (U, φ) podemos expander
ωp = ωj (p)dxjp ,
p ∈ U,
3.2. CAMPOS VECTORIALES Y TENSORIALES
41
donde las n funciones p 7→ ωj (p), j = 1, 2, ..., n, definidas sobre U se llaman las
componentes de ω con respecto a la carta local (U, φ). Según (3.17) se
pueden obtener a través de
!
∂ ,
j = 1, 2, ..., n,
p ∈ U.
ωj (p) = ωp
∂xj p
Definición 15 Un campo de covector ω se llama C ∞ – diferenciable si para
cualquier carta local (U, φ) las n funciones U → R, p 7→ ωi (p), i = 1, 2, ..., n,
son C ∞ –diferenciables. Denotamos por X ∗ (M ) la clase de campos de covectores
C ∞ –diferenciables sobre M .
Ejemplo: Si f ∈ F(M ) es una función C ∞ –diferenciable sobre M , entonces su
diferencial df ∈ X ∗ (M ).
Observación: Como en el caso de los campos vectoriales diferenciables, una
definición de un campo de covector diferenciable que no requiere el uso de coordenadas locales se puede dar a través del fibrado cotangente,
T ∗ M := {(p, ω) : p ∈ M, ω ∈ Tp∗ M }.
3.2.6.
Campos tensoriales
Nos acordamos del álgebra lineal: Sea V un espacio vectorial real de dimensión finita n con espacio dual correspondiente V ∗ . Un tensor del tipo (r, s)
es una función multilineal (V ∗ )r × V s → R. En particular, un tensor del tipo
(0, 1) es un elemento de V ∗ (un funcional lineal) y un tensor del tipo (1, 0) es
un elemento de V ∗∗ ' V (un vector).
Sean ω y η dos funcionales lineales (es decir, dos tensores del tipo (0, 1)).
Entonces podemos definir un tensor ω ⊗ η del tipo (0, 2) a través del producto
tensorial,
(ω ⊗ η)(v, w) := ω(v)η(w),
v, w ∈ V.
De hecho, cualquier tensor t del tipo (0, 2) se puede escribir como una combinación lineal de productos tensoriales entre dos funcionales lineales: Sea B =
{e1 , e2 , ..., en } una base de V con base dual correspondiente B ∗ = {η 1 , η 2 , ..., η n }
de V ∗ . Entonces, para dos vectores v = v i ei , w = wj ej en V la multilinealidad
de t implica que
t(v, w)
= v i wj t(ei , ej )
= t(ei , ej )η i (v)η j (w)
= t(ei , ej )(η i ⊗ η j )(v, w),
y entonces
t = tij η i ⊗ η j ,
donde tij = t(ei , ej ) son las componentes de t con respecto a la base B.
42
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
De manera similar, si a y ω son tensores del tipo (1, 0) y (0, 1), respectivamente, definimos el producto tensorial a ⊗ ω como el tensor del tipo (1, 1) dado
por
ν ∈ V ∗ , w ∈ V.
(a ⊗ ω)(ν, w) := a(ν)ω(w),
Si s es cualquier tensor del tipo (1, 1) y ν = νi η i ∈ V ∗ , w = wj ej ∈ V , entonces
s(ν, w)
= νi wj s(η i , ej )
= s(η i , ej )ν(ei )η j (w)
= s(η i , ej )(Iei )(ν)η j (w),
donde I : V → V ∗∗ es el isomorfismo definido en (3.15). Entonces, tenemos que
s = si j Iei ⊗ η j ,
donde si j := s(η i , ei ) son las componentes de s con respecto a la base B y la
base dual correspondiente B ∗ . Para lo que sigue, identificamos V con V ∗∗ y
escribimos simplemente s = si j ei ⊗ η j en vez de s = si j Iei ⊗ η j .
De la misma manera podemos escribir un tensor del tipo (r, s) arbitrario
como una combinación lineal de productos tensoriales de la forma
ei1 ⊗ ei2 ⊗ ... ⊗ eir ⊗ η j1 ⊗ η j2 ⊗ ... ⊗ η js .
Definición 16 Sea M una variedad diferenciable y sea p ∈ M . Sea (Tp M )r s
el conjunto de los tensores del tipo (r, s) definidos sobre V = Tp M . Un campo
tensorial del tipo (r, s) sobre M (o r veces contravariante y s veces
covariante) es una función t que asigna a cada punto p ∈ M un tensor tp ∈
(Tp M )r s .
Ejemplos:
1. r = s = 0: p 7→ tp es una función sobre M .
2. r = 1, s = 0: p 7→ tp es un campo vectorial sobre M .
3. r = 0, s = 1: p 7→ tp es un campo de covectores sobre M .
4. r = 0, s = 2: Como vamos a ver, la métrica g es un tensor del tipo
(0, 2). Entonces g asigna a cada punto p ∈ M de la variedad un elemento
gp : Tp M × Tp M → R que toma dos vectores Xp , Yp ∈ Tp M y les asigna
un número real gp (Xp , Yp ) ∈ R. Además, la métrica es simétrica en Xp y
Yp : gp (Xp , Yp ) = gp (Yp , Xp ) para todos Xp , Yp ∈ Tp M .
5. r = 0, s = 2: Otro ejemplo de un campo tensorial del tipo (0, 2) es el tensor
electromagnético F . A diferencia del tensor métrico, F es antisimétrico en
Xp y Yp : Fp (Xp , Yp ) = −Fp (Yp , Xp ) para todos Xp , Yp ∈ Tp M y todo
p ∈ M.
6. r = 1, s = 3: Como vamos a ver, el tensor de curvatura es un campo
tensorial del tipo (1, 3).
3.2. CAMPOS VECTORIALES Y TENSORIALES
43
Sean t y u campos tensoriales del tipo (r, s), y sea f ∈ F(M ). Entonces,
u + v y f · u definidos por
t + u : p 7→ tp + up ,
f ·t
: p 7→ f (p)tp ,
también son campos tensoriales del tipo (r, s). Sea (U, φ) una carta
local, en∂ , ..., ∂x∂n p } de Tp M
tonces podemos expander t con respecto a las bases { ∂x
1
p
y {(dx1 )p , ..., (dxn )p } de Tp∗ M ,
!
∂ ∂ i1 ...ir
⊗ ... ⊗
⊗ (dxj1 )p ⊗ · · · ⊗ (dxjs )p .
tp = t
j1 ...js (p)
i
i
1
r
∂x p
∂x p
Las funciones U → R, p 7→ ti1 ...ir j1 ...js (p) se llaman las componentes de t con
respecto a la carta local (U, φ). Usando (3.16) y la isometrı́a I : V → V ∗∗
definida en (3.15) obtenemos que
∂
∂
i1 ...ir
i1
ir
t
, ..., js .
(3.21)
j1 ...js = t dx , ..., dx ,
∂xj1
∂x
Sean (U, φ) y (V, ψ) dos cartas locales en una vecindad de un punto p ∈ M ,
y sean ti1 ...ir j1 ...js y t̄i1 ...ir j1 ...js las componentes de t con respecto a (U, φ) y
(V, ψ) respectivamente. Las leyes de transformaciones (3.18) y (3.19) implican
que
t̄i1 ...ir j1 ...js (p) =
∂y i1
∂y ir ∂xl1
∂xls k1 ...kr
·
·
·
·
·
·
t
l1 ...ls (p),
∂xk1
∂xkr ∂y j1
∂y js
(3.22)
donde x = φ(q) y y = ψ(q), para q ∈ U ∩ V .
Definición 17 Un campo tensorial t se llama C ∞ –diferenciable si para todas las cartas locales (U, φ), las componentes p 7→ ti1 ...ir j1 ...js (p) son funciones
C ∞ –diferenciables sobre U . Denotamos por T r s (M ) la clase de campos tensoriales del tipo (r, s) que son C ∞ –diferenciables. En particular, T 0 0 (M ) = F(M ),
T 1 0 (M ) = X (M ), T 0 1 (M ) = X ∗ (M ).
0
Definición 18 Sean T ∈ T r s (M ) y S ∈ T r s0 dos campos tensoriales sobre M .
0
Sean ω 1 , ..., ω r , η 1 , ..., η r ∈ X ∗ (M ) y X1 , ..., Xs , Y1 , ...Ys0 ∈ X (M ). El producto tensorial de T y S esta definido por
0
(T ⊗ S)(ω 1 , ..., ω r , η 1 , ..., η r , X1 , ..., Xs , Y1 , ...Ys0 )
0
:= T (ω 1 , ..., ω r , X1 , ..., Xs ) · S(η 1 , ..., η r , Y1 , ...Ys0 ).
Obviamente, T ⊗ S ∈ T r+r
0
s+s0 (M ).
Definición 19 Sea t ∈ T r s (M ), y sean X1 , X2 , ..., Xs ∈ X (M ) campos vectoriales y ω 1 , ω 2 , ..., ω r ∈ X ∗ (M ) campos de covectores sobre M . Definimos la
44
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
contracción total del campos tensorial t ⊗ ω 1 ⊗ ...⊗ ω r ⊗ X1 ⊗ ... ⊗ Xs como
la función F := C t ⊗ ω 1 ⊗ ... ⊗ ω r ⊗ X1 ⊗ ... ⊗ Xs : M → R definida por
F (p) := tp ω 1 (p), ..., ω r (p), X1 (p), ..., Xs (p) ,
p ∈ M.
También denotamos esta función simplemente por t(ω 1 , ..., ω r , X1 , ..., Xs ).
En coordenadas locales, ω b = ωibb dxib , Xa = Xaja ∂x∂ja , tenemos que
t(ω 1 , ..., ω r , X1 , ..., Xs ) = ti1 ...ir j1 ...js ω 1 i1 ...ω r ir X1j1 ...Xsjs .
En particular, el mapeo F = t(ω 1 , ..., ω r , X1 , ..., Xs ) : M → R es C ∞ -diferenciable.
Con estas observaciones podemos interpretar t ∈ T r s (M ) como un mapeo
(X ∗ (M ))r × (X (M ))s → F(M )
que es F(M )-lineal, es decir, satisface
t(ω 1 , ..., ω p + f η, ..., ω r , X1 , ..., Xs )
= t(ω 1 , ..., ω p , ..., ω r , X1 , ..., Xs ) + f t(ω 1 , ..., η, ..., ω r , X1 , ..., Xs ),
t(ω 1 , ..., ω r , X1 , ..., Xq + gY, ..., Xs )
= t(ω 1 , ..., ω r , X1 , ..., Xq , ..., Xs ) + gt(ω 1 , ..., ω r , X1 , ..., Y, ..., Xs ),
para todas las funciones f, g ∈ F(M ) y todo ω 1 , ..., ω r , η ∈ X ∗ (M ) y X1 , ..., Xs , Y ∈
X (M ).
Finalmente, generalizamos la definición del pull-back para tensores covariantes.
Definición 20 Sean M y N dos variedades diferenciables, y sea ψ : M →
N diferenciable. Sea t ∈ T 0 s (N ) un campo tensorial sobre N que es s veces
covariante. El pull-back de t está definido como el siguiente campo tensorial
ψ ∗ t ∈ T 0 s (M ) sobre M :
(ψ ∗ t)p (X1p , ..., Xsp ) := tψ(p) (dψp (X1p ), ..., dψp (Xsp )) ,
donde p ∈ M , X1 , ..., Xs ∈ X (M ).
Ejemplos:
1. s = 0: Sea f ∈ F(N ). En este caso, (ψ ∗ f )(p) = f (ψ(p)), p ∈ M se reduce
a la definición que dimos en la sección 3.2.3.
2. s = 1: Sea f ∈ F(N ). Entonces, df ∈ X ∗ (N ) y para X ∈ X (M ) tenemos
que
(ψ ∗ df )(X)
= df (dψ(X))
= dψ(X)[f ]
= X[f ◦ ψ] = X[ψ ∗ f ]
=
[d(ψ ∗ f )](X),
(3.23)
3.3. CONEXIONES AFINES
45
donde hemos usado la definición 13 en el segundo y último paso y la
definición 7 en el tercer paso. Dado que (3.23) vale para todo X ∈ X (M )
obtenemos que
ψ ∗ (df ) = d(ψ ∗ f )
(3.24)
para todo f ∈ F(M ).
Ejemplo: Sea N = R3 el espacio Euclideano con la métrica h = dx2 +dy 2 +dz 2 .
Considere la subvariedad
M = S 2 := {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1}.
La métrica inducida g sobre S 2 está definida por el pull-back
g := ι∗ h,
donde ι : S 2 → R3 , (x, y, z) 7→ (x, y, z) denota la inclusión. Con respecto a las
coordenadas polares (ϑ, ϕ) ∈ (0, π) × (0, 2π) de S 2 tenemos que
ι∗ x = x ◦ ι
=
sen ϑ cos ϕ,
∗
=
sen ϑ sen ϕ,
∗
=
cos ϑ,
ι y =y◦ι
ι z =z◦ι
y entonces
ι∗ dx
∗
= d(ι∗ x) = cos ϑ cos ϕ dϑ − sen ϑ sen ϕ dϕ,
ι dy
= d(ι∗ y) = cos ϑ sen ϕ dϑ + sen ϑ cos ϕ dϕ,
ι∗ dz
= d(ι∗ z) = − sen ϑ dϑ.
Con esto, obtenemos
g = (ι∗ dx)2 + (ι∗ dy)2 + (ι∗ dz)2 = dϑ2 + sen2 ϑ dϕ2 .
3.3.
(3.25)
Conexiones afines
Dada una curva γ que conecta dos puntos p y q de una variedad diferenciable
M , nos preguntamos cómo transportar vectores de manera paralela a lo largo de
la curva γ. Entonces necesitamos un mapeo (el transporte paralelo) que nos permita obtener un vector tangente Xq en el punto q a partir de un vector tangente
Xp en el punto p, de tal manera que se puedan comparar los vectores tangentes
en p con los vectores tangentes en q. Como vamos a ver, el transporte paralelo
puede depender de la elección de la curva γ. Esta dependencia está directamente relacionada con la curvatura de M . A parte de la curvatura, el transporte
paralelo también nos permite definir una derivada para campos tensoriales (la
derivada covariante) y curvas preferidas sobre M (las geodésicas) que tienen la
propiedad que su vector tangente es transportado de manera paralela.
Empezamos con la versión “infinitesimal” del transporte paralelo:
46
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Definición 21 Una conexión afı́n es un mapeo ∇ : X (M ) × X (M ) → X (M ),
(X, Y ) 7→ ∇X Y que satisface las siguientes propiedades
(i) ∇X (Y + Z) = ∇X Y + ∇X Z,
(ii) ∇f ·X+g·Y Z = f · ∇X Z + g · ∇Y Z,
(iii) ∇X (f · Y ) = f · ∇X Y + (Xf ) · Y ,
para todos f, g ∈ F(M ) y todos X, Y, Z ∈ X (M ).
Sea (U, φ) una carta local con coordenadas locales x1 , x2 , ..., xn correspondientes, y sean X, Y ∈ X (M ). Entonces en U podemos expander
∂
∂
,
Y =Yj j .
i
∂x
∂x
Sea ∇ una conexión afı́n, entonces usando sus propiedades (i)–(iii) encontramos
que
i
j ∂
∇X Y = X ∇ ∂ i Y
∂x
∂xj
∂
∂Y j ∂
= X iY j ∇ ∂ i j + X i i
∂x ∂x
∂x ∂xj
k
∂Y
∂
= Xi
+ Γk ij Y j
,
(3.26)
i
∂x
∂xk
X = Xi
donde hemos definidos los sı́mbolos de Christoffel Γk ij : U → R a través de
∇
∂
∂xi
∂
∂
= Γk ij k .
∂xj
∂x
(3.27)
∂
3
k
∞
Puesto que ∇ ∂ i ∂x
-diferenciables.
j ∈ X (U ), las n funciones Γ ij : U → R son C
∂x
Observaciones
1. La ecuación (3.26) muestra que el vector ∇X Y en un punto p ∈ M dado
de la variedad solamente depende del vector Xp en p y del campo vectorial
Y en una vecindad de p. En otras palabras, (∇X Y )p = 0 si Xp = 0 o Y
es cero en una vecindad de p.
2. Los sı́mbolos de Christoffel no se pueden interpretar como las componentes
de un campo tensorial del tipo (1, 2). Sean (U, φ) y (Ū , φ̄) dos cartas locales
con U ∩ Ū 6= ∅, entonces en U ∩ Ū tenemos que
Γ̄c ab
∂
∂ x̄c
= ∇
=
=
=
∂
∂ x̄a
∂
∂ x̄b ∂xj ∂
∂xi ∂
∂ x̄b ∂xj
∂ x̄a ∂xi
j
i
j
∂x ∂x
∂
∂
∂x
∂
∇ ∂i j +
·
a
b
a
b
∂x
∂ x̄ ∂ x̄
∂x
∂ x̄
∂ x̄
∂xj
∇“
”
∂xi ∂xj k ∂
∂ 2 xk ∂
Γ
+
.
ij
∂ x̄a ∂ x̄b
∂xk
∂ x̄a ∂ x̄b ∂xk
3.3. CONEXIONES AFINES
47
donde hemos usado la regla de la cadena, (3.10) en el segundo paso y las
propiedades (i)–(iii) de la conexión en el tercer paso. Usando una vez más
la regla de la cadena,
∂ x̄c ∂
∂
=
,
∂xk
∂xk ∂ x̄c
obtenemos que
∂ x̄c ∂xi ∂xj k
∂ 2 xk ∂ x̄c
Γ ij +
.
(3.28)
k
a
b
∂x ∂ x̄ ∂ x̄
∂ x̄a ∂ x̄b ∂xk
El primer término a la derecha se transforma como las componentes de
un campo tensorial del tipo (1, 2), pero la presencia del segundo término
implica que Γk ij no se transforma como las componentes de un campo
tensorial. En particular, vemos que Γk ij (p) = 0 en un punto p ∈ M no
implica que Γ̄c ab (p) = 0.
Γ̄c ab =
Definición 22 Sea ∇ una conexión afı́n sobre M , y sea Y ∈ X (M ) un campo
vectorial diferenciable. Definimos la derivada covariante de Y como el campo
tensorial ∇Y ∈ T 1 1 (M ) dado por
∇Y (ω, X) := ω(∇X Y ),
ω ∈ X ∗ (M ),
X ∈ X (M ).
(3.29)
Notamos que esta definición tiene sentido, pues si f ∈ F(M ), entonces
∇Y (f ω, X) = f ω(∇X Y ) = f ∇Y (ω, X)
y
∇Y (ω, f · X) = ω(∇(f ·X) Y ) = ω(f ∇X Y ) = f ω(∇X Y ) = f ∇Y (ω, X).
Con respecto a unas coordenadas locales x1 , x2 , ..., xn podemos expander
Y =Yj
∂
,
∂xj
y elegir
∂
,
ω = dxk .
∂xi
Entonces las componentes (∇Y )k i del campo tensorial ∇Y con respecto a las
coordenadas locales x1 , x2 , ..., xn son
∂Y k
+ Γk ij Y j ,
(∇Y )k i = dxk ∇ ∂ i Y =
∂x
∂xi
X=
donde hemos usado la ecuación (3.26). En vez de (∇Y )k i vamos a usar la notación más común ∇i Y k . Entonces,
∇i Y k =
∂Y k
+ Γk ij Y j .
∂xi
(3.30)
Ejercicio 5. Verifique que ∇i Y k satisface la ley de transformación (3.22)
usando (3.28) y (3.30).
48
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Ejemplos:
1. Sea M = Rn , y sean x1 , x2 , ..., xn coordenadas Cartesianas. Podemos iden∂
n
tificar campos vectoriales X = X i ∂x
con mapeos C ∞ -diferenciables
i en R
n
n
1
2
n
X : R → R , x 7→ (X (x), X (x), ..., X (x)). Definimos
(∇X Y )i := X k
∂
Y i,
∂xk
i = 1, 2, ..., n
(3.31)
para X, Y ∈ X (Rn ). Entonces ∇ define una conexión afı́n sobre Rn . Los
sı́mbolos de Christoffel con respecto a las coordenadas Cartesianas son
cero.
2. Sea M una subvariedad de dimensión n − 1 en Rn , n ≥ 2. Definimos
(∇X Y )i (x) := Πi j (x)X k (x)
∂
Y j (x),
∂xk
x ∈ Rn ,
(3.32)
donde Πj k (x) es el proyector ortogonal que asigna a cada vector tangente
Zx = (Z 1 (x), Z 2 (x), ..., Z n (x)) ∈ Rn su proyección ortogonal sobre Tx M .
Verificamos facilmente que ∇ satisface las propiedades (i)–(iii) y define
una conexión afı́n sobre M . ∇ se llama la conexión afı́n inducida de
Rn .
Para ver un caso más concreto, consideramos M = S 2 ⊂ R3 y calculemos
los sı́mbolos de Christoffel asociados a ∇ en coordenadas polares (ϑ, ϕ).
Para esto, conviene introducir los tres campos vectoriales
er
eϑ
eϕ
:=
(sen ϑ cos ϕ, sen ϑ sen ϕ, cos ϑ),
∂
e = (cos ϑ cos ϕ, cos ϑ sen ϕ, − sen ϑ),
:=
∂ϑ r
1 ∂
e = (− sen ϕ, cos ϕ, 0),
:=
sen ϑ ∂ϕ r
sobre S 2 que forman una base orthonormal de R3 en cada punto de S 2 .
Entonces la proyección ortogonal de un vector Z = Z r er + Z ϑ eϑ + Z ϕ eϕ ∈
R3 es simplemente Π(Z) = Z ϑ eϑ + Z ϕ eϕ . Usando la regla de la cadena y
la relación x = er para un punto x ∈ S 2 sobre la esfera, encontramos que
∂
= eϑ · ∇,
∂ϑ
∂
= sen ϑ eϕ · ∇,
∂ϕ
de tal manera que podemos identificar
∂
∂ϑ
↔ eϑ y
∂
∂ϕ
↔ sen ϑ eϕ . Con
3.3. CONEXIONES AFINES
49
estas observaciones tenemos
∂
∂
∇∂
↔ Π
eϑ = Π(−er ) = 0,
∂ϑ ∂ϑ
∂ϑ
∂
∂
∇∂
↔ Π
sen ϑ eϕ = Π cos ϑ eϕ = cot ϑ sen ϑ eϕ ,
∂ϑ ∂ϕ
∂ϑ
∂
∂
∇∂
↔ Π
eϑ = Π cos ϑ eϕ = cot ϑ sen ϑ eϕ ,
∂ϕ ∂ϑ
∂ϕ
∂
∂
↔ Π
sen ϑ eϕ = Π − sen2 ϑ er − cos ϑ sen ϑ eϑ
∇∂
∂ϕ ∂ϕ
∂ϕ
= − cos ϑ sen ϑ eϑ .
Entonces los sı́mbolos de Christoffel que son diferentes de cero son
Γϕ ϑϕ = Γϕ ϕϑ = cot ϑ,
3.3.1.
Γϑ ϕϕ = − cos ϑ sen ϑ.
La derivada covariante de campos tensoriales
Deseamos extender la definición de la derivada covariante a campos tensoriales. Sea X ∈ X (M ) un campo vectorial sobre una variedad diferenciable
∞
N
(M, ∇) con conexión afı́n ∇. Sea T (M ) :=
T r s (M ) el álgebra de campos
r,s=0
tensoriales sobre M . Pedimos que la derivada covariante, ∇X , con respecto de
X sea un mapeo ∇X : T (M ) → T (M ) tal que
(i) ∇X T ∈ T r s (M ), T ∈ T r s (M ).
(ii) ∇X (S + T ) = ∇X S + ∇X T para todos S, T ∈ T r s (M ).
(iii) ∇X (S ⊗ T ) = ∇X S ⊗ T + S ⊗ ∇X T para todo S ∈ T r s (M ) y T ∈ T p q (M ).
(iv) ∇X conmuta con las contracciones totales C (ver la definición 19).
(v) Para un campo tensorial Y ∈ X (M ) del tipo (1, 0), ∇X Y coincide con la
acción de la conexión afı́n ∇ sobre (X, Y ).
(vi) Para un campo tensorial f ∈ F(M ) del tipo (0, 0), ∇X f = X[f ] es la
derivada direccional de f con respecto a X.1
Como vamos a ver ahora, las propiedades (i)-(vi) determinan de manera
única la extensión de la derivada covariante para campos tensoriales. Tomamos
primero un campo de covectores ω ∈ X ∗ (M ), y sea Y ∈ X (M ). Entonces la
propiedad (iii) implica que
∇X (ω ⊗ Y ) = ∇X ω ⊗ Y + ω ⊗ ∇X Y.
1 Notamos que esta propiedad es una consecuencia de las propiedades (iii) y (v). Para ver esto, tomamos S = f ∈ F (M ) y T = Y ∈ X (M ) y obtenemos por un lado
∇X (f Y ) = (∇X f )Y + f ∇X Y usando (iii) y por otro lado ∇X (f Y ) = f ∇X Y + (Xf )Y
usando las propiedades de la conexión afı́n. Entonces, ∇X f = Xf .
50
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Tomando la contracción total C a ambos lados, y usando las propiedades (iv) y
(vi) encontramos que
X [ω(Y )]
= ∇X C(ω × Y )
= C(∇X ω ⊗ Y + ω ⊗ ∇X Y )
=
(∇X ω)(Y ) + ω(∇X Y ).
Entonces,
(∇X ω)(Y ) = X [ω(Y )] − ω(∇X Y ),
Y ∈ X (M ).
(3.33)
Notamos que para Y, Z ∈ X (M ) y f ∈ F(M ) vale
(∇X ω)(Y + f Z)
= X [ω(Y ) + f ω(Z)] − ω (∇X Y + f ∇X Z + (Xf )Z)
= X [ω(Y )] + f X [ω(Z)] + (Xf )ω(Z)
− ω(∇X Y ) − f ω(∇X Z) − (Xf )ω(Z)
=
(∇X ω)(Y ) + f (∇X ω)(Z),
de tal manera que (3.33) define un campo de covectores ∇X ω. Con respecto a
∂
∂
k
coordenadas locales x1 , ..., xn , sean X = ∂x
i , Y = ∂xj y ω = ωk dx . Entonces,
∂ ∇i ωj :=
∇ ∂i ω
∂x
∂xj
∂ωj
∂
k
=
− ωk dx ∇ ∂ i j
∂x ∂x
∂xi
∂ωj
− Γk ij ωk ,
=
∂xi
donde hemos usado la definición de los sı́mbolos de Christoffel (3.27). Resumiendo, las expresiones para las componentes de las derivadas covariantes de
∂
j
un campo vectorial Y = Y i ∂x
son
i y de un campo de covectores ω = ωj dx
En particular, para Y =
∇i Y j
=
∇i ωj
=
∂Y j
+ Γk ij Y k ,
∂xi
∂ωj
− Γk ij ωk .
∂xi
(3.34)
(3.35)
∂
∂xi
y ω = dxj obtenemos que
∂
∂
∇ ∂i
= Γk ij k ,
∂x
∂xj
∂x
∇ ∂ i dxj
= −Γj ik dxk .
(3.36)
(3.37)
∂x
Ahora sea t ∈ T r s (M ) un campo tensorial del tipo (r, s) arbitrario, y sean
ω , ..., ω r ∈ X ∗ (M ) y X1 , ..., Xs ∈ X (M ). Entonces,
1
∇X (t ⊗ ω 1 ... ⊗ Ys )
= ∇X t ⊗ ω 1 ... ⊗ Ys
+ t ⊗ ∇X ω 1 ⊗ ω 2 ... ⊗ Ys + ... + t ⊗ ω 1 ... ⊗ Ys−1 ⊗ ∇X Ys .
3.3. CONEXIONES AFINES
51
Tomando la contracción total C a ambos lados obtenemos
(∇X t)(ω 1 , ..., ω r , Y1 , ..., Ys )
= X t(ω 1 , ..., ω r , Y1 , ..., Ys )
(3.38)
− t(∇X ω 1 , ω 2 , ..., ω r , Y1 , ..., Ys ) − ... − t(ω 1 , ..., ω r−1 , ∇X ω r , Y1 , ..., Ys )
− t(ω 1 , ..., ω r , ∇X Y1 , Y2 , ..., Ys ) − ... − t(ω 1 , ..., ω r , Y1 , ..., Ys−1 , ∇X Ys ).
Como antes, se puede verificar que (3.38) define un campo tensorial ∇X t ∈
T r s (M ) del tipo (r, s). Con respecto a coordenadas locales x1 , ..., xn , sean X =
∂
, ω p = dxip y Yq = ∂x∂jq . Entonces usando (3.38), (3.36) y (3.37) encontramos
∂xk
que
∂
∂
∇k ti1 ...ir j1 ...js :=
∇ ∂k t
dxi1 , ..., dxir , j1 , ..., js
∂x
∂x
∂x
i1 ...ir
∂t
j1 ...js
=
∂xk
+ Γi1 kl tli2 ...ir j1 ...js + ... + Γir kl ti1 ...ir−1 l j1 ...js
−
Γl kj1 ti1 ...ir lj2 ...js − ... − Γl kjs ti1 ...ir j1 ...js−1 l . (3.39)
Finalmente, no es difı́cil comprobar que (3.38), tomada como definición para
la derivada covariante de campos tensoriales, satisface todas las propiedades
(i)-(vi). A continuación, se discute una definición más geométrica de la derivada
covariante.
3.3.2.
El transporte paralelo a lo largo de una curva
Definición 23 Sea γ : I ⊂ R → M una curva en M , y sea X un campo
vectorial definido en una vecindad de γ(I). X se llama autoparalelo a lo
largo de γ si
DX
(t) := (∇γ̇ X)γ(t) = 0,
t ∈ I.
dt
DX/dt se llama la derivada covariante de X a lo largo de γ.
Notamos que ∇γ̇ X está bien definido dado que su valor en γ(t) solamente depende del vector γ̇(t) y del campo vectorial X en una vecindad de γ(t). Si (U, φ)
es una carta local con coordenadas locales correspondientes x1 , ..., xn , entonces
tenemos
∂
γ̇ = ẋi i ,
xi (t) = φ(γ(t))i .
∂x
Entonces (3.26) implica que
k
∂
DX
i ∂X
k
i j
=
ẋ
+ Γ ij ẋ X
i
dt
∂x
∂xk
∂
∂ k
k
i j
k
= (Ẋ + Γ ij ẋ X ) k ,
Xγ(t) = X (t)
. (3.40)
∂x
∂xk γ(t)
52
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
De esta ecuación vemos que de facto, ∇γ̇ X solamente depende de Xp para los
puntos p ∈ γ(I) de M que se encuentran sobre la curva γ. Resumiendo, el
campo vectorial Xp es autoparalelo a lo largo de γ si y sólo si sus componentes
X k (t) = dxk (X)γ(t) satisfacen la ecuación diferencial lineal ordinaria
Ẋ k (t) = M k j (t)X j (t),
(3.41)
donde M k j (t) := −Γk ij (γ(t))ẋi (t). De los teoremas para ecuaciones diferenciales
lineales ordinarias obtenemos:
Lema 4 Sean a > 0 y γ : (−a, a) ⊂ R → M una curva en M que pasa a través
del punto p = γ(0). Sea Yp ∈ Tp M un vector en p. Entonces existe un único
campo vectorial X autoparalelo sobre γ tal que Xp = Yp .
Demostración. Supongamos primero que la curva γ(−a, a) ⊂ U esté
contenida
en una carta local (U, φ). Entonces definimos Xγ(t) = X k (t) ∂x∂ k γ(t) , |t| < a,
donde X k (t) es la solución única de (3.41) con dato inicial X k (0) = dxk (Y )p .
Por construcción, X es autoparalelo a lo largo de γ y Xp = Yp .
Si la curva γ no está contenida en una sola carta local, la podemos cubrir
por un número finito de cartas locales (Uα , φα ) dado que γ(−a, a) es compacto.
Entonces podemos dividir γ en un número finito de segmentos γα , donde la
imagen de γα está enteramente contenida en Uα . Aplicando el resultado del
primer paso a cada segmento γα , obtenemos un campo X que es autoparalelo a
lo largo de γ.
Finalmente, sea Z otro campo autoparalelo a lo largo de γ tal que Zp =
Xp . Vamos a demostrar que Zγ(t) = Xγ(t) para todo t ∈ [0, a). Para esto,
sea t∗ := sup{t ∈ [0, a) : Zγ(t) = Xγ (t)}, y supongamos que t∗ < a. Sea
(U, φ) una carta local en una vecindad de γ(t∗ ). Entonces X k (t) = dxk (X)γ(t)
y Z k (t) = dxk (Z)γ(t) satisfacen la ecuación (3.41) en U , y X k (t) = Z k (t) para
t < t∗ tal que γ(t) ∈ U . Por unicidad de las soluciones de (3.41) encontramos
que X k (t) = Z k (t) para todo t ∈ [0, a) tal que γ(t) ∈ U , lo que contradice la
definición de t∗ . Entonces, t∗ = a y Zγ(t) = Xγ(t) para todo t ∈ [0, a). De la
misma manera probamos que Zγ(t) = Xγ(t) para todo t ∈ (−a, 0].
Del resultado del Lema 4 obtenemos para cada curva γ : (−a, a) → M un
mapeo
τt,s : Tγ(s) M → Tγ(t) M,
s, t ∈ (−a, a),
que transforma un vector X ∈ Tγ(s) M en un vector Y = τt,s X ∈ Tγ(t) M a través
del transporte paralelo a lo largo de γ. Este mapeo, llamado el transporte
paralelo, satisface las siguientes propiedades:
(i) τt,s : Tγ(s) M → Tγ(t) M es lineal,
(ii) τt,t = id,
(iii) τt,s ◦ τs,r = τt,r ,
3.3. CONEXIONES AFINES
53
(iv) Con respecto a coordenadas locales en una vecindad de γ(t) vale
d
= −Γk ij (γ(s))ẋi (s).
(τt,s )k j dt
t=s
(v) Sea X un campo vectorial a lo largo de γ, entonces2
d
DX
.
(t) = (∇γ̇ X)γ(t) =
τt,s Xγ(s) dt
ds
s=t
(3.42)
(3.43)
para todos r, s, t ∈ (−a, a).
Las propiedades (i)-(iii) son consecuencias directas del resultado del Lema 4 y
de la linealidad de (3.41). En particular notamos que (ii) y (iii) implican que
−1
τt,s es invertible y que τt,s
= τs,t . La propiedad (iv) es una consecuencia directa
de (3.41). Para demostrar (v) fijamos t ∈ (−a, a) e introducimos coordenadas
locales x1 , ..., xn en una vecindad de γ(t). Usando
d
d
d
τt,s = −τt,s
τs,t τt,s τs,t =−
ds
ds
ds
s=t
s=t
s=t
y la propiedad (iv), obtenemos con la regla de Leibnitz
k d
d
= −
+ Ẋ k (t)
τt,s Xγ(s) (τs,t )k j X j (t)
ds
ds
s=t
s=t
=
Γk ij (γ(t))ẋi (t)X j (t) + Ẋ k (t) =
DX k
(t).
dt
El transporte paralelo se puede generalizar a campos tensoriales de manera
natural:
Definición 24 Sea γ : (−a, a) → M un curva, y sean s, t ∈ (−a, a). Sea ω ∈
∗
Tγ(s)
M un covector en el punto γ(s). Entonces definimos el transporte paralelo
∗
τt,s ω ∈ Tγ(t)
M de ω en el punto γ(t) a través de la ecuación
(τt,s ω) (τt,s Y ) = ω(Y )
(3.44)
para todo Y ∈ Tγ(s) M , es decir por
−1
(τt,s ω) (Z) = ω(τt,s
Z)
(3.45)
para todo Z ∈ Tγ(t) M .
De manera más general, si T ∈ (Tγ(s) M )q r es un tensor del tipo (q, r) en el
punto γ(s), entonces definimos τt,s T ∈ (Tγ(t) M )q r a través de
−1 1
−1 q
−1
−1
(τt,s T ) (ω 1 , ..., ω q , X1 , ..., Xr ) := T (τt,s
ω , ..., τt,s
ω , τt,s
X1 , ..., τt,s
Xr ) (3.46)
∗
para todo ω 1 , ..., ω q ∈ Tγ(t)
M y X1 , ..., Xr ∈ Tγ(t) M .
2 Notamos
Rn ,
el lı́mite
que τt,s Xγ(s) ∈ Tγ(t) M para todo s ∈ (−a, a). Dado que Tγ(t) M es isomorfo a
˛
ˆ
˜
˛
1
d
τ X
:= lı́m h
τt,t+h Xγ(t+h) − Xγ(t) ∈ Tγ(t) M tiene sentido.
ds t,s γ(s) ˛
s=t
h→0
54
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Observación: Sea X ∈ X (M ) un campo vectorial sobre M , y sea I : X (M ) →
T (M )1 0 el isomorfismo definido en (3.15). Entonces,
(τt,s IX) (ω)
−1
= IX(τt,s
ω)
=
−1
(τt,s
ω)(X)
= ω(τt,s X)
=
(Iτt,s X) (ω),
de tal manera que τt,s conmuta con I. Entonces podemos identificar elementos
de X (M ) con elementos de T (M )1 0 como siempre.
La ecuación (3.43) sugiere la definición siguiente para la derivada covariante
de un campo tensorial:
Definición 25 Sea X ∈ X (M ) un campo vectorial sobre M , y sea T ∈ T (M )q r
un campo tensorial del tipo (q, r) 6= (0, 0). Sea p ∈ M y considere una curva
integral γ : (−ε, ε) → M de X a través del punto p. Definimos la derivada
covariante de T en la dirección de X por
d
(∇X T )p :=
.
(3.47)
τ0,s Tγ(s) ds
s=0
Lema 5 La definición 25 es equivalente a la definición previa (3.38).
Demostración. Solamente damos una demostración para el caso de un campo
tensorial T = ω del tipo (0, 1). Sean x1 , ..., xn coordenadas local en una vecindad
del punto p. Tenemos que
(τ0,s ωγ(s) )i = (τ0,s ωγ(s) )
∂
∂xi
= ωγ(s)
∂
τs,0 i
∂x
j
= (τs,0 ) i ωγ(s)
∂
∂xj
,
entonces
(τ0,s ωγ(s) )i (p) = (τs,0 )j i ωj (γ(s)).
Tomando la diferencial con respecto a s a ambos lados y usando (3.42) obtenemos que
∂ωj (∇X ω)i (p) = −Γj ki (p)X k (p)ωj (p) + δ j i
X k (p)
∂xk p
!
∂ωi j
k
= X (p)
− Γ ki (p)ωj (p) ,
∂xk p
lo que coincide con (3.35).
3.3. CONEXIONES AFINES
55
Ejercicio 6. Consideramos la esfera S 2 ⊂ R3 con la conexión afı́n inducida ∇.
(a) Calcule el transporte paralelo τ−π/2,π/2 : Tp S 2 → Tq S 2 entre los puntos
p := (0, −1, 0) y q := (0, 1, 0) a lo largo de la curva equatorial γ : (−π, π) →
S 2 dada por
γ(t) := (cos t, sen t, 0),
−π < t < π.
(b) Calcule el transporte paralelo Xq := τ−π/2,π/2 Xp del vector Xp := (1, 0, 0)
a lo largo de la curva γ del inciso (a).
(c) Calcule el transporte paralelo Xq := τ−π/2,π/2 Xp del vector Xp := (1, 0, 0)
a lo largo de la curva µ : (−π, π) → S 2 definida por
µ(t) = (0, sen t, cos t),
3.3.3.
−π < t < π.
Geodésicas
A continuación analizamos curvas especiales en M , llamadas geodésicas.
Definición 26 Sea (M, ∇) una variedad diferenciable con conexión afı́n ∇.
Sea γ : (−a, a) → M una curva en M con campo de velocidad correspondiente
X = γ̇. γ se llama geodésica si existe una función f : (−a, a) → R tal que
(∇X X)γ(t) = f (t)Xγ(t) ,
|t| < a.
(3.48)
Entonces una geodésica tiene la propiedad que la derivada covariante de su
campo de velocidad a lo largo de si misma es paralela al campo de velocidad.
Con respecto a una carta local (U, φ) la ecuación (3.40) implica que
ẍk (t) + Γk ij (γ(t))ẋi (t)ẋj (t) = f (t)ẋk (t),
donde xk (t) = φ(γ(t))k .
Observaciones
1. Sea s otro parámetro de γ. Entonces,
X=
d
ds d
γ=
γ = ṡY,
dt
dt ds
Y :=
d
γ,
ds
y
∇X X = ∇X (ṡY ) = s̈Y + ṡ2 ∇Y Y.
Entonces la ecuación (3.48) se convierte en
∇Y Y = f˜Y,
f˜ = ṡ−2 (f ṡ − s̈).
(3.49)
56
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Concluimos que la ecuación (3.48) es invariante bajo reparametrizaciones
de la curva. La función f˜ es cero si eligimos s(t) tal que

 t
Z
|t| < a,
ṡ(t) = A exp  f (τ )dτ  ,
0
con una constante A 6= 0. Notamos que ṡ 6= 0, asi que la transformación
t 7→ s es invertible. La ecuación s̈(t) = f (t)ṡ(t) determina s(t) de manera
única con la excepción de las transformaciones s̃(t) = As(t) + B, donde A
y B son dos constantes y A 6= 0. Por esta razón, un paramétro s tal que
(∇Y Y )γ(s) = 0
(3.50)
se llama un parámetro afı́n.
2. Por los teoremas sobre ecuaciones diferenciales ordinarias, la ecuación
(3.50) implica que para cada p ∈ M y vector v ∈ Tp M existe una geodésica maximal y única γ : (a, b) → M (a < 0 < b) tal que ∇γ̇ γ̇ = 0 y tal que
γ(0) = p y γ̇(0) = v.
3. Si γ(t) es una geodésica con parámetro afı́n t tal que γ(0) = p y γ̇(0) = v,
entonces µ(t) := γ(At), A 6= 0, es una geodésica con parámetro afı́n tal
que µ(0) = p y µ̇(0) = Av.
4. Sea p ∈ M . Entonces las observaciones anteriores implican que existe una
vecindad V ⊂ Tp M del origen 0 ∈ Tp M del espacio tangente en p tal
que todas las geodésicas γv (t) con parámetro afı́n t y con γv (0) = p y
γ̇v (0) = v ∈ V existen para t ∈ [0, 1].
Ahora vamos a introducir el mapeo exponencial que nos permite identificar
una vecindad de p con una vecindad del origen en el espacio tangente Tp M :
Definición 27 Sea p ∈ M , y sea V ⊂ Tp M como en la última observación.
Sea γv (t) la geodésica con parámetro afı́n tal que γv (0) = p y γ̇v (0) = v ∈ V . El
mapeo exponencial en el punto p está definido por
expp : V ⊂ Tp M → M, v 7→ expp (v) := γv (1).
(3.51)
Dado que γtv (s) = γv (ts) para s, t ∈ [0, 1] encontramos que
expp (tv) = γv (t),
t ∈ [0, 1].
(3.52)
Además, la diferencial d expp : Tp M → Tp M de expp satisface, por definición,
d
d expp (v) =
expp (tv)
dt
t=0
d
=
γv (t)
= v,
dt
t=0
3.4. MÉTRICAS PSEUDO-RIEMANNIANAS
57
para v ∈ V . Por la linealidad de d expp , obtenemos que d expp : Tp M → Tp M
es la identidad. El Teorema 3 implica que expp : V ⊂ Tp M → M es un difeomorfismo local. En otras palabras, existe una vecindad W ⊂ Tp M del origen
0 ∈ Tp M tal que expp : W → U := expp (W ) es un difeomorfismo. De esta
manera, podemos identificar puntos en U con vectores en W .
Como aplicación importante, vamos a introducir coordenadas locales x1 , x2 , ..., xn
particulares sobre U : Sea {e1 , e2 , ..., en } una base del espacio vectorial Tp M . Sea
q ∈ U un punto en U y vq = expp−1 (q) ∈ Tp M el vector correspondiente en W .
Entonces, definimos las coordenadas x1 (q), x2 (q), ... ,xn (q) a través de la expansión
vq = xi (q)ei .
Las coordenadas x1 , x2 , ..., xn que construimos de esta manera se llaman coordenadas Gaussianas o coordenadas normales con respecto al punto p.
Puesto que γv (t) = expp (tv) para v = v i ei ∈ W , t ∈ [0, 1], γv (t) posee las coordenadas xi (t) = tv i . Entonces en estas coordenadas, las geodésicas que pasan a
través del punto p son rectas, ẍi (t) = 0. Introduciendo esta información en la
ecuación geodésica (3.50) encontramos que
Γk ij (p)v i v j = 0
para todo v ∈ W , lo que implica
Γk ij (p) + Γk ji (p) = 0.
(3.53)
En particular, si la conexión es tal que Γk ij es simétrico en los indices ij (lo que
ocurre para las conexiones de Levi-Civita como vamos a ver en la sección que
sigue) obtenemos que Γk ij (p) = 0.
Ejercicio 7. Consideramos una vez más la esfera S 2 ⊂ R3 con la conexión afı́n
inducida ∇.
(a) Demuestre que la curva equatorial γ : (−π, π] → S 2 dada por
γ(t) := (cos t, sen t, 0),
−π < t ≤ π
es una geodésica.
(b) Demuestre que las geodésicas sobre S 2 son los cı́rculos con circunferencia
2π.
3.4.
Métricas pseudo-Riemannianas y conexiones de Levi-Civita
En la sección previa introducimos una conexión afı́n que nos permite definir
la noción del transporte paralelo de campos tensoriales a lo largo de una curva
y de definir derivadas de campos tensoriales. En esta sección introducimos otra
58
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
estructura sobre la variedad, la métrica. En el caso que la métrica es definida
positiva, nos permite definir la longitud de una curva. En el caso de relatividad
general, le métrica no es definida positiva, y nos da una distinción entre los
vectores de tipo tiempo, de tipo espacio y de tipo nulo. Dado una métrica, existe
una conexión afı́n única que satisface dos condiciones naturales (compatibilidad
con la métrica y cero torsión). Esta conexión afı́n se llama la conexión de LeviCivita. La mtrica también nos da una manera de definir la integral de funciones
sobre la variedad.
Definición 28 Una métrica pseudo-Riemanniana sobre una variedad diferenciable M es un campo tensorial g ∈ T 0 2 (M ) del tipo (0, 2) que satisface las
siguientes propiedades:
(i) g(X, Y ) = g(Y, X) para todos X, Y ∈ X (M ) (simetrı́a)
(ii) Para todo p ∈ M , gp es no degenerada. Esto quiere decir que gp (Xp , Yp ) =
0 para todo Yp ∈ Tp M implica que Xp = 0.
Si gp es definido positivo en cada punto p ∈ M , g también se llama una métrica
Riemanniana.
El par (M, g) se llama variedad (pseudo-) Riemanniana.
Sean p ∈ M y g una métrica pseudo-Riemanniana sobre M . Denotando por
F ⊂ Tp M un subespacio de Tp M definimos
:=
máx{dim F : gp |F es definido positivo},
s :=
máx{dim F : gp |F es definido negativo},
r
La diferencia r − s se llama la signatura de la métrica g.
Sean x1 , ..., xn coordenadas locales en una vecindad de p, entonces podemos
expander
∂
∂
,
.
g = gij dxi ⊗ dxj ,
gij = gji = g
∂xi ∂xj
Con respecto a otras coordenadas locales x̄1 , ..., x̄n en un vecindad de p, las
componentes ḡkl de g están relacionadas con gij a través de
ḡkl =
∂xi ∂xj
gij .
∂ x̄k ∂ x̄l
Si definimos la matriz de Jacobi J(p) por
J i k (p) :=
∂xi ∂ x̄k p
podemos reescribir la relación entre ḡkl y gij en forma matricial:
ḡ(p) = J(p)T g(p)J(p).
3.4. MÉTRICAS PSEUDO-RIEMANNIANAS
59
Ahora, sea p ∈ M fijo. Dado que g(p) es simétrico, existe una transformación ortogonal A ∈ O(n) tal que AT g(p)A = diag(λ1 , λ2 , ..., λn ) es diagonal. Ninguno
de los eigenvalores λ1 , ..., λn es cero dado que gp es no degenerada. Además,
podemos elegir A tal que λ1 , λ2 , ...λs < 0 < λs+1 , ...λn . Si definimos la transformación
!
1
1
1
1
,
, ..., √
,p
, ..., √
B := diag √
−λ1
−λs
λn
λs+1
obtenemos B T AT g(p)AB = diag(−1, ..., −1, 1, ..,1). Entonces, definiendo las
coordenadas x̄1 , ..., x̄n a través de
x̄i = J i j xj ,
J = AB,
logramos que las componentes de la métrica en el punto p3 se reduzcan a

 −1, 1 ≤ k = l ≤ s,
1, s + 1 ≤ k = l ≤ n,
ḡkl (p) = ηkl =

0, k 6= l.
Entonces la signatura de la métrica es (n − s) − s = n − 2s. Dado que los autovalores λ1 (p), ..., λn (p) dependen da manera continua4 de gij (p) y no pueden
ser ceros, y dado que g es un campo tensorial diferenciable, la signatura es independiente de p.
Ejemplos:
1. Sea (M, g) con M = Rn y
g(X, Y ) := δij X i Y j ,
X = (X 1 , ..., X n ), Y = (Y 1 , ..., Y n ) ∈ Rn ,
el espacio Euclideano de dimensión n. Entonces g es una métrica Riemanniana. Las transformaciones de coordenadas que dejan gij = δij invariantes
consisten de las transformaciones afines de la forma
x̄i = Ri j xj + ai ,
donde R ∈ O(n) y a ∈ Rn .
2. Sea (M, g) con M = Rn y
g(X, Y ) := ηij X i Y j ,
X = (X 1 , ..., X n ), Y = (Y 1 , ..., Y n ) ∈ Rn ,
donde (ηij ) = diag(−1, 1, 1, ..., 1), el espacio de Minkowski de dimensión n.
Entonces g es una métrica pseudo-Riemanniana con signatura n − 2. Las
transformaciones de coordenadas que dejan gij = ηij invariantes consisten
de las transformaciones de Poincaré
x̄i = Λi j xj + ai ,
donde Λ ∈ O(1, n − 1) es una transformación de Lorentz y a ∈ Rn .
3 ¿Porqué en general no es posible lograr que ḡ (p) tenga esta forma no solamente en el
kl
punto p pero en toda una vecindad de p?
4 Ver [7], párrafo II.5 para una formulación precisa de esta afirmación.
60
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
3. En relatividad general, el espacio-tiempo está descrito por (M, g), donde
M es una variedad diferenciable de dimensión 4 y g es una métrica pseudoRiemanniana con signatura 2. Entonces podemos introducir coordenadas
locales x0 , x1 , x2 , x3 en la vecindad de cada punto p tal que en este punto
gp = −dx0p ⊗ dx0p + dx1p ⊗ dx1p + dx2p ⊗ dx2p + dx3p ⊗ dx3p .
3.4.1.
La métrica como isomorfismo entre Tp M y Tp∗ M
La segunda condición (ii) de la definición 28 nos permite identificar en cada
punto p ∈ M el espacio tangente Tp M con su espacio dual Tp∗ M a través del
mapeo lineal Tp M → Tp∗ M : X 7→ X := gp (X, .). Dado que gp es no degenerada,
e
esta transformación es invertible. Entonces
existe para cada ω ∈ Tp∗ M un único
vector X ∈ Tp M tal que X = ω. Con respecto a coordenadas locales x1 , ..., xn
e
podemos expander
∂
,
∂xi
X = X j dxj ,
e
e
y las componentes de X con respecto a estas coordenadas son
e
∂
∂
Xj = X
=
g
X,
= gij X i .
∂xj
e ∂xj
e
g = gij dxi ⊗ dxj ,
X = Xi
Entonces las componentes de X se obtienen a partir de las componentes de X
e
al “bajar” sus indices con las componentes
de la métrica gij y las componentes
de X se obtienen a partir de las componentes de X al “subir” los indices con
e
las componentes de la inversa de la matriz gij , denotados
por g ij .
Esto se puede generalizar para campos tensoriales. Por ejemplo, sea T ∈
T 0 2 (M ), entonces podemos definir un campo tensorial T̃ ∈ T 2 0 (M ) a través de
T̃ (X , Y ) := T (X, Y ),
X, Y ∈ X (M ).
e e
Con respecto a coordenadas locales x1 , ..., xn y eligiendo
X=
∂
,
∂xi
Y =
∂
∂xj
obtenemos X = gki dxk , Y = glj dxl y entonces
e
e
gki glj T̃ kl = Tij ,
o
T̃ kl = g ki g lj Tij .
En particular, si T = g es el tensor métrico, encontramos que
g̃ kl = g kl ,
dado que definimos g ij como las componentes de la matriz inversa de gij . Entonces vemos porque denotamos la inversa de esta manera: Las componentes de
la matriz inversa de gij son las componentes del tensor g̃ ∈ T 2 0 .
3.4. MÉTRICAS PSEUDO-RIEMANNIANAS
3.4.2.
61
La conexión de Levi-Civita
Dado un variedad (pseudo-) Riemanniana (M, g), nos preguntamos si existe
una conexión afı́n ∇ natural asociada a g.
Para contestar esta pregunta, consideramos primero una conexión ∇ sobre
M . Sea γ : (−ε, ε) → M una curva en M , y sean Xγ(t) y Yγ(t) dos campos
vectoriales autoparalelos definidos sobre γ. Suponemos que el producto escalar
entre X y Y está constante a lo largo de γ:
|t| < ε.
gγ(t) Xγ(t) , Yγ(t) = const,
Por otro lado, usando el transporte paralelo τt,s a lo largo de γ tenemos que
= gγ(t) τt,0 Xγ(0) , τt,0 Yγ(0)
gγ(t) Xγ(t) , Yγ(t)
= (τ0,t g)γ(0) Xγ(0) , Yγ(0) .
Usando la definición 25 encontramos que
d 0=
(τ0,t g)γ(0) Xγ(0) , Yγ(0) = (∇γ̇ g)γ(0) Xγ(0) , Yγ(0) .
dt t=0
Entonces el transporte paralelo a lo largo de cualquier curva preserva el producto
escalar entre dos vectores si y sólo si
∇g = 0.
Definición 29 Sea (M, g) una variedad (pseudo-) Riemanniana. Una conexión
afı́n ∇ sobre M se llama una conexión métrica si
∇g = 0.
(3.54)
A continuación, analizamos el hessiano covariante de una función f ∈ M,
∇df . Sean X, Y ∈ X (M ) dos campos vectoriales, entonces obtenemos de la
ecuación (3.33)
(∇df )(X, Y ) := (∇X df )(Y ) = X[df (Y )] − df (∇X Y ) = X(Y [f ]) − df (∇X Y ).
Entonces la parte antisimétrica de ∇df es
(∇df )(X, Y ) − (∇df )(Y, X)
=
[X, Y ]f − df (∇X Y − ∇Y X)
=
−df (∇X Y − ∇Y X − [X, Y ]). (3.55)
Esto motiva la siguiente definición:
Definición 30 Sea M una variedad diferenciable con conexión afı́n ∇. La torsión de ∇ se define como el mapeo T : X (M ) × X (M ) → X (M ) dado por
T (X, Y ) := ∇X Y − ∇Y X − [X, Y ],
X, Y ∈ X (M ).
(3.56)
62
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Notamos que T (Y, X) = −T (X, Y ) es antisimétrico en X, Y ∈ X (M ) y que
para X, Y, Z ∈ X (M ) y f ∈ F(M ) valen
T (X, Y + f Z)
= ∇X (Y + f Z) − ∇Y +f Z X − [X, Y + f Z]
= ∇X Y + f ∇X Z + X(f )Z − ∇Y X − f ∇Z X
− [X, Y ] − f [X, Z] − X(f )Z
= T (X, Y ) + f T (X, Z).
Entonces T define un campo tensorial T̄ ∈ T 1 2 (M ) a través de
T̄ (ω, X, Y ) := ω(T (X, Y )),
ω ∈ X ∗ (M ), X, Y ∈ X (M ).
(3.57)
Con respecto a coordenadas locales x1 , ..., xn , tenemos que
∂
∂
T̄ k ij = dxk T
,
∂xi ∂xj
∂
∂
∂
∂
= dxk ∇ ∂ i j − ∇ ∂ j
−
,
∂x ∂x
∂x ∂xi
∂xi ∂xj
∂
∂
= dxk Γl ij l − Γl ji l − 0
∂x
∂x
=
Γk ij − Γk ji ,
donde hemos usado la definición de los sı́mbolos de Christoffel (3.27) en el tercer
paso. Entonces,
T̄ k ij = Γk ij − Γk ji .
(3.58)
Definición 31 Sea M una variedad diferenciable con conexión afı́n ∇. Se dice
que ∇ es simétrica o libre de torsión si
T = 0.
(3.59)
Con respecto a coordenadas locales esto quiere decir que los sı́mbolos de Christoffel Γk ij asociados a ∇ son simétricos en ij.
De acuerdo a la ecuación (3.55), ∇ es simétrica si y sólo si para cada función
f ∈ M el hessiano covariante ∇df es simétrico.
Ahora viene el resultado importante:
Teorema 4 Sea (M, g) una variedad (pseudo-) Riemanniana. Entonces existe
una única conexión afı́n ∇ tal que
(i) ∇g = 0 (∇ es métrica)
(ii) T = 0 (∇ es simétrica).
Esta conexión única se llama conexión Riemanniana o conexión de LeviCivita.
3.4. MÉTRICAS PSEUDO-RIEMANNIANAS
63
Demostración. Sean ∇ una conexión afı́n y X, Y, Z ∈ X (M ) tres campos
vectoriales. Entonces la ecuación (3.38) implica que
(∇Z g)(X, Y ) = Z[g(X, Y )] − g(∇Z X, Y ) − g(X, ∇Z Y ),
y la condición (i) es equivalente a
Z[g(X, Y )] = g(∇Z X, Y ) + g(X, ∇Z Y )
(3.60)
para todos X, Y, Z ∈ X (M ). La ecuación (3.60) se llama identidad de Ricci.
Para demostrar el teorema suponemos primero que existe una conexión afı́n
que satisface las propiedades (i) y (ii). Usando la identidad de Ricci (3.60) y la
simetrı́a de ∇ encontramos que
Z[g(X, Y )] − X[g(Y, Z)] − Y [g(Z, X)]
= g(∇Z X − ∇X Z, Y ) + g(∇Z Y − ∇Y Z, X) + g(∇X Y − ∇Y X, Z)
− 2g(∇X Y, Z)
= g([Z, X], Y ) + g([Z, Y ], X) + g([X, Y ], Z) − 2g(∇X Y, Z)
Entonces,
2g(∇X Y, Z)
=
−Z[g(X, Y )] + X[g(Y, Z)] + Y [g(X, Z)]
+
g([X, Y ], Z) + g([Z, X], Y ) + g([Z, Y ], X).
(3.61)
La parte derecha de esta ecuación no depende de ∇. Entonces, dado que g es
no-degenerada, la unicidad de ∇ queda demostrada.
Para demostrar la existencia de ∇, fijamos X, Y ∈ X (M ) y definimos para
cada Z ∈ X (M ) la función ω(Z) por la parte derecha de la ecuación (3.61). Podemos verificar que ω es lineal en Z y que para una función f ∈ F(M ) tenemos
que ω(f Z) = f ω(Z). Entonces ω ∈ X ∗ (M ) define un campo de covectores. Dado que la métrica es no-degenerada existe un único campo vectorial W ∈ X (M )
tal que 2W = ω, es decir, tal que
f
2g(W, Z) = ω(Z)
para todo Z ∈ X (M ) (ver la sección 3.4.1). Ahora definimos ∇ por ∇X Y := W .
No es difı́cil verificar que el mapeo ∇ : X (M )×X (M ) → X (M ), (X, Y ) 7→ ∇X Y
definido de esta manera satisface todas las propiedades de una conexión afı́n.
Además, obtenemos de (3.61)
2g(∇X Y − ∇Y X, Z) = 2g([X, Y ], Z)
para todo Z ∈ X (M ) lo que muestra ∇ es libre de torsión. Finalmente, ∇
satisface la identidad de Ricci (3.60) puesto que (3.61) implica que
2g(∇X Y, Z) + 2g(∇X Z, Y ) = 2X[g(Y, Z)],
y entonces ∇ es métrica. Esto concluye la demostración del teorema.
64
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Observaciones
1. Sean x1 , ..., xn coordenadas locales de M . Si introducimos los campos vectoriales
∂
∂
∂
,
Y =
,
Z=
,
X=
∂xi
∂xj
∂xk
en la ecuación (3.61), obtenemos que
∂
∂
∂
∂
∂
l
l
gjk +
gik .
2glk Γ ij = 2g Γ ij l , k = − k gij +
i
∂x ∂x
∂x
∂x
∂xj
Entonces, encontramos
Γ
k
ij
1
= g kl
2
∂
∂
∂
gjl +
gil −
gij .
∂xi
∂xj
∂xl
(3.62)
Esta fórmula nos permite calcular los sı́mbolos de Christoffel asociada a
la conexión de Levi-Civita a partir de las componentes de la métrica y de
sus primeras derivadas.
2. Sea ∇ la conexión de Levi-Civita. Como mostramos en la sección previa,
dado un punto p ∈ M , siempre podemos encontrar coordenadas locales
x1 , ..., xn en una vecindad de p tal que Γk ij (p) = 0. Esta condición se
mantiene si hacemos un cambio de coordenadas x̄i = Ai j xj , donde A es
una matriz n × n constante. Además, como vimos, podemos elegir A tal
que ḡij (p) = ηij , (ηij ) = diag(−1, .., −1, 1, ..,1).
Resumiendo, sea (M, g) una variedad (pseudo-) Riemanniana con conexión de Levi-Civita ∇. Entonces dado un punto p ∈ M , podemos encontrar coordenadas locales en una vecindad de p tales que en el punto p se
satisfacen gij (p) = ηij y Γk ij (p) = 0. Como vamos a ver en el capı́tulo que
sigue, un sistema de coordenadas locales con estas propiedades se llama un
sistema inercial local y constituye un ingrediente clave para la relatividad
general.
3. En el capı́tulo que sigue, también mostraremos que las geodésicas con respecto a la conexión de Levi-Civita corresponden a las curvas estacionarias
del funcional de longitud de arco,
L[γ] =
Z(2)q
|gγ(t) (γ̇(t), γ̇(t))|dt,
(1)
donde los puntos extremos de la curva, (1) y (2), son fijos.
Ejercicio 8. Sea (M, g) una variedad pseudo-Riemanniana con conexión afı́n de
Levi-Civita correspondiente ∇. Definimos la divergencia de un campo vectorial
X ∈ X (M ) como la contracción
div X := C(∇X) ∈ F(M ).
(3.63)
3.4. MÉTRICAS PSEUDO-RIEMANNIANAS
65
Demuestre que en coordenadas locales,
1
div X = ∇i X i = p
∂i
| det(gij )|
3.4.3.
q
| det(gij )|X i .
(3.64)
Integración de funciones sobre una variedad
Sea (M, g) una variedad pseudo-Riemanniana de dimensión n. Sea f ∈ F(M )
una función C ∞ -diferenciable sobre M , y sea K ⊂ M un subconjunto compacto
de M . Entonces podemos definir la integral de f sobre K de la manera siguiente:
Primero, vamos a suponer que K ⊂ U está enteramente contenida en una
carta local (U, φ). Sean gij : U → R las n × n componentes de la métrica g con
respecto a esta carta. Entonces definimos
Z
Z
q
f :=
f (φ−1 (x)) | det(gij (φ−1 (x))|dn x.
(3.65)
K
φ(K)
Sea (Ū , φ̄) otra carta local tal que K ⊂ Ū . Sean ḡkl : Ū → R las componentes
de g con respecto a esta carta. Entonces, la ley de transformación (3.22) para
las componentes de campos tensoriales implica que
∂ x̄k k
l
k
gij (p) = J i (p)J j (p)ḡkl (p),
J i (p) =
,
x̄ = ψ(φ−1 (x)),
∂xi p
para todo p ∈ K y por lo tanto,
q
p
| det(gij (p))| = | det(ḡkl (p))| | det J(p)|.
Ahora la fórmula de transformación de variables para integrales sobre Rn nos
da
Z
q
f (φ−1 (x)) | det(gij (φ−1 (x))|dn x
φ(K)
Z
=
p
f (φ−1 (x)) | det(ḡkl (φ−1 (x))| | det J(φ−1 (x))|dn x
φ(K)
Z
=
f (ψ −1 (x̄))
q
| det(gij (ψ −1 (x̄))|dn x̄,
ψ(K)
lo que demuestra que la definición (3.65) es independiente de la elección de
la carta local. Ahora, si K no está enteramente contenida en una carta local,
usamos una partición de la unidad.
66
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Definición 32 Sea M una variedad diferenciable. Una partición de la unidad es una familia (Uα , φα , hα ), donde los (Uα , φα ) forman un atlas diferenciable de M y donde hα ∈ F(M ) son funciones C ∞ -diferenciables sobre M de
tal manera que
(i) La familia Uα es localmente finita, es decir cada punto p ∈ M posee una
vecindad abierta U ⊂ M tal que la intersección U ∩ Uα es no vacı́a solamente para una número finitos de α’s.
(ii) hα ≥ 0 y supp hα ⊂ Uα para todo α.
P
(iii)
hα (p) = 1 para todo p ∈ M .
α
Observaciones
1. Notamos que gracias a la condición (i), para cada p ∈ M , hα (p) 6= 0 solamente para un número finito de α’s de tal manera que no hay problemas
de convergencı́a en la condición (iii).
2. Se puede demostrar que una variedad diferenciable M posee una partición
de la unidad si y sólo si cada componente conexa de M es Hausdorff y
posee una base contable (ver [5] y referencias a dentro).
Volviendo a la definición de la integral de f sobre M , tomamos una partición de la unidad (Uα , φα , hα ) de M . Entonces las funciones hα f son C ∞ diferenciables y son cero fuera del conjunto compacto Kα := supp hα ∩ K ⊂ Uα .
Entonces definimos
Z
q
XZ
X Z
n
| det(gij (φ−1
f :=
hα f =
(hα f )(φ−1
(x))
α (x))|d x. (3.66)
α
α
K
α
Kα
φα (Kα )
Notamos que la condición (i) y la compacticidad de K implican que solamente
un número finito de las funciones hα f son diferentes de cero, de tal manera que
la suma en (3.66) es finita.
Finalmente, demostramos que la definición (3.66) is independiente de la elección de la partición de la unidad: Sea (Vβ , ψβ , kβ ) otra partición de la unidad de M . Entonces (Wαβ , ζαβ , mαβ ), donde Wαβ := Uα ∩ Vβ , ζαβ := φα |Vβ ,
mαβ := hα kβ también es una partición de la unidad de M de tal manera que
X
mαβ (p) = hα (p),
para todo p ∈ M . Entonces,
Z
X
X
hα f =
supp hα ∩K
mαβ (p) = kβ (p),
α
β
α
X
Z
α,β supp m
mαβ f =
αβ ∩K
X
β
Z
supp kβ ∩K
kβ f,
3.4. MÉTRICAS PSEUDO-RIEMANNIANAS
67
lo que demuestra que la definición (3.66) is independiente de la elección de la
partición de la unidad.
A veces es posible calcular la integral de funciones sobre subconjuntos compactos que no están enteramente contenidos en una carta local sin usar ninguna
partición de la unidad.
2
Ejemplo: Sea M = SR
= {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = R2 } la esfera con
radio R > 0 con la métrica inducida h = R2 (dϑ2 +sen2 ϑ dϕ2 ). Sean 0 < δ < π/2
y Kδ := {R(cos ϕ sen ϑ, sen ϕ sen ϑ, cos ϑ) : δ ≤ ϑ ≤ ϑ − δ, δ ≤ ϕ ≤ 2π − δ}.
2
Entonces para una función f ∈ F(SR
) diferenciable tenemos
π−δ
Z 2π−δ
Z
Z
f (R(cos ϕ sen ϑ, sen ϕ sen ϑ, cos ϑ)) R2 sen ϑdϕdϑ.
f=
Kδ
δ
δ
Puesto que f es diferenciable, podemos tomar el lı́mite δ → 0 y obtenemos la
integral de f sobre S 2 . En particular, para f = 1, obtenemos
2
Vol(SR
)
Zπ Z2π
Z
:=
1=
0
2
SR
R2 sen ϑdϕdϑ = 4πR2 .
0
A continuación demostramos el teorema de Gauss en su versión covariante.
Empezamos con el caso más simple de un cubo K := [−1, 1]n en (Rn , g), donde
g es una métrica pseudo-Riemanniana sobre Rn . Sean Si± := {(x1 , x2 , ..., xn ) ∈
K : xi = ±1}, i = 1, 2, ..., n, los lados del cubo con covectores normales νi± correspondientes proporcional a ±dxi . En lo que sigue, suponemos que las métricas
inducidas hi± sobre Si± son no-degeneradas. Entonces podemos normalizar νi±
de tal manera que los vectores normales correspondientes, ν̃i± , satisfacen
|g(ν̃i± , ν̃i± )| = 1,
i = 1, 2, ..., n.
Con estas suposiciones tenemos:
Lema 6 Sea (Rn , g) una variedad pseudo-Riemanniana, y sean K, Si± y νi±
definidos como arriba, donde suponemos que las métricas inducidas sobre Si±
son no-degeneradas. Entonces vale para todo X ∈ X (Rn ),
Z
Z
div X =
K
ν(X) :=
∂K
n X Z
X
νi± (X),
i=1 ± S
i±
donde div X := C(∇X) es la divergencia de X con respecto a la métrica de
Levi-Civita.
68
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Demostración. Trabajando con la carta trivial (Rn , id) tenemos que
q
Z
Z
k
div X =
∂k
| det(gij )|X dn x
K
K
=


Z q
Z q
n
X


| det(gij )|X k dn−1 x −
| det(gij )|X k dn−1 x

k=1
Sk−
Sk+
donde usamos la expresión (3.64) para la divergencia y la definición 3.65 en el
primer paso y el teorema fundamental del cálculo en el segundo paso.
Ahora veámos primero la integral sobre el lado S1+ . Podemos expander la
métrica de la siguiente forma,
g = adx1 ⊗ dx1 + hAB (dxA + β A dx1 ) ⊗ (dxB + β B dx1 )
A, B = 2, 3, ..., n,
donde a 6= 0 sobre S1+ y donde hAB dxA ⊗ dxB es la métrica inducida sobre
S1+ . Con esta notación, es fácil verificar que
p
| det(gij )| = |a|| det(hAB )|,
ν1+ = |a|dx1 ,
de tal manera que
Z q
Z
1 n−1
| det(gij )|X d
x=
ν1+ (X).
S1+
S1+
Luego,
para el lado S1− se tienen las mismas expresiones excepto que ν1− =
p
− |a|dx1 , y entonces
Z
Z q
| det(gij )|X 1 dn−1 x =
ν1− (X).
−
S1−
S1−
Conclusiones similares aplican a los lados S2± , ... , Sn± .
Ahora podemos generalizar el teorema de Gauss a subconjuntos compactos
K ⊂ M que se pueden obtener de una unión finita de cubos deformados.
Teorema 5 Sea (M, g) una variedad pseudo-Riemanniana de dimensión n con
conexión afı́n de Levi Civita correspondiente ∇. Sea K ⊂ M un subconjunto
compacto de la siguiente forma: Existen cartas locales (U1 , φ1 ), ... ,(Um , φm ) y
subconjuntos compactos K1 ⊂ U1 , ... , Km ⊂ Um tales que
(i) K =
m
S
Kl ,
l=1
(ii) K̇i ∩ K̇j = ∅ para i 6= j, donde K̇j := Kj \ ∂Kj ,
(iii) φl (Kl ) = [−1, 1]n para todo l = 1, 2, ..., m.
3.4. MÉTRICAS PSEUDO-RIEMANNIANAS
69
(iv) La métrica inducida sobre ∂Kl es no-degenerada para todo l = 1, 2, ..., m.
Sea ν el campo de covectores normal unitario exterior sobre ∂K, es decir ν
satisface ν(X) = 0 para cada X ∈ T (∂K), |g(ν̃, ν̃)| = 1 y νp (Xp ) > 0 si Xp es
un vector tangente en p ∈ ∂K que apunta fuera de K. Entonces
Z
Z
Z
div X =
ν(X) =
g(X, ν̃)
K
∂K
∂K
para cada campo vectorial X ∈ X (M ).
Demostración. Usando la definición 3.65 y el resultado del Lema 6 tenemos
que
Z
div X
=
m Z
X
div X
l=1 K
K
l
=
Z
m
X
l=1
=
div X(φ−1
l (x))
q
n
| det(gij (φ−1
l (x)))|d x
[−1,1]n
m X
n X
X
l=1 i=1 ±
Z
φ∗l νi± (X).
φ−1
l (Si± )
Las integrales sobre los lados conjuntos se cancelan, y quedan las integrales
sobre los lados exteriores que forman ∂K.
Ejemplos:
1. Sea (M, g) = (R3 , h) con h = dx ⊗ dx + dy ⊗ dy + dz ⊗ dz la métrica
Euclideana. Sea K = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ R} la bola con radio
2
R > 0 con frontera ∂K = SR
. Entonces podemos escribir K como la unión
2
de siete cubos deformados, y el covector normal unitario exterior sobre SR
−1
es ν = dR = R (xdx + ydy + zdz).
Para el campo vectorial particular X(x, y, z) = x∂x + y∂y + z∂z tenemos
div X = 3 y ν(X) = R. Entonces el teorema de Gauss implica la relación
Z
Z
1
4π 3
1
R = RVol(S 2 ) =
R .
Vol(K) := 1 =
3
3
3
K
S2
2. Consideramos una variedad pseudo-Riemanniana (M, g) con las siguientes
propiedades:
(a) M = R × Σ, donde Σ es una variedad diferenciable de dimensión n.
(b) Las hojas Σt := {t} × Σ con las métricas inducidas correspondientes
ht forman variedades Riemannianas para cada t ∈ R.
70
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
(c) La métrica inducida sobre las lı́neas R×{p} es negativa definida para
todo p ∈ Σ.
El campo de covectores normal unitario N sobre las hojas Σt es proporcional a dt. Entonces existe una función α : M → R tal que N = αdt. De
acuerdo al propiedad (c), esta función no tiene ceros. Elegimos la orientación tal que N (∂t ) > 0, entonces α es estrictamente positivo.
Si S ⊂ Σ es un subconjunto compacto de Σ que satisface las propiedades
(i)–(iii) del Teorema 5, entonces para t1 < t2 el subconjunto compacto
K := [t1 , t2 ] × S ⊂ M de M satisface todas las condiciones (i)–(iv) del
teorema, y ∂K = S1 ∪ S2 ∪ T , donde S1 := {t1 } × S, S2 := {t2 } × S y
T := [t1 , t2 ] × ∂S. Entonces el teorema de Gauss implica que
Z
Z
Z
Z
div X = − N (X) + N (X) + ν(X),
(3.67)
K
S1
S2
T
donde ν es el campo de covectores normal unitario exterior a K sobre T .
En particular, si div X = 0 y X tiene soporte compacto sobre cada rebanada St := {t} × S, t1 ≤ t ≤ t2 , de K, entonces la ecuación (3.4.3) implica
que
Z
Z
N (X) =
S2
es decir, la cantidad
3.5.
R
St
N (X) =
N (X),
S1
R
St
αdt(X) es independiente de t.
Derivada de Lie
En esta sección vamos a introducir la derivada de Lie de una campo tensorial
T con respecto a un campo vectorial X. Intuitivamente, esta derivada nos da el
”cambio infinitesimal de T a lo largo de X”. La derivada de Lie es importante
para describir las simetrı́as de una variedad, y algunos de los conceptos que se
van a ver en este capı́tulo también son útiles para el estudio de los grupos de
Lie.
En esta sección denotamos por M una variedad diferenciable. Empezamos
con la definición del flujo asociado a un campo vectorial.
3.5.1.
El flujo de un campo vectorial
Para definir el flujo necesitamos primero el siguiente resultado que se puede
demostrar con los teoremas clásicos para las ecuaciones diferenciales ordinarias
(ver, por ejemplo, la referencia [6]):
Teorema 6 Sea X ∈ X (M ) un campo vectorial sobre M . Entonces existe para
cada p ∈ M una única curva integral maximal γp de X a través de p. Es decir,
dado p ∈ M existe una única curva γp : (a, b) → M con a < 0 < b tal que
3.5. DERIVADA DE LIE
71
(i) γp (0) = p,
(ii) γ̇p (t) = Xγp (t) para todo a < t < b,
(iii) Si µ : (c, d) → M es otra curva integral de X a través del punto p, entonces
a ≤ c, d ≤ b y µ(t) = γp (t) para todo c < t < d.
Demostración. Sea p ∈ M , y sea Cp (X) el conjunto de todas las curvas integrales a X a través del punto p. El resultado del Lema 3 implica que el
conjunto Cp (X) no es vacı́o. Sean γ1 : (a1 , b1 ) → M y γ2 : (a2 , b2 ) → M dos
elementos de Cp (X). Entonces vamos a demostrar que γ1 (t) = γ2 (t) para todo
t1 := máx{a1 , a2 } < t < t2 := mı́n{b1 , b2 }. Para ver esto, sea t∗ := sup{t ∈
R : 0 < t < t2 , γ1 (t) = γ2 (t)}. Si t∗ < t2 obtenemos una contradicción con
el resultado de unicidad local del Lema 3 aplicado al punto γ(t∗ ), y entonces
t∗ = t2 , lo que implica que γ1 (t) = γ2 (t) para todo 0 ≤ t < t2 . De la misma
forma, se muestra que γ1 (t) = γ2 (t) para todo t1 < t ≤ 0.
Ahora definimos la curva integral maximal γp : (A, B) → M de la siguiente
manera:
A :=
ı́nf{a ∈ R : γ : (a, b) → M es un elemento de Cp (X)},
B
sup{b ∈ R : γ : (a, b) → M es un elemento de Cp (X)}.
:=
Sea t ∈ (A, B), entonces existe una curva integral γ : (a, b) → M de X a través
de p tal que t ∈ (a, b), y definimos γp (t) = γ(t). Esta definición es independiente
de la curva γ de acuerdo al resultado de unicidad que acabamos de demostrar.
La curva γp : (A, B) → M definida de esta manera es una curva integral a X a
través de p que es maximal.
Definición 33 Sea X ∈ X (M ) un campo vectorial. Denotamos para cada punto
p ∈ M de la variedad por γp : Ip → M la única curva integral maximal de X a
través de p. Sean
D
Dt
:= {(t, p) : p ∈ M, t ∈ Ip } ⊂ R × M,
:= {p ∈ M : t ∈ Ip } ⊂ M.
Entonces el mapeo ϕ : D → M , (t, p) 7→ ϕ(t, p) := γp (t) se llama el flujo de
X. Para cada t ∈ R fijo también definimos el mapeo
ϕt : Dt → M, p 7→ ϕt (p) := ϕ(t, p) = γp (t),
que deja ”fluir un punto p por el tiempo t a lo largo de la curva γp ”.
Ejemplos:
∂
1. Sean M = R y X ∈ X (R) el campo vectorial X = x2 ∂x
. La curva integral
x(t) de X a través del punto p = x0 ∈ R satisface el problema de Cauchy
ẋ(t) = x(t)2 ,
x(0) = x0
72
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
con la solución formal
x(t) =
x0
.
1 − tx0
Observamos que x(t) diverge cuando t → 1/x0 . Por lo tanto, los intervalos
maximal de existencia Ip son dados por

R, p = x0 = 0,


 1
−∞, x0 , p = x0 > 0,
Ip =


1

, ∞ , p = x0 < 0,
x0
y el flujo es
ϕt : Dt → M, x0 7→ ϕt (x0 ) =
donde
Dt =
x0
,
1 − tx0


R = M,
t = 0,
−∞, 1t , t > 0,

1
t , ∞ , t < 0,
∂
∂
2. Sean M = R2 y X ∈ X (R2 ) el campo vectorial X = y ∂x
− x ∂y
. La curva
2
integral (x(t), y(t)) de X a través del punto (x0 , y0 ) ∈ R obedece
ẋ(t) = y(t),
ẏ(t) = −x(t)
x(0) = x0 ,
y(0) = y0 ,
con las solución
x(t)
cos(t)
t
= ϕ (x0 , y0 ) =
y(t)
− sen(t)
sen(t)
cos(t)
x0
y0
.
En este caso, el intervalo maximal de existencia es Ip = R para cada punto
p = (x0 , y0 ) de M , y D = R × M .
Definición 34 Sea X ∈ X (M ) un campo vectorial. Entonces X se llama completo si D = R × M .
Observación: En el primer ejemplo de arriba, X no es completo porque las
curvas integrales no siempre pueden ser extendidades a todo el intervalo R del
tiempo. En el segundo ejemplo, X es completo.
El flujo de un campo vectorial satisface las siguientes propiedades:
Lema 7 Sea X ∈ X (M ) un campo vectorial con flujo asociado ϕ : D → M .
Entonces valen las siguientes afirmaciones:
(i) ϕ0 = idM .
(ii) Sean t, s ∈ R. Entonces valen para todo p ∈ Ds+t , ϕt (p) ∈ Ds , ϕs (p) ∈ Dt
y
ϕs+t (p) = ϕs ◦ ϕt (p) = ϕt ◦ ϕs (p).
3.5. DERIVADA DE LIE
73
(iii) D ⊂ R × M es un conjunto abierto.
(iv) ϕ : D ⊂ R × M → M es C ∞ -diferenciable.
(v) Para cada t ∈ R, el mapeo ϕt : Dt → M es un difeomorfismo de Dt en
D−t con inversa ϕ−t .
(vi) Si U ⊂ Dt es abierto, entonces ϕt : U → M es un difeomorfismo de U en
ϕt (U ).
(vii) Si M es compacto, entonces D = R × M y X es completo.
Demostración. Consultar un libro, por ejemplo [8].
3.5.2.
El pull-back y el push-forward de un difeomorfismo
Sean M y N variedades diferenciables, y sea φ : M → N un mapeo C ∞ diferenciable. Preguntamos si φ induce un mapeo natural de T r s (M ) a T r s (N ).
Nos acordamos de que para campos tensoriales del tipo (0, s) habı́amos definido
(ver la definición 20) el pull-back φ∗ : T 0 s (N ) → T 0 s (M ) a través de
(φ∗ T )p (Y1 , Y2 , ..., Ys ) := Tφ(p) (dφp (Y1 ), dφp (Y2 ), ..., dφp (Ys ))
para todo T ∈ T 0 s (N ), Y1 , Y2 , ..., Ys ∈ Tp M y p ∈ M , donde dφp : Tp M →
Tφ(p) N denota la diferencial de φ en el punto p, ver la definición 7.
A continuación preguntamos si φ induce un mapeo similar para campos
tensoriales contravariantes. Para un campo vectorial X ∈ X (M ), por ejemplo,
podrı́amos tener la tentación de definir el “push-forwar” de X con respecto a φ
a través de dφ(X). Sin embargo, es claro que esta definición tiene problemas si
existen puntos p, q ∈ M , p 6= q tal que φ(p) = φ(q) pero dφp (Xp ) 6= dφq (Xq ).
Para evitar estos problemas vamos a pedir que φ : M → N es invertible en lo
que sigue. Para definir el pull-back y el push-forward de campos tensoriales arbitrarios en este caso, empezamos con las siguientes consideraciones del álgebra
lineal:
Sean E y F dos espacios vectoriales reales de dimensión finita, y sea A :
E → F un isomorfismo lineal (es decir, un mapeo lineal e invertible) con inversa
A−1 : F → E. Sean E ∗ y F ∗ los espacioes duales correspondientes a E y F .
Definimos el adjunto de A como el mapeo A∗ : F ∗ → E ∗ , w∗ 7→ A∗ w∗ definido
por
(A∗ w∗ )(v) := w∗ (Av),
v ∈ E.
(3.68)
A∗ define un isomorfismo de F ∗ en E ∗ con inversa (A∗ )−1 = (A−1 )∗ . Sean
E r s , F r s los espacios de tensores del tipo (r, s) sobre E y F , respectivamente.
Entonces el ismomorfismo A : E → F induce un isomorfismo Ar s : E r s → F r s ,
T 7→ Ar s T definido por
(Ar s T )(Y1∗ , ..., Yr∗ , Y1 , ..., Ys ) := T (A∗ Y1∗ , ..., A∗ Yr∗ , A−1 Y1 , ..., A−1 Ys ),
donde T ∈ E r s , Y1∗ , ..., Yr∗ ∈ F ∗ , Y1 , ..., Ys ∈ F . En particular, notamos los
siguientes casos particulares:
74
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
1. A0 0 = idR , porque un tensor del tipo (0, 0) sobre E o F es un número
real.
2. A0 1 = (A−1 )∗ , porque para
T ∈ E 0 1 = E ∗ y Y ∈ F tenemos que
−1
0
−1
(A 1 T )(Y ) = T (A Y ) = (A )∗ T (Y ) de acuerdo a la definición 3.68.
3. A1 0 = A, porque para T ∈ E 1 0 = E ∗∗ ' E y Y ∗ ∈ F ∗ tenemos que
(A1 0 T )(Y ∗ ) = T (A∗ Y ∗ ) = (A∗ Y ∗ )(T ) = Y ∗ (AT ) = AT (Y ∗ ), donde usamos de nuevo la definición 3.68.
Ahora aplicamos la definición de Ar s al caso E = Tp M , F = Tφ(p) N y A =
dφp : E → F , donde φ : M → N es un difeomorfismo.
Definición 35 Sean M y N variedades diferenciables, y sea φ : M → N un
difeomorfismo. Entonces definimos el push-forward con respecto a φ como
el mapeo φ∗ : T r s (M ) → T r s (N ), T 7→ φ∗ T definido por
p = φ−1 (q),
(φ∗ T )q := (dφp )r s Tp ,
para T ∈ T r s (M ) y q ∈ N .
De manera similar, definimos el pull-back con respecto a φ como el
mapeo φ∗ : T r s (N ) → T r s (M ), S 7→ φ∗ S definido por
−1
(φ∗ S)p := [(dφp )r s ]
Sφ(p) ,
para S ∈ T r s (N ) y p ∈ M .
Observaciones
1. De acuerdo a la definición, valen φ∗ ◦φ∗ = id|T r s (M ) y φ∗ ◦φ∗ = id|T r s (N ) .
2. Si X ∈ X (M ) es un campo vectorial sobre M , entonces
(φ∗ X)q = dφp (Xp ),
p = φ−1 (q),
para todo q ∈ N .
3. Si r = 0, entonces la definición 35 es equivalente a la definición original 20
del pull-back para campos tensoriales covariantes.
4. Para un campo tensorial T ∈ T 1 1 (M ) del tipo (1, 1) sobre M , tenemos,
explicitamente,
(φ∗ T )q (ωq , Yq ) = Tp (dφp )∗ ωq , (dφp )−1 (Yq ) ,
p = φ−1 (q) (3.69)
para todo q ∈ N , ωq ∈ Tq∗ N y Yq ∈ Tq N .
A continuación, vamos a encontrar las expresiones en coordenadas locales
para el pull-forward de un campo tensorial. Sean p ∈ M y q = φ(p) ∈ N , sean
3.5. DERIVADA DE LIE
75
x1 , x2 , ..., xn coordenadas locales en una vecindad U de p, y sean y 1 , y 2 , ..., y n
coordenadas locales en la vecindad φ(U ) de q. Entonces podemos expander
!
∂ ∂ i
= A j (p)
,
p ∈ U, q = φ(p),
dφp
∂xj p
∂y i q
donde los coeficientes Ai j (p) son dados por
"
i
A j (p)
=
=
=
=
!#
∂ dφp
∂xj p
"
!#
∂ (y i )
dφp
∂xj p
∂ i
[y ◦ φ]
∂xj p
∂y i ,
∂xj p
dyqi
donde hemos usado las definiciones 13 y 7 en el segundo y tercer paso, respectivamente. De acuerdo a la definición 20 del pull-back, también tenemos que
"
!#
!
∂y i ∂ ∂ ∗
i
i
= (dφp ) (dyq )
,
= dyq dφp
∂xj p
∂xj p
∂xi p
y entonces podemos expander
(dφp )∗ (dyqi )
(dφp )
−1
!
∂ ∂y j q
=
=
∂y i dxj ,
∂xj p p
−1 i
(A(p)
)
j
∂ ∂xi ∂ =
.
∂xi p
∂y j p ∂xi p
Basándonos en la ecuación (3.69), encontramos la siguiente relación
(φ∗ T )
i1 ...ir
j1 ...js (q)
dyqi1 , ..., dyqir ,
!
∂ ∂ , ...,
∂y j1 q
∂y js q
=
(φ∗ T )q
=
∂y i1
∂y ir ∂xl1
∂xls k1 ...kr
·
·
·
·
·
·
T
l1 ...ls (p),(3.70)
∂xk1
∂xkr ∂y j1
∂y js
q ∈ φ(U ), p = φ−1 (q), entre las componentes de un campo tensorial T ∈
T r s (M ) del tipo (r, s) sobre M y las componentes de su push-forward φ∗ T . Esta
ecuación se ve formalmente equivalente a la ley de transformación (3.22) para
las componentes de un campo tensorial. La diferencia entre las dos ecuaciones
reside en su interpretación: Aquı́, la ecuación (3.70) describe la relación entre
las componentes de dos campos tensoriales distintos (T sobre M y φ∗ T sobre N ,
76
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
respectivamente) con respecto a coordenadas locales x1 , ..., xn y y 1 , ..., y n en la
vecindad de dos puntos distintos (p ∈ M y q = φ(p) ∈ N , respectivamente). A
diferencia de esto, la ecuación (3.22) describe la relación entre las componentes
del mismo campo tensorial T con respecto a coordenadas locales en la vecindad
del mismo punto p. Para el caso M = N esta diferencia refleja la diferencia
entre transformaciones activas y pasivas.
3.5.3.
La derivada de Lie
Ahora tenemos todos los ingredientes para definir la derivada de Lie de un
campo tensorial:
Definición 36 Sea M una variedad diferenciable, y sea X ∈ X (M ) un campo
vectorial C ∞ -diferenciable con flujo asociado ϕt . Entonces definimos para cada
T ∈ T r s (M ) su derivada de Lie con respecto a X a través de
o
1 n t ∗ d t ∗ (ϕ ) T p − Tp ,
(ϕ ) T p = lı́m
p ∈ M. (3.71)
(£X T )p :=
t→0 t
dt
t=0
Observación: Como vimos en la sección 3.5.1 el flujo ϕt no siempre está definido
para todos los puntos p ∈ M . Sin embargo, el Lema 7 implica que para cada
t ∈ R el mapeo ϕt : Dt → D−t es un difeomorfismo, y que para p ∈ M dado,
p ∈ Dt para |t| suficientemente pequeño. Entonces dado p ∈ M , [(ϕt )∗ T ]p define
un tensor del tipo (r, s) sobre Tp M para cada |t| suficientemente pequeño y la
ecuación (3.71) tiene sentido.
La derivada de Lie satisface las siguientes propiedades básicas:
Lema 8 Sea M una variedad diferenciable, y sea X ∈ X (M ). Entonces,
(i) £X T ∈ T r s (M ) para cada T ∈ T r s (M ).
(ii) £X (T1 + T2 ) = £X T1 + £X T2 para todo T1 , T2 ∈ T r s (M ).
(iii) £X (T ⊗ S) = (£X T ) ⊗ S + T ⊗ (£X S) para todo T ∈ T r s (M ) y S ∈
T p q (M ).
(iv) £X conmuta con las contracciónes totales.
(v) £X f = X[f ] = df (X) para todo f ∈ F(M ).
(vi) £X Y = [X, Y ] para todo Y ∈ X (M ).
Demostración. Con respecto a la afirmación (i), notamos que [(ϕt )∗ T ]p es
C ∞ -diferenciable en t y en p de acuerdo al Lema 7(iv) y la definición 35 del pullback. Por esta razón, £X T define un campo tensorial del tipo (r, s) que es C ∞ diferenciable. Las afirmaciones (ii) y (iii) son consecuencias directas de las identidades (ϕt )∗ (T1 + T2 ) = (ϕt )∗ T1 + (ϕt )∗ T1 y (ϕt )∗ (T ⊗ S) = [(ϕt )∗ T ] ⊗ [(ϕt )∗ S].
Para demostrar la afirmación (iv) notamos que (ϕt )∗ C(T ) = C ((ϕt )∗ T ) para
un campo tensorial T ∈ T r r (M ) del tipo (r, s) con r = s.
3.5. DERIVADA DE LIE
77
Para demostrar la afirmación (v) tomamos f ∈ F(M ) y p ∈ M . Entonces
de acuerdo a la definición 36 de la derivada de Lie,
d
d t ∗ t
=
= Xp [f ],
£X fp =
(ϕ ) f p f ◦ ϕ (p)
dt
dt
t=0
t=0
de acuerdo a las definiciones del pull-back para funciones, y usando el hecho de
que Xp es el vector tangente a la curva Ip → M , t 7→ ϕt (p) en el punto p.
Finalmente, para demostrar (vi), tomamos f ∈ F(M ) y definimos la función
C ∞ -diferenciable h : D → M a través de
h(t, q) := f (ϕt (q)) − f (q),
(t, q) ∈ D.
Dado que h(0, q) = 0 para todo q ∈ M tenemos que
Z1
h(t, q) =
d
h(st, q)ds = t
ds
Z1
∂h
(st, q)ds ≡ tg(t, q)
∂t
0
0
donde g : D → M es C ∞ -diferenciable. Entonces encontramos que
f ◦ ϕt (q) = f (q) + tg(t, q)
(3.72)
para todo (t, q) ∈ D, lo que implica que
Xq [f ] =
d
f ◦ ϕt (q)
= g(0, q)
dt
t=0
para todo q ∈ M . Por otro lado, la ecuación (3.72) también implica que
(dϕt Y )ϕt (q) [f ] = Yq [f ◦ ϕt ] = Yq [f ] + tYq [g(t, ·)].
para todo (t, q) ∈ D, y entonces
(£X Y )p [f ]
=
1 t ∗
[(ϕ ) Y ]p − Yp [f ]
t→0 t
1 −t
lı́m
[dϕ (Y )]p [f ] − Yp [f ]
t→0 t
1
lı́m
Yϕt (p) [f ] − Yp [f ] − lı́m Yϕt (p) [g(−t, ·)]
t→0 t
t→0
Xp [Y f ] − Yp [g(0, ·)]
=
[X, Y ]p [f ].
=
=
=
lı́m
Notamos que las propiedades (i)–(vi) que satisface el operador £X son las
mismas que las propiedades (i)–(vi) que satisface la derivada covariante ∇X , ver
la sección 3.3.1. Entonces usando el mismo procedimiento que en esta sección,
78
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
encontramos la siguiente expresión explı́cita para la derivada de Lie de un campo
tensorial T ∈ T r s (M ) con respecto a X ∈ X (M ):
=
(£X T )(ω 1 , ..., ω r , Y1 , ..., Ys )
X T (ω 1 , ..., ω r , Y1 , ..., Ys )
−
T (£X ω 1 , ω 2 , ..., ω r , Y1 , ..., Ys ) − ... − T (ω 1 , ..., ω r−1 , £X ω r , Y1 , ..., Ys )
−
T (ω 1 , ..., ω r , [X, Y1 ], Y2 , ..., Ys ) − ... − T (ω 1 , ..., ω r , Y1 , ..., Ys−1 , [X, Ys ]).
(3.73)
para ω 1 , ..., ω r ∈ X ∗ (M ) y Y1 , ..., Ys ∈ X (M ). En particular para ω ∈ X ∗ (M ),
tenemos
(£X ω)(Y ) = X[ω(Y )] − ω([X, Y ]),
Y ∈ X (M ).
(3.74)
En coordenadas locales x1 , ..., xn , sean X = X k ∂x∂ k , ω = dxi , Y =
£X
∂
∂xj
=
£X dxi
=
∂
∂xj
tenemos
∂
∂X k ∂
,
X, j = − j
∂x
∂x ∂xk
∂X k ∂
∂X i j
∂
X k k (δ i j ) + dxi
dxj =
dx ,
j
k
∂x
∂x ∂x
∂xj
y entonces encontramos de la ecuación (3.73) que
∂
∂
i1 ...ir
i1
ir
(£X T )
= (£X T ) dx , ..., dx , j1 , ..., js
j1 ...js
∂x
∂x
∂
= X k k T i1 ...ir j1 ...js
∂x
∂X i1 ki2 ...ir
∂X ir i1 ...ir−1 k
−
T
T
−
...
−
j
...j
j1 ...js
1
s
∂xk
∂xk
∂X k i1 ...ir
∂X k i1 ...ir
+
T
T
.
+
...
+
kj
...j
j1 ...js−1 k (3.75)
2
s
j
∂x 1
∂xjs
Observación: Comparando la ecuación (3.73) con la expresión (3.38) correspondiente para la derivada covariante,
=
(∇X T )(ω 1 , ..., ω r , Y1 , ..., Ys )
X T (ω 1 , ..., ω r , Y1 , ..., Ys )
−
T (∇X ω 1 , ω 2 , ..., ω r , Y1 , ..., Ys ) − ... − T (ω 1 , ..., ω r−1 , ∇X ω r , Y1 , ..., Ys )
−
T (ω 1 , ..., ω r , ∇X Y1 , Y2 , ..., Ys ) − ... − T (ω 1 , ..., ω r , Y1 , ..., Ys−1 , ∇X Ys ).
podemos notar lo siguiente:
(£X T )(ω 1 , ..., ω r , Y1 , ..., Ys )
=
(∇X T )(ω 1 , ..., ω r , Y1 , ..., Ys )
−
T ((£X − ∇X )ω 1 , ω 2 , ..., ω r , Y1 , ..., Ys )
−
... − T (ω 1 , ..., ω r , Y1 , ..., Ys−1 , (£X − ∇X )Ys ).
3.5. DERIVADA DE LIE
79
Ahora, si la conexión afı́n ∇ es libre de torsión, entonces
(£X − ∇X )Y = [X, Y ] − ∇X Y = −∇Y X
y
[(£X − ∇X )ω](Y ) = −ω ([X, Y ] − ∇X Y ) = ω(∇Y X)
para todo Y ∈ X (M ) y ω ∈ X ∗ (M ), y concluimos que
(£X T )(ω 1 , ..., ω r , Y1 , ..., Ys )
1
(3.76)
r
=
(∇X T )(ω , ..., ω , Y1 , ..., Ys )
−
T (ω 1 (∇X), ω 2 , ..., ω r , Y1 , ..., Ys ) − ... − T (ω 1 , ..., ω r (∇X), Y1 , ..., Ys )
+
T (ω 1 , ..., ω r , ∇Y1 X, Y2 , ..., Ys )... + T (ω 1 , ..., ω r , Y1 , ..., Ys−1 , ∇Ys X),
donde para ω ∈ X ∗ (M ), ω(∇X) se refiere al campo de covectores definido por
[ω(∇X)](Y ) := ω(∇Y X), Y ∈ X (M ). En coordenadas locales,
(£X T )i1 ...ir j1 ...js
= X k ∇k T i1 ...ir j1 ...js
i1
ki2 ...ir
k
i1 ...ir
− (∇k X )T
+
(∇j1 X )T
j1 ...js
kj2 ...js
(3.77)
ir
− ... − (∇k X )T
k
+ ... + (∇js X )T
i1 ...ir−1 k
i1 ...ir
j1 ...js
j1 ...js−1 k
,
es decir, podemos reemplazar todas las derivadas parciales por derivadas covariantes en la expresión (3.75) si la conexión afı́n ∇ es libre de torsión.
Ejemplo: Sea (M, g) una variedad pseudo-Riemanniana con conexión de LeviCivita ∇. Entonces la fórmula (3.76) y ∇g = 0 implican que
(£X g)(Y, Z) = g(∇Y X, Z) + g(Y, ∇Z X)
para todo X, Y, Z ∈ X (M ). Usando la identidad de Ricci (3.60) podemos reescribir
g(∇Y X, Z) = Y [g(X, Z)] − g(X, ∇Y Z) = Y [X (Z)] − X (∇Y Z) = (∇Y X )(Z),
e
e
e
y entonces
(£X g)(Y, Z) = (∇X )(Y, Z) + (∇X )(Z, Y )
(3.78)
e
e
para todo X, Y, Z ∈ X (M ), donde X := g(X, ·). En coordenadas locales,
e
(£X g)ij = ∇i Xj + ∇j Xi .
(3.79)
3.5.4.
La interpretación geométrica de la derivada de Lie
Empezamos con el resultado siguiente:
Lema 9 Sea M una variedad diferenciable, y sean X, Y ∈ X (M ) y λ ∈ R.
Entonces valen
(i) £λX+Y = λ£X + £Y .
80
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
(ii) [£X , £Y ] = £[X,Y ] .
Demostración. De acuerdo a la fórmula 3.73 es suficiente verificar que las
afirmaciones sean ciertas para funciones y campos vectoriales, dado que los operadores £λX+Y − λ£X − £Y y [£X , £Y ] − £[X,Y ] satisfacen las propiedades (i)–
(iv) del Lema 8. Obviamente, se satisface la afirmación (i) dado que £λX+Y f =
(λX + Y )[f ] = λ£X f + £Y f y £λX+Y Z = [λX + Y, Z] = λ£X Z + £Y Z para
todo f ∈ F(M ) y Z ∈ X (M ).
Para verificar (ii) tomamos primero una función f ∈ F(M ) y calculamos
[£X , £Y ]f = £X (Y f ) − £Y (Xf ) = [X, Y ]f = £[X,Y ] f.
Luego, tomamos un campo vectorial Z ∈ X (M ) y encontramos que
[£X , £Y ]Z
= £X [Y, Z] − £Y [X, Z]
=
[X, [Y, Z]] − [Y, [X, Z]]
=
−[Z, [X, Y ]]
=
£[X,Y ] Z,
donde hemos usado la identidad de Jacobi (ver el Lema 2) en el tercer paso.
Ahora llegamos a la interpretación geométrica de la derivada de Lie:
Teorema 7 Sea M una variedad diferenciable y sean X, Y ∈ X (M ). Sean ϕt
y ψ s los flujos asociados a X y Y , respectivamente. Entonces las siguientes
afirmaciones son equivalentes:
(i) [X, Y ] = 0.
(ii) £X ◦ £Y = £Y ◦ £X .
(iii) ϕt ◦ ψ s = ψ s ◦ ϕt (donde definido)
En particular, los campos vectoriales X y Y conmutan si y sólo si los flujos
asociados ϕt y ψ s conmutan.
Demostración. La equivalencia de (i) y (ii) es una consecuencia directa del
Lema 9(ii). Ahora vamos a demostrar la implicación (iii) ⇒ (i). Sea p ∈ M y
supongamos que
ϕt ◦ ψ s (p) = ψ s ◦ ϕt (p)
para todo |t| y |s| suficientemente pequeños. Derivando con respecto a t y evaluando en t = 0 obtenemos
Xψs (p) = dψps (Xp ),
de acuerdo a la definición de X y de la diferencial de ψ s . Entonces,
Xp = (dψps )−1 Xψs (p) = [(ψ s )∗ X]p
3.5. DERIVADA DE LIE
81
para todo |s| suficientemente pequeños. Esto implica que £Y X = [Y, X] = 0 de
acuerdo a la definición 36 de la derivada de Lie.
Finalmente, demostramos la implicación (i) ⇒ (iii). Supongamos que [X, Y ] =
0. Entonces, vale para todo p ∈ M y t ∈ Ip
d s+t ∗ d t ∗ (ϕ ) Y p =
(ϕ ) Y p dt
ds
s=0
d
=
(ϕt )∗ ◦ (ϕs )∗ Y ds
p s=0
t ∗
= (ϕ ) (£X Y ) p
=
0,
(3.80)
donde usamos la identidad (ϕs+t )∗ = (ϕs ◦ ϕt )∗ = (ϕt )∗ ◦ (ϕs )∗ en el segundo
paso. Ahora sean (t, p) ∈ D fijos. Definimos γ s (p) := ϕ−t ◦ ψ s ◦ ϕt (p) para |s|
suficientemente pequeño, de tal manera que ϕt ◦ γ s (p) = ψ s ◦ ϕt (p). Derivando
con respecto a s obtenemos
d s
t
dϕγ s (p)
γ (p) = Yψs (ϕt (p)) = Yϕt (γ s (p)) ,
ds
de tal manera que
d s
γ (p) = (dϕtγ s (p) )−1 Yϕt (γ s (p)) = (ϕt )∗ Y γ s (p) = Yγ s (p) ,
ds
de acuerdo a la ecuación (3.80). Dado que γ 0 (p) = p, s 7→ γ s (p) es una curva
integral al campo vectorial Y a través del punto p. Por unicidad de las curvas
integrales, γ s (p) = ψ s (p), lo que demuestra la afirmación.
Definición 37 Sean M una variedad diferenciable, X ∈ X (M ) un campo vectorial con flujo asociado ϕt y T ∈ T r s (M ) un campo tensorial. Entonces T se
llama invariante bajo el flujo ϕt si
t ∗ (ϕ ) T p = Tp
para todo (t, p) ∈ D.
Observaciones
1. Usando la definición de la derivada de Lie y un argumento similar a la
ecuación (3.80) obtenemos que T es invariante bajo ϕt si y sólo si
£X T = 0.
2. Sea M una variedad diferenciable de dimensión n, y sean X ∈ X (M ) y
Σ ⊂ M una subvariedad de dimensión n − 1 transversal a X, es decir,
82
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Xp ∈
/ Tp Σ para todo p ∈ Σ (en particular, esto implica que X 6= 0 en una
vecindad de Σ). Sea (V, ψ) una carta local de Σ con coordenadas locales
asociadas x2 , x3 , ..., xn tal que V ⊂ Σ es acotado. Sea ε > 0 suficientemente
pequeño tal que (t, p) ∈ D para todo |t| < ε y p ∈ V . Consideramos el
mapeo
F : (−ε, ε) × ψ(V ) → M,
(x1 , x2 , ..., xn ) 7→ ϕx1 ◦ ψ −1 (x2 , ..., xn ),
donde ϕt denota el flujo de X. Las propiedades del flujo y la transversalidad de X implican que F : (−ε, ε) × ψ(V ) → U := F ((−ε, ε) × ψ(V )) es
un difeomorfismo si ε > 0 es suficientemente pequeño. Entonces la inversa
Φ := F −1 : U → (−ε, ε) × ψ(V ), q 7→ (x1 , x2 , ..., xn ) = F −1 (q) de este mapeo define una carta local (U, Φ) de M tal que Φ(Σ∩U ) = {(0, x2 , ..., xn ) ∈
Φ(U )}. Además, sean p ∈ U y Φ(p) = (x1 , x2 , ..., xn ). Para |t| suficiente1
mente pequeño, Φ−1 (Φ(p) + te1 ) = ϕx +t ◦ ψ −1 (x2 , ..., xn ) = ϕt (p) es la
∂ de tal manera que
curva a través de p con vector tangente ∂x
1
p
∂ d
t
=
Xp [f ] =
f ◦ ϕ (p)
[f ]
dt
∂x1 p
t=0
para todo f ∈ F(M ). Concluimos que en las coordenadas locales (x1 , x2 , ..., xn )
X=
∂
,
∂x1
es decir, las componentes de X son simplemente (X i ) = (1, 0, ..., 0). En
particular, la ecuación (3.75) implica que en estas coordenadas
(£X T )i1 ...ir j1 ...js =
∂ i1 ...ir
T
j1 ...js
∂x1
para un campo tensorial T ∈ T r s (M ).
3. De manera más general podemos preguntar si dado dos campos vectoriales X, Y ∈ X (M ) existen coordenadas locales (x1 , x2 , ..., xn ) sobre un
∂
∂
subconjunto abierto U ⊂ M tales que X = ∂x
1 y Y = ∂x2 . Obviamente,
tales coordenadas solamente pueden existir si Xp y Yp son linealmente
independientes y si [X, Y ]p = 0 en cada punto p ∈ U . Resulta que estas
condiciones son necesarias y suficientes:
Teorema 8 Sea M una variedad diferenciable, y sea {X1 , X2 , ..., Xm } un
conjunto de campos vectoriales C ∞ -diferenciables que satisface
(i) Los vectores X1p , X2p , ..., Xmp son linealmente independientes para
cada p ∈ M .
(ii) [Xi , Xj ] = 0 para todo 1 ≤ i < j ≤ m.
3.6. CURVATURA
83
Entonces, dado p ∈ M existe una carta local (U, Φ) tal que p ∈ U y tal que
Xi =
∂
,
∂xi
i = 1, 2, ..., m.
Demostración. Generalizando los argumentos de la observación previa
y usando el resultado del Teorema 7 que implica que los flujos asociados
a Xi y Xj conmutan.
3.6.
Curvatura
Definición 38 Sea (M, ∇) una variedad diferenciable con conexión afı́n ∇. La
curvatura asociada a ∇ está definida por el mapeo R : X (M ) × X (M ) ×
X (M ) → X (M ) dado por
R(X, Y )Z := ∇X (∇Y Z) − ∇Y (∇X Z) − ∇[X,Y ] Z,
X, Y, Z ∈ X (M ).
Notamos que R(Y, X)Z = −R(X, Y )Z es antisimétrico en X y Y , y que
R(X, Y )Z es lineal en X, Y y Z. Además, si f ∈ F(M ), entonces
R(f X, Y )Z
=
f ∇X ∇Y Z − ∇Y (f ∇X Z) − ∇f [X,Y ]−Y (f )X Z
=
f ∇X ∇Y Z − f ∇Y ∇X Z − Y (f )∇X Z − f ∇[X,Y ] Z + Y (f )∇X Z
=
f R(X, Y )Z,
y
R(X, Y )(f Z)
= ∇X [f ∇Y Z + Y (f )Z] − ∇Y [f ∇X Z + X(f )Z]
− f ∇[X,Y ] Z − ([X, Y ]f )Z
= f ∇X ∇Y Z + X(f )∇Y Z + Y (f )∇X Z + [XY (f )]Z
− f ∇Y ∇X Z − Y (f )∇X Z − X(f )∇Y Z − [Y X(f )]Z
− f ∇[X,Y ] Z − ([X, Y ]f )Z
= f R(X, Y )Z.
Entonces R define un campo tensorial R̄ ∈ T 1 3 (M ) a través de
R̄(ω, Z, X, Y ) := ω(R(X, Y )Z),
ω ∈ X ∗ (M ),
X, Y, Z ∈ X (M ).
∂
∂
Y = ∂x
Sean x1 , x2 , ..., xn coordenadas locales, y ω = dxl , X =
j y Z = ∂xk .
Entonces,
∂
∂
∂
−
∇
−
∇
R̄l kij = dxl ∇ ∂ i ∇ ∂ j
∂ ∇ ∂
[ ∂x∂ i , ∂x∂ j ] ∂xk
∂x
∂xi ∂xk
∂x ∂xk
∂xj
∂
∂
= dxl ∇ ∂ i Γr jk r − ∇ ∂ j Γr ik r
∂x
∂x
∂x
∂x
r
∂Γ jk
∂
∂
∂Γr ik
∂
∂
r
s
r
s
= dxl
·
+
Γ
Γ
−
·
−
Γ
Γ
,
jk
ir
ik
jr
∂xi
∂xr
∂xs
∂xj ∂xr
∂xs
∂
∂xi ,
84
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
de tal manera que
R̄l kij =
∂Γl ik
∂Γl jk
l
r
−
Γ
+
Γ
− Γr ik Γl jr .
ir
jk
∂xi
∂xj
(3.81)
Definición 39 Sea {X1 , X2 , ..., Xn } una base local de T M y {θ1 , θ2 , ..., θn } la
base local dual correspondiente de T ∗ M . El tensor de Ricci está definido a
través de la siguiente contracción del tensor de curvatura:
Ric(Z, Y ) := R̄(θi , Z, Xi , Y ) = θi (R(Xi , Y )Z),
Y, Z ∈ X (M ).
(3.82)
Como se demuestra en un ejercicio, Ric es independiente de la base {X1 , ..., Xn }
y define un campo tensorial del tipo (0, 2). Con respecto a coordenadas locales
∂
i
i
x1 , x2 , ..., xn podemos elegir Xi = ∂x
i y θ = dx , y obtenemos que
∂
∂
Rickj = Ric
,
= R̄i kij
∂xk ∂xj
∂Γi ik
∂Γi jk
r
i
+
Γ
Γ
−
− Γr ik Γi jr .
(3.83)
=
jk
ir
∂xi
∂xj
Muchas veces, se usa la notación Rkj para denotar las componentes Rickj del
tensor de Ricci, y también la notación Rl kij (sin la barra) para denotar las
componentes del campo tensorial R̄.
Para formular el próximo resultado necesitamos lo siguiente: Sea A : X (M )s →
X (M ) un mapeo que es F(M )-lineal en todos sus argumentos, es decir, que satisface
A(X1 + f Y, X2 , ..., Xs ) = A(X1 , X2 , ..., Xs ) + f A(Y, X2 , ..., Xs )
para todos X1 , ..., Xs , Y ∈ X (M ) y todo f ∈ F(M ) y lo mismo para cada
argumento de A. Entonces podemos definir un campo tensorial asociado Ā del
tipo (1, s) a través de
Ā(ω, X1 , ..., Xs ) := ω(A(X1 , ..., Xs )),
ω ∈ X ∗ (M ),
X1 , ..., Xs ∈ X (M ).
Por ejemplo, el tensor de torsión define un campo tensorial del tipo (1, 2) y el
tensor de curvatura uno del tipo (1, 3). Definimos la derivada covariante ∇Y A
de A con respecto de un campo vectorial Y ∈ X (M ) a través de la condición
ω [(∇Y A)(X1 , ..., Xs )] = (∇Y Ā)(ω, X1 , ..., Xs )
para todo ω ∈ X ∗ (M ) y todos X1 , ..., Xs ∈ X (M ). Usando (3.38) encontramos
que
ω [(∇Y A)(X1 , ..., Xs )] = Y Ā(ω, X1 , ..., Xs ) − Ā(∇Y ω, X1 , ..., Xs )
−
Ā(ω, ∇Y X1 , ..., Xs ) − ... − Ā(ω, X1 , ..., ∇Y Xs )
=
Y [ω(A(X1 , ..., Xs ))] − (∇Y ω)(A(X1 , ..., Xs ))
−
ω(A(∇Y X1 , ..., Xs )) − ... − ω(A(X1 , ..., ∇Y Xs )).
3.6. CURVATURA
85
Por otro lado, (3.38) también implica que
(∇Y ω)(Z) = Y [ω(Z)] − ω(∇Y Z)
para todo Z ∈ X (M ). Entonces,
(∇Y A)(X1 , ..., Xs )
= ∇Y (A(X1 , ..., Xs ))
− A(∇Y X1 , ..., Xs ) − ... − A(X1 , ..., ∇Y Xs ) (3.84)
para todos X1 , ..., Xs , Y ∈ X (M ).
Teorema 9 (identidades de Bianchi) Sea (M, ∇) una variedad diferenciable con conexión afı́n ∇, y sean T y R la torsión y curvatura asociados a ∇,
respectivamente. Entonces,
X
X
R(X, Y )Z =
[(∇X T )(Y, Z) + T (T (X, Y ), Z)] , (3.85)
(XY Z)
X
(XY Z)
(∇X R)(Y, Z)
=
(XY Z)
X
−
R (T (X, Y ), Z)
(3.86)
(XY Z)
para todos X, Y, Z ∈ X (M ), donde
P
denota la suma cı́clica sobre X, Y y
(XY Z)
Z.
Observación: Si la conexión ∇ es simétrica (T = 0), las expresiones a la derecha
de (3.85) y (3.86) son ceros. En particular, esto ocurre para la conexión de LeviCivita.
Demostración del Teorema 9. Para demostrar la primera ideantidad (3.85)
tomamos X, Y, Z ∈ X (M ). Entonces,
X
X R(X, Y )Z =
∇X ∇Y Z − ∇Y ∇X Z − ∇[X,Y ] Z
(XY Z)
(XY Z)
=
X ∇X ∇Y Z − ∇X ∇Z Y − ∇[Y,Z] X
(XY Z)
=
X ∇X (T (Y, Z) + [Y, Z]) − ∇[Y,Z] X
(XY Z)
=
X
{∇X (T (Y, Z)) + T (X, [Y, Z]) + [X, [Y, Z]]}
(XY Z)
=
X
{(∇X T )(Y, Z) + T (∇X Y, Z) + T (Y, ∇X Z) + T (X, [Y, Z])}
(XY Z)
=
X
{(∇X T )(Y, Z) + T (∇X Y − ∇Y X − [X, Y ], Z)}
(XY Z)
=
X
(XY Z)
{(∇X T )(Y, Z) + T (T (X, Y ), Z)} ,
86
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
donde hemos usado la definición de la torsión en el tercer, cuarto y último paso,
la identidad de Jacobi (ver el Lema 2) en el quinto paso y el resultado (3.84) en
el quinto paso.
Ejercicio 9. Demuestra la segunda identidad de Bianchi (3.86).
3.6.1.
La interpretación geométrica de la curvatura
A continuación, vamos a dar una interpretación geométrica de la curvatura
basada en el transporte paralelo. Sean X, Y ∈ X (M ) dos campos vectoriales
diferenciables que conmutan, [X, Y ] = 0. Como vimos en el Teorema 7, esto
implica que los flujos correspondientes, ϕt y ψ s , conmutan. Sea p ∈ M fijo,
sean γs (t) := ϕt (ψ s (p)) las curvas integrales a X a través del punto ψ s (p), y
µt (s) := ψ s (ϕt (p)) las curvas integrales a Y a través del punto ϕt (p). Consideramos el transporte paralelo de un vector tangente Zp ∈ Tp M a lo largo de
un paralelogramo pqrs generado por dichas curvas integrales, donde q := γ0 (ε),
r := µε (δ) = γδ (ε) y s := µ0 (δ). Entonces tenemos el siguiente resultado:
Lema 10 Sea (M, ∇) una variedad diferenciable con conexión afı́n. Sean X, Y ∈
X (M ) tales que [X, Y ] = 0. Con la notación de arriba, denotamos por
(µ )
Zp0 := Gp (ε, δ)Zp ,
(γ )
(µ )
(γ )
Gp (ε, δ) := τ0,δ0 ◦ τ0,εδ ◦ τδ,0ε ◦ τε,00 .
(3.87)
el transporte paralelo del vector tangente Zp ∈ Tp M a lo largo del paralelogramo
pqrs.
Entonces vale para todo ε, δ ∈ R tal que h := máx{|ε|, |δ|} es suficientemente
pequeño,
Gp (ε, δ) = I − εδ R(X, Y )|p + O(h3 ).
(3.88)
Demostración. Primero, notamos que la ecuación (3.87) es equivalente a
(γ )
(µ )
(µ )
(γ )
τε,0δ ◦ τδ,00 Zp0 = τδ,0ε ◦ τε,00 Zp
(3.89)
Para calcular ambos lados de esta ecuación, suponemos que h := máx{|ε|, |δ|}
es suficientemente pequeño, de tal manera que existan los flujos y que podamos
suponer que el paralelogramo pqrs se encuentre dentro de una carta local (U, φ).
Si X es paralelo a Y , Gp (ε, δ) = I es trivial y R(X, Y ) = 0. Entonces podemos
suponer que X no es paralelo a Y . En este caso, el Teorema 8 garantiza que
podemos encontrar coordenadas locales x1 , x2 , ..., xn sobre U tales que
X=
∂
,
∂x1
Y =
∂
.
∂x2
De acuerdo a la fórmula (3.41) para el transporte paralelo, las componentes del
(γ )
campo vectorial V (t) := τt,00 Zp satisfacen
V̇ k (t)
k
V (0)
= M k j (t)V j (t),
= Zpk ,
0 < t < ε,
3.6. CURVATURA
87
donde M k j (t) := −Γk 1j (γ0 (t)). Entonces,
V k (ε) = Zpk + εM k j (0)Zpj +
i
ε2 h k
Ṁ j (0) + M k i (0)M i j (0) Zpj + O(ε3 ). (3.90)
2
(µ )
De la misma manera, las componentes del campo vectorial V (ε, δ) := τδ,0ε V (ε) =
(µ ) (γ )
τδ,0ε τε,00 Zp
satisfacen
V k (ε, δ) = V k (ε) + δN k j (0)V j (ε) +
i
δ2 h k
Ṅ j (0) + N k i (0)N i j (0) V j (ε) + O(δ 3 ),
2
donde N k j (s) := −Γk 2j (µε (s)). Introduciendo (3.90) en esta ecuación y usando
el teorema de Taylor para encontrar
∂ k k
k
k
N j (0) = −Γ 2j (µ0 (ε)) = −Γ 2j (p) − ε
Γ 2j + O(ε2 )
∂x1
p
obtenemos que
V k (ε, δ)
= Zpk − εΓk 1j (p)Zpj − δΓk 2j (p)Zpj
ε2 ∂ k
k
m
Γ 1j − Γ 1m Γ 1j Zpj
−
2 ∂x1
p
2
δ
∂ k
Γ 2j − Γk 2m Γm 2j Zpj
−
2 ∂x2
p
∂ k
− εδ
Γ 2j − Γk 2m Γm 1j Zpj + O(h3 ).
∂x1
p
Al intercambiar ε con δ, 1 con 2 y Z con Z 0 , obtenemos la expresión corres(γ )
(µ )
pondiente para las componentes del vector τε,0δ ◦ τδ,00 Zp0 . Introduciendo los
resultados en la ecuación (3.89) obtenemos
(Zp0 )k
=
Zpk − εδ
∂ k
k
m
Γ
−
Γ
Γ
−
(1
↔
2)
Zpj + O(h3 ).
2j
2m
1j
∂x1
p
= Zpk − εδ R̄k j12 (p)Zpj + O(h3 ),
donde hemos usado la expresión (3.81) para las componentes del tensor de curvatura.
También podemos interpretar el resultado del lema de la siguiente forma:
Definición 40 Sea p ∈ M , y sea Cp el conjunto de todos los lazos cerrados en
p,
Cp := {γ : [0, 1] → M : γ es una curva tal que γ(0) = γ(1) = p}.
88
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
(γ)
Entonces para cada curva γ ∈ Cp el transporte paralelo τ1,0 : Tp M → Tp M
define una transformación lineal e invertible sobre el espacio tangente Tp M en
p. El conjunto
(γ)
H(p) := {τ1,0 ∈ GL(n, R) : γ ∈ Cp }
forma un subgrupo de GL(n, R) que se llama el grupo de holonomı́a de
(M, ∇) en el punto p.
Ejercicio 10. Sean p, q ∈ M , y sea γ una curva que conecta p con q: γ(0) = p,
γ(1) = q. Demuestre que
(γ)
(γ)
H(q) = τ1,0 H(p)τ0,1 .
Entonces los dos grupos H(p) y H(q) son isomorfos si p y q son en la misma
componente conexa de M .
Para un paralelogramo pqrs generado por dos campos vectoriales X y Y que
conmutan demostramos en el Lema 10 que el elemento correspondiente Gp (ε, δ)
de H(p) satisface
∂ 2 Gp (ε, δ) = − R(X, Y )|p .
∂ε∂δ ε=δ=0
De manera más general, se puede demostrar el siguiente
Teorema 10 (caso particular del teorema de Ambrose-Singer) Sea (M, ∇)
una variedad diferenciable con conexión afı́n. Sea p ∈ M . Entonces el álgebra
de Lie del grupo H(p) de holonomı́a en el punto p es
{ R(X, Y )|p : X, Y ∈ Tp M }.
Demostración. Ver, por ejemplo [9].
Una consequencia directa de este teorema es5
Corolario 1 Sea (M, ∇) una variedad diferenciable con conexión afı́n ∇. Entonces el transporte paralelo es independiente de la curva si y sólo si el tensor
de curvatura es cero.
3.6.2.
La curvatura asociada a la conexión de Levi-Civita
Si ∇ es la conexión de Levi-Civita correspondiente a una métrica pseudoRiemanniana, el tensor de curvatura posee simetrı́as adicionales:
Teorema 11 Sea (M, g) una variedad (pseudo-) Riemanniana, y sea ∇ la conexión de Levi-Civita correspondiente. Definimos el siguiente campo tensorial
de tipo (0, 4):
R(W, Z, X, Y ) := g(W, R(X, Y )Z),
5 Una
X, Y, Z, W ∈ X ∗ (M ).
demostración directa del corolario también se puede encontrar en [1].
(3.91)
3.6. CURVATURA
89
Entonces R satisface las siguientes simetrı́as:
R(W, Z, X, Y )
= −R(W, Z, Y, X)
(3.92)
R(W, Z, X, Y )
= −R(Z, W, X, Y ),
(3.93)
R(W, Z, X, Y )
= R(X, Y, W, Z),
(3.94)
para todo X, Y, Z, W ∈ X (M ).
Demostración. La primera idenditad (3.92) es una consecuencia directa de la
definición de R. Para demostrar (3.93) partimos de la identidad de Ricci (3.60),
Y [g(Z, Z)] = 2g(Z, ∇Y Z).
Usando la identidad de Ricci otra vez encontramos que
XY [g(Z, Z)] = 2g(Z, ∇X ∇Y Z) + 2g(∇X Z, ∇Y Z).
Usando este resultado y una vez más la identidad de Ricci obtenemos
2g(Z, ∇[X,Y ] Z) = [X, Y ][g(Z, Z)] = 2g(Z, ∇X ∇Y Z − ∇Y ∇X Z)
y entonces
R(Z, Z, X, Y ) = g(Z, R(X, Y )Z) = 0
para todos X, Y, Z ∈ X (M ). Reemplazando Z por Z = U + W , U, W ∈ X (M ),
esta ecuación implica que
R(U, W, X, Y ) + R(W, U, X, Y ) = 0.
Para demostrar (3.94) usamos la primera identidad de Bianchi (3.85), notando que T = 0, y obtenemos
g(W, R(X, Y )Z) = −g(W, R(Y, X)Z) = g(W, R(X, Z)Y ) + g(W, R(Z, Y )X)
(3.95)
para todos X, Y, Z, W ∈ X (M ). Usando (3.93) y otra vez la primera identidad
de Bianchi también encontramos que
g(W, R(X, Y )Z) = −g(Z, R(X, Y )W ) = g(Z, R(Y, W )X) + g(Z, R(W, X)Y ).
(3.96)
Sumando (3.95) y (3.96) obtenemos que
2R(W, Z, X, Y )
=
g(W, R(X, Z)Y ) + g(Z, R(Y, W )X)
+
g(W, R(Z, Y )X) + g(Z, R(W, X)Y ).
Puesto que R(X, Y ) = −R(Y, X) y dado (3.93) se ve que el lado derecho es
invariante bajo el intercambio de los pares (X, Y ) ↔ (Z, W ). Esto concluye la
demostración de (3.94).
90
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Con respecto a coordenadas locales x1 , x2 , ..., xn las simetrı́as del tensor de
curvatura correspondiente a la conexión de Levi-Civita se pueden resumir de la
siguiente manera:
X
Rijkl = 0
(primera identidad de Bianchi (3.85)),
(jkl)
X
∇m Rijkl = 0
(segunda identidad de Bianchi (3.86) ),
(klm)
Rijkl = −Rijlk
(de (3.92)),
Rijkl = −Rjikl
(de (3.93)),
Rijkl = Rklij
donde Rijkl = Rijkl = gim R̄
(de (3.94)),
m
jkl .
Observaciones
1. La simetrı́a (3.94) implica que el tensor de Ricci es simétrico: De su definición (3.82) encontramos que
Rkj = Ri kij = δ i l Rl kij = g il Rlkij = g il Rijlk = Rjk .
Como esta ecuación vale para cualquier sistema local de coordenadas,
tenemos que Ric(X, Y ) = Ric(Y, X) para todos X, Y ∈ X (M ).
2. Sea p ∈ M un punto fijo de la variedad, y sean x1 , ..., xn coordenadas
normales con respecto a p (tales que Γk ij (p) = 0). De la expresión (3.62)
para los sı́mbolos de Christoffel,
1 kl
∂
∂
∂
k
Γ ij = g
gjl +
gil −
gij ,
2
∂xi
∂xj
∂xl
encontramos que en el punto p,
∂2
∂2
∂2
∂Γk ij 1 kl
gjl +
gil −
gij
= g
.
∂xs p
2
∂xi ∂xs
∂xj ∂xs
∂xl ∂xs
p
Entonces de la expresión (3.81) obtenemos que
1 kl
∂2
∂2
∂2
k
R jsi (p) =
g
g
+
g
−
gij
jl
il
2
∂xi ∂xs
∂xj ∂xs
∂xl ∂xs
∂2
∂2
∂2
− s i gjl −
g
+
gsj
.
sl
∂x ∂x
∂xj ∂xi
∂xl ∂xi
p
o
∂2
1
∂2
∂2
∂2
Rljsi (p) =
gil −
gij −
gsl +
gsj .
2 ∂xj ∂xs
∂xl ∂xs
∂xj ∂xi
∂xl ∂xi
p
(3.97)
Esta expresión nos permite verificar las simetrı́as algebraicas (3.85), (3.93)
y (3.94) de manera directa.
3.6. CURVATURA
91
3. Se puede mostrar que las simetrı́as algebraicas (3.85), (3.93) y (3.94) del
tensor de curvatura correspondiente a la conexión de Levi-Civita sobre una
variedad diferenciable (M, g) de dimensión n implican que Rklij solamente
posee
n2 (n2 − 1)
12
componentes independientes. En particular, para n = 2, Rklij está enteramente determinado por el escalar de Ricci, R := g lj Rlj = g lj Ri lij ,
Rklij =
1
(gki gjl − gli gjk ) R
2
(ver el ejercicio abajo). Para n = 3 el tensor de curvatura posee 6 grados
de libertades que están contenidos en el tensor de Ricci, y
Rklij = gki Rjl − gli Rjk + glj Rik − gkj Ril −
1
(gki gjl − gli gjk ) R.
2
Para n = 4 el número independientes de componenentes de Rklij es 20.
10 de ellas están contenidas en el tensor de Ricci.
4. La segunda identidad de Bianchi y las simetrı́as algebraicas del tensor de
curvatura implican la siguiente identidad para el tensor de Ricci:
1
div Ric − ∇R = 0.
2
(3.98)
Para demostrar esta identidad contraemos la segunda identidad de Bianchi,
∇m Ri jkl + ∇k Ri jlm + ∇l Ri jmk = 0
sobre i = k para obtener
∇m Rjl + ∇i Ri jlm − ∇l Rjm = 0.
Contrayendo ambos lados con g mj y usando el hecho de que ∇l g jm = 0
encontramos que
∇j Rjl + ∇i Ri l − ∇l R = 0,
lo que demuestra (3.98). Para lo que sigue, definimos el tensor de Einstein G ∈ T 0 2 (M ) a través de
G := Ric −
R
g.
2
Con esta definición, las identidades de Bianchi (3.98) contraidas son simplemente
div G = 0.
(3.99)
Como vamos a ver en el capı́tulo 5 esta identidad juega un papel fundamental para el acople de la gravitación a la materia.
92
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Ejercicio 11. Sea M una variedad diferenciable bidimensional con métrica
pseudo-Riemanniana g.
(a) Demuestre que siempre existen coordenadas locales x, y sobre M de tal
manera que la métrica tiene la forma
g = εA(x, y)2 dx2 + B(x, y)2 dy 2 ,
donde A y B son funciones C ∞ estrictamente positivas, y ε = ±1, dependiendo de la signatura de g.
(b) Calcule los sı́mbolos de Christoffel correspondientes a la métrica g.
(c) Muestre que el tensor de curvatura tiene la forma
Rm lij = κ (δ m i gjl − δ m j gil ) .
La función κ se llama la curvatura de Gauss.
(d) Muestre que
" #
Bx
Ay
1
ε
+
.
κ=−
AB
A x
B y
2
(e) Calcule κ para el caso de la esfera SR
con radio R > 0.
(f) Calcule κ para la métrica6
2M
g̃ = − 1 −
r
3.7.
2M
dt + 1 −
r
2
−1
dr2 ,
t ∈ R,
r > 2M.
Apéndice: Derivaciones
En este apéndice analizamos una definición alternativa para un vector tangent y mostramos que es equivalente a la definición dada en la sección 3.2.1.
Definición 41 Sea M una variedad diferenciable de dimensión n, y sea p ∈ M .
Denotamos con Dp la clase de todas las funciones f : M → R que son C ∞ –
diferenciables en una vecindad de p. Una derivación en el punto p es un
mapeo Dp → R que satisface
(i) Xp [af + bg] = aXp [f ] + bXp [g] para todos a, b ∈ R y f, g ∈ Dp (linealidad),
(ii) Xp [f · g] = f (p)Xp [g] + g(p)Xp [f ] para todos f, g ∈ Dp (regla de Leibnitz).
6 Como vamos a ver en el capı́tulo 6, la métrica g̃ describe la geometrı́a radial del exterior
de una estrella esfericamente simétrica.
3.7. APÉNDICE: DERIVACIONES
93
Si aplicamos la regla de Leibnitz a las funciones constantes f = g = 1 igual
a uno obtenemos Xp [1] = Xp [1] + Xp [1]. Con la linealidad, esto implica que
Xp [f ] = 0 para una función f constante.
Dado dos derivaciones Xp y Yp en el punto p, y dado un número real a ∈ R
podemos definir nuevas derivaciones Xp + Yp y aXp a través de
(Xp + Yp )[f ]
(aXp )[f ]
:= Xp [f ] + Yp [f ],
:= aXp [f ],
para f ∈ Dp . Con esto, el conjunto de las derivaciones en p forma un espacio
vectorial real.
Ahora mostramos que cada derivación Xp en p es un vector tangente en
p en el sentido de la sección 3.2.1. Para ver esto, probamos que si Xp es una
derivación en p se puede escribir como
∂ ,
Xp = Xpi
∂xi p
con respecto a una carta local (U, φ) tal que p ∈ U . Entonces consideramos la
derivación
∂ Yp := Xp − Xpi
,
Xpi := Xp [xi ], i = 1, 2, ..., n,
∂xi p
y vamos a demostrar que Yp = 0 es la derivación trivial. Notamos primero que
por contrucción, Yp [xi ] = 0 para todo i = 1, 2, ..., n. Luego, usamos
Lema 11 Sean ε > 0 y V = Bε (y) la bola abierta con radio en Rn centrada
en el punto y ∈ Rn , y sea f : V → R una función que es C ∞ –diferenciable.
Entonces existen funciones h1 , h2 , ..., hn : V → R que son C ∞ –diferenciables
tales que
f (x) = f (y) + hi (x)(xi − y i ),
x = (x1 , x2 , ..., xn ) ∈ V.
Demostración. Sea x ∈ V , entonces
Z1
f (x) − f (y)
d
f (y 1 + t(x1 − y 1 ), ..., y n + t(xn − y n ))dt
dt
=
0
=
i
i
i
i
Z1
(x − y )
∂
f (y 1 + t(x1 − y 1 ), ..., y n + t(xn − y n ))dt
∂xi
0
≡ (x − y )hi (x),
donde hemos definido las funciones C ∞ –diferenciables hi (x) :=
R1
0
∂
1
∂xi f (y
+
t(x1 − y 1 ), ..., y n + t(xn − y n ))dt, i = 1, 2, ..., n. Esto concluye la demostración
del lema.
94
CAPÍTULO 3. GEOMETRÍA DIFERENCIAL
Ahora sean f ∈ Dp , y := φ(p) ∈ Rn y F := f ◦ φ−1 : φ(U ) ⊂ Rn → R.
De acuerdo al lema que acabamos de demostrar existe ε > 0 y funciones C ∞ –
diferenciables h1 , ..., hn : Bε (y) → R tales que F (x) = F (y) + hi (x)(xi − y i )
para todo x ∈ Bε (y). Entonces f (q) = f (p) + hi (φ(q))(φ(q)i − φ(p)i ) para todo
q ∈ U , y usando la linealidad y la regla de Leibnitz encontramos que
Yp [f ] = Yp [F ◦ φ] = Yp [f (p)] + hi (φ(p))Yp [xi ] = 0,
lo que queriamos demostrar.
Capı́tulo 4
El principio de equivalencia
En el capı́tulo 2 describimos una teorı́a escalar relativista de la gravitación
(una teorı́a con espı́n 0), y también consideramos la posibilidad de una teorı́a
vectorial (una teorı́a con espı́n 1) en el ejercicio 4. Como vimos, estas teorı́as
deben ser descartadas por razones experimentales o teóricas. En este capı́tulo
empezamos con la discusión de la teorı́a de relatividad general de Einstein. Como
vamos a ver en el capı́tulo 7 esta teorı́a se reduce a una teorı́a relativista con
espı́n 2 en el lı́mite de campos débiles. En los capı́tulos 6 y 7 analizaremos varios
experimentos que confirman la relatividad general, por lo menos en el régimen
de campos gravitacionales débiles.
Uno de los ingredientes más importantes de la relatividad general es el principio de equivalencia. Este principio lleva de manera natural a la formulación
cinemática de la teorı́a y determina cómo la materia se acopla a un campo
gravitacional externo.
4.1.
La formulación fı́sica del principio de equivalencia
La relatividad general se basa en los dos postulados siguientes:
la universalidad de la gravitación
el principio de equivalencia
Universalidad de la gravitación (Galilei)
El movimiento de un cuerpo de prueba en un campo gravitacional es independiente de su masa o composición (despreciando las interacciones del espı́n y del
momento cuadrupolar de la partı́cula con el campo gravitacional).
Como vimos en la sección 1.2, en la teorı́a de Newton la universalidad de la
gravitación es una consecuencia de la igualdad de la masa inercial con la masa
95
96
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
gravitacional. Esta igualdad se ha verificado de manera experimental hasta una
precisión relativa de 10−12 .
El principio de equivalencia (Einstein)
En un campo gravitacional arbitrario, ningún experimento local puede distinguir
un sistema en caı́da libre no-rotante (un sistema inercial local) de un sistema
en movimiento uniforme en la ausencia de un campo gravitacional.
En otras palabras, siempre es posible hacer desaparecer el campo gravitacional al nivel local mediante una transformación de coordenadas. Ejemplos de
sistemas inerciales locales son un ascensor en caı́da libre no-rotante o una nave
espacial en una órbita terrestre. En ambos casos existe un campo gravitacional
(el campo gravitacional terrestre), pero ni las personas que se encuentran dentro del ascensor ni los astronautas pueden medirlo con experimentos locales (en
la sección siguiente definimos de manera mas precisa lo que significa “local”).
Por otro lado, un sistema en reposo sobre la superficie de la tierra no es un
sistema inercial local; observadores en este sistema miden un campo gravitacional no trivial. Al pasar al sistema del ascensor es posible deshacerse del campo
gravitacional al nivel local. Sin embargo, no es posible deshacerce del campo
gravitacional al nivel global, porque la órbita de la nave espacial constituye una
trayectoria cerrada.
Ejemplo: Considere una partı́cula Newtoniana en un campo gravitacional homogéneo con aceleración g:
mi ẍ = mg g.
La universalidad implica que mi = mg , entonces la ecuación de movimiento se
reduce a ẍ = g. Con respecto al sistema de referencia acelerado y = x − 21 gt2
tenemos que
ÿ = 0.
Entonces, en la teorı́a Newtoniana, el principio de equivalencia es una consecuencia de la universalidad de la gravitación. En general, esto no tiene que ocurrir
como lo muestra el ejercicio que sigue.
Ejercicio 12. Considere una partı́cula de carga q y masa inercial m en un
campo eléctrico homogéneo E = E(1, 0, 0) con dato inicial
xµ (τ = 0) = 0,
(uµ (τ = 0)) = γ0 (c, 0, v0 , 0),
donde γ0 = (1 − v02 /c2 )−1/2 .
(a) Use las ecuaciones relativistas de movimiento
m
duµ
q
= F µν uν
dτ
c
para calcular el tiempo td necesario para que la partı́cula se mueva de
x = 0 a x = d.
4.2. LA FORMULACIÓN MATEMÁTICA DEL PRINCIPIO
97
(b) Considere un mundo (ficticio) donde q/m es una constante universal para
todas las partı́culas. Use el resultado del inciso (a) para mostrar que en
este mundo vale la universalidad pero no el principio de equivalencia.
4.2.
La formulación matemática del principio de
equivalencia
El modelo matemático para el espacio-tiempo (el conjunto de todos los eventos) es una variedad cuadridimensional pseudo-Riemanniana (M, g), donde la
métrica g posee la misma signatura que la métrica de Minkowksi η. En este
caso, (M, g) se llama una variedad Lorentziana. La métrica describe:
La estructura causal del espacio-tiempo: Los rayos de luz emitidos en un
evento p ∈ M se propagan en el cono de luz futuro del punto p.1
El potencial gravitacional.
Definición 42 Un sistema inercial local (SIL) con respecto a un punto
p ∈ M es un sistema de coordenadas locales x0 , x1 , x2 , x3 definidas en una
vecindad del punto p tal que
(i) gµν (p) = ηµν .
(ii)
∂gµν
∂xσ (p)
= 0.
En el capı́tulo previo mostramos que en cada punto p ∈ M existe un SIL. La
existencia de SIL’s es la versión matemática del principio de equivalencia, que
dice que es posible deshacerse del campo gravitacional al nivel local. Entonces
“local” se refiere al hecho de que en un evento p ∈ M dado, siempre es posible
encontrar un sistema de referencia tal que las componentes de la métrica y sus
primeras derivadas son ceros en este evento. En otras palabras, las componentes
de la métrica en un SIL tienen la forma
gµν (xσ ) = ηµν + O(xσ )2 ,
donde suponemos que el punto p está representado por xµ = 0. Los términos
cuadráticos son relacionados con la curvatura del espacio-tiempo y no pueden
ser eliminados.
Ejercicio 13. Sean xσ coordenadas normales con respecto al punto p ∈ M .
Demuestre que la métrica posee la expansión
1
gµν (xσ ) = ηµν − Rµσντ (p)xσ xτ + O(xσ )3
3
1 Asumimos que existe en cada punto p una distinción entre el cono de luz futuro y el cono
de luz pasado que depende de manera continua de p.
98
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
cerca del punto p, donde Rµσντ son las componentes del tensor de curvatura
con respecto a las coordenadas xσ .
Para encontrar las leyes de la fı́sica sobre (M, g) vamos a pedir lo siguiente:
(i) Covarianza general. Nos acordamos de que en la relatividad especial
existen sistemas de referencia preferidos (los sistemas inerciales) que son
conectados a través de las transformaciones de Poincaré. Se requiere que
las leyes de la fı́sica sean invariantes con respecto a estas transformaciones (covarianza de Lorentz). En la relatividad general no existen sistemas
de referencia preferidos (excepto en casos particulares con simetrı́as). Entonces, pedimos que las leyes de la fı́sica sean invariantes con respecto a
cualquier transformación de coordenadas.
(ii) Principio de equivalencia. Las leyes de la fı́sica se reducen a las leyes
correspondientes en relatividad especial en el origen de un sistema inercial
local.
(iii) Aparte de la métrica y de sus derivadas, las leyes de la fı́sica deben involucrar solamente cantidades que también estan presentes en la teorı́a
especial de relatividad.
La propiedad (i) sugiere que las leyes de la fı́sica se deben describir por ecuaciones entre campos tensoriales2 sobre la variedad M . Entonces, una ecuación
de primer orden tendrı́a la forma
∇T = J,
donde ∇ es la derivada covariante asociada a la conexión de Levi-Civita, y
T, J ∈ T (M ) son campos tensoriales. Con respecto a coordenadas locales (ver
la ecuación (3.39)),
∂ ...
T ... + Γ. .. T ... ... + ... − Γ. .. T ... ... = J ... ... ,
∂xµ
donde Γ. .. son los sı́mbolos de Christoffel asociados a ∇. En un sistema inercial
local con respecto a un punto p ∈ M esta ecuación evaluada en el punto p se
reduce a (dado que Γ. .. (p) = 0)
∂ ... ...
∇µ T ... |p =
T ... = J ... ... (p).
∂xµ
p
Entonces obtenemos la siguiente receta para acoplar la materia al campo gravitacional: Si en relatividad especial una ley fı́sica se describe a través de una
ecuación de primer orden de la forma
∂T = J,
2 Para
sistemas que involucran fermiones también se necesitan campos espinoriales. Por
falta de tiempo no consideramos espinores en estas notas.
4.3. LAS ECUACIONES DE MOVIMIENTO PARA UNA PARTÍCULA
99
donde T y J son tensores de Lorentz, entonces en relatividad general la misma
ley se describe a través de la ecuación
∇T = J,
donde T y J son campos tensoriales sobre (M, g). Dado que los sı́mbolos de
Christoffel dependen de la métrica y de sus primeras derivadas, obtenemos un
acople de la materia al campo gravitacional.
Ejemplo: Como vimos en la sección 1.3.3 las ecuaciones de Maxwell inhomogéneas en su forma relativista son
∂ν F µν =
1 µ
j ,
c
donde F µν describe el tensor electromagnético y j µ el cuadrivector de flujo eléctrico. Entonces en relatividad general, las ecuaciones de Maxwell inhomogéneas son
1
∇ν F µν = j µ ,
c
donde F µν son las componentes de un campo tensorial del tipo (2, 0) y donde
j µ son las componentes de un campo vectorial sobre (M, g).
4.3.
Las ecuaciones de movimiento para una partı́cula de prueba en un campo gravitacional
Nos acordamos de que en la relatividad especial, la trayectoria de una partı́cula libre se puede determinar a partir de los puntos crı́ticos del funcional
Ze2
S[x(λ)] =
p
−ηµν ẋµ ẋν dλ,
ẋµ ≡
dxµ
,
dλ
(4.1)
e1
donde x es una curva causal que conecta dos eventos e1 y e2 fijos. La generalización obvia para la relatividad general es el funcional
S[γ] =
Ze2 p
−g(γ̇, γ̇) dλ,
(4.2)
e1
donde γ es una curva causal que conecta dos eventos fijos e1 , e2 ∈ M del
espacio-tiempo. Notamos que el funcional (4.2) es independiente de la elección
del parámetro λ. Fı́sicamente3 , S/c representa el tiempo propio que necesita un
observador para moverse de e1 a e2 a lo largo de la curva γ. Para calcular la
3 Para que S tenga las unidades de una acción, podrı́amos multiplicar (4.2) por mc2 donde
m es la masa de la partı́cula. Sin embargo, esta multiplicación no afecta las trayectorias
clásicas, y por lo tanto no es necesaria para nuestras consideraciones clásicas.
100
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
variación de S consideramos una familia γµ = γ( . , µ) de curvas causales que
conectan e1 y e2 . Podemos elegir el parámetro λ de tal manera que la curva
crı́tica γ0 satisfaga −g(γ̇, γ̇) = −c2 , es decir, λ es el tiempo propio para la curva
crı́tica. Con esto obtenemos primero
Ze2
1
d
δg(γ̇, γ̇) dλ.
= δS[γ] = −
0=
S[γ]
dµ
2c
µ=0
e1
Para calcular δg(γ̇, γ̇) notamos primero que la variación δ es igual al vector
tangente a la curva µ 7→ γ(λ, µ) en el punto γ(λ, 0), y por lo tanto δ conmuta
con γ̇. Usando la identidad de Ricci (3.60) encontramos que
δg(γ̇, γ̇) = 2g(γ̇, ∇δ γ̇),
donde ∇ es la conexión de Levi-Civita asociada a g. Puesto que ∇ es libre de
torsión y que δ y γ̇ conmutan, ∇δ γ̇ = ∇γ̇ δ, y usando otra vez la identidad de
Ricci obtenemos4
δg(γ̇, γ̇) = 2g(γ̇, ∇γ̇ δ) = 2γ̇ [g(γ̇, δ)] − 2g(∇γ̇ γ̇, δ) = 2
d
g(γ̇, δ) − 2g(∇γ̇ γ̇, δ).
dλ
Puesto que δ = 0 en los dos eventos fijos e1 y e2 , obtenemos
1
0 = δS[γ] =
c
Ze2
g(∇γ̇ γ̇, δ)dλ.
e1
4 Otra posibilidad para calcular δg(γ̇, γ̇) es usar una carta local, de tal manera que g(γ̇, γ̇) =
gµν ẋµ ẋν , y entonces
δg(γ̇, γ̇)
=
=
=
+
∂gµν α µ ν
δx ẋ ẋ + 2gµν ẋµ δ ẋν
∂xα
»
–
∂gµν α µ ν
d
∂gµν α µ
µ
δx
ẋ
ẋ
−
2
ẋ
ẋ
+
g
ẍ
δxν + 2
[gµν ẋµ δxν ]
µν
∂xα
∂xα
dλ
»
–
ff

1 ∂gµν
∂gαν
∂gµα
µ α
+
−
ẋ
ẋ
δxν
−2 gµν ẍµ +
2 ∂xα
∂xµ
∂xν
d
2
[gµν ẋµ δxν ] .
dλ
Acordándonos de la expresión (3.62) para los sı́mbolos de Christoffel,
»
–
∂gβν
∂gαβ
1
∂gαν
Γµ αβ = g µν
+
−
,
2
∂xβ
∂xα
∂xν
y de la expresión (3.26) para la derivada covariante,
(∇γ̇ γ̇)µ = ẍµ + Γµ αβ ẋα ẋβ ,
obtenemos el mismo resultado
δg(γ̇, γ̇) = −2g(∇γ̇ γ̇, δ) + 2
d
g(γ̇, δ).
dλ
4.3. LAS ECUACIONES DE MOVIMIENTO PARA UNA PARTÍCULA 101
Dado que esta ecuación se debe cumplir para todas las variaciones δ (tales que
δe1 = δe2 = 0), concluimos que la curva crı́tica debe satisfacer
∇γ̇ γ̇ = 0.
(4.3)
Esta es la ecuación para una geodésica con parámetro afı́n λ. Concluimos que
las ecuaciones de movimiento para una partı́cula de prueba en caı́da libre en
un campo gravitacional están descritas por las geodésicas causales del espaciotiempo M .
Observaciones
1. Con respecto a coordenadas locales, (4.3) tiene la forma
ẍµ + Γµ αβ ẋα ẋβ = 0,
(4.4)
donde Γµ αβ son los sı́mbolos de Christoffel correspondientes a la conexión
de Levi-Civita, ver la ecuación (3.62).
2. Notamos que (4.3) satisface el principio de equivalencia; en un SIL con
respecto a un punto p, Γµ αβ (p) = 0 y la ecuación (4.4) se reduce a
ẍµ |p = 0,
la ecuación para una partı́cula libre en relatividad especial.
3. También notamos que (4.3) satisface el principio de la universalidad de la
gravitación.
2
4. La ecuación (4.4) generaliza la primera ley de Newton ddt2x = 0 para
partı́culas de prueba en un campo gravitacional. Sin embargo, hay que
subrayar que la interpretación de −Γµ αβ ẋα ẋβ como fuerza gravitacional
por unidad de masa no tiene ningún sentido fı́sico puesto que este término
se puede hacer cero en un SIL. Solamente la cuadrivelocidad u = γ̇ y la
aceleración a = ∇γ̇ γ̇ poseen un sentido geométrico y fı́sico.
5. La ecuación (4.3) implica que
d
g(γ̇, γ̇) = γ̇ [g(γ̇, γ̇)] = 2g(γ̇, ∇γ̇ γ̇) = 0,
dλ
donde hemos usado la identidad de Ricci (3.60) en el tercer paso. Entonces,
la norma de γ̇, g(γ̇, γ̇), es constante a lo largo de las trayectorias. En
particular, una partı́cula de prueba en caı́da libre con cuadrivelocidad
inicial que es de tipo tiempo no puede adquirir una velocidad igual a o
mayor que la velocidad de la luz.
6. Como vamos a justificar pronto, los rayos de luz están descritos por geodésicas nulas,
∇γ̇ γ̇ = 0,
g(γ̇, γ̇) = 0.
102
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
En este caso, la acción S definida en (4.2) ya no tiene sentido puesto que
no es diferenciable para curvas nulas. Sin embargo, en este caso la ecuación
de la geodésica se puede obtener al variar la acción modificada
Ze2
g(γ̇, γ̇) dλ.
S0 [γ] =
(4.5)
e1
4.4.
El lı́mite Newtoniano
En la sección previa vimos que las trayectorias de partı́culas de prueba en
caı́da libre son geodésicas del espacio-tiempo (M, g). En esta sección vamos a
demostrar que las geodésicas satisfacen las ecuaciones de movimiento de Newton
en el lı́mite de campos débiles y cuasi-estacionarios y de velocidades pequeñas
comparadas a la velocidad de la luz. Más precisamente, suponemos que existen
coordenadas locales en una región U ⊂ M del espacio-tiempo tales que
(i) La métrica es casi plana, es decir,
|hµν | 1,
gµν = ηµν + hµν ,
donde (ηµν ) = diag(−1, 1, 1, 1) es la métrica de Minkowski.
(ii)
1
c |∂t hµν |
|∂i hµν |, i = 1, 2, 3.
(iii) La velocidad v :=
satisface |v| c.
dx
dt
de la partı́cula con respecto a estas coordenadas
Sea xµ (τ ) la parametrización de una geodésica con respecto a estas coordenadas,
donde τ es el tiempo propio a lo largo de la trayectoria. Entonces
ẍµ + Γµ αβ ẋα ẋβ = 0,
ẋµ :=
dxµ
.
dτ
(4.6)
Despreciando términos que son por lo menos cuadráticos en hµν y v/c, encontramos que
1
1 dxµ 1 dxν
−1 = 2 gµν ẋµ ẋν = gµν
c
c dt c dt
dt
dτ
2
= −(1 − h00 )
dt
dτ
2
de tal manera que
dt
1
= 1 + h00 ,
dτ
2
(ẋj ) = v,
j = 1, 2, 3.
Por otro lado, los sı́mbolos de Christoffel en nuestra aproximación son
1
∂hαν
∂hβν
∂hαβ
Γµ αβ = η µν
+
−
.
2
∂xβ
∂xα
∂xν
,
4.4. EL LÍMITE NEWTONIANO
103
Entonces las componentes espaciales de (4.6) dan
d2 xk
+ Γk 00 c2 = 0,
dt2
k = 1, 2, 3.
Usando la hipótesis (ii) encontramos que
1
1
∂h00
Γk 00 = − η kj
= − ∂ k h00 .
2
∂xi
2
Concluimos que
d2 x
c2
=
∇h00 .
dt2
2
Esto concuerda con la ley de Newton (1.3) si igualamos la masa inercial con la
masa gravitacional, y si
2φ
(4.7)
h00 = − 2 ,
c
donde φ es el potencial gravitacional Newtoniano. En otras palabras, recuperamos las ecuaciones de movimiento de Newton bajo las suposiciones (i),(ii) y (iii)
si
2φ
(4.8)
g00 = − 1 + 2 ,
c
1 k
∂ φ,
k = 1, 2, 3.
(4.9)
Γk 00 =
c2
Estas ecuaciones motivan los nombres “potencial gravitacional” y “fuerza gravitacional” para gµν y Γµ αβ , respectivamente, aunque insistimos en que fuera del
régimen de validez de la aproximación Newtoniana los sı́mbolos de Christoffel
no tienen ningún significado fı́sico.
Ejercicio 14. Verifique la consistencia de la componente temporal de la ecuación (4.6).
La suposición (i) y la ecuación (4.7) implican que la aproximación Newtoniana es válida si
|φ|
1.
(4.10)
c2
Como ejemplo, podemos considerar el valor de φ/c2 en la superficie de un objeto
esfericamente simétrico de masa M y radio R, por lo cual φ = − GM
R :
|φ|/c2
10−9
10−6
10−4
10−1
1
10−39
en la superficie
de la tierra
del sol
de una enana blanca
de una estrella de neutrones
en el horizonte de eventos de un agujero negro
de un protón
104
4.5.
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
Las ecuaciones de Maxwell en un fondo curvo
Como vimos en la sección 1.3.3, la forma covariante de las ecuaciones de
Maxwell en relatividad especial es
∂σ Fµν + ∂µ Fνσ + ∂ν Fσµ = 0,
1
∂ν F µν = j µ ,
c
donde

0
 E1
(Fµν ) = (−Fνµ ) = 
 E2
E3
−E1
0
−B3
B2
−E2
B3
0
−B1
(4.11)
(4.12)

−E3
−B2 

B1 
0
es el tensor electromagnético, F µν = η µσ η ντ Fστ , y donde (j µ ) = (cρc , j) es
el cuadrivector de densidad de corriente eléctrica. Puesto que F µν = −F νµ
es antisimétrico, las ecuaciones inhomogéneas (4.12) implican la ecuación de
continuidad,
∂µ j µ = 0.
(4.13)
La ecuación de continuidad a su vez implica la conservación de la carga total,
Z
Z
1
0
3
Q(t) :=
j (t, x) d x = ρc (t, x) d3 x.
(4.14)
c
R3
R3
Asumiendo que Fµν dacae suficientemente rápido para |x| → ∞, la ecuación
(4.13) y el teorema de Gauss implican que
d
Q(t) = 0.
dt
Ejercicio 15. Demuestre que la carga total, como está definida en (4.14), es
independiente de la elección del sistema inercial.
Para obtener la generalización de las ecuaciones de Maxwell en un fondo
curvo (M, g) dado, aplicamos el método descrito en la sección (4.2). Entonces
elevamos Fµν a las componentes de un campo tensorial del tipo (0, 2) sobre
M , j µ a las componentes de un campo vectorial sobre M , y reemplazamos las
derivadas parciales por derivadas covariantes en (4.11,4.12). El resultado es
∇σ Fµν + ∇µ Fνσ + ∇ν Fσµ = 0,
1
∇ν F µν = j µ ,
c
(4.15)
(4.16)
donde F µν = g µσ g ντ Fστ . La forma libre de coordenadas de estas ecuaciones es
X
∇X F (Y, Z) = 0,
(4.17)
(XY Z)
1
div F = − j ,
ce
(4.18)
4.5. LAS ECUACIONES DE MAXWELL EN UN FONDO CURVO
donde
P
105
denota la suma cı́clica sobre X, Y y Z, donde div F se refiere a
(XY Z)
la contracción de ∇F sobre las primeras dos entradas, y donde j := g(j, ·) es el
e
campo de covectores correspondiente a j.
Ahora el campo electromagnético está acoplado al campo gravitacional puesto que la métrica aparece en la relación entre Fµν y F µν y en los sı́mbolos de
Christoffel asociados a ∇. Sin embargo, un análisis más detallado revela que la
ecuación (4.15) no depende de g, puesto que
X
X
∇σ Fµν =
(∂σ Fµν − Γτ σµ Fτ ν − Γτ σν Fµτ )
(σµν)
(σµν)
=
X
(∂σ Fµν − Γτ σµ Fτ ν − Γτ µσ Fντ )
(σµν)
=
X
∂σ Fµν ,
(4.19)
(σµν)
donde hemos usado la simetrı́a de los sı́mbolos de Christoffel, Γτ µσ = Γτ σµ y la
antisimetrı́a de Fτ ν = −Fντ en el último paso. Entonces la ecuación (4.15) se
reduce a la ecuación (4.11) en cualquier sistema de coordenadas.
¿Qué pasa con las ecuaciones inhomogéneas (4.16)? ¿Dependen de la métrica? ¿Y cuál es la generalización correcta de la ecuación de continuidad (4.13)?
Para contestar a estas preguntas vamos a usar el siguiente
Lema 12 Sean n ∈ N y ε > 0. Sea A : (−ε, ε) → GL(n, R) un mapeo diferenciable del intervalo abierto (ε, ε) en las transformaciones lineales e invertibles
sobre Rn . Entonces
d
−1 d
log | det(A(t))| = tr A(t)
A(t)
dt
dt
para todo |t| < ε.
Demostración. Sea s ∈ (−ε, ε). Defina B(t) := A(s)−1 A(t), |t| < ε. Puesto
que B(s) = 11 tenemos que
X
d
d
det(B(t))
=
σ(π)B1π(1) (t)B2π(2) (t) · · · Bnπ(n) (t)
dt
dt
t=s
π∈S(n)
t=s
n
X
X
d
=
σ(π)B1π(1) (s) · · · Bjπ(j) (t)
· · · Bnπ(n) (s)
dt
t=s
j=1 π∈S(n)
n
X
d
d
Bjj (t)
tr(B(t))
=
=
.
dt
dt
t=s
t=s
j=1
Entonces,
d
d
d
log | det(A(t))|
=
det(B(t))
= tr A(t)−1 A(t) .
dt
dt
dt
t=s
t=s
t=s
106
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
Ahora veamos las ecuaciones de Maxwell inhomogéneas (4.16). Tenemos
∇ν F µν = ∂ν F µν + Γµ νσ F σν + Γν νσ F µσ .
El segundo término a la derecha de la ecuación es cero puesto que Γµ νσ = Γµ σν
es simétrico en νσ mientras que F νσ = −F σν es antisimétrico. Para el tercer
término notamos que
1 νµ ∂gνµ
∂gσµ
∂gνσ
ν
Γ νσ =
+
−
g
2
∂xσ
∂xν
∂xµ
1 νµ ∂gνµ
=
g
2
∂xσ
1 ∂
=
log |g|
2 ∂xσ
1
∂ p
= p
|g|,
(4.20)
∂x
|g| σ
donde hemos definido |g| := | det(gµν )| y usado el resultado del Lema 12. Entonces obtenemos
p
1
∇ν F µν = p ∂ν
|g|F µν ,
|g|
y podemos reescribir las ecuaciones inhomogéneas (4.16) en la forma
∂ν
p
1p
|g|F µν =
|g| j µ .
c
(4.21)
Aplicando el operador ∂µ a ambos lados de la ecuación y usando la antisimetrı́a
de F µν , obtenemos la ecuación de continuidad
p
0 = ∂µ
|g| j µ .
(4.22)
Usando otra vez el resultado del Lema 12 podemos reescribir esto de forma
covariante,
∇µ j µ = 0,
(4.23)
o
div j = 0,
(4.24)
y obtenemos la generalización de (4.13) que esperamos del principio de equivalencia. Para fuentes localizadas sobre una región del espacio-tiempo de la forma
[t1 , t2 ] × S, la ecuación (4.24) implica la conservación de la carga total
Z
1
Q :=
αj t ,
c
S
4.5. LAS ECUACIONES DE MAXWELL EN UN FONDO CURVO
107
ver el segundo ejemplo al final de la sección 3.4.3.
Ejercicio 16. Muestre que las ecuaciones de Maxwell (4.15,4.16) son invariantes bajo transformaciones conformes gµν 7→ e2φ gµν , j µ 7→ e−4φ j µ , Fµν 7→ Fµν .
¿Qué implicaciones tiene este resultado para la propagación de la luz en un
espacio conformemente plano, como en las teorı́as escalares de la gravitación?
4.5.1.
La descripción a través de potenciales
Las ecuaciones de Maxwell homogéneas (4.15) implican la existencia local5
de un potencial Aµ tal que
Fµν = ∂µ Aν − ∂ν Aµ .
(4.25)
Notamos que la simetrı́a de Γα µν = Γα νµ en µν implica que esta ecuación
también se puede escribir como
Fµν = ∇µ Aν − ∇ν Aµ ,
lo que muestra que (4.25) es independiente de las coordenadas locales si es que
Aµ son las componentes de un campo de covectores sobre M . En cambio,
F µν = ∇µ Aν − ∇ν Aµ 6= ∂ µ Aν − ∂ ν Aµ
en general. Introduciendo (4.25) en las ecuaciones de Maxwell inhomogéneas (4.16)
obtenemos
1
(4.26)
−∇ν ∇ν Aµ + ∇ν ∇µ Aν = j µ .
c
El primer término a la izquierda de la ecuación tiene la forma de un operador
de onda que actúa sobre Aµ = g µν Aν . Para eliminar el segundo término, conmutamos los operadores covariantes ∇ν y ∇µ y imponemos la norma de Lorentz
covariante
∇ν Aν = 0.
(4.27)
Para conmutar los operadores covariantes, partimos de la definición 38 del tensor
de curvatura,
R(∂µ , ∂ν )A = (∇µ ∇ν − ∇ν ∇µ )A,
A = Aα ∂α ,
o,
R̄α βµν = (∇µ ∇ν − ∇ν ∇µ )Aα .
Contrayendo sobre α = ν obtenemos
−Ricβµ Aβ = ∇µ ∇ν Aν − ∇ν ∇µ Aν = −∇ν ∇µ Aν ,
5 Ver
el lema de Poincaré, por ejemplo en la referencia [10].
108
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
donde usamos la definición 39 del tensor de Ricci y la norma de Lorentz covariante (4.27). Ahora, la ecuación (4.26) implica
1 µ
j ,
∇ν Aν = 0.
(4.28)
c
Esto describe un sistema acoplado de ecuaciones de onda, sujeto a una constricción.
−∇ν ∇ν Aµ + Ricµ ν Aν =
Ejercicio 17.
(a) Demuestre que siempre es posible satisfacer la norma de Lorentz, por lo
menos localmente. Es decir, dado un campo de covectores A ∈ X ∗ (M)
y un evento p ∈ M , existe una función χ ∈ F(U ) definida sobre una
vecindad U de p tal que Ā := A + dχ satisface ∇ν Āν = 0 sobre U .
(b) Verifique que el sistema de ecuaciones de onda para A implica la siguiente
ecuación para la divergencia de A, C := ∇ν Aν ,
1
∇µ j µ .
c
Esta ecuación muestra que la norma de Lorentz covariante es consistente
con el sistema de ecuaciones de onda para A siempre y cuando se cumpla
la ecuación de continuidad (4.23).
−∇µ ∇µ C =
Observación: En relatividad especial, la ecuación (4.26) se reduce a
1 µ
j ,
c
donde usamos el hecho de que las derivadas parciales conmutan. Si aplicamos
la receta descrita en la sección (4.2) para acoplar el campo gravitacional al
campo electromagnético y reemplazamos las derivadas parciales por derivadas
covariantes a esta ecuación, obtenemos en vez de la ecuación (4.26) la ecuación
−∂ν ∂ ν Aµ + ∂ µ ∂ν Aν =
1 µ
j .
(4.29)
c
La diferencia entre las ecuaciones (4.29) y (4.26) consiste justamente en el conmutador
(∇µ ∇ν − ∇ν ∇µ )Aν = −Rµ ν Aν .
−∇ν ∇ν Aµ + ∇µ ∇ν Aν =
Este ejemplo muestra que la transición de la relatividad especial a la relatividad
general involucra ambigüedades inevitables cuando las ecuaciones de campo
contienen derivadas del orden dos o mayor. Estas ambigüedades son similares a
las que aparecen en la transición de la mecánica clásica a la mecánica cuántica,
y tienen que ver con la no-conmutatividad de las derivadas covariantes.
En nuestro ejemplo, podemos descartar la ecuación (4.29) observando que
no es invariante bajo las transformaciones de norma A 7→ A + dχ. Con respecto
a dicha transformación,
− ∇ ν ∇ ν Aµ + ∇ µ ∇ ν Aν
7→
−∇ν ∇ν Aµ + ∇µ ∇ν Aν − ∇ν ∇ν ∇µ χ + ∇µ ∇ν ∇ν χ
=
−∇ν ∇ν Aµ + ∇µ ∇ν Aν − Rµ ν ∇ν χ,
4.6. EL LÍMITE GEOMÉTRICO EN UN FONDO CURVO
109
mientras que la ecuación (4.26) es, por supuesto, invariante bajo las transformaciones de norma.
4.6.
El lı́mite geométrico en un fondo curvo
En esta sección vamos a analizar el lı́mite geométrico de las ecuaciones de
Maxwell, y demostrar que en este lı́mite los rayos de luz se pueden describir por
geodésicas nulas.
Para esto, nos acordamos primero de la electrodinámica en relatividad especial. En la ausencia de una campo gravitacional y de las fuentes electromagnéticas, las ecuaciones de Maxwell son equivalentes a
∂ν ∂ ν Aµ = 0,
∂ν Aν = 0.
(4.30)
Soluciones particulares son las ondas planas
Aµ (x) = aµ eik·x ,
(4.31)
donde (aµ ) ∈ R4 es el vector de amplitud y (k µ ) = (c−1 ω, k) ∈ R4 el vector de
onda, y donde k · x = kµ xµ = −ωt + k · x. Las ecuaciones (4.30) implican que k
es un vector nulo y que a es ortogonal a k, de tal manera que
|ω|
= |k|,
c
ω
a0 + k · a = 0.
c
Ejercicio 18. Muestre que es posible aplicar una transformación de norma que
preserva la norma de Lorentz de tal manera que a0 = 0.
El campo electromagnético correspondiente a (4.31) es
Fµν (x) = i(kµ aν − kν aµ )eik·x .
Si a0 = 0 el campo eléctrico Ej = Fj0 y el campo magnético Bj = εjkl F kl /2
son dados por
E(x)
=
B(x)
=
ω ik·x
ae ,
c
i(k ∧ a)eik·x ,
i
donde a · k = 0 y |ω| = |k|c. La parte real de estas ecuaciones describen un
rayo de luz monocromático con polarización lineal. Está parametrizado por su
frecuencia ω, su vector de onda k y su vector de amplitud a.
En la presencia de un campo gravitacional vimos que se deben reemplazar
las ecuaciones (4.30) por
−∇ν ∇ν Aµ + Ricµ ν Aν =
1 µ
j ,
c
∇ν Aν = 0,
(4.32)
y en general no se esperan soluciones de la forma (4.31), puesto que los coeficientes en las ecuaciones (4.32) ya no son constantes. Sin embargo, los rayos
110
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
de luz se pueden describir en el lı́mite geométrico si el campo gravitacional
varı́a poco sobre distancias comparables a la longitud de onda. Para definir el
lı́mite geométrico, consideramos una onda electromagnética monocromática con
polarización lineal, y consideramos las siguientes cantidades:
λ: la longitud de onda tı́pica,
L: una longitud tı́pica sobre la cual la amplitud, la polarización y la longitud de onda varı́an de manera significativa,
R: El radio de curvatura de la geometrı́a. Por ejemplo, este radio se puede
definir como
R := |una componente tı́pica del tensor de curvatura en un SIL|
−1/2
.
Entonces el lı́mite geométrico consiste de las suposiciones
λ L,
λ R.
(4.33)
y del siguiente ansatz para la solución de (4.32):
A = ãeiψ̃ ,
donde ã ∈ X ∗ (M ) es una amplitud que varı́a poco sobre distancias del orden L
o R y donde ψ̃ ∈ F(M ) es una fase oscilatoria. Definiendo
ε :=
λ
1,
mı́n{L, R}
podemos expander
ã = a + εb + O(ε2 ),
donde a, b ∈ X ∗ (M ). Dado que ψ̃(x) = k · x y k ' λ−1 en relatividad especial,
conviene definir ψ := εψ̃, de tal manera que nuestro ansatz tenga la forma
−1
A = a + εb + O(ε2 ) eiε ψ .
(4.34)
Para lo que sigue, suponemos que el campo vectorial ã correspondiente a a =
g(ã, ·) es de tipo espacio y definimos
˜
k := ∇ψ
∗ 1/2
|a| := g(ã, ã )
>0
(vector de onda),
(amplitud escalar),
f := ã/|a|
(vector de polarización),
θ := div k
(expansión).
Con esto, encontramos las siguientes expansiones en coordenadas locales,
−1
i
∇ ν Aµ =
kν aµ + (ikν bµ + ∇ν aµ ) + O(ε) eiε ψ ,
ε
−1
1
1
∇ν ∇ν Aµ = − 2 k ν kν aµ + (−k ν kν bµ + 2i∇k aµ + iθaµ ) + O(ε0 ) eiε ψ .
ε
ε
4.7. CAMPOS ESTACIONARIOS Y ESTÁTICOS
111
Al orden dominante cuando ε → 0 obtenemos las condiciones
g(k, k) = 0,
g(k, ã) = 0.
Entonces el vector de onda es un vector nulo, y el vector de amplitud es ortogonal
a k, exactamente como en relatividad especial con la diferencia que ahora los
términos nulo y ortogonal se refieren a la métrica g del espacio curvo. Mientras
k 6= 0 los conjuntos {ψ = const.} de fase constante (las frente de ondas) definen
superficies nulas. Además, dado que k = ∇ψ, tenemos
e
∇ν (k µ kµ ) = 2k µ ∇ν ∇µ ψ = 2k µ ∇µ ∇ν ψ = 2k µ ∇µ kν = 2∇k kν ,
donde usamos el hecho de que la torsión de ∇ es cero en el segundo paso. Puesto
que k µ kµ = g(k, k) = 0, aprendemos que las curvas integrales a k (los rayos de
luz) son geodésicas nulas. Dado que k es nulo, es a la vez ortogonal y tangente
a las superficies {ψ = const.} y cada una de las geodésicas generadas por k
está dentro de una de estas superficies.
Al siguiente orden en ε obtenemos
2∇k ã + θã = 0,
ig(k, b̃) + div ã = 0.
En términos de la amplitud escalar y del vector de polarización la primera
ecuación es equivalente a
θ
∇k |a| = − |a|,
2
∇k f = 0.
(4.35)
En particular, el vector de polarización es autoparalelo a lo largo de las geodésicas generadas por k. Entonces es suficiente conocer los valores de la amplitud
escalar |a| y del vector de polarización f en un punto p de la geodésica nula,
los valores en los otros puntos se obtienen al resolver las ecuaciones (4.35). Si
fp es ortogonal a kp y es unitario, el transporte paralelo de f garantiza que las
condiciones g(k, f ) = 0 y g(f, f ∗ ) = 1 se satisfacen sobre todos los puntos de la
geodésica dado que la conexión es métrica.
La primera ecuación en (4.35 también se puede escribir como la ley de conservación
div J = 0,
J := |a|2 k.
(4.36)
Al nivel de la mecánica cuántica, J describe la corriente de fotones en los rayos
de luz generados por k. La cantidad conservada correspondiente se refiere al
número de fotones. Por supuesto, la ley de conservación (4.36) solamente es
válida en el lı́mite geométrico sobre un fondo curvo fijo; en general los fotones
pueden interactuar con el campo gravitacional.
4.7.
Campos estacionarios y estáticos
En esta sección queremos definir lo que son los espacio-tiempos estacionarios y estáticos. Intuitivamente, un espacio-tiempo estacionario es una variedad
112
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
Lorentziana (M, g) donde la métrica g “no depende del tiempo”. Dado que en
relatividad general no existe un tiempo absoluto, tenemos que definir con más
precisión lo que queremos decir por “no depende del tiempo”. Una posibilidad
es pedir que existan coordenadas locales x0 = ct, x1 , x2 , x3 tales que
∂t gµν = 0,
(4.37)
es decir, las componentes de la métrica no dependen del tiempo en estas coordenadas particulares. Sin embargo, esta definición no satisface el principio de
covarianza general y está restringida a una carta local.
Para dar una definición geométrica de un espacio-tiempo estacionario, partimos de la siguiente observación. Si definimos el campo vectorial k := ∂t en
una carta local donde vale la ecuación (4.37), entonces en estas coordenadas
particulares, tenemos
(£k g)µν = k σ ∂σ gµν + (∂µ k σ )gσν + (∂ν k σ )gµσ = 0,
donde usamos la fórmula general (3.75) para las componentes de la derivada de
Lie y el hecho de que (k σ ) = (1, 0, 0, 0) es constante. Entonces en esta carta
local, la ecuación (4.37) es equivalente a
£k g = 0.
(4.38)
Pero a diferencia de la ecuación (4.37), la ecuación (4.38) es independiente de
las coordenadas locales.
Definición 43 Un campo vectorial k ∈ X (M ) que satisface la ecuación (4.38)
se llama un campo vectorial de Killing.
Ahora podemos dar una definición geométrica de un espacio-tiempo estacionario.
Definición 44 Un espacio-tiempo (M, g) se llama estacionario si existe un
campo vectorial de Killing k que es de tipo tiempo, es decir existe k ∈ X (M ) tal
que
£k g = 0,
g(k, k) < 0.
Observaciones
1. Sea k un campo vectorial de Killing y sea ϕt el flujo correspondiente a k.
Entonces la ecuación (4.38) es equivalente a
(ϕt )∗ g = g,
ver la observación debajo de la definición 37. En este sentido, la métrica
es invariante bajo el flujo de k.
2. Dado un campo vectorial de Killing k y un evento p ∈ M , siempre es posible encontrar coordenadas locales x0 , x1 , x2 , x3 en una vecindad de p tales
que k = ∂0 como demostramos al final de la sección 3.5.4. En estas coordenadas, tenemos 0 = £k gµν = ∂0 gµν , y recuperamos la ecuación (4.37).
4.7. CAMPOS ESTACIONARIOS Y ESTÁTICOS
113
3. Es posible que una variedad Lorentziana (M, g) posee un campo vectorial
de Killing k que es de tipo tiempo en una región, pero nulo o tipo espacio
en otra región del espacio-tiempo. De hecho, vamos a ver que esto ocurre
en la solución de Schwarzschild. En este caso, decimos que la métrica es
estacionaria en la región donde k es tipo tiempo.
4. De acuerdo a la fórmula (3.78), un campo vectorial de Killing k satisface
(∇k )(X, Y ) + (∇k )(Y, X) = 0
(4.39)
e
e
para todo X, Y ∈ X (M ), donde k := g(k, ·) es el campo de covector
e
correspondiente a k. La ecuación (4.39)
se llama ecuación de Killing.
Es equivalente a pedir que ∇k sea antisimétrico. Su forma en coordenadas
e
locales es
∇µ kν + ∇ν kµ = 0.
(4.40)
De acuerdo al teorema de Noether, a cada simetrı́a del sistema le corresponde una cantidad conservada. A continuación mencionamos dos resultados
importantes donde la presencia de un vector de Killing en el espacio-tiempo da
lugar a cantidades conservadas:
Lema 13 Sea (M, g) un espacio-tiempo con campo vectorial de Killing k, y sea
d
γ.
γ una geodésica en (M, g) con parámetro afı́n λ y campo de velocidad u = dλ
Entonces vale
u[g(u, k)] = 0,
(4.41)
es decir, el producto escalar g(u, k) se conserva a lo largo de γ.
Demostración. Usando la ecuación de Killing (4.39) y la ecuación geodésica
∇u u = 0 encontramos que6
u[g(u, k)] = u[k (u)] = (∇u k )(u) + k (∇u u) = (∇k )(u, u) = 0.
e
e
e
e
Lema 14 Sea (M, g) un espacio-tiempo con campo vectorial de Killing k, y sea
T ∈ T 2 0 (M ) un tensor de energı́a-impulso, es decir, un campo tensorial del tipo
(2, 0) simétrico que satisface div T = 0. Entonces la corriente j := −T (k , ·) es
e
conservada, es decir,
div j = 0.
(4.42)
Demostración. Sea p ∈ M y sean x0 , x1 , x2 , x3 coordenadas locales en una
vecindad de p. Entonces
div j = ∇ν j ν = −∇ν (T µν kµ ) = −(∇ν T µν )kµ − T µν ∇ν kµ = 0,
6 En coordenadas locales, u[g(u, k)] = uβ ∇ (uα k ) = (uβ ∇ uα )k + uβ uα ∇ k
α
α
β
β
β α = 0,
puesto que uβ ∇β uα = ∇u uα = 0 y que ∇β kα es antisimétrico en αβ.
114
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
dado que ∇ν T µν = 0, y que T µν es simétrico en µν mientras que ∇ν kµ es
antisimétrico en µν de acuerdo a la ecuación de Killing (4.40).
Los espacio-tiempos estáticos son casos particulares de los espacio-tiempos
estacionarios. En estos casos, el espacio-tiempo se puede dividir (por lo menos
localmente) de manera natural en un“tiempo” y un“espacio”.
Definición 45 Un espacio-tiempo (M, g) se llama estático si existe un campo
vectorial de Killing k ∈ X (M ) que es de tipo tiempo y que satisface la condición
X
k ⊗ ∇k (X, Y, Z) = 0,
(4.43)
e
e
(XY Z)
P
para todos X, Y, Z ∈ X (M ), donde
denota la suma cı́clica sobre (X, Y, Z).
(XY Z)
En coordenadas locales, la condición (4.43) es
X
kσ ∇µ kν = 0.
(4.44)
(σµν)
De acuerdo a un teorema general de Frobenius (ver, por ejemplo, [9]) la
condición (4.43) implica la existencia local de subvariedades tridimensional espaciales que son ortogonales a k. En vez de usar el teorema de Frobenius, vamos
a demostrar directamente:
Lema 15 Un espacio-tiempo (M, g) es estático con respecto al campo vectorial
de Killing k si y sólo si existen en la vecindad de cada evento p ∈ M coordenadas
locales x0 , x1 , x2 , x3 tales que k = ∂0 y tales que
g = −N (x)dx0 ⊗ dx0 + gij (x)dxi ⊗ dxj ,
x = (xi ) = (x1 , x2 , x3 ),
(4.45)
donde N (x) > 0 y gij (x) es definido positivo. Entonces las componentes de la
métrica tienen la siguiente forma:


0
−N (x)
,
(gµν (x)) = 
x = (xi ) = (x1 , x2 , x3 ).
(4.46)
0
gij (x)
Demostración. Supongamos primero que en una carta local (U, Φ), k = ∂0 y
que la métrica tiene la forma (4.45). Entonces k es un campo vectorial de Killing
sobre U y g(k, k) = −N < 0 sobre U . Además, k = −N dx0 , de tal manera que
e
X
1 X
1 X
kσ (∇µ kν − ∇ν kµ ) =
kσ (∂µ kν − ∂ν kµ ) = 0.
k σ ∇µ k ν =
2
2
(σµν)
(σµν)
(σµν)
Por otro lado, si k ∈ X (M ) es un campo vectorial de Killing de tipo tiempo
que satisface la condición (4.43). Entonces dada una carta local (U, Φ) tenemos
0
= kσ ∇µ kν + kµ ∇ν kσ + kν ∇σ kµ
1
1
= −kσ ∇ν kµ + kµ ∇ν kσ − kµ ∇σ kν + kν ∇σ kµ ,
2
2
4.7. CAMPOS ESTACIONARIOS Y ESTÁTICOS
115
donde usamos la ecuación de Killing (4.40) en el segundo paso. Contrayendo
con k µ encontramos que
0
=
=
1
[kσ ∇ν N − N (∇ν kσ − ∇σ kν ) − kν ∇σ N ] ,
2 N2
kν
kσ
∇σ
− ∇ν
,
2
N
N
(4.47)
donde definimos N := −g(k, k) = −k µ kµ > 0. Entonces el campo de covectores
uν := kν /N satisface la ecuación
0 = ∇σ uν − ∇ν uσ = ∂σ uν − ∂ν uσ .
Esto implica la existencia local7 de una función f ∈ F(U ) tal que uσ = ∂σ f .
Con esta función podemos escribir k de la forma
kσ = N ∂σ f,
N = −g(k, k) = −k µ kµ > 0.
(4.48)
Notamos que −k σ ∂σ f = −N −1 k σ kσ = 1. Ahora definimos las superficies
Σx0 := {p ∈ U : −f (p) = x0 },
x0 ∈ R.
(4.49)
De acuerdo a la ecuación (4.48) estas superficies son regulares y ortogonales a k.
Por lo tanto, son superficies espaciales. Ahora podemos construir coordenadas
Lagrangianas (x0 , x1 , x2 , x3 ) adaptadas a las superficies Σx0 como describimos
al final de la sección 3.5.4, de tal manera que k = ∂0 . Con respecto a estas
coordenadas tenemos
k = g00 dx0 + g0i dxi ,
i = 1, 2, 3.
e
Por otro lado, la ecuación (4.48) implica que k = N df = −N dx0 , de tal manera
e k = ∂ es un vector de Killing,
que g00 = −N y g0i = 0. Finalmente, dado que
0
las componentes de la métrica no dependen de x0 . Entonces la métrica tiene la
forma (4.45) en U .
Observaciones
1. Las superficies Σx0 de tiempo constante definidas en (4.49) con la métrica
inducida son mutualmente isométricas puesto que (ϕt )∗ g = g, donde ϕt
denota el flujo de k.
2. Para un espacio-tiempo estacionario podemos definir un observador en
reposo como un observador que se mueve a lo largo de una curva integral del campo vectorial de Killing de tipo tiempo k. Vamos a ver en la
sección 4.9 que en general, un observador en reposo puede adquirir una
rotación si el espacio-tiempo es estacionario pero no estático.
3. Si el espacio-tiempo es estático, entonces existe una distinción natural entre el espacio y el tiempo, dado por el sistema de coordenadas del Lema 15.
7 Ver
el lema de Poincaré, por ejemplo en la referencia [10].
116
4.7.1.
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
El principio de Fermat para campos estáticos
Como aplicación vamos a derivar el principio de Fermat para los rayos de luz
en un espacio-tiempo estático. Como vimos en las secciones 4.3 y 4.6 los rayos
de luz en el lı́mite geométrico se pueden describir a través del funcional
Ze2
g(γ̇, γ̇)dλ,
S0 [γ] =
e1
con la constricción g(γ̇, γ̇) = 0. De acuerdo a los cálculos que hicimos en la
sección 4.3 la variación de S0 da
Ze2
δS0 [γ] =
δg(γ̇, γ̇)dλ = 2
e
g(γ̇, δ)|e21
Ze2
−2
g(∇γ̇ γ̇, δ)dλ
e1
e1
Si la variación es cero en e1 y e2 , obtenemos δS0 [γ] = 0 de acuerdo a la ecuación
de la geodésica ∇γ̇ γ̇ = 0, pero aquı́ vamos a considerar variaciones más generales
que no fijan los eventos e1 y e2 . En este caso, la variación de S0 alrededor de
un rayo de luz γ da
e
(4.50)
δS0 [γ] = 2 g(γ̇, δ)|e21 .
En lo que sigue, vamos a usar el resultado del Lema 15 para introducir
coordenadas locales x0 , x1 , x2 , x3 adaptadas a la estaticidad en una vecindad U
de M , tales que U = I × Σ y
g = −N (x)dx0 ⊗ dx0 + gij (x)dxi ⊗ dxj ,
(x0 , x) ∈ I × Σ,
donde N (x) y gij (x) son definidos positivos. Vamos a suponer que e1 , e2 y la
geodésica nula que conecta e1 y e2 se encuentra dentro de la región U . Consideramos
variaciones del funcional S0 que consisten de curvas que satisfacen
δxi e1 ,e2 = 0. De acuerdo al resultado del Lema 13 el producto escalar g(γ̇, k),
k = ∂0 , es constante a lo largo del rayo de luz. Podemos normalizar el parámetro
afı́n λ de tal manera que g(γ̇, k) = 1. Con esto, la ecuación (4.50) implica que
e2
e2
δS0 [γ] = 2 g(γ̇, δx k)e1 = 2 δx0 e1 = 2δ
0
Ze2
ẋ0 dλ.
e1
En particular, si consideramos curvas nulas que satisfacen δxi e ,e = 0, enton1 2
ces S0 = 0 a lo largo de la variación y
0 = g(γ̇, γ̇) = −N (x)(ẋ0 )2 + gij (x)ẋi ẋj
de tal manera que
ẋ0 =
q
hij (x)ẋi ẋj ,
hij (x) :=
1
gij (x),
N (x)
(4.51)
4.8. EL CORRIMIENTO AL ROJO
117
Entonces obtenemos el principio variacional
Zp2
0=δ
p1
1
dt = δ
c
Zp2 q
hij (x)ẋi ẋj dλ,
(4.52)
p1
con la métrica efectiva hij (x) := N (x)−1 gij (x), donde p1 y p2 denotan la proyección de e1 y e2 sobre Σ.
Esta ecuación describe el principio de Fermat: La trayectoria seguida por
la luz al propagarse de un punto p1 a otro p2 del espacio es tal que el tiempo
empleado en recorrerla es mı́nimo.
p La comparación con el principio de Fermat en
la óptica revela que el factor 1/ N (x) juega el papel de un ı́ndice de refracción
en la geometrı́a Riemanniana (Σ, gij dxi ⊗ dxj ). La ecuación (4.52) también
implica que los rayos de luz en una métrica estática son geodésicas en el espacio
Riemanniano (Σ, hij dxi ⊗ dxj ).
4.8.
El corrimiento al rojo
Consideramos las trayectorias de dos observadores γ1 y γ2 en el espaciotiempo. Uno de los observadores, γ1 , el transmisor, emite una onda electromagnética en un evento e1 que será recibida por γ2 , el receptor, en el evento e2 .
Preguntamos cuál es la relación entre la frecuencia emitida por el transmisor y
la frecuencia recibida por γ2 .
Para calcular esta relación, vamos a suponer la validez del lı́mite geométrico
de tal manera que podemos describir la onda electromagnética a través del
potencial
−1
A = ã eiε ψ ,
donde ã ∈ X ∗ (M ) es el covector de amplitud y ψ ∈ F(M ) es la fase. Como
˜ de ψ es un vector nulo
habı́amos visto en la sección 4.6, el gradiente k = ∇ψ
que satisface ∇k k = 0, es decir, las curvas integrales a k son geodésicas nulas.
Además, k es tangente a las superficies ψ = const. de fase constante.
Sean ψj (τj ) = ψ(γj (τj )), j = 1, 2, las fases sobre las curvas γ1 y γ2 en función
de los tiempos propios τj respectivos. Definimos la frecuencia emitida y recibida
a través de
1 d
νj :=
ψj (τj ),
j = 1, 2.
2πε dτj
Usando la definición 13 de la diferencial y de k encontramos que
2πενj = dψ(uj )|γj (τj ) = k (uj )γ (τ ) = g(k, uj )|γj (τj ) ,
j = 1, 2,
j
j
e
donde uj := γ̇j se refiere a la cuadrivelocidad de γj . Entonces encontramos la
siguiente fórmula general para la razón entre ν1 y ν2 :
g(k, u1 )|e1
ν1
=
.
ν2
g(k, u2 )|e2
(4.53)
118
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
Como vamos a ilustrar en los ejemplos que siguen, esta fórmula representa los
efectos combinados del efecto Doppler (un efecto puramente cinemático) y el
corrimiento al rojo gravitacional.
Ejemplos:
1. Sea (M, g) = (R4 , η) el espacio-tiempo de Minkowski. Entonces las geodésicas nulas son rectas y en este caso k es un vector constante. Supongamos que el receptor se encuentra en reposo, u2 = ∂t , y que el transmisor se mueve a una velocidad v constante con respecto al transmisor,
u1 = γ(∂t + v · ∇), donde β := v/c, γ := (1 − |β|2 )−1/2 . Con la parametrización k = ωc (∂0 + k̂ · ∇), donde |k̂| = 1, la fórmula (4.53) implica que
ν1
= γ 1 − β · k̂ .
(4.54)
ν2
Esta es la fórmula para el efecto Doppler en relatividad especial. En particular, si β y k̂ apuntan en la misma dirección (es decir, el transmisor se
mueve hacia el receptor), entonces
s
ν1
1−β
1−β
=
,
=p
2
ν2
1+β
1−β
donde β := |β| = |v|/c. Si β 1, ν1 /ν2 ≈ 1 − |v|/c se reduce a la fórmula
no-relativista del efecto Doppler.
2. Sea (M, g) un espacio estacionario con campo vectorial de Killing tipo
tiempo T . Supongamos que tanto el transmisor como el receptor son observadores en reposo, de tal manera que su cuadrivelocidad es u = cN −1/2 T
con N := −g(T, T ) > 0. Entonces g(k, u) = cN −1/2 g(k, T ). Pero dado que
∇k k = 0, el resultado del Lema 13 implica que el producto escalar g(k, T )
es constante a lo largo de los rayos de luz. Entonces la fórmula (4.53)
implica
s
ν1
N (e2 )
.
(4.55)
=
ν2
N (e1 )
Esta fórmula muestra que dos observadores en reposo perciben frecuencias distintas si el factor N = −g(k, k) es diferente en e1 y e2 . Si el campo gravitacional es débil en el sentido que existen coordenadas locales
x0 , x1 , x2 , x3 tales que k = ∂0 y |gµν − ηµν | 1, entonces estamos en el
regimen de validez del lı́mite Newtoniano, y la ecuación (4.8) implica que
N = −g00 = 1 + 2φ/c2 con el potencial gravitacional Newtoniano φ. En
este caso podemos reescribir la ecuación (4.55) como
1
ν1
≈ 1 + 2 [φ(e2 ) − φ(e1 )] ,
ν2
c
o en términos del factor z de corrimiento al rojo,
z :=
ν2 − ν1
1
≈ 2 [φ(e1 ) − φ(e2 )] .
ν1
c
(4.56)
4.9. SISTEMAS DE REFERENCIA NO-ROTANTES
119
Para el campo gravitacional terrestre, φ(x) = gx, de tal manera que un
foton que se mueve en la dirección x de x1 a x2 = x1 + H percibe un
cambio relativo de frecuencias dado por z = −gH/c2 . Si H > 0, entonces
ν2 < ν1 y el foton pierde energı́a en este proceso, es decir, su frecuencia
se recorre hacia el rojo.
Ejercicio 19. Considere un proceso donde una partı́cula de masa m inicialmente en reposo cae en el campo gravitacional Newtoniano φ(x) = gx de x = H
a x = 0. En x = 0 convertimos toda la energı́a de la partı́cula en un foton que
se mueve en la dirección −x hasta llegar a x = H. En x = H convertimos toda
la energı́a del foton en un partı́cula en reposo y seguimos el proceso de esta
manera.
Demuestre que para conservar la energı́a en este proceso, el foton debe percibir un corrimiento hacia el rojo dado por z = −gH/c2 .
Ejercicio 20. Considere dos observadores que se mueven a lo largo de las
∂
en la métrica8
curvas integrales al campo vectorial ∂t
g = −c2 dt2 + a(t)2 dx2 + dy 2 + dz 2 ,
donde a : (0, ∞) → (0, ∞) es una función C ∞ -diferenciable. Demuestre que el
factor de corrimiento al rojo entre los dos observadores tiene la forma
z=
a(t1 )
− 1.
a(t2 )
(4.57)
Calcule la relación entre t1 y t2 .
4.9.
Sistemas de referencia no-rotantes
En esta sección consideramos la trayectoria tipo tiempo γ(τ ) de un observador, parametrizado por su tiempo propio τ , de tal manera que u = γ̇ es la
cuadrivelocidad, es decir, u es el vector tangente tal que g(u, u) = −c2 . Definimos la aceleración a := ∇u u. Usando la identidad de Ricci (3.60) encontramos
g(a, u) = g(∇u u, u) =
1
1
u[g(u, u)] = u[−c2 ] = 0,
2
2
y concluimos que la aceleración es ortogonal a u.
Preguntamos si se puede definir en cada punto p ∈ γ una base ortonormal
e0 , e1 , e2 , e3 preferida de Tp M . Es muy natural elegir e0 = u/c, de tal manera
que e0 sea alineada con el vector tangente a γ. Sin embargo, queda la pregunta
de cómo elegir los tres vectores espaciales e1 , e2 , e3 . Si γ fuera una geodésica,
a = ∇u u = 0, podrı́amos elegir tres vectores tangentes e1 , e2 , e3 mutualemente
8 Como
vamos a ver en el capı́tulo 8 esta métrica describe nuestro universo a grandes escalas.
120
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
ortonormales y ortogonal a up en un punto p ∈ γ dado y transportalos de
manera paralela a todos los otros puntos de la curva. Dado que la conexión ∇ de
Levi-Civita preserva los productos escalares, esto definirı́a una base ortonormal
e0 , e1 , e2 , e3 en cada punto de la curva.
Para generalizar esta construcción a trayectorias que no necesariamente se
encuentran en caı́da libre, nos basamos en la siguiente definición.
Definición 46 Sea (M, g) un espacio-tiempo, y sea u ∈ X (M ) un campo vectorial tal que g(u, u) = −c2 . Entonces definimos para cada X ∈ X (M ) la derivada de Fermi de X con respecto a u por
IFu X := ∇u X + c−2 g(u, X)a − c−2 g(a, X)u,
(4.58)
donde a := ∇u u.
La derivada de Fermi satisface las siguientes propiedades:
(i) IFu u = 0.
(ii) IFu = ∇u si a = 0.
(iii) Si X es ortogonal a u, entonces IFu X es la componente de ∇u X ortogonal
a u.
(iv) u[g(X, Y )] = g(IFu X, Y ) + g(X, IFu Y ) para todo X, Y ∈ X (M ).
(v) IFu (f X + Y ) = f IFu X + u[f ]X + IFu Y para todo X, Y ∈ X (M ) y todo
f ∈ F(M ).
De la misma forma que el transporte paralelo podemos definir el transporte
de Fermi de un vector X a lo largo de la curva γ a través de
IFu X = 0.
(4.59)
Si γ es una geodésica, el transporte de Fermi coincide con el transporte paralelo.
En general, la propiedad (iv) del transporte de Fermi implica que si IFu X =
IFu Y = 0, entonces el producto escalar g(X, Y ) es constante a lo largo de γ. El
transporte de Fermi permite definir un sistema de referencia no-rotante:
Definición 47 Sea γ(τ ) una curva tipo tiempo en un espacio-tiempo (M, g),
parametrizada por su tiempo propio τ . Un sistema de referencia no-rotante
a lo largo de γ es una base ortonormal e0 , e1 , e2 , e3 en cada punto p ∈ γ tal
que e0 = u/c y IFu ei = 0, i = 1, 2, 3, donde u = γ̇.
Observaciones:
1. Un sistema de referencia no-rotante a lo largo de una curva tipo tiempo γ
es único salvo una rotación global de e1 , e2 , e3 .
4.9. SISTEMAS DE REFERENCIA NO-ROTANTES
121
2. Un trompo (o una partı́cula con espı́n) se puede describir por un campo
vectorial S a lo largo de γ que satisface
IFu S = 0,
g(S, u) = 0.
(4.60)
En el origen de un sistema inercial local tal que u = ∂t estas ecuaciones
d
S = 0 de tal manera que se satisface el principio de equise reducen a dt
valencia. Con respecto a un sistema de referencia no-rotante, S = S i ei
donde u[S i ] = 0, es decir, las componentes de S con respecto al sistema
de referencia no-rotante son constantes.
A continuación, consideramos toda una familia de observadores, descrita por
las curvas integrales a un campo u de cuadrivelocidades, es decir u ∈ X (M ) es
tal que g(u, u) = −c2 . Sea X ∈ X (M ) un campo vectorial que es transversal a u
e invariante bajo el flujo de u, es decir, £u X = 0. Entonces definimos el campo
de desviación Y ∈ X (M ) correspondiente a X por su proyección ortogonal a u,
es decir,
Y := X + c−2 g(u, X)u.
(4.61)
El campo Y mide la distancia infinitesimal entre dos trayectorias vecinas. Usando las fórmulas £u u = [u, u] = 0 y
u[g(u, X)]
= g(∇u u, X) + g(u, ∇u X)
g(a, X) + g(u, ∇X u + £u X)
1
= g(a, X) + X[g(u, u)]
2
= g(a, X)
=
=
g(a, Y )
donde usamos la simetrı́a de ∇ en el segundo paso para obtener £u X = [u, X] =
∇u X − ∇X u, encontramos que el campo de desviación Y satisface la ecuación
diferencial
£u Y = c−2 g(a, Y )u.
(4.62)
Ahora vamos a reescribir esta ecuación en términos de un sistema de referencia
no-rotante e0 , e1 , e2 , e3 con respecto a uno de los observadores que se mueve
sobre una curva integral a u. Dado que Y es ortogonal a u podemos expander
Y = Y i ei , i = 1, 2, 3. Por otro lado, usando la definición (4.58) de la derivada
de Fermi y la simetrı́a de ∇ encontramos que
u[Y i ]ei = IFu Y = ∇u Y − c−2 g(a, Y )u = ∇u Y − [u, Y ] = ∇Y u = Y j ∇ej u.
Puesto que g(u, ∇ej u) = 21 ej [g(u, u)] = 0 podemos expander
∇ej u = B i j e i ,
(4.63)
y obtenemos la siguiente ecuación para las componentes de Y ,
u[Y i ] = (Σi j + Ωi j )Y j ,
(4.64)
122
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
donde descompusimos Bij = g(ei , ∇ej u) = Σij + Ωij en su parte simétrica,
Σij := B(ij) y su parte antisimétrica, Ωij := B[ij] . Notamos que para dos campos
de desviación Y y Z tenemos
u[g(Y, Z)] = u[δij Y i Z j ] = (Σi j + Ωi j )Y j Zi + Yj (Σj i + Ωj i )Z i = 2Σij Y i Z j ;
por esta razón Σ se llama el tensor de deformación, mientras que Ω se llama
el tensor de rotación porque genera rotaciones infinitesimales con respecto al
transporte de Fermi.
4.9.1.
La diferencia fı́sica entre espacio-tiempos estáticos
y estacionarios
Ahora consideramos el caso particular de observadores en reposo en un
espacio-tiempo (M, g) con campo vectorial de Killing de tipo tiempo k. En
este caso, u = cN −1/2 k donde N = −g(k, k), y
Bij = g(ei , ∇ej u) = −g(∇ej ei , u) = −cN −1/2 k (∇ej ei ) = cN −1/2 (∇ej k )(ei ).
e
e
De acuerdo a la ecuación de Killing (4.39) la parte derecha es antisimétrica, de
tal manera que
Σij
=
0,
−cN −1/2 (∇k )(ei , ej ).
e
Entonces para observadores estacionarios en un espacio-tiempo estacionario, el
tensor de deformación es cero, lo que implica que el producto escalar entre dos
vectores de desviación es constante a lo largo de sus trayectorias. Sin embargo,
los vectores de desviación pueden girar en el sistema de referencia no-rotante si
el espacio-tiempo es estacionario pero no estático:
Ωij
=
Lema 16 Sea (M, g) un espacio-tiempo estacionario con campo vectorial de
Killing de tipo tiempo k. Entonces Ωij = 0 para todos los observadores en reposo
si y sólo si (M, g) es estático con respecto a k.
Demostración. De acuerdo a la ecuación (4.43) el espacio-tiempo es estático
con respecto a k si y sólo si el tensor totalmente antisimétrico
X
ω(X, Y, Z) :=
k ⊗ ∇k (X, Y, Z),
X, Y, Z ∈ X (M ),
e
e
(XY Z)
es cero. Sus componentes con respecto a la base no-rotante e0 , e1 , e2 , e3 son
X
ωkij =
k (ek )(∇k )(ei , ej ) = 0,
e
e
(kij)
ω0ij
=
N
k (e0 )(∇k )(ei , ej ) = Ωij ,
c
e
e
4.9. SISTEMAS DE REFERENCIA NO-ROTANTES
123
donde usamos el hecho de que k (e0 ) = g(k, e0 ) = N 1/2 g(e0 , e0 ) = −N 1/2 y
e
k (ej ) = 0, j = 1, 2, 3.
e
El resultado del Lema 16 nos lleva a la siguiente conclusión: Sea (M, g) un
espacio-tiempo estacionario. En un sistema de referencia no-rotante, los vectores
de desviación correspondientes a los observadores en reposo son constantes si y
sólo si el espacio-tiempo es estático. En otras palabras, si el espacio-tiempo es
estacionario pero no estático existen vectores de desviación que adquieren una
rotación con respecto al sistema no-rotante. Esta rotación proviene del espaciotiempo mismo.
Ejercicio 21. Sea (M, g) un espacio-tiempo que es estacionario con respecto al
campo vectorial de Killing k. Demuestre que (M, g) es estático si y sólo si todos
los trompos que se mueven a lo largo de un observador en reposo son invariantes
bajo el flujo de k, es decir, si y sólo si dichos trompos satisfacen £k S = 0.
Instrucciones:
(a) Sea X ∈ X (M ) un campo vectorial que es ortogonal a k. Demuestre que
£k X también es ortogonal a k.
(b) Derive la fórmula
1
£k ej = − N 1/2 Ωi j ei
c
para un sistema no-rotante e0 , e1 , e2 , e3 a lo largo de un observador en
reposo.
(c) Usando el resultado del inciso (b), demuestre que un trompo S que se
mueve a lo largo de un observador en reposo satisface
1
£k S = − N 1/2 Ωi j S j ei ,
c
S = S j ej .
(4.65)
124
CAPÍTULO 4. EL PRINCIPIO DE EQUIVALENCIA
Capı́tulo 5
Las ecuaciones de Einstein
En el capı́tulo anterior analizamos la parte cinemática de la teorı́a general de
la relatividad, es decir, examinamos los efectos de un espacio-tiempo dado (M, g)
sobre los sistemas fı́sicos. En particular, vimos de que manera el campo gravitacional afecta la trayectoria de partı́culas libres y el campo electromagnético,
incluyendo la propagación de la luz. En el lı́mite Newtoniano, la ecuación de
las geodésicas que describe la trayectoria de partı́culas en caı́da libre se reduce
a la ecuación de movimiento Newtoniana para una partı́cula en un potencial
gravitacional Newtoniano.
En este capı́tulo abordamos la pregunta de cómo determinar la variedad M
y la métrica g. Como vamos a ver, las famosas ecuaciones de campo de Einstein
relacionan el campo gravitacional g con los campos materiales. En el lı́mite
Newtoniano, las ecuaciones de Einstein se reducen a la ecuación de Poisson
para el potencial gravitacional Newtoniano.
5.1.
La interpretación fı́sica de la curvatura
Antes de discutir las ecuaciones de Einstein, queremos preguntarnos cómo
medir el campo gravitacional en un espacio-tiempo (M, g) dado. Esta pregunta
no es totalmente trivial, porque como vimos en el capı́tulo anterior, dado un
evento p ∈ M , siempre se pueden encontrar coordenadas locales x0 , x1 , x2 , x3
en una vecindad de p (un sistema inercial local) de tal manera que
gµν (p)
∂σ gµν (p)
= ηµν ,
(5.1)
=
(5.2)
0.
Entonces en tal sistema de coordenadas se necesitan medir por lo menos las
desviaciones cuadráticas del evento p para detectar si existe o no un campo gravitacional, es decir, si la métrica es realmente distinta a la métrica de Minkowksi
ηµν . Como vamos a ver pronto, estas desviaciones cuadráticas están relacionadas con la desviación geodésica. Pero antes de analizar la desviación geodésica,
queremos reforzar el resultado (5.1,5.2) y demostrar que existe un sistema de
125
126
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
coordenadas locales en una vecindad de una trayectoria en caı́da libre de tal
manera que las ecuaciones (5.1,5.2) valgan para todos los puntos de la trayectoria. Esto es la justificación matemática para la existencia del “ascensor de
Einstein”.
De manera un poco más general, consideramos la trayectoria γ(τ ) de un
observador tipo tiempo, parametrizada por su tiempo propio τ . Sea e0 , e1 , e2 , e3
un sistema de referencia no-rotante a lo largo de γ, ver la definición 47. En
particular, e0 = u/c y IFu ej = 0, j = 1, 2, 3, donde u := γ̇/c es la cuadrivelocidad del observador. Entonces construimos un sistema de coordenadas locales
x0 , x1 , x2 , x3 adaptado al sistema de referencia no-rotante de la siguiente manera: Sea τ fijo, y sea n ∈ Tγ(τ ) M un vector unitario ortogonal a u, g(n, n) = 1,
g(u, n) = 0. Podemos expander n = nj ej con respecto al sistema de referencia
no-rotante. Sea
α(s; n, τ ) := expγ(τ ) (sn)
la geodésica a través de γ(τ ) con dirección inicial n, parametrizada por su longitud de arco s. En una vecindad U de γ cada punto se encuentra sobre exactamente una de estas geodésicas. Es decir, para cada q ∈ U existe exactamente
un triple (τ, s, n) tal que q = α(s; n, τ ). Entonces asociamos a q las coordenadas
x0 (q)
j
x (q)
:= cτ,
(5.3)
j
:= sn ,
j = 1, 2, 3.
(5.4)
Por construcción, estas coordenadas satisfacen
∂ ,
α = 0, 1, 2, 3,
(eα )p =
∂xα p
para todo evento p ∈ γ sobre la curva γ. Como consecuencia, tenemos
gαβ (p) = gp (eα , eβ ) = ηαβ ,
para todo p ∈ γ. Además, usando 0 = IFu eα = ∇u eα +c−1 g(e0 , eα )a−c−1 g(a, eα )e0
y
∂
(∇u eα )µ |p =
eα µ |p + uσ Γµ σν eα ν |p = cΓµ 0α (p)
∂τ
para p ∈ γ encontramos también
Γ0 00 (p) = 0,
Γ0 0j (p) =
Γk 00 (p) =
1
aj |p ,
c2
1 k a p,
c2
Γk 0j (p) = 0,
para todo p ∈ γ. Finalmente, porque para cada τ y n fijos, α(s; n, τ ) es una
geodésica con parámetro afı́n s, parametrizada por las coordenadas (xµ (s)) =
(cτ, snj ) tenemos
2 µ
d x
dxα dxβ
µ
0=
+ Γ αβ
, = Γµ ij (p)ni nj ,
ds2
ds ds p
5.1. LA INTERPRETACIÓN FÍSICA DE LA CURVATURA
127
y entonces Γµ ij (p) = 0 para todo p ∈ γ. Usando la fórmula
∂σ gαβ (p)
= ∇σ gαβ (p) + Γµ σα (p)gµβ (p) + Γµ σβ (p)gαµ (p)
= ηαµ Γµ σβ (p) + ηβµ Γµ σα (p),
encontramos que todas las derivadas parciales de primer orden de gαβ son cero
sobre γ con la excepción de ∂k g00 (p) = −2c−2 ak (p). Concluimos que en las
coordenadas locales (5.3,5.4) la cuadrivelocidad es
u=
∂
∂
= c 0,
∂τ
∂x
y la métrica tiene la siguiente forma simple
2
k
g = − 1 + 2 ak (τ )x dx0 ⊗ dx0 + δij dxi ⊗ dxj + O(|x|2 )αβ dxα ⊗ dxβ , (5.5)
c
x = (x1 , x2 , x3 ), en la vecindad U de la curva γ. Para todos los puntos p ∈ U
sobre la curva γ, las componentes de la métrica son iguales a las componentes
de la métrica de Minkowksi. A primer orden en la desviación x de la curva, la
única perturbación que el observador puede medir es la aceleración de sı́ mismo.
Si γ es una geodésica, entonces a = 0 y se satisfacen las ecuaciones (5.1,5.2)
para todos los puntos p ∈ γ de la curva.
Para que un observador pueda medir el campo gravitacional, tiene que medir las desviaciones cuadráticas entre dos trayectorias vecinas. Como en la sección 4.9 consideramos una familia de observadores descrita por su campo de
cuadrivelocidades u ∈ X (M ), normalizado de tal manera que g(u, u) = −c2 .
Sea Y ∈ X (M ) un campo de desviación. De acuerdo a la ecuación (4.62) Y
satisface
£u Y = c−2 g(a, Y )u,
(5.6)
donde a = ∇u u es el campo de aceleración. En términos de la derivada de Fermi,
ver la ecuación (4.58), esta ecuación y la simetrı́a de ∇ implican que
IFu Y = ∇u Y − c−2 g(a, Y )u = ∇u Y − [u, Y ] = ∇Y u.
Aplicando el operador IFu a ambos lados de esta ecuación y usando la definición 38 de la curvatura, obtenemos
IFu IFu Y
=
∇u ∇Y u + c−2 g(u, ∇Y u)a − c−2 g(a, ∇Y u)u
=
∇u ∇Y u − ∇Y (∇u u − a) − ∇[u,Y ]−c−2 g(a,Y )u u − c−2 g(a, ∇Y u)u
=
R(u, Y )u + ∇Y a + c−2 g(∇Y a, u)u + c−2 g(a, Y )a,
donde hemos usado la ecuación (5.6) y g(u, ∇Y u) = Y [g(u, u)]/2 = 0 en el
segundo paso y la ecuación 0 = Y [g(a, u)] = g(∇Y a, u) + g(a, ∇Y u) en el tercer
paso. Denotando por Z⊥ := Z + c−2 g(u, Z)u la parte del vector Z ortogonal a
u concluimos que un vector de desviación Y satisface la ecuación
IFu2 Y = R(u, Y )u + (∇Y a)⊥ + c−2 g(a, Y )a.
(5.7)
128
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
En particular para geodésicas, a = 0 y la ecuación (5.7) se reduce a la ecuación
de desviación geodésica
∇2u Y = R(u, Y )u.
(5.8)
Con respecto a un sistema de referencia no-rotante e0 = u/c, e1 , e2 , e3 podemos
expander Y = Y i ei , y dado que ∇u ei = IFu ei = 0, i = 1, 2, 3, tenemos ∇u Y =
u[Y i ]ei , ∇2u Y = u2 [Y i ]ei , de tal manera que la ecuación (5.8) también se puede
escribir como
d2 i
Y = c2 Ri 00j Y j .
(5.9)
dτ 2
Esto constituye un sistema de tres ecuaciones diferenciales ordinarias lineales de
segundo orden para las tres componentes (Y 1 , Y 2 , Y 3 ) del vector de desviación
Y . El vector Y mide la distancia infinitesimal entre dos trayectorias vecinas en
caı́da libre. La aceleración de esta distancia está directamente relacionada con
el tensor de curvatura. En particular, si el tensor de curvatura es cero, entonces
el vector de desviación Y depende linealmente de τ como es el caso para la
distancia que separa dos rectas en el plano Euclideano.
Para lo que sigue resulta ser instructivo comparar la ecuación (5.9) con la
desviación entre trayectorias x(t) en la teorı́a Newtoniana que se mueven bajo
la influencia de un potencial gravitacional φ:
ẍi = −(∂ i φ)(x).
Tomando la variación a ambos lados de esta ecuación obtenemos
Ÿ i = −(∂ i ∂j φ)(x)Y j ,
(5.10)
donde Y i = δxi denota la variación entre las trayectorias. Comparando esta
ecuación con la ecuación (5.9) de desviación geodésica, descubrimos la correspondencia
Ri 0j0 ↔ c−2 ∂ i ∂j φ
(5.11)
entre el caso relativista y el caso Newtoniano. En particular, la traza de (5.11)
da
R00 ↔ c−2 ∆φ.
(5.12)
Al nivel fı́sico la parte derecha de la ecuación (5.8) representa la fuerza de
marea por unidad de masa inducida por el campo gravitacional. A diferencia
de la “fuerza gravitacional por unidad de masa” que no tiene ningún sentido
fı́sico en general, la fuerza de marea tiene un sentido covariante independiente
del observador, puesto que corresponde a contracciones de vectores con el tensor
de curvatura. En particular, mientras que la “fuerza gravitacional” puede ser
transformada a cero a lo largo de una trayectorı́a en caı́da libre dada, las fuerzas de mareas no pueden ser transformadas a cero. Concluimos que el campo
gravitacional g del espacio-tiempo (M, g) se puede medir a través de la fuerza
de marea entre dos partı́culas de prueba en caı́da libre. De esta manera, se mide
la métrica g a través de su curvatura.
5.2. LAS ECUACIONES DE EINSTEIN EN VACÍO
129
Observación: Como vimos en la sección 4.3, las trayectorias de partı́culas en
caı́da libre se obtienen de la primera variación del funcional
S[γ] =
Ze2 p
−g(γ̇, γ̇) dλ,
(5.13)
e1
para curvas γ de tipo tiempo que conectan el evento e1 al evento e2 . (Recordamos
que S[γ]/c mide el tiempo propio de e1 a e2 a lo largo de la curva γ.) La
ecuación de desviación geodésica (5.8) se puede obtener de la segunda variación
del funcional S[γ], ver por ejemplo [11]. La segunda variación de S[γ] juega un
papel importante en los teoremas de singularidad.
Ejercicio 22. Sea (U, Φ) una carta local del espacio-tiempo donde vale el lı́mite
Newtoniano. Usando la expresión (4.8), demuestre que en U vale la siguiente
expresión para el tensor de curvatura:
Ri 0j0 = ∂ i ∂j
5.2.
φ
c2
.
Las ecuaciones de Einstein en vacı́o
Postulamos un principio variacional para el campo métrico g que es de la
siguiente forma:
Z
S[g] := f [g],
(5.14)
K
donde K ⊂ M es un subconjunto compacto del espacio-tiempo M , y donde
f [g] ∈ F(M ) es una función C ∞ -diferenciable sobre M que depende de g. Tenemos el siguiente resultado para la variación de S:
Lema 17 La variación del funcional S[g] definido en (5.14) es
Z 1
−1
δS[g] =
δf [g] + f Tr(g δg) ,
2
(5.15)
K
donde Tr(g −1 δg) := C[g −1 ⊗ δg] = g µν δgµν .
Demostración. Podemos suponer que K ⊂ U está enteramente contenido
en una carta local (U, φ); de otra manera usamos una partición de la unidad.
130
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
Entonces en las coordenadas locales correspondientes,
Z q
δS[g] = δ f | det(gµν )|d4 x
K
q
Z 1
=
δf + f g µν δgµν
| det(gµν )|d4 x
2
K
Z 1
−1
=
δf + f Tr(g δg) ,
2
K
donde usamos el resultado del Lema 12 en el segundo paso.
Ahora nos preguntamos como elegir la función f . Queremos que f dependa
algebraicamente de gµν y de sus derivadas parciales. No puede depender nada
más de gµν y de sus derivadas parciales de primer orden, porque si no f serı́a
constante. Efectivamente, en el origen de un sistema inercial local tal función
solamente dependerı́a de ηµν . Entonces para obtener una acción no-trivial necesitamos que f dependa de gµν y de sus primeras derivadas parciales de primer
y de segundo orden. La función más simple que cumple con estos requisitos es
el escalar de Ricci, R = Tr(g −1 Ric). Esto nos lleva a la acción de EinsteinHilbert,
Z
c3
SEH [g] :=
R[g],
(5.16)
16πGN
K
3
donde el factor c /(16πGN ) con c la velocidad de la luz y GN la constante de
Newton se introduce para que SEH tenga las dimensiones de una acción. Vamos a
calcular la variación de SEH con la suposición que δg y sus derivadas covariantes
de primer orden, ∇δg, son cero en la frontera ∂K. Para esto necesitamos calcular
la variación del escalar de Ricci, R[g].
Introduciendo coordenadas locales x0 , x1 , x2 , x3 observamos primero
δR[g] = δ(g µν Rµν ) = g µν δRµν + δ(g µν )Rµν .
(5.17)
Para calcular el segundo término notamos que la variación de
g µν gνβ = δ µ β
da
δ(g µν )gνβ + g µν δgνβ = 0,
de tal manera que
δ(g µν ) = −g µα g νβ δgαβ .
(5.18)
Para calcular el primer término en (5.17) calculamos las variaciones de las formulas (3.62) y (3.83) y obtenemos
δΓα µν =
1 αβ
g (∇µ δgνβ + ∇ν δgµβ − ∇β δgµν )
2
(5.19)
5.2. LAS ECUACIONES DE EINSTEIN EN VACÍO
131
y
δRµν = ∇α δΓα µν − ∇ν δΓα αµ .
(5.20)
Usando todo esto en la ecuación (5.17) obtenemos
δR[g] = −Rµν δgµν + div W,
(5.21)
donde W ∈ X (M ) es el campo vectorial con componentes W µ := (g µν ∇α −
g αν ∇µ )δgαν . Introduciendo este resultado en la fórmula del Lema 17, aplicando
el teorema de Gauss en su forma covariante y usando el hecho de que W |∂K = 0,
obtenemos
Z
c3
Tr(Gδg),
(5.22)
δSEH [g] = −
16πGN
K
donde G ∈ T
2
0 (M )
es el tensor de Einstein definido por
1
Gµν := Rµν − g µν R.
2
(5.23)
Entonces concluimos que los puntos estacionarios de la acción de EinsteinHilbert corresponden a las ecuaciones de campo de Einstein en el vacı́o,
Gµν = 0.
(5.24)
Observaciones
1. Si no se asume que ∇δg = 0 en la frontera ∂K, la variación de SEH [g] da
términos adicionales en la frontera que deben ser cancelados modificando
la acción de Einstein-Hilbert (ver el apéndice E.1 en la referencia [2]).
2. Las ecuaciones Gµν = 0 son equivalentes a Rµν = 0, puesto que la traza
del tensor de Einstein, G := g µν Gµν = −R es cero si y sólo si R = 0.
3. Las ecuaciones (5.24) constituyen un sistema nolineal acoplado de diez
ecuaciones con derivadas parciales para las componentes del tensor métrico gµν . Entonces no es sorprendente que se conozcan solamente pocas
soluciones exactas con relevancia fı́sica.
La solución más simple es la métrica de Minkowski, gµν = ηµν para la
cuál todas las componentes del tensor de curvatura son cero. De hecho,
cualquier transformación de coordenadas,
gµν =
∂xα ∂xβ
ηαβ
∂y µ ∂y ν
también satisface las ecuaciones de Einstein, dado que Gµν son las componentes de un campo tensorial, pero esta nueva solución solamente representa la métrica de Minkowski en una carta de coordenadas y 0 , y 1 , y 2 , y 3
curvilineas. Una solución no-trivial de las ecuaciones de Einstein en el
vacı́o se derivará en el próximo capı́tulo.
132
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
4. La acción (5.16) es invariante bajo difeomorfismos ϕ : M → M que dejan
K invariante,
SEH [ϕ∗ g] = SEH [g].
En particular, si X ∈ X (M ) es un campo vectorial C ∞ -diferenciable que es
identicamente cero fuera de K, y si ϕλ es el flujo correspondiente, entonces
la familia de métricas g(λ) := (ϕλ )∗ g satisface
SEH [g(λ)] = SEH [g].
para todo |λ| suficientemente pequeño. Tomando la variación a ambos
lados de esta ecuación y usando (5.22) obtenemos
0=
Z
c3
d
SEH [g(λ)]
=−
Tr(Gδg),
dλ
16πGN
λ=0
K
donde
δg =
d λ ∗ = £X g,
(ϕ ) g dλ
λ=0
donde tomamos en cuenta la definición (3.71) de la derivada de Lie. Por
otro lado, usando la ecuación de Killing (3.79), tenemos
Tr(Gδg) = 2Gµν ∇µ Xν = 2∇µ (Gµν Xν ) − 2(∇µ Gµν )Xν ,
y entonces usando el teorema de Gauss en su forma covariante y el hecho
de que X|∂K = 0 llegamos a
Z
0=
g(div G, X)
K
para todo X ∈ X (M ) identicamente cero fuera de K, lo que implica que
div G = 0.
(5.25)
Estas son las identidades de Bianchi contraidas (3.99). Entonces dichas
identidades son una consecuencia directa de la invarianza de la acción de
Einstein-Hilbert bajo difeomorfismos.
Ejercicio 23.
¯ libres de
(a) Sea (M, g) una variedad Lorentziana con dos conexiones, ∇ y ∇
torsión pero no necesariamente compatibles con la métrica g. Demuestre
¯ X Y , X, Y ∈ X (M ) define un campo tensorial del
que C(X, Y ) := ∇X Y − ∇
tipo (1, 2) sobre M . Calcule sus componentes en términos de los sı́mbolos
¯
de Christoffel asociados a ∇ y ∇.
5.3. LAS ECUACIONES DE EINSTEIN CON MATERIA
133
¯ están relacio(b) Demuestre que los tensores de curvatura asociados a ∇ y ∇
nados entre ellos a través de
¯ [µ C α ν]β + 2C α σ[µ C σ ν]β ,
Rα βµν = R̄α βµν + 2∇
donde los paréntesis B[µν] := (Bµν − Bνµ )/2 denotan la antisimetrización
en µν.
(c) Considere la acción de Einstein-Hilbert
c3
S[g, ∇] =
16πG
Z
Tr(g −1 Ric[∇]),
K
donde la métrica g y la conexión ∇ se toman como campos independientes, y donde Ric[∇] es el tensor de Ricci asociado a la conexión ∇.
Suponiendo que g y ∇ son ceros en la frontera ∂K, obtenga las ecuaciones que describen los puntos estacionarios de S y demuestre que son
equivalentes a las ecuaciones de Einstein en el vacı́o (5.24).
5.3.
Las ecuaciones de Einstein con materia
Ahora consideramos, aparte de la métrica g, un campo de materia Φ. Este
campo puede ser o un campo escalar, en tal caso Φ es una función sobre la
variedad, o bien un campo electromagnético, en tal caso Φ = A es un campo de
covectores. En general Φ puede ser cualquier campo tensorial sobre el espaciotiempo (M, g), posiblemente con grados de libertad internos.1
Supongamos que en relatividad especial, la dinámica de Φ está descrita por
un Lagrangiano que depende de manera algebráica de Φ, de sus primeras derivadas parciales ∂µ Φ y de la métrica de Minkowki ηµν ,
LM = LM (Φ, ∂µ Φ, ηµν ).
Suponiendo que LM es un escalar de Lorentz, definimos la acción correspondiente a la materia a través de2
Z
1
SM [Φ] =
LM (Φ, ∂µ Φ, ηµν )d4 x,
c
K
donde K ⊂ R4 es un subconjunto compacto del espacio-tiempo de Minkowski.
Como en la mecánica clásica, las ecuaciones de movimiento se obtienen de los
puntos estacionarios de la acción, δSM = 0, suponiendo que la variación de Φ
1 Para los fermiones, Φ es un campo espinorial, pero por simplicidad excluimos este caso
en este curso.
2 El factor de 1/c en la definición de S
00 del
M se pone para que LM y las componentes τ
tensor de energı́a-impulso tengan las unidades de una densidad de energı́a.
134
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
es cero en la frontera ∂K del dominio K. El resultado son las ecuaciones de
Euler-Lagrange,
∂LM
∂LM
,
Πµ :=
,
(5.26)
∂µ Πµ =
∂Φ
∂(∂µ Φ)
donde Πµ es el momento canónico. La satisfacción de las ecuaciones de EulerLagrange implican la conservación del tensor de enrgı́a-impulso canónico,
τ µν := −Πµ ∂ ν Φ + η µν LM ,
∂µ τ µν = 0,
lo que a su vez implica la conservación de la energı́a y del momento lineal total
del sistema,
Z
ν
P := τ 0ν d3 x,
R3
asumiendo que Φ decae a cero suficientemente rápido para |x| → ∞.
Ejemplos:
1. La ecuación de onda con potencial
Φ = F (Φ),
F (Φ) := −
∂V
(Φ),
∂Φ
se obtiene del Lagrangiano
1
Lescalar (Φ, ∂µ Φ) = − η µν ∂µ Φ · ∂ν Φ − V (Φ).
2
El tensor de energı́a-impulso canónico es
1
µν
τescalar
= ∂ µ Φ · ∂ ν Φ − η µν [∂ α Φ · ∂α Φ + 2V (Φ)] .
2
2. Las ecuaciones de Maxwell en ausencia de fuentes se pueden obtener del
Lagrangiano
1
Lem (∂µ Aν ) = − η µα η νβ Fµν Fαβ ,
4
Fµν = ∂µ Aν − ∂ν Aµ .
El momento canónico es
Πµν
em =
∂Lem
1
∂Fαβ
= − F αβ
= −F µν
∂(∂µ Aν )
2
∂(∂µ Aν )
y el tensor de energı́a-impulso canónico es
1
µν
τem
= F µα ∂ ν Aα − η µν F αβ Fαβ .
4
5.3. LAS ECUACIONES DE EINSTEIN CON MATERIA
135
Cuando pasamos a la relatividad general, el principio de equivalencia nos
dice que debemos reemplazar ηµν por las componentes de la métrica curva gµν
y las derivadas parciales ∂µ Φ por las derivadas covariantes ∇µ Φ. Con esto, el
Lagrangiano para la materia tiene la forma
LM = LM (Φ, ∇Φ, g),
(5.27)
y como antes, suponemos que LM es una función sobre la variedad. Entonces la
acción correspondiente es
Z
1
LM (Φ, ∇Φ, g),
(5.28)
SM [Φ, g] =
c
K
con K ⊂ M compacto. Para simplificar los cálculos de abajo, suponemos que
K ⊂ U está contenido dentro de una carta local. La variación de SM con respecto
a Φ dejando la métrica g fija da
Z
1
δΦ SM =
δΦ LM (Φ, ∇Φ, g)
c
K
Z 1
∂LM
∂LM
=
δΦ +
(∇µ δΦ)
c
∂Φ
∂(∇µ Φ)
K
Z Z
1
∂LM
∂LM
∂LM
=
− ∇µ
δΦ ,
δΦ + ∇µ
c
∂Φ
∂(∇µ Φ)
∂(∇µ Φ)
K
K
donde usamos el hecho de que δΦ (∇µ Φ) = ∇µ δΦ en el segundo paso. Aplicando
el teorema de Gauss podemos convertir la segunda integral en una integral de
frontera que es cero si suponemos otra vez que δΦ|∂K = 0. Entonces los puntos
estacionarios de SM [Φ, g] con métrica fija g, es decir los campos Φ para los cuales
δΦ SM [Φ, g] = 0 para todas las variaciones δΦ que son cero en ∂K, satisfacen las
ecuaciones de Euler-Lagrange covariantes,
∇·Π=
∂LM
,
∂Φ
Π :=
∂LM
.
∂(∇Φ)
(5.29)
Ahora variamos SM con respecto a la métrica g, fijando Φ. Usando el resultado del Lema 17 obtenemos
Z 1
1
−1
δg SM =
δg LM + LM Tr(g δg)
c
2
K
Z 1
∂LM
∂LM
1
=
δg (∇µ Φ) +
δgµν + LM g µν δgµν .
c
∂(∇µ Φ)
∂gµν
2
K
En general, la expresión ∇µ Φ depende de la métrica dado que ∇ es la conexión
de Levi-Civita, y en coordenadas locales tiene la forma
∇µ Φ... ... = ∂µ Φ... ... + Γ. .. Φ... ... + ... − Γ. .. Φ... ... ,
136
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
de tal manera que
δg (∇µ Φ... ... ) = δΓ. .. Φ... ... + ... − δΓ. .. Φ... ... .
Por otro lado, vimos en la ecuación (5.19) que la variación de los sı́mbolos
de Christoffel forman las componentes de un campo tensorial que se puede
escribir en términos de las primeras derivadas covariantes de la variación de
la métrica, δg. Aplicando el teorema de Gauss, y asumiendo que δg|∂K = 0
podemos factorizar la variación de g, y podemos escribir la variacón de SM con
respecto a g en la forma
Z
Z
1
1
Tr(T δg) =
T µν δgµν ,
(5.30)
δg SM =
2c
2c
K
K
donde el campo tensorial T ∈ T 2 0 (M ) es simétrico y se llama tensor de
energı́a-impulso. De esta manera, el tensor de energı́a-impulso también se
puede interpretar como la derivada funcional de SM , y se escribe
T µν := 2c
δSM
.
δgµν
(5.31)
Observaciones:
1. A diferencia del tensor de energı́a-impulso canónico τ µν , T µν = T νµ es
simétrico por definición.
2. Se puede mostrar que en relatividad especial siempre es posible sumar un
término a τ µν para obtener un nuevo tensor Θµν simétrico con el mismo
contenido fı́sico que τ µν . Este tensor coincide precisamente con el tensor
T µν definido en (5.31) en el lı́mite donde gµν = ηµν es la métrica de
Minkowski, ver la referencia [12].
3. Podemos usar el mismo tipo de argumentos que en la sección previa para
demostrar que las ecuaciones de Euler-Lagrange y la invarianza de SM
bajo difeomorfismos implican que
div T = 0.
(5.32)
Para demostrar esta afirmación, tomamos el flujo ϕλ de un campo vectorial
X ∈ X (M ) que es identicamente cero fuera de K, y consideramos la
variación particular Φ(λ) := (ϕλ )∗ Φ, g(λ) := (ϕλ )∗ g. La invarianza de
SM bajo difeomorfismos implica
SM [Φ(λ), g(λ)] = SM [Φ, g]
para todo |λ| suficientemente pequeño. Tomando la variación a ambos
lados, encontramos
0 = δSM = δΦ SM + δg SM .
5.3. LAS ECUACIONES DE EINSTEIN CON MATERIA
137
La variación con respecto a Φ es cero si se satisfacen las ecuaciones de
Euler-Lagrange (5.29). Usando la definición del tensor de energı́a-impulso
y δgµν = £X gµν = ∇µ Xν + ∇ν Xµ concluimos que
Z
0 = T µν ∇µ Xν ,
K
lo que implica la ecuación (5.32) después de aplicar el teorema de Gauss.
En el espacio de Minkowski, la ecuación (5.32) se reduce a ∂µ T µν = 0 y
como vimos, esto da lugar a la conservación de la energı́a y del momento
lineal total del sistema. Para espacios curvos, la ecuación (5.32) no da
lugar a ninguna cantidad conservada en general. Efectivamente, para una
métrica curva se pierde la invarianza traslacional, y por este motivo no se
espera conservación de energı́a o de momento lineal, ni siquiera al nivel
local. Una excepción es cuando el espacio-tiempo (M, g) admite un vector
de Killing k; en este caso se conserva la corriente J µ := −T µν kν , ∇µ J µ =
0, como vimos en el Lema 14, y el teorema de Gauss covariante da una ley
de conservación. Otra excepción son los espacio-tiempos asintóticamente
planos para los cuales se pueden definir la masa y el momento lineal total
del espacio-tiempo, ver el capı́tulo 11 en [2].
Ejemplos: Retomamos los ejemplos de la ecuación de onda con potencial y de
la teorı́a de Maxwell, y calculamos el tensor de energı́a-impulso en ambos casos:
1. Para la ecuación de onda con potencial sobre un espacio curvo, la acción
es
Z
1
[g µν ∇µ Φ · ∇ν Φ + 2V (Φ)] .
Sescalar [Φ, g] = −
2c
K
Usando la fórmula (5.18) para la variación de la métrica inversa y usando
el resultado del Lema 17 encontramos
Z 1
1 µν α
µ
ν
δg Sescalar =
∇ Φ · ∇ Φ − g [∇ Φ · ∇α Φ + 2V (Φ)] δgµν ,
2c
2
K
y obtenemos
1
µν
Tescalar
= ∇µ Φ · ∇ν Φ − g µν [∇α Φ · ∇α Φ + 2V (Φ)] .
2
En el caso particular de un fondo de Minkowski, esto coincide precisamente
con el tensor de energı́a-impulso canónico.
2. Para el caso de Maxwell la acción es
Z
1
Sem (A, g) = −
g µα g νβ Fµν Fαβ ,
4c
K
Fµν = ∇µ Aν − ∇ν Aµ
138
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
y
δg Sem
=
=
Z 1 σρ αβ
µσ αρ νβ
µα νσ βρ
(g g g + g g g )Fµν Fαβ − g F Fαβ δgσρ
2
K
Z 1
1
F σα F ρ α − g σρ F αβ Fαβ δgσρ .
2c
4
1
4c
K
Entonces el tensor de energı́a-impulso es
1
µν
Tem
= F µβ F ν β − g µν F αβ Fαβ .
4
A diferencia de la expresión correspondiente para el tensor de energı́aµν
impulso canónico, Tem
es simétrico e invariante bajo transformaciones de
norma Aµ 7→ Aµ + ∇µ χ.
Finalmente, describimos el sistema acoplado formado por el campo gravitacional g y el campo de materia Φ. La acción para este sistema es la suma de la
acción de Einstein-Hilbert y de la acción material,
S[Φ, g] = SEH [g] + SM [Φ, g],
(5.33)
donde SEH [g] está definido en (5.16) y SM [Φ, g] en (5.28). Las ecuaciones de
movimiento corresponden a los puntos estacionarios de S,
0 = δS = δΦ S + δg S,
para todas las variaciones de Φ y de g que son cero cerca de ∂K. Fijando
g y variando Φ obtenemos las ecuaciones de Euler-Lagrange (5.29), puesto que
SEH [g] no depende de los campos materiales. Por otro lado, fijando Φ y variando
con respecto a g obtenemos las ecuaciones de Einstein en presencia de materia,
Gµν =
8πGN µν
T .
c4
(5.34)
Entonces la materia determina la curvatura del espacio tiempo a través de las
ecuaciones de Einstein. Por otro lado, la curvatura de la métrica afecta los campos materiales a través de las ecuaciones de Euler-Lagrange (5.29) covariantes.
Este acople en ambas direcciones entre la métrica y los campos materiales hace
que sea difı́cil encontrar soluciones del sistema total, pues hay que resolver el
sistema acoplado (5.29,5.34).
Notamos también que las propiedades del tensor de energı́a-impulso T µν son
compatibles con las propiedades correspondientes del tensor de Einstein. Primero, T µν es simétrico en µν, segundo, su divergencia covariante es cero si se
satisfacen las ecuaciones de Euler-Lagrange, lo que encaja perfectamente con la
simetrı́a de Gµν y las identidades de Bianchi contraidas (5.25).
5.4. FLUIDOS RELATIVISTAS
139
Ejemplo: El sistema acoplado formado por un campo electromagnético y un
campo gravitacional se describe a través de las ecuaciones de Einstein-Maxwell,
∇µ F µν = 0,
Fµν = ∇µ Aν − ∇ν Aµ ,
1 µν αβ
8πGN
8πGN µν
µβ ν
µν
Tem =
F F β − g F Fαβ .
G =
c4
c4
4
(5.35)
(5.36)
Dado que la traza del tensor de energı́a-impulso es cero en el caso de Maxwell3 ,
µν
gµν Tem
= 0, las ecuaciones de Einstein son equivalentes a
Rµν =
5.4.
8πGN µν
Tem .
c4
Una formulación Lagrangiana para los fluidos relativistas
En la sección previa vimos dos ejemplos de campos materiales clásicos: el
campo escalar y el campo electromagnético. En esta sección vamos a formular
un principio variacional para una clase importante de campos materiales que
son los fluidos. Aunque a diferencia de los ejemplos previos estos campos no son
fundamentales, su descripción fenomenológica juega un papel muy importante
en procesos astrofı́sicos con campos gravitacionales fuertes, como por ejemplo
un disco de acreción alrededor de un agujero negro o el colapso gravitacional de
una estrella suficientemente masiva.
Describimos el fluido de la siguiente forma.4 Consideramos una variedad
tridimensional Γ que describe el fluido en su forma de reposo. Es decir, cada
punto q ∈ Γ representa un elemento dado del fluido. En este sentido, los puntos
q de Γ se pueden interpretar como etiquetas que dan un nombre a cada elemento
de fluido. El movimiento del fluido está descrito por un mapeo C ∞ -diferenciable
F : M → Γ del espacio-tiempo (M, g) en Γ que tiene la siguiente interpretación:
q = F (p) es el elemento de fluido que se encuentra en el evento p. Entonces la
lı́nea de flujo γq del elemento de fluido q es
γq := F −1 (q) = {p ∈ M : F (p) = q} ⊂ M.
Para garantizar que γq sea una curva diferenciable tipo tiempo hacemos las
siguientes suposiciones sobre la diferencial dFp : Tp M → TF (p) Γ del mapeo
F : Su núcleo, ker(dFp ) ⊂ Tp M , es de dimensión uno y de tipo tiempo para
todo p ∈ M . Por el teorema de la función implı́cita, esto implica que existe en
cada evento p ∈ M una única curva γ : (−ε, ε) → M a través de p tal que
F (γ(t)) = F (p) para todo |t| < ε. Por unicidad, γ ⊂ γq , y concluimos que γq
es una curva diferenciable. Su vector tangente up está en el kernel de dFp para
todo p, dado que
d
d
0 = q = F (γq ) = dFp (up ),
dt
dt
3 Esto
ya no es cierto en teorı́as de la gravedad con dimensiones extra.
hecho, la misma descripción se puede usar para cuerpos elásticos, ver por ejemplo la
referencia [12].
4 De
140
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
y entonces γq es una curva tipo tiempo. Normalizamos u para que g(u, u) = −c2 ,
de tal manera que u sea la cuadrivelocidad del fluido.
Ejemplo: Sean (M, g) = (R4 , η) el espacio de Minkowki y (Γ, m) = (R3 , δ) el
espacio Euclideano. Un flujo homogéneo con velocidad v se describe a través del
mapeo F : M → Γ definido por
y = F (x) = x − tv,
(t, x) ∈ M.
La lı́nea de flujo correspondiente al elemento de fluido y es
γy = {(t, y + tv) : t ∈ R}
y su cuadrivelocidad es
1
u= q
1−
|v|2
c2
(∂t + v · ∇) .
Para describir la dinámica del fluido vamos a necesitar definir su densidad,
aparte de su cuadrivelocidad. Para esto equipamos Γ con una métrica Riemanniana m que tiene el siguiente papel: El número N (V ) de partı́culas contenidas
en un subconjunto compacto V ⊂ Γ del fluido es
Z
N (V ) := 1.
V
Si V está contenidoR en una
coordenadas (y a ) = (y 1 , y 2 , y 3 ),
p carta local (W, ψ) con
3
−1
entonces N (V ) = ψ(V ) det(mab )(ψ (y))d y. En particular, las componentes
mab de m tienen las unidades de uno entre longitud al cuadrado. Mediante el
mapeo F : M → Γ, podemos introducir el pull-back de la métrica m sobre M ,
H := F ∗ m.
(5.37)
Lema 18 El campo tensorial H = F ∗ m ∈ T 0 2 (M ) satisface las siguientes
propiedades:
(i) H es simétrico: H(X, Y ) = H(Y, X) para todo X, Y ∈ X (M ).
(ii) H es semi-positivo: H(X, X) ≥ 0 para todo X ∈ X (M ) y H(X, X) = 0 si
y sólo si X es proporcional a u.
(iii) H es ortogonal a u: H(u, Y ) = 0 para todo Y ∈ X (M ).
(iv) H es invariante con respecto al flujo de u: £u H = 0.
Demostración. (i) es una consecuencia directa de la simetrı́a de m. Para
ver (ii) tomamos X ∈ X (M ). Entonces H(X, X) = m(dF (X), dF (X)) ≥ 0
y H(X, X) = 0 si y sólo si dF (X) = 0. Como ker(dF ) es generado por el
vector u, esto es equivalente a decir que X es proporcional a u. Para (iii)
5.4. FLUIDOS RELATIVISTAS
141
tomamos Y ∈ X (M ). Entonces H(u, Y ) = m(dF (u), dF (Y )) = 0, dado que
u ∈ ker(dF ). Para demostrar (iv) notamos primero que si ϕt es el flujo de u,
entonces t 7→ ϕt (p) es la lı́nea de flujo a través del punto p y F ◦ ϕt (p) = F (p)
para todo (t, p) ∈ D. Entonces
d d d t ∗
t ∗
(ϕ
)
H
=
(F
◦
ϕ
)
m
=
F ∗ m = 0.
£u H =
dt t=0
dt t=0
dt t=0
A continuación, definimos la densidad de partı́culas n ∈ F(M ) y la corriente de partı́culas J ∈ X (M ). Para esto, tomamos una tetrada e0 , e1 , e2 , e3
tal que e0 = u/c y consideramos las componentes Hab := H(ea , eb ), a, b = 1, 2, 3
del pull-back de la métrica m. Entonces definimos
p
J := nu.
(5.38)
n := det(Hab ),
Observamos primero que la definición de n es independiente de la orientación
de los tres vectores e1 , e2 , e3 , porque si R = (Ra b ) ∈ O(3) es una rotación o
0
= Ra c Rb d Hcd de tal
una inversión de la paridad y e0a := Ra b eb , entonces Hab
0
2
manera que det(Hab ) = det(Hab )| det(R)| = det(Hab ). Luego, demostramos
que la corriente J es conservada.
Teorema 12 La corriente J = nu satisface div J = 0.
Demostración. Vamos a calcular el cambio infinitesimal £u n = u[n] de la
densidad de partı́culas a lo largo de una lı́nea de flujo. Usando el resultado del
Lema 12 encontramos primero que
2n£u n = £u (n2 ) = n2 H ab u[Hab ] = n2 H ab [(£u H)(ea , eb ) + 2H(ea , £u eb )] ,
donde H ab denota las componentes de la matriz inversa a (Hab ). El primer
término a la derecha es cero dado el resultado del Lema 18(iv). Para evaluar
el segundo término usamos la simetrı́a de la conexión para escribir £u eb =
∇u eb −∇eb u. Para analizar el primer término desarrollamos ∇u eb = Ab u+Cb c ec .
Puesto que
0
=
(∇u g)(ea , eb ) = u[g(ea , eb )] + g(∇u ea , eb ) + g(ea , ∇u eb )
= Ca c δcb + Cb c δac = Cab + Cba ,
Cab es antisimétrico, y por lo tanto, H ab H(ea , ∇u eb ) = H ab Cb c Hac = δ b c Cb c =
0. Finalmente, desarrollamos ∇eb u = B c b ec , y encontramos H ab H(ea , ∇eb u) =
H ab B c b Hac = δ b c B c b = div u. Concluimos que
£u n = −nH ab H(ea , ∇eb u) = −ndiv u,
o div (nu) = 0.
142
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
Mediante el teorema de Gauss, ver el Teorema 5, la ecuación div J = 0
implica que el flujo total,
Z
Z
ν(J) = div J = 0,
Ω
∂Ω
de J a través de la frontera ∂Ω de una región Ω ⊂ M del espacio-tiempo es cero.
Esto refleja la conservación del número de partı́culas. En particular podemos
aplicar este resultado a un región del espacio-tiempo de la siguiente forma:
Ωε := {ϕt (p) : 0 ≤ t ≤ ε, p ∈ S},
donde S es una superficie tridimensional espacial y compacta S, con frontera
∂S suave, que fluye a lo largo del flujo ϕt de u. La frontera de Ωε consiste de la
superficie inicial S0 = S, de la superficie final, Sε = ϕε (S), y de la superficie de
frontera T := {ϕt (p) : 0 ≤ t ≤ ε, p ∈ ∂S}. La integral sobre T es cero, dado que
el campo de covectores normal unitario aniquila J: ν(u) = 0 sobre T . Entonces
obtenemos la ley de conservación
Z
Z
N (S) := αdt(J) = αdt(J)
S
Sε
para el número de partı́culas N (S) contenidas en el interior de las superficies
Sε , donde α > 0 es una función que normaliza dt. Con respecto a coordenadas
Lagrangianas x0 = ct, x1 , x2 , x3 adaptadas a u y S de tal manera que
1
∂
= u,
∂x0
c
∂
tangente a St , j = 1, 2, 3,
∂xj
tenemos dt(J) = ndt(u) = n y entonces
Z
q
N (S) =
n(φ−1 (x)) − det(gµν )(φ−1 (x))d3 x,
φ(S)
donde suponemos que S ⊂ U se encuentre dentro de la región de validez de la
carta Lagrangiana (U, φ) de M .
Por otro lado, tenemos el resultado siguiente:
∂
Lema 19 Sean x0 , x1 , x2 , x3 coordenadas locales tales que u = c ∂x
0 . Entonces
podemos escribir la densidad de partı́culas n de la siguiente forma,
s
n=
donde Hij = H
∂
∂
∂xi , ∂xj
det(Hij )
,
− det(gµν )
, i, j = 1, 2, 3.
5.4. FLUIDOS RELATIVISTAS
143
Demostración. Sea e0 = u/c, e1 , e2 , e3 una tetrada adaptada a las lı́neas del
fluido. Podemos expander
e α = Aα
∂
∂
+ Bα i i .
∂x0
∂x
Dado que e0 = u/c tenemos A0 = 1 y B0 i = 0. Puesto que H es ortogonal a u
tenemos
Hab = H(ea , eb ) = Ba i Bb j Hij ,
de tal manera que det(Hab ) = det(Hij )| det(Ba i )|2 . Por otro lado,
g µν = η αβ eα µ eβ ν ,
de tal manera que det(g µν ) = det(η αβ )| det(eα µ )|2 = −| det(Ba i )|2 .
Dado este resultado, podemos escribir
Z q
N (S) =
det(Hij )(φ−1 (x))d3 x.
φ(S)
Finalmente, podemos reescribir esta integral como una integral sobre la región
V := F (S) en Γ. Para esto, expandemos la diferencial de F en términos de las
coordenadas locales Lagrangianas xµ de M y de coordenadas locales y a de Γ,
dF (X) =
∂F a µ ∂
X
,
∂xµ
∂y a
X = Xµ
∂
.
∂xµ
Entonces
Hij = H
∂
∂
,
∂xi ∂xj
∂
∂
∂F a ∂F b
= m dF
,
dF
=
mab ,
i
i
∂x
∂x
∂xi ∂xj
para i, j = 1, 2, 3, y
q
det(Hij ) =
p
a ∂F det(mab ) det
.
∂xi Aplicando la regla de sustitución de variables y a = F a (x1 , x2 , x3 ), obtenemos
Z q
N (S) =
det(Hij )(φ−1 (x))d3 x
φ(S)
=
a Z p
∂F 3
det(mab )(φ−1 (x)) det
d x
∂xi φ(S)
Z
=
ψ(V )
p
det(mab )(ψ −1 (y))d3 y,
144
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
lo que es precisamente el número de partı́culas contenidas en el volumen V de
Γ.
A continuación queremos describir la dinámica del fluido. Para simplificar el
tratamiento vamos a hacer un par de suposiciones. Primero, vamos a despreciar
los efectos de viscosidad y de transporte de calor. En este sentido, el fluido que
consideramos es perfecto. Segundo, suponemos que la entropı́a de cada elemento
de fluido no cambia en el tiempo. Con estas suposiciones, la acción toma la forma
siguiente,
Z
1
LM (F, n),
SM [F, g] =
c K
donde el Lagrangiano depende algebraicamente del mapeo F y de la densidad
de partı́culas n. De manera más precisa introducimos las siguientes cantidades:
v := 1/n: el volumen por partı́cula,
(F, v): la energı́a interna del elemento de fluido F ,
∂
p := − ∂v
: la presión.
Entonces el Lagrangiano LM (n) = −n(F, v) representa menos la densidad de
energı́a. Para calcular las variaciones de SM necesitamos los siguientes resultados:
Lema 20 Las derivadas de la densidad de partı́culas n con respecto a los campos
F a , ∂µ F a y gµν son dados por
(i)
(ii)
(iii)
∂n
∂F a
= 0,
∂n
∂(∂µ F c )
∂n
∂gµν
d
µν
= nmcd ∂F
, donde H µν := H ab ea µ eb µ ,
∂xν H
= − n2 hµν , donde hµν := δ ab ea µ eb ν = g µν +
1 µ ν
c2 u u .
Demostración. Usando otra vez el resultado del Lema 12, calculamos la variación de n2 = det(Hab ) con respecto a F y g:
2nδn = δ(n2 ) = n2 H ab δHab ,
de donde
δn =
n ab
H δHab .
2
(5.39)
c
d
∂F
µ ν
Luego, Hab = H(ea , eb ) = m(dF (ea ), dF (eb )) = mcd ∂F
∂xµ ∂xν ea eb , lo que implica
c
∂F
∂F d µ ν
∂F c ∂F d
µ
ν
δn = nH ab mcd δ
e
e
+
m
δ(e
)e
a
b
cd
a
b
∂xµ ∂xν
∂xµ ∂xν
c
∂F
∂F d µν
= nmcd δ
H + nH ab Hµν δ(ea µ )eb ν .
µ
∂x
∂xν
5.4. FLUIDOS RELATIVISTAS
145
Por otro lado, podemos expander δea = Aa e0 + Ba c ec . Variando la ecuación
δab = g(ea , eb ) con respecto a g, obtenemos
0
=
(δg)(ea , eb ) + g(Aa e0 + Ba c ec , eb ) + g(ea , Ab e0 + Bb c ec )
=
(δg)(ea , eb ) + Ba c δcb + Bb c δac ,
lo que implica la ecuación B(ab) = −(δg)(ea , eb )/2 para la parte simétrica de
Bab . Con esto encontramos
H ab Hµν δ(ea µ )eb ν
=
=
=
H ab H(δea , eb ) = H ab H(Aa e0 + Ba c ec , eb )
1
H ab Ba c Hcb = δ ab Bab = − δ ab (δg)(ea , eb )
2
1 µν
− h δgµν .
2
donde usamos e0 = u/c y el hecho de que H es ortogonal a u en el tercer paso.
Para encontrar las ecuaciones de campo usamos
∂LM
1 ∂
1
= − +
= − (p + n)
∂n
n ∂v
n
y la definición del tensor de energı́a-impuslo T µν ,
Z
Z
T µν δgµν = 2cδg SM = (2δg LM + LM g µν δgµν )
K
K
Z
=
[(p + n)hµν − nεg µν ] δgµν
K
y obtenemos
−∇µ Πµ c =
Gµν =
∂LM
,
∂F c
8πGN
Tµν ,
c4
Πµ c = −(p + n)H µν mcd
Tµν =
n
uµ uν + phµν .
c2
∂F d
∂xν
(5.40)
(5.41)
Estas son las ecuaciones acopladas para los campos F y g, dada una ecuación de
estado = (F, v), v = 1/n. En la práctica, conviene reescribir las ecuaciones de
Euler-Lagrange (5.40) de otra forma. Como demostramos en la sección anterior,
estas ecuaciones implican que el tensor de energı́a-impulso tiene divergencia cero.
Como vamos a demostrar ahora, la ecuación ∇µ T µν = 0 es, de hecho, equivalente
a las ecuaciones de movimiento (5.40). Para ver esto, notamos primero que la
generalización a la relatividad general de la expresión del tensor de energı́aimpulso canónico es
τ µν = −Πµ c ∇ν F c + g µν LM .
146
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
Usando el resultado del Lema 20 y el hecho de que F c se comporta como un
escalar sobre M , encontramos
−Πµ c ∇ν F c = (p + n)mcd
∂F d µσ νρ ∂F c
H g
= (p + n)g νρ Hσρ H µσ
∂xσ
∂xρ
Luego, g νρ Hσρ H µσ = η αβ eα ν eβ ρ Hσρ H cd ec µ ed σ = η αβ eα ν Hβd H cd ec µ = δ ac ea ν ec µ =
hµν . Con esto encontramos que
τ µν = (p + n)hµν − g µν n = T µν ,
es decir, la generalización covariante del tensor de energı́a-impulso canónico es
exactamente T µν . Por otro lado,
∇µ T µν
∇µ τ µν = −(∇µ Πµ c )∇ν F c − Πµ c ∇µ ∇ν F c + ∇ν LM
c
∂LM
µ
νρ ∂F
=
−
∇
Π
+ Πµ c (∇ν ∇µ − ∇µ ∇ν )F c
g
µ
c
∂F c
∂xρ
c
∂LM
µ
νρ ∂F
−
∇
Π
.
(5.42)
=
g
µ
c
∂F c
∂xρ
=
M
Puesto que el rango de dFp es maximal, las ecuaciones de Euler-Lagrange ∂L
∂F c −
∇µ Πµ c = 0 se satisfacen si y sólo si la divergencia covariante del tensor de
energı́a-impulso es cero.
Podemos escribir las ecuaciones ∇µ T µν = 0 de forma más explı́cita, notando
que un observador que se mueve sobre una de las lı́neas de flujo del fluido mide las
siguientes componentes del tensor de energı́a-impulso con respecto a un sistema
de referencia no-rotante e0 = u/c, e1 , e2 , e3 :
T00 = nε
(densidad de energı́a)
T0j = 0
(flujo de energı́a cero)
Tij = pδij
(tensión diagonal)
En términos de las cantidades
ρ := n
(expansión),
µ
(aceleración),
θ := ∇µ u
µ
µ
ν
a := ∇u u = u ∇ν u
(densidad de energı́a),
µ
la ecuación ∇µ T µν = 0 da
1
[(∇u ρ)uν + (ρ + p)θuν + (ρ + p)aν ] + hµν ∇µ p.
c2
(5.43)
Las componentes paralelas y ortogonales a u dan las ecuaciones relativistas de
continuidad y de Euler,
∇u ρ = −(ρ + p)θ,
µ
(ρ + p)a
respectivamente.
2 µν
= −c h ∇ν p,
(5.44)
(5.45)
5.5. EL LÍMITE NEWTONIANO
5.5.
147
El lı́mite Newtoniano
En esta sección vamos a demostrar que en el lı́mite Newtoniano, las ecuaciones de Einstein (5.34) se reducen a la ecuación de Poisson. Para esto, partimos
de básicamente las mismas suposiciones (i),(ii) y (iii) que en la sección 4.4,
salvo la suposición (iii) que debe ser adaptada a condiciones sobre el tensor
de energı́a-impulso. Entonces postulamos la existencia de coordenadas locales
x0 = ct, x1 , x2 , x3 en una región del espacio-tiempo tales que
(i) La métrica es casi plana, es decir,
gµν = ηµν + hµν ,
|hµν | 1,
donde (ηµν ) = diag(−1, 1, 1, 1) es la métrica de Minkowski.
(ii)
1
c |∂t hµν |
|∂i hµν |, i = 1, 2, 3.
(iii) La componente T00 del tensor de energı́a-impulso domina, es decir |Tµj | |T00 | para todo µ = 0, 1, 2, 3 y j = 1, 2, 3.
La suposición (iii) se puede justificar facilmente en el caso del fluido perfecto
considerado en la sección previa, donde Tµν = (n + p)uµ uν /c2 + pgµν . En el
lı́mite Newtoniano, la energı́a interna de un elemento de fluido se puede escribir
como
(v) = m0 c2 + N (v),
|N (v)| m0 c2 ,
donde m0 c2 representa la energı́a de reposo y N (v) la energı́a interna Newtoniana. Suponiendo que N (v) no varia mucho en v, concluimos que la presión
p=−
∂
∂N
=−
∂v
∂v
es mucho más pequeña que la densidad de energı́a ρ = n. Usando esto con
(uµ /c) = γ(−1, v/c) y |v| c encontramos que T00 ≈ nm0 c2 = ρ0 c2 , donde
ρ0 = nm0 describe la densidad de masa de reposo, y Tµj ≈ 0 en la aproximación
Newtoniana, lo que justifica la suposición (iii).
Ahora calculamos las componentes del tensor de Ricci bajo las suposiciones
(i) y (ii),
Rµν = ∂α Γα µν − ∂ν Γα αµ + O(Γ2 ),
donde
Γα µν =
1 αβ
η [∂µ hνβ + ∂ν hµβ − ∂β hµν ] + O(h2 ).
2
Despreciando términos que son por lo menos cuadráticos en hµν y v/c y usando
la hipótesis (ii) encontramos, en particular, que
R00 = ∂k Γk 00 ,
1
Γk 00 = − ∂ k h00 .
2
148
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
Usando la correspondencia (4.7) entre h00 = −2φ/c2 y el potencial gravitacional
Newtoniano φ encontramos que
R00 =
1
∆φ,
c2
(5.46)
como se esperaba de la correspondencia (5.12). Por otro lado, las ecuaciones de
Einstein (5.34) son equivalentes a
1
8πGN
αβ
T
−
Rµν =
g
g
T
.
(5.47)
µν
µν
αβ
c4
2
Calculando las componentes 00 de la parte derecha tomando en cuenta la condición (iii) encontramos
1
4πGN T00
8πGN
T
.
T
−
=
00
00
4
c
2
c4
Comparando con (5.46) obtenemos la ecuación de Poisson,
∆φ = 4πGN ρ0 ,
(5.48)
para la densidad de masa ρ0 = T00 /c2 .
Ejercicio 24. Demuestre que las componentes 0j y ij, i, j = 1, 2, 3, de la ecuación (5.47) son compatibles con la ecuación de Poisson en el lı́mite Newtoniano
siempre y cuando
2φ
h0j = 0,
hij = −δij 2 .
c
Ejercicio 25. Las ecuaciones Rµν = 4πGN c−4 Tµν también poseen el lı́mite
Newtoniano correcto. Sin embargo, tienen un problema, ¿cuál es?
Ejercicio 26. Demuestre que en el lı́mite Newtoniano las ecuaciones (5.44,5.45)
se reducen a la ecuación de continuidad y las ecuaciones de Euler no-relativistas,
ρ̇0 + ∇ · (ρ0 v)
ρ0 [v̇ + (∇ · v)v]
=
0,
= −∇p − ρ0 ∇φ.
(5.49)
(5.50)
Ejercicio 27. Considere un teorı́a escalar donde el campo gravitacional se
describe a través de una métrica conformemente plana, gµν = Ω2 ηµν , donde
Ω ∈ F(M ) es una función positiva y ηµν es la métrica plana de Minkowksi. En
esta teorı́a, se hacen los siguientes postulados:
Las partı́culas de prueba en caı́da libre siguen geodésicas de tipo tiempo.
5.5. EL LÍMITE NEWTONIANO
149
La dinámica del campo gravitacional está determinada por las siguientes
ecuaciones de campo,
R = κT,
(5.51)
con R el escalar de Ricci, T la traza del tensor de energı́a-impulso y κ una
constante de acoplamiento.
(a) Muestre que R = −6Ω−3 η µν ∂µ ∂ν Ω.
(b) Elija la constante κ de tal manera que la teorı́a posea el lı́mite Newtoniano
correcto. ¿Cuál es la relación entre el factor conforme Ω y el potencial
gravitacional Newtoniano φ?
(c) Compare (5.51) con la ecuación correspondiente (2.3) del capı́tulo 2.
150
CAPÍTULO 5. LAS ECUACIONES DE EINSTEIN
Capı́tulo 6
La solución de
Schwarzschild
En este capı́tulo analizamos las soluciones esfericamente simétricas de las
ecuaciones de Einstein en el vacı́o. La métrica correspondiente fue encontrada
por Karl Schwarzschild en 1916, solamente dos meses después de que Einstein publicó sus ecuaciones de campo. Fı́sicamente la métrica de Schwarzschild
describe el campo gravitacional en el exterior de una distribución de masa esfericamente simétrica. Como vamos a ver, si esta distribución de masa está concentrada en una región suficientemente pequeña, la métrica de Schwarzschild
describe un agujero negro.
Empezamos con la derivación de la métrica de Schwarzschild en la sección
que sigue. Las propiedades fı́sicas y geométricas de la métrica se discuten en las
secciones posteriores.
6.1.
La derivación de la solución de Schwarzschild
151
152
CAPÍTULO 6. LA SOLUCIÓN DE SCHWARZSCHILD
Capı́tulo 7
Campos gravitacionales
débiles
153
154
CAPÍTULO 7. CAMPOS GRAVITACIONALES DÉBILES
Capı́tulo 8
Los universos de
Friedmann-Lemaı̂tre
155
156
CAPÍTULO 8. LOS UNIVERSOS DE FRIEDMANN-LEMAÎTRE
Bibliografı́a
[1] N. Straumann. General Relativity and Relativistic Astrophysics. SpringerVerlag, Berlin, 1984.
[2] R.M. Wald. General Relativity. The University of Chicago Press, Chicago,
London, 1984.
[3] C.W. Misner, K.S. Thorne, and J.A. Wheeler. Gravitation. W. H. Freeman,
1973.
[4] S.M. Carroll. Spacetime and Geometry. An introduction to General Relativity. Addison Wesley, 2004.
[5] M.P. do Carmo. Riemannian Geometry. Birkhäuser, Boston, 1992.
[6] W. Walter. Ordinary Differential Equations. Springer-Verlag, New York,
1998.
[7] T. Kato. Perturbation Theory for Linear Operators. Springer-Verlag, New
York, 1980.
[8] P. Hartman. Ordinary Differential Equations. John Wiley & Sons, Inc.,
New York, 1964.
[9] S. Kobayashi and K. Nomizu. Foundations of Differential Geometry. John
Wiley & Sons, 1963.
[10] M.P. do Carmo. Differential Forms and Applications. Springer-Verlag,
2000.
[11] S.W. Hawking and G.F.R. Ellis. The Large Scale Structure of Space Time.
Cambridge University Press, Cambridge, 1973.
[12] D.E. Soper. Classical Field Theory. Dover Publications Inc., Mineola, New
York, 2008.
157
Descargar