Sobre la teoría especial de la relatividad

Anuncio
Sobre la teoría especial de la relatividad
Juan Manuel Tejeiro Sarmiento
Profesor Titular
Observatorio Astronómico Nacional
Facultad de Ciencias
Universidad Nacional de Colombia
2004
ii
Índice general
Introducción
I
VII
Cinemática relativista
1
1. Modelo mecánico del mundo
1.1. Introducción . . . . . . . . . . . . . . . . . .
1.2. Leyes de Newton y principio de relatividad
1.3. Luz y éter: El retorno al espacio absoluto .
1.3.1. Un experimento crucial . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
4
9
14
2. Fundamentos de la relatividad especial
2.1. Postulados de la relatividad especial . .
2.2. Transformaciones de Lorentz . . . . . .
2.3. Propiedades de las TL . . . . . . . . . .
2.4. Consecuencias de las TL . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
19
19
24
31
40
3. La estructura causal del espacio-tiempo
3.1. Introducción . . . . . . . . . . . . . . . .
3.2. Rotaciones en el plano euclideano . . . .
3.3. Cuadri-vectores y el grupo de Lorentz .
3.4. Conos de luz y relaciones de causalidad
3.5. Algebra de cuadri-vectores . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
47
47
47
51
55
59
.
.
.
.
.
65
65
65
69
70
75
4. Cinemática relativista
4.1. Introducción . . . . . . . .
4.2. Cuadri-vector velocidad .
4.3. Cuadri-vector aceleración
4.3.1. Viaje interestelar .
4.4. Cuadri-vector de onda . .
.
.
.
.
.
.
.
.
.
.
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
iv
II
ÍNDICE GENERAL
Dinámica relativista
5. Dinámica relativista
5.1. Ecuaciones de movimiento . . . . . . . . . .
5.2. Leyes de conservación . . . . . . . . . . . .
5.3. Propiedades del c-momentun . . . . . . . .
5.4. Sistema centro de masa . . . . . . . . . . .
5.5. Energía umbral . . . . . . . . . . . . . . . .
5.6. Fotones y partículas de masa en reposo cero
79
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
81
81
84
87
90
93
96
6. Aplicaciones de la dinámica relativista
6.1. Introducción . . . . . . . . . . . . . . . . . . . . . .
6.2. Colisiones elásticas . . . . . . . . . . . . . . . . . .
6.2.1. Efecto Compton . . . . . . . . . . . . . . .
6.2.2. Efecto Compton inverso . . . . . . . . . . .
6.3. Colisiones inelásticas . . . . . . . . . . . . . . . . .
6.3.1. Absorción de un fotón por un átomo . . . .
6.3.2. Emisión de un fotón por un átomo exitado
6.4. Sistemas de masa variable . . . . . . . . . . . . . .
6.5. Creación y aniquilación de partículas . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
101
101
101
102
105
107
108
111
113
115
III
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Electrodinámica relativista
7. Tensores
7.1. Introducción . . . . . . . . . . . . . . . . . .
7.2. Definiciones fundamentales . . . . . . . . .
7.2.1. Componentes covariantes . . . . . .
7.2.2. Algebra tensorial . . . . . . . . . . .
7.2.3. Propiedades de simetría de tensores
7.3. Transformación general de coordenadas . .
7.4. Operadores vectoriales
.
117
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
119
119
120
122
125
130
136
138
8. Electrodinámica
8.1. Introducción . . . . . . . . . . . . . . . . . . .
8.2. Ecuaciones de Maxwell . . . . . . . . . . . . .
8.3. Campo magnético como un efecto relativista .
8.4. Ecuaciones de Maxwell covariantes . . . . . .
8.5. Transformaciones Gauge . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
143
143
144
146
154
163
9. Bibliografía
169
Prefacio
Segunda edición de las notas de clase sobre relatividad especial.
v
vi
PREFACE
Introducción
La teoría de la relatividad (especial y general) es considerada como uno
de los más grandes logros de la mente humana y forma parte, de lo que
podemos llamar la cultura del hombre del siglo XX. A pesar del estigma
de incomprensibilidad que siempre ha rodeado a la teoría de la relatividad,
en el sentido que su comprensión está al alcance solamente de unos pocos
especialistas, esta teoría científica ha sido la de mayor impacto y difusión a
nivel de divulgación y ha tenido influencia definitiva sobre nuestra imagen
del mundo.
El desarrollo de la teoría de la relatividad ha estado marcado por circunstancias particulares que la diferencian de otros desarrollos de la física
contemporánea, a las cuales me referiré en esta introducción, con el fin de
mostrar, por una parte el estado actual de la teoría y por otra, el papel
fundamental que ha jugado y juega esta teoría en el desarrollo de la física
actual.
La formulación de la Teoría Especial de la Relatividad dada por Einstein
en 1905 es completa, es decir, a parte de ejemplos y aplicaciones de la teoría,
o de su reformulación en términos de modelos matemáticos más sofisticados,
todo los elementos básicos que hoy conocemos de la teoría especial de la relatividad están contenidos en los trabajos originales de Einstein. Además, el
estilo del primer trabajo publicado por Einstein sobre el tema, a diferencia
de otros trabajos en física teórica, se caracterizó por su sencillez en la exposición, con muy poco contenido matemático y la ausencia de referencias a
artículos y trabajos anteriores. Su conclusión fundamental, la necesidad de
reformular el concepto absoluto de simultaneidad y con él, el concepto de
tiempo en física, muestra la genialidad de Einstein, no por la complejidad de
sus razonamientos ni la complejidad en los cálculos, sino por la profundidad
de sus conclusiones, las cuales modificaron de manera radical e irreversible
nuestros conceptos básicos de espacio y tiempo. No es cierto, como sostienen
varios historiadores de la física, que el trabajo de Einstein no fue comprendido en su tiempo, pues pocos meses después de su publicación físicos de
vii
viii
INTRODUCCIÓN
Cracovia afirmaban que había nacido un nuevo Copernico y ya para 1909,
los principales físicos de esa época tales como Planck, von Laue y otros,
reconocieron la genialidad de Einstein y la importancia de sus trabajos.
Es importante resaltar en este punto que de hecho todas las ecuaciones
básicas de la teoría especial de la relatividad, tales como la contracción
de longitudes, aumento de la masa con la velocidad, la equivalencia masaenergía, etc., ya eran conocidas en la literatura y por lo tanto, la física si
estaba preparada para entender y asimilar las ideas de Einstein. Para comprender esto, basta con recordar que la teoría electromagnética de Maxwell
es una teoría relativista y por lo tanto era de esperar que un estudio minucioso de las ecuaciones de Maxwell (recordemos el excelente trabajo realizado por Lorentz sobre el electrón, el cual fue publicado en 1904) condujera a
todas estas ecuaciones relativistas, aun cuando su interpretación estuviera
fuertemente influenciada por el concepto del éter.
Claramente, el impacto de la teoría especial de la relatividad de Einstein
no se podía esperar que fuera muy grande a nivel experimental y tecnológico, pues de hecho la posibilidad de probar experimentalmente la teoría en
forma directa era muy difícil y más significativo aún, era su escasa o prácticamente nula aplicabilidad. Esto, debido a que los fenómenos relativistas
son relevantes en situaciones que involucren velocidades comparables a la
velocidad de la luz en el vacío (aproximadamente 300,000km/s), lo cual solo
vino a ser posible con el desarrollo de los grandes aceleradores de partículas
a mediados del siglo XX.
En 1916 Einstein publica la Teoría General de la Relatividad, la cual
corresponde a la formulación relativista de la ley de gravitación universal de
Newton. Estos trabajos, a diferencia de sus primeras publicaciones sobre la
teoría especial de la relatividad, si requirieron de una estructura matemática
muy compleja: la geometría diferencial y el cálculo tensorial. Dos predicciones fundamentales surgen de estos trabajos, el corrimiento del perihelio
de Mercurio, efecto que ya había sido observado, más no explicado por los
astrónomos y la desviación de la luz por el sol, cuya corroboración se da en
1919, aprovechando un eclipse total de sol que tuvo lugar el 29 de Mayo.
Más significativo aún para el desarrollo de la teoría general de la relatividad, puede ser el descubrimiento de Hubble de la expansión del universo en
1929, si bien Einstein no había predicho este efecto, si estaba contenido en
sus ecuaciones de la relatividad general. Este punto de la historia marca el
comienzo de la cosmología actual, la cual es una de las áreas de investigación
más activas que tenemos hoy día.
Retomando de nuevo el desarrollo de la teoría especial de la relatividad,
el papel fundamental que ella juega en la física se comienza a reconocer
ix
y a explotar tan solo con el desarrollo de la mecánica cuántica relativista
formulada por Dirac en 1925. En efecto, hasta 1925 se conocían solamente
dos partículas elementales: el electrón y el protón. Como una consecuencia
fundamental de su recién desarrollada teoría relativista del electrón, Dirac
predice la existencia del positrón, que es una partícula fundamental de la
misma masa del electrón pero de carga opuesta. Este hecho es posteriormente generalizado y se establece un resultado general de la naturaleza y
es que a toda partícula fundamental le corresponde una antipartícula. Estos
desarrollos condujeron entonces a la teoría cuántica de campos, que constituye el marco teórico para entender las interacciones fundamentales de la
naturaleza (electromagnética, fuerte y débil), que rigen el comportamiento
de la materia a escala microscópica.
Hoy día la teoría especial de la relatividad es reconocida como una teoría
fundamental de la física, cuyo alcance va más allá de sus posibles aplicaciones experimentales o tecnológicas, pues ella se enmarca en el contexto de
las propiedades fundamentales del espacio-tiempo, independientemente de
cualquier modelo físico utilizado para describir los fenómenos. En general,
las leyes físicas que rigen el comportamiento de los sistemas se formulan en
términos de relaciones (ecuaciones diferenciales) entre las variables físicas
necesarias para describir un sistema. Estas variables físicas se describen por
funciones del espacio y el tiempo (posición, momentun, energía, etc.), cuyo
comportamiento está regido por los principios de la teoría especial de la
relatividad.
El objetivo fundamental de este libro es presentar los principios básicos y los resultados fundamentales de la teoría especial de la relatividad,
con énfasis en una formulación covariante, es decir una formulación que nos
permite desde un principio, exhibir en forma explícita el carácter relativista
de una teoría. Para este fin se han organizado los temas en tres grupos: El
primer grupo lo conforman los tres primeros capítulos, la presente introducción, un capítulo sobre los fundamentos de la mecánica Newtoniana, con
una breve discusión sobre el problema del éter, esto con el fin de motivar los
postulados básicos de la teoría especial de la relatividad y sus principales
consecuencias, desarolladas en el tercer capítulo. El segundo grupo lo constituye el cuerpo central del libro, comenzando con una formulación exhaustiva
del concepto de cuadri-vector y la estructura causal del espacio-tiempo para
formular los principios y leyes de la dinámica relativista, dedicando un capítulo a sus principales aplicaciones. El último tema está destinado a formular
la teoría electromagnética (ecuaciones de Maxwell) en forma explícita relativista, para lo cual se dedica un capítulo a la formulación y álgebra de
tensores sobre el espacio de Minkowski en forma sencilla, es decir sin re-
x
INTRODUCCIÓN
currir a todo el formalismo matemático de las variedades y la geometría
diferencial, pero manteniendo la validéz general, tanto en la notación como
en los resultados fundamentales.
Parte I
Cinemática relativista
1
Capítulo 1
Modelo mecánico del mundo
1.1.
Introducción
En este capítulo presentaremos en forma resumida la situación de la
física a comienzos del siglo XX, destacando los hechos más relevantes, que
nos permitan motivar y entender mejor los conceptos y postulados fundamentales, sobre los cuales está basada la teoría especial de la relatividad,
formulada en 1905 por el físico alemán Albert Einstein.
En la primera sección revisaremos las leyes y conceptos fundamentales
de la mecánica Newtoniana, dedicando el resto del capítulo a presentar una
breve descripción de algunas de las teorías del éter, con el fín de entender el
problema central que se debatía en la física en la segunda mitad del sigloXIX,
en cuanto a la aparente inconsistencia entre la mecánica Newtoniana y la
recién desarrollada teoría electromagnética.
La teoría de la mecánica formulada por Newton en el siglo XVI y enriquecida por la contribución de muchos físicos y matemáticos a lo largo de
los dos siglos siguientes, se constituyó en la teoría fundamental que permitía
entender, explicar y predecir todos los fenómenos físicos conocidos. Fue en
la primera mitad del siglo XIX que aparecieron fenómenos relacionados con
el electromagnetismo y con la luz que comenzaron a complicar la imágen
(explicación) mecánica del mundo. Esta situación se tornó más crítica en la
segunda mitad del siglo con el desarrollo de la teoría de la electrodinámica
de Maxwell, pues su aparente incompatibilidad con la mecánica newtoniana, reflejada no sólo en consideraciones teóricas sino también en resultados
experimentales, hacían pensar que alguna de las dos teorías, la mecánica o la
electrodinámica, debería ser abandonada o revisada, lo cual no era un problema fácil, pues ambas teorías presentaban una enorme cantidad de pruebas
3
4
CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO
experimentales y desarrollos tecnológicos que sustentaban su validez.
1.2.
Leyes de Newton y principio de relatividad
Para comprender mejor los problemas que se le planteaban a la física
en el siglo XIX y preparar el terreno para entender los cambios de interpretación necesarios que se dieron con el desarrollo de la teoría especial de
la relatividad, en esta sección revisaremos brevemente algunos conceptos
fundamentales de la mecánica newtoniana, cuyo punto de partida son las
tres leyes de Newton:
Ley de la inercia- Toda partícula permanece en estado de reposo o
movimiento rectilíneo uniforme respecto a cualquier sistema de referencia
inercial, mientras no actúen fuerzas externas sobre él, o equivalentemente el
momentum de una partícula libre de fuerzas permanece constante, en donde
la cantidad dinámica de momentum se define como
p = mv
(1.1)
siendo m la masa inercial de la partícula y v su velocidad.
Ecuación de movimiento- La fuerza aplicada sobre la partícula es
igual a la rata de cambio de su momentum
F =
dv
dp
=m
dt
dt
(1.2)
en donde la última igualdad se deduce del hecho que la masa inercial de una
partícula puntual es constante e independiente de su estado de movimiento.
Interacción entre partículas- La fuerza que una partícula A ejerce
sobre otra partícula B es igual en magnitud y en sentido opuesto a la fuerza
que la partícula B ejerce sobre A.
Para la formulación de estas leyes hay toda una serie de supuestos básicos
necesarios, tales como la estructura geométrica del espacio, el concepto de
tiempo, observador y sistema de referencia, magnitudes físicas y el concepto
de medida. Sin embargo, no es objeto del presente libro entrar a discutir
exhaustivamente estos conceptos, sino nos centraremos únicamente en aquellos aspectos que son relevantes para plantear y motivar la formulación de
la teoría especial de la relatividad.
Definamos, en primer lugar, el concepto de observador como un sistema
físico (reglas o patrón de medida espacial y relojes o patrón de medida temporal), que permite determinar la posición y el instante de tiempo respecto
a un origen arbitrario, de un fenómeno físico (que en lo sucesivo llamaremos
1.2. LEYES DE NEWTON Y PRINCIPIO DE RELATIVIDAD
5
evento). A este conjunto de reglas y relojes lo denominaremos sistema de
referencia, cuya representación matemática se puede realizar por el espacio
R × R3 , con R los números reales que representa el tiempo y R3 el espacio
euclidiano tridimensional que representa el espacio físico. Dotar al espacio
y al tiempo con esta estructura matemática supone (como lo asumió explícitamente Newton) que el espacio es absoluto, homogéneo e isotrópico y
obedece la geometría euclideana y el tiempo es absoluto y homogéneo y por
lo tanto son conceptos independientes del observador.
En segundo lugar, Newton asumió que sus leyes se cumplen en el espacio
absoluto, es decir que sus leyes son válidas para un observador, cuyo sistema
de coordenadas esté fijo respecto al espacio absoluto. A este observador particular se le llama ”sistema de referencia inercial” y lo denotaremos por Σ.
Elegir un sistema de referencia inercial es, en principio, escoger una coordenada temporal t y un sistema de coordenadas cartesianas (x, y, z) para
determinar el instante y la posición de un evento. Que el origen de la coordenada temporal es arbitrario, refleja el hecho que el tiempo es homogéneo,
mientras que el origen y la orientación arbitrarias de las coordenadas espaciales ponen de manifiesto la homogeneidad e isotropía del espacio. Si la
primera ley de Newton es válida en Σ, entonces una partícula P , sobre la
cual no actúan fuerzas, debe viajar en una línea recta respecto al sistema
Σ. Así por ejemplo, si elegimos el origen del tiempo y los ejes espaciales de
tal manera, que la partícula pase por el origen espacial en el instante t = 0
y se mueva en la dirección del eje x positivo, entonces su posición, en un
instante de tiempo cualquiera t,está dada por
x = ux t ; y = 0 ; z = 0
(1.3)
u = (ux , uy , uz ) = (ux , 0, 0)
(1.4)
con
la velocidad de la partícula.
Consideremos otro sistema de referencia Σ0 , con respecto al cual la
partícula P permanece en reposo en su origen de coordenadas espaciales,
y elijamos los ejes espaciales de Σ0 paralelos a los del sistema de referencia inercial Σ y el origen del tiempo de tal manera los relojes comiencen
a contar el tiempo, t = t0 = 0, cuando los orígenes de los dos sistemas se
cruzan. Entonces, podemos determinar las coordenadas espaciales y el tiempo de cualquier evento físico, bien sea con respecto al sistema inercial Σ o
con respecto al sistema de referencia Σ0 . Si llamamos (t, x, y, z) las coordenadas de un evento físico cualquiera, medidas respecto a Σ y (t0 , x0 , y0 , z 0 ) las
correspondientes coordenadas, medidas respecto a Σ0 , podemos encontrar la
6
CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO
Figura 1.1: Transformaciones de Galileo
relación entre las coordenadas del evento, medidas por los dos sistemas de
referencia Σ0 y Σ. Estas relaciones son llamadas ecuaciones de transformación de Galileo.
Es fácil encontrar las ecuaciones de transformación de Galileo (Figura
1.1), pues teniendo encuenta que las ecuaciones (1.3) nos dan la posición,
respecto al sistema inercial Σ, del origen de coordenadas del sistema Σ0 ,
entonces, las coordenadas (t0 , x0 , y0 , z 0 ) de cualquier evento medidas por Σ0 ,
están relacionadas con las coordenadas (t, x, y, z) del mismo evento medidas
por Σ, por las ecuaciones:
t0 = t
x0 = x − vt
y0 = y
z0 = z
(1.5)
en donde se ha hecho el cambio ux = v, para rescatar la notación usual
utilizada en la literatura.
Así, en lo sucesivo v denotará la velocidad del sistema de referencia Σ0
respecto a Σ. La elección de los dos sistemas coordenados de Σ y Σ0 con
los ejes coordenados paralelos y la misma orientación, así como la velocidad
relativa de los dos sistemas a lo largo de los ejes x, x0 no representa pérdida alguna de generalidad y su justificación se encuentra en la hipótesis de
isotropía del espacio, la cual implica que la física no depende de la orientación
de los ejes coordenados, o equivalentemente, que el espacio es isotrópico.
1.2. LEYES DE NEWTON Y PRINCIPIO DE RELATIVIDAD
7
Además, en las ecuaciones de tranformación de Galileo está implícita, también, la hipótesis de homogeneidad del espacio y el tiempo, pues la elección
del origen del tiempo para los dos sistemas, en el instante en que los orígenes espaciales coinciden, es arbitraria, indicando que cualquier instante
de tiempo y todos los puntos del espacio son equivalentes para describir los
fenómenos físicos. La primera ecuación de transformación, t0 = t, representa
el carácter absoluto del tiempo, y significa que (salvo la elección arbitraria
del origen) el instante en el cual ocurre un evento físico es independiente del
observador y además, esta ecuación lleva también la hipótesis implícita, que
existe algún mecanismo físico apropiado que permite transmitir información
instantáneamente. Otra forma de expresar este carácter absoluto del tiempo,
es a través del concepto de simultaneidad: Si dos eventos, que ocurren en
puntos diferentes del espacio para un observador, son simultáneos, entonces
estos dos eventos son también simultáneos para cualquier otro observador,
sin importar su estado de movimiento relativo respecto al primer observador.
Como veremos más adelante, la simultaneidad es uno de los conceptos fundamentales que debe ser cuestionado y se torna en un punto muy importante
para la formulación de la teoría de la relatividad.
Una primera consecuencia de las transformaciones de Galileo, es que las
leyes de la mecánica son válidas en todos los sistemas de referencia que se
muevan con respecto al sistema de referencia inercial, el cual se encuentra en
reposo con respecto al espacio absoluto. La demostración de este resultado
es directa, pues, si una partícula libre posee una velocidad
u = (ux , uy , uz ) = (
dx dy dz
, , )
dt dt dt
(1.6)
respecto al sistema de referencia inercial Σ, entonces, se obtiene de las ecuaciones de transformación de Galileo (1.5), que las componentes de la velocidad de la partícula, medidas en el sistema de referencia Σ0 están dadas
por:
dx0
uy0 = uy
uz0 = uz
(1.7)
ux0 = 0 = ux − v
dt
Este resultado se conoce con el nombre de teorema de adición de velocidades de Galileo. Así, puesto que la velocidad relativa v entre los sistemas de
referencia Σ y Σ0 es constante, entoces, la partícula libre también se mueve
con velocidad constante u0 = (u0x0 , uy0 , uz 0 ) respecto al sistema Σ0 . De manera similar, se deduce que la segunda ley de Newton también se satisface,
pues, utilizando el resultado anterior (ecuación (1.7)), tenemos que
F0 =
du
dp
dp0
du0
=m
=
=F
=
m
0
dt
dt
dt
dt
(1.8)
8
CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO
con el resultado adicional, que no sólo la forma de la segunda ley de Newton
F = dp
dt es la misma, como queríamos probar, sino que tanto la fuerza que
actúa sobre la partícula, como su aceleración, toman el mismo valor en los
dos sistemas de referencia. Que la tercera ley de Newton también se cumple
para el sistema de referencia Σ, se obtiene de este resultado y del carácter
absoluto de la simultaneidad, pues, la igualdad de las fuerzas de acción y
reacción es instantánea, independiente de la posición relativa de los puntos
de aplicación de las fuerzas.
Esta invarianza de las leyes de la mecánica bajo transformaciones de
Galileo, constituye el Principio de Relatividad Galileano. En la formulación
inicial de las leyes de Newton, se postuló que ellas eran válidas para un
observador en reposo con respecto al espacio absoluto, que lo llamamos observador inercial o sistema de referencia inercial, y mostramos, que si este
postulado se cumplía, entonces las leyes de Newton también eran válidas
en cualquier sistema de referencia que se moviera con velocidad constante
respecto al observador inercial. Esto justifica extender el nombre de sistema
de referencia inercial, para todos los observadores con movimiento relativo
constante, respecto al observador inercial inicialmente en reposo relativo al
espacio absoluto. Así, podemos dar otras formas equivalentes de enunciar el
principio de relatividad galileano: Las leyes de la mecánica son las mismas
en todos los sistemas de referencia inerciales, o también, no es posible, a
través de experimentos mecánicos, determinar la velocidad del sistema de
referencia inercial con respecto al espacio absoluto.
Esta última forma equivalente de enunciar el principio de relatividad
Galileano, le quita todo el sentido físico al espacio absoluto, pues elimina
su estatus privilegiado de ser el único sistema de referencia con respecto
al cual se cumplen las leyes de la mecánica y por lo tanto, el espacio absoluto queda como un concepto empíricamente vacío, por lo menos en lo
que a fenómenos mecánicos se refiere. Esta situación, reconocida desde un
principio por Newton, lo condujo a buscar experimentos alternativos que le
permitieran determinar el movimiento con respecto al espacio absoluto. El
ejemplo más conocido en la literatura lo constituye su experimento del balde
rotante, en el cual, la curvatura que toma la superficie del agua del balde,
cuando éste se encuentra en rotación, se la atribuye a su movimiento de
rotación respecto al espacio absoluto, pues este fenómeno, sostenía Newton,
tenía lugar aún en el caso que el balde se encontrara solo en el universo.
Críticas a este análisis son igualmente abundantes en la literatura, siendo
la de Mach la más conocida, pues parte del análisis que llevó a Einstein a
formular los principios de la Teoría General de la Relatividad está basado
sobre los trabajos de Mach.
1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO
9
No es objeto de la presente sección profundizar más sobre este tema,
pues volveremos sobre el problema del espacio absoluto, cuando discutamos
las teorias del eter y los fenómenos electromagnéticos. Sin embargo, es importante dejar claro un aspecto referente a este tema: Dada la imposibilidad
de determinar el movimiento absoluto (a velocidad constante) a través de
fenómenos mecánicos, Newton recurrió, entonces, a sistemas de referencia
acelerados, para los cuales las leyes de la mecánica ya no permanecen invariantes y claramente, los efectos de la aceleración si son detectables (las, no
bien llamadas fuerzas ficticias, tales como la fuerza centrífuga o la fuerza de
coriolis, que surgen en sistemas de referencia acelerados), pero aún, en este
caso de sistemas de referencia no inerciales, cualquier referencia al espacio
absoluto sigue siendo superflua.
1.3.
Luz y éter: El retorno al espacio absoluto
Hasta comienzos del siglo XIX todos los fenómenos físicos, incluidos los
de la óptica, admitían una explicación mecánica. Esto nos permite comprender, en gran parte, por qué esta imágen mecánica del mundo se extendió
hasta finales del siglo XIX, tratando de explicar fenómenos tales como la
propagación de las ondas de luz, y todos aquellos fenómenos relacionados
con la teoría electromagnética de Maxwell. Un ejemplo, que ilustra muy bien esta concepción, lo podemos encontrar en la siguiente cita debida a Lord
Kelvin: ”No estaré contento hasta que pueda construir un modelo mecánico del objeto que estoy estudiando. Si lo puedo lograr significa que lo he
entendido, de lo contrario no.”.
En este parágrafo describiremos brevemente dos desarrollos de la física
del siglo XIX, el carácter ondulatorio de la luz descubierto por Young y
Fresnel y la electrodinámica de Maxwell, que constituyen, en mi opinión, el
punto de partida más directo para formular los principios y conceptos de la
teoría especial de la relatividad.
El sonido es la propagación de ondas longitudinales en un medio material,
en donde la velocidad de propagación está dada por la ecuación debida a
Newton:
s
v=
Y
ρ
(1.9)
en donde Y es el módulo de elasticidad del medio y ρ la densidad del medio.
Además, la velocidad del sonido es independiente de la fuente, pero depende de la velocidad del medio en el cual se transmite. De manera similar,
10
CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO
se trabajaron modelos para explicar los fenómenos de la luz, como los desarrollados por Hook y Huygens, en donde la luz se consideraba como alguna
forma de onda longitudinal, que se propagaba a través del espacio. Newton
trabajó este modelo por algún tiempo, pero dada la imposibilidad de explicar la polarización de la luz, desarrolló el modelo corpuscular, capaz de
explicar este efecto y de dar cuenta de otras propiedades conocidas de la luz,
desplazando al modelo ondulatorio de Huygens.
La teoría corpuscular de la luz permaneció vigente hasta comienzos del
siglo XIX, cuando Young y Fresnel explicaron los nuevos fenómenos de interferencia y difracción, con base en la teoría ondulatoria, relegando a la
teoría corpuscular Newtoniana, a un capítulo más de la historia de la física. Sin embargo, de la misma manera que el sonido necesita de un medio
para propagarse, se vió la física avocada a postular un medio material para
la propagación de las ondas de luz. Este medio material, que optaron por
llamar éter, debería ser de naturaleza diferente a la materia conocida hasta entonces. Es importante anotar, que el éter en la física no era una idea
completamente original, pues ya había sido usado antes para ”explicar” muchos otros fenómenos. Por ejemplo, Newton, sugiere que el éter puede estar
asociado con la gravitación, con los fenómenos eléctricos y magnéticos, con
la propagación del calor etc.. A este respecto, Young aclara, que el éter a
través del cual se propaga la luz no necesariamente es el mismo que el éter
eléctrico, y por esta razón Young propone llamarlo éter lumínico.
Una vez aceptado que la luz es un fenómeno ondulatorio, comenzaron a
desarrollarse teorías y modelos mecánicos del éter, para explicar el mecanismo de propagación de las ondas de luz en este medio. Young y Fresnel
fueron los primeros en encontrar que las ondas de luz deben ser transversales, para poder explicar el fenómeno de polarización. Este hecho exigía,
entonces, un esfuerzo teórico muy grande para comprender el mecanismo
de transmisión de ondas transversales en un medio elástico, dado que ésto requería que el medio de transmisión, el éter, tuviera un coeficiente de
rigidez muy grande, pues, como lo demostró Poisson, ondas longitudinales
y transversales se podían propagar en un sólido, con
v⊥ = (η/ρ)1/2
(1.10)
la velocidad de las ondas transversales y
vk = ([k + 4η/3]/ρ)1/2
(1.11)
la velocidad de las ondas longitudinales, siendo η el módulo de rigidez, k el
módulo de elasticidad volumétrico y ρ la densidad del sólido. Una dificultad,
1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO
11
de este modelo mecánico del éter, era la ausencia de componente longitudinal de las ondas de luz, lo que llevó a Cauchy a sugerir, que el eter debía
tener una compresibilidad negativa, de tal manera que el factor k + 4η/3,
en la ecuación (1.11), se anulara. Estas teorías estaban basadas sobre las
propiedades conocidas de los medios elásticos, pero la combinación tan inusual de las propiedades que debería tener el éter, condujeron a MacCullagh a
postular, que este medio era un nuevo tipo de sustancia elástica, diferente
a las conocidas y asociándole otras propiedades desarrolló una teoría más
sofisticada, con un sistema de ecuaciones, muy parecido a las ecuaciones de
Maxwell, que fue intensamente trabajado en la segunda mitad del siglo XIX.
A diferencia de las propiedades mecánicas del éter, anteriormente discutidas, para las cuales era difícil proponer experimentos directos que las
verificaran, el teorema de adición de velocidades de Galileo, que se cumple
también para las ondas en un medio mecánico, permitió proponer y realizar
toda una serie de experimentos para medir la velocidad de la luz, desde
un sistema de referencia móvil respecto al éter. La situación se plantea de
la siguiente forma: De la teoría de propagación de las ondas en un medio
elástico, sabemos que:
(1.12)
u0 = u − v
en donde u es la velocidad de propagación de las ondas, medida en sistema
de referencia inercial Σ, el cual está en reposo con respecto al medio de
propagación (el éter para el caso de ondas de luz), u0 es la velocidad de las
ondas, medida por un observador en un sistema de referencia inercial Σ0 ,
que se mueve con velocidad v respecto a Σ.
En 1728 Bradley descubrió el fenómeno de aberración de la luz, que consiste en el cambio aparente de posición de las estrellas en diferentes épocas
del año (Figura 1.2). Este efecto se explica fácilmente, si se supone que el
éter está en reposo respecto al sol, pues, dado que la tierra se mueve con
una velocidad aproximada de 30km/s en su órbita alrededor del sol y, por
lo tanto, si tomamos una estrella colocada perpendicularmente al plano de
translación de la tierra, el telescopio debe inclinarse un ángulo adicional dado por vc sin θ, en donde v es la velocidad orbital de la tierra, c la velocidad
de la luz respecto al éter y θ mide la posición angular instántanea de la
estrella respecto a la tierra. Esta interpretación fue capaz de dar el valor
correcto de la aberración observada, a primer orden en v/c.
Es de anotar, que los experimentos de aberración de la luz estelar no
eran capaces de dar el valor de la velocidad absoluta de la tierra respecto al
éter, sino solamente cambios de la velocidad relativa de la tierra respecto al
éter. Arago en 1810 propuso una modificación al experimento de aberración,
12
CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO
Figura 1.2: Aberración de la luz estelar
que sí permitiría medir la velocidad absoluta de la tierra respecto al éter,
pues de acuerdo con la teoría clásica, si la luz atravesaba un medio refractivo
(como el agua o un vidrio), el cual estuviera moviéndose respecto al éter,
entonces la velocidad de la luz respecto a este medio variaba, dependiendo de
la dirección relativa de movimiento del medio y el éter, es decir, el índice de
refración del medio dependería de la dirección relativa de movimiento. Arago
colocó un prisma en el telescopio y observó diferentes estrellas, esperando
encontrar variaciones del ángulo de aberración. El resultado negativo de su
experimento, condujo a Fresnel a proponer la teoría del arrastre parcial del
éter por los medios materiales en movimiento y mostró que este arrastre
parcial del éter hacía inobservable el efecto del viento de éter en medios
materiales, en órdenes de magnitud de v/c.
Basados sobre este mismo principio, se realizaron toda una serie de experimentos como los de Hoek, de Mascart y Jamin, Airy, Fizeau, etc, obteniéndose también resultados negativos. Sin embargo, no se podía estar seguro
que las condiciones experimentales fueran lo suficientemente adecuadas para
medir los pequeños efectos que se estaban buscando. Además se agregaba
la dificultad que al utilizar luz blanca, el índice de refración de la luz en un
medio dependía de la frecuencia y por tanto cada color (frecuencia) sufría un
arrastre diferente. Los problemas de la teoría del éter no se centraban úni-
1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO
13
camente en la determinación de la velocidad absoluta de la tierra respecto
al éter, sino también tenían que dar cuenta de los demás efectos conocidos,
tales como las leyes de reflexión, refracción, polarización, cristales ópticos,
etc, lo cual conducía a complicar cada vez más el modelo mecánico del éter.
Un elemento adicional que se sumaba a esta historia del éter, lo constituye el desarrollo de las teorías de la electricidad y el magnetismo, que
culminan hacia mediados del siglo XIX con las ecuaciones de Maxwell y con
el descubrimiento, tal vez el más importante de ese siglo, que la luz son ondas
electromagnéticas. A partir de este momento el éter se asoció como el medio
de propagación de los campos eléctricos y magnéticos. Pero un punto más
importante para nuestra discusión de los orígenes de la teoría especial de
la relatividad, lo constituye el hecho de que las leyes del electromagnetismo
de Maxwell no satisfacen el principio de relatividad de Galileo. Lo que resta
de esta sección lo dedicaremos a explicar el significado de este hecho y sus
implicaciones.
Que las leyes del electromagnetismo de Maxwell no satisfacen el principio de relatividad de Galileo significa que las ecuaciones de Maxwell no
permanecen invariantes, cuando se realiza una transformación de Galileo
entre dos sistemas de referencia inerciales, o en otros términos equivalentes,
si suponemos que las ecuaciones de Maxwell son válidas en un sistema de referencia inercial Σ, entonces ellas cambiarán para cualquier otro observador
inercial Σ0 , que se mueva con respecto a Σ. Este cambio se refleja en que a
las ecuaciones de Maxwell le aparecen nuevos términos, que van a depender
de la velocidad relativa de los sistemas. Estos nuevos términos dependientes
de la velocidad en las leyes de la electrodinámica deben producir efectos observables y por tanto, deben permitir determinar la velocidad del sistema de
referencia Σ0 del observador, respecto al único sistema de referencia inercial
para el cual las ecuaciones de Maxwell toman su forma más simple.
Esta situación de las leyes del electromagnetismo rescataba entonces el
concepto de espacio absoluto, identificado a su vez con el sistema de reposo
del éter, pero ahora y a diferencia del caso de la mecánica de Newton, dándole
un significado físico: Las leyes de la electrodinámica son válidas solamente
en el sistema de referencia en reposo con respecto al espacio absoluto.
Para ilustrar esta situación, consideremos dos cargas +q y −q, unidas
por una varilla rígida aislante (Figura 1.3). Si este sistema está en reposo
respecto al espacio absoluto Σ, la única fuerza entre las cargas es la eléctrica,
dada por la ley de Coulomb. Pero si estas cargas se encuentran en reposo en
otro sistema de referencia inercial Σ0 que se mueva respecto Σ a una velocidad v, entonces aparecerá un campo magnético y así, una fuerza, adicional
a la fuerza eléctrica, debida al movimiento de las cargas, que producirá, por
14
CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO
Figura 1.3: Experimento de Truton-Noble
lo tanto, un par de fuerzas que tenderá a hacer girar el sistema. Este experimento, con resultado negativo, fue llevado a cabo por Trouton y Noble,
2
esperando encontrar una fuerza magnética que dependía de la relación vc2 ,
siendo v la velocidad de la tierra. Es de anotar, que el diseño experimental utilizado para realizar este experimento, permitía medir cantidades del
orden de magnitud de v 2 /c2 ∼ 10−8 .
1.3.1.
Un experimento crucial
El experimento más notable, y de referencia obligada en todo tratado de
relatividad, lo constituye el realizado por Michelson y Morley en 1887. Es
interesante notar, que Einstein no hace referencia alguna a este experimento
en sus primeros artículos, en donde desarrolla la teoría especial de la relatividad, y de hecho, varios historiadores de la ciencia afirman que ni siquiera
lo conocía. La importancia histórica de este experimento y su obligatoria
referencia, la podemos entender por dos aspectos: primero, el diseño del
experimento permitía medir, con una precisión suficiente (corrimientos del
patrón de interferencia menores a 1/100 de franja), evitando así, el problema
que se presentaba en todos los otros experimentos realizados hasta entonces,
en cuanto a que, el orden de magnitud de los efectos esperados, eran siempre
menores o del mismo orden que el error experimental, dejando siempre un
1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO
15
velo de duda sobre los resultados obtenidos. Segundo, el resultado negativo
del experimento de Michelson y Morley generó toda una serie de trabajos
teóricos, que impulsaron el desarrollo de la física y abrieron el camino para
la formulación de la teoría de la relatividad. Tal vez, el más importante de
estos trabajos fue el realizado por Lorentz, que culminó con su libro sobre la
teoría del electrón publicado en 1905. Es interesante, más no sorprendente,
anotar como, en este libro, se encuentran todas las ecuaciones que describen
los fenómenos más significativos que predice la relatividad, como por ejemplo, las transformaciones entre sistemas de referencia inerciales (llamadas hoy
transformaciones de Lorentz), las ecuaciones de contracción de longitudes y
dilatación del tiempo, la equivalencia masa-energía, la variación de la masa
inercial con la velocidad, etc, solamente que su interpretación, en términos
de las propiedades del éter, era incorrecta, en cuanto a que, estos efectos
esperados, siempre se compensaban con otros debidos al éter, de tal manera que ninguno de ellos resultaba ser observable. Este trabajo teórico de
Lorentz resolvía, así, la aparente inconsistencia entre los dos grandes pilares
de la física conocidos hasta entoces, la mecánica de Newton y la electrodinámica de Maxwell, pero dejaba el problema fundamental sin resolver: el
espacio absoluto y la indetectabilidad del éter.
Anotábamos en el parágrafo anterior, que no es una sorpresa que el trabajo de Lorentz contenga todas las ecuaciones relativistas, pues está basado sobre la electrodinámica de Maxwell, que como veremos en un capítulo
posterior, es una teoría relativista. Igualmente, esta anotación nos permite
también entender, por qué no era necesario que Einstein conociera el experimento de Michelson y Morley para desarrollar la teoría de la relatividad.
En efecto, basta con recordar el título del primer artículo publicado por
Einstein sobre el tema:“Zur Elektrodinamik der bewegten Körper” (Sobre
la electrodinámica de los cuerpos en movimiento).
El experimento de Michelson-Morley fue realizado en 1887, utilizando
como principio físico el fenómeno de interferencia de la luz. El diseño experimental es bosquejado en la (Figura 1.4). De la fuente S sale un haz de
luz que incide sobre un espejo semitransparente A, el cual divide al haz en
dos rayos mutuamente perpendiculares, los cuales se reflejan en los espejos
planos B y C, retornando al espejo A, en donde, el rayo proveniente del
espejo C es desviado hacia el objetivo O, mientras que el rayo reflejado en
B atraviesa el espejo A y llega al objetivo O, donde se observan franjas de
interferencia, las cuales dependen de la diferencia de caminos ópticos entre
los dos rayos de luz.
Supongamos, sin pérdida de generalidad y para simplicar el análisis, que
16
CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO
Figura 1.4: Experimento de Michelson y Morley
los caminos AB y AC de los dos haces de luz son iguales. Sea v la velocidad
de la tierra respecto al éter y paralela al brazo AC del interferómetro. Así,
la velocidad del viento del éter respecto al interferómetro, fijo a la tierra,
está en la dirección de CA (ver Figura 1.4), suponiendo que no hay arrastre
parcial del éter. De acuerdo con las teorías del éter, la velocidad de la luz
relativa al laboratorio es c−v, cuando va de A hacia C y c+v cuando regresa
1
de C hacia A, mientras que la velocidad del otro rayo de luz es (c2 − v2 ) 2
en la dirección de A hacia B y de B hacia A.
Entonces, si la longitud de cada uno de los brazos del interferómetro es
L, la diferencia de tiempos de llegada de los dos rayos está dada por:
2Lc
2L
−√
2
2
−v
c − v2
1
2L
1
(
−p
)
2
2
c 1 − v /c
1 − v2 /c2
∆t = tACA − tABA =
=
c2
(1.13)
Utilizando la expansión en serie
(1 + x)r = 1 + rx +
1
r(r − 1)x2 + · · ·
2!
(1.14)
la cual es convergente para |x| < 1, se desarrolla cada fracción hasta términos
1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO
17
del orden de v 2 /c2 , obteniendo:
∆t ' L
v2
c2
(1.15)
Si rotamos el interferómetro 90◦ , el tiempo para recorrer el camino ABA
será ahora mayor que el tiempo para el camino ACA, y la diferencia de
2
tiempos ∆t estará dada por ∆t ' −L vc2 . Por lo tanto, el cambio total en la
2
diferencia de tiempos al rotar el interferómetro es igual a 2L vc2 . Si λ es la
longitud de onda de la luz utilizada, entonces la rotación del interferómetro
da lugar a un corrimiento de n franjas, dado por:
n=
2L v2
λ c2
(1.16)
Michelson y Morley utilizaron en su experimento luz de longitud de onda
de 5,9 × 10−7 m y un camino de L = 11m, logrado por múltiples reflexiones.
Tomando para la velocidad de la tierra alrededor del sol 30km/s, se esperaba
un corrimiento de aproximadamente 0,37 franjas, el cual, como ya se ha dicho
no fue observado.
18
CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO
Capítulo 2
Fundamentos de la
relatividad especial
En este capítulo formularemos los postulados fundamentales sobre los
cuales está basada la teoría especial de la relatividad y obtendremos las ecuaciones de transformación entre sistemas de referencia inerciales (transformaciones de Lorentz). Concluiremos el capítulo estudiando las propiedades de
las transformaciones de Lorentz y sus consecuencias sobre la medida de intervalos temporales y espaciales.
2.1.
Postulados de la relatividad especial
Como fue anotado en el capítulo anterior, la teoría desarrollada por
Lorentz solucionaba la aparente inconsistencia de la mecánica Newtoniana y
la electrodinámica de Maxwell, manteniendo inmodificados los principios y
postulados físicos sobre los cuales se basaban estas teorias. La aproximación
de Einstein a este problema es diferente, pues está basada sobre dos postulados de carácter fundamental, en el sentido de que estos postulados deben ser
satisfechos por cualquier teoría física que se proponga, independientemente
de las leyes y principios que se postulen para describir esta teoría.
Postulado 1: Las leyes físicas son independientes del sistema de referencia inercial, con respecto al cual se midan las variables que describen al
sistema físico considerado.
Postulado 2: La velocidad de la luz en el vacío es la misma para todos
los observadores inerciales, independiente de la dirección de propagación y
de la velocidad de la fuente emisora.
El primer postulado propuesto por Einstein es conocido también como
19
20 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
el Principio de Relatividad, el cual generaliza el principio de relatividad
Galileano a todas las leyes de la física. El costo de aceptar este postulado
es el de abandonar las transformaciones de Galileo, que relacionan las coordenadas de los eventos medidas por diferentes observadores inerciales, y de
paso, se hace necesario revisar las leyes de la mecánica Newtoniana. Pues,
como vimos en la parte final del capítulo anterior, las ecuaciones de Maxwell
no eran invariantes bajo transformaciones de Galileo, indicando que las leyes
del electromagnetismo no obedecían el principio de relatividad de Galileo.
Sin embargo, los experimentos realizados para demostrar este hecho daban
todos resultados negativos, y no es aventurado pensar que fue esta situación
la que llevó a Einstein a postular, que las leyes de la electrodinámica sí satisfacían el principio de relatividad, pero entonces ésto exigía abandonar las
ecuaciones de transformación de Galileo, como la forma correcta de expresar
las transformaciones entre sistemas de referencia inerciales. Esto implicaba
también que deberían ser modificadas las leyes de la mecánica de Newton,
las cuales sí permanecen invariantes bajo transformaciones de Galileo.
El segundo postulado de la Teoría de la Relatividad establece que la
velocidad de la luz en el vacío es constante, independiente del sistema de
referencia inercial desde el cual ésta sea medida. Cómo llegó Einstein a este
resultado, es un problema que ha sido objeto permanente de debate en la
historia de la ciencia. Ninguno de los experimentos realizados en el siglo XIX
se puede considerar como evidencia directa de la constancia de la velocidad
de la luz en el vacío. Es claro a la luz de este postulado, el resultado negativo
del experimento de Michelson y Morley y podría pensarse, como lo afirma
Grünbaum, que Einstein incorpora este resultado nulo como un axióma, a
través del principio de la constancia de la velocidad de la luz. Aun cuando
en una entrevista realizada por Shankland a Einstein en 1950, le afirma que
él no estaba familiarizado con el experimento de Michelson y Morley cuando
escribió su artículo en 1905, Shankland hace notar que en este artículo Einstein hace referencia a ”intentos fallidos para detectar cualquier movimiento
de la tierra respecto al éter lumínico”, lo que indica según Shankland, que
Einstein tenía referencia de los diferentes experimentos ópticos realizados,
pero no de los detalles própios de cada experimento.
Una aproximación alternativa para buscar los orígenes de este segundo postulado, la podemos encontrar en la teoría de la electrodinámica de
Maxwell, pues, si aceptamos su validez y el principio de relatividad, podemos
encontrar el principio de la constancia de la velocidad de la luz, así como
también el postulado de la constancia de la carga eléctrica, el cual juega un
papel igualmente importante en física.
Las ecuaciones de Maxwell, en el sistema M.K.S. racionalizado, para un
2.1. POSTULADOS DE LA RELATIVIDAD ESPECIAL
21
observador inercial Σ toman la forma
∇ · E = ρ/ε0
(2.1)
∇·B =0
(2.2)
∇ × B = µ0 J + µ0 ε0
∂E
∂t
(2.3)
∂B
(2.4)
∂t
con µ0 = 4π × 10−7 N w/(amp)2 la permeabilidad magnética del vacío y
ε0 = 8, 854 × 10−12 coulomb2 /N w · m2 la constante dieléctrica del vacío. La
primera ecuación corresponde a la ley de Gauss, y establece que las cargas
son fuente del campo eléctrico, siendo ρ la densidad de carga. La segunda
ecuación afirma que no existen cargas magnéticas aisladas. El primer término
de la tercera ecuación corresponde a la ley de Ampère y significa que las
corrientes eléctricas son fuente del campo magnético, con J la densidad
de corriente, mientras que el último término, conocido como corriente de
desplazamiento de Maxwell, establece que variaciones temporales del campo
eléctrico son también fuente del campo magnético. La última ecuación es la
ley de inducción de Faraday, en la cual variaciones temporales del campo
magnético producen campos eléctricos. Las ecuaciones de campo de Maxwell
se completan con una ecuación de movimiento, la cual establece que la fuerza
sobre una partícula de carga q en presencia de un campo electromagnético
está dada por :
F = q E + qu × B
(2.5)
∇×E =−
conocida como la fuerza de Lorentz.
Si tomamos la divergencia de la tercera ecuación de Maxwell, haciendo
uso de la ley de Gauss (primera ecuación) y del hecho que la divergencia
del rotacional siempre es cero, obtenemos la ecuación de continuidad para
la carga eléctrica
∂ρ
+∇·J =0
(2.6)
∂t
Integrando en todo el espacio y aplicando el teorema de Gauss, se llega
al principio de conservación de la carga:
Z
dQ
d
ρdV =
=0
(2.7)
dt
dt
Este resultado es independiente del estado de movimienento de la carga
y existe muchísima evidencia experimental que lo corrobora. Por ejemplo,
22 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
si la carga dependiera de la velocidad, el átomo de hidrógeno podría no ser
eléctricamente neutro, ya que en promedio, la velocidad del electrón en el
átomo es mayor que la velocidad del protón.
Considerando otro sistema de referencia inercial Σ0 y asumiendo el principio de relatividad, las ecuaciones de Maxwell en este nuevo sistema están
dadas por:
0
(2.8)
∇ · E 0 = ρ0 /ε0
0
∇ · B0 = 0
0
∇ × B 0 = µ0 J 0 + µ0 ε0
(2.9)
∂E0
∂t0
(2.10)
∂B0
(2.11)
∂t0
en donde las cantidades primadas se refieren a sus valores medidos por el
observador Σ0 . Siguiendo los mismos pasos anteriores, obtenemos la ecuación
de continuidad en el sistema de referencia Σ0
0
∇ × E0 = −
∂ρ0
0
+ ∇ · J0 = 0
∂t0
(2.12)
y el principio de la invarianza de la carga, que para el caso de una partícula
elemental su valor invariante corresponde al valor medido de la carga, cuando ésta se encuentra en reposo respecto al sistema de referencia inercial Σ0 .
Una suposición fundamental que está implícita en el principio de relatividad,
es que parámetros tales como la carga , la masa, etc., de una partícula fundamental, cuando son medidos respecto a un sistema de referencia Σ para el
cual la partícula está en reposo, toman el mismo valor numérico cuando se
miden con respecto a otro sistema de referencia inercial Σ0 cuando la partícula se encuentra en reposo relativo respecto a este sistema Σ0 . Si aceptamos
esta suposición, entonces el principio de la constacia de la carga eléctrica, se
obtiene de las ecuaciones de Maxwell y del principio de relatividad.
Consideremos, ahora, las ecuaciones de Maxwell en el vacío (ρ = 0,
J = 0), en un sistema de referencia inercial Σ y tomemos el rotacional de
la última ecuación de Maxwell (la ley de inducción de Faraday), entonces,
teniendo en cuenta la identidad vectorial
∇ × ∇ × E = ∇(∇ · E) − ∇2 E
(2.13)
y la primera ecuación de Maxwell en el vacío ∇ · E = 0, obtenemos
∇2 E − µ0 ε0
∂2E
=0
∂t2
(2.14)
2.1. POSTULADOS DE LA RELATIVIDAD ESPECIAL
23
Esta relación corresponde a la ecuación de ondas electromagnéticas (con
una ecuación similar para el vector campo magnético), y describe la radiación electromagnética producida por algún sistema de cargas aceleradas,
y cuya velocidad de propagación en el vacío, viene dada por:
√
(2.15)
c = 1/ µ0 ε0
siendo esta velocidad de propagación, independiente de la velocidad de la
fuente (sistema de cargas aceleradas). Si ahora asumimos de nuevo la validez
del principio de relatividad y consideramos otro sistema de referencia inercial
Σ0 , obtenemos, siguiendo un razonamiento similar, la ecuación de ondas en
el sistema de referencia Σ0 :
∇02 E 0 − µ00 ε00
∂2E0
=0
∂t02
(2.16)
Esta ecuación describe la propagación de las ondas electromanéticas con
una velocidad (µ00 ε00 )−1/2 en el vacío, la cual, como para el caso del sistema de
referencia Σ, es también independiente del movimiento de las cargas fuente.
Si definimos el amperio a través de la ley de Biot-Savart, como la corriente que circula por dos hilos paralelos infinitos, separados por una distancia
de un metro en el vacío, para que sobre cada hilo se experimente una fuerza
por unidad de longitud de 2 × 10−7 N w, entonces el valor de la constante
permeabilidad magnética del vacío es:
µ00 = µ0 = 4π × 10−7 N w/m
(2.17)
Por otra parte, si suponemos que la ley de Coulomb es válida en los dos
sistemas de referencia inerciales Σ y Σ0 , y que la fuerza de Coulomb, entre dos
partículas iguales en reposo relativo, por ejemplo dos electrones o protones,
es la misma en ambos sistemas de referencia inerciales, entonces ε00 = ε0 y
por lo tanto la velocidad de la luz es independiente del sistema de referencia
inercial desde el cual ésta sea medida e independiente del movimiento de las
fuentes.
Si aceptamos ahora, que el postulado de la constancia de la velocidad de
la luz es válido, y las ecuaciones de Maxwell son correctas, entonces ε00 = ε0 y
también µ00 = µ0 . Esto implica que las unidades fundamentales de longitud,
tiempo, masa y carga eléctrica deben ser definidas en la misma forma en
todos los sistemas de referencia inerciales, así como también las constantes
fundamentales de la física: la constante de Planck h = 6, 626 × 10−34 J · s, la
constante de gravitación universal de Newton G = 6, 670 × 10−11 N w · m2 ·
kg −2 y la velocidad de la luz en el vacío c = 2, 998 × 108 m · s−1 .
24 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
Como fue originalmente propuesto por Planck, estas constantes fundamentales c, G y ~ = h/2π, pueden ser conbinadas para dar las unidades
fundamentales de longitud, tiempo y masa:
Lp := (G~/c3 )1/2 = 1, 616 × 10−35 m
(2.18)
Tp := (G~/c5 )1/2 = 5, 39 × 10−44 s
(2.19)
Mp := (~c/G)1/2 = 2, 18 × 10−8 kg
(2.20)
llamadas longitud, tiempo y masa de Planck respectivamente. Actualmente
es práctica usual en la física trabajar con unidades de c = ~ = G = 1, las
cuales son llamadas unidades fundamentales o naturales.
2.2.
Transformaciones de Lorentz
De lo discutido en la sección anterior, las leyes de la electrodinámica
son físicamente compatibles con el principio de la constancia de la velocidad de la luz, pero a diferencia de las leyes de Newton, las ecuaciones de
Maxwell no permanecen invariantes bajo las transformaciones de Gelileo.
Esta situación nos conduce al problema de encontrar un conjunto de transformaciones de coordenadas compatibles con los postulados de la relatividad especial. Lorentz a finales del sigloXIX, encontró las transformaciones
de coordenadas que dejaban invariante a las ecuaciones de Maxwell, pero en
ningún momento las consideró como las ecuaciones de transformación entre
sistemas de referencia inerciales, pues ellas claramente, no eran compatibles
con las leyes de la mecánica Newtoniana. Estas transformaciones se conocen
hoy día como las transformaciones de Lorentz.
En esta sección mostraremos, que las transformaciones de Lorentz, constituyen el conjunto de ecuaciones de transformación de coordenadas entre
sistemas de referencia inerciales, deduciéndolas a partir de los postulados
fundamentales de la relatividad especial, junto con algunas suposiciones generales sobre homogeneidad e isotropía del espacio y del tiempo.
Antes de abordar el problema de obtener las ecuaciones de transformación de coordenadas, es importante aclarar algunos conceptos sobre la forma
como se definen y miden las coordenadas del espacio y del tiempo, y sobre
los postulados de homogeneidad e isotropía.
Al igual que en la mecánica Newtoniana, asumiremos que el espacio físico es homogéneo e isotrópico, lo cual implica que todos los puntos y todas
las direcciones espaciales son equivalentes para describir los fenómenos físicos. Esto significa, en términos más precisos, que las leyes fundamentales
2.2. TRANSFORMACIONES DE LORENTZ
25
de la física no deben depender de la posición y de la dirección espacial, lo
cual energía se traduce en la arbitrariedad para elegir el origen y la dirección de los ejes espaciales. Adicionalmente se postula que el espacio físico
es tridimensional y obedece los postulados de la geometría euclideana. La
homogeneidad e isotropía del tiempo, significan que las leyes de la física
no deben depender de un instante particular ni de la dirección del tiempo
elegida, es decir, la elección del origen y la escala para medir el tiempo es
arbitraria (homogeneidad) y que las leyes de la física son invariantes bajo
una transformación de la forma t → −t (isotropía). Estas propiedades del
espacio y el tiempo deben quedar reflejadas en el sistema de coordenadas
espacio-temporales elegido, así como la forma en que se miden las distancias
espaciales y el intervalo temporal entre eventos físicos.
Un evento es un fenómeno físico independiente del observador (tal como
la colisión entre dos partículas, o la emisión de un fotón por un átomo), el
cual ocurre en un punto del espacio y en un instante de tiempo y puede ser
medido por instrumentos físicos adecuados.
Adicional a los postulados anteriores sobre la estructura del espacio y el
tiempo, suponemos que se puede definir una escala de medida de longitudes,
igual para todos los observadores inerciales, la cual nos permite medir intervalos espaciales utilizando un sistema de reglas rígidas. Este procedimiento
define una métrica para el espacio, que cumple con las propiedades de homogeneidad e isotropía y que obedece la geometría euclideana. El sistema
de coordenadas cartesianas espaciales R3 con la métrica usual, esto es la
métrica euclideana
x ∈ R3 ⇒ |x|2 = x21 + x22 + x23
(2.21)
nos ofrece el modelo matemático natural para describir el espacio físico.
Uno de los aspectos cruciales de la teoría de la relatividad lo constituye el
problema de la medida del tiempo. En efecto, Einstein en su primer artículo,
dedica una buena parte de él a definir la forma como se miden los intervalos
temporales entre eventos físicos. Definida ya la estructura métrica del espacio
y el proceso de medida de intervalos espaciales, podemos utilizar el postulado
de la constancia de la velocidad de la luz para definir el concepto de tiempo
físico, es decir, el método operacional para la medida del tiempo que esté
de acuerdo con los postulados fundamentales de la física y que refleje las
propiedades de homogeneidad e isotropía del tiempo.
En primer lugar se asume, que si dos eventos físicos ocurren en el mismo
punto del espacio y simultáneamente (en el mismo instante de tiempo) para
un observador inercial, entonces estos dos eventos físicos serán simultáneos
26 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
Figura 2.1: Sincronización de relojes
para todos los observadores inerciales y ocurrirán también en el mismo punto del espacio. En otras palabras, la simultáneidad de eventos en un mismo
punto del espacio es un hecho físico absoluto, i.e., independiente del observador. Supongamos además, que se dispone de un conjunto de relojes ideales
e idénticos, es decir, algún dispositivo o fenómeno físico reproducible, que
nos permita determinar una escala de tiempo y situemos uno de estos relojes
en el origen de coordenadas espaciales escogido por un observador inercial.
De acuerdo con la suposición sobre el caracter absoluto de la simultáneidad
para eventos que tienen lugar en el mismo punto del espacio, el observador
determinará un tiempo, el marcado por el reloj situado en su origen, para
cada evento que ocurra en el origen de coordenadas. Este tiempo marcado
por el reloj supone haber elegido un instante inicial, t = 0, el cual es arbitrario, de acuerdo con la hipótesis de homogeneidad del tiempo. Ahora,
coloquemos en cada punto del espacio y en reposo relativo al reloj del origen,
uno de estos relojes idénticos, y determinemos que el instante de tiempo en
que un evento físico sucede, es el marcado por el reloj situado en el punto
del espacio donde el evento tiene lugar.
Hasta este momento se ha definido la medida del tiempo local y falta
entonces “sincronizar” todos los relojes del observador inercial, para que este
2.2. TRANSFORMACIONES DE LORENTZ
27
observador asigne un único tiempo y así, una única coordenada temporal a
cada evento físico, independiente de la posición espacial en la cual suceda
dicho evento. Para sincronizar los relojes seguiremos el método expuesto por
Einstein en su primer artículo.
Para el reloj situado en el origen de coordenadas, elijamos un instante
cualquiera como el tiempo t = 0. Consideremos un segundo reloj situado a
una distancia d del origen y enviemos, desde el origen y en la dirección de este
segundo reloj, un rayo de luz en en el instante en que el reloj del origen marca
t1 (Figura 2.1). Este segundo reloj marcará un tiempo t2 cuando el rayo de
luz lo alcanza, y se define entonces que los dos relojes están sincronizados,
si se cumple que
t2 = t1 +
d
c
(2.22)
Con estas definiciones de medida de la distancia y del intervalo temporal, un observador inercial construye su sistema de coordenadas espaciotemporal. Este procedimiento es consistente y válido para todos los observadores inerciales, puesto que la distancia d para puntos en reposo relativo
está bien definida y es por su definición independiente del observador, así como la velocidad de la luz en el vacío c es una constante universal, de acuerdo
con el segundo postulado.
La coordenada temporal para un evento, se le define, entonces, como la
lectura del reloj que está situado en el punto del espacio donde el evento
ocurre, y de acuerdo con la hipótesis del caracter absoluto de la simultáneidad, para eventos que suceden en el mismo punto del espacio, este procedimiento es independiente del observador.
Habiendo definido la forma como un observador inercial construye su
sistema de coordenadas espacio-temporales, abordemos, ahora, el problema
de encontrar las ecuaciones que relacionan las coordenadas de un evento,
asignadas por dos observadores inerciales.
Sea p un evento físico, y séan (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) las coordenadas
del evento, medidas por los dos observadores inerciales Σ y Σ0 . De acuerdo
con la homogéneidad e isotropía del espacio y el tiempo, supongamos, sin
pérdida de generalidad, que los dos observadores eligen los ejes coordenados
espaciales paralelos, con v, la velocidad del sistema Σ0 respecto a Σ, en
la dirección positiva de los ejes x, x0 , y además, define cada observador, el
origen de la coordenada temporal t = t0 = 0, en el instante en que los
orígenes espaciales de los sistemas coinciden (Figura 2.2).
El conjunto de transformaciones de coordenadas, que estamos buscando,
28 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
Figura 2.2: Transformaciones de Lorentz
lo podemos escribir en la forma general como:
t0 = f1 (t, x, y, z)
(2.23)
x0 = f2 (t, x, y, z)
(2.24)
y 0 = f3 (t, x, y, z)
(2.25)
z 0 = f4 (t, x, y, z)
(2.26)
con la condición que las funciones fi séan invertibles, es decir, que se puedan
despejar las coordenadas (t, x, y, z) en función de las coordenadas primadas
(t0 , x0 , y 0 , z 0 ).
Otra condición general sobre las funciones fi la impone la primera ley de
Newton la cual implica que una partícula libre debe moverse con velocidad
constante para todos los observadores inerciales. Esta exigencia implica que
las ecuaciones de transformación deben ser lineales en las coordenadas. Así,
el sistema de ecuaciones de transformación (2.23), (2.24), (2.25) y (2.26) lo
podemos escribir como:
t0 = a00 t + a01 x + a02 y + a03 z
(2.27)
x0 = a10 t + a11 x + a12 y + a13 z
(2.28)
2.2. TRANSFORMACIONES DE LORENTZ
29
y0 = a20 t + a21 x + a22 y + a23 z
(2.29)
z 0 = a30 t + a31 x + a32 y + a33 z
(2.30)
en donde los coeficientes ai,j son constantes independientes de las coordenadas. Estos coeficientes ai,j son funciones, a lo sumo, de la velocidad del
sistema de referencia Σ0 respecto a Σ, pues se supone que todos los observadores eligen las mismas escalas para medir distancias y tiempos. La
linealidad implica también que los ejes espaciales de Σ0 permanecen siempre
paralelos a si mismos y así a los ejes espaciales de Σ. Además, la velocidad
del sistema Σ respecto a Σ0 es igual a −v (igual en magnitud y opuesta a
la velocidad de Σ0 respecto a Σ), y por lo tanto la transformación inversa
debe tener la misma forma cambiando v por −v. Para el caso cuando v = 0,
la transformación se reduce a la identidad. La condición de existencia de la
transformación inversa, por otra parte, queda garantizada exigiendo que el
determinante de los coeficientes aij sea diferente de cero.
De la escogencia de los ejes espaciales se obtiene que los planos y = 0
y y0 = 0 coinciden permanentemente (todos los ejes espaciales de los dos
sistemas de referencia permanecen paralelos) y por lo tanto la ecuación de
transformación para la coordenada y 0 debe reducirse a:
y 0 = a22 y
(2.31)
Si invertimos las direcciones de los ejes x y z de Σ no se debe afectar la
relación anterior, y por lo tanto la transformación inversa de Σ0 a Σ, para
la coordenada y, toma la forma
y = a022 y 0 = a22 y 0
(2.32)
Esto implica, por lo tanto que se debe cumplir que a22 = ±1. Por otra
parte, dado que para v → 0 se cumple que y0 → y, entonces
a22 = 1
(2.33)
Un argumento similar vale para la coordenada z, entonces
y0 = y ; z 0 = z
(2.34)
Puesto que la transformación de coordenadas es lineal y las coordenadas
del origen del sistema de referencia Σ0 , medidas por el observador Σ, están
dadas por x = vt, entonces x0 debe ser de la forma
x0 = γ(x − vt)
(2.35)
30 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
donde γ es un parámetro que, en general, depende de la velocidad. Por
simetría, la transformación inversa para la coordenada x tendrá la misma
forma (con v cambiada por −v), entonces
x = γ 0 (x0 + vt0 )
(2.36)
siendo γ 0 otra constante dependiente de v. Si invertimos las direcciones de
los ejex x y z en Σ y Σ0 , entonces las relaciones (2.35) y (2.36) se siguen
cumpliendo, es decir si cambiando x → −x y x0 → −x0 tenemos que
−x0 = γ(−x − vt)
=⇒
−x = γ 0 (−x0 + vt0 )
=⇒
0
x
= γ(x + vt)
(2.37)
y
0
0
0
x = γ (x − vt )
(2.38)
de donde se obtiene que γ = γ 0 , pues, del principio de relatividad la física
no debe depender de la dirección elegida para los ejes espaciales. Además,
el parámetro γ debe ser positivo dado que para t = 0, x0 > 0 si x > 0.
Para encontrar una expresión explícita para γ y la forma como la coordenada temporal se transforma, apliquemos ahora el segundo postulado de la
constancia de la velocidad de la luz en el vacío. Si en el instante t = 0 = t0 ,
cuando los orígenes coinciden, se emite un pulso de luz en la dirección del eje
x positivo, entonces se debe satisfacer que al cabo de un tiempo t, medido en
Σ, el pulso de luz esté en un punto del espacio cuya coordenada x, medida
en Σ, cumpla x = ct. De acuerdo con el postulado de la constancia de la
velocidad de la luz en el vacío, para el observador Σ0 se debe cumplir que
el pulso de luz llega al punto del espacio de coordenada x0 , en un instante
t0 , tal que x0 = ct0 . Substituyendo estas dos relaciones, x = ct y x0 = ct0 ,
en las ecuaciones (2.35) y (2.36), multiplicando las ecuaciones resultantes y
eliminando el término tt0 , obtenemos
1
γ = γ(v) = p
1 − v 2 /c2
(2.39)
conocido como el factor gamma de Lorentz. A partir de esta expresión y
eliminando la coordenada x0 entre las ecuaciones (2.35) y (2.36), obtenemos
la ecuación de transformación para la coordenada temporal:
t0 = γ(t − vx/c2 )
(2.40)
2.3. PROPIEDADES DE LAS TL
31
Resumiendo, el conjunto de transformaciones de coordenadas, llamadas
transformaciones de Lorentz (TL), que relacionan las coordenadas espaciotemporales de un evento físico medidas por dos observadores inerciales, están
dadas por:
t0 = γ(t − vx/c2 )
x0 = γ(x − vt)
(2.41)
y0 = y
z0 = z
Así, el principio de relatividad exige que las leyes de la física deben ser
tales que ellas permanezcan invariantes bajo las tranformaciones de Lorentz
(ecuaciones (2.41)), pues, como veremos en la siguiente sección donde se
discutirán algunas propiedades de las TL, éllas contienen implícitamente
al postulado de la constancia de la velocidad de la luz. Para encontrar las
transfomaciones de Lorentz inversas, es decir, las transformaciones de coordenadas para pasar del sistema Σ0 al sistema Σ, basta con invertir las
ecuaciones (2.41), o en forma equivalente, cambiando v por −v en las TL
(2.41) y las coordenadas primadas por las no primadas (por la simetría entre
los sistemas Σ y Σ0 ):
t = γ(t0 + vx0 /c2 )
x = γ(x0 + vt0 )
(2.42)
y = y0
z = z0
2.3.
Propiedades de las TL
Las ecuaciones de transformación de Lorentz encontradas en la sección
anterior, corresponden a un caso particular de un conjunto de transformaciones más general, que constituyen la expresión matemática del principio
de relatividad y de las propiedades de homogeneidad e isotropía del espacio
y el tiempo. En efecto, el conjunto de transformaciones de coordenadas más
general se puede escribir en la forma:
0µ
x =
3
X
Λνµ xν + aµ ; µ, ν = 0, 1, 2, 3
(2.43)
ν=0
con Λνµ y aµ constantes independientes de las coordenadas. Para simplificar
las expresiones hemos introducido la notación
ct ≡ x0 ; x ≡ x1 ; y ≡ x2 ; z ≡ x3
(2.44)
32 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
de tal manera que la coordenada temporal la medimos en unidades de longitud, dado el carácter de constante universal de la velocidad de la luz c. Esta
redefinición de la coordenada temporal nos permite, como veremos más adelante, escribir las transformaciones de Lorentz en una forma más simétrica
y resaltar en forma explícita el papel de la coordenada temporal en la teoría
de la relatividad. En lo sucesivo utilizaremos índices griegos, que recorren
de 0 a 3, para describir las coordenadas de un evento y dejaremos los índices
latinos para describir solamente las coordenadas espaciales.
Las ecuaciones de transformación (2.43) constituyen un conjunto de
transformaciones lineales no homogéneas, en donde las cuatro constantes
aµ corresponden a la arbitrariedad para elegir el origen de las coordenadas
espaciales (µ = 1, 2, 3) y de la coordenada temporal (µ = 0), y así representan la homogeneidad del espacio-tiempo. Esta propiedad de homogeneidad
del espacio y el tiempo, en términos más formales, se traduce en el principio de invarianza de la física bajo translaciones espaciales (ai ; i = 1, 2, 3) y
translaciones temporales (a0 ).
De sta forma, la invarianza de las leyes de la física bajo translaciones
espacio-temporales, nos permiten elegir las coordenadas de los dos sistemas
de referencia inerciales de tal manera que coincidan sus orígenes espaciales
para t = t0 = 0, haciendo que el término inhomogéneo del sistema de ecuaciones (2.43) se anula, y en este caso las ecuaciones de transformación se
reducen al sistema lineal homogéneo
0µ
x =
3
X
Λµν xν
;
µ, ν = 0, 1, 2, 3
(2.45)
ν=0
Este conjunto de transformaciones, contiene dos casos especiales: Por una
parte están las rotaciones de los ejes espaciales, las cuales reflejan la isotropía
del espacio, es decir, que la leyes físicas no deben depender de la orientación
de los ejes espaciales. Una rotación de los ejes espaciales queda determinada
por tres parámetros, por ejemplo, los tres ángulos de Euler. Por otra parte,
están las llamadas transformaciones de Lorentz puras, caracterizadas por
las tres componentes de la velocidad relativa de los sistemas de referencia
inerciales.
Así, las transformaciones de Lorentz deducidas en la sección anterior,
constituyen un caso particular del conjunto de transformaciones (2.43), en
donde el movimiento relativo entre los sistemas de referencia es a lo largo
de un eje coordenado, con ejes espaciales paralelos (no hay rotación de ejes)
y sin translación de los orígenes espacial y temporal (Figura 2.3). En este
caso basta con un solo parámetro, la magnitud de la velocidad relativa, para
2.3. PROPIEDADES DE LAS TL
33
Figura 2.3: Transformación general de coordenadas
determinar completamente la transformación.
En el caso de general de una transformación de coordenadas que involucre movimiento relativo, cambio de orientación de los ejes espaciales
y translación del origen de coordenadas espacial y temporal, se requieren
entonces 10 parámetros para determinar completamente la transformación:
Los tres parámetros ai , i = 1, 2, 3 que determinan el cambio del origen espacial, un parámetro a0 para el desplazamiento del origen temporal, tres
parámetros (e.g. los ángulos de Euler) para determinar una rotación de los
ejes espaciales y tres parámetros (e.g. las tres componentes de la velocidad relativa) para determinar una transformación pura de Lorentz. Para los
objetivos del presente libro, salvo se especifique lo contrario, es suficiente
considerar solamente transformaciones de Lorentz puras con los ejes xx0 en
la dirección de la velocidad relativa de los sistemas de referencia y supondremos además, que los orígenes de los sistemas coinciden para el tiempo
cero en ambos sistemas.
Antes de continuar con la discusión de algunas propiedades de las transformaciones de Lorentz, reescribamos las ecuaciones de transformación (2.41)
34 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
Figura 2.4: Composición de transformaciones de Lorentz
en la notación introducida en la ecuación (2.44):
x00 = γ(x0 − βx1 )
x01 = γ(x1 − βx0 )
x02 = x2
x03 = x3
(2.46)
en donde se ha definido el parámetro adimensional β = v/c y así γ(v) =
(1−β 2 )−1/2 . Como se mencionó al comienzo de esta sección, las ecuaciones de
transformación de Lorentz adquieren una forma simétrica en las coordenadas
espaciales y la temporal. Así, los coeficientes de la transformación de Lorentz
Λνµ , llamados también elementos de la matriz de transformación de Lorentz,
en la ecuación (2.45) están dados por:
Λ00 = Λ11 = γ
= Λ10 = −βγ
2
Λ 2 = Λ33 = 1
Λ01
(2.47)
siendo los demás coeficientes cero.
Consideremos ahora tres sistemas de referencia inerciales Σ, Σ0 y Σ00 , con
ejes paralelos, movimiento relativo a lo largo del eje espacial x1 , y orígenes
2.3. PROPIEDADES DE LAS TL
35
espaciales coincidentes para t = t0 = t00 = 0 (Figura 2.4). Sea v la velocidad
del sistema de referencia Σ0 respecto a Σ y w la velocidad del sistema Σ00
respecto a Σ0 , y sean (x0 , x1 , x2 , x3 ), (x00 , x01 , x02 , x03 ) y (x000 , x001 , x002 , x003 ) las
coordenadas de un evento físico medidas por los tres observadores Σ, Σ0 y Σ00 ,
respectivamente. La relación entre las coordenadas del evento medidas por
Σ y Σ0 están dadas por la ecuación (2.46) y la relación entre las coordenadas
medidas por Σ0 y Σ00 están dadas por las ecuaciones:
x000 = γ(w)(x00 − β 0 x01 )
x001 = γ(w)(x01 − β 0 x00 )
x002 = x02
x003 = x03
(2.48)
en donde β 0 = w/c. Las ecuaciones de transformación que relacionan las
coordenadas medidas por Σ y Σ00 se obtienen entonces, componiendo las
dos transformaciones, es decir, remplazando las coordenadas del sistema Σ0
de la ecuación (2.46), en esta última ecuación (2.48). Despues de reagrupar
términos, las ecuaciones de transformación finales, como era de esperarse,
toman la misma forma:
x000 = γ(u)(x0 − β 00 x1 )
x001 = γ(u)(x1 − β 00 x0 )
x002 = x2
x003 = x3
(2.49)
en donde β 00 = u/c y u es la velocidad relativa del sistema de referencia Σ00
respecto a Σ, la cual está dada por la ecuación
u=
w+v
1 + wv/c2
(2.50)
Esta ecuación corresponde a la versión relativista del teorema de adición
de velocidades de Galileo. Notemos si v < c y w < c entonces u < c.
Notemos que las ecuaciones de transformación de Lorentz y el teorema
de adición de velocidades se reducen a las ecuaciones de transformación de
Galileo y al teorema de adición de velocidades Galileano cuando c → ∞.
Este límite formal, sin embargo, carece de significado físico en la medida
que la velocidad de la luz en el vacío es una constante universal y por lo
tanto este límite debe entenderse mejor en el siguiente sentido.
Para velocidades pequeñas comparadas con la velocidad de la luz v ¿ c,
tanto las ecuaciones de transformación de Lorentz, como el teorema de adición de velociades, se reducen a las ecuaciones de transformación de Galileo
36 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
y al teorema de adición de velocidades galileano, respectivamente. Para ver
esto, es suficiente recordar la expansión en serie de Taylor de la función
(1 + xr ) = 1 + rx +
r (r − 1) 2
x +···
2!
(2.51)
la cual converge para |x| < 1. Si aplicamos esta expansión al factor γ (v)
tenemos
¶−1/2
µ
v2
γ (v) =
1− 2
c
1 v2
= 1+
+···
(2.52)
2 c2
Remplazando esta expansión en las ecuaciones de transformación de
Lorentz 2.41 obtenemos
¶
µ
1 v2
+ · · · (x − vt)
x´ =
1+
2 c2
µ 2¶
v
= x − vt + O 2
(2.53)
c
¶³
µ
v ´
1 v2
+
·
·
·
t
−
x
t´ =
1+
2 c2
c2
µ 2¶
v
= t+O
c2
(2.54)
¡
¢
en donde O v 2 /c2 representa términos del orden de v 2 /c2 , los cuales son
muy pequeños si v/c << 1 y por lo tanto las ecuaciones de transformación de Galileo corresponden a una aproximación a vajas velocidades de las
ecuaciones de Lorentz. Un resultado similar se obtiene pata el teorema de
adición de velociades.
Este límite de bajas velocidades juega el papel de un principio de correspondencia, en el sentido de que la “física Newtoniana es una teoría válida”
para describir los fenómenos, cuando las velocidades típicas involucradas en
los procesos bajo consideración son bajas comparadas con la velocidad de
la luz y por lo tanto, las ecuaciones de la relatividad deben reducirse a las
correspondientes relaciones clásicas, en este límite de velocidades bajas. Es
importante aclarar el significado de la frase “validez de la física Newtonianas
para velocidades v << c”. Dado que toda medida experimental de una cantidad física, lleva consigo un error experimental, entonces las predicciones
2.3. PROPIEDADES DE LAS TL
37
de la mecánica clásica para los diferentes observables de un sistema dado,
están en concordancia con los resultados experimentales, dentro del rango
de error experimental. Así, el límite clásico, o el rango de velocidades para el
cual la mecánica clásica es aplicable, depende de la precisión experimental.
El límite formal c → ∞ se puede entender fícamente en el sentido que c
representa la vélocidad máxima de propagación de señales físicas, independientemente que esta constante corresponda a la velocidad de la luz en el
vacío, y por lo tanto si c → ∞ esto significaría que podemos enviar información a velocidad infinita, lo que implicaría que tendríamos a disposición
un mecanismo instantáneo para calibrar relojes, lo que implicaría que todos
los observadores inerciales medirían la misma coordenada temporal para un
evento dado. Así podemos entender la hipótesis de Newton de un tiempo
universal independiente del observador, como la hipótesis de una velocidad
infinita para transmitir información. Notemos además que en efecto la tercera ley de Newton requiere de esta hipótesis, pues esta ley exige que las
fuerzas de acción y reacción sean iguales en todo instante, independientemente de la posición de los cuerpos que están en interacción.
Retomando las ecuaciones de transformación (2.49), vemos que dos transformaciones de Lorentz sucesivas, conducen a una nueva transformación de
Lorentz, cuyo parámetro (la velocidad relativa) está dado por la ecuación
(2.50). Por otra parte, la transformación de Lorentz inversa, es decir, las
ecuaciones de transformación de coordenadas del sistema Σ0 al Σ, tienen
la misma forma (ecuación (2.46)), pero cambiando el parámetro v por −v.
Además, la transformación identidad, esto es, del sistema Σ sobre el mismo,
corresponde a una transformación de Lorentz con parámetro v = 0, trivialmente. Si escribimos formalmente una transformación de Lorentz entre Σ y
Σ0 , como
L(v) : Σ −→ Σ0
(2.55)
x −→ x0 = L(v)x
entonces, las propiedades encontradas, las podemos fresumir formalmente
de la siguiente manera:
L(w) ◦ L(v) = L(u)
w+v
u =
1 + wv/c2
L(v = 0) = id ⇒ L(0) ◦ L(v) = L(v) ◦ L(0) = L(v)
(2.56)
(2.57)
(2.58)
L−1 (v) = L(−v)
(2.59)
L(v) ◦ L(−v) = L(−v) ◦ L(v) = id
(2.60)
38 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
en donde id significa la transformación identidad, L−1 (v) la transformación
inversa, y el producto L(w) ◦ L(v) representa la composición de dos transformaciones sucesivas.
Un grupo matemático es un conjunto de elementos G, con una operación interna llamada producto, es decir, el producto de dos elementos de G
es de nuevo un elemento del conjunto y esta operación debe satisfacer las
siguientes propiedades:
i.-Existe un elemento del grupo G, llamado la identidad, tal que la identidad por cualquier elemento del grupo es el mismo elemento del grupo.
ii.-Para todo elemento del grupo, existe otro elemento en el grupo, tal
que su producto es la identidad.
Un grupo se llama abeliano, si la operación producto es conmutativa. Las
relaciones simbólicas representadas en las ecuaciones (2.56), (2.58), (2.59)
y (2.60), muestran que las transformaciones de Lorentz forman un grupo
matemático, llamado el grupo de Lorentz. Para el caso particular que estamos considerando, esto es, de transformaciones entre sistemas de referencia
con ejes paralelos y movimiento relativo a lo largo del eje x, el grupo es
claramente abeliano, y cada elemento del grupo corresponde, o está caracterizado por el valor de la velocidad. Puesto que la velocidad puede tomar
cualquier valor entre −c < v < c, el grupo contiene un número infinito no
numerable de elementos, y así este grupo es conocido en la literatura como
un grupo de Lie de un parámetro o grupo continuo, en contraposición con
los grupos finitos o discretos, tales como por ejemplo, los números enteros
con la operación suma. El caso de las transformaciones generales, ecuación
(2.43), energía forman un grupo, llamado el grupo de Poincaré, el cual es
energía un grupo de Lie pero de diez parámetros, pues como vimos, una
transformación general requiere de 10 parámetros para caracterizarla.
Otra propiedad muy importante de las TL, la cual va a jugar un papel
fundamental en el problema de la causalidad en física, es que las TL dejan
invariante una cantidad, que la llamaremos intervalo o distancia espaciotemporal entre eventos. Sean ℘1 y ℘2 dos eventos físicos cualesquiera y sean
(x01 , x11 , x21 , x31 ) y (x02 , x12 , x22 , x32 ) las coordenadas de los dos eventos, medidas
por un observador inercial Σ. Definamos el intervalo espacio-tiempo entre
los dos eventos por:
2
∆S12
:= (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2
(2.61)
Sea Σ0 otro observador inercial que se mueve con velocidad v respecto
01 02 03
00 01 02 03
a Σ y sean (x00
1 , x1 , x1 , x1 ) y (x2 , x2 , x2 , x2 ) las coordenadas de los dos
0
eventos ℘1 y ℘2 medidas por Σ . Entonces, para este nuevo observador, el
2.3. PROPIEDADES DE LAS TL
39
intervalo espacio-tiempo entre los dos eventos está dado por:
02
00 2
01
01 2
02
02 2
03
03 2
:= (x00
∆S12
2 − x1 ) − (x2 − x1 ) − (x2 − x1 ) − (x2 − x1 )
(2.62)
Utilizando las TL (ecuaciones (2.46)) expresemos el intervalo espaciotiempo medido por Σ0 (ecuación (2.62)), en términos de las coordenadas del
observador Σ:
02
= (γ(x02 − βx12 ) − γ(x01 − βx11 ))2 − (γ(x12 − βx02 )
∆S12
−γ(x11 − βx21 ))2 − (x22 − x21 )2 − (x32 − x31 )2
(2.63)
reagrupando términos obtenemos
02
2
= (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 = ∆S12
(2.64)
∆S12
Este resultado significa que el intervalo espacio-tiempo entre dos eventos
físicos es una cantidad independiente del observador y así es un invariante
físico, lo que implica que el valor numérico del intervalo es siempre el mismo,
sin importar cual observador lo mida. A las variables físicas que son invariantes bajo transformaciones de Lorentz se les llama invariantes relativistas
o escalares de Lorentz, y claramente juegan un papel fundamental, pues al
ser independientes del observador, nos caracterizan propiedades intrínsecas
del sistema o de los fenómenos físicos.
Las implicaciones físicas, para el caso particular del intervalo espaciotiempo, serán discutidas en el próximo capítulo con mayor detalle. Es im2
portante solamente resaltar en este punto dos aspectos: en primer lugar ∆S12
puede ser positivo, negativo o cero, y en segundo lugar, el último caso cuan2 es cero, corresponde a la expresión matemática del principio de la
do ∆S12
constancia de la velocidad de la luz, pues si desde el punto del espacio y en
el instante donde ocurre el primer evento, por ejemplo ℘1 , se emite un rayo
de luz en dirección del evento ℘2 , entonces este rayo de luz alcanza el punto
del espacio en el instante de tiempo, en que el segundo evento ocurre. Esto
se ve fácilmente, pues de la definición del intervalo espacio-tiempo, ecuación
(2.61) o (2.62), y recordando que x0 = ct, entoces despejando c de cualquiera
2 = 0 = ∆S 02 ) implica que c =(distancia espade estas dos ecuaciones (∆S12
12
cial entre los eventos)/(intervalo temporal entre los eventos) es un invariante
relativista.
Es importante resaltar que el intervalo espacio-tiempo es invariante bajo las transformaciones generales de coordenadas (ecuación (2.43)), y no
solamente bajo las transformaciones de Lorentz puras consideradas, pues
por una parte, el témino inhomogéneo de las transformaciones se cancela al
40 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
tomar la diferencia de las coordenadas, mientras que las rotaciones de los
ejes espaciales dejan invariante la distancia espacial (ver sección 4.1)
(x12 − x11 )2 + (x22 − x21 )2 + (x32 − x31 )2
(2.65)
permaneciendo la coordenada temporal inanalterada.
Otra característica importante que se deriva directamente de las TL, es
que las velocidades relativas entre sistemas de referencia inerciales, deben
ser siempre menores que la velocidad de la luz, pues el factor γ(v) diverge
para v = c y se hace imaginario si v > c, lo cual es inadmisible dado el
significado físico asignado a las coordenadas utilizadas.
2.4.
Consecuencias de las TL
Para finalizar el presente capítulo, vamos a considerar dos consecuencias
de las TL que constituyen, tal vez, los dos resultados más sorprendentes de
la teoría especial de la relatividad y por esta razón los más conocidos en la
literatura de divulgación científica.
Consideremos para comenzar el problema de la dilatación temporal. En
primer lugar definamos el concepto de tiempo propio, como el intervalo de
tiempo ∆τ entre dos eventos ℘1 y ℘2 , medido por un mismo reloj. Esto significa, equivalentemente, que existe un sistema de referencia inercial, llamémolo Σ, para el cual los dos eventos ocurren en el mismo punto del espacio.
Así, las coordenadas de estos dos eventos para el observador Σ están dadas
por (x01 , x11 , x21 , x31 ) y (x02 , x12 , x22 , x33 ), con x02 − x01 = c∆τ y xi2 = xi1 ; i = 1, 2, 3.
Suponiendo, sin pérdida de generalidad, que el evento 2 ocurre después que
el evento 1 para el observador Σ, i.e. x02 > x01 , y como xi2 = xi1 ; i = 1, 2, 3,
pues los dos eventos por definición, tienen lugar en el mismo punto del espacio, es claro que para cualquier otro observador inercial, por ejemplo Σ0 ,
los dos eventos suceden en puntos diferentes del espacio, y por lo tanto,
2 entre los dos evendada la invarianza del intervalo espacio-tiempo ∆S12
0
tos, el intervalo de tiempo medido por Σ para estos dos eventos, debe ser
mayor que el intervalo de tiempo propio. Para probar esta afirmación, sean
01 02 03
00 01 02 03
0
(x00
1 , x1 , x1 , x1 ) y (x2 , x2 , x2 , x2 ) las coordenadas de estos eventos y ∆t
0
el intervalo de tiempo medido en Σ , con
00
c∆t0 = x00
2 − x1
(2.66)
Utilizando las TL para remplazar en esta expresión las coordenadas primadas en términos de las no primadas y aplicando la definición de tiempo
2.4. CONSECUENCIAS DE LAS TL
41
propio, obtenemos
c∆t0 = γ(x02 − βx12 ) − γ(x01 − βx11 )
(2.67)
y puesto que en sistema de referencia inercial Σ los dos eventos suceden en
el mismo punto del espacio, i.e. x12 = x11 , llegamos finalmente a la ecuación
de dilatación temporal:
∆τ
∆t0 = γ∆τ = p
1 − v 2 /c2
(2.68)
pues el factor γ simpre es mayor que 1, para v 6= 0. De paso hemos demostrado, que si dos eventos ocurren para un observador en un mismo punto del
espacio, el orden temporal de los eventos (e.g. x02 − x01 > 0) es el mismo
00
para todos los observadores, es decir si x02 − x01 > 0 entonces x00
2 − x1 > 0,
y el tiempo propio es el intervalo de tiempo más pequeño medido por algún observador. Esto justifica el nombre de dilatación temporal, y significa
físicamente, que los dos eventos están conectados causalmente, es decir, que
el evento posterior pudo ser causado por el primer evento, aún cuando no
necesariamente exista un proceso físico que los ligue. Notemos además que
el intervalo de tiempo entre dos eventos puede hacerse tan grande como se
quiera, si tomamos velocidades suficientemente cercanas a la velocidad de la
luz, pues 1 ≤ γ < ∞ para 0 ≤ v < c, y por lo tanto dado ∆τ > 0, entonces
∆t0 = γ∆τ puede hacerse tan grande como se quiera haciendo que v −→ c.
Calculemos, ahora el intervalo espacio-tiempo para estos dos eventos. En
el sistema Σ obtenemos la expresión
2
∆S12
= (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 = c2 ∆τ 2 > 0 (2.69)
el cual nos indica, que para el caso que estamos considerando, el intervalo
espacio-tiempo nos mide directamente (salvo un factor constante c2 ) el intervalo de tiempo propio. Si calculamos este mismo intervalo, ahora en el
sistema de referencia Σ0 (ver ecuación (2.62)), por su invarianza, obviamente
obtenemos el mismo resultado. Esto nos muestra, sin ulteriores cálculos, que
el intervalo de tiempo en Σ0 debe ser mayor que en Σ, pues a c2 ∆t02 le estamos restando una cantidad positiva, que nos da la distancia espacial entre
los dos eventos medidos en el sistema Σ0 .
¿Cuando tiene sentido hablar del intervalo de tiempo propio entre dos
eventos?. Para responder a esta pregunta, consideremos dos eventos físicos
2 entre ellos en algún
cualesquiera ℘1 y ℘2 y calculemos el intervalo ∆S12
0
1
2
3
sistema de referencia inercial Σ. Sean (x1 , x1 , x1 , x1 ) y (x02 , x12 , x22 , x32 ) las
42 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
coordenadas de los eventos ℘1 y ℘2 respectivamente, y supongamos para
simplificar los cálculos, pero sin perder generalidad del resultado, que x22 =
x21 y x32 = x31 , entonces:
2
= (x02 − x01 )2 − (x12 − x11 )2
∆S12
(2.70)
Por lo tanto, si este intervalo es mayor que cero, esto significa que siempre
es posible encontrar un sistema de referencia inercial Σ0 , para el cual los dos
eventos ocurren en el mismo punto del espacio, así
2
00 2
2
2
∆S12
= (x00
2 − x1 ) = c ∆τ
(2.71)
pues, dadas las coordenadas de los dos eventos en Σ, basta con considerar
un sistema de referencia Σ0 el cual se mueva con una velocidad v respecto a
Σ dada por
x1 − x11
v
(2.72)
β = = 20
c
x2 − x01
Para el caso que estamos considerando, la velocidad ν del sistema Σ0
está a lo largo del eje de las x y su dirección depende de la posición relativa
entre los eventos (x12 − x11 > 0 o x12 − x11 < 0) en Σ, y del orden temporal
entre ellos, es decir si x02 − x01 > 0 o x02 − x01 < 0 (ver ecuación (2.72)).
Ahora bien, si el intervalo espacio-tiempo entre los eventos medido en algún
2 ,
sistema de referencia fuera menor o igual a cero, dada la invarianza de ∆S12
es obvio que no existe un sistema de referencia para el cual los dos eventos
ocurran en el mismo punto del espacio, y por lo tanto, en este caso, no tiene
sentido hablar de tiempo propio entre los eventos. Además, para esta última
situación considerada, como lo veremos en seguida, el orden temporal entre
los eventos puede invertirse o ser simultáneos para algunos observadores, lo
que implica físicamente que los dos eventos no pueden estar causalmente
conectados, pues para que un evento fuera causa del otro, se necesitaría
transmir información a una velocidad mayor a la de la luz.
La segunda consecuencia importante de las TL, se relaciona con la contracción de longitudes. Para entender el significado físico de este fenómeno,
definamos primero lo que se entiende por medir la longitud de un cuerpo. Consideremos el problema de medir la longitud de una varilla rígida.
Supongamos que para un observador inercial Σ la varilla se encuentra en
reposo y elijamos el eje de las x a lo largo de la varilla. Por definición, la
longitud de la varilla está dada por la diferencia de las coordenadas de los
extremos de la varilla:
(2.73)
L0 = x12 − x11
2.4. CONSECUENCIAS DE LAS TL
43
en donde se ha supuesto, sin pérdida de generalidad, que x12 > x11 . Esta
definición es físicamente consistente, puesto que la varilla está en reposo
para el observador Σ. De la misma manera como definimos tiempo propio,
llamemos a L0 , definido en la ecuación (2.73), longitud propia de la varilla.
En términos generales, definimos la longitud propia de un cuerpo cualquiera,
como la longitud del cuerpo medida en el sistema de referencia, en el cual
el cuerpo se encuentra en reposo. El problema surge, cuando el cuerpo al
cual se le quieren medir sus dimensiones, está en movimiento. Consideremos
entonces, otro sistema de referencia Σ0 , el cual se mueve con velocidad v
respecto a Σ y definamos la longitud de la varilla en Σ0 , como la diferencia
de las coordenadas de los extremos de la varilla en un instante dado t0 :
01
L = x01
2 − x1
(2.74)
Esto significa, que el observador Σ0 mide simultáneamente la posición de
los extremos de la varilla, y define su longitud como la diferencia de las coordenadas espaciales de los dos eventos físicos, cuyas coordenadas están dadas
01
00 01
por (x00
1 , x1 , 0, 0) y (x2 , x2 , 0, 0). Para encontrar la relación entre las medidas realizadas por los dos observadores, basta con aplicar las TL, teniendo
en cuenta que en el sistema Σ0 los eventos (coordenadas espacio-tiempo de
los extremos de la varilla) deben ser simultáneos. Así, de la ecuación (2.73)
y de las TL inversas (ecuaciones (2.42)), tenemos
0
01
0
01
01
L0 = γ(x01
2 + βt ) − γ(x1 + βt ) = γ(x2 − x1 )
(2.75)
y aplicando la definición (2.74) para la longitud de la barra medida por Σ0 ,
llegamos al resultado
p
(2.76)
L = L0 1 − v 2 /c2
el cual esptablece que la longitud física p
en la dirección de movimiento de
un sólido, se vé contraida en un factor 1 − v 2 /c2 con respecto a la longitud propia del sólido, en donde v es la velocidad del cuerpo respecto al
observador inercial que mide su longitud. De las TL se ve directamente que
las dimensiones transversales al movimiento de un sólido no se alteran en
virtud de su movimiento. Una consecuencia inmediata de este efecto de la
contracción, es que en física relativista los conceptos de sólido rígido y fluido incomprensible no son válidos, en general. La ecuación (2.76) la habían
postulado Fitzgerald y Lorentz para explicar el resultado negativo del experimento Michelson-Morley, pues si en brazo del interferómetro a lo largo
de la dirección de movimiento de la tierra se contrayese de acuerdo a esta
ecuación, entonces se puede mostrar fácilmente que no aparecerían franjas
44 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
de interferencia, pues los caminos ópticos de los dos rayos de luz serían
iguales. El problema con el razonamiento de Fitzgerald y Lorentz es que los
brazos del interferómetro están en reposo respecto a la tierra, y por lo tanto
su longitud medida en la tierra, de acuerdo a la relatividad, es la longitud
propia y no debe aparecer contraída.
Estas dos primeras consecuencias de la teoría de la relatividad, dilatación temporal y contracción de longitudes, a pesar de su caracter bastante
extraño a nuestra intuición clásica, han sido corroboradas en varios experimentos. El primer experimento reportado, fue realizado por Rossi y Hall
(Rossi, B. & Hall, D. B., Phys. Rev., 59,223, 1941) utilizando unas partículas elementales, los muones µ− , descubiertas en los rayos cósmicos. La gran
mayoría de las partículas elementales conocidas son inestables, es decir, que
estas partículas después de haber sido producidas por algún proceso, decaen
expontáneamente en otras partículas al cabo de un cierto tiempo, llamado
tiempo propio o tiempo de vida media de la partícula (este tiempo de vida
es característico de cada clase de partícula). Por ejemplo, si producimos un
muón µ− en reposo en el laboratorio, entonces pasados unos 2, 2 × 10−6 s
la partícula se desintegra en un electrón y en dos neutrinos. Los rayos cósmicos son haces de partículas, fundamentalmente protones y electrones de
alta energía, los cuales al incidir sobre las capas superiores de la atmósfera
terrestre, producen toda una serie de partículas elementates, entre otras, los
muones, los cuales viajan hacia la tierra con velocidades muy cercanas a la
de la luz: v ≈ 0,994c. Estos muones se producen a una altura del orden de
los 2000m, y se detectan sobre la superficie de la tierra. Clásicamente, se
espera que estos muones se desintegren antes de llegar a la superficie terrestre, pues a la velocidad de 0,994c en un tiempo de vida de 2, 2 × 10−6 s
alcanzan a avanzar escasamente unos 656m. Dado que para un observador
ligado a la tierra los dos eventos, se crea el muón y luego se detecta, ocurren
en puntos diferentes del espacio, mientras que para un observador ligado al
muón los dos eventos ocurren en el mismo punto del espacio, y por lo tanto,
el intervalo de tiempo medido por este último observador es un tiempo propio, entonces, para el observador terrestre, el tiempo entre los eventos debe
estar dilatado en un factor
p
(2.77)
1/ 1 − v 2 /c2 ≈ 9
de acuerdo con la ecuación (2.68). Así, para el observador en reposo con
respecto a la tierra el muón alcanza a sobevivir un tiempo del orden de
t ≈ 2 × 10−5 s antes de desintegrarse y por lo tanto, puede recorrer un
espacio aproximado de d = vt ≈ 6,000m, antes de desintegrarse, lo que
significa que los mesones si pueden alcanzar la superficie terrestre antes de
2.4. CONSECUENCIAS DE LAS TL
45
que ellos decaigan en otras partículas. Dado que la llegada de los muones a
la superficie terrestre es un hecho físico, a esta misma conclusión debe llegar
cualquier otro observador inercial. Por ejemplo, consideremos el observador
ligado a la partícula. Puesto que para él la partícula se encuentra en reposo,
su vida media no se ve dilatada y por lo tanto el muón se desintegra al
cabo de 2, 2 × 10−6 s. Pero ahora, es la tierra la que se mueve hacia él,
con una velocidad de v = 0,994c y la distancia a la superficie tierrestre,
desde
el lugar donde se producen los muones, se ve contraida en un factor
p
1 − v 2 /c2 ≈ 0,11 de acuerdo con la ecuación (2.76) y por lo tanto la
superficie de la tierra se encuentra a una distancia de 0, 11×2,000m = 220m,
la cual es lo suficientemente corta para que la superficie de la tierra llegue
hasta el punto en el cual se encuentra el muón, antes que este se desintegre.
Esta aparente asimetría en el análisis de un fenómeno físico, visto por
dos observadores inerciales (en un caso el efecto considerado es la dilatación temporal, mientras que para el otro observador es la contracción de
longitudes), no está en contradicción con el principio de relatividad, pues
este principio lo que establece es la invarianza de las leyes físicas para observadores inerciales. En efecto, dos observadores pueden medir diferentes
trayectorias, longitudes, intervalos de tiempo, energías cinéticas, etc., pero
las leyes que rigen la dinámica de los sistemas si deben ser las mismas.
Es importante resaltar este aspecto, pues es frecuente caer en aparentes
paradojas cuando se aplica el principio de relatividad. De hecho se han construido muchos ejemplos, llamados en física “gedanken Experimenten”, que
ilustran esta situación y que constituyen un buen ejercicio para comprender
mejor los fenómenos relativistas. Un clásico ejemplo es el de un carro de
longitud propia L0 y un garaje de menor longitud propia d0 con d0 < L0 .
Supongamos que el carro se dirige hacia el garaje con una velocidad v suficiente, para que su longitud medida porpun observador en reposo con respecto
al garaje sea menor que d0 , esto es L0 1 − v2 /c2 < d0 . Entonces, un observador en reposo respecto al garage planea atrapar al carro dentro del garaje
y calcula cerrar la puerta de éste, tan pronto la trompa del carro alcance la
pared del fondo. Para el observador que viaja con el carro, es el garaje el que
aparece contraido y por lo tanto, para él es imposible que lo atrapen dentro
del garaje, pues cuando la pared toque la punta del carro, el observador del
garaje no puede cerrar la puerta. Claramente este análisis es contradictorio, pues desde el punto de vista físico si el carro puede ser atrapado por
un observador, este debe ser atrapado por todos, o lo contrario, es decir no
es atrapado por ninguno. La solución a esta aparente paradoja reposa en
el hecho que la simultaneidad no es un concepto absoluto como hemos visto. Cuando el observador ligado al garage cierra la puerta simultáneamente
46 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL
cuando la trompa del carro alcanza a la pared, para el observador en el carro,
primero llega la trompa a la pared, y luego, se cierra la puerta.
Capítulo 3
La estructura causal del
espacio-tiempo
3.1.
Introducción
En este capítulo definiremos la estructura causal del espacio-tiempo. En
la primera parte se hará una breve discusión sobre transformaciones lineales que dejan invariante la distancia euclideana (rotaciones) con el fin de
motivar la estructura Minkowskiana del espacio-tiempo y el concepto de
cuadri-vector. En la parte final se deducirán las transformaciones de Lorentz
a partir de la invarianza del intervalo espacio-tiempo entre dos eventos y se
discutará la estructura causal del espacio-tiempo.
3.2.
Rotaciones en el plano euclideano
Consideremos el plano euclideano
©
ª
R2 := x = (x1 , x2 ) | xi ∈ R; i = 1, 2
y el conjunto de transformaciones lineales del plano euclideano sobre si mismo:
(3.1)
T : R2 → R2 ; x → x0 = T x
tal que dejen invariante la norma euclideana, definida por
2
x :=
2
X
δ ij xi xj = (x1 )2 + (x2 )2
i,j=1
47
(3.2)
48CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO
es decir,
x0 = T x
=⇒
x02 = x2
(3.3)
En la ecuación (3.2) se ha definido el símbolo de Kronecker δ ij (o tensor
métrico euclideano) por:
½
0 si i 6= j
(3.4)
δ ij :=
1 si i = j
Dado que T es una transformación lineal de R2 en R2 la podemos escribir
como
2
X
aji xi = aji xi
(3.5)
x0j =
i=1
aji
son constantes. En la última igualdad hemos
en donde los coeficientes
introducido la convención de suma de Einstein, en donde se asume una
suma en todo factor en el cual aparezcan dos índices repetidos, uno como
subíndice y el otro como supraíndice y la suma se realiza sobre el rango
de valores que tome el índice. Busquemos entonces la forma más general
de estos coeficientes que representen una transformación lineal y que dejen
invariante la distancia euclideana. Para este fin remplacemos en la ecuación
(3.3) la transformación lineal (3.5):
δ ij ajk ail xk xl = δ ij x´i x´j = x´2 = x2 = δ ij xi xj
(3.6)
Identificando los coeficientes de las correspondientes coordenadas, obtenemos el siguiente conjunto de ecuaciones acopladas para los coeficientes:
a211 + a221 = 1
(3.7)
a212 + a222 = 1
(3.8)
a11 a12 + a21 a22 = 0
(3.9)
Además, dado que T es una transformación lineal de R2 en R2 , y por lo
tanto T x = 0 solo si x = 0, entonces el determinante de la transformación
debe ser diferente de cero
a11 a22 − a12 a21 6= 0
(3.10)
Como el sistema de ecuaciones tiene cuatro incognitas podemos encontrar tres de éllas en términos de la restante, o equivalentemente podemos
despejar las cuatro incognitas en función de un parámetro. Si llamamos a
3.2. ROTACIONES EN EL PLANO EUCLIDEANO
49
este parámetro θ y lo definimos como a11 := cos(θ),directamente se pueden
despejar los demás coeficientes para obtener:
a11 = a22 = cos(θ);
a12 = −a21 = sin(θ)
(3.11)
Con esto podemos escribir explícitamente las ecuaciones de transformación en la forma:
(3.12)
x01 = x1 cos(θ) + x2 sin(θ)
x02 = x2 cos(θ) − x1 sin(θ)
(3.13)
Es de anotar que en el proceso de despejar los coeficientes tenemos que
escoger un signo, pues de la ecuación (3.7), al despejar a21 en términos de a11
surge una raíz. La escogencia hecha de la raíz positiva nos conduce a que el
determinante de los coeficientes tome el valor +1, que para el caso de haber
tomado la raíz negativa nos hubiera dado el valor del determinante igual a
−1. Que el determinante de los coeficientes de la transformación lineal T es
±1 se puede obtener directamente de las propiedades de las transformaciones
que dejan invariante la norma euclideana de un vector, pues si representamos
los puntos (vectores) de x ∈ R2 por matrices columna
µ 1 ¶
x
x=
(3.14)
x2
entonces, la norma al cuadrado (ecuación (3.2)) se puede escribir como:
µ
¶ µ 1 ¶τ µ 1 ¶
¡ 1
¢ x1
x
x
2
2
(3.15)
x = x x
=
= xτ x
2
2
x
x
x2
donde τ significa la transpuesta de la matriz. De esta forma, la invarianza
bajo la transformación lineal T de la norma se puede escribir de la siguiente
forma:
(3.16)
xτ x = x0τ x0 = (T x)τ (T x) = xτ T τ T x
lo que implica que la matriz de transformación debe satisfacer la condición
TτT = 1
(3.17)
que fácilmente se ve que conduce al mismo sistema de ecuaciones para los
coeficientes de la matriz T . Toda transformación (o matriz) que satisfaga la
ecuación anterior (3.17) se llama ortogonal, y fácilmente se ve que bajo una
tal transformación, también se preservan los ángulos entre los vectores del
plano euclideano, pues
x0 · y0 ≡ x0τ y0 = (T x)τ T y = xτ T τ T y = xτ y = x · y
(3.18)
50CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO
Figura 3.1: Rotación de los ejes en el plano euclideano
Tomando el determinante en la ecuación (3.17) y teniendo en cuenta que
det T = det T τ , obtenemos el resultado general que:
| det T |2 = 1 =⇒ | det T |= ±1
(3.19)
Este resultado tiene una interpretación geométrica que veremos enseguida (ver Figura 3.1).
Si hacemos una rotación de los ejes coordenados x, y por un ángulo θ y en
sentido contrario a las agujas del reloj, las componentes de un vector de R2
se transforman como en la ecuación (3.5) y claramente dejan la norma del
vector invariante. Este resultado muestra entonces, que la transformación
lineal que deja invariante la norma de un vector en R2 queda determinada por un solo parámetro y puesto que es equivalente a una rotación de
los ejes, podemos escoger como parámetro el ángulo de rotación θ. De esta
forma podemos escribir T (θ) para representar esta transformación lineal.
Además, si realizamos dos transformaciones (rotaciones) sucesivas T (θ) y
T (ϕ), la primera en un ángulo θ y la segunda en un ángulo ϕ, entonces la
transformación compuesta T (θ) ◦ T (ϕ) es equivalente a una sola transformación en un ángulo θ + ϕ. Adicionalmente, la transformación inversa de T (θ)
es equivalente a la transformación por un ángulo −θ y la transformación
3.3. CUADRI-VECTORES Y EL GRUPO DE LORENTZ
51
identidad corresponde a la rotación en un ángulo cero. Resumiendo
T (θ) ◦ T (ϕ) = T (θ + ϕ)
(3.20)
T −1 (θ) = T (−θ)
(3.21)
T (0) = 1
(3.22)
Estas ecuaciones definen un grupo matemático, llamado el grupo de rotaciones del plano. Dado que las transformaciones están determinadas por un
único parámetro θ, que varía continuamente de 0 a 2π, el grupo se llama
continuo o grupo de Lie de un parámetro.
3.3.
Cuadri-vectores y el grupo de Lorentz
Definamos el espacio cuadridimensional de cuadri-vectores como:
M : = {x = (x0 , x1 , x2 , x3 ) ∈ R4 | x · y :=
producto interno M inkowskiano}
(3.23)
en donde el producto interno Minkowskiano está definido como
x · y := x0 y 0 − x1 y1 − x2 y 2 − x3 y 3 = η µν xµ y ν
(3.24)
En la última igualdad hemos hecho uso de la convención de suma de Einstein,
en la cual los índices griegos repetidos toman los valores 0, 1, 2, 3 y como es
usual en relatividad, el índice 0 corresponde a la componente temporal del
cuadri-vector. Los elementos de matriz η µν , llamados las componentes del
tensor de Minkowski (nombre que se justificará cuando veamos tensores),
están definidos por

µ 6= ν
 0 si
1 si
µ=ν=0
(3.25)
η µν :=

−1 si µ = ν = 1, 2, 3
El producto interno definido por la ecuación (3.24) induce entonces una
norma
x2 := x · x = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 = ηµν xµ xν
(3.26)
Definamos una Transformación de Lorentz (TL) como una transformación lineal
L : M −→
M
(3.27)
,
x 7−→ x = Lx
52CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO
tal que deje invariante el producto interno Minkowskiano x · y, esto es
x, · y , = x · y
(3.28)
Para encontrar la forma general de una transformación de Lorentz, utilicemos primero el hecho que cualquier transformación lineal la podemos
escribir en la forma
(3.29)
x,α = Λαβ xβ
en donde los coeficientes Λαβ conforman la matriz de transformación de
Lorentz. Remplazando la ecuación (3.29) en (3.28) y comparando coeficientes, obtenemos las condiciones que deben cumplir los elementos de la
matriz de Lorentz:
(3.30)
η δγ = η αβ Λαδ Λβγ
Esta ecuación la podemos escribir en forma equivalente, como el siguiente
sistemas de ecuaciones:
(Λ00 )2 −
(Λ0k )2 −
3
X
(Λi0 )2 = 1
i=1
3
X
(Λik )2 = 1;
i=1
η ρσ Λρµ Λσν
(3.31)
= 0;
k = 1, 2, 3
µ 6= ν
(3.32)
(3.33)
Este sistema de ecuaciones es general y contiene todas las posibles transformaciones entre sistemas de coordenadas que dejan invariante el producto
punto Minkowskiano. Estas transformaciones las podemos dividir en tres
categorías: La primera corresponde a las rotaciones de los ejes espaciales,
dejando la coordenada temporal inmodificada y forman el llamado grupo de
rotaciones. este grupo representa el hecho que el espacio físico es isotrópico.
Claramente una rotación espacial queda determinada por tres parámetros,
por ejemplo los tres ángulos de Euler. La segunda categoría la constituye la
operación de inversión de los ejes espaciales y el temporal. La última categoría, que es la de interés para nosotros, la conforman las transformaciones
puras de Lorentz, que representan el cambio entre sistemas de referencia inerciales, manteniendo tanto los ejes espaciales paralelos (no hay rotaciones
espaciales) así como el sentido de los ejes espaciales y el temporal (sin inversión de ejes). Este grupo de transformaciones es conocido en la literatura
como las ”boost” de Lorentz ”, las cuales quedan completamente determinadas por tres parámetros, que pueden ser escogidos para que corresponden
a las tres componentes de la velocidad relativa de los sistemas de referencia.
3.3. CUADRI-VECTORES Y EL GRUPO DE LORENTZ
53
Antes de continuar desarrollando este último grupo de transformaciones,
es importante aclarar que el conjunto de transformaciones que dejan invariante el producto punto Minkowskiano es más general que el dado en
la ecuación (3.29), pues es inmediato ver que bajo una translación de los
ejes epacio-temporales la invarianza del producto punto se mantiene. Estas tranformaciones representan la homogeneidad del espacio-tiempo, o en
otros términos, la arbitrariedad de la elección del origen de coordenadas.
Esta transformación queda determinada por cuatro parámetros (las cuatro
componentes del cuadri-vector translación) y podemos entonces escribir la
transformación de coordenadas más general como
x,α = Λαβ xβ + aα
(3.34)
llamada transformación de Lorentz inhomogénea. Estas transformaciones
generales constituyen el grupo de Poincare de diez parámetros: Tres ángulos
de rotación + tres componentes de la velocidad relativa + cuatro desplazamientos. El grupo de Poincare es el grupo de simetrias fundamental de la
física y representa la expresión matemática del principio de relatividad y de
las propiedades básicas del espacio y el tiempo, esto es, de la homogeneidad e isotropía del espacio físico tridimensional y su estructura geométrica
euclideana y de la homogeneidad e isotropía del tiempo.
Restrinjámonos ahora solamente a las ”boost” de Lorentz y consideremos
un sistema de referencia inercial Σ0 que se mueve con velocidad constante v
respecto al sistema inercial Σ a lo largo del eje x1 y con los ejes espaciales
paralelos. Entonces, dado que en este caso x02 ≡ y , = y ≡ x2 y x03 ≡ z , =
z ≡ x3 , la matriz de transformación de Lorentz se reduce a:
 0

Λ 0 Λ01 0 0
 Λ10 Λ11 0 0 

Λαβ = 
(3.35)
 0
0 1 0 
0
0 0 1
y las relaciones (3.31), (3.32) y (3.33), toman la forma:
(Λ00 )2 − (Λ10 )2 = 1
(3.36)
(Λ01 )2 − (Λ11 )2 = −1
(3.37)
Λ00 Λ01 − Λ10 Λ11 = 0
(3.38)
que es un sistema de tres ecuaciones con cuatro incógnitas y así, los coeficientes Λαβ por determinar, quedan dados en términos de un parámetro:
54CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO
la velocidad relativa v entre los sistemas de referencia Σ y Σ0 . Teniendo en
cuenta que las coordenadas del origen del sistema Σ0 , medidas en el sistema
Σ están dadas por (x0 , vc x1 , 0, 0) y que bajo una T.L. se transforman a las
coordenadas (x,0 , 0, 0, 0) en Σ0 , obtenemos la ecuación:
v
0 = Λ10 x0 + Λ11 x1 = Λ10 x0 + Λ11 x0
c
v
Λ10 = − Λ11
c
=⇒
(3.39)
Entonces, el sistema de ecuaciones (3.36), (3.37) y (3.38) tiene solución
única y está dada por:
Λαβ


γ
−βγ 0 0
 −βγ
γ
0 0 

=
 0
0
1 0 
0
0
0 1
(3.40)
en donde
1
γ = γ(v) := q
1−
v
β = β(v) :=
c
v2
c2
;
(3.41)
(3.42)
Escribiendo explícitamente el sistema de ecuaciones de transformaciones
de Lorentz,
(3.43)
x,0 = γ(x0 − βx1 )
x,1 = γ(x1 − βx0 )
(3.44)
x,2 = x2
(3.45)
x,3 = x3
(3.46)
vemos la extrecha relación formal con la ecuación (3.13) (rotación de los ejes
x1 y x2 ).
No es dificil ver que podemos interpretar formalmente una transformación de Lorentz, como una rotación en el plano complejo de los ejes (ict, x) en
un ángulo complejo. Para este fín definamos el parámetro φ por la siguiente
ecuación:
v
(3.47)
tanh φ := β =
c
3.4. CONOS DE LUZ Y RELACIONES DE CAUSALIDAD
55
en donde tanh es la tangente hiperbólica. Con esta definición, y utilizando
las identidades para las funciones hiperbólicas, tenemos que:
cosh φ = γ(v);
sinh φ =
v
γ(v);
c
(3.48)
Con esta defición (ecuación (3.47)) y las relaciones (3.48) las ecuaciones
de transformación de Lorentz se pueden escribir en la forma:
x,0 = x0 cosh φ − x1 sinh φ
(3.49)
x,1 = x1 cosh φ − x0 sinh φ
(3.50)
x,2 = x2
(3.51)
x,3 = x3
(3.52)
Recordando la relación cosh φ = cos(iφ), vemos la estrecha relación entre
las rotaciones de los ejes coordenados y las transformaciones de Lorentz. Otra
ventaja que tiene expresar las transformaciones de Lorentz en términos del
parámetro φ, es la expresión para el teorema de adición de las velocidades,
pues dos transformaciones de Lorentz sucesivas, con parámetros tanh φ1 =
v1 /c y tanh φ2 = v2 /c, corresponden a una transformación de Lorentz con
parámetro φ = φ1 +φ2 , pues, de la identidad trigonométrica para la tangente
de la suma de dos ángulos, tenemos:
tanh φ = tanh(φ1 + φ2 )
tanh φ1 + tanh φ2
=
1 + tanh φ1 tanh φ2
v1 /c + v2 /c
=
1 + v1 v2 /c2
v
=
c
(3.53)
la cual coincide con la ecuación (2.50).
3.4.
Conos de luz y relaciones de causalidad
Puesto que el cuadrado la norma de todo cuadri-vector (c-v) es un invariante relativista y esta norma no es definida positiva, podemos clasificar a
los c-v en en tres grupos disyuntos: Dado un c-v x ∈ M, definimos:
1. si x2 > 0 el c-v se llama como de tiempo
56CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO
2. si x2 < 0 el c-v se llama como de espacio
3. si x2 = 0 el c-v se llama como de luz
Un c-vector x como de tiempo, cuya primera componente es mayor que
cero, x0 > 0, se llama dirigido al futuro, mientras que si x0 < 0 se llama
dirigido al pasado.
Para entender el significado físico de esta clasificación y sus consecuencias, consideremos dos eventos físicos, por ejemplo el decaimiento de un núcleo radiactivo de uranio, situado en el origen de coordenadas (x01 , x11 , x21 , x31 ) =
(0, 0, 0, 0) para un observador Σ y la fisión de otro núcleo de uranio, situado
en las coordenadas (x02 , x12 , x22 , x32 ) ≡ (ct, x, y, z) medidas por el observador Σ.
Calculemos entonces el intervalo espacio-temporal entre estos dos eventos:
∆S 2 = (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2
= c2 t2 − x2 − y 2 − z 2
(3.54)
Consideremos primero el caso ∆S 2 > 0 (sin pérdida de generalidad
tomemos t > 0), y supongamos que en el instante t = 0, en el cual ocurre el
primer evento y desde el origen de coordenadas, se envía una señal luminosa
que viaja en la dirección
p del segundo evento. Puesto que la distancia espacial
entre los eventos es x2 + y2 + z 2 , el tiempo t0 , que tarda en llegar el rayo
de luz al punto del espacio donde el núcleo se fisiona es menor que t, pues
de la relación ∆S 2 > 0 se sigue que
t2 >
x2 + y2 + z 2
= t20
c2
(3.55)
Esto significa que es posible que el primer evento, la desintegración del núcleo, pueda ser causa del segundo evento, la fisión del otro núcleo. Si hubieramos supuesto que t < 0 la conclusión es la misma, solo que en este caso la
fisión del núcleo pudo ser la causa de la desintegración del otro. El resultado
general que se desprende de este análisis es que eventos, cuya separación
o intervalo espacio-temporal es mayor que cero, son eventos causalmente
conectados (lo que no significa necesariamente que uno de ellos sea causa
del otro), y por lo tanto, la sucesión temporal de eventos causalmente conectados es la misma para todos los observadores. Además, puesto que ∆S 2 > 0,
notemos que siempre es posible encontrar un sistema de referencia Σ0 para
el cual los dos eventos ocurren en el mismo punto del espacio, pues basta
con elegir la velocidad de este sistema igual a
r
x2 + y 2 + z 2
(3.56)
v=
t2
3.4. CONOS DE LUZ Y RELACIONES DE CAUSALIDAD
57
en la dirección apropiada (a lo largo de la línea que une a los dos eventos,
tomándola como el eje de las x) y haciendo una transformación de Lorentz,
obtenemos que las coordenadas de los dos eventos en este sistema de referencia Σ0 son (0, 0, 0, 0) y (ct0 , 0, 0, 0), y por lo tanto
∆S 2 = c2 t2 − x2 − y 2 − z 2 = c2 t02
(3.57)
Recordando la definición de tiempo propio, como el intervalo de tiempo
medido en un sistema de referencia para el cual los dos eventos ocurren en
el mismo punto del espacio, vemos que el intervalo espacio-temporal para
eventos como de luz, nos da una medida directa del tiempo propio entre los
eventos, sin necesidad de encontrar el sistema de referencia para el cual los
dos eventos ocurren en el mismo punto del espacio. Así podemos adoptar la
siguiente definición general de tiempo propio:
Si ∆S 2 > 0 para dos eventos, definimos ∆τ , intervalo de tiempo propio,
como:
r
∆S 2
(3.58)
∆τ :=
c2
En el segundo caso, para eventos como de luz donde ∆S 2 = 0, obtenemos una conclusión similar al caso anterior, en cuanto a que los eventos
están conectados causalmente, solo que para este caso, el fotón que se envía
desde el primer evento en la dirección del segundo, llega en el mismo instante
en que ocurre el segundo evento y en este caso no tiene sentido hablar de
tiempo propio entre los eventos, pues no es posible encontrar un sistema de
referencia para el cual los dos eventos ocurran en el mismo punto del espacio
(∆x02 + ∆y02 + ∆z 02 = 0), sin que se viole la invariancia de ∆S 2 = 0, salvo
en el caso trivial que también fuera ∆t02 = 0, caso en el cual los dos eventos
ocurren en el mismo punto del espacio-tiempo para todos los observadores.
Para el último caso, de eventos como de espacio ∆S 2 < 0, encontramos,realizando un análisis similar a los anteriores, que el fotón enviado
desde el primer evento hacia el segundo, siempre llega después que el evento
ha tenido lugar. Así no es posible que un evento sea causa del otro y en
este caso se habla de eventos causalmente desconectados. De la expresión
para ∆S 2 se obtiene que siempre es posible encontrar un sistema de referencia para el cual los eventos ocurren simultáneamente, pero, lógicamente, en
puntos separados del espacio. Además, la sucesión temporal de los eventos
depende del observador, es decir, si para un observador inercia Σ dos eventos P1 y P2 causalmente desconectados (i.e. como de espacio) son tales que
t1 < t2 , entonces existen observadores inerciales, e.g. Σ´, tal que t´1 > t´2 .
58CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO
Figura 3.2: Estructura causal del espacio-tiempo
Esta clasificación de eventos divide al espacio-tiempo en cinco regiones
disyuntas. Dado un evento p , el cual lo podemos ubicar sin pérdida de
generalidad en el origen de coordenadas de un sistema de referencia Σ, el
conjunto de eventos con coordenadas (ct, x, y, z), medidas en Σ, que satisfacen la relación
(3.59)
∆S 2 = c2 t2 − x2 − y 2 − z 2 = 0
definen el llamado cono de luz del evento p ubicado en el origen de coordenadas. La razón de llamarse cono de luz surge cuando dibujamos estos
puntos en un gráfico tridimensional, (ct, x, y) como se ve en la (Figura 3.2).
Los eventos con coordenadas tales que:
∆S 2 = c2 t2 − x2 − y 2 − z 2 > 0
y
ct > 0
(3.60)
forman el futuro causal de p y aquellos con ct < 0 el pasado causal, esto
significa, que todos los eventos situados dentro del cono de luz de p están
causalmente conectados con p y pueden ser causados por el evento p (futuro
causal) o pueden ser causa de p (pasado causal). Todos los demás eventos,
es decir aquellos para los cuales se cumple la relación
∆S 2 = c2 t2 − x2 − y 2 − z 2 < 0
(3.61)
3.5. ALGEBRA DE CUADRI-VECTORES
59
Figura 3.3: Lineas de universo de partículas físicas
conforman la región como de espacio de eventos causalmente desconectados
con el evento p.
Esta forma de representar los eventos en un gráfico espacio-temporal, nos
permite visualizar fácilmente muchos procesos físicos como veremos en varios
ejemplos a lo largo del texto. Un primer resultado que podemos obtener,
sin necesidad de recurrir a cálculos explícitos, es que la trayectoria de una
partícula material representada en un gráfico espacio-tiempo, siempre tiene
que estar dentro del cono de luz de cada uno de los puntos (eventos) de la
trayectoria y la trayectoria de un fotón (rayo de luz) siempre está sobre el
cono de luz de cada uno de los puntos de su trayectoria (ver Figura 3.3).
3.5.
Algebra de cuadri-vectores
En esta sección veremos algunas propiedades de carácter matemático
de los c-v, que se desprenden directamente de la definición de la métrica
Minkowskiana, sin necesidad de recurrir a interpretaciones físicas, pero que
van a ser de mucha utilidad para entender algunos resultados de la teoría
de la relatividad.
El espacio cuadridimensional de cuadri-vectores M, admite una estruc-
60CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO
tura de espacio vectorial con la suma de c-v y el producto de un escalar (los
reales) por un c-v definidos como:
∀x, y ∈ M
y
∀λ ∈ R
=⇒
x + y = (x0 , x1 , x2 , x3 ) + (y0 , y 1 , y 2 , y3 )
0
0
1
1
2
2
3
(3.62)
3
= (x + y , x + y , x + y , x + y )
λx = λ(x0 , x1 , x2 , x3 ) := (λx0 , λx1 , λx2 , λx3 )
(3.63)
o en forma equivalente, utilizando la notación con índices:
(x + y)µ = xµ + yµ
(3.64)
(λx)µ = λxµ
(3.65)
De la definición del producto interno invariante de Lorentz y por las
propiedades del álgebra vectorial definida, se obtienen las siguientes propiedades
del producto interno:
Proposición 4.1 El producto interno Minkowskiano satisface las siguientes propiedades:
x·y =y·x
x · (y + z) = x · y + x · z
(3.66)
x · (λy) = (λx) · y = λ(x · y) ∀x, y, z ∈ M ∀λ ∈ R
Su demostración es directa a partir de la definición del producto punto
Minkowskiano (3.24) y del álgebra de vectores definida por las ecuaciones
(3.62) y (3.63). Veamos, como ejemplo del método de demostración, solamente la segunda propiedad. De las definiciones de producto interno y suma
de c-v en notación de componentes, tenemos:
x · (y + z) = ηµν xµ (y + z)ν
= ηµν xµ (yν + z ν )
= ηµν xµ y ν + η µν xµ z ν
= x·y+x·z
como queriamos probar.
Corolario 4.2 ∀x, y ∈ M se cumplen las siguientes identidades:
(x ± y)2 = x2 + y 2 ± 2xy
(3.67)
3.5. ALGEBRA DE CUADRI-VECTORES
(x + y)2 + (x − y)2 = 2(x2 + y 2 )
61
(3.68)
(x + y) · (x − y) = x2 − y2
Estas identidades se deducen directamente de la Proposición 4.1 anterior.
Podemos extender formalmente, la definición de vectores ortogonales de
espacios vectoriales reales con producto interno definido positivo, al caso de
c-vectores por medio de la relación x · y = 0, la cual por ejemplo hace que
todo vector como de luz sea ortogonal a si mismo, pues x2 = xx = 0.
Nota 4.1 Dado un c-v cualquiera x ∈ M, con x = (x0 , x1 , x2 , x3 ),
a la primera componente del c-v se le llama temporal y a las otras tres
componentes espaciales, justificando de esta forma la notación x = (x0 , x).
Entonces, de la definición del producto interno de c-v, la norma de un
c-v la podemos escribir como
x2 = (x0 )2 − | x |2
(3.69)
con x ∈ R3 y | x | la norma usual ( euclideana) de R3 .
Otras propiedades de interés de los cuadri-vectores son las siguientes:
Proposición 4.2 Si x, y ∈ M son c-v como de luz, entonces los vectores
x + y y x − y son mutuamente ortogonales y tienen normas opuestas.
Para demostrar la ortogonalidad, basta con utilizar la última de las ecuaciones (3.68), pues
(x + y) · (x − y) = x2 − y 2 = 0
(3.70)
dado que los c-vectores x y y son como de luz, i.e. x2 = 0 y y 2 = 0. De
esta última propiedad y de la primera de las ecuaciones (3.68) se obtiene
también, que sus normas son opuestas:
(x + y)2 = x2 + y2 + 2x · y = 2x · y
(3.71)
(x − y)2 = x2 + y 2 − 2x · y = −2x · y
(3.72)
Proposición 4.3 Dos c-v x, y ∈ M como de luz y mutuamente ortogonales x · y = 0 son proporcionales entre si, i.e. x = λy.
Para la demostración basta con tener en cuenta, por hipótesis, las siguientes relaciones,
(3.73)
0 = xy = x0 y0 − x · y
0 = x2 = (x0 )2 − | x |2
0 = y 2 = (y0 )2 − | y |2
(3.74)
(3.75)
62CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO
Entonces, de las propiedades del producto interno euclideano para las
componentes espaciales de cualquier c-v sabemos que x·y =| x || y | cos x∧ y,
y así obtenemos de las anteriores relaciones que
x · y = x0 y0 = (| x |2 )1/2 (| y |2 )1/2
⇒
cos x∧ y = 1
(3.76)
lo cual significa que las componentes espaciales son paralelas y así proporcionales, es decir x = λy. Ahora, de la relación x = λy y remplazándola en
la ecuación (3.73) se obtiene:
0 = xy = x0 y0 − x · y = x0 y0 − λ | x |2
(3.77)
Teniendo en cuenta que (x0 )2 =| x |2 (relación (3.74)), entonces
0 = x0 y 0 − λ(x0 )2 = x0 (y 0 − λx0 )
(3.78)
Como el c-v x es como de luz se debe cumplir que x0 6= 0 y por lo tanto
la ecuación anterior implica que y 0 = λx0 , de donde se deduce que los c-v x
y y son proporcionales:
y = λx
(3.79)
como se quería probar.
Nota 4.2 La relación
(x + y) · (x − y) = x2 − y 2
(3.80)
nos permite construir c-v ortogonales a partir de dos c-v cualesquiera x y y
de igual norma.
Proposición 4.4 Todos los c-v x ∈ M, ortogonales a un c-v z como de
tiempo, son como de espacio y forman un subespacio tridimensional como
de espacio.
Para su demostración consideremos primero que, si
xz = 0 ⇒ x0 z 0 = x · z
(3.81)
entonces, como z = (z 0 , z) es como de tiempo, se debe cumplir que z 0 6= 0
y (z 0 )2 >| z |2 y por lo tanto
¯ 0 0¯
¯x z ¯
|x · z|
|x · z|
=
<
(3.82)
|z 0 |
|z 0 |
(z 2 )1/2
Elevando al cuadrado ambos lados de esta desigualdad
¯ 0 0 ¯2
¯x z ¯
|x · z|2
x2 z 2
0 2
=
(x
)
<
≤
= x2
|z|2
|z|2
|z 0 |2
3.5. ALGEBRA DE CUADRI-VECTORES
=⇒ x2 = (x0 )2 − x2 < 0
63
(3.83)
Utilizando un argumento similar al anterior, se puede probar que todo
vector ortogonal a un vector como de luz es como de espacio, salvo el caso
tratado anteriormente (Proposición 4.3).
Nota 4.3 Claramente existen tres c-v como de espacio ortogonales entre
sí, pero solo hay dos c-v como de espacio mutuamente ortogonales, que sean a
su vez ortogonales a un c-v dado como de luz. Esta situación se puede ilustrar
tomando eτ = (1, 1, 0, 0), el cual es un c-v como de luz y e1 = (0, 0, 1, 0) y
e2 = (0, 0, 0, 1) c-vectores como de espacio, ortogonales entre si y ortogonales
al c-v eτ . Ahora, es claro que cualquier otro c-v como de espacio, ortogonal
a e1 y e2 , debe tener la segunda componente no nula y por lo tanto ya no
sería ortogonal al c-v eτ . Para probar esto, por contradicción, supongamos
que existe un vector e3 = (x0 , x1 , x2 , x3 ) como de espacio y ortogonal a los
c-v eτ , e1 y e2 . Entonces, de la ortogonalidad con e1 y e2 se obtiene que
x2 = x3 = 0, y de la ortogonalidad con eτ se tiene que x0 = x1 , por lo tanto
la norma del c-v e3 está dada por:
e3 · e3 = (x0 )2 − (x1 )2 = 0
(3.84)
lo cual implica que e3 sería como de luz, contradiciendo la hipótesis inicial.
Nota 4.4 Análogo a la descomposición de vectores v ordinarios en componentes ortogonales, una de ellas a lo largo de un vector dado w, con
v = v⊥ + τ w, en donde v⊥ es ortogonal a w, podemos representar cualquier
c-v x ∈ M como
x = y + τz
(3.85)
con z un c-v fijo como de tiempo y y un único c-v como de espacio ortogonal
a z, el cual está completamente determinado por por el c-v x, siendo τ un
parámetro real.
64CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO
Capítulo 4
Cinemática relativista
4.1.
Introducción
En este capítulo se desarrollará la cinemática relativista como una aplicación de los cuadri-vectores. En las dos primeras partes definiremos los
c-vectores velocidad y aceleración y en la última parte introduciremos el cvector número de onda, como una consecuencia de la invarianza relativista
del producto punto y se discutirá el efecto Doppler y la aberración de la luz
como una consecuencia de las leyes de transformación de los c-vectores.
4.2.
Cuadri-vector velocidad
Definamos el c-v posición x como un elemento del espacio M el cual describe el instante de tiempo y posición espacial de un evento físico cualquiera,
cuyas coordenadas para un observador inercial Σ están dadas por xα =
(x0 , x1 , x2 , x3 ). Por ejemplo, la trayectoria de una partícula elemental, es
decir, su posición espacial en cada instante de tiempo, la podemos describir
por un c-v posición x(s) como función de algún parámetro s, y a esta función
x(s) se le llama la línea de universo de la partícula. En física no relativista
es usual utilizar como parámetro s la coordenada temporal t. Sin embargo
es claro que en el caso relativista este no es el parámetro más adecuado, aún
cuando se puede usar, pues él depende del observador. Para describir la línea
de universo de una partícula material es usual, dada su interpretación física
directa, utilizar como parámetro s al tiempo propio de la partícula, es decir,
el tiempo medido por un reloj que ”viaja con la partícula”, el cual es un invariante relativista y así es un parámetro independiente del observador. De
lo discutido en el parágrafo anterior, si xα1 y xα2 son las coordenadas de dos
65
66
CAPÍTULO 4. CINEMÁTICA RELATIVISTA
eventos medidos por un observador Σ, entonces el intervalo espacio-temporal
entre los dos eventos está dado por la expresión:
∆S 2 = (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2
(4.1)
Si las coordenadas xα1 y xα2 representan dos posiciones sucesivas de una
partícula material, entonces ∆S 2 es mayor que cero y nos mide el tiempo
propio ∆τ entre los dos eventos (ecuación (3.58)). De esta manera x(τ ) nos
describe la posición espacio-temporal de una partícula en función del tiempo
propio τ , transcurrido desde un instante inicial arbitrario, es decir x(0) nos
representa la posición espacio-temporal de la partícula en τ = 0. Notemos
que esta descripción de la cuadri-posición en función de τ solo es posible
para partículas que se mueven a una velocidad menor que la de la luz, pues
para el caso de fotones (u otras partículas con masa en reposo nula), dado
que ellas solo se pueden mover a la velocidad de la luz, el intervalo ∆s2 entre
dos puntos de su línea de universo siempre es cero.
La velocidad física de una partícula se define como
u=
dr
dt
(4.2)
en donde r son las coordenadas de posición y t el tiempo medido por algún
observador inercial Σ. Podemos generalizar el concepto de velocidad al caso
de cuadri-vectores de una manera independiente del observador, definiendo
el c-v velocidad (c-velocidad) por:
U :=
dx
dτ
(4.3)
en donde x(τ ) es el c-v posición que describe la línea de universo de una
partícula material y τ el parámetro tiempo propio. Para encontrar la relación
entre las componentes de la c-velocidad y la velocidad física medida en un
sistema de referencia inercial Σ, basta tener en cuenta que (ver ecuación
(3.58) con la notación x = (x0 , x1 , x2 , x3 ) = (x0 , r) = (ct, r)) para una
partícula material el tiempo propio está dado por la expresión:
p
(4.4)
cdτ = (dx0 )2 − (dr)2
y por lo tanto tenemos
dτ
dt
dt
dτ
r
dr 2
) ⇒
dt
1
= γ(u) := p
1 − u2 /c2
=
1−(
(4.5)
4.2. CUADRI-VECTOR VELOCIDAD
67
en donde u = dr/dt es la velocidad física de la partícula medida en el sistema
de referencia Σ. De esta última ecuación es fácil obtener la relación entre las
componentes de la c-velocidad U α = (U 0 , U 1 , U 2 , U 3 ) y la velocidad física u
en Σ, pues aplicando la regla de la cadena para las derivadas se obtiene
Uα =
=
d α
d 0
x =
(x , x)
dτ
dτ
dt d
(ct, r) = γ(u)(c, u)
dτ dt
(4.6)
Entonces
U 0 = γ(u)c;
U 1 = γ(u)ux ;
U 2 = γ(u)uy ;
U 3 = γ(u)uz
(4.7)
Por ejemplo, para una partícula en reposo u = 0 y el c-v velocidad
está dado por U α = (c, 0). Puesto que para determinar unívocamente la
velocidad de una partícula se requieren tres parámetros, por ejemplo, las
tres componentes de la velocidad respecto a algún sistema de referencia,
y la c-velocidad tiene cuatro componentes, entonces estas componentes no
pueden ser todas independientes y debe existir una relación entre ellas. Esta
relación se puede obtener teniendo en cuenta el hecho de que la norma al
cuadrado de todo c-v es un invariante relativista, así
U 2 = η αβ U α U β = γ 2 (u)(c2 − u2 ) = c2
(4.8)
Esta relación indica que todo c-v velocidad es como de tiempo y geométricamente representa el c-v tangente a la línea de universo de una partícula
material, generalizando de esta forma los conceptos usuales de curva y su
vector tangente (velocidad). Notemos que el valor de la norma al cuadrado
del c-v velocidad se hubiera podido obtener directamente, sin realizar ningún
cálculo, pues, dado que esta norma es un invariante, siempre podemos escoger un sistema de referencia inercial particular, por ejemplo, aquel para
el cual la partícula está momentáneamente en reposo, en donde U α = (c, 0),
y asi directamente se obtiene que U 2 = c2 . Este ejemplo ilustra uno de los
hechos que hacen del cálculo con c-vectores una herramienta muy poderosa
y en general más simple.
Otra propiedad muy importante de los c-vectores es que todos se transforman, por definición, de la misma forma bajo una transformación de
Lorentz, lo cual nos permite obtener de una manera más simple, pero más
general, las leyes de transformación entre sistemas de referencia inerciales
de las variables físicas. Por ejemplo, el teorema de adición de velocidades
68
CAPÍTULO 4. CINEMÁTICA RELATIVISTA
se sigue directamente del hecho que siendo U un c-v, entonces sus componentes medidas en dos sistemas de referencia Σ y Σ0 están relacionadas
por las ecuaciones de transformación de Lorentz (ecuaciones (3.43), (3.44),
(3.45) y (3.46)):
(4.9)
U ,0 = γ(v)(U 0 − βU 1 )
U ,1 = γ(v)(U 1 − βU 0 )
,2
(4.10)
2
(4.11)
U ,3 = U 3
(4.12)
U
=U
En donde v es la velocidad del sistema de referencia Σ0 respecto al sistema Σ y β = v/c. Hemos colocado explícitamente el argumento del factor
γ, para distinguirlo del γ asociado a la velocidad física u de la partícula.
Teniendo en cuenta la relación entre las componentes de la c-velocidad y la
velocidad física (ecuación (4.7)), válidas en cualquier sistema de referencia,
la ecuación (4.9) nos da directamente la ley de transformación del factor γ
de la partícula:
vux
(4.13)
γ(u, ) = γ(v)γ(u)(1 − 2 )
c
y teniendo en cuenta esta relación, se obtiene, de las otras tres ecuaciones
(4.10), (4.11) y (4.12), el teorema de adición de velocidades o equivalentemente la ley de transformación de las componentes de la velocidad física
entre dos sistemas de referencia inerciales:
ux0 γ(u, ) = γ(v)(γ(u)ux − βcγ(u))
entonces
ux0 =
ux − v
x
(1 − vu
c2 )
(4.14)
(4.15)
y similarmente
uy0 =
uz0 =
p
1 − v2 /c2
x
(1 − vu
)
c2
p
2
uz 1 − v /c2
x
(1 − vu
)
c2
uy
(4.16)
(4.17)
Para finalizar esta sección, daremos dos resultados importantes, que
serán de utilidad en la dinámica relativista.
Proposición 5.1 Cualquier c-vector w = (w0 , w) como de tiempo (w2 >
0), y dirigido al futuro (w0 > 0), puede ser expresado como un multiplo de
una c-velocidad U .
4.3. CUADRI-VECTOR ACELERACIÓN
Para esto basta tomar
69
√
w2
U
w=
c
(4.18)
Proposición 5.2 Dado un c-vector w como de tiempo, siempre es posible
encontrar un sistema de referencia para el cual las componentes del c-vector
sean (w0 , 0).
Teniendo en cuenta la Proposición 5.1, basta con probar que se cumple
para una c-velocidad. Sea U = γ(u)(c, u) en un sistema de referencia Σ y
consideremos un segundo sistema de referencia Σ0 cuya c-velocidad respecto
al sistema Σ sea U , entonces claramente las componentes de la c-velocidad
U respecto a Σ0 son (c, 0). La velocidad física del sistema es entonces u. En
efecto, si escogemos el eje temporal de Σ0 paralelo a u, podemos eliminar
sus componentes espaciales; en caso que el c-vector U esté dirigido al pasado
podemos aplicar los mismos argumentos a la velocidad −u. Esta situación de
elección de los ejes nos permite, en muchas situaciones, simplificar cálculos,
pues por ejemplo si W es un c-vector cualquiera no nulo, siempre podemos
absorber dos de sus componentes espaciales (digamos W 2 y W 3 ) rotando los
ejes espaciales del sistema de referencia Σ y escoger el eje t0 o x0 a lo largo
del vector W y eliminar una componente más, bien sea W 1 (como en el caso
anterior) si W es un c-vector como de tiempo, o W 0 si W es un c-vector
como de espacio.
4.3.
Cuadri-vector aceleración
De manera similar a la c-velocidad, definimos el c-v aceleración como la
derivada de la c-velocidad respecto al tiempo propio
A = (A0 , A1 , A2 , A3 ) :=
dU
dτ
(4.19)
Para encontrarar la relación de las componentes de la c-aceleración con
la aceleración física, i.e., con la derivada de la velocidad respecto al tiempo
a = du/dt medida en un sistema de referencia, basta con utilizar la relación
(4.5) en la ecuación que relaciona las componentes de la c-velocidad con u
(ecuación (4.7)) medidas en algún sistema de referencia Σ:
dt d
dU α
=
γ(u)(c, u)
dτ
dτ dt
dγ(u) dγ(u)
,
u + γ(u)a)
= γ(u)(
dt
dt
Aα =
(4.20)
70
CAPÍTULO 4. CINEMÁTICA RELATIVISTA
Consideremos un sistema de referencia inercial para el cual la partícula
se encuentra momentáneamente en reposo, i.e., u = 0, entonces para este
sistema las componentes de la c-aceleración toman la forma
Aα = (0, a)
(4.21)
A esta aceleración física a se le llama aceleración propia y es un invariante relativista, pues la norma al cuadrado del c-v aceleración está dada
por
(4.22)
A2 = − | a |2
Esta relación indica también que la c-aceleración es un c-v como de espacio. Además, los c-vectores velocidad y aceleración son ortogonales pues, en
el sistema de referencia propio de la partícula el c-v velocidad tiene componentes (c, 0) y por lo tanto el producto interno entre los c-vectores velocidad
y aceleración, que es también un invariante, está dado por:
U · A = η αβ U α Aβ = 0
(4.23)
Este resultado se puede obtener directamente, sin hacer uso de un sistema
particular de referencia, pues dado que U 2 = c2 , se tiene entonces que
0=
d
d 2
U = 2U ·
U = 2U · A
dτ
dτ
(4.24)
Podemos proceder de manera similar como se hizo para obtener las leyes
de transformación de las componentes de la velocidad entre sistemas de referencia inerciales y calcular las ecuaciones de transformación para la aceleración, sin embargo, dado que estas expresiones no son de mucha utilidad,
pospondremos la interpretación física de la aceleración para el siguiente capítulo sobre dinámica relativista y nos limitaremos en este punto a dar un
ejemplo sobre la cinemática de un sistema con aceleración propia constante.
4.3.1.
Viaje interestelar
Este ejemplo ilustra uno de los resultados más sorprendentes de la teoría
especial de la relatividad, conocido históricamente como la paradoja de los
mellizos de Langevan. Como veremos, este resultado no es de ninguna manera una paradoja, pero si es ilustrativo plantearlo en estos términos, pues
nos permite entender de manera más precisa el principio de relatividad y
evitar un error muy común que se presenta cuando se analizan situaciones
o fenómenos desde el punto de vista de diferentes observadores inerciales.
4.3. CUADRI-VECTOR ACELERACIÓN
71
Supongamos que un mellizo parte en un viaje espacial mientras que el
otro permanece en la tierra, entonces como veremos en el siguiente ejemplo
numérico que vamos a tratar, el mellizo viajero regresa a la tierra al cabo
de unos cuantos años medidos por relojes de la nave espacial, mientras que
para el mellizo que permaneció en la tierra habrían transcurrido miles años
medidos por relojes del sistema de referencia de la tierra. Claramente no
hay simetría en el análisis de la situación vista por los dos mellizos, pues el
mellizo viajero no constituye un sistema de referencia inercial y por lo tanto
no es válido (como se plantea en la paradoja) suponer que visto desde la
tierra, es el mellizo de la nave a quien le transcurren miles de años.
Consideremos un cohete que parte del reposo en la tierra con una aceleración propia constante igual a g (la aceleración de la gravedad sobre la
superficie de la tierra) y viaja hacia el centro de la galaxia. Supongamos que
la mitad del viaje lo realiza acelerando y la otra mitad frenando, también
con aceleración propia g. Tomando como sistema de referencia inercial la
tierra, con su origen de coordenadas en la tierra, el origen del tiempo en el
instante en que la nave parte y como eje x la dirección del movimiento de la
nave, entonces las componentes de la c-velocidad y c-aceleración de la nave
están dadas por:
U
= (U 0 , U ) = (U 0 , Ux , 0, 0)
0
0
A = (A , A) = (A , Ax , 0, 0)
(4.25)
(4.26)
las cuales satisfacen las siguientes relaciones (usando unidades con c = 1):
U 2 = 1 = (U 0 )2 − Ux2
(4.27)
U · A = 0 = U 0 A0 − Ux Ax
(4.28)
A2 = −g 2 = (A0 )2 − A2x
(4.29)
En unidades de c = 1, el valor de la aceleración de la gravedad es g '
1al−1 (al ≡ año luz). De la ecuación (4.28) despejamos A0
A0 = Ax Ux /U 0
(4.30)
y reemplazamos en la ecuación (4.29), entonces
g 2 = A2x [1 − (
Ux 2
) ]
U0
(4.31)
Utilizando la ecuación (4.27) obtenemos
Ax = gU 0
(4.32)
72
CAPÍTULO 4. CINEMÁTICA RELATIVISTA
y de esta ecuación y la (4.30) se llega a la relación:
A0 = gUx
(4.33)
Diferenciando con respecto al tiempo propio la ecuación (4.32) y haciendo uso de la ecuación (4.33), obtenemos una ecuación diferencial para
Ux :
d2 Ux
dU 0
= gA0 = g 2 Ux
=
g
(4.34)
dτ 2
dτ
entonces
d2 Ux
− g 2 Ux = 0
(4.35)
dτ 2
cuya solución está dada en términos de funciones hiperbólicas, como se puede
probar por sustitución directa,
Ux = C1 sinh(gτ ) + C2 cosh(gτ )
(4.36)
con C1 y C2 constantes de integración, las cuales se pueden determinar
utilizando las condiciones iniciales: la nave parte del reposo con acelerax
ción propia g, i.e., Ux (τ = 0) = 0 y dU
dτ |τ =0 = g. Entonces, de la primera
condición se obtiene que C2 = 0 y de la segunda condición
g = C1 g cosh(0) ⇒ C1 = 1
(4.37)
Así, obtenemos las siguientes ecuaciones diferenciales para las coordenadas (x0 , x) de la nave, medidas desde el sistema tierra:
Ux =
U0 =
dx
= sinh(gτ )
dτ
dx0
= cosh(gτ )
dτ
(4.38)
(4.39)
en donde la segunda ecuación se obtiene de la ecuación (4.27). Integrando estas ecuaciones con las condiciones iniciales x = x0 = 0 para τ = 0,
obtenemos la ecuación para la trayectoria o línea de universo de la nave, en
términos del parámetro τ (tiempo propio de la nave):
x0 = g −1 sinh(gτ )
(4.40)
x = g −1 (cosh(gτ ) − 1)
(4.41)
En la Figura 4.1 se muestra un gráfico de la línea de universo de la nave, en
el sistema de referencia tierra. En este diagrama la línea de universo de la
4.3. CUADRI-VECTOR ACELERACIÓN
73
Figura 4.1: Línea de universo del cohete
tierra es el eje ct y también se ha dibujado allí, el cono futuro del evento P,
es decir, del evento: partida de la nave en la tierra. La línea de universo del
cohete siempre tiene que estar dentro del cono de luz del evento P y en todo
punto la tangente a la línea de universo es menor de 45o , con respecto al
eje ct, indicando que la velocidad del cohete siempre es menor que c, como
lo exige la relatividad. Notemos además, que la línea de universo del cohete
intercepta a la línea de universo de la tierra en dos puntos: en el instante del
lanzamiento de cohete y luego en el instante en que éste regresa a la tierra.
A partir de estas ecuaciones podemos obtener toda la información que
se quiera respecto al viaje. Por ejemplo, calculemos la distancia a la cual se
encuentra el cohete de la tierra y su velocidad al cabo de 40 años medidos
en la tierra. Como estamos trabajando con unidades de c = 1 tenemos que
x0 = t = 40años, entonces, despejando τ de la ecuación (4.40)
τ = sinh−1 (gx0 ) = sinh−1 (40) ' 4, 38años
(4.42)
y remplazando este valor del tiempo transcurrido en la nave (tiempo propio)
en la ecuación (4.41), obtenemos la distancia a la cual se encuentra la nave
de la tierra:
x = [cosh(4,38) − 1]años − luz = 39,01años − luz
(4.43)
74
CAPÍTULO 4. CINEMÁTICA RELATIVISTA
La velocidad de la nave en cualquier instante la podemos obtener derivando las ecuaciones (4.40) y (4.41), y de la relación entre las componentes de
su c-velocidad y su velocidad física:
U α = (U 0 , U ) = γ(u)(1, u)
U
α
= (cosh(gτ ), sinh(gτ ), 0, 0)
(4.44)
(4.45)
por lo tanto, despejando la velocidad u = (ux , 0, 0) de esta relación, tenemos
que la velocidad de la nave en ese punto de la trayectoria es:
ux = tanh(gτ ) = tanh(4,38) = 0,9997
(4.46)
El centro de la galaxia se encuentra aproximadamente a unos 30000 añosluz de la tierra, puesto que la mitad del viaje se hace acelerando y la otra
mitad desacelerando, entonces por simetría, el tiempo propio para que la
nave llegue al centro de la galaxia es el doble del tiempo necesario para
recorrer los primeros 15000 años-luz. Despejando τ de la segunda (4.41)
tenemos:
(4.47)
τ = cosh−1 (15000 + 1) = 10,309años
y por tanto el tiempo medido en la nave para realizar este viaje es de
20,6años, tiempo perfectamente razonable para un viaje interestelar. Ahora,
si este viajero regresa a la tierra siguiendo el mismo plan de vuelo, entonces
el viaje completo le llevaría un tiempo de 41,2años, mientras que el tiempo
transcurrido en la tierra sería de
x0 = 4 sinh(10,3) = 60003,9años
(4.48)
Este ejemplo muestra la famosa paradoja de los mellizos de Langevan,
pero ilustra también claramente la asimetría de la situación. En el relato de
la paradoja se afirma que dada la relatividad de los sistemas de referencia,
esto es, la equivalencia de todos los sistemas de referencia inerciales para
describir los fenómenos físicos, podemos considerar el viaje visto desde la
nave espacial y ver que es la tierra la que se aleja de la nave y por lo tanto
se espera, que cuando la tierra regrese a la nave, entonces sea el mellizo que
permanecio en la nave al que le han transcurrido 60003,9años, mientras que
al viajero de la tierra tan solo le habrían pasado 41,2años.
La falsedad de este último razonamiento radica en el hecho que la nave
espacial está acelerada y por lo tanto no es un sistema de referencia inercial,
a diferencia del sistema tierra, lo que hace inválido aplicar el principio de
relatividad restringida. Este efecto de retraso temporal de relojes, que se
encuentran sometidos a una aceleración, se ha probado experimentalmente
4.4. CUADRI-VECTOR DE ONDA
75
utilizando relojes atómicos (de alta precisión), uno de los cuales permanece
en la tierra y el otro viaja en un avión alrededor de la tierra. Si bien, el
efecto del retardo temporal del reloj viajero es muy pequeño, del orden de
millonésimas de segundo, este tipo de relojes ha permitido hacer estas medidas con la suficiente precisión, mostrando este espectacular efecto relativista.
Es de anotar que para el cálculo del retardo temporal en este experimento
terrestre, es necesario tener en cuenta los efectos asociados al campo gravitacional, es decir hay que trabajar en el contexto de la teoría general de
la relatividad, sin que se invalide de ninguna manera las predicciones de la
teoría especial de la relatividad.
Una última conclusión que se desprende de este ejemplo, es que los viajes
interestelares son físicamente posibles, pues basta con lograr aceleraciones
suficientes durante un tiempo adecuado, para que un viajero en un tiempo
razonable atraviese nuestra galaxia, o incluso viaje a otras galaxias, pero
definitivamente no pretenda regresar a la tierra, pues en la tierra podrían
haber transcurrido varios millones de años.
4.4.
Cuadri-vector de onda
Una de las contribuciones más importantes de las ecuaciones de Maxwell
lo constituye la propagación de las ondas electromagnéticas. Debido a que la
ecuación de ondas en el vacío (ver por ejemplo la ecuación (2.14)) es lineal,
vale el principio de superposición y así cualquier onda electromagnética se
puede escribir como una suma o superposición de ondas planas de la forma
ψ(t, r) = Ae±i(ωt−k·r)
(4.49)
en donde A es la amplitud del campo ψ (por ejemplo el campo eléctrico,
magnético, potencial vectorial o potencial escalar), ω la frecuencia de la
onda, k el vector de onda y el signo ± indica el sentido de propagación de
la onda. La cantidad
ϕ = ωt − k · r
(4.50)
se llama la fase de la onda y debe ser un invariante relativista, esto es, debe
ser la misma para todos los observadores inerciales. Si definimos el c-vector
de onda k como
k := (ω/c, k)
(4.51)
entonces la fase de la onda se puede escribir como el producto interno
Minkowskiano entre el c-vector de onda y el c-vector posición x = (ct, r):
ϕ=k·x
(4.52)
76
CAPÍTULO 4. CINEMÁTICA RELATIVISTA
la cual es un invariante relativista. De las propiedades de transformación de
los c-vectores se tiene que las componentes del c-vector de onda, medidas
por dos observadores inerciales Σ y Σ0 están relacionadas por las ecuaciones
de transformación:
ω 0 = γ(v)(ω − vkx )
(4.53)
v
kx0 = γ(v)(kx − 2 ω)
(4.54)
c
ky0 = ky
(4.55)
kz0 = kz
(4.56)
De las propiedades de los c-vectores sabemos que la norma Minkowskiana
de todo c-vector es un invariante relativista y por lo tanto se espera que
ésta tenga un significado físico. Si tomamos la norma del c-vector de onda
obtenemos
ω2 ¯¯ ¯¯2
(4.57)
k 2 = 2 − ¯k ¯ = 0
c
pues, si tenemos en cuenta la relación
¯ ¯ de dispersión para las ondas electro¯ ¯
magnéticas en el vacío, c = ω/ ¯k¯, vemos que el c-vector de onda es un
c-vector nulo o como de luz, y cuya norma nos da la relación de dispersión
para ondas electromagnéticas en el vacío.
Consideremos como ejemplo una onda electromagnética plana de frecuencia ω, que se propaga respecto al sistema Σ a lo largo del eje y, i.e.,
k = (o, ky , 0). Entonces, para un observador Σ0 que se mueve respecto a Σ
con velocidad v a lo largo de los ejes paralelos xx0 , tenemos
ω0 = γ(v)ω
kx0 = −
v
γ(v)ω
c2
ky0 = ky
(4.58)
En primer lugar, la dirección de propagación de la onda para el observador Σ0 está dada por la relación
kx0 /ky0 = −
v
ω
v
γ(v) = − γ(v)
2
c
ky
c
(4.59)
en donde la última igualdad se obtuvo utilizando la relación de dispersión
para la onda en el sistema Σ. En el límite de bajas velocidades, es decir,
para velocidades del observador Σ0 tales que v ¿ c, podemos aproximar el
factor γ(v) ∼ 1, y obtenemos el fenómeno clásico de la aberración de la luz
estelar, discutida en el capítulo segundo.
El efecto Doppler es un fenómeno asociado a las ondas en general y corresponde al cambio en la frecuencia medida por un observador con respecto
4.4. CUADRI-VECTOR DE ONDA
77
a la frecuencia emitida por la fuente, debido a los movimientos relativos del
observador y/o de la fuente y en el caso particular de ondas que requieran
un medio para propagarse, tales como las sonoras o elásticas, también depende de la velocidad del medio. En física no relativista el efecto Doppler
se puede entender fácilmente si tenemos encuenta que, por ejemplo, cuando la fuente se está moviendo en dirección del observador, el tiempo entre
dos pulsos recibidos es menor que el tiempo entre la emisión de estos dos
pulsos, dando lugar así a una frecuencia detectada mayor a la frecuencia
emitida, fenómeno llamado corrimiento hacia el azul. La misma situación se
presenta si es el observador el que se acerca a la fuente. Cuando la fuente
se aleja del observador, la frecuencia detectada es menor que la emitida y
el efecto se llama corrimiento al rojo. En el caso relativista se presenta una
situación similar, pero el factor de corrimiento se ve corregido debido al
comportamiento del tiempo para diferentes observadores. En las ecuaciones
de transformación para el c-vector de onda ( (4.53) a la (4.56)), está contenido el efecto Doppler relativista para la situación más general posible.
Para encontrar las relaciones estandar del efecto Doppler relativista que se
tratan usualmente en los textos de relatividad especial, vamos a considerar
casos particulares de las ecuaciones de transformación (4.53) a la (4.56).
Supongamos que la fuente está en reposo respecto al observador Σ y que
emite un frente de ondas de frecuencia ω a lo largo del eje x, entonces las
componentes del c-vector de onda son (ω/c, kx , 0, 0). De la ecuación (4.53),
y teniendo en cuenta que kx = ω/c, para el observador Σ0 tenemos
v
ω 0 = γ(v)(ω − vkx ) = ωγ(v)(1 − )
c
(4.60)
en donde el signo de la velocidad v es positivo si el observador se aleja de
la fuente y negativo si se acerca. Para el caso de movimiento del observador
transversal a la dirección de propagación, consideremos que el observador
Σ emite un frente de ondas de frecuencia ω en la dirección y, entonces el
c-vector de onda toma la forma k = (ω/c, 0, ky , 0). A partir de la ecuación
(4.53) la frecuencia medida por el observador Σ0 es
ω 0 = γ(v)ω
(4.61)
Una situación más general de interés se presenta cuando el tren de ondas
emitido por la fuente viaja en el plano xy formando un ángulo α con respecto
al eje de las x, entonces el c-vector de onda es k = (ω/c, kx , ky , 0), con
¯ ¯ q
¯ ¯
¯ ¯
¯ ¯
(4.62)
tan α = ky /kx ;
¯k¯ = kx2 + ky2 ;
¯k¯ = ω/c
78
CAPÍTULO 4. CINEMÁTICA RELATIVISTA
Entonces para el observador Σ0 se tiene que
ω 0 = γ(v)(ω − vkx ) = γ(v)ω(1 −
v
cos α)
c
(4.63)
Claramente esta última relación contiene, como casos particulares, las
situaciones descritas anteriormente. Cuando α = 0 obtenemos la ecuación
(4.60) y para α = 90◦ se reduce a la ecuación (4.61).
Notemos que el efecto Doppler transversal, ecuación (4.61), es de origen
estrictamente relativista puesto que es una consecuencia de la dilatación
temporal, situación que obviamente no se presenta en el tratamiento clásico.
Parte II
Dinámica relativista
79
Capítulo 5
Dinámica relativista
En este capítulo se desarrollarán las leyes de la dinámica relativista utilizando desde un principio, la formulación de cuadrivectores, la cual permite
formular las leyes de la dinámica relativista como una generalización de las
leyes fundamentales de la mecánica Newtoniana.
5.1.
Ecuaciones de movimiento
Definamos el cuadri-vector momentun por
p := m0 U = m0
dx
dτ
(5.1)
en donde m0 es la masa inercial propia de la partícula, es decir, la masa
inercial medida en el sistema de referencia en reposo de la partícula. m0
también es llamada masa en reposo y U es su cuadri-velocidad. Por definición, la masa en reposo de una partícula es un invariante relativista que
caracteriza a la partícula, pues si tomamos la norma del c-v momentun,
ecuación (5.1), obtenemos:
(5.2)
p2 = m20 c2
dado que la norma al cuadrado del c-v velocidad es c2 .
A partir de esta definición del c-momento de una partícula, podemos
mantener la misma definición de la segunda ley de Newton, pero formulada
para las cantidades c-vectoriales. Así, la ecuación de movimiento relativista
está dada por
dp
= m0 A
(5.3)
f=
dτ
81
82
CAPÍTULO 5. DINÁMICA RELATIVISTA
en donde A es la c-aceleración y f es la c-fuerza. Para interpretar las componentes del c-momento y c-fuerza en términos de variables dinámicas físicas,
específicamente, en términos de su cantidad de movimiento lineal (momentun), de su energía y de la fuerza, consideremos en primer lugar el c-momento
(ecuación (5.1)) y hagamos uso del hecho que a bajas velocidades comparadas con la velocidad de la luz, i.e. v ¿ c, las ecuaciones de la relatividad
deben reducirse a las ecuaciones de la mecánica Newtoniana. Teniendo en
cuenta que las componentes de la c-velocidad están relacionadas con la velocidad de la partícula a través de la ecuación U α = γ(u)(c, u), entonces (ver
capítulo anterior) las componentes del c-momentun serán
pα = (m0 γ(u)c, m0 γ(u)u) =: (E/c, p)
(5.4)
En esta última ecuación hemos definido las cantidades E (con unidades
de energía) y p (con unidades de momento) por
con
E = mc2
(5.5)
p = mu
(5.6)
m0
m := m0 γ(u) = p
1 − u2 /c2
(5.7)
llamada masa inercial relativista de la partícula, nombre que será justificado
en el siguiente análisis. Teniendo en cuenta que en el límite de bajas velocidades el factor γ(u) lo podemos expandir en una serie en potencias de (u/c),
reteniendo términos hasta orden (u/c)2 ,
1 u2
+ O(u4 /c4 )
(5.8)
2 c2
entonces, las componentes espaciales del c-momentun toman la forma
γ(u) = 1 +
1 u2
+ O(u4 /c4 )) ≈ m0 u
(5.9)
2 c2
la cual, en el límite de bajas velocidades se reduce a la definición del momentum clásico. Así, la definición del momentum relativista de una partícula
por la ecuación (5.6), nos conduce a interpretar la masa relativista (ecuación
(5.7)) como la inercia de una partícula, la cual depende de su velocidad.
Para interpretar la componente temporal del c-momento, consideremos
de nuevo el límite de bajas velocidades de la ecuación (5.5). Remplazando
la expansión (5.8) en la definición (5.7) tenemos
p = m0 u(1 +
E = m0 c20 (1 +
1 u2
1
+ O(u4 /c4 )) ≈ m0 c2 + m0 u2
2
2c
2
(5.10)
5.1. ECUACIONES DE MOVIMIENTO
83
la cual, salvo el término constante m0 c2 , corresponde a la definición newtoniana de energía cinética. Así, este resultado nos conduce a definir la cantidad
K := mc2 − m0 c2
(5.11)
como la energía cinética relativista de una partícula. Esta definición tiene
sentido en cuanto que la función K depende de la velocidad de la partícula,
se anula para u = 0 y en el límite de bajas velocidades se reduce a la energía
cinética clásica. La cantidad E = mc2 se define como la energía total de la
partícula y a la cantidad dinámica
E0 := m0 c2
(5.12)
la definimos como su energía en reposo. Esta cantidad E0 adquiere el sentido físico de una energía, solamente si es posible transformar esta forma de
energía (asociada a la masa y no a su estado de movimiento) en otras formas
de energía. Einstein, en su segundo artículo de 1905 sobre relatividad, titulado ”Depende la inercia de un cuerpo de su contenido de energía” postula
que esta forma de energía, asociada a la masa en reposo de una partícula, es
posible transformarla en otras formas de energía, dándole así sentido físico
a esta definición y sugiere que esta transformación de masa en energía se
puede medir en el decaimiento radioactivo de las sales de radio. Este postulado le valió a Einstein el ganarse el dudoso honor de ser ”el padre de la
bomba atómica”.
Otro resultado que apoya las definiciones anteriores, nos lo da la interpretación física de las componentes de la c-fuerza, definida por la ecuación
de movimiento (5.3). Haciendo uso de la relación d\dτ = γ(u)d/dt y de la
definición (5.4) de las componentes del c-momento, tenemos
fα =
dpα
dpα
= γ(u)
dτ
dt
dm
dm dp
, ) = γ(u)(c
, f)
dt dt
dt
En la última igualdad hemos definido la cantidad
= γ(u)(c
f=
dp
dt
(5.13)
(5.14)
la cual identificamos como la fuerza física que actúa sobre la partícula, produciendo, de acuerdo con la definión newtoniana de fuerza, un cambio por
unidad de tiempo en el momentum de la partícula. Para sustentar aún más
84
CAPÍTULO 5. DINÁMICA RELATIVISTA
esta definición de fuerza y de paso la definición de energía total E dada, consideremos la relación de ortogonalidad entre la c-velocidad y la c-aceleración
(ecuación (4.23)) U · A = 0, entonces
f · U = η αβ f α U β = 0
(5.15)
y de esta ecuación y de la definición de las componentes de la c-velocidad,
obtenemos la relación
γ 2 (u)c2
dm
− γ 2 (u)f · u = 0
dt
dE
=f ·u
dt
Esto implica que si adoptamos la definición clásica de trabajo
⇐⇒
(5.16)
dW = f · dr
(5.17)
dW = f · udt = dE
(5.18)
entonces se obtiene que
esto significa, que si el trabajo realizado por una fuerza sobre una partícula
es diferente de cero, entonces la partícula cambia su energía total, de acuerdo
con la ecuación (5.18).
Esta última relación nos permite escribir las componentes de la c-fuerza,
definidas en la ecuación (5.13), en la forma
1
f α = γ(u)( f · u, f )
c
(5.19)
la cual nos da una interpretación directa de las componentes de la c-fuerza;
la componente temporal representa el trabajo por unidad de tiempo que
realiza la fuerza física f sobre la partícula, mientras que las componentes
espaciales forman el vector fuerza.
5.2.
Leyes de conservación
La dinámica Newtoniana está basada sobre tres postulados fundamentales: La primera ley de Newton o el princio de inercia, la cual también
se puede formular de manera equivalente, como el principio de relatividad
Galileano, siendo el primer postulado de la teoría especial de la relatividad
la generalización de esta primera ley. La segunda ley, que postula la ecuación
5.2. LEYES DE CONSERVACIÓN
85
de movimiento para una partícula sometida a una fuerza (F = ma), se extiende al caso relativista a través de la ecuación (5.3). La tercera ley llamada
de acción y reacción, que postula el comportamiento de la interacción entre
sistemas, esto es, que la fuerza ejercida sobre una partícula es el resultado
de la interacción de esta partícula con algún sistema y por tanto, sobre este
sistema también interacciona la partícula, efectuando sobre él una fuerza de
la misma magnitud pero de sentido contrario a la ejercida por el sistema
sobre la partícula. Claramente esta ley implica que la acción y la reacción
son eventos simultaneos y por lo tanto no puede ser válida para el caso relativista en general. Sin embargo, para el caso particular en que coincidan
los puntos de aplicación de las fuerzas de acción y reacción, sí se cumple
la tercera ley de Newton, una situación que se puede presentar cuando los
sistemas que interactúan son partículas puntuales y la interacción entre ellas
se pueda aproximar por una interacción de contacto. Puesto que las interacciones fundamentales (gravitacional, electromagnética, fuerte o nuclear y
débil) que rigen todos los procesos físicos son interacciones a distancia, y
por lo tanto en sentido riguroso, ninguna de estas interacciones fundamentales puede satisfacer la tercera ley de Newton, es claro que el postulado
de Newton sobre la acción y la reacción, deja de ser una ley fundamental
en la naturaleza y su validez queda restringida a sistemas cuyas velocidades
típicas séan pequeñas comparadas con la velocidad de la luz, o para interaciones puntuales de contacto. Es importante anotar en este punto que, en el
marco de la mecánica Newtoniana, la tercera ley de Newton juega un papel
fundamental para establecer los teoremas de conservación del momentum y
de la energía mecánica.
Esto nos conduce entonces, a postular un principio de conservación para
la energía y el momentun de un sistema relativista, el cual como veremos,
generaliza las leyes de conservación de la mecánica Newtoniana y adiciona
una nueva forma de energía, llamada energía en reposo, que está asociada a
toda partícula material y que constituye uno de los aportes más importantes
de la teoría especial de la relatividad.
Para un sistema aislado de partículas, con c-momentos pi , i = 1, 2, ..., el
c-momento total del sistema p , defido como
X
pi
(5.20)
p :=
i=1
es una constante de movimiento. Dado que la componente temporal del cmomento representa la energía total del sistema y las componentes espaciales
corresponden a las componentes del vector momento, entonces el postulado de la conservación del cuadrimomento asegura que la energía total y el
86
CAPÍTULO 5. DINÁMICA RELATIVISTA
momentun total de un sistema aislado son constantes del movimiento. Esto
es, si expresamos la ecuación (5.20) en componentes, con pi = (Ei /c, pi ) y
p = (E/c, p), obtenemos que la energía total del sistema E, definida como
la suma de las energías de las partículas individuales
X
Ei
(5.21)
E :=
i=1
y el momentun total del sistema, definido como la suma vectorial de los
momentos individuales de las partículas
X
pi
(5.22)
p :=
i=1
se conservan. Notemos que la ley de conservación de la energía (ecuación
(5.21)) se puede reformular como el postulado de la conservación de la masa
inercial, pues de la definición de energía total de una partícula E = mc2 ,
tenemos que
X
mi = cte.
(5.23)
i=1
Existe toda una serie de consecuencias interesantes de los postulados
de la dinámica relativista, que las vamos a exponer a través de ejemplos
sobre procesos que se presentan al nivel de las partículas elementales. Es
importante en este punto de la discusión hacer algunas anotaciones respecto
a la diferencia, tanto en las aplicaciones como en la metodología de trabajo,
entre la dinámica Newtoniana y la relativista. En mecánica Newtoniana, por
lo general se conocen las fuerzas (su forma funcional), por ejemplo la fuerza
de la gravedad, de Coulomb, del tipo oscilador armónico, de rozamiento, etc.,
y a partir de ellas , utilizando la segunda ley de Newton se encuentran las
trayectorias de las partículas y las leyes de conservación permiten determinar
constantes de movimiento, simplificando así el problema dinámico.
En el caso de la relatividad la situación se modifica un poco, pues, salvo
el caso de la fuerza de Lorentz, que describe la fuerza que actúa sobre una
partícula cargada inmersa en un campo electromanético, la cual nos permite describir el movimiento de la carga solucionando la ecuación dinámica
de movimiento, las otras interacciones fundamentales no admiten, por una
parte, una descripción clásica funcional de la fuerza que esté de acuerdo
con los principios de la relatividad y por otra parte, es conocido que el
tratamiento de las interacciones fundamentales (incluyendo la electromagnética) debe hacerse en en marco de la teoría cuántica de campos. El caso
de la electrodinámica es especial, pues esta interacción fundamental admite
5.3. PROPIEDADES DEL C-MOMENTUN
87
una descripción clásica dada por las ecuaciones de Maxwell, las cuales son
ecuaciones relativistas que describen correctamente los fenómenos electromagnéticos a nivel macroscópico. La diferencia de la electrodinámica clásica
con la ley de gravitación universal de Newton, la cual también describe
correctamente los fenómenos gravitacionales a escalas macroscópicas, radica en el hecho que esta última no es una teoría relativista, pues la fuerza
gravitacional Newtoniana es una interacción a distancia e independiente del
tiempo. Esta situación fue precisamente la que condujo a Einstein a buscar
una teoría de la gravitación que estuviera de acuerdo con los principios de
la relatividad y que en el límite de bajas velocidades se redujera a la teoría
Newtoniana de la gravedad, logrando su objetivo en 1915, cuando formuló
la Teoría General de la Relatividad.
Si bien, las aplicaciones fundamentales de la teoría especial de la relatividad de dan en el marco de las partículas elementales y como fue enfatizado
en el parágrafo anterior, para su descripción dinámica se requiere de una
teoría cuántica de campos, es posible como veremos, obtener toda una serie de resultados importantes a partir de la dinámica relativista a partir de
los principios de conservación, sin necesidad de recurrir a una descripción
completa de las interacciones que rigen estos procesos.
Antes de entrar a estudiar las principales consecuencias de los postulados
de la dinámica relativista, a través de fenómenos y procesos físicos, daremos
algunas definiciones y propiedades y unos resultados generales que serán de
utilidad más adelante.
5.3.
Propiedades del c-momentun
Un primer resultado general que se deriva de la formulación cuadrivectorial de la relatividad surge debido al hecho de que la norma de cualquier
c-vector en un invariante relativista y por lo tanto las cuatro componentes
que conforman un c-vector no son independientes. Así por ejemplo, esta restricción sobre las componentes del c-momentun de una partícula, nos conduce a una relación entre su energía total y la magnitud de su momentun,
pues dado p = (E/c, p) tenemos
p2 = E 2 /c2 − | p |2 = Invariante
(5.24)
Para calcular el valor de este invariente, basta con determinar el cmomentun de la partícula en un sistema de referencia particular, por ejemplo, en el sistema de reposo instantaneo de la partícula, para el cual el
88
CAPÍTULO 5. DINÁMICA RELATIVISTA
c-momentun toma la forma
p = (E0 /c, 0)
(5.25)
y por lo tanto su norma al cuadrado se reduce a
p2 = E02 /c2 = m20 c2
(5.26)
Esto significa que para una partícula de masa en reposo m0 , energía
total E y momentun p medidas en un sistema de referencia Σ, se cumple la
relación
(5.27)
E 2 /c2 − | p |2 = m20 c2
o en forma equivalente
E 2 = E02 + | p |2 c2
(5.28)
Dos conclusiones importantes se desprenden de este análisis: La primera
tiene que ver con el hecho de que el cuadrivector-momentun de una partícula
física debe ser como de tiempo, pues m20 c2 > 0 y la segunda conclusión es
que su norma nos caracteriza a la partícula, pues está dada por la masa
en reposo de dicha partícula, que es un invariante relativista por definición.
Más adelante cuando discutamos el concepto de fotón o partículas de masa
en reposo nula, volveremos sobre la ecuación (5.28).
Consideremos ahora dos partículas de c-momentos p1 y p2 , con masas en
reposo m01 y m02 respectivamente y sea v la velocidad relativa entre ellas.
Entonces el producto interno Minkowskiano entre sus c-momentos, que es
un invariante relativista, está dado por
(5.29)
p1 · p2 = c2 m01 m2 = c2 m1 m02 = c2 m01 m02 γ(v)
p
en donde γ(v) = 1 − v2 /c2 es el factor γ de la velocidad relativa. Para
obtener esta expresión, basta con calcular el producto interno en el sistema
de referencia propio de una de las partículas (segunda o tercera igualdad
de la ecuación (5.29)), mientras que la última igualdad de esta ecuación se
deduce del hecho que v es la velocidad de una de las partículas medida en
el sistema de referencia de la otra (i.e. la velocidad relativa).
En mecánica Newtoniana se define una colisión elástica entre dos partículas, cuando la energía cinética del sistema es la misma antes y después de
la colisión. Así, en una colisión inelástica parte de la energía cinética de las
partículas se transforma en otras formas de energía, como por ejemplo, calor,
ondas mecánicas, etc.. Consideremos ahora una colisión relativista entre dos
partículas puntuales, con c-momentos p1 y p2 antes de la colisión y p01 y p02
5.3. PROPIEDADES DEL C-MOMENTUN
89
después de la colisión. De la hipótesis de conservación del c-momentun se
obtiene que
(5.30)
p1 + p2 = p01 + p02
elevando al cuadrado y utilizando las propiedades del producto interno
Minkowskiano (ecuación (3.68)) obtenemos
02
0
0
p21 + p22 + 2p1 · p2 = p02
1 + p2 + 2p1 · p2
(5.31)
Uno de los hechos más interesantes que surge en relatividad y que no
tiene su contraparte clásica, es que en un proceso de colisión (interacción)
entre partículas, es posible que algunas o todas de las partículas iniciales
que intervienen en el proceso se aniquilen y surjan otras diferentes. Que
este hecho sea posible es una consecuencia de la equivalencia masa-energía
(ecuación (5.12)). Es importante reiterar que los parámetros que caracterizan una clase de partículas (electrones, protones, etc.) son su masa en reposo, carga eléctrica, spin, y otros números cuánticos. En los procesos que
son de interés para nosotros, solo va a intervenir la masa en reposo de las
partículas y por lo tanto, este único parámetro es suficiente para caracterizar
dinámicamente a una partícula dada.
Retomando la discusión de la colisión entre dos partículas, consideremos el caso particular en el cual las partículas que intervienen en el proceso
(ecuaciones (5.30) y (5.31)) son las mismas antes y después de la colisión. Si
m01 y m02 son las masas en reposo de las partículas, entonces de la relación
(5.26) se tiene que
2 2
(5.32)
p21 = p02
1 = m01 c
2 2
p22 = p02
2 = m02 c
(5.33)
y por lo tanto la ecuación (5.31) se reduce a la igualdad
p1 · p2 = p01 · p02
(5.34)
Teniendo presente el resultado de la ecuación (5.29), aplicandolo a ambos
miembros de la ecuación (5.34), se llega a que
c2 m01 m02 γ(v) = c2 m01 m02 γ(v 0 )
(5.35)
con v y v0 las velocidades relativas entre las partículas antes y después de la
colisión, de donde se obtiene que
v = v0
(5.36)
90
CAPÍTULO 5. DINÁMICA RELATIVISTA
Por lo tanto, llegamos a la conclusión general que la magnitud de la
velocidad relativa entre las partículas no cambia. Esta situación nos conduce
a hacer la siguiente definición:
Una colisión entre partículas se llama elástica, si las partículas que intervienen en el proceso son las mismas antes y después de la colisión, o
equivalentemente, si las masas en reposo de las partículas que intervienen
en la colisión no cambian. Con esta definición, el resultado expresado en
la ecuación (5.36) se conoce como el lema de la colisión elástica para dos
partículas. Esta definición de colisión elástica tiene relación con la correspondiente definición Newtoniana de colisión elástica, pues en el límite de
bajas velocidades se reduce a la conservación de la energía cinética. Para ver
esto, basta con tener en cuenta la definición de energía cinética relativista
como la diferencia entre la energía total y de reposo. Si llamamos Ei y Ef las
energías totales antes y después de la colisión, entonces de la conservación
de la energía total se tiene
Ei = m1 c2 + m2 c2 = m01 c2 + m02 c2 = Ef
(5.37)
Por lo tanto, la energía cinética del sistema antes y después de la colisión
es la misma:
Ki = Ei − m01 c2 − m02 c2 = Ef − m01 c2 − m02 c2 = Kf
5.4.
(5.38)
Sistema centro de masa
Como vimos en la Proposición 4.6, dado un c-vector V como de tiempo
siempre es posible encontrar un sistema de referencia Σ0 , para el cual sus
componentes se reducen a (V 0 , 0), dejando además el signo de la primera
componente invariante, puesto que V o está dirigido al futuro (V 0 > 0) o
dirigido al pasado (V 0 < 0). Si W es otro c-vector como de tiempo, sincrono
con V , i.e., V 0 W 0 > 0, entonces en el sistema de referencia Σ0 se cumple
(V + W )2 = (V 0 + W 0 )2 − W 2 = V 2 + W 2 + 2V 0 W 0 > 0
(5.39)
por lo tanto, se llega al siguiente resultado importante que lo enunciaremos
como un lema:
Lema 5.1 La suma de dos c-vectores como de tiempo y sincronos, es un
c-vector como de tiempo y sincrono con cada uno de los sumandos.
Por inducción este resultado es válido para una suma cualquiera de cvectores como de tiempo sincronos.
5.4. SISTEMA CENTRO DE MASA
91
Consideremos ahora un sistema de un número finito de partículas no
interactuantes, salvo colisiones puntuales mutuas, con masas en reposo m0i ,
i = 1, 2, ... y c-momentos pi y sea Σ un sistema de referencia inercial
cualquiera. Definamos la masa relativista total m̄ del sistema y su c-momentun
total p̄ como
X
mi
(5.40)
m̄ :=
i=1
p̄ :=
X
i=1
X
pi =
(mi c, pi ) = (m̄c, p)
(5.41)
i=1
en donde hemos definido el momentun total del sistema p en la última igualdad de la ecuación (5.41). De los postulados de conservación todas las cantidades definidas, p̄ y por tanto m̄ y p, son constantes en el tiempo. Por
el lema anterior, el c-momentun total del sistema es un c-vector como de
tiempo y dirigido al futuro pues m̄c > 0. Por las propiedades dadas en la
Proposición 5.1 y Proposición 5.2, podemos encontrar un sistema de
referencia que lo llamaremos ΣCM o sistema de referencia centro de masa,
para el cual el c-momentun total p̄ no tenga componentes espaciales, esto es,
un sistema para el cual p = 0. La velocidad uCM del sistema de referencia
centro de masa respecto a Σ está dada por
uCM =
p
m̄
(5.42)
A diferencia de la mecánica Newtoniana, el vector centro de masa de un
sistema de partículas relativistas es dependiente del sistema de referencia
inercial, lo cual se puede entender fácilmente si tenemos en cuenta que la
masa inercial de las partículas depende de la velocidad de las mismas. Sin
embargo, este vector centro de masa siempre está en reposo en el sistema
de referencia ΣCM . Para ver esto, definamos para un sistema de referencia
inercial Σ, el vector posición centro de masa del sistema como
P
ri mi
(5.43)
rCM := Pi=1
i=1 mi
entonces
drCM
=
dt
P
dri
i=1 dt mi
+
m̄
P
dmi
i=1 ri dt
=
P
i=1 pi
m̄
= uCM
(5.44)
en donde se han utilizado las definiciones (5.42), (5.43) y (5.44), el hecho
de que m̄ es una constante de movimiento y además que para interacciones
92
CAPÍTULO 5. DINÁMICA RELATIVISTA
P
puntuales (colisión) i=1 ri dmi /dt = 0 entre colisiones. Este resultado significa que para cualquier sistema de referencia, el centro de masa del sistema
se mueve con la velocidad del sistema centro de masa, lo que no significa que
el vector posición centro de masa sea el mismo para todos los observadores
inerciales. Por esta razón, es usual definir el centro de masa del sistema como
el vector posición rCM medido en el sistema ΣCM .
Definida la velocidad uCM (ecuación (5.42)), la c-velocidad del centro de
masa está dada por
UCM = γ(uCM )(c, uCM )
(5.45)
entonces, de la definición de c-momentun total (ecuación (5.41)), velocidad
del centro de masa (ecuación (5.42) y la definición de c-velocidad del centro
de masa (ecuación (5.45)), tenemos que
p̄ = (m̄c, p) = m̄(c, uCM ) = m̄γ −1 (uCM )UCM
(5.46)
Tomando la norma al cuadrado de esta ecuación
p̄2 = m̄2 γ −2 (uCM )c2
(5.47)
la cual debe ser un invariante relativista, nos conduce a la definición de la
masa total del sistema de partículas en el sistema de referencia centro de
masa ΣCM :
m̄
(5.48)
mCM :=
γ(uCM )
Por lo tanto, podemos escribir el c-momentun total del sistema como
p̄ = mCM UCM
(5.49)
en donde mCM y UCM para el sistema de partículas, juegan el papel de m0
y U para una partícula simple. Es importante aclarar que mCM , la masa en
reposo del sistema en ΣCM , excede a la suma de las masas en reposo de las
partículas del sistema, pues a ella contribuyen también las energías cinéticas
de las partículas individuales, puesto que la energía cinética del sistema en
ΣCM está dada por
KCM = mCM c2 − m̄0 c2
(5.50)
en donde hemos definido
m̄0 :=
n
X
i=1
m0i
(5.51)
5.5. ENERGÍA UMBRAL
5.5.
93
Energía umbral
La primera patícula fundamental que se identificó fue el electrón, el cual
era el responsable de la conducción eléctrica. Luego a comienzos de la década
de los treinta, se identificaron el protón y el neutrón como los constituyentes
del núcleo atómico. Por esta época Yukawa desarrolló un modelo para la
interacción nuclear, en el cual surgía una nueva partícula fundamental, el
pión, que luego fue observada experimentalmente. Esta época se puede considerar como el comienzo de la física de las partículas fundamentales y ya
en la década de los sesenta, se conocian cientos de nuevas partículas, las
cuales se podían producir en el laboratorio como producto de las colisiones
entre partículas aceleradas a altas energías (por ejemplo electrones contra
electrones o protones). Cuando chocan dos partículas con energía cinética
suficiente, se pueden generar nuevas y más masivas partículas, como el resutaldo de la transformación de energía cinética en energía en reposo de
las nuevas partículas. La pregunta dinámica que surge es ¿Cual en la energía mínima necesaria de las partículas incidentes, para producir una nueva
partícula de una masa dada?. La respuesta a esta pregunta la constituye el
llamado problema de la energía umbral, que es una de las aplicaciones más
importantes de la dinámica relativista.
Para introducir el concepto de energía umbral, consideremos por ejemplo un electrón de masa en reposo m0 y energía total E = mc2 , que choca
contra otro electrón en reposo y como producto de la colisión surge, además
de los dos electrones iniciales, una nueva partícula de masa en reposo M0 .
El problema es encontrar la energía mínima necesaria del electrón incidente,
llamada energía umbral, para que esta reacción pueda suceder. La respuesta
no es simplemente (m + M0 )c2 , i.e., que la energía cinética del electrón incidente sea justamente la energía en reposo de la nueva partícula, pues dado
que el momentun del sistema debe conservarse, el producto de la colisión
en general, debe poseer alguna energía cinética y por lo tanto parte de la
energía inicial debe gastarse en esta energía cinética y la otra parte debe
suplir la energía en reposo de la nueva partícula. De cualquier manera, la
energía mínima (umbral) se tendrá cuando las partículas resultantes de la
colisión estén en reposo en el sistema de referencia del centro de masa del
sistema. Esta última afirmación define el concepto de energía umbral.
Tomemos por el momento el caso general de dos partícula de masas en
reposo m01 y m02 y c-momentos p1 y p2 respectivamente, que al chocar producen una nueva partícula de masa en reposo M0 . Entonces, el c-momentun
94
CAPÍTULO 5. DINÁMICA RELATIVISTA
total del sistema está dado por:
p̄ = p1 + p2
(5.52)
Elevando al cuadrado esta expresión y teniendo en cuenta la ecuación
(5.29) y la definición (5.48), tenemos
m201 c2 + m202 c2 + 2m01 m2 c2 = p̄2 = m2CM c2
(5.53)
De esta relación se obtiene que la energía de la partícula incidente, en el
sistema de referencia del laboratorio, será mínima cuando mCM sea mínima,
lo cual ocurre cuando todas las partículas emergentes estén en reposo en el
sistema de referencia centro de masa. Puesto que en este caso la masa del
sistema centro de masa coincide con la suma de las masas en reposo de las
partículas que salen, el límite de mínima energía (5.53) se reduce a
m201 + m202 + 2m01 m02 γ(v) = (m01 + m02 + M0 )2
(5.54)
siendo v la velocidad de incidencia de la partícula 2. Dadas las masas de las
partículas iniciales y la masa de la nueva partícula, podemos obtener de esta
ecuación la velocidad de la partícula incidente y así la energía umbral. Para
el ejemplo de los dos electrones, que al colisionar crean una nueva partícula
de masa en reposo M0 , podemos despejar de la ecuación (5.54) el factor
γ(v):
2M0 M02
γ(v) = 1 +
+ 2
(5.55)
m0
m0
y por lo tanto la energía umbral está dada por
EU = m0 γ(v)c2 = m0 c2 + 2M0 c2 +
M02 2
c
m0
(5.56)
Esta ecuación es fundamental cuando se diseñan experimentos para buscar nuevas partículas. Como ejemplo, tomemos el caso del último de los
quarks buscado por los físicos de altas energías, el quark top τ , el cual fue
detectado en el año de 1995 en el Fermilab (Estados Unidos). Es importante
anotar que el cálculo que vamos a mostrar, es tan solo un estimado de la
mínima energía a partir de la cual podría detectarse el quark, pues en la
reacción donde aparece el quark, también pueden aparecer otras partículas
y por lo tanto, para un cálculo más exacto se debe tener en cuenta estos
efectos adicionales. El quark top se espera que aparezca en una colisión
protón-antiproón (p − p̄) y supongamos para simplificar, que después de la
colisión permanece el par (p − p̄) y el quark τ . Las predicciones teóricas de
5.5. ENERGÍA UMBRAL
95
la existencia del quark τ , así como su posible masa, dependen del modelo
teórico utilizado, pues por ejemplo, tomando los modelos más aceptados en
julio de 1994 (tomados del Particle Physics Booklet, July 1994, American
Institute of Physics) la masa predicha para el quark oscilaba entre 62Gev/c2 ,
pasando por 131Gev/c2 y 174Gev/c2 , hasta el valor más alto de 169Gev/c2 ,
calculado a partir del modelo estandar electro-débil. Tomando para la masa
del protón m0 = 0,94Gev/c2 , que es la misma masa del antiprotón, obtenemos de la ecuación (5.56) la energía umbral en el sistema laboratorio para
la creación del quark top
(5.57)
EU = 32557Gev
asumiendo una masa para el quark top de 174Gev/c2 . Es importante anotar
que esta energía umbral calculada, corresponde a la energía con la que deben
incidir, por ejemplo los protones sobre los antiprotones estacionarios, para
que esta reacción pueda ocurrir. En la práctica, las energías alcanzadas hasta
el presente en los grandes aceleradores están en el orden de los cientos de
Gev. Sin embargo, en la mayoría de los aceleradores los experimentos se
realizan en el sistema centro de masa directamente, pues tanto los protones
como los antiprotones (o electrones) son acelerados a las mismas energías
en un anillo, viajando en direcciones opuestas y por lo tanto la energía a
la cual ellos son acelerados debe ser del orden de la energía umbral en el
sistema centro de masa, que para nuestro caso corresponde a energías del
orden de la masa en reposo de la partícula que se quiere encontrar, estos es
a energías del orden de los 200Gev. Para ilustrar esta situación, calculemos
la energía disponible en un experimento de dispersión de protones contra
protones (o antiprotones) en dos casos: En el primer caso, los protones son
acelerados hasta alcanzar una energía de 100GeV y chocan contra un blanco
de protones en reposo (por ejemplo un gas de hidrógeno a baja temperatura,
para el cual podemos despreciar la energía cinética típica de las partículas
del gas). En un segundo experimento, los protones son acelerados a energías
del orden de 50GeV , se divide el rayo en dos partes y se hacen chocar los dos
haces de protones frontalmente. Sean p y q los c-momentos iniciales de los
protones y sea ECM la energía del sistema en el centro de masa. De acuerdo
a las ecuaciones (5.47) y (5.48) la cantidad
2
(p + q)2 = m2CM c2 = ECM
/c2
(5.58)
es un invariante, la cual puede ser evaluada en cualquier sistema de referencia. Para el primer caso, protones chocando con un blanco estacionario
p = (E1 /c, p1 ) y q = (mp0 c, 0), tenemos
2
= 2m2p0 c4 + 2E1 mp0 c2 ' 2E1 mp0 c2
ECM
(5.59)
96
CAPÍTULO 5. DINÁMICA RELATIVISTA
pues, mp0 c2 ¿ E. Con E1 = 100GeV y mp0 c2 = 0,94GeV , la energía
disponible es del orden de 13,7GeV .
Para el segundo experimento, p = (E2 /c, p2 ) y q = (E2 /c, −p ), por lo
tanto, la energía disponible está dada por:
2
= 4E22 =⇒ ECM = 100GeV
ECM
(5.60)
Para alcanzar esta energía en el experimento de blanco estacionario, sería
necesario acelerar los protones hasta una energía del orden de
E1 '
5.6.
2
ECM
' 5319GeV
2mp0 c2
(5.61)
Fotones y partículas de masa en reposo cero
En esta sección vamos a introducir el concepto de partícula de masa en
reposo cero, y en particular el concepto de fotón, como la partícula portadora de la interacción electromagnética. El concepto de fotón o quantum
de energía está estrechamente relacionado con la teoría cuántica, pero como
veremos enseguida su origen es estrictamente relativista. No está dentro de
los objetivos de este libro discutir la formulación de la teoría cuántica de
campos, pues no es necesario tener un conocimiento en física cuántica, para
entender los ejemplos y procesos que vamos a desarrollar a lo largo del presente capítulo. Sin embargo, haremos un breve recuento de los principales
hechos históricos que contribuyeron al desarrollo del concepto de fotón.
En la segunda mitad del siglo XIX, cuando la teoría de Maxwell se consolida con los experimentos de Herz sobre ondas electromagnéticas, se plantean
varios problemas en diferentes áreas de la física, que finalmente conducen
al desarrollo de la mecánica cuántica. En el campo de la espectroscopia se
tenía el problema de explicar la estructura y en particular, el espectro de
emisión y absorción de radiación electromagnética por átomos. En el experimento de Herz sobre las ondas electromagnéticas, se reporta un fenómeno
curioso que luego, en experimentos más detallados conducen al descubrimiento del efecto fotoelectrico, esto es, la producción de una corriente eléctrica
(fotocorriente) en un material, debido a la incidencia de radiación electromagnética. El problema surge, cuando todos los intentos teóricos basados
sobre la electrodinámica de Maxwell, fallan para explicar las características
de este efecto. Hacia finales del siglo XIX, Max Planck trabajando sobre
el espectro de radiación de cuerpo negro, introduce la hipótesis de la emision y absorción discreta de energía de los osciladores del cuerpo negro, el
5.6. FOTONES Y PARTÍCULAS DE MASA EN REPOSO CERO
97
cual se puede modelar por una cavidad cerrada, en la cual se encuentra radiación electromanética en equilibrio térmico a una temperatura T dada.
Esta radiación a su vez, está en equilibrio termodinámico con el material
que conforma la cavidad que está emitiendo y absorviendo continuamente
radiación electromagnética. Contrario a la situación clásica, para la cual se
espera que un oscilador pueda absorber o emitir energía en cualquier cantidad, Planck postuló que cada oscilador podía enmitir o absorber energía
únicamente en valores discretos, múltiplos de una cantidad fundamental
E = hν
(5.62)
en donde ν es la frecuencia de la radiación electromagnética emitida o
absorvida y h se conoce como la constante de Planck, cuyo valor actual
6,626075(40) × 1034 J · s. Seis años después en 1905, Einstein extiende esta
hipótesis y postula que la radiación electromagnética energía está cuantizada y no solamente los osciladores materiales que emiten y absorven la
radiación. Así una onda electromagnética de frecuencia ν transporta su energía en paquetes o quantos de energía, llamados fotones, de valor hν. Con
esta hipótesis, Einstein explica el efecto fotoeléctrico y predice además que
de acuerdo a la equivalencia masa-energía, los fotones deben transferir momentun al igual que cualquier otra partícula. La diferencia con las partículas
usuales, tales como el electrón o el protón, está en su masa en reposo, como
veremos enseguida.
Partiendo de la definición de las componentes del c-momentun (ver ecuación (5.4))
(5.63)
pα = (E/c, p)
y de sus propiedades, ecuación (5.24) o equivalentemente ecuación (5.28),
se tiene la relación, entre la energía total de la partícula E, su energía en
reposo E0 y su momentun p:
E 2 = E02 + |p|2 c2
(5.64)
Esta relación nos permite considerar el caso de una partícula de energía
en reposo nula, i.e., E0 = 0. Esto implica por una parte, que su masa en
reposo es cero m0 = 0 y además, que la norma del c-momentun de esta
partícula es un c-vector como de luz, pues su norma se anula
p2 = E 2 /c2 − |p|2 = 0
(5.65)
Estas partículas se llaman partículas de masa en reposo nula y su principal característica es que sus líneas de universo siempre están sobre el cono
98
CAPÍTULO 5. DINÁMICA RELATIVISTA
de luz y por lo tanto no existe ningún observador inercial para el cual estas
partículas estén en reposo. La ecuación (5.65) nos da la relación entre el
momentun físico y la energía total de las partículas de masa en reposo nula.
El fotón, que es la partícula asociada al campo electromagnético, es un caso
particular de partícula de masa en reposo nula.
Consideremos ahora el c-vector de onda
k = (ω/c, k)
(5.66)
definido en el capítulo anterior (sección (4.4)), que nos representa una onda
electromagnética plana de frecuencia ω y número de onda k y postulemos,
de acuerdo a Einstein, que esta onda transporta su energía y momentun en
quantos o fotones, cuyo c-vector momentun está dado por:
p := ~k = (~ω/c, ~k)
(5.67)
en donde se ha introducido la constante ~, relacionada con la constante de
Planck por ~ = h/2π. De esta relación se sigue que el fotón transporta una
energía total
E = ~ω = hν
(5.68)
pues ω = 2πν, de acuerdo al postulado original de Einstein y un momentun
físico
p = ~k
(5.69)
que de acuerdo a las propiedades del c-vector de onda (ecuación (4.57)),
la energía (ecuación (5.68)) y el momentun físico (ecuación (5.69)), deben
cumplir la relación
(5.70)
~2 k 2 = E 2 /c2 − |p|2 = 0
la cual nos define una partícula de masa en reposo nula, teniendo en cuenta
la ecuación (5.65). Las partículas de masa en reposo cero pueden tener también otras características que las diferencian entre si, tales como la carga,
momento magnético, etc.. A parte del fotón, en la naturaleza se encuentran
otras partículas de masa en reposo cero, como por ejemplo los neutrinos.
Es importante anotar que la física busca permanentemente nuevos experimentos para determinar si estos neutrinos son realmente partículas de masa
en reposo cero, o si estos poseen una masa en reposo. Hasta el presente se
ha determinado que la masa es reposo de estos neutrinos, si la tienen, es
inferior a 17kev/c2 , que al compararla con la masa del electrón (la partícula
estable de menor masa en reposo conocida) m0 = 0,51M ev/c2 , es realmente
muy pequeña. De hecho para el fotón también se han realizado experimentos
5.6. FOTONES Y PARTÍCULAS DE MASA EN REPOSO CERO
99
para imponerle cotas superiores a su masa en reposo. Como ya se ha dicho
en la introducción de esta sección, el caracter dual que presentan las ondas
electromagnéticas, esto es, para cierto tipo de fenómenos, como el efecto
fotoelectrico o el efecto Compton (que discutiremos más adelante), para los
cuales la luz interacciona como partículas, contrasta con otros fenómenos
típicos del caracter ondulatorio de la luz, como los efectos de interferencia
o difracción. Esta dualidad es una característica general de toda la materia
cuyo estudio le corresponde a la mecánica cuántica. Esta dualidad es tal
vez, uno de los aspectos más interesantes que presenta la naturaleza y su
interpretación ha sido objeto de muchos trabajos. La teoría de la relatividad no pretende conciliar estas ideas y de hecho, este comportamiento dual
aparentemente contradictorio, no se presenta como un problema en el contexto de la teoría de la relatividad, pues tanto las ondas electromagnéticas,
como las partículas de masa en reposo cero (y en particular los fotones) son
conceptos relativistas y su relación física se establece solo a través del postulado de cuantización de la energía de Planck, el cual en ningún momento
entra en contradicción con los principios básicos de la relatividad.
Para finalizar esta sección, retomaremos algunos resultados generales
de la dinámica relativista, que siguen siendo válidos si alguna o todas las
partículas que intervienen en el proceso son de masa en reposo nula, como
por ejemplo la emisión de un fotón por un átomo.
En primer lugar consideremos el caso de dos partículas de c-momentun
p1 y p2 , para el cual el producto interno Minkowskiano está dado por la
relación invariante ecuación (5.29). Si una de las partículas es un fotón, e.g.,
la partícula 2, entonces m02 = 0 y podemos escribir esta relación en la forma:
p1 · p2 = cm01 E2
(5.71)
en donde p1 = (m1 c, p1 ) y p2 = (E2 /c, p2 ), con E2 la energía del fotón
en el sistema de referencia propio de la partícula 1. En el caso en que
las dos partículas sean fotones, la relación (5.29) se vuelve indeterminada. Para encontrar la relación correcta, supongamos que p1 = (E1 /c, p1 ) y
p2 = (E2 /c, p2 ). Como p1 y p2 son c-vcectores nulos, se debe cumplir que
|pi | = Ei /c, para i = 1, 2, entonces de la definición de producto interno
Minkowskiano se tiene:
p1 · p2 = E1 E2 /c2 − p1 · p2 =
E1 E2
(1 − cos θ)
c2
(5.72)
en donde θ es el ángulo formado por los vectores momentun de las partículas, que para el caso de fotones, sería el ángulo entre las direcciones de
propagación de las ondas electromagnéticas o fotones.
100
CAPÍTULO 5. DINÁMICA RELATIVISTA
Otra relación que permanece válida para el caso de partículas de masa
en reposo cero, se refiere al problema de la energía umbral, ecuación (5.53).
Si por ejemplo la partícula que choca es un fotón, entonces m2 = ~ω/c2 ,
m02 = 0 y por lo tanto
(5.73)
mCM = m01
Capítulo 6
Aplicaciones de la dinámica
relativista
6.1.
Introducción
En este capítulo daremos algunos ejemplos de procesos dinámicos, los
cuales ilustran los fenómenos y aplicaciones más importantes de la teoría
especial de la relatividad y más específicamente, de los postulados de conservación de la energía y el momentun. Restringiremos nuestra discusión a
procesos de colisión entre partículas puntuales, i.e., consideraremos únicamente interacciones de contacto, sin entrar en los detalles de las interacciones (fuerzas) que rigen estos procesos. Como se mencionó al comienzo del
capítulo anterior, de las cuatro interacciones fundamentales que determinan
la dinámica de todos los procesos conocidos, solamente la interacción electromagnética admite una descripción clásica relativista. Dejaremos para el
capítulo sobre electrodinámica, el problema de formular las ecuaciones de
movimiento de partículas cargadas en campos electromagnéticos.
6.2.
Colisiones elásticas
El ejemplo más importante de una colisión elástica, tanto por su importancia histórica como por sus aplicaciones prácticas, lo constituye el proceso
de dispersión Compton. Este proceso, llamado energía efecto Compton, jugó
un papel fundamental en el desarrollo de la mecánica cuántica, pues éste
ofreció una de las primeras pruebas directas del carácter corpuscular de la
luz y de paso también, una prueba más de la dinámica relativista. A. H.
Compton recibió el premio nobel en 1927 por el estudio de este efecto (ver,
101
102 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA
Figura 6.1: Efecto Compton
por ejemplo, el artículo original: Compton A.H., 1923, Phys. Rev. 22,409).
6.2.1.
Efecto Compton
La dispersión Compton es el proceso de colisión elástico entre una partícula de masa en reposo cero (e.g., un fotón) contra una partícula masiva (e.g.,
un electrón). El experimento original se realizo haciendo colisionar fotones
de alta energía (como rayos X o rayos gama) contra electrones practicamente
en reposo, es decir, electrones con energías cinéticas mucho menores que las
energías típicas de los fotones.
Tomemos el eje z en la dirección de incidencia del fotón (ver Figura 6.1),
entonces su c-momentun inicial se puede escribir como
pγ = (Eγ /c, pγ )
(6.1)
con Eγ = hν la energía, siendo ν la frecuencia del fotón incidente y pγ =
(0, 0, Eγ /c) su momentun, en donde se ha hecho uso de la relación (5.65). El
c-momentun inicial del electrón en reposo está dado por:
pe = (me0 c, 0)
(6.2)
6.2. COLISIONES ELÁSTICAS
103
Figura 6.2: Lineas de universo del efecto Compton
Sean
p0γ = (Eγ0 /c, p0γ )
y
p0e = (me c, p0e )
(6.3)
los correspondientes c-momentos del fotón y del electrón después de la colisión. Sin pérdida de generalidad, supongamos que el plano en el cual se
realiza la colisión es el x − z y sea θ el ángulo que forma la dirección de
dispersión del fotón con respecto al eje z y ϕ el ángulo respecto al eje z de
dispersión del electrón. Entonces de la conservación del c-momentun total
del sistema, tenemos
(6.4)
pγ + pe = p0γ + p0e
En la Figura 6.2 se muestran las líneas de universo del electrón y el fotón
en el sistema de referencia del laboratorio. La línea de universo del fotón,
dibujada a 45o en un plano paralelo al plano ct − z, intercepta a la línea
de universo del electrón en reposo, evento P. En este punto el electrón es
dispersado, siguiendo una línea de universo dentro del cono de luz del evento
P, mientras que el fotón es dispersado en otra dirección, siguiendo una línea
de universo sobre el cono de luz del evento P.
Puesto que experimentalmente se mide la frecuencia (energía) o longitud de onda del fotón dispersado, en función del ángulo de dispersión y de
la frecuencia o longitud de onda del fotón incidente, despejemos p0e de la
104 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA
ecuación (6.4) y tomando la norma al cuadrado de esta ecuación resultante,
obtenemos:
(6.5)
(pγ + pe − p0γ )2 = (p0e )2
Teniendo en cuenta que
p2γ = p02
γ =0
(6.6)
2 2
p2e = p02
e = me0 c
(6.7)
y
llegamos finalmente a la relación:
pγ · p0γ + pe · (p0γ − pγ ) = 0
(6.8)
Utilizando la ecuación (5.72) para el producto punto entre c-vectores
nulos y de las expresiones (ecuaciones (6.1) a la (6.2)) para los c-momentun
del electrón y los fotones inicial y final, obtenemos
Eγ Eγ0
(1 − cos θ) + me0 (Eγ0 − Eγ ) = 0
(6.9)
c2
Expresando las energías de los fotones en términos de la longitud de onda
asociada, Eγ = hν = hc/λ y Eγ0 = hν 0 = hc/λ0 , obtenemos finalmente, la
expresión estandar para la dispersión Compton, la cual nos da la diferencia
entre las longitudes de onda dispersada e incidente, en función del ángulo
de dispersión θ:
(6.10)
λ0 − λ = λe (1 − cos θ)
A la cantidad λe := h/me0 c se le llama longitud de onda de Compton asociada al electrón. En la (Figura 6.3) se reproducen los resultados originales
de Compton.
En 1950 Cross y Ramsey (Cross W.G. and Ramsey N.F., 1950, Phys.
Rev. 80,929) midieron por primera vez al electrón dispersado simultáneamente con el fotón, en un experimento de coincidencia, obteniendo resultados
en concordancia con la teoría. Para calcular el ángulo de dispersión del
electrón, en función del ángulo de dispersión del fotón y de la energía del
fotón incidente, despejemos la velocidad del electrón de las componentes
espaciales de la ecuación (6.4) y eliminando Eγ0 en esta expresión, con la
ayuda de la ecuación (6.9), obtenemos:
tan ϕ =
me0c c2 sin θ
(Eγ + me0 c2 )(1 − cos θ)
(6.11)
en donde ϕ es el ángulo de dispersión del electrón, medido con respecto a
la dirección de incidencia del fotón. En el experimento de coincidencia de
Cross y Ramsey se midió un ángulo ϕ = 31,3◦ , para una energía del fotón
incidente de 2,6M ev y un ángulo θ = 30,0◦ para el fotón dispersado.
6.2. COLISIONES ELÁSTICAS
105
Figura 6.3: Resultados experimentales de Compton
6.2.2.
Efecto Compton inverso
Como otro ejemplo de colisión elástica, consideremos la dispersión de
un fotón de muy baja energía por una partícula, por ejemplo un protón,
de alta energía. Después de la colisión la partícula masiva le cede parte de
su energía cinética al fotón, el cual se dispersa con una frecuencia mayor
dependiente del ángulo de dispersión. Por esta razón, a este proceso lo llamaremos efecto Compton inverso. El desarrollo matemático es similar al del
efecto Compton tratado en el parágrafo precedente, aun cuando algo más
complejo, pues la partícula está inicialmente en moviento. Para discutir un
fenómeno interesante que se puede presentar con los rayos cósmicos y los
fotones de la radiación cósmica de fondo, vamos a restringir la discución a
un caso particular de este proceso de dispersión.
Supongamos que la energía del fotón inicial Eγ es mucho menor que la
energía total de la partícula incidente Ep = mp c2 , i.e., Eγ ¿ mp c2 y consideraremos solamente el caso de máxima transferencia de energía en el proceso
de colisión, que de acuerdo con la relación (ecuación (6.10)) se obtiene para
el caso de dispersión frontal, es decir θ = 180. Sea pγ = (Eγ /c, pγ ) el cmomentun del fotón y pp = (Ep /c, pp ) el c-momentun del protón antes de
la colisión y sean p0γ = (Eγ0 /c, p0γ ) y p0p = (Ep0 /c, p0p ) los correspondientes
c-momentos después de la colisión. De manera similar al caso tratado para
106 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA
el efecto Compton, despejamos p0p de la ecuación de conservación (6.4) y
elevando al cuadrado, obtenemos
pγ · p0γ + pp · (p0γ − pγ ) = 0
¯ ¯
Teniendo en cuenta que |pγ | = Eγ /c, ¯p0γ ¯ = Eγ0 /c y utilizando la
imación
q
m2p0 c4
|pp | c = Ep2 − m2p0 c4 ≈ Ep − −
2Ep
obtenemos, para la energía del fotón dispersado
¯ ¯
¯ ¯
Eγ (Ep + ¯Pp ¯ c)
Ep
≈
Eγ0 =
2
2Eγ + Ep − |pp | c
1 + mp0 c4 /Eγ E p
(6.12)
aprox(6.13)
(6.14)
El modelo estandar de la cosmología describe la estructura y evolución
del universo actual, postulando su origen a partir de un estado inicial de
altísima densidad y temperatura (en principio infinitas). Una de las predicciones fundamentales del modelo estandar es la existencia de un fondo de
radión cósmica (radiación electromagnética con un espectro de cuerpo negro), el cual se ha ido enfriando debido a la expansión del universo, alcanzando una temperatura actual del orden de 2,73◦ K. Esta radiación cósmica de
fondo se puede modelar como un gas de fotones, con una cierta distribución
de energías. En promedio un fotón típico de este fondo de radiación tiene
una energía media dada por
Eγ = kB T
(6.15)
en donde T es la temperatura absoluta de 2,73◦ K y
kB = 1,380 × 10−23 J · K −1 = 8,617 × 10−5 eV · K −1
(6.16)
es la constante de Boltzmann.
Por otra parte, los rayos cósmicos son haces de partículas elementales
(en su mayoría electrones y protones) de alta energía E ∼ 1020 eV , cuya
fuente, aun cuando no está completamente determinada, parece ser de origen
galáctico. Un protón típico de estos rayos cósmicos, puede entonces dispersar
elásticamente un fotón del fondo de radión cósmica y suministrarle entonces
una energía, que de acuerdo a la relación (5.39), es del orden de
Eγ0 '
1020 eV
1 + (0,938
× 109 )2 /(1020
· 2,37 × 10−4 )
' 2,6 × 1018 eV
(6.17)
Es decir, el fotón dispersado puede adquirir energías típicas de los rayos
gama.
6.3. COLISIONES INELÁSTICAS
6.3.
107
Colisiones inelásticas
Las aplicaciones más importantes de la dinámica relativista se encuentran en los procesos de dispersión inelásticos, tales como la absorción y
emisión de fotones y la creación de nuevas partículas. Cuando colisionan
dos partículas, se pueden producir muchos tipos de efectos que podemos
esquematizar en los siguientes tipos de reacciones:
A+B =C
A+B =A+B+C
A+B =A+C
A+B =C +D+F +···
(6.18)
La primera reacción por ejemplo, representa un proceso en el cual las
partículas que chocan se aniquilan, para dar lugar a una nueva partiícula (por partícula queremos significar tanto las partículas elementales, como
aquellas que presentan estructura interna o están conformadas por otras
partículas elementales, tales como los átomos, moléculas o núcleos). La segunda reacción representa un proceso en el cual las partículas iniciales sobreviven a la colisión, dando lugar a una nueva partícula. En el tercer caso,
una de las partículas que entra en la reacción se aniquila, dando lugar a la
creación de otra y en la última reacción las partículas iniciales desaparencen y surgen varias partículas nuevas. ¿Que leyes físicas determinan cuál o
cuáles reacciones pueden ocurrir?. En primer lugar están las leyes de conservación, las cuales determinan si un proceso dado puede o no suceder.
Tomemos como ejemplo un fotón que choca contra un electrón inicialmente
en reposo y captura al fotón, saliendo el electrón con cierta energía cinética.
Sean p = (me0 c, 0) y q = (Eγ /c, Eγ /cn̂) los c-momentos iniciales del electrón y el fotón respectivamente, con n̂ un vector unitario en la dirección
de movimiento del fotón incidente y sea p0 = (mc, mvn̂) el c-momentun del
electrón depués de la colisión. Al aplicar el postulado de la conservación del
c-momentun, p + q = p0 , obtenemos un resultado inconsistente, pues basta
con elevar al cuadrado esta expresión:
m2e0 c2 + 2me0 Eγ = (p + q)2 = p02 = m2e0 c2
(6.19)
la cual implica que me0 = 0 o Eγ = 0. Esto significa que este proceso es
prohibido, pues viola el principio de conservación del c-momentun. En segundo lugar existen otros principios de conservación los cuales, en general,
dependen de la interacción (fuerte, electromagnética, débil o gravitacional)
que media el proceso de colisión y que de igual manera, a los principios fundamenta de conservación de la energía y momentun, restringen los procesos
108 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA
que puedan ocurrir en una colisión entre partículas. Algunos de estos principios de conservación son de validez general, tal como la conservación de
la carga eléctrica, mientras que otros, como la conservación del número bariónico o la paridad, solamente se cumplen para unas interacciones pero no
para otras. Por ejemplo, la interacción electromagnética conserva la paridad,
pero la interacción bébil no la conserva.
6.3.1.
Absorción de un fotón por un átomo
Antes de entrar en el problema de absorción de un fotón por un átomo, es
importante aclarar la diferencia, desde la óptica de la dinámica relativista,
entre un átomo y una partícula elemental. La partícula elemental está caracterizada por su masa propia y eventualmente por otros números cuánticos
como la carga, el spin, el isospin, etc, y basta que uno de estos parámetros
sea diferente para que se tenga otra partícula elemental diferente. Un átomo,
por otra parte, está caracterizado por su número atómico (i.e., el número
de electrones o protones el cual determina sus propiedades químicas) y su
número de nucleones (protones más neutrones del núcleo) el cual determina
los diferentes isópos de un mismo elemento químico. La masa propia de los
átomos no es estrictamente un parámetro que determine un tipo particular
de átomos, pues dado que los atómos presentan estructura interna, (como
los diferentes niveles de energía) la energía cinética de las partículas que
lo constituyen y la energía potencial de interacción entre ellas contribuyen
también a la masa propia de los átomos. Es de anotar, que si bien la contribución a la masa de los átomos debida a esta energía interna, es muy
pequeña comparada con la suma de las masas de las partículas que lo conforman, si hacen una diferencia fundamental, cuando se trata el problema
dinámico de la emisión y absorción de fotones por átomos, como veremos en
esta sección. Así, un átomo que a emitido o absorbido un fotón, tendrá una
masa propia diferente antes y después del proceso, sin que cambien necesariamente sus propiedades químicas y por lo tanto desde el punto de vista de la
dinámica relativista relativista, estos átomos son partículas diferentes antes
y después de la emisión o absorción de un fotón. Esta misma situación sigue
siendo válida, aún en el caso en que el átomo se ionise (pierda uno o varios
de sus electrones) y también cuando estamos tratando con otras estructuras
como los núcleos atómicos. Por esta razón, una partícula elemental (sin estructura interna) aislada, tal como un electrón, no puede emitir o absorber
un fotón individual, sin violar los principios de conservación fundamentales
como vimos en el ejemplo tratado anteriormente.
Consideremos una partícula no elemental (átomo, molécula, ión o núcleo)
6.3. COLISIONES INELÁSTICAS
109
Figura 6.4: Lineas de universo del átomo y el fotón capturado
con masa en reposo M0 , sobre la cual incide un fotón de frecuencia ν, el
cual es absorbido por la partícula. En la Figura 6.4 se muestra el proceso
de absorción de un fotón por un átomo. La línea de universo del átomo
inicialmente en reposo, intercepta a la línea de universo del fotón, evento
P. El átomo captura al fotón y se dispersa siguiendo una línea de universo
recta, la cual está dentro del cono de luz futuro del evento P.
Sea M00 la masa de la partícula después de la colisión y calculemos,
suponiendo que la partícula inicial está en reposo, la velocidad con que
sale la partícula final. Llamemos p = (M0 c, 0) y q = (Eγ /c, Eγ /cn̂) los cmomentos iniciales de la partícula y el fotón respectivamente, en donde Eγ =
hν y n̂ es un vector unitario en la dirección de propagación del fotón. El cmomentun final del sistema será p0 = (M 0 c, M 0 vn̂), pues por la conservación
del momentun, la dirección de movimiento de la partícula final es la misma
que la del fotón incidente, siendo v su velocidad y
p
M 0 = M00 / 1 − v 2 /c2
(6.20)
De la conservación del c-momentun p + q = p0 podemos despejar directamente, elevando al cuadrado esta expresión, la masa en reposo de la
110 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA
partícula final
M00
= M0
r
2Eγ
M0 c2
1+
(6.21)
Escribiendo explícitamente en componentes la ecuación de conservación
del c-momentun
M0 c2 + Eγ = M 0 c2
(6.22)
Eγ /c = M 0 v
podemos calcular la masa relativista y la velocidad de la partícula final:
M 0 = M0 +
β=
Eγ
c
v
c=
Eγ
M0 c2 +Eγ
(6.23)
(6.24)
Las partículas con estructura interna, como los átomos, moléculas y núcleos, poseen niveles de energía internos Ei con i = 0, 1, 2, ..., (en donde
el nivel E0 se le llama estado base o fundamental del sistema) y por lo
tanto el proceso de absorción de fotones por este tipo de partículas es selectivo, esto es, la partícula solo puede absorber fotones de ciertos valores
de energía que cumplan con la condición que Ej − Ek ' Eγ , estrictamente
Eγ > Ej − Ek , pues parte de la energía del fotón incidente debe gastarse
en la energía cinética final del átomo (lo cual se deduce de las ecuaciones
(6.23) y (6.24)). En un átomo por ejemplo, la diferencia típica entre niveles
de energía está en el rango de los electronvoltios. Puesto que la masa propia
de los átomos oscila entre 1GeV /c2 (para el átomo de hidrógeno) hasta los
cientos de gigaelectronvoltios (para átomos pesados), la fracción Eγ /M0 c2 es
del orden de 10−8 , calculada para el caso de un átomo de hidrógeno, mientras que la diferencia entre niveles de energía es inferior a 13,6eV (valor que
corresponde a la energía de ionización del átomo de hidrógeno).
De la ecuación (6.21) vemos que la masa propia del átomo exitado (que
ha absorbido el fotón) es tan solo una fracción del orden de 10−8 mayor que
la masa del átomo inicial. Por otra parte, la velocidad del átomo exitado
está dada por la ecuación (6.24)), obteniendose
v = 10−8 c
(6.25)
en donde para estos cálculos, hemos asumido un valor típico de 10eV para
la energía Eγ del fotón incidente.
Es de anotar que si incide un fotón sobre un átomo con una energía
mayor a la de ionización, el fotón puede ser capturado por el átomo, o más
6.3. COLISIONES INELÁSTICAS
111
exactamente por un electrón del átomo, el cual se desprende del sistema con
una energía cinética igual al exceso de energía del fotón sobre la energía de
ionización. Este proceso, diferente al que estamos considerando, es la base del
efecto fotoeléctrico el cual, como yá se ha mencionado anteriormente, jugó
un papel fundamental en el desarrollo de la mecánica cuántica. Si llamamos
ϕ la energía de ligadura del electrón al átomo, o a la estructura de átomos
para el caso de un sólido (llamada también función trabajo del material), y
Eγ = hν a la energía del fotón incidente, entonces si este fotón es absorbido
por el sólido, el electrón se puede desprender del material, con una energía
cinética dada por
(6.26)
Ke = hν − ϕ
La energía cinética de los electrones desprendidos, llamados fotoelectrones, se puede medir utilizando un contravoltaje. La ecuación (6.26) presenta dos características importantes probadas experimentalmente, las cuales
no pueden ser explicadas con un modelo ondulatorio de la luz: La primera
característica es la relación líneal entre la frecuencia de la luz incidente, sin
importar cual sea la intensidad de ella (la intensidad de la luz, en el modelo
ondulatorio es proporcional al cuadrado de la amplitud de los campos electromagnéticos, mientras que en el modelo corpuscular de la luz, la intensidad
es proporcional a la densidad de fotones). La segunda característica importante, es la existencia de una frecuencia umbral ν 0 , por debajo de la cual no
hay corriente de fotoelectrones, la cual se obtiene cuando Ke = 0 = hν 0 − ϕ
y que depende del material, pues la función trabajo ϕ es una propiedad del
material, más no de la radiación electromagnética incidente.
6.3.2.
Emisión de un fotón por un átomo exitado
Consideremos ahora el proceso inverso al descrito en la sección anterior.
Supongamos que un átomo exitado de masa propia M0 , inicialmente en
reposo, emite un fotón de frecuencia ν, esto es, de energía Eγ = hν.
En la Figura 6.5 se muestran las líneas de universo del proceso de emisión
de un fotón por un átomo. El átomo exitado, inicialmente en reposo, emite
un fotón: evento P. El fotón emitido sigue una línea de universo que está
sobre el cono de luz futuro del evento P, en tanto que la línea de universo
del átomo dispersado es descrito por la línea recta, interior al cono de luz
del evento P.
De manera similar al caso tratado en la sección anterior, la energía del
fotón emitido no puede ser exactamente igual a la diferencia entre dos niveles
de energía del átomo, de hecho debe ser ahora menor Eγ < Ej − Ek ≡ Eγ0 ,
112 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA
Figura 6.5: Lineas de universo del átomo y el fotón emitido
pues por conservación de momentun el átomo, al emitir el fotón, debe sufrir
un retroceso y por lo tanto parte de la energía suministrada por el átomo
al realizar la transición, debe ser transformada a energía cinética del átomo
final. Es de anotar que esta energía Eγ0 corresponde también a la diferencia
entre las energías en reposo de los átomos inicial y final, i.e.,
Eγ0 = M0 c2 − M00 c2
(6.27)
Una variable de interés en este proceso es la relación entre la energía
del fotón emitido, con respecto a la diferencia entre dos niveles internos de
energía del átomo, o equivalentemente, a la energía de un fotón emitido por
el átomo, si este no sufriera retroceso. Sean p = (M0 c, 0) el c-momentun
del átomo inicial y q = (Eγ /c, Eγ /cn̂) y p0 = (M 0 c, −M 0 vn̂) los c-momentos
finales del fotón y el átomo, en donde n̂ es la dirección de propagación del
fotón y v la velocidad de retroceso del átomo. De la ecuación de conservación
del c-momentun, escrita en la forma p0 = p − q y elevando al cuadrado esta
ecuación, se obtiene la relación:
M002 c2 = M02 c2 − 2M0 Eγ
(6.28)
Remplazando la masa en reposo del átomo final, en términos de Eγ0 , se
6.4. SISTEMAS DE MASA VARIABLE
113
llega finalmente a
Eγ = Eγ0 (1 −
Eγ0
)
2M0 c2
(6.29)
Para ganar una idea de las magnitudes de las variables físicas involucradas, tomemos de nuevo el caso del átomo de hidrógeno y supongamos
que Eγ0 ' 10eV y M0 c2 ' 1GeV , entonces la energía del fotón emitido será
una fracción del orden de 10−12 veces menor, que la frecuencia de un fotón
emitido sin retroceso. Como se discutió anteriormente, el efecto del retroceso
causa una disminución en la frecuencia del fotón emitido con respecto a la
frecuencia de la transición y la fración en la cual cambia esta frecuencia, es
inversamente proporcional a la masa del átomo (ver ecuación (6.29)). Si el
átomo emisor está ligado a una estructura, por ejemplo a una red de átomos
como en un sólido, entonces la masa efectiva que absorbe el momentun de
retroceso será ahora del orden de 1023 veces la masa del átomo emisor y la
energía del fotón emitido, prácticamente coincide con la energía propia de
la correspondiente transición entre niveles de energía del átomo. Este efecto de emisión sin retroceso fue descubierto por Möβbauer, quien recibió el
premio nobel en 1961 y este efecto es actualmente una fuente de muchas
aplicaciones en física atómica, estado sólido y física nuclear.
6.4.
Sistemas de masa variable
Puesto que la masa inercial de una patícula medida por un observador
depende de la velocidad, se puede considerar que todo sistema relativista
es, de hecho, un sistema de masa variable. Sin embargo en relatividad, el
equivalente al caso de la mecánica clásica de un sistema de masa variable,
corresponde a un sistema cuya masa propia sea variable. Un ejemplo de un
sistema de masa propia variable, lo constituye el cohete fotónico, esto es,
un cohete para el cual el sistema de propulsión transforma masa en energía
radiante (fotones).
Retomemos el ejemplo discutido en el capítulo anterior de una nave
espacial que realiza un viaje al centro de nuestra galaxia, con aceleración
propia constante igual a la aceleración de la gravedad g y supongamos que
esta nave dispone de un cohete de propulsión que transforma masa en reposo
en fotones y los radía con un ciento por ciento de eficiencia, directamente
hacia atrás y perfectamente colimados. Calculemos entonces qué fracción de
la masa propia inicial es gastada para realizar el viaje hasta el centro de la
galaxia, suponiendo (como en el ejemplo del capítulo cuarto, sección (4.4.3))
que durante la mitad del viaje acelera y la otra mitad frena, con aceleración
114 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA
propia constante g. Sea M la masa propia del cohete en un instante dado
(la cual es variable) y P = M U su c-momentun, en donde
U = (U 0 , U ) = (U 0 , Ux , 0, 0)
(6.30)
es la c-velocidad del cohete, el cual se mueve a lo largo del eje x y
prad = (Erad /c, prad )
(6.31)
el c-momentun de la radiación. Por conservación de la energía, el cambio en
la energía del cohete es igual al cambio en la energía radiada, entonces
d(M U 0 ) = −dErad /c
(6.32)
Como la energía radiada es en forma de fotones, se debe tener que:
dErad = cdprad
(6.33)
y por conservación del momentun tenemos:
dprad = d(M Ux )
(6.34)
Entonces, de estas relaciones obtenemos la ecuación:
dM U 0 = −d(M Ux )
(6.35)
la cual se puede escribir en la forma:
dM
d(U 0 + Ux )
=−
M
U 0 + Ux
(6.36)
Integrando esta ecuación y teniendo en cuenta las expresiones para U 0 y
Ux (ecuación (4.38)) se llega, finalmente a la expresión para la masa propia
del cohete, en función del tiempo propio τ :
M = M0 e−τ g/c
(6.37)
en donde M0 es la masa propia inicial de la nave. De acuerdo a la ecuación
(4.47), el tiempo propio para que la nave realice la mitad del viaje es de
10,3años y por lo tanto eτ g/c ' 29700, de donde se sigue que la masa propia
de la nave a la mitad del viaje es de M1/2 = M0 /29700 y la masa propia al
final del viaje hasta el centro de la galaxia será
Mf inal = M0 /(29700)2 ' 10−9 M0
(6.38)
Esto significa que la gran mayoria de la masa de la nave (109 ) debe ser
gastada como combustible.
6.5. CREACIÓN Y ANIQUILACIÓN DE PARTÍCULAS
6.5.
115
Creación y aniquilación de partículas
Una de las aplicaciones más importantes de la equivalencia entre la masa
y la energía, es la posibilidad de generar nuevas partículas en procesos de
colisión inelástica, o también a partir del decaimiento (aniquilación) espontáneo de una partícula inestable. Como ya se mencionó en la sección (6.6.3)
sobre colisiones inelásticas, la posibilidad de una determinada reacción, por
ejemplo la creación de un antiprotón a partir de la colisión entre dos protones depende, en primer lugar, de los principios de conservación dinámicos
de energía-momentun y en segundo lugar, que la interación que media el
proceso permita este tipo de reacción. La teoría física fundamental que describe estos procesos se llama teoría cuántica de campos y ella nos permite
predecir, no solo que reacciones son posibles, sino también la probabilidad
con que un determinado proceso puede ocurrir. La probabilidad para que
un cierto proceso ocurra signica lo siguiente: cuando dos partículas colisionan, o una partícula inestable se desintegra, como resultado de esta reacción
pueden surgir diferentes productos, todos permitidos por las diferentes leyes
de conservación y cada uno de ellos con una probabilidad de ocurrencia,
o equivalentemente, con un porcentaje de ocurrencia. Por ejemplo el barión Λ0 puede decaer en 6 formas diferentes, cada una de ellas con diferente
probabilidad:
Λ0 −→ p + π −
Λ0 −→ n + π 0
Λ0 −→ n + γ
0
−
Λ −→ p + π + γ
0
−
0
−
Λ −→ p + e + ν̄ e
Λ −→ p + µ + ν̄ µ
(63,9 ± 0,5) %
(6.39)
(35,8 ± 0,5) %
(6.40)
(1,75 ± 0,15) × 10−3 %
−4
(8,4 ± 1,4) × 10
%
(6.41)
(6.42)
−4
%
(6.43)
−4
%
(6.44)
(8,32 ± 0,14) × 10
(1,57 ± 0,35) × 10
El porcentaje entre paréntesis significa que, de cada 100 eventos de decaimiento del barión Λ0 , por ejemplo, decáe en un protón y en un pión
aproximadamente 64 veces, el cual es el evento más probable, miéntras que
el último proceso, decaimiento en un protón, un muón y un neutrino muónico es el menos probable, con una ocurrencia de un evento por cada 10000,
aproximadamente. La masa del barión Λ0 es de 1115,684M eV y su vida media, esto es el tiempo propio que la partícula permanece desde su creación
hasta que ella decáe, es de 2, 632 × 10−10 s. A su vez esta partícula, el barión
Λ0 , es producido en otra reacción, como por ejemplo
π + + n −→ K + + Λ0
(6.45)
116 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA
Si las masas del pión π + , el neutrón n y el mesón K + son 140M eV /c2 ,
940M eV /c2 y 494M eV /c2 respectivamente, calculemos por ejemplo la energía cinética umbral del mesón π + , para que al chocar con el neutrón en
reposo, se cree el barión Λ0 a un ángulo de 90◦ , medidos con respecto a la
dirección de incidencia del pión. De la conservación del c-momentun, tenemos
(6.46)
pπ + pn = pK + pΛ
Puesto que no estamos interesados en la información para la partícula K + , despejemos su c-momentun de la ecuación anterior y tomemos el
cuadrado de la expresión resultante (con la notación pπ = (Eπ /c, pπ ), mπ0
la masa en reposo del pión y similarmente para las otras partículas):
m2K0 c2 = m2π0 c2 + m2n0 c2 + m2Λ0 c2 + 2pπ · pn − 2pπ · pΛ − pn · pΛ
(6.47)
Puesto que en el sistema de laboratorio pπ = (Eπ /c, pπ ), pn = (mn0 c, 0)
y pΛ = (EΛ /c, pΛ ) y además pπ · pΛ = 0 dado que el ángulo de dispersión
del barión Λ0 es de 90◦ , entonces podemos despejar la energía total Eπ de
esta expresión, para obtener
Eπ =
m2K0 c2 − m2π0 c2 − m2n0 c2 − m2Λ0 c2 + 2mn0 EΛ
2(mn0 − EΛ /c2 )
(6.48)
por lo tanto, para que Eπ séa mínimo se requiere que la energía del barión
Λ0 sea mínima y para esto basta tomar EΛ = mΛ0 c2 , entonces
m2K0 − m2π0 − m2n0 − m2Λ0 + 2mn0 mΛ0 2
c = 1149M eV
2(mn0 − mΛ0 )
(6.49)
y por lo tanto la energía cinética umbral del pión incidente será de
Eπ (umbral) =
Kumbral = 1149M eV − 140M eV = 1009M eV ' 1Gev
(6.50)
Parte III
Electrodinámica relativista
117
Capítulo 7
Tensores
7.1.
Introducción
Uno de los elementos fundamentales de toda teoría física lo constituye el
modelo matemático adecuado para describir las variables físicas y las leyes
que rigen su comportamiento. En el capítulo 3 se definieron los conceptos
de cuadri-vector y de invariante relativista, el primero como una cantidad
con cuatro componentes que bajo una transformación de Lorentz, sus componentes se transforman de acuerdo a una ley definida (ecuación (3.29)) y
el segundo como una cantidad invariante bajo una TL, es decir una cantidad que toma el mismo valor numérico en todos los sistemas de referencia
inerciales, el cual llamaremos en lo sucesivo escalar de Lorentz. Para muchos
de los fenómenos físicos conocidos estos objetos matemáticos, escalares y cvectores, son suficientes para definir las variables que permiten describir los
procesos físicos. Sin embargo, existe toda una serie de variables dinámicas,
tales como por ejemplo el momento de inercia de un sólido rígido, las cuales
requieren para su descripción otros objetos matemáticos llamados tensores.
El objetivo fundamental del presente capítulo es introducir el concepto de
tensor y dar las herramientas fundamentales del álgebra y del cálculo tensorial.
Existen varios caminos posibles para definir el concepto de tensor, por
ejemplo, la aproximación algebráica, la cual es una extensión del álgebra
lineal y de los espacios vectoriales. Otro camino más cercano a sus aplicaciones físicas, es a través de la definición de un tensor por sus propiedades
de transformación bajo un cambio de coordenadas. Este será el camino que
seguiremos en este capítulo.
Es importante anotar en este punto, que las variedades diferenciales con119
120
CAPÍTULO 7. TENSORES
stituyen el marco matemático natural para definir de manera rigurosa y
general el concepto de tensor. Pero no abordaremos aquí esta teoría, pues
está más allá del alcance del presente libro y además para los objetivos
que perseguimos, formular la electrodinámica clásica en forma relativista
explícita, no es necesario desarrollar este formalismo matemático en toda su
extensión. Sin embargo, vale la pena resaltar que los resultados del análisis
tensorial que presentaremos son válidos en el caso general y sirven como
punto de partida para un estudio más riguroso de geometría diferencial,
necesario para abordar el estudio de la Teoría General de la Relatividad
desarrollada por Einstein en 1916.
7.2.
Definiciones fundamentales
En esta sección introduciremos los conceptos fundamentales del cálculo
tensorial. Los objetos matemáticos fundamentales con los cuales trataremos son los escalares, los vectores y los tensores, los cuales son en general
funciones de las coordenadas. Estos objetos serán definidos en términos de
sus propiedades de transformación, cuando cambiamos de sistemas de coordenadas. Aun cuando todas las definiciones que daremos, así como sus
propiedades, son generales, nos restringiremos exclusivamente a transformaciones de Lorentz, pero mantendremos en lo posible una notación general.
Definición 8.1 Sean Σ y Σ0 dos sistemas de referencia inerciales y sean
µ
x = (x0 , x1 , x2 , x3 ) y x0µ = (x00 , x01 , x02 , x03 ) las coordenadas de un evento
físico medidas en Σ y Σ0 respectivamente. Entonces una transformación de
Lorentz de las coordenadas está definida como:
xµ 7−→ x0µ = Λµν xν
(7.1)
tal que el producto punto Minkowskiano queda invariante bajo esta transformación de coordenadas.
Definición8.2 Un escalar de Lorentz es una cantidad (en general una
función de las coordenadas) que es invariante bajo transformaciones de
Lorentz.
Ejemplos de escalares de Lorentz son: la masa propia de una partícula, el
intervalo de tiempo propio entre dos eventos, la norma de todo cuadri-vector,
el producto interno de cuadri-vectores, etc.
Definición 8.3 Un cuadri-vector (c-v) V es una cantidad cuyas componentes, que denotaremos por V µ , µ = 0, 1, 2, 3, medidas por el observador
inercial Σ, se transforman bajo una transformación de Lorentz de las coordenadas (ecuación (7.1)), de la misma manera que las coordenadas, es
7.2. DEFINICIONES FUNDAMENTALES
121
decir:
V 0µ = Λµν V ν
(7.2)
0µ
donde V denota las componentes del cuadri-vector V medidas en el sistema de referencia Σ0 . A las cantidades V µ se le llaman las componentes
contravariantes del cuadri-vector V. Esta denominación de las componentes
contravariantes será justificada más adelante.
Ejemplos de c-v contravariantes son: el c-v posición x, cuyas componentes
son las coordenadas de un evento físico, las diferenciales de coordenadas dxµ ,
la c-velocidad U µ , la c-aceleración Aµ , el c-momentum pµ , la c-fuerza f µ ,
etc.
Las componentes de un c-v V µ y V 0µ relacionadas por una transformación de Lorentz, representan el mismo objeto matemático ”medido” en dos
sistemas de referencia inerciales Σ y Σ0 respectivamente. Asi V es el c-v y
V µ son las componentes de V en el sistema Σ y V 0µ sus componentes en el
sistema Σ0 .
Definición 8.4 Un tensor T de segundo orden dos veces contravariante,
es un conjunto de 16 componentes T µν ; µ, ν = 0, 1, 2, 3 medidas en un sistema
de referencia Σ, tales que bajo una transformación de Lorentz (ecuación
(7.1)) sus componentes se transforman como:
T 0µν = Λµα Λνβ T αβ
(7.3)
donde T 0µν denota las componentes del tensor T en el sistemade referencia
Σ0 .
Definición 8.5 La definición anterior se generaliza al caso de un tensor
T contravariante de orden r, como un objeto de 4r componentes, medidas
en un sistema de referencia Σ, cuyas componentes se transforman bajo una
transformación de Lorentz (7.1) en la forma:
µ
µ
µ
T 0µ1 µ2 ...µr = Λ ν11 Λ ν22 · · · Λ νrr T ν 1 ν 2 ...ν r
(7.4)
Así, podemos definir un tensor de orden cero como un escalar y un tensor
contravariante de orden uno como un c-vector.
En el siguiente capítulo veremos ejemplos de tensores de segundo orden
con significado físico, tales como el tensor campo electromagnético y el tensor energía-momentun. Por ahora trabajaremos con estas cantidades como
objetos matemáticos abstractos, sin asignarles ningún significado. Es de anotar que en física no aparecen cantidades que se describan por tensores de
orden mayor al segundo, salvo en el caso de la Teoría General de la Relatividad, en donde se requiere del tensor de Riemann, el cual es un tensor
122
CAPÍTULO 7. TENSORES
de cuarto orden y cuyo significado está ligado al concepto geométrico de
curvatura de la variedad espacio-tiempo.
7.2.1.
Componentes covariantes
Las transformaciones de Lorentz las definimos como el conjunto de transformaciones de coordenadas, tales que dejen invariante el intervalo espaciotiempo (ver capítulo 4, ecuaciones (3.25) a la (3.30)), es decir, si xµ y
xµ + dxµ , son las coordenadas de dos eventos físicos medidas por un observador inercial Σ, entonces la distancia espacio-tiempo entre estos dos
eventos, definida como:
(7.5)
ds2 = η µν dxµ dxν
es invariante bajo una transformación de coordenadas, es decir:
ds2 = η µν dxµ dxν = ηµν dx0µ dx0ν
(7.6)
en donde la matriz de Minkowski η (llamado también tensor métrico de
Minkowski, por las razones que veremos en seguida) está definido por:

 1; si µ = ν = 0
η µν :=
−1; si µ = ν = 1, 2, 3
(7.7)

0; si µ 6= ν
Así, para que bajo una transformación de Lorentz el escalar de Lorentz
ds2 permanezca invariante, esto es:
ds2 = η µν dx0µ dx0ν = η µν Λµα Λνβ dxα dxβ = η αβ dxα dxβ
(7.8)
se debe cumplir que la matriz de Minkowski satisfaga la relación:
η αβ = Λµα Λνβ η µν
(7.9)
Como el determinante de la matriz de Minkowski es diferente de cero,
i.e., det(η αβ ) = −1, entonces existe la matriz de transformación inversa
(η αβ )−1 , cuyas componentes que denotaremos por η αβ , satisfacen la siguiente relación:
(7.10)
ηη −1 = 1
la cual, escrita en términos de componentes toma la forma:
η αβ η βσ = δ ασ
(7.11)
7.2. DEFINICIONES FUNDAMENTALES
123
en donde δ ασ son los elementos de la matriz identidad.
Los elementos de la matriz inversa de Minkowsky coinciden numéricamente con η αβ , como se puede probar directamente. Además, la matriz de
Minkowski y su inversa son matrices simétricas, i.e. ηαβ = η βα y ηαβ = η βα .
Por otra parte, la inversa de una transformación de Lorentz está dada
por:
(7.12)
xµ = Λν µ x0ν
con
Λνµ = (Λµν )−1 ⇐⇒ Λνε Λνµ = δ µε
(7.13)
Los elementos de la transformación inversa de Lorentz se pueden obtener
a partir de la relación:
(7.14)
Λν µ = η νγ ηµδ Λγδ
pues
Λν
µ ν
Λδ
= ηνγ η µβ Λγβ Λνδ = η δ η µ = δ δµ
(7.15)
en donde se ha hecho uso de la ecuación (7.9). Por ejemplo, si consideramos el caso particular de una transformación de Lorentz entre sistemas de
referencia inerciales Σ y Σ0 , con ejes espaciales paralelos y v la velocidad de
Σ0 en la dirección del eje x positivo, entonces los elementos de la matriz de
transformación de Lorentz están dados por (ver la ecuación (3.40))


γ
−βγ 0 0
 −βγ
γ
0 0 

(7.16)
Λαβ = 
 0
0
1 0 
0
0
0 1
por lo tanto aplicando la relación (7.14), tenemos

γ βγ

βγ γ
Λν µ = η νγ η µδ Λγδ = 
 0
0
0
0
0
0
1
0

0
0 

0 
1
(7.17)
la cual corresponde a la transformación del sistema de referencia Σ0 al Σ,
que equivale como vimos en el capítulo 3, a cambiar la velocidad v por −v.
Definición 8.6 Definamos las “componentes” covariantes de un c-v V
como
(7.18)
Vα := η αβ V β
124
CAPÍTULO 7. TENSORES
Esta definición tiene sentido, pues dado que la matriz de Minkowski
η αβ posee una inversa, la relación entre las componentes contravariantes y
covariantes de un c-v es una relación biyectiva (uno a uno y sobre) y por
lo tanto es un isomorfismo, es decir, dadas las componentes contravariantes
V µ de un c-v, sus componentes covariantes Vν están unívocamente definidas
(ecuación (7.18)) y viceversa; es decir, dadas las componentes covariantes
Vµ , entonces sus correspondientes componentes contravariantes se obtienen
de la transformación inversa, así
V µ = η µν Vν
(7.19)
Este resultado nos permite identificar a las componentes covariantes Vν
y a las contravariantes V µ de un c-v, como representaciones de un mismo
objeto abstracto V.
Podemos generalizar esta operación, que se conoce en el marco del análisis tensorial como subir y bajar índices, al caso de tensores de cualquier
rango. Así por ejemplo, las componentes covariantes de un tensor de segundo orden están relacionadas con sus componentes contravariantes por la
ecuación:
(7.20)
Tµν = η µα ηνβ T αβ
o también, podemos definir las componentes de un tensor de segundo orden
una vez contravariante y una vez covariante, con las siguientes posibilidades:
Tα
β
= η βµ T αµ
;
Tα
β
= η µα T µβ
(7.21)
De esta forma, T αβ , Tµν , T α β , y Tα β son todas diferentes representaciones de un mismo tensor de segundo rango T. Es importante anotar que
el orden de los índices en una ecuación tensorial debe ser preservado, dado
que en general T αβ 6= T βα y por esta razón las componentes mixtas T α β y
Tα
β
del tensor T son diferentes en general.
Para encontrar como se transformanlas componentes covariantes de cualquier
tensor, bajo una transformación de Lorentz, consideremos primero el caso
particular de un c-v:
V 0µ = Λµν V ν
=⇒
Vα0 = η αµ V 0µ = η αµ Λµν V ν
(7.22)
Ahora, de la relación (7.14) multiplicándola por ηβµ a ambos lados y
sumando sobre el índice µ, obtenemos
η βµ Λν
µ
= η βµ η νγ η µδ Λγδ = η νγ δ δβ Λγδ = η νγ Λγβ
(7.23)
7.2. DEFINICIONES FUNDAMENTALES
125
Remplazando esta relación en el último término de la ecuación (7.22),
tenemos
(7.24)
Vα0 = η νµ Λα µ V ν = Λα µ Vµ
Esta ecuación nos da la ley de transformación de las componentes covariantes de un c-v.
De lo visto hasta ahora, es fácil generalizar esta ecuación para obtener la
ley general de transformación de las componentes covariantes y contravariantes de un tensor cualquiera T, r-veces contravariante y s-veces covariante:
0µ µ ...µ
µ
µ
µ
...ν r
2
r
Tγ 1 1γ 2 ...γ
= Λ ν11 Λ ν22 · · · Λ νrr Λγδ11 Λγδ22 · · · Λγδrr Tδν11δν22...δ
s
s
7.2.2.
(7.25)
Algebra tensorial
...ν r
Denotemos por Πrs el conjunto de todos los tensores Tδν11δν22...δ
de orden
s
n = r + s, r-veces contravariante y s-veces covariante. Así, en esta notación
un escalar es un elemento de Π00 , un c-vector contravariante es un elemento
de Π10 y uno covariante de Π01 , etc.
Definición 8.7 Suma de tensores: Dados dos tensores T, S ∈ Πrs definimos la suma y la multiplicación por un escalar λ ∈ R, por:
...ν r
...ν r
...ν r
...ν r
:= (T + S)νδ11δν22...δ
:= Tδν11δν22...δ
+ Sδν11δν22...δ
Qνδ11δν22...δ
s
s
s
s
(7.26)
...ν r
...ν r
...ν r
Pδν11δν22...δ
:= (λT )νδ11δν22...δ
:= λTδν11δν22...δ
s
s
s
(7.27)
Notemos que estas operaciones no son más que la generalización directa
de la suma y el producto por un escalar de vectores cartesianos, en donde el
vector resultante de estas operaciones se obtiene como la suma componente
a componente y por el producto del escalar por cada componente del vector.
Cuando se define una opreación con tensores, hay que demostrar que esta
operación está bien definida, es decir, que la operación preserva el caracter
tensorial. Esto significa que por ejemplo, para las operaciones definidas en las
ecuaciones (7.26) y (7.27), para la suma y multiplicación por un escalar de
...ν r
...ν r
y Pδν11...δ
tensores de un mismo rango, las componentes resultantes Qνδ11...δ
s
s
se
transforman
efectivamente
como
las
componentes
de
un
tensor
del
tipo
¡r¢n
s , es decir:
T, S ∈ Πrs =⇒ Q = T + S ∈ Πrs
y
P =λT ∈ Πrs
(7.28)
126
CAPÍTULO 7. TENSORES
La demostración general de este resultado es muy sencilla y por esta
razón ilustraré el método para el caso particular de un tensor mixto de
segundo rango. Sean T, S ∈ Π11 con componentes para un observador inercial
Σ dadas por T αβ y S αβ respectivamente y sea
Qαβ = T αβ + S αβ
(7.29)
Debemos probar que bajo una transformación de coordenadas, las componentes Qαβ se transforman como un tensor del tipo Π11 . Así, para un sistema
de referencia Σ0 tenemos, aplicando la ley de transformación (7.25) para las
0α
componentes de los tensores T 0α
β y S β,
0α
Q0αβ = T 0α
β +Sβ
= Λαν Λβ
µ
T νµ + Λαν Λβ
= Λαν Λβ
µ
(T νµ + S νµ )
= Λαν Λβ
µ
Qαβ
µ ν
Sµ
(7.30)
lo cual implica que las cantidades Qαβ se transforman como las componentes
de un tensor del tipo Π11 , como se quería probar. Un procedimiento similar
se puede hacer para el producto de un escalar por un tensor.
¡r¢nEste resultado muestra que el conjunto de todos los tensores del tipo
forman un espacio vectorial.
s
Definición 8.8 Producto tensorial: Dados dos tensores T ∈ Πrs y S ∈
Πpq , definimos el producto tensorial como:
ν ν ...ν ν
...ν
ν
ν
...ν
r+1
r+p
ν 1 ν 2 ...ν r
r+1 r+2
r+p
Wδ11δ22...δsrδs+1
...δ s+q := Tδ 1 δ 2 ...δ s Sδ s+1 δ s+2 ...δ s+q
(7.31)
¡r+p¢
r+p
el cual es un tensor de Πr+p
s+q s+q , es decir W ∈ Πs+q .
Esta operación no tiene su correspondiente en el cálculo vectorial ordinario y representa lo que en álgebra matricial se llama un producto directo. Como en el caso anterior, hay que probar que esta operación está bien
definida y para este fin consideremos el caso particular del producto de dos
c-vectores, uno covariante y el otro contravariante. Sea T ∈ Π10 y llamemos sus componentes T µ , y S ∈ Π01 con componentes Sµ . Entonces, de la
definición 8.8 el producto está dado por
W µν = T µ Sν
(7.32)
y debemos probar que las componentes del producto Wνµ se transforman
como:
(7.33)
W 0µν = Λµα Λνβ W αβ
7.2. DEFINICIONES FUNDAMENTALES
127
de acuerdo con la ecuación (7.25). Sean T 0µ y Sν0 las componentes de los
c-vectores T y S medidas en el sistema de referencia Σ0 , entonces en este
sistema de referencia las componentes del producto están dadas por:
W 0µ ν = T 0µ Sν0
(7.34)
Puesto que T y S son c-vectores, sus componentes se transforman de
acuerdo con la relación:
T 0µ = Λµα T α ; Sν0 = Λνβ Sβ
(7.35)
Remplazando estas expresiones en la ecuación (7.34), tenemos
W 0µ ν = T 0µ Sν0 = Λµα T α Λνβ Sβ = Λµα Λνβ T α Sβ = Λµα Λνβ W αβ
(7.36)
como se quería demostrar.
La siguiente operación que vamos a definir es fundamental en el cálculo
tensorial, pues nos permite obtener a partir de un tensor dado de rango
n, un tensor de rango n − 2. Así, si partimos de un tensor de rango par,
por aplicaciones sucesivas de esta operación, podemos obtener un tensor de
rango cero, es decir un escalar de Lorentz o en términos más físicos, un
invariante relativista.
Definición 8.9 Contracción de Indices: Dado un tensor T ∈ Πr1s definimos la contracción del índice contravariante αi (1 ≤ i ≤ r) con el índice
covariante β j (1 ≤ j ≤ s) por:
(α )
...αi ...αr
α1 α2 ...σ...αr
r−1
C(β i) (Tβα1βα2...β
...β ) := Tβ β ...σ...β ∈ Πs−1
j
1 2
j
s
1 2
s
(7.37)
Es decir, dado un tensor mixto de orden n = r + s, r − veces contravariante y s − veces covariante, al sumar sobre dos índices repetidos,
uno contravariante y otro covariante, obtenemos un tensor de orden n − 2,
r − 1 − veces contravariante y s − 1 − veces covariante. Para demostrar que
esta operación está bien definida consideremos, sin pérdida de generalidad,
un tensor de de rango 4, 2 − veces contravariante y 2 − veces covariante
αβ
∈ Π22 y contraigamos por ejemplo, el primer índice contravariante con
Tγδ
el segundo covariante:
(α)
αβ
σβ
C(δ) (Tγδ
) = Tγσ
:= Tγ
β
∈ Π11
(7.38)
Entonces, veamos que las componentes que resultan Tγ β , después de realizada la operación de contracción, se transforman como las componentes de
128
CAPÍTULO 7. TENSORES
un tensor mixto de rango 2. Si denotamos como es costumbre, por cantidades
primadas las componentes de los tensores en el sistema de referencia Σ0 y
aplicamos las correspondientes leyes de transformación de tensores, tenemos
entonces
0λβ
σβ
= Λλσ Λβη Λγµ Λλϑ Tµϑ
Tγ0 β = Tγλ
σβ
ση
= δ ϑσ Λβη Λγµ Tµϑ
= Λβη Λγµ Tµσ
= Λβη Λγµ Tµη
(7.39)
lo cual demuestra que la operación de contracción de índices está bien definida. En la segunda igualdad hemos utilizado la ley de transformación para
0λβ
el tensor Tγλ
, la cual se aplica independientemente del hecho que el tensor
tenga dos índices repetidos sobre los cuales se suma. Para obtener la tercera
igualdad se ha utilizadoel hecho que los elementos de la transformación Λλσ
y Λλϑ , corresponden a la transformación de Lorentz de Σ a Σ0 y a su inversa
respectivamente y por lo tanto satisfacen la relación (7.15). Finalmente, al
sumar sobre el índice repetido ϑ, por la definición de la delta de Kronecker
δ ϑσ , todos los términos son cero, salvo aquel para el cual ϑ = σ, obteniendose
de esta forma la cuarta iguldad.
Antes de continuar con otras operaciones entre tensores, mostremos que
las componentes de la matriz de Minkowski ηαβ , su inversa η αβ y la delta
de Kronecker δ βα son tensores de segundo rango, lo que justifica el nombre
de tensor métrico de Minkowski y además η αβ , η αβ y δ βα corresponden a
diferentes representaciones del mismo objeto matemático, el tensor métrico
η, con la particularidad que las componentes de este tensor métrico toman
los mismos valores numéricos en todos los sistemas de referencia inerciales.
El papel especial de este objeto matemático lo podemos ver, si retornamos
a la definición del intervalo espacio-tiempo entre dos puntos de la variedad
espacio-tiempo:
ds2 = η µν dxµ dxν
(7.40)
El escalar ds2 es obtenido a partir del producto de tres tensores (η µν , dxµ
y dxν ) seguida de una doble contracción sobre índices, y por lo visto hasta
ahora, estas operaciones están bien definidas. También, podemos probar
directamente el carácter tensorial de η, pues dado que ds2 es un invariante,
7.2. DEFINICIONES FUNDAMENTALES
129
entonces
ds2 = η 0µν dx0µ dx0ν
= Λµα Λνβ Λµγ Λνϑ ηαβ dxγ dxϑ
= δ αγ δ βϑ η αβ dxγ dxϑ
= η αβ dxα dxβ
(7.41)
en donde hemos denotado por η 0µν a las componentes del tensor métrico
medidas en el sistema de referencia Σ0 , las cuales están relacionadas con sus
componentes en el sistema Σ por:
η 0µν = Λµα Λνβ η αβ
(7.42)
Un cálculo directo, aplicando las propiedades de las transformaciones de
Lorentz, muestra que las componentes del tensor η en el sistema Σ0 coinciden
con sus componentes en Σ. Un procedimiento similar se puede seguir para
probar que η αβ y δ αβ también se transforman como tensores de segundo rango
(dos veces contravariante y mixto respectivamente) y que sus componentes
son las mismas en todos los sistema de referencia inerciales.
Un caso particular que surge de la combinación de las operaciones, producto tensorial y contracción de índices, es la generalización de la Definición 8.6, llamada subir y bajar índices, pues el producto tensorial del tensor
métrico η de segundo orden (sea de sus componentes contravariantes ηµν ,
covariantes η µν o mixtas δ µν ) con un tensor cualquiera T de orden n, seguida
de una contracción de índices, produce de nuevo un tensor de orden n; por
ejemplo, consideremos un tensor T de cuarto orden del tipo Π22 . Al multiplicar este tensor T por el tensor métrico ηαβ ∈ Π20 , produce un tensor
del tipo Π42 , que al contraer dos índices conduce a otro tensor del tipo Π31 .
Resumiendo tenemos:
σβ
= Tγσβµ
(7.43)
η µν Tγν
Otro caso particular de la combinación de estas dos operaciones tensoriales, producto tensorial seguida de una contracción, es el producto punto
de dos c-vectores, pues
V · V = η µν V µ V ν = η µν Vµ Vµ = δ µν V ν Vµ = V µ Vµ
(7.44)
Por ejemplo, consideremos el c-vector momentun p de una partícula de
masa en reposo m0 , cuyas componentes contravariantes en algún sistema de
referencia inercial Σ, están dadas por pµ = (p0 , p1 , p2 , p3 ) ≡ (E/c, px , py , pz ).
130
CAPÍTULO 7. TENSORES
Entonces podemos calcular sus correspondientes componentes covariantes
en este sistema como
pα = η αβ pβ = (p0 , p1 , p2 , p3 ) = (E/c, −px , −py , −pz )
(7.45)
Aplicando ahora cualquiera de las expresiones dadas en la ecuación
(7.44), obtenemos que su norma al cuadrado está dada por
p2 = p · p = E 2 /c2 − p2x − p2y − p2z = m20 c2
7.2.3.
(7.46)
Propiedades de simetría de tensores
En esta sección definiremos los conceptos de tensores simétricos y antisimétricos e introduciremos la operación tensorial de simetrización (y antisimetrización) de las componentes de un tensor, la cual es de utilidad para
generalizar algunas operaciones del cálculo vectorial usual, como veremos en
la última sección del presente capítulo.
Definición 8.10 Un tensor T de segundo rango del tipo Π20 , con componentes T αβ en un sistema de referencia Σ, se llama simétrico si
T αβ = T βα
(7.47)
T αβ = −T βα
(7.48)
y antisimétrico si
Esta definición es válida también, para las componentes covariantes de un
tensor de segundo rango y puede ser generalizada a cualquier par de índices
de un tensor de rango n ≥ 2. Por ejemplo, para un tensor R de cuarto rango
del tipo Π04 , simétrico en su primera y tercera componente y antisimétrico
en la segunda y cuarta componente, se tiene que
Rαβγδ = Rγβαδ ; Rαβγδ = −Rαδγβ
(7.49)
Es fácil probar, a partir de las propiedades de transformación de las
componentes, que el carácter simétrico o antisimétrico de un tensor es independiente del sistema de referencia, pues si T αβ = T βα en un sistema de
referencia Σ, entonces de las propiedades de transformación (ecuación (7.3))
tenemos
T 0µυ = Λµα Λνβ T αβ = Λµα Λνβ T βα = Λνβ Λµα T βα = T 0νµ
como se quería probar.
(7.50)
7.2. DEFINICIONES FUNDAMENTALES
131
Dado un tensor de segundo rango con componentes T αβ en un sistema de
referencia, siempre se puede escribir este tensor como la suma de un tensor
simétrico más uno antisimétrico, es decir
T αβ = S αβ + Aαβ
(7.51)
con S αβ = S βα y Aαβ = −Aβα . Para demostrar esta afirmación basta con
tomar
1
(7.52)
S αβ := (T αβ + T βα )
2
y
1
Aαβ := (T αβ − T βα )
(7.53)
2
en donde al tensor S αβ se le llama la parte simétrica del tensor T αβ y al
tensor Aαβ su parte antisimétrica. Claramente estas mismas relaciones son
válidas para índices covariantes. De estas ecuaciones ( (7.52) y (7.53)) se
deduce además, que un tensor es simétrico si su parte antisimétrica es cero
y es antisimétrico si su parte simétrica es cero:
1
(7.54)
T αβ = T βα ⇐⇒ Aαβ = (T αβ − T βα ) = 0
2
1
(7.55)
T αβ = −T βα ⇐⇒ S αβ = (T αβ + T βα ) = 0
2
Un ejemplo de un tensor simétrico es el tensor métrico de Minkowski,
pues por su definición ηαβ = η βα .
Las ecuaciones (7.52) y (7.53) nos conducen a la siguiente definición de
dos nuevas operaciones tensoriales:
Definición 8.11 Dado un tensor T de segundo rango del tipo Π20 , con
componentes T αβ en un sistema de referencia Σ, definamos un nuevo tensor
que lo denotaremos como T (αβ) , por la operación
1
T (αβ) := (T αβ + T βα )
2
(7.56)
el cual por definición es simétrico, es decir T (αβ) = T (βα) . A esta operación
se le conoce en la literatura como simetrización de un tensor. Claramente,
si el tensor T αβ es simétrico, entonces el tensor simetrizado coincide con el
tensor original, esto es T (αβ) = T αβ y si el tensor T αβ es antisimétrico, el
tensor simetrizado es cero: T (αβ) = 0.
Similarmente, definimos la operación de antisimetrización de un tensor
dado T αβ , que lo denotaremos como T [αβ] , por:
1
T [αβ] := (T αβ − T βα )
2
(7.57)
132
CAPÍTULO 7. TENSORES
De la misma manera se tiene que si un tensor T αβ es simétrico, entonces
el tensor antisimetrizado es cero y si T αβ es antisimétrico, entonces T [αβ] =
T αβ . Claramente estas operaciones son válidas también para tensores del
tipo Π02 .
Tanto las definiciones de simetría y antisimetría dadas (Definición 8.10),
así como las operaciones de simetrización y antisimetrización (Definición
8.11), se pueden generalizar a tensores de orden mayor. Antes de considerar este problema, se introducirán algunos elementos básicos de la teoría de
permutaciones.
Consideremos el conjunto {1, 2, ..., r} de los r primeros números naturales y denotemos por (n1 , n2 , ..., nr ) un arreglo ordenado de ellos, sin que
ninguno se repita. Existen entonces r! = 1 · 2 · 3 · ... · r formas diferentes
de ordenar en este arreglo los r pimeros números naturales. Por ejemplo, si
tomamos el conjunto {1, 2, 3}, podemos construir 3! = 6 arreglos diferentes:
(1, 2, 3); (1, 3, 2); (2, 1, 3); (2, 3, 1); (3, 1, 2); (3, 2, 1)
(7.58)
Dado un arreglo (n1 , n2 , ..., nr ), definimos una permutación Pσ sobre
este arreglo, como el arreglo obtenido al permutar los elementos del arreglo
original. Denotaremos simbólicamente esta operación de permutación por
Pσ (n1 , n2 , ..., nr ) = (nσ(1) , nσ(2) , ..., nσ(r) )
(7.59)
en donde σ es una función (uno a uno y sobre)
σ : {1, 2, ..., r} −→ {1, 2, ..., r}
ni
7−→ σ(ni ) = nj
(7.60)
Por ejemplo, el arreglo (3, 2, 1) se puede obtener a partir del primer arreglo
(1, 2, 3) permutando los números 1 y 3:
Pσ (1, 2, 3) ≡ Pσ (n1 , n2 , n3 ) = (nσ(1) , nσ(2) , nσ(3) ) = (3, 2, 1)
(7.61)
Definamos ahora una transposición como una permutación
Pni ↔ni+1
(7.62)
obtenida, al permutar dos números consecutivos ni y ni+1 del arreglo original:
Pni ↔ni+1 (n1 , n2 , ..., ni , ni+1 , ..., nr ) = (n1 , n2 , ..., ni+1 , ni , ..., nr )
(7.63)
7.2. DEFINICIONES FUNDAMENTALES
133
Claramente, cualquier arreglo de los números {1, 2, ..., r} se puede obtener
por una permutación Pσ sobre un arreglo dado, incluyendo como caso particular, la permutación identidad que no cambia el arreglo original. Además,
cualquier permutación dada se puede obtener aplicando sucesivamente transposiciones. Es decir, toda permutación se puede descomponer, o factorizar,
como el producto de transposiciones:
Pσ = Pni ↔ni+1 Pnj ↔nj+1 · · · Pnk ↔nk+1
(7.64)
En el ejemplo ilustrado en la ecuación (7.58), se puede obtener el segundo
arreglo (1, 3, 2) a partir del primer arreglo (1, 2, 3), aplicando la transposición
P2↔3 , esto es:
P2↔3 (1, 2, 3) = (1, 3, 2)
(7.65)
pero también es posible obtener este mismo arreglo en otra forma, por aplicación sucesiva de las transposiciones siguientes:
P3↔1 P2↔1 P2↔3 P1↔3 P1↔2 (1, 2, 3) = P3↔1 P2↔1 P2↔3 P1↔3 (2, 1, 3)
= P3↔1 P2↔1 P2↔3 (2, 3, 1)
= P3↔1 P2↔1 (3, 2, 1)
= P3↔1 (3, 2, 1)
= (1, 3, 2)
(7.66)
Este ejemplo muestra que no hay una única forma de obtener una permutación dada por transposiciones sucesivas. Sin embargo, el número definido
por:
½
+1
si Nσ es par
Nσ
(7.67)
=
(−1)
−1
si Nσ es impar
sí es independiente de las transposiciones realizadas para obtener la permutación dada. Este número es llamado el signo de la permutación, siendo
Nσ igual al número de las transposiciones realizadas. Esto significa que si
una permutación dada se factoriza en un número par (impar) de transposiciones, entonces, cualquier otra factorización de la misma permutación, contendrá también un número par (impar) de transposiciones. Una permutación
se llama par(impar) si el signo es +1(−1). Así en nuestro ejemplo anterior, la permutación Pσ (1, 2, 3) = (1, 3, 2) se puede escribir en términos de
transposiciones, como Pσ = P2↔3 , en cuyo caso Nσ = 1 y el signo de la
permutación es (−1)Nσ = −1, o también se puede factorizar en la forma
Pσ = P3↔1 P2↔1 P2↔3 P1↔3 P1↔2 , con Nσ = 5 y por lo tanto el mismo signo
de la permutación (−1)5 = −1.
134
CAPÍTULO 7. TENSORES
Con estos elementos básicos de la teoría de permutaciones, podemos
extender las operaciones anteriores de simetrización y antisimetrización a
tensores de orden superior.
Definición 8.12 Dado un tensor T de rango r del tipo Πr0 , con componentes T α1 ···αr en un sistema de referencia Σ, definamos dos nuevos tensores, uno completamente simétrico en todos sus índices que denotaremos
como T (α1 ···αr ) y el otro completamente antisimétrico en todos sus índices
que denotaremos como T [α1 ···αr ] , por las operaciones
1 X Pσ (α1 ···αr )
T (α1 ···αr ) :=
T
(7.68)
r!
Pσ
T [α1 ···αr ] :=
1X
(−1)Nσ T Pσ (α1 ···αr )
r!
(7.69)
Pσ
en donde la suma se realiza sobre todas las permutaciones de los índices
(α1 , · · ·, αr ). La misma definición vale para índices covariantes.
Por ejemplo, consideremos un tensor Tαβγ del tipo Π03 y construyamos
los tensores T(αβγ) y T[αβγ] por las operaciones definidas en las ecuaciones
(7.64) y (7.69):
T(αβγ) :=
1
(Tαβγ + Tαγβ + Tβαγ + Tβγα + Tγαβ + Tγβα )
3!
(7.70)
1
(Tαβγ − Tαγβ + Tβγα − Tβαγ + Tγαβ − Tγβα )
(7.71)
3!
Es fácil comprobar directamente que el nuevo tensor T(αβγ) es completamente simétrico bajo cualquier permutación de sus índices; por ejemplo
T(031) = T(013) = etc, mientras que el tensor T[αβγ] es completamente antisimétrico bajo permutación de sus índices, pues por ejemplo T[031] = −T[013] ,
pero T[031] = T[310] dado que en el primer caso los índices [013] corresponden
a una permutación par de los índices originales [031], mientras que en el
segundo caso el arreglo de índices [310] es una permutación par del arreglo
original [031]. Notemos que las definiciones dadas para tensores de segundo
rango son un caso particular de la Definición 8.12. Un ejemplo de esta
operación de antisimetrización de tensores, lo constituye la generalización
del producto cruz usual del cálculo vectorial tridimensional.
Sean Aα y B β las componentes de dos c-vectores en un sistema de referencia Σ. Definamos un nuevo vector como el producto tensorial antisimetrizado
de estos dos c-vectores:
T[αβγ] :=
1
C αβ := A[α B β] = {Aα B β − Aβ B α }
2
(7.72)
7.2. DEFINICIONES FUNDAMENTALES
135
Un tensor de segundo rango C αβ en n dimensiones tiene n2 componentes
independientes. En el caso particular de las 4 dimensiones del espacio-tiempo
n2 = 16 componentes independientes. Si el tensor es simétrico entonces
C αβ = C βα y su número de componentes independientes se reduce a:
n2 − n
n(n + 1)
+n=
2
2
(7.73)
Ahora, si el tensor es antisimétrico C αβ = −C βα su número de componentes independientes está dado por:
n(n − 1)
n2 − n
=
2
2
(7.74)
pues en este caso las componentes con índices repetidos son cero. En el caso
de vectores tridimensionales cartesianos n = 3, y por lo tanto el número de
componentes independientes de un tensor antisimétrico de segundo rango
es tres. Así, podemos identificar a las tres componentes independientes que
surgen de la operación definida en la ecuación (7.72), a su vez con las componentes de un nuevo vector, el cual se conoce como el producto cruz del
cálculo vectorial usual. Notemos que esta identificación no es posible para
otras dimensiones del espacio, pues por ejemplo, en cuatro dimensiones el
número de componentes independientes de un tensor antisimétrico de segundo rango es de seis y por lo tanto estas componentes no pueden ser
identificadas con las componentes de nigún c-vector.
Para finalizar esta sección consideraremos un ejemplo especial de un
tensor de cuarto rango completamente antisimétrico, el cual jugará un papel
importante en el capítulo octavo sobre las ecuaciones de Maxwell. Definamos
el tensor εαβγδ , llamado tensor de Levi-Civita, por la ecuación:
εαβγδ

 +1 si αβγδ es permutación par de 0123
:=
−1 si αβγδ es permutación impar de 0123

0 en los demás casos
(7.75)
Este tensor, al igual que el tensor métrico de Minkowski, tiene la particularidad que en todos los sistemas de referencia inerciales sus componentes
tienen el mismo valor numérico. Para probar que εαβγδ es un tensor con esta
característica, se debe mostrar que sus componentes se transforman, bajo
una transformación de Lorentz, en la forma
ε0αβγδ = Λαµ Λβν Λγσ Λδ ρ εµνσρ ≡ εαβγδ
(7.76)
136
CAPÍTULO 7. TENSORES
Para esto, es suficiente notar lo siguiente: si en la ecuación anterior reemplazamos los índices α, β, γ y δ por 0, 1, 2 y 3 respectivamente, entonces la
ecuación (7.76) toma la forma
1 = ε0123 = Λ0 µ Λ1ν Λ2σ Λ3ρ εµνσρ = det |Λ|
(7.77)
De lo visto en el capítulo 3 sobre las propiedades de las transformaciones
de Lorentz, es fácil deducir que toda transformación de Lorentz propia,
es decir que no involucra inversión de los ejes espaciales o inversión de la
coordenada temporal, tiene determinante igual a 1. Así, la ecuación (7.77)
es una identidad y por lo tanto las componentes εαβγδ del tensor de LeviCivita deben transformarse de acuerdo con la ecuación (7.76), como se quería
mostrar.
7.3.
Transformación general de coordenadas
Antes de continuar con la generalización de los operadores vectoriales
usuales del cálculo diferencial (gradiente, divergencia y rotacional), veamos
el caso general de transformaciones de coordenadas que contienen, lógicamente, el caso particular de las transformaciones de Lorentz que hemos
considerado hasta ahora.
Sean Σ y Σ0 dos sistemas de referencia y llamemos xµ y x0ν las coordenadas de un punto medidas en los sistemas de referencia Σ y Σ0 respectivamente. Supongamos, sin pérdida de generalidad, que nuestro espacio es de
cuatro dimensiones. Entonces, un cambio general de coordenadas entre los
sistemas Σ y Σ0 se puede expresar como un conjunto de cuatro ecuaciones,
en donde las nuevas coordenas primadas son funciones continuas, con inversa continua, de las coordenadas no primadas. Así la transformación de
coordenadas y su inversa, se pueden escribir como:
x0µ = x0µ (xα )
(7.78)
xβ = xβ (x0ν )
(7.79)
Notemos que si exigimos que las transformaciones de coordenas sean
lineales, entonces estas ecuaciones se reducen a la forma:
x0µ = Λµ α xα
(7.80)
xβ = Λν β x0ν
(7.81)
7.3. TRANSFORMACIÓN GENERAL DE COORDENADAS
137
con los coeficientes de la transformaciones Λµα (y los de la transformación inversa Λνβ ) constantes, independientes de las coordenadas. Las componentes
del vector desplazamiento infinitesimal dx en el sistema de coordenadas Σ
están dadas por dxµ = (dx0 , dx1 , dx2 , dx3 ), mientras que las correspondientes componentes medidas en Σ0 son dx0ν = (dx00 , dx01 , dx02 , dx03 ). Para
encontrar la relación entre las componentes del vector dx en los dos sistemas, basta con tomar la diferencial total de cada una de las funciones en
las ecuaciones (7.78) y (7.79), así:
dx0µ =
∂x0µ ν
dx
∂xν
(7.82)
∂xµ 0ν
dx
(7.83)
∂x0ν
Estas ecuaciones definen la ley de transformación (y su inversa) para las
componentes de cualquier vector en los dos sistemas de referencia:
dxµ =
V 0µ =
∂x0µ ν
V
∂xν
(7.84)
∂xµ 0ν
V
(7.85)
∂x0ν
En el caso particular de transformaciones lineales (ecuaciones (7.80) y
(7.81)), la ley de transformación para las componentes de un vector toma la
forma:
(7.86)
V 0µ = Λµ ν V ν
Vµ =
V µ = Λνµ V 0ν
(7.87)
la cual se obtiene del caso general si hacemos la siguiente identificación:
Λµ
ν
=
∂x0µ
∂xν
(7.88)
∂xµ
(7.89)
∂x0ν
Finalmente, puesto que las transformaciones de coordenadas deben ser
invertibles se debe cumplir que
Λνµ =
∂x0µ ∂xα
= δ µν
∂xα ∂x0ν
(7.90)
Esta relación se obtiene directamente, si aplicamos la regla de la cadena para
las derivadas a la transformación idéntica x0µ (xα (x0ν )) ≡ x0µ , la cual para
138
CAPÍTULO 7. TENSORES
el caso particular de transformaciones lineales, toma la forma Λµ α Λνα = δ µν .
Así, teniendo en cuenta las ecuaciones (7.88) y (7.89), toda el álgebra y los
conceptos del cálculo tensorial desarrollados en este capítulo, para el caso
particular de transformaciones de Lorentz, son válidos para el caso más general de transformaciones arbitrarias de coordenadas. Las restricciones que
impongamos sobre el conjunto de transformaciones de coordenadas entre
sistemas, nos determinan las propiedades matemáticas (o físicas, según sea
el caso) del espacio sobre el cual estamos trabajando. Por ejemplo, si consideramos que los sistemas de referencia físicamente significativos son los
inerciales y que el principio de la constancia de la velocidad de la luz en
el vacío se cumple, entonces solamente las ecuaciones de transformación de
coordenadas admisibles son aquellas que dejan el intervalo espacio-tiempo
invariante, obteniendo entonces el caso particular de transformaciones de
Lorentz que hemos estado considerando en este capítulo. Otra posibilidad
sería por ejemplo, aceptar el principio de la constancia de la velocidad de
la luz, pero postular que las leyes de la física son válidas en todos los sistemas de referencia, séan inerciales o no. Para este caso más general ya no
estamos restringidos a transformaciones de coordenadas lineales, como en el
caso anterior que corresponde a la relatividad especial, aún cuando se sigue
exigiendo que el intervalo espacio-tiempo permanezca invariante, esto es
0
dx0α dx0β
ds2 = gµν dxµ dxν = gαβ
(7.91)
En este caso, bajo una transformación admisible de coordenadas, las
componentes del tensor métrico (denotado ahora por g) son en general funciones de las coordenadas y por tanto, a diferencia del tensor métrico de
Minkowski, sus componentes varían de un sistema de coordenadas (o de referencia) a otro. Este último ejemplo adquiere todo su significado en la teoría
general de la relatividad, cuyo estudio está más allá del alcance del presente
libro.
7.4.
Operadores vectoriales
En el cálculo vectorial usual sobre R3 se define el operador gradiente
como:
∂ ∂ ∂
(7.92)
∇=( , , )
∂x ∂y ∂z
el cual al actuar sobre una función escalar produce un vector en la dirección del máximo cambio de la función. Por función escalar se entiende, una
7.4. OPERADORES VECTORIALES
139
función de valor real y variable vectorial, es decir una función de la forma
f : R3 7−→ R
(7.93)
tal que, a un vector x = (x, y, z) de R3 le asocia un número real f (x, y, z).
Así, al actuar el operador gradiente ∇ sobre la función f (x, y, z) da como
resultado un vector sobre cada punto de R3 , con sus componentes dadas por
∇f = (
∂f ∂f ∂f
,
,
)
∂x ∂y ∂z
(7.94)
Si consideramos ahora una función vectorial F (x, y, z), es decir una función de valor vectorial y variable vectorial:
F : R3 7−→ R3
(7.95)
con componentes (Fx , Fy , Fz ), entonces podemos hacer actuar el operador
gradiente sobre F en la forma
∇·F =
∂Fz
∂Fx ∂Fy
+
+
∂x
∂y
∂z
(7.96)
para obtener una función real llamada la divergencia. También es posible
obtener un vector a partir del operador gradiente, actuando éste sobre una
función vectorial en la forma:
∇×F =(
∂Fy ∂Fx ∂Fz ∂Fy
∂Fx
∂Fz
−
,
−
,
−
)
∂y
∂z ∂z
∂x ∂x
∂y
(7.97)
conocida como el rotacional de una función vectorial. Notemos que las tres
operaciones definidas a partir del operador ∇, el gradiente, la divergencia y
el rotacional, se pueden considerar como una extención de las operaciones
usuales del álgebra vectorial: el producto de un vector por un escalar, el
producto interno entre vectores y el producto cruz, respectivamente. Por
esta razón es usual considerar para todos los efectos al operador ∇ como un
vector, con el cual podemos construir todo tipo de operaciones permitidas
dentro del cálculo vectorial usual, solamente teniendo presente el orden en
el cual entra ∇ en la expresiones, pues el vector ∇ actua sobre funciones.
Así por ejemplo, podemos construir expresiones tales como
∇2 = ∇ · ∇ =
∂2
∂2
∂2
+
+
∂x2 ∂y 2 ∂z 2
conocida como el operador Laplaciano.
(7.98)
140
CAPÍTULO 7. TENSORES
Definamos entonces el cuadri-vector gradiente ∇ como un operador diferencial, tal que al actuar sobre una función escalar de las coordenadas Φ(xµ ),
produce el c-vector ∇Φ, cuyas componentes en un sistema de referencia Σ
están dadas por:
∂Φ ∂Φ ∂Φ ∂Φ
(7.99)
(∇Φ)µ = ( 0 , 1 , 2 , 3 )
∂x ∂x ∂x ∂x
A las componentes de ∇Φ las denotaremos también como ∂Φ/∂xµ , o ∂µ Φ.
Veamos entonces, que las componentes de ∇Φ se transforman como las
componentes covariantes de un c-vector bajo una transformación de coordenadas. Sean xµ y x0ν las coordenadas de un evento, medidas en los sistemas
de referencia Σ y Σ0 respectivamente y relacionadas por una transformación
de Lorentz, entonces las componentes covariantes de un c-vector V, en los
dos sistemas de referencia, están relacionadas por:
Vµ0 = Λµν Vν ≡
∂xν
Vν
∂x0µ
(7.100)
de acuerdo con las ecuaciones (7.88) y (7.89) de la sección anterior. Bajo
una transformación de coordenadas por definición, una función escalar permanece invariante, es decir Φ(xµ ) = Φ(x0ν ). Teniendo en cuenta que bajo la
transformación de coordenadas se tiene x0µ = x0µ (xν ) y aplicando la regla
de la cadena a la función Φ(x0µ (xν )), obtenemos para las componentes del
operador gradiente, medidas en los dos sistemas de referencia, la relación
∇0 Φ(x0µ ) ≡
∂Φ
∂xα ∂Φ
=
∂x0µ
∂x0µ ∂xα
(7.101)
Puesto que esta relación es general e independiente de la función escalar
Φ, podemos concluir que las componentes del operador gradiente se transforman, bajo un cambio de coordenadas, como las componentes covariantes
de un c-vector, es decir
(7.102)
∂µ0 = Λµν ∂v
A partir de esta definición, podemos construir los operadores de uso más
frecuente en física, siguiendo los mismos procedimientos que en el caso del
cálculo vectorial tridimensional estandar. Consideremos un campo vectorial Ψµ (xα ), esto es, una función vectorial de las coordenadas y calculemos
el producto interno Minkowskiano entre este campo vectorial y el vector
gradiente:
(7.103)
∇ · Ψ = ∂ν Ψν
que corresponde a la generalización del operador divergencia tridimensional.
Un ejemplo de esta operación de uso muy frecuente en física, es la llamada
7.4. OPERADORES VECTORIALES
141
ecuación de continuidad:
∂ν Ψν = 0
⇐⇒
∂ Ψ0
˜ =0
+ ∇Ψ
∂x0
(7.104)
en donde el simbolo ∇ significa el operador gradiente tridimensional. Claramente esta ecuación, por provenir de un producto interno entre c-vectores,
es invariante bajo transformaciones de coordenadas, es decir
∂ν Ψν = 0 = ∂ν0 Ψ0ν
(7.105)
lo que significa que la ecuación de continuidad escrita de esta manera, automáticamente satisface el principio de relatividad. Ahora, si definimos un
nuevo operador (conocido en la literatura como el D’Alembertiano ¤) como
el producto interno del operador gradiente consigo mismo, obtenemos un
operador que es un invariante (un escalar) bajo transformaciones de coordenadas, asi
∂2
− ∇2
(7.106)
¤ = η µν ∂µ ∂ν = ∂ µ ∂µ =
∂x02
la cual nos permite escribir directamente la ecuación de ondas como:
¤Ψ = 0
(7.107)
Es conocido del álgebra vectorial, que el producto cruz entre vectores
es una operación que solo tiene sentido para vectores cartesianos en tres
dimensiones y por lo tanto en la forma usual como ella se define, no es posible
generalizarla a vectores definidos en otras dimensiones espaciales. Realmente
el producto cruz usual es un caso particular de tensores de segundo rango,
como fue discutido al final de la sección 5.2.3.
La operación de antisimetrizar un tensor de segundo rango (ecuación
(7.57)) nos permite generalizar el producto cruz del cálculo verctorial usual
en tres dimensiones, al caso de varias dimensiones, obteniendose no un vector axial como en el caso tridimensional, sino un tensor de segundo rango
antisimétrico. Así por ejemplo, el “rotacional” de una función vectorial Ψα
está dado por:
(7.108)
∂[α Ψβ] = ∂α Ψβ − ∂β Ψα
Si aplicamos esta definición al caso particular de un vector tridimensional usual, con componentes A = (Ax , Ay , Az ) ≡ (A1 , A2 , A3 ) ≡ Ai y
∇ = (∂/∂x, ∂/∂y, ∂/∂z) ≡ ∂j , entonces las siguientes tres componentes
142
CAPÍTULO 7. TENSORES
independientes del tensor ∂[i Aj]
∂[1 A2] =
∂[3 A1] =
∂[2 A3] =
∂Ax ∂Ay
−
∂y
∂x
∂Ax
∂Az
−
∂x
∂z
∂Ay
∂Az
−
∂z
∂y
(7.109)
corresponden a las componentes del rotacional (∇ × A)z , (∇ × A)y y (∇ × A)x
respectivamente, en el cálculo vectorial ususal.
Capítulo 8
Electrodinámica
8.1.
Introducción
En el segundo capítulo sobre los fundamentos de la teoría especial de
la relatividad, vimos como las ecuaciones de Maxwell no permanecían invariantes bajo transformaciones de Galileo, indicando que si se aceptan las
leyes de la electrodinámica, entonces ellas son válidas únicamente en un
sistema de referencia privilegiado y por lo tanto, a través de experimentos
electromagnéticos se podría determinar el movimiento absoluto. Los resultados negativos de estos experimentos planteaban una inconsistencia entre
los principios de la mecánica Newtoniana y las leyes del electromagnetismo,
las cuales condujeron a muchos teóricos de la época, a desarrollar elaboradas teorias que permitieran coexistir, sin aparente contradicción, a estos
dos grandes pilares de la física del siglo XIX.
La relatividad especial, basada sobre los potulados de la constancia de
la velocidad de la luz en el vacío y el principio de relatividad, es una teoría
independiente de los fenómenos eléctricos y mecánicos y por esta razón constituye uno de los pilares fundamentales de la física. En efecto podemos
partir por ejemplo, de la validez de la ley de Coulomb para la fuerza entre
dos partículas cargadas en reposo respecto a algún observador inercial (o
equivalentemente, del campo eléctrico producido por una carga en reposo)
y del carácter invariante de la carga eléctrica y encontrar, utilizando los
principios de la dinámica relativista, la necesidad de introducir un campo
dependiente de la velocidad de la partícula que lo produce, conocido como el
campo magnético. Continuando con este procedimiento, más algunas hipótesis de origen experimental, tales como la conservación de la carga, se pueden
encontrar las leyes de la electrodinámica que rigen el comportamiento de los
143
144
CAPÍTULO 8. ELECTRODINÁMICA
campos electromagnéticos, así como la fuerza sobre las partículas cargadas
en campos electromagnéticos. Este método de trabajo para mostrar el caracter relativista de la electrodinámica ha sido extensivamente utilizado en
la literatura (ver por ejemplo el exelente tratado en el libro de Rosser) y por
esta razón presentaré en este capítulo otro método de trabajo, el cual nos
permite encontrar de manera directa las propiedades de transformación de
los campos electromagnéticos entre sistemas de referencia inerciales.
El objetivo fundamental de este capítulo es entonces, escribir las leyes
de la electrodinámica en forma explícita covariante, es decir, de tal manera
que su invarianza relativista sea manifiesta. Como una consecuencia de esta
formulación de las ecuaciones de Maxwell, obtendremos las ecuaciones de
transformación de los campos eléctricos y magnéticos bajo transformaciones
de Lorentz. Para este fin, haremos uso del formalismo tensorial desarrollado en el capítulo anterior, postulando en primer lugar, que las leyes de la
electrodinámica, constituidas por las ecuaciones de Maxwell, la ecuación de
continuidad para la carga y la ley de la fuerza de Lorentz, son válidas y
luego reescribiremos estas ecuaciones en términos de cantidades tensoriales.
8.2.
Ecuaciones de Maxwell
Las leyes de la electrodinámica están constituidas por dos conjuntos de
ecuaciones. El primer conjunto lo conforman las ecuaciones de Maxwell que
están dadas por (en unidades cgs):
∇ · E = 4πρ
(8.1)
∇·B =0
(8.2)
∇×B =
1 ∂ E 4π
+
J
c ∂t
c
∇×E =−
1 ∂B
c ∂t
(8.3)
(8.4)
las cuales nos determinan los campos eléctrico E y magnético B en términos de sus fuentes (cargas y corrientes), con ρ la densidad volumétrica de
carga y J la densidad de corriente eléctrica. La primera de estas ecuaciones
es conocida como la ley de Gauss y establece que las cargas eléctricas son
fuente del campo eléctrico, mientras que la tercera ecuación, la correspondiente ley de Gauss para el campo magnético, nos dice que no existen fuentes
para el campo magnético, es decir, que en la naturaleza no existen cargas
8.2. ECUACIONES DE MAXWELL
145
magnéticas aisladas, conocidas en la literatura como monopolos magnéticos. La segunda de las ecuaciones de Maxwell contiene dos términos: por
una parte está la ley de Ampere, esto es, que las corrientes eléctricas (representadas en el término 4π J/c) producen campos magnéticos y por otra
parte está el término 1/c∂ E/∂t, introducido por Maxwell, que nos dice que
campos eléctricos variables en el tiempo son también una fuente de campo
magnético. La última de las ecuaciones de Maxwell es la ley de inducción
de Faraday, la cual establece que campos magnéticos variables en el tiempo
inducen campos eléctricos.
El segundo conjunto de ecuaciones que conforman las leyes de la electrodinámica, lo constituyen la ecuación de continuidad y la ley de la fuerza
de Lorentz:
∂ρ
=0
(8.5)
∇·J +
∂t
dp
q
= qE + u × B
dt
c
(8.6)
en donde q es la carga de la partícula y u su velocidad. La primera de
estas ecuaciones, la ecuación de continuidad, establece que la carga eléctrica
es conservada en la naturaleza. Es decir, si en una región del espacio la
densidad de carga eléctrica varía (∂ρ/∂t 6= 0), es porque esta entrando o
saliendo carga de esa región (∇ · J 6= 0). Es de anotar que esta ley de
conservación de la carga está contenida en las ecuaciones de Maxwell y por lo
tanto no constituye una ley independiente de la electrodinámica, pues basta
con tomar la divergencia de la segunda ecuación de Maxwell y teniendo en
cuenta la ley de Gauss (primera ecuación) se llega directamente a la ecuación
de continuidad. Sin embargo, es usual y útil, para claridad en la discusión,
mantener explícitamente esta ecuación de continuidad. Finalmente, la ley
de la fuerza de Lorentz nos da la ecuación de movimiento para una carga
puntual inmersa en un campo electromagnético.
Las ecuaciones de Maxwell muestran como los campos eléctricos y magnéticos son en realidad aspectos diferentes de un solo fenómeno. Sin embargo,
hasta el siglo XVIII los fenómenos eléctricos y los magnéticos, conocidos por
la humanidad desde tiempos remotos, se consideraban como fenómenos completamente independientes entre si, situación que se puede entender ahora, si
consideramos el caso particular de campos electromagnéticos independientes
del tiempo, con sus fuentes de cargas y corrientes estacionarias. Bajo estas
condiciones (campos y densidades de carga y corriente independientes del
tiempo), las ecuaciones de Maxwell (ecuaciones (8.1) a la (8.4)) se pueden
separar en dos conjuntos independientes: El primer conjunto de ecuaciones,
146
CAPÍTULO 8. ELECTRODINÁMICA
dado por:
∇ · E = 4πρ
(8.7)
∇×E =0
(8.8)
describe las leyes de la electrostática. La primera ecuación, la ley de Gauss,
describe que la única fuente del campo eléctrico son las cargas (estacionarias), mientras que la segunda ecuación nos dice que el campo producido por
estas cargas es conservativo. Estas dos ecuaciones son equivalentes a la ley
de Coulomb. El segundo conjunto de ecuaciones
∇×B =
4π
J
c
∇·B =0
(8.9)
(8.10)
constituido por la ley de Ampere (con densidad de corriente estacionaria J,
i.e. ∇ · J = 0) y la ley de Gauss para el campo magnético, describen las leyes
de la magnetostática y muestran que la única fuente del campo magnético
también son las cargas eléctricas, pero ahora en movimiento (corrientes). Si
bien sabemos que el origen de los campos electrostáticos y magnetostáticos
son las cargas, los conjuntos de ecuaciones (8.7), (8.8) y (8.9), (8.10) para los
campos E y B no establecen ninguna relación entre estos campos, es decir, si
bien E y B tienen en últimas las mismas fuentes por origen, son conceptual
y fenomenológicamente diferentes. Veremos en la siguiente sección, como
la relatividad especial nos permite establecer una relación entre el campo
magnético y el eléctrico, aún en el caso particular de campos independientes
del tiempo.
8.3.
Campo magnético como un efecto relativista
Antes de entrar al tema central del presente capítulo, mostraremos en
esta sección la estrecha relación que existe entre los fenómenos eléctricos y
magnéticos (para campos independientes del tiempo) como una aplicación de
los postulados fundamentales de la teoría especial de la relatividad. Veamos
entonces, como surge el concepto de campo magnético como una necesidad
para mantener la invarianza de las leyes físicas, si suponemos que la ley de
Coulomb, la cual nos da la fuerza entre dos partículas cargadas en reposo,
es válida. Coulomb fue el primero en describir cuantitativamente la fuerza
entre partículas cargadas estacionarias a través de la ley de fuerzas:
f12 = k
q1 q2
r̂
r2
(8.11)
8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA
147
en donde q1 y q2 miden las cargas eléctricas de las partículas, r es la distancia
entre en ellas, con r̂ un vector unitario en la dirección del radio vector que
une la carga 1 con la carga 2, y k es una constante de proporcionalidad
que depende del sistema de unidades elegido (k = 1 en el sistema cgs que
usaremos en el presente capítulo). Entonces f12 nos mide la fuerza que la
carga q2 experimenta debido a la carga q1 , siendo esta fuerza atractica o
repulsiva dependiendo del signo de las cargas: repulsiva si las cargas son
del mismo signo y atractiva en caso contrario. Además, esta expresión de la
fuerza satisface por su definición la tercera ley de Newton, esto es f12 = −f21 .
En esta relación (ecuación (8.11)) se ha expresado la fuerza sobre la carga
q2 debido a la carga q1 y en este sentido podemos escribir la ley de Coulomb
en la forma:
(8.12)
f12 = q2 E1 (r)
en donde la cantidad E1 (r), definida como
E1 (r) :=
q1
r̂
r2
(8.13)
es el campo eléctrico producido por la carga q1 en el punto r (hemos elegido
el origen del sistema de coordenadas espaciales en la posición de la carga q1
para simplicar las expresiones). Estas expresiones para la fuerza (ecuación
(8.11)) y el campo eléctrico (ecuación (8.13)) son válidas para un observador inercial Σ, con respecto al cual la carga q1 está en reposo. Es un hecho
experimental, que la fuerza sobre la carga de prueba q2 es independiente
del estado de movimiento de la carga de prueba, lo cual está implícito en
la expresión para la fuerza de Coulomb, pues ella depende solamente de la
posición instantánea de la carga q2 . Además, tanto la fuerza de Coulomb
como el campo eléctrico producido por la carga q1 , son independientes del
tiempo siempre y cuando la carga q1 permanezca en reposo. Experimentalmente determinamos la fuerza f12 sobre la carga de prueba q2 en el sistema
de referencia inercial Σ, midiendo la rata de cambio del momentun p2 de
la carga q2 , es decir midiendo dp2 /dt, así como también las otras variables
cinemáticas y dinámicas que entran en la definición de la fuerza de Coulomb,
tales como la distancia entre la carga q1 y la de prueba, la velocidad (nula
en este caso) de la carga q1 y el momentun p2 de q2 . Si consideramos otro
sistema de referencia inercial Σ0 , el cual se mueve con velocidad v a lo largo
de los ejes x, x0 con respecto a Σ, entonces todas las cantidades cinemáticas
y dinámicas deben transformarce de acuerdo con los principios de la relatividad especial y a partir de estas cantidades podemos determinar la fuerza
sobre la carga de prueba, pero ahora estando las cargas q1 y q2 en moviento.
148
CAPÍTULO 8. ELECTRODINÁMICA
Figura 8.1: Interacción Coulombiana normal al movimiento
Nuestro primer objetivo es determinar la fuerza sobre una carga de prueba q2 , medida por un observador inercial Σ, debida a una carga q1 que se
mueve con velocidad constante. Para simplificar los cálculos y sin pérdida
de generalidad, consideraremos dos situaciones particulares: En la primera,
ilustrada en la Figura 8.1, la carga de prueba q2 se encuentra en reposo
con respecto al sistema Σ y está situada sobre el eje y en las coordenadas
(0, y, 0), mientras que la carga q1 se mueve con velocidad v a lo largo del eje
positivo de las x y pasa por el origen de coordenadas en el instante t = 0.
La segunda situación, mostrada en la Figura 8.2, se diferencia de la anterior solamente en que ahora la carga de prueba, que la denotaremos ahora
por q3 , se situa en reposo respecto al sistema Σ sobre el eje de las x en las
coordenadas (x, 0, 0).
Debido a que la carga q1 se está moviendo, debemos pasarnos a un sistema de referencia inercial Σ0 con respecto al cual esta carga se encuentre
en reposo, con el fin de poder aplicar la ley de Coulomb. Considerados un
sistema de referencia inercial Σ0 , que se mueva con velocidad v a lo largo del
eje positivo x, siendo v la velocidad de la carga q1 respecto a Σ. Entonces,
para todo instante t0 la carga q1 se encuentra en reposo en el origen de coordenadas de Σ0 , mientras que la carga de prueba q2 pasa por el punto de
coordenadas (0, y 0 , 0) en el instante t0 = 0 y la carga q3 pasa por el punto
8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA
149
Figura 8.2: Interacción Coulombiana en la dirección de movimiento
de coordenadas (x0 , 0, 0) en t0 = 0. Bajo estas condiciones, las fuerzas sobre
las cargas q2 y q3 están dadas por la ley de Coulomb (ecuación (8.11)). Entonces, sobre la carga q2 la fuerza en el instante t0 = 0 solo tiene componente
y y está dada por:
q1 q2 0
0
0
= 0; fy12
= 02 ; fz12
=0
(8.14)
fx12
y
mientras que para la carga q3 la fuerza de Coulomb, en t0 = 0, tiene solo
componente x:
q1 q3 0
0
0
= 02 ; fy13
= 0; fz13
=0
(8.15)
fx13
x
Retornemos ahora al sistema de referencia inercial Σ. Para este fin,
recordemos la definición de las componentes del c-vector fuerza (ecuación
(5.19))
1
(8.16)
f α = (f 0 , f 1 , f 2 , f 3 ) = γ(u)( f · u, f )
c
en donde u es la velocidad de la partícula sobre la cual esta actuando la
fuerza física f . Bajo la transformación de Lorentz que estamos considerando, las componentes de la c-fuerza medidas por Σ0 están relacionadas con
las correspondientes componentes de la c-fuerza medidas en Σ, por las relaciones:
(8.17)
f 0 = γ(−v)(f 00 + βf 01 )
150
CAPÍTULO 8. ELECTRODINÁMICA
f 1 = γ(−v)(f 01 + βf 00 )
(8.18)
f 2 = f 02
(8.19)
f 3 = f 03
(8.20)
siendo −v la velocidad de Σ respecto a Σ0 , β = v/c y γ(−v) = γ(v). Teniendo
en cuenta la ecuación (8.16) y recordando la forma como el factor γ(u0 ) se
transforma (ver ecuación (4.13)), las ecuaciones de transformación para las
componentes de la fuerza física f están dadas por:
fx =
fy =
fz =
u01
v 0
f · u0
c2
0
x
1 + vu
c2
fx0 +
f0
³ y
γ(v) 1 +
f0
³ z
γ(v) 1 +
(8.21)
vu0x
c2
´
(8.22)
vu0x
c2
´
(8.23)
Dado que la velocidad u0 de las cargas q2 y q3 , que las denotaremos por
y u02 respectivamente, están dadas por:
u01 = (−v, 0, 0)
(8.24)
u02 = (−v, 0, 0)
(8.25)
con respecto al sistema de referencia Σ0 , tenemos que las componentes de la
fuerza física respecto a Σ son:
0
=0
fx12 = fx12
0
= γ(v)
fy12 = γ(v) fy12
0
fz12 = fz12
=0
para la carga q2 , y
0
fx13 = fx13
=
q1 q3
x02
(8.26)
q1 q2
y02
(8.27)
(8.28)
(8.29)
0
=0
fy13 = fy13
(8.30)
0
=0
fz13 = fz13
(8.31)
8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA
151
para la carga q3 . Puesto que bajo la transformación de Lorentz considerada
y0 = y y x0 = γ(v)x, obtenemos que las componentes no nulas de la fuerza
en Σ, sobre las cargas de prueba q2 y q3 , están dadas por:
q1 q2
y2
(8.32)
1 q1 q3
γ 2 (v) x2
(8.33)
fy12 = γ(v)
fx13 =
respectivamente. A partir de estos resultados, es fácil intuir la forma general
para la fuerza eléctrica en un instante dado sobre una partícula de prueba
q2 en reposo en un punto de coordenadas (x, y, z), debido a una carga q1 que
se desplaza a velocidad constante v a los largo del eje de las x y que pasa
por el origen de coordenadas en ese instante:
f = q1 q2
γ(v)r
+ y 2 + z 2 )3/2
(γ 2 (v)x2
(8.34)
en donde r es el vector posición instantáneo que une la carga q1 con la
carga de prueba q2 . Así, podemos definir el campo eléctrico producido por
una partícula móvil, situada instantáneamente en el origen de coordenadas,
como:
γ(v)r
(8.35)
E = q1 2
2
(γ (v)x + y 2 + z 2 )3/2
Notemos en primer lugar, que el campo eléctrico sigue siendo radial,
aún cuando ya no es esféricamente simétrico como en el caso del campo
eléctrico producido por una carga en reposo, pues de la ecuación anterior se
deduce que el campo eléctrico se intensifica en un factor γ(v) para puntos
del espacio situados en el plano perpendicular a la dirección de movimiento
de la partícula, mientras que se hace un factor 1/γ 2 (v) más pequeño para
puntos situados a lo largo de la dirección de movimiento de la carga q1 .
Consideremos ahora dos cargas q1 y q2 como se muestra en la Figura 8.3,
en donde la carga q1 se mueve con velocidad v a lo largo del eje x positivo
con respecto al sistema de referencia Σ y la carga q2 se mueve con velocidad
u = (ux , uy , uz ) respecto a Σ y supongamos que en el instante t = 0, la carga
q1 pasa por el origen de coordenadas y q2 por el punto (x, y, z) . Similar al
caso anteriormente discutido, sea Σ0 un sistema de referencia inercial que
se desplaza con velocidad v en la dirección positiva de las x respecto a Σ.
Entonces, con respecto al observador Σ0 la carga q1 se encuentran en reposo
en el origen de coordenadas de Σ0 y q2 pasa por el punto de coordenadas
152
CAPÍTULO 8. ELECTRODINÁMICA
Figura 8.3: Interacción entre cargas con movimiento arbitrario
(x0 , y 0 , z 0 ) en el instante t0 = 0, moviendose con una velocidad u0 . De la ley
de Coulomb, las componentes de la fuerza medidas por el observador inercial
Σ0 están dadas por:
q1 q2 x0
0
fx12
= 02
(8.36)
(x + y02 + z 02 )3/2
0
fy12
=
q1 q2 y 0
(x02 + y 02 + z 02 )3/2
(8.37)
0
=
fz12
q1 q2 z 0
(x02 + y02 + z 02 )3/2
(8.38)
las cuales son independientes de la velocidad u0 de la carga de prueba. Aplicando las ecuaciones (8.21), (8.22) y (8.23) para la transformación de las
componentes de la fuerza y teniendo en cuenta la ley de transformación de
velocidades:
ux − v
(8.39)
u0x =
x
1 − vu
c2
u0y =
u0z =
u
¡ y
γ(v) 1 −
u
¡ z
γ(v) 1 −
vux
c2
vux
c2
¢
¢
(8.40)
(8.41)
8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA
153
obtenemos para las componentes de la fuerza sobre la carga de prueba q2 ,
medidas por el observador inercial Σ:
fx12 =
³
vuy
γ(v)q1 q2
vuz ´
x
+
y
+
z
c2
c2
(γ 2 (v)x2 + y 2 + z 2 )3/2
³
vux ´
γ(v)q1 q2 y
1
−
c2
(γ 2 (v)x2 + y2 + z 2 )3/2
³
vux ´
γ(v)q1 q2 z
1
−
= 2
c2
(γ (v)x2 + y 2 + z 2 )3/2
(8.42)
fy12 =
(8.43)
fz12
(8.44)
Sabemos que la fuerza de Coulomb sobre una carga de prueba es independiente del estado de movimiento de dicha carga de prueba. Sin embargo,
comparando la ecuación (8.32) con las ecuaciones (8.42), (8.43) y (8.44)
para la fuerza sobre la carga de prueba q2 , la primera cuando q2 está en
reposo y la segunda cuando está en movimiento, vemos que en el segundo
caso aparecen unos términos extras a la fuerza eléctrica (de Coulomb). Para
ver esto de una manera más directa, notemos que la fuerza sobre la carga
de prueba q2 (ecuaciones (8.42), (8.43) y (8.44)) la podemos escribir en la
forma:
u
(elec)
(mag)
(8.45)
f12 = f12 + f12 ; = q2 E + q2 × B
c
en donde E es el campo eléctrico producido por la carga q1 dado por
(ecuación (8.35)):
q1 γ(v)r
(8.46)
E= 2
(γ (v)x2 + y 2 + z 2 )3/2
siendo u la velocidad de la carga de prueba q2 y definimos el campo magnético B producido por la carga q1 , como:
B
γ(v)q1 r
1
= v× 2
c
(γ (v)x2 + y 2 + z 2 )3/2
1
v×E
=
c
:
(8.47)
siendo v la velocidad de la carga q1 . Teniendo en cuenta que la velocidad de
la carga q1 , en el caso considerado está dada por v = (v, 0, 0), es fácil ver por
un cálculo directo, que la expresión general dada por la ecuación (8.45) se
reduce a la expresión para fuerza, encontrada en las ecuaciones (8.42), (8.43)
y (8.44). En la ecuación (8.45) se dividió explícitamente la fuerza que actua
sobre la carga de prueba en dos términos: El primero corresponde a la fuerza
Coulombiana que actua sobre la carga q2 , la cual es independiente del estado
154
CAPÍTULO 8. ELECTRODINÁMICA
de movimiento de dicha carga de prueba, mientras que el segundo término
sí es dependiente de la velocidad de dicha carga. Además, este segundo
término se anula si cualquiera de las cargas, la carga fuente q1 o la de prueba
q2 están en reposo. Este resultado nos muestra la estrecha relación entre
los fenómenos eléctricos y magnéticos. Es importante tener en mente, que
en todo nuestro análisis hemos trabajo bajo la suposición que las cargas
no están sometidas a aceleraciones, pues para considerar esta situación es
necesario trabajar con las leyes completas de la electrodinámica.
Es posible continuar con este método de trabajo y obtener la ley de BiotSabart y la ley de Ampere para corrientes estacionarias, pero dejaremos estos
temas de lado, para concentrarnos en el objetivo fundamental del presente
capítulo.
En la siguiente sección escribiremos las ecuaciones de Maxwell en forma
explícita relativista y encontraremos las leyes generales de transformación
de los campos electromagnéticos, entre sistemas de referencia inerciales y
mostraremos, cómo los resultados anteriormente obtenidos, corresponden a
casos particulares de estas leyes de transformación.
8.4.
Ecuaciones de Maxwell covariantes
Consideremos en primer lugar la ecuación de continuidad (8.5), la cual
podemos escribir en forma explícitamente covariante, como:
∂µ J µ = 0
(8.48)
teniendo encuenta lo establecido en la última sección del capítulo anterior y
donde el c-vector corriente J ν se ha definido en la forma:
J ν := (J 0 , J 1 , J 2 , J 3 ) = (cρ, J)
(8.49)
La componente temporal J 0 representa la densidad de carga (siendo la
carga un invariante relativista) y las componentes espaciales J i , i = 1, 2, 3
corresponden a las componentes del vector densidad de corriente eléctrica.
Esta definición del c-vector corriente nos da inmediatamente, las ecuaciones
de transformación para las densidades de carga y corriente, medidas por dos
observadores inerciales. En efecto, dados dos sistemas de referencia inerciales
Σ y Σ0 , con J ν = (cρ, J) y J 0ν = (cρ0 , J 0 ) las componentes del c-vector corriente medidas por los dos observadores, entonces J ν y J 0ν están relacionadas
por (ver ecuación (7.2)):
(8.50)
J 0ν = Λµν J ν
8.4. ECUACIONES DE MAXWELL COVARIANTES
155
Para el caso particular de dos sistemas de referencia inerciales, con v la
velocidad del sistema Σ0 respecto a Σ, a lo largo del eje positivo de las x y
ejes espaciales paralelos, tenemos que las ecuaciones de transformación para
las componentes de la densidad de corriente están dadas por:
J 00 = γ(v)(J 0 − βJ 1 )
(8.51)
J 01 = γ(v)(J 1 − βJ 0
(8.52)
2
(8.53)
J 03 = J 3
(8.54)
J
02
=J
en donde hemos utilizado las ecuaciones (2.46)
p para los elementos de la transµ
formación de Lorentz Λ ν , siendo γ(v) = 1/ 1 − β 2 y β = v/c. Remplazando las componentes J 0ν y J ν en términos de las densidades de carga (J 0 = cρ
y J 00 = cρ0 ) y de corriente ( j i = J ≡ (Jx , Jy , Jz ) y j 0i = J 0 ≡ (Jx0 , Jy0 , Jz 0 ))
obtenemos las relaciones:
v
(8.55)
ρ0 = γ(v)(ρ − 2 Jx )
c
Jx0 = γ(v)(Jx − vρ)
(8.56)
Jy0 = Jy
(8.57)
Jz0 = Jz
(8.58)
En las ecuaciones de Maxwell escritas en la forma tradicional (ecuaciones
(8.1) a la (8.4)) los campos eléctricos E y magnéticos B son vectores cartesianos usuales y por lo tanto no corresponden a ninguna cantidad relativista,
es decir a un escalar de Lorentz, o a un c-vector, o a un tensor. Por otra parte,
para describir los campos electromagnéticos producidos por alguna distribución de cargas y corrientes, es necesario conocer seis cantidades independientes, esto es, las tres componentes del campo eléctrico y las tres del campo
magnético. Esta situación nos conduce a postular, que el objeto matemático
(relativista) adecuado para describir al campo electromagnético, es un tensor
de segundo orden antisimétrico, pues por lo discutido en el capítulo anterior (sección 8.2.3), este tensor posee solo seis componentes independientes.
Estos argumentos nos motivan a definir el tensor campo electromagnético
F medido por un observador inercial Σ, como un tensor de segundo rango
antisimétrico cuyas componente contravariantes están definidas por:
F 12 = −F 21 = Bz
F 01 = −F 10 = Ex
F αα = 0
F 23 = −F 32 = Bx
F 02 = −F 20 = Ey
F 31 = −F 13 = By
F 03 = −F 30 = Ez
∀α = 0, 1, 2, 3
(8.59)
156
CAPÍTULO 8. ELECTRODINÁMICA
Con esta definición, podemos escribir las dos primeras ecuaciones de
Maxwell (ecuaciones (8.1) y (8.2)) en la forma:
∂α F αβ = −
4π β
J
c
(8.60)
la cual es una ecuación covariante relativista, pues el lado izquierdo es el
producto del operador gradiente ∂α por el tensor electromagnético F αβ contraido en su primer índice α, para obtener así un c-vector contravariante, el
cual es proporcional al c-vector densidad de corriente. Esto significa que esta
ecuación tiene la misma forma en todos los sistemas de referencia inerciales,
es decir, en un sistema de referencia Σ0 , para el cual F 0αβ y J 0β son las correspondientes componentes del tensor campo electromagnético y densidad
de corriente, las dos primeras ecuaciones de Maxwell tienen la forma:
∂α0 F 0αβ = −
4π 0β
J
c
(8.61)
en donde las componentes de la densidad de corriente J 0β medidas en Σ0 , están relacionadas con las medidas en Σ, por las ecuaciones de transformación
(8.50) ( o las ecuaciones (8.51), (8.52), (8.53) y (8.54) o también las ecuaciones (8.55), (8.56), (8.57) y (8.58) en el caso particular usual). Las componentes del tensor campo electromagnético medidas por los dos observadores
inerciales Σ y Σ0 están relacionadas por las ecuaciones de transformación
(ver el capítulo anterior ecuación (7.3)):
F 0µν = Λµα Λνβ F αβ
(8.62)
Estas relaciones nos dan entonces, las ecuaciones de transformación para
los campos eléctricos y magnéticos medidas por dos observadores inerciales.
Consideremos de nuevo, el caso particular de transformaciones de Lorentz
entre sistemas de referencia con ejes paralelos y velocidad relativa a lo largo
de los ejes xx0 , en donde los elementos de la transformación de Lorentz están
dados por (ecuación (2.47)):
Λ00 = Λ11 = γ
(8.63)
Λ01 = Λ10 = −βγ
(8.64)
Λ22
Λ33
=
=1
p
con β = v/c y γ = 1 − β 2 y los demás elementos cero. Sean
E = (Ex , Ey , Ez )
(8.65)
(8.66)
8.4. ECUACIONES DE MAXWELL COVARIANTES
157
B = (Bx , By , Bz )
(8.67)
E 0 =(Ex0 , Ey0 , Ez0 )
(8.68)
B 0 = (Bx0 , By0 , Bz0 )
(8.69)
las componentes de los campos eléctricos y magnéticos medidas por Σ y Σ´respectivamente. Entonces aplicando las ecuaciones de transformación (8.62),
con los elementos de la transformación de Lorentz dados por las ecuaciones
(8.63), (8.64) y (8.65) y la definición (8.59) de las componentes del tensor
electromagnético, tenemos (para las componentes no nulas de F):
Ex0 = F
0 01
= Λ0α Λ1β F αβ
= Λ00 Λ10 F 00 + Λ00 Λ11 F 01 + Λ00 Λ12 F 02 + Λ00 Λ13 F 03
+Λ01 Λ10 F 10 + Λ01 Λ11 F 11 + Λ01 Λ12 F 12 + Λ01 Λ13 F 13
+Λ02 Λ10 F 20 + Λ02 Λ11 F 21 + Λ02 Λ12 F 22 + Λ02 Λ13 F 23
+Λ03 Λ10 F 30 + Λ03 Λ11 F 31 + Λ03 Λ12 F 32 + Λ03 Λ13 F 33
= Λ00 Λ11 F 01 + Λ01 Λ10 F 10
= γ 2 Ex − β 2 γ 2 Ex
= Ex
(8.70)
Un cálculo similar se puede hacer para las demás componentes, pero por
brevedad, aquí solo presentaremos los téminos no nulos que surgen en la
transformación:
Ey0 = F
0 02
= Λ0α Λ2β F αβ = Λ00 Λ22 F 02 + Λ01 Λ22 F 12
= γ(Ey − βBz )
Ez0 = F
0 03
= Λ0α Λ3β F αβ = Λ00 Λ33 F 03 + Λ01 Λ33 F 13
= γ(Ez + βBy )
Bx0 = F
=
0 23
(8.72)
= Λ2α Λ3β F αβ = Λ22 Λ33 F 23
Bx
By0 = F
(8.71)
0 31
(8.73)
= Λ3α Λ1β F αβ = Λ33 Λ10 F 30 + Λ33 Λ11 F 31
= γ(By + βEz )
(8.74)
158
CAPÍTULO 8. ELECTRODINÁMICA
Bz0 = F
0 12
= Λ1α Λ2β F αβ = Λ10 Λ22 F 02 + Λ11 Λ22 F 12
= γ(Bz − βEy )
(8.75)
Antes de considerar aplicaciones de estas ecuaciones de transformación
de los campos, las cuales serán dadas más adelante, escribamos las otras
ecuaciones de Maxwell en notación tensorial.
Las ecuaciones de Maxwell homogéneas (las dos últimas ecuaciones (8.3)
y (8.4)), con la ayuda del tensor de Levi-Civita introducido en el capítulo
anterior (ecuación (7.75)), las podemos escribir en la forma:
εαβγδ ∂β Fγδ = 0
(8.76)
en donde en esta última ecuación se ha utilizado el tensor de Minkowski
para bajar los índices del tensor electromagnético F, esto es:
Fγδ = η αγ η βδ F αβ
(8.77)
las cuales nos representa las componentes covariantes del tensor campo electromagnético. Para recordar más fácilmente la relación entre las componentes contravariantes del tensor F, definidas en la ecuación (8.59) y su
relación con las componentes covariantes, definidas en la ecuación (8.77), es
útil escribir estas componentes en forma matricial:
 00

F
F 01 F 02 F 03 



 10

F
F 11 F 12 F 13
αβ
(F ) =
F 20 F 21 F 22 F 23 



 30

F
F 31 F 32 F 33


0
E
E
E


x
y
z




−Ex
0
Bz
−By
=
(8.78)
−Ey −Bz
0
Bx 





−Ez
By
−Bx
0
Aplicando, ahora, la ecuación (8.77), tenemos:


F00 F01 F02 F03 





F10 F11 F12 F13
(Fαβ ) =
F
F21 F22 F23 



 20

F30 F31 F32 F33

0 −Ex −Ey −Ez



Ex
0
Bz
−By
=
E
−B
0
Bx

z

 y
Ez
By
−Bx
0







(8.79)
8.4. ECUACIONES DE MAXWELL COVARIANTES
159
Ilustremos como se aplicó la ecuación (8.77) para llegar a la ecuación anterior, calculando explícitamente dos términos, por ejemplo F02 y F21 . Recordando, para simplificar, que los elementos del tensor métrico de Minkowski
se anulan si los índices son diferentes, vemos que de los 16 sumandos que
aparecen por la doble suma en la ecuación (8.77), solo un término es no nulo:
F02 = η α0 η β2 F αβ = η 00 η 22 F 02 = −Ey
(8.80)
F21 = η α2 ηβ1 F αβ = η 22 η 11 F 21 = −Bz
(8.81)
Veamos ahora que efectivamente la ecuación (8.76) reproduce las ecuaciones de Maxwell homogeneas. Notemos en primer lugar que la ecuación
(8.76) contiene cuatro ecuaciones, una para cada α = 0, 1, 2, 3 y cada una
a su vez (debido a la triple suma sobre los índices repetidos β, γ y δ) está
conformada por 64 sumandos. Sin embargo, dado que las componentes del
tensor de Levi-Civita se anulan para cualquier par de índices repetidos, en
cada ecuación sobreviven solo cuatro sumandos. Así, para α = 0 los términos
no nulos son:
0 = ε0123 ∂1 F23 + ε0132 ∂1 F32 + ε0213 ∂2 F13 +
ε0231 ∂2 F31 + ε0312 ∂3 F12 + ε0321 ∂3 F21
∂By
∂Bz
∂Bx
+2
+2
= 2∇ · B
= 2
∂x
∂y
∂z
(8.82)
obteniendo la ecuación de Maxwell para la divergencia del campo magnético. Para la última ecuación de Maxwell, la ley de Faraday, consideremos
explícitamente solo el caso de α = 1, pues el resultado se puede extrapolar
fácilmente a α = 2 y 3. Entonces, para α = 1 los términos no nulos son:
0 = ε1023 ∂0 F23 + ε1032 ∂0 F32 + ε1203 ∂2 F03 +
ε1230 ∂2 F30 + ε1302 ∂3 F02 + ε1320 ∂3 F20
∂Ey
∂Ez
2 Bx
∂Bx
+2
−2
=−
− 2(∇ × E)x
= −2
∂ct
∂y
∂z
c ∂t
(8.83)
en donde hemos utilizado el hecho que x0 = ct, obteniendo así la componente
x de la ley de Faraday.
Finalmente consideremos la ecuación de la Fuerza de Lorentz (segunda
ecuación en (8.6)), la cual podemos escribir en forma covariante como:
fα =
q
q
dxγ
dpα
= ηβγ F βα
= Fγ
dτ
c
dτ
c
γ
α dx
dτ
(8.84)
160
CAPÍTULO 8. ELECTRODINÁMICA
en donde pα es el c-momentun de la partícula de carga q, τ el tiempo propio,
xγ sus coordenadas de posición y Fγ α las componentes mixtas del tensor
campo electromagnético definidas por:
Fγ
α
= η γσ F σα
(8.85)
Desarrollemos explícitamente la ecuación (8.84), para interpretar los términos que de ella surgen, pues si bien afirmamos que esta ecuación es equivalente a la fuerza de Lorentz, notemos que, siendo la fuerza de Lorentz una
ecuación vectorial, contiene tres ecuaciones escalares independientes, mientras que la ecuación (8.84) es cuadri-vectorial y por tanto contiene cuatro
ecuaciones. En primer lugar calculemos, utilizando la ecuación (8.85), las
componentes mixtas F αγ del tensor campo electromagnético:
(Fβ

F


 0
F0
α
) =
F


 0
F0

0



Ex
=
E


 y
Ez
0
1
2
3
F1
F1
F1
F1
Ex
0
−Bz
By
0
1
2
3
F2
F2
F2
F2
Ey
Bz
0
−Bx
0
1
2
3
F
F3
F3
F3
Ez
−By
Bx
0
0
3
1
2
3














(8.86)
Remplazando estas cantidades en la ecuación (8.84), y desarrollandola
explícitamente en componentes, tenemos:
dx1
dx2
dx3
q
f 0 = (Ex
+ Ey
+ Ez
)
c
dτ
dτ
dτ
(8.87)
dx0
dx2
dx3
q
+ Bz
− By
)
f 1 = (Ex
c
dτ
dτ
dτ
(8.88)
dx0
dx1
dx3
q
f 2 = (Ey
− Bz
+ Bx
)
c
dτ
dτ
dτ
(8.89)
dx0
dx1
dx2
q
f 3 = (Ez
+ By
− Bx
)
(8.90)
c
dτ
dτ
dτ
Para interpretar estas ecuaciones, recordemos el significado físico de las
componentes de la cuadri-fuerza dado en el capítulo 5 (ver ecuación (5.19)).
Las componentes de la c-fuerza se pueden escribir en la forma:
1
f α = γ(u)( f · u, f )
c
(8.91)
8.4. ECUACIONES DE MAXWELL COVARIANTES
161
en donde f = dp/dt es la fuerza física sobre la partícula, u su velocidad
y la componente temporal representa el trabajo por unidad de tiempo que
realiza la fuerza física f sobre la partícula. Recordando que
1
dt
= γ(u) := p
dτ
1 − u2 /c2
(8.92)
(ver capítulo 4 ecuación (4.5)), podemos reescribir las ecuaciones (8.87),
(8.88), (8.89) y (8.90), en la forma siguiente:
q
1
f ·u= E·u
c
c
(8.93)
f = q E + qu × B
(8.94)
Notemos que el factor de Lorentz γ(u) se cancela. La componente temporal de la c-fuerza, corresponde al hecho de que solo el campo eléctrico
realiza trabajo sobre las partículas, una situación que está contemplada en
la expresión para la fuerza de Lorentz, puesto que la fuerza debida al campo
magnético es de la forma qu × B y por lo tanto:
q
f · u = (q E + u × B) · u = E · u
c
(8.95)
Resumiendo, las leyes de la electrodinámica (que incluyen las ecuaciones
de Maxwell, la ecuación de continuidad y la fuerza de Lorentz) escritas en
forma relativista covariante son:
∂α F αβ = −4πJ β
(8.96)
εαβγδ ∂β Fγδ = 0
(8.97)
µ
(8.98)
∂µ J = 0
dxγ
q
(8.99)
f α = Fγ α
c
dτ
Veamos ahora, algunas aplicaciones sencillas de estas ecuaciones y de las
propiedades de transformación de los campos. Consideremos en primer lugar
los ejemplos tratados en la sección anterior. Supongamos que una partícula
de carga q1 se mueve con velocidad constante v respecto a un sistema de
referencia inercial Σ, a lo largo del eje positivo de las x y pasa por el origen
en el intante t = 0. Sea Σ0 otro sistema de referencia inercial, el cual se
mueve con velocidad v respecto a Σ en la dirección del eje positivo de las
x. Entonces, la carga q1 se encuentra en reposo en el origen de Σ0 y por lo
162
CAPÍTULO 8. ELECTRODINÁMICA
tanto el campo electromagnético, en un punto de coordenadas (x0 , y 0 , z 0 ) y
en cualquier instante, producido por q1 se reduce a:
q1
(8.100)
E 0 = 03 r0 ; B 0 = 0
r
de acuerdo con la ley de Coulomb, en donde r0 = (x0 , y 0 , z 0 ) y r0 = (x02 +y 02 +
z 02 )1/2 . Para calcular el campo electromagnético medido por el observador
inercial Σ, calculamos primero las componentes del tensor campo electromagnético en Σ0 y luego aplicamos las propiedades de transformación del
0 . De la ecuación (8.100) tenemos (en notación matricial):
tensor Fµν


q1 x0
q1 y0
q1 z 0


0
03
03
03


r
r
r


 q1 x0

−
0
0
0
03
0αβ
r
(8.101)
(F ) =
0

− qr103y
0
0
0 




 q1 z0

0
0
0
− r03
Aplicando las ecuaciones de transformación para las componentes del
tensor F 0µν (ecuación (8.62)), pero teniendo en cuenta que ahora estamos
transformando del sistema Σ0 al Σ:
F µν = Λµα Λνβ F 0αβ
(8.102)
en donde los elementos de la transformación de Lorentz Λµα están dados por
las ecuaciones (8.63), (8.64) y (8.65), cambiando β = v/c por −β, y teniendo
en cuenta que γ(−v) = γ(v).
Consideremos primero los término F 0i , i = 1, 2, 3 que corresponden a las
componentes del campo eléctrico medido en Σ. Entonces, como Λ02 = Λ03 = 0
y Λiβ = 0 para β 6= 0 y β 6= i y teniendo en cuenta que F 0ij = 0, i, j = 1, 2, 3
(no hay campo magnético en Σ0 ), tenemos que los términos no nulos de la
ecuación (8.102) son:
F 0i = Λ0α Λiβ F 0αβ
= Λ00 Λiβ F 00β + Λ01 Λiβ F 01β
= Λ00 Λii F 00i + Λ01 Λi0 F 010
(8.103)
Notemos que en el primer término de la última igualdad no hay suma
sobre el índice i, pues está repetido tres veces. Esto surgió del hecho que
Λij = 0 si i 6= j; i, j = 1, 2, 3. Remplazando explícitamente los diferentes
términos, tenemos que las componentes del campo eléctrico medidas por el
observador Σ están dadas por:
Ex = γ 2 (v)Ex0 − β 2 γ 2 (v)Ex0 = Ex0
(8.104)
8.5. TRANSFORMACIONES GAUGE
163
Ey = γ(v)Ey0
(8.105)
Ez = γ(v)Ez0
(8.106)
Notemos que en el instante t = 0 medido en Σ, la carga está en el origen
y la relación entre las coordenadas del punto donde estamos observando el
campo eléctrico es (x0 , y0 , z 0 ) = (γ(v)x, y, z) en ese instante. Entonces, si expresamos el campo eléctrico medido por Σ en términos de las coordenadas
de Σ, obtenemos el resultado ya encontrado en la sección anterior, ecuación
(8.35). Calculemos ahora las componentes del campo magnético en el sistema de referencia Σ. Procediendo de forma similar, escribamos primero las
componentes no nulas de la ecuación (8.102) que corresponden al campo
magnético, notando que i 6= j; i, j = 1, 2, 3 y no hay suma sobre tres índices
repetidos:
F ij = Λiα Λjβ F 0αβ
= Λi0 Λjj F 00j + Λii Λj0 F 0i0
(8.107)
Remplazando, tenemos que las componentes del campo magnético son:
Bx = F 23 = 0
(8.108)
By = F 31 = −βγ(v)Ez0
(8.109)
Bz = F
12
= βγ(v)Ey0
(8.110)
Este resultado lo podemos escribir en forma condensada como:
1
B = v×E
c
(8.111)
en completo acuerdo con el resultado obtenido en la sección anterior, ecuación
(8.47), teniendo en cuenta las ecuaciones (8.104), (8.105) y (8.106) y que la
velocidad está dada por:
v = (v, 0, 0)
(8.112)
8.5.
Transformaciones Gauge
Hay dos teoremas del cálculo diferencial en varias variables, que nos
permiten escribir las ecuaciones de Maxwell en forma más compacta:
Teorema 9.1: Sea F una función vectoria tal que su rotacional es cero,
i.e., ∇ × F = 0, entonces la función F se puede escribir como el gradiente
de una función escalar Ψ(r), esto es:
F = ∇Ψ(r)
(8.113)
164
CAPÍTULO 8. ELECTRODINÁMICA
Teorema 9.2: Sea F una función vectorial tal que su divergencia es cero,
i.e., ∇ · F = 0 , entonces la función F se puede escribir como el rotacional
de una función vectorial Υ(r), esto es:
F = ∇ × Υ(r)
(8.114)
Apliquemos estos dos resultados del cálculo vectorial a los campos eléctrico
y magnético. La tercera ecuación de Maxwell (8.3) establece que
∇·B =0
(8.115)
entonces podemos escribir el campo magnético como el rotacional de una
función vectorial, es decir:
B =∇×A
(8.116)
en donde la función vectorial A se le llama el potencial vectorial.
Ahora, si reemplazamos el campo magnético en la última de las ecuaciones (8.4) en términos del potencial vectorial A, tenemos:
∇ × (E +
∂A
)=0
∂t
(8.117)
esto significa, de acuerdo con el Teorema 9.2, que la función vectorial
E + ∂ A/∂t la podemos escribir como el gradiente de una función escalar Φ,
es decir
∂A
= −∇Φ
(8.118)
E+
∂t
en donde Φ es el potencial escalar. El signo menos en la ecuación anterior
permite interpretar directamente al potencial Φ, para el caso de campos
independientes del tiempo, como el trabajo por unidad de carga realizado
por el campo eléctrico, llamado potencial electrostático, el cual es un campo
conservativo.
Estos dos teoremas del cálculo vectorial, corresponden a casos particulares de un teorema más general de tensores:
Teorema 9.3: Sean Tαβ las componentes covariantes de un tensor de
segundo rango antisimétrico, tal que
εαβγδ ∂β Tγδ = 0
(8.119)
entonces el tensor Tαβ se puede escribir como el “rotacional” (ver ecuación
(7.108)) de una función cuadri-vectorial W γ , es decir
Tαβ = ∂[α Wβ] = ∂α Wβ − ∂β Wα
(8.120)
8.5. TRANSFORMACIONES GAUGE
165
Como vimos en la sección 9.4 de este capítulo, las dos ecuaciones de
Maxwell homogeneas (∇ · B = 0 y ∇ × E + ∂ B/∂t = 0) se pueden escribir
en la forma
εαβγδ ∂β Fγδ = 0
(8.121)
en donde Fγδ es el tensor campo electromagnético. Entonces, de acuerdo con
el Teorema 9.3, el tensor campo electromagnético Fγδ se puede escribir en
la forma
∂Aγ
∂Aδ
Fγδ = ∂γ Aδ − ∂δ Aγ =
−
(8.122)
∂xγ
∂xδ
en donde el cuadri-vector Aµ , definido como:
Aµ := (Φ, A)
(8.123)
es llamado el cuadri-potencial,con A el potencial vectorial y Φ el potencial
escalar definidos en la ecuaciones (8.116) y (8.118) respectivamente.
Con esta definición del c-potencial Aµ , podemos escribir las ecuaciones
de Maxwell inhomogeneas (ver ecuación (8.60)):
∂α F αβ = −4πJ β
(8.124)
en términos del c-potencial Aµ . Remplazando la ecuación (8.122) en la
ecuación anterior y teniendo en cuenta que F αβ = η αµ ηβν Fµν y Jγ = η γβ J β ,
obtenemos:
∂ µ ∂µ Aγ − ∂ µ ∂γ Aµ = −4πJγ
(8.125)
De esta manera, esta última ecuación es equivalente a las ecuaciones de
campo de Maxwell, pues dadas las fuentes de los campos J α y resolviendo
la ecuación (8.125), conocemos el c-potencial Aµ y así los campos electromagnéticos.
Por otra parte, de la ecuación de definición de Fγδ en términos del potencial c-vectorial, notemos que podemos cambiar Aµ , adicionandole una
función cualquiera de la forma ∂µ ϕ, sin que cambia el tensor campo electromagnético Fγδ . Es decir, si realizamos la transformación
Aµ
õ = Aµ + ∂µ Λ
(8.126)
en donde Λ es una función cualquiera de las coordenadas, la ecuación (8.122)
166
CAPÍTULO 8. ELECTRODINÁMICA
nos conduce a:
F̃γδ =
=
=
=
∂ Ãγ
∂ Ãδ
−
γ
∂x
∂xδ
∂
∂
(Aδ + ∂δ Λ) − δ (Aγ + ∂γ Λ)
γ
∂x
∂x
∂
∂2Λ
∂2Λ
∂
A
−
A
+
−
γ
δ
∂xγ
∂xδ
∂xγ ∂xδ
∂xδ ∂xγ
∂
∂
Aδ − δ Aγ = Fγδ
∂xγ
∂x
(8.127)
lo cual significa que la función Fγδ permanece invariante bajo la transformación (8.126) y así también los campos electromagnéticos E y B. A la
transformación (8.126) se le llama una transformación “gauge”. Este tipo
de transformaciones juega un papel fundamental en la teoría cuántica de
campos y en las llamadas teorias de unificación de las interacciones fundamentales de la naturaleza.
Para finalizar este capítulo, veamos como esta característica de la teoría
electromagnética (cuando se formulan las ecuaciones de Maxwell en términos
del c-potencial), de permanecer los campos físicos E y B invariantes bajo
una transformación gauge, nos permite simplicar las ecuaciones que rigen el
comportamiento del c-potencial Aµ .
Dado que el c-potencial Aµ no está definido de manera única, entonces,
podemos imponer sobre él una condición o ecuación de ligadura, llamada
la elección de un gauge particular, la cual por lo establecido anteriormente,
no cambia la física, es decir no cambian los campos E y B. Así, podemos
escoger la función arbitraria Λ en la ecuación (8.126), de tal manera que el
potencial c-vectorial Aµ cumpla con la ecuación:
∂ µ Aµ = 0
(8.128)
llamado el gauge de Lorentz, de tal manera que la ecuación (8.125) se simplifica, reduciendose a la ecuación:
¤Aµ = −Jµ
(8.129)
que es la ecuación de ondas inhomogénea. Recordando la definición del operador ¤, ecuación (7.106), vemos que la teoría electromagnética de Maxwell,
expresada por la ecuación (8.129) contiene al postulado de la constancia de
la velocidad de la luz, pues dado que el operador ¤ definido por:
¤=
2
1 ∂2
−∇
2
2
c ∂t
(8.130)
8.5. TRANSFORMACIONES GAUGE
167
es un invariante bajo transformaciones de Lorentz, entonces el coeficiente
1/c2 , que representa la velocidad de propagación de los campos electromagnéticos, es una constante independiente del observador. Este último resultado ilustra con toda claridad y sin restarle meritos a la genialidad de Albert
Einstein, como la teoría de la relatividad especial estaba ya presente en la
física.
168
CAPÍTULO 8. ELECTRODINÁMICA
Capítulo 9
Bibliografía
La literatura disponible sobre relatividad es tal vez de las más amplias,
tanto en el campo especializado como en el divulgativo. Se listarán a continuación algunas referencias, desde literatura de divulgación, pasando por
textos elementales, obras de valor histórico, hasta textos y libros avanzados
que, sin pretender ser exaustivas, si cubren globalmente la temática de la
teoría especial de la relatividad.
Referencias de caracter divulgativo:
Bucker R. B., Geometry, Relativity and the fourth dimension. Dover Publications, Inc. N. Y. 1977
Lilley S., Discovering Relativity for yourself. Cambridge University Press
1981
Russell B., ABC de la Relatividad. Ed. Ariel Barcelona 1978
Williams L. P., La Teoría de la Relatividad. Alianza Universidad 1977
Textos elementales, a nivel universitario, sobre relatividad especial:
Mook D. E. and Vargish T., La Relatividad. Espacio, Tiempo y Movimiento. McGraw Hill 1993
Resnick R., Introducción a la Teoría Especial de la Relatividad. Limusa
1981
Skinner R., Relativity for Scientist and Engineers. Dover Publishing N. Y.
1982
Smith J. H., Introducción a la Relatividad Especial. Ed. Reverté 1978
Textos universitarios de relatividad a nivel intermedio:
Enrique L., Física Relativista. Buenos Aires 1955
French A. P., Special Relativity. Massachusetts Institute of Technology
1968
169
170
CAPÍTULO 9. BIBLIOGRAFÍA
Rindler W., Essential Relativity. Special, General and Cosmology. Springer-Verlag 1977
Taylor E. F. and Wheeler J. A., Spacetime Physics. Freeman, San Francisco 1966
Libros y textos avanzados sobre relatividad. Algunos de ellos incluyen, también, elementos básicos de la Relatividad General:
Aharoni J., The Special Theory of Relativity. Oxford University Press 1965
Bressan A., Relativistic Theories of Materials. Springer-Verlag 1978
Fock V., The Theory of Space Time and Gravitation, Pergamon Press 1959
Gill T. P., The Doppler Effect. Academic Press 1965
Kopczynski W. and Trautman A., Spacetime and Gravitation. John
Wiley & Sons 1992
Matveev A. N., Mechanics and Theory of Relativity. Mir Publishers Moscow
1989
Rosser W. G. V., An Introduction to the Theory of Relativity. Butterworth, London 1964
Ugarov V. A., Special Theory of Relativity. Mir Publishers Moscow 1979
Libros avanzados de relatividad, con un fuerte énfasis en aspectos matemáticos:
Hagendorn R., Relativistic Kinematics. W. A. Benjamin, Inc. 1963
Misner C. W., Thorne K. S. and Wheeler J. A., Gravitation. W. H.
Freeman and Co. 1973
Naber G. L., The Geometry of Minkowski Spacetime. Springer-Verlag 1992
Woodhouse N. M. J., Special Relativity. Springer-Verlag 1992
Libros clásicos de relatividad y obras formales de carácter histórico:
Born M., Einstein’s Theory of Relativity. Dover Publications, Inc. 1965 (1a
ed. 1920)
Einstein A., The Principle of Relativity. Dover N. Y. 1958
Poincaré H., La Mécanique Nouvelle. Conference Mémoire et note sur la
Théorie de la Relativité. Editions Jacques Gabay 1989
Rocard J. M., Newton et la Relativité. Press University France 1986
Sard R. D., Relativistic Mechanics. W. A. Benjamin, Inc. 1970
Silberstein L., The Theory of Relativity. Great Britain 1914
Synge J. L., Relativity: The Special Theory. North-Holland Publishing
Company 1958
Whittaker Sir E. T., History of the Theories Aether and Electricity. Harper and Row, N. Y. 1960
Descargar