Sobre la teoría especial de la relatividad Juan Manuel Tejeiro Sarmiento Profesor Titular Observatorio Astronómico Nacional Facultad de Ciencias Universidad Nacional de Colombia 2004 ii Índice general Introducción I VII Cinemática relativista 1 1. Modelo mecánico del mundo 1.1. Introducción . . . . . . . . . . . . . . . . . . 1.2. Leyes de Newton y principio de relatividad 1.3. Luz y éter: El retorno al espacio absoluto . 1.3.1. Un experimento crucial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 4 9 14 2. Fundamentos de la relatividad especial 2.1. Postulados de la relatividad especial . . 2.2. Transformaciones de Lorentz . . . . . . 2.3. Propiedades de las TL . . . . . . . . . . 2.4. Consecuencias de las TL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 19 24 31 40 3. La estructura causal del espacio-tiempo 3.1. Introducción . . . . . . . . . . . . . . . . 3.2. Rotaciones en el plano euclideano . . . . 3.3. Cuadri-vectores y el grupo de Lorentz . 3.4. Conos de luz y relaciones de causalidad 3.5. Algebra de cuadri-vectores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 47 47 51 55 59 . . . . . 65 65 65 69 70 75 4. Cinemática relativista 4.1. Introducción . . . . . . . . 4.2. Cuadri-vector velocidad . 4.3. Cuadri-vector aceleración 4.3.1. Viaje interestelar . 4.4. Cuadri-vector de onda . . . . . . . . . . . . iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv II ÍNDICE GENERAL Dinámica relativista 5. Dinámica relativista 5.1. Ecuaciones de movimiento . . . . . . . . . . 5.2. Leyes de conservación . . . . . . . . . . . . 5.3. Propiedades del c-momentun . . . . . . . . 5.4. Sistema centro de masa . . . . . . . . . . . 5.5. Energía umbral . . . . . . . . . . . . . . . . 5.6. Fotones y partículas de masa en reposo cero 79 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 81 84 87 90 93 96 6. Aplicaciones de la dinámica relativista 6.1. Introducción . . . . . . . . . . . . . . . . . . . . . . 6.2. Colisiones elásticas . . . . . . . . . . . . . . . . . . 6.2.1. Efecto Compton . . . . . . . . . . . . . . . 6.2.2. Efecto Compton inverso . . . . . . . . . . . 6.3. Colisiones inelásticas . . . . . . . . . . . . . . . . . 6.3.1. Absorción de un fotón por un átomo . . . . 6.3.2. Emisión de un fotón por un átomo exitado 6.4. Sistemas de masa variable . . . . . . . . . . . . . . 6.5. Creación y aniquilación de partículas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 101 101 102 105 107 108 111 113 115 III . . . . . . . . . . . . . . . . . . Electrodinámica relativista 7. Tensores 7.1. Introducción . . . . . . . . . . . . . . . . . . 7.2. Definiciones fundamentales . . . . . . . . . 7.2.1. Componentes covariantes . . . . . . 7.2.2. Algebra tensorial . . . . . . . . . . . 7.2.3. Propiedades de simetría de tensores 7.3. Transformación general de coordenadas . . 7.4. Operadores vectoriales . 117 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 119 120 122 125 130 136 138 8. Electrodinámica 8.1. Introducción . . . . . . . . . . . . . . . . . . . 8.2. Ecuaciones de Maxwell . . . . . . . . . . . . . 8.3. Campo magnético como un efecto relativista . 8.4. Ecuaciones de Maxwell covariantes . . . . . . 8.5. Transformaciones Gauge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 143 144 146 154 163 9. Bibliografía 169 Prefacio Segunda edición de las notas de clase sobre relatividad especial. v vi PREFACE Introducción La teoría de la relatividad (especial y general) es considerada como uno de los más grandes logros de la mente humana y forma parte, de lo que podemos llamar la cultura del hombre del siglo XX. A pesar del estigma de incomprensibilidad que siempre ha rodeado a la teoría de la relatividad, en el sentido que su comprensión está al alcance solamente de unos pocos especialistas, esta teoría científica ha sido la de mayor impacto y difusión a nivel de divulgación y ha tenido influencia definitiva sobre nuestra imagen del mundo. El desarrollo de la teoría de la relatividad ha estado marcado por circunstancias particulares que la diferencian de otros desarrollos de la física contemporánea, a las cuales me referiré en esta introducción, con el fin de mostrar, por una parte el estado actual de la teoría y por otra, el papel fundamental que ha jugado y juega esta teoría en el desarrollo de la física actual. La formulación de la Teoría Especial de la Relatividad dada por Einstein en 1905 es completa, es decir, a parte de ejemplos y aplicaciones de la teoría, o de su reformulación en términos de modelos matemáticos más sofisticados, todo los elementos básicos que hoy conocemos de la teoría especial de la relatividad están contenidos en los trabajos originales de Einstein. Además, el estilo del primer trabajo publicado por Einstein sobre el tema, a diferencia de otros trabajos en física teórica, se caracterizó por su sencillez en la exposición, con muy poco contenido matemático y la ausencia de referencias a artículos y trabajos anteriores. Su conclusión fundamental, la necesidad de reformular el concepto absoluto de simultaneidad y con él, el concepto de tiempo en física, muestra la genialidad de Einstein, no por la complejidad de sus razonamientos ni la complejidad en los cálculos, sino por la profundidad de sus conclusiones, las cuales modificaron de manera radical e irreversible nuestros conceptos básicos de espacio y tiempo. No es cierto, como sostienen varios historiadores de la física, que el trabajo de Einstein no fue comprendido en su tiempo, pues pocos meses después de su publicación físicos de vii viii INTRODUCCIÓN Cracovia afirmaban que había nacido un nuevo Copernico y ya para 1909, los principales físicos de esa época tales como Planck, von Laue y otros, reconocieron la genialidad de Einstein y la importancia de sus trabajos. Es importante resaltar en este punto que de hecho todas las ecuaciones básicas de la teoría especial de la relatividad, tales como la contracción de longitudes, aumento de la masa con la velocidad, la equivalencia masaenergía, etc., ya eran conocidas en la literatura y por lo tanto, la física si estaba preparada para entender y asimilar las ideas de Einstein. Para comprender esto, basta con recordar que la teoría electromagnética de Maxwell es una teoría relativista y por lo tanto era de esperar que un estudio minucioso de las ecuaciones de Maxwell (recordemos el excelente trabajo realizado por Lorentz sobre el electrón, el cual fue publicado en 1904) condujera a todas estas ecuaciones relativistas, aun cuando su interpretación estuviera fuertemente influenciada por el concepto del éter. Claramente, el impacto de la teoría especial de la relatividad de Einstein no se podía esperar que fuera muy grande a nivel experimental y tecnológico, pues de hecho la posibilidad de probar experimentalmente la teoría en forma directa era muy difícil y más significativo aún, era su escasa o prácticamente nula aplicabilidad. Esto, debido a que los fenómenos relativistas son relevantes en situaciones que involucren velocidades comparables a la velocidad de la luz en el vacío (aproximadamente 300,000km/s), lo cual solo vino a ser posible con el desarrollo de los grandes aceleradores de partículas a mediados del siglo XX. En 1916 Einstein publica la Teoría General de la Relatividad, la cual corresponde a la formulación relativista de la ley de gravitación universal de Newton. Estos trabajos, a diferencia de sus primeras publicaciones sobre la teoría especial de la relatividad, si requirieron de una estructura matemática muy compleja: la geometría diferencial y el cálculo tensorial. Dos predicciones fundamentales surgen de estos trabajos, el corrimiento del perihelio de Mercurio, efecto que ya había sido observado, más no explicado por los astrónomos y la desviación de la luz por el sol, cuya corroboración se da en 1919, aprovechando un eclipse total de sol que tuvo lugar el 29 de Mayo. Más significativo aún para el desarrollo de la teoría general de la relatividad, puede ser el descubrimiento de Hubble de la expansión del universo en 1929, si bien Einstein no había predicho este efecto, si estaba contenido en sus ecuaciones de la relatividad general. Este punto de la historia marca el comienzo de la cosmología actual, la cual es una de las áreas de investigación más activas que tenemos hoy día. Retomando de nuevo el desarrollo de la teoría especial de la relatividad, el papel fundamental que ella juega en la física se comienza a reconocer ix y a explotar tan solo con el desarrollo de la mecánica cuántica relativista formulada por Dirac en 1925. En efecto, hasta 1925 se conocían solamente dos partículas elementales: el electrón y el protón. Como una consecuencia fundamental de su recién desarrollada teoría relativista del electrón, Dirac predice la existencia del positrón, que es una partícula fundamental de la misma masa del electrón pero de carga opuesta. Este hecho es posteriormente generalizado y se establece un resultado general de la naturaleza y es que a toda partícula fundamental le corresponde una antipartícula. Estos desarrollos condujeron entonces a la teoría cuántica de campos, que constituye el marco teórico para entender las interacciones fundamentales de la naturaleza (electromagnética, fuerte y débil), que rigen el comportamiento de la materia a escala microscópica. Hoy día la teoría especial de la relatividad es reconocida como una teoría fundamental de la física, cuyo alcance va más allá de sus posibles aplicaciones experimentales o tecnológicas, pues ella se enmarca en el contexto de las propiedades fundamentales del espacio-tiempo, independientemente de cualquier modelo físico utilizado para describir los fenómenos. En general, las leyes físicas que rigen el comportamiento de los sistemas se formulan en términos de relaciones (ecuaciones diferenciales) entre las variables físicas necesarias para describir un sistema. Estas variables físicas se describen por funciones del espacio y el tiempo (posición, momentun, energía, etc.), cuyo comportamiento está regido por los principios de la teoría especial de la relatividad. El objetivo fundamental de este libro es presentar los principios básicos y los resultados fundamentales de la teoría especial de la relatividad, con énfasis en una formulación covariante, es decir una formulación que nos permite desde un principio, exhibir en forma explícita el carácter relativista de una teoría. Para este fin se han organizado los temas en tres grupos: El primer grupo lo conforman los tres primeros capítulos, la presente introducción, un capítulo sobre los fundamentos de la mecánica Newtoniana, con una breve discusión sobre el problema del éter, esto con el fin de motivar los postulados básicos de la teoría especial de la relatividad y sus principales consecuencias, desarolladas en el tercer capítulo. El segundo grupo lo constituye el cuerpo central del libro, comenzando con una formulación exhaustiva del concepto de cuadri-vector y la estructura causal del espacio-tiempo para formular los principios y leyes de la dinámica relativista, dedicando un capítulo a sus principales aplicaciones. El último tema está destinado a formular la teoría electromagnética (ecuaciones de Maxwell) en forma explícita relativista, para lo cual se dedica un capítulo a la formulación y álgebra de tensores sobre el espacio de Minkowski en forma sencilla, es decir sin re- x INTRODUCCIÓN currir a todo el formalismo matemático de las variedades y la geometría diferencial, pero manteniendo la validéz general, tanto en la notación como en los resultados fundamentales. Parte I Cinemática relativista 1 Capítulo 1 Modelo mecánico del mundo 1.1. Introducción En este capítulo presentaremos en forma resumida la situación de la física a comienzos del siglo XX, destacando los hechos más relevantes, que nos permitan motivar y entender mejor los conceptos y postulados fundamentales, sobre los cuales está basada la teoría especial de la relatividad, formulada en 1905 por el físico alemán Albert Einstein. En la primera sección revisaremos las leyes y conceptos fundamentales de la mecánica Newtoniana, dedicando el resto del capítulo a presentar una breve descripción de algunas de las teorías del éter, con el fín de entender el problema central que se debatía en la física en la segunda mitad del sigloXIX, en cuanto a la aparente inconsistencia entre la mecánica Newtoniana y la recién desarrollada teoría electromagnética. La teoría de la mecánica formulada por Newton en el siglo XVI y enriquecida por la contribución de muchos físicos y matemáticos a lo largo de los dos siglos siguientes, se constituyó en la teoría fundamental que permitía entender, explicar y predecir todos los fenómenos físicos conocidos. Fue en la primera mitad del siglo XIX que aparecieron fenómenos relacionados con el electromagnetismo y con la luz que comenzaron a complicar la imágen (explicación) mecánica del mundo. Esta situación se tornó más crítica en la segunda mitad del siglo con el desarrollo de la teoría de la electrodinámica de Maxwell, pues su aparente incompatibilidad con la mecánica newtoniana, reflejada no sólo en consideraciones teóricas sino también en resultados experimentales, hacían pensar que alguna de las dos teorías, la mecánica o la electrodinámica, debería ser abandonada o revisada, lo cual no era un problema fácil, pues ambas teorías presentaban una enorme cantidad de pruebas 3 4 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO experimentales y desarrollos tecnológicos que sustentaban su validez. 1.2. Leyes de Newton y principio de relatividad Para comprender mejor los problemas que se le planteaban a la física en el siglo XIX y preparar el terreno para entender los cambios de interpretación necesarios que se dieron con el desarrollo de la teoría especial de la relatividad, en esta sección revisaremos brevemente algunos conceptos fundamentales de la mecánica newtoniana, cuyo punto de partida son las tres leyes de Newton: Ley de la inercia- Toda partícula permanece en estado de reposo o movimiento rectilíneo uniforme respecto a cualquier sistema de referencia inercial, mientras no actúen fuerzas externas sobre él, o equivalentemente el momentum de una partícula libre de fuerzas permanece constante, en donde la cantidad dinámica de momentum se define como p = mv (1.1) siendo m la masa inercial de la partícula y v su velocidad. Ecuación de movimiento- La fuerza aplicada sobre la partícula es igual a la rata de cambio de su momentum F = dv dp =m dt dt (1.2) en donde la última igualdad se deduce del hecho que la masa inercial de una partícula puntual es constante e independiente de su estado de movimiento. Interacción entre partículas- La fuerza que una partícula A ejerce sobre otra partícula B es igual en magnitud y en sentido opuesto a la fuerza que la partícula B ejerce sobre A. Para la formulación de estas leyes hay toda una serie de supuestos básicos necesarios, tales como la estructura geométrica del espacio, el concepto de tiempo, observador y sistema de referencia, magnitudes físicas y el concepto de medida. Sin embargo, no es objeto del presente libro entrar a discutir exhaustivamente estos conceptos, sino nos centraremos únicamente en aquellos aspectos que son relevantes para plantear y motivar la formulación de la teoría especial de la relatividad. Definamos, en primer lugar, el concepto de observador como un sistema físico (reglas o patrón de medida espacial y relojes o patrón de medida temporal), que permite determinar la posición y el instante de tiempo respecto a un origen arbitrario, de un fenómeno físico (que en lo sucesivo llamaremos 1.2. LEYES DE NEWTON Y PRINCIPIO DE RELATIVIDAD 5 evento). A este conjunto de reglas y relojes lo denominaremos sistema de referencia, cuya representación matemática se puede realizar por el espacio R × R3 , con R los números reales que representa el tiempo y R3 el espacio euclidiano tridimensional que representa el espacio físico. Dotar al espacio y al tiempo con esta estructura matemática supone (como lo asumió explícitamente Newton) que el espacio es absoluto, homogéneo e isotrópico y obedece la geometría euclideana y el tiempo es absoluto y homogéneo y por lo tanto son conceptos independientes del observador. En segundo lugar, Newton asumió que sus leyes se cumplen en el espacio absoluto, es decir que sus leyes son válidas para un observador, cuyo sistema de coordenadas esté fijo respecto al espacio absoluto. A este observador particular se le llama ”sistema de referencia inercial” y lo denotaremos por Σ. Elegir un sistema de referencia inercial es, en principio, escoger una coordenada temporal t y un sistema de coordenadas cartesianas (x, y, z) para determinar el instante y la posición de un evento. Que el origen de la coordenada temporal es arbitrario, refleja el hecho que el tiempo es homogéneo, mientras que el origen y la orientación arbitrarias de las coordenadas espaciales ponen de manifiesto la homogeneidad e isotropía del espacio. Si la primera ley de Newton es válida en Σ, entonces una partícula P , sobre la cual no actúan fuerzas, debe viajar en una línea recta respecto al sistema Σ. Así por ejemplo, si elegimos el origen del tiempo y los ejes espaciales de tal manera, que la partícula pase por el origen espacial en el instante t = 0 y se mueva en la dirección del eje x positivo, entonces su posición, en un instante de tiempo cualquiera t,está dada por x = ux t ; y = 0 ; z = 0 (1.3) u = (ux , uy , uz ) = (ux , 0, 0) (1.4) con la velocidad de la partícula. Consideremos otro sistema de referencia Σ0 , con respecto al cual la partícula P permanece en reposo en su origen de coordenadas espaciales, y elijamos los ejes espaciales de Σ0 paralelos a los del sistema de referencia inercial Σ y el origen del tiempo de tal manera los relojes comiencen a contar el tiempo, t = t0 = 0, cuando los orígenes de los dos sistemas se cruzan. Entonces, podemos determinar las coordenadas espaciales y el tiempo de cualquier evento físico, bien sea con respecto al sistema inercial Σ o con respecto al sistema de referencia Σ0 . Si llamamos (t, x, y, z) las coordenadas de un evento físico cualquiera, medidas respecto a Σ y (t0 , x0 , y0 , z 0 ) las correspondientes coordenadas, medidas respecto a Σ0 , podemos encontrar la 6 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO Figura 1.1: Transformaciones de Galileo relación entre las coordenadas del evento, medidas por los dos sistemas de referencia Σ0 y Σ. Estas relaciones son llamadas ecuaciones de transformación de Galileo. Es fácil encontrar las ecuaciones de transformación de Galileo (Figura 1.1), pues teniendo encuenta que las ecuaciones (1.3) nos dan la posición, respecto al sistema inercial Σ, del origen de coordenadas del sistema Σ0 , entonces, las coordenadas (t0 , x0 , y0 , z 0 ) de cualquier evento medidas por Σ0 , están relacionadas con las coordenadas (t, x, y, z) del mismo evento medidas por Σ, por las ecuaciones: t0 = t x0 = x − vt y0 = y z0 = z (1.5) en donde se ha hecho el cambio ux = v, para rescatar la notación usual utilizada en la literatura. Así, en lo sucesivo v denotará la velocidad del sistema de referencia Σ0 respecto a Σ. La elección de los dos sistemas coordenados de Σ y Σ0 con los ejes coordenados paralelos y la misma orientación, así como la velocidad relativa de los dos sistemas a lo largo de los ejes x, x0 no representa pérdida alguna de generalidad y su justificación se encuentra en la hipótesis de isotropía del espacio, la cual implica que la física no depende de la orientación de los ejes coordenados, o equivalentemente, que el espacio es isotrópico. 1.2. LEYES DE NEWTON Y PRINCIPIO DE RELATIVIDAD 7 Además, en las ecuaciones de tranformación de Galileo está implícita, también, la hipótesis de homogeneidad del espacio y el tiempo, pues la elección del origen del tiempo para los dos sistemas, en el instante en que los orígenes espaciales coinciden, es arbitraria, indicando que cualquier instante de tiempo y todos los puntos del espacio son equivalentes para describir los fenómenos físicos. La primera ecuación de transformación, t0 = t, representa el carácter absoluto del tiempo, y significa que (salvo la elección arbitraria del origen) el instante en el cual ocurre un evento físico es independiente del observador y además, esta ecuación lleva también la hipótesis implícita, que existe algún mecanismo físico apropiado que permite transmitir información instantáneamente. Otra forma de expresar este carácter absoluto del tiempo, es a través del concepto de simultaneidad: Si dos eventos, que ocurren en puntos diferentes del espacio para un observador, son simultáneos, entonces estos dos eventos son también simultáneos para cualquier otro observador, sin importar su estado de movimiento relativo respecto al primer observador. Como veremos más adelante, la simultaneidad es uno de los conceptos fundamentales que debe ser cuestionado y se torna en un punto muy importante para la formulación de la teoría de la relatividad. Una primera consecuencia de las transformaciones de Galileo, es que las leyes de la mecánica son válidas en todos los sistemas de referencia que se muevan con respecto al sistema de referencia inercial, el cual se encuentra en reposo con respecto al espacio absoluto. La demostración de este resultado es directa, pues, si una partícula libre posee una velocidad u = (ux , uy , uz ) = ( dx dy dz , , ) dt dt dt (1.6) respecto al sistema de referencia inercial Σ, entonces, se obtiene de las ecuaciones de transformación de Galileo (1.5), que las componentes de la velocidad de la partícula, medidas en el sistema de referencia Σ0 están dadas por: dx0 uy0 = uy uz0 = uz (1.7) ux0 = 0 = ux − v dt Este resultado se conoce con el nombre de teorema de adición de velocidades de Galileo. Así, puesto que la velocidad relativa v entre los sistemas de referencia Σ y Σ0 es constante, entoces, la partícula libre también se mueve con velocidad constante u0 = (u0x0 , uy0 , uz 0 ) respecto al sistema Σ0 . De manera similar, se deduce que la segunda ley de Newton también se satisface, pues, utilizando el resultado anterior (ecuación (1.7)), tenemos que F0 = du dp dp0 du0 =m = =F = m 0 dt dt dt dt (1.8) 8 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO con el resultado adicional, que no sólo la forma de la segunda ley de Newton F = dp dt es la misma, como queríamos probar, sino que tanto la fuerza que actúa sobre la partícula, como su aceleración, toman el mismo valor en los dos sistemas de referencia. Que la tercera ley de Newton también se cumple para el sistema de referencia Σ, se obtiene de este resultado y del carácter absoluto de la simultaneidad, pues, la igualdad de las fuerzas de acción y reacción es instantánea, independiente de la posición relativa de los puntos de aplicación de las fuerzas. Esta invarianza de las leyes de la mecánica bajo transformaciones de Galileo, constituye el Principio de Relatividad Galileano. En la formulación inicial de las leyes de Newton, se postuló que ellas eran válidas para un observador en reposo con respecto al espacio absoluto, que lo llamamos observador inercial o sistema de referencia inercial, y mostramos, que si este postulado se cumplía, entonces las leyes de Newton también eran válidas en cualquier sistema de referencia que se moviera con velocidad constante respecto al observador inercial. Esto justifica extender el nombre de sistema de referencia inercial, para todos los observadores con movimiento relativo constante, respecto al observador inercial inicialmente en reposo relativo al espacio absoluto. Así, podemos dar otras formas equivalentes de enunciar el principio de relatividad galileano: Las leyes de la mecánica son las mismas en todos los sistemas de referencia inerciales, o también, no es posible, a través de experimentos mecánicos, determinar la velocidad del sistema de referencia inercial con respecto al espacio absoluto. Esta última forma equivalente de enunciar el principio de relatividad Galileano, le quita todo el sentido físico al espacio absoluto, pues elimina su estatus privilegiado de ser el único sistema de referencia con respecto al cual se cumplen las leyes de la mecánica y por lo tanto, el espacio absoluto queda como un concepto empíricamente vacío, por lo menos en lo que a fenómenos mecánicos se refiere. Esta situación, reconocida desde un principio por Newton, lo condujo a buscar experimentos alternativos que le permitieran determinar el movimiento con respecto al espacio absoluto. El ejemplo más conocido en la literatura lo constituye su experimento del balde rotante, en el cual, la curvatura que toma la superficie del agua del balde, cuando éste se encuentra en rotación, se la atribuye a su movimiento de rotación respecto al espacio absoluto, pues este fenómeno, sostenía Newton, tenía lugar aún en el caso que el balde se encontrara solo en el universo. Críticas a este análisis son igualmente abundantes en la literatura, siendo la de Mach la más conocida, pues parte del análisis que llevó a Einstein a formular los principios de la Teoría General de la Relatividad está basado sobre los trabajos de Mach. 1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 9 No es objeto de la presente sección profundizar más sobre este tema, pues volveremos sobre el problema del espacio absoluto, cuando discutamos las teorias del eter y los fenómenos electromagnéticos. Sin embargo, es importante dejar claro un aspecto referente a este tema: Dada la imposibilidad de determinar el movimiento absoluto (a velocidad constante) a través de fenómenos mecánicos, Newton recurrió, entonces, a sistemas de referencia acelerados, para los cuales las leyes de la mecánica ya no permanecen invariantes y claramente, los efectos de la aceleración si son detectables (las, no bien llamadas fuerzas ficticias, tales como la fuerza centrífuga o la fuerza de coriolis, que surgen en sistemas de referencia acelerados), pero aún, en este caso de sistemas de referencia no inerciales, cualquier referencia al espacio absoluto sigue siendo superflua. 1.3. Luz y éter: El retorno al espacio absoluto Hasta comienzos del siglo XIX todos los fenómenos físicos, incluidos los de la óptica, admitían una explicación mecánica. Esto nos permite comprender, en gran parte, por qué esta imágen mecánica del mundo se extendió hasta finales del siglo XIX, tratando de explicar fenómenos tales como la propagación de las ondas de luz, y todos aquellos fenómenos relacionados con la teoría electromagnética de Maxwell. Un ejemplo, que ilustra muy bien esta concepción, lo podemos encontrar en la siguiente cita debida a Lord Kelvin: ”No estaré contento hasta que pueda construir un modelo mecánico del objeto que estoy estudiando. Si lo puedo lograr significa que lo he entendido, de lo contrario no.”. En este parágrafo describiremos brevemente dos desarrollos de la física del siglo XIX, el carácter ondulatorio de la luz descubierto por Young y Fresnel y la electrodinámica de Maxwell, que constituyen, en mi opinión, el punto de partida más directo para formular los principios y conceptos de la teoría especial de la relatividad. El sonido es la propagación de ondas longitudinales en un medio material, en donde la velocidad de propagación está dada por la ecuación debida a Newton: s v= Y ρ (1.9) en donde Y es el módulo de elasticidad del medio y ρ la densidad del medio. Además, la velocidad del sonido es independiente de la fuente, pero depende de la velocidad del medio en el cual se transmite. De manera similar, 10 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO se trabajaron modelos para explicar los fenómenos de la luz, como los desarrollados por Hook y Huygens, en donde la luz se consideraba como alguna forma de onda longitudinal, que se propagaba a través del espacio. Newton trabajó este modelo por algún tiempo, pero dada la imposibilidad de explicar la polarización de la luz, desarrolló el modelo corpuscular, capaz de explicar este efecto y de dar cuenta de otras propiedades conocidas de la luz, desplazando al modelo ondulatorio de Huygens. La teoría corpuscular de la luz permaneció vigente hasta comienzos del siglo XIX, cuando Young y Fresnel explicaron los nuevos fenómenos de interferencia y difracción, con base en la teoría ondulatoria, relegando a la teoría corpuscular Newtoniana, a un capítulo más de la historia de la física. Sin embargo, de la misma manera que el sonido necesita de un medio para propagarse, se vió la física avocada a postular un medio material para la propagación de las ondas de luz. Este medio material, que optaron por llamar éter, debería ser de naturaleza diferente a la materia conocida hasta entonces. Es importante anotar, que el éter en la física no era una idea completamente original, pues ya había sido usado antes para ”explicar” muchos otros fenómenos. Por ejemplo, Newton, sugiere que el éter puede estar asociado con la gravitación, con los fenómenos eléctricos y magnéticos, con la propagación del calor etc.. A este respecto, Young aclara, que el éter a través del cual se propaga la luz no necesariamente es el mismo que el éter eléctrico, y por esta razón Young propone llamarlo éter lumínico. Una vez aceptado que la luz es un fenómeno ondulatorio, comenzaron a desarrollarse teorías y modelos mecánicos del éter, para explicar el mecanismo de propagación de las ondas de luz en este medio. Young y Fresnel fueron los primeros en encontrar que las ondas de luz deben ser transversales, para poder explicar el fenómeno de polarización. Este hecho exigía, entonces, un esfuerzo teórico muy grande para comprender el mecanismo de transmisión de ondas transversales en un medio elástico, dado que ésto requería que el medio de transmisión, el éter, tuviera un coeficiente de rigidez muy grande, pues, como lo demostró Poisson, ondas longitudinales y transversales se podían propagar en un sólido, con v⊥ = (η/ρ)1/2 (1.10) la velocidad de las ondas transversales y vk = ([k + 4η/3]/ρ)1/2 (1.11) la velocidad de las ondas longitudinales, siendo η el módulo de rigidez, k el módulo de elasticidad volumétrico y ρ la densidad del sólido. Una dificultad, 1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 11 de este modelo mecánico del éter, era la ausencia de componente longitudinal de las ondas de luz, lo que llevó a Cauchy a sugerir, que el eter debía tener una compresibilidad negativa, de tal manera que el factor k + 4η/3, en la ecuación (1.11), se anulara. Estas teorías estaban basadas sobre las propiedades conocidas de los medios elásticos, pero la combinación tan inusual de las propiedades que debería tener el éter, condujeron a MacCullagh a postular, que este medio era un nuevo tipo de sustancia elástica, diferente a las conocidas y asociándole otras propiedades desarrolló una teoría más sofisticada, con un sistema de ecuaciones, muy parecido a las ecuaciones de Maxwell, que fue intensamente trabajado en la segunda mitad del siglo XIX. A diferencia de las propiedades mecánicas del éter, anteriormente discutidas, para las cuales era difícil proponer experimentos directos que las verificaran, el teorema de adición de velocidades de Galileo, que se cumple también para las ondas en un medio mecánico, permitió proponer y realizar toda una serie de experimentos para medir la velocidad de la luz, desde un sistema de referencia móvil respecto al éter. La situación se plantea de la siguiente forma: De la teoría de propagación de las ondas en un medio elástico, sabemos que: (1.12) u0 = u − v en donde u es la velocidad de propagación de las ondas, medida en sistema de referencia inercial Σ, el cual está en reposo con respecto al medio de propagación (el éter para el caso de ondas de luz), u0 es la velocidad de las ondas, medida por un observador en un sistema de referencia inercial Σ0 , que se mueve con velocidad v respecto a Σ. En 1728 Bradley descubrió el fenómeno de aberración de la luz, que consiste en el cambio aparente de posición de las estrellas en diferentes épocas del año (Figura 1.2). Este efecto se explica fácilmente, si se supone que el éter está en reposo respecto al sol, pues, dado que la tierra se mueve con una velocidad aproximada de 30km/s en su órbita alrededor del sol y, por lo tanto, si tomamos una estrella colocada perpendicularmente al plano de translación de la tierra, el telescopio debe inclinarse un ángulo adicional dado por vc sin θ, en donde v es la velocidad orbital de la tierra, c la velocidad de la luz respecto al éter y θ mide la posición angular instántanea de la estrella respecto a la tierra. Esta interpretación fue capaz de dar el valor correcto de la aberración observada, a primer orden en v/c. Es de anotar, que los experimentos de aberración de la luz estelar no eran capaces de dar el valor de la velocidad absoluta de la tierra respecto al éter, sino solamente cambios de la velocidad relativa de la tierra respecto al éter. Arago en 1810 propuso una modificación al experimento de aberración, 12 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO Figura 1.2: Aberración de la luz estelar que sí permitiría medir la velocidad absoluta de la tierra respecto al éter, pues de acuerdo con la teoría clásica, si la luz atravesaba un medio refractivo (como el agua o un vidrio), el cual estuviera moviéndose respecto al éter, entonces la velocidad de la luz respecto a este medio variaba, dependiendo de la dirección relativa de movimiento del medio y el éter, es decir, el índice de refración del medio dependería de la dirección relativa de movimiento. Arago colocó un prisma en el telescopio y observó diferentes estrellas, esperando encontrar variaciones del ángulo de aberración. El resultado negativo de su experimento, condujo a Fresnel a proponer la teoría del arrastre parcial del éter por los medios materiales en movimiento y mostró que este arrastre parcial del éter hacía inobservable el efecto del viento de éter en medios materiales, en órdenes de magnitud de v/c. Basados sobre este mismo principio, se realizaron toda una serie de experimentos como los de Hoek, de Mascart y Jamin, Airy, Fizeau, etc, obteniéndose también resultados negativos. Sin embargo, no se podía estar seguro que las condiciones experimentales fueran lo suficientemente adecuadas para medir los pequeños efectos que se estaban buscando. Además se agregaba la dificultad que al utilizar luz blanca, el índice de refración de la luz en un medio dependía de la frecuencia y por tanto cada color (frecuencia) sufría un arrastre diferente. Los problemas de la teoría del éter no se centraban úni- 1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 13 camente en la determinación de la velocidad absoluta de la tierra respecto al éter, sino también tenían que dar cuenta de los demás efectos conocidos, tales como las leyes de reflexión, refracción, polarización, cristales ópticos, etc, lo cual conducía a complicar cada vez más el modelo mecánico del éter. Un elemento adicional que se sumaba a esta historia del éter, lo constituye el desarrollo de las teorías de la electricidad y el magnetismo, que culminan hacia mediados del siglo XIX con las ecuaciones de Maxwell y con el descubrimiento, tal vez el más importante de ese siglo, que la luz son ondas electromagnéticas. A partir de este momento el éter se asoció como el medio de propagación de los campos eléctricos y magnéticos. Pero un punto más importante para nuestra discusión de los orígenes de la teoría especial de la relatividad, lo constituye el hecho de que las leyes del electromagnetismo de Maxwell no satisfacen el principio de relatividad de Galileo. Lo que resta de esta sección lo dedicaremos a explicar el significado de este hecho y sus implicaciones. Que las leyes del electromagnetismo de Maxwell no satisfacen el principio de relatividad de Galileo significa que las ecuaciones de Maxwell no permanecen invariantes, cuando se realiza una transformación de Galileo entre dos sistemas de referencia inerciales, o en otros términos equivalentes, si suponemos que las ecuaciones de Maxwell son válidas en un sistema de referencia inercial Σ, entonces ellas cambiarán para cualquier otro observador inercial Σ0 , que se mueva con respecto a Σ. Este cambio se refleja en que a las ecuaciones de Maxwell le aparecen nuevos términos, que van a depender de la velocidad relativa de los sistemas. Estos nuevos términos dependientes de la velocidad en las leyes de la electrodinámica deben producir efectos observables y por tanto, deben permitir determinar la velocidad del sistema de referencia Σ0 del observador, respecto al único sistema de referencia inercial para el cual las ecuaciones de Maxwell toman su forma más simple. Esta situación de las leyes del electromagnetismo rescataba entonces el concepto de espacio absoluto, identificado a su vez con el sistema de reposo del éter, pero ahora y a diferencia del caso de la mecánica de Newton, dándole un significado físico: Las leyes de la electrodinámica son válidas solamente en el sistema de referencia en reposo con respecto al espacio absoluto. Para ilustrar esta situación, consideremos dos cargas +q y −q, unidas por una varilla rígida aislante (Figura 1.3). Si este sistema está en reposo respecto al espacio absoluto Σ, la única fuerza entre las cargas es la eléctrica, dada por la ley de Coulomb. Pero si estas cargas se encuentran en reposo en otro sistema de referencia inercial Σ0 que se mueva respecto Σ a una velocidad v, entonces aparecerá un campo magnético y así, una fuerza, adicional a la fuerza eléctrica, debida al movimiento de las cargas, que producirá, por 14 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO Figura 1.3: Experimento de Truton-Noble lo tanto, un par de fuerzas que tenderá a hacer girar el sistema. Este experimento, con resultado negativo, fue llevado a cabo por Trouton y Noble, 2 esperando encontrar una fuerza magnética que dependía de la relación vc2 , siendo v la velocidad de la tierra. Es de anotar, que el diseño experimental utilizado para realizar este experimento, permitía medir cantidades del orden de magnitud de v 2 /c2 ∼ 10−8 . 1.3.1. Un experimento crucial El experimento más notable, y de referencia obligada en todo tratado de relatividad, lo constituye el realizado por Michelson y Morley en 1887. Es interesante notar, que Einstein no hace referencia alguna a este experimento en sus primeros artículos, en donde desarrolla la teoría especial de la relatividad, y de hecho, varios historiadores de la ciencia afirman que ni siquiera lo conocía. La importancia histórica de este experimento y su obligatoria referencia, la podemos entender por dos aspectos: primero, el diseño del experimento permitía medir, con una precisión suficiente (corrimientos del patrón de interferencia menores a 1/100 de franja), evitando así, el problema que se presentaba en todos los otros experimentos realizados hasta entonces, en cuanto a que, el orden de magnitud de los efectos esperados, eran siempre menores o del mismo orden que el error experimental, dejando siempre un 1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 15 velo de duda sobre los resultados obtenidos. Segundo, el resultado negativo del experimento de Michelson y Morley generó toda una serie de trabajos teóricos, que impulsaron el desarrollo de la física y abrieron el camino para la formulación de la teoría de la relatividad. Tal vez, el más importante de estos trabajos fue el realizado por Lorentz, que culminó con su libro sobre la teoría del electrón publicado en 1905. Es interesante, más no sorprendente, anotar como, en este libro, se encuentran todas las ecuaciones que describen los fenómenos más significativos que predice la relatividad, como por ejemplo, las transformaciones entre sistemas de referencia inerciales (llamadas hoy transformaciones de Lorentz), las ecuaciones de contracción de longitudes y dilatación del tiempo, la equivalencia masa-energía, la variación de la masa inercial con la velocidad, etc, solamente que su interpretación, en términos de las propiedades del éter, era incorrecta, en cuanto a que, estos efectos esperados, siempre se compensaban con otros debidos al éter, de tal manera que ninguno de ellos resultaba ser observable. Este trabajo teórico de Lorentz resolvía, así, la aparente inconsistencia entre los dos grandes pilares de la física conocidos hasta entoces, la mecánica de Newton y la electrodinámica de Maxwell, pero dejaba el problema fundamental sin resolver: el espacio absoluto y la indetectabilidad del éter. Anotábamos en el parágrafo anterior, que no es una sorpresa que el trabajo de Lorentz contenga todas las ecuaciones relativistas, pues está basado sobre la electrodinámica de Maxwell, que como veremos en un capítulo posterior, es una teoría relativista. Igualmente, esta anotación nos permite también entender, por qué no era necesario que Einstein conociera el experimento de Michelson y Morley para desarrollar la teoría de la relatividad. En efecto, basta con recordar el título del primer artículo publicado por Einstein sobre el tema:“Zur Elektrodinamik der bewegten Körper” (Sobre la electrodinámica de los cuerpos en movimiento). El experimento de Michelson-Morley fue realizado en 1887, utilizando como principio físico el fenómeno de interferencia de la luz. El diseño experimental es bosquejado en la (Figura 1.4). De la fuente S sale un haz de luz que incide sobre un espejo semitransparente A, el cual divide al haz en dos rayos mutuamente perpendiculares, los cuales se reflejan en los espejos planos B y C, retornando al espejo A, en donde, el rayo proveniente del espejo C es desviado hacia el objetivo O, mientras que el rayo reflejado en B atraviesa el espejo A y llega al objetivo O, donde se observan franjas de interferencia, las cuales dependen de la diferencia de caminos ópticos entre los dos rayos de luz. Supongamos, sin pérdida de generalidad y para simplicar el análisis, que 16 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO Figura 1.4: Experimento de Michelson y Morley los caminos AB y AC de los dos haces de luz son iguales. Sea v la velocidad de la tierra respecto al éter y paralela al brazo AC del interferómetro. Así, la velocidad del viento del éter respecto al interferómetro, fijo a la tierra, está en la dirección de CA (ver Figura 1.4), suponiendo que no hay arrastre parcial del éter. De acuerdo con las teorías del éter, la velocidad de la luz relativa al laboratorio es c−v, cuando va de A hacia C y c+v cuando regresa 1 de C hacia A, mientras que la velocidad del otro rayo de luz es (c2 − v2 ) 2 en la dirección de A hacia B y de B hacia A. Entonces, si la longitud de cada uno de los brazos del interferómetro es L, la diferencia de tiempos de llegada de los dos rayos está dada por: 2Lc 2L −√ 2 2 −v c − v2 1 2L 1 ( −p ) 2 2 c 1 − v /c 1 − v2 /c2 ∆t = tACA − tABA = = c2 (1.13) Utilizando la expansión en serie (1 + x)r = 1 + rx + 1 r(r − 1)x2 + · · · 2! (1.14) la cual es convergente para |x| < 1, se desarrolla cada fracción hasta términos 1.3. LUZ Y ÉTER: EL RETORNO AL ESPACIO ABSOLUTO 17 del orden de v 2 /c2 , obteniendo: ∆t ' L v2 c2 (1.15) Si rotamos el interferómetro 90◦ , el tiempo para recorrer el camino ABA será ahora mayor que el tiempo para el camino ACA, y la diferencia de 2 tiempos ∆t estará dada por ∆t ' −L vc2 . Por lo tanto, el cambio total en la 2 diferencia de tiempos al rotar el interferómetro es igual a 2L vc2 . Si λ es la longitud de onda de la luz utilizada, entonces la rotación del interferómetro da lugar a un corrimiento de n franjas, dado por: n= 2L v2 λ c2 (1.16) Michelson y Morley utilizaron en su experimento luz de longitud de onda de 5,9 × 10−7 m y un camino de L = 11m, logrado por múltiples reflexiones. Tomando para la velocidad de la tierra alrededor del sol 30km/s, se esperaba un corrimiento de aproximadamente 0,37 franjas, el cual, como ya se ha dicho no fue observado. 18 CAPÍTULO 1. MODELO MECÁNICO DEL MUNDO Capítulo 2 Fundamentos de la relatividad especial En este capítulo formularemos los postulados fundamentales sobre los cuales está basada la teoría especial de la relatividad y obtendremos las ecuaciones de transformación entre sistemas de referencia inerciales (transformaciones de Lorentz). Concluiremos el capítulo estudiando las propiedades de las transformaciones de Lorentz y sus consecuencias sobre la medida de intervalos temporales y espaciales. 2.1. Postulados de la relatividad especial Como fue anotado en el capítulo anterior, la teoría desarrollada por Lorentz solucionaba la aparente inconsistencia de la mecánica Newtoniana y la electrodinámica de Maxwell, manteniendo inmodificados los principios y postulados físicos sobre los cuales se basaban estas teorias. La aproximación de Einstein a este problema es diferente, pues está basada sobre dos postulados de carácter fundamental, en el sentido de que estos postulados deben ser satisfechos por cualquier teoría física que se proponga, independientemente de las leyes y principios que se postulen para describir esta teoría. Postulado 1: Las leyes físicas son independientes del sistema de referencia inercial, con respecto al cual se midan las variables que describen al sistema físico considerado. Postulado 2: La velocidad de la luz en el vacío es la misma para todos los observadores inerciales, independiente de la dirección de propagación y de la velocidad de la fuente emisora. El primer postulado propuesto por Einstein es conocido también como 19 20 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL el Principio de Relatividad, el cual generaliza el principio de relatividad Galileano a todas las leyes de la física. El costo de aceptar este postulado es el de abandonar las transformaciones de Galileo, que relacionan las coordenadas de los eventos medidas por diferentes observadores inerciales, y de paso, se hace necesario revisar las leyes de la mecánica Newtoniana. Pues, como vimos en la parte final del capítulo anterior, las ecuaciones de Maxwell no eran invariantes bajo transformaciones de Galileo, indicando que las leyes del electromagnetismo no obedecían el principio de relatividad de Galileo. Sin embargo, los experimentos realizados para demostrar este hecho daban todos resultados negativos, y no es aventurado pensar que fue esta situación la que llevó a Einstein a postular, que las leyes de la electrodinámica sí satisfacían el principio de relatividad, pero entonces ésto exigía abandonar las ecuaciones de transformación de Galileo, como la forma correcta de expresar las transformaciones entre sistemas de referencia inerciales. Esto implicaba también que deberían ser modificadas las leyes de la mecánica de Newton, las cuales sí permanecen invariantes bajo transformaciones de Galileo. El segundo postulado de la Teoría de la Relatividad establece que la velocidad de la luz en el vacío es constante, independiente del sistema de referencia inercial desde el cual ésta sea medida. Cómo llegó Einstein a este resultado, es un problema que ha sido objeto permanente de debate en la historia de la ciencia. Ninguno de los experimentos realizados en el siglo XIX se puede considerar como evidencia directa de la constancia de la velocidad de la luz en el vacío. Es claro a la luz de este postulado, el resultado negativo del experimento de Michelson y Morley y podría pensarse, como lo afirma Grünbaum, que Einstein incorpora este resultado nulo como un axióma, a través del principio de la constancia de la velocidad de la luz. Aun cuando en una entrevista realizada por Shankland a Einstein en 1950, le afirma que él no estaba familiarizado con el experimento de Michelson y Morley cuando escribió su artículo en 1905, Shankland hace notar que en este artículo Einstein hace referencia a ”intentos fallidos para detectar cualquier movimiento de la tierra respecto al éter lumínico”, lo que indica según Shankland, que Einstein tenía referencia de los diferentes experimentos ópticos realizados, pero no de los detalles própios de cada experimento. Una aproximación alternativa para buscar los orígenes de este segundo postulado, la podemos encontrar en la teoría de la electrodinámica de Maxwell, pues, si aceptamos su validez y el principio de relatividad, podemos encontrar el principio de la constancia de la velocidad de la luz, así como también el postulado de la constancia de la carga eléctrica, el cual juega un papel igualmente importante en física. Las ecuaciones de Maxwell, en el sistema M.K.S. racionalizado, para un 2.1. POSTULADOS DE LA RELATIVIDAD ESPECIAL 21 observador inercial Σ toman la forma ∇ · E = ρ/ε0 (2.1) ∇·B =0 (2.2) ∇ × B = µ0 J + µ0 ε0 ∂E ∂t (2.3) ∂B (2.4) ∂t con µ0 = 4π × 10−7 N w/(amp)2 la permeabilidad magnética del vacío y ε0 = 8, 854 × 10−12 coulomb2 /N w · m2 la constante dieléctrica del vacío. La primera ecuación corresponde a la ley de Gauss, y establece que las cargas son fuente del campo eléctrico, siendo ρ la densidad de carga. La segunda ecuación afirma que no existen cargas magnéticas aisladas. El primer término de la tercera ecuación corresponde a la ley de Ampère y significa que las corrientes eléctricas son fuente del campo magnético, con J la densidad de corriente, mientras que el último término, conocido como corriente de desplazamiento de Maxwell, establece que variaciones temporales del campo eléctrico son también fuente del campo magnético. La última ecuación es la ley de inducción de Faraday, en la cual variaciones temporales del campo magnético producen campos eléctricos. Las ecuaciones de campo de Maxwell se completan con una ecuación de movimiento, la cual establece que la fuerza sobre una partícula de carga q en presencia de un campo electromagnético está dada por : F = q E + qu × B (2.5) ∇×E =− conocida como la fuerza de Lorentz. Si tomamos la divergencia de la tercera ecuación de Maxwell, haciendo uso de la ley de Gauss (primera ecuación) y del hecho que la divergencia del rotacional siempre es cero, obtenemos la ecuación de continuidad para la carga eléctrica ∂ρ +∇·J =0 (2.6) ∂t Integrando en todo el espacio y aplicando el teorema de Gauss, se llega al principio de conservación de la carga: Z dQ d ρdV = =0 (2.7) dt dt Este resultado es independiente del estado de movimienento de la carga y existe muchísima evidencia experimental que lo corrobora. Por ejemplo, 22 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL si la carga dependiera de la velocidad, el átomo de hidrógeno podría no ser eléctricamente neutro, ya que en promedio, la velocidad del electrón en el átomo es mayor que la velocidad del protón. Considerando otro sistema de referencia inercial Σ0 y asumiendo el principio de relatividad, las ecuaciones de Maxwell en este nuevo sistema están dadas por: 0 (2.8) ∇ · E 0 = ρ0 /ε0 0 ∇ · B0 = 0 0 ∇ × B 0 = µ0 J 0 + µ0 ε0 (2.9) ∂E0 ∂t0 (2.10) ∂B0 (2.11) ∂t0 en donde las cantidades primadas se refieren a sus valores medidos por el observador Σ0 . Siguiendo los mismos pasos anteriores, obtenemos la ecuación de continuidad en el sistema de referencia Σ0 0 ∇ × E0 = − ∂ρ0 0 + ∇ · J0 = 0 ∂t0 (2.12) y el principio de la invarianza de la carga, que para el caso de una partícula elemental su valor invariante corresponde al valor medido de la carga, cuando ésta se encuentra en reposo respecto al sistema de referencia inercial Σ0 . Una suposición fundamental que está implícita en el principio de relatividad, es que parámetros tales como la carga , la masa, etc., de una partícula fundamental, cuando son medidos respecto a un sistema de referencia Σ para el cual la partícula está en reposo, toman el mismo valor numérico cuando se miden con respecto a otro sistema de referencia inercial Σ0 cuando la partícula se encuentra en reposo relativo respecto a este sistema Σ0 . Si aceptamos esta suposición, entonces el principio de la constacia de la carga eléctrica, se obtiene de las ecuaciones de Maxwell y del principio de relatividad. Consideremos, ahora, las ecuaciones de Maxwell en el vacío (ρ = 0, J = 0), en un sistema de referencia inercial Σ y tomemos el rotacional de la última ecuación de Maxwell (la ley de inducción de Faraday), entonces, teniendo en cuenta la identidad vectorial ∇ × ∇ × E = ∇(∇ · E) − ∇2 E (2.13) y la primera ecuación de Maxwell en el vacío ∇ · E = 0, obtenemos ∇2 E − µ0 ε0 ∂2E =0 ∂t2 (2.14) 2.1. POSTULADOS DE LA RELATIVIDAD ESPECIAL 23 Esta relación corresponde a la ecuación de ondas electromagnéticas (con una ecuación similar para el vector campo magnético), y describe la radiación electromagnética producida por algún sistema de cargas aceleradas, y cuya velocidad de propagación en el vacío, viene dada por: √ (2.15) c = 1/ µ0 ε0 siendo esta velocidad de propagación, independiente de la velocidad de la fuente (sistema de cargas aceleradas). Si ahora asumimos de nuevo la validez del principio de relatividad y consideramos otro sistema de referencia inercial Σ0 , obtenemos, siguiendo un razonamiento similar, la ecuación de ondas en el sistema de referencia Σ0 : ∇02 E 0 − µ00 ε00 ∂2E0 =0 ∂t02 (2.16) Esta ecuación describe la propagación de las ondas electromanéticas con una velocidad (µ00 ε00 )−1/2 en el vacío, la cual, como para el caso del sistema de referencia Σ, es también independiente del movimiento de las cargas fuente. Si definimos el amperio a través de la ley de Biot-Savart, como la corriente que circula por dos hilos paralelos infinitos, separados por una distancia de un metro en el vacío, para que sobre cada hilo se experimente una fuerza por unidad de longitud de 2 × 10−7 N w, entonces el valor de la constante permeabilidad magnética del vacío es: µ00 = µ0 = 4π × 10−7 N w/m (2.17) Por otra parte, si suponemos que la ley de Coulomb es válida en los dos sistemas de referencia inerciales Σ y Σ0 , y que la fuerza de Coulomb, entre dos partículas iguales en reposo relativo, por ejemplo dos electrones o protones, es la misma en ambos sistemas de referencia inerciales, entonces ε00 = ε0 y por lo tanto la velocidad de la luz es independiente del sistema de referencia inercial desde el cual ésta sea medida e independiente del movimiento de las fuentes. Si aceptamos ahora, que el postulado de la constancia de la velocidad de la luz es válido, y las ecuaciones de Maxwell son correctas, entonces ε00 = ε0 y también µ00 = µ0 . Esto implica que las unidades fundamentales de longitud, tiempo, masa y carga eléctrica deben ser definidas en la misma forma en todos los sistemas de referencia inerciales, así como también las constantes fundamentales de la física: la constante de Planck h = 6, 626 × 10−34 J · s, la constante de gravitación universal de Newton G = 6, 670 × 10−11 N w · m2 · kg −2 y la velocidad de la luz en el vacío c = 2, 998 × 108 m · s−1 . 24 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL Como fue originalmente propuesto por Planck, estas constantes fundamentales c, G y ~ = h/2π, pueden ser conbinadas para dar las unidades fundamentales de longitud, tiempo y masa: Lp := (G~/c3 )1/2 = 1, 616 × 10−35 m (2.18) Tp := (G~/c5 )1/2 = 5, 39 × 10−44 s (2.19) Mp := (~c/G)1/2 = 2, 18 × 10−8 kg (2.20) llamadas longitud, tiempo y masa de Planck respectivamente. Actualmente es práctica usual en la física trabajar con unidades de c = ~ = G = 1, las cuales son llamadas unidades fundamentales o naturales. 2.2. Transformaciones de Lorentz De lo discutido en la sección anterior, las leyes de la electrodinámica son físicamente compatibles con el principio de la constancia de la velocidad de la luz, pero a diferencia de las leyes de Newton, las ecuaciones de Maxwell no permanecen invariantes bajo las transformaciones de Gelileo. Esta situación nos conduce al problema de encontrar un conjunto de transformaciones de coordenadas compatibles con los postulados de la relatividad especial. Lorentz a finales del sigloXIX, encontró las transformaciones de coordenadas que dejaban invariante a las ecuaciones de Maxwell, pero en ningún momento las consideró como las ecuaciones de transformación entre sistemas de referencia inerciales, pues ellas claramente, no eran compatibles con las leyes de la mecánica Newtoniana. Estas transformaciones se conocen hoy día como las transformaciones de Lorentz. En esta sección mostraremos, que las transformaciones de Lorentz, constituyen el conjunto de ecuaciones de transformación de coordenadas entre sistemas de referencia inerciales, deduciéndolas a partir de los postulados fundamentales de la relatividad especial, junto con algunas suposiciones generales sobre homogeneidad e isotropía del espacio y del tiempo. Antes de abordar el problema de obtener las ecuaciones de transformación de coordenadas, es importante aclarar algunos conceptos sobre la forma como se definen y miden las coordenadas del espacio y del tiempo, y sobre los postulados de homogeneidad e isotropía. Al igual que en la mecánica Newtoniana, asumiremos que el espacio físico es homogéneo e isotrópico, lo cual implica que todos los puntos y todas las direcciones espaciales son equivalentes para describir los fenómenos físicos. Esto significa, en términos más precisos, que las leyes fundamentales 2.2. TRANSFORMACIONES DE LORENTZ 25 de la física no deben depender de la posición y de la dirección espacial, lo cual energía se traduce en la arbitrariedad para elegir el origen y la dirección de los ejes espaciales. Adicionalmente se postula que el espacio físico es tridimensional y obedece los postulados de la geometría euclideana. La homogeneidad e isotropía del tiempo, significan que las leyes de la física no deben depender de un instante particular ni de la dirección del tiempo elegida, es decir, la elección del origen y la escala para medir el tiempo es arbitraria (homogeneidad) y que las leyes de la física son invariantes bajo una transformación de la forma t → −t (isotropía). Estas propiedades del espacio y el tiempo deben quedar reflejadas en el sistema de coordenadas espacio-temporales elegido, así como la forma en que se miden las distancias espaciales y el intervalo temporal entre eventos físicos. Un evento es un fenómeno físico independiente del observador (tal como la colisión entre dos partículas, o la emisión de un fotón por un átomo), el cual ocurre en un punto del espacio y en un instante de tiempo y puede ser medido por instrumentos físicos adecuados. Adicional a los postulados anteriores sobre la estructura del espacio y el tiempo, suponemos que se puede definir una escala de medida de longitudes, igual para todos los observadores inerciales, la cual nos permite medir intervalos espaciales utilizando un sistema de reglas rígidas. Este procedimiento define una métrica para el espacio, que cumple con las propiedades de homogeneidad e isotropía y que obedece la geometría euclideana. El sistema de coordenadas cartesianas espaciales R3 con la métrica usual, esto es la métrica euclideana x ∈ R3 ⇒ |x|2 = x21 + x22 + x23 (2.21) nos ofrece el modelo matemático natural para describir el espacio físico. Uno de los aspectos cruciales de la teoría de la relatividad lo constituye el problema de la medida del tiempo. En efecto, Einstein en su primer artículo, dedica una buena parte de él a definir la forma como se miden los intervalos temporales entre eventos físicos. Definida ya la estructura métrica del espacio y el proceso de medida de intervalos espaciales, podemos utilizar el postulado de la constancia de la velocidad de la luz para definir el concepto de tiempo físico, es decir, el método operacional para la medida del tiempo que esté de acuerdo con los postulados fundamentales de la física y que refleje las propiedades de homogeneidad e isotropía del tiempo. En primer lugar se asume, que si dos eventos físicos ocurren en el mismo punto del espacio y simultáneamente (en el mismo instante de tiempo) para un observador inercial, entonces estos dos eventos físicos serán simultáneos 26 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL Figura 2.1: Sincronización de relojes para todos los observadores inerciales y ocurrirán también en el mismo punto del espacio. En otras palabras, la simultáneidad de eventos en un mismo punto del espacio es un hecho físico absoluto, i.e., independiente del observador. Supongamos además, que se dispone de un conjunto de relojes ideales e idénticos, es decir, algún dispositivo o fenómeno físico reproducible, que nos permita determinar una escala de tiempo y situemos uno de estos relojes en el origen de coordenadas espaciales escogido por un observador inercial. De acuerdo con la suposición sobre el caracter absoluto de la simultáneidad para eventos que tienen lugar en el mismo punto del espacio, el observador determinará un tiempo, el marcado por el reloj situado en su origen, para cada evento que ocurra en el origen de coordenadas. Este tiempo marcado por el reloj supone haber elegido un instante inicial, t = 0, el cual es arbitrario, de acuerdo con la hipótesis de homogeneidad del tiempo. Ahora, coloquemos en cada punto del espacio y en reposo relativo al reloj del origen, uno de estos relojes idénticos, y determinemos que el instante de tiempo en que un evento físico sucede, es el marcado por el reloj situado en el punto del espacio donde el evento tiene lugar. Hasta este momento se ha definido la medida del tiempo local y falta entonces “sincronizar” todos los relojes del observador inercial, para que este 2.2. TRANSFORMACIONES DE LORENTZ 27 observador asigne un único tiempo y así, una única coordenada temporal a cada evento físico, independiente de la posición espacial en la cual suceda dicho evento. Para sincronizar los relojes seguiremos el método expuesto por Einstein en su primer artículo. Para el reloj situado en el origen de coordenadas, elijamos un instante cualquiera como el tiempo t = 0. Consideremos un segundo reloj situado a una distancia d del origen y enviemos, desde el origen y en la dirección de este segundo reloj, un rayo de luz en en el instante en que el reloj del origen marca t1 (Figura 2.1). Este segundo reloj marcará un tiempo t2 cuando el rayo de luz lo alcanza, y se define entonces que los dos relojes están sincronizados, si se cumple que t2 = t1 + d c (2.22) Con estas definiciones de medida de la distancia y del intervalo temporal, un observador inercial construye su sistema de coordenadas espaciotemporal. Este procedimiento es consistente y válido para todos los observadores inerciales, puesto que la distancia d para puntos en reposo relativo está bien definida y es por su definición independiente del observador, así como la velocidad de la luz en el vacío c es una constante universal, de acuerdo con el segundo postulado. La coordenada temporal para un evento, se le define, entonces, como la lectura del reloj que está situado en el punto del espacio donde el evento ocurre, y de acuerdo con la hipótesis del caracter absoluto de la simultáneidad, para eventos que suceden en el mismo punto del espacio, este procedimiento es independiente del observador. Habiendo definido la forma como un observador inercial construye su sistema de coordenadas espacio-temporales, abordemos, ahora, el problema de encontrar las ecuaciones que relacionan las coordenadas de un evento, asignadas por dos observadores inerciales. Sea p un evento físico, y séan (t, x, y, z) y (t0 , x0 , y 0 , z 0 ) las coordenadas del evento, medidas por los dos observadores inerciales Σ y Σ0 . De acuerdo con la homogéneidad e isotropía del espacio y el tiempo, supongamos, sin pérdida de generalidad, que los dos observadores eligen los ejes coordenados espaciales paralelos, con v, la velocidad del sistema Σ0 respecto a Σ, en la dirección positiva de los ejes x, x0 , y además, define cada observador, el origen de la coordenada temporal t = t0 = 0, en el instante en que los orígenes espaciales de los sistemas coinciden (Figura 2.2). El conjunto de transformaciones de coordenadas, que estamos buscando, 28 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL Figura 2.2: Transformaciones de Lorentz lo podemos escribir en la forma general como: t0 = f1 (t, x, y, z) (2.23) x0 = f2 (t, x, y, z) (2.24) y 0 = f3 (t, x, y, z) (2.25) z 0 = f4 (t, x, y, z) (2.26) con la condición que las funciones fi séan invertibles, es decir, que se puedan despejar las coordenadas (t, x, y, z) en función de las coordenadas primadas (t0 , x0 , y 0 , z 0 ). Otra condición general sobre las funciones fi la impone la primera ley de Newton la cual implica que una partícula libre debe moverse con velocidad constante para todos los observadores inerciales. Esta exigencia implica que las ecuaciones de transformación deben ser lineales en las coordenadas. Así, el sistema de ecuaciones de transformación (2.23), (2.24), (2.25) y (2.26) lo podemos escribir como: t0 = a00 t + a01 x + a02 y + a03 z (2.27) x0 = a10 t + a11 x + a12 y + a13 z (2.28) 2.2. TRANSFORMACIONES DE LORENTZ 29 y0 = a20 t + a21 x + a22 y + a23 z (2.29) z 0 = a30 t + a31 x + a32 y + a33 z (2.30) en donde los coeficientes ai,j son constantes independientes de las coordenadas. Estos coeficientes ai,j son funciones, a lo sumo, de la velocidad del sistema de referencia Σ0 respecto a Σ, pues se supone que todos los observadores eligen las mismas escalas para medir distancias y tiempos. La linealidad implica también que los ejes espaciales de Σ0 permanecen siempre paralelos a si mismos y así a los ejes espaciales de Σ. Además, la velocidad del sistema Σ respecto a Σ0 es igual a −v (igual en magnitud y opuesta a la velocidad de Σ0 respecto a Σ), y por lo tanto la transformación inversa debe tener la misma forma cambiando v por −v. Para el caso cuando v = 0, la transformación se reduce a la identidad. La condición de existencia de la transformación inversa, por otra parte, queda garantizada exigiendo que el determinante de los coeficientes aij sea diferente de cero. De la escogencia de los ejes espaciales se obtiene que los planos y = 0 y y0 = 0 coinciden permanentemente (todos los ejes espaciales de los dos sistemas de referencia permanecen paralelos) y por lo tanto la ecuación de transformación para la coordenada y 0 debe reducirse a: y 0 = a22 y (2.31) Si invertimos las direcciones de los ejes x y z de Σ no se debe afectar la relación anterior, y por lo tanto la transformación inversa de Σ0 a Σ, para la coordenada y, toma la forma y = a022 y 0 = a22 y 0 (2.32) Esto implica, por lo tanto que se debe cumplir que a22 = ±1. Por otra parte, dado que para v → 0 se cumple que y0 → y, entonces a22 = 1 (2.33) Un argumento similar vale para la coordenada z, entonces y0 = y ; z 0 = z (2.34) Puesto que la transformación de coordenadas es lineal y las coordenadas del origen del sistema de referencia Σ0 , medidas por el observador Σ, están dadas por x = vt, entonces x0 debe ser de la forma x0 = γ(x − vt) (2.35) 30 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL donde γ es un parámetro que, en general, depende de la velocidad. Por simetría, la transformación inversa para la coordenada x tendrá la misma forma (con v cambiada por −v), entonces x = γ 0 (x0 + vt0 ) (2.36) siendo γ 0 otra constante dependiente de v. Si invertimos las direcciones de los ejex x y z en Σ y Σ0 , entonces las relaciones (2.35) y (2.36) se siguen cumpliendo, es decir si cambiando x → −x y x0 → −x0 tenemos que −x0 = γ(−x − vt) =⇒ −x = γ 0 (−x0 + vt0 ) =⇒ 0 x = γ(x + vt) (2.37) y 0 0 0 x = γ (x − vt ) (2.38) de donde se obtiene que γ = γ 0 , pues, del principio de relatividad la física no debe depender de la dirección elegida para los ejes espaciales. Además, el parámetro γ debe ser positivo dado que para t = 0, x0 > 0 si x > 0. Para encontrar una expresión explícita para γ y la forma como la coordenada temporal se transforma, apliquemos ahora el segundo postulado de la constancia de la velocidad de la luz en el vacío. Si en el instante t = 0 = t0 , cuando los orígenes coinciden, se emite un pulso de luz en la dirección del eje x positivo, entonces se debe satisfacer que al cabo de un tiempo t, medido en Σ, el pulso de luz esté en un punto del espacio cuya coordenada x, medida en Σ, cumpla x = ct. De acuerdo con el postulado de la constancia de la velocidad de la luz en el vacío, para el observador Σ0 se debe cumplir que el pulso de luz llega al punto del espacio de coordenada x0 , en un instante t0 , tal que x0 = ct0 . Substituyendo estas dos relaciones, x = ct y x0 = ct0 , en las ecuaciones (2.35) y (2.36), multiplicando las ecuaciones resultantes y eliminando el término tt0 , obtenemos 1 γ = γ(v) = p 1 − v 2 /c2 (2.39) conocido como el factor gamma de Lorentz. A partir de esta expresión y eliminando la coordenada x0 entre las ecuaciones (2.35) y (2.36), obtenemos la ecuación de transformación para la coordenada temporal: t0 = γ(t − vx/c2 ) (2.40) 2.3. PROPIEDADES DE LAS TL 31 Resumiendo, el conjunto de transformaciones de coordenadas, llamadas transformaciones de Lorentz (TL), que relacionan las coordenadas espaciotemporales de un evento físico medidas por dos observadores inerciales, están dadas por: t0 = γ(t − vx/c2 ) x0 = γ(x − vt) (2.41) y0 = y z0 = z Así, el principio de relatividad exige que las leyes de la física deben ser tales que ellas permanezcan invariantes bajo las tranformaciones de Lorentz (ecuaciones (2.41)), pues, como veremos en la siguiente sección donde se discutirán algunas propiedades de las TL, éllas contienen implícitamente al postulado de la constancia de la velocidad de la luz. Para encontrar las transfomaciones de Lorentz inversas, es decir, las transformaciones de coordenadas para pasar del sistema Σ0 al sistema Σ, basta con invertir las ecuaciones (2.41), o en forma equivalente, cambiando v por −v en las TL (2.41) y las coordenadas primadas por las no primadas (por la simetría entre los sistemas Σ y Σ0 ): t = γ(t0 + vx0 /c2 ) x = γ(x0 + vt0 ) (2.42) y = y0 z = z0 2.3. Propiedades de las TL Las ecuaciones de transformación de Lorentz encontradas en la sección anterior, corresponden a un caso particular de un conjunto de transformaciones más general, que constituyen la expresión matemática del principio de relatividad y de las propiedades de homogeneidad e isotropía del espacio y el tiempo. En efecto, el conjunto de transformaciones de coordenadas más general se puede escribir en la forma: 0µ x = 3 X Λνµ xν + aµ ; µ, ν = 0, 1, 2, 3 (2.43) ν=0 con Λνµ y aµ constantes independientes de las coordenadas. Para simplificar las expresiones hemos introducido la notación ct ≡ x0 ; x ≡ x1 ; y ≡ x2 ; z ≡ x3 (2.44) 32 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL de tal manera que la coordenada temporal la medimos en unidades de longitud, dado el carácter de constante universal de la velocidad de la luz c. Esta redefinición de la coordenada temporal nos permite, como veremos más adelante, escribir las transformaciones de Lorentz en una forma más simétrica y resaltar en forma explícita el papel de la coordenada temporal en la teoría de la relatividad. En lo sucesivo utilizaremos índices griegos, que recorren de 0 a 3, para describir las coordenadas de un evento y dejaremos los índices latinos para describir solamente las coordenadas espaciales. Las ecuaciones de transformación (2.43) constituyen un conjunto de transformaciones lineales no homogéneas, en donde las cuatro constantes aµ corresponden a la arbitrariedad para elegir el origen de las coordenadas espaciales (µ = 1, 2, 3) y de la coordenada temporal (µ = 0), y así representan la homogeneidad del espacio-tiempo. Esta propiedad de homogeneidad del espacio y el tiempo, en términos más formales, se traduce en el principio de invarianza de la física bajo translaciones espaciales (ai ; i = 1, 2, 3) y translaciones temporales (a0 ). De sta forma, la invarianza de las leyes de la física bajo translaciones espacio-temporales, nos permiten elegir las coordenadas de los dos sistemas de referencia inerciales de tal manera que coincidan sus orígenes espaciales para t = t0 = 0, haciendo que el término inhomogéneo del sistema de ecuaciones (2.43) se anula, y en este caso las ecuaciones de transformación se reducen al sistema lineal homogéneo 0µ x = 3 X Λµν xν ; µ, ν = 0, 1, 2, 3 (2.45) ν=0 Este conjunto de transformaciones, contiene dos casos especiales: Por una parte están las rotaciones de los ejes espaciales, las cuales reflejan la isotropía del espacio, es decir, que la leyes físicas no deben depender de la orientación de los ejes espaciales. Una rotación de los ejes espaciales queda determinada por tres parámetros, por ejemplo, los tres ángulos de Euler. Por otra parte, están las llamadas transformaciones de Lorentz puras, caracterizadas por las tres componentes de la velocidad relativa de los sistemas de referencia inerciales. Así, las transformaciones de Lorentz deducidas en la sección anterior, constituyen un caso particular del conjunto de transformaciones (2.43), en donde el movimiento relativo entre los sistemas de referencia es a lo largo de un eje coordenado, con ejes espaciales paralelos (no hay rotación de ejes) y sin translación de los orígenes espacial y temporal (Figura 2.3). En este caso basta con un solo parámetro, la magnitud de la velocidad relativa, para 2.3. PROPIEDADES DE LAS TL 33 Figura 2.3: Transformación general de coordenadas determinar completamente la transformación. En el caso de general de una transformación de coordenadas que involucre movimiento relativo, cambio de orientación de los ejes espaciales y translación del origen de coordenadas espacial y temporal, se requieren entonces 10 parámetros para determinar completamente la transformación: Los tres parámetros ai , i = 1, 2, 3 que determinan el cambio del origen espacial, un parámetro a0 para el desplazamiento del origen temporal, tres parámetros (e.g. los ángulos de Euler) para determinar una rotación de los ejes espaciales y tres parámetros (e.g. las tres componentes de la velocidad relativa) para determinar una transformación pura de Lorentz. Para los objetivos del presente libro, salvo se especifique lo contrario, es suficiente considerar solamente transformaciones de Lorentz puras con los ejes xx0 en la dirección de la velocidad relativa de los sistemas de referencia y supondremos además, que los orígenes de los sistemas coinciden para el tiempo cero en ambos sistemas. Antes de continuar con la discusión de algunas propiedades de las transformaciones de Lorentz, reescribamos las ecuaciones de transformación (2.41) 34 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL Figura 2.4: Composición de transformaciones de Lorentz en la notación introducida en la ecuación (2.44): x00 = γ(x0 − βx1 ) x01 = γ(x1 − βx0 ) x02 = x2 x03 = x3 (2.46) en donde se ha definido el parámetro adimensional β = v/c y así γ(v) = (1−β 2 )−1/2 . Como se mencionó al comienzo de esta sección, las ecuaciones de transformación de Lorentz adquieren una forma simétrica en las coordenadas espaciales y la temporal. Así, los coeficientes de la transformación de Lorentz Λνµ , llamados también elementos de la matriz de transformación de Lorentz, en la ecuación (2.45) están dados por: Λ00 = Λ11 = γ = Λ10 = −βγ 2 Λ 2 = Λ33 = 1 Λ01 (2.47) siendo los demás coeficientes cero. Consideremos ahora tres sistemas de referencia inerciales Σ, Σ0 y Σ00 , con ejes paralelos, movimiento relativo a lo largo del eje espacial x1 , y orígenes 2.3. PROPIEDADES DE LAS TL 35 espaciales coincidentes para t = t0 = t00 = 0 (Figura 2.4). Sea v la velocidad del sistema de referencia Σ0 respecto a Σ y w la velocidad del sistema Σ00 respecto a Σ0 , y sean (x0 , x1 , x2 , x3 ), (x00 , x01 , x02 , x03 ) y (x000 , x001 , x002 , x003 ) las coordenadas de un evento físico medidas por los tres observadores Σ, Σ0 y Σ00 , respectivamente. La relación entre las coordenadas del evento medidas por Σ y Σ0 están dadas por la ecuación (2.46) y la relación entre las coordenadas medidas por Σ0 y Σ00 están dadas por las ecuaciones: x000 = γ(w)(x00 − β 0 x01 ) x001 = γ(w)(x01 − β 0 x00 ) x002 = x02 x003 = x03 (2.48) en donde β 0 = w/c. Las ecuaciones de transformación que relacionan las coordenadas medidas por Σ y Σ00 se obtienen entonces, componiendo las dos transformaciones, es decir, remplazando las coordenadas del sistema Σ0 de la ecuación (2.46), en esta última ecuación (2.48). Despues de reagrupar términos, las ecuaciones de transformación finales, como era de esperarse, toman la misma forma: x000 = γ(u)(x0 − β 00 x1 ) x001 = γ(u)(x1 − β 00 x0 ) x002 = x2 x003 = x3 (2.49) en donde β 00 = u/c y u es la velocidad relativa del sistema de referencia Σ00 respecto a Σ, la cual está dada por la ecuación u= w+v 1 + wv/c2 (2.50) Esta ecuación corresponde a la versión relativista del teorema de adición de velocidades de Galileo. Notemos si v < c y w < c entonces u < c. Notemos que las ecuaciones de transformación de Lorentz y el teorema de adición de velocidades se reducen a las ecuaciones de transformación de Galileo y al teorema de adición de velocidades Galileano cuando c → ∞. Este límite formal, sin embargo, carece de significado físico en la medida que la velocidad de la luz en el vacío es una constante universal y por lo tanto este límite debe entenderse mejor en el siguiente sentido. Para velocidades pequeñas comparadas con la velocidad de la luz v ¿ c, tanto las ecuaciones de transformación de Lorentz, como el teorema de adición de velociades, se reducen a las ecuaciones de transformación de Galileo 36 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL y al teorema de adición de velocidades galileano, respectivamente. Para ver esto, es suficiente recordar la expansión en serie de Taylor de la función (1 + xr ) = 1 + rx + r (r − 1) 2 x +··· 2! (2.51) la cual converge para |x| < 1. Si aplicamos esta expansión al factor γ (v) tenemos ¶−1/2 µ v2 γ (v) = 1− 2 c 1 v2 = 1+ +··· (2.52) 2 c2 Remplazando esta expansión en las ecuaciones de transformación de Lorentz 2.41 obtenemos ¶ µ 1 v2 + · · · (x − vt) x´ = 1+ 2 c2 µ 2¶ v = x − vt + O 2 (2.53) c ¶³ µ v ´ 1 v2 + · · · t − x t´ = 1+ 2 c2 c2 µ 2¶ v = t+O c2 (2.54) ¡ ¢ en donde O v 2 /c2 representa términos del orden de v 2 /c2 , los cuales son muy pequeños si v/c << 1 y por lo tanto las ecuaciones de transformación de Galileo corresponden a una aproximación a vajas velocidades de las ecuaciones de Lorentz. Un resultado similar se obtiene pata el teorema de adición de velociades. Este límite de bajas velocidades juega el papel de un principio de correspondencia, en el sentido de que la “física Newtoniana es una teoría válida” para describir los fenómenos, cuando las velocidades típicas involucradas en los procesos bajo consideración son bajas comparadas con la velocidad de la luz y por lo tanto, las ecuaciones de la relatividad deben reducirse a las correspondientes relaciones clásicas, en este límite de velocidades bajas. Es importante aclarar el significado de la frase “validez de la física Newtonianas para velocidades v << c”. Dado que toda medida experimental de una cantidad física, lleva consigo un error experimental, entonces las predicciones 2.3. PROPIEDADES DE LAS TL 37 de la mecánica clásica para los diferentes observables de un sistema dado, están en concordancia con los resultados experimentales, dentro del rango de error experimental. Así, el límite clásico, o el rango de velocidades para el cual la mecánica clásica es aplicable, depende de la precisión experimental. El límite formal c → ∞ se puede entender fícamente en el sentido que c representa la vélocidad máxima de propagación de señales físicas, independientemente que esta constante corresponda a la velocidad de la luz en el vacío, y por lo tanto si c → ∞ esto significaría que podemos enviar información a velocidad infinita, lo que implicaría que tendríamos a disposición un mecanismo instantáneo para calibrar relojes, lo que implicaría que todos los observadores inerciales medirían la misma coordenada temporal para un evento dado. Así podemos entender la hipótesis de Newton de un tiempo universal independiente del observador, como la hipótesis de una velocidad infinita para transmitir información. Notemos además que en efecto la tercera ley de Newton requiere de esta hipótesis, pues esta ley exige que las fuerzas de acción y reacción sean iguales en todo instante, independientemente de la posición de los cuerpos que están en interacción. Retomando las ecuaciones de transformación (2.49), vemos que dos transformaciones de Lorentz sucesivas, conducen a una nueva transformación de Lorentz, cuyo parámetro (la velocidad relativa) está dado por la ecuación (2.50). Por otra parte, la transformación de Lorentz inversa, es decir, las ecuaciones de transformación de coordenadas del sistema Σ0 al Σ, tienen la misma forma (ecuación (2.46)), pero cambiando el parámetro v por −v. Además, la transformación identidad, esto es, del sistema Σ sobre el mismo, corresponde a una transformación de Lorentz con parámetro v = 0, trivialmente. Si escribimos formalmente una transformación de Lorentz entre Σ y Σ0 , como L(v) : Σ −→ Σ0 (2.55) x −→ x0 = L(v)x entonces, las propiedades encontradas, las podemos fresumir formalmente de la siguiente manera: L(w) ◦ L(v) = L(u) w+v u = 1 + wv/c2 L(v = 0) = id ⇒ L(0) ◦ L(v) = L(v) ◦ L(0) = L(v) (2.56) (2.57) (2.58) L−1 (v) = L(−v) (2.59) L(v) ◦ L(−v) = L(−v) ◦ L(v) = id (2.60) 38 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL en donde id significa la transformación identidad, L−1 (v) la transformación inversa, y el producto L(w) ◦ L(v) representa la composición de dos transformaciones sucesivas. Un grupo matemático es un conjunto de elementos G, con una operación interna llamada producto, es decir, el producto de dos elementos de G es de nuevo un elemento del conjunto y esta operación debe satisfacer las siguientes propiedades: i.-Existe un elemento del grupo G, llamado la identidad, tal que la identidad por cualquier elemento del grupo es el mismo elemento del grupo. ii.-Para todo elemento del grupo, existe otro elemento en el grupo, tal que su producto es la identidad. Un grupo se llama abeliano, si la operación producto es conmutativa. Las relaciones simbólicas representadas en las ecuaciones (2.56), (2.58), (2.59) y (2.60), muestran que las transformaciones de Lorentz forman un grupo matemático, llamado el grupo de Lorentz. Para el caso particular que estamos considerando, esto es, de transformaciones entre sistemas de referencia con ejes paralelos y movimiento relativo a lo largo del eje x, el grupo es claramente abeliano, y cada elemento del grupo corresponde, o está caracterizado por el valor de la velocidad. Puesto que la velocidad puede tomar cualquier valor entre −c < v < c, el grupo contiene un número infinito no numerable de elementos, y así este grupo es conocido en la literatura como un grupo de Lie de un parámetro o grupo continuo, en contraposición con los grupos finitos o discretos, tales como por ejemplo, los números enteros con la operación suma. El caso de las transformaciones generales, ecuación (2.43), energía forman un grupo, llamado el grupo de Poincaré, el cual es energía un grupo de Lie pero de diez parámetros, pues como vimos, una transformación general requiere de 10 parámetros para caracterizarla. Otra propiedad muy importante de las TL, la cual va a jugar un papel fundamental en el problema de la causalidad en física, es que las TL dejan invariante una cantidad, que la llamaremos intervalo o distancia espaciotemporal entre eventos. Sean ℘1 y ℘2 dos eventos físicos cualesquiera y sean (x01 , x11 , x21 , x31 ) y (x02 , x12 , x22 , x32 ) las coordenadas de los dos eventos, medidas por un observador inercial Σ. Definamos el intervalo espacio-tiempo entre los dos eventos por: 2 ∆S12 := (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 (2.61) Sea Σ0 otro observador inercial que se mueve con velocidad v respecto 01 02 03 00 01 02 03 a Σ y sean (x00 1 , x1 , x1 , x1 ) y (x2 , x2 , x2 , x2 ) las coordenadas de los dos 0 eventos ℘1 y ℘2 medidas por Σ . Entonces, para este nuevo observador, el 2.3. PROPIEDADES DE LAS TL 39 intervalo espacio-tiempo entre los dos eventos está dado por: 02 00 2 01 01 2 02 02 2 03 03 2 := (x00 ∆S12 2 − x1 ) − (x2 − x1 ) − (x2 − x1 ) − (x2 − x1 ) (2.62) Utilizando las TL (ecuaciones (2.46)) expresemos el intervalo espaciotiempo medido por Σ0 (ecuación (2.62)), en términos de las coordenadas del observador Σ: 02 = (γ(x02 − βx12 ) − γ(x01 − βx11 ))2 − (γ(x12 − βx02 ) ∆S12 −γ(x11 − βx21 ))2 − (x22 − x21 )2 − (x32 − x31 )2 (2.63) reagrupando términos obtenemos 02 2 = (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 = ∆S12 (2.64) ∆S12 Este resultado significa que el intervalo espacio-tiempo entre dos eventos físicos es una cantidad independiente del observador y así es un invariante físico, lo que implica que el valor numérico del intervalo es siempre el mismo, sin importar cual observador lo mida. A las variables físicas que son invariantes bajo transformaciones de Lorentz se les llama invariantes relativistas o escalares de Lorentz, y claramente juegan un papel fundamental, pues al ser independientes del observador, nos caracterizan propiedades intrínsecas del sistema o de los fenómenos físicos. Las implicaciones físicas, para el caso particular del intervalo espaciotiempo, serán discutidas en el próximo capítulo con mayor detalle. Es im2 portante solamente resaltar en este punto dos aspectos: en primer lugar ∆S12 puede ser positivo, negativo o cero, y en segundo lugar, el último caso cuan2 es cero, corresponde a la expresión matemática del principio de la do ∆S12 constancia de la velocidad de la luz, pues si desde el punto del espacio y en el instante donde ocurre el primer evento, por ejemplo ℘1 , se emite un rayo de luz en dirección del evento ℘2 , entonces este rayo de luz alcanza el punto del espacio en el instante de tiempo, en que el segundo evento ocurre. Esto se ve fácilmente, pues de la definición del intervalo espacio-tiempo, ecuación (2.61) o (2.62), y recordando que x0 = ct, entoces despejando c de cualquiera 2 = 0 = ∆S 02 ) implica que c =(distancia espade estas dos ecuaciones (∆S12 12 cial entre los eventos)/(intervalo temporal entre los eventos) es un invariante relativista. Es importante resaltar que el intervalo espacio-tiempo es invariante bajo las transformaciones generales de coordenadas (ecuación (2.43)), y no solamente bajo las transformaciones de Lorentz puras consideradas, pues por una parte, el témino inhomogéneo de las transformaciones se cancela al 40 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL tomar la diferencia de las coordenadas, mientras que las rotaciones de los ejes espaciales dejan invariante la distancia espacial (ver sección 4.1) (x12 − x11 )2 + (x22 − x21 )2 + (x32 − x31 )2 (2.65) permaneciendo la coordenada temporal inanalterada. Otra característica importante que se deriva directamente de las TL, es que las velocidades relativas entre sistemas de referencia inerciales, deben ser siempre menores que la velocidad de la luz, pues el factor γ(v) diverge para v = c y se hace imaginario si v > c, lo cual es inadmisible dado el significado físico asignado a las coordenadas utilizadas. 2.4. Consecuencias de las TL Para finalizar el presente capítulo, vamos a considerar dos consecuencias de las TL que constituyen, tal vez, los dos resultados más sorprendentes de la teoría especial de la relatividad y por esta razón los más conocidos en la literatura de divulgación científica. Consideremos para comenzar el problema de la dilatación temporal. En primer lugar definamos el concepto de tiempo propio, como el intervalo de tiempo ∆τ entre dos eventos ℘1 y ℘2 , medido por un mismo reloj. Esto significa, equivalentemente, que existe un sistema de referencia inercial, llamémolo Σ, para el cual los dos eventos ocurren en el mismo punto del espacio. Así, las coordenadas de estos dos eventos para el observador Σ están dadas por (x01 , x11 , x21 , x31 ) y (x02 , x12 , x22 , x33 ), con x02 − x01 = c∆τ y xi2 = xi1 ; i = 1, 2, 3. Suponiendo, sin pérdida de generalidad, que el evento 2 ocurre después que el evento 1 para el observador Σ, i.e. x02 > x01 , y como xi2 = xi1 ; i = 1, 2, 3, pues los dos eventos por definición, tienen lugar en el mismo punto del espacio, es claro que para cualquier otro observador inercial, por ejemplo Σ0 , los dos eventos suceden en puntos diferentes del espacio, y por lo tanto, 2 entre los dos evendada la invarianza del intervalo espacio-tiempo ∆S12 0 tos, el intervalo de tiempo medido por Σ para estos dos eventos, debe ser mayor que el intervalo de tiempo propio. Para probar esta afirmación, sean 01 02 03 00 01 02 03 0 (x00 1 , x1 , x1 , x1 ) y (x2 , x2 , x2 , x2 ) las coordenadas de estos eventos y ∆t 0 el intervalo de tiempo medido en Σ , con 00 c∆t0 = x00 2 − x1 (2.66) Utilizando las TL para remplazar en esta expresión las coordenadas primadas en términos de las no primadas y aplicando la definición de tiempo 2.4. CONSECUENCIAS DE LAS TL 41 propio, obtenemos c∆t0 = γ(x02 − βx12 ) − γ(x01 − βx11 ) (2.67) y puesto que en sistema de referencia inercial Σ los dos eventos suceden en el mismo punto del espacio, i.e. x12 = x11 , llegamos finalmente a la ecuación de dilatación temporal: ∆τ ∆t0 = γ∆τ = p 1 − v 2 /c2 (2.68) pues el factor γ simpre es mayor que 1, para v 6= 0. De paso hemos demostrado, que si dos eventos ocurren para un observador en un mismo punto del espacio, el orden temporal de los eventos (e.g. x02 − x01 > 0) es el mismo 00 para todos los observadores, es decir si x02 − x01 > 0 entonces x00 2 − x1 > 0, y el tiempo propio es el intervalo de tiempo más pequeño medido por algún observador. Esto justifica el nombre de dilatación temporal, y significa físicamente, que los dos eventos están conectados causalmente, es decir, que el evento posterior pudo ser causado por el primer evento, aún cuando no necesariamente exista un proceso físico que los ligue. Notemos además que el intervalo de tiempo entre dos eventos puede hacerse tan grande como se quiera, si tomamos velocidades suficientemente cercanas a la velocidad de la luz, pues 1 ≤ γ < ∞ para 0 ≤ v < c, y por lo tanto dado ∆τ > 0, entonces ∆t0 = γ∆τ puede hacerse tan grande como se quiera haciendo que v −→ c. Calculemos, ahora el intervalo espacio-tiempo para estos dos eventos. En el sistema Σ obtenemos la expresión 2 ∆S12 = (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 = c2 ∆τ 2 > 0 (2.69) el cual nos indica, que para el caso que estamos considerando, el intervalo espacio-tiempo nos mide directamente (salvo un factor constante c2 ) el intervalo de tiempo propio. Si calculamos este mismo intervalo, ahora en el sistema de referencia Σ0 (ver ecuación (2.62)), por su invarianza, obviamente obtenemos el mismo resultado. Esto nos muestra, sin ulteriores cálculos, que el intervalo de tiempo en Σ0 debe ser mayor que en Σ, pues a c2 ∆t02 le estamos restando una cantidad positiva, que nos da la distancia espacial entre los dos eventos medidos en el sistema Σ0 . ¿Cuando tiene sentido hablar del intervalo de tiempo propio entre dos eventos?. Para responder a esta pregunta, consideremos dos eventos físicos 2 entre ellos en algún cualesquiera ℘1 y ℘2 y calculemos el intervalo ∆S12 0 1 2 3 sistema de referencia inercial Σ. Sean (x1 , x1 , x1 , x1 ) y (x02 , x12 , x22 , x32 ) las 42 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL coordenadas de los eventos ℘1 y ℘2 respectivamente, y supongamos para simplificar los cálculos, pero sin perder generalidad del resultado, que x22 = x21 y x32 = x31 , entonces: 2 = (x02 − x01 )2 − (x12 − x11 )2 ∆S12 (2.70) Por lo tanto, si este intervalo es mayor que cero, esto significa que siempre es posible encontrar un sistema de referencia inercial Σ0 , para el cual los dos eventos ocurren en el mismo punto del espacio, así 2 00 2 2 2 ∆S12 = (x00 2 − x1 ) = c ∆τ (2.71) pues, dadas las coordenadas de los dos eventos en Σ, basta con considerar un sistema de referencia Σ0 el cual se mueva con una velocidad v respecto a Σ dada por x1 − x11 v (2.72) β = = 20 c x2 − x01 Para el caso que estamos considerando, la velocidad ν del sistema Σ0 está a lo largo del eje de las x y su dirección depende de la posición relativa entre los eventos (x12 − x11 > 0 o x12 − x11 < 0) en Σ, y del orden temporal entre ellos, es decir si x02 − x01 > 0 o x02 − x01 < 0 (ver ecuación (2.72)). Ahora bien, si el intervalo espacio-tiempo entre los eventos medido en algún 2 , sistema de referencia fuera menor o igual a cero, dada la invarianza de ∆S12 es obvio que no existe un sistema de referencia para el cual los dos eventos ocurran en el mismo punto del espacio, y por lo tanto, en este caso, no tiene sentido hablar de tiempo propio entre los eventos. Además, para esta última situación considerada, como lo veremos en seguida, el orden temporal entre los eventos puede invertirse o ser simultáneos para algunos observadores, lo que implica físicamente que los dos eventos no pueden estar causalmente conectados, pues para que un evento fuera causa del otro, se necesitaría transmir información a una velocidad mayor a la de la luz. La segunda consecuencia importante de las TL, se relaciona con la contracción de longitudes. Para entender el significado físico de este fenómeno, definamos primero lo que se entiende por medir la longitud de un cuerpo. Consideremos el problema de medir la longitud de una varilla rígida. Supongamos que para un observador inercial Σ la varilla se encuentra en reposo y elijamos el eje de las x a lo largo de la varilla. Por definición, la longitud de la varilla está dada por la diferencia de las coordenadas de los extremos de la varilla: (2.73) L0 = x12 − x11 2.4. CONSECUENCIAS DE LAS TL 43 en donde se ha supuesto, sin pérdida de generalidad, que x12 > x11 . Esta definición es físicamente consistente, puesto que la varilla está en reposo para el observador Σ. De la misma manera como definimos tiempo propio, llamemos a L0 , definido en la ecuación (2.73), longitud propia de la varilla. En términos generales, definimos la longitud propia de un cuerpo cualquiera, como la longitud del cuerpo medida en el sistema de referencia, en el cual el cuerpo se encuentra en reposo. El problema surge, cuando el cuerpo al cual se le quieren medir sus dimensiones, está en movimiento. Consideremos entonces, otro sistema de referencia Σ0 , el cual se mueve con velocidad v respecto a Σ y definamos la longitud de la varilla en Σ0 , como la diferencia de las coordenadas de los extremos de la varilla en un instante dado t0 : 01 L = x01 2 − x1 (2.74) Esto significa, que el observador Σ0 mide simultáneamente la posición de los extremos de la varilla, y define su longitud como la diferencia de las coordenadas espaciales de los dos eventos físicos, cuyas coordenadas están dadas 01 00 01 por (x00 1 , x1 , 0, 0) y (x2 , x2 , 0, 0). Para encontrar la relación entre las medidas realizadas por los dos observadores, basta con aplicar las TL, teniendo en cuenta que en el sistema Σ0 los eventos (coordenadas espacio-tiempo de los extremos de la varilla) deben ser simultáneos. Así, de la ecuación (2.73) y de las TL inversas (ecuaciones (2.42)), tenemos 0 01 0 01 01 L0 = γ(x01 2 + βt ) − γ(x1 + βt ) = γ(x2 − x1 ) (2.75) y aplicando la definición (2.74) para la longitud de la barra medida por Σ0 , llegamos al resultado p (2.76) L = L0 1 − v 2 /c2 el cual esptablece que la longitud física p en la dirección de movimiento de un sólido, se vé contraida en un factor 1 − v 2 /c2 con respecto a la longitud propia del sólido, en donde v es la velocidad del cuerpo respecto al observador inercial que mide su longitud. De las TL se ve directamente que las dimensiones transversales al movimiento de un sólido no se alteran en virtud de su movimiento. Una consecuencia inmediata de este efecto de la contracción, es que en física relativista los conceptos de sólido rígido y fluido incomprensible no son válidos, en general. La ecuación (2.76) la habían postulado Fitzgerald y Lorentz para explicar el resultado negativo del experimento Michelson-Morley, pues si en brazo del interferómetro a lo largo de la dirección de movimiento de la tierra se contrayese de acuerdo a esta ecuación, entonces se puede mostrar fácilmente que no aparecerían franjas 44 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL de interferencia, pues los caminos ópticos de los dos rayos de luz serían iguales. El problema con el razonamiento de Fitzgerald y Lorentz es que los brazos del interferómetro están en reposo respecto a la tierra, y por lo tanto su longitud medida en la tierra, de acuerdo a la relatividad, es la longitud propia y no debe aparecer contraída. Estas dos primeras consecuencias de la teoría de la relatividad, dilatación temporal y contracción de longitudes, a pesar de su caracter bastante extraño a nuestra intuición clásica, han sido corroboradas en varios experimentos. El primer experimento reportado, fue realizado por Rossi y Hall (Rossi, B. & Hall, D. B., Phys. Rev., 59,223, 1941) utilizando unas partículas elementales, los muones µ− , descubiertas en los rayos cósmicos. La gran mayoría de las partículas elementales conocidas son inestables, es decir, que estas partículas después de haber sido producidas por algún proceso, decaen expontáneamente en otras partículas al cabo de un cierto tiempo, llamado tiempo propio o tiempo de vida media de la partícula (este tiempo de vida es característico de cada clase de partícula). Por ejemplo, si producimos un muón µ− en reposo en el laboratorio, entonces pasados unos 2, 2 × 10−6 s la partícula se desintegra en un electrón y en dos neutrinos. Los rayos cósmicos son haces de partículas, fundamentalmente protones y electrones de alta energía, los cuales al incidir sobre las capas superiores de la atmósfera terrestre, producen toda una serie de partículas elementates, entre otras, los muones, los cuales viajan hacia la tierra con velocidades muy cercanas a la de la luz: v ≈ 0,994c. Estos muones se producen a una altura del orden de los 2000m, y se detectan sobre la superficie de la tierra. Clásicamente, se espera que estos muones se desintegren antes de llegar a la superficie terrestre, pues a la velocidad de 0,994c en un tiempo de vida de 2, 2 × 10−6 s alcanzan a avanzar escasamente unos 656m. Dado que para un observador ligado a la tierra los dos eventos, se crea el muón y luego se detecta, ocurren en puntos diferentes del espacio, mientras que para un observador ligado al muón los dos eventos ocurren en el mismo punto del espacio, y por lo tanto, el intervalo de tiempo medido por este último observador es un tiempo propio, entonces, para el observador terrestre, el tiempo entre los eventos debe estar dilatado en un factor p (2.77) 1/ 1 − v 2 /c2 ≈ 9 de acuerdo con la ecuación (2.68). Así, para el observador en reposo con respecto a la tierra el muón alcanza a sobevivir un tiempo del orden de t ≈ 2 × 10−5 s antes de desintegrarse y por lo tanto, puede recorrer un espacio aproximado de d = vt ≈ 6,000m, antes de desintegrarse, lo que significa que los mesones si pueden alcanzar la superficie terrestre antes de 2.4. CONSECUENCIAS DE LAS TL 45 que ellos decaigan en otras partículas. Dado que la llegada de los muones a la superficie terrestre es un hecho físico, a esta misma conclusión debe llegar cualquier otro observador inercial. Por ejemplo, consideremos el observador ligado a la partícula. Puesto que para él la partícula se encuentra en reposo, su vida media no se ve dilatada y por lo tanto el muón se desintegra al cabo de 2, 2 × 10−6 s. Pero ahora, es la tierra la que se mueve hacia él, con una velocidad de v = 0,994c y la distancia a la superficie tierrestre, desde el lugar donde se producen los muones, se ve contraida en un factor p 1 − v 2 /c2 ≈ 0,11 de acuerdo con la ecuación (2.76) y por lo tanto la superficie de la tierra se encuentra a una distancia de 0, 11×2,000m = 220m, la cual es lo suficientemente corta para que la superficie de la tierra llegue hasta el punto en el cual se encuentra el muón, antes que este se desintegre. Esta aparente asimetría en el análisis de un fenómeno físico, visto por dos observadores inerciales (en un caso el efecto considerado es la dilatación temporal, mientras que para el otro observador es la contracción de longitudes), no está en contradicción con el principio de relatividad, pues este principio lo que establece es la invarianza de las leyes físicas para observadores inerciales. En efecto, dos observadores pueden medir diferentes trayectorias, longitudes, intervalos de tiempo, energías cinéticas, etc., pero las leyes que rigen la dinámica de los sistemas si deben ser las mismas. Es importante resaltar este aspecto, pues es frecuente caer en aparentes paradojas cuando se aplica el principio de relatividad. De hecho se han construido muchos ejemplos, llamados en física “gedanken Experimenten”, que ilustran esta situación y que constituyen un buen ejercicio para comprender mejor los fenómenos relativistas. Un clásico ejemplo es el de un carro de longitud propia L0 y un garaje de menor longitud propia d0 con d0 < L0 . Supongamos que el carro se dirige hacia el garaje con una velocidad v suficiente, para que su longitud medida porpun observador en reposo con respecto al garaje sea menor que d0 , esto es L0 1 − v2 /c2 < d0 . Entonces, un observador en reposo respecto al garage planea atrapar al carro dentro del garaje y calcula cerrar la puerta de éste, tan pronto la trompa del carro alcance la pared del fondo. Para el observador que viaja con el carro, es el garaje el que aparece contraido y por lo tanto, para él es imposible que lo atrapen dentro del garaje, pues cuando la pared toque la punta del carro, el observador del garaje no puede cerrar la puerta. Claramente este análisis es contradictorio, pues desde el punto de vista físico si el carro puede ser atrapado por un observador, este debe ser atrapado por todos, o lo contrario, es decir no es atrapado por ninguno. La solución a esta aparente paradoja reposa en el hecho que la simultaneidad no es un concepto absoluto como hemos visto. Cuando el observador ligado al garage cierra la puerta simultáneamente 46 CAPÍTULO 2. FUNDAMENTOS DE LA RELATIVIDAD ESPECIAL cuando la trompa del carro alcanza a la pared, para el observador en el carro, primero llega la trompa a la pared, y luego, se cierra la puerta. Capítulo 3 La estructura causal del espacio-tiempo 3.1. Introducción En este capítulo definiremos la estructura causal del espacio-tiempo. En la primera parte se hará una breve discusión sobre transformaciones lineales que dejan invariante la distancia euclideana (rotaciones) con el fin de motivar la estructura Minkowskiana del espacio-tiempo y el concepto de cuadri-vector. En la parte final se deducirán las transformaciones de Lorentz a partir de la invarianza del intervalo espacio-tiempo entre dos eventos y se discutará la estructura causal del espacio-tiempo. 3.2. Rotaciones en el plano euclideano Consideremos el plano euclideano © ª R2 := x = (x1 , x2 ) | xi ∈ R; i = 1, 2 y el conjunto de transformaciones lineales del plano euclideano sobre si mismo: (3.1) T : R2 → R2 ; x → x0 = T x tal que dejen invariante la norma euclideana, definida por 2 x := 2 X δ ij xi xj = (x1 )2 + (x2 )2 i,j=1 47 (3.2) 48CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO es decir, x0 = T x =⇒ x02 = x2 (3.3) En la ecuación (3.2) se ha definido el símbolo de Kronecker δ ij (o tensor métrico euclideano) por: ½ 0 si i 6= j (3.4) δ ij := 1 si i = j Dado que T es una transformación lineal de R2 en R2 la podemos escribir como 2 X aji xi = aji xi (3.5) x0j = i=1 aji son constantes. En la última igualdad hemos en donde los coeficientes introducido la convención de suma de Einstein, en donde se asume una suma en todo factor en el cual aparezcan dos índices repetidos, uno como subíndice y el otro como supraíndice y la suma se realiza sobre el rango de valores que tome el índice. Busquemos entonces la forma más general de estos coeficientes que representen una transformación lineal y que dejen invariante la distancia euclideana. Para este fin remplacemos en la ecuación (3.3) la transformación lineal (3.5): δ ij ajk ail xk xl = δ ij x´i x´j = x´2 = x2 = δ ij xi xj (3.6) Identificando los coeficientes de las correspondientes coordenadas, obtenemos el siguiente conjunto de ecuaciones acopladas para los coeficientes: a211 + a221 = 1 (3.7) a212 + a222 = 1 (3.8) a11 a12 + a21 a22 = 0 (3.9) Además, dado que T es una transformación lineal de R2 en R2 , y por lo tanto T x = 0 solo si x = 0, entonces el determinante de la transformación debe ser diferente de cero a11 a22 − a12 a21 6= 0 (3.10) Como el sistema de ecuaciones tiene cuatro incognitas podemos encontrar tres de éllas en términos de la restante, o equivalentemente podemos despejar las cuatro incognitas en función de un parámetro. Si llamamos a 3.2. ROTACIONES EN EL PLANO EUCLIDEANO 49 este parámetro θ y lo definimos como a11 := cos(θ),directamente se pueden despejar los demás coeficientes para obtener: a11 = a22 = cos(θ); a12 = −a21 = sin(θ) (3.11) Con esto podemos escribir explícitamente las ecuaciones de transformación en la forma: (3.12) x01 = x1 cos(θ) + x2 sin(θ) x02 = x2 cos(θ) − x1 sin(θ) (3.13) Es de anotar que en el proceso de despejar los coeficientes tenemos que escoger un signo, pues de la ecuación (3.7), al despejar a21 en términos de a11 surge una raíz. La escogencia hecha de la raíz positiva nos conduce a que el determinante de los coeficientes tome el valor +1, que para el caso de haber tomado la raíz negativa nos hubiera dado el valor del determinante igual a −1. Que el determinante de los coeficientes de la transformación lineal T es ±1 se puede obtener directamente de las propiedades de las transformaciones que dejan invariante la norma euclideana de un vector, pues si representamos los puntos (vectores) de x ∈ R2 por matrices columna µ 1 ¶ x x= (3.14) x2 entonces, la norma al cuadrado (ecuación (3.2)) se puede escribir como: µ ¶ µ 1 ¶τ µ 1 ¶ ¡ 1 ¢ x1 x x 2 2 (3.15) x = x x = = xτ x 2 2 x x x2 donde τ significa la transpuesta de la matriz. De esta forma, la invarianza bajo la transformación lineal T de la norma se puede escribir de la siguiente forma: (3.16) xτ x = x0τ x0 = (T x)τ (T x) = xτ T τ T x lo que implica que la matriz de transformación debe satisfacer la condición TτT = 1 (3.17) que fácilmente se ve que conduce al mismo sistema de ecuaciones para los coeficientes de la matriz T . Toda transformación (o matriz) que satisfaga la ecuación anterior (3.17) se llama ortogonal, y fácilmente se ve que bajo una tal transformación, también se preservan los ángulos entre los vectores del plano euclideano, pues x0 · y0 ≡ x0τ y0 = (T x)τ T y = xτ T τ T y = xτ y = x · y (3.18) 50CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO Figura 3.1: Rotación de los ejes en el plano euclideano Tomando el determinante en la ecuación (3.17) y teniendo en cuenta que det T = det T τ , obtenemos el resultado general que: | det T |2 = 1 =⇒ | det T |= ±1 (3.19) Este resultado tiene una interpretación geométrica que veremos enseguida (ver Figura 3.1). Si hacemos una rotación de los ejes coordenados x, y por un ángulo θ y en sentido contrario a las agujas del reloj, las componentes de un vector de R2 se transforman como en la ecuación (3.5) y claramente dejan la norma del vector invariante. Este resultado muestra entonces, que la transformación lineal que deja invariante la norma de un vector en R2 queda determinada por un solo parámetro y puesto que es equivalente a una rotación de los ejes, podemos escoger como parámetro el ángulo de rotación θ. De esta forma podemos escribir T (θ) para representar esta transformación lineal. Además, si realizamos dos transformaciones (rotaciones) sucesivas T (θ) y T (ϕ), la primera en un ángulo θ y la segunda en un ángulo ϕ, entonces la transformación compuesta T (θ) ◦ T (ϕ) es equivalente a una sola transformación en un ángulo θ + ϕ. Adicionalmente, la transformación inversa de T (θ) es equivalente a la transformación por un ángulo −θ y la transformación 3.3. CUADRI-VECTORES Y EL GRUPO DE LORENTZ 51 identidad corresponde a la rotación en un ángulo cero. Resumiendo T (θ) ◦ T (ϕ) = T (θ + ϕ) (3.20) T −1 (θ) = T (−θ) (3.21) T (0) = 1 (3.22) Estas ecuaciones definen un grupo matemático, llamado el grupo de rotaciones del plano. Dado que las transformaciones están determinadas por un único parámetro θ, que varía continuamente de 0 a 2π, el grupo se llama continuo o grupo de Lie de un parámetro. 3.3. Cuadri-vectores y el grupo de Lorentz Definamos el espacio cuadridimensional de cuadri-vectores como: M : = {x = (x0 , x1 , x2 , x3 ) ∈ R4 | x · y := producto interno M inkowskiano} (3.23) en donde el producto interno Minkowskiano está definido como x · y := x0 y 0 − x1 y1 − x2 y 2 − x3 y 3 = η µν xµ y ν (3.24) En la última igualdad hemos hecho uso de la convención de suma de Einstein, en la cual los índices griegos repetidos toman los valores 0, 1, 2, 3 y como es usual en relatividad, el índice 0 corresponde a la componente temporal del cuadri-vector. Los elementos de matriz η µν , llamados las componentes del tensor de Minkowski (nombre que se justificará cuando veamos tensores), están definidos por µ 6= ν 0 si 1 si µ=ν=0 (3.25) η µν := −1 si µ = ν = 1, 2, 3 El producto interno definido por la ecuación (3.24) induce entonces una norma x2 := x · x = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 = ηµν xµ xν (3.26) Definamos una Transformación de Lorentz (TL) como una transformación lineal L : M −→ M (3.27) , x 7−→ x = Lx 52CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO tal que deje invariante el producto interno Minkowskiano x · y, esto es x, · y , = x · y (3.28) Para encontrar la forma general de una transformación de Lorentz, utilicemos primero el hecho que cualquier transformación lineal la podemos escribir en la forma (3.29) x,α = Λαβ xβ en donde los coeficientes Λαβ conforman la matriz de transformación de Lorentz. Remplazando la ecuación (3.29) en (3.28) y comparando coeficientes, obtenemos las condiciones que deben cumplir los elementos de la matriz de Lorentz: (3.30) η δγ = η αβ Λαδ Λβγ Esta ecuación la podemos escribir en forma equivalente, como el siguiente sistemas de ecuaciones: (Λ00 )2 − (Λ0k )2 − 3 X (Λi0 )2 = 1 i=1 3 X (Λik )2 = 1; i=1 η ρσ Λρµ Λσν (3.31) = 0; k = 1, 2, 3 µ 6= ν (3.32) (3.33) Este sistema de ecuaciones es general y contiene todas las posibles transformaciones entre sistemas de coordenadas que dejan invariante el producto punto Minkowskiano. Estas transformaciones las podemos dividir en tres categorías: La primera corresponde a las rotaciones de los ejes espaciales, dejando la coordenada temporal inmodificada y forman el llamado grupo de rotaciones. este grupo representa el hecho que el espacio físico es isotrópico. Claramente una rotación espacial queda determinada por tres parámetros, por ejemplo los tres ángulos de Euler. La segunda categoría la constituye la operación de inversión de los ejes espaciales y el temporal. La última categoría, que es la de interés para nosotros, la conforman las transformaciones puras de Lorentz, que representan el cambio entre sistemas de referencia inerciales, manteniendo tanto los ejes espaciales paralelos (no hay rotaciones espaciales) así como el sentido de los ejes espaciales y el temporal (sin inversión de ejes). Este grupo de transformaciones es conocido en la literatura como las ”boost” de Lorentz ”, las cuales quedan completamente determinadas por tres parámetros, que pueden ser escogidos para que corresponden a las tres componentes de la velocidad relativa de los sistemas de referencia. 3.3. CUADRI-VECTORES Y EL GRUPO DE LORENTZ 53 Antes de continuar desarrollando este último grupo de transformaciones, es importante aclarar que el conjunto de transformaciones que dejan invariante el producto punto Minkowskiano es más general que el dado en la ecuación (3.29), pues es inmediato ver que bajo una translación de los ejes epacio-temporales la invarianza del producto punto se mantiene. Estas tranformaciones representan la homogeneidad del espacio-tiempo, o en otros términos, la arbitrariedad de la elección del origen de coordenadas. Esta transformación queda determinada por cuatro parámetros (las cuatro componentes del cuadri-vector translación) y podemos entonces escribir la transformación de coordenadas más general como x,α = Λαβ xβ + aα (3.34) llamada transformación de Lorentz inhomogénea. Estas transformaciones generales constituyen el grupo de Poincare de diez parámetros: Tres ángulos de rotación + tres componentes de la velocidad relativa + cuatro desplazamientos. El grupo de Poincare es el grupo de simetrias fundamental de la física y representa la expresión matemática del principio de relatividad y de las propiedades básicas del espacio y el tiempo, esto es, de la homogeneidad e isotropía del espacio físico tridimensional y su estructura geométrica euclideana y de la homogeneidad e isotropía del tiempo. Restrinjámonos ahora solamente a las ”boost” de Lorentz y consideremos un sistema de referencia inercial Σ0 que se mueve con velocidad constante v respecto al sistema inercial Σ a lo largo del eje x1 y con los ejes espaciales paralelos. Entonces, dado que en este caso x02 ≡ y , = y ≡ x2 y x03 ≡ z , = z ≡ x3 , la matriz de transformación de Lorentz se reduce a: 0 Λ 0 Λ01 0 0 Λ10 Λ11 0 0 Λαβ = (3.35) 0 0 1 0 0 0 0 1 y las relaciones (3.31), (3.32) y (3.33), toman la forma: (Λ00 )2 − (Λ10 )2 = 1 (3.36) (Λ01 )2 − (Λ11 )2 = −1 (3.37) Λ00 Λ01 − Λ10 Λ11 = 0 (3.38) que es un sistema de tres ecuaciones con cuatro incógnitas y así, los coeficientes Λαβ por determinar, quedan dados en términos de un parámetro: 54CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO la velocidad relativa v entre los sistemas de referencia Σ y Σ0 . Teniendo en cuenta que las coordenadas del origen del sistema Σ0 , medidas en el sistema Σ están dadas por (x0 , vc x1 , 0, 0) y que bajo una T.L. se transforman a las coordenadas (x,0 , 0, 0, 0) en Σ0 , obtenemos la ecuación: v 0 = Λ10 x0 + Λ11 x1 = Λ10 x0 + Λ11 x0 c v Λ10 = − Λ11 c =⇒ (3.39) Entonces, el sistema de ecuaciones (3.36), (3.37) y (3.38) tiene solución única y está dada por: Λαβ γ −βγ 0 0 −βγ γ 0 0 = 0 0 1 0 0 0 0 1 (3.40) en donde 1 γ = γ(v) := q 1− v β = β(v) := c v2 c2 ; (3.41) (3.42) Escribiendo explícitamente el sistema de ecuaciones de transformaciones de Lorentz, (3.43) x,0 = γ(x0 − βx1 ) x,1 = γ(x1 − βx0 ) (3.44) x,2 = x2 (3.45) x,3 = x3 (3.46) vemos la extrecha relación formal con la ecuación (3.13) (rotación de los ejes x1 y x2 ). No es dificil ver que podemos interpretar formalmente una transformación de Lorentz, como una rotación en el plano complejo de los ejes (ict, x) en un ángulo complejo. Para este fín definamos el parámetro φ por la siguiente ecuación: v (3.47) tanh φ := β = c 3.4. CONOS DE LUZ Y RELACIONES DE CAUSALIDAD 55 en donde tanh es la tangente hiperbólica. Con esta definición, y utilizando las identidades para las funciones hiperbólicas, tenemos que: cosh φ = γ(v); sinh φ = v γ(v); c (3.48) Con esta defición (ecuación (3.47)) y las relaciones (3.48) las ecuaciones de transformación de Lorentz se pueden escribir en la forma: x,0 = x0 cosh φ − x1 sinh φ (3.49) x,1 = x1 cosh φ − x0 sinh φ (3.50) x,2 = x2 (3.51) x,3 = x3 (3.52) Recordando la relación cosh φ = cos(iφ), vemos la estrecha relación entre las rotaciones de los ejes coordenados y las transformaciones de Lorentz. Otra ventaja que tiene expresar las transformaciones de Lorentz en términos del parámetro φ, es la expresión para el teorema de adición de las velocidades, pues dos transformaciones de Lorentz sucesivas, con parámetros tanh φ1 = v1 /c y tanh φ2 = v2 /c, corresponden a una transformación de Lorentz con parámetro φ = φ1 +φ2 , pues, de la identidad trigonométrica para la tangente de la suma de dos ángulos, tenemos: tanh φ = tanh(φ1 + φ2 ) tanh φ1 + tanh φ2 = 1 + tanh φ1 tanh φ2 v1 /c + v2 /c = 1 + v1 v2 /c2 v = c (3.53) la cual coincide con la ecuación (2.50). 3.4. Conos de luz y relaciones de causalidad Puesto que el cuadrado la norma de todo cuadri-vector (c-v) es un invariante relativista y esta norma no es definida positiva, podemos clasificar a los c-v en en tres grupos disyuntos: Dado un c-v x ∈ M, definimos: 1. si x2 > 0 el c-v se llama como de tiempo 56CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO 2. si x2 < 0 el c-v se llama como de espacio 3. si x2 = 0 el c-v se llama como de luz Un c-vector x como de tiempo, cuya primera componente es mayor que cero, x0 > 0, se llama dirigido al futuro, mientras que si x0 < 0 se llama dirigido al pasado. Para entender el significado físico de esta clasificación y sus consecuencias, consideremos dos eventos físicos, por ejemplo el decaimiento de un núcleo radiactivo de uranio, situado en el origen de coordenadas (x01 , x11 , x21 , x31 ) = (0, 0, 0, 0) para un observador Σ y la fisión de otro núcleo de uranio, situado en las coordenadas (x02 , x12 , x22 , x32 ) ≡ (ct, x, y, z) medidas por el observador Σ. Calculemos entonces el intervalo espacio-temporal entre estos dos eventos: ∆S 2 = (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 = c2 t2 − x2 − y 2 − z 2 (3.54) Consideremos primero el caso ∆S 2 > 0 (sin pérdida de generalidad tomemos t > 0), y supongamos que en el instante t = 0, en el cual ocurre el primer evento y desde el origen de coordenadas, se envía una señal luminosa que viaja en la dirección p del segundo evento. Puesto que la distancia espacial entre los eventos es x2 + y2 + z 2 , el tiempo t0 , que tarda en llegar el rayo de luz al punto del espacio donde el núcleo se fisiona es menor que t, pues de la relación ∆S 2 > 0 se sigue que t2 > x2 + y2 + z 2 = t20 c2 (3.55) Esto significa que es posible que el primer evento, la desintegración del núcleo, pueda ser causa del segundo evento, la fisión del otro núcleo. Si hubieramos supuesto que t < 0 la conclusión es la misma, solo que en este caso la fisión del núcleo pudo ser la causa de la desintegración del otro. El resultado general que se desprende de este análisis es que eventos, cuya separación o intervalo espacio-temporal es mayor que cero, son eventos causalmente conectados (lo que no significa necesariamente que uno de ellos sea causa del otro), y por lo tanto, la sucesión temporal de eventos causalmente conectados es la misma para todos los observadores. Además, puesto que ∆S 2 > 0, notemos que siempre es posible encontrar un sistema de referencia Σ0 para el cual los dos eventos ocurren en el mismo punto del espacio, pues basta con elegir la velocidad de este sistema igual a r x2 + y 2 + z 2 (3.56) v= t2 3.4. CONOS DE LUZ Y RELACIONES DE CAUSALIDAD 57 en la dirección apropiada (a lo largo de la línea que une a los dos eventos, tomándola como el eje de las x) y haciendo una transformación de Lorentz, obtenemos que las coordenadas de los dos eventos en este sistema de referencia Σ0 son (0, 0, 0, 0) y (ct0 , 0, 0, 0), y por lo tanto ∆S 2 = c2 t2 − x2 − y 2 − z 2 = c2 t02 (3.57) Recordando la definición de tiempo propio, como el intervalo de tiempo medido en un sistema de referencia para el cual los dos eventos ocurren en el mismo punto del espacio, vemos que el intervalo espacio-temporal para eventos como de luz, nos da una medida directa del tiempo propio entre los eventos, sin necesidad de encontrar el sistema de referencia para el cual los dos eventos ocurren en el mismo punto del espacio. Así podemos adoptar la siguiente definición general de tiempo propio: Si ∆S 2 > 0 para dos eventos, definimos ∆τ , intervalo de tiempo propio, como: r ∆S 2 (3.58) ∆τ := c2 En el segundo caso, para eventos como de luz donde ∆S 2 = 0, obtenemos una conclusión similar al caso anterior, en cuanto a que los eventos están conectados causalmente, solo que para este caso, el fotón que se envía desde el primer evento en la dirección del segundo, llega en el mismo instante en que ocurre el segundo evento y en este caso no tiene sentido hablar de tiempo propio entre los eventos, pues no es posible encontrar un sistema de referencia para el cual los dos eventos ocurran en el mismo punto del espacio (∆x02 + ∆y02 + ∆z 02 = 0), sin que se viole la invariancia de ∆S 2 = 0, salvo en el caso trivial que también fuera ∆t02 = 0, caso en el cual los dos eventos ocurren en el mismo punto del espacio-tiempo para todos los observadores. Para el último caso, de eventos como de espacio ∆S 2 < 0, encontramos,realizando un análisis similar a los anteriores, que el fotón enviado desde el primer evento hacia el segundo, siempre llega después que el evento ha tenido lugar. Así no es posible que un evento sea causa del otro y en este caso se habla de eventos causalmente desconectados. De la expresión para ∆S 2 se obtiene que siempre es posible encontrar un sistema de referencia para el cual los eventos ocurren simultáneamente, pero, lógicamente, en puntos separados del espacio. Además, la sucesión temporal de los eventos depende del observador, es decir, si para un observador inercia Σ dos eventos P1 y P2 causalmente desconectados (i.e. como de espacio) son tales que t1 < t2 , entonces existen observadores inerciales, e.g. Σ´, tal que t´1 > t´2 . 58CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO Figura 3.2: Estructura causal del espacio-tiempo Esta clasificación de eventos divide al espacio-tiempo en cinco regiones disyuntas. Dado un evento p , el cual lo podemos ubicar sin pérdida de generalidad en el origen de coordenadas de un sistema de referencia Σ, el conjunto de eventos con coordenadas (ct, x, y, z), medidas en Σ, que satisfacen la relación (3.59) ∆S 2 = c2 t2 − x2 − y 2 − z 2 = 0 definen el llamado cono de luz del evento p ubicado en el origen de coordenadas. La razón de llamarse cono de luz surge cuando dibujamos estos puntos en un gráfico tridimensional, (ct, x, y) como se ve en la (Figura 3.2). Los eventos con coordenadas tales que: ∆S 2 = c2 t2 − x2 − y 2 − z 2 > 0 y ct > 0 (3.60) forman el futuro causal de p y aquellos con ct < 0 el pasado causal, esto significa, que todos los eventos situados dentro del cono de luz de p están causalmente conectados con p y pueden ser causados por el evento p (futuro causal) o pueden ser causa de p (pasado causal). Todos los demás eventos, es decir aquellos para los cuales se cumple la relación ∆S 2 = c2 t2 − x2 − y 2 − z 2 < 0 (3.61) 3.5. ALGEBRA DE CUADRI-VECTORES 59 Figura 3.3: Lineas de universo de partículas físicas conforman la región como de espacio de eventos causalmente desconectados con el evento p. Esta forma de representar los eventos en un gráfico espacio-temporal, nos permite visualizar fácilmente muchos procesos físicos como veremos en varios ejemplos a lo largo del texto. Un primer resultado que podemos obtener, sin necesidad de recurrir a cálculos explícitos, es que la trayectoria de una partícula material representada en un gráfico espacio-tiempo, siempre tiene que estar dentro del cono de luz de cada uno de los puntos (eventos) de la trayectoria y la trayectoria de un fotón (rayo de luz) siempre está sobre el cono de luz de cada uno de los puntos de su trayectoria (ver Figura 3.3). 3.5. Algebra de cuadri-vectores En esta sección veremos algunas propiedades de carácter matemático de los c-v, que se desprenden directamente de la definición de la métrica Minkowskiana, sin necesidad de recurrir a interpretaciones físicas, pero que van a ser de mucha utilidad para entender algunos resultados de la teoría de la relatividad. El espacio cuadridimensional de cuadri-vectores M, admite una estruc- 60CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO tura de espacio vectorial con la suma de c-v y el producto de un escalar (los reales) por un c-v definidos como: ∀x, y ∈ M y ∀λ ∈ R =⇒ x + y = (x0 , x1 , x2 , x3 ) + (y0 , y 1 , y 2 , y3 ) 0 0 1 1 2 2 3 (3.62) 3 = (x + y , x + y , x + y , x + y ) λx = λ(x0 , x1 , x2 , x3 ) := (λx0 , λx1 , λx2 , λx3 ) (3.63) o en forma equivalente, utilizando la notación con índices: (x + y)µ = xµ + yµ (3.64) (λx)µ = λxµ (3.65) De la definición del producto interno invariante de Lorentz y por las propiedades del álgebra vectorial definida, se obtienen las siguientes propiedades del producto interno: Proposición 4.1 El producto interno Minkowskiano satisface las siguientes propiedades: x·y =y·x x · (y + z) = x · y + x · z (3.66) x · (λy) = (λx) · y = λ(x · y) ∀x, y, z ∈ M ∀λ ∈ R Su demostración es directa a partir de la definición del producto punto Minkowskiano (3.24) y del álgebra de vectores definida por las ecuaciones (3.62) y (3.63). Veamos, como ejemplo del método de demostración, solamente la segunda propiedad. De las definiciones de producto interno y suma de c-v en notación de componentes, tenemos: x · (y + z) = ηµν xµ (y + z)ν = ηµν xµ (yν + z ν ) = ηµν xµ y ν + η µν xµ z ν = x·y+x·z como queriamos probar. Corolario 4.2 ∀x, y ∈ M se cumplen las siguientes identidades: (x ± y)2 = x2 + y 2 ± 2xy (3.67) 3.5. ALGEBRA DE CUADRI-VECTORES (x + y)2 + (x − y)2 = 2(x2 + y 2 ) 61 (3.68) (x + y) · (x − y) = x2 − y2 Estas identidades se deducen directamente de la Proposición 4.1 anterior. Podemos extender formalmente, la definición de vectores ortogonales de espacios vectoriales reales con producto interno definido positivo, al caso de c-vectores por medio de la relación x · y = 0, la cual por ejemplo hace que todo vector como de luz sea ortogonal a si mismo, pues x2 = xx = 0. Nota 4.1 Dado un c-v cualquiera x ∈ M, con x = (x0 , x1 , x2 , x3 ), a la primera componente del c-v se le llama temporal y a las otras tres componentes espaciales, justificando de esta forma la notación x = (x0 , x). Entonces, de la definición del producto interno de c-v, la norma de un c-v la podemos escribir como x2 = (x0 )2 − | x |2 (3.69) con x ∈ R3 y | x | la norma usual ( euclideana) de R3 . Otras propiedades de interés de los cuadri-vectores son las siguientes: Proposición 4.2 Si x, y ∈ M son c-v como de luz, entonces los vectores x + y y x − y son mutuamente ortogonales y tienen normas opuestas. Para demostrar la ortogonalidad, basta con utilizar la última de las ecuaciones (3.68), pues (x + y) · (x − y) = x2 − y 2 = 0 (3.70) dado que los c-vectores x y y son como de luz, i.e. x2 = 0 y y 2 = 0. De esta última propiedad y de la primera de las ecuaciones (3.68) se obtiene también, que sus normas son opuestas: (x + y)2 = x2 + y2 + 2x · y = 2x · y (3.71) (x − y)2 = x2 + y 2 − 2x · y = −2x · y (3.72) Proposición 4.3 Dos c-v x, y ∈ M como de luz y mutuamente ortogonales x · y = 0 son proporcionales entre si, i.e. x = λy. Para la demostración basta con tener en cuenta, por hipótesis, las siguientes relaciones, (3.73) 0 = xy = x0 y0 − x · y 0 = x2 = (x0 )2 − | x |2 0 = y 2 = (y0 )2 − | y |2 (3.74) (3.75) 62CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO Entonces, de las propiedades del producto interno euclideano para las componentes espaciales de cualquier c-v sabemos que x·y =| x || y | cos x∧ y, y así obtenemos de las anteriores relaciones que x · y = x0 y0 = (| x |2 )1/2 (| y |2 )1/2 ⇒ cos x∧ y = 1 (3.76) lo cual significa que las componentes espaciales son paralelas y así proporcionales, es decir x = λy. Ahora, de la relación x = λy y remplazándola en la ecuación (3.73) se obtiene: 0 = xy = x0 y0 − x · y = x0 y0 − λ | x |2 (3.77) Teniendo en cuenta que (x0 )2 =| x |2 (relación (3.74)), entonces 0 = x0 y 0 − λ(x0 )2 = x0 (y 0 − λx0 ) (3.78) Como el c-v x es como de luz se debe cumplir que x0 6= 0 y por lo tanto la ecuación anterior implica que y 0 = λx0 , de donde se deduce que los c-v x y y son proporcionales: y = λx (3.79) como se quería probar. Nota 4.2 La relación (x + y) · (x − y) = x2 − y 2 (3.80) nos permite construir c-v ortogonales a partir de dos c-v cualesquiera x y y de igual norma. Proposición 4.4 Todos los c-v x ∈ M, ortogonales a un c-v z como de tiempo, son como de espacio y forman un subespacio tridimensional como de espacio. Para su demostración consideremos primero que, si xz = 0 ⇒ x0 z 0 = x · z (3.81) entonces, como z = (z 0 , z) es como de tiempo, se debe cumplir que z 0 6= 0 y (z 0 )2 >| z |2 y por lo tanto ¯ 0 0¯ ¯x z ¯ |x · z| |x · z| = < (3.82) |z 0 | |z 0 | (z 2 )1/2 Elevando al cuadrado ambos lados de esta desigualdad ¯ 0 0 ¯2 ¯x z ¯ |x · z|2 x2 z 2 0 2 = (x ) < ≤ = x2 |z|2 |z|2 |z 0 |2 3.5. ALGEBRA DE CUADRI-VECTORES =⇒ x2 = (x0 )2 − x2 < 0 63 (3.83) Utilizando un argumento similar al anterior, se puede probar que todo vector ortogonal a un vector como de luz es como de espacio, salvo el caso tratado anteriormente (Proposición 4.3). Nota 4.3 Claramente existen tres c-v como de espacio ortogonales entre sí, pero solo hay dos c-v como de espacio mutuamente ortogonales, que sean a su vez ortogonales a un c-v dado como de luz. Esta situación se puede ilustrar tomando eτ = (1, 1, 0, 0), el cual es un c-v como de luz y e1 = (0, 0, 1, 0) y e2 = (0, 0, 0, 1) c-vectores como de espacio, ortogonales entre si y ortogonales al c-v eτ . Ahora, es claro que cualquier otro c-v como de espacio, ortogonal a e1 y e2 , debe tener la segunda componente no nula y por lo tanto ya no sería ortogonal al c-v eτ . Para probar esto, por contradicción, supongamos que existe un vector e3 = (x0 , x1 , x2 , x3 ) como de espacio y ortogonal a los c-v eτ , e1 y e2 . Entonces, de la ortogonalidad con e1 y e2 se obtiene que x2 = x3 = 0, y de la ortogonalidad con eτ se tiene que x0 = x1 , por lo tanto la norma del c-v e3 está dada por: e3 · e3 = (x0 )2 − (x1 )2 = 0 (3.84) lo cual implica que e3 sería como de luz, contradiciendo la hipótesis inicial. Nota 4.4 Análogo a la descomposición de vectores v ordinarios en componentes ortogonales, una de ellas a lo largo de un vector dado w, con v = v⊥ + τ w, en donde v⊥ es ortogonal a w, podemos representar cualquier c-v x ∈ M como x = y + τz (3.85) con z un c-v fijo como de tiempo y y un único c-v como de espacio ortogonal a z, el cual está completamente determinado por por el c-v x, siendo τ un parámetro real. 64CAPÍTULO 3. LA ESTRUCTURA CAUSAL DEL ESPACIO-TIEMPO Capítulo 4 Cinemática relativista 4.1. Introducción En este capítulo se desarrollará la cinemática relativista como una aplicación de los cuadri-vectores. En las dos primeras partes definiremos los c-vectores velocidad y aceleración y en la última parte introduciremos el cvector número de onda, como una consecuencia de la invarianza relativista del producto punto y se discutirá el efecto Doppler y la aberración de la luz como una consecuencia de las leyes de transformación de los c-vectores. 4.2. Cuadri-vector velocidad Definamos el c-v posición x como un elemento del espacio M el cual describe el instante de tiempo y posición espacial de un evento físico cualquiera, cuyas coordenadas para un observador inercial Σ están dadas por xα = (x0 , x1 , x2 , x3 ). Por ejemplo, la trayectoria de una partícula elemental, es decir, su posición espacial en cada instante de tiempo, la podemos describir por un c-v posición x(s) como función de algún parámetro s, y a esta función x(s) se le llama la línea de universo de la partícula. En física no relativista es usual utilizar como parámetro s la coordenada temporal t. Sin embargo es claro que en el caso relativista este no es el parámetro más adecuado, aún cuando se puede usar, pues él depende del observador. Para describir la línea de universo de una partícula material es usual, dada su interpretación física directa, utilizar como parámetro s al tiempo propio de la partícula, es decir, el tiempo medido por un reloj que ”viaja con la partícula”, el cual es un invariante relativista y así es un parámetro independiente del observador. De lo discutido en el parágrafo anterior, si xα1 y xα2 son las coordenadas de dos 65 66 CAPÍTULO 4. CINEMÁTICA RELATIVISTA eventos medidos por un observador Σ, entonces el intervalo espacio-temporal entre los dos eventos está dado por la expresión: ∆S 2 = (x02 − x01 )2 − (x12 − x11 )2 − (x22 − x21 )2 − (x32 − x31 )2 (4.1) Si las coordenadas xα1 y xα2 representan dos posiciones sucesivas de una partícula material, entonces ∆S 2 es mayor que cero y nos mide el tiempo propio ∆τ entre los dos eventos (ecuación (3.58)). De esta manera x(τ ) nos describe la posición espacio-temporal de una partícula en función del tiempo propio τ , transcurrido desde un instante inicial arbitrario, es decir x(0) nos representa la posición espacio-temporal de la partícula en τ = 0. Notemos que esta descripción de la cuadri-posición en función de τ solo es posible para partículas que se mueven a una velocidad menor que la de la luz, pues para el caso de fotones (u otras partículas con masa en reposo nula), dado que ellas solo se pueden mover a la velocidad de la luz, el intervalo ∆s2 entre dos puntos de su línea de universo siempre es cero. La velocidad física de una partícula se define como u= dr dt (4.2) en donde r son las coordenadas de posición y t el tiempo medido por algún observador inercial Σ. Podemos generalizar el concepto de velocidad al caso de cuadri-vectores de una manera independiente del observador, definiendo el c-v velocidad (c-velocidad) por: U := dx dτ (4.3) en donde x(τ ) es el c-v posición que describe la línea de universo de una partícula material y τ el parámetro tiempo propio. Para encontrar la relación entre las componentes de la c-velocidad y la velocidad física medida en un sistema de referencia inercial Σ, basta tener en cuenta que (ver ecuación (3.58) con la notación x = (x0 , x1 , x2 , x3 ) = (x0 , r) = (ct, r)) para una partícula material el tiempo propio está dado por la expresión: p (4.4) cdτ = (dx0 )2 − (dr)2 y por lo tanto tenemos dτ dt dt dτ r dr 2 ) ⇒ dt 1 = γ(u) := p 1 − u2 /c2 = 1−( (4.5) 4.2. CUADRI-VECTOR VELOCIDAD 67 en donde u = dr/dt es la velocidad física de la partícula medida en el sistema de referencia Σ. De esta última ecuación es fácil obtener la relación entre las componentes de la c-velocidad U α = (U 0 , U 1 , U 2 , U 3 ) y la velocidad física u en Σ, pues aplicando la regla de la cadena para las derivadas se obtiene Uα = = d α d 0 x = (x , x) dτ dτ dt d (ct, r) = γ(u)(c, u) dτ dt (4.6) Entonces U 0 = γ(u)c; U 1 = γ(u)ux ; U 2 = γ(u)uy ; U 3 = γ(u)uz (4.7) Por ejemplo, para una partícula en reposo u = 0 y el c-v velocidad está dado por U α = (c, 0). Puesto que para determinar unívocamente la velocidad de una partícula se requieren tres parámetros, por ejemplo, las tres componentes de la velocidad respecto a algún sistema de referencia, y la c-velocidad tiene cuatro componentes, entonces estas componentes no pueden ser todas independientes y debe existir una relación entre ellas. Esta relación se puede obtener teniendo en cuenta el hecho de que la norma al cuadrado de todo c-v es un invariante relativista, así U 2 = η αβ U α U β = γ 2 (u)(c2 − u2 ) = c2 (4.8) Esta relación indica que todo c-v velocidad es como de tiempo y geométricamente representa el c-v tangente a la línea de universo de una partícula material, generalizando de esta forma los conceptos usuales de curva y su vector tangente (velocidad). Notemos que el valor de la norma al cuadrado del c-v velocidad se hubiera podido obtener directamente, sin realizar ningún cálculo, pues, dado que esta norma es un invariante, siempre podemos escoger un sistema de referencia inercial particular, por ejemplo, aquel para el cual la partícula está momentáneamente en reposo, en donde U α = (c, 0), y asi directamente se obtiene que U 2 = c2 . Este ejemplo ilustra uno de los hechos que hacen del cálculo con c-vectores una herramienta muy poderosa y en general más simple. Otra propiedad muy importante de los c-vectores es que todos se transforman, por definición, de la misma forma bajo una transformación de Lorentz, lo cual nos permite obtener de una manera más simple, pero más general, las leyes de transformación entre sistemas de referencia inerciales de las variables físicas. Por ejemplo, el teorema de adición de velocidades 68 CAPÍTULO 4. CINEMÁTICA RELATIVISTA se sigue directamente del hecho que siendo U un c-v, entonces sus componentes medidas en dos sistemas de referencia Σ y Σ0 están relacionadas por las ecuaciones de transformación de Lorentz (ecuaciones (3.43), (3.44), (3.45) y (3.46)): (4.9) U ,0 = γ(v)(U 0 − βU 1 ) U ,1 = γ(v)(U 1 − βU 0 ) ,2 (4.10) 2 (4.11) U ,3 = U 3 (4.12) U =U En donde v es la velocidad del sistema de referencia Σ0 respecto al sistema Σ y β = v/c. Hemos colocado explícitamente el argumento del factor γ, para distinguirlo del γ asociado a la velocidad física u de la partícula. Teniendo en cuenta la relación entre las componentes de la c-velocidad y la velocidad física (ecuación (4.7)), válidas en cualquier sistema de referencia, la ecuación (4.9) nos da directamente la ley de transformación del factor γ de la partícula: vux (4.13) γ(u, ) = γ(v)γ(u)(1 − 2 ) c y teniendo en cuenta esta relación, se obtiene, de las otras tres ecuaciones (4.10), (4.11) y (4.12), el teorema de adición de velocidades o equivalentemente la ley de transformación de las componentes de la velocidad física entre dos sistemas de referencia inerciales: ux0 γ(u, ) = γ(v)(γ(u)ux − βcγ(u)) entonces ux0 = ux − v x (1 − vu c2 ) (4.14) (4.15) y similarmente uy0 = uz0 = p 1 − v2 /c2 x (1 − vu ) c2 p 2 uz 1 − v /c2 x (1 − vu ) c2 uy (4.16) (4.17) Para finalizar esta sección, daremos dos resultados importantes, que serán de utilidad en la dinámica relativista. Proposición 5.1 Cualquier c-vector w = (w0 , w) como de tiempo (w2 > 0), y dirigido al futuro (w0 > 0), puede ser expresado como un multiplo de una c-velocidad U . 4.3. CUADRI-VECTOR ACELERACIÓN Para esto basta tomar 69 √ w2 U w= c (4.18) Proposición 5.2 Dado un c-vector w como de tiempo, siempre es posible encontrar un sistema de referencia para el cual las componentes del c-vector sean (w0 , 0). Teniendo en cuenta la Proposición 5.1, basta con probar que se cumple para una c-velocidad. Sea U = γ(u)(c, u) en un sistema de referencia Σ y consideremos un segundo sistema de referencia Σ0 cuya c-velocidad respecto al sistema Σ sea U , entonces claramente las componentes de la c-velocidad U respecto a Σ0 son (c, 0). La velocidad física del sistema es entonces u. En efecto, si escogemos el eje temporal de Σ0 paralelo a u, podemos eliminar sus componentes espaciales; en caso que el c-vector U esté dirigido al pasado podemos aplicar los mismos argumentos a la velocidad −u. Esta situación de elección de los ejes nos permite, en muchas situaciones, simplificar cálculos, pues por ejemplo si W es un c-vector cualquiera no nulo, siempre podemos absorber dos de sus componentes espaciales (digamos W 2 y W 3 ) rotando los ejes espaciales del sistema de referencia Σ y escoger el eje t0 o x0 a lo largo del vector W y eliminar una componente más, bien sea W 1 (como en el caso anterior) si W es un c-vector como de tiempo, o W 0 si W es un c-vector como de espacio. 4.3. Cuadri-vector aceleración De manera similar a la c-velocidad, definimos el c-v aceleración como la derivada de la c-velocidad respecto al tiempo propio A = (A0 , A1 , A2 , A3 ) := dU dτ (4.19) Para encontrarar la relación de las componentes de la c-aceleración con la aceleración física, i.e., con la derivada de la velocidad respecto al tiempo a = du/dt medida en un sistema de referencia, basta con utilizar la relación (4.5) en la ecuación que relaciona las componentes de la c-velocidad con u (ecuación (4.7)) medidas en algún sistema de referencia Σ: dt d dU α = γ(u)(c, u) dτ dτ dt dγ(u) dγ(u) , u + γ(u)a) = γ(u)( dt dt Aα = (4.20) 70 CAPÍTULO 4. CINEMÁTICA RELATIVISTA Consideremos un sistema de referencia inercial para el cual la partícula se encuentra momentáneamente en reposo, i.e., u = 0, entonces para este sistema las componentes de la c-aceleración toman la forma Aα = (0, a) (4.21) A esta aceleración física a se le llama aceleración propia y es un invariante relativista, pues la norma al cuadrado del c-v aceleración está dada por (4.22) A2 = − | a |2 Esta relación indica también que la c-aceleración es un c-v como de espacio. Además, los c-vectores velocidad y aceleración son ortogonales pues, en el sistema de referencia propio de la partícula el c-v velocidad tiene componentes (c, 0) y por lo tanto el producto interno entre los c-vectores velocidad y aceleración, que es también un invariante, está dado por: U · A = η αβ U α Aβ = 0 (4.23) Este resultado se puede obtener directamente, sin hacer uso de un sistema particular de referencia, pues dado que U 2 = c2 , se tiene entonces que 0= d d 2 U = 2U · U = 2U · A dτ dτ (4.24) Podemos proceder de manera similar como se hizo para obtener las leyes de transformación de las componentes de la velocidad entre sistemas de referencia inerciales y calcular las ecuaciones de transformación para la aceleración, sin embargo, dado que estas expresiones no son de mucha utilidad, pospondremos la interpretación física de la aceleración para el siguiente capítulo sobre dinámica relativista y nos limitaremos en este punto a dar un ejemplo sobre la cinemática de un sistema con aceleración propia constante. 4.3.1. Viaje interestelar Este ejemplo ilustra uno de los resultados más sorprendentes de la teoría especial de la relatividad, conocido históricamente como la paradoja de los mellizos de Langevan. Como veremos, este resultado no es de ninguna manera una paradoja, pero si es ilustrativo plantearlo en estos términos, pues nos permite entender de manera más precisa el principio de relatividad y evitar un error muy común que se presenta cuando se analizan situaciones o fenómenos desde el punto de vista de diferentes observadores inerciales. 4.3. CUADRI-VECTOR ACELERACIÓN 71 Supongamos que un mellizo parte en un viaje espacial mientras que el otro permanece en la tierra, entonces como veremos en el siguiente ejemplo numérico que vamos a tratar, el mellizo viajero regresa a la tierra al cabo de unos cuantos años medidos por relojes de la nave espacial, mientras que para el mellizo que permaneció en la tierra habrían transcurrido miles años medidos por relojes del sistema de referencia de la tierra. Claramente no hay simetría en el análisis de la situación vista por los dos mellizos, pues el mellizo viajero no constituye un sistema de referencia inercial y por lo tanto no es válido (como se plantea en la paradoja) suponer que visto desde la tierra, es el mellizo de la nave a quien le transcurren miles de años. Consideremos un cohete que parte del reposo en la tierra con una aceleración propia constante igual a g (la aceleración de la gravedad sobre la superficie de la tierra) y viaja hacia el centro de la galaxia. Supongamos que la mitad del viaje lo realiza acelerando y la otra mitad frenando, también con aceleración propia g. Tomando como sistema de referencia inercial la tierra, con su origen de coordenadas en la tierra, el origen del tiempo en el instante en que la nave parte y como eje x la dirección del movimiento de la nave, entonces las componentes de la c-velocidad y c-aceleración de la nave están dadas por: U = (U 0 , U ) = (U 0 , Ux , 0, 0) 0 0 A = (A , A) = (A , Ax , 0, 0) (4.25) (4.26) las cuales satisfacen las siguientes relaciones (usando unidades con c = 1): U 2 = 1 = (U 0 )2 − Ux2 (4.27) U · A = 0 = U 0 A0 − Ux Ax (4.28) A2 = −g 2 = (A0 )2 − A2x (4.29) En unidades de c = 1, el valor de la aceleración de la gravedad es g ' 1al−1 (al ≡ año luz). De la ecuación (4.28) despejamos A0 A0 = Ax Ux /U 0 (4.30) y reemplazamos en la ecuación (4.29), entonces g 2 = A2x [1 − ( Ux 2 ) ] U0 (4.31) Utilizando la ecuación (4.27) obtenemos Ax = gU 0 (4.32) 72 CAPÍTULO 4. CINEMÁTICA RELATIVISTA y de esta ecuación y la (4.30) se llega a la relación: A0 = gUx (4.33) Diferenciando con respecto al tiempo propio la ecuación (4.32) y haciendo uso de la ecuación (4.33), obtenemos una ecuación diferencial para Ux : d2 Ux dU 0 = gA0 = g 2 Ux = g (4.34) dτ 2 dτ entonces d2 Ux − g 2 Ux = 0 (4.35) dτ 2 cuya solución está dada en términos de funciones hiperbólicas, como se puede probar por sustitución directa, Ux = C1 sinh(gτ ) + C2 cosh(gτ ) (4.36) con C1 y C2 constantes de integración, las cuales se pueden determinar utilizando las condiciones iniciales: la nave parte del reposo con acelerax ción propia g, i.e., Ux (τ = 0) = 0 y dU dτ |τ =0 = g. Entonces, de la primera condición se obtiene que C2 = 0 y de la segunda condición g = C1 g cosh(0) ⇒ C1 = 1 (4.37) Así, obtenemos las siguientes ecuaciones diferenciales para las coordenadas (x0 , x) de la nave, medidas desde el sistema tierra: Ux = U0 = dx = sinh(gτ ) dτ dx0 = cosh(gτ ) dτ (4.38) (4.39) en donde la segunda ecuación se obtiene de la ecuación (4.27). Integrando estas ecuaciones con las condiciones iniciales x = x0 = 0 para τ = 0, obtenemos la ecuación para la trayectoria o línea de universo de la nave, en términos del parámetro τ (tiempo propio de la nave): x0 = g −1 sinh(gτ ) (4.40) x = g −1 (cosh(gτ ) − 1) (4.41) En la Figura 4.1 se muestra un gráfico de la línea de universo de la nave, en el sistema de referencia tierra. En este diagrama la línea de universo de la 4.3. CUADRI-VECTOR ACELERACIÓN 73 Figura 4.1: Línea de universo del cohete tierra es el eje ct y también se ha dibujado allí, el cono futuro del evento P, es decir, del evento: partida de la nave en la tierra. La línea de universo del cohete siempre tiene que estar dentro del cono de luz del evento P y en todo punto la tangente a la línea de universo es menor de 45o , con respecto al eje ct, indicando que la velocidad del cohete siempre es menor que c, como lo exige la relatividad. Notemos además, que la línea de universo del cohete intercepta a la línea de universo de la tierra en dos puntos: en el instante del lanzamiento de cohete y luego en el instante en que éste regresa a la tierra. A partir de estas ecuaciones podemos obtener toda la información que se quiera respecto al viaje. Por ejemplo, calculemos la distancia a la cual se encuentra el cohete de la tierra y su velocidad al cabo de 40 años medidos en la tierra. Como estamos trabajando con unidades de c = 1 tenemos que x0 = t = 40años, entonces, despejando τ de la ecuación (4.40) τ = sinh−1 (gx0 ) = sinh−1 (40) ' 4, 38años (4.42) y remplazando este valor del tiempo transcurrido en la nave (tiempo propio) en la ecuación (4.41), obtenemos la distancia a la cual se encuentra la nave de la tierra: x = [cosh(4,38) − 1]años − luz = 39,01años − luz (4.43) 74 CAPÍTULO 4. CINEMÁTICA RELATIVISTA La velocidad de la nave en cualquier instante la podemos obtener derivando las ecuaciones (4.40) y (4.41), y de la relación entre las componentes de su c-velocidad y su velocidad física: U α = (U 0 , U ) = γ(u)(1, u) U α = (cosh(gτ ), sinh(gτ ), 0, 0) (4.44) (4.45) por lo tanto, despejando la velocidad u = (ux , 0, 0) de esta relación, tenemos que la velocidad de la nave en ese punto de la trayectoria es: ux = tanh(gτ ) = tanh(4,38) = 0,9997 (4.46) El centro de la galaxia se encuentra aproximadamente a unos 30000 añosluz de la tierra, puesto que la mitad del viaje se hace acelerando y la otra mitad desacelerando, entonces por simetría, el tiempo propio para que la nave llegue al centro de la galaxia es el doble del tiempo necesario para recorrer los primeros 15000 años-luz. Despejando τ de la segunda (4.41) tenemos: (4.47) τ = cosh−1 (15000 + 1) = 10,309años y por tanto el tiempo medido en la nave para realizar este viaje es de 20,6años, tiempo perfectamente razonable para un viaje interestelar. Ahora, si este viajero regresa a la tierra siguiendo el mismo plan de vuelo, entonces el viaje completo le llevaría un tiempo de 41,2años, mientras que el tiempo transcurrido en la tierra sería de x0 = 4 sinh(10,3) = 60003,9años (4.48) Este ejemplo muestra la famosa paradoja de los mellizos de Langevan, pero ilustra también claramente la asimetría de la situación. En el relato de la paradoja se afirma que dada la relatividad de los sistemas de referencia, esto es, la equivalencia de todos los sistemas de referencia inerciales para describir los fenómenos físicos, podemos considerar el viaje visto desde la nave espacial y ver que es la tierra la que se aleja de la nave y por lo tanto se espera, que cuando la tierra regrese a la nave, entonces sea el mellizo que permanecio en la nave al que le han transcurrido 60003,9años, mientras que al viajero de la tierra tan solo le habrían pasado 41,2años. La falsedad de este último razonamiento radica en el hecho que la nave espacial está acelerada y por lo tanto no es un sistema de referencia inercial, a diferencia del sistema tierra, lo que hace inválido aplicar el principio de relatividad restringida. Este efecto de retraso temporal de relojes, que se encuentran sometidos a una aceleración, se ha probado experimentalmente 4.4. CUADRI-VECTOR DE ONDA 75 utilizando relojes atómicos (de alta precisión), uno de los cuales permanece en la tierra y el otro viaja en un avión alrededor de la tierra. Si bien, el efecto del retardo temporal del reloj viajero es muy pequeño, del orden de millonésimas de segundo, este tipo de relojes ha permitido hacer estas medidas con la suficiente precisión, mostrando este espectacular efecto relativista. Es de anotar que para el cálculo del retardo temporal en este experimento terrestre, es necesario tener en cuenta los efectos asociados al campo gravitacional, es decir hay que trabajar en el contexto de la teoría general de la relatividad, sin que se invalide de ninguna manera las predicciones de la teoría especial de la relatividad. Una última conclusión que se desprende de este ejemplo, es que los viajes interestelares son físicamente posibles, pues basta con lograr aceleraciones suficientes durante un tiempo adecuado, para que un viajero en un tiempo razonable atraviese nuestra galaxia, o incluso viaje a otras galaxias, pero definitivamente no pretenda regresar a la tierra, pues en la tierra podrían haber transcurrido varios millones de años. 4.4. Cuadri-vector de onda Una de las contribuciones más importantes de las ecuaciones de Maxwell lo constituye la propagación de las ondas electromagnéticas. Debido a que la ecuación de ondas en el vacío (ver por ejemplo la ecuación (2.14)) es lineal, vale el principio de superposición y así cualquier onda electromagnética se puede escribir como una suma o superposición de ondas planas de la forma ψ(t, r) = Ae±i(ωt−k·r) (4.49) en donde A es la amplitud del campo ψ (por ejemplo el campo eléctrico, magnético, potencial vectorial o potencial escalar), ω la frecuencia de la onda, k el vector de onda y el signo ± indica el sentido de propagación de la onda. La cantidad ϕ = ωt − k · r (4.50) se llama la fase de la onda y debe ser un invariante relativista, esto es, debe ser la misma para todos los observadores inerciales. Si definimos el c-vector de onda k como k := (ω/c, k) (4.51) entonces la fase de la onda se puede escribir como el producto interno Minkowskiano entre el c-vector de onda y el c-vector posición x = (ct, r): ϕ=k·x (4.52) 76 CAPÍTULO 4. CINEMÁTICA RELATIVISTA la cual es un invariante relativista. De las propiedades de transformación de los c-vectores se tiene que las componentes del c-vector de onda, medidas por dos observadores inerciales Σ y Σ0 están relacionadas por las ecuaciones de transformación: ω 0 = γ(v)(ω − vkx ) (4.53) v kx0 = γ(v)(kx − 2 ω) (4.54) c ky0 = ky (4.55) kz0 = kz (4.56) De las propiedades de los c-vectores sabemos que la norma Minkowskiana de todo c-vector es un invariante relativista y por lo tanto se espera que ésta tenga un significado físico. Si tomamos la norma del c-vector de onda obtenemos ω2 ¯¯ ¯¯2 (4.57) k 2 = 2 − ¯k ¯ = 0 c pues, si tenemos en cuenta la relación ¯ ¯ de dispersión para las ondas electro¯ ¯ magnéticas en el vacío, c = ω/ ¯k¯, vemos que el c-vector de onda es un c-vector nulo o como de luz, y cuya norma nos da la relación de dispersión para ondas electromagnéticas en el vacío. Consideremos como ejemplo una onda electromagnética plana de frecuencia ω, que se propaga respecto al sistema Σ a lo largo del eje y, i.e., k = (o, ky , 0). Entonces, para un observador Σ0 que se mueve respecto a Σ con velocidad v a lo largo de los ejes paralelos xx0 , tenemos ω0 = γ(v)ω kx0 = − v γ(v)ω c2 ky0 = ky (4.58) En primer lugar, la dirección de propagación de la onda para el observador Σ0 está dada por la relación kx0 /ky0 = − v ω v γ(v) = − γ(v) 2 c ky c (4.59) en donde la última igualdad se obtuvo utilizando la relación de dispersión para la onda en el sistema Σ. En el límite de bajas velocidades, es decir, para velocidades del observador Σ0 tales que v ¿ c, podemos aproximar el factor γ(v) ∼ 1, y obtenemos el fenómeno clásico de la aberración de la luz estelar, discutida en el capítulo segundo. El efecto Doppler es un fenómeno asociado a las ondas en general y corresponde al cambio en la frecuencia medida por un observador con respecto 4.4. CUADRI-VECTOR DE ONDA 77 a la frecuencia emitida por la fuente, debido a los movimientos relativos del observador y/o de la fuente y en el caso particular de ondas que requieran un medio para propagarse, tales como las sonoras o elásticas, también depende de la velocidad del medio. En física no relativista el efecto Doppler se puede entender fácilmente si tenemos encuenta que, por ejemplo, cuando la fuente se está moviendo en dirección del observador, el tiempo entre dos pulsos recibidos es menor que el tiempo entre la emisión de estos dos pulsos, dando lugar así a una frecuencia detectada mayor a la frecuencia emitida, fenómeno llamado corrimiento hacia el azul. La misma situación se presenta si es el observador el que se acerca a la fuente. Cuando la fuente se aleja del observador, la frecuencia detectada es menor que la emitida y el efecto se llama corrimiento al rojo. En el caso relativista se presenta una situación similar, pero el factor de corrimiento se ve corregido debido al comportamiento del tiempo para diferentes observadores. En las ecuaciones de transformación para el c-vector de onda ( (4.53) a la (4.56)), está contenido el efecto Doppler relativista para la situación más general posible. Para encontrar las relaciones estandar del efecto Doppler relativista que se tratan usualmente en los textos de relatividad especial, vamos a considerar casos particulares de las ecuaciones de transformación (4.53) a la (4.56). Supongamos que la fuente está en reposo respecto al observador Σ y que emite un frente de ondas de frecuencia ω a lo largo del eje x, entonces las componentes del c-vector de onda son (ω/c, kx , 0, 0). De la ecuación (4.53), y teniendo en cuenta que kx = ω/c, para el observador Σ0 tenemos v ω 0 = γ(v)(ω − vkx ) = ωγ(v)(1 − ) c (4.60) en donde el signo de la velocidad v es positivo si el observador se aleja de la fuente y negativo si se acerca. Para el caso de movimiento del observador transversal a la dirección de propagación, consideremos que el observador Σ emite un frente de ondas de frecuencia ω en la dirección y, entonces el c-vector de onda toma la forma k = (ω/c, 0, ky , 0). A partir de la ecuación (4.53) la frecuencia medida por el observador Σ0 es ω 0 = γ(v)ω (4.61) Una situación más general de interés se presenta cuando el tren de ondas emitido por la fuente viaja en el plano xy formando un ángulo α con respecto al eje de las x, entonces el c-vector de onda es k = (ω/c, kx , ky , 0), con ¯ ¯ q ¯ ¯ ¯ ¯ ¯ ¯ (4.62) tan α = ky /kx ; ¯k¯ = kx2 + ky2 ; ¯k¯ = ω/c 78 CAPÍTULO 4. CINEMÁTICA RELATIVISTA Entonces para el observador Σ0 se tiene que ω 0 = γ(v)(ω − vkx ) = γ(v)ω(1 − v cos α) c (4.63) Claramente esta última relación contiene, como casos particulares, las situaciones descritas anteriormente. Cuando α = 0 obtenemos la ecuación (4.60) y para α = 90◦ se reduce a la ecuación (4.61). Notemos que el efecto Doppler transversal, ecuación (4.61), es de origen estrictamente relativista puesto que es una consecuencia de la dilatación temporal, situación que obviamente no se presenta en el tratamiento clásico. Parte II Dinámica relativista 79 Capítulo 5 Dinámica relativista En este capítulo se desarrollarán las leyes de la dinámica relativista utilizando desde un principio, la formulación de cuadrivectores, la cual permite formular las leyes de la dinámica relativista como una generalización de las leyes fundamentales de la mecánica Newtoniana. 5.1. Ecuaciones de movimiento Definamos el cuadri-vector momentun por p := m0 U = m0 dx dτ (5.1) en donde m0 es la masa inercial propia de la partícula, es decir, la masa inercial medida en el sistema de referencia en reposo de la partícula. m0 también es llamada masa en reposo y U es su cuadri-velocidad. Por definición, la masa en reposo de una partícula es un invariante relativista que caracteriza a la partícula, pues si tomamos la norma del c-v momentun, ecuación (5.1), obtenemos: (5.2) p2 = m20 c2 dado que la norma al cuadrado del c-v velocidad es c2 . A partir de esta definición del c-momento de una partícula, podemos mantener la misma definición de la segunda ley de Newton, pero formulada para las cantidades c-vectoriales. Así, la ecuación de movimiento relativista está dada por dp = m0 A (5.3) f= dτ 81 82 CAPÍTULO 5. DINÁMICA RELATIVISTA en donde A es la c-aceleración y f es la c-fuerza. Para interpretar las componentes del c-momento y c-fuerza en términos de variables dinámicas físicas, específicamente, en términos de su cantidad de movimiento lineal (momentun), de su energía y de la fuerza, consideremos en primer lugar el c-momento (ecuación (5.1)) y hagamos uso del hecho que a bajas velocidades comparadas con la velocidad de la luz, i.e. v ¿ c, las ecuaciones de la relatividad deben reducirse a las ecuaciones de la mecánica Newtoniana. Teniendo en cuenta que las componentes de la c-velocidad están relacionadas con la velocidad de la partícula a través de la ecuación U α = γ(u)(c, u), entonces (ver capítulo anterior) las componentes del c-momentun serán pα = (m0 γ(u)c, m0 γ(u)u) =: (E/c, p) (5.4) En esta última ecuación hemos definido las cantidades E (con unidades de energía) y p (con unidades de momento) por con E = mc2 (5.5) p = mu (5.6) m0 m := m0 γ(u) = p 1 − u2 /c2 (5.7) llamada masa inercial relativista de la partícula, nombre que será justificado en el siguiente análisis. Teniendo en cuenta que en el límite de bajas velocidades el factor γ(u) lo podemos expandir en una serie en potencias de (u/c), reteniendo términos hasta orden (u/c)2 , 1 u2 + O(u4 /c4 ) (5.8) 2 c2 entonces, las componentes espaciales del c-momentun toman la forma γ(u) = 1 + 1 u2 + O(u4 /c4 )) ≈ m0 u (5.9) 2 c2 la cual, en el límite de bajas velocidades se reduce a la definición del momentum clásico. Así, la definición del momentum relativista de una partícula por la ecuación (5.6), nos conduce a interpretar la masa relativista (ecuación (5.7)) como la inercia de una partícula, la cual depende de su velocidad. Para interpretar la componente temporal del c-momento, consideremos de nuevo el límite de bajas velocidades de la ecuación (5.5). Remplazando la expansión (5.8) en la definición (5.7) tenemos p = m0 u(1 + E = m0 c20 (1 + 1 u2 1 + O(u4 /c4 )) ≈ m0 c2 + m0 u2 2 2c 2 (5.10) 5.1. ECUACIONES DE MOVIMIENTO 83 la cual, salvo el término constante m0 c2 , corresponde a la definición newtoniana de energía cinética. Así, este resultado nos conduce a definir la cantidad K := mc2 − m0 c2 (5.11) como la energía cinética relativista de una partícula. Esta definición tiene sentido en cuanto que la función K depende de la velocidad de la partícula, se anula para u = 0 y en el límite de bajas velocidades se reduce a la energía cinética clásica. La cantidad E = mc2 se define como la energía total de la partícula y a la cantidad dinámica E0 := m0 c2 (5.12) la definimos como su energía en reposo. Esta cantidad E0 adquiere el sentido físico de una energía, solamente si es posible transformar esta forma de energía (asociada a la masa y no a su estado de movimiento) en otras formas de energía. Einstein, en su segundo artículo de 1905 sobre relatividad, titulado ”Depende la inercia de un cuerpo de su contenido de energía” postula que esta forma de energía, asociada a la masa en reposo de una partícula, es posible transformarla en otras formas de energía, dándole así sentido físico a esta definición y sugiere que esta transformación de masa en energía se puede medir en el decaimiento radioactivo de las sales de radio. Este postulado le valió a Einstein el ganarse el dudoso honor de ser ”el padre de la bomba atómica”. Otro resultado que apoya las definiciones anteriores, nos lo da la interpretación física de las componentes de la c-fuerza, definida por la ecuación de movimiento (5.3). Haciendo uso de la relación d\dτ = γ(u)d/dt y de la definición (5.4) de las componentes del c-momento, tenemos fα = dpα dpα = γ(u) dτ dt dm dm dp , ) = γ(u)(c , f) dt dt dt En la última igualdad hemos definido la cantidad = γ(u)(c f= dp dt (5.13) (5.14) la cual identificamos como la fuerza física que actúa sobre la partícula, produciendo, de acuerdo con la definión newtoniana de fuerza, un cambio por unidad de tiempo en el momentum de la partícula. Para sustentar aún más 84 CAPÍTULO 5. DINÁMICA RELATIVISTA esta definición de fuerza y de paso la definición de energía total E dada, consideremos la relación de ortogonalidad entre la c-velocidad y la c-aceleración (ecuación (4.23)) U · A = 0, entonces f · U = η αβ f α U β = 0 (5.15) y de esta ecuación y de la definición de las componentes de la c-velocidad, obtenemos la relación γ 2 (u)c2 dm − γ 2 (u)f · u = 0 dt dE =f ·u dt Esto implica que si adoptamos la definición clásica de trabajo ⇐⇒ (5.16) dW = f · dr (5.17) dW = f · udt = dE (5.18) entonces se obtiene que esto significa, que si el trabajo realizado por una fuerza sobre una partícula es diferente de cero, entonces la partícula cambia su energía total, de acuerdo con la ecuación (5.18). Esta última relación nos permite escribir las componentes de la c-fuerza, definidas en la ecuación (5.13), en la forma 1 f α = γ(u)( f · u, f ) c (5.19) la cual nos da una interpretación directa de las componentes de la c-fuerza; la componente temporal representa el trabajo por unidad de tiempo que realiza la fuerza física f sobre la partícula, mientras que las componentes espaciales forman el vector fuerza. 5.2. Leyes de conservación La dinámica Newtoniana está basada sobre tres postulados fundamentales: La primera ley de Newton o el princio de inercia, la cual también se puede formular de manera equivalente, como el principio de relatividad Galileano, siendo el primer postulado de la teoría especial de la relatividad la generalización de esta primera ley. La segunda ley, que postula la ecuación 5.2. LEYES DE CONSERVACIÓN 85 de movimiento para una partícula sometida a una fuerza (F = ma), se extiende al caso relativista a través de la ecuación (5.3). La tercera ley llamada de acción y reacción, que postula el comportamiento de la interacción entre sistemas, esto es, que la fuerza ejercida sobre una partícula es el resultado de la interacción de esta partícula con algún sistema y por tanto, sobre este sistema también interacciona la partícula, efectuando sobre él una fuerza de la misma magnitud pero de sentido contrario a la ejercida por el sistema sobre la partícula. Claramente esta ley implica que la acción y la reacción son eventos simultaneos y por lo tanto no puede ser válida para el caso relativista en general. Sin embargo, para el caso particular en que coincidan los puntos de aplicación de las fuerzas de acción y reacción, sí se cumple la tercera ley de Newton, una situación que se puede presentar cuando los sistemas que interactúan son partículas puntuales y la interacción entre ellas se pueda aproximar por una interacción de contacto. Puesto que las interacciones fundamentales (gravitacional, electromagnética, fuerte o nuclear y débil) que rigen todos los procesos físicos son interacciones a distancia, y por lo tanto en sentido riguroso, ninguna de estas interacciones fundamentales puede satisfacer la tercera ley de Newton, es claro que el postulado de Newton sobre la acción y la reacción, deja de ser una ley fundamental en la naturaleza y su validez queda restringida a sistemas cuyas velocidades típicas séan pequeñas comparadas con la velocidad de la luz, o para interaciones puntuales de contacto. Es importante anotar en este punto que, en el marco de la mecánica Newtoniana, la tercera ley de Newton juega un papel fundamental para establecer los teoremas de conservación del momentum y de la energía mecánica. Esto nos conduce entonces, a postular un principio de conservación para la energía y el momentun de un sistema relativista, el cual como veremos, generaliza las leyes de conservación de la mecánica Newtoniana y adiciona una nueva forma de energía, llamada energía en reposo, que está asociada a toda partícula material y que constituye uno de los aportes más importantes de la teoría especial de la relatividad. Para un sistema aislado de partículas, con c-momentos pi , i = 1, 2, ..., el c-momento total del sistema p , defido como X pi (5.20) p := i=1 es una constante de movimiento. Dado que la componente temporal del cmomento representa la energía total del sistema y las componentes espaciales corresponden a las componentes del vector momento, entonces el postulado de la conservación del cuadrimomento asegura que la energía total y el 86 CAPÍTULO 5. DINÁMICA RELATIVISTA momentun total de un sistema aislado son constantes del movimiento. Esto es, si expresamos la ecuación (5.20) en componentes, con pi = (Ei /c, pi ) y p = (E/c, p), obtenemos que la energía total del sistema E, definida como la suma de las energías de las partículas individuales X Ei (5.21) E := i=1 y el momentun total del sistema, definido como la suma vectorial de los momentos individuales de las partículas X pi (5.22) p := i=1 se conservan. Notemos que la ley de conservación de la energía (ecuación (5.21)) se puede reformular como el postulado de la conservación de la masa inercial, pues de la definición de energía total de una partícula E = mc2 , tenemos que X mi = cte. (5.23) i=1 Existe toda una serie de consecuencias interesantes de los postulados de la dinámica relativista, que las vamos a exponer a través de ejemplos sobre procesos que se presentan al nivel de las partículas elementales. Es importante en este punto de la discusión hacer algunas anotaciones respecto a la diferencia, tanto en las aplicaciones como en la metodología de trabajo, entre la dinámica Newtoniana y la relativista. En mecánica Newtoniana, por lo general se conocen las fuerzas (su forma funcional), por ejemplo la fuerza de la gravedad, de Coulomb, del tipo oscilador armónico, de rozamiento, etc., y a partir de ellas , utilizando la segunda ley de Newton se encuentran las trayectorias de las partículas y las leyes de conservación permiten determinar constantes de movimiento, simplificando así el problema dinámico. En el caso de la relatividad la situación se modifica un poco, pues, salvo el caso de la fuerza de Lorentz, que describe la fuerza que actúa sobre una partícula cargada inmersa en un campo electromanético, la cual nos permite describir el movimiento de la carga solucionando la ecuación dinámica de movimiento, las otras interacciones fundamentales no admiten, por una parte, una descripción clásica funcional de la fuerza que esté de acuerdo con los principios de la relatividad y por otra parte, es conocido que el tratamiento de las interacciones fundamentales (incluyendo la electromagnética) debe hacerse en en marco de la teoría cuántica de campos. El caso de la electrodinámica es especial, pues esta interacción fundamental admite 5.3. PROPIEDADES DEL C-MOMENTUN 87 una descripción clásica dada por las ecuaciones de Maxwell, las cuales son ecuaciones relativistas que describen correctamente los fenómenos electromagnéticos a nivel macroscópico. La diferencia de la electrodinámica clásica con la ley de gravitación universal de Newton, la cual también describe correctamente los fenómenos gravitacionales a escalas macroscópicas, radica en el hecho que esta última no es una teoría relativista, pues la fuerza gravitacional Newtoniana es una interacción a distancia e independiente del tiempo. Esta situación fue precisamente la que condujo a Einstein a buscar una teoría de la gravitación que estuviera de acuerdo con los principios de la relatividad y que en el límite de bajas velocidades se redujera a la teoría Newtoniana de la gravedad, logrando su objetivo en 1915, cuando formuló la Teoría General de la Relatividad. Si bien, las aplicaciones fundamentales de la teoría especial de la relatividad de dan en el marco de las partículas elementales y como fue enfatizado en el parágrafo anterior, para su descripción dinámica se requiere de una teoría cuántica de campos, es posible como veremos, obtener toda una serie de resultados importantes a partir de la dinámica relativista a partir de los principios de conservación, sin necesidad de recurrir a una descripción completa de las interacciones que rigen estos procesos. Antes de entrar a estudiar las principales consecuencias de los postulados de la dinámica relativista, a través de fenómenos y procesos físicos, daremos algunas definiciones y propiedades y unos resultados generales que serán de utilidad más adelante. 5.3. Propiedades del c-momentun Un primer resultado general que se deriva de la formulación cuadrivectorial de la relatividad surge debido al hecho de que la norma de cualquier c-vector en un invariante relativista y por lo tanto las cuatro componentes que conforman un c-vector no son independientes. Así por ejemplo, esta restricción sobre las componentes del c-momentun de una partícula, nos conduce a una relación entre su energía total y la magnitud de su momentun, pues dado p = (E/c, p) tenemos p2 = E 2 /c2 − | p |2 = Invariante (5.24) Para calcular el valor de este invariente, basta con determinar el cmomentun de la partícula en un sistema de referencia particular, por ejemplo, en el sistema de reposo instantaneo de la partícula, para el cual el 88 CAPÍTULO 5. DINÁMICA RELATIVISTA c-momentun toma la forma p = (E0 /c, 0) (5.25) y por lo tanto su norma al cuadrado se reduce a p2 = E02 /c2 = m20 c2 (5.26) Esto significa que para una partícula de masa en reposo m0 , energía total E y momentun p medidas en un sistema de referencia Σ, se cumple la relación (5.27) E 2 /c2 − | p |2 = m20 c2 o en forma equivalente E 2 = E02 + | p |2 c2 (5.28) Dos conclusiones importantes se desprenden de este análisis: La primera tiene que ver con el hecho de que el cuadrivector-momentun de una partícula física debe ser como de tiempo, pues m20 c2 > 0 y la segunda conclusión es que su norma nos caracteriza a la partícula, pues está dada por la masa en reposo de dicha partícula, que es un invariante relativista por definición. Más adelante cuando discutamos el concepto de fotón o partículas de masa en reposo nula, volveremos sobre la ecuación (5.28). Consideremos ahora dos partículas de c-momentos p1 y p2 , con masas en reposo m01 y m02 respectivamente y sea v la velocidad relativa entre ellas. Entonces el producto interno Minkowskiano entre sus c-momentos, que es un invariante relativista, está dado por (5.29) p1 · p2 = c2 m01 m2 = c2 m1 m02 = c2 m01 m02 γ(v) p en donde γ(v) = 1 − v2 /c2 es el factor γ de la velocidad relativa. Para obtener esta expresión, basta con calcular el producto interno en el sistema de referencia propio de una de las partículas (segunda o tercera igualdad de la ecuación (5.29)), mientras que la última igualdad de esta ecuación se deduce del hecho que v es la velocidad de una de las partículas medida en el sistema de referencia de la otra (i.e. la velocidad relativa). En mecánica Newtoniana se define una colisión elástica entre dos partículas, cuando la energía cinética del sistema es la misma antes y después de la colisión. Así, en una colisión inelástica parte de la energía cinética de las partículas se transforma en otras formas de energía, como por ejemplo, calor, ondas mecánicas, etc.. Consideremos ahora una colisión relativista entre dos partículas puntuales, con c-momentos p1 y p2 antes de la colisión y p01 y p02 5.3. PROPIEDADES DEL C-MOMENTUN 89 después de la colisión. De la hipótesis de conservación del c-momentun se obtiene que (5.30) p1 + p2 = p01 + p02 elevando al cuadrado y utilizando las propiedades del producto interno Minkowskiano (ecuación (3.68)) obtenemos 02 0 0 p21 + p22 + 2p1 · p2 = p02 1 + p2 + 2p1 · p2 (5.31) Uno de los hechos más interesantes que surge en relatividad y que no tiene su contraparte clásica, es que en un proceso de colisión (interacción) entre partículas, es posible que algunas o todas de las partículas iniciales que intervienen en el proceso se aniquilen y surjan otras diferentes. Que este hecho sea posible es una consecuencia de la equivalencia masa-energía (ecuación (5.12)). Es importante reiterar que los parámetros que caracterizan una clase de partículas (electrones, protones, etc.) son su masa en reposo, carga eléctrica, spin, y otros números cuánticos. En los procesos que son de interés para nosotros, solo va a intervenir la masa en reposo de las partículas y por lo tanto, este único parámetro es suficiente para caracterizar dinámicamente a una partícula dada. Retomando la discusión de la colisión entre dos partículas, consideremos el caso particular en el cual las partículas que intervienen en el proceso (ecuaciones (5.30) y (5.31)) son las mismas antes y después de la colisión. Si m01 y m02 son las masas en reposo de las partículas, entonces de la relación (5.26) se tiene que 2 2 (5.32) p21 = p02 1 = m01 c 2 2 p22 = p02 2 = m02 c (5.33) y por lo tanto la ecuación (5.31) se reduce a la igualdad p1 · p2 = p01 · p02 (5.34) Teniendo presente el resultado de la ecuación (5.29), aplicandolo a ambos miembros de la ecuación (5.34), se llega a que c2 m01 m02 γ(v) = c2 m01 m02 γ(v 0 ) (5.35) con v y v0 las velocidades relativas entre las partículas antes y después de la colisión, de donde se obtiene que v = v0 (5.36) 90 CAPÍTULO 5. DINÁMICA RELATIVISTA Por lo tanto, llegamos a la conclusión general que la magnitud de la velocidad relativa entre las partículas no cambia. Esta situación nos conduce a hacer la siguiente definición: Una colisión entre partículas se llama elástica, si las partículas que intervienen en el proceso son las mismas antes y después de la colisión, o equivalentemente, si las masas en reposo de las partículas que intervienen en la colisión no cambian. Con esta definición, el resultado expresado en la ecuación (5.36) se conoce como el lema de la colisión elástica para dos partículas. Esta definición de colisión elástica tiene relación con la correspondiente definición Newtoniana de colisión elástica, pues en el límite de bajas velocidades se reduce a la conservación de la energía cinética. Para ver esto, basta con tener en cuenta la definición de energía cinética relativista como la diferencia entre la energía total y de reposo. Si llamamos Ei y Ef las energías totales antes y después de la colisión, entonces de la conservación de la energía total se tiene Ei = m1 c2 + m2 c2 = m01 c2 + m02 c2 = Ef (5.37) Por lo tanto, la energía cinética del sistema antes y después de la colisión es la misma: Ki = Ei − m01 c2 − m02 c2 = Ef − m01 c2 − m02 c2 = Kf 5.4. (5.38) Sistema centro de masa Como vimos en la Proposición 4.6, dado un c-vector V como de tiempo siempre es posible encontrar un sistema de referencia Σ0 , para el cual sus componentes se reducen a (V 0 , 0), dejando además el signo de la primera componente invariante, puesto que V o está dirigido al futuro (V 0 > 0) o dirigido al pasado (V 0 < 0). Si W es otro c-vector como de tiempo, sincrono con V , i.e., V 0 W 0 > 0, entonces en el sistema de referencia Σ0 se cumple (V + W )2 = (V 0 + W 0 )2 − W 2 = V 2 + W 2 + 2V 0 W 0 > 0 (5.39) por lo tanto, se llega al siguiente resultado importante que lo enunciaremos como un lema: Lema 5.1 La suma de dos c-vectores como de tiempo y sincronos, es un c-vector como de tiempo y sincrono con cada uno de los sumandos. Por inducción este resultado es válido para una suma cualquiera de cvectores como de tiempo sincronos. 5.4. SISTEMA CENTRO DE MASA 91 Consideremos ahora un sistema de un número finito de partículas no interactuantes, salvo colisiones puntuales mutuas, con masas en reposo m0i , i = 1, 2, ... y c-momentos pi y sea Σ un sistema de referencia inercial cualquiera. Definamos la masa relativista total m̄ del sistema y su c-momentun total p̄ como X mi (5.40) m̄ := i=1 p̄ := X i=1 X pi = (mi c, pi ) = (m̄c, p) (5.41) i=1 en donde hemos definido el momentun total del sistema p en la última igualdad de la ecuación (5.41). De los postulados de conservación todas las cantidades definidas, p̄ y por tanto m̄ y p, son constantes en el tiempo. Por el lema anterior, el c-momentun total del sistema es un c-vector como de tiempo y dirigido al futuro pues m̄c > 0. Por las propiedades dadas en la Proposición 5.1 y Proposición 5.2, podemos encontrar un sistema de referencia que lo llamaremos ΣCM o sistema de referencia centro de masa, para el cual el c-momentun total p̄ no tenga componentes espaciales, esto es, un sistema para el cual p = 0. La velocidad uCM del sistema de referencia centro de masa respecto a Σ está dada por uCM = p m̄ (5.42) A diferencia de la mecánica Newtoniana, el vector centro de masa de un sistema de partículas relativistas es dependiente del sistema de referencia inercial, lo cual se puede entender fácilmente si tenemos en cuenta que la masa inercial de las partículas depende de la velocidad de las mismas. Sin embargo, este vector centro de masa siempre está en reposo en el sistema de referencia ΣCM . Para ver esto, definamos para un sistema de referencia inercial Σ, el vector posición centro de masa del sistema como P ri mi (5.43) rCM := Pi=1 i=1 mi entonces drCM = dt P dri i=1 dt mi + m̄ P dmi i=1 ri dt = P i=1 pi m̄ = uCM (5.44) en donde se han utilizado las definiciones (5.42), (5.43) y (5.44), el hecho de que m̄ es una constante de movimiento y además que para interacciones 92 CAPÍTULO 5. DINÁMICA RELATIVISTA P puntuales (colisión) i=1 ri dmi /dt = 0 entre colisiones. Este resultado significa que para cualquier sistema de referencia, el centro de masa del sistema se mueve con la velocidad del sistema centro de masa, lo que no significa que el vector posición centro de masa sea el mismo para todos los observadores inerciales. Por esta razón, es usual definir el centro de masa del sistema como el vector posición rCM medido en el sistema ΣCM . Definida la velocidad uCM (ecuación (5.42)), la c-velocidad del centro de masa está dada por UCM = γ(uCM )(c, uCM ) (5.45) entonces, de la definición de c-momentun total (ecuación (5.41)), velocidad del centro de masa (ecuación (5.42) y la definición de c-velocidad del centro de masa (ecuación (5.45)), tenemos que p̄ = (m̄c, p) = m̄(c, uCM ) = m̄γ −1 (uCM )UCM (5.46) Tomando la norma al cuadrado de esta ecuación p̄2 = m̄2 γ −2 (uCM )c2 (5.47) la cual debe ser un invariante relativista, nos conduce a la definición de la masa total del sistema de partículas en el sistema de referencia centro de masa ΣCM : m̄ (5.48) mCM := γ(uCM ) Por lo tanto, podemos escribir el c-momentun total del sistema como p̄ = mCM UCM (5.49) en donde mCM y UCM para el sistema de partículas, juegan el papel de m0 y U para una partícula simple. Es importante aclarar que mCM , la masa en reposo del sistema en ΣCM , excede a la suma de las masas en reposo de las partículas del sistema, pues a ella contribuyen también las energías cinéticas de las partículas individuales, puesto que la energía cinética del sistema en ΣCM está dada por KCM = mCM c2 − m̄0 c2 (5.50) en donde hemos definido m̄0 := n X i=1 m0i (5.51) 5.5. ENERGÍA UMBRAL 5.5. 93 Energía umbral La primera patícula fundamental que se identificó fue el electrón, el cual era el responsable de la conducción eléctrica. Luego a comienzos de la década de los treinta, se identificaron el protón y el neutrón como los constituyentes del núcleo atómico. Por esta época Yukawa desarrolló un modelo para la interacción nuclear, en el cual surgía una nueva partícula fundamental, el pión, que luego fue observada experimentalmente. Esta época se puede considerar como el comienzo de la física de las partículas fundamentales y ya en la década de los sesenta, se conocian cientos de nuevas partículas, las cuales se podían producir en el laboratorio como producto de las colisiones entre partículas aceleradas a altas energías (por ejemplo electrones contra electrones o protones). Cuando chocan dos partículas con energía cinética suficiente, se pueden generar nuevas y más masivas partículas, como el resutaldo de la transformación de energía cinética en energía en reposo de las nuevas partículas. La pregunta dinámica que surge es ¿Cual en la energía mínima necesaria de las partículas incidentes, para producir una nueva partícula de una masa dada?. La respuesta a esta pregunta la constituye el llamado problema de la energía umbral, que es una de las aplicaciones más importantes de la dinámica relativista. Para introducir el concepto de energía umbral, consideremos por ejemplo un electrón de masa en reposo m0 y energía total E = mc2 , que choca contra otro electrón en reposo y como producto de la colisión surge, además de los dos electrones iniciales, una nueva partícula de masa en reposo M0 . El problema es encontrar la energía mínima necesaria del electrón incidente, llamada energía umbral, para que esta reacción pueda suceder. La respuesta no es simplemente (m + M0 )c2 , i.e., que la energía cinética del electrón incidente sea justamente la energía en reposo de la nueva partícula, pues dado que el momentun del sistema debe conservarse, el producto de la colisión en general, debe poseer alguna energía cinética y por lo tanto parte de la energía inicial debe gastarse en esta energía cinética y la otra parte debe suplir la energía en reposo de la nueva partícula. De cualquier manera, la energía mínima (umbral) se tendrá cuando las partículas resultantes de la colisión estén en reposo en el sistema de referencia del centro de masa del sistema. Esta última afirmación define el concepto de energía umbral. Tomemos por el momento el caso general de dos partícula de masas en reposo m01 y m02 y c-momentos p1 y p2 respectivamente, que al chocar producen una nueva partícula de masa en reposo M0 . Entonces, el c-momentun 94 CAPÍTULO 5. DINÁMICA RELATIVISTA total del sistema está dado por: p̄ = p1 + p2 (5.52) Elevando al cuadrado esta expresión y teniendo en cuenta la ecuación (5.29) y la definición (5.48), tenemos m201 c2 + m202 c2 + 2m01 m2 c2 = p̄2 = m2CM c2 (5.53) De esta relación se obtiene que la energía de la partícula incidente, en el sistema de referencia del laboratorio, será mínima cuando mCM sea mínima, lo cual ocurre cuando todas las partículas emergentes estén en reposo en el sistema de referencia centro de masa. Puesto que en este caso la masa del sistema centro de masa coincide con la suma de las masas en reposo de las partículas que salen, el límite de mínima energía (5.53) se reduce a m201 + m202 + 2m01 m02 γ(v) = (m01 + m02 + M0 )2 (5.54) siendo v la velocidad de incidencia de la partícula 2. Dadas las masas de las partículas iniciales y la masa de la nueva partícula, podemos obtener de esta ecuación la velocidad de la partícula incidente y así la energía umbral. Para el ejemplo de los dos electrones, que al colisionar crean una nueva partícula de masa en reposo M0 , podemos despejar de la ecuación (5.54) el factor γ(v): 2M0 M02 γ(v) = 1 + + 2 (5.55) m0 m0 y por lo tanto la energía umbral está dada por EU = m0 γ(v)c2 = m0 c2 + 2M0 c2 + M02 2 c m0 (5.56) Esta ecuación es fundamental cuando se diseñan experimentos para buscar nuevas partículas. Como ejemplo, tomemos el caso del último de los quarks buscado por los físicos de altas energías, el quark top τ , el cual fue detectado en el año de 1995 en el Fermilab (Estados Unidos). Es importante anotar que el cálculo que vamos a mostrar, es tan solo un estimado de la mínima energía a partir de la cual podría detectarse el quark, pues en la reacción donde aparece el quark, también pueden aparecer otras partículas y por lo tanto, para un cálculo más exacto se debe tener en cuenta estos efectos adicionales. El quark top se espera que aparezca en una colisión protón-antiproón (p − p̄) y supongamos para simplificar, que después de la colisión permanece el par (p − p̄) y el quark τ . Las predicciones teóricas de 5.5. ENERGÍA UMBRAL 95 la existencia del quark τ , así como su posible masa, dependen del modelo teórico utilizado, pues por ejemplo, tomando los modelos más aceptados en julio de 1994 (tomados del Particle Physics Booklet, July 1994, American Institute of Physics) la masa predicha para el quark oscilaba entre 62Gev/c2 , pasando por 131Gev/c2 y 174Gev/c2 , hasta el valor más alto de 169Gev/c2 , calculado a partir del modelo estandar electro-débil. Tomando para la masa del protón m0 = 0,94Gev/c2 , que es la misma masa del antiprotón, obtenemos de la ecuación (5.56) la energía umbral en el sistema laboratorio para la creación del quark top (5.57) EU = 32557Gev asumiendo una masa para el quark top de 174Gev/c2 . Es importante anotar que esta energía umbral calculada, corresponde a la energía con la que deben incidir, por ejemplo los protones sobre los antiprotones estacionarios, para que esta reacción pueda ocurrir. En la práctica, las energías alcanzadas hasta el presente en los grandes aceleradores están en el orden de los cientos de Gev. Sin embargo, en la mayoría de los aceleradores los experimentos se realizan en el sistema centro de masa directamente, pues tanto los protones como los antiprotones (o electrones) son acelerados a las mismas energías en un anillo, viajando en direcciones opuestas y por lo tanto la energía a la cual ellos son acelerados debe ser del orden de la energía umbral en el sistema centro de masa, que para nuestro caso corresponde a energías del orden de la masa en reposo de la partícula que se quiere encontrar, estos es a energías del orden de los 200Gev. Para ilustrar esta situación, calculemos la energía disponible en un experimento de dispersión de protones contra protones (o antiprotones) en dos casos: En el primer caso, los protones son acelerados hasta alcanzar una energía de 100GeV y chocan contra un blanco de protones en reposo (por ejemplo un gas de hidrógeno a baja temperatura, para el cual podemos despreciar la energía cinética típica de las partículas del gas). En un segundo experimento, los protones son acelerados a energías del orden de 50GeV , se divide el rayo en dos partes y se hacen chocar los dos haces de protones frontalmente. Sean p y q los c-momentos iniciales de los protones y sea ECM la energía del sistema en el centro de masa. De acuerdo a las ecuaciones (5.47) y (5.48) la cantidad 2 (p + q)2 = m2CM c2 = ECM /c2 (5.58) es un invariante, la cual puede ser evaluada en cualquier sistema de referencia. Para el primer caso, protones chocando con un blanco estacionario p = (E1 /c, p1 ) y q = (mp0 c, 0), tenemos 2 = 2m2p0 c4 + 2E1 mp0 c2 ' 2E1 mp0 c2 ECM (5.59) 96 CAPÍTULO 5. DINÁMICA RELATIVISTA pues, mp0 c2 ¿ E. Con E1 = 100GeV y mp0 c2 = 0,94GeV , la energía disponible es del orden de 13,7GeV . Para el segundo experimento, p = (E2 /c, p2 ) y q = (E2 /c, −p ), por lo tanto, la energía disponible está dada por: 2 = 4E22 =⇒ ECM = 100GeV ECM (5.60) Para alcanzar esta energía en el experimento de blanco estacionario, sería necesario acelerar los protones hasta una energía del orden de E1 ' 5.6. 2 ECM ' 5319GeV 2mp0 c2 (5.61) Fotones y partículas de masa en reposo cero En esta sección vamos a introducir el concepto de partícula de masa en reposo cero, y en particular el concepto de fotón, como la partícula portadora de la interacción electromagnética. El concepto de fotón o quantum de energía está estrechamente relacionado con la teoría cuántica, pero como veremos enseguida su origen es estrictamente relativista. No está dentro de los objetivos de este libro discutir la formulación de la teoría cuántica de campos, pues no es necesario tener un conocimiento en física cuántica, para entender los ejemplos y procesos que vamos a desarrollar a lo largo del presente capítulo. Sin embargo, haremos un breve recuento de los principales hechos históricos que contribuyeron al desarrollo del concepto de fotón. En la segunda mitad del siglo XIX, cuando la teoría de Maxwell se consolida con los experimentos de Herz sobre ondas electromagnéticas, se plantean varios problemas en diferentes áreas de la física, que finalmente conducen al desarrollo de la mecánica cuántica. En el campo de la espectroscopia se tenía el problema de explicar la estructura y en particular, el espectro de emisión y absorción de radiación electromagnética por átomos. En el experimento de Herz sobre las ondas electromagnéticas, se reporta un fenómeno curioso que luego, en experimentos más detallados conducen al descubrimiento del efecto fotoelectrico, esto es, la producción de una corriente eléctrica (fotocorriente) en un material, debido a la incidencia de radiación electromagnética. El problema surge, cuando todos los intentos teóricos basados sobre la electrodinámica de Maxwell, fallan para explicar las características de este efecto. Hacia finales del siglo XIX, Max Planck trabajando sobre el espectro de radiación de cuerpo negro, introduce la hipótesis de la emision y absorción discreta de energía de los osciladores del cuerpo negro, el 5.6. FOTONES Y PARTÍCULAS DE MASA EN REPOSO CERO 97 cual se puede modelar por una cavidad cerrada, en la cual se encuentra radiación electromanética en equilibrio térmico a una temperatura T dada. Esta radiación a su vez, está en equilibrio termodinámico con el material que conforma la cavidad que está emitiendo y absorviendo continuamente radiación electromagnética. Contrario a la situación clásica, para la cual se espera que un oscilador pueda absorber o emitir energía en cualquier cantidad, Planck postuló que cada oscilador podía enmitir o absorber energía únicamente en valores discretos, múltiplos de una cantidad fundamental E = hν (5.62) en donde ν es la frecuencia de la radiación electromagnética emitida o absorvida y h se conoce como la constante de Planck, cuyo valor actual 6,626075(40) × 1034 J · s. Seis años después en 1905, Einstein extiende esta hipótesis y postula que la radiación electromagnética energía está cuantizada y no solamente los osciladores materiales que emiten y absorven la radiación. Así una onda electromagnética de frecuencia ν transporta su energía en paquetes o quantos de energía, llamados fotones, de valor hν. Con esta hipótesis, Einstein explica el efecto fotoeléctrico y predice además que de acuerdo a la equivalencia masa-energía, los fotones deben transferir momentun al igual que cualquier otra partícula. La diferencia con las partículas usuales, tales como el electrón o el protón, está en su masa en reposo, como veremos enseguida. Partiendo de la definición de las componentes del c-momentun (ver ecuación (5.4)) (5.63) pα = (E/c, p) y de sus propiedades, ecuación (5.24) o equivalentemente ecuación (5.28), se tiene la relación, entre la energía total de la partícula E, su energía en reposo E0 y su momentun p: E 2 = E02 + |p|2 c2 (5.64) Esta relación nos permite considerar el caso de una partícula de energía en reposo nula, i.e., E0 = 0. Esto implica por una parte, que su masa en reposo es cero m0 = 0 y además, que la norma del c-momentun de esta partícula es un c-vector como de luz, pues su norma se anula p2 = E 2 /c2 − |p|2 = 0 (5.65) Estas partículas se llaman partículas de masa en reposo nula y su principal característica es que sus líneas de universo siempre están sobre el cono 98 CAPÍTULO 5. DINÁMICA RELATIVISTA de luz y por lo tanto no existe ningún observador inercial para el cual estas partículas estén en reposo. La ecuación (5.65) nos da la relación entre el momentun físico y la energía total de las partículas de masa en reposo nula. El fotón, que es la partícula asociada al campo electromagnético, es un caso particular de partícula de masa en reposo nula. Consideremos ahora el c-vector de onda k = (ω/c, k) (5.66) definido en el capítulo anterior (sección (4.4)), que nos representa una onda electromagnética plana de frecuencia ω y número de onda k y postulemos, de acuerdo a Einstein, que esta onda transporta su energía y momentun en quantos o fotones, cuyo c-vector momentun está dado por: p := ~k = (~ω/c, ~k) (5.67) en donde se ha introducido la constante ~, relacionada con la constante de Planck por ~ = h/2π. De esta relación se sigue que el fotón transporta una energía total E = ~ω = hν (5.68) pues ω = 2πν, de acuerdo al postulado original de Einstein y un momentun físico p = ~k (5.69) que de acuerdo a las propiedades del c-vector de onda (ecuación (4.57)), la energía (ecuación (5.68)) y el momentun físico (ecuación (5.69)), deben cumplir la relación (5.70) ~2 k 2 = E 2 /c2 − |p|2 = 0 la cual nos define una partícula de masa en reposo nula, teniendo en cuenta la ecuación (5.65). Las partículas de masa en reposo cero pueden tener también otras características que las diferencian entre si, tales como la carga, momento magnético, etc.. A parte del fotón, en la naturaleza se encuentran otras partículas de masa en reposo cero, como por ejemplo los neutrinos. Es importante anotar que la física busca permanentemente nuevos experimentos para determinar si estos neutrinos son realmente partículas de masa en reposo cero, o si estos poseen una masa en reposo. Hasta el presente se ha determinado que la masa es reposo de estos neutrinos, si la tienen, es inferior a 17kev/c2 , que al compararla con la masa del electrón (la partícula estable de menor masa en reposo conocida) m0 = 0,51M ev/c2 , es realmente muy pequeña. De hecho para el fotón también se han realizado experimentos 5.6. FOTONES Y PARTÍCULAS DE MASA EN REPOSO CERO 99 para imponerle cotas superiores a su masa en reposo. Como ya se ha dicho en la introducción de esta sección, el caracter dual que presentan las ondas electromagnéticas, esto es, para cierto tipo de fenómenos, como el efecto fotoelectrico o el efecto Compton (que discutiremos más adelante), para los cuales la luz interacciona como partículas, contrasta con otros fenómenos típicos del caracter ondulatorio de la luz, como los efectos de interferencia o difracción. Esta dualidad es una característica general de toda la materia cuyo estudio le corresponde a la mecánica cuántica. Esta dualidad es tal vez, uno de los aspectos más interesantes que presenta la naturaleza y su interpretación ha sido objeto de muchos trabajos. La teoría de la relatividad no pretende conciliar estas ideas y de hecho, este comportamiento dual aparentemente contradictorio, no se presenta como un problema en el contexto de la teoría de la relatividad, pues tanto las ondas electromagnéticas, como las partículas de masa en reposo cero (y en particular los fotones) son conceptos relativistas y su relación física se establece solo a través del postulado de cuantización de la energía de Planck, el cual en ningún momento entra en contradicción con los principios básicos de la relatividad. Para finalizar esta sección, retomaremos algunos resultados generales de la dinámica relativista, que siguen siendo válidos si alguna o todas las partículas que intervienen en el proceso son de masa en reposo nula, como por ejemplo la emisión de un fotón por un átomo. En primer lugar consideremos el caso de dos partículas de c-momentun p1 y p2 , para el cual el producto interno Minkowskiano está dado por la relación invariante ecuación (5.29). Si una de las partículas es un fotón, e.g., la partícula 2, entonces m02 = 0 y podemos escribir esta relación en la forma: p1 · p2 = cm01 E2 (5.71) en donde p1 = (m1 c, p1 ) y p2 = (E2 /c, p2 ), con E2 la energía del fotón en el sistema de referencia propio de la partícula 1. En el caso en que las dos partículas sean fotones, la relación (5.29) se vuelve indeterminada. Para encontrar la relación correcta, supongamos que p1 = (E1 /c, p1 ) y p2 = (E2 /c, p2 ). Como p1 y p2 son c-vcectores nulos, se debe cumplir que |pi | = Ei /c, para i = 1, 2, entonces de la definición de producto interno Minkowskiano se tiene: p1 · p2 = E1 E2 /c2 − p1 · p2 = E1 E2 (1 − cos θ) c2 (5.72) en donde θ es el ángulo formado por los vectores momentun de las partículas, que para el caso de fotones, sería el ángulo entre las direcciones de propagación de las ondas electromagnéticas o fotones. 100 CAPÍTULO 5. DINÁMICA RELATIVISTA Otra relación que permanece válida para el caso de partículas de masa en reposo cero, se refiere al problema de la energía umbral, ecuación (5.53). Si por ejemplo la partícula que choca es un fotón, entonces m2 = ~ω/c2 , m02 = 0 y por lo tanto (5.73) mCM = m01 Capítulo 6 Aplicaciones de la dinámica relativista 6.1. Introducción En este capítulo daremos algunos ejemplos de procesos dinámicos, los cuales ilustran los fenómenos y aplicaciones más importantes de la teoría especial de la relatividad y más específicamente, de los postulados de conservación de la energía y el momentun. Restringiremos nuestra discusión a procesos de colisión entre partículas puntuales, i.e., consideraremos únicamente interacciones de contacto, sin entrar en los detalles de las interacciones (fuerzas) que rigen estos procesos. Como se mencionó al comienzo del capítulo anterior, de las cuatro interacciones fundamentales que determinan la dinámica de todos los procesos conocidos, solamente la interacción electromagnética admite una descripción clásica relativista. Dejaremos para el capítulo sobre electrodinámica, el problema de formular las ecuaciones de movimiento de partículas cargadas en campos electromagnéticos. 6.2. Colisiones elásticas El ejemplo más importante de una colisión elástica, tanto por su importancia histórica como por sus aplicaciones prácticas, lo constituye el proceso de dispersión Compton. Este proceso, llamado energía efecto Compton, jugó un papel fundamental en el desarrollo de la mecánica cuántica, pues éste ofreció una de las primeras pruebas directas del carácter corpuscular de la luz y de paso también, una prueba más de la dinámica relativista. A. H. Compton recibió el premio nobel en 1927 por el estudio de este efecto (ver, 101 102 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA Figura 6.1: Efecto Compton por ejemplo, el artículo original: Compton A.H., 1923, Phys. Rev. 22,409). 6.2.1. Efecto Compton La dispersión Compton es el proceso de colisión elástico entre una partícula de masa en reposo cero (e.g., un fotón) contra una partícula masiva (e.g., un electrón). El experimento original se realizo haciendo colisionar fotones de alta energía (como rayos X o rayos gama) contra electrones practicamente en reposo, es decir, electrones con energías cinéticas mucho menores que las energías típicas de los fotones. Tomemos el eje z en la dirección de incidencia del fotón (ver Figura 6.1), entonces su c-momentun inicial se puede escribir como pγ = (Eγ /c, pγ ) (6.1) con Eγ = hν la energía, siendo ν la frecuencia del fotón incidente y pγ = (0, 0, Eγ /c) su momentun, en donde se ha hecho uso de la relación (5.65). El c-momentun inicial del electrón en reposo está dado por: pe = (me0 c, 0) (6.2) 6.2. COLISIONES ELÁSTICAS 103 Figura 6.2: Lineas de universo del efecto Compton Sean p0γ = (Eγ0 /c, p0γ ) y p0e = (me c, p0e ) (6.3) los correspondientes c-momentos del fotón y del electrón después de la colisión. Sin pérdida de generalidad, supongamos que el plano en el cual se realiza la colisión es el x − z y sea θ el ángulo que forma la dirección de dispersión del fotón con respecto al eje z y ϕ el ángulo respecto al eje z de dispersión del electrón. Entonces de la conservación del c-momentun total del sistema, tenemos (6.4) pγ + pe = p0γ + p0e En la Figura 6.2 se muestran las líneas de universo del electrón y el fotón en el sistema de referencia del laboratorio. La línea de universo del fotón, dibujada a 45o en un plano paralelo al plano ct − z, intercepta a la línea de universo del electrón en reposo, evento P. En este punto el electrón es dispersado, siguiendo una línea de universo dentro del cono de luz del evento P, mientras que el fotón es dispersado en otra dirección, siguiendo una línea de universo sobre el cono de luz del evento P. Puesto que experimentalmente se mide la frecuencia (energía) o longitud de onda del fotón dispersado, en función del ángulo de dispersión y de la frecuencia o longitud de onda del fotón incidente, despejemos p0e de la 104 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA ecuación (6.4) y tomando la norma al cuadrado de esta ecuación resultante, obtenemos: (6.5) (pγ + pe − p0γ )2 = (p0e )2 Teniendo en cuenta que p2γ = p02 γ =0 (6.6) 2 2 p2e = p02 e = me0 c (6.7) y llegamos finalmente a la relación: pγ · p0γ + pe · (p0γ − pγ ) = 0 (6.8) Utilizando la ecuación (5.72) para el producto punto entre c-vectores nulos y de las expresiones (ecuaciones (6.1) a la (6.2)) para los c-momentun del electrón y los fotones inicial y final, obtenemos Eγ Eγ0 (1 − cos θ) + me0 (Eγ0 − Eγ ) = 0 (6.9) c2 Expresando las energías de los fotones en términos de la longitud de onda asociada, Eγ = hν = hc/λ y Eγ0 = hν 0 = hc/λ0 , obtenemos finalmente, la expresión estandar para la dispersión Compton, la cual nos da la diferencia entre las longitudes de onda dispersada e incidente, en función del ángulo de dispersión θ: (6.10) λ0 − λ = λe (1 − cos θ) A la cantidad λe := h/me0 c se le llama longitud de onda de Compton asociada al electrón. En la (Figura 6.3) se reproducen los resultados originales de Compton. En 1950 Cross y Ramsey (Cross W.G. and Ramsey N.F., 1950, Phys. Rev. 80,929) midieron por primera vez al electrón dispersado simultáneamente con el fotón, en un experimento de coincidencia, obteniendo resultados en concordancia con la teoría. Para calcular el ángulo de dispersión del electrón, en función del ángulo de dispersión del fotón y de la energía del fotón incidente, despejemos la velocidad del electrón de las componentes espaciales de la ecuación (6.4) y eliminando Eγ0 en esta expresión, con la ayuda de la ecuación (6.9), obtenemos: tan ϕ = me0c c2 sin θ (Eγ + me0 c2 )(1 − cos θ) (6.11) en donde ϕ es el ángulo de dispersión del electrón, medido con respecto a la dirección de incidencia del fotón. En el experimento de coincidencia de Cross y Ramsey se midió un ángulo ϕ = 31,3◦ , para una energía del fotón incidente de 2,6M ev y un ángulo θ = 30,0◦ para el fotón dispersado. 6.2. COLISIONES ELÁSTICAS 105 Figura 6.3: Resultados experimentales de Compton 6.2.2. Efecto Compton inverso Como otro ejemplo de colisión elástica, consideremos la dispersión de un fotón de muy baja energía por una partícula, por ejemplo un protón, de alta energía. Después de la colisión la partícula masiva le cede parte de su energía cinética al fotón, el cual se dispersa con una frecuencia mayor dependiente del ángulo de dispersión. Por esta razón, a este proceso lo llamaremos efecto Compton inverso. El desarrollo matemático es similar al del efecto Compton tratado en el parágrafo precedente, aun cuando algo más complejo, pues la partícula está inicialmente en moviento. Para discutir un fenómeno interesante que se puede presentar con los rayos cósmicos y los fotones de la radiación cósmica de fondo, vamos a restringir la discución a un caso particular de este proceso de dispersión. Supongamos que la energía del fotón inicial Eγ es mucho menor que la energía total de la partícula incidente Ep = mp c2 , i.e., Eγ ¿ mp c2 y consideraremos solamente el caso de máxima transferencia de energía en el proceso de colisión, que de acuerdo con la relación (ecuación (6.10)) se obtiene para el caso de dispersión frontal, es decir θ = 180. Sea pγ = (Eγ /c, pγ ) el cmomentun del fotón y pp = (Ep /c, pp ) el c-momentun del protón antes de la colisión y sean p0γ = (Eγ0 /c, p0γ ) y p0p = (Ep0 /c, p0p ) los correspondientes c-momentos después de la colisión. De manera similar al caso tratado para 106 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA el efecto Compton, despejamos p0p de la ecuación de conservación (6.4) y elevando al cuadrado, obtenemos pγ · p0γ + pp · (p0γ − pγ ) = 0 ¯ ¯ Teniendo en cuenta que |pγ | = Eγ /c, ¯p0γ ¯ = Eγ0 /c y utilizando la imación q m2p0 c4 |pp | c = Ep2 − m2p0 c4 ≈ Ep − − 2Ep obtenemos, para la energía del fotón dispersado ¯ ¯ ¯ ¯ Eγ (Ep + ¯Pp ¯ c) Ep ≈ Eγ0 = 2 2Eγ + Ep − |pp | c 1 + mp0 c4 /Eγ E p (6.12) aprox(6.13) (6.14) El modelo estandar de la cosmología describe la estructura y evolución del universo actual, postulando su origen a partir de un estado inicial de altísima densidad y temperatura (en principio infinitas). Una de las predicciones fundamentales del modelo estandar es la existencia de un fondo de radión cósmica (radiación electromagnética con un espectro de cuerpo negro), el cual se ha ido enfriando debido a la expansión del universo, alcanzando una temperatura actual del orden de 2,73◦ K. Esta radiación cósmica de fondo se puede modelar como un gas de fotones, con una cierta distribución de energías. En promedio un fotón típico de este fondo de radiación tiene una energía media dada por Eγ = kB T (6.15) en donde T es la temperatura absoluta de 2,73◦ K y kB = 1,380 × 10−23 J · K −1 = 8,617 × 10−5 eV · K −1 (6.16) es la constante de Boltzmann. Por otra parte, los rayos cósmicos son haces de partículas elementales (en su mayoría electrones y protones) de alta energía E ∼ 1020 eV , cuya fuente, aun cuando no está completamente determinada, parece ser de origen galáctico. Un protón típico de estos rayos cósmicos, puede entonces dispersar elásticamente un fotón del fondo de radión cósmica y suministrarle entonces una energía, que de acuerdo a la relación (5.39), es del orden de Eγ0 ' 1020 eV 1 + (0,938 × 109 )2 /(1020 · 2,37 × 10−4 ) ' 2,6 × 1018 eV (6.17) Es decir, el fotón dispersado puede adquirir energías típicas de los rayos gama. 6.3. COLISIONES INELÁSTICAS 6.3. 107 Colisiones inelásticas Las aplicaciones más importantes de la dinámica relativista se encuentran en los procesos de dispersión inelásticos, tales como la absorción y emisión de fotones y la creación de nuevas partículas. Cuando colisionan dos partículas, se pueden producir muchos tipos de efectos que podemos esquematizar en los siguientes tipos de reacciones: A+B =C A+B =A+B+C A+B =A+C A+B =C +D+F +··· (6.18) La primera reacción por ejemplo, representa un proceso en el cual las partículas que chocan se aniquilan, para dar lugar a una nueva partiícula (por partícula queremos significar tanto las partículas elementales, como aquellas que presentan estructura interna o están conformadas por otras partículas elementales, tales como los átomos, moléculas o núcleos). La segunda reacción representa un proceso en el cual las partículas iniciales sobreviven a la colisión, dando lugar a una nueva partícula. En el tercer caso, una de las partículas que entra en la reacción se aniquila, dando lugar a la creación de otra y en la última reacción las partículas iniciales desaparencen y surgen varias partículas nuevas. ¿Que leyes físicas determinan cuál o cuáles reacciones pueden ocurrir?. En primer lugar están las leyes de conservación, las cuales determinan si un proceso dado puede o no suceder. Tomemos como ejemplo un fotón que choca contra un electrón inicialmente en reposo y captura al fotón, saliendo el electrón con cierta energía cinética. Sean p = (me0 c, 0) y q = (Eγ /c, Eγ /cn̂) los c-momentos iniciales del electrón y el fotón respectivamente, con n̂ un vector unitario en la dirección de movimiento del fotón incidente y sea p0 = (mc, mvn̂) el c-momentun del electrón depués de la colisión. Al aplicar el postulado de la conservación del c-momentun, p + q = p0 , obtenemos un resultado inconsistente, pues basta con elevar al cuadrado esta expresión: m2e0 c2 + 2me0 Eγ = (p + q)2 = p02 = m2e0 c2 (6.19) la cual implica que me0 = 0 o Eγ = 0. Esto significa que este proceso es prohibido, pues viola el principio de conservación del c-momentun. En segundo lugar existen otros principios de conservación los cuales, en general, dependen de la interacción (fuerte, electromagnética, débil o gravitacional) que media el proceso de colisión y que de igual manera, a los principios fundamenta de conservación de la energía y momentun, restringen los procesos 108 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA que puedan ocurrir en una colisión entre partículas. Algunos de estos principios de conservación son de validez general, tal como la conservación de la carga eléctrica, mientras que otros, como la conservación del número bariónico o la paridad, solamente se cumplen para unas interacciones pero no para otras. Por ejemplo, la interacción electromagnética conserva la paridad, pero la interacción bébil no la conserva. 6.3.1. Absorción de un fotón por un átomo Antes de entrar en el problema de absorción de un fotón por un átomo, es importante aclarar la diferencia, desde la óptica de la dinámica relativista, entre un átomo y una partícula elemental. La partícula elemental está caracterizada por su masa propia y eventualmente por otros números cuánticos como la carga, el spin, el isospin, etc, y basta que uno de estos parámetros sea diferente para que se tenga otra partícula elemental diferente. Un átomo, por otra parte, está caracterizado por su número atómico (i.e., el número de electrones o protones el cual determina sus propiedades químicas) y su número de nucleones (protones más neutrones del núcleo) el cual determina los diferentes isópos de un mismo elemento químico. La masa propia de los átomos no es estrictamente un parámetro que determine un tipo particular de átomos, pues dado que los atómos presentan estructura interna, (como los diferentes niveles de energía) la energía cinética de las partículas que lo constituyen y la energía potencial de interacción entre ellas contribuyen también a la masa propia de los átomos. Es de anotar, que si bien la contribución a la masa de los átomos debida a esta energía interna, es muy pequeña comparada con la suma de las masas de las partículas que lo conforman, si hacen una diferencia fundamental, cuando se trata el problema dinámico de la emisión y absorción de fotones por átomos, como veremos en esta sección. Así, un átomo que a emitido o absorbido un fotón, tendrá una masa propia diferente antes y después del proceso, sin que cambien necesariamente sus propiedades químicas y por lo tanto desde el punto de vista de la dinámica relativista relativista, estos átomos son partículas diferentes antes y después de la emisión o absorción de un fotón. Esta misma situación sigue siendo válida, aún en el caso en que el átomo se ionise (pierda uno o varios de sus electrones) y también cuando estamos tratando con otras estructuras como los núcleos atómicos. Por esta razón, una partícula elemental (sin estructura interna) aislada, tal como un electrón, no puede emitir o absorber un fotón individual, sin violar los principios de conservación fundamentales como vimos en el ejemplo tratado anteriormente. Consideremos una partícula no elemental (átomo, molécula, ión o núcleo) 6.3. COLISIONES INELÁSTICAS 109 Figura 6.4: Lineas de universo del átomo y el fotón capturado con masa en reposo M0 , sobre la cual incide un fotón de frecuencia ν, el cual es absorbido por la partícula. En la Figura 6.4 se muestra el proceso de absorción de un fotón por un átomo. La línea de universo del átomo inicialmente en reposo, intercepta a la línea de universo del fotón, evento P. El átomo captura al fotón y se dispersa siguiendo una línea de universo recta, la cual está dentro del cono de luz futuro del evento P. Sea M00 la masa de la partícula después de la colisión y calculemos, suponiendo que la partícula inicial está en reposo, la velocidad con que sale la partícula final. Llamemos p = (M0 c, 0) y q = (Eγ /c, Eγ /cn̂) los cmomentos iniciales de la partícula y el fotón respectivamente, en donde Eγ = hν y n̂ es un vector unitario en la dirección de propagación del fotón. El cmomentun final del sistema será p0 = (M 0 c, M 0 vn̂), pues por la conservación del momentun, la dirección de movimiento de la partícula final es la misma que la del fotón incidente, siendo v su velocidad y p M 0 = M00 / 1 − v 2 /c2 (6.20) De la conservación del c-momentun p + q = p0 podemos despejar directamente, elevando al cuadrado esta expresión, la masa en reposo de la 110 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA partícula final M00 = M0 r 2Eγ M0 c2 1+ (6.21) Escribiendo explícitamente en componentes la ecuación de conservación del c-momentun M0 c2 + Eγ = M 0 c2 (6.22) Eγ /c = M 0 v podemos calcular la masa relativista y la velocidad de la partícula final: M 0 = M0 + β= Eγ c v c= Eγ M0 c2 +Eγ (6.23) (6.24) Las partículas con estructura interna, como los átomos, moléculas y núcleos, poseen niveles de energía internos Ei con i = 0, 1, 2, ..., (en donde el nivel E0 se le llama estado base o fundamental del sistema) y por lo tanto el proceso de absorción de fotones por este tipo de partículas es selectivo, esto es, la partícula solo puede absorber fotones de ciertos valores de energía que cumplan con la condición que Ej − Ek ' Eγ , estrictamente Eγ > Ej − Ek , pues parte de la energía del fotón incidente debe gastarse en la energía cinética final del átomo (lo cual se deduce de las ecuaciones (6.23) y (6.24)). En un átomo por ejemplo, la diferencia típica entre niveles de energía está en el rango de los electronvoltios. Puesto que la masa propia de los átomos oscila entre 1GeV /c2 (para el átomo de hidrógeno) hasta los cientos de gigaelectronvoltios (para átomos pesados), la fracción Eγ /M0 c2 es del orden de 10−8 , calculada para el caso de un átomo de hidrógeno, mientras que la diferencia entre niveles de energía es inferior a 13,6eV (valor que corresponde a la energía de ionización del átomo de hidrógeno). De la ecuación (6.21) vemos que la masa propia del átomo exitado (que ha absorbido el fotón) es tan solo una fracción del orden de 10−8 mayor que la masa del átomo inicial. Por otra parte, la velocidad del átomo exitado está dada por la ecuación (6.24)), obteniendose v = 10−8 c (6.25) en donde para estos cálculos, hemos asumido un valor típico de 10eV para la energía Eγ del fotón incidente. Es de anotar que si incide un fotón sobre un átomo con una energía mayor a la de ionización, el fotón puede ser capturado por el átomo, o más 6.3. COLISIONES INELÁSTICAS 111 exactamente por un electrón del átomo, el cual se desprende del sistema con una energía cinética igual al exceso de energía del fotón sobre la energía de ionización. Este proceso, diferente al que estamos considerando, es la base del efecto fotoeléctrico el cual, como yá se ha mencionado anteriormente, jugó un papel fundamental en el desarrollo de la mecánica cuántica. Si llamamos ϕ la energía de ligadura del electrón al átomo, o a la estructura de átomos para el caso de un sólido (llamada también función trabajo del material), y Eγ = hν a la energía del fotón incidente, entonces si este fotón es absorbido por el sólido, el electrón se puede desprender del material, con una energía cinética dada por (6.26) Ke = hν − ϕ La energía cinética de los electrones desprendidos, llamados fotoelectrones, se puede medir utilizando un contravoltaje. La ecuación (6.26) presenta dos características importantes probadas experimentalmente, las cuales no pueden ser explicadas con un modelo ondulatorio de la luz: La primera característica es la relación líneal entre la frecuencia de la luz incidente, sin importar cual sea la intensidad de ella (la intensidad de la luz, en el modelo ondulatorio es proporcional al cuadrado de la amplitud de los campos electromagnéticos, mientras que en el modelo corpuscular de la luz, la intensidad es proporcional a la densidad de fotones). La segunda característica importante, es la existencia de una frecuencia umbral ν 0 , por debajo de la cual no hay corriente de fotoelectrones, la cual se obtiene cuando Ke = 0 = hν 0 − ϕ y que depende del material, pues la función trabajo ϕ es una propiedad del material, más no de la radiación electromagnética incidente. 6.3.2. Emisión de un fotón por un átomo exitado Consideremos ahora el proceso inverso al descrito en la sección anterior. Supongamos que un átomo exitado de masa propia M0 , inicialmente en reposo, emite un fotón de frecuencia ν, esto es, de energía Eγ = hν. En la Figura 6.5 se muestran las líneas de universo del proceso de emisión de un fotón por un átomo. El átomo exitado, inicialmente en reposo, emite un fotón: evento P. El fotón emitido sigue una línea de universo que está sobre el cono de luz futuro del evento P, en tanto que la línea de universo del átomo dispersado es descrito por la línea recta, interior al cono de luz del evento P. De manera similar al caso tratado en la sección anterior, la energía del fotón emitido no puede ser exactamente igual a la diferencia entre dos niveles de energía del átomo, de hecho debe ser ahora menor Eγ < Ej − Ek ≡ Eγ0 , 112 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA Figura 6.5: Lineas de universo del átomo y el fotón emitido pues por conservación de momentun el átomo, al emitir el fotón, debe sufrir un retroceso y por lo tanto parte de la energía suministrada por el átomo al realizar la transición, debe ser transformada a energía cinética del átomo final. Es de anotar que esta energía Eγ0 corresponde también a la diferencia entre las energías en reposo de los átomos inicial y final, i.e., Eγ0 = M0 c2 − M00 c2 (6.27) Una variable de interés en este proceso es la relación entre la energía del fotón emitido, con respecto a la diferencia entre dos niveles internos de energía del átomo, o equivalentemente, a la energía de un fotón emitido por el átomo, si este no sufriera retroceso. Sean p = (M0 c, 0) el c-momentun del átomo inicial y q = (Eγ /c, Eγ /cn̂) y p0 = (M 0 c, −M 0 vn̂) los c-momentos finales del fotón y el átomo, en donde n̂ es la dirección de propagación del fotón y v la velocidad de retroceso del átomo. De la ecuación de conservación del c-momentun, escrita en la forma p0 = p − q y elevando al cuadrado esta ecuación, se obtiene la relación: M002 c2 = M02 c2 − 2M0 Eγ (6.28) Remplazando la masa en reposo del átomo final, en términos de Eγ0 , se 6.4. SISTEMAS DE MASA VARIABLE 113 llega finalmente a Eγ = Eγ0 (1 − Eγ0 ) 2M0 c2 (6.29) Para ganar una idea de las magnitudes de las variables físicas involucradas, tomemos de nuevo el caso del átomo de hidrógeno y supongamos que Eγ0 ' 10eV y M0 c2 ' 1GeV , entonces la energía del fotón emitido será una fracción del orden de 10−12 veces menor, que la frecuencia de un fotón emitido sin retroceso. Como se discutió anteriormente, el efecto del retroceso causa una disminución en la frecuencia del fotón emitido con respecto a la frecuencia de la transición y la fración en la cual cambia esta frecuencia, es inversamente proporcional a la masa del átomo (ver ecuación (6.29)). Si el átomo emisor está ligado a una estructura, por ejemplo a una red de átomos como en un sólido, entonces la masa efectiva que absorbe el momentun de retroceso será ahora del orden de 1023 veces la masa del átomo emisor y la energía del fotón emitido, prácticamente coincide con la energía propia de la correspondiente transición entre niveles de energía del átomo. Este efecto de emisión sin retroceso fue descubierto por Möβbauer, quien recibió el premio nobel en 1961 y este efecto es actualmente una fuente de muchas aplicaciones en física atómica, estado sólido y física nuclear. 6.4. Sistemas de masa variable Puesto que la masa inercial de una patícula medida por un observador depende de la velocidad, se puede considerar que todo sistema relativista es, de hecho, un sistema de masa variable. Sin embargo en relatividad, el equivalente al caso de la mecánica clásica de un sistema de masa variable, corresponde a un sistema cuya masa propia sea variable. Un ejemplo de un sistema de masa propia variable, lo constituye el cohete fotónico, esto es, un cohete para el cual el sistema de propulsión transforma masa en energía radiante (fotones). Retomemos el ejemplo discutido en el capítulo anterior de una nave espacial que realiza un viaje al centro de nuestra galaxia, con aceleración propia constante igual a la aceleración de la gravedad g y supongamos que esta nave dispone de un cohete de propulsión que transforma masa en reposo en fotones y los radía con un ciento por ciento de eficiencia, directamente hacia atrás y perfectamente colimados. Calculemos entonces qué fracción de la masa propia inicial es gastada para realizar el viaje hasta el centro de la galaxia, suponiendo (como en el ejemplo del capítulo cuarto, sección (4.4.3)) que durante la mitad del viaje acelera y la otra mitad frena, con aceleración 114 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA propia constante g. Sea M la masa propia del cohete en un instante dado (la cual es variable) y P = M U su c-momentun, en donde U = (U 0 , U ) = (U 0 , Ux , 0, 0) (6.30) es la c-velocidad del cohete, el cual se mueve a lo largo del eje x y prad = (Erad /c, prad ) (6.31) el c-momentun de la radiación. Por conservación de la energía, el cambio en la energía del cohete es igual al cambio en la energía radiada, entonces d(M U 0 ) = −dErad /c (6.32) Como la energía radiada es en forma de fotones, se debe tener que: dErad = cdprad (6.33) y por conservación del momentun tenemos: dprad = d(M Ux ) (6.34) Entonces, de estas relaciones obtenemos la ecuación: dM U 0 = −d(M Ux ) (6.35) la cual se puede escribir en la forma: dM d(U 0 + Ux ) =− M U 0 + Ux (6.36) Integrando esta ecuación y teniendo en cuenta las expresiones para U 0 y Ux (ecuación (4.38)) se llega, finalmente a la expresión para la masa propia del cohete, en función del tiempo propio τ : M = M0 e−τ g/c (6.37) en donde M0 es la masa propia inicial de la nave. De acuerdo a la ecuación (4.47), el tiempo propio para que la nave realice la mitad del viaje es de 10,3años y por lo tanto eτ g/c ' 29700, de donde se sigue que la masa propia de la nave a la mitad del viaje es de M1/2 = M0 /29700 y la masa propia al final del viaje hasta el centro de la galaxia será Mf inal = M0 /(29700)2 ' 10−9 M0 (6.38) Esto significa que la gran mayoria de la masa de la nave (109 ) debe ser gastada como combustible. 6.5. CREACIÓN Y ANIQUILACIÓN DE PARTÍCULAS 6.5. 115 Creación y aniquilación de partículas Una de las aplicaciones más importantes de la equivalencia entre la masa y la energía, es la posibilidad de generar nuevas partículas en procesos de colisión inelástica, o también a partir del decaimiento (aniquilación) espontáneo de una partícula inestable. Como ya se mencionó en la sección (6.6.3) sobre colisiones inelásticas, la posibilidad de una determinada reacción, por ejemplo la creación de un antiprotón a partir de la colisión entre dos protones depende, en primer lugar, de los principios de conservación dinámicos de energía-momentun y en segundo lugar, que la interación que media el proceso permita este tipo de reacción. La teoría física fundamental que describe estos procesos se llama teoría cuántica de campos y ella nos permite predecir, no solo que reacciones son posibles, sino también la probabilidad con que un determinado proceso puede ocurrir. La probabilidad para que un cierto proceso ocurra signica lo siguiente: cuando dos partículas colisionan, o una partícula inestable se desintegra, como resultado de esta reacción pueden surgir diferentes productos, todos permitidos por las diferentes leyes de conservación y cada uno de ellos con una probabilidad de ocurrencia, o equivalentemente, con un porcentaje de ocurrencia. Por ejemplo el barión Λ0 puede decaer en 6 formas diferentes, cada una de ellas con diferente probabilidad: Λ0 −→ p + π − Λ0 −→ n + π 0 Λ0 −→ n + γ 0 − Λ −→ p + π + γ 0 − 0 − Λ −→ p + e + ν̄ e Λ −→ p + µ + ν̄ µ (63,9 ± 0,5) % (6.39) (35,8 ± 0,5) % (6.40) (1,75 ± 0,15) × 10−3 % −4 (8,4 ± 1,4) × 10 % (6.41) (6.42) −4 % (6.43) −4 % (6.44) (8,32 ± 0,14) × 10 (1,57 ± 0,35) × 10 El porcentaje entre paréntesis significa que, de cada 100 eventos de decaimiento del barión Λ0 , por ejemplo, decáe en un protón y en un pión aproximadamente 64 veces, el cual es el evento más probable, miéntras que el último proceso, decaimiento en un protón, un muón y un neutrino muónico es el menos probable, con una ocurrencia de un evento por cada 10000, aproximadamente. La masa del barión Λ0 es de 1115,684M eV y su vida media, esto es el tiempo propio que la partícula permanece desde su creación hasta que ella decáe, es de 2, 632 × 10−10 s. A su vez esta partícula, el barión Λ0 , es producido en otra reacción, como por ejemplo π + + n −→ K + + Λ0 (6.45) 116 CAPÍTULO 6. APLICACIONES DE LA DINÁMICA RELATIVISTA Si las masas del pión π + , el neutrón n y el mesón K + son 140M eV /c2 , 940M eV /c2 y 494M eV /c2 respectivamente, calculemos por ejemplo la energía cinética umbral del mesón π + , para que al chocar con el neutrón en reposo, se cree el barión Λ0 a un ángulo de 90◦ , medidos con respecto a la dirección de incidencia del pión. De la conservación del c-momentun, tenemos (6.46) pπ + pn = pK + pΛ Puesto que no estamos interesados en la información para la partícula K + , despejemos su c-momentun de la ecuación anterior y tomemos el cuadrado de la expresión resultante (con la notación pπ = (Eπ /c, pπ ), mπ0 la masa en reposo del pión y similarmente para las otras partículas): m2K0 c2 = m2π0 c2 + m2n0 c2 + m2Λ0 c2 + 2pπ · pn − 2pπ · pΛ − pn · pΛ (6.47) Puesto que en el sistema de laboratorio pπ = (Eπ /c, pπ ), pn = (mn0 c, 0) y pΛ = (EΛ /c, pΛ ) y además pπ · pΛ = 0 dado que el ángulo de dispersión del barión Λ0 es de 90◦ , entonces podemos despejar la energía total Eπ de esta expresión, para obtener Eπ = m2K0 c2 − m2π0 c2 − m2n0 c2 − m2Λ0 c2 + 2mn0 EΛ 2(mn0 − EΛ /c2 ) (6.48) por lo tanto, para que Eπ séa mínimo se requiere que la energía del barión Λ0 sea mínima y para esto basta tomar EΛ = mΛ0 c2 , entonces m2K0 − m2π0 − m2n0 − m2Λ0 + 2mn0 mΛ0 2 c = 1149M eV 2(mn0 − mΛ0 ) (6.49) y por lo tanto la energía cinética umbral del pión incidente será de Eπ (umbral) = Kumbral = 1149M eV − 140M eV = 1009M eV ' 1Gev (6.50) Parte III Electrodinámica relativista 117 Capítulo 7 Tensores 7.1. Introducción Uno de los elementos fundamentales de toda teoría física lo constituye el modelo matemático adecuado para describir las variables físicas y las leyes que rigen su comportamiento. En el capítulo 3 se definieron los conceptos de cuadri-vector y de invariante relativista, el primero como una cantidad con cuatro componentes que bajo una transformación de Lorentz, sus componentes se transforman de acuerdo a una ley definida (ecuación (3.29)) y el segundo como una cantidad invariante bajo una TL, es decir una cantidad que toma el mismo valor numérico en todos los sistemas de referencia inerciales, el cual llamaremos en lo sucesivo escalar de Lorentz. Para muchos de los fenómenos físicos conocidos estos objetos matemáticos, escalares y cvectores, son suficientes para definir las variables que permiten describir los procesos físicos. Sin embargo, existe toda una serie de variables dinámicas, tales como por ejemplo el momento de inercia de un sólido rígido, las cuales requieren para su descripción otros objetos matemáticos llamados tensores. El objetivo fundamental del presente capítulo es introducir el concepto de tensor y dar las herramientas fundamentales del álgebra y del cálculo tensorial. Existen varios caminos posibles para definir el concepto de tensor, por ejemplo, la aproximación algebráica, la cual es una extensión del álgebra lineal y de los espacios vectoriales. Otro camino más cercano a sus aplicaciones físicas, es a través de la definición de un tensor por sus propiedades de transformación bajo un cambio de coordenadas. Este será el camino que seguiremos en este capítulo. Es importante anotar en este punto, que las variedades diferenciales con119 120 CAPÍTULO 7. TENSORES stituyen el marco matemático natural para definir de manera rigurosa y general el concepto de tensor. Pero no abordaremos aquí esta teoría, pues está más allá del alcance del presente libro y además para los objetivos que perseguimos, formular la electrodinámica clásica en forma relativista explícita, no es necesario desarrollar este formalismo matemático en toda su extensión. Sin embargo, vale la pena resaltar que los resultados del análisis tensorial que presentaremos son válidos en el caso general y sirven como punto de partida para un estudio más riguroso de geometría diferencial, necesario para abordar el estudio de la Teoría General de la Relatividad desarrollada por Einstein en 1916. 7.2. Definiciones fundamentales En esta sección introduciremos los conceptos fundamentales del cálculo tensorial. Los objetos matemáticos fundamentales con los cuales trataremos son los escalares, los vectores y los tensores, los cuales son en general funciones de las coordenadas. Estos objetos serán definidos en términos de sus propiedades de transformación, cuando cambiamos de sistemas de coordenadas. Aun cuando todas las definiciones que daremos, así como sus propiedades, son generales, nos restringiremos exclusivamente a transformaciones de Lorentz, pero mantendremos en lo posible una notación general. Definición 8.1 Sean Σ y Σ0 dos sistemas de referencia inerciales y sean µ x = (x0 , x1 , x2 , x3 ) y x0µ = (x00 , x01 , x02 , x03 ) las coordenadas de un evento físico medidas en Σ y Σ0 respectivamente. Entonces una transformación de Lorentz de las coordenadas está definida como: xµ 7−→ x0µ = Λµν xν (7.1) tal que el producto punto Minkowskiano queda invariante bajo esta transformación de coordenadas. Definición8.2 Un escalar de Lorentz es una cantidad (en general una función de las coordenadas) que es invariante bajo transformaciones de Lorentz. Ejemplos de escalares de Lorentz son: la masa propia de una partícula, el intervalo de tiempo propio entre dos eventos, la norma de todo cuadri-vector, el producto interno de cuadri-vectores, etc. Definición 8.3 Un cuadri-vector (c-v) V es una cantidad cuyas componentes, que denotaremos por V µ , µ = 0, 1, 2, 3, medidas por el observador inercial Σ, se transforman bajo una transformación de Lorentz de las coordenadas (ecuación (7.1)), de la misma manera que las coordenadas, es 7.2. DEFINICIONES FUNDAMENTALES 121 decir: V 0µ = Λµν V ν (7.2) 0µ donde V denota las componentes del cuadri-vector V medidas en el sistema de referencia Σ0 . A las cantidades V µ se le llaman las componentes contravariantes del cuadri-vector V. Esta denominación de las componentes contravariantes será justificada más adelante. Ejemplos de c-v contravariantes son: el c-v posición x, cuyas componentes son las coordenadas de un evento físico, las diferenciales de coordenadas dxµ , la c-velocidad U µ , la c-aceleración Aµ , el c-momentum pµ , la c-fuerza f µ , etc. Las componentes de un c-v V µ y V 0µ relacionadas por una transformación de Lorentz, representan el mismo objeto matemático ”medido” en dos sistemas de referencia inerciales Σ y Σ0 respectivamente. Asi V es el c-v y V µ son las componentes de V en el sistema Σ y V 0µ sus componentes en el sistema Σ0 . Definición 8.4 Un tensor T de segundo orden dos veces contravariante, es un conjunto de 16 componentes T µν ; µ, ν = 0, 1, 2, 3 medidas en un sistema de referencia Σ, tales que bajo una transformación de Lorentz (ecuación (7.1)) sus componentes se transforman como: T 0µν = Λµα Λνβ T αβ (7.3) donde T 0µν denota las componentes del tensor T en el sistemade referencia Σ0 . Definición 8.5 La definición anterior se generaliza al caso de un tensor T contravariante de orden r, como un objeto de 4r componentes, medidas en un sistema de referencia Σ, cuyas componentes se transforman bajo una transformación de Lorentz (7.1) en la forma: µ µ µ T 0µ1 µ2 ...µr = Λ ν11 Λ ν22 · · · Λ νrr T ν 1 ν 2 ...ν r (7.4) Así, podemos definir un tensor de orden cero como un escalar y un tensor contravariante de orden uno como un c-vector. En el siguiente capítulo veremos ejemplos de tensores de segundo orden con significado físico, tales como el tensor campo electromagnético y el tensor energía-momentun. Por ahora trabajaremos con estas cantidades como objetos matemáticos abstractos, sin asignarles ningún significado. Es de anotar que en física no aparecen cantidades que se describan por tensores de orden mayor al segundo, salvo en el caso de la Teoría General de la Relatividad, en donde se requiere del tensor de Riemann, el cual es un tensor 122 CAPÍTULO 7. TENSORES de cuarto orden y cuyo significado está ligado al concepto geométrico de curvatura de la variedad espacio-tiempo. 7.2.1. Componentes covariantes Las transformaciones de Lorentz las definimos como el conjunto de transformaciones de coordenadas, tales que dejen invariante el intervalo espaciotiempo (ver capítulo 4, ecuaciones (3.25) a la (3.30)), es decir, si xµ y xµ + dxµ , son las coordenadas de dos eventos físicos medidas por un observador inercial Σ, entonces la distancia espacio-tiempo entre estos dos eventos, definida como: (7.5) ds2 = η µν dxµ dxν es invariante bajo una transformación de coordenadas, es decir: ds2 = η µν dxµ dxν = ηµν dx0µ dx0ν (7.6) en donde la matriz de Minkowski η (llamado también tensor métrico de Minkowski, por las razones que veremos en seguida) está definido por: 1; si µ = ν = 0 η µν := −1; si µ = ν = 1, 2, 3 (7.7) 0; si µ 6= ν Así, para que bajo una transformación de Lorentz el escalar de Lorentz ds2 permanezca invariante, esto es: ds2 = η µν dx0µ dx0ν = η µν Λµα Λνβ dxα dxβ = η αβ dxα dxβ (7.8) se debe cumplir que la matriz de Minkowski satisfaga la relación: η αβ = Λµα Λνβ η µν (7.9) Como el determinante de la matriz de Minkowski es diferente de cero, i.e., det(η αβ ) = −1, entonces existe la matriz de transformación inversa (η αβ )−1 , cuyas componentes que denotaremos por η αβ , satisfacen la siguiente relación: (7.10) ηη −1 = 1 la cual, escrita en términos de componentes toma la forma: η αβ η βσ = δ ασ (7.11) 7.2. DEFINICIONES FUNDAMENTALES 123 en donde δ ασ son los elementos de la matriz identidad. Los elementos de la matriz inversa de Minkowsky coinciden numéricamente con η αβ , como se puede probar directamente. Además, la matriz de Minkowski y su inversa son matrices simétricas, i.e. ηαβ = η βα y ηαβ = η βα . Por otra parte, la inversa de una transformación de Lorentz está dada por: (7.12) xµ = Λν µ x0ν con Λνµ = (Λµν )−1 ⇐⇒ Λνε Λνµ = δ µε (7.13) Los elementos de la transformación inversa de Lorentz se pueden obtener a partir de la relación: (7.14) Λν µ = η νγ ηµδ Λγδ pues Λν µ ν Λδ = ηνγ η µβ Λγβ Λνδ = η δ η µ = δ δµ (7.15) en donde se ha hecho uso de la ecuación (7.9). Por ejemplo, si consideramos el caso particular de una transformación de Lorentz entre sistemas de referencia inerciales Σ y Σ0 , con ejes espaciales paralelos y v la velocidad de Σ0 en la dirección del eje x positivo, entonces los elementos de la matriz de transformación de Lorentz están dados por (ver la ecuación (3.40)) γ −βγ 0 0 −βγ γ 0 0 (7.16) Λαβ = 0 0 1 0 0 0 0 1 por lo tanto aplicando la relación (7.14), tenemos γ βγ βγ γ Λν µ = η νγ η µδ Λγδ = 0 0 0 0 0 0 1 0 0 0 0 1 (7.17) la cual corresponde a la transformación del sistema de referencia Σ0 al Σ, que equivale como vimos en el capítulo 3, a cambiar la velocidad v por −v. Definición 8.6 Definamos las “componentes” covariantes de un c-v V como (7.18) Vα := η αβ V β 124 CAPÍTULO 7. TENSORES Esta definición tiene sentido, pues dado que la matriz de Minkowski η αβ posee una inversa, la relación entre las componentes contravariantes y covariantes de un c-v es una relación biyectiva (uno a uno y sobre) y por lo tanto es un isomorfismo, es decir, dadas las componentes contravariantes V µ de un c-v, sus componentes covariantes Vν están unívocamente definidas (ecuación (7.18)) y viceversa; es decir, dadas las componentes covariantes Vµ , entonces sus correspondientes componentes contravariantes se obtienen de la transformación inversa, así V µ = η µν Vν (7.19) Este resultado nos permite identificar a las componentes covariantes Vν y a las contravariantes V µ de un c-v, como representaciones de un mismo objeto abstracto V. Podemos generalizar esta operación, que se conoce en el marco del análisis tensorial como subir y bajar índices, al caso de tensores de cualquier rango. Así por ejemplo, las componentes covariantes de un tensor de segundo orden están relacionadas con sus componentes contravariantes por la ecuación: (7.20) Tµν = η µα ηνβ T αβ o también, podemos definir las componentes de un tensor de segundo orden una vez contravariante y una vez covariante, con las siguientes posibilidades: Tα β = η βµ T αµ ; Tα β = η µα T µβ (7.21) De esta forma, T αβ , Tµν , T α β , y Tα β son todas diferentes representaciones de un mismo tensor de segundo rango T. Es importante anotar que el orden de los índices en una ecuación tensorial debe ser preservado, dado que en general T αβ 6= T βα y por esta razón las componentes mixtas T α β y Tα β del tensor T son diferentes en general. Para encontrar como se transformanlas componentes covariantes de cualquier tensor, bajo una transformación de Lorentz, consideremos primero el caso particular de un c-v: V 0µ = Λµν V ν =⇒ Vα0 = η αµ V 0µ = η αµ Λµν V ν (7.22) Ahora, de la relación (7.14) multiplicándola por ηβµ a ambos lados y sumando sobre el índice µ, obtenemos η βµ Λν µ = η βµ η νγ η µδ Λγδ = η νγ δ δβ Λγδ = η νγ Λγβ (7.23) 7.2. DEFINICIONES FUNDAMENTALES 125 Remplazando esta relación en el último término de la ecuación (7.22), tenemos (7.24) Vα0 = η νµ Λα µ V ν = Λα µ Vµ Esta ecuación nos da la ley de transformación de las componentes covariantes de un c-v. De lo visto hasta ahora, es fácil generalizar esta ecuación para obtener la ley general de transformación de las componentes covariantes y contravariantes de un tensor cualquiera T, r-veces contravariante y s-veces covariante: 0µ µ ...µ µ µ µ ...ν r 2 r Tγ 1 1γ 2 ...γ = Λ ν11 Λ ν22 · · · Λ νrr Λγδ11 Λγδ22 · · · Λγδrr Tδν11δν22...δ s s 7.2.2. (7.25) Algebra tensorial ...ν r Denotemos por Πrs el conjunto de todos los tensores Tδν11δν22...δ de orden s n = r + s, r-veces contravariante y s-veces covariante. Así, en esta notación un escalar es un elemento de Π00 , un c-vector contravariante es un elemento de Π10 y uno covariante de Π01 , etc. Definición 8.7 Suma de tensores: Dados dos tensores T, S ∈ Πrs definimos la suma y la multiplicación por un escalar λ ∈ R, por: ...ν r ...ν r ...ν r ...ν r := (T + S)νδ11δν22...δ := Tδν11δν22...δ + Sδν11δν22...δ Qνδ11δν22...δ s s s s (7.26) ...ν r ...ν r ...ν r Pδν11δν22...δ := (λT )νδ11δν22...δ := λTδν11δν22...δ s s s (7.27) Notemos que estas operaciones no son más que la generalización directa de la suma y el producto por un escalar de vectores cartesianos, en donde el vector resultante de estas operaciones se obtiene como la suma componente a componente y por el producto del escalar por cada componente del vector. Cuando se define una opreación con tensores, hay que demostrar que esta operación está bien definida, es decir, que la operación preserva el caracter tensorial. Esto significa que por ejemplo, para las operaciones definidas en las ecuaciones (7.26) y (7.27), para la suma y multiplicación por un escalar de ...ν r ...ν r y Pδν11...δ tensores de un mismo rango, las componentes resultantes Qνδ11...δ s s se transforman efectivamente como las componentes de un tensor del tipo ¡r¢n s , es decir: T, S ∈ Πrs =⇒ Q = T + S ∈ Πrs y P =λT ∈ Πrs (7.28) 126 CAPÍTULO 7. TENSORES La demostración general de este resultado es muy sencilla y por esta razón ilustraré el método para el caso particular de un tensor mixto de segundo rango. Sean T, S ∈ Π11 con componentes para un observador inercial Σ dadas por T αβ y S αβ respectivamente y sea Qαβ = T αβ + S αβ (7.29) Debemos probar que bajo una transformación de coordenadas, las componentes Qαβ se transforman como un tensor del tipo Π11 . Así, para un sistema de referencia Σ0 tenemos, aplicando la ley de transformación (7.25) para las 0α componentes de los tensores T 0α β y S β, 0α Q0αβ = T 0α β +Sβ = Λαν Λβ µ T νµ + Λαν Λβ = Λαν Λβ µ (T νµ + S νµ ) = Λαν Λβ µ Qαβ µ ν Sµ (7.30) lo cual implica que las cantidades Qαβ se transforman como las componentes de un tensor del tipo Π11 , como se quería probar. Un procedimiento similar se puede hacer para el producto de un escalar por un tensor. ¡r¢nEste resultado muestra que el conjunto de todos los tensores del tipo forman un espacio vectorial. s Definición 8.8 Producto tensorial: Dados dos tensores T ∈ Πrs y S ∈ Πpq , definimos el producto tensorial como: ν ν ...ν ν ...ν ν ν ...ν r+1 r+p ν 1 ν 2 ...ν r r+1 r+2 r+p Wδ11δ22...δsrδs+1 ...δ s+q := Tδ 1 δ 2 ...δ s Sδ s+1 δ s+2 ...δ s+q (7.31) ¡r+p¢ r+p el cual es un tensor de Πr+p s+q s+q , es decir W ∈ Πs+q . Esta operación no tiene su correspondiente en el cálculo vectorial ordinario y representa lo que en álgebra matricial se llama un producto directo. Como en el caso anterior, hay que probar que esta operación está bien definida y para este fin consideremos el caso particular del producto de dos c-vectores, uno covariante y el otro contravariante. Sea T ∈ Π10 y llamemos sus componentes T µ , y S ∈ Π01 con componentes Sµ . Entonces, de la definición 8.8 el producto está dado por W µν = T µ Sν (7.32) y debemos probar que las componentes del producto Wνµ se transforman como: (7.33) W 0µν = Λµα Λνβ W αβ 7.2. DEFINICIONES FUNDAMENTALES 127 de acuerdo con la ecuación (7.25). Sean T 0µ y Sν0 las componentes de los c-vectores T y S medidas en el sistema de referencia Σ0 , entonces en este sistema de referencia las componentes del producto están dadas por: W 0µ ν = T 0µ Sν0 (7.34) Puesto que T y S son c-vectores, sus componentes se transforman de acuerdo con la relación: T 0µ = Λµα T α ; Sν0 = Λνβ Sβ (7.35) Remplazando estas expresiones en la ecuación (7.34), tenemos W 0µ ν = T 0µ Sν0 = Λµα T α Λνβ Sβ = Λµα Λνβ T α Sβ = Λµα Λνβ W αβ (7.36) como se quería demostrar. La siguiente operación que vamos a definir es fundamental en el cálculo tensorial, pues nos permite obtener a partir de un tensor dado de rango n, un tensor de rango n − 2. Así, si partimos de un tensor de rango par, por aplicaciones sucesivas de esta operación, podemos obtener un tensor de rango cero, es decir un escalar de Lorentz o en términos más físicos, un invariante relativista. Definición 8.9 Contracción de Indices: Dado un tensor T ∈ Πr1s definimos la contracción del índice contravariante αi (1 ≤ i ≤ r) con el índice covariante β j (1 ≤ j ≤ s) por: (α ) ...αi ...αr α1 α2 ...σ...αr r−1 C(β i) (Tβα1βα2...β ...β ) := Tβ β ...σ...β ∈ Πs−1 j 1 2 j s 1 2 s (7.37) Es decir, dado un tensor mixto de orden n = r + s, r − veces contravariante y s − veces covariante, al sumar sobre dos índices repetidos, uno contravariante y otro covariante, obtenemos un tensor de orden n − 2, r − 1 − veces contravariante y s − 1 − veces covariante. Para demostrar que esta operación está bien definida consideremos, sin pérdida de generalidad, un tensor de de rango 4, 2 − veces contravariante y 2 − veces covariante αβ ∈ Π22 y contraigamos por ejemplo, el primer índice contravariante con Tγδ el segundo covariante: (α) αβ σβ C(δ) (Tγδ ) = Tγσ := Tγ β ∈ Π11 (7.38) Entonces, veamos que las componentes que resultan Tγ β , después de realizada la operación de contracción, se transforman como las componentes de 128 CAPÍTULO 7. TENSORES un tensor mixto de rango 2. Si denotamos como es costumbre, por cantidades primadas las componentes de los tensores en el sistema de referencia Σ0 y aplicamos las correspondientes leyes de transformación de tensores, tenemos entonces 0λβ σβ = Λλσ Λβη Λγµ Λλϑ Tµϑ Tγ0 β = Tγλ σβ ση = δ ϑσ Λβη Λγµ Tµϑ = Λβη Λγµ Tµσ = Λβη Λγµ Tµη (7.39) lo cual demuestra que la operación de contracción de índices está bien definida. En la segunda igualdad hemos utilizado la ley de transformación para 0λβ el tensor Tγλ , la cual se aplica independientemente del hecho que el tensor tenga dos índices repetidos sobre los cuales se suma. Para obtener la tercera igualdad se ha utilizadoel hecho que los elementos de la transformación Λλσ y Λλϑ , corresponden a la transformación de Lorentz de Σ a Σ0 y a su inversa respectivamente y por lo tanto satisfacen la relación (7.15). Finalmente, al sumar sobre el índice repetido ϑ, por la definición de la delta de Kronecker δ ϑσ , todos los términos son cero, salvo aquel para el cual ϑ = σ, obteniendose de esta forma la cuarta iguldad. Antes de continuar con otras operaciones entre tensores, mostremos que las componentes de la matriz de Minkowski ηαβ , su inversa η αβ y la delta de Kronecker δ βα son tensores de segundo rango, lo que justifica el nombre de tensor métrico de Minkowski y además η αβ , η αβ y δ βα corresponden a diferentes representaciones del mismo objeto matemático, el tensor métrico η, con la particularidad que las componentes de este tensor métrico toman los mismos valores numéricos en todos los sistemas de referencia inerciales. El papel especial de este objeto matemático lo podemos ver, si retornamos a la definición del intervalo espacio-tiempo entre dos puntos de la variedad espacio-tiempo: ds2 = η µν dxµ dxν (7.40) El escalar ds2 es obtenido a partir del producto de tres tensores (η µν , dxµ y dxν ) seguida de una doble contracción sobre índices, y por lo visto hasta ahora, estas operaciones están bien definidas. También, podemos probar directamente el carácter tensorial de η, pues dado que ds2 es un invariante, 7.2. DEFINICIONES FUNDAMENTALES 129 entonces ds2 = η 0µν dx0µ dx0ν = Λµα Λνβ Λµγ Λνϑ ηαβ dxγ dxϑ = δ αγ δ βϑ η αβ dxγ dxϑ = η αβ dxα dxβ (7.41) en donde hemos denotado por η 0µν a las componentes del tensor métrico medidas en el sistema de referencia Σ0 , las cuales están relacionadas con sus componentes en el sistema Σ por: η 0µν = Λµα Λνβ η αβ (7.42) Un cálculo directo, aplicando las propiedades de las transformaciones de Lorentz, muestra que las componentes del tensor η en el sistema Σ0 coinciden con sus componentes en Σ. Un procedimiento similar se puede seguir para probar que η αβ y δ αβ también se transforman como tensores de segundo rango (dos veces contravariante y mixto respectivamente) y que sus componentes son las mismas en todos los sistema de referencia inerciales. Un caso particular que surge de la combinación de las operaciones, producto tensorial y contracción de índices, es la generalización de la Definición 8.6, llamada subir y bajar índices, pues el producto tensorial del tensor métrico η de segundo orden (sea de sus componentes contravariantes ηµν , covariantes η µν o mixtas δ µν ) con un tensor cualquiera T de orden n, seguida de una contracción de índices, produce de nuevo un tensor de orden n; por ejemplo, consideremos un tensor T de cuarto orden del tipo Π22 . Al multiplicar este tensor T por el tensor métrico ηαβ ∈ Π20 , produce un tensor del tipo Π42 , que al contraer dos índices conduce a otro tensor del tipo Π31 . Resumiendo tenemos: σβ = Tγσβµ (7.43) η µν Tγν Otro caso particular de la combinación de estas dos operaciones tensoriales, producto tensorial seguida de una contracción, es el producto punto de dos c-vectores, pues V · V = η µν V µ V ν = η µν Vµ Vµ = δ µν V ν Vµ = V µ Vµ (7.44) Por ejemplo, consideremos el c-vector momentun p de una partícula de masa en reposo m0 , cuyas componentes contravariantes en algún sistema de referencia inercial Σ, están dadas por pµ = (p0 , p1 , p2 , p3 ) ≡ (E/c, px , py , pz ). 130 CAPÍTULO 7. TENSORES Entonces podemos calcular sus correspondientes componentes covariantes en este sistema como pα = η αβ pβ = (p0 , p1 , p2 , p3 ) = (E/c, −px , −py , −pz ) (7.45) Aplicando ahora cualquiera de las expresiones dadas en la ecuación (7.44), obtenemos que su norma al cuadrado está dada por p2 = p · p = E 2 /c2 − p2x − p2y − p2z = m20 c2 7.2.3. (7.46) Propiedades de simetría de tensores En esta sección definiremos los conceptos de tensores simétricos y antisimétricos e introduciremos la operación tensorial de simetrización (y antisimetrización) de las componentes de un tensor, la cual es de utilidad para generalizar algunas operaciones del cálculo vectorial usual, como veremos en la última sección del presente capítulo. Definición 8.10 Un tensor T de segundo rango del tipo Π20 , con componentes T αβ en un sistema de referencia Σ, se llama simétrico si T αβ = T βα (7.47) T αβ = −T βα (7.48) y antisimétrico si Esta definición es válida también, para las componentes covariantes de un tensor de segundo rango y puede ser generalizada a cualquier par de índices de un tensor de rango n ≥ 2. Por ejemplo, para un tensor R de cuarto rango del tipo Π04 , simétrico en su primera y tercera componente y antisimétrico en la segunda y cuarta componente, se tiene que Rαβγδ = Rγβαδ ; Rαβγδ = −Rαδγβ (7.49) Es fácil probar, a partir de las propiedades de transformación de las componentes, que el carácter simétrico o antisimétrico de un tensor es independiente del sistema de referencia, pues si T αβ = T βα en un sistema de referencia Σ, entonces de las propiedades de transformación (ecuación (7.3)) tenemos T 0µυ = Λµα Λνβ T αβ = Λµα Λνβ T βα = Λνβ Λµα T βα = T 0νµ como se quería probar. (7.50) 7.2. DEFINICIONES FUNDAMENTALES 131 Dado un tensor de segundo rango con componentes T αβ en un sistema de referencia, siempre se puede escribir este tensor como la suma de un tensor simétrico más uno antisimétrico, es decir T αβ = S αβ + Aαβ (7.51) con S αβ = S βα y Aαβ = −Aβα . Para demostrar esta afirmación basta con tomar 1 (7.52) S αβ := (T αβ + T βα ) 2 y 1 Aαβ := (T αβ − T βα ) (7.53) 2 en donde al tensor S αβ se le llama la parte simétrica del tensor T αβ y al tensor Aαβ su parte antisimétrica. Claramente estas mismas relaciones son válidas para índices covariantes. De estas ecuaciones ( (7.52) y (7.53)) se deduce además, que un tensor es simétrico si su parte antisimétrica es cero y es antisimétrico si su parte simétrica es cero: 1 (7.54) T αβ = T βα ⇐⇒ Aαβ = (T αβ − T βα ) = 0 2 1 (7.55) T αβ = −T βα ⇐⇒ S αβ = (T αβ + T βα ) = 0 2 Un ejemplo de un tensor simétrico es el tensor métrico de Minkowski, pues por su definición ηαβ = η βα . Las ecuaciones (7.52) y (7.53) nos conducen a la siguiente definición de dos nuevas operaciones tensoriales: Definición 8.11 Dado un tensor T de segundo rango del tipo Π20 , con componentes T αβ en un sistema de referencia Σ, definamos un nuevo tensor que lo denotaremos como T (αβ) , por la operación 1 T (αβ) := (T αβ + T βα ) 2 (7.56) el cual por definición es simétrico, es decir T (αβ) = T (βα) . A esta operación se le conoce en la literatura como simetrización de un tensor. Claramente, si el tensor T αβ es simétrico, entonces el tensor simetrizado coincide con el tensor original, esto es T (αβ) = T αβ y si el tensor T αβ es antisimétrico, el tensor simetrizado es cero: T (αβ) = 0. Similarmente, definimos la operación de antisimetrización de un tensor dado T αβ , que lo denotaremos como T [αβ] , por: 1 T [αβ] := (T αβ − T βα ) 2 (7.57) 132 CAPÍTULO 7. TENSORES De la misma manera se tiene que si un tensor T αβ es simétrico, entonces el tensor antisimetrizado es cero y si T αβ es antisimétrico, entonces T [αβ] = T αβ . Claramente estas operaciones son válidas también para tensores del tipo Π02 . Tanto las definiciones de simetría y antisimetría dadas (Definición 8.10), así como las operaciones de simetrización y antisimetrización (Definición 8.11), se pueden generalizar a tensores de orden mayor. Antes de considerar este problema, se introducirán algunos elementos básicos de la teoría de permutaciones. Consideremos el conjunto {1, 2, ..., r} de los r primeros números naturales y denotemos por (n1 , n2 , ..., nr ) un arreglo ordenado de ellos, sin que ninguno se repita. Existen entonces r! = 1 · 2 · 3 · ... · r formas diferentes de ordenar en este arreglo los r pimeros números naturales. Por ejemplo, si tomamos el conjunto {1, 2, 3}, podemos construir 3! = 6 arreglos diferentes: (1, 2, 3); (1, 3, 2); (2, 1, 3); (2, 3, 1); (3, 1, 2); (3, 2, 1) (7.58) Dado un arreglo (n1 , n2 , ..., nr ), definimos una permutación Pσ sobre este arreglo, como el arreglo obtenido al permutar los elementos del arreglo original. Denotaremos simbólicamente esta operación de permutación por Pσ (n1 , n2 , ..., nr ) = (nσ(1) , nσ(2) , ..., nσ(r) ) (7.59) en donde σ es una función (uno a uno y sobre) σ : {1, 2, ..., r} −→ {1, 2, ..., r} ni 7−→ σ(ni ) = nj (7.60) Por ejemplo, el arreglo (3, 2, 1) se puede obtener a partir del primer arreglo (1, 2, 3) permutando los números 1 y 3: Pσ (1, 2, 3) ≡ Pσ (n1 , n2 , n3 ) = (nσ(1) , nσ(2) , nσ(3) ) = (3, 2, 1) (7.61) Definamos ahora una transposición como una permutación Pni ↔ni+1 (7.62) obtenida, al permutar dos números consecutivos ni y ni+1 del arreglo original: Pni ↔ni+1 (n1 , n2 , ..., ni , ni+1 , ..., nr ) = (n1 , n2 , ..., ni+1 , ni , ..., nr ) (7.63) 7.2. DEFINICIONES FUNDAMENTALES 133 Claramente, cualquier arreglo de los números {1, 2, ..., r} se puede obtener por una permutación Pσ sobre un arreglo dado, incluyendo como caso particular, la permutación identidad que no cambia el arreglo original. Además, cualquier permutación dada se puede obtener aplicando sucesivamente transposiciones. Es decir, toda permutación se puede descomponer, o factorizar, como el producto de transposiciones: Pσ = Pni ↔ni+1 Pnj ↔nj+1 · · · Pnk ↔nk+1 (7.64) En el ejemplo ilustrado en la ecuación (7.58), se puede obtener el segundo arreglo (1, 3, 2) a partir del primer arreglo (1, 2, 3), aplicando la transposición P2↔3 , esto es: P2↔3 (1, 2, 3) = (1, 3, 2) (7.65) pero también es posible obtener este mismo arreglo en otra forma, por aplicación sucesiva de las transposiciones siguientes: P3↔1 P2↔1 P2↔3 P1↔3 P1↔2 (1, 2, 3) = P3↔1 P2↔1 P2↔3 P1↔3 (2, 1, 3) = P3↔1 P2↔1 P2↔3 (2, 3, 1) = P3↔1 P2↔1 (3, 2, 1) = P3↔1 (3, 2, 1) = (1, 3, 2) (7.66) Este ejemplo muestra que no hay una única forma de obtener una permutación dada por transposiciones sucesivas. Sin embargo, el número definido por: ½ +1 si Nσ es par Nσ (7.67) = (−1) −1 si Nσ es impar sí es independiente de las transposiciones realizadas para obtener la permutación dada. Este número es llamado el signo de la permutación, siendo Nσ igual al número de las transposiciones realizadas. Esto significa que si una permutación dada se factoriza en un número par (impar) de transposiciones, entonces, cualquier otra factorización de la misma permutación, contendrá también un número par (impar) de transposiciones. Una permutación se llama par(impar) si el signo es +1(−1). Así en nuestro ejemplo anterior, la permutación Pσ (1, 2, 3) = (1, 3, 2) se puede escribir en términos de transposiciones, como Pσ = P2↔3 , en cuyo caso Nσ = 1 y el signo de la permutación es (−1)Nσ = −1, o también se puede factorizar en la forma Pσ = P3↔1 P2↔1 P2↔3 P1↔3 P1↔2 , con Nσ = 5 y por lo tanto el mismo signo de la permutación (−1)5 = −1. 134 CAPÍTULO 7. TENSORES Con estos elementos básicos de la teoría de permutaciones, podemos extender las operaciones anteriores de simetrización y antisimetrización a tensores de orden superior. Definición 8.12 Dado un tensor T de rango r del tipo Πr0 , con componentes T α1 ···αr en un sistema de referencia Σ, definamos dos nuevos tensores, uno completamente simétrico en todos sus índices que denotaremos como T (α1 ···αr ) y el otro completamente antisimétrico en todos sus índices que denotaremos como T [α1 ···αr ] , por las operaciones 1 X Pσ (α1 ···αr ) T (α1 ···αr ) := T (7.68) r! Pσ T [α1 ···αr ] := 1X (−1)Nσ T Pσ (α1 ···αr ) r! (7.69) Pσ en donde la suma se realiza sobre todas las permutaciones de los índices (α1 , · · ·, αr ). La misma definición vale para índices covariantes. Por ejemplo, consideremos un tensor Tαβγ del tipo Π03 y construyamos los tensores T(αβγ) y T[αβγ] por las operaciones definidas en las ecuaciones (7.64) y (7.69): T(αβγ) := 1 (Tαβγ + Tαγβ + Tβαγ + Tβγα + Tγαβ + Tγβα ) 3! (7.70) 1 (Tαβγ − Tαγβ + Tβγα − Tβαγ + Tγαβ − Tγβα ) (7.71) 3! Es fácil comprobar directamente que el nuevo tensor T(αβγ) es completamente simétrico bajo cualquier permutación de sus índices; por ejemplo T(031) = T(013) = etc, mientras que el tensor T[αβγ] es completamente antisimétrico bajo permutación de sus índices, pues por ejemplo T[031] = −T[013] , pero T[031] = T[310] dado que en el primer caso los índices [013] corresponden a una permutación par de los índices originales [031], mientras que en el segundo caso el arreglo de índices [310] es una permutación par del arreglo original [031]. Notemos que las definiciones dadas para tensores de segundo rango son un caso particular de la Definición 8.12. Un ejemplo de esta operación de antisimetrización de tensores, lo constituye la generalización del producto cruz usual del cálculo vectorial tridimensional. Sean Aα y B β las componentes de dos c-vectores en un sistema de referencia Σ. Definamos un nuevo vector como el producto tensorial antisimetrizado de estos dos c-vectores: T[αβγ] := 1 C αβ := A[α B β] = {Aα B β − Aβ B α } 2 (7.72) 7.2. DEFINICIONES FUNDAMENTALES 135 Un tensor de segundo rango C αβ en n dimensiones tiene n2 componentes independientes. En el caso particular de las 4 dimensiones del espacio-tiempo n2 = 16 componentes independientes. Si el tensor es simétrico entonces C αβ = C βα y su número de componentes independientes se reduce a: n2 − n n(n + 1) +n= 2 2 (7.73) Ahora, si el tensor es antisimétrico C αβ = −C βα su número de componentes independientes está dado por: n(n − 1) n2 − n = 2 2 (7.74) pues en este caso las componentes con índices repetidos son cero. En el caso de vectores tridimensionales cartesianos n = 3, y por lo tanto el número de componentes independientes de un tensor antisimétrico de segundo rango es tres. Así, podemos identificar a las tres componentes independientes que surgen de la operación definida en la ecuación (7.72), a su vez con las componentes de un nuevo vector, el cual se conoce como el producto cruz del cálculo vectorial usual. Notemos que esta identificación no es posible para otras dimensiones del espacio, pues por ejemplo, en cuatro dimensiones el número de componentes independientes de un tensor antisimétrico de segundo rango es de seis y por lo tanto estas componentes no pueden ser identificadas con las componentes de nigún c-vector. Para finalizar esta sección consideraremos un ejemplo especial de un tensor de cuarto rango completamente antisimétrico, el cual jugará un papel importante en el capítulo octavo sobre las ecuaciones de Maxwell. Definamos el tensor εαβγδ , llamado tensor de Levi-Civita, por la ecuación: εαβγδ +1 si αβγδ es permutación par de 0123 := −1 si αβγδ es permutación impar de 0123 0 en los demás casos (7.75) Este tensor, al igual que el tensor métrico de Minkowski, tiene la particularidad que en todos los sistemas de referencia inerciales sus componentes tienen el mismo valor numérico. Para probar que εαβγδ es un tensor con esta característica, se debe mostrar que sus componentes se transforman, bajo una transformación de Lorentz, en la forma ε0αβγδ = Λαµ Λβν Λγσ Λδ ρ εµνσρ ≡ εαβγδ (7.76) 136 CAPÍTULO 7. TENSORES Para esto, es suficiente notar lo siguiente: si en la ecuación anterior reemplazamos los índices α, β, γ y δ por 0, 1, 2 y 3 respectivamente, entonces la ecuación (7.76) toma la forma 1 = ε0123 = Λ0 µ Λ1ν Λ2σ Λ3ρ εµνσρ = det |Λ| (7.77) De lo visto en el capítulo 3 sobre las propiedades de las transformaciones de Lorentz, es fácil deducir que toda transformación de Lorentz propia, es decir que no involucra inversión de los ejes espaciales o inversión de la coordenada temporal, tiene determinante igual a 1. Así, la ecuación (7.77) es una identidad y por lo tanto las componentes εαβγδ del tensor de LeviCivita deben transformarse de acuerdo con la ecuación (7.76), como se quería mostrar. 7.3. Transformación general de coordenadas Antes de continuar con la generalización de los operadores vectoriales usuales del cálculo diferencial (gradiente, divergencia y rotacional), veamos el caso general de transformaciones de coordenadas que contienen, lógicamente, el caso particular de las transformaciones de Lorentz que hemos considerado hasta ahora. Sean Σ y Σ0 dos sistemas de referencia y llamemos xµ y x0ν las coordenadas de un punto medidas en los sistemas de referencia Σ y Σ0 respectivamente. Supongamos, sin pérdida de generalidad, que nuestro espacio es de cuatro dimensiones. Entonces, un cambio general de coordenadas entre los sistemas Σ y Σ0 se puede expresar como un conjunto de cuatro ecuaciones, en donde las nuevas coordenas primadas son funciones continuas, con inversa continua, de las coordenadas no primadas. Así la transformación de coordenadas y su inversa, se pueden escribir como: x0µ = x0µ (xα ) (7.78) xβ = xβ (x0ν ) (7.79) Notemos que si exigimos que las transformaciones de coordenas sean lineales, entonces estas ecuaciones se reducen a la forma: x0µ = Λµ α xα (7.80) xβ = Λν β x0ν (7.81) 7.3. TRANSFORMACIÓN GENERAL DE COORDENADAS 137 con los coeficientes de la transformaciones Λµα (y los de la transformación inversa Λνβ ) constantes, independientes de las coordenadas. Las componentes del vector desplazamiento infinitesimal dx en el sistema de coordenadas Σ están dadas por dxµ = (dx0 , dx1 , dx2 , dx3 ), mientras que las correspondientes componentes medidas en Σ0 son dx0ν = (dx00 , dx01 , dx02 , dx03 ). Para encontrar la relación entre las componentes del vector dx en los dos sistemas, basta con tomar la diferencial total de cada una de las funciones en las ecuaciones (7.78) y (7.79), así: dx0µ = ∂x0µ ν dx ∂xν (7.82) ∂xµ 0ν dx (7.83) ∂x0ν Estas ecuaciones definen la ley de transformación (y su inversa) para las componentes de cualquier vector en los dos sistemas de referencia: dxµ = V 0µ = ∂x0µ ν V ∂xν (7.84) ∂xµ 0ν V (7.85) ∂x0ν En el caso particular de transformaciones lineales (ecuaciones (7.80) y (7.81)), la ley de transformación para las componentes de un vector toma la forma: (7.86) V 0µ = Λµ ν V ν Vµ = V µ = Λνµ V 0ν (7.87) la cual se obtiene del caso general si hacemos la siguiente identificación: Λµ ν = ∂x0µ ∂xν (7.88) ∂xµ (7.89) ∂x0ν Finalmente, puesto que las transformaciones de coordenadas deben ser invertibles se debe cumplir que Λνµ = ∂x0µ ∂xα = δ µν ∂xα ∂x0ν (7.90) Esta relación se obtiene directamente, si aplicamos la regla de la cadena para las derivadas a la transformación idéntica x0µ (xα (x0ν )) ≡ x0µ , la cual para 138 CAPÍTULO 7. TENSORES el caso particular de transformaciones lineales, toma la forma Λµ α Λνα = δ µν . Así, teniendo en cuenta las ecuaciones (7.88) y (7.89), toda el álgebra y los conceptos del cálculo tensorial desarrollados en este capítulo, para el caso particular de transformaciones de Lorentz, son válidos para el caso más general de transformaciones arbitrarias de coordenadas. Las restricciones que impongamos sobre el conjunto de transformaciones de coordenadas entre sistemas, nos determinan las propiedades matemáticas (o físicas, según sea el caso) del espacio sobre el cual estamos trabajando. Por ejemplo, si consideramos que los sistemas de referencia físicamente significativos son los inerciales y que el principio de la constancia de la velocidad de la luz en el vacío se cumple, entonces solamente las ecuaciones de transformación de coordenadas admisibles son aquellas que dejan el intervalo espacio-tiempo invariante, obteniendo entonces el caso particular de transformaciones de Lorentz que hemos estado considerando en este capítulo. Otra posibilidad sería por ejemplo, aceptar el principio de la constancia de la velocidad de la luz, pero postular que las leyes de la física son válidas en todos los sistemas de referencia, séan inerciales o no. Para este caso más general ya no estamos restringidos a transformaciones de coordenadas lineales, como en el caso anterior que corresponde a la relatividad especial, aún cuando se sigue exigiendo que el intervalo espacio-tiempo permanezca invariante, esto es 0 dx0α dx0β ds2 = gµν dxµ dxν = gαβ (7.91) En este caso, bajo una transformación admisible de coordenadas, las componentes del tensor métrico (denotado ahora por g) son en general funciones de las coordenadas y por tanto, a diferencia del tensor métrico de Minkowski, sus componentes varían de un sistema de coordenadas (o de referencia) a otro. Este último ejemplo adquiere todo su significado en la teoría general de la relatividad, cuyo estudio está más allá del alcance del presente libro. 7.4. Operadores vectoriales En el cálculo vectorial usual sobre R3 se define el operador gradiente como: ∂ ∂ ∂ (7.92) ∇=( , , ) ∂x ∂y ∂z el cual al actuar sobre una función escalar produce un vector en la dirección del máximo cambio de la función. Por función escalar se entiende, una 7.4. OPERADORES VECTORIALES 139 función de valor real y variable vectorial, es decir una función de la forma f : R3 7−→ R (7.93) tal que, a un vector x = (x, y, z) de R3 le asocia un número real f (x, y, z). Así, al actuar el operador gradiente ∇ sobre la función f (x, y, z) da como resultado un vector sobre cada punto de R3 , con sus componentes dadas por ∇f = ( ∂f ∂f ∂f , , ) ∂x ∂y ∂z (7.94) Si consideramos ahora una función vectorial F (x, y, z), es decir una función de valor vectorial y variable vectorial: F : R3 7−→ R3 (7.95) con componentes (Fx , Fy , Fz ), entonces podemos hacer actuar el operador gradiente sobre F en la forma ∇·F = ∂Fz ∂Fx ∂Fy + + ∂x ∂y ∂z (7.96) para obtener una función real llamada la divergencia. También es posible obtener un vector a partir del operador gradiente, actuando éste sobre una función vectorial en la forma: ∇×F =( ∂Fy ∂Fx ∂Fz ∂Fy ∂Fx ∂Fz − , − , − ) ∂y ∂z ∂z ∂x ∂x ∂y (7.97) conocida como el rotacional de una función vectorial. Notemos que las tres operaciones definidas a partir del operador ∇, el gradiente, la divergencia y el rotacional, se pueden considerar como una extención de las operaciones usuales del álgebra vectorial: el producto de un vector por un escalar, el producto interno entre vectores y el producto cruz, respectivamente. Por esta razón es usual considerar para todos los efectos al operador ∇ como un vector, con el cual podemos construir todo tipo de operaciones permitidas dentro del cálculo vectorial usual, solamente teniendo presente el orden en el cual entra ∇ en la expresiones, pues el vector ∇ actua sobre funciones. Así por ejemplo, podemos construir expresiones tales como ∇2 = ∇ · ∇ = ∂2 ∂2 ∂2 + + ∂x2 ∂y 2 ∂z 2 conocida como el operador Laplaciano. (7.98) 140 CAPÍTULO 7. TENSORES Definamos entonces el cuadri-vector gradiente ∇ como un operador diferencial, tal que al actuar sobre una función escalar de las coordenadas Φ(xµ ), produce el c-vector ∇Φ, cuyas componentes en un sistema de referencia Σ están dadas por: ∂Φ ∂Φ ∂Φ ∂Φ (7.99) (∇Φ)µ = ( 0 , 1 , 2 , 3 ) ∂x ∂x ∂x ∂x A las componentes de ∇Φ las denotaremos también como ∂Φ/∂xµ , o ∂µ Φ. Veamos entonces, que las componentes de ∇Φ se transforman como las componentes covariantes de un c-vector bajo una transformación de coordenadas. Sean xµ y x0ν las coordenadas de un evento, medidas en los sistemas de referencia Σ y Σ0 respectivamente y relacionadas por una transformación de Lorentz, entonces las componentes covariantes de un c-vector V, en los dos sistemas de referencia, están relacionadas por: Vµ0 = Λµν Vν ≡ ∂xν Vν ∂x0µ (7.100) de acuerdo con las ecuaciones (7.88) y (7.89) de la sección anterior. Bajo una transformación de coordenadas por definición, una función escalar permanece invariante, es decir Φ(xµ ) = Φ(x0ν ). Teniendo en cuenta que bajo la transformación de coordenadas se tiene x0µ = x0µ (xν ) y aplicando la regla de la cadena a la función Φ(x0µ (xν )), obtenemos para las componentes del operador gradiente, medidas en los dos sistemas de referencia, la relación ∇0 Φ(x0µ ) ≡ ∂Φ ∂xα ∂Φ = ∂x0µ ∂x0µ ∂xα (7.101) Puesto que esta relación es general e independiente de la función escalar Φ, podemos concluir que las componentes del operador gradiente se transforman, bajo un cambio de coordenadas, como las componentes covariantes de un c-vector, es decir (7.102) ∂µ0 = Λµν ∂v A partir de esta definición, podemos construir los operadores de uso más frecuente en física, siguiendo los mismos procedimientos que en el caso del cálculo vectorial tridimensional estandar. Consideremos un campo vectorial Ψµ (xα ), esto es, una función vectorial de las coordenadas y calculemos el producto interno Minkowskiano entre este campo vectorial y el vector gradiente: (7.103) ∇ · Ψ = ∂ν Ψν que corresponde a la generalización del operador divergencia tridimensional. Un ejemplo de esta operación de uso muy frecuente en física, es la llamada 7.4. OPERADORES VECTORIALES 141 ecuación de continuidad: ∂ν Ψν = 0 ⇐⇒ ∂ Ψ0 ˜ =0 + ∇Ψ ∂x0 (7.104) en donde el simbolo ∇ significa el operador gradiente tridimensional. Claramente esta ecuación, por provenir de un producto interno entre c-vectores, es invariante bajo transformaciones de coordenadas, es decir ∂ν Ψν = 0 = ∂ν0 Ψ0ν (7.105) lo que significa que la ecuación de continuidad escrita de esta manera, automáticamente satisface el principio de relatividad. Ahora, si definimos un nuevo operador (conocido en la literatura como el D’Alembertiano ¤) como el producto interno del operador gradiente consigo mismo, obtenemos un operador que es un invariante (un escalar) bajo transformaciones de coordenadas, asi ∂2 − ∇2 (7.106) ¤ = η µν ∂µ ∂ν = ∂ µ ∂µ = ∂x02 la cual nos permite escribir directamente la ecuación de ondas como: ¤Ψ = 0 (7.107) Es conocido del álgebra vectorial, que el producto cruz entre vectores es una operación que solo tiene sentido para vectores cartesianos en tres dimensiones y por lo tanto en la forma usual como ella se define, no es posible generalizarla a vectores definidos en otras dimensiones espaciales. Realmente el producto cruz usual es un caso particular de tensores de segundo rango, como fue discutido al final de la sección 5.2.3. La operación de antisimetrizar un tensor de segundo rango (ecuación (7.57)) nos permite generalizar el producto cruz del cálculo verctorial usual en tres dimensiones, al caso de varias dimensiones, obteniendose no un vector axial como en el caso tridimensional, sino un tensor de segundo rango antisimétrico. Así por ejemplo, el “rotacional” de una función vectorial Ψα está dado por: (7.108) ∂[α Ψβ] = ∂α Ψβ − ∂β Ψα Si aplicamos esta definición al caso particular de un vector tridimensional usual, con componentes A = (Ax , Ay , Az ) ≡ (A1 , A2 , A3 ) ≡ Ai y ∇ = (∂/∂x, ∂/∂y, ∂/∂z) ≡ ∂j , entonces las siguientes tres componentes 142 CAPÍTULO 7. TENSORES independientes del tensor ∂[i Aj] ∂[1 A2] = ∂[3 A1] = ∂[2 A3] = ∂Ax ∂Ay − ∂y ∂x ∂Ax ∂Az − ∂x ∂z ∂Ay ∂Az − ∂z ∂y (7.109) corresponden a las componentes del rotacional (∇ × A)z , (∇ × A)y y (∇ × A)x respectivamente, en el cálculo vectorial ususal. Capítulo 8 Electrodinámica 8.1. Introducción En el segundo capítulo sobre los fundamentos de la teoría especial de la relatividad, vimos como las ecuaciones de Maxwell no permanecían invariantes bajo transformaciones de Galileo, indicando que si se aceptan las leyes de la electrodinámica, entonces ellas son válidas únicamente en un sistema de referencia privilegiado y por lo tanto, a través de experimentos electromagnéticos se podría determinar el movimiento absoluto. Los resultados negativos de estos experimentos planteaban una inconsistencia entre los principios de la mecánica Newtoniana y las leyes del electromagnetismo, las cuales condujeron a muchos teóricos de la época, a desarrollar elaboradas teorias que permitieran coexistir, sin aparente contradicción, a estos dos grandes pilares de la física del siglo XIX. La relatividad especial, basada sobre los potulados de la constancia de la velocidad de la luz en el vacío y el principio de relatividad, es una teoría independiente de los fenómenos eléctricos y mecánicos y por esta razón constituye uno de los pilares fundamentales de la física. En efecto podemos partir por ejemplo, de la validez de la ley de Coulomb para la fuerza entre dos partículas cargadas en reposo respecto a algún observador inercial (o equivalentemente, del campo eléctrico producido por una carga en reposo) y del carácter invariante de la carga eléctrica y encontrar, utilizando los principios de la dinámica relativista, la necesidad de introducir un campo dependiente de la velocidad de la partícula que lo produce, conocido como el campo magnético. Continuando con este procedimiento, más algunas hipótesis de origen experimental, tales como la conservación de la carga, se pueden encontrar las leyes de la electrodinámica que rigen el comportamiento de los 143 144 CAPÍTULO 8. ELECTRODINÁMICA campos electromagnéticos, así como la fuerza sobre las partículas cargadas en campos electromagnéticos. Este método de trabajo para mostrar el caracter relativista de la electrodinámica ha sido extensivamente utilizado en la literatura (ver por ejemplo el exelente tratado en el libro de Rosser) y por esta razón presentaré en este capítulo otro método de trabajo, el cual nos permite encontrar de manera directa las propiedades de transformación de los campos electromagnéticos entre sistemas de referencia inerciales. El objetivo fundamental de este capítulo es entonces, escribir las leyes de la electrodinámica en forma explícita covariante, es decir, de tal manera que su invarianza relativista sea manifiesta. Como una consecuencia de esta formulación de las ecuaciones de Maxwell, obtendremos las ecuaciones de transformación de los campos eléctricos y magnéticos bajo transformaciones de Lorentz. Para este fin, haremos uso del formalismo tensorial desarrollado en el capítulo anterior, postulando en primer lugar, que las leyes de la electrodinámica, constituidas por las ecuaciones de Maxwell, la ecuación de continuidad para la carga y la ley de la fuerza de Lorentz, son válidas y luego reescribiremos estas ecuaciones en términos de cantidades tensoriales. 8.2. Ecuaciones de Maxwell Las leyes de la electrodinámica están constituidas por dos conjuntos de ecuaciones. El primer conjunto lo conforman las ecuaciones de Maxwell que están dadas por (en unidades cgs): ∇ · E = 4πρ (8.1) ∇·B =0 (8.2) ∇×B = 1 ∂ E 4π + J c ∂t c ∇×E =− 1 ∂B c ∂t (8.3) (8.4) las cuales nos determinan los campos eléctrico E y magnético B en términos de sus fuentes (cargas y corrientes), con ρ la densidad volumétrica de carga y J la densidad de corriente eléctrica. La primera de estas ecuaciones es conocida como la ley de Gauss y establece que las cargas eléctricas son fuente del campo eléctrico, mientras que la tercera ecuación, la correspondiente ley de Gauss para el campo magnético, nos dice que no existen fuentes para el campo magnético, es decir, que en la naturaleza no existen cargas 8.2. ECUACIONES DE MAXWELL 145 magnéticas aisladas, conocidas en la literatura como monopolos magnéticos. La segunda de las ecuaciones de Maxwell contiene dos términos: por una parte está la ley de Ampere, esto es, que las corrientes eléctricas (representadas en el término 4π J/c) producen campos magnéticos y por otra parte está el término 1/c∂ E/∂t, introducido por Maxwell, que nos dice que campos eléctricos variables en el tiempo son también una fuente de campo magnético. La última de las ecuaciones de Maxwell es la ley de inducción de Faraday, la cual establece que campos magnéticos variables en el tiempo inducen campos eléctricos. El segundo conjunto de ecuaciones que conforman las leyes de la electrodinámica, lo constituyen la ecuación de continuidad y la ley de la fuerza de Lorentz: ∂ρ =0 (8.5) ∇·J + ∂t dp q = qE + u × B dt c (8.6) en donde q es la carga de la partícula y u su velocidad. La primera de estas ecuaciones, la ecuación de continuidad, establece que la carga eléctrica es conservada en la naturaleza. Es decir, si en una región del espacio la densidad de carga eléctrica varía (∂ρ/∂t 6= 0), es porque esta entrando o saliendo carga de esa región (∇ · J 6= 0). Es de anotar que esta ley de conservación de la carga está contenida en las ecuaciones de Maxwell y por lo tanto no constituye una ley independiente de la electrodinámica, pues basta con tomar la divergencia de la segunda ecuación de Maxwell y teniendo en cuenta la ley de Gauss (primera ecuación) se llega directamente a la ecuación de continuidad. Sin embargo, es usual y útil, para claridad en la discusión, mantener explícitamente esta ecuación de continuidad. Finalmente, la ley de la fuerza de Lorentz nos da la ecuación de movimiento para una carga puntual inmersa en un campo electromagnético. Las ecuaciones de Maxwell muestran como los campos eléctricos y magnéticos son en realidad aspectos diferentes de un solo fenómeno. Sin embargo, hasta el siglo XVIII los fenómenos eléctricos y los magnéticos, conocidos por la humanidad desde tiempos remotos, se consideraban como fenómenos completamente independientes entre si, situación que se puede entender ahora, si consideramos el caso particular de campos electromagnéticos independientes del tiempo, con sus fuentes de cargas y corrientes estacionarias. Bajo estas condiciones (campos y densidades de carga y corriente independientes del tiempo), las ecuaciones de Maxwell (ecuaciones (8.1) a la (8.4)) se pueden separar en dos conjuntos independientes: El primer conjunto de ecuaciones, 146 CAPÍTULO 8. ELECTRODINÁMICA dado por: ∇ · E = 4πρ (8.7) ∇×E =0 (8.8) describe las leyes de la electrostática. La primera ecuación, la ley de Gauss, describe que la única fuente del campo eléctrico son las cargas (estacionarias), mientras que la segunda ecuación nos dice que el campo producido por estas cargas es conservativo. Estas dos ecuaciones son equivalentes a la ley de Coulomb. El segundo conjunto de ecuaciones ∇×B = 4π J c ∇·B =0 (8.9) (8.10) constituido por la ley de Ampere (con densidad de corriente estacionaria J, i.e. ∇ · J = 0) y la ley de Gauss para el campo magnético, describen las leyes de la magnetostática y muestran que la única fuente del campo magnético también son las cargas eléctricas, pero ahora en movimiento (corrientes). Si bien sabemos que el origen de los campos electrostáticos y magnetostáticos son las cargas, los conjuntos de ecuaciones (8.7), (8.8) y (8.9), (8.10) para los campos E y B no establecen ninguna relación entre estos campos, es decir, si bien E y B tienen en últimas las mismas fuentes por origen, son conceptual y fenomenológicamente diferentes. Veremos en la siguiente sección, como la relatividad especial nos permite establecer una relación entre el campo magnético y el eléctrico, aún en el caso particular de campos independientes del tiempo. 8.3. Campo magnético como un efecto relativista Antes de entrar al tema central del presente capítulo, mostraremos en esta sección la estrecha relación que existe entre los fenómenos eléctricos y magnéticos (para campos independientes del tiempo) como una aplicación de los postulados fundamentales de la teoría especial de la relatividad. Veamos entonces, como surge el concepto de campo magnético como una necesidad para mantener la invarianza de las leyes físicas, si suponemos que la ley de Coulomb, la cual nos da la fuerza entre dos partículas cargadas en reposo, es válida. Coulomb fue el primero en describir cuantitativamente la fuerza entre partículas cargadas estacionarias a través de la ley de fuerzas: f12 = k q1 q2 r̂ r2 (8.11) 8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 147 en donde q1 y q2 miden las cargas eléctricas de las partículas, r es la distancia entre en ellas, con r̂ un vector unitario en la dirección del radio vector que une la carga 1 con la carga 2, y k es una constante de proporcionalidad que depende del sistema de unidades elegido (k = 1 en el sistema cgs que usaremos en el presente capítulo). Entonces f12 nos mide la fuerza que la carga q2 experimenta debido a la carga q1 , siendo esta fuerza atractica o repulsiva dependiendo del signo de las cargas: repulsiva si las cargas son del mismo signo y atractiva en caso contrario. Además, esta expresión de la fuerza satisface por su definición la tercera ley de Newton, esto es f12 = −f21 . En esta relación (ecuación (8.11)) se ha expresado la fuerza sobre la carga q2 debido a la carga q1 y en este sentido podemos escribir la ley de Coulomb en la forma: (8.12) f12 = q2 E1 (r) en donde la cantidad E1 (r), definida como E1 (r) := q1 r̂ r2 (8.13) es el campo eléctrico producido por la carga q1 en el punto r (hemos elegido el origen del sistema de coordenadas espaciales en la posición de la carga q1 para simplicar las expresiones). Estas expresiones para la fuerza (ecuación (8.11)) y el campo eléctrico (ecuación (8.13)) son válidas para un observador inercial Σ, con respecto al cual la carga q1 está en reposo. Es un hecho experimental, que la fuerza sobre la carga de prueba q2 es independiente del estado de movimiento de la carga de prueba, lo cual está implícito en la expresión para la fuerza de Coulomb, pues ella depende solamente de la posición instantánea de la carga q2 . Además, tanto la fuerza de Coulomb como el campo eléctrico producido por la carga q1 , son independientes del tiempo siempre y cuando la carga q1 permanezca en reposo. Experimentalmente determinamos la fuerza f12 sobre la carga de prueba q2 en el sistema de referencia inercial Σ, midiendo la rata de cambio del momentun p2 de la carga q2 , es decir midiendo dp2 /dt, así como también las otras variables cinemáticas y dinámicas que entran en la definición de la fuerza de Coulomb, tales como la distancia entre la carga q1 y la de prueba, la velocidad (nula en este caso) de la carga q1 y el momentun p2 de q2 . Si consideramos otro sistema de referencia inercial Σ0 , el cual se mueve con velocidad v a lo largo de los ejes x, x0 con respecto a Σ, entonces todas las cantidades cinemáticas y dinámicas deben transformarce de acuerdo con los principios de la relatividad especial y a partir de estas cantidades podemos determinar la fuerza sobre la carga de prueba, pero ahora estando las cargas q1 y q2 en moviento. 148 CAPÍTULO 8. ELECTRODINÁMICA Figura 8.1: Interacción Coulombiana normal al movimiento Nuestro primer objetivo es determinar la fuerza sobre una carga de prueba q2 , medida por un observador inercial Σ, debida a una carga q1 que se mueve con velocidad constante. Para simplificar los cálculos y sin pérdida de generalidad, consideraremos dos situaciones particulares: En la primera, ilustrada en la Figura 8.1, la carga de prueba q2 se encuentra en reposo con respecto al sistema Σ y está situada sobre el eje y en las coordenadas (0, y, 0), mientras que la carga q1 se mueve con velocidad v a lo largo del eje positivo de las x y pasa por el origen de coordenadas en el instante t = 0. La segunda situación, mostrada en la Figura 8.2, se diferencia de la anterior solamente en que ahora la carga de prueba, que la denotaremos ahora por q3 , se situa en reposo respecto al sistema Σ sobre el eje de las x en las coordenadas (x, 0, 0). Debido a que la carga q1 se está moviendo, debemos pasarnos a un sistema de referencia inercial Σ0 con respecto al cual esta carga se encuentre en reposo, con el fin de poder aplicar la ley de Coulomb. Considerados un sistema de referencia inercial Σ0 , que se mueva con velocidad v a lo largo del eje positivo x, siendo v la velocidad de la carga q1 respecto a Σ. Entonces, para todo instante t0 la carga q1 se encuentra en reposo en el origen de coordenadas de Σ0 , mientras que la carga de prueba q2 pasa por el punto de coordenadas (0, y 0 , 0) en el instante t0 = 0 y la carga q3 pasa por el punto 8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 149 Figura 8.2: Interacción Coulombiana en la dirección de movimiento de coordenadas (x0 , 0, 0) en t0 = 0. Bajo estas condiciones, las fuerzas sobre las cargas q2 y q3 están dadas por la ley de Coulomb (ecuación (8.11)). Entonces, sobre la carga q2 la fuerza en el instante t0 = 0 solo tiene componente y y está dada por: q1 q2 0 0 0 = 0; fy12 = 02 ; fz12 =0 (8.14) fx12 y mientras que para la carga q3 la fuerza de Coulomb, en t0 = 0, tiene solo componente x: q1 q3 0 0 0 = 02 ; fy13 = 0; fz13 =0 (8.15) fx13 x Retornemos ahora al sistema de referencia inercial Σ. Para este fin, recordemos la definición de las componentes del c-vector fuerza (ecuación (5.19)) 1 (8.16) f α = (f 0 , f 1 , f 2 , f 3 ) = γ(u)( f · u, f ) c en donde u es la velocidad de la partícula sobre la cual esta actuando la fuerza física f . Bajo la transformación de Lorentz que estamos considerando, las componentes de la c-fuerza medidas por Σ0 están relacionadas con las correspondientes componentes de la c-fuerza medidas en Σ, por las relaciones: (8.17) f 0 = γ(−v)(f 00 + βf 01 ) 150 CAPÍTULO 8. ELECTRODINÁMICA f 1 = γ(−v)(f 01 + βf 00 ) (8.18) f 2 = f 02 (8.19) f 3 = f 03 (8.20) siendo −v la velocidad de Σ respecto a Σ0 , β = v/c y γ(−v) = γ(v). Teniendo en cuenta la ecuación (8.16) y recordando la forma como el factor γ(u0 ) se transforma (ver ecuación (4.13)), las ecuaciones de transformación para las componentes de la fuerza física f están dadas por: fx = fy = fz = u01 v 0 f · u0 c2 0 x 1 + vu c2 fx0 + f0 ³ y γ(v) 1 + f0 ³ z γ(v) 1 + (8.21) vu0x c2 ´ (8.22) vu0x c2 ´ (8.23) Dado que la velocidad u0 de las cargas q2 y q3 , que las denotaremos por y u02 respectivamente, están dadas por: u01 = (−v, 0, 0) (8.24) u02 = (−v, 0, 0) (8.25) con respecto al sistema de referencia Σ0 , tenemos que las componentes de la fuerza física respecto a Σ son: 0 =0 fx12 = fx12 0 = γ(v) fy12 = γ(v) fy12 0 fz12 = fz12 =0 para la carga q2 , y 0 fx13 = fx13 = q1 q3 x02 (8.26) q1 q2 y02 (8.27) (8.28) (8.29) 0 =0 fy13 = fy13 (8.30) 0 =0 fz13 = fz13 (8.31) 8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 151 para la carga q3 . Puesto que bajo la transformación de Lorentz considerada y0 = y y x0 = γ(v)x, obtenemos que las componentes no nulas de la fuerza en Σ, sobre las cargas de prueba q2 y q3 , están dadas por: q1 q2 y2 (8.32) 1 q1 q3 γ 2 (v) x2 (8.33) fy12 = γ(v) fx13 = respectivamente. A partir de estos resultados, es fácil intuir la forma general para la fuerza eléctrica en un instante dado sobre una partícula de prueba q2 en reposo en un punto de coordenadas (x, y, z), debido a una carga q1 que se desplaza a velocidad constante v a los largo del eje de las x y que pasa por el origen de coordenadas en ese instante: f = q1 q2 γ(v)r + y 2 + z 2 )3/2 (γ 2 (v)x2 (8.34) en donde r es el vector posición instantáneo que une la carga q1 con la carga de prueba q2 . Así, podemos definir el campo eléctrico producido por una partícula móvil, situada instantáneamente en el origen de coordenadas, como: γ(v)r (8.35) E = q1 2 2 (γ (v)x + y 2 + z 2 )3/2 Notemos en primer lugar, que el campo eléctrico sigue siendo radial, aún cuando ya no es esféricamente simétrico como en el caso del campo eléctrico producido por una carga en reposo, pues de la ecuación anterior se deduce que el campo eléctrico se intensifica en un factor γ(v) para puntos del espacio situados en el plano perpendicular a la dirección de movimiento de la partícula, mientras que se hace un factor 1/γ 2 (v) más pequeño para puntos situados a lo largo de la dirección de movimiento de la carga q1 . Consideremos ahora dos cargas q1 y q2 como se muestra en la Figura 8.3, en donde la carga q1 se mueve con velocidad v a lo largo del eje x positivo con respecto al sistema de referencia Σ y la carga q2 se mueve con velocidad u = (ux , uy , uz ) respecto a Σ y supongamos que en el instante t = 0, la carga q1 pasa por el origen de coordenadas y q2 por el punto (x, y, z) . Similar al caso anteriormente discutido, sea Σ0 un sistema de referencia inercial que se desplaza con velocidad v en la dirección positiva de las x respecto a Σ. Entonces, con respecto al observador Σ0 la carga q1 se encuentran en reposo en el origen de coordenadas de Σ0 y q2 pasa por el punto de coordenadas 152 CAPÍTULO 8. ELECTRODINÁMICA Figura 8.3: Interacción entre cargas con movimiento arbitrario (x0 , y 0 , z 0 ) en el instante t0 = 0, moviendose con una velocidad u0 . De la ley de Coulomb, las componentes de la fuerza medidas por el observador inercial Σ0 están dadas por: q1 q2 x0 0 fx12 = 02 (8.36) (x + y02 + z 02 )3/2 0 fy12 = q1 q2 y 0 (x02 + y 02 + z 02 )3/2 (8.37) 0 = fz12 q1 q2 z 0 (x02 + y02 + z 02 )3/2 (8.38) las cuales son independientes de la velocidad u0 de la carga de prueba. Aplicando las ecuaciones (8.21), (8.22) y (8.23) para la transformación de las componentes de la fuerza y teniendo en cuenta la ley de transformación de velocidades: ux − v (8.39) u0x = x 1 − vu c2 u0y = u0z = u ¡ y γ(v) 1 − u ¡ z γ(v) 1 − vux c2 vux c2 ¢ ¢ (8.40) (8.41) 8.3. CAMPO MAGNÉTICO COMO UN EFECTO RELATIVISTA 153 obtenemos para las componentes de la fuerza sobre la carga de prueba q2 , medidas por el observador inercial Σ: fx12 = ³ vuy γ(v)q1 q2 vuz ´ x + y + z c2 c2 (γ 2 (v)x2 + y 2 + z 2 )3/2 ³ vux ´ γ(v)q1 q2 y 1 − c2 (γ 2 (v)x2 + y2 + z 2 )3/2 ³ vux ´ γ(v)q1 q2 z 1 − = 2 c2 (γ (v)x2 + y 2 + z 2 )3/2 (8.42) fy12 = (8.43) fz12 (8.44) Sabemos que la fuerza de Coulomb sobre una carga de prueba es independiente del estado de movimiento de dicha carga de prueba. Sin embargo, comparando la ecuación (8.32) con las ecuaciones (8.42), (8.43) y (8.44) para la fuerza sobre la carga de prueba q2 , la primera cuando q2 está en reposo y la segunda cuando está en movimiento, vemos que en el segundo caso aparecen unos términos extras a la fuerza eléctrica (de Coulomb). Para ver esto de una manera más directa, notemos que la fuerza sobre la carga de prueba q2 (ecuaciones (8.42), (8.43) y (8.44)) la podemos escribir en la forma: u (elec) (mag) (8.45) f12 = f12 + f12 ; = q2 E + q2 × B c en donde E es el campo eléctrico producido por la carga q1 dado por (ecuación (8.35)): q1 γ(v)r (8.46) E= 2 (γ (v)x2 + y 2 + z 2 )3/2 siendo u la velocidad de la carga de prueba q2 y definimos el campo magnético B producido por la carga q1 , como: B γ(v)q1 r 1 = v× 2 c (γ (v)x2 + y 2 + z 2 )3/2 1 v×E = c : (8.47) siendo v la velocidad de la carga q1 . Teniendo en cuenta que la velocidad de la carga q1 , en el caso considerado está dada por v = (v, 0, 0), es fácil ver por un cálculo directo, que la expresión general dada por la ecuación (8.45) se reduce a la expresión para fuerza, encontrada en las ecuaciones (8.42), (8.43) y (8.44). En la ecuación (8.45) se dividió explícitamente la fuerza que actua sobre la carga de prueba en dos términos: El primero corresponde a la fuerza Coulombiana que actua sobre la carga q2 , la cual es independiente del estado 154 CAPÍTULO 8. ELECTRODINÁMICA de movimiento de dicha carga de prueba, mientras que el segundo término sí es dependiente de la velocidad de dicha carga. Además, este segundo término se anula si cualquiera de las cargas, la carga fuente q1 o la de prueba q2 están en reposo. Este resultado nos muestra la estrecha relación entre los fenómenos eléctricos y magnéticos. Es importante tener en mente, que en todo nuestro análisis hemos trabajo bajo la suposición que las cargas no están sometidas a aceleraciones, pues para considerar esta situación es necesario trabajar con las leyes completas de la electrodinámica. Es posible continuar con este método de trabajo y obtener la ley de BiotSabart y la ley de Ampere para corrientes estacionarias, pero dejaremos estos temas de lado, para concentrarnos en el objetivo fundamental del presente capítulo. En la siguiente sección escribiremos las ecuaciones de Maxwell en forma explícita relativista y encontraremos las leyes generales de transformación de los campos electromagnéticos, entre sistemas de referencia inerciales y mostraremos, cómo los resultados anteriormente obtenidos, corresponden a casos particulares de estas leyes de transformación. 8.4. Ecuaciones de Maxwell covariantes Consideremos en primer lugar la ecuación de continuidad (8.5), la cual podemos escribir en forma explícitamente covariante, como: ∂µ J µ = 0 (8.48) teniendo encuenta lo establecido en la última sección del capítulo anterior y donde el c-vector corriente J ν se ha definido en la forma: J ν := (J 0 , J 1 , J 2 , J 3 ) = (cρ, J) (8.49) La componente temporal J 0 representa la densidad de carga (siendo la carga un invariante relativista) y las componentes espaciales J i , i = 1, 2, 3 corresponden a las componentes del vector densidad de corriente eléctrica. Esta definición del c-vector corriente nos da inmediatamente, las ecuaciones de transformación para las densidades de carga y corriente, medidas por dos observadores inerciales. En efecto, dados dos sistemas de referencia inerciales Σ y Σ0 , con J ν = (cρ, J) y J 0ν = (cρ0 , J 0 ) las componentes del c-vector corriente medidas por los dos observadores, entonces J ν y J 0ν están relacionadas por (ver ecuación (7.2)): (8.50) J 0ν = Λµν J ν 8.4. ECUACIONES DE MAXWELL COVARIANTES 155 Para el caso particular de dos sistemas de referencia inerciales, con v la velocidad del sistema Σ0 respecto a Σ, a lo largo del eje positivo de las x y ejes espaciales paralelos, tenemos que las ecuaciones de transformación para las componentes de la densidad de corriente están dadas por: J 00 = γ(v)(J 0 − βJ 1 ) (8.51) J 01 = γ(v)(J 1 − βJ 0 (8.52) 2 (8.53) J 03 = J 3 (8.54) J 02 =J en donde hemos utilizado las ecuaciones (2.46) p para los elementos de la transµ formación de Lorentz Λ ν , siendo γ(v) = 1/ 1 − β 2 y β = v/c. Remplazando las componentes J 0ν y J ν en términos de las densidades de carga (J 0 = cρ y J 00 = cρ0 ) y de corriente ( j i = J ≡ (Jx , Jy , Jz ) y j 0i = J 0 ≡ (Jx0 , Jy0 , Jz 0 )) obtenemos las relaciones: v (8.55) ρ0 = γ(v)(ρ − 2 Jx ) c Jx0 = γ(v)(Jx − vρ) (8.56) Jy0 = Jy (8.57) Jz0 = Jz (8.58) En las ecuaciones de Maxwell escritas en la forma tradicional (ecuaciones (8.1) a la (8.4)) los campos eléctricos E y magnéticos B son vectores cartesianos usuales y por lo tanto no corresponden a ninguna cantidad relativista, es decir a un escalar de Lorentz, o a un c-vector, o a un tensor. Por otra parte, para describir los campos electromagnéticos producidos por alguna distribución de cargas y corrientes, es necesario conocer seis cantidades independientes, esto es, las tres componentes del campo eléctrico y las tres del campo magnético. Esta situación nos conduce a postular, que el objeto matemático (relativista) adecuado para describir al campo electromagnético, es un tensor de segundo orden antisimétrico, pues por lo discutido en el capítulo anterior (sección 8.2.3), este tensor posee solo seis componentes independientes. Estos argumentos nos motivan a definir el tensor campo electromagnético F medido por un observador inercial Σ, como un tensor de segundo rango antisimétrico cuyas componente contravariantes están definidas por: F 12 = −F 21 = Bz F 01 = −F 10 = Ex F αα = 0 F 23 = −F 32 = Bx F 02 = −F 20 = Ey F 31 = −F 13 = By F 03 = −F 30 = Ez ∀α = 0, 1, 2, 3 (8.59) 156 CAPÍTULO 8. ELECTRODINÁMICA Con esta definición, podemos escribir las dos primeras ecuaciones de Maxwell (ecuaciones (8.1) y (8.2)) en la forma: ∂α F αβ = − 4π β J c (8.60) la cual es una ecuación covariante relativista, pues el lado izquierdo es el producto del operador gradiente ∂α por el tensor electromagnético F αβ contraido en su primer índice α, para obtener así un c-vector contravariante, el cual es proporcional al c-vector densidad de corriente. Esto significa que esta ecuación tiene la misma forma en todos los sistemas de referencia inerciales, es decir, en un sistema de referencia Σ0 , para el cual F 0αβ y J 0β son las correspondientes componentes del tensor campo electromagnético y densidad de corriente, las dos primeras ecuaciones de Maxwell tienen la forma: ∂α0 F 0αβ = − 4π 0β J c (8.61) en donde las componentes de la densidad de corriente J 0β medidas en Σ0 , están relacionadas con las medidas en Σ, por las ecuaciones de transformación (8.50) ( o las ecuaciones (8.51), (8.52), (8.53) y (8.54) o también las ecuaciones (8.55), (8.56), (8.57) y (8.58) en el caso particular usual). Las componentes del tensor campo electromagnético medidas por los dos observadores inerciales Σ y Σ0 están relacionadas por las ecuaciones de transformación (ver el capítulo anterior ecuación (7.3)): F 0µν = Λµα Λνβ F αβ (8.62) Estas relaciones nos dan entonces, las ecuaciones de transformación para los campos eléctricos y magnéticos medidas por dos observadores inerciales. Consideremos de nuevo, el caso particular de transformaciones de Lorentz entre sistemas de referencia con ejes paralelos y velocidad relativa a lo largo de los ejes xx0 , en donde los elementos de la transformación de Lorentz están dados por (ecuación (2.47)): Λ00 = Λ11 = γ (8.63) Λ01 = Λ10 = −βγ (8.64) Λ22 Λ33 = =1 p con β = v/c y γ = 1 − β 2 y los demás elementos cero. Sean E = (Ex , Ey , Ez ) (8.65) (8.66) 8.4. ECUACIONES DE MAXWELL COVARIANTES 157 B = (Bx , By , Bz ) (8.67) E 0 =(Ex0 , Ey0 , Ez0 ) (8.68) B 0 = (Bx0 , By0 , Bz0 ) (8.69) las componentes de los campos eléctricos y magnéticos medidas por Σ y Σ´respectivamente. Entonces aplicando las ecuaciones de transformación (8.62), con los elementos de la transformación de Lorentz dados por las ecuaciones (8.63), (8.64) y (8.65) y la definición (8.59) de las componentes del tensor electromagnético, tenemos (para las componentes no nulas de F): Ex0 = F 0 01 = Λ0α Λ1β F αβ = Λ00 Λ10 F 00 + Λ00 Λ11 F 01 + Λ00 Λ12 F 02 + Λ00 Λ13 F 03 +Λ01 Λ10 F 10 + Λ01 Λ11 F 11 + Λ01 Λ12 F 12 + Λ01 Λ13 F 13 +Λ02 Λ10 F 20 + Λ02 Λ11 F 21 + Λ02 Λ12 F 22 + Λ02 Λ13 F 23 +Λ03 Λ10 F 30 + Λ03 Λ11 F 31 + Λ03 Λ12 F 32 + Λ03 Λ13 F 33 = Λ00 Λ11 F 01 + Λ01 Λ10 F 10 = γ 2 Ex − β 2 γ 2 Ex = Ex (8.70) Un cálculo similar se puede hacer para las demás componentes, pero por brevedad, aquí solo presentaremos los téminos no nulos que surgen en la transformación: Ey0 = F 0 02 = Λ0α Λ2β F αβ = Λ00 Λ22 F 02 + Λ01 Λ22 F 12 = γ(Ey − βBz ) Ez0 = F 0 03 = Λ0α Λ3β F αβ = Λ00 Λ33 F 03 + Λ01 Λ33 F 13 = γ(Ez + βBy ) Bx0 = F = 0 23 (8.72) = Λ2α Λ3β F αβ = Λ22 Λ33 F 23 Bx By0 = F (8.71) 0 31 (8.73) = Λ3α Λ1β F αβ = Λ33 Λ10 F 30 + Λ33 Λ11 F 31 = γ(By + βEz ) (8.74) 158 CAPÍTULO 8. ELECTRODINÁMICA Bz0 = F 0 12 = Λ1α Λ2β F αβ = Λ10 Λ22 F 02 + Λ11 Λ22 F 12 = γ(Bz − βEy ) (8.75) Antes de considerar aplicaciones de estas ecuaciones de transformación de los campos, las cuales serán dadas más adelante, escribamos las otras ecuaciones de Maxwell en notación tensorial. Las ecuaciones de Maxwell homogéneas (las dos últimas ecuaciones (8.3) y (8.4)), con la ayuda del tensor de Levi-Civita introducido en el capítulo anterior (ecuación (7.75)), las podemos escribir en la forma: εαβγδ ∂β Fγδ = 0 (8.76) en donde en esta última ecuación se ha utilizado el tensor de Minkowski para bajar los índices del tensor electromagnético F, esto es: Fγδ = η αγ η βδ F αβ (8.77) las cuales nos representa las componentes covariantes del tensor campo electromagnético. Para recordar más fácilmente la relación entre las componentes contravariantes del tensor F, definidas en la ecuación (8.59) y su relación con las componentes covariantes, definidas en la ecuación (8.77), es útil escribir estas componentes en forma matricial: 00 F F 01 F 02 F 03 10 F F 11 F 12 F 13 αβ (F ) = F 20 F 21 F 22 F 23 30 F F 31 F 32 F 33 0 E E E x y z −Ex 0 Bz −By = (8.78) −Ey −Bz 0 Bx −Ez By −Bx 0 Aplicando, ahora, la ecuación (8.77), tenemos: F00 F01 F02 F03 F10 F11 F12 F13 (Fαβ ) = F F21 F22 F23 20 F30 F31 F32 F33 0 −Ex −Ey −Ez Ex 0 Bz −By = E −B 0 Bx z y Ez By −Bx 0 (8.79) 8.4. ECUACIONES DE MAXWELL COVARIANTES 159 Ilustremos como se aplicó la ecuación (8.77) para llegar a la ecuación anterior, calculando explícitamente dos términos, por ejemplo F02 y F21 . Recordando, para simplificar, que los elementos del tensor métrico de Minkowski se anulan si los índices son diferentes, vemos que de los 16 sumandos que aparecen por la doble suma en la ecuación (8.77), solo un término es no nulo: F02 = η α0 η β2 F αβ = η 00 η 22 F 02 = −Ey (8.80) F21 = η α2 ηβ1 F αβ = η 22 η 11 F 21 = −Bz (8.81) Veamos ahora que efectivamente la ecuación (8.76) reproduce las ecuaciones de Maxwell homogeneas. Notemos en primer lugar que la ecuación (8.76) contiene cuatro ecuaciones, una para cada α = 0, 1, 2, 3 y cada una a su vez (debido a la triple suma sobre los índices repetidos β, γ y δ) está conformada por 64 sumandos. Sin embargo, dado que las componentes del tensor de Levi-Civita se anulan para cualquier par de índices repetidos, en cada ecuación sobreviven solo cuatro sumandos. Así, para α = 0 los términos no nulos son: 0 = ε0123 ∂1 F23 + ε0132 ∂1 F32 + ε0213 ∂2 F13 + ε0231 ∂2 F31 + ε0312 ∂3 F12 + ε0321 ∂3 F21 ∂By ∂Bz ∂Bx +2 +2 = 2∇ · B = 2 ∂x ∂y ∂z (8.82) obteniendo la ecuación de Maxwell para la divergencia del campo magnético. Para la última ecuación de Maxwell, la ley de Faraday, consideremos explícitamente solo el caso de α = 1, pues el resultado se puede extrapolar fácilmente a α = 2 y 3. Entonces, para α = 1 los términos no nulos son: 0 = ε1023 ∂0 F23 + ε1032 ∂0 F32 + ε1203 ∂2 F03 + ε1230 ∂2 F30 + ε1302 ∂3 F02 + ε1320 ∂3 F20 ∂Ey ∂Ez 2 Bx ∂Bx +2 −2 =− − 2(∇ × E)x = −2 ∂ct ∂y ∂z c ∂t (8.83) en donde hemos utilizado el hecho que x0 = ct, obteniendo así la componente x de la ley de Faraday. Finalmente consideremos la ecuación de la Fuerza de Lorentz (segunda ecuación en (8.6)), la cual podemos escribir en forma covariante como: fα = q q dxγ dpα = ηβγ F βα = Fγ dτ c dτ c γ α dx dτ (8.84) 160 CAPÍTULO 8. ELECTRODINÁMICA en donde pα es el c-momentun de la partícula de carga q, τ el tiempo propio, xγ sus coordenadas de posición y Fγ α las componentes mixtas del tensor campo electromagnético definidas por: Fγ α = η γσ F σα (8.85) Desarrollemos explícitamente la ecuación (8.84), para interpretar los términos que de ella surgen, pues si bien afirmamos que esta ecuación es equivalente a la fuerza de Lorentz, notemos que, siendo la fuerza de Lorentz una ecuación vectorial, contiene tres ecuaciones escalares independientes, mientras que la ecuación (8.84) es cuadri-vectorial y por tanto contiene cuatro ecuaciones. En primer lugar calculemos, utilizando la ecuación (8.85), las componentes mixtas F αγ del tensor campo electromagnético: (Fβ F 0 F0 α ) = F 0 F0 0 Ex = E y Ez 0 1 2 3 F1 F1 F1 F1 Ex 0 −Bz By 0 1 2 3 F2 F2 F2 F2 Ey Bz 0 −Bx 0 1 2 3 F F3 F3 F3 Ez −By Bx 0 0 3 1 2 3 (8.86) Remplazando estas cantidades en la ecuación (8.84), y desarrollandola explícitamente en componentes, tenemos: dx1 dx2 dx3 q f 0 = (Ex + Ey + Ez ) c dτ dτ dτ (8.87) dx0 dx2 dx3 q + Bz − By ) f 1 = (Ex c dτ dτ dτ (8.88) dx0 dx1 dx3 q f 2 = (Ey − Bz + Bx ) c dτ dτ dτ (8.89) dx0 dx1 dx2 q f 3 = (Ez + By − Bx ) (8.90) c dτ dτ dτ Para interpretar estas ecuaciones, recordemos el significado físico de las componentes de la cuadri-fuerza dado en el capítulo 5 (ver ecuación (5.19)). Las componentes de la c-fuerza se pueden escribir en la forma: 1 f α = γ(u)( f · u, f ) c (8.91) 8.4. ECUACIONES DE MAXWELL COVARIANTES 161 en donde f = dp/dt es la fuerza física sobre la partícula, u su velocidad y la componente temporal representa el trabajo por unidad de tiempo que realiza la fuerza física f sobre la partícula. Recordando que 1 dt = γ(u) := p dτ 1 − u2 /c2 (8.92) (ver capítulo 4 ecuación (4.5)), podemos reescribir las ecuaciones (8.87), (8.88), (8.89) y (8.90), en la forma siguiente: q 1 f ·u= E·u c c (8.93) f = q E + qu × B (8.94) Notemos que el factor de Lorentz γ(u) se cancela. La componente temporal de la c-fuerza, corresponde al hecho de que solo el campo eléctrico realiza trabajo sobre las partículas, una situación que está contemplada en la expresión para la fuerza de Lorentz, puesto que la fuerza debida al campo magnético es de la forma qu × B y por lo tanto: q f · u = (q E + u × B) · u = E · u c (8.95) Resumiendo, las leyes de la electrodinámica (que incluyen las ecuaciones de Maxwell, la ecuación de continuidad y la fuerza de Lorentz) escritas en forma relativista covariante son: ∂α F αβ = −4πJ β (8.96) εαβγδ ∂β Fγδ = 0 (8.97) µ (8.98) ∂µ J = 0 dxγ q (8.99) f α = Fγ α c dτ Veamos ahora, algunas aplicaciones sencillas de estas ecuaciones y de las propiedades de transformación de los campos. Consideremos en primer lugar los ejemplos tratados en la sección anterior. Supongamos que una partícula de carga q1 se mueve con velocidad constante v respecto a un sistema de referencia inercial Σ, a lo largo del eje positivo de las x y pasa por el origen en el intante t = 0. Sea Σ0 otro sistema de referencia inercial, el cual se mueve con velocidad v respecto a Σ en la dirección del eje positivo de las x. Entonces, la carga q1 se encuentra en reposo en el origen de Σ0 y por lo 162 CAPÍTULO 8. ELECTRODINÁMICA tanto el campo electromagnético, en un punto de coordenadas (x0 , y 0 , z 0 ) y en cualquier instante, producido por q1 se reduce a: q1 (8.100) E 0 = 03 r0 ; B 0 = 0 r de acuerdo con la ley de Coulomb, en donde r0 = (x0 , y 0 , z 0 ) y r0 = (x02 +y 02 + z 02 )1/2 . Para calcular el campo electromagnético medido por el observador inercial Σ, calculamos primero las componentes del tensor campo electromagnético en Σ0 y luego aplicamos las propiedades de transformación del 0 . De la ecuación (8.100) tenemos (en notación matricial): tensor Fµν q1 x0 q1 y0 q1 z 0 0 03 03 03 r r r q1 x0 − 0 0 0 03 0αβ r (8.101) (F ) = 0 − qr103y 0 0 0 q1 z0 0 0 0 − r03 Aplicando las ecuaciones de transformación para las componentes del tensor F 0µν (ecuación (8.62)), pero teniendo en cuenta que ahora estamos transformando del sistema Σ0 al Σ: F µν = Λµα Λνβ F 0αβ (8.102) en donde los elementos de la transformación de Lorentz Λµα están dados por las ecuaciones (8.63), (8.64) y (8.65), cambiando β = v/c por −β, y teniendo en cuenta que γ(−v) = γ(v). Consideremos primero los término F 0i , i = 1, 2, 3 que corresponden a las componentes del campo eléctrico medido en Σ. Entonces, como Λ02 = Λ03 = 0 y Λiβ = 0 para β 6= 0 y β 6= i y teniendo en cuenta que F 0ij = 0, i, j = 1, 2, 3 (no hay campo magnético en Σ0 ), tenemos que los términos no nulos de la ecuación (8.102) son: F 0i = Λ0α Λiβ F 0αβ = Λ00 Λiβ F 00β + Λ01 Λiβ F 01β = Λ00 Λii F 00i + Λ01 Λi0 F 010 (8.103) Notemos que en el primer término de la última igualdad no hay suma sobre el índice i, pues está repetido tres veces. Esto surgió del hecho que Λij = 0 si i 6= j; i, j = 1, 2, 3. Remplazando explícitamente los diferentes términos, tenemos que las componentes del campo eléctrico medidas por el observador Σ están dadas por: Ex = γ 2 (v)Ex0 − β 2 γ 2 (v)Ex0 = Ex0 (8.104) 8.5. TRANSFORMACIONES GAUGE 163 Ey = γ(v)Ey0 (8.105) Ez = γ(v)Ez0 (8.106) Notemos que en el instante t = 0 medido en Σ, la carga está en el origen y la relación entre las coordenadas del punto donde estamos observando el campo eléctrico es (x0 , y0 , z 0 ) = (γ(v)x, y, z) en ese instante. Entonces, si expresamos el campo eléctrico medido por Σ en términos de las coordenadas de Σ, obtenemos el resultado ya encontrado en la sección anterior, ecuación (8.35). Calculemos ahora las componentes del campo magnético en el sistema de referencia Σ. Procediendo de forma similar, escribamos primero las componentes no nulas de la ecuación (8.102) que corresponden al campo magnético, notando que i 6= j; i, j = 1, 2, 3 y no hay suma sobre tres índices repetidos: F ij = Λiα Λjβ F 0αβ = Λi0 Λjj F 00j + Λii Λj0 F 0i0 (8.107) Remplazando, tenemos que las componentes del campo magnético son: Bx = F 23 = 0 (8.108) By = F 31 = −βγ(v)Ez0 (8.109) Bz = F 12 = βγ(v)Ey0 (8.110) Este resultado lo podemos escribir en forma condensada como: 1 B = v×E c (8.111) en completo acuerdo con el resultado obtenido en la sección anterior, ecuación (8.47), teniendo en cuenta las ecuaciones (8.104), (8.105) y (8.106) y que la velocidad está dada por: v = (v, 0, 0) (8.112) 8.5. Transformaciones Gauge Hay dos teoremas del cálculo diferencial en varias variables, que nos permiten escribir las ecuaciones de Maxwell en forma más compacta: Teorema 9.1: Sea F una función vectoria tal que su rotacional es cero, i.e., ∇ × F = 0, entonces la función F se puede escribir como el gradiente de una función escalar Ψ(r), esto es: F = ∇Ψ(r) (8.113) 164 CAPÍTULO 8. ELECTRODINÁMICA Teorema 9.2: Sea F una función vectorial tal que su divergencia es cero, i.e., ∇ · F = 0 , entonces la función F se puede escribir como el rotacional de una función vectorial Υ(r), esto es: F = ∇ × Υ(r) (8.114) Apliquemos estos dos resultados del cálculo vectorial a los campos eléctrico y magnético. La tercera ecuación de Maxwell (8.3) establece que ∇·B =0 (8.115) entonces podemos escribir el campo magnético como el rotacional de una función vectorial, es decir: B =∇×A (8.116) en donde la función vectorial A se le llama el potencial vectorial. Ahora, si reemplazamos el campo magnético en la última de las ecuaciones (8.4) en términos del potencial vectorial A, tenemos: ∇ × (E + ∂A )=0 ∂t (8.117) esto significa, de acuerdo con el Teorema 9.2, que la función vectorial E + ∂ A/∂t la podemos escribir como el gradiente de una función escalar Φ, es decir ∂A = −∇Φ (8.118) E+ ∂t en donde Φ es el potencial escalar. El signo menos en la ecuación anterior permite interpretar directamente al potencial Φ, para el caso de campos independientes del tiempo, como el trabajo por unidad de carga realizado por el campo eléctrico, llamado potencial electrostático, el cual es un campo conservativo. Estos dos teoremas del cálculo vectorial, corresponden a casos particulares de un teorema más general de tensores: Teorema 9.3: Sean Tαβ las componentes covariantes de un tensor de segundo rango antisimétrico, tal que εαβγδ ∂β Tγδ = 0 (8.119) entonces el tensor Tαβ se puede escribir como el “rotacional” (ver ecuación (7.108)) de una función cuadri-vectorial W γ , es decir Tαβ = ∂[α Wβ] = ∂α Wβ − ∂β Wα (8.120) 8.5. TRANSFORMACIONES GAUGE 165 Como vimos en la sección 9.4 de este capítulo, las dos ecuaciones de Maxwell homogeneas (∇ · B = 0 y ∇ × E + ∂ B/∂t = 0) se pueden escribir en la forma εαβγδ ∂β Fγδ = 0 (8.121) en donde Fγδ es el tensor campo electromagnético. Entonces, de acuerdo con el Teorema 9.3, el tensor campo electromagnético Fγδ se puede escribir en la forma ∂Aγ ∂Aδ Fγδ = ∂γ Aδ − ∂δ Aγ = − (8.122) ∂xγ ∂xδ en donde el cuadri-vector Aµ , definido como: Aµ := (Φ, A) (8.123) es llamado el cuadri-potencial,con A el potencial vectorial y Φ el potencial escalar definidos en la ecuaciones (8.116) y (8.118) respectivamente. Con esta definición del c-potencial Aµ , podemos escribir las ecuaciones de Maxwell inhomogeneas (ver ecuación (8.60)): ∂α F αβ = −4πJ β (8.124) en términos del c-potencial Aµ . Remplazando la ecuación (8.122) en la ecuación anterior y teniendo en cuenta que F αβ = η αµ ηβν Fµν y Jγ = η γβ J β , obtenemos: ∂ µ ∂µ Aγ − ∂ µ ∂γ Aµ = −4πJγ (8.125) De esta manera, esta última ecuación es equivalente a las ecuaciones de campo de Maxwell, pues dadas las fuentes de los campos J α y resolviendo la ecuación (8.125), conocemos el c-potencial Aµ y así los campos electromagnéticos. Por otra parte, de la ecuación de definición de Fγδ en términos del potencial c-vectorial, notemos que podemos cambiar Aµ , adicionandole una función cualquiera de la forma ∂µ ϕ, sin que cambia el tensor campo electromagnético Fγδ . Es decir, si realizamos la transformación Aµ õ = Aµ + ∂µ Λ (8.126) en donde Λ es una función cualquiera de las coordenadas, la ecuación (8.122) 166 CAPÍTULO 8. ELECTRODINÁMICA nos conduce a: F̃γδ = = = = ∂ Ãγ ∂ Ãδ − γ ∂x ∂xδ ∂ ∂ (Aδ + ∂δ Λ) − δ (Aγ + ∂γ Λ) γ ∂x ∂x ∂ ∂2Λ ∂2Λ ∂ A − A + − γ δ ∂xγ ∂xδ ∂xγ ∂xδ ∂xδ ∂xγ ∂ ∂ Aδ − δ Aγ = Fγδ ∂xγ ∂x (8.127) lo cual significa que la función Fγδ permanece invariante bajo la transformación (8.126) y así también los campos electromagnéticos E y B. A la transformación (8.126) se le llama una transformación “gauge”. Este tipo de transformaciones juega un papel fundamental en la teoría cuántica de campos y en las llamadas teorias de unificación de las interacciones fundamentales de la naturaleza. Para finalizar este capítulo, veamos como esta característica de la teoría electromagnética (cuando se formulan las ecuaciones de Maxwell en términos del c-potencial), de permanecer los campos físicos E y B invariantes bajo una transformación gauge, nos permite simplicar las ecuaciones que rigen el comportamiento del c-potencial Aµ . Dado que el c-potencial Aµ no está definido de manera única, entonces, podemos imponer sobre él una condición o ecuación de ligadura, llamada la elección de un gauge particular, la cual por lo establecido anteriormente, no cambia la física, es decir no cambian los campos E y B. Así, podemos escoger la función arbitraria Λ en la ecuación (8.126), de tal manera que el potencial c-vectorial Aµ cumpla con la ecuación: ∂ µ Aµ = 0 (8.128) llamado el gauge de Lorentz, de tal manera que la ecuación (8.125) se simplifica, reduciendose a la ecuación: ¤Aµ = −Jµ (8.129) que es la ecuación de ondas inhomogénea. Recordando la definición del operador ¤, ecuación (7.106), vemos que la teoría electromagnética de Maxwell, expresada por la ecuación (8.129) contiene al postulado de la constancia de la velocidad de la luz, pues dado que el operador ¤ definido por: ¤= 2 1 ∂2 −∇ 2 2 c ∂t (8.130) 8.5. TRANSFORMACIONES GAUGE 167 es un invariante bajo transformaciones de Lorentz, entonces el coeficiente 1/c2 , que representa la velocidad de propagación de los campos electromagnéticos, es una constante independiente del observador. Este último resultado ilustra con toda claridad y sin restarle meritos a la genialidad de Albert Einstein, como la teoría de la relatividad especial estaba ya presente en la física. 168 CAPÍTULO 8. ELECTRODINÁMICA Capítulo 9 Bibliografía La literatura disponible sobre relatividad es tal vez de las más amplias, tanto en el campo especializado como en el divulgativo. Se listarán a continuación algunas referencias, desde literatura de divulgación, pasando por textos elementales, obras de valor histórico, hasta textos y libros avanzados que, sin pretender ser exaustivas, si cubren globalmente la temática de la teoría especial de la relatividad. Referencias de caracter divulgativo: Bucker R. B., Geometry, Relativity and the fourth dimension. Dover Publications, Inc. N. Y. 1977 Lilley S., Discovering Relativity for yourself. Cambridge University Press 1981 Russell B., ABC de la Relatividad. Ed. Ariel Barcelona 1978 Williams L. P., La Teoría de la Relatividad. Alianza Universidad 1977 Textos elementales, a nivel universitario, sobre relatividad especial: Mook D. E. and Vargish T., La Relatividad. Espacio, Tiempo y Movimiento. McGraw Hill 1993 Resnick R., Introducción a la Teoría Especial de la Relatividad. Limusa 1981 Skinner R., Relativity for Scientist and Engineers. Dover Publishing N. Y. 1982 Smith J. H., Introducción a la Relatividad Especial. Ed. Reverté 1978 Textos universitarios de relatividad a nivel intermedio: Enrique L., Física Relativista. Buenos Aires 1955 French A. P., Special Relativity. Massachusetts Institute of Technology 1968 169 170 CAPÍTULO 9. BIBLIOGRAFÍA Rindler W., Essential Relativity. Special, General and Cosmology. Springer-Verlag 1977 Taylor E. F. and Wheeler J. A., Spacetime Physics. Freeman, San Francisco 1966 Libros y textos avanzados sobre relatividad. Algunos de ellos incluyen, también, elementos básicos de la Relatividad General: Aharoni J., The Special Theory of Relativity. Oxford University Press 1965 Bressan A., Relativistic Theories of Materials. Springer-Verlag 1978 Fock V., The Theory of Space Time and Gravitation, Pergamon Press 1959 Gill T. P., The Doppler Effect. Academic Press 1965 Kopczynski W. and Trautman A., Spacetime and Gravitation. John Wiley & Sons 1992 Matveev A. N., Mechanics and Theory of Relativity. Mir Publishers Moscow 1989 Rosser W. G. V., An Introduction to the Theory of Relativity. Butterworth, London 1964 Ugarov V. A., Special Theory of Relativity. Mir Publishers Moscow 1979 Libros avanzados de relatividad, con un fuerte énfasis en aspectos matemáticos: Hagendorn R., Relativistic Kinematics. W. A. Benjamin, Inc. 1963 Misner C. W., Thorne K. S. and Wheeler J. A., Gravitation. W. H. Freeman and Co. 1973 Naber G. L., The Geometry of Minkowski Spacetime. Springer-Verlag 1992 Woodhouse N. M. J., Special Relativity. Springer-Verlag 1992 Libros clásicos de relatividad y obras formales de carácter histórico: Born M., Einstein’s Theory of Relativity. Dover Publications, Inc. 1965 (1a ed. 1920) Einstein A., The Principle of Relativity. Dover N. Y. 1958 Poincaré H., La Mécanique Nouvelle. Conference Mémoire et note sur la Théorie de la Relativité. Editions Jacques Gabay 1989 Rocard J. M., Newton et la Relativité. Press University France 1986 Sard R. D., Relativistic Mechanics. W. A. Benjamin, Inc. 1970 Silberstein L., The Theory of Relativity. Great Britain 1914 Synge J. L., Relativity: The Special Theory. North-Holland Publishing Company 1958 Whittaker Sir E. T., History of the Theories Aether and Electricity. Harper and Row, N. Y. 1960