Relatividad General y Cosmología Física Contemporanea 1. Introducción La gravedad es una de las cuatro interacciones fundamentales. La teoría clásica (es decir, no cuántica) que trata de la gravedad es la Teoría de la Relatividad General, propuesta por Albert Einstein en 1915 y contituye el tópico del presente capítulo. Los orígenes de esta teoría se remontan a la revolución conceptual que siguió a la introducción de la Relatividad Especial por Einstein en 1905. De acuerdo con la ley de gravitación de Newton, dos masas puntuales se atraen mutuamente con una fuerza proporcional a sus masas e inversamente proporcional al cuadrado de la distancia entre ellas. Así, la fuerza sobre una de las masas en un instante de tiempo depende de la posición de la otra en el mismo instante. Cualquier variación en la posición de una de ellas se transmite instantáneamente a la otra. No obstante, dicha interacción instantánea entra en contradicción con la Relatividad Especial, de acuerdo con la cual ninguna señal puede viajar mas rápido que la luz. Por lo tanto, la teoría newtoniana de la gravedad (altamente exitosa en la descripción de una enorme cantidad de fenómenos) solo puede ser una aproximación a otra teoría mas fundamental. La relatividad general no propone una nueva ley de fuerzas ni constituye una nueva teoría para el campo gravitatorio, sino que se basa en un profundo cambio conceptual de la concepción del espacio y el tiempo. Einstein percibió que el hecho experimental de que todos los cuerpos caen con la misma aceleración en un campo gravitatorio (independientemente de su masa) puede interpretarse en términos de un espacio–tiempo curvo. En este esquema conceptual las masas curvan el espacio–tiempo a su alrededor y las trayectorias de otras masas en las inmediaciones son "líneas rectas” (curvas de longitud mínima) en ese espacio–tiempo curvo. La relatividad general es entonces una teoría geométrica. Vamos a comenzar por lo tanto con una breve introducción a la geometrías no–euclidianas. 2. Geometrias no euclidianas La idea de una geometría no euclidiana se ilustra facilmente en dos dimensiones. En la geometría euclidiana se trabaja en base a las nociones de punto, línea recta, distancia, ángulos, paralelas, circulos, etc.. Entre los teoremas mas familiares podemos mencionar que la suma de los ángulos interiores de un triángulo equivale a π o que el cociente entre el perímetro y el radio de un circulo es 2π, entre muchos otros. La superficie de una esfera nos brinda un ejemplo sencillo de una geometría diferente (no euclidiana), en la cual los resultados anteriormente mencionados de la geometría en el plano no son válidos y deben ser reemplazados por definiciones y teoremas diferentes. Por ejemplo, en la geometría esférica el concepto de línea recta se reemplaza por el de círculo máximo o gran círculo, el cual se define como la curva que se obtiene al intersecar la esfera con un plano que pasa por el centro de la misma. Así, mientras que en el plano dos rectas o bien nunca se cortan (paralelas) o se cortan en un único punto, dos rectas arbitrarias (círculos máximos) en la esfera siempre se cortan en dos puntos (diametralmente opuestos). La distancia entre dos puntos de la esfera se define como la curva de menor longitud sobre la esfera que une ambos, también llamada geodésica; se demuestra que la misma coincide siempre con un segmento de círculo máximo. Un triángulo se construye a través de la intersección de tres círculos máximos (al igual que en el plano se construye a través de la intersección de tres rectas); un círculo se define como el conjunto de puntos equidistantes de otro (con la definición de distancia dada anteriormente), etc.. El ángulo entre dos círculos máximos se puede definir como el ángulo entre dos rectas en el espacio tridimensional tangentes a dichos círculos en el punto de intersección. Notemos que un triángulo esférico puede tener tres ángulos interiores rectos, con lo cual su suma es superior a π. En general, puede demostrarse que la suma de los ángulos interiores de un triángulo esférico es igual a π + A/a2 , donde A es el área del triangulo y a el radio de la esfera. Notemos que en el caso de triángulos muy pequeños comparados con las dimensiones de la 1 esfera A/a2 ¿ 1, recuperamos el resultado de la geometría plana con buena aproximación. También puede demostrarse facilmente (queda como ejercicio para el lector) que el cociente entre el perímetro P y el radio r de un círculo arbitrario sobre la esfera es P sin(r/a) = 2π r (r/a) (1) Nuevamente, si r ¿ a recuperamos el resultado de la geometría plana. Puede dar la impresión de que para determinar la geometría de un objeto bidimensional uno debe trabajar en el espacio tridimensional en el cual el objeto se encuentra embebido. No obstante, es posible determinar la geometría de manera puramente local (es decir, sin salir al espacio tridimensional). Una persona sobre la superficie de una esfera (la tierra) puede medir cosas como ángulos interiores de triángulos, perímetros y radios de círculos, etc.. Ajustando entonces las fórmulas anteriores puede determinar si la geometría de ese espacio es efectivamente esférica y estimar en ese caso el radio de la esfera, sin necesidad de una dimensión extra. En el caso de geometrías curvas tridimensionales, la visualización no es tan simple como en el caso bidimensional, en el cual a menudo una geometría curva puede representarse como una superficie en un espacio euclideo tridimensional. No obstante, en algunos casos simples podemos extender esta idea y pensar ciertas geometrías curvas tridimensionales como hipersuperficies embebidas en un hipotético espacio euclideo de cuatro dimensiones. Por ejemplo, el análogo de la esfera bidimensional en tres dimensiones es la hipersuperficie (volumen) de una esfera en cuatro dimensiones, al cual llamaremos una triesfera. Si nuestro espacio físico tuviera la geometría de una triesfera, un viaje en línea recta tarde o temprano nos llevaría de vuelta al punto de partida. No obstante, al igual que en el caso bidimensional, podemos obtener una información mucho mas detallada acerca de la geometría del espacio mediante cálculos puramente locales (sin necesidad de emprender un viaje tan incierto). Por ejemplo, puede demostrarse que el volumen encerrado por una esfera bidimensional (la esfera normal) de radio r en tal geometría espacial esta dado por ( ) · ³ ´ ³ r ´2 ¸1/2 1 r −1 r 3 V = 4πa sin − 1− 2 a 2a a donde a es el radio de la triesfera. Es facil ver que para r ¿ a se recupera el resultado familiar V ≈ 4π r3 /3. Así, mediante mediciones de radios y volúmenes de esferas bidimensionales es posible determinar si la geometría del espacio es la de una triesfera. Para cada número de dimensiones existe una cantidad infinita de posibles geometrías. Así, por ejemplo, en dos dimensiones además del plano y la esfera existe la geometría de un huevo o de cualquier otra superficie suave. Como podemos describir y comparar matemáticamente estas diferentes geometrías? Lo que hemos hecho hasta ahora con la esfera y la triesfera es describir estos espacios considerandolos embebidos en un espacio euclidiano de dimensión mayor. Este método que funciona bien en dos dimensiones, se complica bastante para geometrías tridimensionales mas complicadas que la triesfera y en el caso de cuatro dimensiones resulta completamente inviable. Otra posibilidad para especificar una geometría es dar un conjunto pequeño de postulados o axiomas y deducir mediante teoremas las diferentes propiedades del objeto. Para la geometría del plano, por ejemplo, tenemos los cinco postulados de Euclides: por dos puntos pasa una única recta, las paralelas nunca se intersectan, etc.. La superficie de la esfera puede ser descripta por el mismo conjunto de axiomas, excepto el de las paralelas; este último se reemplaza por el postulado de que dos rectas cualesquiera siempre se intersectan en dos puntos. Sin embargo este método también es bastante limitado. Que postulados describen la superficie de una papa? La descripción local mas general de una geometría hace uso del cálculo diferencial e integral, mediante la especificación de la distancia entre cada par de puntos cercanos. A partir de la distancia entre puntos cercanos, la distancia a lo largo de curvas puede ser obtenida por integración. De esta manera, las ”líneas rectas´´ se definen como las curvas de menor distancia entre dos puntos. Los ángulos se definen como el cociente entre la longitud de un arco de curva y sus radios, cuando estos radios son pequeños, etc.. Esta área de la matemática se conoce como geometría diferencial. Vamos a introducir algunas de sus ideas básicas. 2 Figura 1: Distancia entre puntos cercanos en coordenadas cartesianas y polares. 2.1. Geometría euclidiana del plano Un pre–requisito para establecer la distancia entre puntos cercanos es disponer de un sistema de coordenadas, el cual por supuesto no es único. Por ejemplo, en dos dimensiones podemos usar coordenadas cartesianas o coordenadas polares respecto de un cierto origen, asi como muchos otros sistemas de coordenadas (ver Fig.1). Así, puntos cercanos tendrán valores parecidos de sus coordenadas. Por ejemplo, los puntos (x, y) y (x + dx, y + dy) serán cercanos si dx y dy son infinitesimales. En coordenadas cartesianas la distancia dS entre los puntos (x, y) y (x + dx, y + dy) viene dada por (ver Fig.1) p dS = (dx)2 + (dy)2 (2) En coordenadas polares la distancia entre los puntos (r, φ) y (r + dr, φ + dφ) viene dada pòr (ver Fig.1) p dS = (dr)2 + (r dφ)2 (3) Expresiones como (2) y (3) son válidas para calcular longitudes solamente si las cantidades dx y dy, ó dr y dφ son pequeñas. No obstante, distancias largas pueden ser obtenidas por integración a partir de estas relaciones infinitesimales. Por ejemplo, podemos calcular el perímetro de un círculo y analizar su relación con el radio R. Eligiendo el origen como el centro, la ecuación del círculo en coordenadas cartesianas es x2 + y 2 = R2 (4) El perímetro es la integral de dS a lo largo del círculo. Tenemos entonces I P = dS = Z I p (dx)2 + (dy)2 " R µ dx 1 + = 2 −R Z r R dx = 2 −R dy dx (5) ¶2 #1/2 (6) x2 +y 2 =R2 R2 = 2πR, R2 − x2 (7) que es la respuesta correcta. Derivar la relación entre el perímetro y el radio es mucho mas facil en coordenadas polares, donde la ecuación del círculo es simplemente r = R. Así, a partir de (3) tenemos I P = Z 2π dS = R dφ = 2πR (8) 0 El resultado por supuesto es el mismo y la elección de uno u otro sistema de coordenadas es simplemente una conveniencia de cálculo. 3 Procediendo de esta manera podríamos derivar todos los teoremas de la geometría Euclidiana en el plano. Por ejemplo, podemos obtener ángulos a partir del cálculo de distancias. El ángulo entre dos rectas que se intersectan puede definirse centrando un círculo de radio R en la intersección de las rectas; el ángulo (en radianes) se define entonces como ∆C (9) R donde ∆C es la longitud del arco entre las intersecciones del círculo con las rectas. A partir de esta definicíón es posible demostrar que la suma de los ángulos interiores de un triángulo es igual a π. De hecho, es posible verificar todos los axiomas de la geometría Euclidiana en el plano a partir de (2) ó (3). Toda la geometría puede reducirse a relaciones entre distancias; todas las distancias pueden reducirse a integrales de distancias entre puntos cercanos; toda la geometría Euclidiana en el plano esta contenida en (2) ó (3). Resumiendo: una geometría puede especificarse mediante lo que llamaremos un elemento de línea, tal como (2) ó (3), el cual nos da la distancia entre puntos cercanos en términos de diferencias entre coordenadas en algún sistema. Convencionalmente, el elemento de línea se expresa como una relación cuadrática para dS 2 , como por ejemplo θ= dS 2 = dx2 + dy 2 2.2. Geometría no-euclidiana de la esfera Un ejemplo relativamente simple de geometría no euclidiana es la superficie de una esfera bidimensional de radio a. Para describir los puntos sobre la esfera podemos utilizar los ángulos (θ, φ) de las coordenadas polares tridimensionales. Se puede deducir (queda como ejercicio para el lector) que la distancia entre dos puntos cercanos (θ, φ) y (θ + dθ, φ + dφ) sobre la esfera viene dada por dS 2 = a2 (dθ2 + sin2 θ dφ2 ) (10) Este es el elemento de línea de la superficie de la esfera, a través del cual pueden obtenerse todas las propiedades de la geometría esférica. Veamos por ejemplo la razón entre perímetro y radio de un círculo. Por círculo entendemos en este caso el conjunto de puntos sobre la superficie de la esfera, que se encuentran a distancia constante (radio) de un punto (centro), donde la distancia se mide a lo largo de un segmento de círculo máximo. Dado que todos los puntos sobre la esfera son equivalentes, podemos orientar las coordenadas polares de manera que el eje polar pase por el centro del círculo. Un cìrculo queda entonces definido como una curva a θ constante. Consideremos el círculo definido por la ecuación θ=Θ (11) El perímetro P de este círculo es la longitud de dicha curva, a lo largo de la cual tenemos dθ = 0. De la Ec.(10) tenemos I P = Z 2π dS = a sin Θdφ = 2πa sin Θ (12) 0 El radio r del círculo es la distancia de cualquier punto sobre la curva al polo norte, medida a lo largo de un meridiano lo cual implica φ =constante, es decir dφ = 0 y dS = a dθ. Así, Z r= Θ a dθ = a Θ 0 y por lo tanto P = 2πa sin de donde recuperamos la expresión (1). 4 ³r´ a , (13) 2.2.1. Proyecciones de la esfera La geometría esférica describe con muy buena aproximación la superficie terrestre. Para trazar un mapa de la superficie terrestre (planisferio terrestre o mapamundi), tenemos que proyectar la superficie de la esfera en un plano. Esta proyección no es única y las diferentes opciones constituyen un ejemplo de una misma geometría expresada en diferentes sistemas de coordenadas. En coordenadas polares la geometría esta dada por el elemento de línea (10) siendo a el radio de la tierra. Usualmente al ángulo φ se lo denomina longitud. La latitud es λ = π/2 − θ. En términos de latitud y longitud el elemento de línea es dS 2 = a2 (dλ2 + cos2 λ dφ2 ) (14) Para construir un mapa debemos introducir nuevas coordenadas x e y sobre la esfera, definidas a través de relaciones del tipo x = x(λ, φ) y = y(λ, φ) y utilizar estas variables como coordenadas cartesianas en el plano para trazar los contornos de continentes, ubicación de ciudades, etc.. Es claro que existe un número infinito de proyecciones. El ejemplo mas simple es una proyección lineal: Lx φ Ly λ y= (15) 2π π donde (Lx , Ly ) son las dimensiones del mapa. Esta transformación simplemente expresa latitud y longitud en un gráfico cartesiano, reescalado las variables al tamaño del mapa. El resultado, que se conoce como proyección equirectangular, se muestra en la Fig.2a. Es claro que esta proyección deforma las distancias reales, especialmente en la región de los polos. De hecho, toda proyección de la esfera en el plano deforma en alguna medida las distancias. Existen otras proyecciones mas útiles que preservan algunas propiedades de la geometría de la esfera en el plano. Por supuesto, no todas las propiedades se pueden preservar, ya que la geometría de la esfera es diferente de la del plano. Una clase muy amplia y utilizada de proyecciones mantienen la linealidad en la longitud y proyectan no-linealmente la latitud: x= Lφ y = y(λ) 2π Para proyecciones de este tipo, el elemento de línea en la esfera toma la forma "µ # ¶2 µ ¶2 2π dλ 2 2 2 2 dS = a cos λ(y) dx + dy L dy x= (16) (17) Un ejemplo simple de este tipo de proyección (y de hecho uno de los mas familiares) es la llamada proyección Mercator, inventada por G. Kremer en 1569 y la cual se muestra en la Fig.2b. Esta proyección tiene la particularidad de que preserva el ángulo entre dos direcciones a partir de cualquier punto. La misma fue inventada para facilitar la navegación marítima. Si un marinero desea navegar desde Buenos Aires a Johannesburg, traza una línea recta en el mapa uniendo las dos ciudades. Midiendo el ángulo en el mapa de esta línea respecto del eje y, sabe cual debe ser el ángulo a mantener por la dirección de navegación respecto del norte geográfico. Como podemos elegir la transformación y = y(λ) para preservar los ángulos? Recordemos que los ángulos, en cualquier geometría, pueden definirse como cocientes entre longitudes, es decir, entre un arco de círculo y su radio para radios suficientemente pequeños (esto es, en el límite del radio tendiendo a cero). El ángulo entre dos direcciones en la esfera será por lo tanto igual al ángulo entre las direcciones correspondientes en el 2 plano si el elemento de línea en la esfera es proporcional al elemento de línea en el plano dSplano = dx2 + dy 2 . Así, podemos buscar y = y(λ) tal que la Ec.(17) pueda ser expresada como 5 Figura 2: Proyecciones de la superficie terrestre en el plano (mapamundi). a) Proyección equirectangular. b) Proyección Mercator. 6 Figura 3: Comparación entre las proyecciones cartográficas de Mercator (que preserva ángulos) y Gall-Peters (que preserva áreas). dS 2 = Ω2 (x, y) (dx2 + dy 2 ) (18) Comparando con la Ec.(17) obtenemos la ecuación diferencial 2π dλ = cos λ. dy L (19) Eligiendo y = 0 para λ = 0 obtenemos la solución y(λ) = L 2π Z 0 λ0 · µ ¶¸ dλ0 L π λ = log tan + cos λ0 2π 4 2 (20) Las Ecs.(16) y (20) definen la proyección Mercator. El ecuador es mapeado en la línea y = 0 y los polos λ = ±π/2 se mapean en y = ±∞ respectivamente. El factor de escala de la Ec.(18) resulta entonces (luego de un poco de tratamiento algebraico) 2πa 4πa e2πy/L cos λ(y) = (21) L L 1 + e4πy/L Todas las propiedades importantes de la proyección Mercator pueden deducirse de este factor de escala. Por ejemplo, la distancia real entre dos puntos en el mapa a una distancia ∆x en un mismo paralelo (latitud constante y) viene dada por Ω(y) = ∆S = Ω(y) ∆x El factor de escala tiende a cero cuando nos aproximamos de los polos y → ±∞. Así, distancias horizontales iguales en el mapa, entre puntos ubicados a diferentes latitudes, corresponden a distancias reales cada vez menores cuanto mas cerca estemos de los polos. De la misma manera, un elemento de area dxdy en el mapa corresponde a un elemento de area en la esfera dA = Ω2 (y)dxdy. Así, las áreas en el mapa resultan magnificadas respecto del area real en las cercanías de los polos. Esto puede apreciarse en la comparación 7 entre la proyección Mercator y la proyección Gall-Peters (esta última preserva las areas) que se muestra en la Fig.3. El ejemplo mas notable es Groenlandia, que en la proyección Mercator aparenta tener un area equivalente a Sudamerica, siendo que en la realidad es mucho menor. 2.3. Coordenadas e invariancia Resumiendo los resultados de las secciones anteriores, una geometría arbitraria puede definirse a través de un elemento de línea, que nos da la distancia entre puntos infinitesimalmente cercanos. Sin perdida de generalidad, supongamos trabajemos en tres dimensiones. Para un sistema de coordenadas arbitrario (x1 , x2 , x3 ), el elemento de línea puede describirse a través de la forma cuadrática definida positiva dS 2 = 3 X 3 X gij dxi dxj (22) i=1 j=1 donde los coeficientes gij = gji son funciones de las coordenadas y son las componentes del llamado tensor métrico, o simplemente métrica. En coordenadas cartesianas gij = δij (donde δij es una delta de Kroenecker). Si no existe una transformación de coordenadas que nos lleve la métrica a esta forma, entonces la geometría es no euclidiana. Un buen sistema de coordenadas nos provee de una identificación única de cada punto en el espacio. No obstante, la mayoría de los sistemas de coordenadas fallan al respecto en alguna parte del espacio. Por ejemplo, en coordenadas polares (r, θ, φ), los puntos sobre el eje polar (θ = 0) son etiquetados por un conjuntos infinito de valores de coordenadas (para cada valor de r el valor de φ es arbitrario). Este es un ejemplo de singularidad coordenada. Un ejemplo mas dramático es el siguiente. Tomemos el elemento de línea en el plano en coordenadas polares dS 2 = dr2 + r2 dφ2 y efectuemos la transformación r = a/r0 , para algún valor constante a. El resultado es a4 (dr02 + r02 dφ2 ) r04 Este elemento de línea explota en r0 = 0. No obstante, físicamente no ocurre nada interesante allí; la geometría continúa siendo la del plano euclideo! La singularidad ocurre simplemente porque la transformación mapea todos los puntos en r = ∞ a r0 = 0 y por lo tanto falla en dar una identificación única de todos los puntos en el plano. Vamos a ver otros ejemplos mas delante. Un punto importante a enfatizar es que la distancia entre dos puntos es independiente de la elección del sistema de coordenadas. Cuando calculamos el perímetro de un círculo en coordenadas cartesianas y polares obtuvimos el mismo resultado. Es evidente que esto debe ser así. Si nos dan un disco físico, podemos verificar mediante una cinta métrica que el contorno es un círculo, si medimos que diferentes puntos del mismo equidistan de un centro. Midiendo además el perímetro del contorno podemos verificar su relación con el radio del mismo. Estas relaciones no tienen nada que ver con ningun sistema de coordenadas. Un sistema de coordenadas es nada mas que un modo conveniente de etiquetar los puntos en una geometría. Existe un número infinito de sistemas de coordenadas para una misma geometría, todos equivalentes entre sí. La distancia entre dos puntos dS, es una cantidad invariante ante transformaciones de coordenadas. dS 2 = 3. Teoría de la Relatividad Especial La Teoría de la Relatividad Especial nos brinda un ejemplo de geometría no euclidiana. Repasemos brevemente los postulados y consecuencias principales de la teoría. El postulado fundamental de la relatividad especial es que todas las leyes de la física adoptan la misma forma en cualquier sistema de referencia inercial (es decir, sistemas que se mueven con velocidad constante 8 unos respecto de otros1 ). Esto incluye no solo las leyes de la mecánica (principio que ya se encontraba en la mecánica newtoniana), sinó también las del electromagnetismo. Lo último implica que la velocidad de la luz debe ser la misma en cualquier referencial inercial (hecho empírico soportado por el famoso experimento de Michelson-Morley). La constancia de la velocidad de la luz en diferentes referenciales inerciales tienen enormes implicancias, siendo la primera y tal vez mas importante la relatividad de la simutaneidad. Esto es, eventos simultáneos en un referencial inercial no lo son en otro. La idea de tiempo absoluto, independiente del sistema inercial de la mecánica newtoniana, debe ser por lo tanto abandonada. Así, la noción de tiempo depende del referencial, el cual se encuentra caracterizado no solo por sus coordenadas espaciales x, y, z, sinó tambien por una cuarta coordenada t (el tiempo en ese referencial) y un referencial diferente esta caracterizado por un conjunto diferente de coordenadas (x0 , y 0 , z 0 , t0 ). El tiempo absoluto, independiente del espacio tridimensional pierde sentido y es necesario estudiar los eventos físicos en una unificación cuadri-dimensional de espacio y tiempo, denominado espacio-tiempo. La separación del espacio-tiempo en nociones separadas de espacio y tiempo ocurre de manera diferente en cada sistema inercial. Las transformaciones de coordenadas entre diferentes sistemas inerciales que preservan la velocidad de la luz se denominan Lorentz boost y en conjunto con las traslaciones y rotaciones rígidas de coordenadas constituyen las llamadas transformaciones de Lorentz. Para un sistema de coordenadas (x0 , y 0 , z 0 , t0 ) en un referencial que se mueve con velocidad v en la dirección x respecto de un referencial con coordenadas (x, y, z, t) estas transformaciones adoptan la forma t0 x0 = = γ(t − vx/c2 ) γ(x − vt) (23) (24) y0 z0 = = y z (25) (26) donde 1 γ=p 1 − v 2 /c2 . (27) La transformación inversa se obtiene simplemente cambiando v → −v en las expresiones anteriores. A partir ~ = d~x/dt es la velocidad de estas expresiones la ley de transformación para ls velocidades es inmediata. Si V 0 de una partícula en el referencial en reposo, su velocidad V~ 0 = dx~0 /dt en el referencial que se mueve con velocidad v en la dirección x es Vx−v 1 − vV x /c2 (28) V 0y = 1 Vy γ 1 − vV x /c2 (29) V 0z = 1 Vz γ 1 − vV x /c2 (30) V 0x = De aqui resulta inmediato verificar que, si un objeto se mueve con con velocidad c en un referencial, su velocidad en cualquier otro referencial es siempre c. 3.0.1. Espacio-tiempo Un punto en el espacio-tiempo define un evento, esto es, algo que ocurre en un lugar particular en un tiempo particular. La curva en el espacio-tiempo asociada a la trayectoria de una partícula se denomina línea de mundo. 1 Por supuesto, esto incluye también sistemas estacionarios que se encuentran orientados de manera diferente. 9 Los postulados de la relatividad requieren que las leyes de la física sean expresables en términos de cantidades que sean independientes del sistema de referencia. Una cantidad fundamental en este sentido es la distancia entre dos eventos. El elemento de línea ds2 = −(cdt)2 + dx2 + dy 2 + dz 2 (31) constituye una cantidad invariante ante transformaciones de Lorentz. Esto es, de las Ecs.(23)-(26) es facil ver que −(cdt0 )2 + dx02 + dy 02 + dz 02 = −(cdt)2 + dx2 + dy 2 + dz 2 La Relatividad Especial nos define de esta manera, a través del elemento de línea (31), una geometría del espacio-tiempo cuadri-dimensional. Esta geometría es no euclidiana (debido al signo menos). Sin embargo, este espacio es también plano, en un sentido que quedrá claro mas adelante2 . Dos eventos pueden estar separados por una distancia cuyo cuadrado es positivo, negativo o nulo. Si la distancia entre dos eventos es ds2 > 0 se dice que tienen una separación tipo espacial; este es el caso, por ejemplo, de dos eventos para los cuales dt = 0, en cuyo caso ds se reduce a la distancia euclidea tridimensional. Si la distancia entre dos eventos es ds2 < 0 se dice que tienen una separación tipo temporal; este es el caso, por ejemplo, de dos eventos que ocurren en el mismo lugar dx = dy = dz = 0. Si ds2 = 0 se dice que los eventos tienen una separación nula, por ejemplo si dy = dz = 0 y dx = cdt. Puntos con separación nula pueden estar conectados por rayos de luz que viajan a la velocidad c. El conjunto de puntos con separación nula de un punto P definen su cono de luz. Partículas con masa en reposo no nula se mueven por líneas de mundo tipo temporal, las cuales se encuentran siempre dentro del cono de luz en cualquier punto de la trayectoria, ya que su velocidad debe ser inferior a la de la luz. De esta manera, los conos de luz definen relaciones causales entre puntos en el espacio-tiempo. Un evento en un punto P solo puede influenciar o ser influenciado por puntos que yacen dentro o sobre su cono de luz. Supongamos un sistema de referencia solidario con una partícula a lo largo de su línea de mundo. Para medir la distancia entre eventos en este referencial es conveniente introducir dτ 2 = −ds2 /c2 (32) que es real y tiene dimensiones de tiempo. Un reloj fijo a este sistema de referencia mide el tiempo τ , el cual por lo tanto se denomina tiempo propio. El tiempo propio entre dos puntos A y B en una línea de mundo tipo temporal resulta Z τAB Z B = B dτ = A Z tB = tA ( £ 2 ¤1/2 dt − (dx2 + dy 2 + dz 2 )/c2 A 1 dt 1 − 2 c "µ dx dt ¶2 µ + dy dt ¶2 µ + dz dt ¶2 #)1/2 (33) o de manera mas compacta Z tB τAB = p dt 1 − V 2 (t)/c2 (34) tA El tiempo propio τAB es siempre mas corto que el intervalo tB − tA . Esto es lo que se conoce como el fenómeno de dilatación temporal y tiene como su expresión mas famosa la llamada "paradoja de los gemelos”. Dos gemelos, Andrea y Bernardo se encuentran en reposo en un referencial al tiempo t1 en una posición xP . Andrea parte en una nave en la dirección x, acelerándose y frenándose hasta un cierto punto a partir del cual retorna a la posición inical xP , deteniéndose al tiempo t2 (ver figura 4). Bernardo permanece en xP 2 En particular, una partícula libre en este espacio sigue una trayectoria recta, al igual que en la geometría euclideana de la física newtoniana 10 Figura 4: Paradoja de los gemelos. Andrea y Bernardo siguen dos líneas de mundo diferentes entre dos puntos en el espacio-tiempo. Las longitudes de dichas trayectorias son diferentees y consecuentemente el tiempo propio registrado por sus relojes son diferentes. durante todo el intervalo t2 − t1 . El tiempo transcurrido para Andrea es menor que t2 − t1 por la Ec.(34). La gemela que se movió envejeció menos que el que se quedó quieto3 . La paradoja de los gemelos ilustra una propiedad importante del espacio-tiempo plano. Cualquier trayectoria seguida por Andrea tendrá una distancia (tiempo propio) menor que la línea recta seguida por Bernardo4 . La línea recta es la curva de distancia máxima entre todas las líneas de mundo tipo temporal que conectan dos puntos. Al trabajar en el espacio-tiempo resulta conveniente utilizar cuadrivectores, tal como el vector desplazamiento entre dos puntos ∆x = (∆t, ∆x, ∆y, ∆z). Dado un sistema de coordenadas (t, x, y, z) en un referencial inercial y un cuadrivector a, lo denotaremos en general por aα (el conjunto de componentes aα ) y a sus componentes indistintamente como aα = (at , ax , ay , az ) = (a0 , a1 , a2 , a3 ) = (at , ~a), reservando la notación de flechas para vectores en el espacio euclideo tridimensional. Dados dos refenciales inerciales que se mueven con velocidad constante v uno respecto de otro, las componentes de un cuadrivector en ambos sistemas de coordenadas se relacionan a través de las transformaciones de Lorentz (23)-(26). El producto escalar entre dos cuadrivectores viene dado por a.b = ηαβ aα bβ (35) donde la matriz (o tensor) ηαβ −c2 0 = 0 0 0 1 0 0 0 0 0 0 1 0 0 1 (36) se conoce como métrica del espacio-tiempo plano ó métrica de Minkowski. El producto escalar (35) es invariante ante las tranformaciones de Lorentz. 3 La supuesa paradoja proviene de la aparente simetría entre las situaciones de ambos gemelos. Desde su punto de vista, Andrea permanece en reposo, viendo a Bernardo alejarse y volver a su posición. Sin embargo las situaciones no son simétricas. Ambos gemelos se mueven por líneas de mundo diferentes que conectan los mismos puntos inicial y final, y por lo tanto sus tiempos propios son diferentes. Uno permanece en un referencial inercial y el otro se acelera. 4 Las líneas en diagrama (x, ct) parecen tener longitud mayor que las de la línea recta, pero esto es porque estamos representando el espacio-tiempo (que es no euclidiano) en un espacio euclideo. La situación es análoga a la de las distancias en un mapamundi. 11 3.0.2. Dinámica relativista Una línea de mundo puede describirse dando las tres coordenadas espaciales en función del tiempo t en un dado referencial inercial. No obstante, resulta mas conveniente describir la trayectoria de manera paramétrica en el espacio-tiempo. Esto es, dando las cuatro coordenadas de la partícula xα en función de un parámetro σ a lo largo de la trayectoria. Una parametrización natural es utilizar la propia longitud de la curva, esto es, el tiempo propio τ . Así, la línea de mundo se describe a través de las ecuaciones xα = xα (τ ) La cuadrivelocidad es el cuadrivector u cuyas componentes son las derivadas de la posición a lo largo de la línea de mundo respecto del tiempo propio dxα (37) dτ El cuadrivector u es tangente a la línea de mundo, ya que el desplazamiento a lo largo de la curva viene dado por ∆xα = uα ∆τ . ~ = d~x/dt en un referencial Las componentes de u pueden expresarse en términos de la trivelocidad V inercial particular usando la versión diferencial de la Ec.(34) p dτ = dt 1 − V 2 (t)/c2 . (38) uα = Por ejemplo, ut = dt 1 =p dτ 1 − V 2 /c2 (39) Abusando de la abreviatura γ = (1 − V 2 /c2 )−1/2 (no confundir con el γ de las transformaciones de Lorentz!) tenemos ~ ). uα = (γ, γ V (40) Una consecuencia inmediata de este resultado es la normalización de la cuadrivelocidad u.u = −c2 (41) La primera ley de Newton se asume válida también en la Relatividad Especial: en ausencia de de fuerzas, un cuerpo permanece en reposo o se mueve en una trayectoria recta con velocidad constante. Esto se resume en la expresión du =0 dτ (42) ~ es constante en cualquier referencial. la cual de la Ec.(40) implica que V El cuadrimomento se define como p = mu (43) donde m es la masa en reposo de la partícula. De la Éc.(41) el cuadrimomento satisface la normalización p.p = −m2 c2 (44) dp =0 dτ (45) y la ecuación de movimiento (42) 12 La expresión anterior nos dice que las componentes p son cantidades conservadas para una partícula ~ en un referencial libre. Por otra parte, de la Ec.(40) las componentes de p se relacionan con la velocidad V inercial a través de m pt = p 1 − V 2 /c2 ~ mV p~ = p , 1 − V 2 /c2 ; en el límite newtoniano V /c ¿ 1 tenemos 1 pt = m + mV 2 /c2 + · · · , 2 ~ + ··· . p~ = mV Así, a bajas velocidades p~ se reduce al momento usual, mientras que pt c2 resulta la energía cinética mas una constante. La energía relativista se asume entonces que es E = pt c2 y a p se lo denomina el cuadrivector energía-momento ~) pα = (E/c2 , p~) = (mγ, mγ V (46) De la normalización (44) resulta la expresión para la energía relativista p E = m2 c4 + c2 p2 (47) Para p = 0 se obtiene la probablemente mas famosa fórmula de la física E = mc2 . 3.0.3. Principio variacional para el movimiento de una partícula libre Hemos visto que el tiempo propio entre dos puntos del espacio-tiempo es máximo en una trayectoria de velocidad constante. Esto nos permite obtener la ecuación de movimiento para partículas libres en términos variacionales, principio que generalizaremos luego a la relatividad general. El principio variacional puede formularse como sigue: la línea de mundo para una partícula libre entre dos puntos con separación tipo temporal corresponde a un extremo del tiempo propio entre ellos. Esto es análogo al principio de máxima acción en la formulación Lagrangiana de la mecánica clásica, usando como integral de acción el tiempo propio. Supongamos que parametrizamos la línea de mundo con un parámetro σ que toma los valores 0 y 1 en los puntos inicial y final de la trayectoria. El tiempo propio resulta entonces Z τ= (µ 1 dσ 0 dt dσ ¶2 1 − 2 c "µ dx dσ ¶2 µ + dy dσ ¶2 µ + dz dσ ¶2 #)1/2 (48) que corresponde a un Lagrangiano (µ L= dt dσ ¶2 1 − 2 c "µ dx dσ ¶2 µ + dy dσ ¶2 µ + dz dσ ¶2 #)1/2 = · ¸1/2 1 dxα dxα −ηαβ c dσ dσ La condición de extremo se obtiene aplicando las ecuaciones de Euler-Lagrange µ ¶ d ∂L ∂L − + =0 dσ ∂(dxα /dσ) ∂xα Escribamos por ejemplo la ecuación para x1 ≡ x: · ¸ d 1 dx1 =0 dσ L dσ Dado que L = dτ /dσ, resulta inmediato que 13 (49) (50) du1 =0 dτ y lo mismo para las restantes coordenadas. 4. Teoría geométrica de la gravedad 4.1. Teoría de la gravedad de Newton La teoría newtoniana de la gravedad se basa en el concepto de fuerza entre masas puntuales. La misma especifica la fuerza F~ gravitatoria que una masa puntual A de masa M ejerce sobre otra masa puntual B de masa m situada a una distancia ~r de la primera. Esta fuerza es atractiva, dirigida a lo largo de la dirección que une las masas e inversamente proporcional a r2 : GmM F~grav = − ~er (51) r2 donde ~er es un vector unitario que apunta en la dirección que une las masas y G = 6,67 × 10−11 N m2 /Kg 2 es la constante de gravitación universal. Esta fuerza sobre la masa B puede ser escrita como F~grav = −m∇Φ(~xB ) (52) donde ~xB es la posición de la masa B y Φ(~x) es el potencial gravitacional producido por A: Φ(~x) = − GM GM =− . r |~x − ~xA | Si B es atraida por un conjunto de masa puntuales Mj , j = 1, 2, . . . en diferentes posiciones ~xj el potencial viene dado por X GMj Φ(~x) = − ; |~x − ~xj | j para una distribución continua de masa con densidad µ(~x) tenemos Z Gµ(~x0 ) Φ(~x) = − d3 x0 ; |~x − ~x0 | La forma diferencial para la ecuación anterior es la ecuación de Poisson para el potencial gravitatorio ∇2 Φ(~x) = 4πGµ(~x) (53) Si insertamos ahora la Ec.(52) en la ecuación de movimiento de Newton F~ = m~a obtenemos: m~a = m∇Φ (54) o bien ~a = ∇Φ. La expresión anterior es la ley de caída de los cuerpos de Galileo, es decir, que todos los cuerpos caen con la misma aceleración en un campo gravitatorio, independientemente de su masa o composición. La clave de este comportamiento universal radica en el doble rol jugado por la masa en la Ec.(54). La masa que aparece en el lado izquierdo de la ecuación gobierna las propiedades inerciales de la partícula, es decir, como responde ante una fuerza externa de cualquier naturaleza (gravitatoria, electromagnética, elástica, etc.). Vamos a llamarla masa inercial mI , es decir, vamos a reescribir F~ = mI ~a 14 La masa que aparece en el lado derecho de la Ec.(54) mide la intensidad de la fuerza gravitacional entre los cuerpos. Vamos a denominarla masa gravitacional mG . Esta masa es la que aparece en la ley de gravitación de Newton GmG MG F~grav = − ~er r2 (55) F~ = −mG ∇Φ(~x) (56) o bien Experimentalmente se encuentra que todos los cuerpos caen con la misma aceleración en un campo gravitacional. Esto implica que el cociente mG /mI es el mismo para todos los cuerpos, es decir, una constante universal. Convencionalmente se eligen las unidades de manera que dicha constante sea igual a uno. Así, tenemos que mI = mG (57) Esta igualdad entre masa inercial y gravitatoria es altamente no trivial y uno de los principios de la física mejor verificados experimentalmente (con un error relativo inferior a 10−13 ). Tenemos dos cantidades que a priori no tienen porque estar relacionadas y desde la teoría newtoniana esta igualdad no tiene explicación. Sin embargo, es en este hecho experimental en que yace la clave para una teoría geométrica de la gravedad: si todos los cuerpos que parten de una misma condición inicial, independientemente de su composición se mueven a lo largo de la misma trayectoria, es razonable suponer que dicha curva es una propiedad del espacio-tiempo, independiente del cuerpo que la transita. 4.2. El Principio de Equivalencia La idea anterior se refuerza con la siguiente observación (debida por supuesto a A. Einstein): un observador en caída libre5 no siente su propio peso. En términos un poco mas precisos, en un sistema de referencia no inercial en caída libre, en una vecindad suficientemente pequeña del espacio-tiempo, el campo gravitatorio desaparece y las leyes de la física obedecen la relatividad especial. Pensemos en los astronautas en una estación espacial que orbita la tierra o en paracaidistas antes de abrir el paracaidas. Si cualquiera de estos observadores (en un entorno local suficientmente pequeño) suelta un objeto, verá que el mismo permanece en reposo o mantiene un movimiento uniforme. De un estudio del movimiento de diferentes objetos en un período relativamente corto de tiempo, los observadores no serán capaces de distinguir si se encuentran en caída libre en el campo gravitacional terrestre o en reposo (movimiento uniforme) en el espacio vacío, alejados de cualquier fuente gravitacional. La igualdad entre masa inercial y gravitatoria es fundamental para alcanzar esta conclusión. Si una bola de acero y una pluma cayeran con diferentes aceleraciones en el campo gravitatorio terrestre, no podrían permanecer en movimiento uniforme uno respecto del otro dentro de la estación espacial. La detección de cualquier diferencia en las aceleraciones, por pequeña que sea, sería suficiente para distinguir la presencia de un campo gravitacional. La igualdad entre masas inercial y gravitatoria no solo implica que el campo gravitacional puede ser eliminado en un referencial en caída libre; el campo gravitacional también puede ser creado mediante aceleración. Consideremos observadores en un laboratorio aislado del exterior sobre la superficie de un planeta con gravedad g (Fig.5). Supongamos que el laboratorio es suficientemente pequeño como para que el campo gravitacional pueda ser considerado uniforme dentro de la resolución experimental de los observadores. Los observadores pueden llevar a cabo distintos tipos de experimentos, arrojando objetos de diferentes masas y verificarán que todos los cuerpos caen con la misma aceleración g, debido a la equivalencia entre masas inercial y gravitatoria. Consideremos ahora el mismo laboratorio en el espacio vacío, lejos de cualquier fuente gravitacional, pero acelerado hacia arriba con aceleración a = g (Fig.5). Si los observadores llevan a cabo ahora los mismos experimentos de antes, obtendrán exactamente los mismos resultados: todos los cuerpos 5 Llamamos caída libre al movimiento de un cuerpo bajo acción exclusiva del campo gravitatorio, es decir, despreciando todo otro tipo de fuerzas, tales como el rozamiento con el aire o cualquier otro fluido. 15 Figura 5: . Observadores en un referencial local acelerado con aceleración a = g hacia arriba (a) y en un referencial en reposo bajo la acción de un campo gravitatorio uniforme g son incapaces de distinguir entre ambas situaciones mediante experimetnos mecánicos. caen "hacia abajo” con la misma aceleración g. Es decir, mediante estos experimentos mecánicos, es imposible discernir si el laboratorio se encuentra en presencia de un campo gravitacional o esta uniformemente acelerado. Ambas situaciones son enteramente equivalentes, en lo que respecta a este tipo de experimentos. Que ocurre con otro tipo de experimentos, por ejemplo, con campos electromagnéticos? La propuesta de Einstein se resume en lo que se conoce como Principio de Equivalencia: no existe ningún tipo de experimento capaz de distinguir entre aceleración uniforme y un campo gravitatorio uniforme. Las implicancias de este principio son enormes. Por ejemplo, si el mismo se cumple para los fenómenos electromagnéticos, nos lleva a concluir que la luz cae en un campo gravitatorio con la misma aceleración que los cuerpos materiales. En un referencial inercial un rayo de luz se mueve siguiendo una trayectoria recta. Supongamos un laboratorio acelerado en la dirección perpendicular al rayo de luz con aceleración a (Fig.6). Desde el referencial acelerado veremos que el rayo de luz incide en la pared opuesta a la cual penetró en una posición inferior (respecto a la dirección de desplazamiento) y por lo tanto en este referencial vemos que el rayo sigue una trayectoria curva. Por el principio de equivalencia, en un referencial en reposo bajo la acción de un campo gravitatorio a el rayo de luz debe seguir la misma trayectoria. El desvío de la luz en presencia de campos gravitatorios fuertes se ha verificado experimentalmente. Analicemos ahora el experimento pensado que se ilustra en la Fig.7. La observadora A (Andrea) se encuentra a una altura h del observador B (Bernardo) en un referencial en reposo bajo la acción de un campo gravitatorio, en el cual todos los cuerpos caen con aceleración g. Pensemos que Andrea se encuentra en la punta de un cohete de altura h sobre la superficie de la tierra y Bernardo en la base. Andrea le envía a Bernardo pulsos de luz a intervalos regulares de tiempo ∆τA , medidos en un reloj localizado a la misma altura. Bernardo tiene un reloj idéntico, con el cual mide el intervalo de tiempo ∆τB entre el arribo de dos pulsos sucesivos a su posición. El principio de equivalencia nos dice que ∆τB < ∆τA . Para ver esto supongamos ahora que el cohete se encuentra acelerado hacia arriba con aceleración g y lejos de cualquier fuente gravitational. Por el principio de equivalencia las mediciones tienen que ser idénticas que en el caso anterior. Dado que el cohete esta acelerado, B recibe los pulsos a una frecuencia mayor de la que son emitidos y lo mismo debe observarse en el cohete en reposo en el campo gravitatorio. Para poner esto en términos cuantitativos, analicemos el caso en que el cohete se acelera respecto de un referencial inercial en el cual V /c ¿ 1, de manera que la mecánica Newtoniana resulte una buena aproximación y podamos despreciar efectos tales como la contracción de Lorentz y la dilatación temporal6 6 El problema puede analizarse dentro de la Relatividad Especial y el resultado es exactamente el mismo (dentro del mismo 16 Figura 6: . (a) Un rayo de luz que se propaga en la dirección x sigue una línea recta en un referencial en reposo y penetra por una ventana a un ascensor que sube con aceleración a. (b) El mismo rayo de luz visto desde el referencial acelerado. Vamos a asumir ademas que el cohete no se acelera a velocidades relativistas en el tiempo en que demora un pulso en viajar de la punta a la base del cohete. Esto implica que gh/c2 ¿ 1. Supongamos que el cohete se acelera en la dirección z. La posición de Bernardo en el cohete como función del tiempo esta dada por 1 2 gt (58) 2 si el origen de z coincide con la posición de Bernardo para t = 0. La posición de Andrea en la punta del cohete esta dada por zB (t) = 1 zA (t) = h + gt2 (59) 2 Consideremos la emisión de dos pulsos sucesivos por Andrea y su recepción por Bernardo. Supongamos que el primer pulso es emitido en t = 0 y recibido en t = t1 . El segundo pulso es emitido en t = ∆τA y recibido en t = t1 + ∆τB . La secuencia de eventos se muestra en la Fig.8. La distancia recorrida por el primer pulso es zA (0) − zB (t1 ) = ct1 (60) La distancia recorrida por el segundo pulso es zA (∆τA ) − zB (t1 + ∆τB ) = c(t1 + ∆τB − ∆τA ) (61) Reemplazando las Ecs.(58) y (59) en las Ecs.(60) y (61), y asumiendo que ∆τA es pequeño (comparado con t1 ) de manera que podemos despreciar los términos cuadráticos en ∆τA y ∆τB , obtenemos 1 h − gt21 = ct1 2 orden de aproximación); la aproximación newtoniana simplemente permite simplificar el análisis. 17 (62) Figura 7: . Andrea (A) emite señales luminosas desde la punta de un cohete en reposo en un campo gravitacional ~g a intervalos regulares ∆τA . Bernardo (B) en la base del cohete recibe las señales a intervalos ∆τB . Si el cohete se acelera en el vacío con aceleración g los observadores deben medir los mismos tiempos por el principio de equivalencia. 1 h − gt21 − gt1 ∆τB = c(t1 + ∆τB − ∆τA ) 2 (63) Resolviendo la Ec.(62) al menor orden en gh/c2 obtenemos t1 ≈ h/c; restando la Ec.(62) de la Ec.(63) y reemplazando el valor antes obtenido de t1 llegamos a µ ¶ gh ∆τA = 1 + 2 ∆τB c Dado que la frecuencia es f = 1/∆τ y que gh es la diferencia de potencial gravitacional entre A y B: ΦA − ΦB = gh tenemos finalmente µ ¶ ΦA − ΦB fB = 1 + fA (64) c2 Si el receptor se encuentra a a menor potencial que el emisor, recibe la señal a mayor frecuencia de la que es emitida y viceversa. Si bien este resultado fue obtenido para un campo gravitacional uniforme, parece natural asumir su extensión al caso no uniforme reemplazando simplemente ΦA = Φ(~xA ) y ΦB = Φ(~xB ). La validez de esta extensión, asi como del principio de equivalencia mismo, reside en última instancia en la verificación experimental. Dos situaciones en las cuales se verifica este fenómeno son el Sistema de Posicionamiento Global (GPS) y el corrimiento al rojo gravitacional. 4.2.1. Corrimiento al rojo gravitacional Las crestas de una onda luminosa con frecuencia bien definida pueden ser pensadas como una serie de señales emitidas con dicha frecuencia. La relación (64) puede ser por lo tanto aplicada a la luz. Por ejemplo, la luz emitida desde la superficie de una estrella con frecuencia ω∗ arribará a un observador lejano con una frecuencia ω∞ menor que ω∗ . Esto se conoce como corrimiento al rojo gravitacional. El potencial gravitacional en la superficie de una estrella de masa M y radio R es Φ = −GM/R; el potencial en el infinito es cero. La Ec.(64) resulta entonces 18 Figura 8: . Secuencia de eventos en la emisión de pulsos del experimento pensado de la Fig.7. ω∞ = µ ¶ GM 1− ω∗ Rc2 (65) Esta expresión es precisa para valores pequeños de GM/Rc2 ; una relación general para valores arbitrarios de este cociente se obtiene de la Teoría de la Relatividad General (la cual por supuesto reproduce la anterior en el límite GM/Rc2 ¿ 1). El corrimiento a rojo gravitacional predicho por la Ec.(65) ha sido detectado en el espectro de enanas blancas (estrellas pequeñas muy densas con una masa comparable a la del sol y un radio R ∼ 103 Km), para las cuales GM/Rc2 ∼ 10−3 . 4.2.2. GPS El GPS (Global Positioning System) se basa en una constelación de 24 satélites, cada uno en una órbita de 12 hs alrededor de la tierra, distribuidos en 6 planos orbitales equiespaciados. Cada satélite lleva un reloj atómico de alta precisión (del orden de 1013 en unas pocas semanas) que mide el tiempo propio del satélite, con correcciones transmitidas desde tierra periódicamente que permiten mantener la precisión por períodos prolongados. Los detalles de operación son altamente complejos, pero podemos tener una idea de su funcionamiento a través de una situación idealizada. Imaginemos un sistema inercial en el cual el centro de la tierra se encuentra aproximadamente en reposo durante el período de tiempo que toma en llegar una señal del satélite al suelo. Cada satélite emite periódicamente una señal de microondas codificada con el tiempo y la localización espacial del mismo en el sistema de coordenadas del referencial inercial. Un observador en la superficie de la tierra que recibe la señal un tiempo despues puede calcular su distancia al satélite multiplicando el intervalo de tiempo transcurrido por c. Utilizando la señal de tres satélites el observador puede estimar su posición espacial como el punto de intersección de tres esferas. La señal de un cuarto satélite permite una localización espacio-temporal completa. Si se toman en cuenta las señales de mas satélites se puede mejorar la resolución. Para que todo esto sea posible, el tiempo propio de cada satélite debe ser corregido a fin obtener el tiempo correcto en el referencial inercial por dos motivos: la dilatación temporal de la relatividad especial y los efectos del campo gravitacional antes discutidos. Si bien los parámetros del problema (velocidades de los statélites, distancia a la tierra, etc.) son tales que estos efectos son pequeños, para obtener una resolución espacial del orden de los metros es necesario tomar en cuenta estas correcciones. 19 Mas aún, también es necesario tomar en cuenta la rotación de la tierra (sisema no inercial), errores en los relojes, efecto Doppler, efectos de refracción de la señal en la ionósfera terrestre, etc., etc.. 4.2.3. Espacio-tiempo curvo Como puede explicarse la diferencia entre las frecuencias de emisión y recepción a diferentes potenciales gravitatorios? Una explicación posible es que la gravedad altera los relojes, de la siguiente manera. En ausencia de cualquier campo gravitacional, dos relojes en reposo en un referencial inercial están sincronizados (marcan exactamente el mismo tiempo). En presencia de un campo gravitacional el espacio-tiempo no resulta afectado (continua siendo el espacio-tiempo plano de la relatividad especial) pero los relojes funcionan a un ritmo que difiere en un factor (1 + Φ/c2 ) respecto del que tendrían en ausencia de gravedad, donde Φ es el potencial gravitatorio en la localización del reloj. Cuanto mayor Φ mas rápido anda el reloj. Así, los relojes a mayor potencial andan mas rápido que los que se encuentran a menor potencial y esto explica la diferencia entre las frecuencias de emisión y recepción de señales entre Andrea y Bernardo. Todos los relojes son afectados de la misma manera. Este tipo de explicación es análoga a la siguiente. Supongamos una persona cree firmemente que en realidad la tierra es plana y que su curvatura es solo aparente. Esta persona dispone de un mapamundi en alguna de sus proyecciones (digamos la Mercator) y confía plenamente en ella. Para esta persona ese mapa representa fielmente la superficie de la tierra. Ese es su axioma. Sin embargo, se topa con el siguiente hecho empírico. Cuando un avión viaja a lo largo de un paralelo, las distancias son mas cortas de lo que marca el mapa cuanto mas lejos del ecuador viaja. Por ejemplo, de acuerdo con el mapa, la distancia a recorrer para atravesar Sudamerica en su parte mas ancha es aproximadamente la misma que para atravesar Groenlandia. Sin embargo, los instrumentos del avión marcan una distancia mucho menor! Como lo explica? Una explicación que mantiene el axioma del mapa correcto es que las reglas (instrumentos para medir longitudes) cambian su longitud a medida que nos movemos de sur a norte. Cuanto mas lejos del ecuador nos movemos, las reglas se hacen mas largas y por lo tanto las distancias que miden parecen mas cortas. Así, elabora una teoría acerca de un ”campo” especial que altera la longitud las reglas de acuerdo con la latitud. Una teoría de este tipo para ser consistente tiene que asumir que dicho campo tiene que afectar todas las longitudes de la misma manera. Es decir, dicho campo tiene que afectar no solo las reglas propiamente dichas, sino tambien todos los objetos, los pasajeros, el avión (incluso la cantidad de combustible que consume), etc. De otra manera veríamos que los objetos se deforman! La explicación mediante un espacio-tiempo plano de los relojes en un campo gravitatorio y la explicación de las reglas que cambian en una tierra plana tienen en común lo siguiente: ambas asumen una geometría subyacente que no es posible medir directamente, debido a que todos los instrumentos son afectados de igual manera. Es mucho mas simple, económico en hipótesis y en última instancia con mayor poder predictivo desechar la hipótesis de una tierra plana, aceptar que las reglas miden correctamente y que vivimos arriba de una esfera. De la misma manera, es mucho mas simple, económico en hipótesis y con mayor poder predictivo aceptar que los relojes miden correctamente el tiempo y que en presencia de gravedad la geometría del espacio-tiempo no es plana. Esta es la línea de pensamiento de la Relatividad General. 4.3. Gravedad Newtoniana en términos de espacio-tiempo curvo A fin de tener una primera noción acerca de como sería una teoría geométrica de la gravedad, vamos a considerar primero un modelo geométrico simple que permite explicar la gravedad en el límite newtoniano. En este modelo la geometría plana del espacio-tiempo de la Relatividad Especial es modificada incorporando una pequeña curvatura (podemos pensarlo como una perturbación) que permite explicar el comportamiento de los relojes antes discutido. La geometría espacio-temporal en este modelo se describe a través del elemento de línea µ ¶ µ ¶ 2Φ(~x) 2Φ(~x) 2 ds2 = − 1 + (cdt) + 1 − (dx2 + dy 2 + dz 2 ) (66) c2 c2 20 Figura 9: . Diagrama espacio-tiempo para la emisión y recepción de señales en el modelo de espacio-tiempo curvo (66). donde el potencial Φ(~x) es solución de la ecuación de Poisson (53) y se assume que se anula en infinito. Por ejemplo, alrededor de la tierra Φ(r) = −GM/r, donde M es la masa terrestre. De hecho este elemento de línea es la predicción de la Relatividad General para pequeñas curvaturas producidas por fuentes gravitorias estáticas débiles. Por ejemplo, es una buena aproximación para la curvatura del espacio-tiempo producida por el sol. El intervalo de tiempo propio de un observador cualquiera es dτ 2 = −ds2 /c2 , al igual que en relatividad especial. Así, de la Ec.(66) resulta inmediato que el tiempo propio de observadores estáticos en diferentes posiciones es en principio diferente, esto es dτ 2 = (1 + 2Φ(~x)/c2 )dt2 . La explicación a los ritmos diferentes de los relojes es inmediata. Consideremos el diagrama de espacio-tiempo de la Fig.9. Supongamos que las señales se propagan en la dirección x. En la figura se muestran las líneas de mundo del emisor y receptor xA y xB respectivamente, así como las líneas de mundo de dos señales consecutivas. Las señales emitidas estan separadas por un intervalo ∆t en la coordenada t, que corresponde a un intervalo de tiempo propio del emisor ∆τA · Las líneas de universo de las señales luminosas no son rectas de pendiente c como en la geometría plana, ya que ahora el espacio-tiempo es curvo. Sin embargo, dado que la métrica no depende de la coordenada t, la forma de las trayectorias para ambas señales será la misma, pero estarán separadas por una distancia constante ∆t. Así, de la Ec.(66) tenemos que sµ ¶ µ ¶ ΦA 2ΦA ∆τA = 1+ 2 ∆t ≈ 1 + 2 ∆t (67) c c donde hemos asumido ΦA /c2 ¿ 1. De la misma manera ¶ µ ΦB ∆t ∆τB = 1 + 2 c Eliminando ∆t de las dos ecuaciones anteriores obtenemos µ ¶ ΦB − ΦA ∆τB = 1 + ∆τA c2 que es el mismo resultado obtenido a partir del principio de equivalencia. 21 (68) (69) 4.3.1. Movimiento newtoniano en términos geométricos Hemos visto que en relatividad especial la trayectoria de una partícula libre en el espacio-tiempo plano es aquella que extremiza el tiempo propio. El mismo principio variacional nos da el movimiento de una partícula en un potencial gravitacional Φ si utilizamos el elemento de línea (66). El tiempo propio entre dos eventos A y B viene dado por µ ¶1/2 ds2 dτ = − 2 = c A A ¶ µ ¶ ¸1/2 Z B ·µ 2Φ 2Φ 1 2 2 2 2 1 + 2 dt − 2 1 − 2 (dx + dy + dz ) = c c c A Z τAB B Z B (70) donde la integral es a lo largo de la línea de mundo que une A con B. Usando la coordenada t para parametrizar la curva obtenemos Z B τAB = A (µ ¶ µ ¶ "µ ¶2 µ ¶2 µ ¶2 #)1/2 2Φ 1 2Φ dx dy dz + + dt 1+ 2 − 2 1− 2 c c c dt dt dt (71) El término entre corchetes es el módulo de la velocidad de la partícula al cuadrado V 2 . Vamos a aproximar esta expresión a orden Φ/c2 y V 2 /c2 (velocidades no relativistas). Obtenemos así µ ¶¸ Z B · 1 1 2 τAB ≈ dt 1 − 2 V −Φ (72) c 2 A Dado que el primer término en la integral es independiente de la trayectoria, la expresión a extremar es ¶ Z B µ 1 2 dt V −Φ 2 A que resulta equivalente a una integral de acción para el Lagrangiano µ L ¶ µ ¶2 d~x 1 d~x , ~x = − Φ(~x) dt 2 dt (73) Si multiplicamos (73) por la masa m de la partícula obtenemos precisamente el Lagrangiano de una partícula no relativista en un potencial gravitacional Φ(~x). Aplicando las ecuaciones de Euler-Lagrange se obtiene d2 ~x = −∇Φ(~x) (74) dt2 la cual multiplicada por m nos da la segunda ley de Newton. Vemos así como la gravedad newtoniana puede ser enteramente expresada en términos geométricos en un espacio-tiempo descripto por el elemento de línea (66). En la descripción newtoniana cierta distribución de materia produce un campo gravitatorio asociado al potencial Φ, el cual determina el movimiento de otra partícula a través de m~a = −m∇Φ; en la descripción geométrica cierta distribución de materia produce una curvatura en el espacio-tiempo (66) y las partículas se mueven en esta geometría a lo largo de geodésicas (caminos de tiempo propio extremal). Los conceptos de fuerza y efectos sobre relojes son reemplazados por ideas geométricas. Mas aún, la igualdad entre masa inercial y gravitacional resulta automáticamente explicada, ya que la masa no entra para nada en la descripción del movimiento de las partículas. La ley de movimiento es la misma que para una partícula libre, pero en un espacio-tiempo curvo. El único rol de la masa en esta descripción es el de curvar el espacio-tiempo. 22 5. Relatividad General Con los elementos que hemos visto hasta aquí estamos en condiciones de describir la estructura general de la teoría geométrica de la gravedad, esto es, la Relatividad General y discutir algunas de sus predicciones mas importantes. Como ya hemos discutido, la geometría del espacio-tiempo se describe en general mediante un elemento de línea ds2 que nos da la distancia entre puntos cercanos. Para escribir el elemento de línea necesitamos disponer de un sistema de cuatro coordenadas xα (α = 0, 1, 2, 3) para describir los puntos y especificar la distancia entre puntos separados por intervalos de coordenadas dxα . La elección del sistema de coordenadas es arbitrario, en tanto nos provea de una descripción única de los puntos en la región del espacio-tiempo a estudiar. Por lo demas, la elección de un sistema particular depende solo de conveniencias de cálculo, según las simetrías del problema a tratar. Un elemento de línea especifica una geometría, pero una misma geometría puede ser descripta por diferentes elementos de línea, debido a los diferentes sistemas de coordenadas disponibles. Por ejemplo, el espacio-tiempo plano de la relatividad especial puede resumirse en coordenadas cartesianas por la expresión familiar ds2 = −(cdt)2 + dx2 + dy 2 + dz 2 (75) La parte espacial puede ser transformada a coordenadas polares mediante x = r sin θ cos φ y = r sin θ sin φ z = r cos θ. Reemplazando en la Ec.(75) obtenemos ds2 = −(cdt)2 + dr2 + r2 dθ2 + r2 sin2 θ dφ2 (76) Esta expresión luce diferente de la Ec.(75), pero representa exactamente la misma geometría de espaciotiempo plano. En términos generales el elemento de línea viene dado por ds2 = gαβ (x)dxα xβ (77) donde gαβ (x) es un tensor simétrico de rango 2 (una matriz) dependiente de la posición denominado tensor métrico o simplemente métrica. Por ejemplo, para el elemento de línea (75) tenemos la métrica de Minkowski gαβ = ηαβ , donde ηαβ viene dada por la Ec.(36). La teoría de la Relatividad General fue introducida por Albert Einstein en 1915. La variable central en esta teoría es la métrica, la cual se obtiene de las ecuaciones de campo de Einstein, o simplemente Ecuaciones de Einstein. Las mismas constituyen un conjunto de ecuaciones en derivadas parciales (no lineales) para la métrica gαβ (x), dada una distribución de materia (materia o energía, ambas son equivalentes en la relatividad). Son análogas a las ecuaciones de Maxwell, las cuales determinan los potenciales electromagnéticos, para distribuciones dadas de carga y corrientes. Las ecuaciones de Einstein son altamente complejas y para los fines del presente curso nos basta con saber que permiten calcular la métrica para situaciones particulares y en lo que resta de este capítulo exploraremos algunas de las consecuencias de tener un espacio-tiempo curvo. La discusión precedente acerca del principio de equivalencia nos sugiere que las propiedades locales de un espacio tiempo curvo deben ser indistinguibles de aquellas del espacio-tiempo plano de la relatividad especial (recordemos que es posible eliminar localmente los efectos de la gravedad en un referencial acelerado apropiado). Una expresión concreta de esta idea física es el requerimiento de que, dada una métrica gαβ (x) en un sistema de coordenadas, en cada punto del espacio-tiempo es posible introducir nuevas coordenadas x0α tales que 0 (x0P ) = ηαβ gαβ x0α P (78) donde ηαβ es la métrica de Minkowski (36) y son las coordenadas de un punto particular P . Es facil ver 0 que, dada una métrica, siempre es posible encontrar un sistema de coordenadas tales que gαβ (x0P ) es diagonal, ya que la métrica es una matriz simétrica 4x4; una vez diagonalizada es posible reescalar las coordenadas 23 una a una, de manera que los elementos diagonales tomen todos valores de la métrica de Minkowski. Lo que no es siempre posible es encontrar una transformación de coordenadas que cambie el número de autovalores positivos y negativos. Es una suposición de la teoría que en cada punto existen tres autovalores positivos y uno negativo. Físicamente esto significa que hay tres dimensiones espaciales y una temporal. Hasta donde es posible hacer coincidir la métrica con la del espacio-tiempo plano mediante transformaciones de coordenadas? Evidentemente no es posible encontrar coordenadas en las cuales gαβ = ηαβ en todo punto del espacio-tiempo: esto significaría que el espacio-tiempo es de hecho plano. Sin embargo puede demostrarse que (dentro de la estructura matemática supuesta de la teoría) siempre es posible encontrar coordenadas x0α tales que, ademas de la condición (78), las derivadas primeras de la métrica se anulan en el punto P : 0 ¯¯ ∂gαβ 0 ¯ = 0. (79) gαβ (x0P ) = ηαβ ∂x0γ ¯x0 =x0 P Un sistema de coordenadas que satisface estas condiciones se denomina un referencial inercial local en el punto P . Las propiedades en un entorno pequeño de P en estas coordenadas son las mismas que las del espacio-tiempo plano. Las ecuaciones (79) pueden ser satisfechas en cualquier otro punto, pero en un sistema de coordenadas diferentes. La distancia espacio-temporal entre el punto P y sus vecinos puede ser calculada tanto en las coordenadas de (77) como en aquellas correspondientes al referencial inercial local. Esto significa que la relatividad general hereda la estructura local de conos de luz de la relatividad especial. Puntos separados de P por intervalos de coordenadas infinitesimales dxα podrán tener separaciones tipo temporal (ds2 < 0), tipo espacial (ds2 > 0) o nula (ds2 = 0). Los rayos de luz se mueven por curvas nulas, a lo largo de las cuales ds2 = 0. La familia de direcciones nulas que emergen de o convergen al punto P expanden los conos de luz locales de pasado y futuro en P . Así, los conos de luz locales son tangentes a las líneas de mundo nulas. Las partículas materiales (masa en reposo no nula) se mueven a lo largo de líneas de mundo tipo temporal, las cuales pueden ser descriptas paramétricamente por cuatro funciones xα (τ ) de la distancia τ a lo largo de la misma. La distancia entre dos eventos A y B a lo largo de una línea de mundo tipo temporal está dada por el tiempo propio τAB 1 = c Z B [−gαβ (x) dxα dxβ ]1/2 (80) A donde la integral es a lo largo de la línea de mundo. Un reloj que se mueve con la partícula a lo largo de esta curva mide la distancia espacio-temporal τ , el cual es por lo tanto el tiempo propio en ese referencial. Una linea de mundo tipo temporal con ds2 < 0 ó dτ 2 = −ds2 /c2 > 0 se encuentra dentro del cono de luz local en cada punto de la trayectoria. Esto implica que las partículas se mueven siempre a velocidades inferiores a la de la luz. Ahora bien, dada la métrica, cual es la ecuación de movimiento para las partículas (el equivalente de la segunda ley de Newton)? Vamos a considerar por simplicidad partículas solo bajo la acción de la gravedad (es decir, libres de cualquier otra inlfuencia, tal como fuerzas electromagnéticas), a las cuales llamaremos "partículas libres”. Mas aún, vamos a considerar partículas de prueba, esto es, partículas de masa suficientemente pequeña tal que la curvatura que producen es despreciable. El principio general que rige el movimiento de partículas libres de prueba en un espacio-tiempo curvo es entonces el mismo principio variacional que en Relatividad Especial: la línea de mundo de una partícula de prueba libre entre dos puntos separados por un intervalo tipo temporal (ds2 < 0) es el que extrema el tiempo propio entre ellos. Una línea de mundo que corresponde a un tiempo propio extremal se denomina geodésica y la ecuación de movimiento que la determina ecuación de la geodésica. Notemos que hablamos de tiempo propio extremo y no máximo, como en Relatividad Especial (espacio-tiempo plano). En un espacio-tiempo curvo una curva de tiempo propio extremal corresponde también a un máximo solo si existe una única curva extremal conectando un par de puntos. No obstante, esto no es necesariamente cierto para un camino extremal entre dos puntos en un espacio-tiempo curvo. Por ejemplo, en una esfera existen dos caminos de distancia extremal entre dos puntos cualesquiera. 24 El procedimiento para encontrar la ecuación de la geodésica es directo. Dados dos puntos A y B una línea de mundo entre ellos puede ser descripto paramétricamente dando las cuatro coordenadas xα en función de algún parámetro genérico σ que varía entre σ = 0 en A y σ = 1 en B. El tiempo propio (80) puede escribirse entonces como: r Z 1 1 dxα dxβ τAB = dσ −gαβ (x) (81) c 0 dσ dσ Esta expresión cumple un rol análogo al de una integral de acción en la formulación Lagrangiana de la mecánica, correspondiente al Lagrangiano ¶ r µ α dx dxα dxβ α L ,x = −gαβ (x) (82) dσ dσ dσ Las ecuaciones de movimiento son entonces aquellas que satisfacen las ecuaciones de Euler-Lagrange µ ¶ d ∂L ∂L − + =0 (83) dσ ∂(dxα /dσ) ∂xα Resulta conveniente expresar las ecuaciones de movimiento en términos del tiempo propio τ a lo largo de la trayectoria. Usando que dxα dxα dτ ⇒ =L dσ dσ dτ puede verse que la ecuación de la geodésica resulta L= donde los coeficientes Γα βγ d2 xα dxβ dxγ = −Γα βγ 2 dτ dτ dτ se denominan símbolos de Christoffel y se calculan de las ecuaciones µ ¶ 1 ∂gαβ ∂gαγ ∂gβγ gαδ Γδβγ = + − 2 ∂xγ ∂xβ ∂xα (84) (85) En términos de la cuadrivelocidad u la ecuación de la geodésica resulta duα β γ = −Γα βγ u u dτ (86) En el caso de la métrica de Minkowski gαβ = ηαβ tenemos que Γδβγ = 0, de donde recuperamos la ecuación de movimiento para una partícula libre de la Relatidad especial: duα =0 dτ Las cuatro ecuaciones diferenciales (84) no son independientes, ya que c2 dτ 2 = −gαβ (x) dxα dxβ y por lo tanto gαβ (x) uα uβ = −c2 25 (87) 5.1. Geometría en el entorno de una estrella esférica Una de las soluciones mas simples de las ecuaciones de Einstein y una de las mas útiles es la que se obtiene en el espacio vacío en los alrededores de una fuente de curvatura esféricamente simétrica, tal como una estrella esférica. Esta fue obtenida en 1916 por Karl Schwarzschild y por ello se la denomina geometría de Schwarzschild. En un sistema particular de coordenadas, la misma se resume en el elemento de línea µ ¶ µ ¶−1 2GM 2GM ds2 = − 1 − 2 (cdt)2 + 1 − 2 dr2 + r2 (dθ2 + sin2 θ dφ2 ) c r c r (88) Las coordenadas se denominan coordenadas de Schwarzschild. La métrica asociada (llamada por supuesto de Schwarzschild) en el sistema de coordenadas (t, r, θ, φ) es ¡ ¢ −c2 1 − 2GM 0 0 0 c2 r ¡ ¢ −1 0 1 − 2GM 0 0 c2 r gαβ = (89) 2 0 0 r 0 0 0 0 r2 sin2 θ A t y r constantes, el elemento de línea (88) describe la geometría de una superficie esférica bidimensional de radio r en el espacio euclideo tridimensional. La geometría de Schwarzschild tiene por lo tanto simetría esférica, en lo que respecta a cambios en los ángulos θ y φ. La coordenada r no debe interpretarse estrictamente como la distancia a un ”centro"(ya que el espacio es curvo). Una interpretación mas clara resulta de calcular el área de una de dichas esferas bidimensionales de radio r, la cual puede verse viene dada por la fórmula standard A = 4πr2 . Si GM/c2 r ¿ 1, el coeficiente de dr2 en (88) puede ser desarrollado obteniéndose ¶ µ ¶ µ 2GM 2GM (cdt)2 + 1 + 2 dr2 + r2 (dθ2 + sin2 θ dφ2 ), (90) ds2 ≈ − 1 − 2 c r c r que corresponde exactamente a la métrica del modelo geométrico de gravedad newtoniana (66) con un potencial Φ = −GM/r. Esto lleva a la identificación de la constante M con la masa total de la fuente de curvatura (M puede pensarse como una constante de integración en la solución de las ecuaciones de Einstein). Evidentemente algo interesante pasa con la métrica para r = 0 y r = 2GM/c2 . Este último se denomina radio de Schwarzschild y constituye una longitud característica para la curvatura en la geometría de Schwarzschild. Sin embargo, la superficie de estrellas estáticas ocurre siempre a radios mayores que el de Schwarzschild7 . En el interior de una estrella la solución es diferente de la de Schwarzschild y ambas deben ser empalmadas. Así, en tanto analicemos el comportamiento fuera de una estrella estas singularidades no resultan relevantes. 5.1.1. Órbitas: precesión del perihelio Analicemos las ecuaciones de movimiento de una partícula en la geometría de Schwarzschild (por ejemplo, un planeta en órbita alrededor de una estrella), esto es, la ecuación de la geodésica. La métrica (89) no depende de t ni de φ, lo cual implica que existen constantes de movimiento asociadas. Así, por ejemplo la ecuación de Euler-Lagrange para t nos dá ∂L −gtt dt dt = = −gtt = cte ∂(dt/dσ) L dσ dτ de donde µ ¶ µ ¶ 2GM dt 2GM c2 1 − 2 = c2 1 − 2 ut = e c r dτ c r (91) y en forma semejante 7 Por ejemplo, el radio de Schwarzschild para el sol es ∼ 3 Km, mientras que el radio de la superficie solar es ∼ 7 × 105 Km 26 r2 sin2 θ uφ = l (92) Para r grande, e resulta la energía por unidad de masa (en reposo) en el espacio-tiempo plano, E = mc2 ut . Dado que e es una cantidad conservada que resulta de una simetría temporal, asumimos que e es la energía por unidad de masa en cualquier parte. De la misma manera, l resulta el momento angular por unidad de masa en reposo. La conservación del momento angular implica que las órbitas yacen en un ”plano”, al igual que en la mecánica newtoniana. Para ver esto tomemos un instante particular y sea ~u la componente espacial de la cuadrivelocidad. Siempre podemos rotar el sistema de coordenadas para que uφ = 0 para algún ángulo particular φ = φ∗ (podemos tomar φ∗ = 0 sin pérdida de generalidad). Por la Ec.(92) tenemos que uφ será cero en toda la geodésica y por lo tanto la partícula permanecerá en el ”plano” meridional φ = 0. Una vez establecido esto, es simple reorientar las coordenadas de manera que la órbita esté en el ”plano” ecuatorial θ = π/2 y por lo tanto uθ = 0. El resto del análisis es muy semejante al de la mecánica newtoniana. Tenemos ya dos integrales de movimiento. La normalización (87) nos proveé una tercera. Así, de las Ecs.(87) y (89) tenemos µ ¶ µ ¶−1 2GM 2GM t 2 −c 1 − 2 (u ) + 1 − 2 (ur )2 + r2 (uφ )2 = −c2 . c r c r 2 Eliminando ut y uφ de las Ecs.(91) y (92), reemplazando en la expresión anterior y con un poco de álgebra (queda como ejercicio para el lector) llegamos a la siguiente ecuación para la componente radial de la cuadrivelocidad ur = dr/dτ : 1 E= 2 2c µ dr dτ ¶2 + Vef (r) (93) donde Vef (r) = · ¸ 1 GM l2 GM l2 − + − c2 r 2r2 c2 r3 (94) e2 − c4 (95) 2c4 La ecuación (93) tiene la misma estructura que la ecuación para la velocidad radial en el problema de potencial central en mecánica newtoniana. Mas aún, definiendo Enewt = mc2 E obtenemos E= Enewt = m 2 µ dr dτ ¶2 + L2 GM m GM l2 − − 2 3 2 2mr r c mr (96) donde L = ml. Esta ecuación tiene exactamente la misma forma que la integral de energía en mecánica newtoniana, con la corrección relativista proporcional a 1/r3 . El límite de la gravedad newtoniana se obtiene para distancias suficientemente grandes (de manera que el término proporcional a 1/r3 pueda ser despreciado) y velocidades suficientemente bajas, de manera que la derivada respecto de τ pueda ser reemplazada por una derivada respecto de t. El potencial efectivo se muestra en la Fig.10, donde se compara con el corespondiente caso newtoniano. La diferencia mas notable con el caso newtoniano es la ausencia de una barrera centrífuga infinita para valores pequeños de r y l 6= 0. Para valores grandes de r el potencial aproxima rápidamente el comportamiento newtoniano, especialmente para valores grandes de l/M . A título ilustrativo, para la órbita terrestre alrededor del sol tenemos l/M ∼ 109 . El resto del análisis es el mismo que en la mecánica newtoniana. Si la Ec.(93) tiene un solo punto de retorno, esto es, un único valor de r para el cual E = Vef (r), la trayectoria, o bien comienza y termina en infinito, o bien converge al orígen. Si tenemos 2 puntos de retorno rmin y rmax , la trayectoria será oscilatoria en r. La ecuación de la trayectoria, esto es, φ en función de r se obtiene combinando la Ec.(93) con la ecuación para el momento ángular l = r2 dφ/dτ , de donde 27 Figura 10: . Potencial efectivo (G = c = 1) para diferentes valores del momento angular l. La línea punteada corresponde al potencial efectivo Newtoniano para l/M = 5. dφ l 1 =± 2 2p dr c r 2(E − Vef (r)) Integrando esta ecuación para r variando de rmin a rmax y nuevamente hasta rmin podemos calcular la variación del ángulo ∆φ en ese período. Si ∆φ = 2πq/n, con q y n enteros, entonces la trayectoria es cerrada: luego de n períodos la partícula dió q vueltas y regresó a su posición inicial. La corrección relativista del potencial central tiene varios efectos, siendo tal vez el mas importante el siguiente. Es sábido de la mecánica newtoniana8 que hay solamente dos tipos de potencial central para los cuales las trayectorias son cerradas: aquellos en que el potencial varía como 1/r y aquellos para los cuales varía como r2 . La presencia de la corrección ∝ 1/r3 implica por lo tanto que las órbitas son abiertas, barriendo indefinidamente la corona comprendida entre rmin y rmax , tal como si fuera una elipse cuyo eje mayor rota alrededor del foco. Este fenómeno se conoce como precesión del perihelio y ya había sido observada en la órbita del Mercurio durante el siglo XIX, sin poder ser explicada desde la mecánica Newtoniana. La predicción precisa del ángulo de precesión de Mercurio fué uno de los primeras corroboraciones experimentales de la Relatividad General. 5.2. Agujeros negros y el colapso gravitacional 5.2.1. La vida de una estrella La historia de vida de una estrella es una historia de competencia entre la atracción gravitatoria, que tiende a contraerla, y una presión expansiva de orígen no gravitatorio que la contiene. La historia comienza con el colapso gravitatorio de una nube de gas interestelar, compuesta mayormente por hidrógeno y helio, la cual se encuentra circunstancialmente mas fria (con menor energía cinética) y mas densa que su entorno. A medida que este gas se condensa, su temperatura aumenta por compresión hasta que alcanza un valor suficientemente alto como para iniciar la fusión del hidrógeno, el cual se transforma en helio y libera energía. La estrella alcanza entonces un estado estacionario, en el cual la pérdida de energía por radiación se encuentra balanceada por la energía producida en la fusión del hidrógeno. La materia se encuentra confinada a una 8 L. D. Landau y E. M. Lifshitz, Mecánica, Ed. Reverté, 1978, Cap. 3, versículo 14. 28 región del espacio, de tal manera que la atracción gravitatoria se encuentra balanceada por la expansión térmica del gas. Este es el estado presente de nuestro sol. Eventualmente una fracción significativa del hidrógeno presente se consume y el combustible nuclear resulta insuficiente para compensar las perdidas por radiación. La contracción gravitatoria recomienza, aumentando nuevamente la temperatura por compresión hasta que esta alcanza un valor suficientemente alto para disparar la fusión del helio, el cual se transforma en otros elementos mas pesados. La temperatura en la superficie de la estrella aumenta y se vuelve mas brillante. Eventualmente la cantidad de helio también se vuelve insuficiente, el nucleo de la estrella se contrae nuevamente y se inician nuevas reacciones nucleares. Cuando termina este proceso? Evidentemente no puede continuar mas allá de la formación de nucleos de 56 F e, ya que estos tienen la mayor energía de ligadura por nucleón. De esta manera, cuando la fracción de nucleos pesados (Fe u otros elementos cercanos en la tabla periódica) supera cierto umbral, las reacciones nucleares no proveen suficiente energía para contrarestar la contracción gravitatoria. Que ocurre entonces cuando se agota el combustible termonuclear? Hay dos posibilidades. O bien la estrella alcanza un nuevo estado de equilibrio, en el cual la atracción gravitacional resulta contrarestada por una fuente de presión no térmica, o bien la estrella no alcanza más un estado de equilibrio y su estado final es un colapso gravitacional. Una fuente importante de presión no térmica la proveé el principio de exclusión de Pauli, en cuyo caso se denomina presión de Fermi. Otra fuente de presión no térmica son las fuerzas de repulsión nucleares. Las estrellas en las cuales el colapso gravitacional es soportado por la presión de Fermi debida a los electrones se denominan enenas blancas. Las enenas blancas son estrellas con masas del orden de la masa solar, pero con un radio de solo unos pocos miles de kilometros. La temperatura en estas estrellas es del orden ∼ 107 K. A esta temperatura los átomos se encuentran completamente ionizados y el gas puede pensarse como un plasma compuesto por nucleos de carga positiva y electrones. Un modelo simple consiste en considerar el gas de electrones como un gas ideal de Fermi. La densidad de estas estrellas corresponde a una densidad de electrones ρe ∼ 1030 electrones/cm3 . La temperatura de Fermi resulta así h̄2 ¡ 2 ¢2/3 3π ρe ∼ 1011 K 2mkB Dado que la temperatura de Fermi es mucho mayor que la de la estrella, el gas de electrones se encuentra fuertemente degenerado (en su estado fundamental). La presión de punto cero del gas de Fermi es la que contraresta la atracción gravitacional debida a la mayor masa de los nucleos. No obstante, si la masa de la estrella es muy grande, aún la presión de Fermi electrónica resulta insuficiente para contener el colapso gravitacional. Podemos hacer una estimación gruesa del valor de la masa crítica mediante el siguiente argumento. Supongamos que tenemos A electrones en un volúmen esférico de radio R, de manera que ρe ∝ A/R3 . El 1/3 momento de Fermi es pF ∝ h̄ρe . La mayor contribución a la energía total del gas de lectrones está dada por aquellos niveles cercanos al de Fermi; para la alta densidad electrónica del problema, dichas energías serán elevadas, de manera que vamos a asumir que son relativistas. Así, en una primera aproximación tenemos TF = ²F /kB = Ee ≈ A((me c2 )2 + (pF c)2 )1/2 ≈ ApF c ≈ A4/3 h̄c/R La energía gravitacional es proporcionada fundamentalmente por los protones, de manera que EG ≈ −G(mp A)2 /R Ambas energías varían como 1/R. Si A es suficientemente grande, la energía total será negativa y favorable a que el sistema colapse disminuyendo R. El valor crítico de A por encima del cual esto ocurre resulta entonces Acrit ≈ (h̄c/Gm2p )3/2 ∼ 1057 que corresponde a una masa crítica Mcrit ≈ mp Acrit ∼ M¯ (el símbolo ¯ representa el sol). Un cálculo mas refinado muestra que Mcrit = 1,4 M¯ , el cual se conoce como masa de Chandrasekhar. Para masas entre el límite de Chandrasekhar y 3 masas solares el objeto que se genera se conoce como estrella de neutrones. En el interior de las mismas las energías son tan elevadas (la temperatura es del orden de 109 K) que ocurre una recombinación de protones y electrones de manera que la mayor parte de la materia esta compuesta por neutrones (la corteza esta compuesta mayoritariamente por nucleos de Fe). La contracción gravitacional en estas estrellas esta soportada por la presión de Fermi debida a los neutrones 29 y a las fuerzas de repulsión nucleares. El radio de una estrella de neutrones es de unas pocas decenas de kilometros! Para masas superiores a un límite entre dos y tres masas solares el colapso gravitacional es inevitable y lo que se genera se conoce como aguero negro. 5.2.2. El agujero negro de Schwarzschild A fin de entender los aspectos escenciales de la física del colapso gravitacional consideremos el caso idealizado en que tanto el objeto que colapsa como el espacio circundante son esféricamente simétricos. En la discusión restante vamos a adoptar el sistema de unidades en el cual G = c = 1. El elemento de línea de Scwarzschild resulta entonces µ ¶ µ ¶−1 2M 2M 2 ds = − 1 − dt + 1 − dr2 + r2 (dθ2 + sin2 θ dφ2 ) r r 2 (97) En la teoría de la gravitación newtoniana, el teorema de Newton (el equivalente al teorema de Gauss en la electrostática) nos dice que el potencial afuera de un cuerpo esféricamente simétrico es −GM/r, aún cuando el curpo esta cambiando en el tiempo (ya que el potencial depende solo de la masa total, la cual se conserva). Un teorema semejante de la Relatividad General demuestra que, aún cuando la distribución de masa es dependiente del tiempo, la geometría fuera del colapso gravitacional esféricament simétrico es la de Scwarzschild Ec.(97). Así, a medida que el colapso evoluciona, la geometría de Scwarzschild se extiende a regiones cada vez mayores. En particular, las singularidades en la métrica para r = 0 y r = 2M se vuelven relevantes. La singularidad en r = 2M en realidad no es una singularidad física, sinó una singularidad coordenada. Para mostrar esto basta con encontrar un sistema de coordenadas en el cual la métrica no es singular. Existen muchos sistemas que muestran esto, pero uno particularmente util son las coordenadas de EddingtonFinkelstein (EF), en las cuales la coordenada t es reemplazada por una nueva coordenada v, a través de ¯ r ¯ ¯ ¯ t = v − r − 2M log ¯ − 1¯ (98) 2M Reemplazando en la Ec.(97), tanto para r > 2M como para r < 2M se obtiene µ ¶ 2M 2 ds = − 1 − dv 2 + 2dvdr + r2 (dθ2 + sin2 θ dφ2 ) (99) r Vemos que la singularidad en r = 2M fué removida por el cambio de coordenadas. Sin embargo, la singularidad en r = 0 persiste. De hecho puede demostrarse que r = 0 es un punto de curvatura infinita, es decir, con una densidad infinita de energía. Eso significa que la singularidad no puede ser eliminada con ningún cambio de coordenadas. Esta es una auténtica singularidad física. En general, una singularidad en una teoría física representa un límite de validez de la misma. Para entender el significado del agujero negro de Schwarzschild resulta util analizar el comportamiento de los rayos de luz radiales en las coordenadas de EF, esto es, de las líneas de mundo nulas ds2 = 0 para las cuales dθ = dφ = 0: µ ¶ 2M − 1− dv 2 + 2dvdr = 0 r Tenemos dos posibles soluciones. En una de ellas v = cte. De la Ec.(98) vemos que esta solución corresponde a rayos que convergen a la singuaridad r = 0, ya que para mantener v = cte, r debe disminuir cuando t aumenta. La otra solución corresponde a µ ¶ 2M − 1− dv + 2dr = 0. r Integrando esta ecuación se obtiene 30 Figura 11: . Geodésicas nulas radiales en la geometría de Schwarzschild. ¯ r ¯´ ³ ¯ ¯ v − 2 r + 2M log ¯ − 1¯ = cte (100) 2M Utilizando la Ec.(98) es facil ver que las soluciones de (100) para r > 2M corresponden a trayectorias que se alejan del orígen (r creciente con t), mientras que las soluciones para r < 2M corresponden a trayectorias que convergen al orígen (r decreciente con t). En la figura 11 se muestran las soluciones anteriores en términos de las variables t∗ = v − r vs. r. Las soluciones con v = cte en este gráfico resultan rectas a −45o del eje vertical. Las soluciones (100) para r > 2M se alejan de r = 0, convergiendo a rectas a 45o para r À 2M (en este límite t∗ ∼ t y la líneas de mundo son las del espacio-tiempo plano; recordemos que c = 1). En las intersecciones entre líneas de mundo nulas se representan esquemáticamente algunos conos de luz futuros. Vemos que la línea vertical correspondiente a r = 2M separa dos regiones de comportamiento diferente. Para r > 2M un rayo de luz puede alejarse de la singularidad (por la solución (100)) o converger a la misma (por la solución v = cte). Para r < 2M ambas soluciones partiendo de un mismo punto convergen a la singularidad. Dado que las líneas de mundo tipo temporales se encuentran siempre dentro de los conos de luz, ninguna trayectoria que comienza con r < 2M puede atravesar la frontera r = 2M , ya que para hacerlo debería salir a través de un cono de luz (y por lo tanto viajar a velocidad mayor que la luz) 9 . Para r > 2M la luz (o una partícula material) puede escapar al infinito, mientras que para r < 2M la gravedad es tan intensa que ni siquiera la luz puede escapar. Esto es lo que define la geometría de un agujero negro. La supericie r = 2M (una esfera de área A = 4π(2M )2 ) se conoce como horizonte de eventos del agujero negro. Un agujero negro se describe entonces desde la teoría como una singularidad cubierta por un horizonte de eventos. Físicamente resulta imposible obtener información de lo que ocurre dentro del horizonte. 9 Si bien esto fué derivado para rayos radiales, se puede ver que las geodésicas nulas no radiales se encuentran comprendidas dentro de los anteriores 31 Si bien la caracterización anterior fué obtenida para un agujero negro esféricamente simétrico, la fenomenología general (en particular la existencia de un horizonte) se mantiene en el caso de agujeros no simétricos. 5.3. Modelos cosmológicos La cosmología es la parte de la ciencia que estudia la estructura y evolución del universo a las mayores escalas espaciales y temporales. A estas escalas el comportamiento del universo esta dominado por la gravedad, debido al caracter de largo alcance de las interacciones gravitatorias, a diferencia de las interacciones nucleares fuerte y debil. La interacción electromagnética también es de largo alcance y de intensidad mucho mayor que la gravitatoria. Sin embargo, el universo es eléctricamente neutro, de manera que a grandes escalas espaciales esta interacción resulta apantallada y la interacción que domina es la gravitatoria. La Relatividad General por lo tanto es de importancia central para la cosmología, la cual constituye una de las aplicaciones mas importantes de esta teoría. 5.3.1. El universo visible en dos palabras En los últimos años el conocimiento del universo, tanto a nivel observacional como teórico se ha incrementado dramáticamente, de manera que una descripción razonablemente completa del mismo está a años luz del presente curso. Nos vamos a limitar a resumir solo unos pocos aspectos fundamentales en los cuales se fundamentan los modelos cosmológicos mas relevantes y su predicción mas importante: el llamado big bang. La materia visible en el universo esta contenida mayormente en galaxias, esto es, colecciones de estrellas, gases (mayoritariamente H y He) y polvo (partículas pequeñas) aglomeradas por interacción gravitatoria. Una galaxia típica contiene del orden de 1011 estrellas y una masa total del orden de 1012 M¯ . Hay del orden de 1011 galaxias en la parte del universo accesible a nuestras observaciones al día de hoy. Si la materia visible se distribuyera uniformemente sobre la mayor escala espacial detectable, corrrespondería al presente a una densidad del orden de ρm ∼ 10−31 g/cm3 , que corresponde aproximadamente a un protón por cm3 . Además de galaxias, el universo contiene radiación, compuesta partículas de masa en reposo nula, tales como fotones, ondas gravitacionales y tal vez cierto tipo de partículas llamadas neutrinos. La radiación con mayor densidad de energía es la radiación cósmica de fondo, que es la radiación electromagnética remanente del big bang. El espectro medido de esta radiación resulta con enorme precisión el de un cuerpo negro con una temperatura de 2,725 K. Este ajuste tan preciso al espectro de cuerpo negro es una de las evidencias experimentales mas fuertes que soportan el big bang. La densidad de energía de un cuerpo negro a esta temperatura es aproximadamente de ρr ∼ 10−34 g/cm3 . Vemos que esta densidad es hoy mucho menor que la densidad promedio de materia. No obstante, la situación era la inversa en las etapas tempranas posteriores al big bang. Existe una evidencia considerable de que la mayor parte de la masa en el universo no procede ni de la materia visible en las galaxias, ni de la radiación detectada hasta ahora10 . Esta masa faltante para explicar los fenómenos observados se conoce como materia oscura. Se estima que la materia oscura es del orden de 10 veces mas que la materia visible. La naturaleza de esta materia oscura es un problema central de la cosmología aún en abierto. Existe otro tipo de energía presente en el universo que se conoce como energía del vacío o energía oscura. La misma es de orígen cuántico y corresponde a la energía de punto cero (estado fundamental) del sistema de partículas. Esta es detectable a través de la formación espontanea de pares partícula-antipartícula predicha por la teoría cuántica de campos, la cual ha sido medida experimentalmente. Si bien no existe al presente una teoría fundamental que permita estimar la densidad de energía del vacío ρv , la misma puede ser detectada a através de sus efectos gravitacionales, ya que en relatividad toda forma de energía curva el espacio. Diversas observaciones astrofísicas indican que dicha densidad es constante en el espacio y el tiempo. Otra observación importante es que, promediado sobre grandes escalas, el universo es isotrópico -las propiedades son las mismas en cualquier dirección- y homogeneo - las propiedades en un punto del espacio 10 Por ejemplo, a partir del análisis de la distribución de velocidades de galaxias espirales; la distribución medida no concuerda con la distribución de masa observada bajo nigún modelo físico razonable. 32 son las mismas que en cualquier otro punto. Las densidades de materia y energía son en promedio uniformes en el espacio. Finalmente se observa que el universo se expande. El análisis espectral de galaxias fuera de nuestro grupo local muestra que todas presentan un corrimiento al rojo. Interpretado como efecto Doppler en un espacio-tiempo plano, este fenómeno implica que todas las galaxias (excepto tal vez las mas cercanas) se estan alejando de nosotros. Mas aún, para aquellas galaxias suficientemente cercanas que su distancia puede ser medida, se observa que la velocidad V con que se alejan es proporcional a su distancia d: V = H0 d. (101) Esto se conoce como ley de Hubble, donde H0 ≈ 72 (Km/s)/M pc es la constante de Hubble (1 pc = 3,09× 1016 m, aproximadamente 3,26 años-luz). El alejamiento de todas las galaxias no implica necesariamente que somos el centro del universo. Por el contrario, se asume este fenómeno como una evidencia de la inexistencia de un centro y de la expansión del universo. Así, se asume que observadores en cualquier otra galaxia verían exactamente lo mismo que nosotros: todas las galaxias se alejan de él, y el alejamiento está controlado por la misma constante de Hubble. Para hacernos una idea, podemos pensar en la analogía de una universo plano como una plancha de goma que se estira uniformemente en todas las direcciones, con las galaxias siendo puntos fijados a esta superficie; alternativamente podemos pensar en la superficie de un globo de goma que se infla a velocidad constante. En cada una de estas situaciones, cada punto verá alejarse a todos los otros de sí mismo, sin haber ningún ”centro” o punto privilegiado del espacio. Mas allá de consideraciones filosóficas, esta hipótesis es consistente con la observación de homogeneidad e isotropía del espacio. Pero en última instancia, la verificación de la validez de la hipótesis reside en la confirmación experimental (formidable hasta el momento) de las consecuencias que se derivan de la misma. 5.3.2. Modelos cosmológicos: el big bang En base a las observaciones anteriores se propone un modelo para la geometría del universo a gran escala, en el cual se asume que la distribución de energía es uniforme, de manera que podemos pensar el sistema como un fluido de densidad, presión y temperatura constantes espacialmente. La expansión del universo del universo, por otra parte, nos dice que estas cantidades cambian en el tiempo, manteniendo la homogeneidad e isotropía espaciales. Se asume así que, para cada valor de t, el fluido se encuentra en equilibrio termodinámico. El elemento de línea consistente con estas características adopta entonces la forma (c = 1) ds2 = −dt2 + a2 (t)dL2 (102) donde a(t) es una función de la coordenada temporal llamado factor de escala y dL2 es un elemento de línea independiente del tiempo de una geometría espacial tridimensional homogenea e isotrópica. El ejemplo mas simple es una geometría euclidea plana tridimensional dL2 = dx2 + dy 2 + dz 2 = dr2 + r2 (dθ2 + sin2 θ dφ2 ) (103) El elemento de línea (102) define una familia de modelos cosmológicos conocidos como de FriedmanRobertson-Walker (FRW). Las galaxias en estos modelos pueden pensarse como partículas en este fluido cósmico, cuya localización esta descripta por las coordenadas xi (en el caso (103)). La velocidad dxi /dt debe anularse en este grado de aproximación (recordemos que estamos asumiendo un promedio espacial y temporal a grandes escalas), ya que de otro modo eso podría establecer una dirección preferencial, violando las suposición de isotropía. De acuerdo con esto, las coordenadas (x, y, z) (o las coordenadas espaciales que correspondan de acuerdo a (102)) son comoviles (como los distintos puntos de un cuerpo rígido): una galaxia individual tiene las mismas coordenadas xi para cualquier tiempo. Si a(t) aumenta con el tiempo, el elemento de línea (102) describe un universo que se expande. Para ver esto consideremos las líneas de mundo de dos galxias separadas por intervalos ∆x, ∆y, ∆z en la geometría (103). La distancia coordenada dcoord = ((∆x)2 + (∆y)2 + (∆z)2 )1/2 permanece constante en el tiempo. Pero la distancia física entre ellas a un tiempo t está dada por 33 d(t) = a(t)dcoord Si consideramos una galaxia a una distancia coordenada R de nosotros que nos envía señales luminosas de frecuencia ωe a un tiempo t = te , las cuales son recibidas por nosotros en un tiempo posterios t = t0 con una frecuencia ω0 , del análisis de las geodésicas nulas de acuerdo al elemento de línea (102)-(103) se obtiene que (queda como ejercicio para el lector) ω0 a(te ) = ωe a(t0 ) (104) En un universo que se expande, la frecuencia con que se reciben todas las señales luminosas es inferior a aquellas con que fueron emitidas. Este es el corrimiento al rojo cosmológico. Mas aún, para R pequeña y usando la relación para el efecto Doppler V /c = ∆λ/λ (donde λ es la longitud de onda), de la relación anterior se deriva la ley de Hubble (101) con H0 = ȧ(t0 ) a(t0 ) (105) donde ȧ denota una derivada respecto de t y t0 es el tiempo actual. Ahora bien, existe alguna otra posibilidad para un espacio homogeneo e isotrópico, además de la métrica plana (103)? Notablemente solo existen otras dos posibilidades. Una de ellas es la triesfera, esto es la generalización de una esfera en un hipotético espacio euclideo de cuatro dimensiones con coordenadas cartesianas (X, Y, Z, W ), definida por X2 + Y 2 + Z2 + W 2 = 1 Resulta conveniente para describir este espacio introducir la generalización de las coordenadas polares en cuatro dimensiones (con radio unitario) X Y Z W = = = = sin χ sin θ cos φ sin χ sin θ sin φ sin χ cos θ cos χ (106) (107) (108) (109) donde el rango de los ángulos polares es 0 ≤ χ ≤ π, 0 ≤ θ ≤ π y 0 ≤ φ ≤ 2π. Reemplazando en el elemento de línea para el espacio euclideo (X, Y, Z, W ): dS 2 = dX 2 + dY 2 + dZ 2 + dW 2 obtenemos dL2 = dχ2 + sin2 χ (dθ2 + sin2 θ dφ2 ) (110) Esta es la métrica de un espacio curvo tridimensional, homogeno e isotrópico: la triesfera. Este espacio se dice que es cerrado, ya que su volumen es finito y no tiene borde. Es el análogo tridimensional de la superficie de la esfera, que tiene área finita y no tiene borde. La geometría restante para un espacio tridimensional homogeneo e isotrópico se conoce como hiperboloide de Lorentz y es el conjunto de puntos en el espacio euclideo (X, Y, Z, W ) que satisfacen la ecuación: −W 2 + X 2 + Y 2 + Z 2 = −1 El análogo de las coordenadas polares para este espacio es 34 (111) X Y Z = sinh χ sin θ cos φ = sinh χ sin θ sin φ = sinh χ cos θ (112) (113) (114) W = cosh χ (115) donde el rango de las variables es 0 ≤ χ ≤ ∞, 0 ≤ θ ≤ π y 0 ≤ φ ≤ 2π. Cortes bidimensionales de este espacio para X, Y o Z constantes corresponden a hiperboloides de revolución, al igual que cortes de la triesfera coresponden a esferas. El elemento de línea en estas coordenadas resulta dL2 = dχ2 + sinh2 χ (dθ2 + sin2 θ dφ2 ) (116) El volúmen de este espacio es infinito y por lo tanto se denomina abierto. Los tres tipos de espacio también pueden ser caracterizados como aquellos espacios en los cuales la curvatura es la misma en cualquier punto. Introduciendo el cambio de variable r = sin χ para el espacio cerrado y r = sinh χ para el espacio abierto, podemos resumir las métricas de FRW en una sola expresión como · ¸ dr2 2 2 2 2 ds2 = −dt2 + a2 (t) + r (dθ + sin θ dφ ) (117) 1 − kr2 donde k = +1, 0, −1 corresponde a los espacios cerrado, plano y abierto respectivamente. Vemos que la métrica esta casi enteramente determinada por restricciones de simetría, excepto por el factor de escala a(t). Si se introduce la expresión anterior en las ecuaciones de Einstein para un fluido de densidad de energía y presion uniformes ρ(t) y p(t) se obtienen las siguientes ecuaciones d(ρ a3 ) d(a)3 = −p dt dt (118) 8π 2 ρ a = −k (119) 3 donde la relación entre p y ρ viene dada por la ecuación de estado del fluido. La Ec.(118) tiene una interpretación muy directa. Tomemos un pequeño volúmen en el espacio coordenado ∆Vcoord (por ej., en la métrica plana en coordenadas cartesianas ∆Vcoord = ∆x ∆y ∆z) y consideremos un intervalo de tiempo infinitesimal dt. El volumen físico viene dado por ∆V = a3 ∆Vcoord . ∆Vcoord es independiente de t, ya que las coordenadas espaciales son comoviles. Así, multiplicando la Ec.(118) por ∆Vcoord obtenemos ȧ2 − d(ρ∆V) = d(∆E) = −p d(∆V) donde ∆E es la energía contenida en ∆V. El lado derecho de la ecuación anterior es el trabajo realizado al expandirse ∆V. Si tomamos en cuenta que en equilibrio termodinámico el flujo de calor en todo punto debe ser nulo (de otro modo se generarían inhomogeneidades) la Ec.(118) no es mas que la primera ley de la termodinámica. Dada la eccuación de estado del fluido, esta nos permite obtener la densidad en función de a. Por ejemplo, supongamos que solo tenemos materia (galaxias). En general se observa que las galaxias se mueven aleatoriamente con velocidades bastante bajas. Esto hace que la energía cinética de las mismas sea despreciable frente a la energía debida a la masa en reposo. Esto corresponde a un fluido sin presión p = 0 (o bien a temperatura nula T = 0). De la Ec.(118) tenemos que ρm a3 = cte o bien ρm (t) = ρm (t0 ) a(t0 )3 a(t)3 (120) Para el caso de un universo compuesto exclusivamente por radiación, la ecuación de estado para un cuerpo negro nos dice que 35 pr = 1 ρr . 3 (121) Reemplazando en la Ec.(118) es facil ver que ρr (t) = ρr (t0 ) a(t0 )4 a(t)4 (122) La Ec.(119) se conoce como ecuación de Friedman. Ante de resolverla notemos lo siguiente. Si la dividimos por a2 , la evaluamos en t = t0 (el tiempo actual) y comparamos con la Ec.(105) obtenemos H02 − 8π k ρ0 = − 2 3 a (t0 ) donde ρ0 ≡ ρ(t0 ). Definiendo la densidad crítica ρc = 3H02 8π (123) podemos reescribir la ecuación anterior como · ¸ ρ0 k H02 1 − =− 2 ρc a (t0 ) (124) Esta relación implica que, si la densidad actual de energía es ρ0 > ρc el universo es cerrado (k = +1); si ρ0 < ρc el universo es abierto (k = −1). ρ0 = ρc es el caso límite entre ambas situaciones anteriores y corresponde a un universo plano (k = 0). Esta predicción es notable. Determinando solo dos cantidades (H0 y ρ0 , ambas accesibles experimentalmente) podemos conocer la geometría del universo! Mas notable aún es el hecho de que toda la evidencia experimental al presente indica que el universo es aproximadamente plano (justamente el caso límite). Volviendo a la solución de la Ec.(119), consideremos el caso de un universo dominado por materia (ρ = ρm ) y tomemos por simplicidad el caso k = 0. Reemplazando la Ec.(120) en la ecuación de Friedman y usando la normalización a(t0 ) = 1 obtenemos ȧ2 − H02 =0 a cuya solución es ¸2/3 3 . a(t) = 1 + H0 (t − t0 ) 2 · Esta solución se anula a = 0 para un cierto tiempo t pasado; tomando t0 = 2/3H0 (lo caul equivale a elegir el orígen t = 0 como aquel en el cual a = 0) la expresión anterior puede escribirse como µ a(t) = t t0 ¶2/3 (125) Para el caso de un universo dominado por radiación ρ = ρr se obtiene en forma semejante µ a(t) = t t0 ¶1/2 (126) con t0 = 1/2H0 . Vemos que en ambas situaciones existe un tiempo pasado proporcional a tH = 1/H0 (conocido como tiempo de Hubble) para el cual el factor de escala se anula. Incluso puede verse que esto sucede para cualquier combinación lineal de densidades de materia y radiación, inclusive en el caso de geometrías curvas (k 6= 0). Pero esto corresponde a una densidad y temperaturas infinitas, es decir, a una singularidad física. Esto es el Big Bang. A diferencia de lo que ocurre en una agujero negro, esta singularidad 36 Figura 12: . Factor de escala para geometrías curvas k = +1 (panel izquierdo) y k = −1 (panel derecho), en un universo dominado por materia, para diferentes valores de Ω ≡ ρ0 /ρc . no posee un horizonte de eventos: podemos "ver” hacia atras toda la evolución hasta llegar a la singularidad. Esta última expresión es bastante literal: el fondo de radiación cósmica que vemos en la actualidad es luz proveniente de los primeros instantes posteriores al big bang. Como ya hemos mencionado en el caso de agujeros negros, una singularidad representa el límite de validez de la teoría. La propia noción clásica de geometría del espacio-tiempo deja de tener sentido en la singularidad. Mas aún, la densidad y temperatura extremas predichas por la teoría en los primeros instantes posteriores al big bang nos llevan al reino de las partículas de altas energías, reino eminentemente cuántico que, al menos hasta el presente, resulta incompatible con la relatividad general. Por ejemplo, si corremos la película hacia atras en el tiempo, con la temperatura y la densidad aumentando, llegará un punto en el cual la energía térmica kB T superará las energías de disociación de moléculas y átomos. Todas las moléculas y átomos resultan ionizados, dando lugar a un plasma de electrones y nucleos. Si continuamos hacia atrás, llegará un punto en el cual los nucleos se disociarán en protones y neutrones. Un poco mas y los protones y neutrones se disocirán en quarks y gluones (partículas elementales que los componen), dando lugar a una sopa de partículas elementales infernalmente caliente. Corriendo la película ahora en sentido inverso, pero usando todo el conocimiento presente del modelo standard de partículas elementales, es posible entonces hacer predicciones acerca de que debería observarse en el presente, en mediciones tales como el espectro de radiación electromagnética de fondo, la abundancia relativa de las diferentes partículas elementales, etc. Notablemente todas las predicciones han sido verificadas hasta el presente. Este enorme grado de consistencia en el rompecabezas que involucra gran parte del conocimiento de la física actual, sustenta la enorme aceptación del big bang como explicación del fenómeno natural mas alejado de cualquier experiencia humana: el orígen del universo. Un elemento que no hemos tenido en cuenta hasta ahora es la energía del vacío. De hecho, las observaciones indican esta contribución a la energía total es dominante (alrededor del 70 %). Si se reemplaza la densidad ρ = ρv = cte en la ecuación de Friedman, se obtiene un comportamiento exponencial a(t) = exp[H0 (t − t0 )], de manera que esta solución no presenta big bang. No obstante, una densidad constante resulta despreciable en un tiempo pasado en el cual las densidades de materia y radiación divergen. Finalmente veamos que ocurre con las geometrías curvas. En la Fig.12 se ejemplifica soluciones típicas de la evolución de a(t) para los universos cerrado y abierto, en el caso dominado por materia ρ = ρm . En todos los casos existe un big bang. La gran diferencia radica en el comportamiento a tiempos grandes. En el caso de un universo cerrado la expansión presenta un máximo, seguido de una contracción que culmina en una nueva singularidad (llamada "big crunch”, o gran colapso). En el caso de un universo abierto la expansión continua indefinidamente, al igual que en el caso plano. 37