Astrodinámica Alberto Abad ©As t r o d i n á mi c a ©Al b e r t oAb a d , 2 0 1 2 Gr u p od eMe c á n i c aEs p a c i a l Un i v e r s i d a dd eZa r a g o z a Za r a g o z a . Sp a i n . e ma i l :a b a d @u n i z a r . e s we b :h t t p : / / g me . u n i z a r . e s I SBNp a p e l :9 7 8 8 4 6 8 6 2 8 5 7 8 Ed i t o rBu b o kPu b l i s h i n gS. L. I mp r e s oe nEs p a ñ a / Pr i n t e di nSp a i n iii Para Pili, Pablo, Cristina, Cari y Alejo. iv Índice general Prólogo y agradecimientos I XI Sistemas de referencia en Astrodinámica 1 1 Sistemas de referencia en IR3 1.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 El espacio afı́n IR3 : sistemas de referencia . . . . . . . . . 1.3 Producto escalar: IR3 como espacio euclı́deo . . . . . . . . 1.4 Ángulos y funciones circulares inversas . . . . . . . . . . . 1.5 Producto vectorial y mixto . . . . . . . . . . . . . . . . . 1.6 Sistemas de referencia ortonormales . . . . . . . . . . . . 1.7 Otras propiedades de los distintos productos de vectores . 1.8 Ángulo orientado entre dos vectores . . . . . . . . . . . . 1.9 Coordenadas cartesianas y polares . . . . . . . . . . . . . 1.10 Trigonometrı́a esférica . . . . . . . . . . . . . . . . . . . . 1.10.1 Fórmulas de Bessel . . . . . . . . . . . . . . . . . . 1.10.2 Regla del pentágono de Neper . . . . . . . . . . . . 1.10.3 Analogı́as de Neper . . . . . . . . . . . . . . . . . . 1.10.4 Algoritmo para la resolución de triángulos esféricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 4 4 5 8 9 11 12 14 16 18 20 21 22 2 Cambios del sistema de referencia: rotaciones 2.1 Introducción . . . . . . . . . . . . . . . . . . . . 2.2 Rotaciones en IR3 . . . . . . . . . . . . . . . . . 2.3 Composición de rotaciones . . . . . . . . . . . . 2.4 Rotación de un vector alrededor de un eje . . . 2.5 Rotaciones elementales . . . . . . . . . . . . . . 2.6 Ángulos de Euler . . . . . . . . . . . . . . . . . 2.7 Rotaciones y cuaternios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 25 26 28 29 30 32 33 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Fundamentos de los sistemas de referencia en el espacio 37 3.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.2 Sistema de referencia horizontal . . . . . . . . . . . . . . . . . . . . 39 3.3 Sistema de referencia horario . . . . . . . . . . . . . . . . . . . . . 41 v Índice general vi 3.4 3.5 3.6 3.7 3.8 . . . . . . . . . . . . . . . . . . . . 42 42 43 45 50 4 Sistemas de referencia espaciales precisos 4.1 Movimientos del polo y del equinoccio . . . . . . . . . . . . . 4.2 Sistemas de referencia espaciales precisos . . . . . . . . . . . . 4.3 Transformaciones entre sistemas de referencia precisos . . . . 4.3.1 Movimiento del polo . . . . . . . . . . . . . . . . . . . 4.3.2 Cambios de origen en el ecuador intermedio . . . . . . 4.3.3 Precesión . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.4 Nutación . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.5 Tratamiento actual de la precesión y nutación . . . . . 4.3.6 Desviación entre los sistemas E oo y SG . . . . . . . . . 4.3.7 Transformación general de coordenadas . . . . . . . . 4.4 Relación de los sistemas precisos con los sistemas idealizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 53 57 60 62 64 65 67 68 70 71 71 5 Referencia temporal 5.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Relojes basados en la rotación terrestre . . . . . . . . . . . . 5.2.1 Tiempo sidéreo . . . . . . . . . . . . . . . . . . . . . . 5.2.2 Ángulo de rotación terrestre . . . . . . . . . . . . . . . 5.2.3 Tiempo solar y tiempo medio . . . . . . . . . . . . . . 5.2.4 Tiempo universal . . . . . . . . . . . . . . . . . . . . . 5.3 Movimiento orbital de la Tierra: el año . . . . . . . . . . . . 5.4 Relación entre el tiempo sidéreo y el tiempo medio . . . . . . 5.5 Escalas de tiempo uniforme . . . . . . . . . . . . . . . . . . . 5.5.1 Tiempo de efemérides y tiempo atómico internacional 5.5.2 Tiempo universal coordinado . . . . . . . . . . . . . . 5.5.3 Tiempo de zona y tiempo oficial . . . . . . . . . . . . 5.6 Escalas modernas de tiempo . . . . . . . . . . . . . . . . . . . 5.7 Tiempos coordenada . . . . . . . . . . . . . . . . . . . . . . . 5.8 Calendario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.9 Determinación de una época . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 73 75 75 77 77 79 81 82 84 84 86 88 88 90 90 91 II Sistema de referencia ecuatorial . . . . . . . . . . . Sistema de referencia eclı́ptico . . . . . . . . . . . . Relación entre los sistemas de referencia espaciales Sistema de referencia geográfico . . . . . . . . . . . Sistema de referencia planetográfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Movimiento kepleriano 6 Revisión de elementos de dinámica clásica 6.1 Introducción . . . . . . . . . . . . . . . . . . 6.2 Movimiento de una masa puntual . . . . . . 6.3 Sistemas inerciales y no inerciales . . . . . 6.4 Movimiento de una partı́cula en su plano . 95 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 . 97 . 97 . 99 . 101 Índice general 6.5 6.6 6.7 6.8 vii Sistemas dinámicos . . . . . . . . . . . . Ecuaciones de Lagrange y de Hamilton . Transformaciones canónicas . . . . . . . Ecuación de Hamilton–Jacobi y ecuación . . . . . . de . . . . . . . . . . . . . . . . . . Delaunay . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 104 105 107 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 109 109 110 111 112 112 113 115 116 118 8 Integración del problema kepleriano 8.1 Modelo orbital kepleriano . . . . . . . . . . . . . . . . . . . 8.2 Primeras integrales . . . . . . . . . . . . . . . . . . . . . . . 8.3 Deducción de la primera y segunda leyes de Kepler . . . . . 8.4 Tercera ley de Kepler: unidades . . . . . . . . . . . . . . . . 8.5 Ley horaria del movimiento . . . . . . . . . . . . . . . . . . 8.5.1 Formulación regularizada del movimiento kepleriano 8.5.2 Caso parabólico . . . . . . . . . . . . . . . . . . . . . 8.5.3 Caso elı́ptico . . . . . . . . . . . . . . . . . . . . . . 8.5.4 Resolución de la ecuación de Kepler . . . . . . . . . 8.5.5 Caso hiperbólico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 123 124 126 129 130 131 133 134 136 138 7 Movimiento kepleriano 7.1 Introducción . . . . . . . . . . . . 7.2 Leyes de Kepler . . . . . . . . . . 7.3 Propiedades de las cónicas . . . . 7.3.1 Elipses: 0 e < 1 . . . . . 7.3.2 Parábolas: e = 1 . . . . . 7.3.3 Hipérbolas: e > 1 . . . . . 7.4 Ley de gravitación de Newton . . 7.5 Problema de dos cuerpos . . . . . 7.6 Movimiento relativo o kepleriano 7.7 Funciones f y g de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Órbitas keplerianas 141 9.1 Caracterización de las órbitas keplerianas . . . . . . . . . . . . . . 141 9.2 Elementos orbitales ordinarios . . . . . . . . . . . . . . . . . . . . . 143 9.3 Variables no singulares . . . . . . . . . . . . . . . . . . . . . . . . . 145 9.4 Sistemas de referencia orbitales . . . . . . . . . . . . . . . . . . . . 146 9.4.1 Sistema espacial . . . . . . . . . . . . . . . . . . . . . . . . 146 9.4.2 Sistema nodal–espacial . . . . . . . . . . . . . . . . . . . . . 147 9.4.3 Sistema nodal . . . . . . . . . . . . . . . . . . . . . . . . . . 147 9.4.4 Sistema apsidal . . . . . . . . . . . . . . . . . . . . . . . . . 149 9.4.5 Sistema orbital . . . . . . . . . . . . . . . . . . . . . . . . . 149 9.4.6 Sistema de Frenet . . . . . . . . . . . . . . . . . . . . . . . 150 9.5 Relaciones entre el vector de estado y los elementos orbitales . . . 151 9.5.1 Determinación de la órbita a partir de las condiciones iniciales152 9.5.2 Cálculo de efemérides . . . . . . . . . . . . . . . . . . . . . 153 9.6 Intersección de dos órbitas keplerianas . . . . . . . . . . . . . . . . 154 9.6.1 Pertenencia de un punto a una órbita . . . . . . . . . . . . 154 Índice general viii 9.6.2 Intersección de órbitas no coplanarias . . 9.6.3 Intersección de órbitas coplanarias . . . . 9.6.4 Colisiones . . . . . . . . . . . . . . . . . . Variaciones de los sistemas de referencia . . . . . Variables polares–nodales . . . . . . . . . . . . . Variables de Delaunay en el movimiento elı́ptico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 155 157 157 158 160 10 Formulación universal del problema kepleriano 10.1 Introducción . . . . . . . . . . . . . . . . . . . . . 10.2 Funciones V de Stump↵ . . . . . . . . . . . . . . 10.3 Funciones V0 , V1 . . . . . . . . . . . . . . . . . . 10.4 Formulación universal del problema kepleriano . 10.5 Coeficientes de transición en forma cerrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 163 163 168 169 172 11 Órbitas keplerianas que pasan por dos puntos 11.1 Problema de transferencias orbitales y problema de Lambert . 11.2 Órbitas de transferencia . . . . . . . . . . . . . . . . . . . . . . 11.2.1 Plano de la órbita . . . . . . . . . . . . . . . . . . . . . 11.2.2 Ángulo de transferencia . . . . . . . . . . . . . . . . . . 11.3 Elementos del triángulo OP1 P2 . . . . . . . . . . . . . . . . . . 11.4 Hodógrafa en P1 y P2 . . . . . . . . . . . . . . . . . . . . . . . 11.5 Órbitas de energı́a mı́nima . . . . . . . . . . . . . . . . . . . . . 11.6 Órbitas de energı́a h > hm . . . . . . . . . . . . . . . . . . . . . 11.7 Conjunto de las órbitas que pasan por dos puntos . . . . . . . . 11.8 Tiempo de tránsito . . . . . . . . . . . . . . . . . . . . . . . . . 11.9 Órbitas keplerianas que pasan por dos puntos en dos instantes . . . . . . . . . . . . . . . . . . . . . . 175 175 176 177 177 177 179 182 182 185 186 187 9.7 9.8 9.9 III Movimiento orbital 189 12 Movimiento orbital 12.1 Ecuaciones del movimiento orbital . . . . . . . . . . . . 12.2 Ecuaciones de Lagrange . . . . . . . . . . . . . . . . . . 12.3 Ecuaciones de Gauss . . . . . . . . . . . . . . . . . . . . 12.4 Perturbaciones de corto y largo periodo y seculares . . . 12.5 Método de aproximaciones sucesivas . . . . . . . . . . . 12.6 Perturbaciones de primer orden en el movimiento orbital 12.7 Propagadores orbitales . . . . . . . . . . . . . . . . . . . 12.8 Propagador SGP4/SDP4 y variables TLE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 191 192 195 197 198 199 200 203 13 Problema de n cuerpos 13.1 Formulación del problema de n cuerpos . . 13.2 Modelo planetario . . . . . . . . . . . . . . 13.3 Perturbación luni-solar del satélite artificial 13.4 Problema de tres cuerpos . . . . . . . . . . 13.4.1 Problema restringido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 207 209 210 211 211 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Índice general ix 13.4.2 Problema restringido circular . . . . . . . . . . . . . . . . . 212 13.4.3 Puntos de Lagrange . . . . . . . . . . . . . . . . . . . . . . 213 13.4.4 Curvas de velocidad cero . . . . . . . . . . . . . . . . . . . 216 14 Atracción de sólidos 14.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . 14.2 Polinomios de Legendre . . . . . . . . . . . . . . . . . . 14.3 Potencial gravitatorio de un planeta . . . . . . . . . . . 14.4 Modelos de potencial gravitatorio . . . . . . . . . . . . . 14.5 Evaluación del potencial planetario y la fuerza derivada 14.6 Potencial terrestre en variables polares nodales . . . . . 14.7 Ecuaciones del movimiento en el sistema planetográfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 219 220 223 226 228 230 231 15 Otras perturbaciones 15.1 Rozamiento atmosférico . . . . . . . . . . . . . . 15.2 Presión de radiación solar . . . . . . . . . . . . . 15.3 Eclipses . . . . . . . . . . . . . . . . . . . . . . . 15.3.1 Semidiámetros y distancia angular . . . . 15.3.2 Condiciones para un eclipse . . . . . . . . 15.3.3 Área de un segmento circular . . . . . . . 15.3.4 Magnitud del eclipse . . . . . . . . . . . . 15.3.5 Eclipses en satélites artificiales terrestres . 15.4 Perturbaciones relativistas . . . . . . . . . . . . . 15.5 Perturbaciones empı́ricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 235 239 241 241 242 243 245 246 247 248 IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Navegación espacial 16 Navegación espacial 16.1 Introducción . . . . . . . . . . . . . . . . 16.2 Satélites artificiales terrestres . . . . . . 16.2.1 Satélites de comunicaciones . . . 16.2.2 Satélites de navegación . . . . . . 16.2.3 Satélites de observación terrestre 16.2.4 Satélites cientı́ficos . . . . . . . . 16.2.5 Estaciones espaciales . . . . . . . 16.2.6 Vehı́culos de transporte de carga 16.2.7 Basura espacial . . . . . . . . . . 16.3 Navegación interplanetaria . . . . . . . . 16.3.1 Viajes a la Luna . . . . . . . . . 16.3.2 Viajes a Marte . . . . . . . . . . 16.3.3 Exploración del sistema solar . . 249 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 251 253 254 255 257 258 259 260 262 263 264 266 267 Índice general x 17 Órbitas de satélites artificiales terrestres 17.1 Movimiento del satélite sobre la superficie terrestre . . . 17.1.1 La órbita en la superficie terrestre: traza . . . . . 17.1.2 Visibilidad de un satélite desde una estación . . . 17.2 El problema principal del satélite . . . . . . . . . . . . . 17.3 Efectos sobre el satélite de otras perturbaciones . . . . . 17.4 Clasificación de los satélites artificiales según su órbita . 17.4.1 Órbitas bajas (LEO) . . . . . . . . . . . . . . . . 17.4.2 Órbitas medias (MEO) . . . . . . . . . . . . . . 17.4.3 Órbitas geoestacionarias (GEO) . . . . . . . . . 17.4.4 Satélites Molniya y Tundra . . . . . . . . . . . . 17.4.5 Satélites heliosı́ncronos . . . . . . . . . . . . . . . 17.4.6 Órbitas de transferencia geoestacionarias (GTO) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 271 272 276 278 279 281 281 282 282 283 284 285 18 Maniobras orbitales 18.1 Introducción . . . . . . . . . . . . . . . . . 18.2 La velocidad y la navegación espacial . . . 18.3 Propulsión de naves espaciales . . . . . . . 18.4 Lanzamiento de satélites artificiales . . . . 18.5 Corrección de órbitas . . . . . . . . . . . . 18.5.1 Corrección general de la órbita . . 18.5.2 Cambio del plano orbital . . . . . 18.5.3 Corrección de la órbita en su plano 18.5.4 Cambio de la forma de la órbita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 287 287 290 295 301 302 302 305 306 19 Transferencias y encuentros orbitales 19.1 Transferencias orbitales . . . . . . . . . . . . . . . . . . . 19.1.1 Transferencias de Hohmann y bielı́ptica . . . . . . 19.1.2 Transferencia óptima en dos maniobras . . . . . . 19.2 Encuentros orbitales . . . . . . . . . . . . . . . . . . . . . 19.2.1 Maniobra de espera . . . . . . . . . . . . . . . . . 19.2.2 Encuentro directo en transferencias generales . . . 19.2.3 Encuentros en transferencias de Hohmann . . . . . 19.3 Viaje a Marte en una órbita de transferencia de Hohmann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 309 310 314 315 316 317 318 321 20 Navegación interplanetaria 20.1 Sondas espaciales . . . . . . . . . . . . . . . . . . 20.2 Esfera gravitacional de influencia . . . . . . . . . 20.3 Salida del campo gravitacional de un planeta . . 20.4 Entrada en el campo gravitacional de un planeta 20.5 Impulso gravitacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323 323 325 327 329 332 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bibliografı́a 335 Índice alfabético 337 Prólogo y agradecimientos La Tierra es la cuna de la inteligencia, pero no se puede vivir siempre en una cuna. Konstantin E. Tsiokovsky, 1911. La tecnologı́a espacial es responsable de una buena parte de los avances tecnológicos actuales. La investigación y desarrollo en cuestiones cientı́ficas y técnicas relativas a los satélites artificiales y la navegación espacial resultan fundamentales para un rápido avance cientı́fico y tecnológico. Son muchas las actividades cotidianas que no podrı́amos realizar de no existir satélites artificiales orbitando alrededor de la Tierra. En efecto, en las noticias de televisión son frecuentes las conexiones con paı́ses de otros continentes; recibimos canales de televisión a través de las antenas parabólicas; hablamos con otros paı́ses por teléfono con igual o mejor cobertura que en la misma ciudad; vemos fotografı́as de las borrascas, lo que permite la predicción del tiempo; sabemos los minutos que faltan hasta que llegue el próximo autobús; tenemos información de los minutos y segundos que lleva de ventaja el ciclista escapado sobre el pelotón que lo persigue, etc. Además, hay otros usos más sofisticados, como el poder obtener imágenes de galaxias extremadamente alejadas, hacer un seguimiento del avance de la desertificación en los Monegros, una estimación de la nieve acumulada en el Pirineo, localización de una colonia de linces ibéricos, detectar bancos de pesca, o hacer llegar la educación a lugares remotos, como la selva brasileña, por poner unos cuantos ejemplos. Pero todas estas posibilidades son relativamente recientes; el primer satélite artificial, el Sputnik I se lanzó en 1957. La era espacial, en el momento de escribir estas lı́neas, no tiene más que 55 años. Uno de los aspectos fundamentales para el éxito de una misión artificial es el xii establecimiento de una órbita precisa que le permita desarrollar, durante el mayor periodo de tiempo posible, la misión para la que ha sido concebido. Los fundamentos del análisis del movimiento orbital de los satélites artificiales, ası́ como el de otras naves espaciales cuyo propósito sea la exploración del espacio exterior, se basan en las consecuencias de la ley de gravitación universal enunciada por Newton. Esta ley, que determina el movimiento de cualquier cuerpo en el espacio, natural o artificial, dio lugar a la Mecánica Celeste, que nació como la disciplina cientı́fica que estudia el movimiento de planetas, cometas, asteroides y cualquier otro cuerpo sometido a la ley de gravitación de Newton. Las caracterı́sticas especiales de alguno de los problemas dinámicos planteados en el estudio de las órbitas de los satélites artificiales llevaron a definir una nueva disciplina cientı́fica, la Astrodinámica, heredera de la Mecánica Celeste, que estudia principalmente el movimiento en el espacio de los objetos artificiales. Aunque la causa fundamental del movimiento sigue siendo la ley de gravitación de Newton, en Astrodinámica hay que considerar otro tipo de fuerzas no gravitacionales que modifican las consecuencias de esta ley. Por otro lado, la Astrodinámica añade a la Mecánica Celeste un nuevo problema, como es el diseño de complejas trayectorias para las naves espaciales que les permitan realizar, con las limitaciones energéticas actuales, cualquier recorrido por el sistema solar. El presente libro pretende dar una visión general de los principales puntos que aborda la Astrodinámica, para ello se ha dividido en cuatro partes: sistemas de referencia, movimiento kepleriano, movimiento orbital y navegación espacial. En la primera parte del libro se aborda un problema previo a la navegación espacial, la determinación precisa de la posición y velocidad de un cuerpo en el espacio. En primer lugar se realiza un repaso de una serie de herramientas básicas, que van, desde el concepto de ángulo y vector, hasta el de sistema de referencia y el estudio de las rotaciones de estos sistemas. Una vez establecidos los conceptos básicos se pasa al estudio de los sistemas de referencia astronómicos considerando las variaciones de estos sistemas debidas a los pequeños movimientos de los planos fundamentales del ecuador y la eclı́ptica. En este punto se han introducido todas las recomendaciones y normas dictadas por la Unión Astronómica Internacional (IAU) en el año 2000, y en vigor desde el año 2003, que vienen a modificar las teorı́as de la precesión y nutación de los años 1976 y 1980. Finalmente se estudia el parámetro que actúa de variable independiente en las teorı́as dinámicas, esto es, el tiempo. Puesto que cualquier misión espacial establecerá su referencia temporal a través de un reloj, se estudian los distintos tipos de relojes y tiempos que nos da la Astronomı́a. En la segunda parte del libro se estudia en profundidad el movimiento kepleriano. Las leyes de Kepler describen el comportamiento de la solución de un modelo teórico basado en el movimiento relativo de dos masas puntuales que interaccionan gravitacionalmente de acuerdo con la ley de Newton. No solo se integra el problema, sino que se realiza un estudio cualitativo exhaustivo del mismo, que es necesario para comprender la complejidad del modelo orbital real. Se analiza la geometrı́a de este movimiento, ası́ como distintos conjuntos de variables que lo xiii describen y varios sistemas de referencia asociados a las órbita keplerianas. Finalmente se estudia el problema de contorno consistente en el análisis del conjunto de órbitas keplerianas que pasan por dos puntos. La tercera parte trata del modelo orbital real. Se analizan los distintos efectos que pueden modificar una órbita kepleriana: forma no esférica de la Tierra y de los planetas; atracción gravitacional de otros cuerpos; frenado atmosférico; presión de radiación solar; efectos relativistas; etc. Se estudia la formulación del problema de tres cuerpos, que es el siguiente en complejidad al modelo kepleriano de dos cuerpos, y se analiza un caso particular, el problema restringido, que determina muchas de las caracterı́sticas dinámicas de la navegación interplanetaria. Finalmente, se obtienen las ecuaciones que permiten estudiar los modelos de movimiento orbital a partir de aproximaciones al modelo kepleriano. La parte final aborda los aspectos que se refieren a la navegación espacial, tanto de satélites artificiales como de sondas interplanetarias. El primer capı́tulo de esta parte analiza la historia del primer medio siglo de navegación espacial, no tanto desde un punto de vista cronológico, sino describiendo la historia de cada tipo de misión, procurando dar de esta forma una visión más coherente de la industria espacial actual. Se estudian por separado los satélites artificiales y la navegación interplanetaria. En los primeros se analiza la interacción entre éstos y la Tierra, que condiciona el tipo de misión en función de las zonas de la Tierra que el satélite sobrevuela. También se estudian los distintos tipos de maniobras, incluido el lanzamiento, que permiten modificar una órbita; ası́ como las trasferencias orbitales, o conjunto de maniobras que conectan órbitas sin un punto en común. El último capı́tulo estudia los conceptos básicos para el diseño de las trayectorias interplanetarias a partir de la unión de fragmentos de órbitas keplerianas. El presente libro ha sido escrito después de muchos años de estar encargado de la docencia de las asignaturas de Astronomı́a y Mecánica Celeste de la licenciatura de Matemáticas en la Universidad de Zaragoza. Parte de las notas escritas como consecuencia de dicha docencia se plasmaron en un libro titulado Curso de Astronomı́a y escrito en colaboración con José Angel Docobo y Antonio Elipe. A ellos quiero agradecer el uso, en éste libro, de ciertas partes del anterior, con objeto de dejar cerrados algunos temas. De esta forma, el lector interesado únicamente en Astrodinámica no tendrá la necesidad de navegar en otro libro más orientado a la Astronomı́a. Con este libro he intentado llenar una laguna en la literatura en español de temas de Astrodinámica, pues son muy escasos los libros de estas caracterı́sticas que pueden encontrarse en las librerı́as. Escribir el libro en español me ha hecho reflexionar sobre la adaptación de los términos cientı́ficos a nuestra lengua y me ha conducido a unas consideraciones sobre terminologı́a que, equivocadas o no, he intentado plasmar en el libro. En este punto quiero agradecer a mi colega Luis Florı́a sus fructı́feras e ilustrativas conversaciones sobre el tema. El inglés se ha convertido en la lengua común de la ciencia, es por ello corriente que determinados xiv términos no se traduzcan o la traducción sea poco meditada. Al escribir este libro he intentado utilizar una terminologı́a que se adapte al máximo a las palabras y conceptos del español y a su significado cientı́fico. Esto debe ayudar a realizar una correcta interpretación de dichos términos cuando se pretende hacer divulgación de temas especializados a personas no expertas en la materia o no familiarizadas con la literatura técnica escrita en inglés. Ası́, en este libro he usado palabras no estándar como cónicas enlazadas en lugar de patched conics, órbitas de aproximación en lugar de flyby o swingby, etc. Al final de la obra, en el ı́ndice alfabético se han incorporado algunos de estos términos comunes en inglés con una indicación de la traducción usada en el libro. También resulta relacionado con el lenguaje otro aspecto que podrı́a no mencionar y dejar pasar desapercibido pero del que prefiero que quede constancia escrita. Ası́ como he intentado ser riguroso en la elección de la terminologı́a en español y por adelantado pido excusas por los posibles fallos cometidos en este empeño, también he prescindido de una norma de nuestro lenguaje que creo debe ser modificada. Es norma del español usar la coma como separador de la parte decimal de un número. A este respecto, creo firmemente que el lenguaje matemático, que es un lenguaje universal, debe estar por encima de cualquier localismo que únicamente lo dificulta. Aunque es bien cierto que la coma o el punto únicamente constituyen dos formas diferentes de representación de un mismo concepto, que es el número real, es también útil disponer de un representación universal que sea interpretada en la misma forma por cualquier persona. Por ello he optado por el uso del punto en lugar de la coma como separador decimal. La escritura de un libro de texto cientı́fico requiere la realización de profundas revisiones para garantizar la calidad del producto final. Sin embargo, la experiencia me indica que en cada revisión (no profesional) de un texto del tamaño de éste, siempre se encuentran nuevas erratas. No pienso que este libro quede totalmente exento de las mismas, por lo que intentaré, dentro de lo posible, informar al lector de todas las que se vayan encontrando después de la edición definitiva. Para ello puede consultarse la página web: gme.unizar.es/pages/libroastrodinamica, donde se informará, periódicamente, de las mismas, ası́ como de toda información útil relacionada con el libro. A lo largo del próximo año aparecerá también, como se menciona en el capı́tulo 12, el software Orbits, paquete de Mathematica que complementa este libro. En la página web: gme.unizar.es/software/orbits, aparecerán instrucciones sobre su descarga y uso. Quiero terminar este prólogo entrando en el apartado de agradecimientos. Es difı́cil intentar agradecer en unas pocas lı́neas a todos cuantos, de alguna forma, han colaborado, directa o indirectamente, en la escritura de este libro, al fin y al cabo, la escritura del libro está ı́ntimamente relacionada con una trayectoria profesional de más de 30 años. Por otro lado, quiero ser breve y no deseo olvidarme de nadie, ası́ que comenzaré con un agradecimiento genérico a todos los miembros del Grupo de Mecánica Espacial de la Universidad de Zaragoza y a todos los colegas y amigos de las Universidades de La Rioja, Santiago de Compostela, Murcia, Cartagena, Pamplona y del Real Observatorio de la Armada. xv Por otra parte, es de justicia escribir unas lineas aparte, y muy destacadas, para todos los miembros del grupo APSIDE (Asociación para la Promoción Social de la Investigación y el Desarrollo Espacial), sección aragonesa del proyecto SSETI (Student Space Exploration and Technology Initiative) a quienes dedico de manera especial este libro y que son quienes, de alguna forma, me han creado la obligación moral de escribirlo, terminarlo e intentar que sea una herramienta útil para todos aquellos estudiantes interesados en la industria espacial. El proyecto SSETI nació hace unos años como una iniciativa de la Agencia Espacial Europea (ESA) para formar a jóvenes estudiantes en el ámbito espacial. El proyecto pretendı́a agrupar universidades de toda Europa formando equipos que serı́an capaces de diseñar, construir y lanzar satélites. La novedad consistı́a en que todo el proyecto estarı́a dirigido y formado exclusivamente por estudiantes, contando con el apoyo de expertos de la Agencia y profesores de las universidades. Como primer objetivo se planteó la construcción y envı́o al espacio del satélite ESEO (European Student Earth Orbiter). Itziar Barat y Rubén Castro, estudiantes de la Facultad de Ciencias de la Universidad de Zaragoza, asumieron el liderazgo de un grupo de compañeros de las licenciaturas de Matemáticas y Fı́sicas y se encargaron del análisis de misión de ESEO, es decir, el diseño de la órbita y de todos los aspectos astrodinámicos derivados de la misma. Además convencieron a Antonio Elipe, que fue decano de la Facultad de Ciencias y Director del Instituto de Matemáticas y Aplicaciones de Aragón, y a mi mismo, para actuar como profesores tutores del proyecto Los miembros del SSETI han ido cambiando, en su mayor parte por terminar sus estudios de licenciatura. A lo largo de estos años varias generaciones de estudiantes han ido desarrollando sin desánimo el proyecto. Además de los ya mencionados debo nombrar también a Isaac Toda y Eva Tresaco en la segunda generación, a Julia Marı́n-Yaseli, David Vicente y Alejandro Vaquero en la tercera y el último por ahora, Jonatan Peris, que ha conseguido que la llama de la ilusión no se extinga. No son los únicos y ruego al resto de sus compañeros que me perdonen y que hagan suyo mi homenaje a todo el grupo. La falta de estabilidad de los grupos, que necesariamente debı́an cambiar algunos miembros cada año, hicieron ver a los organizadores de la ESA que los objetivos iniciales de ESEO eran demasiado ambiciosos, por lo que se planteó la necesidad de desarrollar un proyecto algo menos exigente que, por su duración, no desmotivara a los participantes. Ası́ nació SSETI-Express, un satélite artificial más pequeño desarrollado en dos años y lanzado al espacio el dı́a 27 de Octubre de 2005. Aunque la señal de dicho satélite se perdió por problemas en las baterı́as, podemos calificar sus resultados como de profundo éxito. Este éxito animó al uso de la experiencia adquirida para alcanzar mayores objetivos, como el proyecto ESMO (European Student Moon Orbiter) que trataba de enviar una nave a orbitar en torno a la Luna. Diversos acontecimientos posteriores, junto con la crisis económica, minimizaron los objetivos propuestos, aunque afortunadamente todavı́a subsiste una pequeña llama encendida, en espera de tiempos mejores. xvi Para un profesor nada hay tan importante como el éxito de sus alumnos, en este caso comprobado y reconocido. Por ello, quiero enviarles a todos ellos mi agradecimiento más profundo, por ser los culpables de la finalización del libro y por haber logrado que recuperara la ilusión por la docencia y demostrarme, y demostrar a muchos otros, que con voluntad y con esfuerzo cualquier joven preparado es capaz de conseguir lo que se proponga. Zaragoza, Agosto de 2012 Alberto Abad Parte I Sistemas de referencia en Astrodinámica 1 Capı́tulo 1 Sistemas de referencia en IR3 1.1 Introducción El objetivo del presente capı́tulo es recordar el concepto de sistema de referencia en IR3 , necesario para situar la posición de los astros y otros objetos en el espacio. Para ello, efectuaremos un breve repaso de las propiedades básicas del espacio vectorial real IR3 y de todos los conceptos asociados al mismo como los productos escalar, vectorial y mixto, ángulos, etc., que serán de gran importancia en el desarrollo del libro. Estas notas no constituyen un tratado de álgebra, de hecho, será necesaria una revisión de un libro especializado para una mejor comprensión de algunos de los conceptos aquı́ utilizados. Sin embargo, hemos preferido profundizar en algunos aspectos, como el de sentido de un ángulo y la orientación de los sistemas de referencia, pues estos conceptos, de gran importancia en la Astrodinámica, son a menudo tratados sin demasiado rigor. La trigonometrı́a esférica ha sido la herramienta tradicional para resolver problemas de Astronomı́a de Posición, donde el concepto de distancia entre puntos, imposible de medir por observación directa, es cambiado por el de distancia angular, sustituyendo los puntos de IR3 por su proyección en una esfera de radio arbitrario (tomado como unidad de longitud). En este libro, salvo en una ocasión, hemos utilizado el cálculo vectorial y matricial en lugar de las fórmulas de la trigonometrı́a esférica, lo que conduce a relaciones más fáciles de entender y que no contienen ambigüedades. Sin embargo, con objeto de que el lector pueda comprender algunas de las demostraciones que aparecen en libros clásicos de Astrodinámica desarrollaremos brevemente en este capı́tulo los fundamentos de la Sistemas de referencia en IR3 4 trigonometrı́a esférica. 1.2 El espacio afı́n IR3 : sistemas de referencia El espacio IR3 puede ser considerado como un conjunto de elementos, llamados puntos, que se representan por letras mayúsculas: O, P, Q, S, . . .; o bien, como el conjunto de vectores x de un espacio vectorial real de dimensión tres. Estas dos formas de ver IR3 pueden relacionarse si consideramos un punto cualquiera O 2 IR3 , que llamaremos origen, y asociamos a cada punto P un vector de IR3 , que llamaremos x = OP , y que geométricamente representa el segmento (vector) que une el punto O con el punto P . Si consideramos otro punto Q, tal que y = OQ, podremos poner QP = OP OQ = x y. De esta forma hemos dotado a IR3 de una estructura de espacio afı́n. Si consideramos una base (i1 , i2 , i3 ) de IR3 el elemento x 2 IR3 puede representarse por tres números reales (x1 , x2 , x3 ), que son llamados componentes del vector en dicha base, de manera que x = x1 i1 + x2 i2 + x3 i3 . Al conjunto formado por el origen y la base {O, i1 , i2 , i3 } le llamaremos sistema de referencia de IR3 . En este sistema de referencia el vector correspondiente al origen O tiene sus tres componentes nulas. 1.3 Producto escalar: IR3 como espacio euclı́deo Llamaremos producto escalar de dos vectores x, y, al número real x · y = x 1 y 1 + x 2 y 2 + x 3 y3 , (1.1) donde (x1 , x2 , x3 ), (y1 , y2 , y3 ) son las componentes de x, y en la base (i1 , i2 , i3 ). Aunque el valor obtenido con esta definición depende de la base donde estemos trabajando, puede demostrarse fácilmente que el valor del producto escalar es independiente de la base en la cual se calcule. El producto escalar nos permitirá definir los conceptos de ángulo y distancia. Diremos que dos vectores son ortogonales cuando su producto escalar sea cero. Llamaremos longitud o norma de un vector al escalar p k x k = x · x = (x2 )1/2 . De esta forma, la distancia entre dos puntos P, Q vendrá dada por la norma del vector QP = OP OQ. Todo vector x puede ser expresado en la forma x = k x k x̂, Ángulos y funciones circulares inversas 5 donde x̂ representa un vector de norma unidad en la misma dirección que x y por lo cual será llamado dirección. Esta propiedad permite caracterizar un vector por su norma y su dirección. El producto escalar de vectores verifica además las siguientes propiedades: x·y = x · (y + z) = ( x) · y = x·x x · x = 0 () y · x, x · y + x · z, (x · y), 0, x = 0. (1.2) La introducción de los conceptos de producto escalar y distancia y sus propiedades permiten considerar IR3 como espacio euclı́deo. Llamaremos ángulo entre dos vectores x, y, al número real ↵ que verifica y x · y = k x kk y k cos ↵. ↵ x 2⇡ ↵ Figura 1.1: Ángulo entre dos vectores. 1.4 (1.3) Las propiedades de la función coseno, ası́ como la propia geometrı́a de la figura 1.1, nos indican la existencia de dos posibles soluciones de la anterior ecuación que se corresponden con los dos ángulos ↵, 2⇡ ↵. Ángulos y funciones circulares inversas Observando la figura 1.1 podemos pensar en un ángulo como el arco o trayectoria recorrido por el vector x hasta llegar a la dirección ocupada por el vector y. Para llegar a y puede pasarse varias veces por su posición, lo que equivale a dar varias vueltas y se corresponde con las propiedades de periodicidad de la función coseno. Ası́ pues, desde el punto de vista de la definición anterior, el ángulo entre dos vectores o direcciones puede considerarse idéntico si le restamos o sumamos un número entero de vueltas, esto es, un múltiplo de 2⇡. Con objeto de evitar esta múltiple definición y precisar más este concepto definiremos en IR una relación de equivalencia R2⇡ de la siguiente forma: dados x, y 2 IR diremos que x está relacionado con y, esto es xR2⇡ y, si y solo si existe un k 2 ZZ tal que x y = 2k⇡. El conjunto A de las clases de equivalencia definidas por R2⇡ coincide con el conjunto cociente IR /2⇡ZZ y hereda la estructura de grupo conmutativo. Los elementos de A serán llamados ángulos. Un representante cualquiera de cada clase de A, que viene dado por un número real, será llamado determinación del ángulo ↵. Llamaremos determinación principal de ↵ al número real perteneciente al intervalo [0, 2⇡) que sea representante Sistemas de referencia en IR3 6 de una clase de IR /2⇡ZZ. Obtener la determinación principal de un ángulo es lo mismo que calcular el resto de la división del número real que representa el ángulo por 2⇡ o bien obtener el valor congruente (módulo 2⇡) de éste número. Obsérvese que podemos definir un isomorfismo entre el conjunto A de ángulos y el intervalo [0, 2⇡) a través de la determinación principal de cada ángulo. Por ello, a partir de aquı́, cuando hablemos de ángulo nos referiremos siempre a su determinación principal o a su valor ↵ 2 [0, 2⇡). De esta forma quedarán justificadas igualdades del tipo ↵ + ⇡ = ↵ ⇡ y otras que aparecen cuando obtenemos la determinación principal de una combinación lineal de ángulos cuyo valor, obtenido por reglas aritméticas, excede de 2⇡ o es menor que 0. En ocasiones la práctica común exige la elección de otra determinación para los ángulos, basada en una definición de los mismos en el intervalo ( ⇡, ⇡]. Esta representación se establecerá para los ángulos definidos explı́citamente en dicho intervalo o en un subintervalo de éste. Las funciones trigonométricas o circulares sen, cos : IR tan : IR ! ! [ 1, 1], IR [{ 1, 1}, son tres1 funciones suprayectivas y periódicas, de periodo 2⇡, cuyas propiedades suponemos de sobra conocidas. A pesar de no ser biyectivas, su periodicidad permite la definición de una serie de funciones inversas llamadas arco coseno (acos), arco seno (asin) y arco tangente (atan) que serán biyectivas si restringimos el intervalo de definición acos : [ 1, 1] ! [0, ⇡], ⇡ ⇡ asen : [ 1, 1] ! [ , ], (1.4) 2 2 ⇡ ⇡ atan : IR [{ 1, 1} ! [ , ]. 2 2 Esta determinación de cuadrante es la usada habitualmente por todos los lenguajes de programación y calculadoras cuando se invocan las funciones inversas de las circulares. Nótese además que la función acos ası́ definida, cuando se usa para la obtención del ángulo entre dos vectores, determina el menor de los dos posibles o ángulo agudo. Habitualmente el uso de las funciones arco coseno, arco seno y arco tangente viene asociado a la resolución de ecuaciones del tipo cos ↵ = x, sen ↵ = x, ó tan ↵ = x. Si el significado geométrico de ↵ en dichas ecuaciones se restringe al intervalo de definición de las funciones, la solución de cada una de esas ecuaciones será única y vendrá dada por las funciones acos, asen, atan, respectivamente. En 1 Las funciones sec, cosec, cotan, pueden considerarse funciones auxiliares de sen, cos y tan y sus propiedades fácilmente deducibles a partir de ellas por lo que no son consideradas en esta exposición. Ángulos y funciones circulares inversas 7 caso contrario, si la solución puede ser un ángulo cualquiera en su determinación principal, tendremos dos posibles soluciones por cada ecuación, que vendrán expresadas por las funciones arccos, arcsin, arctan en lugar de acos, asen, atan, () ↵ = arccos x sen ↵ = x () ↵ = arcsen x () tan ↵ = x () ↵ = arctan x () cos ↵ = x ⇢ () ⇢ ⇢ ↵0 ↵1 = = acos x, acos x, ↵0 ↵1 = = ⇡ ↵0 ↵1 = = atan x, ⇡ + atan x. asen x, asen x, (1.5) Cuando conozcamos simultáneamente el coseno y el seno de un ángulo, cos ↵ = x, sen ↵ = y, éste podrá ser encontrado sin ambigüedad tomando la solución común de entre las dos obtenidas a partir de arccos x, arcsen y. Al igual que en algunos lenguajes de programación, que definen una función arco tangente con dos argumentos para resolver dicho caso, en lo que sigue utilizaremos la función atan(x, y) que determina, sin ambigüedad, el ángulo ↵ que formap el punto (x, y) 2 IR2 {(0, 0)} con el eje Ox del plano, esto es, cuyo coseno es x/ x2 + y 2 y cuyo p 2 2 seno es y/ x + y . ↵ = atan(x, y) () 8 > < cos ↵ = > : sen ↵ = x p , 2 x + y2 y p . 2 x + y2 (1.6) Nótese que hemos usado un orden de variables distinto a la función atan2 de FORTRAN, pues hemos considerado que esta forma concuerda más con el lenguaje habitual de las Matemáticas, donde la primera coordenada x suele representar el coseno, y la segunda, y, el seno. Propiedad.- La ecuación ↵ = x, 2 tiene una única solución dada por la expresión tan (1.7) ↵ = 2 atan x. En efecto, aplicando la función inversa ⇢ ↵ = arctan x = ⇡ 2 + (1.8) atan x, atan x, y llamando ↵0 , ↵1 a las dos soluciones, se tendrá ↵1 = 2(⇡ + atan x) = 2⇡ + 2 atan x = 2 atan x = ↵0 . (1.9) Sistemas de referencia en IR3 8 Propiedad.- Las dos soluciones de la ecuación A, B, C 2 IR, A = C cos ↵ + S sen ↵, (1.10) vienen dadas por la expresión ↵ = atan(C, S) arccos ✓ A p 2 C + S2 ◆ . (1.11) En efecto, si llamamos M, m, a las constantes definidas por C = M cos m, o lo que es igual M= podremos poner p C 2 + S2, S = M sen m, m = atan (C, S) , A = M cos m cos ↵ + M sen m sen ↵ = M cos(m ↵), de donde invirtiendo se llega a m ↵ = arccos y finalmente ↵=m 1.5 arccos ✓ A M ◆ , ✓ A M ◆ . Producto vectorial y mixto Como sabemos, dos vectores linealmente independientes de IR3 determinan un plano. Además, podemos definir dos direcciones distintas, ortogonales al plano, equivalentes a los conceptos relativos de encima y debajo del plano. Por otro lado, las dos direcciones ortogonales al plano son opuestas entre si. Para caracterizar estas dos direcciones estableceremos el concepto de producto vectorial. Supongamos dos vectores x, y que forman entre si un ángulo2 ↵ = acos(x · y). Llamaremos producto vectorial de dos vectores x, y, y lo representaremos por x ⇥ y, a un vector que se caracteriza por: Su norma, k x ⇥ y k = k x kk y k sen ↵. Su dirección, ortogonal al plano definido por x, y, que viene definida por la dirección de avance de un sacacorchos o tornillo3 cuando gira para llevar el vector x hacia el vector y por el camino más corto (ángulo agudo ↵). Sistemas de referencia ortonormales 9 x⇥y y x x⇥y y x Figura 1.2: Producto vectorial de dos vectores. La figura 1.2 representa los dos posibles vectores x⇥y según la posición relativa de x e y. Puede observarse también que las dos únicas direcciones ortogonales al plano definido por dichos vectores se representan por los vectores x ⇥ y e y ⇥ x, que además verifican la relación x⇥y = y ⇥ x. Al producto escalar de un vector x por el vector resultante del producto vectorial de otros dos y ⇥ z, que puede también denotarse como [x, y, z] = x· (y ⇥ z), se le suele llamar producto mixto de tres vectores. 1.6 Sistemas de referencia ortonormales La definición de ortogonalidad nos permite definir un sistema de referencia donde los vectores de la base son ortogonales4 entre si i1 · i2 = i1 · i3 = i2 · i3 = 0. A dicho sistema de referencia le llamaremos sistema de referencia ortogonal. Si además los vectores tienen norma unidad i21 = i22 = i23 = 1, el sistema será llamado sistema de referencia ortonormal. De acuerdo con lo visto en el apartado anterior, dados dos vectores ortogonales y unitarios i1 , i2 , existen únicamente dos direcciones ortogonales al plano definido 2 Como se ha dicho antes hemos elegido el menor de los dos posibles o ángulo agudo. que un sacacorchos avanza hacia arriba cuando gira en sentido contrario a las agujas del reloj y hacia abajo en caso contrario. 4 Tres vectores de IR3 ortogonales entre si son linealmente independientes. 3 Recuérdese Sistemas de referencia en IR3 10 por i1 y i2 . Estas dos direcciones son las representadas por los vectores i1 ⇥ i2 e i2 ⇥ i1 , que en ambos casos tienen norma unidad de acuerdo con la definición de producto vectorial. De esta forma se llega a las dos posibles elecciones de sistemas de referencia ortonormales: sistema directo (llamado también sistema dextrógiro o de orientación positiva) cuando i3 = i1 ⇥ i2 y sistema retrógrado (sistema levógiro o de orientación negativa) cuando i3 = i2 ⇥ i1 . i3 i3 i2 i1 i1 i2 Figura 1.3: Sistema de referencia de orientación positiva (izquierda) y de orientación negativa (derecha). Nótese la posición distinta de los vectores i1 , i2 en ambos sistemas. Propiedad.- Para todo sistema ortogonal directo se verifica 1. i3 = i1 ⇥ i2 , i1 = i2 ⇥ i3 , i2 = i3 ⇥ i1 . (1.12) 2. Dados dos vectores x = x1 i1 + x2 i2 + x3 i3 , y = y1 i1 + y2 i2 + y3 i3 , su producto vectorial se puede expresar como x⇥y = (x2 y3 = i1 x1 y1 x3 y2 )i1 + (x3 y1 i2 x2 y2 i3 x3 y3 x1 y3 )i2 + (x1 y2 x2 y1 )i3 (1.13) . 3. Dados tres vectores x = x1 i1 + x2 i2 + x3 i3 , y = y1 i1 + y2 i2 + y3 i3 y z = z1 i1 + z2 i2 + z3 i3 , su producto mixto se puede expresar como [x, y, z] = x1 y1 z1 x2 y2 z2 x3 y3 z3 . (1.14) Otras propiedades de los distintos productos de vectores 11 Propiedad.- Para todo sistema ortogonal retrógrado se verifica 1. i3 = i2 ⇥ i1 , i2 = i1 ⇥ i3 , i1 = i3 ⇥ i2 , (1.15) 2. Dados dos vectores x = x1 i1 + x2 i2 + x3 i3 , y = y1 i1 + y2 i2 + y3 i3 , su producto vectorial se puede expresar como x⇥y = (y2 x3 = i1 y1 x1 y3 x2 )i1 + (y3 x1 i2 y2 x2 i3 y3 x3 y1 x3 )i2 + (y1 x2 y2 x1 )i3 (1.16) . 3. Dados tres vectores x = x1 i1 + x2 i2 + x3 i3 , y = y1 i1 + y2 i2 + y3 i3 y z = z1 i1 + z2 i2 + z3 i3 , su producto mixto se puede expresar como [x, y, z] = x1 z1 y1 x2 z2 y2 x3 z3 y3 . (1.17) Las dos propiedades anteriores caracterizan los sistemas directos y retrógrados cuya representación gráfica puede verse en la figura 1.3. La definición de producto vectorial no es útil para el cálculo del mismo. Para realizar este cálculo es necesario acudir a una de las expresiones (1.13) o (1.16). Hay que hacer notar aquı́ que únicamente la primera es usada en la mayorı́a de los libros y las librerı́as de los lenguajes de programación. Esto supone que de manera implı́cita dichos libros y programas trabajan con un sistema de referencia ortogonal directo. En Astronomı́a, se utilizan dos sistemas de coordenadas, horizontales y horarias, que se definen habitualmente a través de sistemas de referencia retrógrados. En este libro, con objeto de evitar el problema generado por las distintas propiedades del producto vectorial, utilizaremos únicamente sistemas directos, para lo que redefiniremos las coordenadas asociadas a los sistemas retrógrados. 1.7 Otras propiedades de los distintos productos de vectores Daremos a continuación otras propiedades de los productos de vectores que son independientes de la orientación de la base elegida para su cálculo. Estas propiedades serán usadas a lo largo del libro. Sistemas de referencia en IR3 12 Propiedad .- Las relaciones siguientes son válidas independientemente del sistema de referencia en el que expresemos los vectores: x ⇥ (y + z) = x ⇥ y + x ⇥ z, (1.18) (x ⇥ y)2 = k x k2 k y k2 (1.19) (x ⇥ y) ⇥ z = (x · z)y (y · z)x, (1.20) x ⇥ (y ⇥ z) = (x · z)y (x · y)z. (1.21) (x · y)2 , Propiedad.- El área de un triángulo de vértices O, P, Q viene dada por el valor de k x ⇥ y k/2, siendo x = OP , y = OQ. Propiedad.- Dados dos vectores ortogonales a, b, y un escalar c, el sistema x⇥a x·a tiene como única solución x= En efecto, = = b, c, (1.22) a ⇥ b + ca . a·a a ⇥ b = a ⇥ (x ⇥ a) = (a · a)x (1.23) (a · x)a, de donde despejando se llega a la solución. 1.8 Ángulo orientado entre dos vectores La ecuación (1.3) nos ha permitido introducir el concepto de ángulo y su medida a través del producto escalar. La solución de dicha ecuación conduce, como se ve en la figura 1.1, a dos valores, ↵ y 2⇡ ↵, que representan igualmente al ángulo salvo que las propiedades geométricas de un determinado problema restrinjan el rango de valores a un subintervalo de [0, 2⇡). También podremos discriminar uno de los dos posibles valores cuando definamos un sentido de recorrido de los ángulos y tomemos uno de los dos vectores como origen (de aquı́ en adelante x). Generalmente se considera sentido de giro positivo al recorrido en sentido contrario a las agujas del reloj y sentido de giro negativo al recorrido en sentido de las agujas de un reloj. En dinámica suele hablarse también de sentido directo y sentido retrógrado respectivamente. Habitualmente se considera positivo el signo de los ángulos medidos en sentido directo y negativo los medidos en sentido retrógrado. La anterior definición contiene también una ambigüedad, pues el sentido positivo se transforma en negativo, y viceversa, cuando miramos la figura desde el otro Ángulo orientado entre dos vectores 13 lado del plano determinado por los vectores x, y. Dicha ambigüedad quedará eliminada fijando, mediante el producto vectorial de los dos vectores, el subespacio desde el cual observamos el giro. Para fijar los conceptos de ángulo directo o retrógrado entre dos vectores x, y, o ángulo que va de x a y en sentido positivo o negativo, debemos fijar, en primer lugar, una orientación o dirección n, definida a partir del vector (x⇥y)/k x⇥y k o del vector (y⇥x)/k x⇥y k. Fijado n, hablaremos de ángulo directo, o recorrido en sentido positivo o directo, como aquel que lleva el vector x hacia y en el sentido de giro contrario a las agujas del reloj visto desde la dirección del espacio definida por el vector n. Un ángulo retrógrado, o recorrido en sentido negativo o retrógrado, es el ángulo recorrido en sentido contrario al anterior. Habitualmente todos los libros usan, sin mencionarlo, la orientación definida por n = (x ⇥ y)/k x ⇥ y k. El concepto de sistema ortogonal directo nos va a permitir determinar, de una manera precisa, el ángulo directo entre dos vectores x, y, una vez hayamos definido la orientación n. En efecto, por ser n ortogonal a x podemos definir un sistema de referencia ortonormal directo formado por los vectores {i1 = x/k x k, i2 = n⇥x/k n⇥x k, i3 = n}. Notemos que por ser n y x ortogonales se tiene k n⇥x k = k x k y por tanto i2 = (n ⇥ x)/k x k. El vector ŷ, que pertenece al plano formado por i1 y i2 podrá expresarse como ŷ = p i1 + q i2 , o lo que es igual y = k y kp i1 + k y kq i2 . Si llamamos ↵ = atan(p, q) tendremos que y = k y k cos ↵ i1 + k y k sen ↵ i2 , de donde podremos poner k y k cos ↵ = y · i1 = x·y , kxk k y k sen ↵ = y · i2 = y · (n ⇥ x) n · (x ⇥ y) = , kxk kxk y finalmente k x kk y k cos ↵ = x · y, k x kk y k sen ↵ = n · (x ⇥ y), (1.24) o lo que es igual ↵ = ↵(x, y, n) = atan (x · y, n · (x ⇥ y)) . (1.25) La expresión (1.25) nos da de manera precisa y única el valor del ángulo que va de x a y en sentido positivo desde la orientación definida por el vector n. Sistemas de referencia en IR3 14 1.9 Coordenadas cartesianas y polares Las componentes (x, y, z) de un vector x = x i1 + y i2 + z i3 , expresado en un sistema de referencia ortogonal directo {i1 , i2 , i3 }, serán llamadas coordenadas cartesianas o coordenadas rectangulares y representan: Las proyecciones del vector x sobre los ejes Ox, Oy y Oz o direcciones i1 , i2 e i3 respectivamente. Los cosenos directores, o cosenos de los ángulos que forma el vector x con los ejes Ox, Oy y Oz: x y z = = = k x k cos(x, i1 ) k x k cos(x, i2 ) k x k cos(x, i3 ) = = = x · i1 , x · i2 , x · i3 . En Astronomı́a, donde en ocasiones la medida de la distancia a los astros no es conocida, resulta de particular importancia el uso de las coordenadas polares esféricas que separan la distancia al origen de las otras coordenadas angulares. Para definir las coordenadas polares esféricas (figura 1.4) consideraremos, en primer lugar, un vector l de norma igual a k x k y cuya dirección representa la intersección del plano formado por x e i3 con el plano Oxy formado por i1 e i2 . Llamaremos longitud al ángulo desde i1 hasta l medido en sentido directo tomando como orientación la definida por el vector i3 . La longitud puede tomar un valor cualquiera 2 [0, 2⇡). Llamaremos latitud al ángulo entre l y x. Este ángulo se considera positivo si el vector x está en el lado del espacio correspondiente a i3 y negativo si está en el correspondiente a i3 . De esta forma 2 [ ⇡/2, ⇡/2]. Por último llamaremos distancia r a la norma k x k. Las coordenadas (r, , ) serán llamadas coordenadas polares esféricas o simplemente coordenadas esféricas y se caracterizan principalmente por separar la distancia r de las cantidades angulares adimensionales , . En ocasiones hablaremos de la colatitud o ángulo ˜ = ⇡/2 2 [0, ⇡] entre i3 y x y de la colongitud o ángulo ˜ entre i2 y l, medido en sentido retrógrado. Fácilmente comprobamos que también se verifica ˜ = ⇡/2 2 [0, 2⇡). El uso de la colatitud y la colongitud permite usar los sistemas de coordenadas (r, , ˜), (r, ˜ , ), (r, ˜ , ˜) como alternativa al sistema de coordenadas polares esféricas. Observando la figura 1.4 se deduce fácilmente que un vector unitario l̂ perteneciente al plano Oxy y que tiene una longitud , forma tres ángulos ( , ⇡/2 , ⇡/2) con los tres vectores de la base, por lo que sus componentes, dadas por los cosenos directores serán ⇡ ⇡ l̂ = cos i1 + cos( ) i2 + cos i3 = cos i1 + sen i2 . 2 2 Coordenadas cartesianas y polares 15 De esta forma, se tendrá, por un lado i3 l = r cos i1 + r sen i2 , y por otro, x x ˜ i2 r cos l + r cos ˜ i3 = r cos l + r sen i3 , por lo que finalmente se llega a la expresión del vector en coordenadas polares esféricas ˜ i1 = l x = Figura 1.4: Coordenadas polares esféricas. r cos cos i1 + r sen cos i2 + r sen i3 , (1.26) lo que demuestra que las coordenadas cartesianas pueden expresarse en función de las polares esféricas en la forma: x y z = = = r cos cos , r cos sen , r sen . (1.27) Asimismo, invirtiendo las relaciones anteriores obtenemos las coordenadas esféricas en función de las rectangulares: p r = x2 + y 2 + z 2 , z (1.28) = asen , r = atan(x, y). Puesto que el paso de cartesianas a polares y el de polares a cartesianas serán muy usados a lo largo del libro estableceremos, de aquı́ en adelante una notación más compacta que establece el nombre de una función que a través de los algoritmos (1.27) y (1.28) realiza la transformación. Llamaremos cart() a la función que obtiene el vector x = (x, y, z) a partir del vector de coordenadas polares (r, , ), 0 1 0 x r cos cos x = @ y A = @ r cos sen z r sen 1 A = cart(r, , ). (1.29) Para referirnos a cada una de sus componentes podremos usar las funciones: x = cart1 (r, , ), y = cart2 (r, , ), z = cart3 (r, , ). (1.30) Sistemas de referencia en IR3 16 Por otro lado, la función polar() representará la inversa de la anterior, es decir, nos dará el vector de coordenadas polares en función del vector en cartesianas (r, , ) = polar(x). (1.31) Para referirnos a cada coordenada polar por separado usaremos las funciones siguientes: r = polarr (x), = polar (x), = polar (x). (1.32) Combinando el uso de la colatitud y colongitud con las coordenadas polares podremos poner: x = x = x = r sen ˜ cos i1 + r cos ˜ cos i2 + r sen i3 , r cos sen ˜ i1 + r sen sen ˜ i2 + r cos ˜ i3 , r sen ˜ sen ˜ i1 + r cos ˜ sen ˜ i2 + r cos ˜ i3 , (1.33) (1.34) (1.35) o bien usando la función cart() escribiremos x = cart(r, 1.10 ⇡ 2 ˜ , ) = cart(r, , ⇡ 2 ˜) = cart(r, ⇡ 2 ˜, ⇡ 2 ˜). Trigonometrı́a esférica Una de las caracterı́sticas de la observación astronómica es la imposibilidad de una medición visual directa de la distancia al astro, pudiéndose medir únicamente distancias angulares. Las coordenadas polares resultan perfectamente adaptadas a la premisa anterior pues separan la distancia r al astro de las dos coordenadas angulares. Desde un punto de vista práctico prescindir de la distancia equivale a suponer todos los astros proyectados sobre una esfera de radio arbitrario que tomaremos como unidad. Esta esfera es llamada esfera celeste. En el caso de las órbitas de los cuerpos del sistema solar y de las naves espaciales la distancia es mucho menor que la distancia a las estrellas por lo que debe ser tomada en consideración, sin embargo, los parámetros angulares de su órbita pueden separarse y ser estudiados sustituyendo la órbita por su proyección en la esfera celeste que será una circunferencia. La necesidad de relacionar puntos en una esfera nos lleva a considerar una herramienta muy usada en Astronomı́a clásica: la trigonometrı́a esférica. En este libro se ha limitado al máximo el uso de triángulos esféricos, sin embargo, por claridad en la lectura de otros libros de Astrodinámica y Mecánica Celeste se estudian en este apartado las fórmulas básicas de la trigonometrı́a esférica: las fórmulas de Bessel. Comenzaremos recordando que la intersección de la esfera con un plano que pase por su centro es una circunferencia que llamaremos cı́rculo máximo. Si el plano no pasa por el centro de la esfera el cı́rculo será llamado cı́rculo menor. Trigonometrı́a esférica 17 Por otro lado, dados dos puntos en una esfera, existe uno y solo un cı́rculo máximo que pasa por ellos, pues estos dos puntos, junto con el centro determinan un plano que corta a la esfera en dicho cı́rculo máximo. Nótese que el cı́rculo máximo es el equivalente a la recta en la geometrı́a plana. En geometrı́a plana, queda perfectamente determinado el concepto de segmento de recta como la parte de la recta que une dos puntos. Sin embargo, dados dos puntos en la esfera, al ser cerrado el cı́rculo máximo que los une, quedan determinados dos segmentos y no uno. Para evitar confusiones consideraremos únicamente como segmento que une dos puntos al menor de ambos. Uno de los parámetros que representan un segmento de recta es su longitud. Esto ocurre también cuando consideramos un segmento de cı́rculo máximo, sin embargo, puesto que al trabajar en la esfera se pretende eliminar el concepto de distancia, o lo que es igual las dimensiones de longitud, deberemos sustituir el concepto de longitud del segmento por algún otro concepto equivalente. Para ello, basta recordar la expresión l = r✓, que relaciona la longitud del segmento de circunferencia con el producto del arco que éste abarca por el radio de la circunferencia. Si consideramos el radio como unidad de distancia, la longitud del segmento equivale al arco. Ası́ pues, a partir de ahora, cuando hablemos de longitud del segmento que une dos puntos de la esfera, entenderemos como tal el arco que dicho segmento abarca, expresado en radianes. Tres puntos no alineados en un plano forman un triángulo plano, que queda caracterizado por seis parámetros: la longitud de los tres lados y los ángulos que forman entre si los tres lados. Si tomamos tres puntos sobre una esfera podemos unirlos dos a dos por medio de segmentos de cı́rculo máximo (figura 1.5). La figura formada en la esfera por estos tres segmentos será llamada triángulo esférico. A b c B a C Figura 1.5: Triángulo esférico. Un triángulo esférico viene caracterizado también por seis elementos: la longitud de sus tres lados (a, b, c), que como hemos dicho antes viene expresada en Sistemas de referencia en IR3 18 radianes, y por sus tres ángulos (A, B, C) que quedan definidos por los tres ángulos que forman entre si los planos que definen cada par de cı́rculos máximos. Debido a la forma de elegir el segmento entre los dos posibles, los tres lados verifican la relación a 2 [0, ⇡], b 2 [0, ⇡], c 2 [0, ⇡]. De la misma forma esto obliga a que se verifiquen también las relaciones A 2 [0, ⇡], B 2 [0, ⇡], C 2 [0, ⇡]. La trigonometrı́a esférica permite obtener los seis elementos de un triángulo esférico a partir de tres cualesquiera de ellos. 1.10.1 Fórmulas de Bessel Con objeto de encontrar las fórmulas que nos permitirán resolver un triángulo esférico, definiremos un sistema de referencia en el que el origen coincida con el centro de la esfera. De esta forma los vectores, de norma unidad, que unen el origen con cada vértice del triángulo esférico serán llamados a = OA, b = OB, c = OC. Elegiremos un sistema de referencia ortogonal directo de forma que i3 = a, y b esté en el plano formado por Oxz. Ası́, atendiendo a la figura 1.6, podemos deducir que: a b c = = = i3 , sen c i1 + cos c i3 , sen b cos A i1 + sen b sen A i2 + cos b i3 . (1.36) Puesto que el ángulo entre cada par de vectores es igual al lado que forman sus vértices podremos poner, por un lado b · c = cos a, a A b ⇡ 2 c ⇡ 2 c b A Figura 1.6: Vectores que definen los vértices del triángulo. y por otro, sustituyendo el valor de los vectores dado por las relaciones (1.36), obtendremos b · c = cos b cos c + sen b sen c cos A. Igualando las dos últimas ecuaciones se obtiene la expresión cos a = cos b cos c + sen b sen c cos A, (1.37) que es la conocida como primera fórmula de Bessel o fórmula del coseno. Tanto en la anterior como en todas las fórmulas de la trigonometrı́a esférica podemos permutar las tres letras que representan lados y ángulos distintos. De esta forma las fórmulas obtenidas no serán únicas. En particular, la primera fórmula de Bessel debe leerse de la siguiente forma: el coseno de un lado es igual al producto Trigonometrı́a esférica 19 de los cosenos de los otros dos lados más el producto de los senos de los otros dos lados por el coseno del ángulo opuesto al primer lado. Ası́ tendremos tres y no una fórmula del coseno. Por otro lado, llamaremos A, B, C a los vectores unitarios ortogonales a los planos que contienen cada lado del triángulo esférico y cuya expresión viene dada como C= o lo que es igual a⇥b , ka ⇥ bk B= c⇥a , kc ⇥ ak A= b⇥c , kb ⇥ ck (1.38) cos c sen A sen b cos A cos c sen b cos b sen c sen A sen b sen c i1 + i2 + i3 , sen a sen a sen a B = sen A i1 cos A i2 , A = C = i2 . (1.39) Los extremos de los vectores A, B, C forman otro triángulo esférico (figura 1.7), que es llamado triángulo polar, cuyos lados son a0 = ⇡ A, b0 = ⇡ B, c0 = ⇡ C y cuyos ángulos son A0 = ⇡ a, B 0 = ⇡ b, C 0 = ⇡ c. Por ser ⇡ B el ángulo entre A y C tendremos, por un lado, que A a kA ⇥ C k = = k A kk C k sen(⇡ B) sen B, y por otro lado C c b A ⇡ 2 B A sen2 B = k A⇥C k2 = (A⇥C)·(A⇥C). Si sustituimos las expresiones dadas en (1.39), desarrollamos y efectuamos ciertas simplificaciones, llegaremos a la igualdad sen a sen B = sen b sen A. (1.40) Figura 1.7: Triángulo polar. Escribiendo esta expresión para todas las permutaciones de letras se obtiene la segunda fórmula de Bessel o fórmula de los senos que puede también expresarse en la forma siguiente sen a sen b sen c = = . sen A sen B sen C (1.41) Por último, si calculamos el producto escalar de A por C, tendremos por un lado A · C = cos(⇡ B) = cos B, Sistemas de referencia en IR3 20 y por otro A·C = cos b sen c + sen b cos c cos A , sen a lo que lleva finalmente a obtener la tercera fórmula de Bessel sen a cos B = cos b sen c sen b cos c cos A. (1.42) Las tres fórmulas de Bessel son válidas para cualquier triángulo esférico, por tanto lo serán también para el triángulo polar. Ası́ pues si las aplicamos para los elementos a0 = ⇡ A, b0 = ⇡ B, c0 = ⇡ C, A0 = ⇡ a, B 0 = ⇡ c, C 0 = ⇡ c, obtendremos, por un lado cos A = cos B cos C + sen B sen C cos a, (1.43) que será llamada primera fórmula polar, y por otro sen A cos b = cos B sen C + sen B cos C cos a, (1.44) que será llamada tercera fórmula polar. La segunda de Bessel aplicada al triángulo polar vuelve a dar la misma expresión, por lo que ha sido omitida y es la razón por la que no hemos definido ninguna segunda fórmula polar. 1.10.2 Regla del pentágono de Neper Las fórmulas de Bessel se simplifican cuando alguno de los elementos, bien sea un lado o un ángulo, vale 90 . A un triángulo de este tipo le llamaremos respectivamente triángulo rectilátero o triángulo rectángulo. Neper reunió todas las formulas de Bessel particularizadas para ambos casos y consiguió enunciar una regla muy simple, llamada regla del pentágono de Neper, que relaciona entre si todos los elementos de estos triángulos. Estas reglas van asociadas a cada uno de los pentágonos dibujados en las figuras 1.8(a), 1.8(b). Estos pentágonos pueden modificarse con una permutación cualquiera de las letras en él representadas. Hay dos reglas para cada pentágono que se pueden enunciar de la siguiente forma: El coseno de un elemento situado en un vértice es igual al producto de las cotangentes de los elementos situados en vértices contiguos. El coseno de un elemento situado en un vértice es igual al producto de los senos de los elementos situados en vértices opuestos. Trigonometrı́a esférica 21 a B 180 C A = 90 90 c 90 b b c a = 90 90 (a) Triángulo rectángulo. A C 90 B (b) Triángulo rectilátero. Figura 1.8: Pentágono de Neper. 1.10.3 Analogı́as de Neper Las cinco fórmulas de Bessel, y las que se derivan de la posible permutación de letras, permiten la resolución de cualquier tipo de triángulo esférico a partir de tres datos del mismo. Sin embargo, con objeto de discriminar de forma sencilla entre dos posibles soluciones es conveniente el uso de otro conjunto de fórmulas, obtenidas a partir de las anteriores, que serán llamadas analogı́as de Neper. Las analogı́as de Neper5 pueden escribirse como: A 2 a tan 2 tan = = cos sec b c 2 B C 2 b+c 2 B+C cos 2 sec B+C , 2 b+c tan . 2 cot (1.45) Veremos únicamente la obtención de la primera, pues el resto se obtiene de manera idéntica. Para ello, reuniremos convenientemente las expresiones (1.41) llegando a sen a (sen B + sen C) = sen A (sen b + sen c), por otro lado, aplicando dos de las permutaciones de las terceras fórmulas de Bessel (1.42), se llega a sen a(cos B + cos C) = (1 cos A)(cos c sen b + cos b sen c), que divididas nos conducen a sen B + sen C = cos B + cos C (1 sen A (sen b + sen c) . cos A)(cos c sen b + cos b sen c) 5 Existen otras expresiones similares, pero éstas nos dan la información suficiente para completar el algoritmo del próximo apartado. Sistemas de referencia en IR3 22 Usando simples relaciones trigonométricas se llega finalmente a tan B+C b c b+c A = cos sec cot , 2 2 2 2 que coincide con la primera de las expresiones (1.45). 1.10.4 Algoritmo para la resolución de triángulos esféricos Podemos encontrar un algoritmo muy simple para resolver cualquier triángulo esférico si tenemos en cuenta las siguientes propiedades derivadas de las funciones trigonométricas: Cualquier lado o ángulo de un triángulo esférico está en el primer o segundo cuadrante luego para determinarlo unı́vocamente se precisa conocer su coseno. La tangente del ángulo mitad determina, sin ambigüedad el cuadrante de cualquier ángulo. La resolución de un triángulo esférico del que conocemos tres elementos se realizará mediante seis conjuntos de fórmulas que representan casos idénticos salvo una permutación de letras. 1. Tres ángulos (A, B, C) conocidos. Solución única obtenida a partir de las tres fórmulas polares del coseno. 2. Tres lados (a, b, c) conocidos. Solución única obtenida a partir de las tres fórmulas del coseno. 3. Conocidos dos lados y un ángulo de manera que el ángulo no sea opuesto a ninguno de los dos lados. Esto corresponde a los tres casos: (a, b, C), (a, c, B), (b, c, A). Cada uno de estos casos tiene solución única en la que el tercer lado se obtiene por aplicación directa de la fórmula del coseno, y una vez obtenido éste, los otros dos ángulos se obtienen como en el segundo caso por aplicación de las fórmulas del coseno. 4. Conocidos dos ángulos y un lado de manera que el lado no sea opuesto a ninguno de los dos ángulos. Esto corresponde a los tres casos: (A, B, c), (A, C, b), (B, C, a). Cada uno de estos casos tiene solución única en la que el tercer ángulo se obtiene por aplicación directa de la fórmula polar del coseno, y una vez obtenido éste, los otros dos lados se obtienen como en el primer caso por aplicación de las fórmulas polares del coseno. Trigonometrı́a esférica 23 5. Conocidos dos lados y un ángulo de manera que el ángulo sea opuesto a alguno de los dos lados. Esto corresponde a los seis casos: (a, b, A), (a, b, B), (a, c, A), (a, c, C), (b, c, B), (b, c, C). Cada uno de estos casos tiene solución doble. Por ejemplo el caso (a, b, A) se resuelve aplicando en primer lugar la fórmula de los senos para obtener B. Del seno se obtienen dos valores B1 , B2 que serán llevados junto con los de (a, b, A) a las analogı́as de Neper para obtener c y C. El resto de casos se resuelve también con una aplicación de la fórmula de los senos y luego las dos analogı́as de Neper. 6. Conocidos dos ángulos y un lado de manera que el lado sea opuesto a alguno de los dos ángulos. Esto corresponde a los seis casos: (A, B, a), (A, B, b), (A, C, a), (A, C, c), (B, C, b), (B, C, c). Cada uno de estos casos tiene solución doble. Por ejemplo el caso (A, B, a) se resuelve aplicando en primer lugar la fórmula de los senos para obtener b. Del seno se obtienen dos valores b1 , b2 que serán llevados junto con los de (a, b, A) a las analogı́as de Neper para obtener c y C. El resto de caos se resuelve también con una aplicación de la fórmula de los senos y luego las dos analogı́as de Neper. La indicación de solución única o doble de cada uno de los seis casos representa únicamente el número máximo de soluciones. En todos los casos puede haber menos soluciones. La anulación de la solución obtenida se realizará cuando se obtenga un valor mayor que la unidad para un seno o un coseno o al aplicar las analogı́as de Neper se obtenga un ángulo mayor que 180 . 24 Sistemas de referencia en IR3 Capı́tulo 2 Cambios del sistema de referencia: rotaciones 2.1 Introducción Si tenemos un punto P , referido a un sistema de referencia {O, i1 , i2 , i3 }, y queremos expresarlo en el sistema {O0 , f 1 , f 2 , f 3 } debemos transformar la expresión del vector OP en la base inicial {i1 , i2 , i3 } en la expresión del vector O0 P en la base del sistema final {f 1 , f 2 , f 3 }. Para ello debemos realizar dos operaciones: una traslación del origen, dada por la relación OP = OO0 + O0 P , un cambio de base para expresar los tres vectores de la relación anterior en la base del sistema final. En adelante prescindiremos de la traslación, suma del vector OO0 , por la simplicidad de esta operación y porque en la práctica casi todos los cambios de sistema de referencia que trataremos en este libro mantienen fijo el origen. Un cambio entre dos bases ortonormales de IR3 con la misma orientación será llamado rotación del sistema de referencia. 26 2.2 Cambios del sistema de referencia: rotaciones Rotaciones en IR3 Sea un vector x 2 IR3 que, expresado en la base1 I = {i1 , i2 , i3 }, tiene la forma x = x1 i 1 + x2 i 2 + x3 i 3 , (2.1) mientras que en la base F = {f 1 , f 2 , f 3 } se escribe x = X1 f 1 + X2 f 2 + X3 f 3 . (2.2) Para relacionar las componentes de x en ambas bases tendremos en cuenta, por un lado, que por ser F base de IR3 cualquier vector de IR3 podrá ser expresado en dicha base, por tanto, podremos escribir: i1 i2 i3 = = = r11 f 1 + r12 f 2 + r13 f 3 , r21 f 1 + r22 f 2 + r23 f 3 , r31 f 1 + r32 f 2 + r33 f 3 , (2.3) mientras que, por ser I base de IR3 , cualquier vector de IR3 podrá ser expresado en dicha base en la forma: f1 f2 f3 = = = s11 i1 + s12 i2 + s13 i3 , s21 i1 + s22 i2 + s23 i3 , s31 i1 + s32 i2 + s33 i3 . (2.4) Por ser las bases ortonormales, las componentes de un vector pueden obtenerse a través de los cosenos directores, luego se tendrá rij = cos(ii , f j ) = ii · f j = cos(f j , ii ) = sji , lo que permite finalmente escribir: f1 f2 f3 = = = r11 i1 + r21 i2 + r31 i3 , r12 i1 + r22 i2 + r32 i3 , r13 i1 + r23 i2 + r33 i3 . (2.5) Si en la igualdad (2.2) sustituimos los vectores f i por las expresiones dadas en (2.5), y la igualamos, componente a componente, a (2.1), obtendremos tres relaciones que en forma matricial se podrán poner como 0 1 0 x1 r11 @ x2 A = @ r21 x3 r31 r12 r22 r32 10 1 r13 X1 r23 A @ X2 A . r33 X3 (2.6) 1 Cuando no haya ambigüedad en el origen identificaremos con el mismo nombre al sistema de referencia y a la base que lo forma. Rotaciones en IR3 27 De la misma forma, sustituyendo en la igualdad (2.1) los vectores ii por las expresiones dadas en (2.3) e igualando, componente a componente, a (2.2) obtendremos la relación inversa de (2.6) en la forma 0 1 0 10 1 X1 r11 r21 r31 x1 @ X2 A = @ r12 r22 r32 A @ x2 A . (2.7) X3 r13 r23 r33 x3 De aquı́ en adelante, dado un vector cualquiera x de IR3 , utilizaremos un subı́ndice que coincida con el nombre de un sistema de referencia para indicar el vector columna formado por las componentes de x en la base de dicho sistema de referencia. De esta forma xI , xF serán: 0 1 0 1 x1 X1 xI = @ x 2 A , xF = @ X 2 A . x3 X3 Por otro lado, llamando RIF 0 r11 = @ r21 r31 r12 r22 r32 1 r13 r23 A , r33 (2.8) a la matriz cuyas columnas son las componentes de la base F en términos de la base I, la relación (2.6) se podrá poner como xI = RIF xF , (2.9) mientras que la matriz RF I 0 r11 = @ r12 r13 r21 r22 r23 permite poner la ecuación (2.7) en la forma 1 r31 r32 A , r33 xF = R F I xI . (2.10) (2.11) A partir de las propiedades anteriores se demuestra que la inversa de una matriz de rotación coincide con su traspuesta RF I = RIF1 = RTIF . Las matrices que cumplen esta importante propiedad son llamadas matrices ortogonales. La notación anterior, que usa dos subı́ndices que representan los nombres de los dos sistemas de referencia, no presenta ningún tipo de ambigüedad en la expresión de la rotación. Sin embargo, esto no sucede ası́ cuando se define 28 Cambios del sistema de referencia: rotaciones el concepto de matriz de rotación. Revisando la literatura nos encontramos dos definiciones distintas que responden a dos convenios diferentes. Los dos convenios son correctos siempre que no se mezclen entre si. Convenio A.- Llamaremos matriz de rotación entre los sistemas de referencia I y F, y la representaremos por el sı́mbolo R a la matriz RIF que permite expresar el vector xI como producto de la matriz R por el vector xF . Convenio B.- Llamaremos matriz de rotación entre los sistemas de referencia I e a la matriz R que permite expresar y F, y la representaremos por el sı́mbolo R FI e por el vector x . el vector xF como producto de la matriz R I Puede parecer absurdo introducir en este texto ambos convenios, sobre todo después de haber establecido inicialmente una notación que no contiene ninguna ambigüedad, sin embargo, hemos preferido introducir las dos notaciones con objeto de no modificar expresiones que son de uso común en la comunidad cientı́fica, en la que no siempre coincide el convenio utilizado para expresar las rotaciones. Siempre que sea posible utilizaremos los subı́ndices para evitar confusiones, en otros casos utilizaremos la notación con o sin tilde para especificar el convenio utilizado sin recordarlo en cada caso. 2.3 Composición de rotaciones Supongamos que partimos de un sistema de referencia S1 y vamos aplicando sucesivamente rotaciones que pasan de S1 a S2 , de S2 a S3 , etc. Llamaremos, respectivamente, ei = R Ri = RSi Si+1 , R , Si+1 Si a las matrices de cada rotación en ambos convenios. Sustituyendo sucesivamente el vector xSi por el producto RSi Si+1 xSi+1 se podrá poner x S1 = R S 1 S2 R S2 S3 . . . R Sn 1 Sn x Sn , (2.12) obteniéndose la matriz de giro como producto de las sucesivas matrices de giro en el orden en que éstos se producen. La expresión (2.12) puede ponerse también en la forma e xSn = Rx , S1 xS1 = RxSn , donde hemos llamado R = R1 R2 . . . Rn 1, (2.13) (2.14) a la matriz de giro compuesto en el primer convenio y e=R en R 1 e2R e1, ...R (2.15) a la matriz de giro compuesto en el segundo convenio. Podemos observar que el orden de las matrices en el producto cambia de un convenio al otro. Rotación de un vector alrededor de un eje 2.4 29 Rotación de un vector alrededor de un eje â (x · â)â x R[↵, â][x] Estudiaremos ahora el problema de la rotación de un vector x, un cierto ángulo ↵, alrededor de un eje â. El valor positivo o negativo del ángulo ↵ girado vendrá definido por la orientación dada por el vector â. Llamaremos R[↵, â][x] al vector resultante de la rotación que puede verse en la figura 2.1. Para obtener el valor de dicho vector elegiremos un sistema de referencia ortogonal directo en el R[↵, â][(â ⇥ x) ⇥ â] que â representa el eje Oz, el eje Oy vendrá definido por el vector Figura 2.1: Rotación de un vector alrededor de â⇥x, ortogonal a â, y por último el eje Ox por la dirección (â ⇥ un eje. x) ⇥ â, la única posible para que el sistema sea ortogonal y directo. De esta forma hemos elegido una base ortogonal {(â ⇥ x) ⇥ â, â ⇥ x, â}. (â ⇥ x) ⇥ â â ⇥ x La propiedad (1.20) permite escribir x = (x · â)â + (â ⇥ x) ⇥ â, por lo que, de acuerdo con la figura 2.1, tendremos R[↵, â][x] = (x · â)â + R[↵, â][(â ⇥ x) ⇥ â]. Teniendo en cuenta que R[↵, â][(â ⇥ x) ⇥ â] pertenece al plano Oxy y tiene una longitud ↵, podremos poner R[↵, â][(â ⇥ x) ⇥ â] = [(â ⇥ x) ⇥ â] cos ↵ + (â ⇥ x) sen ↵, y finalmente expresar el resultado del giro del vector x en la forma R[↵, â][x] = (x · â)â + [(â ⇥ x) ⇥ â] cos ↵ + (â ⇥ x) sen ↵. (2.16) Propiedad.- El resultado de aplicar consecutivamente a un vector x un giro de ángulo ↵ y otro de ángulo ↵ respecto a un cierto eje â es el mismo vector x, esto es, se verifica la relación R[↵, â][R[ ↵, â][x]] = x. 30 Cambios del sistema de referencia: rotaciones Propiedad.- La rotación de ángulo ( ↵) alrededor del eje ( â) es idéntica a la de ángulo ↵ alrededor del eje â, o lo que es igual, se verifica la relación R[↵, â][x] = R[ ↵, â][x]. Si aplicamos una rotación de ángulo dado ↵ alrededor de un eje â = a1 i1 + a2 i2 + a3 i3 al sistema de referencia I = {i1 , i2 , i3 }, éste se transformará en el sistema F = {f 1 , f 2 , f 3 } de manera que la expresión de los vectores f j vendrá dada por f j = R[↵, â][ij ]. Particularizando la relación (2.16) con la expresión de â = a1 i1 +a2 i2 +a3 i3 en la base I, obtendremos las expresiones de los elementos de la base F en términos de la base I, con lo que podremos calcular la matriz de rotación RIF 0 a21 + (a22 + a23 ) cos ↵ @ a1 a2 (1 cos ↵) + a3 sen ↵ a1 a3 (1 cos ↵) a2 sen ↵ a1 a2 (1 cos ↵) a3 sen ↵ a22 + (a21 + a23 ) cos ↵ a2 a3 (1 cos ↵) + a1 sen ↵ 1 a1 a3 (1 cos ↵) + a2 sen ↵ a2 a3 (1 cos ↵) a1 sen ↵ A . a23 + (a21 + a22 ) cos ↵ (2.17) Llamando, como en (2.8), rij a las componentes de esta matriz podemos concluir que se verifican las relaciones: 2 cos ↵ 2 a1 sen ↵ 2 a2 sen ↵ 2 a3 sen ↵ = = = = r11 + r22 + r33 r32 r23 , r13 r31 , r21 r12 , 1, (2.18) que permiten obtener la rotación alrededor de un eje que pasa de uno a otro sistema de referencia. Puede observarse que las ecuaciones (2.18) producen dos soluciones correspondientes a las dos rotaciones de signos opuestos vistas en la última propiedad. 2.5 Rotaciones elementales Llamaremos rotación elemental de eje j a aquella que transforma una base ortonormal I = {i1 , i2 , i3 } en otra también ortonormal F = {f 1 , f 2 , f 3 } manteniendo fijo el eje j, esto es ij = f j . Dichas rotaciones consisten (ver figura 2.2) en girar el sistema de referencia un cierto ángulo ✓ alrededor del eje definido por ij . La matriz de una rotación de este tipo será llamada Rj (✓). Calcularemos únicamente el valor de la matriz R1 (✓), siendo igual el cálculo de las otras dos R2 (✓), R3 (✓). Para ello tendremos en cuenta que, de acuerdo con el apartado anterior y la relación (2.16), los vectores de la nueva base {f 1 , f 2 , f 3 } vendrán dados por las expresiones f j = R[✓, i1 ][ij ] = (ij · i1 )i1 + [(i1 ⇥ ij ) ⇥ i1 ] cos ✓ + (i1 ⇥ ij ) sen ✓. Rotaciones elementales f3 31 i3 i3 i3 ⌘ f 3 f2 ✓ f3 ✓ f2 ✓ i2 ✓ i1 ⌘ f 1 ✓ i2 ⌘ f 2 i2 ✓ i1 i1 f1 f1 Figura 2.2: Rotaciones elementales alrededor de los tres ejes. De acuerdo con las condiciones de ortonormalidad de la base I y aplicando la anterior relación a los tres ı́ndices j = 1, 2, 3, se obtendrá: f1 f2 f3 = = = i1 , cos ✓ i2 + sen ✓ i3 , sen ✓ i2 + cos ✓ i3 . (2.19) Teniendo en cuenta como se forman las matrices de rotación, a partir de las expresiones de los vectores de la base, la matriz de giro alrededor del eje Ox podrá expresarse, de acuerdo con los dos convenios establecidos, en la forma: 0 1 0 1 1 0 0 1 0 0 e1 (✓) = @ 0 sen ✓ A , R cos ✓ sen ✓ A . (2.20) R1 (✓) = @ 0 cos ✓ 0 sen ✓ cos ✓ 0 sen ✓ cos ✓ De manera similar al eje Oy: 0 cos ✓ 0 R2 (✓) = @ sen ✓ y respecto a Oz: 0 cos ✓ R3 (✓) = @ sen ✓ 0 pueden obtenerse las matrices de giro elemental respecto 0 1 0 1 sen ✓ 0 A, cos ✓ 1 sen ✓ 0 cos ✓ 0 A , 0 1 0 cos ✓ e2 (✓) = @ 0 R sen ✓ 0 e3 (✓) = @ R cos ✓ sen ✓ 0 0 1 0 1 sen ✓ 0 A, cos ✓ (2.21) 1 0 0 A. 1 (2.22) sen ✓ cos ✓ 0 Las matrices anteriores representan, respectivemente, las matrices de rotación respecto a los tres ejes expresadas en los dos convenios. A partir de las propiedades de las funciones trigonométricas puede demostrarse fácilmente la relación ei (✓) = Ri ( ✓). R (2.23) 32 2.6 Cambios del sistema de referencia: rotaciones Ángulos de Euler Cualquier rotación de un sistema I = {i1 , i2 , i3 } a otro F = {f 1 , f 2 , f 3 } puede ser expresada a través de la composición de una serie de giros elementales. Esta descomposición, que puede ser efectuada de diversas maneras, será presentada aquı́ a través de los llamados ángulos de Euler que es su forma más común. Para ello supondremos que el plano de los vectores i1 , i2 es distinto al formado por f 1 , f 2 . Puesto que el origen O pertenece a ambos planos debe existir una recta común que estará caracterizada por el vector direccional l= i3 ⇥ f 3 . k i3 ⇥ f 3 k Como se ve en la figura (2.3) al ángulo entre el vector i1 y l le llamaremos ⌦. De esta forma si efectuamos una rotación de eje Oz y ángulo ⌦ pasaremos a un sistema de referencia I 0 dado por los vectores {l, i3 ⇥ l, i3 }. i3 f3 f2 I Desde la dirección l, eje Ox del ✓ I ⌦ nuevo sistema de referencia, podel mos efectuar un giro de ángulo I, i1 ángulo entre los vectores i3 y f 3 , Figura 2.3: Ángulos de Euler. que pasa al nuevo sistema de referencia I 00 = {l, f 3 ⇥ l, f 3 }, donde el eje Oz ya coincide con el del sistema F. f1 i2 Finalmente, llamando ✓ al ángulo que forman las direcciones l con f 1 , podemos efectuar un giro de eje Oz que pase al sistema de referencia final F = {f 1 , f 2 , f 3 }. Llamaremos ángulos de Euler a los tres ángulos (⌦, I, ✓) introducidos en los párrafos anteriores. Por medio de estos ángulos podemos representar cualquier rotación como composición de las tres rotaciones elementales anteriores en la forma xI = R3 (⌦)R1 (I)R3 (✓) xF , (2.24) o en el segundo convenio e3 (✓)R e1 (I)R e3 (⌦)x . xF = R I Esta relación, junto con la propiedad (2.23), permite poner la expresión anterior en la forma xF = R3 ( ✓)R1 ( I)R3 ( ⌦)xI , lo que nos indica que si (⌦, I, ✓) son los tres ángulos de Euler que pasan de I a F, entonces los ángulos ( ✓, I, ⌦) son los ángulos de Euler que pasan de F a I. Cuando los planos i1 , i2 y f 1 , f 2 coincidan el problema es mucho más simple, pues en este caso una única rotación alrededor del eje Oz es suficiente para pasar al Rotaciones y cuaternios 33 sistema de referencia final. Manteniendo la forma de definir los ángulos de Euler podemos considerar este caso como una rotación de ángulos de Euler (⌦, I = 0 , ✓ = 0 ). Dados dos sistemas de referencia I y F, en los que conocemos las expresiones de los vectores de la base de F expresados en la base de I, podemos obtener los ángulos de Euler que pasan de I a F a través de un sencillo algoritmo. El ángulo ⌦ es la longitud del vector l, o de i3 ⇥ f 3 en el sistema de referencia I, por lo que podemos poner ⌦ = polar ((i3 ⇥ f 3 )I ). (2.25) El ángulo I es el ángulo entre los vectores i3 y f 3 , luego verifica I = acos(i3 · f 3 ), (2.26) expresión que nos da sin ambigüedad este ángulo pues pertenece al intervalo [0, ⇡]. Finalmente, el ángulo ✓ es la longitud del vector f 1 en el sistema de referencia I 00 = {l, f 3 ⇥ l, f 3 }, por tanto tendremos e1 (I)R e3 (⌦)(f 1 ) ). ✓ = polar ((f 1 )I00 ) = polar (R I (2.27) Si tenemos las expresiones de la base de I en términos de la base de F, para encontrar los ángulos de Euler basta encontrar, por el procedimiento anterior, los ángulos de Euler que pasan de F a I y cambiarles el signo y el orden. 2.7 Rotaciones y cuaternios La expresión (2.17), de la matriz RIF que pasa de I a F, puede ponerse, después de una serie de manipulaciones algebraicas, en la forma2 0 2 1 q0 + q12 q22 q32 2(q1 q2 q0 q3 ) 2(q1 q3 + q0 q2 ) @ 2(q1 q2 + q0 q3 ) q02 q12 + q22 q32 2(q2 q3 q0 q1 ) A , (2.28) 2 2(q1 q3 q0 q2 ) 2(q2 q3 + q0 q1 ) q0 q12 q22 + q32 donde: q0 = cos ↵ , 2 qi = ai sen ↵ , 2 (2.29) son llamados parámetros de Euler de la rotación. El tratamiento de las rotaciones por medio de los parámetros de Euler se simplifica si se introduce un conjunto de números, desarrollados por Hamilton, y que son llamados cuaternios. 2 En muchos libros aparece la traspuesta de esta matriz porque usan el convenio B. 34 Cambios del sistema de referencia: rotaciones Los cuaternios son una extensión de los números complejos que se definen a partir del elemento q = q 0 + i q1 + j q 2 + k q 3 , (2.30) donde se han introducido tres números imaginarios i, j, k, en lugar de uno, cuyos productos respectivos se definen como: i2 = j 2 = k 2 = 1, ij = ji = k, jk = kj = i, ki = ik = j. (2.31) A q0 le llamaremos parte real del cuaternio, mientras que el resto será la parte imaginaria. Podemos definir la suma, producto por un escalar y el producto de cuaternios como las operaciones entre polinomios, y aplicar las relaciones (2.31). De esta forma, dados dos cuaternios cualesquiera q a = q0a + i q1a + j q2a + k q3a , q b = q0b + i q1b + j q2b + k q3b y un número real r, tendremos q a + q b = (q0a + q0b ) + i (q1a + q1b ) + j (q2a + q2b ) + k (q3a + q3b ), (2.32) para la suma, r q a = r q0a + i r q1a + j r q2a + k r q3a , (2.33) para el producto por un escalar, y qa qb = (q0a q0b q1a q1b q2a q2b q3a q3b )+ i (q0a q1b + q1a q0b + q2a q3b q3a q2b )+ j (q0a q2b + q2a q0b + q3a q1b q1a q3b )+ k (q0a q3b + q3a q0b + q1a q2b q2a q1b ), (2.34) para el producto. Estas operaciones dotan al conjunto de los cuaternios de una estructura de álgebra. Observemos que el producto de dos cuaternios tiene la propiedad asociativa, pero no la conmutativa. De forma similar que para los números complejos podemos definir el conjugado qe de un cuaternio q = q0 + i q1 + j q2 + k q3 como el cuaternio que tiene la misma parte real que q pero la parte imaginaria está cambiada de signo, esto es qe = q0 i q1 j q2 k q3 . Para relacionar las rotaciones con los cuaternios estableceremos una relación entre éstos y los vectores definiendo, a partir de un vector x cuyas componentes en una cierta base I son (x, y, z), el cuaternio de parte real nula x = i x + j y + k z. Con esta definición podemos demostrar, por simple comprobación, que la relación que nos da el cambio de base de un vector x, que en forma matricial se puede poner como xI = RIF xF , Rotaciones y cuaternios 35 tiene su equivalente, a partir de un producto de cuaternios3 , en la expresión xI = q xF qe, (2.35) donde q = q0 + q1 i + q2 j + q3 k, y (qo , q1 , q2 , q3 ) representan los parámetros de Euler de la rotación. La composición de dos rotaciones que pasan de Ia a Ib y de éste a F se realizarán a partir de dos cuaternios: q a , q b . De esta forma xIa = q a xIb qea , por lo que finalmente podremos poner xIb = q b xF qeb , xIa = q a q b xF qeb qea = q xF qe, q = qa qb . (2.36) Ası́ pues, el cuaternio asociado a la composición de las dos rotaciones viene dado por el producto de los cuaternios de cada una de las rotaciones en el orden de aplicación de éstas. Las rotaciones elementales R1 (✓), R2 (✓), R3 (✓) vienen caracterizadas, respectivamente, por los siguientes cuaternios: (cos ✓/2 + i sen ✓/2), (cos ✓/2 + j sen ✓/2), (cos ✓/2 + k sen ✓/2). Por otro lado, si tenemos una rotación definida a partir de los tres ángulos de Euler ⌦, I, ✓, el cuaternio asociado a esta rotación será el producto de los tres cuaternios q = (cos ⌦ ⌦ I I ✓ ✓ + k sen )(cos + i sen )(cos + k sen ), 2 2 2 2 2 2 cuyas componentes son: I ⌦+✓ cos , 2 2 I ⌦ ✓ q1 = sen cos , 2 2 I ⌦ ✓ q2 = sen sen , 2 2 I ⌦+✓ q3 = cos sen . 2 2 q0 = cos 3 En los libros que utilizan el convenio de matrices B, se define como qe x q. (2.37) 36 Cambios del sistema de referencia: rotaciones Capı́tulo 3 Fundamentos de los sistemas de referencia en el espacio 3.1 Introducción En el capı́tulo primero se ha establecido que un sistema de referencia está formado por un punto origen O y una base ortonormal directa {i1 , i2 , i3 }. Para determinar esta base es suficiente, desde el punto de vista práctico, especificar dos elementos: El plano fundamental o plano formado por los vectores i1 e i2 . Este plano puede sustituirse por el vector i3 que es perpendicular al plano fundamental o bien, si trabajamos en la esfera celeste, por un punto que representa el polo del sistema o punto intersección del eje i3 con la esfera. Una dirección origen de coordenadas representada por el vector i1 , o bien el punto de la esfera celeste intersección de ésta con la dirección origen. A este punto le llamaremos por extensión el origen del sistema. A partir de estos dos elementos quedan unı́vocamente determinados los vectores i1 e i3 , ası́ como i2 , pues la condición de sistema ortonormal directo obliga a tomar i2 = i3 ⇥ i1 . Observando los fenómenos astronómicos más simples y conocidos se pueden establecer tres planos que serán la base de los cuatro sistemas de referencia comúnmente utilizados en Astronomı́a. Estos sistemas, junto con los planetográficos presentados al final del capı́tulo, constituyen el fundamento de los sistemas de 38 Fundamentos de los sistemas de referencia en el espacio referencia en el espacio que serán útiles tanto para el establecimiento de las coordenadas astronómicas y geográficas o planetográficas como para el establecimiento de sistemas de referencia para la navegación espacial. En los dos próximos capı́tulos distinguiremos entre los sistemas de referencia idealizados, que parten de la premisa de que los planos y puntos usados como referencia están fijos en el espacio, y los sistemas de referencia precisos, que toman en consideración, de forma rigurosa, las variaciones de estos planos y puntos. Si atendemos al movimiento orbital de la Tierra en torno al Sol, las leyes enunciadas por Kepler nos indican que éste tiene lugar en un plano que es llamado plano de la eclı́ptica. Por otro lado, la Tierra es un sólido de revolución que gira, con velocidad angular constante, alrededor de un eje. El plano perpendicular a dicho eje es llamado plano del ecuador y la intersección del eje de rotación con la superficie de la Tierra y con la esfera celeste nos define, respectivamente, el polo terrestre y el polo celeste. Los planos del ecuador y la eclı́ptica son, en una primera aproximación, planos fijos en el espacio. Su intersección (ver figura 3.1), representada por el sı́mbolo , es un punto llamado equinoccio 1 o punto vernal. El ángulo ✏ entre los dos planos es llamado oblicuidad de la eclı́ptica y tiene un valor aproximado de 23 270 . eclı́ptica ✏ ecuador La combinación de la atracción gravitacional junto con la rotación de la Tierra determinan, para cada observador situado en su superficie, una dirección privilegiada, llamada dirección vertical, que se observa de manera muy precisa con una simple plomada. El Figura 3.1: Planos del ecuador y de la plano perpendicular a la vertical de un eclı́ptica. lugar es el llamado plano horizontal u horizonte. Puesto que la dirección de la vertical depende del lugar, el plano horizontal resulta ser un plano distinto para cada observador. Mediante estos planos y sus intersecciones definiremos los elementos necesarios para establecer las bases de los sistemas de referencia fundamentales, pero además, deberemos establecer el origen del sistema. Utilizaremos distinto nombre según el origen elegido, ası́ llamaremos a los sistemas: 1 En realidad existen dos equinoccios: el de primavera o punto en el que el Sol cruza el ecuador con declinaciones crecientes (acercándose al polo norte) y el equinoccio de otoño, que es el punto opuesto. De aquı́ en adelante cuando hablemos del equinoccio nos referiremos al equinoccio de primavera. Sistema de referencia horizontal 39 topocéntrico, si el origen es un lugar en la superficie de la Tierra, geocéntrico, si el origen es el centro de masas de la Tierra, heliocéntrico, si el origen es el centro de masas del Sol, baricéntrico, si el origen es el baricentro del sistema solar, planetocéntrico, si el origen es el centro de masas de un planeta, selenocéntrico, si el origen es el centro de masas de la Luna. El cambio entre sistemas con centros diferentes requerirá aplicar una traslación, para lo que será necesario el vector de posición relativa entre los dos centros expresado en la base correspondiente. Finalmente introduciremos una breve nota relativa a la notación utilizada, de aquı́ en adelante, para dar nombre a los sistemas de referencia. Utilizaremos una letra mayúscula caligráfica que hará mención, bien al plano fundamental, o bien a su polo. Un subı́ndice indicará el origen. Ası́, un sistema cuyo plano fundamental sea el ecuador y origen el equinoccio se representará por E , donde la letra E hace mención al plano del ecuador, mientras para un sistema cuyo plano fundamental sea el de la eclı́ptica, y que tenga el mismo origen, usaremos la notación K , que hace mención al polo de la eclı́ptica en lugar del plano. Puesto que en lo que sigue se hará hincapié en el cambio de base no se especificará, en general, el origen O del sistema. 3.2 Sistema de referencia horizontal Situando un punto de la superficie terrestre como origen del sistema de referencia, elegiremos su plano horizontal como primer plano fundamental. El eje ortogonal al plano horizontal (dirección vertical) corta a la esfera celeste en dos puntos llamados zenit2 , Z, y nadir, N . Llamaremos Z 3 al vector unitario que une el origen con el zenit. Para determinar un sistema de referencia ortonormal directo a partir Z 3 habrá que fijar las direcciones fundamentales Z 1 y Z 2 sobre el plano del horizonte. La Tierra gira alrededor de un eje que une los polos. Para un observador del hemisferio norte, el polo norte, que puede ser observado cerca de la estrella polar, señala el Norte geográfico. Debido a la rotación de la Tierra, todos los astros salen por el horizonte hacia el Este (aunque no exactamente por él), se van elevando sobre el horizonte, alcanzan su máxima elevación precisamente en la dirección Sur, y se ponen de nuevo hacia el Oeste (aunque no exactamente por él). Tenemos, pues, los cuatro puntos cardinales, la dirección Norte–Sur que se puede determinar fácilmente por observación, y la Este–Oeste perpendicular a la anterior. 2 Palabra de origen árabe que significa punto situado sobre nuestra cabeza. 40 Fundamentos de los sistemas de referencia en el espacio Si llamamos Z 1 al vector unitario en la dirección Oeste y Z 2 al vector unitario en la dirección Sur, junto con la dirección vertical que determina Z 3 , queda establecida la base que determina el sistema de referencia horizontal. El origen natural de este sistema es el lugar de observación, sin embargo, en ocasiones trasladaremos el origen de dicho sistema al centro de masas de la Tierra. En general, si no hay confusión con el origen, hablaremos del sistema ZW = {Z 1 , Z 2 , Z 3 }. Z3 z Z2 h A Z1 W (Oeste) S (Sur) Horizonte Podemos definir las coordenadas horizontales como las coordenadas polares esféricas en el sistema de referencia horizontal. Llamaremos Acimut3 , Figura 3.2: Sistema de referencia horizonA 2 [0, 2⇡), a la colongitud, medida tal ZW . Coordenadas horizontales. sobre el horizonte a partir del vector Z 2 , y distancia cenital, z 2 [0, ⇡], a la colatitud, medida a partir del eje Z 3 . Con esto, si las coordenadas horizontales de un astro son (A, z), su vector de posición x será x = sen z sen A Z 1 + sen z cos A Z 2 + cos z Z 3 , (3.1) o bien, con la notación introducida en los capı́tulos anteriores, xZW = cart(r, ⇡ 2 A, ⇡ 2 z), (3.2) donde se ha considerado que el punto está a una distancia r en lugar de tomarlo en la esfera celeste. En ocasiones se sustituye la distancia cenital por su complementario (latitud), y a esta coordenada se le llama altura, o elevación, h = ⇡/2 z. Dado que se ha tomado como plano fundamental el horizonte y como direcciones fundamentales los puntos cardinales y la vertical, resulta claro que se trata de un sistema de coordenadas locales, es decir, dependen del punto de la superficie de la Tierra tomado como origen. 3 Esta es la definición usada habitualmente en Astronomı́a y la que mantendremos a lo largo de este libro porque nos permite una fácil relación con el sistema de referencia horario. En geodesia, cartografı́a y navegación suele medirse desde el Norte y no desde el Sur por lo que diferirá en 180 de la utilizada aquı́. Sistema de referencia horario 3.3 41 Sistema de referencia horario Tomemos de nuevo como origen el observador y definamos un sistema de referencia en el que el plano del ecuador, o uno paralelo a éste que pase por el observador, sea el plano fundamental. De esta forma P 3 es el vector unitario en la dirección del polo norte. La intersección entre el ecuador y el horizonte determina la lı́nea Este–Oeste. Tomamos como vector P 1 el vector unitario en la dirección Oeste y como vector P 2 el producto P 2 = P 3 ⇥ P 1 . Con esta definición, los vectores P 1 y Z 1 coinciden. Al sistema EW = {P 1 , P 2 , P 3 } le llamaremos sistema de referencia horario. P (Polo norte) P3 H P1 W Ecuador Los semicı́rculos máximos que unen los polos se denominan meridianos. En Paralelo particular, al meridiano que contiene al zenit, es decir, al que contiene los extremos de los vectores Z 3 y P 3 , se le llama meridiano del lugar. A los planos paralelos al ecuador se les conoce como paralelos. P2 Meridiano Figura 3.3: Sistema de referencia horario EW . Coordenadas horarias. Las coordenadas polares que determinan la dirección de un astro E en este sistema de referencia son: el ángulo horario H 2 [0, 2⇡), que representa la colongitud, y que, por la razón que expondremos más adelante, se suele expresar en horas y la declinación 2 [ ⇡/2, ⇡/2], que representa la latitud. Con esto, el vector unitario x en la dirección del punto E es x = cos sen H P 1 + cos cos H P 2 + sen P 3 , (3.3) o también, situando el punto a una distancia r, tendremos xEW = cart(r, ⇡ 2 H, ). (3.4) Debido al movimiento diurno, todos los puntos de la esfera celeste giran alrededor del eje de los polos, permaneciendo a la misma distancia angular con respecto al ecuador, esto es, recorriendo un paralelo. De esta forma, su declinación, , permanecerá constante, mientras que el ángulo horario, H, dará una vuelta completa en un dı́a; de ahı́ el nombre de “horario” y el que se represente en horas. Al igual que sucedı́a con las coordenadas horizontales se trata de un sistema de coordenadas locales puesto que los vectores fundamentales P 1 y P 2 dependen del lugar elegido. 42 3.4 Fundamentos de los sistemas de referencia en el espacio Sistema de referencia ecuatorial Para que el sistema de referencia no dependa de la posición del observador ni del movimiento diurno usaremos de nuevo el plano del ecuador como plano fundamental, pero elegiremos como dirección origen, esto es como vector e1 , la dirección del equinoccio . El vector e3 coincidirá con la dirección del polo, es decir, e3 = P 3 y el vector e2 es el producto e2 = e3 ⇥ e1 . Además, supondremos el origen en el centro de masas de la Tierra. De esta forma definimos el sistema de referencia ecuatorial E = {e1 , e2 , e3 }. P e3 Paralelo e1 ↵ Ecuador e2 Meridiano Las coordenadas polares, longitud y latitud en este caso, que determinan la dirección de un astro E en este sisteFigura 3.4: Sistema de referencia E . Coorma de referencia, reciben el nombre de: denadas ecuatoriales. ascensión recta ↵ 2 [0, 2⇡), que también se suele expresar en horas, y declinación 2 [ ⇡/2, ⇡/2]. Ası́, el vector unitario x en la dirección del punto E será x = cos cos ↵ e1 + cos sen ↵ e2 + sen e3 , (3.5) o también, situando el punto a una distancia r, tendremos xE = cart(r, ↵, ). (3.6) Se trata, como ya hemos advertido, de un sistema de coordenadas absoluto, es decir, las coordenadas (↵, ) de un astro son independientes del lugar de observación y del movimiento diurno, pues el punto también es arrastrado por dicho movimiento. 3.5 Sistema de referencia eclı́ptico La mayor parte de los objetos del sistema solar ocupan posiciones próximas a la eclı́ptica por lo que, en ocasiones, se suele utilizar otro sistema de coordenadas cuyo plano fundamental sea la eclı́ptica. Para ello, definimos el sistema de referencia eclı́ptico, K = {K 1 , K 2 , K 3 }, de tal modo que el vector K 1 coincide con la dirección del equinoccio, K 1 = e1 , el vector K 3 es la dirección perpendicular a la eclı́ptica, cuya intersección con la esfera celeste será llamada polo de la eclı́ptica, y el vector restante el producto K 2 = K 3 ⇥ K 1 . Relación entre los sistemas de referencia espaciales Las coordenadas polares que determinan la dirección de un astro E en este sistema de referencia son: la longitud eclı́ptica 2 [0, 2⇡) y la latitud eclı́ptica 2 [ ⇡/2, ⇡/2]. El vector unitario x en la dirección del punto E es K3 x = K2 K1 43 cos cos K 1 + cos sen K 2 + sen K 3 , (3.7) o también, situando el punto a una distancia r, tendremos Eclı́ptica xK = cart(r, , ). Figura 3.5: Sistema de referencia eclı́ptico K . Coordenadas eclı́pticas. (3.8) Al igual que el sistema ecuatorial, éste es un sistema de coordenadas absoluto. En el caso particular del Sol la definición del plano de la eclı́ptica determina que su latitud eclı́ptica es siempre nula, por ello su posición queda determinada únicamente por su longitud eclı́ptica que se denota por el sı́mbolo . 3.6 Relación entre los sistemas de referencia espaciales P3 ⇡ 2 Z3 P2 P 1 ⌘ Z1 Z2 Figura 3.6: Transformación entre los sistemas horizontal y horario. Para relacionar los sistemas de referencia horizontal Z y horario P basta tener en cuenta que de acuerdo con la definición de las coordenadas geográficas, que veremos con detalle en un próximo apartado de este capı́tulo, llamaremos latitud de un lugar al ángulo entre la dirección vertical y el ecuador terrestre, que en la figura 3.6 se representa como el ángulo entre los vectores Z 3 y P 2 . Observando la figura 3.6 podemos concluir que para pasar del sistema horizontal al horario basta girar un ángulo igual a (⇡/2 ) alrededor del eje Ox. Por tanto, la matriz de giro entre estos dos sistemas será RZW EW = R1 (⇡/2 ), (3.9) 44 Fundamentos de los sistemas de referencia en el espacio y la relación entre las coordenadas en ambos sistemas vendrá dada por la expresión xZW = RZW EW xEW que, desarrollada, se escribirá en la forma: sen z sen A = cos sen H, sen z cos A = cos cos H sen sen cos , cos z = cos cos H cos + sen sen , (3.10) mientras que su inversa, xEW = REW ZW xZW , será: cos sen H = sen z sen A, cos cos H = sen z cos A sen + cos z cos , sen = sen z cos A cos + cos z sen . (3.11) Para establecer la relación entre los sistemas horario y ecuatorial tengamos en cuenta la figura 3.7. Habitualmente se llama tiempo sidéreo, ST , al ángulo horario del equinoccio . Este ángulo varı́a, por la rotación de la Tierra, entre 0h y 24h a lo largo de un dı́a por lo que representa el reloj natural de la Astronomı́a. P 3 ⌘ e3 ↵ H ST Sur P2 (Sur) L H ↵ e1 ( ) ST L Figura 3.7: Transformación entre los sistemas horario y ecuatorial. Para pasar del sistema horario al ecuatorial debemos girar alrededor de P 3 o eje Oz el ángulo entre P 1 y e1 , esto es ⇡/2 ST . La matriz de giro entre ambos sistemas será REW E = R3 (⇡/2 ST ). (3.12) La relación entre las coordenadas puede obtenerse, bien por la expresión xE = RE EW xEW , o bien, teniendo en cuenta que la declinación es común en ambos sistemas, basta observar la figura 3.7 para comprobar que ST = ↵ + H. (3.13) Sistema de referencia geográfico K3 ✏ e3 K2 e2 e1 ⌘ K 1 Figura 3.8: Transformación entre los sistemas ecuatorial y eclı́ptico. 45 Finalmente, para relacionar el sistema ecuatorial con el eclı́ptico basta recordar que la oblicuidad de la eclı́ptica ✏ es el ángulo entre los planos del ecuador y la eclı́ptica y, por tanto, también entre los vectores e3 y K 3 (figura 3.8). Si tenemos esto en cuenta, ası́ como el hecho de que los vectores e1 y K 1 coinciden, podemos concluir que el paso del sistema ecuatorial al eclı́ptico se realiza por una rotación elemental de ángulo ✏ alrededor del eje Ox, o lo que es igual, por medio de una matriz de rotación RE K = R1 (✏). (3.14) La relación entre las coordenadas en ambos sistemas vendrá dada por la expresión xE = RE K xK que, desarrollada, se escribirá en la forma: cos cos ↵ = cos cos , cos sen ↵ = cos sen cos " sen sen ", sen = cos sen sen " + sen cos ", (3.15) mientras que la relación inversa será: cos cos cos sen sen 3.7 = cos cos ↵, = cos sen ↵ cos " + sen sen ", = cos sen ↵ sen " + sen cos ". (3.16) Sistema de referencia geográfico Estudiando la figura que adopta un fluido en rotación en ausencia de fuerzas externas se comprueba que una de las posibles soluciones es un elipsoide de revolución achatado por los polos. De hecho, se ha comprobado que esta figura se aproxima mucho a la forma real no solo de la Tierra son de otros cuerpos como la Luna, Marte u otros planetas. Además, en todos los casos, el eje de simetrı́a de este elipsoide de revolución está tan próximo al eje de rotación del planeta que, en una primera aproximación, pueden considerarse idénticos. La necesidad de situar geográficamente puntos sobre la superficie de la Tierra ha llevado a definir un sistema de coordenadas geográficas sobre el elipsoide. La inclusión del concepto de altitud, para representar puntos de la Tierra que no se encuentren exactamente en el elipsoide, permite extender el uso de estas coordenadas geográficas para la determinación de la posición geográfica de los satélites artificiales. 46 Fundamentos de los sistemas de referencia en el espacio Para introducir unas coordenadas geográficas estableceremos un sistema de referencia G = {T, g 1 , g 2 , g 3 }, que llamaremos sistema de referencia geográfico 4 , donde T representa el centro de masas de la Tierra y g 3 el eje de revolución del elipsoide que también llamaremos eje polar pues por el momento supondremos que coincide con el eje de rotación del planeta. Por extensión el plano de g 2 y g 3 será el ecuador. Finalmente debemos elegir un meridiano cero también llamado meridiano de referencia o primer meridiano, tradicionalmente el meridiano de Greenwich. Este meridiano de referencia fija la posición del vector g 1 y por tanto la de g 2 = g 3 ⇥ g 1 . Las dimensiones del elipsoide quedan caracterizadas por un parámetro a que representa el radio ecuatorial del elipsoide y por el achatamiento f = (a b)/a, donde b es llamado radio polar. La combinación de la atracción gravitacional junto con la rotación de la Tierra determinan, para cada observador en la superficie, la dirección vertical de la que ya hemos hablado antes. Sin embargo, esta dirección no coincide exactamente con la normal al elipsoide de revolución en un punto, presentando desviaciones que han de ser determinadas para poder pasar de un sistema a otro. En el caso de la Tierra las desviaciones son del orden de 500 a 1000 , por lo que para la mayorı́a de aplicaciones astronómicas y astrodinámicas podemos prescindir de estas pequeñas diferencias y supondremos que la normal al elipsoide y la dirección de la plomada coinciden. g3 z b T a P ⇠ S S a b g2 ⇢ g1 a x Figura 3.9: Sistema de referencia geográfico. Veamos cómo podemos situar un punto S sobre las superficie del elipsoide. Las coordenadas polares esféricas de ese punto serán (⇢, , ), donde ⇢ es la distancia radial al centro de la Tierra, la longitud geográfica es el ángulo diedro que forma el meridiano de referencia con el meridiano del punto S. La longitud, que suele expresarse en horas, será tomada, de aquı́ en adelante, como un ángulo entre 0h y 4 En este sistema hemos usado un sı́mbolo G independiente del polo, del ecuador y del origen, pues estos puntos en el caso del elipsoide de referencia terrestre deberán ser redefinidos con más cuidado. Sistema de referencia geográfico 47 24h medido en sentido contrario a las agujas del reloj, lo que en la Tierra supone medirlo hacia el este. Habitualmente, cuando se da la posición geográfica de un lugar de la Tierra, suele utilizarse el convenio de dar el ángulo entre 0h y 12h hacia el este o el oeste, por lo que cuando se da longitud oeste será preciso cambiarle el signo y sumarle 24h para aplicar el convenio usado en este libro. Para determinar la latitud observaremos la figura de la derecha de 3.9, que representa la elipse meridiana, esto es, la intersección del plano del meridiano del lugar S con el elipsoide de referencia. Aquı́ distinguiremos dos puntos: el punto S del elipsoide del que estamos definiendo las coordenadas y un punto P que está a una distancia ⇠ de S sobre la vertical de éste. A ⇠ le llamaremos altitud de P . Definiremos en primer lugar las coordenadas de S y luego veremos como afecta en las coordenadas el hecho habitual de que el punto de la superficie de la Tierra, cuyas coordenadas se miden, no esté exactamente sobre en el elipsoide sino a una altitud ⇠ respecto a éste. El ángulo , denominado latitud geocéntrica, es el ángulo formado por el semieje mayor de la elipse meridiana con el radio que pasa por el punto S. Sin embargo, en coordenadas astronómicas suele emplearse la llamada latitud geográfica, de sı́mbolo , que es el ángulo formado por la normal a la elipse meridiana en el punto S (que como hemos mencionado anteriormente, haremos coincidir con la dirección de la plomada) con el semieje mayor de dicha elipse. Las dos longitudes , 2 [ ⇡/2, ⇡/2], aunque se suelen expresar siempre como cantidades positivas indicando si es latitud norte (N) o sur (S). Para establecer la relación entre ambas latitudes consideraremos un sistema de referencia plano en la elipse meridiana cuyos ejes Ox y Oz coinciden con la dirección de los semiejes mayor y menor de la elipse. En este sistema la ecuación de la elipse meridiana se puede poner como x2 z2 + = 1. a2 b2 La pendiente de la recta normal a la elipse es tan mientras que el ángulo dx a2 z = 2 , dz b x = viene dado por tan tan = 1 1 e2 = z/x, con lo que resulta tan , (3.17) siendo e la excentricidad del elipsoide que se obtiene a partir del radio ecuatorial a y el achatamiento f . El radio vector ⇢ se obtiene también sin dificultad, aunque con un poco más de cálculo. A partir de la ecuación de la elipse, b2 x 2 + a 2 z 2 = a 2 b2 , 48 Fundamentos de los sistemas de referencia en el espacio y teniendo en cuenta que x = ⇢ cos , se tiene ⇢2 = x2 = a 2 b2 + a2 sen2 b2 cos2 Por otra parte, al ser b2 x sen a4 z 2 cos2 , b4 sen2 z = ⇢ sen , = a2 (1 e2 ) . 1 e2 cos2 (3.18) = a2 z cos , resulta y de ahı́, z2 = b4 sen2 , a2 cos2 + b2 sen2 y con esto ⇢2 = x 2 + z 2 = a2 [cos2 + (1 e2 )2 sen2 ] . 1 e2 sen2 (3.19) Ahora bien, normalmente los lugares de observación no se encuentran sobre el elipsoide de referencia, sino a una cierta altitud, por eso se hace necesario el obtener las coordenadas de un lugar P situado a una altitud ⇠ sobre el horizonte. Recordemos que la latitud se mide sobre la normal al elipsoide. Por ello, se introducen unas cantidades C y S de modo que las coordenadas del punto resultan ser: x = ⇢ cos = a C cos , (3.20) z = ⇢ sen = a S sen . Dividiendo estas dos ecuaciones, se tiene S tan C = tan = b2 tan a2 = (1 f )2 tan , lo que, llevado a la ecuación de la elipse, nos da 1= x2 z2 + = C 2 [cos2 a2 b2 de donde se obtiene finalmente: p C = 1/ 1 f (2 + (1 f ) sen2 , f )2 sen2 )], S = C(1 f )2 . Con esto, si el punto P 0 se encuentra a una altitud ⇠ tendremos x0 z0 = = x+ x z+ z = = (a C + ⇠) cos , (a S + ⇠) sen , (3.21) siendo x0 , z 0 sus coordenadas sobre el plano del meridiano del observador. A partir de lo dicho hasta ahora podemos llamar coordenadas geográficas de un punto al conjunto de elementos ( , , ⇠) que describe su posición con respecto al elipsoide de referencia. Teniendo en cuenta todo lo anterior la expresión del Sistema de referencia geográfico 49 vector de posición de este punto, xG , expresado en el sistema de referencia G, vendrá dada por 0 (a C + ⇠) cos cos xG = @ (a C + ⇠) cos sen (a S + ⇠) sen 1 A. (3.22) En el caso de la Tierra, el IERS (International Earth Rotation and Reference System Service) ha definido el ITRS (International Terrestrial Reference System) como el elipsoide de referencia terrestre oficial. Tras muchos años de estudio de la forma de la Tierra, y una necesidad cada vez más imperiosa de precisión, se han modificado muchos de los estándares clásicos y se ha creado este marco teórico preciso que se debe materializar en modelos calculados que se adapten a este sistema. El ITRS es un modelo de elipsoide cuyo polo es el llamado IRP (Polo de referencia del IERS) y cuyo meridiano cero es el llamado IRM (Meridiano de referencia del IERS). Este sistema se ha creado de forma que sea consistente con el modelo del BIH de 1984, con el polo ajustado al antiguo CIO (Origen internacional convencional) que ha sido suprimido. De acuerdo con el convenio de notación establecido antes el sistema de referencia asociado a este modelo deberı́a llamarse IRP IRM sin embargo, por claridad, hemos preferido continuar usando para este sistema el sı́mbolo G. Una materialización de este sistema es el actual elipsoide WGS84 (World Geodetic System 1984) que es el modelo donde se representan las coordenadas emitidas por los satélites GPS. Debido a la importancia de esta información usaremos de aquı́ en adelante este modelo como modelo de la Tierra. El modelo WGS84 es consistente con ITRS con una aproximación de unos pocos centı́metros, por lo que será suficiente para todas nuestras aplicaciones. Los parámetros de dicho modelo se caracterizan por los siguientes elementos: el radio ecuatorial, que de aquı́ en adelante se denotará por r en lugar de a, y que vale r = 6378137 m, y f = 1/298.257223563. De esta forma el radio polar mide 6356752.3142 m. El meridiano de referencia IRM no coincide exactamente con el meridiano de Greenwich sino que está desplazado unos 100 m. hacia el este. Cuando las coordenadas de un lugar no se obtienen con GPS sino a partir de los modelos geodésicos de cada paı́s o región no se usa el modelo WGS84 sino que se usan modelos regionales mucho más precisos para una zona determinada pero que no son consistentes para la globalidad del globo terrestre. El modelo Español está integrado en el modelo Europeo ED50, y en él se dan todas las coordenadas geográficas oficiales. Existen métodos sencillos que permiten transformar las coordenadas entre ambos sistemas que no vamos a ver aquı́ porque exceden del propósito de este libro. El modelo llamado ETRS89 es una adaptación europea al modelo ITRS, o bien al WGS84. 50 Fundamentos de los sistemas de referencia en el espacio 3.8 Sistema de referencia planetográfico Teniendo en cuenta la posibilidad futura de enviar misiones, tanto a la Luna como a Marte, y aprovechando que la forma de dichos cuerpos es, como en el caso de la Tierra, un elipsoide de revolución, estableceremos un sistema genérico de coordenadas que llamaremos coordenadas planetográficas, que serán llamadas selenográficas en el caso de la Luna y areográficas en el caso de Marte5 y que en esencia son idénticas a las establecidas para la Tierra. El sistema de referencia donde se definirán las coordenadas planetográficas será llamado sistema p3 polo del planeta de referencia planetográfico P = {P, p1 , p2 , p3 }, donde p3 representa el eje de revolución que también llamaremos eje polar pues supondreS mos que coincide con el eje de rotab 6 ción del planeta . A la intersección P del eje de revolución y de rotación p2 a con la superficie del elipsoide le llamaremos polo del planeta. El plano p1 ecuador del planeta de los vectores p1 , p2 será llamado, por extensión, ecuador del planeta. Finalmente debemos elegir un meridiano cero o primer meridiano. Es- Figura 3.10: Sistema de referencia planete meridiano de referencia fija la po- tográfico. sición del vector p1 y por tanto la de p2 = p3 ⇥ p1 . En el caso de la Luna los valores que determinan el elipsoide son a = 1738.1 km, f = 0.0012, por lo que el radio polar será b = 1736.0 km. El primer meridiano está situado casi en centro de la cara visible y su velocidad de rotación, que determinará la posición del meridiano cero desde una dirección fija, es de una vuelta cada 27.321661 dı́as. Para Marte se tiene un radio ecuatorial de a = 3397 km y un achatamiento de f = 0.00736. El primer meridiano pasa por el crater Airy-0 y tiene un perı́odo de rotación de 1.025957 dı́as. Una vez creado el sistema planetográfico, donde podremos establecer la topografı́a del planeta, será necesaria la relación de éste con un sistema fijo como el ecuatorial a través de un sistema intermedio que llamaremos planetocéntrico. La forma usual de definir los elementos del sistema planetográfico P = {P, p1 , p2 , p3 } con respecto al sistema ecuatorial E = {P, e1 , e2 , e3 } es definir las coordenadas ecuatoriales del polo del planeta, (↵0 , 0 ), y determinar lo que llamaremos 5 Ares 6 El es el nombre griego de Marte. plano del ecuador de un planeta no coincide con el plano del ecuador terrestre. Sistema de referencia planetográfico 51 ángulo de rotación, W , que forma el vector p1 con respecto a la intersección del ecuador del planeta con el ecuador celeste. Comprobaremos a continuación que estos tres parámetros permiten efectuar el cambio entre los dos sistemas de referencia anteriores. p3 ⇡ 2 0 p1 P e1 ⇡ 2 $ W + ↵0 Suponiendo que el planeta rota con velocidad angular constante alrededor de su eje de rotación, el ángulo de rotación representa la posición instantánea del meridiano principal con respecto a una posición fija. Este ángulo, que es en cierto modo equivalente al tiempo sidéreo en la Tierra, podrá ponerse como W = W0 + t Wr , donde W0 representa el valor del ángulo en un cierto instante origen, t es el tiempo transcurrido desde ese instante origen medido en dı́as, y Wr es igual a 2⇡/Pr siendo Pr el periodo de rotación del planeta en dı́as. Llamaremos $ y a los puntos del ecuador del planeta que representan los extremos de los vectores p1 y P 1 = (e3 ⇥ p3 )/k e3 ⇥ p3 k. Este último determina la intersección del ecuador celeste y el del planeta y representa el primer meridiano o meridiano cero del planeta. De esta forma podemos definir dos sistemas de referencia asociados a la rotación del planeta, por un lado el que habı́amos llamado antes sistema planetográfico {P, p1 , p2 , p3 }, similar al geográfico en la Tierra, que es un sistema que rota con el planeta y que de ahora en adelante denotaremos por el sı́mbolo P$ y otro sistema que llamaremos sistema de referencia planetocéntrico P = {P, P 1 , P 2 , P 3 }, con P 3 = p3 y P2 = P 3 ⇥ P 1 , que es un sistema fijo pero cuyo plano fundamental coincide con el ecuador del planeta. Figura 3.11: Movimiento del sistema planetográfico respecto al sistema ecuatorial. Si (↵0 , 0) representan las coordenadas del polo del planeta podremos poner p3 = cos ↵0 cos 0 e1 + sen ↵0 cos 0 e3 + sen 0 e3 , por lo que podemos deducir fácilmente que P 1 = (e3 ⇥ p3 )/k e3 ⇥ p3 k = sen ↵0 e1 + cos ↵0 e2 , lo que equivale a decir que la ascensión recta de del punto se muestra en la figura 3.11. vale (⇡/2 + ↵0 ), como La inclinación entre los dos ecuadores viene dada por el ángulo entre los vectores e3 y p3 que es igual a (⇡/2 0 ). 52 Fundamentos de los sistemas de referencia en el espacio Con todo ésto podemos deducir que los ángulos de Euler que pasan del sistema E a P$ son (⇡/2 + ↵0 , ⇡/2 0 , W ) por lo que la matriz de rotación entre ambos sistemas será RE P$ = R3 (⇡/2 + ↵0 )R1 (⇡/2 (3.23) 0 )R3 (W ), y la matriz de paso de E a P será simplemente RE P = R3 (⇡/2 + ↵0 )R1 (⇡/2 0 ). (3.24) En el informe de G. Seidelmann et al.7 (2007) aparecen los valores de los elementos (↵0 , 0 , W ) para todos los planetas, la Luna y otros cuerpos del sistema solar obtenidos por el grupo de trabajo formado por la IAU para el estudio de la rotación de los planetas. 7 Ver bibliografı́a. Capı́tulo 4 Sistemas de referencia espaciales precisos 4.1 Movimientos del polo y del equinoccio Al introducir los sistemas de referencia espaciales en el capı́tulo anterior se ha supuesto que el ecuador y la eclı́ptica son planos fijos y, por tanto, que el equinoccio representa un punto fijo en la esfera celeste. Además, para definir las coordenadas geográficas y planetográficas hemos considerado que el eje de rotación del planeta, que define su polo y su ecuador, y el eje de revolución del elipsoide de referencia del planeta coinciden. La realidad es que ninguna de las premisas anteriores es cierta por lo que deben detallarse mucho más las definiciones a la hora de definir sistemas de referencia que cumplan los requerimientos de precisión de la Astrometrı́a y Astrodinámica actuales. Para entender el problema debemos comprender mejor el movimiento de rotación de los planetas. Supondremos, como primera aproximación, que éstos son sólidos rı́gidos, cuyo movimiento rotacional se describe por las ecuaciones de Euler del movimiento del sólido: I1 !˙ 1 + (I3 I2 !˙ 2 + (I1 I3 !˙ 3 + (I2 I 2 ) !2 !3 I 3 ) !1 !3 I 1 ) !1 !2 = = = µ1 , µ2 , µ3 , (4.1) donde I1 , I2 , I3 son los momentos principales de inercia del sólido, y ! = !1 p1 + !2 p2 + !3 p3 es el vector velocidad angular de rotación del sólido expresada en el sistema de referencia planetográfico P = {p1 , p2 , p3 }, que supondremos coincide 54 Sistemas de referencia espaciales precisos con el de ejes principales de inercia. Finalmente µ1 p1 + µ2 p2 + µ3 p3 representa el momento de las fuerzas externas que actúan sobre el sólido. La integración de las ecuaciones anteriores determinará el valor del vector !. Una vez obtenido éste podremos decir que el sólido rota con una velocidad angular ˆ del vector ! = k ! k alrededor de un eje cuya dirección coincide con la dirección ! !. Si suponemos que no actúa ninguna fuerza exterior sobre el sólido (µ1 = µ2 = µ3 = 0) y que éste es de revolución alrededor del eje Oz (I1 = I2 ), las ecuaciones de Euler (4.1) se transforman en: I1 !˙ 1 + (I3 I1 !˙ 2 + (I1 I3 !˙ 3 = 0. I1 ) !2 !3 = 0, I3 ) !1 !3 = 0, (4.2) De la tercera de estas ecuaciones se obtiene inmediatamente que !3 = ⌦ = constante. ! Las dos primeras ecuaciones (4.2) se pueden escribir como: !˙ 1 + !˙ 2 (4.3) p3 !2 = 0, E !1 = 0, E donde hemos introducido la constante E = I3 I1 I1 ⌦. p2 La solución de estas ecuaciones será !1 = A cos( !2 = A sen( Et + B), t E + B), (4.4) p1 donde A, la fase, y B, la amplitud, son constantes de integración. Las expresiones (4.3) y (4.4) determinan la velocidad angular de un pla- Figura 4.1: Movimiento del eje de rotación neta, considerando éste como un elip- de un sólido libre. soide rı́gido y sobre el que no actúan fuerzas externas. El valor p constante de A y ⌦ nos indica que la norma de la velocidad angular ! = A2 + ⌦2 es una constante, mientras que su dirección describe un cono alrededor del eje p3 , tal como se observa en la figura 4.1. Por ello, podemos decir que, en estas condiciones, un planeta gira con velocidad angular constante alrededor de un eje que describe un cono en torno al eje de simetrı́a del elipsoide. De esta forma vemos que el polo del planeta, esto es, el extremo del eje de rotación, no coincide con el polo del sistema planetocéntrico. Movimientos del polo y del equinoccio 55 En el caso de la Tierra, los valores de I1 , I2 , I3 verifican, aproximadamente, la relación (I3 I1 )/I1 ⇡ 2 ⇥ 10 5 . Con estos valores el periodo de rotación alrededor del eje de simetrı́a es de unos 304 dı́as, mientras que el valor de A es muy pequeño, de forma que la distancia angular entre la posición del polo de sistema planetográfico, extremo de p3 , y el polo de rotación, extremo de !, no es mayor que 0.00 2, lo que equivale a decir que la separación de estos dos puntos en la superficie terrestre nunca es mayor de 10 m. De acuerdo con la definición de dı́a, como el periodo de tiempo en que la Tierra da una vuelta alrededor de su eje de rotación, se tendrá que el valor de ! es exactamente de 2⇡ radianes por dı́a. Chandler observó, en 1891, que el periodo de 304 dı́as del eje de rotación, llamado en su honor periodo de Chandler, es realmente de unos 433 dı́as. Esta discrepancia se debe al hecho de que la Tierra no es completamente rı́gida, sino que tiene deformaciones elásticas. Además, también se observan fluctuaciones de periodo anual debidas a los cambios estacionales en la distribución de masas de aire, de aguas, deshielos, etc., e incluso variaciones irregulares, debidas a terremotos, volcanes, etc., es decir, a un cambio en la distribución de masas de la Tierra. Por otro lado, hemos estudiado una aproximación del problema real, pues no se han considerado los valores de las componentes, (µ1 , µ2 , µ3 ), del momento de las fuerzas producidas por el Sol, la Luna y los planetas. Figura 4.2: Gráfica del movimiento del polo. Datos del IERS. La gráfica 4.2 muestra los datos de movimiento del polo obtenidos por el IERS (International Earth Rotation and Reference Systems Service) para el perı́odo 56 Sistemas de referencia espaciales precisos comprendido entre 1890 y 2000, donde se da el desplazamiento, en segundos de arco, en el plano horizontal con centro en el polo del sistema de coordenadas geográfico y cuyo eje OX representa la dirección del meridiano cero de este sistema. Estos puntos representan el polo verdadero de rotación de la Tierra en cada instante y en consecuencia el ecuador verdadero de cada fecha. Incluyen todos los efectos que actúan sobre el eje de rotación y no pueden ser previstos a priori, sino que se calculan por observación. El IERS es el organismo internacional encargado del cálculo y distribución de estos datos. Hasta aquı́ se ha considerado únicamente la variación del eje de rotación terrestre debida al movimiento del sólido libre. Esta variación se ha representado a través del movimiento del polo y se ha referido al sistema sistema geográfico, solidario con el planeta. La variación del eje de rotación debida al efecto gravitacional del Sol y la Luna, por un lado, y de los planetas por otro, se estudia a través del movimiento del plano del ecuador, más concretamente a través del movimiento del equinoccio, y se refiere a un sistema espacial en lugar del sistema geográfico. Hiparco observó que el equinoccio se desplazaba sobre la eclı́ptica con un movimiento retrógrado de 2 cada 144 años, o lo que es igual, de 50.00 2 por año. Este desplazamiento fue llamado precesión de los equinoccios. Este fenómeno, debido en parte a la variación del plano del ecuador, tiene como consecuencia el desplazamiento del polo norte celeste, que completa una vuelta alrededor del polo de la eclı́ptica en unos 26000 años. El problema de la rotación de la Tierra, considerando todos los elementos que influyen en esta rotación, es uno de los más difı́ciles de la Mecánica Celeste. Esta complejidad es debida, sobre todo, a la falta de esfericidad de la Tierra y a que tanto el Sol, la Luna, como los planetas se mueven en órbitas cuyos elementos orbitales no se pueden expresar en forma cerrada, es decir, por medio de funciones elementales. La solución de las ecuaciones diferenciales que rigen este movimiento solamente se puede conocer mediante desarrollos en serie del tipo !✓ ◆ 1 1 1 X X X sen i k qj = si t + mk t (ci t + d), cos i=0 i=0 k=0 es decir, como suma de términos seculares (series de potencias en t) y términos mixtos (combinación de términos seculares y periódicos). Pues bien, los términos seculares son los responsables de la precesión, mientras que los periódicos y mixtos lo son de la nutación, término cuya raı́z latina nutare significa cabeceo1 . En este libro no estudiaremos la obtención de estas magnitudes, sino el efecto que producen en los sistemas de referencia espaciales. 1 Véase la sección 12.4 de este libro para una descripción de los distintos tipos de perturbaciones. La precesión se corresponde con las perturbaciones de largo periodo, mientras que la nutación es una perturbación de corto periodo. Sistemas de referencia espaciales precisos 57 Tanto el ecuador como la eclı́ptica se mueven. Al ecuador en un cierto instante, que representaremos por E, se le llama actualmente ecuador intermedio, aunque ha sido llamado también ecuador verdadero, ecuador aparente o ecuador de la fecha2 . A la intersección del ecuador intermedio con la eclı́ptica de la fecha se le llama equinoccio verdadero de la fecha o simplemente equinoccio de la fecha y se representa por , mientras que el ángulo entre estos dos planos es la oblicuidad verdadera de la fecha, ✏0 . ✏ Em E m ✏0 0 m eclı́ptica El ecuador intermedio o verdadero se obtiene corrigiendo por precesión y nutación el ecuador de un instante inicial. Si solamente corregimos por precesión, es decir, prescindimos de las variaciones periódicas que son mucho más pequeñas que las debidas a la precesión, obtenemos otro plano, próximo al ecuador verdadero, que se llama ecuador medio y se representa por E m . La intersección de la eclı́ptica con el ecuador medio se llama equinoccio medio, m , y el ángulo entre los dos planos oblicuidad media, ✏. La nutación establece la posición relativa en el espacio de los puntos y m , ası́ como de la diferencia entre las oblicuidades ✏ y ✏0 . Por otro lado, el punto m da, por el efecto de precesión, una vuelta completa al ecuador medio en un periodo de unos 26000 años. Figura 4.3: Precesión y nutación. Los puntos y m pertenecen a planos ecuatoriales distintos, sin embargo, en 0 ocasiones se habla de un punto llamado, por extensión, equinoccio medio, m en la figura (4.3), que es un punto del ecuador verdadero que pertenece al mismo meridiano que el equinoccio medio m . 4.2 Sistemas de referencia espaciales precisos La aparición del fenómeno de precesión-nutación obliga a una definición precisa de los sistemas de referencia basados en el ecuador. Podemos definir varios sistemas asociados a éste: Sistema ecuatorial verdadero de la fecha, E = {e1 , e2 , e3 }. Este sistema está basado en el ecuador intermedio y el equinoccio, , de la fecha. 2 De aquı́ en adelante usaremos indistintamente las palabras ...de la fecha o ...de la época para designar un elemento que depende de un instante dado. 58 Sistemas de referencia espaciales precisos m m Sistema ecuatorial medio, E mm = {em 1 , e2 , e3 }. Es el sistema referido al ecuador y equinoccio medios. Es el sistema verdadero sin corregir por nutación. Sistema ecuatorial de la época J2000.0 3 , E oo = {eo1 , eo2 , eo3 }. Este sistema es un sistema fijo definido a partir de la posición del ecuador y el equinoccio medios en un instante determinado, concretamente J2000.0. A partir de este sistema una corrección por precesión nos lleva al sistema E mm , mientras que una corrección por precesión y nutación nos lleva a E . 0 , que tiene como plano Sistema de ecuador verdadero–equinoccio medio, E m 0 fundamental el plano del ecuador verdadero y como origen el punto m . A las coordenadas ecuatoriales, medidas en cada uno de los tres primeros sistemas, se les da el nombre de coordenadas verdaderas, coordenadas medias y coordenadas de la época J2000.0. Para disponer de un sistema de referencia fijo, donde un objeto celeste sin movimiento propio tenga unas coordenadas constantes, y que sirva como sistema inercial al plantear las ecuaciones del movimiento de los cuerpos celestes, se definió con precisión el sistema ecuatorial E oo , que se materializó en la obtención del catálogo FK5, que no es sino el conjunto de las posiciones de una serie de objetos celestes medidas con una gran precisión y referidas a E oo . La comparación de las posiciones de otros objetos celestes con los del catálogo FK5 permite calcular las coordenadas precisas de dicho objeto. La Unión Astronómica Internacional, teniendo en cuenta la necesidad de una precisión mucho mayor que la obtenida con el uso del sistema E oo , estudió entre los años 1991 y 2000 una serie de cambios en la definición de los sistemas de referencia para hacerlos más rigurosos y precisos. Estos cambios fueros establecidos y están en vigor desde el año 2003. En primer lugar, de la misma forma que hace unos años en el tema de la medida del tiempo, se ha partido de una concepción de los sistemas de referencia basada en la teorı́a de la relatividad, lo que conduce a dos tipos de sistemas distintos: el sistema de referencia baricéntrico celeste, BCRS y el sistema de referencia geocéntrico celeste, GCRS. Ambos sistemas, definidos dentro del contexto de la teorı́a de la relatividad en la geometrı́a del espacio tiempo 4-dimensional, son dos sistemas centrados respectivamente en el baricentro del sistema solar y en el de la Tierra y con su tiempo propio, el tiempo coordenada baricéntrico TCB y el tiempo coordenada geocéntrico TCG . Ambos difieren fundamentalmente en el origen, pues sus ejes, que constituirán un sistema ortogonal directo, son paralelos y llevan direcciones fijas en el espacio4 . 3 El instante o época J2000.0 corresponde al dı́a 1 de enero de 2000 a las 12h TT y será explicado con detalle en el próximo capı́tulo. 4 Están definidos como cinemáticamente no rotantes, lo que significa que sus ejes no tienen rotación sistemática con respecto a objetos muy distantes en el universo sin movimiento propio. Sistemas de referencia espaciales precisos 59 Aunque la orientación de los ejes en la definición del sistema BCRS no está definida formalmente, estos ejes coinciden con los del sistema llamado Sistema de referencia celeste internacional, ICRS, cuya materialización práctica, al igual que el FK5 lo era del sistema E oo , viene dada por el ICRF5 , que no es sino el conjunto de posiciones de un gran número de radiofuentes extragalácticas. Los ejes de este sistema ICRS, que en la práctica coincide con el BCRS, están definidos de manera que sean consistentes con el sistema E oo , con una diferencia de alineación menor que 0.00 02, lo que es despreciable para la mayorı́a de las aplicaciones. En adelante llamaremos sistema espacial, S = {e1 , e2 , e3 }, a un sistema de referencia, que independientemente del origen, tiene unos ejes paralelos al ICRS. En particular tendremos: Sistema espacial geocéntrico 6 , SG , también llamado GCRS y que es el sistema espacial con centro en el centro de masas de la Tierra. Sistema espacial planetocéntrico, SP , o sistema espacial con centro en el centro de masas de un planeta P . El sistema SG (SP ) será el sistema que usaremos a partir de ahora para cualquier observación realizada desde la Tierra (planeta) y sobre todo, por ser éste un sistema inercial, para el planteamiento de las ecuaciones del movimiento de los satélites artificiales. El sistema SG es el sustituto actual de E oo , aunque como hemos dicho antes la diferencia entre ellos es muy pequeña. La transformación de uno a otro será estudiada más adelante. Por otro lado, aunque el plano fundamental del sistema SG es muy próximo al ecuador del instante J2000.0 no coincide exactamente con él por lo que las coordenadas obtenidas en este sistema no son exactamente ecuatoriales. Sin embargo, se ha mantenido el nombre de ascensión recta y declinación para las coordenadas en este sistema, especificando, cuando haya posibilidad de confusión, en cuál de los dos sistemas han sido medidas. Para obtener las coordenadas de un punto en el sistema SG debemos partir del sistema geográfico G, definido en el capı́tulo anterior, pues es en éste donde el IERS determina la posición del polo y, por tanto, del ecuador verdadero que es el que va asociado a la observación, por ello, para entender el proceso que relaciona los diferentes sistemas de referencia, debemos encontrar todo el conjunto de relaciones y sistemas intermedios que ligan los sistemas G y SG . En primer lugar llamaremos 5 HCRF es el nombre de otra materialización de este sistema de menor precisión que ICRF y obtenida con medidas realizadas desde el satélite Hipparcos. 6 Este nombre no es utilizado fuera de este libro pero nos ha parecido coherente su introducción, dentro del contexto de esta obra, con objeto de simplificar y sistematizar la gran cantidad de nombres que aparecen. 60 Sistemas de referencia espaciales precisos Polo celeste intermedio, CIP, o simplemente P , al polo verdadero que el IERS sitúa en el sistema de referencia G. El nombre de polo celeste intermedio viene a sustituir al de polo celeste de efemérides, CEP, usado hasta 2003. Perpendicular al eje determinado por este punto se encuentra el plano del ecuador intermedio con el que antes habı́amos definido el sistema E usando como origen el equinoccio de la fecha. Uno de los objetivos de la reforma de los sistemas de referencia de la IAU es obtener una mayor precisión, lo que se consigue minimizando al máximo las fuentes de error. El problema del movimiento del equinoccio proviene de dos movimientos: el del ecuador y el de la eclı́ptica. Si prescindimos de la eclı́ptica, para lo cual basta elegir un origen distinto al equinoccio, conseguiremos transformar el problema en uno en el que solo intervenga la rotación de la Tierra y no los problemas orbitales que perturban la eclı́ptica. Para definir otros orı́genes en el ecuador verdadero se ha introducido el concepto de origen no rotante que consiste en elegir un punto en el ecuador verdadero móvil de manera que la posición instantánea de ese punto siempre se mantiene perpendicular al ecuador, esto es, siempre se mueve en la dirección del polo P . De otra forma el movimiento de este punto presentarı́a una componente alrededor del eje polar que introducirı́a cierto movimiento espurio en el ángulo de rotación. Ası́, han sido definidos dos nuevos puntos: Origen celeste intermedio, CIO, representado por , que sustituye al equinoccio como origen de coordenadas. Origen terrestre intermedio, TIO, representado por $, que representa un punto en el ecuador que rota con la Tierra. Este punto sustituye al antiguo meridiano de Greenwich aunque está muy próximo al mismo. Los sistemas de referencia asociados a estos orı́genes y que tienen el ecuador intermedio como plano fundamental son llamados: Sistema celeste intermedio, E = {e1 , e2 , e3 }. $ $ Sistema terrestre intermedio, E$ = {e$ 1 , e2 , e3 }. 4.3 Transformaciones entre sistemas de referencia precisos En este apartado desarrollaremos las transformaciones necesarias para relacionar entre si todos los sistemas de referencia espaciales. Para esto seguiremos el esquema de la tabla 4.1, donde cada número representa una transformación entre dos sistemas contiguos, de manera que componiendo transformaciones podamos finalmente relacionar G con SG . Cada número del esquema corresponde a una de las siguientes transformaciones: Transformaciones entre sistemas de referencia precisos Gx ? ? T1? y E$x ? ? T2a? y Ex ? ? T6? y SG T2b ! T5 ! xE ? ? ?T3 y m E xm ? ? ?T4 y T2c ! E 61 0 m E oo Tabla 4.1: Transformaciones entre sistemas de referencia precisos. T1. La corrección por el movimiento del polo. T2. Tres cambios de origen en el ecuador intermedio que relacionan los sistemas 0 con origen en , $, y m . T3. La corrección por nutación. T4. La corrección por precesión. T5. La desviación entre los sistemas E oo y SG . T6. El tratamiento conjunto de la precesión-nutación sin usar el equinoccio. Como puede verse en la tabla 4.1 existen dos caminos para relacionar G con SG . El camino clásico, (T1,T2b,T3,T4,T5), usa la teorı́a de la precesión y nutación clásica basada en el equinoccio. Sin embargo, el moderno, (T1,T2a,T6), no usa el equinoccio. En lo que sigue describiremos ambos caminos, con los parámetros del camino clásico adaptados a los modelos desarrollados por la IAU en el año 2000. En los siguientes subapartados se describe cada transformación por separado, dando tanto los parámetros que la caracterizan como la matriz de transformación. En algunos casos escribiremos la expresión precisa de los parámetros en términos de una variable temporal Ts 7 que se explicará con detalle en el capı́tulo siguiente y que representa el número de siglos julianos transcurridos entre el instante del cálculo y un instante estándar J2000.0. En otros casos no se escribe la expresión debido a su enorme volumen. Tanto en estos casos como en los primeros, quien tenga necesidad de su uso, puede acudir al conjunto de rutinas SOFA8 y NOVAS9 , ambas escritas en lenguaje C y FORTRAN y desarrolladas respectivamente por 7T 2451545.0)/36525. s = (JDTT 8 http://www.iau-sofa.rl.ac.uk/ 9 http://aa.usno.navy.mil/software/novas/novas info.html 62 Sistemas de referencia espaciales precisos la Unión Astronómica Internacional y el USNO (U.S. Naval Observatory). Estas rutinas de software libre abarcan todas las transformaciones descritas en este capı́tulo. 4.3.1 Movimiento del polo (T1) El movimiento del polo permite relacionar el sistema geográfico G con el sistema E$ cuyo polo, CIP, y ecuador, son los verdaderos de la fecha y su origen es el origen terrestre intermedio, TIO (figura 4.4). Llamaremos matriz de tambaleo a la matriz que pasa del sistema E$ al sistema geográfico G RE$ G = W = W (xp , yp , s0 ), (4.5) donde (xp , yp , s0 ) son los tres parámetros que caracterizan el movimiento del polo. Por un lado (xp , yp ) representan la posición del polo instantáneo de rotación, CIP, respecto al sistema G, mientras que s0 es el localizador del TIO, es decir, representa el desplazamiento del origen de longitudes hasta el TIO, por lo que determina la posición exacta del primer meridiano de E$ . El valor de s0 viene dado por s0 = 0.00 000047 Ts , por lo que es despreciable para la mayor parte de las aplicaciones. El polo instantáneo, CIP, está muy próximo al polo internacional de referencia, IRP, su distancia es menor que 0.00 2, por lo que su posición en la esfera se puede aproximar por las coordenadas del punto en un sistema horizontal con centro en el polo de referencia y cuyo eje Ox representa la posición del meridiano origen, IRM, y el eje Oy la dirección Oeste (figura 4.4 izquierda). El IERS determina y publica en sus boletines A y B, unas coordenadas (x, y) que constituyen una buena aproximación a la posición del polo, expresadas en el sistema anterior, que deben ser corregidas por unos elementos (xp , yp ) = (x, y) + ( x, x)marea + ( x, x)nutación , que corresponden a la correcciones por marea oceánica y por nutación y que son menores que 0.00 01. Observando la derecha de la figura 4.4, y tras efectuar tres rotaciones elementales, llegamos a la relación RGE$ = R1 (yp )R2 (xp )R3 ( s0 ), cuya inversa es W = RE$ G = R3T ( s0 )R2T (xp )R1T (yp ), o teniendo en cuenta las relaciones entre las matrices de rotación elemental en sus dos convenios, tendremos finalmente e 3 ( s0 )R e2 (xp )R e1 (yp ), W =R (4.6) que es la expresión que habitualmente aparece en la literatura. Si efectuamos el producto de matrices anteriores, tenemos en cuenta que para un valor muy pequeño de un ángulo a, expresado en radianes, se puede poner Transformaciones entre sistemas de referencia precisos yp IRP g3 xp Oeste yp IRP 63 e$ 3 xp IRM g1 CIP e$ 1 IRM Meridiano origen s0 Figura 4.4: Movimiento del polo. cos a ⇡ 1, sen a ⇡ a, y despreciamos los productos de dos pequeños arcos, se obtendrá una expresión más simple de W , suficientemente aproximada en la mayor parte de las aplicaciones: 0 1 1 s0 xp 1 yp A . W ⇡ @ s0 xp yp 1 La longitud y latitud de un punto de la superficie terrestre, en el sistema geográfico G, son dos valores constantes ( 0 , 0 ) que junto con la altitud determinan la posición del punto. Sin embargo, la longitud y latitud de un punto de la superficie no son constantes cuando se considera el ecuador verdadero y el origen $. Las coordenadas de un punto en este sistema E$ serán dos variables que representaremos por ( , ). Este valor es muy importante pues son las coordenadas que deben usarse para la observación astronómica y las que definen con precisión las escalas de tiempo basadas en la rotación terrestre. ( El valor de ( , ), se obtendrá a partir de las coordenadas del observador 0 ) y del movimiento del polo W por medio de la expresión 0, cart(1, , ) = W cart(1, 0, 0 ). (4.7) Aunque la expresión anterior es exacta, el valor, extremadamente pequeño, de xp , yp y s0 permite obtener una aproximación que da directamente la longitud y latitud en la forma = o + tan = o + (xp cos o (xp sen o o + yp cos yp sen o) , o) , (4.8) 64 Sistemas de referencia espaciales precisos expresión válida tomando xp , yp en radianes. 4.3.2 Cambios de origen en el ecuador intermedio (T2) En el ecuador intermedio existen cuatro puntos que son orı́genes de cuatro sistemas de referencia distintos: el origen intermedio terrestre, TIO o $, el origen intermedio celeste, CIO o y finalmente el equinoccio verdadero, y el equinoccio 0 medio m . Para transformar entre si los sistemas de referencia que tienen como plano fundamental el ecuador y estos puntos como orı́genes basta efectuar un giro de eje Oz con el ángulo adecuado. El ángulo entre el punto $ y el equinoccio no es sino el ángulo horario del equinoccio medido desde el meridiano principal. Es por $ tanto el tiempo sidéreo del meridiano que pasa por $. Este meridiano no es el mismo que el meridiano de Greenwich, sin embar✓ go, se ha mantenido a este ángulo el nombre de tiempo sidéreo en Greenwich. Por otra parte, puesGAST to que está asociado al equinoccio GMST verdadero10 se le da el nombre de 0 tiempo sidéreo aparente en Greenm wich y se representará por las letras GAST . El ángulo entre este pun0 to y el equinoccio medio m repreFigura 4.5: Cambios de origen en el ecuador sentará el tiempo sidéreo medio en intermedio. Greenwich, GMST . El ángulo entre $ y se define de manera que estos dos puntos sean orı́genes no rotantes, se le llama ángulo de rotación terrestre, y se denota por las siglas ERA o por el sı́mbolo ✓. Una vez definidos estos dos ángulos podemos determinar las matrices de rotación que representan el cambio de origen en la forma: e3 (✓), RE$ E = R3 ( ✓) = R e3 (GAST ), RE$ E = R3 ( GAST ) = R mientras que la relación ente los sistemas E y E RE E 0 m = R3 ( EE), 0 m (4.9) viene dada por EE = GAST GMST . (4.10) Al ángulo EE se le llama ecuación de los equinoccios y su valor viene dado por la expresión EE = 10 Esto + 0.00 00264096 sen ⌦ + 0.00 00006352 sen 2⌦ + . . . , se estudiará con detalle en el siguiente capı́tulo. (4.11) Transformaciones entre sistemas de referencia precisos 65 que depende del valor de la nutación en longitud, dado en (4.18), y de algunos términos lunisolares como ⌦ y otros. En la anterior expresión hemos escrito únicamente los tres términos más importantes. 4.3.3 Precesión (T4) eo3 La precesión es la transformación entre el ecuador y equinoccio medios del año J2000.0, que definen el sistema E oo , y el ecuador y equinoccio medios de una fecha, que definen el sistema E mm . Esta transformación se puede modelar por medio de dos conjuntos de parámetros diferentes. La primera aproximación se describe con cuatro parámetros que relacionan la posición del ecuador medio de las dos épocas con el plano de la eclı́ptica en J2000.0 y en la fecha. Los cuatro parámetros (✏o , A , !A , A ), que pueden verse en la figura 4.6, representan lo siguiente: em 3 eclı́ptica en J2000.0 ✏o ⇤ ecuador medio en J2000.0 o A !A A m eclı́ptica ecuador medio Figura 4.6: Precesión: transformación con cuatro rotaciones. ✏o es el valor de la oblicuidad media de la época J2000.0, es decir, el ángulo entre el ecuador medio y la eclı́ptica en J2000.0, que tiene un valor constante. es el ángulo entre el equinoccio medio de J2000.0, o , y un punto ⇤ que representa la intersección del plano de la eclı́ptica en J2000.0 con el ecuador medio de la fecha. A !A es el ángulo entre el plano de la eclı́ptica en J2000.0 y el ecuador medio de la fecha. A es el ángulo entre el punto ⇤ y el equinoccio medio m. Se llama matriz de precesión y se representa por la letra P a la matriz de paso del sistema medio Emm a la del sistema ecuatorial en J2000.0, E oo , esto es, a la matriz RE m E o . m o Para obtener la expresión de P en términos de los cuatro parámetros anteriores, observaremos la figura 4.6, donde podemos concluir que RE o E m = o m R1 (✏o )R3 ( A )R1 ( !A )R3 ( A ). Teniendo en cuenta que P es la transpuesta de la anterior tendremos que P = R3T ( A )R1T ( !A )R3T ( A )R1T (✏o ) y aplicando la relación entre las matrices de rotación con ambos convenios se llaga a la expresión 66 Sistemas de referencia espaciales precisos e3 ( P =R A e 1 ( ! )R e3 ( )R A A e1 (✏o ), )R (4.12) que es una de las dos expresiones habituales de la matriz de precesión. La expresión de los cuatro ángulos en función del tiempo, dado por la variable Ts , es la siguiente: = 23h 26m 21.s 406 = 84381.00 406, A = 5038.00 481507 Ts 1.00 0790069 Ts2 0.00 00114045 Ts3 + 0.00 000132851 Ts4 !A = ✏0 0.00 025754 Ts + 0.00 0512623 Ts2 0.00 00772503 Ts3 0.00 000000467 Ts4 + 0.00 0000003337 Ts5 , A = 10.00 556403 Ts 2.00 3814292 Ts2 0.00 00121197 Ts3 + 0.00 000170663 Ts4 ✏o 0.00 0000000951 Ts5 , (4.13) 0.00 0000000560 Ts5 . Aunque la IAU recomienda usar estos cuatro parámetros para calcular la matriz de precesión, existe otro conjunto de tres parámetros, (zA , ✓A , ⇣A ), idénticos a los clásicos de la teorı́a de la precesión previa al año 2000, pero que han sido modificados para adaptarlos a la mayor precisión de las nueva teorı́as. En lugar de trabajar sobre el ecuador los antiguos parámetros describen la posición del polo del sistema E mm respecto del sistema E oo como se ve en la figura 4.7. En esta figura se observa como el ángulo ✓A representa el ángulo entre los vectores eo3 y el vector em 3 , mientras que zA es el ángulo entre el meridiano principal y el cı́rculo máximo que une los dos polos en el sistema de referencia medio y ⇣A el mismo ángulo en el sistema de referencia medio de J2000.0. eo3 ✓A em 3 ⇣A zA o ecuador medio en J2000.0 m ecuador medio En estas condiciones la mam o triz P de paso de E m a E o se obtendrá como composición de Figura 4.7: Precesión: transformación con tres tres rotaciones: P = REm E o = rotaciones R3 (zA )R2 ( ✓A )R3 (⇣A ) y finalmente pondremos la expresión habitual e 3 ( z )R e1 (✓ )R e3 ( ⇣ ). P =R A A A (4.14) Transformaciones entre sistemas de referencia precisos 67 Las expresiones de los tres ángulos, en función del tiempo dado por la variable Ts , son las siguientes: ⇣A = zA = ✓A = 2.00 650545 + 2306.00 083227 Ts + 0.00 2988499 Ts2 + 0.00 01801828 Ts3 0.00 000005971 Ts4 0.00 0000003173 Ts5 , 2.00 650545 + 2306.00 077181 Ts + 1.00 0927348 Ts2 + 0.00 01826837Ts3 0.00 000028596 Ts4 0.00 0000002904 Ts5 , 2004.00 191903 Ts 0.00 4294934 Ts2 0.00 04182264 Ts3 0.00 000007089 Ts4 0.00 0000001274 Ts5 , (4.15) mientras que el valor del ángulo ✏, que representa la oblicuidad media o ángulo entre el ecuador medio y la eclı́ptica, es igual a ✏ = ✏o + 4.3.4 46.00 836769 Ts 0.00 0001831 Ts2 0.00 00200340 Ts3 0.00 000000576 Ts4 0.00 0000000434 Ts5 . (4.16) Nutación (T3) La nutación produce un pequeño desplazamiento del ecuador, a lo largo de la eclı́ptica, desde el ecuador y equinoccio medios hasta el ecuador y equinoccio verdaderos. Se mide a partir de dos ángulos: la nutación en longitud, , que mide el ángulo entre el equinoccio medio y el verdaderos en la eclı́ptica, y la nutación en oblicuidad, ✏, que mide la diferencia entre la oblicuidad media, ✏, o ángulo entre la eclı́ptica y el ecuador medio y la oblicuidad verdadera, ✏0 , o ángulo entre la eclı́ptica y el ecuador verdadero. em 3 e3 eclı́ptica ✏ em 1 ✏0 = ✏ + ecuador medio ✏ ecuador de la fecha e1 Figura 4.8: Nutación. Se llama matriz de nutación a la matriz de rotación que pasa del sistema E al sistema E mm que, de acuerdo con la figura 4.8, se podrá poner como N = RE E m = m R1 (✏0 )R3 ( )R1 ( ✏), de donde finalmente llegaremos a la expresión e1 ( ✏ N =R e3 ( ✏)R e1 (✏). )R (4.17) 68 Sistemas de referencia espaciales precisos Los valores de ✏y se obtienen a partir de las dos series: = ✏ = N X i=1 N X (Si + Si0 TS ) sen j + Ci00 cos j Si00 j, (4.18) (Ci + Ci0 TS ) cos + sen j, i=1 siendo i = K X j (Ts ), j=1 donde, para el modelo de nutación MHB, que es aceptado en el modelo IAU2000, se tiene N = 1365 términos de la series, y K = 14 parámetros angulares dependientes de las órbitas del Sol y la Luna. Este modelo ha sustituido al antiguo modelo de Wahr en el que las series de la nutación tenı́an 136 términos. 4.3.5 Tratamiento actual de la precesión y nutación (T6) El tratamiento moderno de la precesión y nutación se basa en la posición del sistema E respecto del sistema SG a través de tres parámetros (X, Y, s), que, de forma similar al movimiento del polo, representan la posición del CIP en SG y la corrección s del origen del sistema o localizador del CIO. e3 d e3 E E s Los valores de (X, Y ) representan dos de los tres cosenos directores del vector e3 , respecto de la base {e1 , e2 , e3 } del sistema SG , de forma que e3 = Xe1 + Y e2 + Ze3 , e1 e2 e1 e2 Figura 4.9: Transformación conjunta precesión– nutación. Si llamamos (E, d) a la longitud y la colatitud del vector e3 en el sistema SG se tendrán las relaciones: X = sen d cos E, Y = sen d sen E, donde el valor de Z es muy próximo a la unidad. Z = cos d, (4.19) Transformaciones entre sistemas de referencia precisos 69 En la figura 4.9 se puede observar la posición del sistema E , cuya base es {e1 , e2 , e3 }, respecto del sistema SG , cuya base es {e1 , e2 , e3 }. Llamaremos matriz de precesión–nutación a la matriz C = RE S que pasa de E a SG . G Observando la figura 4.9 podemos concluir que la matriz de rotación entre los dos sistemas es RS E = R3 (E)R2 (d)R3 ( E)R3 ( s), de donde se deduce G finalmente que C = RE S = R3 ( s)T R3 ( E)T R2 (d)T R3 (E)T y por tanto G e3 ( s)R e3 ( E)R e2 (d)R e3 (E). C=R (4.20) Hemos calculado la matriz de rotación en términos de (E, d), sin embargo, se ha dicho antes que esta transformación se plantea en términos de (X, Y ). Para expresar C en términos de X, Y hay que efectuar el producto de las tres mae3 ( E)R e2 (d)R e3 (E), aplicar las relaciones (4.19), y realizar una serie de trices R manipulaciones trigonométricas y simplificaciones para obtener 0 e3 ( s) @ C=R 1 bX 2 bXY X bXY 1 bY 2 Y 1 1 X A, Y 2 2 b(X + Y ) (4.21) donde, teniendo en cuenta que el valor de Z es pequeño, el valor de b = 1/(1 + Z) se puede aproximar, hasta una precisión del orden de 0.00 000001 por la expresión b = 1/2 + (X 2 + Y 2 )/8, de forma que Z no aparece en la matriz. La teorı́a IAU2000 para la precesión y nutación establece unos valores: X= 0.00 01661699 + 2004.00 19174288 Ts 0.00 42721905 Ts2 0.00 19862054 Ts3 0.00 00004605 Ts4 + 0.00 00000598 Ts5 P + i [(as,0 )i sen( j ) + (ac,0 )i cos( j )] P + i [(as,1 )i t sen( j ) + (ac,1 )i t cos( j )] P + i [(as,2 )i t2 sen( j ) + (ac,2 )i t2 cos( j )] +···, Y = 0.00 00695078 0.00 02538199 Ts 22.00 40725099 Ts2 +0.00 00184228 Ts3 + 0.00 00111306 Ts4 + 0.00 00000099 Ts5 P + i [(bc,0 )i cos( j ) + (bs,0 )i sen( j )] P + i [(bc,1 )i t cos( j ) + (bs,1 )i t sen( j )] P + i [(bc,2 )i t2 cos( j ) + (bs,2 )i t2 sen( j )] +···, con los términos de X e Y . j dependientes de la nutación. La expresión de s es similar a la 70 Sistemas de referencia espaciales precisos 4.3.6 Desviación (T5) entre los sistemas E oo y SG Finalmente veremos como pasar del nuevo sistema fundamental SG al antiguamente usado E oo y viceversa. Para ello tendremos en cuenta que la posición de los dos polos y la dirección de los orı́genes respectivos está muy próxima, además la posición de los unos respecto a los otros es fija. Los parámetros que describen esta pequeña desviación son las coordenadas (⇠o , ⌘o ) del polo de E o en el sistema SG . Como puede verse en la figura 4.10 estas coordenadas están dadas en un sistema de dos dimensiones, tangente al polo de SG , y cuyas direcciones O⇠, O⌘ representan el meridiano origen y el de un valor ⇡/2. En este sistema el polo de E oo ocupa la posición ⇠o = 0.00 016617, ⌘o = 0.00 0068192. El desplazamiento del origen se mide por el valor d↵0 = 0.00 0146. Polo E o eo3 (⇠o , ⌘o ) |⌘o | |⌘o | |⇠o | e2 e3 |⇠o | Polo SG ⇠ ⌘ eo1 |d↵o | Figura 4.10: Desviación del sistema E o . La llamada matriz del sesgo de la referencia y denotada por la letra B determina la transformación del sistema E o al sistema SG , es decir B = RE o S . G De acuerdo con la figura 4.10, la matriz RS E o se obtendrá componiendo tres G rotaciones R3 ( |d↵o |)R2 ( |⇠o |)R1 (|⌘o |), que de acuerdo con los signos de d↵o , |⇠o | y |⌘o | se pondrá RS E o = R3 (d↵o )R2 (⇠o )R1 ( ⌘o ). Finalmente, podremos poner G RE o S = R1 ( ⌘o )T R2 (⇠o )T R3 (d↵o )T , o lo que es igual G e 1 ( ⌘o ) R e2 (⇠o )R e3 (d↵o ). B=R (4.22) Si efectuamos el producto de matrices anterior y después aproximamos las funciones trigonométricas por el arco o por la unidad, como ya se ha hecho en un cálculo anterior, se obtendrá una expresión más simple de B, suficientemente Relación de los sistemas precisos con los sistemas idealizados 71 aproximada en la mayor parte de las aplicaciones: 0 1 1 d↵o ⇠o 1 ⌘o A . B ⇡ @ d↵o ⇠o ⌘o 1 4.3.7 Transformación general de coordenadas Finalmente, reuniendo todas las transformaciones dadas hasta aquı́, podemos obtener la expresión de la transformación general de coordenadas entre el sistema geográfico y el sistema GCRS o el del equinoccio y ecuador medios del J2000.0. Las transformaciones pueden resumirse en las siguientes expresiones: xS G xS G xE oo xE oo = = = = e3 ( ✓) W CT R T T T e B P N R3 ( GAST ) W e3 ( ✓) W B CT R e3 ( GAST ) W PT NT R xG xG xG xG = = = = e3 (✓) C WTR e3 (GAST ) N P B W R e3 (✓) C B T WTR T e W R3 (GAST ) N P y sus transpuestas: 4.4 T xG , xG , xG , xG , xS G , xS G , xE oo , xE oo . (4.23) (4.24) Relación de los sistemas precisos con los sistemas idealizados En el capı́tulo anterior se han definido una serie de sistemas idealizados basados en la consideración de planos fijos del ecuador y la eclı́ptica. Si tenemos en cuenta el movimiento de éstos deberemos establecer una serie de premisas que condicionarán las relaciones entre todos los sistemas. En primer lugar deberemos considerar que el sistema horizontal se establece a partir de la dirección del zenit y del sur como origen del acimut. La dirección sur se puede definir a partir del meridiano del lugar, por observación de la culminación superior de los astros, o bien a partir de la dirección sur prefijada geográficamente. El primer caso define unas coordenadas horizontales relacionadas con unas coordenadas horarias definidas sobre el ecuador verdadero, mientras que en el segundo caso el ecuador es el ecuador fijo de la Tierra o lo que es igual el plano Oxy del sistema geográfico. Los dos sistemas horizontales basados en estas dos diferentes elecciones son distintos y su relación con el sistema ecuatorial viene dada, en el 72 Sistemas de referencia espaciales precisos primer caso, a través de la latitud del lugar, corregida del movimiento del polo, mientras que en el segundo se relacionan a partir de la latitud o del lugar sin corregir por el movimiento del polo. De cualquier manera, el movimiento del polo es muy pequeño y no conocido a priori por lo que en la mayor parte de las aplicaciones se pueden hacer coincidir ambos sistemas. El sistema horario y el ecuatorial se entenderán referidos al ecuador verdadero. Entenderemos por eclı́ptica la de la fecha. El paso al sistema de referencia eclı́ptico se puede hacer, bien desde el sistema ecuatorial verdadero de la fecha, cuya intersección con la eclı́ptica es el equinoccio verdadero , y su ángulo con ella es la oblicuidad verdadera ✏0 , o bien desde el ecuador medio de la fecha, cuya intersección con la eclı́ptica es el equinoccio medio m y su ángulo con ésta es la oblicuidad media ✏. Finalmente, hay que decir que los elementos de la rotación de un planeta, coordenadas del polo y posición del meridiano origen, son medidos en el sistema espacial con centro en el centro de masas del planeta SP por lo que la matriz RE P$ , dada en (3.23), representa realmente la matriz RSP P$ , esto es, el paso del sistema celeste de referencia al planetográfico. Capı́tulo 5 Referencia temporal 5.1 Introducción La naturaleza del tiempo es una complicada cuestión a la que ni la Filosofı́a ni la Fı́sica han dado una respuesta definitiva. Nos limitaremos a tratar el tiempo como una variable independiente que sirve como referencia para describir la evolución de los fenómenos fı́sicos o dinámicos. Mediante la medida del tiempo se persiguen dos finalidades distintas: por un lado, se trata de fijar el instante en que sucede un determinado acontecimiento, problema cronológico, y por otro, medir el intervalo de tiempo transcurrido entre dos acontecimientos, problema cronométrico. Para la primera cuestión es necesario fijar una época origen y, a partir de ella, contar el número de ciclos (o fracción) de un fenómeno periódico que han transcurrido desde entonces, por ejemplo, el número de veces que el Sol ha pasado por el meridiano del lugar. Con respecto al aspecto cronométrico, el tiempo puede estar o no asociado a una época determinada. Por ejemplo, a un ciclista que corre una etapa, solamente le interesa saber el número de minutos, segundos y fracciones de segundo que han transcurrido desde que partió de la salida hasta que cruza la lı́nea de meta. La fecha le interesa solamente para saber donde debe estar cierto dı́a a cierta hora. Con respecto al intervalo de tiempo, es esencial la sincronización. En efecto, siguiendo con el sı́mil anterior, el ciclista debe tener su reloj sincronizado con el reloj de la organización, pues de lo contrario, podrı́a llegar tarde a la salida. El problema de la sincronización se hace más acuciante en determinados problemas como la navegación aérea, las telecomunicaciones, electrónica, etc.. Determinadas actividades requieren relojes o instrumentos de medida sencillos, 74 Referencia temporal mientras que otras los necesitan mucho más precisos. Ası́, los pueblos primitivos se regı́an por el movimiento del Sol, puesto que les condicionaba sus actividades diarias, horas de descanso, de vigilia y comidas. Algunas ciencias, como la Geologı́a y la Astronomı́a, manejan intervalos de tiempo del orden de miles y millones de años, por lo que un par de años le es indiferente; por el contrario, la Electrónica necesita saber medir fracciones muy pequeñas de segundo, por ejemplo, si un ordenador va a 132 MHz, quiere decir que necesitan contar 132,000,000 oscilaciones en un segundo, para lo que necesitan un reloj con una precisión mucho mayor. Como vemos, dependiendo del usuario, se necesitan distintos grados de precisión, lo que hace que se manejen distintas escalas de tiempo. Desde los albores de la humanidad, el movimiento de los astros ha marcado las primeras escalas de tiempo, por lo que todavı́a se siguen utilizando. El año, el mes y el dı́a han sido las unidades naturales obtenidas a partir de tres diferentes ciclos astronómicos. Grosso modo, éstos se pueden definir como: Año, el periodo de una revolución completa de la Tierra alrededor del Sol. Mes, el intervalo transcurrido entre dos Lunas llenas sucesivas. Dı́a, el tiempo entre dos pasos consecutivos del Sol por su punto más alto sobre el horizonte. Las tres unidades anteriores determinan el marco habitual donde circunscribimos el concepto tiempo, sin embargo, su definición conlleva una serie de dificultades que hacen necesario un estudio profundo de las mismas para alcanzar los requerimientos actuales en la medida del tiempo. Por un lado el año no contiene un número exacto de dı́as, ni un número exacto de meses y el mes tampoco contiene un número exacto de dı́as. Por otra parte, a lo largo del año, la duración del dı́a, definido como el intervalo de tiempo entre dos pasos consecutivos del Sol por el meridiano del lugar, no es la misma, pues la Tierra se mueve sobre una elipse, viajando en ocasiones más rápida y en otras más lenta. Si en lugar de basar la duración del dı́a sobre el movimiento del Sol, se basa sobre el movimiento de las estrellas, resultará que este dı́a de las estrellas, dı́a sidéreo, es unos 4 minutos más corto que el dı́a solar. Sin embargo, como las estrellas están muy alejadas, este tiempo no varı́a con la época del año en la que nos encontremos. Además, tal como se empezó a sospechar en el siglo XVII, la Tierra no gira uniformemente alrededor de su eje, sino que tiene fluctuaciones y, además, se va frenando gradualmente. Por otra parte, los polos terrestres, que determinan el eje de giro de la Tierra, sobre el que hemos definido el dı́a, también se mueven unos pocos metros en un año, lo que produce discrepancias del orden de unos 30 milisegundos de un año al siguiente. Se hace necesario, por tanto, un reloj que mida periodos constantes uniformemente. Esto se ha conseguido mediante la frecuencia de radiación emitida por un átomo de cesio. Pero como todas las unidades de tiempo habituales (hora, dı́a, mes, año, etc.) tienen un origen astronómico, ha Relojes basados en la rotación terrestre 75 sido preciso definir distintas escalas de tiempo, que veremos más adelante, con objeto de unificar las medidas de relojes astronómicos y atómicos. 5.2 Relojes basados en la rotación terrestre Desde un punto de vista práctico, podemos definir un dı́a como el intervalo de tiempo transcurrido entre dos pasos consecutivos de una cierta referencia espacial, situada en la esfera celeste, por un meridiano terrestre. De esta manera, podemos construir nuestro reloj tomando las 0h como la posición del punto del ecuador que se encuentra en el mismo meridiano que el punto de referencia y dividir el ecuador en 24 sectores. El ángulo entre la dirección del meridiano y la del punto de referencia, ángulo horario, medido en horas, nos determina la hora de nuestro reloj (Figura 5.1). Punto de referencia 0h Tierra 18h 6h Meridiano 12h Figura 5.1: Reloj natural basado en la rotación terrestre. 5.2.1 A pesar de la aparente sencillez de este reloj, aparecen ya los primeros problemas en la determinación de la hora. En primer lugar la falta de uniformidad de la rotación terrestre de la que prescindiremos por el momento. Por otro lado, cada meridiano señala una dirección diferente, por lo que la hora del reloj depende del meridiano elegido, lo que significa que la hora dada por este reloj es local, esto es, depende del lugar en que la midamos. Por último, debemos elegir el punto de referencia. La mejor referencia posible serı́a un punto fijo en el ecuador; sin embargo, esto no será posible desde un punto de vista práctico. Por ello, el movimiento del punto de referencia deberá ser tenido en cuenta para corregir la hora dada por el reloj. Tiempo sidéreo Las estrellas no sirven como punto de referencia, pues su movimiento propio, aunque pequeño, es en muchos casos muy mal conocido; es por lo que se utiliza como referencia el equinoccio , cuyo movimiento por precesión y nutación es lento y está muy bien estudiado. Llamaremos tiempo sidéreo al tiempo asociado a un reloj basado en la rotación terrestre y que toma como referencia el punto . Es decir, el tiempo sidéreo, ST , será el ángulo horario del punto . 76 Referencia temporal Al estudiar la precesión y nutación vimos que pueden definirse tres equinoccios diferentes. El equinoccio 0 de la época J2000.0, el equinoccio verdadero de la fecha , que es el anterior corregido por precesión y nutación y el equinoccio medio m , que es el de la época J2000.0 corregido solo por precesión. Aunque el equinoccio 0 representa una posición fija en el espacio— por lo que constituirı́a la referencia perfecta— no se utiliza, pues no va ligado a la observación astronómica como sucede con los otros dos. La complejidad del modelo de la nutación y su pequeño valor hacen que en general sea suficiente tomar como referencia el equinoccio medio, lo que nos lleva a definir el tiempo sidéreo medio. Este es el que se usa habitualmente, salvo para casos de gran precisión. Si se toma el equinoccio de la época hablaremos de tiempo sidéreo aparente. Llamaremos tiempo sidéreo local aparente, LAST , al ángulo horario del equinoccio de la fecha. El ángulo horario del equinoccio medio será llamado tiempo sidéreo local medio, LMST . Este ángulo es el que coincide con el tiempo sidéreo ST , y está asociado a la observación astronómica. La diferencia entre los dos tipos de tiempo sidéreo local será igual a la diferencia de la ascensión recta del equinoccio medio y el de la época que, de acuerdo con la teorı́a de la nutación, podrá ponerse como LAST donde LMST = EE, EE es la ecuación de los equinoccios, definida en (4.11). El hecho de ser local obliga a usar un reloj distinto en cada lugar. Para corregir esto, utilizaremos de manera global el reloj de tiempo sidéreo de un lugar determinado. L Tradicionalmente para ello se utili(meridiano local) zaba el observatorio de Greenwich definiendo el tiempo sidéreo medio en Greenwich, GMST , y el tiempo sidéreo aparente en Greenwich, GAST , cuya relación vendrá daL ST G da también a través de la ecuación (TIO, $) m G ST de los equinoccios. Las resoluciones de la IAU del año 2000 han sustituido el meridiano de Greenwich o por el origen terrestre intermedio (TIO, $) como origen del sistema Figura 5.2: Tiempos sidéreos. geográfico por lo que no tenı́a sentido mantener el meridiano de Greenwich como lugar común para la medida de un tiempo sidéreo universal, sin embargo, la generalización del uso de los nombres anteriores ha obligado a mantenerlos aunque modificando su definición para usar el nuevo origen. Relojes basados en la rotación terrestre 77 La figura 5.2 permite encontrar la relación entre los tiempos sidéreos locales y en Greenwich a través de la longitud, , del lugar como GMST = LMST , GAST = LAST . (5.1) A partir de ahora, salvo que se diga lo contrario, despreciaremos la nutación y hablaremos únicamente del tiempo sidéreo refiriéndonos al tiempo sidéreo medio y llamaremos dı́a sidéreo a un periodo de 24h de tiempo sidéreo medio. 5.2.2 Ángulo de rotación terrestre El modelo de movimiento del polo y rotación de la Tierra establecido por la Unión Astronómica Internacional en el año 2000, presentado en el capı́tulo 4, establece dos puntos de referencia no rotantes en el ecuador verdadero o intermedio: el origen intermedio terrestre (TIO, $) y el origen celeste intermedio (CIO, ), que representan respectivamente el origen de un sistema rotante con la Tierra y el de un sistema fijo. Estos puntos están próximos, aunque no son iguales, al meridiano de Greenwich y al equinoccio. Al ángulo entre estos dos puntos se le llama ángulo de rotación terrestre (ERA, ✓) y puede verse en la figura 4.5. Los puntos que lo forman están definidos de manera que su variación con respecto al tiempo coincida exactamente con la velocidad angular de rotación de la Tierra d✓ = !. dt En realidad este ángulo no representa un tiempo, pero su variación lo relaciona directamente con éste y su significado es equivalente al del GAST cuando se utiliza el CIO en lugar del equinoccio. 5.2.3 Tiempo solar y tiempo medio El equinoccio es, por su lento movimiento, la mejor referencia posible para la definición del dı́a. Sin embargo, el concepto de dı́a ha venido siempre asociado a la sucesión dı́a–noche debida a la permanencia del Sol por encima del horizonte. Esto nos lleva a considerar el Sol como referencia y por ello definir un nuevo tiempo, el tiempo solar. Se define el tiempo solar o tiempo solar verdadero como el ángulo horario del Sol, H . Esta definición presenta la ventaja de adaptarse mejor al concepto de tiempo en la vida civil, pero tiene el inconveniente de que el punto de referencia tiene movimiento mucho más rápido que el del equinoccio. En efecto, mientras el equinoccio medio se mueve unos 0.s 0084 por dı́a, el Sol se mueve aproximadamente 1 por dı́a. 78 Por otro lado, se presenta un problema mucho más serio debido a que el desplazamiento aparente del Sol en torno a la Tierra no es uniforme, a causa de la excentricidad de la órbita. Por ello, puesto que el valor de H no varı́a de modo uniforme, no puede ser usado como reloj, y se hace necesaria la construcción de un reloj uniforme basado en la hora solar. Referencia temporal (TIO, $) G 24h ET Hm En lugar del Sol, tomaremos como L referencia un punto imaginario, que llaH (meridiano maremos Sol medio (Sm ), que recolocal) rre el ecuador con velocidad constante Sol igual al movimiento medio de la órbiSol medio ta aparente del Sol alrededor de la Tierra1 . Aunque dicho punto no es visible, Figura 5.3: Tiempo solar y tiempo medio. la posición del Sol medio sobre el ecuador viene definida por su ascensión recta ↵m que es calculada por la Mecánica Celeste. Llamaremos tiempo medio o tiempo solar medio al ángulo horario Hm del Sol medio. Este es el tipo de tiempo que nos permitirá una mayor aproximación al tiempo usado habitualmente por todos nosotros. Al intervalo de 24h horas de tiempo medio le llamaremos dı́a medio. La relación del tiempo medio con el tiempo solar vendrá dado a través de la ecuación del tiempo ET = H Hm , (5.2) que debe ser aplicada siempre que observemos la hora dada por un reloj de Sol, tiempo solar y queramos transformarla en tiempo medio (figura 5.3). La figura 5.4 nos muestra la evolución de la ecuación del tiempo, cuyo valor es calculado por la Mecánica Celeste, a lo largo del año. Como puede observarse, la ecuación del tiempo posee dos máximos, dos mı́nimos y cuatro ceros a lo largo del año. Aproximadamente, los ceros se producen el 16 de abril, 13 de junio, 1 de 1 Lógicamente, este punto no puede ser cualquiera, sino que debe definirse con precisión a partir de razonamientos basados en las propiedades de la órbita kepleriana del Sol en torno a la Tierra que se verán en la segunda parte de este libro. Para ello, imaginemos otro punto, que llamaremos Sol ficticio Sf , que se mueve sobre la eclı́ptica, órbita del Sol, con velocidad constante n, y que coincide con el Sol en el perigeo ⇧ de la órbita del Sol. Ası́ pues, sobre la eclı́ptica, el c = f (anomalı́a verdadera), mientras que ⇧S df = ` (anomalı́a media). Pues bien, el Sol arco ⇧S medio definido anteriormente, es tal que se mueve sobre el ecuador, con la misma velocidad n que Sf y coincide con éste en el equinoccio ; por ello, y prescindiendo del pequeño efecto de la precesión que no afecta por igual a las coordenadas ecuatoriales y eclı́pticas, podemos admitir que la ascensión recta ↵m del Sol medio coincide con la longitud eclı́ptica L de Sf . Con esto, la diferencia ↵m = L = f `. La expresión f ` es llamada ecuación del centro. Relojes basados en la rotación terrestre 79 15m 10m 5m 50 100 150 200 250 300 350 dı́as 5m 10m Figura 5.4: Ecuación del tiempo ET. El eje horizontal representa los dı́as transcurridos desde el comienzo del año. El eje vertical representa los minutos de desfase entre el tiempo solar y el tiempo medio. septiembre y 25 de diciembre; el máximo absoluto el 3 de noviembre (unos 16m ) y el máximo relativo el 14 de mayo (unos 4m ); el mı́nimo absoluto el 11 de febrero (unos 4m ) y el mı́nimo relativo el 26 de julio (unos 6m ). 5.2.4 Tiempo universal El tiempo utilizado en la vida civil está basado en el tiempo medio. Sin embargo, dada su definición como el ángulo horario del Sol medio, se desprende un aspecto que no concuerda con el uso civil. En efecto, para usos comunes, el dı́a comienza a media noche, cuando el Sol tiene un ángulo horario de 12h y no al mediodı́a, cuando el ángulo horario es 0h . Este desfase se corrige añadiendo 12h al tiempo medio. Por ello, en 1925 se definió el tiempo civil local como Tc = Hm + 12h . (5.3) De nuevo, este tiempo sigue teniendo un carácter local. Ası́, la hora civil de Santiago de Compostela diferirı́a de la hora de Zaragoza en unos 30m debido a la diferencia de longitud, por lo que el tiempo civil no es todavı́a el candidato más adecuado para la creación de un reloj que nos sea de utilidad y de uso sencillo y común. Hasta finales del siglo XIX, cada paı́s tenı́a establecido su propio meridiano origen con objeto de proporcionar una hora común al paı́s, y que sirviera de referencia a los marinos para determinar la longitud a que se encontraban los barcos en sus largas travesı́as marı́timas. Con objeto de tener un tiempo común para todos los lugares, se toma de nuevo el origen terrestre intermedio (TIO, $) en sustitución del meridiano del observatorio de Greenwich, y a la hora civil en este meridiano se le llama Tiempo Universal Cero, UT0 . La relación de este tiempo 80 Referencia temporal con el tiempo civil vendrá dada a partir de la longitud, 0, UT0 = Tc del lugar en la forma o. (5.4) En la ecuación anterior (5.4), se relaciona el tiempo civil obtenido a partir de la observación del ángulo horario del Sol medio con la longitud o del observatorio, sin corregir ésta por el efecto del movimiento del polo. Si empleamos la longitud corregida, tendremos el llamado Tiempo Universal Uno, UT1 , cuya relación, de acuerdo con la primera de las ecuaciones (4.8), será UT1 = UT0 tan o (xp sen o + yp cos o ), (5.5) donde UT1 representa la medida de la rotación real de la Tierra independientemente de la localización del observador. El ángulo de rotación de la Tierra ha sido definido de manera que tenga una relación lineal con UT1 y está dado en términos de rotaciones de la Tierra (unidades de 2⇡ radianes) desde el 2000 Enero 1 a las 12h de UT1 . Su valor es igual a ✓ = 0.7790572732640 + 1.00273781191135448 Td , (5.6) donde Td 2 representa el número de dı́as, de tiempo UT1 , transcurridos desde el instante origen. El valor de ✓, en radianes, se obtiene multiplicando la cantidad anterior por 2⇡. En ambientes no astronómicos se utiliza a veces el término Tiempo Medio de Greenwich (GMT ). Antes de 1926 dicho término se referı́a realmente al tiempo medio del meridiano de Greenwich, sin embargo, desde 1926 se utiliza para referirse al tiempo civil de Greenwich, o lo que es igual al tiempo universal, sin especificación del tipo (en su forma de uso más reciente se identifica con el Tiempo Universal Coordinado UTC que veremos después). Esta ambigüedad de la definición y su distinta interpretación antes y después de 1926 han llevado a la Unión Astronómica Internacional a desaconsejar su uso. El tiempo UT1 muestra irregularidades causadas por determinadas variaciones de la rotación terrestre, que son de tipo secular (como el frenado que sufre por rozamiento de las aguas con el fondo marino), periódicas (mareas lunares, desplazamientos estacionales de grandes masas de agua en estado sólido, lı́quido o gaseoso), e irregulares (terremotos, volcanes, etc.). Las variaciones periódicas permiten corregir el UT1 y definir el llamado Tiempo Universal Dos, UT2 , cuya relación con UT1 viene dada por UT2 UT1 = 0.s 022 sen(2⇡t) 0.s 012 cos(2⇡t) 0.s 006 sen(4⇡t) + 0.s 007 sen(4⇡t), donde t es la fracción de año trópico (que se verá en la siguiente sección) transcurrido desde el momento en que la longitud del Sol medio es de 280 . Este tiempo no será usado en la práctica, por lo que en adelante lo consideraremos igual a UT1 . 2T d = JDUT1 2451545.0. Movimiento orbital de la Tierra: el año 5.3 81 Movimiento orbital de la Tierra: el año El concepto de año viene asociado al movimiento orbital de la Tierra en torno al Sol o, de forma equivalente, al del Sol en torno a la Tierra. Suele llamarse año al periodo de dicha órbita, que de acuerdo con las leyes de Kepler serı́a constante si el Sol y la Tierra estuviesen aislados formando un problema de dos cuerpos. Las perturbaciones ocasionadas por el resto de los planetas producen una variación del periodo orbital, lo que nos lleva a la conclusión de que la duración del año no es constante. Por otro lado, la definición del año como el tiempo transcurrido entre dos pasos del Sol por un punto determinado de la eclı́ptica requiere la elección de una referencia donde medir el paso del Sol. Si la órbita fuese kepleriana, cualquier punto nos darı́a el mismo valor del año; sin embargo, como la órbita está perturbada, la elección del punto de referencia mediante el cual medimos el periodo adquiere una importancia fundamental, pues su movimiento se combina con la variación del periodo orbital, dando lugar a años con diferente duración. Podemos pensar en varias referencias para medir la duración del año. Por un lado, el perigeo3 de la órbita. Este es el punto de referencia más adecuado si pensamos en la integración del problema dinámico teniendo en cuenta que las ecuaciones del movimiento vendrán expresadas en un ángulo medido desde el perigeo, la anomalı́a verdadera, que varı́a de 0 a 2⇡ entre un perigeo y otro. Llamaremos año anomalı́stico, Aa , al intervalo de tiempo transcurrido entre dos pasos consecutivos del Sol por el perigeo. Llamaremos año sidéreo, As , al intervalo de tiempo transcurrido entre dos pasos consecutivos del Sol por el equinoccio o de una época fija. Conocida por integración la duración del año anomalı́stico, la misma integración nos dará el movimiento del perigeo lo que permitirá obtener el año sidéreo. Los años sidéreo y anomalı́stico vienen definidos a través de una referencia ligada al movimiento orbital, sin embargo, no son éstos los más útiles desde el punto de vista práctico. De hecho, una de las ventajas del uso del año como medida del tiempo es su relación con las estaciones que se definen a partir del paso del Sol por los equinoccios y solsticios. Por ello, es conveniente usar como referencia el equinoccio medio de la época para que la medida del año venga asociada intrı́nsecamente al comienzo de la primavera astronómica en el hemisferio norte. Se llama año trópico, At , al intervalo de tiempo transcurrido entre dos pasos consecutivos del Sol por el equinoccio medio. Por observación, se puede calcular la duración, en dı́as medios, del año trópico, resultando ser aproximadamente de unos 365.2422. Que el año no tenga un número exacto de dı́as ha creado numerosos problemas a la hora de confeccionar 3 Punto de mayor proximidad entre el Sol y la Tierra. El concepto de perigeo será definido con precisión en el capı́tulo 8. 82 Referencia temporal calendarios y es el motivo de la introducción de los años bisiestos. Por ello se introduce un nuevo tipo de año, llamado año juliano, que tiene exactamente 365.25 dı́as medios. La Mecánica Celeste establece la duración, expresada en dı́as medios, del año anomalı́stico y el año sidéreo, que resulta ser Aa = 365.25964134 + 0.0000000304 Ts , As = 365.25636042 + 0.0000000011 Ts . (5.7) Para obtener la duración del año trópico bastará combinar la duración del año sidéreo con el valor de la precesión en longitud para establecer el valor At = 365.24219897 + 0.0000000614 Ts . (5.8) La duración de estos años se puede tomar, de manera bastante aproximada, como Aa = 365.2596, As = 365.2564, At = 365.2422, dı́as medios. 5.4 Relación entre el tiempo sidéreo y el tiempo medio Para encontrar la relación entre el tiempo sidéreo y el tiempo medio en cualquiera de sus versiones anteriores, hay que considerar el tiempo que tarda el Sol medio en pasar dos veces consecutivas por el equinoccio medio, es decir, el año trópico. Supongamos que un cierto dı́a, el equinoccio medio y el meridiano del lugar están en la misma dirección, que coincide con la del meridiano del lugar (posición (1) de la figura 5.5). Al cabo de un dı́a sidéreo, el equinoccio volverá a pasar por el meridiano del lugar (posición (2) de la figura 5.5), sin embargo el Sol medio todavı́a no habrá culminado, faltándole un ángulo ⇣. El dı́a sidéreo es, por tanto, más corto que el el dı́a medio. Sol ⇣ ⇣ (2) Tierra (1) Al cabo de un año trópico, el Sol y el equinoccio volverán a estar alineados en el mismo meridiano pero mientras el Sol ha pasado un cierto número Figura 5.5: Relación entre la duración del de veces por el meridiano del lugar, el dı́a medio y el dı́a sidéreo. Relación entre el tiempo sidéreo y el tiempo medio 83 equinoccio habrá pasado exactamente un dı́a más (puesto que la Tierra ha dado exactamente una vuelta en el año trópico), lo que significa que si el año trópico tiene una duración de At dı́as medios, su valor en dı́as sidéreos será exactamente At + 1, luego se verifica que (At + 1) dı́as sidéreos = At dı́as medios. Esto nos dará la relación entre el dı́a medio y el dı́a sidéreo que, para el valor At = 365.2422 dado anteriormente, permite poner: 1 d.s. 1 d.m. 365.2422 = 0.9972696 d.m. = 23h 56m 4.s 09053 de tiempo medio, 366.2422 366.2422 = = 1.0027379 d.s. = 24h 3m 56.s 55537 de tiempo sidéreo, 365.2422 = que nos dan la relación entre el dı́a sidéreo y el medio. Como podemos apreciar, el dı́a sidéreo es unos cuatro minutos más corto que el medio. También podemos definir la función Intsid (), que transforma tiempo medio en sidéreo, y la función Intmed (), que transforma tiempo sidéreo en medio. Estas funciones vendrán dadas por: Intsid (x) = 1.0027379 x, Intmed (x) = 0.9972696 x, Intsid (x) = At + 1 x, At Intmed (x) = At x. At + 1 (5.9) Las expresiones de arriba en (5.9) son aproximadas, mientras que las de abajo nos dan el valor exacto si sustituimos At por su valor, expresado en dı́as medios. Nótese que la función Intsid () es la inversa de Intmed (). Las funciones anteriores nos van a permitir transformar el tiempo universal, en cualquiera de sus versiones, en tiempo sidéreo y viceversa. Para ello, supongamos un lugar de longitud y un instante caracterizado por una hora sidérea LMST , una hora de tiempo civil Tc y una hora de tiempo universal UT . A partir de ahora usaremos UT sin especificar si es UT1 o UT0 , pues la elección dependerá de si la longitud está o no corregida por el movimiento del polo. Llamaremos GMST0 a la hora GMST cuando sean las 0h de tiempo universal, esto es, cuando comience el dı́a medio en el meridiano origen. Fácilmente se comprueba que en ese instante, la hora sidérea local será LMST 0 = GMST0 + . Para calcular la hora sidérea en el instante UT habrá que añadir a LMST 0 el intervalo de tiempo sidéreo correspondiente a las horas de UT transcurridas, esto es, LMST = GMST0 + + Intsid (UT ), (5.10) relación fundamental que permite pasar de tiempo universal a tiempo sidéreo. De un modo sencillo podemos invertir la anterior relación, obteniendo la fórmula de paso de tiempo sidéreo a universal UT = Intmed (LMST GMST0 ). (5.11) 84 Referencia temporal Notemos que para convertir tiempo sidéreo a universal es necesario el valor de GMST0 , esto es, el tiempo sidéreo en Greenwich a las cero horas de UT de un determinado dı́a. El valor de GMST0 , acorde con el modelo de precesión del año 2000 es igual a GMST0 = 361658.00 2406561 + 129598159.00 7606402 Tsu + 4612.00 15739966 Ts + 1.00 39667721 Ts2 0.00 00009344 Ts3 + 0.00 00001882 Ts4 , (5.12) donde Ts y Tsu representan el UT1 y TT 4 ambos expresados en siglos julianos desde J2000.0. 5.5 Escalas de tiempo uniforme La Mecánica de Newton admite la existencia de un tiempo uniforme y absoluto que es el usado en las ecuaciones del movimiento de los cuerpos. Durante siglos, la rotación terrestre ha sido considerada uniforme y por ello el tiempo que de ella se ha derivado, UT , se ha supuesto coincidente con el tiempo absoluto de la Mecánica. Sin embargo, a finales del siglo XVII, Flamstead ya sugirió que la rotación de la Tierra podrı́a cambiar de estación en estación, debido a las masas de aire y agua que la envuelven y que se desplazan en las distintas estaciones del año. El desarrollo de la Mecánica Celeste permitió lograr, a comienzos del presente siglo, unas teorı́as del movimiento de los planetas suficientemente precisas para comprobar que la rotación de la Tierra no es un fenómeno totalmente uniforme. En efecto, Newcomb observó un desfase entre la observación de los planetas y sus posiciones calculadas. Posteriores investigaciones han llevado a la conclusión de que la Tierra se retrasa en su rotación unos 30s por siglo. 5.5.1 Tiempo de efemérides y tiempo atómico internacional La Astronomı́a, necesitada de mayor precisión en los cálculos, definió una nueva escala de tiempo, el tiempo de efemérides, ET , basada en la dinámica del sistema solar y uniforme por definición. La Mecánica Celeste fue la ciencia encargada de medir el desfase T = ET UT , (5.13) entre el tiempo de efemérides y el tiempo universal que continúa siendo el tiempo tomado como base para las aplicaciones en la vida civil. La época origen desde la que se mide el tiempo de efemérides es el instante de la media noche media (Hm = 12h ) del dı́a que comienza el año 1900. Teniendo en 4 Ver apartado 5.6 Escalas de tiempo uniforme 85 cuenta la duración del año trópico de 1900, igual a 365.242198781 dı́as medios, la Unión Astronómica Internacional (IAU) eligió, en 1956, como unidad fundamental de tiempo el segundo, definido como la fracción 1/31556925.975 de la duración del año trópico de 1900. Esta unidad, puesto que se refirió a un año concreto, es independiente de la rotación terrestre y del año que se considere. En 1900, dos relojes, uno de UT y otro de ET deberı́an marcar la misma hora, pero en el momento en que se definió el ET habı́a un desfase entre ellos de unos 32.s 184 debido al deceleración en rotación de la Tierra. Al contrario de los tiempos definidos hasta aquı́, que conllevan una inexactitud asociada a la no periodicidad del fenómeno por medio del cual se definen, el ET es uniforme por definición, aunque su medida, basada en la observación y el cálculo de las posiciones de los planetas, no es exacta. Sin embargo, el avance es sustancial, pues cualquier mejora en la medida, cientı́fica o tecnológica, supone un progreso en la exactitud del tiempo obtenido, mientras que antes siempre nos encontrábamos con la inexactitud propia del fenómeno que define el reloj. La medida del tiempo basado en el tiempo de efemérides estuvo vigente hasta 1967, año en que se introduce oficialmente el tiempo atómico internacional (TAI ), basado en fenómenos cuánticos propios del interior de la materia. La unidad básica del TAI es el segundo atómico internacional que se define como la duración de 9192631770 periodos de la radiación correspondiente a la transición entre los dos niveles hiperfinos del estado fundamental del átomo de Cesio 133. Este segundo, que es la unidad de tiempo en el sistema internacional (SI), se definió de modo que su duración coincidiera con la del segundo de efemérides establecida anteriormente. La mayor precisión conseguida en la medida de TAI por medio de los relojes atómicos aconsejó la utilización de este tiempo como estándar a partir de 1967. La siguiente tabla nos da una idea de la precisión de estos relojes: Reloj ET , Cristal de cuarzo Rubidio Cesio Maser hidrógeno Pérdida de un segundo en 30 años 30000 años 300000 años 30000000 años El tiempo de efemérides y el tiempo atómico internacional son, en teorı́a, el mismo tiempo uniforme, pero con objeto de ajustar el TAI a UT , hubo que tener en cuenta el desfase entre el UT y el ET y eso hizo que las escalas no tuviesen el mismo origen. Por ello, en la Asamblea General de la IAU de 1976 en Grenoble, se adoptó la resolución de que el instante 00h 00m 00.s 00 del 1 de Enero de 1977 TAI sea el 00h 00m 32.s 184 del 1 de Enero de 1977 del correspondiente a la escala ET con lo que se tiene que ET = TAI + 32.s 184. (5.14) 86 5.5.2 Referencia temporal Tiempo universal coordinado A pesar de la variedad de tiempos que hemos definido, aún no hemos llegado al tiempo que realmente estamos utilizando en nuestra vida cotidiana. Para ello vamos a dar antes un par de definiciones aplicables a cualquier reloj y analizaremos su significado. Llamaremos estado de un reloj, E.R., a la diferencia entre la hora que marca el reloj y la hora exacta. Un valor positivo del estado de un reloj corresponde a un reloj adelantado, mientras que un valor negativo indica que el reloj está atrasado (Figura 5.6(a)). t Zona de adelanto Reloj 1 Reloj 2 Zona de atraso (a) Estado Reloj 3 (b) Marcha Figura 5.6: Estado y marcha de un reloj. En ambas figuras el eje horizontal representa la hora exacta, mientras que el eje vertical representa la hora marcada por el reloj. Llamaremos marcha de un reloj, m, a la variación del estado del reloj en un cierto intervalo de tiempo E.R.2 E.R.1 m= , t2 t 1 es decir, lo que el reloj adelanta o atrasa en dicho intervalo (dı́a, año, etc.). La gráfica 5.6(b) nos muestra tres tipos diferentes de relojes. El reloj 1 es un reloj que tiene un estado constante, esto es, una marcha nula. Este reloj es un reloj uniforme pero que mantiene una diferencia constante con la hora exacta. El reloj 2, tiene una marcha constante, atrasa una cantidad de tiempo constante cada cierto periodo de tiempo, al cabo del cual, el reloj es puesto de nuevo en hora. Por último, el tercer reloj muestra un reloj de marcha constante pero no corregida, por lo que su estado es cada vez mayor. Con estas ideas podemos ilustrar el comportamiento de nuestros relojes de TAI , ET y UT en la figura 5.7. Despreciando la marcha del TAI (1s cada 30000000 años), éste será tomado como tiempo uniforme. El tiempo efemérides, por definición, es también uniforme; sin embargo, su estado es constantemente igual a 32.s 184 que corresponde a un reloj Escalas de tiempo uniforme 87 ET TAI UTC Figura 5.7: Tiempo universal coordinado. como el del tipo primero de la Figura 5.6(b). Por su parte, el tiempo universal va manteniendo una marcha no nula, debido a la variación de la velocidad de rotación de la Tierra. Evidentemente, este reloj (es la Tierra) no puede ser corregido, por lo que es similar al del tipo 3 mostrado en la Figura 5.6(b). Ası́ pues, tenemos por un lado un reloj atómico, casi perfecto, y que de momento, es el tipo de tiempo que se puede medir con mayor precisión, y un mal reloj, formado por la Tierra y el Sol, pero que rige la vida diaria y las costumbres humanas. Se hace necesario, por tanto, relacionar este tiempo TAI con el UT , menos consistente y determinado a partir de la rotación de la Tierra. Esta relación se obtiene con un nuevo tiempo, el llamado tiempo universal coordinado 5 , UTC , introducido en 1972, a caballo entre el TAI y el UT , puesto que prácticamente es el TAI y apenas se desvı́a del UT1 . Este nuevo tiempo, UTC , cumple las siguientes condiciones: 1. Su diferencia, DUT1 , con el tiempo universal debe ser siempre inferior a 0.s 9, esto es, DUT1 = UT1 UTC < 0.s 9. 2. Su diferencia, DTA = TAI -UTC , con el tiempo atómico internacional debe ser un número entero de segundos. Esto se consigue mediante un segundo intercalar, de modo análogo a como sucede con los años. Cuando la diferencia DUT1 va a exceder 0.s 9, se añade un segundo. Este segundo intercalar, normalmente, se le añade al último minuto del año en diciembre, o al último minuto de junio, lo que se anuncia con suficiente antelación por los organismos encargados del tiempo. En el momento de terminar este libro 5 También llamado a veces tiempo zulú y GMT , aunque este nombre ya hemos dicho antes que es confuso y por ello desaconsejado. 88 Referencia temporal el valor de DTA es de 35s con el último segundo intercalar introducido el 30 de Junio de 2012. El UTC es el tiempo difundido por las señales horarias con una precisión de ±0.s 00002 y es tomado como base para definir la hora oficial de cada paı́s o zona. 5.5.3 Tiempo de zona y tiempo oficial El tiempo universal coordinado nos da un tiempo medio común, pero referido al meridiano origen. Un sistema de estándares para todo el globo terrestre está basado en las zonas o husos horarios, basados en incrementos de 15 (una hora) de longitud, aunque, en la práctica, son los gobiernos de los distintos paı́ses quienes decretan el llamado tiempo de zona (ZT ), tomando generalmente como base un número entero de horas que represente la longitud media m de una zona o paı́s determinado, de modo que ZT = UTC + m. (5.15) Sin embargo, este tiempo de zona no suele ser el que un paı́s adopta para su territorio, la llamada hora oficial, sino que ésta se regula mediante criterios polı́ticos o económicos. Ası́, hora oficial española (TE ), viene dada como: TE invierno = UTC + 1h , TE verano = UTC + 2h , siendo TE invierno la hora oficial desde el último domingo del mes de octubre al último domingo del mes de marzo, y TE verano la del resto del año. La diferencia de longitud obliga a definir una hora menos para Canarias. Notemos que realmente, nuestro tiempo de zona no corresponde con nuestro huso horario (el meridiano de Greenwich pasa por la penı́nsula), sino que llevamos el llamado CET (Central European Time), el tiempo de la zona de la Europa central. 5.6 Escalas modernas de tiempo Tanto el TAI como el ET son esencialmente el mismo tiempo dentro del contexto de la mecánica newtoniana, pues ambos señalan un tiempo absoluto. La IAU en el año 1976, considerando la precisión alcanzada entonces en la medida del tiempo, señaló la necesidad de introducir las variaciones de tiempo derivadas de la teorı́a de la relatividad. Ambos tiempos están medidos desde un observatorio terrestre en movimiento y, por lo tanto, son distintos de los que se medirı́an desde otro lugar, como el baricentro del sistema solar. Esto resulta de particular importancia si pensamos en que todas la teorı́as dinámicas del movimiento de los planetas, a partir de las que se obtiene el tiempo de efemérides, están formuladas tomando como origen del sistema de referencia el baricentro del sistema solar. Escalas modernas de tiempo 89 Para resolver esta ambigüedad se definieron dos nuevas clases de tiempo, que están vigentes a partir del año 1984. Estos nuevos tiempos son llamados tiempo terrestre, TT , (anteriormente llamado tiempo dinámico terrestre, TDT ), y el tiempo dinámico baricéntrico, TDB . El tiempo terrestre coincide exactamente con el tiempo de efemérides y no es sino una continuación del ET a partir del 1 de Enero de 1977. De ahı́ que su relación con el TAI sea TT = TAI + 32.s 184. (5.16) El tiempo dinámico baricéntrico (TDB ) es la variable independiente de la ecuaciones del movimiento con respecto al baricentro del sistema solar. La introducción de TT viene condicionada por la necesidad de un tiempo en el cual se formulen las ecuaciones geocéntricas del movimiento, en contraposición con el tiempo de las ecuaciones baricéntricas TDB . En los anuarios astronómicos, todas las efemérides referidas a posiciones geocéntricas vienen expresadas en TT , mientras que las referidas a posiciones baricéntricas vienen en TDB . La aplicación de la teorı́a de la relatividad a las ecuaciones del movimiento planetario permite obtener las relaciones entre TT y TDB que, simplificada, puede ponerse como TDB = TT + 0.s 001658 sen(g + 0.0167 sen g), con g = 357. 53+35999. 050 Ts . En la expresión anterior faltan los términos lunares y planetarios que son del orden de 0.s 00001 y los diarios, del orden de 0.s 000001. Teniendo en cuenta las relaciones entre los tiempos TT , ET y TAI podemos obtener la relación T = TT UTC = DTA + 32.s 184, (5.17) que, a partir del segundo intercalar introducido a mediados del año 2012 es de 67.s 184. Desde el año 1980, atendiendo a la importancia creciente del uso de la constelación de satélites GPS, se ha definido un nuevo tiempo, el llamado tiempo GPS (GPST ), que es el emitido por dichos satélites. Este tiempo está también medido con relojes atómicos y difiere del TAI en una cantidad constante de 19s GPST = TAI 19s . (5.18) De esta forma la introducción de segundos intercalares producirá una diferencia variable de un número entero de segundos con el UTC . Esta diferencia, será GPST UTC = DTA o lo que es igual, 16s desde el 1 de Julio de 2012. 19s , (5.19) 90 Referencia temporal 5.7 Tiempos coordenada El tiempo coordenada representa la coordenada tiempo de los sistemas relativistas baricéntrico y geocéntrico. El tiempo coordenada baricéntrico (TCB ) es el tiempo del sistema BCRS, mientras que el tiempo coordenada geocéntrico (TCG ) es el tiempo del sistema GCRS. De acuerdo con las definiciones de la IAU la relación entre el TCG y el TT viene dada por la expresión d TT =1 d TCG LG , donde LG es una constante adimensional fundamental cuyo valor es 6.969290134⇥ 10 10 . Estableciendo un instante inicial e integrando se obtiene la relación TCG TT = LG (JDTT 2443144.5) ⇥ 86400, (5.20) donde la diferencia viene dada en segundos. El primer orden de la relación entre el TCB y el TCG es TCB TCG = LC (JDTT siendo LC = 1.48082686741 ⇥ 10 no lineales que no se han escrito. 5.8 8 2443144.5) ⇥ 86400, (5.21) . Esta diferencia tiene además otros términos Calendario Para referir cronológicamente los acontecimientos históricos se construyeron calendarios que tratan de combinar los conceptos básicos de dı́a y año para establecer referencias que permitan identificar instantes concretos del tiempo o épocas. La duración del año no es un número entero de dı́as, por lo que la creación de calendarios ha sido una labor compleja. Estudiaremos aquı́ únicamente el calendario en vigor en el mundo occidental, aunque resulta muy interesante realizar un análisis del resto de calendarios. El calendario intenta reproducir el año trópico, pues de esta forma el comienzo de las estaciones tendrá lugar siempre en las mismas fechas del año. La duración aproximada del año trópico es de 365.2422 dı́as medios, lo que llevó a Julio César— a instancias de Sosı́genes— a la promulgación del calendario juliano, constituido por ciclos de tres años de 365 dı́as y otro, llamado año bisiesto, de 366 dı́as. En promedio, el año del calendario Juliano tiene una duración de 365.25 dı́as. Esta cantidad es muy próxima a la duración del año trópico, pero lleva un desfase de 0.0078 dı́as al año o lo que es igual, de casi un dı́a cada 128 años. Determinación de una época 91 Este desfase, con el paso del tiempo, se fue haciendo cada vez más evidente, de modo que los comienzos de las estaciones se adelantaban varios dı́as. Esto, junto con el hecho de volver a tener la fecha de Pascua en las fechas esperadas6 , motivó una profunda reforma del calendario, impulsada por el papa Gregorio XIII, que se conoce con el nombre de Reforma Gregoriana. Al calendario que se adoptó se le dio el nombre de calendario gregoriano. Este reforma corrigió el desfase acumulado e intentó paliar en lo posible el desfase para los años venideros. Como en el año 1512 la primavera comenzaba el 11 de marzo, la reforma gregoriana dispuso, en primer lugar, la desaparición de 10 dı́as, por lo que al 4 de octubre de 1582 le siguió el 15 de octubre de 1582, con lo que se restauraba el equinoccio al 21 de marzo. Además, se siguió con el sistema de años bisiestos, pero de modo que los últimos años de siglo (años que acaben en 00) , no serán bisiestos, excepto aquellos múltiplos de 400. De esta forma, no fueron o no serán bisiestos los años 1700, 1800, 1900, 2100, 2200, 2300, etc., aunque sı́ los años 1600, 2000, 2400, etc. Con este método, la duración del año es de 365.2425 dı́as, por lo que se acumula un error de 1 dı́a en 3314 años, que podrı́a ser recogido con una nueva reforma, pero dado que el número de años que han de transcurrir para que tenga lugar ese desfase, se optó por dejarlo ası́. Como el motivo principal de esta reforma fue religioso, inicialmente fue aceptada sólo por los paı́ses católicos romanos. Los paı́ses protestantes la introdujeron bastantes años más tarde y los ortodoxos incluso la rechazaron hasta comienzos del siglo XX. 5.9 Determinación de una época Una vez establecido el calendario, una fecha se localiza mediante el dı́a, mes y año y se se quiere precisar más, la hora. Desde el punto de vista astronómico, expresaremos un instante o época, T , dando los datos correspondiente en el siguiente orden: año, mes, dı́a y hora. Ası́ hablaremos del 2000 Enero 1 a las 12h UTC como el mediodı́a del uno de Enero del año 2000. En ocasiones, también emplearemos el número 0 para indicar el dı́a, ası́ Enero 0 a las 12h corresponde al 31 de Diciembre a las 12h . Sin embargo, desde un punto de vista matemático, este uso del calendario, no es muy práctico; basta simplemente con calcular el intervalo de tiempo transcurrido entre dos fechas separadas varios meses para constatar lo tedioso que resulta la operación, puesto que hay que tener en cuenta el número de dı́as que tiene cada mes y si aparece involucrado algún año bisiesto o no en el lapso de tiempo considerado. Una escala continua simplificarı́a notablemente el cálculo. Esto se consiguió con el llamado periodo juliano, propuesto por Scaliger en 1582, y que recibe el nombre por su padre, Julio Scaliger. 6 En el Concilio de Nicea se estableció que la Pascua de Resurrección se celebrase el domingo siguiente al primer plenilunio después del 21 de Marzo. 92 Referencia temporal El periodo juliano es una escala continua de tiempo, con su origen en el 4713 A.C. Enero 1d .5, esto es a las 12h TT del dı́a 1 de Enero del año -4712 del calendario Juliano proléptico7 , de modo que los años tienen una duración fija de 365.25 dı́as. Este punto inicial, aparentemente caprichoso, fue una cuidadosa elección por parte de Scaliger de tres ciclos: el ciclo solar de 28 años (cuando los dı́as de la semana y las fechas del calendario se repiten en el calendario Juliano), el ciclo de 19 años de los números áureos (cuando las fases de la luna se repiten en las mismas fechas del calendario) y el ciclo de 15 años de indicción (ciclo de impuestos romano). El número de dı́a juliano (JDN) correspondiente a un dı́a solar es el número entero de dı́as transcurridos entre la época origen y el mediodı́a de ese dı́a. El modo de calcular el JDN es simple: supongamos que queremos calcular el JDN del 1 de Enero de 1998, para ello basta con calcular el número de años transcurrido desde el origen, multiplicar por 365.25, tomar el entero por exceso de la operación, restar el número de dı́as suprimidos mediante la reforma gregoriana y añadir el número de dı́as dentro del año. En nuestro ejemplo, es 4712 + 1998 = 2450827.5, cuyo entero por exceso es 2450828. A este número hay que restarle 13 dı́as (10 de la reforma y tres por 1700, 1800 y 1900 que no fueron bisiestos), con lo que obtenemos 2450815. La fecha juliana (JD) de un instante, es el número de dı́a juliano de ese dı́a, más la fracción de dı́a desde el mediodı́a hasta ese instante. Puesto que en la determinación de la fecha juliana se utiliza la hora, la IAU recomienda usar como tiempo el TT , aunque pueden usarse otros tipos de tiempo como el UT1 , UTC , etc. En estos casos, además de las correcciones oportunas, habrá que especificar el tipo de tiempo usado, por ello hablaremos del JDTT , JDUT1 , JDUTC , etc. Si no se especifica nada se entiende que JD = JDTT . Siguiendo con el mismo ejemplo de antes el 1 de Enero de 1998 es 2450815, luego para encontrar la fecha juliana de ese mismo dı́a a las 0h TT se deberá restar 0.5 a dicho número pues es la fracción de dı́a que falta hasta las 12h TT. Ası́ pues tendremos que la fecha juliana será 2450814.5 y se representará por las letras JD seguidas de ese número JD 2450814.58 . La fecha juliana almacena en un solo número real toda la información necesaria para determinar cualquier instante o época histórica. La parte entera lleva la información del dı́a y la parte decimal de la hora. Este procedimiento limita, desde el punto de vista informático, la precisión en la determinación de la época. Por ejemplo en la época actual, y aproximadamente hasta el año 22666, se precisan siete dı́gitos para el dı́a, por lo que si almacenamos el dato en una variable de doble precisión de un ordenador nos quedan unos 7 u 8 dı́gitos para la hora, lo que supone una precisión aproximada de unos 0.s 01. 7 El calendario juliano proléptico contiene año cero, de forma que el año 1 A.C. corresponde con el año 0, el 2 A.C. con el -1, etc. 8 En la página web http://aa.usno.navy.mil/faq/docs/JD Formula.php puede verse una sencilla fórmula, y su algoritmo escrito en FORTRAN, para realizar este cálculo. Determinación de una época 93 Con objeto de reducir el número de dı́gitos necesarios para almacenar el dı́a y que la fecha juliana comience a medianoche, se suele usar, siempre que no haya lugar a confusión, la fecha juliana modificada (MJD), que no es sino la fecha juliana (JD) menos 2 400 000.5. En nuestro ejemplo, la MJD correspondiente al 1 de Enero de 1998 a las 0h es 50814.0. Con esto aumentamos a 0.s 0001 la precisión en el almacenamiento de la hora. Si se quiere más precisión será necesario almacenar por separado el dı́a y la hora. Existen otras dos formas de caracterización de una época basadas en el concepto de año en lugar del dı́a. Fueron desarrolladas para establecer la variable temporal de las teorı́as dinámicas del sistema solar. Para ello, además de caracterizar la época se establecieron épocas estándar de referencia desde donde se medı́an perı́odos de tiempo. Con anterioridad a 1976, la época estándar estaba basada en el llamado año beseliano. Bessel definió éste como un año de duración idéntica al año trópico y que comienza en el instante en que la ascensión recta del Sol medio, afectada por aberración y contada desde el equinoccio medio es de 280 . Esta elección aparentemente artificial está hecha con la intención de aproximar al máximo el comienzo del año trópico con el del calendario. El año beseliano se representa con una B seguida de un número que indica el año beseliano y un decimal para la fracción de año trópico transcurrida desde el comienzo del año beseliano. Ası́ B1900.0 representa exactamente el comienzo del año beseliano 1900, mientras que B1900.5 representa medio año trópico después. Con esta notación, para establecer un intervalo de tiempo entre dos épocas basta con restar las cantidades y conocer la duración del año trópico. La primera época origen estándar establecida fue B1900.0 y representa el instante B1900.0 = 1900 Enero 0d .813 ET . Posteriormente, hacia la mitad del siglo XX, se usó B1950.0 como época estándar. La duración variable del año trópico hace difı́cil la medición de intervalos entre dos épocas. Esto aconsejó buscar un nuevo método de representación de una época, basado esta vez en el año juliano, que se representa con una J seguida de un número que representa el año y un decimal que representa la fracción de año juliano desde el comienzo de éste. La época estándar establecida en 1976 fue la época J2000.0, que es el año 2000 Enero 1 a las 12h TDB , es decir, el JD 2451545.0, que ya nos ha aparecido en alguna fórmula de este capı́tulo y el anterior. Este nuevo sistema se adapta muy bien al uso del dı́a como unidad para expresar un cierto intervalo de tiempo, lo que resulta muy conveniente en determinado tipo de observaciones. Además, para sustituir el lapso de tiempo transcurrido en las fórmulas mencionadas, basta con calcular la fecha juliana del dı́a requerido y sustraerla de la del instante J2000.0. 94 Referencia temporal Las épocas fundamentales pueden ponerse en la forma: B1900.0 = J2000.0 = JD2415020.31352, JD2451545.0, por lo que las relaciones entre las tres formas de caracterizar una época se expresarán como: JD 2415020.31352 B = 1900.0 + , 365.24219878 (5.22) JD 2451545.0 J = 2000.0 + . 365.25 A partir del año juliano puede definirse la variable Ts , que se usa habitualmente en las teorı́as dinámicas y que hemos utilizado en el capı́tulo anterior y en éste, como la fracción de siglo juliano desde la época J2000.0,es decir Ts = JD 2451545 . 36525 (5.23) Parte II Movimiento kepleriano 95 Capı́tulo 6 Revisión de elementos de dinámica clásica 6.1 Introducción Este capı́tulo contiene un rápido repaso a algunos de los conceptos fundamentales de la Mecánica, necesarios para poder comprender parte de este libro y expresados con una notación adaptada a éste. Su presentación, en algunos casos, no es muy detallada, pues esto nos llevarı́a a una complicación innecesaria para nuestros objetivos. Remitimos al lector a libros especializados del tema para una mejor comprensión del mismo. 6.2 Movimiento de una masa puntual Supongamos un punto P que se mueve en el espacio y cuya posición, con respecto a un cierto origen O, viene dada por un vector x(t) = OP , llamado vector de posición. Éste varı́a con respecto a una variable independiente t que llamaremos tiempo y que será considerado absoluto1 de acuerdo con los axiomas de la Mecánica enunciados por Newton. Si establecemos un sistema de referencia S = {O, e1 , e2 , e3 }, en el cual el vector de posición se expresa como x(t) = x1 (t) e1 + x2 (t) e2 + x3 (t) e3 , llamaremos trayectoria relativa al sistema S a la curva (x1 (t), x2 (t), x3 (t)), dada en coordena1 Independiente de las condiciones cinemáticas y dinámicas del observador. 98 Revisión de elementos de dinámica clásica das paramétricas y definida en el intervalo I = [t0 , t1 ] 2 IR. Si la curva se reduce a un punto, diremos que la partı́cula está en reposo o equilibrio. Llamaremos velocidad del punto al vector X(t) que determina la variación de x(t) con respecto al tiempo X(t) = ẋ(t) = dx(t) . dt El lugar geométrico de los extremos del vector velocidad X(t) es llamado hodógrafa. Si la velocidad de un punto es un vector constante diremos que el movimiento es uniforme. De aquı́ en adelante el punto, o puntos, encima de la variable representarán las derivadas respecto a t. Llamaremos aceleración del punto al vector a(t) que determina la variación de X(t) con respecto al tiempo a(t) = Ẋ(t) = ẍ(t). Un movimiento uniforme viene caracterizado por una aceleración nula. Los tres conceptos anteriores son puramente geométricos y definen la cinemática del punto P . Si al punto P le añadimos el concepto de masa m, como una constante asociada al punto, podremos llamar a P partı́cula material y esto nos permitirá definir dos nuevos conceptos que caracterizarán la dinámica del punto: el momento lineal y el momento angular. Se denomina momento lineal, o cantidad de movimiento, de una partı́cula P , de masa m, al vector p = mX. Por otro lado, llamaremos momento angular de P al vector G = x ⇥ p = m(x ⇥ X). Newton establece el concepto de fuerza como la variación de la cantidad de movimiento de una partı́cula, esto es, F = ṗ = mẊ = ma, (6.1) que es la ecuación fundamental de Newton de la Mecánica. Si conocemos la fuerza que actúa sobre una partı́cula, el conjunto de tres ecuaciones diferenciales de orden dos (6.1), junto con unas condiciones iniciales x(t0 ), X(t0 ), permite averiguar, por integración, la trayectoria de la partı́cula. Aunque el movimiento sea espacial, esto es, no esté restringido a un plano, siempre puede considerarse como instantáneamente plano, puesto que en cada instante la partı́cula se encuentra en el plano instantáneo definido por los vectores de posición y velocidad. La dirección del vector momento angular G, que es por definición perpendicular a x y X, define el plano instantáneo del movimiento, es por ello que si el momento angular de una partı́cula tiene dirección constante, su movimiento es plano. Sistemas inerciales y no inerciales Q x P 99 La norma del momento angular puede ponerse como k G k = 2mk V A k, donde V A = (x ⇥ X)/2 es la llamada velocidad areolar de P . Su significado geométrico es evidente si recordamos que dado el vector x = VA O Figura 6.1: Velocidad areolar. lı́m t!0 t = lı́m t!0 1 (x ⇥ 2 1 (x ⇥ 2 x), su norma k k mide el área del triángulo OP Q de la figura 6.1. Pasando al lı́mite tendremos x 1 ) = (x ⇥ X) = V A . t 2 Ası́ pues, V A mide el área elemental barrida por el vector de posición. Cuando la velocidad areolar, o lo que es igual el módulo del momento angular, es constante, se dice que P cumple la ley de las áreas. 6.3 Sistemas inerciales y no inerciales Otro de los principios establecidos por Newton garantiza la existencia de ciertos sistemas de referencia, que llamaremos sistemas inerciales, con respecto a los cuales una partı́cula libre2 se mantiene en reposo o se mueve con una trayectoria rectilı́nea y uniforme. Para comprender mejor el concepto de sistema inercial supondremos que existe un punto fijo F , en el espacio, y tres direcciones ortogonales fijas dadas por los vectores {f 1 , f 2 , f 3 } con las que definiremos un sistema de referencia fijo F = {F, f 1 , f 2 , f 3 }, en el que la posición, velocidad y aceleración de un punto P vendrán dadas por: r = F P , v = ṙ, a = r̈. Sea otro sistema de referencia, S = {O, s1 , s2 , s3 }, en el que tanto el origen O como las direcciones de los vectores de la base pueden moverse. Puesto que consideramos sistemas de referencia ortonormales, la única forma que tienen de moverse los vectores de la base es que ésta gire. Este movimiento implica que se verifiqua la condición ṡi 6= 0. Si ṡi = 0 diremos que el sistema se traslada. Llamaremos xo = F O al vector de posición del origen del sistema S respecto del sistema fijo F. Su velocidad y aceleración vendrán dadas por los vectores v o = ẋo , ao = ẍo . P3 Si el sistema S gira se tendrá ṡi 6= 0 y por tanto se podrá poner ṡi = j=1 aij sj , donde fácilmente puede comprobarse que se verifica aij = ṡi · sj . 2 Partı́cula sobre la que no actúa ninguna fuerza externa. 100 Revisión de elementos de dinámica clásica Por otro lado, puesto que consideramos únicamente sistemas ortonormales, se verificarán las relaciones si · si = 1, si · sj = 0, que derivadas conducen a 2ṡi · si = 0, ṡi · sj + si · ṡj = 0, o lo que es igual a aii = 0, aij + aji = 0. Llamando ahora !3 = a12 , !2 = a13 , !1 = a23 , podremos poner finalmente 0 1 0 10 1 ṡ1 0 !3 !2 s1 @ ṡ2 A = @ !3 0 ! 1 A @ s2 A , ṡ3 !2 !1 0 s3 o lo que es igual ṡi = ! ⇥ si , P3 (6.2) donde el vector ! = i=1 !i si será llamado velocidad angular del sistema. Las ecuaciones (6.2), llamadas fórmulas de Poisson, caracterizan la rotación de un sistema de referencia. Llamaremos x al vector OP , esto es, al vector de posición de P cuyas componentes en el sistema S son (x1 , x2 , x3 ). Para calcular la velocidad y aceleración de P relativa al sistema S bastará derivar x respecto al tiempo con lo que tendremos ẋ = 3 X ẋi si + i=1 3 X xi ṡi = x0 + i=1 3 X i=1 xi (! ⇥ si ) = x0 + ! ⇥ 3 X x i si , i=1 P3 donde, de aquı́ en adelante, llamaremos x0 = i=0 ẋi si , esto es, al resultado de derivar las tres componentes del vector sin considerar la variación de los vectores de la base. Ası́ llegamos a la expresión ẋ = x0 + ! ⇥ x. (6.3) Esta expresión puede usarse para el cálculo de la derivada segunda obteniéndose finalmente ẍ = = = dx0 d(! ⇥ x) + dt dt (x00 + ! ⇥ x0 ) + ! 0 ⇥ x + ! ⇥ (x0 + ! ⇥ x) (6.4) x00 + 2 ! ⇥ x0 + ! 0 ⇥ x + ! ⇥ (! ⇥ x), donde hemos tenido en cuenta que de acuerdo con (6.3) !˙ = ! 0 . Las ecuaciones anteriores permiten obtener la velocidad y aceleración de un punto P , relativa a un sistema S, como: ẋ = x0 + ! ⇥ x, ẍ = x00 + 2! ⇥ x0 + ! 0 ⇥ x + ! ⇥ (! ⇥ x). (6.5) Ahora ya estamos en condiciones de relacionar la posición, velocidad y aceleración de P en los sistemas fijo y móvil. Para ello, a partir de la relación entre las posiciones r = F P = F O + OP = xo + x, Movimiento de una partı́cula en su plano 101 obtendremos la velocidad v = ṙ = ẋo + ẋ = v o + x0 + ! ⇥ x, y finalmente la aceleración a = r̈ = ẍo + ẍ = ao + x00 + 2! ⇥ x0 + ! 0 ⇥ x + ! ⇥ (! ⇥ x). La expresión anterior para la aceleración puede expresarse en la forma a = x00 + aa + ac + ao , (6.6) siendo x00 la aceleración relativa, ac = 2 ! ⇥ x0 , la aceleración de coriolis, aa = ! 0 ⇥ x + ! ⇥ (! ⇥ x), la aceleración de arrastre y ao la aceleración del origen. La ecuación fundamental de Newton (6.1) se expresará finalmente como F = ma = mx00 + maa + mac + mao , (6.7) lo que muestra que la formulación de las ecuaciones del movimiento en un sistema fijo y otro móvil es distinta pues en el móvil a la aceleración relativa (o vector de las derivadas segundas de las componentes) debemos añadir las aceleraciones del origen, de arrastre y de coriolis. El concepto de sistema móvil, utilizado en el párrafo anterior, queda muy impreciso. Podemos precisarlo más atendiendo a la propia ecuación (6.7). Diremos que un sistema S es inercial si las ecuaciones del movimiento de un punto P en dicho sistema se pueden expresar como F = mẍ = mx00 , esto es, cuando las aceleraciones de arrastre, de coriolis y del origen son nulas. Esto ocurre únicamente cuando el origen tiene un movimiento rectilı́neo y uniforme (ao = 0) y cuando los ejes del sistema no rotan (! = 0), esto es, cuando el sistema está fijo o se traslada con un movimiento rectilı́neo y uniforme. De aquı́ en adelante supondremos la existencia de un sistema inercial S = {O, e1 , e2 , e3 } que llamaremos sistema espacial. En este sistema se tendrá x = P3 P3 P3 0 00 i=0 xi ei , ẋ = x = i=0 ẋi ei y ẍ = x = i=0 ẍi ei . Por tanto, las ecuaciones del movimiento vendrán dadas por F = mẍ. 6.4 (6.8) Movimiento de una partı́cula en su plano Hemos dicho anteriormente que el movimiento de la partı́cula tiene lugar en un plano, no necesariamente fijo, definido por el vector G. Con objeto de simplificar algunas de las propiedades del movimiento será conveniente definir nuevos sistemas de referencia, que pueden no ser inerciales, donde algunos parámetros dinámicos se formularán de forma mucho más sencilla. 102 Revisión de elementos de dinámica clásica Para ello pongamos en primer lugar G = G n, x = r u donde n, u representan las direcciones de los vectores G, x y G, r sus normas. Por ser n y u ortogonales podemos definir un nuevo vector v = n ⇥ u de forma que U = {O, u, v, n} sea un sistema de referencia ortonormal directo que llamaremos sistema orbital. Las direcciones definidas por u, v, n serán llamadas respectivamente dirección radial, dirección transversal y dirección normal, y el plano Oxy representa el plano instantáneo del movimiento. e3 n v u p2 v x X u p1 e2 O e1 ✓ p1 Figura 6.2: Sistema de referencia orbital. Con objeto de estudiar mejor el movimiento de una partı́cula en su plano es conveniente elegir un sistema de coordenadas polares, para lo cual, puesto que ya tenemos O como origen de coordenadas, basta definir una dirección constante en el plano, p1 , desde donde medir el ángulo ✓ de coordenadas polares (figura 6.2). Si llamamos p2 = n ⇥ p1 , podremos definir un sistema de referencia ortonormal {O, p1 , p2 , n}, tal que las direcciones p1 , p2 son constantes, esto es, ṗ1 = 0, ṗ2 = 0. Las expresiones de u, v en la base p1 , p2 , n serán: u = cos ✓ p1 + sen ✓ p2 , v sen ✓ p1 + cos ✓ p2 , = que derivadas conducen a las igualdades: u̇ = ✓˙ v, v̇ = ✓˙ u. (6.9) Teniendo en cuenta las relaciones anteriores y la expresión del vector de posición en la base orbital x = ru, se llega fácilmente, por derivación, a las expresiones: X a = = ẋ ẍ = = ṙ u + r✓˙ v, ˙ v, (r̈ r✓˙2 ) u + (r✓¨ + 2ṙ✓) (6.10) que expresan la velocidad y aceleración de P en el sistema orbital y define los con˙ ası́ como los de aceleración ceptos de velocidad radial ṙ, velocidad transversal r✓, 2 ˙ ¨ ˙ radial (r̈ r✓ ) y aceleración transversal (r✓ + 2ṙ✓). Sistemas dinámicos 103 El vector velocidad areolar se podrá expresar, en el sistema orbital, como VA= 6.5 1 2˙ r ✓ n. 2 (6.11) Sistemas dinámicos Supondremos un sistema dinámico formado por N puntos Pi , i = 1, . . . , N, de masas mi y cuya posición viene expresada en un sistema inercial por los vectores xi . Como sabemos la dinámica de este sistema de puntos viene descrita por el conjunto de ecuaciones resultante de la aplicación de la ecuación fundamental de Newton a cada una de las partı́culas Fi = dpi , dt i = 1, . . . , N, siendo pi = mi ẋi . (6.12) En general los puntos Pi no se mueven libremente sino que están sujetos a una serie de condiciones, o ligaduras, que no son sino relaciones funcionales entre los vectores de posición del tipo f (x1 , x2 , . . . , xN ; t) = 0. Ejemplos de ligaduras de este tipo son las relaciones entre los puntos de un sólido: (xi xj )2 = c2ij o el que una partı́cula que se mueve en una curva o superficie, etc. Normalmente nos referiremos a cada partı́cula por un vector xi , de tres coordenadas cartesianas, por lo que un sistema de N puntos viene representado por 3N coordenadas. Si el sistema tiene k ligaduras o ecuaciones de relación, podrán introducirse n = 3N k coordenadas independientes, q = (q1 , . . . , qn ), de forma que podamos expresar las posiciones de las partı́culas como xi = xi (q; t), i = 1, . . . , N. A este conjunto de coordenadas independientes les llamaremos coordenadas generalizadas, mientras que al espacio n-dimensional de las coordenadas libres le llamaremos espacio de configuración. Las derivadas de las coordenadas generalizadas q̇ = (q̇1 , . . . , q̇n ) son las velocidades generalizadas. Llamaremos número de grados de libertad al número n de coordenadas libres del sistema. Se llama energı́a cinética de un sistema dinámico a la función T = N X 1 i=0 2 mi ẋ2i . Para expresar la energı́a cinética en función de las coordenadas generalizadas tendremos en cuenta que xi = xi (q1 , . . . qn ), por tanto ẋi = @xi dq @x + = @q dt @t i (q, q̇, t), 104 Revisión de elementos de dinámica clásica y finalmente se tendrá T = T (q, q̇, t). Se llama energı́a potencial del sistema a una función escalar V cuyo gradiente coincide con la resultante F de las fuerzas que actúan sobre una partı́cula. ✓ ◆ @V @V F = rV = ,..., . @q1 @qn Cuando V existe sólo depende de q, no depende ni de q̇ ni de t. Por tanto V = V (q). 6.6 Ecuaciones de Lagrange y de Hamilton Llamaremos función lagrangiana de un sistema dinámico a la expresión L(q, q̇, t) = T (q, q̇, t) + V (q). (6.13) Las ecuaciones del movimiento de un sistema mecánico (6.12) pueden expresarse en términos de la función lagrangiana en la forma ✓ ◆ d @L @L = 0, i = 1, . . . , n, (6.14) dt @ q̇ i @q i o lo que es igual ⌘ d ⇣ rq̇ L rq L = 0. (6.15) dt Estas ecuaciones serán llamadas ecuaciones de Lagrange y su solución equivale a la solución de las ecuaciones de Newton del sistema. Definiremos los momentos (generalizados), p = (p1 , . . . , pn ), a partir de las igualdades @L pi = . (6.16) @ q̇i Estas funciones nos permiten expresar las velocidades generalizadas q̇i en la forma q̇i = q̇i (q, p, t). Al espacio 2n dimensional (q, p) le llamaremos espacio fásico (o espacio de las fases). Llamaremos función hamiltoniana, o también hamiltoniano H, a la transformada de Legendre de la función lagrangiana considerada como función de q̇, esto es H(q, p, t) = p · q̇(q, p, t) L(q, q̇(q, p, t), t). (6.17) El sistema de ecuaciones de Lagrange (6.14) es equivalente a las ecuaciones: q̇ = @H = rp H, @p ṗ = @H = @q rq H, (6.18) Transformaciones canónicas 105 que son llamadas ecuaciones de Hamilton del sistema. En ocasiones utilizaremos una notación más compacta en la que llamaremos x = (q, p) 2 IRn ⇥ IRn al vector de coordenadas y momentos (en este orden), de forma que el hamiltoniano se expresará como H(x, t) = H(q, p, t). (6.19) La evolución dinámica del sistema viene dada por las ecuaciones de Hamilton ẋ = J rx H, donde J es la matriz antisimétrica J = ✓ 0n In In 0n (6.20) ◆ , que verifica J 1 = J T = J , y donde 0n , In , representan, respectivamente, las matrices nula y unidad de orden n. 6.7 Transformaciones canónicas Sea la transformación del espacio fásico : IR2n ! IR2n : x = (q, p) ! y = (Q, P ), definida por las expresiones y = y(x, t), que supondremos de clase C (1) y tal que det 6= 0 en el dominio (x, t) que se considere, siendo la matriz jacobiana 0 1 @y1 @y1 . . . ✓ ◆ B @x @x2n C 1 @yi B C ... ... = y x = rx y = = B ... (6.21) C. @xj @ @y @y2n A 2n ... @x1 @x2n Una transformación que satisface las condiciones anteriores se dice transformación canónica, si y solo si, existe una constante µ tal que se satisface la relación3 J T = µJ . La constante µ es llamada multiplicador de la transformación. En particular, si µ = 1 la transformación se llama transformación completamente canónica (t.c.c). Propiedad.- Una transformación es canónica, si y solo si se tiene T J = µJ . Propiedad.- El conjunto de las transformaciones canónicas forma grupo con respecto a la composición de transformaciones. Las transformaciones completamente canónicas forman un subgrupo del grupo anterior. Hay que recordar aquı́ que la composición de dos transformaciones canónicas es otra transformación canónica de multiplicador el producto de los multiplicadores. 3 Una matriz A que satisfaga la condición AJ AT = J será llamada matriz simpléctica. 106 Revisión de elementos de dinámica clásica Además, si 1 , 2 son las matrices jacobianas correspondientes a dos transformaciones canónicas, la matriz jacobiana de la composición es el producto 1 2 . Por otro lado, la transformación identidad (cuya matriz jacobiana es I2n ) T es una transformación canónica de multiplicador 1, pues I2n J I2n = J . Esta transformación representa el elemento neutro del grupo de transformaciones. Por último, la inversa de una transformación canónica de matriz jacobiana 1 y multiplicador µ, es otra transformación canónica de matriz jacobiana y multiplicador 1/µ. La propiedad anterior nos asegura que para cada t.c.c : y = y(x, t) existe una transformación inversa ' : x = x(y, t). Esta transformación puede ser aplicada a la función F (x, t), definida en el espacio fásico, con lo que obtendremos la función transformada '⇤ F (y, t) = F (x(y, t), t). Propiedad.- Una transformación y = y(x, t) es canónica si y solo si existe una función W, y una función resto, R = R(t), tal que d W = 2Rdt µx·J dx+y·J dy, siendo µ constante. Propiedad.- Una transformación y = y(x) es completamente canónica si y solo si existe una función W tal que se verifica una cualquiera de las relaciones siguientes: dW dW dW dW = = = = q · d p + P · d Q, q · dp Q · dP, p · dq + Q · dP, p · d q P · d Q. (6.22) Propiedad.- Sean S (1) (P , q, t), S (2) (p, Q, t), S (3) (p, P , t), S (4) (p, q, t) funciones (1) (2) (3) (4) de clase C (2) tales que det(S ) 6= 0, det(S ) 6= 0, det(S ) 6= 0, det(S ) 6= Pq pQ pP qQ 0, entonces las ecuaciones: p q = = q p = = rq S (1) , rp S (2) , rP S (3) , rq S (4) , Q P = = Q P = = rP S (1) , rQ S (2) , rP S (3) , rQ S (4) , R(1) R(2) R(3) R(4) = = = = (1) St , (2) St , (3) St , (4) St , (6.23) definen transformaciones completamente canónicas de función resto R(i) . A las funciones S (i) se les llama función generatriz (o generador) de la transformación, y a las transformaciones generadas se les llama transformaciones de contacto. Ecuación de Hamilton–Jacobi y ecuación de Delaunay 6.8 107 Ecuación de Hamilton–Jacobi y ecuación de Delaunay Propiedad.- Si existe una función S(P , q, t) generatriz, del tipo S (1) , de una transformación completamente canónica que satisface la ecuación de Hamilton– Jacobi H(q, rq S, t) + St = 0, (6.24) entonces las nuevas variables y momentos (Q, P ) son constantes (integrales) del sistema dinámico de hamiltoniano H. Si el hamiltoniano H es conservativo se tendrá H(q, rq S) = St = P1 , donde P1 es una constante que suele tomarse como nuevo primer momento. De esta forma S = P1 t + W(P , q), y la ecuación de Hamilton–Jacobi se transforma en H(q, rq W) = P1 . (6.25) Encontrar una función W solución de la ecuación anterior equivale a encontrar una transformación canónica que transforma el hamiltoniano en K(Q, P ) = P1 . Poincaré generaliza este resultado y propone buscar un generador S(P , q) que sea solución de la ecuación en derivadas parciales H(q, rq S) = K(rP S, P ), (6.26) de manera que la transformación completamente canónica generada por ella transforme el hamiltoniano en K(y, Y ). A dicha ecuación le llamó ecuación de Delaunay por su similitud con la usada por éste para la teorı́a de la Luna. 108 Revisión de elementos de dinámica clásica Capı́tulo 7 Movimiento kepleriano 7.1 Introducción El movimiento de los planetas es uno de los problemas que más interés ha suscitado a lo largo de la historia de la ciencia. La explicación de este movimiento favoreció el desarrollo de numerosos métodos matemáticos y fı́sicos e incluso la creación de nuevas disciplinas cientı́ficas con las que abordar el aparentemente simple pero sutilmente complejo problema. Aunque a este tema han dedicado sus esfuerzos muchos de los mejores cientı́ficos, tanto antes como después de Kepler y Newton, a ellos dos se deben las bases sobre las que se sustentan, tanto la Mecánica Celeste, como la Astrodinámica y que serán descritas a lo largo de este capı́tulo. 7.2 Leyes de Kepler El paso fundamental en la explicación del movimiento de los planetas lo dio Johannes Kepler (1571-1630), quien a partir de las excelentes observaciones llevadas a cabo por su maestro, el astrónomo danés Tycho Brahe (1546-1601), dedujo las tres leyes llamadas leyes de Kepler 1 , que pueden enunciarse de la siguiente manera: 1. Los planetas se mueven en órbitas planas alrededor del Sol, siendo las áreas descritas proporcionales a los tiempos empleados en describirlas (figura 7.1). 1 Las dos primeras leyes las publicó en 1609 en su obra Astronomia Nova, mientras que la tercera fue posterior (1619) y apareció en Harmonicie Mundi. Libri V. 110 Movimiento kepleriano 2. Las órbitas descritas por los planetas son elipses, de las cuales, el Sol ocupa un foco. 3. Los cubos de los semiejes mayores de las órbitas planetarias son proporcionales a los cuadrados de los tiempos empleados en recorrerlas. Lo que sigue de capı́tulo lo dedicaremos a desarrollar las herramientas necesarias para comprender las leyes de Kepler y, a partir de ellas, desvelar el camino seguido por Newton para enunciar la ley de gravitación universal que es el fundamento de la Mecánica Celeste y de la Astrodinámica. 7.3 Figura 7.1: Ley de las áreas. Propiedades de las cónicas La segunda ley de Kepler establece la elipse como la figura del movimiento orbital de los planetas. Las consecuencias de la ley de Newton, que se verán después, añaden la parábola y la hipérbola como posible movimiento orbital. Estas tres figuras geométricas tienen en común la propiedad que las define como el lugar geométrico de los puntos tales que la razón de sus distancias a un punto fijo, foco, y a una recta también fija, directriz, es una constante e > 0, que llamaremos excentricidad. Estas figuras son llamadas cónicas y sus propiedades determinan muchas de las propiedades del movimiento orbital por lo que son analizadas en este apartado. De acuerdo con la anterior definición, y la figura 7.2 se tendrá FP r =e= , PQ p/e r cos ✓ (7.1) P Q r ✓ D donde hemos introducido el parámeF (foco) eje directriz tro p > 0, que es igual a h e, siendo h la distancia entre el foco y la diFigura 7.2: Eje y directriz de una cónica. rectriz. A la recta perpendicular a la directriz que pasa por el foco se le llamará eje de la cónica. De acuerdo con (7.1), la ecuación de la cónica en coordenadas polares, con origen en F y cuyo eje es el de la cónica, tendrá la forma: r= p . 1 + e cos ✓ (7.2) Propiedades de las cónicas 111 La constante e determina la forma de la cónica, mientras que p nos da la escala de longitud. Al parámetro p se la suele llamar semilado recto 2 , pues para ✓ = ⇡/2, r = p, luego representa la mitad de la cuerda perpendicular al eje que pasa por el foco. Nótese que el caso e = 0, que se obtiene como caso lı́mite cuando la directriz se encuentra a una distancia infinita, corresponde a la curva r = p, esto es, a una circunferencia de radio p. La ecuación (7.2) puede ser escrita como p = 1 + e cos ✓. r (7.3) Los valores ✓ = 0, ✓ = ⇡ corresponden, respectivamente, al máximo y mı́nimo de p/r, esto es, al mı́nimo y máximo de r. Sin embargo, cuando e 1, el valor ✓ = ⇡ carece de sentido pues por ser r una distancia, p/r debe ser estrictamente positivo. De acuerdo con esta propiedad distinguiremos tres casos según los valores de e. 7.3.1 Elipses: 0 e < 1 Llamaremos elipse a un cónica cuya excentricidad esté entre cero y uno. En este caso tendremos un valor mı́nimo y máximo de r en dos puntos, que llamaremos respectivamente pericentro y apocentro. Las distancias al foco en estos puntos vienen dadas por: p p rp = , ra = . (7.4) 1+e 1 e Introduzcamos tres nuevas constantes por medio de las relaciones: p p pe a= , c = ae = , b = a 1 e2 , (7.5) 2 2 1 e 1 e y definamos un sistema de referencia plano en el que el origen O es un punto del eje de la cónica a una distancia c del foco en la dirección opuesta a la directriz, y el eje Ox es el eje de la cónica, mientras que el eje Oy es perpendicular a Ox. En este sistema de referencia las coordenadas cartesianas de un punto de la elipse vendrán dadas por x = y = c + r cos ✓ = r sen ✓ = c+ p cos ✓ , 1 + e cos ✓ p sen ✓ . 1 + e cos ✓ (7.6) Puede comprobarse fácilmente que un punto P de coordenadas (x, y) dadas por las expresiones anteriores verifica la ecuación x2 y2 + 2 = 1. 2 a b 2 Semilatus rectum. (7.7) 112 Movimiento kepleriano Las distancias a y b son llamadas, respectivamente, semieje mayor y semieje menor de la elipse y su significado puede verse en la figura 7.3. F0 7.3.2 = = c F rp a De acuerdo con la primera de las expresiones (7.5) podemos expresar las distancias (7.4) al pericentro y apocentro como: rp ra a b Figura 7.3: Elipse. a (1 e), a (1 + e). (7.8) Parábolas: e = 1 Cuando la excentricidad vale uno, la cónica es llamada parábola. En este caso únicamente hay pericentro, por lo que tenemos una curva abierta. La distancia mı́nima al foco es ahora rp = p/2. Si elegimos un sistema da referencia plano, con origen en el periastro y eje Ox el de la cónica con coordenadas positivas en la dirección opuesta a la directriz, las coordenadas cartesianas de un punto de la parábola serán x = y = p 2 p cos ✓ , 1 + cos ✓ p sen ✓ , 1 + cos ✓ (7.9) de donde fácilmente obtenemos como ecuación de la parábola la expresión y 2 = 2px, (7.10) cuya gráfica puede verse en la figura 7.4(a). 7.3.3 Hipérbolas: e > 1 Las cónicas con excentricidad mayor que uno, llamadas hipérbolas, únicamente poseen pericentro por lo que, como las parábolas, son curvas abiertas. Si introducimos las cantidades: a= p e2 1 , c = ae, b=a p e2 1, (7.11) y definimos un sistema de referencia plano con origen en un punto del eje de la cónica a una distancia c del foco en la dirección de la directriz y eje Ox el de la Ley de gravitación de Newton 113 cónica, las coordenadas cartesianas de un punto p de la hipérbola serán x = y = p cos ✓ , 1 + e cos ✓ p sen ✓ . 1 + e cos ✓ ae (7.12) La ecuación de la hipérbola será por tanto x2 a2 y2 = 1, b2 (7.13) que de acuerdo con la figura 7.4(b) tiene dos ramas simétricas. El valor de la distancia al pericentro será en este caso rp = a (e 1). (7.14) y p 2 p 2 x F rp b c O a c (a) Parábola (b) Hipérbola Figura 7.4: Cónicas abiertas 7.4 Ley de gravitación de Newton Las leyes de Kepler suponen el penúltimo eslabón en la carrera por comprender y explicar el movimiento de los planetas. Éstas describen con exactitud el movimiento de los mismos pero, sin embargo, no dan una explicación fı́sica de las causas del movimiento. El último paso lo da Isaac Newton (1642–1727) quien, a partir de estas leyes y tras poner las bases de la Mecánica y del Cálculo Diferencial, enuncia la ley de gravitación universal que ha seguido vigente hasta la 114 Movimiento kepleriano introducción de la teorı́a de la relatividad, pero que todavı́a sigue dando respuesta a la mayor parte de las cuestiones que plantea el movimiento orbital. En lugar de limitarnos a enunciar la ley de gravitación deduciremos ésta a partir de las leyes de Kepler. Para ello formularemos las leyes de Kepler desde un punto de vista más matemático. De acuerdo con la segunda ley, un planeta se mueve en una órbita elı́ptica, que expresada en coordenadas polares es r= a(1 e2 ) , 1 + e cos ✓ (7.15) donde a y e son dos constantes que representan el semieje y la excentricidad de la elipse, mientras que r depende de t a través del ángulo ✓. La tercera ley de Kepler nos indica que la razón a3 /P 2 es constante para todos los planetas. Aquı́ hemos llamado P al periodo orbital del planeta. Si el movimiento es plano, el vector posición x lo podemos descomponer en dos direcciones, la radial (u = x/r) y la transversal (v), perpendicular a la radial, de modo que los vectores posición, velocidad y aceleración son: x = u r, ˙ ẋ = u ṙ + v r✓, 2 ˙ ¨ ẍ = u (r̈ r✓ ) + v (2ṙ✓˙ + r✓). (7.16) La velocidad areolar (área barrida por el radio vector por unidad de tiempo) es ˙ r2 ✓/2; pues bien, la primera ley nos dice que esta expresión es una constante, que se podrá obtener dividiendo el valor de un área barrida (que sepamos calcular) por el tiempo invertido en describirla. En un periodo P , el área barrida será precisamente el área de la elipse (⇡ab), ası́ pues, p 1 2 ˙ ⇡ab ⇡ a2 1 e 2 r ✓= = , (7.17) 2 P P pero esta expresión es una cantidad constante, por lo que derivando, se tiene que ˙ d(r2 ✓) ¨ = 0, = r(2ṙ✓˙ + r✓) dt o lo que es lo mismo, la aceleración transversal (7.16) es nula, y la aceleración solamente tiene componente radial, luego la fuerza que produce el movimiento debe ser radial (recordemos que la segunda ley de la Mecánica de Newton establece que la fuerza = masa ⇥ aceleración). En consecuencia, la fuerza que ejerce el Sol sobre un planeta de masa m será x F = m(r̈ r✓˙2 ) . r Derivando la ecuación de la elipse (7.15) y teniendo en cuenta la expresión (7.17) de la velocidad areolar obtenida a partir de la tercera ley de Kepler, llegamos a F = m 4⇡ 2 a3 x= P 2 r3 m x, r3 Problema de dos cuerpos 115 donde hemos llamado a la constante derivada de la tercera ley de Kepler. Finalmente, por el principio de acción y reacción de Newton, la fuerza ejercida por el Sol sobre el planeta debe ser igual en norma, pero de sentido contrario, a la que ejerce el planeta sobre el Sol, luego de modo análogo se tendrá m =m , siendo m la masa del Sol y la constante para la órbita del Sol respecto del planeta. De acuerdo con esa igualdad, podremos poner m = m = G, donde hemos introducido una nueva constante G que llamaremos constante de gravitación universal. Esto conduce finalmente a la expresión final de la fuerza de atracción que el Sol ejerce sobre el planeta F = G mm x , r2 r (7.18) que nos permite enunciar la Ley de Newton, que dice: la fuerza que ejerce el Sol sobre un planeta es atractiva, lleva la dirección de ambos cuerpos y es proporcional al producto de las masas de éstos, e inversamente proporcional al cuadrado de su distancia mutua. 7.5 Problema de dos cuerpos La ley de Newton, que ha sido enunciada en el apartado anterior para dos planetas, puede extenderse a dos masas puntuales cualesquiera siendo la base del problema fundamental de la Astrodinámica o Mecánica Celeste, que será llamado problema de dos cuerpos, y que consiste en el estudio del movimiento de dos masas puntuales P1 , P2 , de masas respectivas m1 , m2 , que interaccionan gravitacionalmente bajo la ley de atracción universal enunciada por Newton. P2 x r2 r1 P1 O Figura 7.5: Problema de dos cuerpos. Para formular este problema llamaremos r 1 , r 2 respectivamente, a los vectores de posición OP1 , OP2 , y x al vector de posición relativa P1 P2 y supondremos que están referidos a un sistema de referencia ortogonal, directo e inercial. En virtud de la segunda ley de la mecánica de Newton (fuerza = masa ⇥ aceleración), se tiene que: m1 r̈ 1 = m2 r̈ 2 = m1 m2 x , r2 r m1 m2 x G , r2 r G (7.19) 116 Movimiento kepleriano donde r = k x k es la distancia mutua entre P1 y P2 , y G la constante de gravitación universal. El sistema (7.19) constituye un sistema diferencial de orden doce, por lo que la integración del problema quedará resuelta si encontramos doce integrales independientes del mismo. El problema queda fácilmente reducido a otro de orden seis si tenemos en cuenta que sumando las ecuaciones (7.19) se tiene m1 r̈ 1 + m2 r̈ 2 = 0, de donde, de manera inmediata obtenemos m1 r 1 + m2 r 2 = m r c = At + B, (7.20) donde r c representa la posición del centro de masas del sistema y m = m1 + m2 . Los vectores constantes A, B constituyen las seis primeras integrales del problema. La expresión (7.20), también llamada integral del centro de masas, nos indica que el centro de masas de un sistema formado por dos cuerpos que se atraen según la ley de gravitación de Newton, se mueve con un movimiento rectilı́neo y uniforme. 7.6 Movimiento relativo o kepleriano Las integrales del centro de masas pueden aprovecharse para formular las ecuaciones (7.19) de manera más simple. Para ello, tengamos en cuenta las relaciones m rc x = = m2 r 2 r2 + m1 r 1 , r1 , (7.21) que pueden invertirse en la forma: r1 = r2 = m2 x, m m1 rc + x. m rc (7.22) Las anteriores relaciones indican que una vez conocida la evolución temporal del vector del centro de masas r c y la del vector de posición relativa x conoceremos también la de r 1 y r 2 , por lo que el problema queda resuelto. Las seis integrales (7.20) determinan el movimiento de r c , por lo que basta encontrar el movimiento relativo de P2 respecto a P1 para que el problema quede completamente resuelto. En efecto, derivando dos veces la segunda de las ecuaciones (7.21) con respecto al tiempo y sustituyendo el valor de las segundas derivadas dado en (7.19), llegamos a las ecuaciones del movimiento relativo que pueden ponerse como: ẍ = µ x, r3 (7.23) Movimiento relativo o kepleriano 117 donde r = k x k y µ = G m = G(m1 + m2 ), siendo m la suma de las masas de P1 y P2 . La ecuación (7.23) rige el movimiento relativo de P2 en torno a P1 y es, en realidad, la ecuación que gobierna toda la Astrodinámica, pues cuando nos referimos al movimiento orbital, estamos siempre hablando del movimiento relativo, bien en torno al Sol, como en el caso de los planetas, bien en torno a la Tierra, en el caso de los satélites artificiales. Al modelo planteado por el sistema de ecuaciones diferenciales (7.23) le llamaremos problema kepleriano y al movimiento derivado de la solución de dichas ecuaciones le llamaremos movimiento kepleriano. Además, en este caso diremos que P2 está en órbita kepleriana alrededor de P1 . Aunque el problema de dos cuerpos ha sido formulado en un sistema P2 de referencia inercial, el problema kepleriano se formula en un sistema con centro en P1 y ejes paralelos a los del x sistema inercial (figura 7.6). Este sistema no rota, pero su origen se mueve con el movimiento de P1 que no P1 será en general rectilı́neo y uniforme sino que posee una aceleración y por tanto no será inercial. Esto no es problema pues las ecuaciones (7.23) no son una aplicación directa de la ley Figura 7.6: Movimiento relativo de P2 en fundamental de Newton, que debe ser torno a P1 . formulada obligatoriamente en un sistema inercial, sino que se trata de un modelo matemático obtenido por reducción del problema de dos cuerpos aplicando la integral del centro de masas. La aplicación práctica de las ecuaciones (7.23) al movimiento de un satélite artificial se formula en un sistema con centro en el centro de masas de la Tierra y ejes fijos, un sistemas de este tipo es llamado sistema inercial con centro en la Tierra, ECI, que aunque no es inercial cumple la misma función que uno inercial para este problema. Los sistemas SG (GCRS) y E o constituyen los dos ejemplos de sistemas de este tipo que usaremos para formular el movimiento de los satélites artificiales. Además de la ecuación de orden dos (7.23), las ecuaciones del movimiento kepleriano pueden ponerse como un sistema de ecuaciones de orden uno en la forma: ẋ = X, (7.24) µ Ẋ = x, r3 donde X es el vector velocidad cuya norma será llamada v. El problema kepleriano puede ser también expresado en forma hamiltoniana. Para ello supondremos un sistema dinámico cuyo hamiltoniano, que llamaremos 118 Movimiento kepleriano hamiltoniano kepleriano, tendrá la forma Hk (x, X) = 1 X ·X 2 µ , r (7.25) donde x son las coordenadas y X los momentos y hemos llamado energı́a cinética del movimiento relativo al primer sumando y energı́a potencial del movimiento relativo al segundo. Las ecuaciones de Hamilton aplicadas al hamiltoniano Hk son: ẋ = rX H k = X, Ẋ = rx H k = µ x, r3 (7.26) y por tanto son idénticas a las ecuaciones (7.24) del movimiento kepleriano, por ello, podemos concluir que éste está representado por un sistema dinámico de hamiltoniano Hk . 7.7 Solución explı́cita del problema kepleriano: funciones f y g de Lagrange La teorı́a de ecuaciones diferenciales ordinarias nos asegura que las ecuaciones (7.24) tienen una única solución para un conjunto de condiciones iniciales dado por el vector de posición y velocidad x0 , X 0 en un instante t0 . Si encontramos la expresión de la posición y velocidad para un instante dado t en términos de las condiciones iniciales x = x(t, x0 , X 0 ), X = X(t, x0 , X 0 ) podemos dar el problema por integrado. Para encontrar la solución anterior excluiremos el caso en que xo y X 0 sean colineales, que como veremos en el capı́tulo siguiente corresponde a una solución particular del problema: las órbitas rectilı́neas. Sabiendo de antemano que las soluciones del problema estarán en un plano fijo y que xo y X 0 son dos vectores linealmente independientes en dicho plano y, por tanto, forman una base del mismo, entonces existirán dos escalares f, g, dependientes del instante t y del instante t0 , tales que se verifica x = f (t; t0 ) x0 + g(t; t0 ) X 0 . (7.27) Derivando esta expresión se tendrá también que X= @f (t; t0 ) @g(t; t0 ) x0 + X 0. @t @t (7.28) Las funciones f y g de Lagrange, también llamadas coeficientes de transición, no constituyen una forma eficiente de calcular las posiciones y velocidades de un cuerpo en órbita pues, como veremos ahora, sus expresiones explı́citas en función Funciones f y g de Lagrange 119 del tiempo no pueden ser expresadas en forma cerrada, esto es, sin recurrir a desarrollos en series de potencias del tiempo. Dichos desarrollos deben ser truncados y por tanto no producen una buena aproximación a la solución. Además dichos desarrollos son válidos únicamente en un entorno pequeño de t0 . A pesar de lo dicho estudiaremos aquı́ estas funciones pues su significado es muy útil para comprender algunas propiedades de este tipo de movimiento y además son la base de algunos métodos de determinación de órbitas a partir de datos de observación, aunque éstos no serán tratados en este libro. Para ello, veremos a continuación algunas propiedades de dichas funciones. Propiedad.- Las funciones f (t; t0 ), g(t; t0 ) son soluciones de la ecuación diferencial ¨+ µ = 0, (7.29) r(t) de forma que f es la solución particular de (7.29) determinada unı́vocamente por las condiciones iniciales: f (t0 , t0 ) = 1, @f (t0 ; t0 ) = 0, @t (7.30) mientras que g es la solución particular de (7.29) determinada unı́vocamente por las condiciones iniciales: g(t0 , t0 ) = 0, @g(t0 ; t0 ) = 1. @t (7.31) Para demostrar ésto basta tener en cuenta la ecuación fundamental del movimiento orbital µ Ẋ = x, r3 donde sustituyendo las igualdades (7.27) y (7.28) obtenemos 2 2 @ f (t; t0 ) µ @ g(t; t0 ) µ + f (t; t ) x + + 3 g(t; t0 ) X 0 = 0. 0 0 @t2 r3 @t2 r La independencia lineal de x0 y X 0 nos asegura que se verificará: @ 2 f (t; t0 ) µ + 3 f (t; t0 ) @t2 r = 0, @ 2 g(t; t0 ) µ + 3 g(t; t0 ) @t2 r = 0, por lo que f y g verifican (7.29). Se completa la demostración observando que las condiciones iniciales de f y g se corresponden con las obtenidas particularizando en t = t0 las igualdades (7.27) y (7.28). 120 Movimiento kepleriano Para obtener una expresión explı́cita de las funciones f y g en función de t desarrollaremos estas funciones en serie de potencias de t. Para la obtención de dichas series usaremos un procedimiento recursivo que se adapta muy bien a su implementación en un ordenador mediante programas de manipulación algebraica y simbólica. La ecuación (7.29) puede ponerse como ¨= R , donde hemos llamado µ . r3 La función R es asimismo solución de la ecuación diferencial R= Ṙ = (7.32) 3R S, que se obtiene sin más que derivar (7.32) y llamar S a la función ṙ S= , r (7.33) que derivada conduce a la expresión ṙ2 rr̈ Ṡ = r2 . Por otro lado, considerando las constantes3 h = v 2 /2 relación v 2 = ṙ2 + r2 ✓˙2 , llegamos a las expresiones G2 , r2 ṙ2 = v 2 v 2 = 2h + ˙ y la µ/r y G = r2 ✓, 2µ , r que derivadas permiten poner r̈ G2 = 4 r r µ , r3 y finalmente Ṡ = G2 r4 R S2 = v2 ṙ2 r2 R S= v2 r2 R 2S, expresión que puede ponerse como Ṡ = W donde hemos llamado W = R 2S, v2 X2 = . r2 r2 (7.34) 3 El significado de estas expresiones y la demostración de que son constantes aparecerá en el apartado 8.2 del próximo capı́tulo. Funciones f y g de Lagrange 121 Por último, derivando W se tiene Ẇ = = 2(X · Ẋ)r2 v 2 rṙ r4 µ ṙ v 2 ṙ 2 3 2 3 r r r µ x·X r3 r2 = 2 = 2S(R + W ). 2 v 2 ṙ r3 El cálculo de las funciones f y g está basado en la resolución del sistema de ecuaciones diferenciales: ¨ = R , Ṙ = 3RS, Ṡ = Ẇ = W R 2S, (7.35) 2S(R + W ), cuya solución será expresada por medio de series de potencias en la forma: f = g = R = S = W = X fi (t t0 ) i , gi (t t0 ) i , i 0 X Ri (t t0 ) i , Si (t t0 ) i , i 0 X Wi (t i 0 X i 0 X (7.36) t0 ) i , i 0 con las condiciones iniciales siguientes: f0 = 1 , f1 = 0, g0 = 0 , g1 = 1, R0 = S0 = W0 = µ , r03 x0 · X 0 , r02 X 20 , r02 (7.37) Sustituyendo (7.36) en (7.35), e igualando término a término se llega a las 122 Movimiento kepleriano relaciones: (n + 1)(n + 2)fn+2 (n + 1)(n + 2)gn+2 (n + 1)Rn+1 n X = i=0 n X = Ri f n i , Ri g n i , i=0 n X = 3 Ri Sn i , i=0 (n + 1)Sn+1 (n + 1)Wn+1 = Wn = 2 Rn n X 2 (7.38) n X Si Sn i , i=0 Si (Rn i + Wn i ), i=0 donde se ha tenido en cuenta la propiedad X X X X ( am xm )( bn x n ) = ( ai bj i )xj . m 0 n 0 j 0 0ij Si en (7.38) hacemos n = 0 obtendremos 2f2 = R0 f 0 = R0 , 2g2 = f2 = R0 , 2 g2 = 0. y por tanto R0 g0 = 0, Además se tendrá: R1 = S1 = W1 = 3R0 S0 , W0 R0 2S02 , 2S0 (R0 + W0 ), lo que permitirá pasar a n = 1 y obtener 6f3 = R0 f 1 R1 f 0 , 6g3 = R0 g 1 R1 g 0 , de donde R 0 S0 R0 , g3 = . 2 6 De esta forma, por iteración podemos obtener cualquier fn , gn en función de f0 , f1 , g0 , g1 , R0 , S0 , W0 . Hasta orden tres se tendrá: f3 = f (t; t0 ) = 1 1 R0 (t 2 g(t; t0 ) = (t t0 ) 1 t0 )2 + R0 S0 (t 2 1 R0 (t 6 t0 ) 3 + . . . t0 ) 3 + . . . (7.39) Capı́tulo 8 Integración del problema kepleriano 8.1 Modelo orbital kepleriano P x X Llamaremos problema kepleriano al estudio del movimiento de una masa puntual P , que llamaremos orbitador 1 , relativo a un cuerpo central 2 O (figura 8.1) regido por el sistema de ecuaciones diferenciales O ẋ = X, Ẋ = µ x, r3 (8.1) donde x y X son los vectores de posición y velocidad de P expresados en un sistema de referencia inercial centrado en O, que llamaremos sistema Figura 8.1: Movimiento kepleriano. espacial, r = k x k es la distancia de P a O y v = k X k es la norma del vector velocidad. En el capı́tulo anterior hemos introducido el parámetro µ = Gm, siendo m la suma de las masas de P y O. Mientras que G se considera una constante universal, no lo será µ, pues depende de las masas de los dos cuerpos. Sin embargo, puesto 1 Satélite, 2 Sol, sonda, planeta, cometa, asteroide, etc. planeta, etc. 124 Integración del problema kepleriano que, fijado el problema, los dos cuerpos siempre serán los mismos y la masa será constante, de aquı́ en adelante utilizaremos el parámetro µ, en lugar de G, para caracterizar el tipo de órbita. Este parámetro adquiere particular importancia en el caso de órbitas de estrellas dobles donde, en general, las masas son desconocidas, y por lo tanto µ también lo es. En este capı́tulo describiremos el comportamiento del modelo orbital kepleriano, tanto desde el punto de vista geométrico como astronómico y astrodinámico. Dicha descripción debe reproducir y explicar las tres leyes de Kepler, pues este modelo proviene de dichas leyes. Para ello, buscaremos integrales (constantes) del problema con un significado cinemático y dinámico preciso. 8.2 Primeras integrales Llamaremos momento angular 3 de P al vector G = x ⇥ X. (8.2) Denotaremos con G a la norma del vector G y n a su dirección, de forma que G = G n. Propiedad.- El momento angular G, de una partı́cula que se mueve en un campo de atracción newtoniano de acuerdo con la ecuación (8.1), es constante. En efecto, derivando G tendremos µ (x ⇥ x) = 0, r3 Ġ = ẋ ⇥ X + x ⇥ Ẋ = X ⇥ X lo que demuestra la propiedad. El vector A=X ⇥G µ x, r (8.3) será llamado vector de Laplace 4 . Llamaremos A a la norma del vector de Laplace y a a su dirección, de forma que A = A a. Propiedad.- El vector de Laplace A, de una partı́cula que se mueve en un campo de atracción newtoniano de acuerdo con la ecuación (8.1), es constante. Para demostrarlo tengamos en cuenta, en primer lugar, que d(r 1 x) =r dt 3 Esta 1 X r 2 ṙx = r 3 (r2 X rṙx), definición no coincide con el concepto mecánico del momento angular de una partı́cula, pues no está multiplicado por la masa, sino que es un parámetro, sin significado fı́sico, definido en el problema kepleriano para simplificar su integración. Lo mismo ocurrirá con la energı́a h que se definirá más tarde. 4 Llamado a veces Laplace-Runge-Lenz. Primeras integrales 125 donde r2 = x · x, y por tanto r ṙ = x · X. Esto, junto con la propiedad (1.20), permite poner: d(r 1 x) 1 = 3 G ⇥ x. (8.4) dt r Derivando A tendremos Ȧ = Ẋ ⇥ G µ d(r 1 x) = dt µ x⇥G r3 µ G ⇥ x = 0, r3 lo que demuestra la propiedad. Las tres componentes del vector G y las tres de A constituyen seis integrales del sistema diferencial de orden seis5 (8.1). Si estas integrales fuesen independientes el problema estarı́a totalmente integrado, sin embargo, no lo son, como se demuestra en la siguiente propiedad. Propiedad.- Los vectores G y A no constituyen seis integrales independientes del sistema diferencial. En efecto, si G = 0, entonces A = µr 1 x, de donde A · A = µ2 r 2 x2 = µ2 , por lo tanto, las tres componentes de A poseen una relación de dependencia por ser su norma constante. Si G 6= 0 basta tener en cuenta que G · A = 0, lo que determina una dependencia entre las seis integrales. Otra importante constante, que constituirá una nueva integral aunque no independiente de las anteriores como veremos más adelante, es la constante definida por medio de la expresión 1 2 µ v , (8.5) 2 r que será llamada energı́a orbital. En la definición (8.5) llamaremos energı́a cinética T al término v 2 /2 y energı́a potencial V a µ/r. Realmente dichas expresiones no constituyen la energı́a cinética y potencial del problema de dos cuerpos, sino las de un modelo teórico que se comporte igual que el problema del movimiento relativo. Ésta es la razón por la que el valor constante de h no se deduce del teorema de conservación de la energı́a, sino que debe ser demostrado. h= En efecto ḣ = X · Ẋ + µ µ (x · X) = X · (Ẋ + 3 x) = 0. 3 r r La relación entre A, G y h puede verse en la siguiente propiedad. Propiedad.- Para una partı́cula sometida a un campo de atracción newtoniano, las constantes A, G y h verifican la relación A2 = 2hG2 + µ2 . 5 Seis ecuaciones de orden uno. (8.6) 126 Integración del problema kepleriano En efecto, teniendo en cuenta la definición de A y la relación dada en (1.19), se deduce que ✓ ◆ 2µ 2 2 A =A·A= v G2 + µ 2 , r lo que demuestra (8.6). 8.3 Deducción de la primera y segunda leyes de Kepler A falta de la última integral, que deduciremos en el apartado (8.5), el problema ha quedado cerrado desde el punto de vista mecánico. Sin embargo, esto no es ası́ si atendemos a su aspecto astrodinámico o de interpretación de los resultados. La ley de atracción de Newton se obtiene como consecuencia de las leyes de Kepler del movimiento de los planetas. Por ello, para completar el problema debemos obtener aquéllas a partir de las integrales obtenidas aquı́. Este proceso nos llevará a la obtención de las leyes de Kepler, ası́ como también a otras consecuencias interesantes del movimiento kepleriano. Atenderemos, en primer lugar, al valor del momento angular G que puede ser cero o distinto de cero. Propiedad.- El momento angular G = 0 si y solo si el movimiento tiene lugar en una lı́nea recta que pasa por el centro de atracción. du d(r 1 x) = = 0 lo dt dt que representa que el vector unitario en la dirección del orbitador P (radial) es una constante, o lo que es igual, que P se mueve en lı́nea recta. Si tenemos en cuenta la ecuación (8.4) observamos que Por otro lado, si la trayectoria es rectilı́nea, u = (r 1 x) es un vector constante, luego su derivada es cero, por tanto G⇥x es cero en cualquier instante. Puesto que x no puede ser idéntico al vector nulo en todo instante, necesariamente G debe ser paralelo a x, además G es perpendicular a x por definición, luego necesariamente G = 0. Propiedad.- El momento angular G 6= 0 si y solo si el movimiento no es rectilı́neo y tiene lugar en un plano fijo en el espacio, perpendicular a G y que pasa por el centro de atracción. Efectivamente, si G 6= 0, entonces G·x = 0 para cualquier x, luego la partı́cula siempre está en un plano perpendicular a G y que pasa por O. Por otro lado, si el movimiento tiene lugar en un plano y no es rectilı́neo x y X pertenecen a dicho plano y no son paralelos, luego G 6= 0. Esta última proposición demuestra que el movimiento es plano. Además, podemos observar que el vector G, de norma constante, representa el doble del vector Deducción de la primera y segunda leyes de Kepler 127 velocidad areolar, por lo que también verifica la ley de las áreas. Ası́ pues, queda comprobada la primera ley de Kepler y parte de la segunda (movimiento plano). Veamos ahora las propiedades que se derivan del vector de Laplace. Propiedad.- El vector de Laplace verifica las siguientes identidades: A·x = A⇥x = G2 µr, rṙG, A·X = A⇥X = µṙ, ⇣ v2 µ⌘ G, r (8.7) cuya demostración es inmediata a partir de la definición del vector A. En el caso de movimiento rectilı́neo G = 0 y por lo tanto A = µ u = µ(r 1 x), luego el vector de Laplace lleva la dirección del movimiento y además su norma es igual a µ. Por otro lado, si G 6= 0, la relación A·G = 0 indica que el vector A está siempre en el plano del movimiento. Tendremos dos casos según el valor de A. Propiedad.- Para cualquier valor de G 6= 0 el movimiento de la partı́cula tiene lugar en una cónica de excentricidad A/µ. En efecto, si A = 0, de acuerdo con la segunda relación en (8.7), ṙ = 0, luego r es constante, esto es, la órbita es circular. Además, de acuerdo con la primera de las expresiones (8.7), G2 µ r = 0, luego el radio será igual a G2 /µ. P x f O A Figura 8.2: Anomalı́a verdadera f . Si A 6= 0, llamaremos anomalı́a verdadera f 6 al ángulo entre el vector A y el vector de posición x, que vendrá dado por la expresión A · x = A r cos f. Combinando esta igualdad con la primera de las expresiones (8.7) podemos poner r= p , 1 + e cos f (8.8) donde hemos llamado: p= G2 , µ e= A . µ (8.9) La ecuación (8.8) representa una cónica de semilado recto p y excentricidad e, donde la anomalı́a verdadera corresponde al ángulo polar medido desde el eje definido por el vector de Laplace. A la dirección de A que, como vemos, juega un importante papel en la dinámica del problema de los dos cuerpos le llamaremos lı́nea de los ápsides y representa el 6 No confundir con el coeficiente de transición que se denotará siempre en la forma f (t, t0 ). 128 Integración del problema kepleriano eje de la cónica y por lo tanto la dirección donde se alcanza la mı́nima distancia, y la máxima si existe, entre el orbitador y el cuerpo central. A la posición de mı́nima distancia le llamaremos periastro, perigeo o perihelio si el foco es, respectivamente, un astro cualquiera, la Tierra o el Sol. Al punto de máxima distancia le llamaremos apoastro o bien apogeo o afelio. La última proposición demuestra la primera ley de Kepler del movimiento. Kepler habla de elipses puesto que sus leyes describen únicamente movimientos de planetas para los cuales no aparece ningún otro tipo de órbitas, sin embargo, la ley permite órbitas no cerradas (parábolas o hipérbolas). Nótese que si G = 0 la relación (8.6) coincide con la obtenida previamente, A = µ2 , mientras que para G 6= 0 se tendrá h= A2 µ 2 , 2G2 (8.10) que describe la energı́a como una función cuadrática de A. De acuerdo con esta relación podemos caracterizar el tipo de movimiento en función de la energı́a. En efecto, fijado G, h tiene un mı́nimo igual a µ2 /2G2 que se alcanza para órbitas circulares, esto es, para A = 0. Si la órbita es elı́ptica se tiene 0 < A < µ y por tanto h < 0. Para una órbita parabólica A = µ, luego h = 0. Por último, una órbita hiperbólica tiene h > 0 por ser A > µ. Por otro lado, teniendo en cuenta que para el movimiento elı́ptico se tiene a= p 1 e2 = G2 /µ µG2 = = 1 A2 /µ2 µ 2 A2 µ , 2h y para el hiperbólico a= p e2 1 = G2 /µ µG2 µ = = , 2 2 2 2 A /µ 1 A µ 2h encontramos la relación entre la energı́a y el semieje de la órbita. La definición de h, (8.5), combinada con su expresión en función del semieje de la órbita y de su excentricidad permite encontrar una expresión, muy útil, de la velocidad ✓ ◆ 2 1 e2 v2 = µ , (8.11) r p que particularizada para cada tipo de órbita puede verse, junto con otros parámetros, en la tabla (8.1). Tercera ley de Kepler: unidades lineal G=0 129 circular G>0 elı́ptica G>0 parabólica G>0 hiperbólica G>0 A=0 0<A<µ A=µ A>µ p=0 p=a>0 p = a(1 p>0 p = a(e2 e=1 e=0 0<e<1 e=1 e>1 h=0 h= h= v2 = µ2 <0 2G2 µ a e2 ) > 0 µ <0 2a ✓ ◆ 2 1 v2 = µ r a h= v2 = 2µ r 1) > 0 µ >0 2a ✓ ◆ 2 1 v2 = µ + r a Tabla 8.1: Parámetros del movimiento kepleriano. 8.4 Tercera ley de Kepler: unidades Por último comprobaremos la tercera ley de Kepler. Para ello, tendremos de nuevo en cuenta la relación p = G2 /µ. Por un lado recordemos que G es la norma del momento angular y, como se vio en el apartado 6.2, el doble de la velocidad areolar, lo que indica que G representa el doble del área barrida por unidad de tiempo. Si consideramos únicamente órbitas elı́pticas, que son las únicas para las que se puede aplicar esta ley, llamamos P al tiempo total invertido en recorrer toda la órbita o periodo de la órbita, y tenemos en cuenta que el área de una elipse es ⇡ab, tendremos G= 2⇡ab . P Por otro lado, puesto que para una elipse p = b2 /a y además µ = Gm se tendrá finalmente la relación a3 G m = µ = 4⇡ 2 2 , (8.12) P que constituye lo que, de aquı́ en adelante, denominaremos tercera ley de Kepler y que es válida solamente para el movimiento elı́ptico. La tercera ley, tal como la enunció Kepler, decı́a que la razón del cubo de los semiejes y los cuadrados de los periodos de las órbitas de los planetas era una constante. Si tenemos un planeta de masa m1 y periodo P1 y otro de masa m2 y periodo P2 , y el Sol tiene masa ms se tendrán las relaciones: G(ms + m1 ) = 4⇡ 2 a31 , P12 G(ms + m2 ) = 4⇡ 2 a32 , P22 130 Integración del problema kepleriano que divididas nos darán a31 a32 ms + m1 1 + m1 /ms : = = = P12 P22 ms + m2 1 + m2 /ms ⇡ 1, lo que nos lleva a la conclusión de que la tercera ley, tal como fue enunciada por Kepler, es falsa. Sin embargo, si tenemos en cuenta el pequeño valor de la masa de los planetas en relación con la del Sol, podemos aproximar mi /ms por cero, y por tanto puede considerarse como la unidad, lo que indica que para el grado de precisión de las observaciones de la época de Kepler la tercera ley podı́a considerarse como válida tal como él la enunció. La expresión (8.12) permite además analizar más a fondo el valor de la constante G. De hecho, G es una constante universal, pero no es adimensional, esto es, su valor numérico depende de las unidades de distancia, tiempo y masa con las que estemos trabajando. La ecuación dimensional se deduce de la expresión (8.12) y se puede poner como [G] = L3 T 2 M 1 , lo que permite su cálculo en cualquier sistema de unidades a partir de su valor fundamental establecido por la IAU que es igual a G = 6.672 ⇥ 10 11 m3 s 2 kg. En la práctica usaremos la constante µ = Gm en lugar de G pues, de este modo, se elimina la masa de la ecuación dimensional y su valor depende únicamente de las unidades de longitud y tiempo elegidas. Sin embargo, hay que considerar que µ ya no será una constante universal sino que depende del tipo de órbita y de las unidades de longitud y tiempo y, por tanto, no es igual para la órbita de un satélite artificial en torno a la Tierra7 µ = Gm = 0.00553033 r3 min 2 , que para la órbita de un planeta8 µ = Gm = 0.000295939 U.A.3 dias 2 . Es muy importante notar que una vez elegido µ, en un conjunto de unidades, el resto de variables dinámicas del problema deben ser representadas en esas mismas unidades. 8.5 Ley horaria del movimiento Las cinco integrales independientes obtenidas hasta aquı́ nos dan únicamente una visión geométrica global de la órbita, pues determinan la curva, o trayectoria, que recorre el orbitador, pero no determinan la posición del mismo en cada 7 Las unidades más adecuadas para órbitas terrestres son el radio ecuatorial r y el minuto. unidades más adecuadas para órbitas alrededor del Sol son la unidad astronómica (U.A.) que representa la distancia media de la Tierra al Sol y el dı́a medio. A veces se puede usar el año. 8 Las Ley horaria del movimiento 131 instante de tiempo. Para obtener esta posición será preciso determinar el valor de la distancia r en función del tiempo t o bien, de forma alternativa, el valor de la anomalı́a verdadera f en función de t. Para ello será necesario encontrar e integrar la relación diferencial de r o f con t obtenida a partir de la ley de las áreas que es, dentro de las leyes de Kepler, la que establece la dinámica de la partı́cula. Las fórmulas (6.10) permiten expresar los vectores de posición y velocidad en el plano orbital: x = ru, X = ṙu + rf˙v. Donde hemos tomado como eje Ox la dirección del vector de Laplace y por tanto el ángulo polar ✓ es ahora la anomalı́a verdadera f . De esta forma, si consideramos únicamente órbitas no colineales (G 6= 0), podremos poner G = x ⇥ X = r2 f˙n, luego p r2 f˙ = G = µ p . (8.13) Teniendo en cuenta el valor de la constante G, esta relación, llamada ley de las áreas, nos dará la clave para la descripción de la evolución temporal del movimiento. La posición de la partı́cula en cada instante viene dada por sus coordenadas polares r y f , luego conocida la variación de éstas con el tiempo, conoceremos la última integral y quedará resuelto el problema que nos ocupa. A partir de la relación r = p/(1 + e cos f ), dada en (8.8), puede obtenerse por simple derivación pe sen f f˙ e ṙ = = r2 f˙ sen f, (1 + e cos f )2 p y teniendo en cuenta (8.13) podemos poner ṙ = Ge sen f, p (8.14) que nos dará la variación horaria de r con respecto al tiempo en función de la anomalı́a verdadera f . Además, si podemos integrar (8.13), obtendremos la variación de f con el tiempo y por tanto la ley horaria del movimiento. 8.5.1 Formulación regularizada del movimiento kepleriano Para realizar esta integración de una manera más sencilla introduciremos un cambio de escala de tiempo, o cambio de variable, que regulariza la ecuación diferencial en r, esto es, la convierte en un sistema lineal de orden dos con coeficientes constantes. Para ello definiremos un nuevo tiempo s por medio de la ecuación de Sundman: r d s = d t. (8.15) 132 Integración del problema kepleriano Si tomamos como origen del nuevo tiempo el instante T de paso por el periastro, y elegimos s de forma que valga cero en el instante T , se tendrá la relación Z t d⌧ s(t) = , s(T ) = 0. (8.16) r(⌧ ) T El instante T corresponde al valor de f = 0, por lo que podremos poner p r(T ) = rp = , ṙ(T ) = 0. (8.17) 1+e Si denotamos con un punto la derivada respecto a t y con tilde la derivada respecto a s podremos poner: ds dt dt ds = ṡ = 0 t = = 1 , r(t) (8.18) r(s). De acuerdo con la primera de las expresiones (8.18) podemos decir que s es estrictamente creciente con t. Por otro lado, integrando la segunda podremos poner Z s (t T) = r(s)d s. (8.19) 0 En otras palabras, (8.16) tiene una única inversa dada por (8.19). La regla de la cadena permite calcular fácilmente la derivada respecto a s de un elemento cualquiera , que podrá ponerse como 0 = ˙ t0 = r ˙ , lo que permite expresar las ecuaciones del movimiento relativo (7.24) en la forma µ x0 = r X, X0 = x. (8.20) r2 Por otro lado, si recordamos la relación r ṙ = x · X, podremos poner r0 = r ṙ = x · X, lo que nos permite decir, por un lado, que r0 (s = 0) = 0, y por otro, derivando de nuevo µ r00 = x0 · X + x · X 0 = rX · X x · x = rv 2 µ. r2 Por último, sustituyendo el valor de v 2 por el que se deduce de (8.5) se llega fácilmente a la ecuación r00 2h r = µ, (8.21) que es una ecuación lineal de segundo orden de coeficientes constantes que nos servirá para encontrar la posición de la partı́cula en cualquier instante. Aunque puede encontrarse una solución de (8.21) válida para cualquier tipo de movimiento, buscaremos en primer lugar soluciones particulares que serán válidas, por separado, para cada tipo distinto de órbita. Ley horaria del movimiento 8.5.2 133 Caso parabólico En este caso h = 0 y por tanto la ecuación (8.21) se transforma en r00 = µ. De esta forma, una primera integración nos dará r0 = µs + C1 , donde C1 tomará el valor cero por ser r0 (s = 0) = 0. Por último r= µ 2 s + C2 , 2 de donde C2 = p/2 puesto que r(s = 0) = r(T ) = p/2. Por tanto, la solución podrá ponerse como 1 r = (µs2 + p). (8.22) 2 De acuerdo con esto, la cuadratura (8.19) puede ser fácilmente calculada obteniéndose µ 2(t T ) = s3 + ps, (8.23) 3 relación conocida en Mecánica Celeste como ecuación de Barker. En el caso parabólico se tiene e = 0 y por tanto r= p p f = (1 + tan2 ). 1 + cos f 2 2 Comparando esta expresión con (8.22) obtendremos tan2 f µs2 = . 2 p No existirá ambigüedad de signo al extraer la raı́z cuadrada si pensamos que s es positivo cuando t > T o, lo que es igual, cuando f es positivo. Por tanto, podemos poner r f µ tan = s, (8.24) 2 p y por último 2 r µ (t p3 T) = 1 f f tan3 + tan . 3 2 2 Para invertir esta relación basta definir dos ángulos f1 , f2 , tales que f 2 = 2 cot 2f1 = cot f1 tan3 f1 = tan tan f2 , 2 tan f1 , (8.25) 134 Integración del problema kepleriano y de esta forma tan3 f f2 = cot 2 2 tan f2 + 3(tan f 2 cot f ) = 2 cot f2 3 tan f , 2 luego finalmente se tendrá r µ 2 (t p3 T) = 2 cot f2 , 3 relación que permite obtener a partir de t, f2 y posteriormente f1 y f . 8.5.3 Caso elı́ptico En el caso elı́ptico ( 2h) > 0 y la solución de la ecuación (8.21) podrá ponerse como p r = a + C1 cos( 2hs + C2 ), (8.26) donde C1 , C2 son las constantes de integración, y a = µ/2h es el semieje mayor de la elipse. Derivando la expresión de r se tendrá p p r 0 = C1 2h sen( 2hs + C2 ). Sustituyendo los valores iniciales y teniendo en cuenta que, en este caso, la distancia en el periastro es rp = a(1 e) se obtendrán las relaciones: C1 cos C2 = a e, C1 sen C2 = 0, de donde se deduce que C1 = a e, C2 = 0 y por tanto p r = a(1 e cos[ 2hs]). (8.27) De acuerdo con esta relación la cuadratura (8.19) podrá ponerse como Z s i p p 1 1 hp (t T ) = (1 e cos[ 2hs]) d s = p 2hs e sen( 2hs) . a 2h 0 En la expresiónpanterior puede observarse la necesidad de introducir una nueva variable, E = 2hs, que será llamada anomalı́a excéntrica. De esta forma, la ecuación anterior se podrá poner como p 2h (t T ) = E e sen E. a Por otro lado, introduciendo una constante n > 0, por medio de la expresión µ = n2 a 3 , (8.28) y teniendo en cuenta la relación µ = ( 2h)a, podremos poner n(t T) = ` = E e sen E, (8.29) Ley horaria del movimiento 135 que será llamada ecuación de Kepler y donde hemos introducido la anomalı́a media ` = n(t T ). Si tenemos en cuenta la relación (8.28) y la comparamos con la tercera ley de Kepler del movimiento elı́ptico (8.12) podemos deducir que n= 2⇡ , P es decir, n representarı́a la velocidad angular si el movimiento fuese circular, con velocidad angular constante, por ello, llamaremos a n movimiento medio y en adelante podremos llamar tercera ley de Kepler tanto a (8.12) como a (8.28). La definición de anomalı́a excéntrica y la expresión (8.27) permiten expresar r en función de E en la forma r = a(1 e cos E). (8.30) Para establecer la relación entre la anomalı́a verdadera y la anomalı́a excéntrica, basta tener en mente las relaciones a(1 e2 ) = a(1 1 + e cos f r= e cos E), de donde, despejando cos f , se tiene cos f = cos E e , 1 e cos E (8.31) lo que permite poner f 2 f 2 cos2 2 2 sen2 = 1 cos f = = 1 + cos f = (1 + e)(1 cos E) 1 e cos E (1 e)(1 + cos E) 1 e cos E P0 P E f O Figura 8.3: Relación entre las anomalı́as verdadera y excéntrica = = 1+e E 2 sen2 , 1 e cos E 2 1 e E 2 cos2 , 1 e cos E 2 y dividiendo ambas igualdades se obtiene finalmente r f 1+e E tan = tan , (8.32) 2 1 e 2 que es la fórmula más frecuentemente empleada para relacionar las dos anomalı́as, pues es fácilmente invertible y porque el uso de la tangente del ángulo mitad nos asegura el cuadrante correcto en la obtención de la anomalı́a. 136 Integración del problema kepleriano Las relaciones entre estas anomalı́as permiten comprobar el significado geométrico de E que puede verse en la figura 8.3. En efecto, un punto P 0 en una circunferencia de radio a, cuya coordenada x coincida con la del astro P en su órbita, forma un ángulo E con el eje de la elipse, medido éste desde el centro de la elipse. Las distintas anomalı́as en un problema kepleriano elı́ptico representan variables angulares que recorren un arco igual a 2⇡ mientras t recorre todo un periodo P. Puede verse fácilmente que en el movimiento circular las tres anomalı́as coinciden. 8.5.4 Resolución de la ecuación de Kepler El cálculo de la anomalı́a media ` a partir de la excéntrica E es inmediato por aplicación directa de la ecuación de Kepler. Sin embargo, no lo es el caso inverso. No existe ninguna expresión algebraica cerrada que nos resuelva este problema, por lo que obtendremos de manera separada las dos aproximaciones posibles al mismo. Por un lado, la resolución numérica de la ecuación de Kepler, por otro, su resolución por medio de un desarrollo en serie. Por la simplicidad de la ecuación de Kepler, bastará en general, salvo para excentricidades muy grandes, utilizar el método de Newton–Raphson para el cálculo aproximado de raı́ces de una ecuación no lineal. Si queremos encontrar la solución de la ecuación (x) = 0 y x0 es un valor aproximado de dicha solución, el método de Newton–Raphson nos asegura que la sucesión de números (xn 1 ) xn = xn 1 , (8.33) 0 (x n 1) converge a la raiz de la ecuación (x) = 0. En nuestro caso, la ecuación es (E) = ` E + e sen E = 0. Para excentricidades pequeñas el valor de E debe ser próximo a `, por lo que en general será suficiente tomar E0 = `, o bien E0 = ` + e sen `, y construir la sucesión: ` (En 1 e sen En 1 ) En = En 1 + , (8.34) 1 e cos En 1 que converge al valor deseado. De acuerdo con la ecuación de Kepler, y en las condiciones del teorema de la función implı́cita, E puede ser vista como función de e y `, desarrollable en serie de potencias de e en la forma E(e, `) = X @j E @ej j 0 e=0 ej . j! Ley horaria del movimiento 137 Basta encontrar las derivadas de E respecto a la excentricidad y particularizar su valor para e = 0 para obtener los coeficientes de dicho desarrollo. De acuerdo con la ecuación de Kepler se tendrá E e sen E = ` =) (E)e=0 = `, y derivando sucesivamente la misma ecuación obtendremos @E @e sen E e cos E @E @E = 0 =) @e @e = sen `, e=0 para la derivada primera, @2E @e2 cos E @E @e cos E @E @E 2 + e sen E( ) @e @e @2E @e2 e cos E @2E = 0 =) @e2 = 2 sen ` cos ` = sen 2`, e=0 para la derivada segunda, etc. Finalmente obtenemos E = ` + e sen ` + e2 e3 sen 2` + (sen 3` 2 8 sen `) + . . . y reordenando términos, tomando hasta orden 5 en e, se obtiene E ` = e3 e5 + + 8 192 2 4 6 e e e ( + + + 2 6 32 3e3 27e5 ( + 8 128 e4 ( + 3 125e5 ( + 384 (e . . .) sen `+ . . .) sen 2`+ . . .) sen 3`+ . . .) sen 4`+ . . .) sen 5` + . . . Hay que hacer notar que la serie anterior no es absolutamente convergente, por lo que la reordenación de términos efectuada modifica el radio de convergencia, siéndolo únicamente para e < 0.6627. Además, la convergencia es muy lenta, por lo que tendrá muy poca aplicación práctica si los valores de la excentricidad no son muy pequeños. Aunque hemos obtenido únicamente la expresión de E como desarrollo en serie de potencias de e, de manera similar podemos obtener desarrollos de sen E y cos E y a partir de éstos podemos expresar cualquier función de la forma ⇣ r ⌘n ⇣ r ⌘n ⇣ r ⌘n , cos mf, sen mf, a a a 138 Integración del problema kepleriano para n, m enteros cualesquiera, dando lugar a los desarrollos de Hansen que permiten expresar explı́citamente cualquier variable del movimiento orbital elı́ptico como función de `, y por tanto de t. 8.5.5 Caso hiperbólico En este caso h > 0 y la solución de (8.21) se expresará como p r = a + C1 cosh( 2h s + C2 ), donde C1 , C2 son las constantes de integración y a = µ/2h el semieje mayor de la hipérbola. Derivando tenemos: p p r0 = 2hC1 senh( 2h s + C2 ), p r00 = 2hC1 cosh( 2h s + C2 ), de donde, sustituyendo los valores iniciales y teniendo en cuenta que la distancia en el periastro es ahora rp = a(e 1), se tendrán las relaciones: C1 cosh(C2 ) = a e, C1 senh(C2 ) = 0, de las cuales deducimos que C1 = a e, C2 = 0, y por último p r = a(e cosh[ 2h s] 1). (8.35) De acuerdo con esta relación, la cuadratura (8.19) podrá ponerse como Z s p p p 1 1 (t T ) = (e cosh[ 2h s] 1)d s = p [e senh( 2h s) 2h s]. a 2h 0 p Si introducimos la nueva variable F = 2h s podremos poner p 2h (t T ) = e senh F F. a Por otro lado si introducimos, al igual que en el movimiento elı́ptico, una constante n tal que µ = n2 a3 , y teniendo en cuenta la relación µ = 2ha, podremos poner finalmente n(t T ) = ` = e senh F F. (8.36) La ecuación anterior será llamada, por extensión, ecuación de Kepler del movimiento hiperbólico. Nótese que aquı́ el movimiento medio n no tiene el mismo significado que en el caso elı́ptico por no ser la órbita periódica, sin embargo, la relación µ = n2 a3 extiende al movimiento hiperbólico la tercera ley de Kepler. La relación de r con F quedará establecida a partir de (8.35) como r = a(e cosh F 1). (8.37) Ley horaria del movimiento 139 Para establecer la relación con f bastará recordar que r= a(e2 1) = a(e cosh F 1 + e cos f 1), de donde, despejando cos f tendremos cos f = e cosh F . e cosh F 1 Por último, pasando al ángulo mitad como en el caso elı́ptico, se llega a r f e+1 F tan = tanh , 2 e 1 2 después de tomar la raı́z positiva al no existir ambigüedad si consideramos que cuando t > T , tanto f como F son positivas. Para invertir la ecuación de Kepler en el caso hiperbólico usaremos también el método de Newton con la iteración dada por (8.33). En este caso, tendremos (F ) = ` + F e senh F = 0, y por tanto, considerando solo el caso de F y ` positivo, pues el negativo es simétrico, la sucesión para invertir la ecuación será Fn = Fn 1 + ` + (Fn 1 e senh Fn e cosh Fn 1 1 1) . (8.38) Para encontrar el valor inicial de la sucesión F0 expresaremos la ecuación de Kepler del movimiento hiperbólico (8.36) en términos de la función exponencial en lugar del seno hiperbólico e e exp(F ) + exp( F ) 2 2 F ` = 0. (8.39) Si suponemos que F no es demasiado pequeño podemos admitir que el sumando e exp(F )/2 es mucho mayor que e exp( F )/2 F y que, por tanto, podremos e poner exp(F ) ` ⇡ 0, luego podemos tomar como valor inicial 2 ✓ ◆ 2` F0 = Log . e Se ha comprobado que el número de iteraciones se reduce si en lugar de este valor inicial se toma ✓ ◆ 2` F0 = Log + k , k > 0, e lo que proviene de no despreciar totalmente el término F de (8.39). Un valor óptimo de k es el valor k = 1.8. 140 Integración del problema kepleriano Capı́tulo 9 Órbitas keplerianas 9.1 Caracterización de las órbitas keplerianas Llamaremos órbita kepleriana, y la denotaremos con el sı́mbolo O, a la solución de las ecuaciones del problema kepleriano (8.1) para unas condiciones iniciales dadas. Entenderemos por órbita, no solo la trayectoria del orbitador, sino todos sus parámetros, tanto estáticos o constantes, como dinámicos o variables. Las ecuaciones del problema kepleriano (8.1) constituyen un sistema de seis ecuaciones diferenciales de orden uno. De acuerdo con la teorı́a de ecuaciones diferenciales ordinarias una solución de dicho sistema vendrá dada como x = x(t, C), donde C = (C1 , C2 , C3 , C4 , C5 , C6 ) representa un vector de seis constantes independientes que llamaremos variables de estado porque permiten determinar cualquier parámetro de la órbita en cualquier instante, es decir, caracterizan la órbita. Los seis elementos que componen las variables de estado son constantes de la órbita o variables dinámicas particularizadas para un instante dado. En este último caso hay que dar el valor de éstas ası́ como el instante t0 en que han sido calculadas. Una vez determinado el conjunto de variables de estado, la órbita quedará caracterizada por éste y pondremos O(C) si los elementos del vector de estado son constantes de la órbita y O(t0 , C) si son variables particularizadas en t0 . Las variables de estado pueden ser elegidas de diversas maneras. La más natural, desde el punto de vista de las ecuaciones diferenciales, es a través de los valores del vector de posición, x0 , y velocidad, X 0 , para un instante dado. Al 142 Órbitas keplerianas vector de dimensión seis, compuesto por las componentes de los vectores x0 y X 0 , se le llama vector de estado. De esta forma una órbita kepleriana podrá ser representada como O(t0 , x0 , X 0 ). Cada aspecto y propiedad de una órbita kepleriana O puede ser representado por un parámetro orbital o variable dinámica. Estos parámetros pueden ser constantes, como la excentricidad e o la norma del momento angular G, o variables, como el vector de posición x o la anomalı́a verdadera f . Una vez conocidos los seis o siete elementos que caracterizan la órbita, ésta queda completamente determinada junto con todos sus parámetros. En el caso de que un parámetro, que de forma genérica llamaremos , sea constante, utilizaremos la notación (O), pues este parámetro solo depende de la órbita, sin embargo, cuando el parámetro sea variable dependerá a su vez del instante o época orbital ⌧ en que sea calculado, por lo que pondremos (⌧, O). Ası́ como la órbita se podı́a caracterizar por distintos conjuntos de elementos, el instante en que calculamos un parámetro orbital variable también puede representarse en distintas formas: tiempo absoluto t, tiempo relativo al periastro t T, anomalı́a media `, anomalı́a excéntrica E, anomalı́a verdadera f , alguna posición particular: periastro, apoastro, nodo, etc. Conociendo uno cualquiera de los elementos anteriores y la propia órbita, los algoritmos vistos en el capı́tulo anterior permiten obtener los demás, por lo que cualquiera de ellos caracteriza el instante o época orbital ⌧ . Las variables de estado constituyen un conjunto de seis elementos independientes entre si, sin embargo, cuando comparamos dos conjuntos de variables de estado deberán existir relaciones de dependencia entre ambos, pudiéndose obtener los primeros en función de los segundos y viceversa. Hay que tener en cuenta que cualquiera de las variables de estado es un parámetro orbital y por lo tanto debe ser posible su obtención en función de cualquier otro conjunto de variables de estado. En lo que sigue veremos varios conjuntos distintos de variables de estado. Además del vector de estado estudiaremos también los elementos orbitales y varios conjuntos de variables derivados de ellos, ası́ como las variables de Delaunay y las variables polares-nodales. La demostración de que dichos conjuntos representan variables de estado de la órbita vendrá de obtener cada conjunto de elementos en función de otro que ya lo sea y viceversa. Elementos orbitales ordinarios 9.2 143 Elementos orbitales ordinarios La integración de este problema, vista en el capı́tulo anterior, conduce a la obtención de seis constantes, G, A, que caracterizan muchas de las propiedades del movimiento kepleriano. Ya hemos visto que entre estos vectores existe una relación funcional, luego no definen un conjunto de variables de estado sino que representan únicamente cinco de los seis elementos necesarios. Sin embargo, ninguno de estos cinco elementos representa directamente las propiedades de la órbita por lo que su uso no será de utilidad práctica. En su lugar usaremos algunos de los parámetros que definen la geometrı́a de la trayectoria. El sexto elemento deberá añadirse después de considerar algún parámetro relacionado con la dinámica del orbitador. En primer lugar tomaremos los dos elementos que caracterizan la forma de la cónica, esto es, el semieje mayor a (o el semilado recto1 p) y la excentricidad e. En el caso de órbitas de cometas suele sustituirse el semieje a por una cantidad, q, que representa la distancia del cometa al Sol en el perihelio. La distancia en el perihelio vale q = rp = a(1 e), por lo que conocido q puede hallarse a y por tanto a puede sustituirse por q. Para satélites artificiales se sustituye el par de elementos a, e, por la mı́nima y máxima altitud rm , rM , del satélite sobre la superficie terrestre. La relación de estas cantidades con la distancia en el perigeo y el apogeo viene dada por rp = rm + r , ra = rM + r , y a partir de ellos podemos obtener a = (ra + rp )/2, e = (ra rp )/(ra + rp ). Las variables a y e, o cualquiera de sus variantes, caracterizan la forma y dimensiones de la cónica. Para completar la información sobre la trayectoria necesitaremos situarla en el espacio, para lo cual basta observar la figura 9.1 y recordar que la órbita está contenida en un plano perpendicular al vector G o, lo que es igual, a su dirección n. Supondremos, por ahora, que la órbita no coincide con el plano Oxy del sistema espacial, esto es, que n ⇥ e3 6= 0. Puesto que el plano de la órbita y el plano fundamental del sistema espacial Oxy no son paralelos, necesariamente se cortarán en una recta que pasa por O y pertenece a ambos planos y que llamaremos lı́nea de los nodos. Tomaremos como dirección positiva de dicha recta la que contiene el nodo ascendente, o punto de la órbita en el que el orbitador pasa de coordenadas z negativas a positivas. El vector unitario l define la lı́nea de los nodos y forma un ángulo ⌦, ángulo del nodo, con e1 . El ángulo ⌦ puede tomar cualquier valor entre 0 y 2⇡. El ángulo que forman el vector n con e3 será llamado inclinación, y denotado por i, y representa también el ángulo entre el plano Oxy y el de la órbita. El ángulo i puede tomar un valor cualquiera entre 0 y ⇡. El vector n representa también el sentido de la rotación de la partı́cula alrededor del eje definido por n pues, debido a su definición, ésta tiene siempre lugar en sentido contrario a las agujas del reloj si se observa desde el extremo de n. Ası́ pues, el ángulo que forma n con e3 indica también el sentido de giro 1 Recordemos que el semieje mayor no está definido para la parábola. 144 Órbitas keplerianas e3 P x n u i A a f ! O e1 ⌦ e2 l i Figura 9.1: Órbita kepleriana en el espacio. observado desde un punto cualquiera de la parte positiva del eje Oz. Un ángulo i entre 0 y ⇡/2 indicará una órbita directa (sentido de giro contrario a las agujas del reloj), mientras que una inclinación entre ⇡/2 y ⇡ indicará una órbita retrógrada (sentido de giro igual al de las agujas del reloj). De esta forma, podemos separar el sentido de giro observado de la dinámica del sistema, en la que consideraremos siempre f˙ > 0, esto es, una anomalı́a verdadera estrictamente creciente. Los dos ángulos ⌦, i representan la posición del plano de la órbita en el espacio, pero para poder situar con exactitud la cónica en el espacio hay que situar la dirección del eje de la cónica dentro de su plano. El eje de la cónica lleva la dirección de la lı́nea de los ápsides, a, que forma un ángulo ! con la lı́nea de los nodos. Dicho ángulo será llamado argumento del periastro, representa la posición relativa de la cónica en su plano y es la tercera variable angular de la órbita. El argumento del periastro toma un valor cualquiera entre 0 y 2⇡. Cuando la inclinación de la órbita vale cero, la lı́nea de los nodos no está definida, por lo que tampoco lo estarán ⌦ ni !. En esta ocasión tiene sentido definir el ángulo entre la dirección de e1 y la de a, ángulo que llamaremos longitud del periastro ! ˜ . Nótese que dicho parámetro tiene también sentido para órbitas de inclinación no nula sin más que definirlo como ! ˜ = ⌦ + !. Por otro lado, cuando e = 0, queda indefinido a y por tanto quedan indefinidos !y! ˜ . Para eliminar esta indefinición se introduce la longitud media a través de la relación = ! ˜ + ` = ⌦ + ! + `, que contiene la anomalı́a media `, y que queda definida, tanto para órbitas circulares, como para cualquier otro tipo de órbita. Variables no singulares 145 Se han completado ası́ los cinco elementos que caracterizan la forma, dimensiones y situación en el espacio de la órbita. Para caracterizar su dinámica basta considerar la constante T que indica la época en la que el orbitador pasa por el periastro. Aunque el elemento T es constante hay que tener en cuenta que, para órbitas elı́pticas, éste varı́a de una vuelta a otra aumentando en una cantidad igual al periodo orbital P . Además, de la misma forma que se sustituyen a y e, puede sustituirse T por = nT . Otra alternativa, muy frecuentemente usada para definir la sexta constante, es el valor de la anomalı́a media, `0 , en un cierto instante t = t0 . Llamaremos elementos orbitales al conjunto de seis constantes (a, e, i, ⌦, !, T ), sin embargo, en ocasiones, atendiendo a las caracterı́sticas de la órbita pueden modificarse éstos y sustituirse por algunos de los valores alternativos anteriores. Por ejemplo, para el estudio de órbitas planetarias, que tienen inclinaciones y excentricidades muy pequeñas, suele utilizarse, en lugar de los elementos orbitales el conjunto de constantes (a, e, i, ⌦, ! ˜ , 0 ), donde 0 es la longitud media en un instante inicial t0 dado. La equivalencia entre los elementos orbitales y los elementos (t0 , x0 , X 0 ), quedará probada si demostramos que unos se pueden obtener a partir de los otros y viceversa, lo que comprobaremos posteriormente en este mismo capı́tulo. Por tanto, la órbita se puede caracterizar como O(a, e, i, ⌦, !, T ) o bien como O(t0 , x0 , X 0 ). A partir de esta equivalencia, para probar que cualquier otro conjunto de seis constantes o de seis constantes y variables, junto con el instante en que se han medido o calculado, caracterizan la órbita O basta comprobar su equivalencia con los elementos orbitales. 9.3 Variables no singulares El problema que aparece cuando la excentricidad, e, o la inclinación, i, toman valores muy pequeños o cero, no es tanto la indefinición de las variables, sino la aparición de singularidades debidas a la existencia de términos en e y sen i en los denominadores de las ecuaciones que expresan el movimiento orbital perturbado. Para evitar este tipo de singularidades se introduce un nuevo conjunto de variables que son llamadas variables equinocciales o variables no singulares y que se definen por medio de las expresiones: a, = ! ˜ + `0 , h = p = e sen ! ˜, i tan sen ⌦, 2 k = q = e cos ! ˜, i tan cos ⌦. 2 (9.1) Estas variables2 han sido definidas, en ocasiones, a través de términos en tan i o sen i en lugar de tan i/2, sin embargo, esto introduce otro tipo de singularidades para órbitas de inclinación i = 90 . Las variables, tal como las hemos definido 2 No confundir la h de las variables equinocciales con la energı́a de la órbita. 146 Órbitas keplerianas nosotros, son válidas para 0 i < 180 . Otro conjunto de variables similar, que se usa para órbitas retrógradas, son las llamadas variables equinocciales retrógradas, definidas por las relaciones a, = ! ˜ + `0 , hr = pr = e sen ! ˜, i cot sen ⌦, 2 kr = qr = e cos ! ˜, i cot cos ⌦, 2 (9.2) válidas para 0 < i 180 . 9.4 Sistemas de referencia orbitales Hemos dedicado la primera parte de este libro al estudio de los sistemas de referencia espaciales cuyo conocimiento es imprescindible para ubicar con precisión la posición de cualquier cuerpo en el espacio. Las caracterı́sticas del movimiento orbital hacen necesaria la introducción de nuevos sistemas de referencia, adaptados a este problema, donde se formulen, de manera sencilla, algunos de los parámetros del mismo. En las figuras (9.2), (9.3), (9.4), (9.5), (9.6), se representarán con lı́nea discontinuas tanto los vectores de la base del sistema de referencia como el octante que estos forman. Asimismo, en lugar de la órbita y el ecuador (o la eclı́ptica en su caso) se representará su proyección en una esfera unidad, por lo que todos los vectores mostrados serán unitarios, incluida la posición x que se sustituirá por su dirección u. 9.4.1 Sistema espacial Para la integración del problema de los dos cuerpos hemos supuesto que estamos refiriendo todos los vectores a un sistema de referencia inercial, con centro en el cuerpo central de la órbita, al que llamaremos sistema espacial 3 y que denotaremos S = {e1 , e2 , e3 }. En este sistema los vectores de posición y velocidad se expresarán como: x X = = x e1 + y e2 + z e3 , X e1 + Y e2 + Z e3 , (9.3) e3 n u ( ) e1 ↵( ) e2 Figura 9.2: Sistema espacial {e1 , e2 , e3 }. Coordenadas astronómicas del orbitador. o lo que es igual, con la notación introducida en el capı́tulo 2, pondremos: 0 1 0 1 x X xS = @ y A , X S = @ Y A . (9.4) z Z 3 En el caso de órbitas de satélites éste será el sistema SG (SP ) descrito en la página 59. Sistemas de referencia orbitales 147 Si la órbita representada es la de un satélite artificial, o un satélite natural (luna) en torno a un planeta, el sistema espacial adecuado será un sistema ecuatorial y por tanto podremos poner xS = cart(r, ↵, ), (9.5) donde ↵, representan la ascensión recta y declinación. El sistema espacial más adecuado, en el caso de órbitas en torno al Sol, será eclı́ptico y por tanto pondremos xS = cart(r, , ), (9.6) donde , representan la longitud y latitud eclı́ptica respectivamente. De aquı́ en adelante supondremos, salvo que se indique lo contrario, órbitas de satélites expresadas en un sistema ecuatorial en la forma (9.5). 9.4.2 Sistema nodal–espacial e3 n u e1 l ↵ e3 ⇥ l ⌦ Figura 9.3: Sistema nodal–espacial {l, e3 ⇥ l, e3 }. Sustituiremos la dirección de e1 como origen de coordenadas por la del vector l que representa la dirección de la lı́nea de los nodos. De esta forma, tendremos un nuevo sistema de referencia, P = {l, e3 ⇥ l, e3 }, que llamaremos sistema nodal–espacial. Es fácil observar que el paso del sistema espacial al sistema nodal–espacial se efectúa por medio de una matriz de giro que realiza una rotación elemental de eje Oz y ángulo ⌦. GSP = R3 (⌦). (9.7) Como puede observarse en la figura 9.3 las coordenadas polares del vector x, en el sistema espacial–nodal, son (r, ↵ ⌦, ), por lo que podremos escribir 0 1 r cos cos(↵ ⌦) xP = cart(r, ↵ ⌦, ) = @ r cos sen(↵ ⌦) A . (9.8) r sen 9.4.3 Sistema nodal A partir de la dirección n del momento angular G, esto es G = Gn, y de la lı́nea de los nodos l, que es perpendicular a n, podemos definir un sistema de referencia ortogonal directo N = {l, m, n}, que llamaremos sistema nodal, introduciendo el vector m = n ⇥ l. 148 Órbitas keplerianas Fácilmente se observa en la figura 9.4 que para pasar del sistema nodalespacial al nodal basta girar alrededor de l un ángulo igual a la inclinación i, por tanto tendremos GPN = R1 (i). n e3 m (9.9) Finalmente, para obtener la matriz de giro del sistema espacial al nodal basta combinar las dos anteriores, obteniéndose GSN = GSP GPN = R3 (⌦)R1 (i). (9.10) u !+f e2 e1 l Figura 9.4: Sistema nodal {l, m, n}. Las columnas de la matriz de rotación GSN representan las componentes de los vectores de la base final (nodal) en términos de la inicial (espacial), por ello, podremos poner: l m n = = = cos ⌦ cos i sen ⌦ sen i sen ⌦ e1 e1 e1 + + sen ⌦ e2 cos i cos ⌦ e2 sen i cos ⌦ e2 + + sen i cos i , e3 , e3 . (9.11) Usando este sistema de referencia puede encontrarse una expresión sencilla de las coordenadas ecuatoriales de un satélite artificial. En efecto, basta tener en cuenta que el ángulo entre l y x es igual a ! + f y por tanto podremos poner 0 1 r cos(! + f ) xN = cart(r, ! + f, 0) = @ r sen(! + f ) A . (9.12) 0 Si además tenemos en cuenta la relación xP = GPN xN = R1 (i)xN , ası́ como la expresión (9.8), obtendremos finalmente 0 1 0 1 cos cos(↵ ⌦) cos(! + f ) @ cos sen(↵ ⌦) A = @ cos i sen(! + f ) A , (9.13) sen sen i sen(! + f ) o bien, de forma más precisa: ↵ ⌦ = = polar (R1 (i)xN ), polar (R1 (i)xN ), (9.14) que nos da las coordenadas astronómicas del orbitador en términos de los elementos orbitales y las funciones polar , polar definidas en (1.32). Dividiendo entre si las dos primeras componentes de (9.13) llegamos a las relaciones: sen = sen i sen(! + f ), (9.15) tan(↵ ⌦) = cos i tan(! + f ). Sistemas de referencia orbitales 9.4.4 149 Sistema apsidal n e3 b u ! e1 e2 a l Figura 9.5: Sistema apsidal {a, b, n}. Si usamos la lı́nea de los ápsides como eje Ox, en lugar de la lı́nea de los nodos, definiremos un nuevo sistema de referencia que llamaremos sistema apsidal. Para ello, tendremos en cuenta que los vectores a y n son ortogonales y, por tanto, podemos definir el vector b = n ⇥ a y con él el sistema de referencia ortogonal directo A = {a, b, n} que será llamado sistema apsidal. El sistema apsidal tiene el mismo eje Oz que el nodal y los vectores a, b están girados un ángulo ! respecto de l, m. Por ello, la matriz de giro del sistema nodal al apsidal vendrá dada por GN A = R3 (!), por lo que la relación entre los vectores de ambas bases vendrá dada por las expresiones: a = cos ! l + sen ! m, (9.16) b = sen ! l + cos ! m. Finalmente la matriz de giro del sistema espacial al apsidal vendrá dada por GSA = R3 (⌦)R1 (i)R3 (!). Si tenemos en cuenta las propiedades de las cónicas y que la lı́nea de los ápsides representa el eje de coordenadas polares podremos poner 0 1 r cos f xA = cart(r, f, 0) = @ r sen f A . (9.17) 0 9.4.5 Sistema orbital Tanto el sistema nodal como el apsidal representan sistemas fijos y, por tanto, inerciales. Sin embargo, en ocasiones es conveniente usar otro, que será móvil, pero cuyo eje Ox coincida con la dirección radial. Para ello, llamaremos u al vector unitario en la dirección radial, de forma que x = ru, y v al definido por v = n ⇥ u. Al sistema U = {u, v, n} le llamaremos sistema orbital. 150 Órbitas keplerianas Los vectores (u, v) se obtienen a partir de (a, b) por medio de un giro alrededor de n y ángulo f , y a partir de (l, m) por medio de un giro alrededor de n y ángulo ! + f . Por esto podemos definir las siguientes matrices de giro: GAU = R3 (f ), GN U = R3 (! + f ), GSU = R3 (⌦)R1 (i)R3 (! + f ). e3 n v u e1 l Figura 9.6: Sistema orbital {u, v, n}. La expresión de los vectores del sistema orbital en función de los del sistema espacial vendrá dada por: u = v = (cos ⌦ cos(f + !) cos i sen ⌦ sen(f + !)) +(sen ⌦ cos(f + !) + cos i cos ⌦ sen(f + !)) + sen i sen(f + !) e1 e2 e3 , (cos ⌦ sen(f + !) + cos i sen ⌦ cos(f + !)) (sen ⌦ sen(f + !) cos i cos ⌦ cos(f + !)) + sen i cos(f + !) e1 e2 e3 . (9.18) Teniendo en cuenta la definición de u y la expresión del vector velocidad en el sistema orbital dada en (6.10) podremos poner: x X o lo que es igual 9.4.6 = = 0 ru ṙu 1 r xU = @ 0 A , 0 + rf˙v 0 , , 1 ṙ X U = @ rf˙ A . 0 (9.19) (9.20) Sistema de Frenet En Astrodinámica es muy usado otro sistema de referencia en el que el plano Oxy también coincide con el plano del movimiento, pero en el que la dirección principal coincide con la del vector velocidad, también llamada dirección tangente. En efecto, el vector velocidad podrá ponerse como X = v t, donde v es la norma y t la dirección del vector velocidad o tangente a la trayectoria. Tomando la dirección t como eje Ox y n como eje Oz, definiremos el sistema de referencia ortonormal directo F = {t, w, n} que será llamado, de aquı́ en adelante, sistema de Frenet. Este sistema es también llamado triedro de Frenet. Relaciones entre el vector de estado y los elementos orbitales b t u t a Figura 9.7: Ángulo entre la dirección radial y tangente o ángulo de trayectoria de vuelo. 151 La notación empleada aquı́ no coincide con la usada habitualmente en Matemáticas, pues la dirección definida por w, que nosotros llamaremos dirección normal a la tangente suele llamarse normal y por ello se emplea la notación, n, mientras que la definida por n, suele llamarse binormal y se denota b. Si llamamos (figura 9.7) al ángulo entre u y t, medido en sentido directo, con la orientación definida por n, y tenemos en cuenta la expresión (1.25) tendremos = atan(t · u, t · v), (9.21) que de acuerdo con la segunda de las expresiones (9.19) podrá ponerse como ṙ rf˙ = atan( , ). v v Al ángulo 9.5 (9.22) se le denomina ángulo de trayectoria de vuelo. Relaciones entre el vector de estado y los elementos orbitales Hasta aquı́ hemos visto la definición de dos tipos de variables de estado: el vector de estado, formado por la posición x0 y la velocidad X 0 en un instante t0 y los elementos orbitales. En este apartado veremos las relaciones entre estos dos conjuntos de variables de estado que permitirán obtener cada uno de ellos en función del otro. La obtención de los elementos orbitales a partir de una posición y velocidad forma parte de un problema más general llamado determinación de órbitas que intenta obtener los elementos de una órbita kepleriana a partir de datos de observación de la misma. Al problema inverso que nos da la posición y velocidad en un instante a partir de los elementos orbitales le llamaremos cálculo de efemérides. 152 9.5.1 Órbitas keplerianas Determinación de la órbita a partir de las condiciones iniciales Supongamos conocidas la posición y la velocidad x0 , X 0 en un instante dado t0 , ası́ como la constante µ. Fácilmente podemos obtener: r0 = k x0 k, G = x0 ⇥ X 0 , A = X0 ⇥ G h = 1 X0 · X0 2 G = k G k, µ x0 , r0 µ . r0 A = k A k, Por tanto, aparte de las constantes de integración G, A, h, hemos obtenido también los elementos: A G2 e= , p= , µ µ y según que el valor de e sea menor o mayor que uno tendremos 8 p > , si e < 1, < 1 e2 a= p > : , si e > 1. 2 e 1 Una vez obtenida la forma de la órbita, buscaremos su posición relativa en el espacio para lo cual encontraremos, en primer lugar, el valor de los vectores del sistema orbital (u0 , v 0 , n) para t = t0 , expresados en el sistema espacial, a partir de la expresiones: x0 G u0 = , n = , v 0 = n ⇥ u0 . r0 G Si tenemos en cuenta la expresión del vector n dada en (9.11), podremos poner sen ⌦ sen i cos ⌦ sen i cos i de donde: i ⌦ = = = = = n · e1 , n · e2 , n · e3 , acos(n · e3 ), atan( n · e2 , n · e1 ), (9.23) (9.24) lo que nos da la inclinación y el ángulo del nodo de la órbita sin ningún tipo de ambigüedad excepto en el caso en que la inclinación es cero (o 180 ), pues entonces la definición de ⌦ = atan(0, 0) no tiene sentido. En este caso adoptaremos, por convenio, un valor ⌦ = 0. Además, puesto que conocemos A y A podemos obtener a = A/A y tener en cuenta la expresión de a en el sistema espacial que, Relaciones entre el vector de estado y los elementos orbitales 153 particularizada para i = 0, nos da a = cos(! + ⌦) e1 + sen(! + ⌦) e2 , por lo que en este caso tendremos ! ˜ = atan(a · e1 , a · e2 ), (9.25) que sustituirá al argumento del periastro. Nótese que esta expresión no es válida para inclinaciones distintas de 0 o 180 . El cálculo de ! para inclinaciones distintas de 0 o 180 se realizará a partir de las expresiones obtenidas de multiplicar por e3 las expresiones de la base del sistema orbital en función de las del sistema espacial, esto es: u0 · e 3 v 0 · e3 = = sen i sen(! + f0 ), sen i cos(! + f0 ), (9.26) de donde obtenemos (! + f0 ) = atan (v 0 · e3 , u0 · e3 ) . (9.27) Basta recordar que, de acuerdo con la definición de la anomalı́a verdadera, se tiene: a · u0 = cos f0 , (9.28) a · v0 = sen f0 , luego lo que permite obtener !. f0 = atan(a · u0 , a · v 0 ), (9.29) Una vez calculado f0 y conocido el tipo de órbita, las relaciones entre t y f , obtenidas en el capı́tulo 8, permiten obtener T sin más que hacer t = t0 . Si la excentricidad es igual a cero , esto es A = a = 0, no pueden aplicarse las relaciones (9.25) ni (9.29). En este caso adoptaremos, por convenio, el valor a = l si i 6= 0 o i 6= 180 y el valor a = e1 = l si i = 0 o i = 180 . 9.5.2 Cálculo de efemérides El cálculo de la posición x y la velocidad X en un instante t a partir de los elementos orbitales puede obtenerse de manera inmediata formulando la rotación que pasa del sistema espacial al orbital, esto es: xS = GSU xU , X S = GSU X U , que, teniendo en cuenta las expresiones (9.20) y la expresión de la matriz de giro GSU , permiten escribir: 0 1 0 1 x r @ y A = R3 (⌦)R1 (i)R3 (! + f ) @ 0 A , z 0 (9.30) 0 1 0 1 ṙ X @ Y A = R3 (⌦)R1 (i)R3 (! + f ) @ rf˙ A . Z 0 154 Órbitas keplerianas Finalmente basta recordar las expresiones de r, ṙ y f˙ en función de f , dadas en (8.8), (8.13), (8.14), y la relación de f con t, dada en el capı́tulo 8 para cada tipo de movimiento. 9.6 Intersección de dos órbitas keplerianas La búsqueda de los posibles puntos de intersección de dos órbitas keplerianas resulta de gran utilidad, tanto para detectar posibles colisiones (cometas o asteroides con la Tierra, satélites artificiales entre si, etc.), como para conocer el punto donde encender los motores de una nave y modificar ası́ su órbita. 9.6.1 Pertenencia de un punto a una órbita Antes de abordar este problema más general resolveremos un pequeño problema consistente en averiguar si una órbita kepleriana dada, O, pasa por un punto P y si esto es ası́, determinar el instante de paso. Supongamos conocido el vector de posición de P , xS , en el sistema espacial S y llamemos xA al mismo vector en el sistema apsidal. Las relaciones entre los distintos sistemas orbitales vistas anteriormente permiten poner xA = GAS xS , donde GAS es la matriz de paso del sistema apsidal al espacial para dicha órbita. Las coordenadas polares esféricas de P en este sistema apsidal vendrán dadas por: rA = polarr (GAS xS ), A = polar (GAS xS ), A = polar (GAS xS ). Si el punto P pertenece a la órbita O sus coordenadas polares esféricas en el sistema apsidal serán (r, f, 0), por lo que finalmente podremos establecer las condiciones de pertenencia y el instante de paso con las siguientes condiciones: Un punto P , de vector de posición xS , pertenece a la órbita O si se cumplen, simultáneamente, las condiciones: rA = p 1 + e cos( A) , A = 0, (9.31) siendo p y e el semilado recto y la excentricidad de la órbita O. Si xS representa una dirección y no la posición exacta de un punto, basta la segunda de las condiciones anteriores para asegurar que la órbita pasa por algún punto que tiene la dirección xS . Intersección de dos órbitas keplerianas 155 Si el punto P , de vector de posición xS , pertenece a la órbita O el instante de paso del orbitador por ese punto puede calcularse a partir de su anomalı́a verdadera f dada por la relación f= A. (9.32) Una vez establecidas las anteriores relaciones podemos abordar el cálculo del punto o puntos, si los hay, que pertenecen simultáneamente a dos órbitas O1 , O2 . Distinguiremos dos casos según que las órbitas sean coplanarias (mismo valor de i, ⌦ y n, o no lo sean. 9.6.2 Intersección de órbitas no coplanarias En el caso de que las órbitas no sean coplanarias los vectores n1 , n2 , que definen el plano de la órbita, no serán colineales, por lo que podremos definir las direcciones: n1 ⇥ n2 n2 ⇥ n1 ua = , ub = , k n1 ⇥ n2 k k n2 ⇥ n1 k que representan las dos únicas direcciones en las que las órbitas pueden tener un punto común. Llamaremos u a cada una de las dos direcciones anteriores y realizaremos el proceso siguiente para cada una de las dos. En primer lugar calcularemos los valores: f1 = polar (GA1 S u), f2 = polar (GA2 S u), (9.33) que representan los valores de la anomalı́a media de el posible punto de intersección en cada una de las órbitas. De esta forma pueden calcularse los vectores xi = x(fi , Oi ), i = 1, 2, (9.34) que representan el vector de posición del posible punto de intersección en las dos órbitas. Para comprobar que hay punto de intersección basta comprobar que x1 = x2 . 9.6.3 Intersección de órbitas coplanarias Excluiremos el caso en que a1 = a2 , e1 = e2 , i1 = i2 , ⌦1 = ⌦2 , !1 = !2 para el que existen infinitos puntos comunes por ser órbitas coincidentes. Supondremos por tanto que i1 , = i2 , ⌦1 = ⌦2 y que alguno o los tres elementos a, e, i son distintos en las dos órbitas. En este caso n1 y n2 son colineales por lo que no podemos determinar la dirección de la intersección por medio de el producto vectorial de éstos. 156 Órbitas keplerianas De acuerdo con la figura 9.8 impondremos que en el punto de intersección la distancia r en ambas órbitas debe ser la misma, por lo que podremos poner r= 1 p1 = e1 cos f1 1 p2 , e2 cos f2 r = r1 = r2 O f1 donde f1 y f2 corresponden a las anomalı́as verdaderas del punto o los puntos de intersección en cada una de las órbitas. Puesto que el plano de ambas órbitas es el mismo, también coincidirá la dirección del nodo, por lo que se tendrá la relación f1 + !1 = f 2 + !2 , f2 O1 O2 !2 !1 a2 Nodo a1 Figura 9.8: Punto de intersección de dos órbitas coplanarias. lo que permite escribir p1 p2 = 1 + e1 cos f1 1 + e2 cos(f1 + !1 !2 ) , expresión que, desarrollada, puede ponerse como C cos f1 + S sen f1 = P, (9.35) siendo: C = p2 e 1 p1 e2 cos(!1 S = p1 e2 sen(!1 P = p1 !2 ), !2 ), p2 . La ecuación (9.35) coincide con la expresión (1.10) por lo que usando su solución (1.11), que puede ser doble, única o incompatible, podremos poner f1 = atan(C, S) + sen p P , C2 + S2 f2 = f 1 + ! 1 !2 . (9.36) que representan los valores de la anomalı́a media de el posible punto de intersección en cada una de las órbitas. Al igual que en caso no coplanario, los vectores xi = x(fi , Oi ), i = 1, 2, representan el vector de posición del posible punto de intersección en las dos órbitas. Para comprobar que hay punto de intersección basta comprobar que x1 = x2 . Variaciones de los sistemas de referencia 9.6.4 157 Colisiones Una vez comprobada la existencia de uno o varios puntos de intersección de las dos órbitas la comprobación de la colisión exige que los dos orbitadores pasen simultáneamente por el punto intersección. Para comprobar esta condición deberemos calcular en cada punto de intersección el valor del tiempo absoluto ti = t(fi , Oi ) y comprobar que t1 = t2 . 9.7 Variaciones de los sistemas de referencia La importancia del sistema S = {e1 , e2 , e3 } radica en que, salvo el movimiento del origen, es un sistema inercial, esto es, se verifica que dei = 0. En el problema keperiano los sistemas nodal y apsidal son también inerciales, sin embargo, el sistema orbital y el sistema de Frenet no lo son. Cuando se consideran las perturbaciones orbitales únicamente el sistema espacial sigue siendo inercial. En este apartado obtendremos la variación de dichos sisz temas lo que además nos permitirá definir, posteriormente, otros dos conjuntos de variables de ese3 tado: las variables de Delaunay r y las polares-nodales. Para ello x introduciremos un nuevo sistema de referencia auxiliar, no dee2 finido antes, y que está asocia⇢ do a las coordenadas cilı́ndricas u⇢ e1 y a las esféricas. A dicho sistema le llamaremos sistema cilı́ndrico, y está formado por los vectores Figura 9.9: Coordenadas cilı́ndricas y esféricas. (u , e ⇥ u , e ), donde u defi⇢ 3 ⇢ 3 ⇢ ne la dirección de la proyección del orbitador en el plano fundamental definido por e1 y e2 (figura 9.9). Si llamamos ( , ) a la longitud y latitud de P , tendremos que: u⇢ = cos e1 + sen e2 , (9.37) e 3 ⇥ u⇢ = sen e1 + cos e2 . La variación de este sistema de referencia puede obtenerse diferenciando (9.37), de forma que: du⇢ d(e3 ⇥ u⇢ ) = = sen d e1 + cos d e2 cos d e1 sen d e2 = = (e3 ⇥ u⇢ ) d , u⇢ d . (9.38) Si en lugar de u⇢ tomamos como eje Ox la dirección l de la intersección del plano orbital con el plano fundamental podemos definir, por un lado, el sistema nodal-espacial (l, e3 ⇥l, e3 ) (figura 9.3) y, por otro lado, el sistema nodal (l, m, n). 158 Órbitas keplerianas En el primer caso tendremos: l e3 ⇥ l = = cos ⌦ e1 + sen ⌦ e2 , sen ⌦ e1 + cos ⌦ e2 , (9.39) (e3 ⇥ l) d⌦, l d⌦. (9.40) de donde diferenciando obtenemos: dl d(e3 ⇥ l) = = En el segundo: m n = = que diferenciadas dan: dm dn = = cos i (e3 ⇥ l) + sen i e3 , sen i (e3 ⇥ l) + cos i e3 , (9.41) n di + cos i d(e3 ⇥ l), m di sen i d(e3 ⇥ l). (9.42) Finalmente, reuniendo (9.40) y (9.42) se llega a dl dm dn = = = (e3 ⇥ l) d⌦, n di cos i l d⌦, m di + sen i l d⌦. (9.43) En este estudio prescindiremos del sistema apsidal, cuyas variaciones son idénticas a las del orbital cambiando ✓ por !. Para estudiar las variaciones del sistema orbital (u, v, n) recordemos que se verifica: u v = = cos ✓ l + sen ✓ m, sen ✓ l + cos ✓ m, (9.44) y por tanto du = v d✓ + cos ⌦ dl + sen ✓ dm = v d✓ + cos ✓ (e3 ⇥ l) d⌦ + sen ✓ n di sen ✓ cos i l d⌦. Si tenemos en cuenta que, de acuerdo con (9.41), se tiene e3 ⇥ m = cos i (e3 ⇥ (e3 ⇥ l)) = cos i l, podremos poner finalmente: du = dv = 9.8 v d✓ + sen ✓ n di + (e3 ⇥ u) d⌦, u d✓ + cos ✓ n di + (e3 ⇥ v) d⌦. Variables polares–nodales Teniendo en cuenta las expresiones dadas en (9.19) podremos poner X · dx = (ṙ u + G v)(u dr + r du). r (9.45) Variables polares–nodales 159 Después de sustituir du por su valor (9.45), poniendo (! + f ) en lugar de ✓, y tras aplicar las propiedades de ortogonalidad entre u, v y n, ası́ como su relación con e3 , y desarrollar, se obtendrá finalmente X · dx = ṙdr + Gd(! + f ) + G(e3 · n)d⌦. (9.46) Si definimos ahora un conjunto de seis variables por medio de las siguientes igualdades: r R = ṙ , ✓ = !+f , ⌫ = ⌦, , ⇥ = G , N = G (e3 · n) = G cos i, (9.47) la igualdad (9.46), expresada en estas variables, podrá ponerse como X · dx = Rdr + Gd✓ + N d⌫, (9.48) lo que demuestra que la transformación de (x, X) a (r, ✓, ⌫, R, ⇥, N ) es completamente canónica. N = G cos i = H ⇥=G e3 G r n x i e2 e1 ✓ ⌫=⌦=h l Figura 9.10: Coordenadas polares-nodales. Al conjunto de variables canónicas (r, ✓, ⌫, R, ⇥, N ) se le llama variables polares–nodales y también variables de Hill o variables de Whittaker. Nótese que N representa la proyección del momento angular sobre el eje Oz. El significado del resto de las variables es evidente de acuerdo con la definición. Al ser las variables polares– nodales un conjunto de variables canónicas, el hamiltoniano del problema kepleriano se obtendrá aplicando directamente la transformación. Para ello recordemos que la velocidad puede expresarse como v 2 = ṙ2 + r2 f˙2 = R2 + ⇥2 , r2 por lo que la función de Hamilton del problema kepleriano se expresará en la forma 1 ⇥2 µ Hk = (R2 + 2 ) . (9.49) 2 r r 160 9.9 Órbitas keplerianas Variables de Delaunay en el movimiento elı́ptico A partir de las variables polares–nodales obtendremos otro conjunto de variables muy útiles en el estudio de las perturbaciones orbitales: las variables de Delaunay. En esta sección introduciremos estas variables en su forma clásica, esto es, definidas únicamente para el movimiento elı́ptico, sin embargo, su extensión a los otros tipos de movimientos puede ser efectuada sin grandes dificultades. Denotaremos las nuevas variables como (`, g, h, L, G, H), siendo H = N, h = ⌫, es decir, con el último momento y variable iguales a los de las variables polares–nodales. Para obtener la transformación haremos uso de la ecuación de Hamilton– Jacobi que nos permite obtener una transformación canónica a partir de la ecuación en derivadas parciales obtenida de sustituir, en el hamiltoniano, los momentos por las derivadas de la función generatriz respecto de las variables. Teniendo en cuenta la expresión (9.49), igualando ésta a la energı́a, que en el caso elı́ptico4 se puede poner como µ/2a, y después de sustituir los momentos por las derivadas de la función generatriz S respecto de las variables, llegaremos a la ecuación de Hamilton–Jacobi "✓ ◆ ✓ ◆2 # 2 @S @S 1 µ µ 1 + = . (9.50) 2 @r @✓ r2 r 2a La solución de esta ecuación podrá ser obtenida ensayando una expresión de S separada en las variables r y ✓, esto es con S = S1 (r) + S2 (✓), en cuyo caso tendremos ◆2 ✓ ◆2 # 1 @S1 @S2 1 µ µ + = , 2 2 @r @✓ r r 2a que puede también ponerse como ✓ @S2 @✓ ◆2 = 2µr µr2 a r2 ✓ @S1 @r ◆2 = P22 , donde P2 debe ser constante pues iguala una función que depende exclusivamente de ✓ con otra que solo depende de r. Ası́ pues, podremos poner por un lado S2 (✓) = P2 ✓, y por otro @S1 1 = @r r r 2µr µr2 a P22 , 4 Esta restricción hace que las variables que se definen aquı́ sean válidas únicamente para el caso elı́ptico. Variables de Delaunay en el movimiento elı́ptico 161 lo que permite expresar S como Z S = P2 ✓ r r0 r 2µ r P22 , r2 µ a (9.51) donde el lı́mite inferior de integración r0 será elegido posteriormente. De acuerdo con la teorı́a de Hamilton–Jacobi una función generatriz S(q, P ) define una transformación canónica (q, p) ! (Q, P ) a través de las ecuaciones: p= @S , @q Q= @S . @P En nuestro caso tomaremos como variables y momentos viejos las variables polares– nodales, q1 = r, q2 = ✓, p1 = R, p2 = ⇥, de donde llegaremos a las relaciones: r @S @S 2µ µ P22 ṙ = R = p1 = = = , @q1 @r r a r2 (9.52) @S @S ⇥ = G = p2 == = = P2 . @q1 @✓ p Elegiremos como nuevos momentos (P1 = µ a, P2 ). El segundo coincide con ⇥ o, lo que es igual, con la norma del momento angular G, por ello se utiliza esta última notación en el contexto de las variables de Delaunay, P2 = G. Respecto a P1 , suele usarse la letra L, esto es P1 = L. De esta forma, las nuevas coordenadas serán: Z r @S 2µ2 P1 3 s Q1 = = dr, @P1 r0 2µ µ2 P22 2 r P12 r2 Z r @S 2P2 s Q2 = = ✓ + dr, @P2 r0 2µ µ2 P22 2 2r r P12 r2 donde, teniendo en cuenta las relaciones (9.52) además de los valores de P1 , P2 , y por otro lado las relaciones drp = ṙdt, df = Gdt/r2 y la definición del movimiento medio en el caso elı́ptico n = µ/a3 , se llega a: Q1 = Z r r0 Q2 = ✓ + r Z µ 1 dr = a3 ṙ r r0 Z t ndt, t0 G dr = ✓ + r2 ṙ Z f df. f0 Estas expresiones nos permiten elegir el lı́mite inferior de integración como el periastro de la órbita, por lo que r0 = rp , t0 = T, f0 = 0, lo que, junto con la 162 Órbitas keplerianas relación ✓ = ! + f , nos lleva a las expresiones Q1 = n(t T ) = `, (9.53) Q2 = ! = g, donde hemos sustituido la notación de ! por g para emplear la notación clásica de las variables de Delaunay. Todo lo anterior nos permite definir el conjunto de variables de Delaunay (`, g, h, L, G, H) como el conjunto de variables obtenidas a partir de las relaciones: ` = L = n(t T ) p µa , g , G = ! , h = ⌦, , H = G cos i. (9.54) Finalmente, puesto que el hamiltoniano del movimiento kepleriano coincide con la energı́a, y ésta en el caso elı́ptico vale µ/2a, podremos expresar la función de Hamilton en variables de Delaunay como Hk = µ2 . 2L2 (9.55) Capı́tulo 10 Formulación universal del problema kepleriano 10.1 Introducción La distinta formulación de los tres tipos de movimiento resulta poco práctica para el estudio de movimientos orbitales perturbados en las proximidades de un movimiento parabólico, donde cualquier perturbación puede producir una transición entre movimientos periódicos y no periódicos o viceversa. En este apartado describiremos una nueva formulación universal, esto es, válida para los tres tipos de movimientos simultáneamente, que está basada en el uso de la variable s, definida en (8.15), como variable independiente y de las funciones de Stump↵. 10.2 Funciones V de Stump↵ Llamaremos funciones de Stump↵ al conjunto de funciones de variable compleja definidas como cn (z) = X k 0 ( 1)k zk , (2k + n)! n = 0, 1, 2, . . . (10.1) Dado que estas series de potencias son absolutamente convergentes en todo el plano complejo, las funciones cn (z) están definidas para cada valor de z. Cuando z toma valores reales, las funciones cn (z) serán reales. 164 Formulación universal del problema kepleriano Llamaremos funciones V de Stump↵ al conjunto de funciones definidas a partir de las de Stump↵ como n 2 Vn (x; ↵) = x cn (↵x ) = X ( 1)k ↵k x2k+n , (2k + n)! n = 0, 1, 2, . . . , (10.2) k 0 donde x 2 IR es la variable y ↵ 2 IR un parámetro. De acuerdo con la definición (10.1) las funciones c0 , c1 pueden identificarse con las funciones elementales siguientes: 8 p si x > 0, < cos x 1 si x = 0, c0 (x) = p : cosh x si x < 0, p 8 sen x > > (10.3) p si x > 0, > > x > < 1 si x = 0, c1 (x) = > p > > senh x > > : p si x < 0. x De aquı́ pueden deducirse fácilmente las relaciones: 8 p si ↵ > 0, < cos( ↵ x) 1 si ↵ = 0, V0 (x; ↵) = p : cosh( ↵ x) si ↵ < 0, p 8 sen( ↵ x) > > p si ↵ > 0, > > ↵ > < x si ↵ = 0, V1 (x; ↵) = > p > > senh( ↵ x) > > : p si ↵ < 0. ↵ (10.4) Asimismo puede verse, a partir de la definición, que se verifican las siguientes igualdades: Vn ( x; ↵) = Vn (x; ↵), V0 (0, ↵) Vn (0, ↵) = 1, = 0, (10.5) n 1. Propiedad.- La relación entre dos funciones Vn y Vn+2p viene dada por la fórmula Vn (x; ↵) p 1 X ( ↵)k x2k x = ( ↵)p Vn+2p (x; ↵). (2k + n)! n k=0 (10.6) Funciones V de Stump↵ 165 La propiedad puede demostrarse sin más que tener en cuenta que Vn puede ponerse también como Vn (x; ↵) = x n X ( ↵)k x2k , (2k + n)! k 0 de donde el término de la izquierda de (10.6) se obtiene restando los p primeros términos de Vn , con lo que llegamos a xn X ( ↵)k x2k . (2k + n)! k p Una simple reestructuración de ı́ndices, definiendo m = k p, permite expresar dicho término como X ( ↵)m+p x2m+2p X ( ↵)m x2m xn = ( ↵)p xn+2p = ( ↵)p Vn+2p (x; ↵), (2m + 2p + n)! (2m + n)! m 0 m 0 con lo que queda demostrada la propiedad. Particularizando (10.6) para p = 1 se obtiene una relación que será muy usada Vn (x; ↵) + ↵ Vn+2 (x; ↵) = xn . n! (10.7) Esta expresión nos da un procedimiento recursivo que permite evaluar Vn para cualquier valor de x y ↵ 6= 0, siempre que podamos evaluar V0 y V1 , lo que resulta sencillo a partir de las expresiones (10.4). Cuando ↵ = 0, basta particularizar la definición (10.2) con lo que se obtiene Vn (x; 0) = xn . n! (10.8) Este no será el mejor método de evaluación de las funciones V de Stump↵, sin embargo, es un procedimiento sencillo que puede implementarse fácilmente en un ordenador y que puede hacer manejables y prácticas estas funciones. Propiedad.- La familia de funciones V de Stump↵ es cerrada respecto a la diferenciación e integración, es decir: @ Vn (x; ↵) @x @ V0 (x; ↵) @x Z x Vn (s; ↵)d s 0 = = = Vn 1 (x; ↵), ↵ V1 (x; ↵), n 1, (10.9) Vn+1 (x; ↵). Para demostrar esta propiedad basta aplicar la derivación e integración, término a término, en la serie que define estas funciones. 166 Formulación universal del problema kepleriano Propiedad.- La familia de funciones V de Stump↵ verifica las relaciones: 8 > Vn m si n m, m @ Vn (x; ↵) < = m n @ V0 (x; ↵) > @xm : si n < m. @xm n (10.10) ( m ( ↵) 2 V0 (x; ↵) si m es par, @ m V0 (x; ↵) = m+1 @xm ( ↵) 2 V1 (x; ↵) si m es impar. La relación anterior se demuestra, por simple comprobación, a partir de la proposición anterior. Propiedad.- Las derivadas de las funciones V respecto al parámetro vienen dadas por las expresiones @ Vn (x; ↵) 1 = [n Vn+2 (x; ↵) @↵ 2 x Vn+1 (x; ↵)] . (10.11) En efecto, derivando en la definición (10.2) se tiene @ Vn (x; ↵) X ( 1)p p↵p 1 x2p+n 1 X ( 1)m 2(m + 1)↵m x2m+2+n = = . @↵ (2p + n)! 2 (2m + 2 + n)! m 0 k 1 Por último basta tener en cuenta que 2m + 2 2m + 2 + n n 1 = = (2m + 2 + n)! (2m + 2 + n)! (2m + 1 + n)! n , (2m + 2 + n)! para demostrar la proposición enunciada. Propiedad.- Las n + 1 primeras funciones Vn (x; ↵) constituyen un sistema de funciones linealmente independientes para cualquier valor de n. Para comprobar que n + 1 funciones x0 , x1 , . . . , xn son linealmente independientes, es preciso comprobar que el wronskiano es distinto de cero, esto es w(x0 , x1 , . . . , xn ) = x0 x00 ... (n) x0 x1 x01 x2 x02 (n) x1 (n) x2 ... ... xn x0n ... (n) xn 6= 0. En nuestro caso, el wronskiano se obtiene a partir de la expresión de las derivadas n-simas de las funciones. Comprobaremos únicamente el caso n = 3, para cualquier otro n el procedimiento será idéntico. w(V0 , V1 , V2 , V3 , ) = V0 ↵ V1 ↵ V0 ↵ 2 V1 V1 V0 ↵ V1 ↵ V0 V2 V1 V0 ↵ V1 V3 V2 V1 V0 . Funciones V de Stump↵ 167 Multiplicando la primera y segunda filas por ↵ y sumándosela a la tercera y cuarta respectivamente se obtiene, después de aplicar la relación (10.7), w(V0 , V1 , V2 , V3 ) = V0 ↵ V1 0 0 V1 V0 0 0 V2 V3 V1 V2 1 x 0 1 = V02 +↵ V 2 . Observando las derivadas de V0 y V1 respecto a x obtenemos que 0 0 V0 V0 +↵ V1 V1 = 0, por lo que podemos poner 2 2 V0 +↵ V1 = constante, basta tener en cuenta los valores de V0 y V1 en x = 0 para deducir que 2 2 V0 (x; ↵) + ↵ V1 (x; ↵) = 1, y por tanto w(V0 , V1 , V2 , V3 ) = 1, con lo que queda demostrada la proposición. Propiedad.- Vn (x; ↵) es solución de la ecuación diferencial lineal homogénea dm+2 y dm y + ↵ = 0, dxm+2 dxm para todo n m + 1. Para demostrar esto basta tener en cuenta la expresión de las derivadas nsimas y (10.7). Propiedad.- Dado un número real arbitrario ↵, la función y(x; ↵) = m+1 X k=0 k Vk (x; ↵), (10.12) es la solución general de la ecuación diferencial dm+2 y dm y + ↵ = 0, dxm+2 dxm m 0. (10.13) La demostración es trivial pues cada una de las las m + 2 funciones Vk es, según la proposición anterior, solución de la ecuación y éstas son linealmente independientes. 168 10.3 Formulación universal del problema kepleriano Funciones V0 , V1 Las funciones V0 , V1 constituyen la extensión natural de las funciones cos, cosh por un lado y sen, senh por otro. Además, cualquier otra función Vn puede expresarse en términos de las dos primeras, por lo que éstas juegan un importante papel en Astrodinámica. Ya hemos visto como la propiedad fundamental de las funciones circulares puede extenderse a las de Stump↵ por medio de la igualdad (10.7), particularizada para n = 0 en la forma: 2 2 V0 (x; ↵) + ↵ V1 (x; ↵) = 1. (10.14) Por otro lado, puede demostrarse fácilmente la extensión de las propiedades de adición y ángulo doble de las funciones circulares, obteniendose: V0 (x ± y; ↵) = V0 (x; ↵) V0 (y; ↵) ⌥ ↵ V1 (x; ↵) V1 (y; ↵), (10.15) V1 (x ± y; ↵) = V1 (x; ↵) V0 (y; ↵) ± V0 (x; ↵) V1 (y; ↵), (10.16) V0 (2x; ↵) = V0 (x; ↵) (10.17) V1 (2x; ↵) 2 ↵ V12 (x; ↵) = = 2 V02 (x; ↵) = 2 V0 (x; ↵) V1 (x; ↵). 1=1 2↵ V12 (x; ↵), (10.18) De la misma forma que el cociente de funciones circulares e hiperbólicas da lugar a la función tangente y tangente hiperbólica, podemos introducir la función Vt (x; ↵) = V1 (x; ↵) . V0 (x; ↵) (10.19) Finalmente, considerando la definición de las funciones inversas de las circulares e hiperbólicas podemos definir las inversas de las de Stump↵, una vez fijado ↵ y estudiado el rango de definición de éstas que coincide con el de sus homólogas circulares e hiperbólicas. 8 acos x > si ↵ > 0, < p↵ 1 (10.20) V0 (x; ↵) = acosh x > : p si ↵ < 0, ↵ 1 V1 (x; ↵) = p 8 asen( ↵ x) > > p > > ↵ > < x > p > > asenh( ↵ x) > > : p ↵ si ↵ > 0, si ↵ = 0, si ↵ < 0, (10.21) Formulación universal del problema kepleriano 1 Vt (x; ↵) 10.4 = p 8 atan( ↵ x) > > p > > ↵ > < x > p > > atanh( ↵ x) > > : p ↵ 169 si ↵ > 0, si ↵ = 0, si ↵ < 0. (10.22) Formulación universal del problema kepleriano Para obtener expresiones del problema kepleriano válidas para cualquier tipo de movimiento volveremos a la ecuación (8.21) que, después de derivar respecto a s, se transforma en r000 2hr0 = 0. (10.23) De acuerdo con las propiedades de las funciones de Stump↵, vistas en 10.2, una solución general de la ecuación homogénea (10.23) podrá expresarse como r(s) = donde 0, 1, 2 0 V0 (s, 2h) + 1 V1 (s, 2h) + 2 V2 (s, 2h), (10.24) son tres constantes de integración. Todas las ecuaciones diferenciales que aparecerán en esta sección tendrán el mismo parámetro ↵ = 2h por lo que en todas las ocasiones llegaremos a funciones de la forma Vn (s, 2h). Teniendo en cuenta que h es un constante del movimiento, no existirá ambigüedad si en la notación suprimimos el argumento 2h y escribimos Vn (s). Cuando no exista tampoco ambigüedad en la variable temporal s podremos también poner, por brevedad Vn . Derivando dos veces la expresión (10.24) y teniendo en cuenta los valores particulares de Vn (0), se tendrá: r(s = 0) = r0 = 0, 0 = 1, 00 = r00 r000 r (s = 0) r (s = 0) = = 2h 0 + 2, donde, para generalizar, se ha considerado el cero de s en un instante t0 que, por ahora, no tiene que coincidir con T . Aplicando la relación (8.21) para obtener r000 en función de r0 , r00 , se podrá poner finalmente r(s) = r0 V0 (s) + r00 V1 (s) + µ V2 (s). (10.25) Por otro lado, integrando la ecuación (8.19) con el valor de r dado por (10.25), se obtiene finalmente t t0 = r0 V1 (s) + r00 V2 (s) + µ V3 (s), (10.26) 170 Formulación universal del problema kepleriano que será llamada ecuación de Kepler universal, pues, al igual que (10.25), es válida para cualquier tipo de movimiento. Finalmente, si derivamos respecto a s la expresión x0 = r ẋ, obtendremos µ x, r x00 = r0 ẋ + r2 ẍ = r0 ẋ o lo que es igual rx00 = r0 x0 µx. (10.27) Derivando nuevamente y aplicando la relación (8.21) se llega fácilmente a x000 2hx0 = 0, cuya solución se podrá poner como x= 0 V0 + 1 V1 + 2 V2 , donde ahora 0 , 1 , 2 representan tres vectores constantes cuyos valores, después de derivar, igualar a cero y expresar x000 en función de x0 , x00 de acuerdo con (10.27), pueden expresarse como ✓ ◆ r00 0 µ 0 = x , = x , = x + 2h x0 . 0 0 1 2 0 r0 0 r0 Por tanto, x(s) será igual a ✓ ◆ µ r0 x(s) = V0 + 2h V2 x0 + V1 + 0 V2 x00 , r0 r0 relación que, tras aplicar la propiedad V0 2h V2 = 1, adopta la forma µ r00 0 x(s) = 1 V 2 x0 + V 1 + V 2 x0 . r0 r0 (10.28) En este apartado hemos supuesto el instante inicial t0 distinto, en principio, de T , por tanto, las fórmulas son válidas para cualquier instante inicial. Sin embargo, cuando t0 = T tendremos p r00 = rp0 = 0, r0 = rp = , 1+e con lo que las expresiones anteriores se simplificarán, obteniendose las relaciones: r t x T = rp V0 (s) + µ V2 (s), = rp V1 (s) + µ V3 (s), µ 1 V2 (s) xp + V1 (s)x0p . rp = (10.29) Formulación universal del problema kepleriano 171 Las dos primeras expresiones pueden simplificarse más teniendo en cuenta las relaciones V0 2h V2 = 1, V1 2h V3 µ + 2hrp = s, = µe, (10.30) esta última puede obtenerse sin más que tener en cuenta h= A2 µ 2 µ2 e2 µ2 µ(e2 1) = = , 2G2 2µp 2p rp = p . 1+e Sustituyendo (10.30) en (10.29) se obtiene por un lado: r t T = rp + µe V2 (s), = rp s + µe V3 (s), (10.31) y por otro: µ [1 e V0 (s)], 2h (10.32) µ t T = [s e V1 (s)], 2h ecuaciones similares a las dadas para cada uno de los movimientos elı́ptico e hiperbólico pero que no son válidas para el cálculo en el caso parabólico, por lo que dejan de ser universales. r = Si atendemos a la definición de los vectores a, b, del sistema apsidal, podemos poner xp = rp a, X p = vp b, donde vp representa la velocidad en el periastro, por lo que x0p = rp X p = rp vp b. La relación anterior puede modificarse si tenemos en cuenta que, por un lado p G = µp y además G = x ⇥ X = xp ⇥ X p , luego se tendrá finalmente rp vp = rp vp sen 90 = xp Xp sen(xp , X p ) = G = p µp. Reuniendo las anteriores relaciones y llevándolas a la tercera ecuación (10.29) se llega finalmente a p x = [rp µ V2 (s)] a + µp V1 (s) b, (10.33) que comparada con (9.17) permite poner r cos f = rp µ V2 (s), r sen f = p µp V1 (s). (10.34) 172 Formulación universal del problema kepleriano Teniendo en cuenta las expresiones de r, r cos f y las relaciones (10.30) obtendremos fácilmente las expresiones f = r + r cos f 2 f 2 r sen2 = r r cos f, 2 2 r cos2 = rp [1 + V0 (s)], = µ(1 + e) V2 (s) = µ(1 + e) [1 2h V0 (s)]. Por último, las expresiones (10.17) conducen a p r cos f s p = rp V0 ( ), 2 2 p que divididas nos dan f tan = 2 10.5 r sen r p f s = µ(1 + e) V1 ( ), 2 2 µ s (1 + e) Vt ( ). p 2 (10.35) (10.36) Coeficientes de transición en forma cerrada Las propiedades del movimiento kepleriano permiten expresar las funciones f , g en forma cerrada, esto es, sin los desarrollos en serie de las expresiones (7.39), aunque en dichas expresiones no aparecerá t explı́citamente. El valor de f y g se obtiene fácilmente si tenemos en cuenta la relación (10.28) µ 0 x(s) = 1 V2 (s) x0 + [r0 V1 (s) + r0 V2 (s)] X 0 , r0 donde hemos tenido en cuenta que x00 = r0 X 0 . Por tanto, podremos poner por un lado µ f (t; t0 ) = 1 (10.37) V2 (s), r0 y por otro g(t; t0 ) = r0 V1 (s) + r00 V2 (s). Finalmente, si tenemos también en cuenta (10.26) llegamos a la igualdad g(t; t0 ) = (t t0 ) µ V3 (s). (10.38) Las expresiones (10.37) y (10.38) nos dan el valor de f y g en forma cerrada en función de s. Las derivadas de f y g respecto a t serán @f µ = V1 (s), @t rr0 @g =1 @t µ V2 (s). r Coeficientes de transición en forma cerrada Recordando que µ V2 = r0 (1 173 f ) se llega a @g r0 =1 [1 f (t; t0 )] . @t r Por otro lado, la relación (10.26) puede ponerse como V1 = = 1 [(t t0 ) r00 V2 µ V3 ] r0 1 r0 r00 g(t; t0 ) + (1 f ) , r0 µ = 1 [g(t; t0 ) r0 (10.39) r00 V2 ] lo que permite poner @f r0 S0 r0 R 0 = [1 f (t; t0 )] g(t; t0 ), (10.40) @t r r con lo que se completa la relación de fórmulas necesarias para el cálculo de efemérides. Por su importancia veremos en que se transforman las expresiones (10.37) y (10.38) en el movimiento elı́ptico, para el cual 2h < 0 y por tanto: p 2h V2 (s, 2h) = 1 V0 (s, 2h) = 1 cos 2hs, p sen 2hs p 2h V3 (s, 2h) = s V1 (s, 2h) = s , 2h para llegar finalmente a: f (t; t0 ) = 1+ g(t; t0 ) = (t ⌘ p µ ⇣ 1 cos 2hs , 2hr0 p p µ 2hs sen 2hs p t0 ) + . 2h 2h Al integrar en forma separada el movimiento elı́ptico habı́amos definido la anop malı́a media como E = 2hs, después de suponer que el instante t0 coincidı́a con la época de paso por el periastro, esto es t0 = T, E = 0. Sin embargo, para encontrar la expresión de f (t; t0 ), g(t; t0 ), válida para cualquier t0 es preciso p suponer que t0 puede ser cualquier instante, para lo cual tomaremos E E0 = 2hs, y de ahı́: µ f (t; t0 ) = 1 [1 cos(E E0 )] , 2hr0 µ g(t; t0 ) = (t t0 ) + [(E E0 ) sen(E E0 )] . ( 2h)(3/2) Finalmente, si tenemos en cuenta que el movimiento es elı́ptico tendremos que 2h = µ/a = n2 a3 /a = n2 a2 , que llevado a las igualdades anteriores nos da: a f (t; t0 ) = 1 [1 cos(E E0 )] , r0 (10.41) 1 g(t; t0 ) = (t t0 ) + [(E E0 ) sen(E E0 )] . n 174 Formulación universal del problema kepleriano Capı́tulo 11 Órbitas keplerianas que pasan por dos puntos 11.1 Problema de transferencias orbitales y problema de Lambert Plantearemos ahora una una importante pregunta de la dinámica orbital: ¿qué órbita u órbitas permiten llegar a un cuerpo en el espacio desde una posición inicial P1 a otra final P2 ? Esta pregunta conduce a dos problemas distintos según que impongamos o no el tiempo de tránsito entre las dos posiciones. El problema de las transferencias orbitales busca el conjunto O(P1 , P2 ) de todas las órbitas keplerianas que pasan por los dos puntos. A cada una de las infinitas soluciones de este problema se le denomina órbita de transferencia y su conocimiento es de gran aplicación en tecnologı́a espacial para estudiar el problema de la conexión de dos puntos en el espacio a través de un satélite artificial o sonda espacial. Si entre todas las órbitas de transferencia que conectan dos puntos buscamos aquellas que tardan un tiempo dado en pasar de un punto a otro, nos encontramos con un problema clásico de la Mecánica Celeste llamado problema de Lambert. Ası́ como el problema de las transferencias tiene infinitas soluciones, el problema de Lambert tiene una única solución. El problema de Lambert va asociado al problema de determinación de una órbita cuando tenemos información parcial de la misma en varios instantes diferentes, lo que ocurre, por ejemplo, en el caso de cometas, asteroides, etc. 176 Órbitas keplerianas que pasan por dos puntos En este capı́tulo abordamos ambos problemas. En primer lugar buscaremos, y caracterizaremos en función de su energı́a, todas las órbitas que pasan por dos puntos diferentes. Posteriormente encontraremos la relación de la energı́a de la órbita con el tiempo de tránsito entre los puntos P1 y P2 y de esta forma encontraremos un método de resolución del problema de Lambert. Los métodos habitualmente desarrollados en la literatura cientı́fica para la resolución del problema de Lambert son distintos al presentado en este libro. No pretendemos con esto dar ningún método alternativo, de hecho, este método no es comparable con otros ni en precisión ni en velocidad, sin embargo, nos ha parecido útil su inclusión en el libro pues conecta, de manera más natural, la resolución de ambos problemas y es más claro desde el punto de vista didáctico. 11.2 Órbitas de transferencia Sean dos puntos P1 , P2 , que en el e3 P2 nd sistema espacial S, con origen O en el cuerpo central, pueden represenlr id tarse a través de los vectores x1 = Od OP1 , x2 = OP2 , que supondremos P1 no colineales. Supongamos que existe una cónica que pasa por P1 y P2 y tiee2 ne el punto O como foco. Esta cónica Or puede dar lugar a dos órbitas kepleria⌦d nas, una directa Od y otra retrógrada e1 ld Or , según que, visto desde la direcnr ción de e3 , el orbitador vaya de P1 a P2 en el sentido directo o retrógrado Figura 11.1: Órbitas de transferencia direcrespectivamente (figura 11.1). Ambas ta, O , y retrógrada, O . r d órbitas tienen en común el plano orbital y su sistema nodal se caracteriza por unos vectores l, n cuya relación entre si es ld = lr , nd = nr . Para buscar todas las órbitas keplerianas que pasan por P1 y P2 buscaremos por separado las órbitas directas y las retrogradas, duplicandose, de esta forma, el conjunto de soluciones encontradas. Llamemos np = (x1 ⇥ x2 )/k x1 ⇥ x2 k, y supongamos que np · e3 0. Si queremos órbitas directas partiremos de un valor n = nd = np , mientras que si queremos órbitas retrógradas tomaremos n = nr = np . Cuando np · e3 < 0, tomaremos n = nd = np para órbitas directas y n = nr = np para órbitas retrogradas. Elementos del triángulo OP1 P2 11.2.1 177 Plano de la órbita Fijado n podemos obtener el sistema orbital en el punto P1 y el P2 a través de las expresiones: x1 u1 = , n, v 1 = n ⇥ u1 , r1 (11.1) x2 u2 = , n, v 2 = n ⇥ u2 . r2 El valor del vector n determinará, sin ambigüedad, el plano del movimiento a través de los elementos ⌦, i dados por medio de las expresiones (9.24). Además, una vez obtenidos éstos, podemos calcular los vectores l, m del sistema de referencia nodal. En particular tendremos l = cos ⌦ e1 + sen ⌦ e2 . 11.2.2 (11.2) Ángulo de transferencia Hemos dicho anteriormente que una órbita kepleriana, vista desde el vector n, siempre es directa, puesto que las anomalı́as son siempre crecientes. Dicho ésto, y una vez fijado n tras decidir si queremos una órbita directa o retrógrada, llamaremos ángulo de transferencia al ángulo directo, con la orientación dada por n, que lleva el vector x1 al x2 . Este ángulo, que puede tomar cualquier valor entre 0 y 2⇡, viene determinado unı́vocamente por la expresión (1.25), esto es w = atan (x1 · x2 , n · (x1 ⇥ x2 )) , w 2 [0, 2⇡). El ángulo de transferencia puede ponerse también como: r1 r2 cos w r1 r2 sen w 11.3 x1 · x2 , n · (x1 ⇥ x2 ). (11.3) Elementos del triángulo OP1 P2 2 P2 r2 c O = = wt r1 1 P1 Figura 11.2: Triángulo OP1 P2 . mientras que el semiperı́metro valdrá El triángulo OP1 P2 de la figura 11.2, juega un importante papel en el estudio de las transferencias orbitales. El ángulo wt , con vértice en O, coincide con el ángulo de transferencia w cuando éste es menor que ⇡ y con 2⇡ w cuando es mayor que ⇡. En cualquier caso se tendrá cos wt = cos w. Además, la cuerda c subtendida por los dos puntos P1 y P2 se obtendrá con la relación c2 = x212 = (x2 x1 )2 = r12 + r22 2r1 r2 cos wt = r12 + r22 2r1 r2 cos w, = (r1 + r2 + c)/2. 178 Órbitas keplerianas que pasan por dos puntos Teniendo en cuenta el valor de c2 podremos poner (r1 + r2 + c)(r1 + r2 (r1 + c r2 )(r2 + c c) = 2r1 r2 (1 + cos w) = r1 ) = 2r1 r2 (1 = cos w) w , 2 w 4r1 r2 sen2 . 2 4r1 r2 cos2 Por otro lado (r1 + r2 c) = 2( c), (r1 + c r2 ) = 2( r2 ), (r2 + c r1 ) = 2( r1 ), lo que conduce a las expresiones: w 2 w r1 r2 sen2 2 r1 r2 cos2 = = ( c), ( r1 )( r2 ). Si extraemos la raı́z cuadrada y tenemos en cuenta los signos del seno y coseno de w/2, según el cuadrante de w, podremos poner w cos = 2 w s ( c) , r1 r2 w sen = 2 s ( r1 )( r1 r2 r2 ) , (11.4) donde hemos llamado w = ⇢ 1 1 si si w < ⇡, w > ⇡. (11.5) Definiremos los ángulos exteriores 1 , 2 como los ángulos que llevan respectivamente de x1 a x12 y de x12 a x2 en sentido positivo desde la orientación dada por n. Si tenemos en cuenta la expresión (1.24) del seno y coseno del ángulo orientado entre dos vectores y la definición de 1 , podremos poner c r1 cos c r1 sen 1 1 = = x1 · x12 n · (x1 ⇥ x12 ) x1 · (x2 x1 ) n · [x1 ⇥ (x2 x1 )] = = = = x1 · x2 r12 , n · (x1 ⇥ x2 ), lo que, teniendo en cuenta (11.3), conduce a las relaciones c cos c sen 1 1 = = r2 cos w r1 , r2 sen w. (11.6) Hodógrafa en P1 y P2 179 Combinando convenientemente las relaciones anteriores y tras una serie de cálculos, podremos poner cos2 sen El signo de 1 2 1 2 1 2 = = 1 (1 + cos 2 1 (1 cos 2 1) = 1) = ( c)( r1 ) , cr1 ( r2 ) . cr1 se obtiene a partir del de w por medio de las relaciones w<⇡, 1 que permiten analizar el signo de s ( c)( 1 cos = w 2 cr1 < ⇡, w>⇡, 1 > ⇡, 1 /2 según el cuadrante de w y poner finalmente s r1 ) ( r2 ) 1 , sen = . (11.7) 2 cr1 Con un proceso similar podemos obtener también las igualdades s s ( c)( r ) ( r1 ) 2 2 2 cos = w , sen = . 2 cr2 2 cr2 11.4 (11.8) Hodógrafa en P1 y P2 La velocidad de un punto en una órbita kepleriana puede expresarse, en el sistema de referencia orbital, como X = R u + T v, (11.9) donde u, v representan la dirección radial y transversal y R = ṙ, T = r f˙, siendo f la anomalı́a verdadera. De las propiedades de las órbitas keplerianas podemos deducir fácilmente las relaciones: r p pµ p µ r= , R=e sen f, T = , (11.10) 1 + e cos f p r o lo que es igual: p e cos f = r 1, e sen f = R r p , µ p= r2 T 2 . µ (11.11) De acuerdo con las relaciones (11.10), los valores de R, T están restringidos a los rangos r r µ µ T > 0, e Re . (11.12) p p 180 Órbitas keplerianas que pasan por dos puntos La segunda relación no constituye realmente una restricción al valor de la componente radial de la velocidad, sino una relación entre la velocidad y la órbita kepleriana que ésta genera. De hecho, cualquier valor de R determina un vector velocidad cuyos elementos orbitales verifican dicha relación. Si f1 , f2 representan la anomalı́a verdadera en cada uno de los dos puntos, P1 , P2 , se tendrá que el ángulo de transferencia w es igual a w = f2 f1 . (11.13) Si particularizamos la primera de las expresiones (11.10) para el punto P2 (subı́ndice 2) y sustituimos f2 por w + f1 , nos queda una expresión en e sen f1 , e cos f1 . En dicha expresión sustituiremos estos elementos por su valor en función de R1 y T1 , obtenido particularizando (11.11) para P1 . Todo este proceso nos conduce a la relación 1 (R1 , T1 ) = a1 T12 + b1 R1 T1 + c1 = 0, (11.14) donde a1 = r1 r2 cos w , r2 b1 = sen w, µ(1 c1 = cos w) . r1 (11.15) Particularizando de nuevo la primera de las ecuaciones (11.10), en este caso en el punto P1 , sustituyendo f1 por w f2 , y por último sustituyendo sen f2 y cos f2 por su valor en función de R2 y T2 , se obtendrá la relación 2 (R2 , T2 ) = a2 T22 + b2 R2 T2 + c2 = 0, (11.16) donde a2 = r2 r1 cos w , r1 b2 = sen w, µ(1 c2 = cos w) . r2 (11.17) La expresión 1 (R1 , T1 ) = 0 define la relación entre las componentes del vector velocidad X 1 para que el punto P2 pertenezca a la órbita O(x1 , X 1 ). Análogamente 2 (R2 , T2 ) = 0 implica que la órbita O(x2 , X 2 ) pase por P1 . p Finalmente, a partir de las relaciones (11.11), podemos obtener el valor de µp y e2 por las expresiones ✓ ◆2 r 2 R2 T 2 rT p 2 µp = rT, e = + 1 . µ2 µ Una órbita kepleriana que pase por P1 y P2 debe tener unos valores p, e constantes por lo que deben verificarse las relaciones r1 T 1 r12 R12 T12 + µ2 ✓ r1 T 1 µ ◆2 1 r22 R22 T22 µ2 ✓ r2 T 2 µ r2 T 2 = 0, (11.18) ◆2 = 0. (11.19) 1 Hodógrafa en P1 y P2 181 Cualquiera de estas dos condiciones, (11.18 y 11.19), junto con (11.14 y 11.16), constituyen un conjunto de tres relaciones independientes entre las componentes R1 , T1 , R2 , T2 de la velocidad para que la órbita kepleriana pase por los dos puntos y nos asegura que las órbitas O(x1 , X 1 ) y O(x2 , X 2 ) coinciden. Por simplicidad, parece lógico elegir como tercera condición la expresión 3 (R1 , T1 , R2 , T2 ) = r1 T 1 r2 T2 = 0. (11.20) Sin embargo, cuando el ángulo de trasferencia sea w = ⇡, el valor de bi en las dos primeras condiciones se hace cero, por lo que estas condiciones se transforman en a1 T12 + c1 = 0, a2 T22 + c2 = 0, que no forman un sistema independiente con la condición (11.20). En éste la expresión de 3 en la tercera condición, 3 (R1 , T1 , R2 , T2 ) = 0, es la parte izquierda de (11.19). La relación (11.14) indica cómo debe ser el vector velocidad en el punto P1 para que la órbita kepleriana generada pase por el punto P2 . Esta relación representa la ecuación de una hipérbola con dos ramas separadas por las ası́ntotas T1 = 0 y a1 T1 + b1 R1 = 0. La primera de las condiciones (11.12), indica que la hodógrafa queda representada únicamente por la rama superior de la hipérbola. La figura 11.3 presenta dos de estas curvas para valores distintos de ci , positivo y negativo. p La velocidad v1 = R12 + T12 , en el punto P1 , puede ser repreT1 sentada en la gráfica 11.3 como una semicircunferencia de radio v1 . Si esta semicircunferencia tiene algún punto en común con la hodógrafa los puntos de intersección señalan las velocidades en P1 que permiten que la órbita pase por P2 . De acuerdo con la gráfica existirá un valor mı́nimo de la velocidad por debajo del cual Figura 11.3: Hodógrafa en P1 no hay intersección entre la hodógrafa y la semicircunferencia, lo que representa que no es posible, con esa velocidad, conectar P1 con P2 con una órbita kepleriana. R1 Por encima de esa velocidad mı́nima existirán, para cada valor de v1 , dos puntos de la hodógrafa, lo que representa dos órbitas keplerianas de transferencia. Para la velocidad mı́nima existirá una única órbita kepleriana de transferencia. 182 11.5 Órbitas keplerianas que pasan por dos puntos Órbitas de energı́a mı́nima Para conocer el valor de la velocidad mı́nima que permite conectar los dos puntos será preciso minimizar la función v12 = R12 + T12 sujeta a la condición 2 1 (R1 , T1 ) = a1 T1 + b1 R1 T1 + c1 = 0. El método de los multiplicadores de Lagrange, permite obtener1 el valor p ✓ ◆ 2c1 (a1 + a21 + b21 ) 1 1 2 vm = = 2µ , b21 r1 donde se ha expresado vm en términos de r1 , r2 y w, y posteriormente se han aplicado las relaciones entre los lados y los ángulos del triángulo OP1 P2 , siendo el semiperı́metro del triángulo. Teniendo en cuenta la relación entre la velocidad en un punto y la energı́a de la órbita h = v 2 /2 µ/r, y aplicándola al punto P1 con la velocidad mı́nima, obtendremos la energı́a de la órbita de velocidad mı́nima h= µ , (11.21) que representa, por tanto, la órbita de mı́nima energı́a entre P1 y P2 . Esta energı́a es negativa, por lo que la órbita correspondiente será elı́ptica, y de semieje igual a a = /2. Cualquier otra órbita de O(P1 , P2 ) tendrá una energı́a h > hm y por tanto un semieje a > /2. 11.6 Órbitas de energı́a h > hm Igual que hemos razonado antes sobre la velocidad en la gráfica 11.3 puede razonarse sobre la energı́a. A partir del valor de la energı́a mı́nima hm , cualquier valor de la energı́a h, mayor que hm , conduce a dos órbitas keplerianas que conectan los dos puntos. Estas dos órbitas se deducen a partir de los dos vectores velocidad (R1 , T1 ) intersección de la hodógrafa con la semicircunferencia cuyo radio es igual a la velocidad correspondiente a la energı́a h. Para obtener estos valores bastará resolver el sistema de ecuaciones 1 2 (R + T12 ) 2 1 µ r1 h = 0, a1 T12 + b1 R1 T1 + c1 = 0, (11.22) que tendrá dos soluciones para cada valor de h > hm . Una vez obtenidos los valores de R1 y T1 , ası́ como el sistema orbital, (u1 , v1 , n), en P1 , la relación (11.9) permite obtener el vector X 1 en el sistema espacial y 1 Se obtienen cuatro extremos de los que se desechan tres por dar un valor de T negativo o 1 imaginario. Órbitas de energı́a h > hm 183 con éste y x1 , los elementos de la órbita O(x1 , X 1 ) que coincide con la órbita de transferencia Ot (x1 , x2 ) de energı́a h. Una vez obtenida la órbita podemos obtener fácilmente el tiempo t que se emplea en llegar desde P1 hasta P2 . Este tiempo depende de la energı́a h, por lo que se convierte en una función t(h). Para encontrar los valores R1 , T1 de la velocidad podemos utilizar un método numérico que resuelva el sistema de ecuaciones no lineal (11.22). Sin embargo, la aplicación de las funciones de Stump↵ permite encontrar analı́ticamente estas dos órbitas. Para ver esto efectuaremos el siguiente cambio de variable: R1 = x cos T1 = x sen 1 y sen 2 1 + y cos 2 1 2 1 2 , , mediante el cual la ecuación de la hodógrafa en P1 se transforma en x2 tan 1 2 y 2 cot 1 2 = 2µ w tan , r1 2 (11.23) y la norma de la velocidad en P1 se expresará ahora como v12 = R12 + T12 = x2 + y 2 . (11.24) El sistema de ecuaciones (11.22) se ha transformado en un sistema lineal, en las variables x2 , y 2 , de ecuaciones (11.23) y (11.24). Modificaremos ligeramente este sistema sustituyendo en la última ecuación el valor de la velocidad por su expresión en función de una energı́a h cualquiera, mayor que la energı́a mı́nima, esto es 2µ x2 + y 2 = v12 = + 2h. r1 Resolviendo este sistema, después de sustituir el valor de tan w/2 por su expresión en función de los elementos del triángulo OP1 P2 , se llega a x2 = y2 = c)( r1 ) , cr1 cr1 r2 ( r2 ) 2µ + 2h . cr1 cr1 2µ r1 + 2h ( Si introducimos las cantidades auxiliares , por medio de las igualdades s r , = 2 V1 1 ( ; 2h), V1 ( ; 2h) = 2 2µ 2µ s (11.25) r c c 1 , = 2 V1 ( ; 2h), V1 ( ; 2h) = 2 2µ 2µ 184 Órbitas keplerianas que pasan por dos puntos ası́ como las constante xp , yp en la forma r1 , cr1 x2p = 2µ r2 , cr1 yp2 = 2µ podremos poner x2 = x2p V02 ( ), 2 y 2 = yp2 V02 ( ), 2 donde, una vez fijado el nivel h de energı́a, hacemos desaparecer de las funciones de Stump↵ el segundo parámetro. Al estudiar la figura 11.3, en relación con la hodógrafa del movimiento en P1 , hemos visto como la única rama posible es aquella para la cual T1 es positiva, lo que equivale a considerar la rama superior. Al efectuar el giro, la rama anterior de la hipérbola se transforma en aquella para la cual x > 0. Teniendo esto en cuenta, podemos extraer la raı́z cuadrada en las expresiones anteriores, llegándose a x = xp V0 ( ), 2 y = ±yp V0 ( ), 2 que nos da los dos posibles valores de la velocidad asociados a un nivel de energı́a h > hm . Las dos velocidades nos indicarán que para cada nivel de energı́a existen dos posibles órbitas keplerianas, que pasan por P1 , P2 . Volviendo de nuevo a la expresión de la hodógrafa antes de efectuar el giro tendremos T1 = x sen 1 2 + y cos 1 2 1 1 = xp V0 ( ) sen ± yp V0 ( ) cos , 2 2 2 2 donde sustituyendo el seno y coseno de ( 1 /2) por su valor, dado en (11.7), llegamos a s 2µ p T1 = ( r1 )( r2 ) V0 ( ) cr1 2µ 2 s p 2µ w c ± ( r1 )( r2 ) V0 ( ) cr1 2µ 2 2µ p = ( r1 )( r2 ) V 0 ( ) V 1 ( ) ± w V 0 ( ) V 1 ( ) , cr1 2 2 2 2 y finalmente a T1 = 2µ p ( cr1 r1 )( r2 ) V 1 ✓ ± 2 w ◆ , (11.26) que nos da los dos valores de la velocidad transversal asociados a la energı́a h. Conjunto de las órbitas que pasan por dos puntos 185 Recordando la expresión p = r2 T 2 /µ, del semilado recto en función de la velocidad transversal, podemos obtener el semilado recto de cada una de las dos órbitas correspondientes a la energı́a h en la forma ✓ ◆ ( r2 )( r1 ) 2 ± w p± = pi = 4µ , (11.27) V1 c2 2 donde hemos asociado el ı́ndice de p al signo correspondiente. Observemos que el valor de p± para w coincide con el de p⌥ para 2⇡ w, y viceversa. 11.7 Conjunto de las órbitas que pasan por dos puntos Hemos visto que para cada tipo de transferencia, directa o retrógrada, obtenemos un ángulo de transferencia w, y a partir de éste los dos elementos que definen el plano de la órbita ⌦, i que son comunes para todas las órbitas que pasan por los dos puntos. Una vez fijado w, podemos obtener el valor hm de la órbita de mı́nima energı́a que pasa por los dos puntos. Obtenido éste, cada valor h > hm nos dará dos órbitas O1 (h), O2 (h), cuyos elementos orbitales serán obtenidos en este apartado. Fijado h, su signo, combinado con la expresión del semieje en función de la energı́a, nos permite calcular el semieje de la órbita. Además, los semilados rectos de las dos órbitas vienen dados por los valores p± de la ecuación (11.27). Si fijamos, en lo que sigue, el semilado p de una de estas dos órbitas, esto es p+ o p , podemos obtener el resto de elementos orbitales para esa órbita. Si llamamos W = f2 + f1 y recordamos que w = f2 f1 , ası́ como las expresiones (11.11), que nos dan el valor de e cos f y e sen f , podremos poner ✓ ◆ w W 1 1 p p cos cos = (cos f1 + cos f2 ) = + 2 , 2 2 2 2e r1 r2 ✓ ◆ w W 1 1 p p sen sen = (cos f1 cos f2 ) = , 2 2 2 2e r1 r2 que finalmente conduce a W 2 W e sen 2 e cos = = ✓ ◆ 1 p p w + 2 sec , 2 r1 r2 2 ✓ ◆ 1 p p w csc , 2 r1 r2 2 que nos permite calcular e y W para cada uno de los dos casos. A partir de w y W podemos calcular, sin ambigüedad, f1 y f2 f1 = W +w , 2 f2 = W w 2 . (11.28) 186 Órbitas keplerianas que pasan por dos puntos Puesto que conocemos el vector l del sistema nodal y el vector u1 del sistema orbital en P1 podemos calcular el ángulo ✓1 que va de l a u1 . Por otro lado, como sabemos que ✓1 = ! + f1 , esto nos permite calcular el valor del argumento del periastro !. El último elemento orbital, la época de paso por el periastro, puede ser calculado si tenemos en cuenta la relación (10.36) que invertida nos da unos valores de s1 , s2 , correspondientes a f1 , f2 , en la forma r p 1 fi si = 2 Vt 1 ( tan ; 2h). µ1+e 2 A partir de s1 la segunda ecuación (10.29) t nos da el valor de t1 T si conocemos t1 . 11.8 T = rp s + µe V3 (s), (11.29) T , lo que permite calcular la época de paso por el periastro Tiempo de tránsito La misma ecuación (11.29) nos permite obtener una expresión que nos da el tiempo de tránsito entre P1 y P2 , para cada una de las órbitas con energı́a h, como p t(h) = (s2 s1 ) + µe [V3 (s2 ) V3 (s1 )] . (11.30) 1+e La figura 11.4(a) nos muestra la gráfica correspondiente a los tiempos de transferencia, en función de la energı́a h, después de fijar los puntos P1 , P2 y el tipo de transferencia (directa o retrógrada). La figura 11.4(b) muestra el conjunto de todas las órbitas de transferencia para el mismo caso. En la figura 11.4(a) podemos comprobar que no hay ningún valor a la izquierda de la energı́a mı́nima hm . El valor tm corresponde al tiempo de transferencia de la órbita elı́ptica correspondiente a esta energı́a. Esta órbita es la órbita Em de la figura 11.4(b). Si aumentamos la energı́a a un valor hm < h < 0 nos encontramos dos valores de t, ambos correspondientes a las dos órbitas elı́pticas correspondientes a la energı́a h. Uno de los tiempos es menor que tm , el correspondiente a la órbita E1 de la figura 11.4(b), mientras que el otro es mayor que tm y corresponde a E2 . Como se ve en la figura 11.4(b) el tiempo de tránsito en cada caso se corresponde con un mayor arco recorrido. Si continuamos aumentando h, con valores negativos tendiendo su valor hacia cero, una de las dos ramas de la curva tiende a 1 mientras que el otro tiende al valor de tp correspondiente a la órbita parabólica de energı́a h = 0 (órbita P en la figura 11.4(b)). Órbitas keplerianas que pasan por dos puntos en dos instantes 187 E2 t Em hm h 0 E1 P (a) Tiempo de tránsito H (b) Tipo de órbitas Figura 11.4: Transferencias en función de la energı́a h Finalmente, para valores de energı́a positivos, órbitas hiperbólicas, encontramos dos valores de t uno positivo y otro negativo. El valor negativo puede olvidarse, pues corresponde a una órbita imposible que proviene, en el lı́mite, de las órbitas elı́pticas de excentricidad muy grande y tiempo de tránsito tendiendo a infinito, que en el lı́mite se transforman en una parábola y posteriormente en hipérbolas. La única órbita posible para una energı́a positiva h es la que tiene un tiempo de tránsito positivo y menor que tp (órbita H en la figura 11.4(b)). 11.9 Órbitas keplerianas que pasan por dos puntos en dos instantes dados t1 , t2 Si atendemos a la figura 11.4(a) podemos comprobar que, dado un tiempo t de tránsito entre P1 y P2 , existe una y sólo una órbita de trasferencia ente los dos puntos, lo que demuestra que la solución del problema de Lambert es única. Habitualmente, cuando se requiere la resolución de problema de Lambert para el cálculo de las órbitas keplerianas que pasan por dos puntos en dos instantes dados t1 , t2 , suele recurrirse, entre otros, al método iterativo de Gauss. En este apartado vamos a proponer un nuevo método, basado en las propiedades del tiempo de transferencia del apartado anterior y que será muy simple de implementar y comprender y además es válido para cualquier tipo de movimiento. El lector interesado puede acudir a la literatura clásica, donde se describen otros método que resuelven el mismo problema de forma más eficiente aunque, generalmente, menos didáctica. 188 Órbitas keplerianas que pasan por dos puntos Una vez fijado el sentido de la transferencia, y por tanto su ángulo w, intentaremos invertir la ecuación (11.30), esto es, intentaremos obtener el valor de la energı́a h que nos da el tiempo de transferencia t = t2 t1 especificado2 . No conocemos de manera explı́cita la función t = t(h) que nos da el tiempo de la transferencia en función de la energı́a, ni su derivada, por lo que no podemos utilizar el clásico método de Newton para el cálculo de las raı́ces de la ecuación. Sin embargo, la suavidad de la gráfica de dicha función, ası́ como el conocimiento sencillo, de los puntos tm , tp , que separan los distintos comportamientos de la función, permiten aplicar el método de la secante o regula–falsi, que aunque de convergencia no demasiado rápida nos da unos resultados suficientemente buenos en cualquier circunstancia. Dada una función f (x) = 0 y un intervalo [a, b] donde existe una sola raı́z, y por tanto signo(f (a)) 6= signo(f (b)), el método de la secante calcula un punto c, más próximo a la raı́z, por medio de la expresión c=a (b a)f (a) . f (b) f (a) Si dicho punto no está suficientemente cerca de la raı́z, sustituimos el intervalo [a, b] por otro [a, c] o bien [c, b] según que signo(f (a)) 6= signo(f (c)) o bien signo(f (c)) 6= signo(f (b)). Una vez tomado este nuevo intervalo se repite el proceso de forma iterativa. Con objeto de elegir el intervalo, de manera que el método sea convergente, basta comparar t2 t1 con tm y tp . 0 < tp < tm < t2 t2 t2 t2 t2 t1 t1 t1 t1 t1 , < = < = tp , tp , tm , tm , La función f (h) se elige de entre las dos siguientes: ) ) ) ) ) it h 2 [0, 1), h = 0, h 2 [hm , 0], h = hm , h 2 [hm , 0]. teniendo en cuenta las tres reglas Si t2 t1 < tp se toma un valor cualquiera h0 positivo y se elige el valor f (h) = t(h), tal que t(h0 ) > 0. Si tp < t2 t1 < tm se toma un valor cualquiera h0 negativo y mayor que hm y se elige el valor f (h) = t(h), tal que t(h0 ) < tm . Si tm < t2 t1 se toma un valor cualquiera h0 negativo y mayor que hm y se elige el valor f (h) = t(h), tal que t(h0 ) > tm . 2 Para aplicar este método podemos conocer el intervalo de tiempo de paso por P1 y t2 de paso por P2 . t o bien los instantes t1 Parte III Movimiento orbital 189 Capı́tulo 12 Movimiento orbital 12.1 Ecuaciones del movimiento orbital En el capı́tulo 7 se han presentado las ecuaciones del movimiento kepleriano, bien en su forma de ecuaciones de orden dos (7.23), o bien como ecuaciones de orden uno (7.24). Ambos conjuntos de ecuaciones responden al modelo, que hemos llamado movimiento kepleriano, del movimiento relativo de un punto material respecto de otro, cuando ambos están atraı́dos por la ley de atracción gravitacional de Newton. Este modelo es una aproximación a la realidad, pues parte de dos premisas que son falsas: no existen dos cuerpos aislados y éstos en ningún caso representan puntos infinitesimales sino que son sistemas finitos de masas (sólidos). Además, existen muchos otros efectos, gravitacionales y no gravitacionales, que modifican el comportamiento del movimiento kepleriano y que dan lugar a lo que llamaremos movimiento orbital, que constituye una mejor aproximación al movimiento de los cuerpos observado en el sistema solar. La mayor parte de los problemas orbitales pueden ser formulados a través de un sistema de ecuaciones diferenciales similar a las del modelo kepleriano: ẍ + µ x = P, r3 (12.1) donde se añade el vector P, que representa la perturbación o aceleración que produce la perturbación. El sistema dado por (12.1) puede representarse también como: ẋ = X, (12.2) µ x + P. Ẋ = 3 r 192 Movimiento orbital Cuando se verifique la condición k P k ⌧ µ/r2 , esto es, cuando la aceleración que produce la perturbación sea mucho menor que la kepleriana, la solución del sistema (12.1) o (12.2), será llamada movimiento kepleriano perturbado o simplemente movimiento orbital. Si existe una función Vp tal que se cumpla P= podemos definir un hamiltoniano H H(x, X) = Hk + Vp = rx Vp , 1 X ·X 2 (12.3) µ + Vp , kxk (12.4) como suma del hamiltoniano kepleriano Hk , dado en (7.25), y la función Vp que llamaremos potencial perturbador. Las ecuaciones de Hamilton aplicadas a este hamiltoniano coinciden con las ecuaciones (12.2) del movimiento orbital, por lo que ambos sistemas son equivalentes y llamaremos a H(x, X) hamiltoniano del movimiento orbital. 12.2 Ecuaciones de Lagrange El movimiento orbital, en ausencia de perturbaciones, coincide con el kepleriano y puede ser descrito a través de un conjunto de constantes como son los elementos orbitales. Cuando aparecen pequeñas perturbaciones el modelo puede considerarse como instantáneamente kepleriano, esto es, en un cierto instante t0 el movimiento puede ser descrito a través de seis constantes (a0 , e0 , i0 , ⌦0 , !0 , T0 ), llamadas elementos orbitales osculadores, que varı́an para un instante posterior. De esta forma, los elementos orbitales pasan de ser constantes a ser variables en t y las funciones (a(t), e(t), i(t), ⌦(t), !(t), T (t)) permiten establecer la órbita osculatriz para cada instante y, con ella, cualquier elemento, incluidas la posición y la velocidad. Para encontrar las ecuaciones que rigen la variación de los elementos orbitales con respecto al tiempo, que integradas nos determinarán el movimiento orbital, deduciremos la relación diferencial entre éstas y las variables de Delaunay, vistas en el apartado 9.9. Diferenciando la expresión que define el movimiento medio n2 a3 = µ, podemos poner 2na3 dn + 3n2 a2 da = 0, de donde obtenemos dn = Diferenciando la expresión ` = n(t dado en (12.5) obtenemos d` = n dt n dT 3n da. 2a (12.5) T ) y sustituyendo el valor de dn por el 3n (t 2a T ) da. (12.6) Ecuaciones de Lagrange 193 Las identidades g = !, h = ⌦, permiten poner dg = d!, dh = d⌦. (12.7) Las expresiones de los momentos de Delaunay (9.54) pueden ponerse también como L2 = µ a, G2 = L2 (1 e2 ), H = G ci , donde hemos introducido la notación ci = cos i, si = sen i, (12.8) que será usada de aquı́ en adelante. Diferenciando la primera de las relaciones anteriores se tiene dL = µ da. 2L (12.9) Diferenciando la expresión de G y sustituyendo dL por su valor (12.9) se llega a dG = µG da 2L2 L2 e de. G (12.10) Finalmente, tras haber sustituido dG por su valor, dado en (12.10), se obtendrá para H dH = µG ci da 2L2 L2 e ci de + Gsi di. G (12.11) Reuniendo las expresiones (12.6),(12.7),(12.9),(12.10),(12.11), resolviendo el sistema de ecuaciones en da, de, di, d⌦, d!, dT y sustituyendo las diferenciales por las derivadas respecto al tiempo obtendremos finalmente: da dt de dt di dt d⌦ dt d! dt dT dt = = = = = = 2L dL , µ dt G2 dL G dG , 3 eL dt eL2 dt ci dG 1 dH , Gsi dt Gsi dt dh , dt dg , dt 1 d` 3L dL 1 (t T ) . n dt aµ dt (12.12) 194 Movimiento orbital Si expresamos el hamiltoniano del movimiento orbital H en variables de Delaunay µ2 H= + Vp , 2L2 las ecuaciones de Hamilton en estas variables serán: d` dt dg dt dh dt = = = µ2 @Vp + , L3 @L @Vp , @G @Vp , @H dL dt dG dt dH dt = = = @Vp , @` @Vp , @g @Vp . @h (12.13) Aplicando la regla de la cadena para expresar las derivadas de Vp respecto de las variables de Delaunay en función de las derivadas de Vp respecto de elementos orbitales se tendrá @Vp @Vp @a @Vp @e @Vp @i @Vp @⌦ @Vp @! @Vp @T = + + + + + , @ @a @ @e @ @i @ @⌦ @ @! @ @T @ donde (12.14) representa una cualquiera de las variables de Delaunay. Llevando (12.14) a (12.13), éstas a (12.12) y sustituyendo las variables de Delaunay por los elementos orbitales se llegará finalmente a las expresiones: da dt de dt di dt d⌦ dt d! dt d` dt = = = = = = 2 @Vp , na @` p 1 e2 @Vp 1 e2 @Vp , na2 e @! na2 e @` 1 @Vp c @Vp p p i , 2 2 2 2 na 1 e si @⌦ na 1 e si @! 1 @Vp p , nap2 1 e2 si @i 1 e2 @Vp c @Vp p i + , na2 e @e na2 1 e2 si @i 2 @Vp 1 e2 @Vp n+ + , na @a na2 e @e (12.15) que son llamadas ecuaciones de Lagrange del movimiento planetario o simplemente ecuaciones de Lagrange y nos dan la variación de los elementos orbitales de la órbita perturbada por un potencial Vp .1 La última ecuación de Lagrange nos da la variación de la anomalı́a media con respecto al tiempo en lugar de la variación de la época de paso por el periastro. 1 En alguna publicación encontraremos las mismas expresiones con signo de V cambiado, p debido a que toman Vp como la función de fuerzas en lugar del potencial. Ecuaciones de Gauss 195 p Esto es ası́ porque teniendo en cuenta la relación ` = µ/a3 (t T ) podemos obtener la variación de T a partir de la de `. Esta relación es más útil pues permite expresar un cambio de variable de t a ` o, a través de ésta, a las anomalı́as verdadera o excéntrica, que será la variable independiente en la que vendrá expresada habitualmente la perturbación. 12.3 Ecuaciones de Gauss Para determinado tipo de perturbaciones y de análisis es mejor la formulación de las ecuaciones usando la fuerza perturbadora en lugar del potencial. Como sabemos, la relación entre ambas vendrá dada por rx Vp = P, (12.16) donde P = P S representa la fuerza expresada en el sistema de referencia espacial. Habitualmente la fuerza perturbadora viene expresada en el sistema de referencia orbital, P U , por medio de las componentes (Pu , Pv , Pn ), o en el de Frenet P F con las componentes (Pt , Ps , Pn ). La relación entre el P y P U viene dada por P = P S = R3 (⌦)R1 (i)R3 (! + f )P U , (12.17) esto es, se obtiene mediante el giro que pasa del sistema espacial al orbital. Combinando (12.16) con (12.17) se obtiene la expresión de rx Vp en función de las componentes de la fuerza en el sistema orbital. Finalmente, las expresiones de las derivadas @Vp /@ , donde sigma representa cualquier elemento orbital, se obtienen aplicando la regla de la cadena a través de la expresión @Vp = rx Vp · x , @ (12.18) @x @y @z donde x = ( , , ) se obtiene derivando, respecto a cada variable orbital @ @ @ , las componentes del vector x x = R3 (⌦)R1 (i)R3 (! + f )r, donde hemos llamado r = (r, 0, 0). (12.19) 196 Movimiento orbital Realizando todo este conjunto de operaciones se llega a las expresiones: @Vp @a @Vp @e @Vp @i @Vp @⌦ @Vp @! @Vp @` = r Pu , a = a cos f Pu r(2 + e cos f ) sen f Pv , 1 e2 = r sen(! + f )Pn , = rci Pv + rsi cos(! + f )Pn , = rPv , (12.20) = ae sen f p Pu 1 e2 a2 (1 p r 1 e2 ) Pv . e2 Finalmente, sustituyendoplos valores de las expresiones (12.20) en las ecuaciones (12.15), y llamando ⌘ = 1 e2 , obtenemos las ecuaciones: da dt de dt di dt d⌦ dt d! dt d` dt = = = = = = 2e sen f 2a⌘ Pu + Pv , n⌘ nr ✓ 3 ◆ ⌘ sen f ⌘ r⌘ Pu + Pv , an e r n a2 e n r cos(! + f ) Pn , a2 n ⌘ r sen(! + f ) Pn , a2 n si ⌘ ⌘ cos f r(2 + e cos f ) sen f r sen(! + f ) ci Pu + Pv + Pn , aen a2 n e ⌘ a 2 n si ⌘ ✓ ◆ 2 r ⌘ 2 cos f r(2 + e cos f ) sen f n+ + Pu Pn . a2 n aen a2 e n (12.21) que son llamadas ecuaciones de Gauss. Observando las ecuaciones de Gauss podemos sacar una serie de conclusiones interesantes del movimiento orbital: El semieje y la excentricidad solo están perturbados por la componente radial y transversal de la fuerza perturbadora. Si esta fuerza es perpendicular al plano orbital el semieje y la excentricidad no varı́an. La inclinación y el ángulo del nodo solo dependen de la componente normal de la fuerza perturbadora. Si esta fuerza está contenida en el plano del movimiento la inclinación y el ángulo del nodo, o lo que es igual el plano orbital, no varı́an. Perturbaciones de corto y largo periodo y seculares 197 Si tenemos en cuenta las relaciones entre (Pu , Pv , Pn ) y (Pt , Ps , Pn ) dadas por P U = R3 ( ) · P F y las llevamos a (12.21) podemos obtener otra versión de las ecuaciones de Gauss en función de las componentes de la fuerza en el sistema de Frenet. 12.4 Perturbaciones de corto y largo periodo y seculares Cuando se analiza el comportamiento del movimiento orbital frente al kepleriano, sea cual sea el tipo de fuerza externa que actúa sobre el orbitador, se observan tres tipos distintos de perturbaciones en el movimiento orbital. Supongamos que queremos analizar la evolución de un elemento orbital, , que en el movimiento kepleriano representa una constante y por tanto viene representado, en la gráfica 12.1, por una lı́nea recta. En el movimiento orbital este parámetro dejará de ser constante y su variación vendrá representada por la función (t) que puede contener términos de tres tipos: Términos de tipo polinómicos en t. Estos términos producen un desplazamiento secular de la gráfica de respecto de su valor kepleriano constante. Términos en seno y coseno de las variables angulares !, ⌦, i. Puesto que el valor de estas variables angulares varı́a muy lentamente estos términos producen una oscilación periódica, de periodo muy grande. Estos términos son llamados de largo periodo. Finalmente aparecen senos y cosenos de la variable ` que tiene el periodo de la órbita. Estos términos producen pequeñas oscilaciones en torno a la combinación de la perturbación secular y de largo periodo, y son llamados de corto periodo. Figura 12.1: Perturbaciones de corto y largo periodo y seculares. Si se precisa la posición y velocidad de un cuerpo en su órbita en una instante dado es preciso obtener las tres perturbaciones. Sin embargo, si únicamente se desea conocer como evolucionará una órbita a largo plazo, sin preocuparnos de la posición instantánea del cuerpo, podemos prescindir de las perturbaciones de corto periodo y analizar únicamente las de largo periodo y seculares. 198 Movimiento orbital Esto enlaza con el concepto, muy usado en Astrodinámica, de elementos osculadores y elementos medios. Los elementos orbitales, que son constantes en el movimiento kepleriano, se convierten en funciones de t en el movimiento orbital. A los elementos orbitales particularizados en un instante dado se les llama elementos osculadores, porque en dicho instante estos elementos definen una órbita kepleriana instantánea, llamada órbita osculatriz, que tiene un punto de contacto con la órbita real, justo en el punto del espacio que ocupa el orbitador en el instante en que se han calculado los elementos orbitales. La órbita osculatriz en cada instante representa perfectamente todas las caracterı́sticas de la órbita real pero únicamente en ese instante. Los elementos medios son los elementos que se obtienen promediando los elementos osculadores en un periodo orbital. Esto supone, en la práctica, eliminar las perturbaciones de corto periodo, lo que nos permite conocer la evolución de largo periodo y secular. La aplicación de las expresiones del movimiento kepleriano a la órbita promediada, formada a partir de los elementos medios, nos da únicamente una aproximación al comportamiento de la órbita real. 12.5 Método de aproximaciones sucesivas Las perturbaciones de los problemas orbitales vienen expresadas habitualmente como un desarrollo en serie de potencias de un pequeño parámetro ✏. Las bases matemáticas del tratamiento asintótico de las teorı́as de perturbaciones están a menudo camufladas por el gran número de variables y de términos de sus expresiones. Un ejemplo muy simple nos servirá para ilustrar, tanto el método clásico de aproximaciones sucesivas, como el concepto de orden de aproximación de una teorı́a. Sea la ecuación diferencial de primer orden dada por ẋ = 2 ✏ t x, x0 = x(t = 0), ✏ ⌧ 1, (12.22) cuya solución general puede expresarse en la forma 2 x = x0 e✏t , (12.23) cuyo desarrollo en serie de potencias en torno a ✏ viene dado por la expresión X ✏i ✏2 x = x0 t2i = x0 1 + ✏t2 + t4 + . . . . (12.24) i! 2 i 0 Podemos suponer la solución x(t) de la ecuación (12.22) como el resultado de perturbar la ecuación diferencial ẋ = 0, cuya solución es x = x0 , con una pequeña perturbación 2 ✏ t x0 . De esta forma, la solución del problema perturbado será x = x0 + ✏x1 (t) + ✏2 x2 (t) + . . . . (12.25) Perturbaciones de primer orden en el movimiento orbital 199 El método de aproximaciones sucesivas consistirá en calcular sucesivamente, orden a orden, las expresiones de x1 (t), x2 (t), etc. Como primera aproximación a la ecuación diferencial (12.22) usaremos la solución de ésta haciendo ✏ = 0, esto es de ẋ = 0, que integrada nos da x = x0 . Ésta será llamada solución de orden cero o del problema no perturbado, porque en ella no aparece ✏ ni, por lo tanto, el efecto de la perturbación. En el problema orbital la solución de orden cero coincidirá con la del modelo kepleriano. Una solución más aproximada se obtiene tomando como ecuación diferencial el resultado de sustituir la solución de orden cero en la ecuación (12.22), con lo que la ecuación diferencial se transforma en ẋ = 2 ✏ t x0 , o bien, dx = 2 ✏ t x0 dt, cuya integración nos da Z t x x0 = 2 ✏ x0 t dt = ✏ x0 t2 , 0 ⇥ ⇤ o lo que es igual x = x0 1 + ✏ t2 , que es llamada solución de primer orden, pues en ella aparecen términos lineales en ✏. Para aumentar la aproximación, introduzcamos la solución de primer orden en la ecuación original (12.22) lo que nos lleva a la ecuación diferencial que integrada resulta ⇥ ⇤ dx = 2✏x0 1 + ✏ t2 t, dt (12.26) ✏2 4 t , (12.27) 2 y es llamada solución de orden dos. El proceso puede repetirse hasta obtener la precisión deseada, obteniéndose términos cada vez más pequeños que se aproximan cada vez más a la solución correcta. Como puede verse, la solución de orden n corresponde a truncar el desarrollo en serie (12.24) en el orden n. x0 1 + ✏ t2 + 12.6 Perturbaciones de primer orden en el movimiento orbital En el problema orbital no perturbado el valor de Vp = 0, llevado a las ecuaciones de Lagrange (12.15), nos permite obtener la solución de orden cero, que puede expresarse en elementos orbitales como = 0 , donde usaremos el sı́mbolo para representar uno cualquiera de los seis elementos orbitales y para el vector de elementos orbitales ordinarios = (a, e, i, ⌦, !, T ). El valor de la perturbación Vp no suele venir expresado en función de t sino de la anomalı́a verdadera f o la excéntrica E, por lo que las ecuaciones de Lagrange estarán expresadas en una de las dos formas que siguen: ˙ = ( , f) = ( , E). (12.28) 200 Movimiento orbital La solución de primer orden se obtendrá sustituyendo por 0 en la parte derecha de las ecuaciones de Lagrange e integrando éstas. De esta forma, el sistema de ecuaciones diferenciales puede tratarse como seis ecuaciones diferenciales que pueden integrarse de manera independiente, obteniendo, por separado, la variación de primer orden de cada uno de los elementos orbitales por medio de las ecuaciones ˙ = ( 0, f ) = ( 0 , E). (12.29) Si Vp viene expresada en función de f será necesario sustituir ˙ por d /d f . Para ello, teniendo en cuenta la ley de las áreas r2 f˙ = G, podremos poner d d dt r2 = = ( df dt df G 0, f ) = p2 ( 0, f ) , G (1 + e cos f )2 que integrada nos dará la solución de primer orden 0 = Z p2 G f 0 ( 0, f ) d f. (1 + e cos f )2 (12.30) Si Vp viene expresada en función de E será necesario sustituir ˙ por d /d E. Para ello, teniendo en cuenta la ecuación de Kepler, n t = E e sen E, podremos poner Ė = n/(1 e cos E) = na/r, y por tanto d d dt r = = ( dE dt dE na 0 , E) = 1 ( na 0 , E)(1 e cos E), que integrada nos dará la solución de primer orden 0 1 = na Z E ( 0 , E)(1 e cos E)d E. (12.31) 0 La elección de (12.30) o (12.31) para la integración dependerá de cual de las dos es más fácil de integrar. En general el criterio buscado será que las expresiones trigonométricas aparezcan siempre en el numerador del integrando. Si en las ecuaciones (12.30) y (12.31) tomamos el valor 2⇡ como lı́mite superior de integración lo que obtenemos es la variación de primer orden de cada elemento orbital en un periodo o vuelta de la órbita. Esto es equivalente a promediar sobre la variable ` y por tanto eliminar la dependencia de esta variable. Lo que obtenemos entonces es la variación de largo periodo y secular que nos indicará la evolución a largo plazo de la órbita. 12.7 Propagadores orbitales La variación de primer orden de los elementos orbitales nos da un grado de aproximación mejor que la aproximación kepleriana y puede ser suficiente para Propagadores orbitales 201 determinadas aplicaciones, sin embargo, no lo es cuando se requiere una gran precisión. El objetivo de este libro se aparta de la Mecánica Celeste clásica por lo que no abordaremos el problema del movimiento de planetas y otros astros del sistema solar, de hecho, supondremos que se dispone de un modelo preciso del movimiento del mismo, sin el cual no podremos formular perturbaciones como la del tercer cuerpo o la presión de radiación que veremos en capı́tulos posteriores. Este modelo de sistema solar puede encontrarse2 en las rutinas JPL Planetary and Lunar Ephemerides DE405. Como se verá en capı́tulos posteriores la formulación de las perturbaciones que actúan sobre la órbita de una nave espacial es muy compleja, además, en la mayor parte de los casos, contiene elementos mal modelados o de muy difı́cil cálculo, por ello, una integración de precisión de un problema orbital resulta una ardua tarea. Tradicionalmente existen tres formas de abordar esta integración: los métodos analı́ticos, que en Astrodinámica se llaman a veces métodos generales de perturbaciones; los numéricos, también llamados métodos especiales de perturbaciones; y finalmente los seminuméricos. La existencia de una expresión analı́tica que determine la evolución de un parámetro orbital con respecto al tiempo es la situación óptima para el estudio de un sistema dinámico, sin embargo, esto exige una integración analı́tica de las ecuaciones diferenciales de dicho sistema lo que en la mayor parte de los casos resulta una tarea casi imposible. En el caso de que no se disponga de dicho modelo analı́tico será necesario acudir a un modelo numérico, que partiendo del valor de los parámetros orbitales en el instante inicial, construye la solución, paso a paso en el tiempo, hasta llegar al instante deseado. En el caso de la navegación espacial no es posible encontrar una integración analı́tica para un modelo que considere todas las perturbaciones, sin embargo, si son posibles estas integraciones efectuando ciertas restricciones en los modelos perturbadores con lo que se pierde precisión en el modelo. Estas soluciones son, en ocasiones, un buen compromiso entre eficiencia computacional y precisión y juegan un importante papel en estudios de comportamiento orbital a largo plazo, tiempo de vida de una misión, análisis de determinados tipos de órbitas particulares, etc. Dentro de los métodos analı́ticos más usados tenemos el modelo SGP4, que es el origen de las variables TLE. Esta variables, junto con el método analı́tico al que están asociadas, serán descritas en el siguiente apartado. Los modelos seminuméricos combinan ambas técnicas para aprovechar la precisión de los numéricos y la eficiencia de los analı́ticos. Sea cual sea el método de integración usado, el objetivo final es generar una secuencia de efemérides del orbitador a partir de las condiciones iniciales de un problema orbital. La herramienta que se encargará de construir tal secuencia de efemérides se llama propagador y debe estar formada por una serie de elementos 2 ftp://[email protected]/pub/eph/planets 202 Movimiento orbital que analizaremos en este apartado. Estableceremos cuatro módulos básicos que debe tener un propagador Tratamiento de los sistemas de referencia. Formulación del modelo de fuerzas. Integrador. Análisis de los resultados. La integración del problema se debe realizar en un sistema de referencia inercial, habitualmente elegiremos el sistema SG , sin embargo, muchos de los elementos de las perturbaciones son formulados en otros sistemas, y el análisis de los resultados exige también dichos cambios; por ello es muy importante disponer en el propagador de una herramienta para realizar todos los posibles cambios de referencia vistos en los capı́tulos 3, 4 y 7. En cuanto a la formulación del modelo el propagador debe permitir la elección de distintos modelos de perturbaciones, pero es importante que pueda formular al menos las cuatro perturbaciones más importantes del satélite: potencial terrestre, rozamiento atmosférico, presión de radiación solar y perturbación de un tercer cuerpo. Para la formulación de estos modelos se debe disponer de varios modelos de potencial terrestre o planetario, con la posibilidad de elegir el grado máximo que se tomará en el potencial elegido. El potencial planetario debe ser elegido entre alguno de los posibles modelos que se mencionan en el capı́tulo 15. Finalmente, la formulación del modelo de presión de radiación y la del tercer cuerpo exigen el cálculo de efemérides de cuerpos del sistema solar, bien sea el modelo DE405 del JPL u otro menos preciso. En cuanto al integrador podemos elegir entre una serie de métodos numéricos, aunque hay que conocer las caracterı́sticas de cada método para aplicar el más indicado al problema. Finalmente se debe disponer de una serie de herramientas para el análisis de los resultados, entre ellas, todas las relaciones del movimiento kepleriano, el cálculo de eclipses, las trayectorias del satélite sobre la superficie terrestre o traza, etc. La construcción de un propagador orbital es una compleja tarea que excede las posibilidades de la mayor parte de los usuarios que necesiten utilizarlos. Afortunadamente existe un buen número de propagadores, tanto profesionales como software libre. Entre los profesionales señalaremos únicamente uno de los más usados y conocidos: el propagador comercial STK3 de Analytical Graphics Inc’s. Este software, del que existe una versión de prueba gratuita, consta además de un potente entorno gráfico donde analizar y formular cualquier aspecto de una misión espacial con una serie de herramientas matemáticas muy sofisticadas. 3 STK: http://www.agi.com Propagador SGP4/SDP4 y variables TLE 203 Entre los propagadores de libre distribución nos encontramos dos tipos diferentes: los que tienen un entorno gráfico tipo STK y las librerı́as de software. Entre los que poseen un entorno gráfico destacaremos el software GMAT4 , que está siendo desarrollado por la NASA. A fecha de agosto de 2012 dispone de una versión beta, pero casi completamente operativa, para Windows y de las fuentes en C++ para el resto de los sistemas operativos. Como librerı́as de software mencionaremos tres: una escrita en lenguaje C++, llamada GAL5 (General Astrodynamics Library), y otras dos escritas en lenguaje JAVA, por un lado JAT6 (Java Astrodynamics Toolkit) y por otro OREKIT 7 (ORbits Extrapolation KIT). En todos los casos se trata de librerı́as de bajo nivel, que incorporan métodos muy precisos y modernos, pero cuyo uso entraña cierta dificultad. Para estudios más simples, que no requieran de los complicados desarrollos realizados por un propagador, resulta útil disponer de herramientas menos complicadas integradas en entornos de desarrollo de tipo matemático como Matlab o Mathematica. Estas herramientas suelen ser más sencillas de usar y proporcionan mejores y más rápidos resultados en el análisis de aspectos concretos de una misión espacial. Integrado en Matlab podemos mencionar ODTBX8 (Orbit Determination Toolbox) desarrollado por la NASA. El paquete Orbits9 , integrado en Mathematica, está siendo actualmente desarrollado por varios miembros del Grupo de Mecánica Espacial de la Universidad de Zaragoza y aparecerá próximamente en la página web del grupo señalada al pie de página. 12.8 Propagador SGP4/SDP4 y variables TLE No todo usuario que deba realizar un seguimiento de un satélite artificial dispone de un buen propagador ni de los datos del vector de estado inicial necesarios para propagar la órbita. La solución en este caso consiste en usar el propagador analı́tico SGP4/SDP4, cuyas rutinas, de libre distribución, están escritas en FORTRAN aunque hay versiones en C y C++, y obtener los datos de dicho satélite en el formato TLE, elementos de dos lı́neas, catalogados, actualizados y distribuidos10 junto con el software, por el NORAD (North American Aerospace Defense Command). En el año 1966 se desarrolló el modelo SGP, Simplified General Perturbations, basado en una simplificación de la teorı́a de Kozai, que considera el efecto del rozamiento atmosférico. Este modelo parte de un conjunto de constantes que 4 GMAT: http://gmat.gsfc.nasa.gov http://www.amsat-bda.org/GAL Home.html 6 JAT: http://jat.sourceforge.net 7 OREKIT:https://www.orekit.org 8 ODTBX: http://opensource.gsfc.nasa.gov/projects/ODTBX 9 Orbits: http://gme.unizar.es/software/orbits 10 http://celestrak.com/ 5 GAL: 204 Movimiento orbital representan, entre otros parámetros, unos valores medios de los elementos orbitales a partir de los cuales se realiza la propagación. Estos elementos reciben el nombre de elementos de dos lı́neas, TLE, y serán descritos más adelante. Posteriormente, hacia 1970, se crea un segundo modelo que efectúa una simplificación de la teorı́a de Brouwer. Este modelo, llamado SGP4 es distinto y más preciso que el anterior, aunque sus constantes se adaptan a la definición de los TLE para hacerlos compatibles. Esto será cierto para todos los modelos posteriores. El siguiente modelo SDP4 es una adaptación del modelo SGP4 a satélites de periodo mayor o igual que 225 minutos, lo que corresponde a una altitud de unos 6000 km. El modelo SDP4 añade la perturbación Luni-Solar y algunos armónicos del potencial terrestre que afectan a órbitas de periodo igual a medio dı́a o un dı́a. Finalmente, en 1980, se crearon los modelos SGP8/SDP8 que incluye otros modelos de atmósfera y efectúa la integración de una manera distinta. Los modelos SGP4/SDP4 son los más usados y aseguran una probabilidad del 90 % de que el satélite se encuentre a una distancia menor de 5 km de la posición calculada si los elementos TLE del satélite están suficientemente actualizados. Sin embargo, cuando los TLE son antiguos la órbita se degrada mucho y no es fiable. La actualización de los TLE de los satélites debe ser muy frecuente cuando el satélite es de órbita baja y obligatoria cuando se realiza alguna maniobra que lo cambie de órbita. Los elementos obtenidos al propagar una órbita a partir de los elementos TLE por medio de el modelo SGP4/SDP4 se suponen referidos a un sistema de referencia centrado en la Tierra y que tiene el ecuador verdadero de la fecha como plano fundamental y el equinoccio medio como eje Ox. Este sistema coincide 0 con el sistema E m definido en el capı́tulo 4. Los elementos TLE sirven de elementos iniciales para el cálculo de los elementos osculadores de la órbita de un satélite artificial en un instante dado. Estos elementos vienen dados con el siguiente formato: AAAAAAAAAAAAAAAAAAAAAAAA 1 NNNNNA NNNNNAAA NNNNN.NNNNNNNN +.NNNNNNNN +NNNNN-N +NNNNN-N N NNNNN 2 NNNNN NNN.NNNN NNN.NNNN NNNNNNN NNN.NNNN NNN.NNNN NN.NNNNNNNNNNNNNN donde A representa cualquier carácter y N un dı́gito. Este formato proviene de las lı́neas de 80 caracteres de los sistemas de entradasalida, basados en fichas perforadas, de los antiguos ordenadores y es un formato de tres lı́neas en lugar de las dos que anuncia su nombre. La primera lı́nea, llamada lı́nea 0 es un nombre de 24 caracteres consistente con la longitud de los nombres del catálogo de satélites del NORAD. Los elementos de la lı́nea uno se describen a continuación, dando en primer lugar el número de columna y después la descripción: 01 Número de la lı́nea. Propagador SGP4/SDP4 y variables TLE 205 03-07 Número del satélite. 08 Clasificación: S significa secreto o clasificado, U significa no clasificado. 10-11 Dos últimos dı́gitos del año de lanzamiento. 12-14 Número de orden del lanzamiento en el año. 15-17 Pieza del lanzamiento. 19-20 Dos últimos dı́gitos del año. 21-32 Dı́a del año y fracción. 34-43 Primera derivada del movimiento medio ṅ. Tanto este campo como el siguiente utilizan una notación decimal especial. Los primeros campos son la mantisa sin el punto decimal, los dos últimos el exponente, ası́ -12345-6 representa 0.12345 ⇥ 10 6 . 45-52 Segunda derivada del movimiento medio n̈. Suele ponerse igual a cero. 54-61 Término balı́stico modificado. 63 Número de veces que han sido actualizados estos elementos. 65-69 Números de control. Los elementos de la lı́nea 2 son 01 Número de la lı́nea. 03-07 Número del satélite. 09-16 Inclinación, i, en grados. 18-25 Angulo del Nodo, ⌦, en grados. 27-33 Excentricidad, e. No se pone el punto decimal al principio. 35-42 Argumento del perigeo, !, en grados. 44-51 Anomalı́a media, `, en grados. 53-63 Movimiento medio, n en revoluciones por dı́a. 64-68 Número de vueltas en la época. 69 Números de control. Hay que recordar que estos elementos son elementos medios, no osculadores, esto es, no podemos obtener directamente, a partir de ellos, el vector de estado en un instante. Para hacer esto es necesario obtener antes los elementos osculadores aplicando el modelo SGP4/SDP4. El cálculo de los elementos TLE a partir de los elementos osculadores requiere un proceso numérico que no va a ser desarrollado en este libro. 206 Movimiento orbital Capı́tulo 13 Problema de n cuerpos 13.1 Formulación del problema de n cuerpos La ley de atracción gravitacional de Newton puede formularse de la siguiente manera: “La atracción mutua ejercida entre si por dos puntos materiales P1 , P2 , de masas respectivas m1 , m2 , es directamente proporcional al producto de las masas e inversamente proporcional al cuadrado de la distancia r entre los dos cuerpos”. La constante de proporcionalidad G es llamada constante de gravitación universal. La ley anterior es la base de todo el estudio de los movimientos orbitales, tanto en el sistema solar como fuera de él, pues determina también la dinámica de los sistemas estelares múltiples. Si pensamos en el sistema solar y prescindimos, por el momento, del hecho de que todos los cuerpos del mismo son sólidos (rı́gidos o no), la forma más general de modelar el movimiento de estos cuerpos es a través del llamado problema de n cuerpos, que consiste en el estudio de n puntos materiales atraı́dos entre si por la ley de atracción gravitacional enunciada por Newton. Si llamamos Pi , i = 1, . . . n, a los n puntos, mi a sus masas y r i = OPi a sus vectores de posición referidos a un sistema de referencia ortogonal directo e inercial, las ecuaciones del movimiento de cada uno de esos puntos podrá formularse como n X mi mk mi r̈ i = G r ik , i = 1, . . . n, (13.1) 3 rik k=1(k6=i) donde hemos llamado r ik = r k r i y rik = k r ik k. 208 Problema de n cuerpos La integración algebraica de este problema de orden 6 n resulta imposible, en la práctica, cuando n > 2. Como veremos a continuación podremos encontrar 10 integrales del mismo de manera sencilla, pero ya en el caso n = 3 las dos integrales que resuelvan completamente el problema solo pueden obtenerse en algunos casos particulares. Pj r ij rj Pi O ri Afortunadamente, en la mayor parte de los problemas reales, la magnitud de las masas y las distancias mutuas entre los distintos puntos es Figura 13.1: Posiciones relativas de dos puntos en el problema de n cuerpos. tal que permite tomar el modelo más simple de dos cuerpos, el astro del que estudiamos la órbita y el principal que será el Sol o la Tierra, y considerar la acción del resto de los astros como una pequeña perturbación a este modelo. No es nuestro propósito efectuar un estudio riguroso del problema de n cuerpos que puede verse en muchos tratados de Mecánica Celeste, sin embargo, obtendremos ahora las 10 integrales anunciadas anteriormente por su importante significado astronómico. En primer lugar, si sumamos las n ecuaciones (13.1), obtendremos n X mi r̈ i = 0, i=0 que tras una doble integración nos lleva a la condición n X mi r i = At + B, (13.2) i=0 donde A, B representan 6 constantes de integración, llamadas integrales del centro de masas, que indican que el movimiento del centro de masas del sistema formado por los n puntos es rectilı́neo y uniforme. Desde el punto de vista práctico, suponiendo que el sistema solar está aislado, esto nos indica un movimiento en lı́nea recta y con velocidad constante para todo el sistema solar en su conjunto, mientras que, a su vez, todos los cuerpos del mismo se mueven alrededor del centro de masas. Pensemos que, debido a la gran masa del Sol, el centro de masas del sistema solar está en el interior del mismo, por lo que tendrá bastante sentido considerar el Sol como origen y estudiar el movimiento de todos los astros en torno al Sol. Por otro lado, multiplicando vectorialmente cada una de las ecuaciones (13.1) por r i y teniendo en cuenta las propiedades del sumatorio extendido a dos ı́ndices Modelo planetario 209 tendremos n X i=0 mi r i ⇥ r¨i = G X X mi mk i lo que permite poner k 3 rik n X i=0 r i ⇥ r ik = G X X mi mk i k 3 rik r i ⇥ r k = 0, mi r i ⇥ r˙i = G, (13.3) donde G representa el momento angular del sistema que resulta ser constante. De esta forma tenemos 3 nuevas integrales del problema de n cuerpos. La última integral del problema es la integral de la energı́a. 13.2 Modelo planetario Teniendo en cuenta la gran masa del Sol, comparada con la de cualquier planeta, las ecuaciones del movimiento de cada planeta podrán formularse de forma similar a las ecuaciones del movimiento kepleriano, con unos términos adicionales que constituyen una perturbación a este modelo debida al resto de planetas. Para ello, volvamos a las ecuaciones (13.1) y formulemos, a partir de ellas, las del movimiento relativo, esto es, las ecuaciones que rigen la variación de los vectores r ij . Para ello basta considerar r̈ ij = r̈ j r̈ i , (13.4) que da lugar a la expresión r̈ ij = X r ij G(mi + mj ) 3 + G mk rij k6=i,j r jk 3 rjk r ik 3 rik ! . (13.5) Supondremos ahora el modelo extendido a n + 1 puntos i = 0, 1, . . . n de forma que la masa de P0 sea muy grande en relación con las demás m0 mi , i = 1, . . . , n, lo cual resulta cierto en el caso del Sol y el sistema solar. Si llamamos ahora xi = P0 Pi = r 0n , ri = k xi k, lo que en la práctica equivale a tomar P0 como origen, podremos poner las ecuaciones del movimiento anteriores como ✓ ◆ X xi xk xi xk ẍi + µi 3 = G mk , (13.6) ri k xk xi k3 k xk k3 k6=i,n donde µi = G(m0 + mi ). Nótese que el término de la izquierda de estas ecuaciones es idéntico al de las ecuaciones (7.23), mientras que el de la derecha no es cero, sino que es proporcional 210 Problema de n cuerpos a la masa de cada uno de los otros cuerpos, por lo que tendrá un valor pequeño en módulo. Al considerar esta aproximación en el sistema solar podremos suponer todos los valores µi = Gm0 , lo que supone en la práctica despreciar la masa de los planetas frente a la del Sol. La perturbación que cada punto Pk ejerce sobre la órbita de Pi respecto a P0 viene dada por dos sumandos. El primero depende de la posición de Pi y por ello se llama atracción o perturbación directa, mientras que el segundo no depende de la posición de Pi y es llamado atracción o perturbación indirecta. 13.3 Perturbación luni-solar del satélite artificial Cuando se considera el problema del movimiento de un satélite artificial en torno a la Tierra, la aproximación kepleriana consistente en tomar la Tierra y el satélite como puntos aislados puede resultar insuficiente si se tiene en cuenta que tanto el Sol como la Luna están perturbando este modelo. Para estudiar esta perturbación se tiene en cuenta que la combinación de masa y distancia, tanto de la Luna como del Sol, permiten una formulación basada en el modelo planetario, tomando La Tierra como cuerpo central y el satélite como orbitador y considerando que la Luna y el Sol perturban este movimiento actuando como un tercer cuerpo en el modelo planetario. Llamando x a la posición de un satélite respecto de la Tierra y escribiendo el subı́ndice k para expresar un tercer cuerpo que perturba este movimiento, podremos poner ✓ ◆ x xk x xk ẍ + µ 3 = Gmk = Pk. (13.7) r k xk x k3 k xk k3 Este modelo permitirá estudiar, tanto el efecto producido por el Sol en la órbita de la Luna en torno a la Tierra, como la perturbación que el Sol y la Luna producen en la órbita de un satélite artificial. Dada la función escalar Vk = Gmk ✓ 1 k xk xk x · xk k xk k3 ◆ , podemos comprobar, por simple derivación, que su gradiente respecto a x podrá ponerse en la forma P k = rx Vk , lo que permitirá decir que la función hamiltoniana del problema del movimiento orbital, perturbado por un tercer cuerpo, puede expresarse como ✓ ◆ 1 µ 1 x · xk H = H0 + Vk = X · X Gmk , (13.8) 2 kxk k xk x k k xk k3 donde H0 es el hamiltoniano del problema no perturbado o kepleriano y Vk el potencial perturbador. Problema de tres cuerpos 13.4 211 Problema de tres cuerpos Si en lugar de n se consideran únicamente tres masas puntuales se tiene el llamado problema general de tres cuerpos. Ası́ como el problema de dos cuerpos es un problema integrable, el tercer cuerpo añade a la dinámica del sistema una enorme complejidad que lo hace no integrable salvo en unos pocos casos particulares. Sin embargo, éste es el sistema que debe considerarse cuando se piensa en el movimiento de una nave espacial en el interior del sistema Tierra-Luna, o por ejemplo el movimiento de un asteroide o cometa próximo a Júpiter, lo que obliga a considerar el sistema Sol-Júpiter-Asteroide. Si particularizamos para tres cuerpos las ecuaciones del movimiento relativo de n cuerpos dadas por (13.5) tendremos: r 12 3 + Gm3 r12 = G(m1 + m2 ) r̈ 13 = r 13 G(m1 + m3 ) 3 + Gm2 r13 r̈ 23 = G(m2 + m3 ) r̈ 12 r 23 3 + Gm1 r23 ✓ ✓ ✓ r 23 3 r23 r 13 3 r13 r 32 3 r32 r 12 3 r12 r 31 3 r31 r 21 3 r21 ◆ ◆ ◆ , (13.9) , (13.10) . (13.11) El movimiento de P3 en torno a P1 y P2 viene representado por las ecuaciones (13.10) y (13.11) respectivamente, pero en ocasiones suele expresarse éste con respecto al centro de masas C del sistema formado por los primarios P1 y P2 . Si llamamos r = CP3 al vector de posición de P3 respecto a C y tenemos en cuenta que CP3 = CP1 + P1 P3 , que CP1 = OP1 OC y que P1 P3 = r 13 , OP1 = r 1 y OC = (m1 r 1 + m2 r 2 )/(m1 + m2 ), podremos poner finalmente r = r 13 m2 r 12 , m1 + m2 que derivada dos veces y junto con (13.10) y(13.9) permite poner r̈ = 13.4.1 G(m1 + m3 ) r 13 3 r13 Gm2 r 23 3 r23 G m2 m3 m1 + m2 ✓ r 23 3 r23 r 13 3 r13 ◆ . (13.12) Problema restringido La complejidad del problema general de tres cuerpos se reduce notablemente si aplicamos una caracterı́stica que se presenta en muchos problemas: la masa del tercer cuerpo es despreciable frente a la de los otros dos que son llamados primarios. Esto es cierto, por ejemplo, en el caso de los Asteroides cuando se comparan con el Sol y Júpiter y lo es también para cualquier nave espacial en el sistema Tierra-Luna. 212 Problema de n cuerpos Supondremos, por tanto, que el punto P3 tiene masa despreciable frente a la de P1 y P2 , es decir supondremos que m3 = 0 con lo que la ecuación (13.9) se transforma en r 12 r̈ 12 = G(m1 + m2 ) 3 , (13.13) r12 que nos indica que P3 no modifica el movimiento de los primarios, P1 , P2 , que se rigen por las ecuaciones del problema de los dos cuerpos, esto es, presentan un movimiento kepleriano. La propiedad anterior reduce el problema restringido al estudio del movimiento de P3 . Para ello usaremos las ecuaciones (13.10) o (13.11) que particularizadas para m3 = 0 se transforman en ✓ ◆ r 13 r 23 r 12 r̈ 13 = Gm1 3 Gm2 , (13.14) 3 + r3 r13 r23 12 ✓ ◆ r 23 r 13 r 12 r̈ 23 = Gm2 3 Gm1 , (13.15) 3 3 r23 r13 r12 o bien, la ecuación de P3 respecto al centro de masas C de P1 y P2 , que vendrá dada por la ecuación (13.12) que, particularizada para m3 = 0, será r̈ = 13.4.2 Gm1 r 13 3 r13 Gm2 r 23 3 . r23 (13.16) Problema restringido circular Para realizar un análisis cualitativo de este problema resulta conveniente restringir un poco más las condiciones del mismo, teniendo en cuenta que las conclusiones del análisis que realicemos se podrán extender a problemas más generales. En este caso, supondremos que la órbita de los primarios es una órbita circular que se encuentra el el plano fundamental (Oxy) del sistema inercial. Tomaremos el radio de la órbita de los primarios como unidad de longitud y elegiremos una unidad de tiempo en la que el periodo de los primarios sea 2⇡ o, lo que es igual, su movimiento medio o velocidad angular n = 1. De esta forma, el ángulo que forma el eje de los primarios con el eje Ox del sistema inercial será igual al ángulo n t, es decir al tiempo t. Por último, la suma de las masas de los primarios será tomada como unidad de masa m1 + m2 = 1, lo que nos permite definir un nuevo parámetro ⌘ = m2 , que transforma el valor de la masa de P1 en m1 = 1 ⌘. En estas condiciones podemos cambiar el sistema de referencia para pasar al sistema sinódico que es un sistema basado en la órbita de los primarios, en el que el plano Oxy coincide con el plano de la órbita, el eje Ox es la dirección de la recta que une P1 con P2 y el origen coincide con su centro de masas. El paso a Problema de tres cuerpos 213 este sistema se pondrá representar a partir de la matriz de rotación R3 (t) en la forma r = R3 (t)⇣, r 13 = R3 (t)⇣ 1 , r 23 = R3 (t)⇣ 2 , (13.17) donde ⇣ = (x, y, z) representa el vector de posición de P3 respecto al centro de masas de los primarios en el sistema de referencia sinódico. El vector ⇣ i representa el vector que une Pi con P3 expresado también en el sistema sinódico. En este sistema, y con las unidades establecidas, se tendrá CP 1 = ( ⌘, 0, 0), CP 2 = (1 ⌘, 0, 0) y CP 3 = ⇣ = (x, y, z), por lo que ⇣ 1 = (x + ⌘, y, z), ⇣ 2 = (x + ⌘ 1, y, z). (13.18) Por otro lado, derivando r = R3 (t)⇣ y agrupando la expresión se puede demostrar que 0 1 ẍ 2ẏ x r̈ = R3 (t) @ ÿ + 2ẋ y A . (13.19) z̈ Finalmente, si llevamos (13.17), (13.18) y (13.19) a (13.16) e igualamos componente a componente podremos poner: x+⌘ x+⌘ 1 ẍ 2ẏ x = (1 ⌘) 2 ⌘ , r1 r22 y y ÿ + 2ẋ y = (1 ⌘) 2 ⌘ 2 , (13.20) r1 r2 z z z̈ = (1 ⌘) 2 ⌘ 2 , r1 r2 donde r12 = (x + ⌘)2 + y 2 + z 2 , r22 = (x + ⌘ 13.4.3 1)2 + y 2 + z 2 . Puntos de Lagrange En todo sistema dinámico el conocimiento de las soluciones de equilibrio resulta de gran interés para el estudio cualitativo global del sistema. En el problema restringido de tres cuerpos existen cinco soluciones de equilibrio, los puntos de Lagrange, que se pueden extender al problema general de tres cuerpos, y que tienen una gran importancia desde el punto de vista de la Astrodinámica. Un punto de equilibrio es un punto en el que un cuerpo situado con una velocidad inicial nula se mantiene indefinidamente en esa posición. Para encontrar los puntos de equilibrio basta tener en cuenta que estos verificarán: x = x0 , y = y0 , z = z0 por lo que se tendrá ẋ = ẏ = ż = 0, ẍ = ÿ = z̈ = 0, condiciones que llevadas a (13.20) nos dan x+⌘ x+⌘ ⌘ 3 r1 r23 y y y (1 ⌘) 3 ⌘ 3 r1 r2 z z (1 ⌘) 3 ⌘ 3 r1 r2 x (1 ⌘) 1 = 0, = 0, = 0. (13.21) 214 Problema de n cuerpos De la última de las ecuaciones anteriores se deduce que z = 0, luego las soluciones de equilibrio deben estar en el plano del movimiento de los primarios. La segunda ecuación se cumplirá si se verifica 1 (1 ⌘) 1 r13 ⌘ 1 = 0. r23 para lo cual basta que r1 = r2 = 1, en cuyo caso se cumple también la primera. Existen dos puntos que cumplen esta condición, junto con z = 0 y son los dos puntos del plano de los primarios que forman con ellos un triángulo equilátero. Estos son los llamados puntos L4 y L5 de Lagrange. Si los puntos no forman un triángulo equilátero la única forma de verificarse la segunda condición será con y = 0 que, junto con z = 0, indica que las soluciones de equilibrio restantes deben estar en el eje de los primarios. Si hacemos y = z = 0 se tendrá r1 = |x + ⌘|, r2 = |x + ⌘ primera ecuación (13.21) se escribirá como x (1 ⌘) x+⌘ |x + ⌘|3 ⌘ x+⌘ |x + ⌘ 1| por lo que la 1 = 0, 1|3 (13.22) ecuación que representa un polinomio de grado tres cuyas tres soluciones, para un valor concreto de ⌘, representan los tres puntos de equilibrio colineales que son llamados puntos L1 , L2 y L3 de Lagrange. L3 L1 P1 L2 P2 Figura 13.2: Posiciones relativas de L1 , L2 , L3 para distintos valores de ⌘. La figura 13.2 representa, para los distintos valores de ⌘ entre 0 y 1 (eje vertical), las posiciones relativas de los tres puntos de equilibrio. Siempre hay un punto entre P1 y P2 que es llamado L1 y que está más próximo al menos masivo de los primarios. Los otros dos puntos se encuentran detrás de cada primario, y más próximo a éste cuanto menor sea su masa. Problema de tres cuerpos L5 L3 P1 L 1 P2 L 2 L4 Figura 13.3: Puntos de Lagrange en el problema de tres cuerpos. 215 La masa de la Luna es aproximadamente 81 veces menor que la de la Tierra, lo que nos da un valor, para el sistema Tierra-Luna, de ⌘ = 0.0123. El punto L1 se encuentra entre la Tierra y la Luna a un distancia de la Tierra igual 0.836182 si se toma como unidad la distancia Tierra-Luna. Si tomamos una distancia media de 384400 km, el punto L1 está a 321094 km de la Tierra y 62906 km de la Luna. El punto L2 se encuentra detrás de la Luna a una distancia de unos 60002 km de ésta. En la figura 13.3 se representan los cinco puntos de Lagrange para un sistema en el que la masa de P2 es menor que la de P1 . Los puntos triangulares del sistema Sol-Júpiter son llamados también puntos troyanos porque en sus proximidades se han encontrado una serie de pequeños asteroides, llamados también troyanos, con un peculiar movimiento asociado a dichos puntos y a la dinámica del problema de tres cuerpos. En efecto, las órbitas pasan por las proximidades de L4 y comienzan un viaje que les lleva por detrás de L3 hasta llegar a las proximidades de L5 . Este punto se rodea y comienza un nuevo viaje que pasa entre L3 y P1 pero más próximo al primero hasta que llega de nuevo a L4 rodeándolo y comienza de nuevo este ciclo. Figura 13.4: Órbitas en herradura. Este tipo de órbitas, de las que podemos observar un ejemplo en la figura 13.4, son llamadas órbitas en herradura y dan idea de la complejidad que puede llegar a tener la dinámica de tres cuerpos. Además de los ejemplos de órbitas naturales próximas, o relativas, a puntos de equilibrio, como las de los asteroides troyanos, podemos beneficiarnos de ellos para construir cierto tipo de órbitas muy útiles desde el punto de vista de la navegación espacial. Por ejemplo, las propiedades de un punto de Lagrange de equilibrio estable, permitirı́a situar en sus proximidades una estación espacial cuyo 216 Problema de n cuerpos mantenimiento en órbita serı́a muy barato. Otro ejemplo lo contituyen un tipo de órbitas periódicas, llamadas órbitas halo, alrededor del punto L2 del sistema Tierra–Luna, por detrás de ésta, de gran importancia para las comunicaciones con futuras bases espaciales fijas situadas en la cara oculta de la Luna. 13.4.4 Curvas de velocidad cero Si definimos la función ⌦= 1 2 1 ⌘ ⌘ (x + y 2 ) + + , 2 r1 r2 (13.23) las ecuaciones (13.20) podrán ponerse como ẍ 2ẏ x = ÿ + 2ẋ y = z̈ + z = @⌦ , @x @⌦ , @y @⌦ . @z (13.24) Por otro lado, derivando el cuadrado de la velocidad se tendrá dv 2 d = (ẋ2 + ẏ 2 + ż 2 ) = 2ẍẋ + 2ÿ ẏ + 2z̈ ż. dt dt Si en esta expresión sustituimos ẍ, ÿ, z̈ por sus valores obtenidos de (13.24) y aplicamos la regla de la cadena, llegaremos a la relación diferencial dv 2 d⌦ =2 , dt dt que integrada da v 2 = 2⌦ + J, (13.25) siendo J una constante que llamaremos constante de Jacobi. El valor de la constante de Jacobi, que se determina a partir de las Figura 13.5: Curvas de nivel de ⌦(x, y). condiciones iniciales, condicionará el movimiento del punto. En efecto, dado un valor de la constante de Jacobi Jo , la ecuación 2⌦(x, y) + Jo = 0, (13.26) Problema de tres cuerpos 217 1 2 3 4 5 6 7 8 9 Figura 13.6: Evolución de las regiones del movimiento en el problema restringido circular de tres cuerpos para distintos valores de la integral de Jacobi. determina una curva en el plano Oxy que delimita dos regiones del plano. Dichas regiones corresponden a las zonas donde se verifica respectivamente 2⌦(x, y) < Jo y 2⌦(x, y) > Jo . La condición (13.25) que debe cumplir el cuerpo en su movimiento obliga a que 2⌦(x, y) > Jo , pues el cuadrado de la velocidad no puede ser negativo. Por este motivo a esta curva se le llama curva de velocidad cero. La figura (13.5) muestra el conjunto de curvas de nivel de la función ⌦(x, y). La figura (13.6) representa nueve valores distintos de la constante de Jacobi y las curvas de velocidad en cada uno de los casos. En todos ello el área oscura representa la región donde el movimiento es posible, mientras que en el área blanca el movimiento es imposible. Podemos establecer las siguientes condiciones relativas a cada uno de los nueve 218 Problema de n cuerpos casos: 1. En el primer caso el movimiento es posible en una zona externa y dos zonas interiores, casi circulares, alrededor de los dos cuerpos primarios. Las zonas internas son mayores cuanto más masivo sea el correspondiente primario. Con este valor de la constante de Jacobi un cuerpo no puede viajar de un primario a otro. Un cuerpo en el exterior no puede acercarse a los primarios. Los cinco puntos de Lagrange se encuentran en la zona prohibida. 2. Para un determinado valor de J0 las dos zonas alrededor de los primarios, que cada vez son menos circulares, se unen en un punto de contacto que corresponde al punto L1 . La zona externa va acercándose a los primarios. 3. Se abre un camino que permite el viaje entre los dos primarios, pero siempre pasando muy próximos a L1 . Obsérvese que en la zona próxima al punto L2 se va haciendo cada vez más estrecha la zona prohibida. 4. La zona exterior y las interiores se unen en el punto L2 . 5. Se abre un camino que conecta el exterior con el interior a través de L2 . Un cuerpo puede salir al exterior del sistema desde P1 pero pasando primero cerca de L1 y luego cerca de L2 . 6. La zona prohibida es una banda cada vez más estrecha que contiene los puntos L3 , L4 y L5 . La curva se va estrechando cerca de L3 . En estas condiciones son posibles las órbitas en herradura pero sin llegar a entrar la partı́cula en la zona prohibida. 7. Las paredes de la zona prohibida se unen en L3 . 8. La zona prohibida, que hasta este momento era única se convierte en dos regiones, cada una de las cuales contiene a uno de los puntos triangulares. Son posibles órbitas que rodeen al punto triangular por el exterior de la zona prohibida. 9. La zona prohibida se hace cada vez más pequeña. Los puntos triangulares siempre están en el interior de estas zonas. Capı́tulo 14 Atracción de sólidos 14.1 Introducción Otra aproximación en el modelo orbital consiste en considerar sólidos rı́gidos en lugar de puntos materiales, donde la atracción gravitacional ejercida por el sólido se extiende a cada fracción infinitesimal del mismo, considerada ésta como un punto material. El problema más general es el problema de n sólidos, que extiende el de n cuerpos. Sin embargo, si el último ya era imposible de estudiar de forma general mucho más lo será el primero. Podemos disminuir la complejidad del problema tomando n = 2, esto es, considerando el problema de dos sólidos. Esta simplificación sigue siendo igualmente difı́cil de abordar con carácter general, por lo que finalmente reduciremos el problema a su forma más simple, esto es, estudiaremos la atracción gravitacional entre un sólido y un punto material. Esto dará lugar a dos problemas diferentes según que estudiemos el movimiento del sólido o el del punto. El movimiento de un sólido atraı́do gravitacionalmente por un punto material, que no va a ser considerado en el presente libro, permite estudiar, mediante complejos métodos de perturbaciones, el movimiento orbital y rotacional del sólido de forma simultánea. Con él podremos analizar, entre otros, el problema de la rotación de los satélites artificiales, de particular importancia cuando éstos deben estar siempre dirigidos en una cierta dirección del espacio, como es el caso de los satélites con paneles para la recepción de energı́a solar. Otro importante problema que se estudia con este modelo es el de la rotación terrestre, que da lugar a los modelos de precesión y nutación descritos en la primera parte del libro. 220 Atracción de sólidos El problema que estudiaremos con algo más de detalle, por sus implicaciones en el movimiento orbital de satélites artificiales, es el del movimiento orbital de un punto atraı́do por un sólido. Este será el caso de cualquier satélite orbitando en torno a un planeta o cuerpo celeste. 14.2 Polinomios de Legendre La principal herramienta para el desarrollo del potencial del sólido son los polinomios de Legendre, que representan un conjunto de polinomios ortogonales1 . Llamaremos polinomio de Legendre de grado n al polinomio definido por la siguiente expresión 1 dn 2 Pn (t) = n (t 1)n . (14.1) 2 n! dtn De esta forma, los tres primeros polinomios de Legendre serán 1 P0 (t) = 1, P1 (t) = t, P2 (t) = (3t2 1). (14.2) 2 El resto pueden obtenerse por medio de la definición (14.1) o bien por la relación siguiente (n + 1) Pn+1 (t) (2n + 1) t Pn (t) + n Pn 1 (t) = 0, que permite, de forma iterativa, obtener el polinomio de cualquier grado en función, exclusivamente, de los dos primeros: P0 (t) y P1 (t). Resultan también de gran interés los polinomios asociados de Legendre 2 Pnm (t), de grado n y orden m, que se definen a partir de las derivadas, Qnm (t), de los polinomios de Legendre en la forma: dm Pn (t). (14.3) dtm La definición anterior permite encontrar otra relación entre los polinomios de Legendre y los polinomios asociados t2 )(m/2) Qnm (t), Pnm (t) = (1 Qnm (t) = Pn (t) = Pn0 (t) = Qn0 (t). (14.4) Para evaluar los polinomios asociados podremos usar las tres relaciones siguientes p Pmm (t) = (2m 1) 1 t2 Pm 1,m 1 , Pm+1,m (t) = Pnm = 1 Un (2m + 1) t Pmm (t), 1 n m ((2n 1) t Pn 1,m (t) (n + m 1) Pn 2,m (t)) . (14.5) estudio detallado de estos polinomios y de sus propiedades fundamentales puede encontrarse en cualquier libro de polinomios ortogonales. 2 En muchas ocasiones, por ejemplo en el software Mathematica, se definen como polinomios asociados de Legendre los polinomios Pnm (t) cuya relación con los usados en este libro viene dada por Pnm (t) = ( 1)m Pnm (t). Polinomios de Legendre 221 que permiten, de forma iterativa, obtener el polinomio de cualquier grado y orden en función, exclusivamente, del polinomio P00 (t) = 1. Teniendo en cuenta la relación entre Pnm y Qnm obtendremos las relaciones entre los polinomios Qnm que resultan, salvo la primera, idénticas a las anteriores Qmm (t) = (2m 1) Qm Qm+1,m (t) = (2m + 1) t Qmm (t), Qnm = 1 n m ((2n 1,m 1 , 1) t Qn 1,m (t) (n + m 1) Qn 2,m (t)) . (14.6) Estas relaciones permiten también la iteración a partir del valor Q00 (t) = 1. En la expresión del potencial de un planeta, que se desa50 rrollará más adelante, aparecen los polinomios Pnm evaluados en puntos del intervalo [ 1, 1]. Pa30 ra valores grandes del grado n los valores de los coeficientes son muy pequeños, mientras que los valores de los polinomios asocia10 dos de Legendre son muy grann des. De hecho, cuando i = j se 5 15 25 35 alcanza un valor máximo3 igual, Figura 14.1: Gráfica de los valores log10 (2n 1)!! en valor absoluto, a (2n 1)!!. El en función del grado n. número de dı́gitos de este valor es aproximadamente log10 (2n 1)!! y ha sido representado gráficamente en la figura 14.1 para valores de n menores de 36. Estos valores tan grandes deben ser multiplicados por los valores de los armónicos del potencial terrestre que son muy pequeños. Resulta muy poco conveniente, desde el punto de vista numérico, multiplicar cantidades muy pequeñas por cantidades muy grandes. Para paliar en lo posible el error computacional derivado de este hecho, se utiliza la siguiente propiedad Z 1 Pnm (x)Pkm (x) dx = 1 donde ij 3 Por ejemplo, P25,25 (0) = = ⇢ 0 1 2 (n + m)! (2n + 1)(n m)! si si i 6= j, i = j. 58435841445947272053455474390625. nk . (14.7) 222 Atracción de sólidos Esta propiedad demuestra la ortogonalidad de los mismos y permite su normalización por medio de la relación s ⇤ m)! m (2n + 1)(n P̄nm (t) = Nnm Pnm (t), Nnm = , (14.8) (n + m)! ⇤ donde m = 2 0m vale 1 si m = 0 y 2 si m > 0. A los valores Nnm les llamaremos coeficientes de normalización. La figura 14.2 presenta una gráfica con los valores numéricos de p̄nm = maxx2[ 1,1] |P̄nm (x)|, (14.9) que representa el máximo alcanzado por el polinomio normalizado4 dentro del intervalo [ 1, 1] para n 36, m n. Las caracterı́sticas de los resultados obtenidos pueden destacarse en los siguientes puntos: 10 p̄nm 8 6 4 2 5 15 25 35 n Figura 14.2: Valores de p̄nm con 0 m n. Cada lı́nea vertical de puntos representa los valores p̄nm para un valor n fijo que coincide con la abscisa x y los valores de m entre 0 y n. p p̄nm p̄n0 = 2n + 1, siendo 0 m n. p Para n = 36 el valor de p̄36,0 es una cota de todos los demás y vale 73 = 8.544. Los coeficientes de normalización Nnm , dados en (14.8), permiten también normalizar las derivadas de los polinomios de Legendre Qnm definiendo los valores normalizados como Q̄nm (t) = Nnm Qnm (t). (14.10) Aplicando estas relaciones en (14.6) podremos obtener las relaciones entre las derivadas normalizadas en la forma: s ⇤ m 2m + 1 Q̄mm (t) = Q̄m 1,m 1 , ⇤ 2m m 1 p Q̄m+1,m (t) = 2m + 3 t Q̄mm (t), Q̄nm (t) 4 Para = s (2n + 1)(2n 1) t Q̄n 1,m (t) (n m)(n + m) s (2n + 1)(n + m 1)(n m 1) Q̄n (2n 3)(n m)(n + m) el ejemplo anterior el polinomio normalizado vale P̄25,25 (0) = (14.11) 2,m (t). 3.38409. Potencial gravitatorio de un planeta 223 ⇤ ⇤ Observemos que el cociente m / m 1 , que aparece en la primera iteración, vale 2 cuando m = 1 y 1 para cualquier otro valor de m. El valor para iniciar esta iteración será, en este caso, Q̄00 (t) = 1. 14.3 Potencial gravitatorio de un planeta Cada punto P de un sólido, (figura 14.3), ejerce sobre un orS bitador S una fuerza de atracción cuyo potencial viene dado, al igual que en el caso de dos cuerpos, por la expresión x P xp G O dm , donde hemos llamado a la distancia de P a S, hemos tomado como unidad de masa la de S y hemos llamado dm al elemento diferencial de masa del punto P . Figura 14.3: Potencial creado por cada punto P de un sólido. V = G Z dm El potencial creado por el sólido en S vendrá dado por la integral extendida a toda la masa del sólido . (14.12) M Si x, xp representan los vectores de posición respectivos de S y P , referidos a un sistema con centro en el centro de masas del sólido, y el ángulo entre dichos vectores, tendremos 2 = (x xp )2 = x2 + x2p 2k x kk xp k cos = k x k2 (1 2x↵ + x2 ), donde hemos llamado x = k xp k/k x k, ↵ = cos . Finalmente, puesto k x k, podremos poner 1 1 1 = p . r 1 2x↵ + x2 p El término 1/ 1 2x↵ + x2 suele sustituirse por su desarrollo en potencias X 1 p = Pn (↵)xn , 1 2x↵ + x2 n 0 cuyos coeficientes son los polinomios de Legendre. que r = (14.13) serie de (14.14) 224 Atracción de sólidos Para calcular la integral (14.12) a lo largo de toda la masa del sólido formularemos el problema en un sistema de coordenadas planetográficas (ver apartado 3.8), esto es, basado en el plano ecuatorial del planeta, rotando con él, y con un origen de longitudes establecido a priori. Si llamamos ( , ), respectivamente a la longitud y latitud planetográfica del satélite y (⇤, ) a las de un punto P del planeta, las direcciones de los vectores de posición del planeta y el satélite serán x̂S = cart(1, , ), x̂P = cart(1, ⇤, ). El coseno del ángulo entre estos dos vectores vendrá dado por el producto escalar de ambos, lo que lleva a la expresión cos = x̂S · x̂P = sen sen + cos cos cos(⇤ ). (14.15) La relación anterior, llevada a los polinomios de Legendre, permite obtener la siguiente una propiedad, que no demostraremos Pn (cos ) = Pn (sen )Pn (sen ) + 2 n X (n j=1 j)! Pnj (sen )Pnj (sen ) cos j(⇤ (n + j)! ). (14.16) Por otro lado, la expresión (14.12) del potencial del sólido se podrá poner como Z Z ⇣ ⌘n dm GX ⇢ V = G = Pn (cos ), r M M r n 0 de donde, usando la relación (14.16), llegamos a GM GM X ⇣ rp ⌘n V = + Jn Pn (sen ) r r r n 1 n X j=1 Pnj (sen ) (Cnj cos j + Snj sen j )5 , siendo rp el radio ecuatorial del planeta, M la masa del mismo y Z ✓ ◆n 1 ⇢ Pn (cos ) dm, Jn = M M rp Z ✓ ◆n 2 j)! ⇢ 0m (n Cnj = Pnj (sen ) cos j⇤ dm, M (n + j)! M rp Z ✓ ◆n 2 j)! ⇢ 0m (n Snj = Pnj (sen ) sen j⇤ dm, M (n + j)! M rp donde hemos tomado Jn = 3 (14.17) (14.18) Cn0 y hemos considerado que se verifica Sn0 = 0. Potencial gravitatorio de un planeta 225 Consideremos ahora la definición de la matriz de inercia de un sólido, cuyos elementos se expresan como Z Iij = (r2 ij xi xj )dm, M y la de su centro de masas rc = xc1 e1 + xc2 e2 + xc3 e3 e1 = M Z e2 x1 dm + M M Z e3 x2 dm + M M Z x3 dm, M donde r2 = x21 + x22 + x23 y ij vale 0 o 1 según i y j sean iguales o distintos. Expresando estas integrales en coordenadas polares esféricas y comparándolas con las expresiones (14.18) podemos llegar, tras una serie de cálculos, a las siguientes igualdades xc 2xc 2xc J1 = 3 , C11 = 1 , S11 = 2 , rp rp rp que nos indican que, eligiendo el centro de masas del planeta como origen de coordenadas, se llega a J1 = 0, C11 = 0, S11 = 0, lo que permite poner V = GM GM X ⇣ rp ⌘n + r r r n 2 Jn Pn (sen ) n X j=1 3 Pnj (sen ) (Cnj cos j + Snj sen j )5 . (14.19) Por otro lado, encontramos que J2 = 1 (I11 + I22 2M rp 2I33 ), (14.20) que nos da el valor del coeficiente J2 en términos de los momentos de inercia. Todos los demás coeficientes pueden ser encontrados en términos de los elementos de la matriz de inercia. Los coeficientes Jn de la expresión (14.19) del potencial del sólido son llamados armónicos zonales, mientras que los Cij , Sij , j 6= 0, son los armónicos teserales. Una idea más precisa acerca del significado de éstos coeficientes puede encontrarse en cualquier libro de Geodesia. Notemos que cuando el sólido es de revolución la simetrı́a del mismo hace que las integrales que definen los armónicos teserales sean todas cero, por lo que en este caso Cij = 0, Sij = 0, y el potencial contiene sólo términos zonales. 226 Atracción de sólidos Si además de ser de revolución posee simetrı́a respecto al plano Oxy, entonces los términos zonales impares son también cero, J2n+1 = 0. Fijándonos en la expresión de J2 observamos que este término nos da una medida de la diferencia entre el momento de inercia del eje Oz respecto a los otros dos ejes, es decir, J2 nos indicará el achatamiento del planeta. Ya se ha dicho antes que órdenes n del potencial muy altos nos dan valores de Pnm muy grandes y valores de los armónicos Cnm , Snm muy pequeños. El producto del coeficiente de normalización Nnm , dado en (14.8), por el polinomio Pnm conduce a la obtención de un nuevo polinomio P̄nm de valor moderado. Si se usa esta normalización en la expresión del potencial debemos sustituir los armónicos Cnm , Snm por los armónicos normalizados C̄nm , S̄nm , introducidos por Kaula y que se definen por medio de las expresiones: ⇢ C̄nm S̄nm 1 = Nnm ⇢ Cnm Snm . (14.21) Aunque fue Kaula quien introdujo los coeficientes normalizados, en su teorı́a del satélite utiliza coeficientes sin normalizar. Fueron Heiskanen y Moritz en 1967 quienes los utilizaron por primera vez en la teorı́a del potencial. El tratamiento numérico de modelos de potencial de grado alto hace imprescindible su normalización, por lo que todos los modelos se presentan con el valor de los armónicos normalizados. Sin embargo, el tratamiento analı́tico, que no puede ser llevado todavı́a a órdenes muy altos, suele realizarse con los coeficientes sin normalizar, pues de este modo, el manejo de los polinomios de Legendre es más sencillo al no ser necesario el uso de los coeficientes de normalización que introducen números irracionales. La introducción de los coeficientes (14.21) permite expresar el potencial en la forma " n # GM GM X ⇣ rp ⌘n X V = C̄nm cos m + S̄nm sen m P̄nm (sen ) . r r r m=0 n 2 (14.22) El primer sumando de la expresión anterior, que llamaremos potencial kepleriano, corresponde al potencial creado por una masa puntual y coincide con el potencial que producirı́a el planeta si fuese un punto o una esfera homogénea. El resto de términos constituyen el potencial perturbador Vp que es producido por la forma no esférica del planeta. 14.4 Modelos de potencial gravitatorio La obtención de los términos del potencial terrestre se realiza principalmente a partir de las perturbaciones observadas en las órbitas de los satélites artificiales. Modelos de potencial gravitatorio 227 El lanzamiento, en 1957, del Sputnik I y sus primeras observaciones permitieron a King-Hele obtener en 1958 una precisión de 4 dı́gitos en el cálculo de J2 , lo que mejoraba en dos dı́gitos la que se poseı́a hasta entonces. Otros satélites lanzados poco después, como el Vanguard I en 1959, permitieron también detectar el coeficiente J3 que indica la asimetrı́a norte-sur del geoide. Desde ese momento el conocimiento de los coeficientes del potencial terrestre ha avanzado mucho, como modelos militares clasificados en un primer momento y como modelos de dominio público de gran precisión en la actualidad. Entre los modelos actuales podemos destacar el modelo JGM-3 desarrollado en la Universidad de Texas y que alcanza un grado 70 ⇥ 70. Aunque JGM-3 es un modelo de gravedad global muy elaborado para determinación de órbitas con precisión, nuevos modelos son continuamente desarrollados. Una muestra de ello es la colaboración del NASA/GSFC, la National Imagery and Mapping Agency (NIMA) y la Universidad del Estado de Ohio (OSU), que publicó el EGM96S (Earth Gravity Model), de grado y orden 70, y el modelo EGM96, de grado y orden 360. Posteriormente, el National Geospatial-Intelligence Agency (NGA), organismo que e 2003 sustituyó al NIMA, generó el modelo más preciso hasta el momento, el EGM2008, que tiene un grado y orden igual a 2159. El estudio del potencial lunar comienza con el lanzamiento, en 1966, del satélite lunar ruso Luna-10 que demostró el achatamiento de la Luna. Los datos de la misión Clementine permitieron construir el modelo GLGM-2 de grado y orden 70. Este modelo fue mejorado con las observaciones del Lunar Prospector con el nuevo modelo LP75D de grado y orden 75 y finalmente con el LP165P, de grado y orden 165. En el caso del planeta Marte el primer análisis preciso del campo gravitatorio llegó a partir de los datos de seguimiento del Mariner 9. Dicha nave estuvo orbitando alrededor de Marte durante 11 meses, desde noviembre de 1971, con una órbita de unas 12 horas de periodo, altitudes entre 1390 y 1650 km y 64 de inclinación. También se descubrió que el campo gravitatorio de Marte era mucho más irregular que el de la Tierra, con variaciones totales sobre el geoide por encima de los 2000 m frente a los menos de 200 m para el caso terrestre. Una altura del geoide superior a 1200 m fue detectada en Tharsis y reveló el alto valor del cociente C2 2 /S2 2 del campo gravitatorio de Marte. Con datos de la misión Mars Observer y otras anteriores se desarrolló el modelo de potencial Goddard Mars Model-1, o GMM-1 de grado y orden 50. Posteriormente la misión Mars Global Surveyor (MGS), junto con los datos obtenidos por el Mars Orbiter Laser Altimeter (MOLA) permitió obtener un modelo gravitatorio de Marte de grado y orden 80, el Goddard Mars Model 2B (GMM-2B) y posteriormente una mejora del mismo, también de grado y orden 80, llamada MGM1025. Las observaciones por radiometrı́a Doppler, realizadas por la sonda Magallanes en la superficie del planeta Venus, han permitido obtener varios modelos de 228 Atracción de sólidos potencial para este planeta. Comenzando por el modelo MGNP120P de grado y orden 120, posteriormente mejorado con el modelo MGNP180U, de grado y orden 180. Tierra 1.0826 · 10 2.5324 · 10 1.6193 · 10 2.2772 · 10 5.3965 · 10 J2 J3 J4 J5 J6 Luna 2.032 · 10 8.476 · 10 9.592 · 10 7.154 · 10 1.358 · 10 3 6 6 7 7 4 6 6 7 5 Marte 1.955 · 10 3.145 · 10 1.538 · 10 5.719 · 10 4.849 · 10 3 5 5 6 6 Venus 4.404 · 10 2.109 · 10 2.147 · 10 4.669 · 10 1.165 · 10 6 6 6 7 7 Tabla 14.1: Valor de los primeros armónicos zonales para la Tierra, la Luna, Marte y Venus. En la tabla 14.1 se muestran los valores de los seis primeros armónicos, sin normalizar, del potencial de la Tierra, la Luna, Marte y Venus extraidos de los modelos JGM-3, LP165P, GMM-2B y MGNP180U respectivamente. 14.5 Evaluación del potencial planetario y la fuerza derivada La expresión del potencial perturbador de un planeta puede también ponerse como n GM X X VP = Vnm , (14.23) rp m=0 n 2 donde hemos llamado Vnm = ⇢n+1 C̄nm um + S̄nm vm Q̄nm (w1 ), siendo ⇢n = um vm wm = = = ⇣ r ⌘n (14.24) p , r cos m cosm , sen m cosm , senm . (14.25) Si expresamos el vector x en el sistema planetográfico, llamamos (x, y, z) a sus componentes x = x p1 + y p2 + z p3 = r cos cos p1 + r sen cos p2 + r sen p3 , y por otro lado llamamos u a la dirección radial u = x/r = u p1 + v p2 + w p3 , podemos expresar en función de ellos los elementos: u0 u1 = = 1, u = x/r, v0 v1 = = 0, v = y/r, w0 w1 = = 1, w = z/r. (14.26) Evaluación del potencial planetario y la fuerza derivada 229 La evaluación del término Vnm del potencial se realiza por un procedimiento iterativo usando, por un lado, las expresiones (14.11) y por otro las relaciones um = um 1 u1 vm 1 v1 , vm = v m 1 u1 + um 1 v1 , (14.27) que terminan con los valores (14.26). Para calcular la perturbación que el planeta ejerce sobre la órbita del satélite usaremos la relación PP = rx V p = n GM X X P nm , rp m=0 n 2 P nm = rx Vnm . Por otro lado, si observamos la expresión (14.24) y las relaciones iterativas que construyen el término Vnm , podemos concluir que éste término depende únicamente de las variables (r, u, v, w), por lo que podremos poner rx Vnm = @Vnm @Vnm @Vnm @Vnm rx u + rx v + rx w + rx r. @u @v @w @r Teniendo en cuenta que r = k x k, u = x/k x k, v = y/k x k, w = z/k x k, se deducen facilmente las expresiones: rx u = rx v = rx w = rx r = 1 p r 1 1 p r 2 1 p r 3 u. u u, r v u, r w u, r Por otro lado es fácil deducir que: ✓ ◆ @Vnm @um @vm = ⇢n+1 C̄nm + S̄nm Q̄nm (w1 ), @u @u @u ✓ ◆ @Vnm @um @vm = ⇢n+1 C̄nm + S̄nm Q̄nm (w1 ), @v @v @v @Vnm = ⇢n+1 C̄nm um + S̄nm vm n,m Q̄n,m+1 (w1 ), @w @Vnm n+1 = ⇢n+2 C̄nm um + S̄nm vm Q̄nm (w1 ), @r rp (14.28) (14.29) siendo n,m = Nn,m /Nn,m+1 el valor obtenido en la derivación de la expresión (14.10) y la definición de Qn,m . Simplificando esta expresión se obtiene r p 1 n (n + 1), (n m) (n + m + 1). n,0 = n,m = 2 230 Atracción de sólidos El proceso de cálculo quedará completado si obtenemos las derivadas parciales de um , vm con respecto a las variables u y v. Para calcular estas derivadas tendremos en cuenta que um y vm coinciden con la parte real e imaginaria del número complejo cosm cos m + i cosm sen m . De acuerdo con las propiedades de los números complejos éste último es la potencia m-sima del número cos cos + i cos sen = u + iv. Por tanto podremos poner finalmente que um = <[(u + iv)m ], vm = =[(u + iv)m ], De donde, por simple derivación, se llega a las relaciones: @um @u @um @v = m um = @vm @u @vm @v 1, m vm 1, = m vm 1, = m um 1, (14.30) que completan el proceso de cálculo de la fuerza perturbadora del planeta. Aunque las expresiones (14.29) no son válidas cuando m = 0 pueden usarse si extendemos el conjunto de subı́ndices de um , vm , añadiendo los elementos u 14.6 1 = 0, v 1 = 0. Potencial terrestre en variables polares nodales La relación entre las coordenadas planetográficas y las polares– nodales puede deducirse a partir de la figura 14.4, donde podemos observar que el vector x tiene, en el sistema nodal-espacial P, unas coordenadas polares (r, ⌫, ), y de éste pasamos al sistema orbital por medio de la matriz de giro R1 (i)R3 (✓), luego podremos poner el vector cart(r, p3 n i x p1 ⌫ l ⌫, ), como el resultado del producto R1 (i)R3 (✓) cart(r, 0, 0). p2 ✓ ⌫ Figura 14.4: Relación entre las coordenadas polares-nodales y las planetográficas. Igualando ambos vectores y tras una serie de cálculos, llegamos a cos ✓ cos i sen ✓ sen i sen ✓ = = = cos cos( cos sen( sen , ⌫), ⌫), (14.31) Ecuaciones del movimiento en el sistema planetográfico 231 expresiones que, desarrolladas y combinadas con (14.25), nos conducen a cos ✓ cos i sen ✓ sen i sen ✓ = = = u1 cos ⌫ + v1 sen ⌫, v1 cos ⌫ u1 sen ⌫, w1 . (14.32) Finalmente, invirtiendo estas relaciones se llega a u1 = v1 = w1 = 1 (1 ci ) cos(✓ 2 1 (1 ci ) sen(✓ 2 si sen ✓, 1 ⌫) + (1 + ci ) cos(✓ + ⌫), 2 1 ⌫) + (1 + ci ) sen(✓ + ⌫), 2 (14.33) donde hemos llamado N ci = cos i = , ⇥ si = sen i = r 1 N2 . ⇥2 (14.34) Estas relaciones permiten expresar las ui , vi , wi , y a través de ellas la expresión del potencial en términos de las variables r, ✓, ⌫, y de los momentos R, ⇥, N . Las relaciones (14.33) permiten deducir que los términos zonales Jn Pn (w1 ) del potencial no contienen la variable ⌫, mientras que esta variable aparece cuando se consideran los términos teserales. 14.7 Ecuaciones del movimiento en el sistema planetográfico Al plantear las ecuaciones del movimiento de un satélite en torno a un planeta debemos considerar el hecho de que el sistema de referencia donde se ha formulado el potencial y, consecuentemente, la fuerza perturbadora es el sistema geográfico o planetográfico, que es un sistema rotante y por ello no inercial. Las ecuaciones del movimiento podrán ser formuladas siguiendo uno cualquiera de los dos caminos siguientes: Multiplicar la fuerza perturbadora por la matriz de giro, RSP , que pasa de un sistema de referencia espacial, que es inercial, al sistema planetográfico P. Formular las ecuaciones del movimiento en un sistema no inercial. En el primer caso las ecuaciones del movimiento serán ẍ + µ x = RSP P P , r3 (14.35) 232 Atracción de sólidos donde P P ha sido calculado en el apartado 14.5. Para formular el movimiento orbital en el sistema rotante será preciso usar la ecuación (6.5). De esta forma, las ecuaciones (12.1), se pondrán como x00 + 2! ⇥ x0 + ! 0 ⇥ x + ! ⇥ (! ⇥ x) + µ x = PP , r3 (14.36) donde P P = rx Vp es la perturbación y el vector ! representa el vector de rotación de la Tierra o de un planeta, que es constante, por lo que ! 0 = 0 y por tanto el sumando ! 0 ⇥ x desaparece de esta ecuación. Podemos fácilmente comprobar que la solución a este problema es equivalente a la de un sistema dinámico de hamiltoniano H(x, X) = 1 X ·X 2 µ kxk ! · (x ⇥ X) + Vp , (14.37) donde las coordenadas de x son las variables y las de X son los momentos. En efecto, las ecuaciones de Hamilton correspondientes a dicho sistema se expresarán como x0 = rX H = X ! ⇥ x, (14.38) µ X0 = rx H = !⇥X x r V , x p r3 0 0 donde hemos puesto x , X pues en dichas ecuaciones entran únicamente las derivadas respecto al tiempo de las variables y los momentos, esto es, de las coordenadas de x, X, por ello no es necesario derivar los vectores respecto a los elementos de la base del sistema de referencia. Es importante hacer notar que el vector X, de momentos, representa la velocidad absoluta expresada en el sistema rotante y no la velocidad relativa. Derivando respecto al tiempo las componentes de los vectores de la primera de las ecuaciones anteriores, después de despejar X, se llega a la expresión X 0 = x00 + ! ⇥ x0 + ! 0 ⇥ x = x00 + ! ⇥ x0 , que igualada a la segunda nos lleva a x00 + ! ⇥ x0 + ! ⇥ (x0 + ! ⇥ x) + µ x= r3 rx Vp = P P , que coincide con (14.36) haciendo ! 0 = 0. Ası́ pues, al formular el movimiento orbital de un satélite artificial en el sistema de referencia rotante de un planeta el hamiltoniano del problema se pondrá como H(x, X) = Hk + Hr + Vp , (14.39) Hr (x, X) = (14.40) donde ! · (x ⇥ X). Ecuaciones del movimiento en el sistema planetográfico 233 es el término debido a la rotación del planeta, también llamado término de Coriolis. El término Hr , expresado en variables polares-nodales de acuerdo con la definición de aquéllas, se pondrá como Hr = ! · (x ⇥ X) = ! N, (14.41) !H. (14.42) mientras que en en variables de Delaunay será Hr = ! · (x ⇥ X) = La ausencia de ⌫ y N (h y H) en el hamiltoniano del problema, cuando se formula en un sistema inercial, hace que ⌫ y N sean constantes por lo que el número de grados de libertad se reduce en una unidad. Cuando el problema se formula en un sistema rotante hemos de añadir al Hamiltoniano el término ! N , siendo la variable ⌫ ignorable. Esto conduce a las integrales: N constante y ⌫ = ! t, esto es, el nodo varı́a linealmente en el sistema rotante. Aquı́ el número de grados de libertad puede reducirse igualmente. Este resultado puede extenderse cuando en la perturbación no aparece explı́citamente la variable ⌫. 234 Atracción de sólidos Capı́tulo 15 Otras perturbaciones 15.1 Rozamiento atmosférico Las distintas capas de la atmósfera terrestre: troposfera, estratosfera, mesosfera, termosfera y exosfera, llegan a alcanzar una altitud de 1000 km por encima de la superficie, disminuyendo exponencialmente en densidad desde la superficie hasta las regiones exteriores. El rozamiento producido por la atmósfera en esta región contribuye a disminuir la velocidad de cualquier vehı́culo que se mueva dentro de ella. La fuerza que la atmósfera ejerce sobre un satélite artificial es muy grande a altitudes bajas, de hecho, no suelen situarse satélites artificiales por debajo de los 350 km, pues su órbita serı́a demasiado inestable y la acción de la atmósfera los harı́a caer rápidamente a la Tierra. Esta fuerza se aprovecha en la práctica para frenar una nave espacial cuando se le hace regresar a la superficie terrestre. Sin embargo, esta maniobra se hace muy peligrosa para una altitud de unos 120 km1 , donde se considera que el satélite efectúa su reentrada en la atmósfera, pues es donde se comienzan a observar los efectos de la atmósfera sobre la nave. La fuerza de rozamiento atmosférico lleva la dirección opuesta a la velocidad del satélite relativa a la atmósfera, depende, fundamentalmente, de su densidad y de la superficie en contacto entre el satélite y la atmósfera. La expresión de la aceleración (perturbación) producida por esta fuerza en el satélite puede expresarse 1 No confundir con los 100 km de la llamada lı́nea de Karman que la Federación Internacional de Astronáutica fija como lı́mite de la atmósfera y que representa la altitud por encima de la cual un avión no puede volar por fuerzas de tipo aerodinámico. 236 Otras perturbaciones como P AT = 1 A Cd ⇢ k v kv. 2 m (15.1) El coeficiente Cd es un coeficiente de rozamiento adimensional que describe la interacción de la atmósfera con la superficie material del satélite y depende de las propiedades quı́micas y fı́sicas de la atmósfera, la geometrı́a del satélite y de propiedades de los materiales del mismo. Tiene un valor entre 1 y 3 pero no es conocido con precisión hasta que no se efectúa una determinación precisa de la órbita del satélite. Suele tomarse igual a 2 como primera aproximación en el caso de satélites esféricos mientras que se establece un valor entre 2 y 2.3 para satélites de forma convexa. El área A es la superficie efectiva del satélite o el área normal al satélite en la dirección del movimiento. Es función de su geometrı́a y de su actitud u orientación en el espacio, por ello depende de t. Al factor B = Cd A/m, resultante de dividir por la masa del satélite el producto del coeficiente de rozamiento y el área efectiva, se le llama coeficiente balı́stico. El vector v representa la velocidad del satélite con respecto al aire circundante. La dinámica de la atmósfera es muy compleja, sin embargo, podemos aproximar el valor de v por medio de la expresión v=X ! ⇥x vv , (15.2) donde x, X representan la posición y velocidad del satélite respecto del sistema inercial, ! la velocidad angular de rotación de la Tierra y v v la velocidad del viento. El error al no considerar la velocidad del viento puede ser de un máximo del 5 % de la fuerza del rozamiento. La velocidad v se calcula en un sistema de referencia rotante con la Tierra, el sistema E$ , donde el vector ! = (0, 0, ! ), siendo ! = 0.7292 ⇥ 10 4 rad/s, por eso el vector P AT debe transformarse finalmente al sistema espacial multiplicándolo por la matriz de rotación RSE$ . Finalmente, para completar el modelo debe obtenerse un valor de la densidad ⇢ de la atmósfera. Esta densidad es una función poco conocida que depende de un gran número de parámetros como la altitud, longitud, latitud, actividad solar, ı́ndice geomagnético, tiempo, etc., y que es tratada a partir de modelos más o menos complejos que dan una estimación de la densidad de la atmósfera en cada punto. Existen dos tipos de modelos: estáticos y modelos que varı́an con el tiempo. Los primeros son mucho más simples y fáciles de usar pero no dan precisión suficiente en determinados problemas. Los segundos pueden ser extremadamente complejos en su aplicación y difı́ciles de calcular por lo que en muchas ocasiones deben ser sustituidos por los primeros. Comenzaremos con uno de los modelos más simples que supone que la densidad decrece exponencialmente desde la superficie de la Tierra. Este modelo, llamado Rozamiento atmosférico 237 modelo exponencial, está basado en una fórmula del tipo ✓ ◆ h0 h ⇢ = ⇢o exp , H0 (15.3) donde ⇢0 es la densidad de referencia en una altitud h0 mientras que H0 es un factor de escala. Los valores de ⇢o , h0 , H0 , para distintas altitudes h, se toman de la tabla 15.1 h0 0 25 30 40 50 60 70 80 90 100 110 120 130 140 ⇢0 1.225 3.899 ⇥10 1.774 ⇥10 3.972 ⇥10 1.057 ⇥10 3.206⇥10 8.770⇥10 1.905⇥10 3.396⇥10 5.297⇥10 9.661⇥10 2.438⇥10 8.484⇥10 3.845⇥10 2 2 3 3 4 5 5 6 7 8 8 9 9 H0 7.249 6.349 6.682 7.554 8.382 7.714 6.549 5.799 5.382 5.877 7.263 9.473 12.636 16.149 h0 150 180 200 250 300 350 400 450 500 600 700 800 900 1000 ⇢0 2.070 ⇥ 10 9 5.464 ⇥10 10 2.789 ⇥10 10 7.248 ⇥10 11 2.418⇥10 11 9.158⇥10 12 3.725⇥10 12 1.585⇥10 12 6.967⇥10 13 1.454⇥10 13 3.614⇥10 14 1.170⇥10 14 5.254⇥10 15 3.019⇥10 15 H0 22.523 29.740 37.105 45.546 53.628 53.298 58.515 60.828 63.822 71.835 88.667 124.64 181.05 268.00 Tabla 15.1: Tabla de valores de referencia en el modelo exponencial de densidad atmosférica. Las unidades de h0 y H0 están en km, mientras que ⇢0 está expresado en kg/m3 . El modelo de Harris–Priester es otro modelo estático pero que que produce muy buenos resultados por lo que es ampliamente usado y recomendado y da una aproximación suficiente para muchas aplicaciones. Este modelo está basado en la solución de la ecuación de conducción del calor bajo condiciones casi hidrostáticas. Su formulación se efectúa por medio de dos valores mı́nimo y máximo de la densidad para una altitud h que se obtienen a partir de las expresiones ✓ ◆ hi h ⇢m (h) = ⇢m (hi ) exp , Hm ✓ ◆ hi h ⇢M (h) = ⇢M (hi ) exp , hi h hi+1 , HM donde h es la altitud del satélite sobre el elipsoide de referencia. Los valores de los parámetros hi , ⇢m (hi ), ⇢M (hi ) son tomados de la tabla 15.2, mientras que Hm , HM se obtienen a partir de las expresiones Hm (h) = hi hi+1 , ln (⇢m (hi+1 )/⇢m (hi )) 238 Otras perturbaciones hi 100 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 280 290 300 320 340 360 380 400 ⇢m (hi ) 4.974⇥10 2.490⇥10 8.377⇥10 3.899⇥10 2.122⇥10 1.263⇥10 8.008⇥10 5.283⇥10 3.617⇥10 2.557⇥10 1.839⇥10 1.341⇥10 9.949⇥10 7.488⇥10 5.709⇥10 4.403⇥10 3.430⇥10 2.697⇥10 2.139⇥10 1.708⇥10 1.099⇥10 7.214⇥10 4.824⇥10 3.274⇥10 2.249⇥10 7 8 9 9 9 9 10 10 10 10 10 10 11 11 11 11 11 11 11 11 11 12 12 12 12 ⇢M (hi ) 4.974⇥10 2.490⇥10 8.710⇥10 4.059⇥10 2.215⇥10 1.344⇥10 8.758⇥10 6.010⇥10 4.297⇥10 3.162⇥10 2.396⇥10 1.853⇥10 1.455⇥10 1.157⇥10 9.308⇥10 7.555⇥10 6.182⇥10 5.095⇥10 4.226⇥10 3.526⇥10 2.511⇥10 1.819⇥10 1.337⇥10 9.955⇥10 7.492⇥10 7 8 9 9 9 9 10 10 10 10 10 10 10 10 11 11 11 11 11 11 11 11 11 12 12 hi 420 440 460 480 500 520 540 560 580 600 620 640 660 680 700 720 740 760 780 800 840 880 920 960 1000 ⇢m (hi ) 1.558⇥10 1.091⇥10 7.701⇥10 5.474⇥10 3.916⇥10 2.819⇥10 2.042⇥10 1.488⇥10 1.092⇥10 8.070⇥10 6.012⇥10 4.519⇥10 3.430⇥10 2.620⇥10 2.043⇥10 1.607⇥10 1.281⇥10 1.036⇥10 8.496⇥10 7.069⇥10 4.680⇥10 3.200⇥10 2.210⇥10 1.560⇥10 1.150⇥10 12 12 13 13 13 13 13 13 13 14 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 ⇢M (hi ) 5.684⇥10 4.355⇥10 3.362⇥10 2.612⇥10 2.042⇥10 1.605⇥10 1.267⇥10 1.005⇥10 7.997⇥10 6.390⇥10 5.123⇥10 4.121⇥10 3.325⇥10 2.691⇥10 3.325⇥10 1.779⇥10 1.452⇥10 1.190⇥10 9.776⇥10 8.059⇥10 5.741⇥10 4.210⇥10 3.130⇥10 2.360⇥10 1.810⇥10 12 12 12 12 12 12 12 12 13 13 13 13 13 13 13 13 13 13 14 14 14 14 14 14 14 Tabla 15.2: Tabla de valores de referencia en el modelo de Harris–Priester de densidad atmosférica. Las unidades de hi están en km, mientras que ⇢m , ⇢M están expresados en kg/m3 . HM (h) = hi hi+1 . ln (⇢M (hi+1 )/⇢M (hi )) La densidad ⇢ a una altitud h se obtendrá finalmente por medio de la expresión ✓ ◆(n/2) 1 u·a ⇢(h) = ⇢m (h) + (⇢M (h) ⇢m (h)) + , (15.4) 2 2 donde u es la dirección del satélite y a = cart(1, ↵ + 30 , ), siendo ↵ , la ascensión recta y declinación del Sol. El exponente n toma un valor igual a 2 para órbitas bajas y 6 para órbitas polares. Entre los modelos no estáticos más usados se encuentran los modelos de Jaccia, en particular los modelos J71 y J77 que son unos modelos muy precisos pero muy difı́ciles de usar y que no abordaremos en este libro. Presión de radiación solar 15.2 239 Presión de radiación solar Cualquier cuerpo en el espacio recibe una radiación del Sol que produce una fuerza que depende de la superficie del cuerpo expuesta a la radiación solar, de sus propiedades de absorción y de la presión ejercida por esta radiación. Para formular la fuerza producida por la radiación solar comenzaremos con un parámetro llamado intensidad o flujo solar = A E , t donde E es la energı́a recibida en un tiempo t y en una superficie A. La intensidad solar ha sido calculada a partir de la estimación del número de fotones por centı́metro cuadrado que llegan a una distancia igual a una unidad astronómica y la energı́a de un fotón. Aunque el valor de no es exactamente constante, para la mayorı́a de las aplicaciones es suficiente tomarlo igual a = 1367W/m2 . Por otro lado, si tenemos en cuenta la ecuación de Einstein E = mc2 , se deduce fácilmente que pf = mc = Ef /c, lo que nos da la norma de la cantidad de movimiento de un fotón siendo Ef su energı́a. A partir de este valor y teniendo en cuenta la cantidad de fotones que impactan sobre un cuerpo, lo que se relaciona con la intensidad solar, podemos deducir que el impulso o variación de la cantidad de movimiento, en un tiempo t, de un cuerpo que absorbe toda la energı́a, o lo que es igual, que recibe toda la cantidad de movimiento de los fotones, es igual a Ef e = c p= c A t e , siendo A el área la sección del cuerpo que recibe la radiación o área efectiva, y e la dirección del cuerpo al Sol. De esta forma, la fuerza que actúa sobre dicho cuerpo puede ponerse como F abs = donde P c Ae = P Ae , representa la presión de radiación solar P = c = 4.56 ⇥ 106 m 1 kg s 2 que se ha calculado a partir de los valores constantes de , y c. En la expresión anterior de la fuerza, y en lo que sigue, se ha supuesto que el fotón incide perpendicular a la superficie del satélite, esto es, el ángulo de incidencia vale cero. Esto es una aproximación al modelo real en el que debemos considerar este ángulo y la actitud del satélite, sin embargo, para la mayorı́a de las aplicaciones esta aproximación será suficiente. Pensemos, por ejemplo, en la aplicación de este modelo a un satélite en el que la mayor superficie la forman los paneles solares que deben estar siempre orientados perpendicularmente al Sol. 240 Otras perturbaciones En el caso de que el cuerpo refleje toda la energı́a, de forma especular, el momento angular pf del fotón pasa a ser pf , en lugar de anularse como en el caso de la completa absorción. Debido a esto el impulso y por tanto la fuerza serán el doble de la anterior F ref = 2P A e . En la práctica parte de la radiación se refleja y parte se absorbe por lo que el modelo de fuerza producido por la radiación solar será F r = ✏ F ref + (1 ✏)F abs = P (1 + ✏) A e , donde ✏ es un parámetro de reflectividad del cuerpo que toma un valor entre 0 (completa absorción) y 1 (completa reflexión). Habitualmente se sustituye este parámetro por Cr = (1 + ✏), cuyo valor es igual a 1.21 para los paneles solares y 1.81 para el aluminio. Finalmente se tendrá Fr = P Cr A e . El valor de la presión de radiación solar P ha sido calculado para una unidad astronómica de distancia rAU 2 , sin embargo, la distancia del cuerpo al Sol r varı́a con el tiempo, produciendo, para un satélite artificial terrestre, una variación de ±3.3 % en la presión de radiación. Puesto que el flujo solar decrece con el cuadrado de la distancia al Sol podemos establecer finalmente que el valor de la aceleración producida en el satélite por la presión de la radiación solar es P RAD = P Cr A 2 x x r , m AU k x x k3 donde hemos tenido en cuenta que la distancia del satélite al Sol es k x su dirección e = (x x )/k x x k. (15.5) x ky La presión de radiación solar disminuye cuando no es visible toda la superficie del Sol y desaparece cuando éste no es visible, de ahı́ la importancia del estudio del fenómeno de los eclipses desde el punto de vista de la navegación espacial. De hecho, la expresión (15.5) debe ser sustituida por la siguiente P RAD = (x, x ) P Cr A 2 x x r , m AU k x x k3 (15.6) donde (x, x ) es una función que depende de la posición del satélite y del Sol y que representa la fracción del disco solar visible. Si el disco del Sol es totalmente visible, es decir no hay eclipse, entonces = 1. Si el disco solar está totalmente oculto por algún planeta o cuerpo, entonces = 0. El valor de tomará un valor entre 0 y 1 cuando el Sol está parcialmente eclipsado. 2 El factor r AU se introduce en la expresión para unificar las unidades en que ha sido calculada la presión de radiación con las unidades que se usan para formular las ecuaciones del movimiento. Eclipses 15.3 241 Eclipses El fenómeno de la presión de radiación solar afecta a cualquier nave espacial, tanto sea una sonda espacial interplanetaria como satélite artificial orbitando en torno a la Tierra, la Luna o un planeta. Además, la visibilidad del Sol afecta también al funcionamiento de muchos sistemas de la nave que dependen de la recepción de energı́a en los paneles solares, por ello es tan importante el conocimiento de los posibles eclipses en cualquier misión espacial. No debemos quedarnos únicamente en los producidos por la Tierra al interponerse por delante del Sol en un satélite artificial, sino que debemos estudiar la producción de eclipses cuando el cuerpo que lo produce no sea la Tierra. De hecho la Luna también puede producir eclipses en un satélite artificial terrestre. 15.3.1 Semidiámetros y distancia angular La producción de un eclipse está relacionada con el tamaño del semidiámetro observado del Sol y el del planeta, o cuerpo P que pueda eclipsarlo, y la distancia angular entre ambos. S s s sP RP R P Figura 15.1: Separación angular y semidiámetros del Sol y el planeta desde el satélite artificial. Como puede verse en la figura 15.1, la relación entre la distancia angular s y los semidiámetros s y sP nos indicará la existencia o no de eclipses. Para calcular éstas bastará obtener unas sencillas relaciones angulares y trigonométricas. 242 Otras perturbaciones Supongamos que los vectores de posición del planeta y del Sol, vistos desde el satélite, vienen dados por SP , S respectivamente. El semidiámetro sP (s ) del planeta P (Sol) se obtendrá teniendo en cuenta el triángulo rectángulo formado por el satélite S, el centro del planeta P (centro del Sol ) y el punto de tangencia de la recta tangente al planeta (Sol) desde S. Si RP , R representan el radio del planeta y Sol y k SP k, k S k la distancia entre el satélite y el planeta y el Sol, entonces podremos poner ✓ ◆ ✓ ◆ RP R sP = asen , s = asen . (15.7) k SP k kS k Por otro lado, la separación angular entre el Sol y el planeta, vistos desde el satélite, vendrán dados por el producto escalar de SP y S , por lo que podremos poner ✓ ◆ SP · S s = acos . (15.8) k SP kk S k Los valores de s, s , sP pueden calcularse en cualquier instante del tiempo si se conocen con precisión las posiciones del satélite, el planeta y el Sol. 15.3.2 Condiciones para un eclipse Atendiendo al valor relativo de las cantidades s, s , sP podemos decir en cualquier momento si se está produciendo un eclipse y de qué tipo. Obviamente, cuando la distancia angular s sea mayor que la suma s + sP , los centros aparentes del Sol y el planeta estarán suficientemente alejados por lo que no habrá ningún eclipse y la superficie del Sol se verá en su totalidad. (a) Comienzo del eclipse parcial. (b) Final del eclipse parcial. Figura 15.2: Posiciones de comienzo y final de un eclipse parcial. En el momento en que s = s + sP se produce la situación de la figura 15.2(a) donde los discos de el Sol y el planeta entran en contacto y por tanto el disco del Sol, que siempre estará más alejado, se oculta por detrás del disco del planeta comenzando el eclipse parcial. Eclipses 243 El eclipse parcial termina cuando uno de los discos está totalmente dentro del otro, lo que sucede, como vemos en la figura 15.2(b), en el momento en que s = |s sP |. En esta relación hemos tenido que poner el valor absoluto porque pueden darse dos casos según que el disco aparente del planeta sea mayor o menor que el del Sol. Esta situación no podrá darse cuando el satélite sea terrestre y el planeta que produce el eclipse la Tierra, pues en este caso el diámetro aparente de la Tierra es mucho mayor que el del Sol, pero si el que produce el eclipse es la Luna la situación relativa puede conducir al caso de que el disco del Sol sea mayor que el de la Luna. (a) Eclipse total (b) Eclipse anular Figura 15.3: Eclipses total y anular. Cuando s < |s sP | pueden producirse dos casos. Si el planeta tiene mayor semidiámetro, esto es s < sP y s < sP s , entonces el disco del planeta oculta totalmente el del Sol (figura 15.3(a)) produciéndose un eclipse total de Sol. Si por el contrario es el Sol el que tiene mayor semidiámetro, esto es sP < s y s<s sP , entonces el disco del planeta tapará únicamente parte del disco solar (figura 15.3(b)) produciéndose un eclipse anular. Podemos resumir las cuatro condiciones en los siguientes puntos: No hay eclipse: s + sP < s . Eclipse parcial: |s Eclipse total sP | < s < s + sP . : s < s P y s < sP Eclipse anular : sP < s 15.3.3 ys<s s . sP . Área de un segmento circular Para calcular la magnitud de un eclipse parcial hemos de tener en cuenta que, cuando éste se produce, la parte de disco oculta está formada por dos segmentos circulares como puede observarse en la figura 15.4. Cuando cortamos un cı́rculo de radio r por una recta secante QQ0 (figura 15.5) éste queda dividido en dos zonas o segmentos circulares, uno pequeño, que 244 Otras perturbaciones Figura 15.4: Segmentos circulares ocultos durante un eclipse parcial. no contiene el centro y que tiene un área A y otro grande, que contiene al centro, que tiene un área (⇡r2 A). Para caracterizar estos dos segmentos observaremos que la recta QQ0 divide al diámetro perpendicular en dos segmentos de longitud l = y y l = x + r = 2r y. Este parámetro l, que llamaremos longitud del segmento circular, determina a cual de los dos segmentos nos referimos. Q r z A ✓ r P x y Calcularemos, en primer lugar, el área A del menor de los segmentos. Para esto basta tener en cuenta que Q0 2 esta área es igual al área ✓ r del sector circular P QQ0 menos el área z x del triángulo P QQ0 . Simples relacio- Figura 15.5: Área de un segmento circular. nes geométricas permiten poner ✓ ◆ p r y A = r2 acos (r y) 2ry y 2 . r A partir de esta relación es fácil obtener el área del segmento en función de la longitud l, que puede ser mayor o menor que r. Ası́ tendremos la expresión: ✓ ◆ 8 p r l > 2 > r acos (r l) 2rl l2 , l < r, < r ✓ ◆ A(l, r) = (15.9) p > l r > : ⇡r2 r2 acos + (l r) 2rl l2 , l > r, r donde A(l, r) es una función que permite calcular el área de segmento de longitud l en un cı́rculo de radio r. Eclipses 15.3.4 245 Magnitud del eclipse Queda por calcular, finalmente, el valor de la función que determina la magnitud del eclipse, definiendo éste como la fracción de la superficie del disco solar oscurecida por el planeta. Aunque en (15.6) se ha definido este parámetro como función de x y x , expresaremos como función de los tres parámetros s, s , sP , que como sabemos se podrán calcular en términos de x y x . Comenzaremos por el caso del eclipse parcial, donde debemos buscar, en primer lugar, la longitud de los dos segmentos de cı́rculo que determinan la zona del disco solar oculta. Las dos situaciones, que corresponden a la figura 15.4, se representan también en los dos triángulos de la figura 15.6, de los cuales debemos obtener las longitudes de los segmentos de cı́rculo lm y lM . S sM sm z lM ✓M xM PM lm C M xm S0 Cm ✓m Pm S sM ✓M PM sm lM CM xM z ✓m Pm lm xm S 0 Cm Figura 15.6: Triángulo SPm PM . Los subı́ndices m y M usados en esta figura se definen de manera que se corresponden con el valor mı́nimo y máximo de los semidiámetros del Sol y el planeta, esto es sm = mı́n(s , sP ), sM = máx(s , sP ). (15.10) Calcularemos únicamente las longitudes lm y lM para el caso del triángulo de arriba de la figura. Las expresiones finales de lm y lM son idénticas en los dos casos. Si llamamos xm y xM a las distancias respectivas de Pm y PM a S 0 se tendrá la relación xm + xM = s. 246 Otras perturbaciones Por otro lado el teorema de Pitágoras aplicado a los triángulos Pi SS 0 nos da las relaciones z 2 + x2i = s2i para i = m, M . Restando ambas relaciones se obtiene s2M s2m = x2M x2m = (xM + xm )(xM xm ) = s(xM xm ), que junto con la expresión del párrafo anterior nos da un sistema lineal mediante el cual obtenemos xm = s2 s2M + s2m , 2s xM = s2 + s2M 2s s2m Observando la figura se deducen las relaciones li = si permiten escribir, para todos los casos, las expresiones lm = s m s2 s2M + s2m , 2s lM = s M s2 + s2M 2s . xi , i = m, M , que s2m . (15.11) Si tenemos en cuenta finalmente que el área del disco solar es ⇡s2 y que el área ocultada corresponde a dos segmentos circulares de longitudes respectivas li y radios ri , con i = m, M , podremos dar la siguiente expresión para la magnitud de un eclipse parcial = ⇡s2 A(lm , sm ) ⇡s2 A(lM , sM ) . Para un eclipse anular, en el que el semidiámetro del Sol es mayor que el del planeta, se tendrá ⇡s2 ⇡s2P s2P = = 1 . ⇡s2 s2 Finalmente podemos reunir todas las expresiones para la magnitud de un eclipse: 8 si > > 1, > > > si > 0, > > < 2 sP (s, s , sP ) = 1 si 2 > > s > > > 2 > A(lm , sm ) A(lM , sM ) > > ⇡s si : ⇡s2 y dar una expresión general s + sP < s, s < sP y s < s P s , sP < s y s < s sP , |s sP | < s < s + sP , (15.12) donde sm , sM , lm , lM vienen dados por (15.10) y (15.11). 15.3.5 Eclipses en satélites artificiales terrestres En el caso de los satélites artificiales terrestres pueden darse dos tipos distintos de eclipses: los producidos por la Tierra y los producidos por la Luna. Los primeros solo pueden ser parciales o totales, mientras que los segundos pueden ser parciales, totales o anulares. Perturbaciones relativistas 247 En ambos casos podemos usar las expresiones vistas en la sección 15.3 donde se tendrán las relaciones S = x x, SL = xL x, ST = x, siendo x el vector de posición del satélite, y xL , x los vectores de posición de la Luna y del Sol desde la Tierra. 15.4 Perturbaciones relativistas La formulación del movimiento orbital deberı́a, en rigor, ser efectuada de acuerdo con la teorı́a de la relatividad general en lugar de usar la ecuación fundamental de Newton de la Mecánica. La complejidad de esta formulación y el pequeño efecto que produce sobre la órbita obtenida por medio del planteamiento clásico hacen que la corrección relativista sea también tratada como una pequeña perturbación al modelo kepleriano. Este modelo, basado en la teorı́a newtoniana más las correcciones post-newtonianas, es llamado aproximación post-newtoniana. La aproximación post-newtoniana al problema de n cuerpos conduce a las ecuaciones EIH (Einstein, Infeld y Ho↵man). Estas ecuaciones han permitido descubrir el mayor efecto de la relatividad sobre el movimiento orbital, en concreto para las órbitas de los planetas: el desplazamiento del perihelio o variación del ángulo !. Este efecto fue detectado a mediados del siglo XIX en el planeta Mercurio y fue cuantificado por medio de la aproximación post-newtoniana en una variación por vuelta de != 24 ⇡ 3 a2 . P 2 c2 (1 e2 ) En el caso de Mercurio la anterior relación conduce a un valor de ! = 4.82⇥10 7 radianes, lo que equivale a unos 4300 por siglo. Para el planeta Venus el avance del perihelio es de 8.00 64 por siglo. La contribución post-newtoniana a la aceleración de un satélite artificial terrestre puede expresarse como ✓ ◆ µ 1 4µ PPN = 3 2 v 2 x + 4(x · X)X . (15.13) r c r Para una órbita circular se tendrá x · X = 0 y v 2 = µ/r, por lo tanto, la expresión (15.13) se transformará en ✓ ◆ µ x 3v 2 PPN = 3 , (15.14) r c2 248 Otras perturbaciones es decir coincide con la aceleración en el problema kepleriano multiplicada por el factor 3v 2 /c2 que vale aproximadamente 10 10 , lo que constituye una perturbación muy pequeña. 15.5 Perturbaciones empı́ricas Todos los modelos de fuerzas tratados en este capı́tulo aplican simplificaciones basadas en el desconocimiento y la imposibilidad de modelar algunos de los múltiples parámetros que en ellas aparecen. Incluso considerando el gran esfuerzo desarrollado en la obtención de modelos precisos de las fuerzas que actúan sobre el satélite siempre tendremos un grado de incertidumbre derivado del mal conocimiento de los parámetros y su variación. Para tener en cuenta el efecto de todas estas fuerzas mal modeladas, o incluso no modeladas, se ha introducido el concepto de fuerza o perturbación empı́rica. Estas aceleraciones tienen una expresión muy simple, basada en unos parámetros sin significado fı́sico, que pueden ser obtenidos por métodos de determinación de órbitas una vez que el satélite está en el espacio. Obviamente estas técnicas no sirven para un conocimiento previo de la órbita, sino para un conocimiento de alta precisión de la misma a posteriori. Pueden modelarse dos tipos de fuerzas empı́ricas: fuerzas tangentes a la órbita y fuerzas con una frecuencia de una revolución (one-cycle-orbital revolution 1CPR). Las aceleración de las fuerzas empı́ricas en la dirección tangente se expresa en la forma P T AN = Ct t, (15.15) donde Ct es el parámetro tangencial empı́rico y t es la dirección del vector velocidad. La aceleración producida por las fuerzas 1CPR suelen expresarse de la siguiente manera P 1CP R = C cos ✓ + S sen ✓, (15.16) donde ✓ es el argumento de latitud, C = Cu u+Cv v+Cn n y S = Su u+Sv v+Sn n, siendo Cu , Cv , Cn , Su , Sv , Sn los parámetros empı́ricos de la perturbación y u, v, n los vectores del sistema orbital donde se ha formulado la expresión de P 1CP R . Tanto esta fuerza P 1CP R como P T AN deben expresarse finalmente en el sistema orbital. Parte IV Navegación espacial 249 Capı́tulo 16 Navegación espacial 16.1 Introducción El afán viajero del ser humano, junto con su necesidad de supervivencia y su espı́ritu explorador y aventurero impulsaron, en la antigüedad, su expansión por toda la Tierra, viajando, tanto por tierra como por mar, pese a los peligros que este tipo de viajes comportaban. A pesar de que su sueño se extendı́a fuera de la Tierra, no fue hasta el comienzo del siglo XX cuando el hombre consigue por primera vez alejarse de la superficie, en primer lugar a sus proximidades con la aviación y posteriormente, a partir del año 1957, hacia el espacio, iniciando una actividad que solo tiene medio siglo pero que ya ha cambiado el modo de vivir del hombre. Aunque el concepto del cohete, dispositivo propulsado a reacción por la expulsión de los gases generados por una combustión, es conocido desde la invención de la pólvora por los chinos, no es hasta los trabajos de tres pioneros: el ruso Konstantin Tsiolkovski(1857-1935), el norteamericano Robert H. Goddard (1882-1945) y el alemán Hermann Oberth(1894-1989), cuando se ponen las bases de la tecnologı́a moderna de cohetes que permitió poco después el desarrollo de la industria espacial. Estos cientı́ficos proponen y desarrollan el uso de combustible lı́quido en lugar de sólido, los estabilizadores de los cohetes por medio de giróscopos, etc. El primer precedente moderno de los actuales cohetes, que son la base para el envı́o de naves al espacio, son los misiles V2 desarrollados por Alemania durante la segunda guerra mundial bajo la dirección de Wernher von Braun. Tras la derrota de ésta sus cientı́ficos son repartidos entre Estados Unidos y la Unión Soviética. Ambos estados inician, en paralelo, una desaforada carrera espacial establecida 252 Navegación espacial como un campo de batalla más de la guerra frı́a. En este primer periodo Estados Unidos no logra un proyecto común por discrepancias entre los distintos ejércitos y por ello la URSS, con un equipo dirigido por Sergei Korolev, consigue tomar ventaja enviando al espacio el Sputnik I el dı́a 4 de octubre de 1957. El Sputnik I, de 83 kg de peso, fue situado en una órbita de 250 km de altitud, donde permaneció hasta su incineración, en su reentrada en la atmósfera, el 3 de enero de 1958. Casi a continuación la URSS lanza un segundo satélite, el Sputnik II, que transportaba en su interior al primer ser vivo que viajó al espacio: la perrita Laika, que falleció unos 10 dı́as después de entrar en órbita. Estos dos éxitos consecutivos de la industria espacial soviética forzaron a los norteamericanos a dos lanzamientos casi seguidos: el Vanguard-1, lanzado por la armada el 5 de diciembre de 1957 y que fracasó y el Explorer I, lanzado con éxito por el ejército el 31 de diciembre de 1957. Sin embargo, la consecuencia más importante para Norteamérica, derivada de sus primeros fracasos, fue la creación de una agencia espacial para coordinar todos los esfuerzos en esta carrera, ası́, el 1 de octubre de 1958 comienza a operar la NASA con cuatro laboratorios y unos 8000 empleados. Planteada la carrera espacial como consecución de hitos y no con una estrategia cientı́fica, es la URSS la que sigue, durante mucho tiempo, llevando la iniciativa: obtiene las primeras imágenes de la cara oculta de la Luna el 4 de octubre de 1959; es la primera que pone un ser humano, Yury Gagarin, en órbita el 12 de abril de 1961; etc. Todo esto lleva a la administración Kennedy, a plantear, en un famoso discurso pronunciado el 25 de mayo de 1961, la consecución de un ambicioso proyecto que tenı́a como objetivo que el hombre pisara la Luna antes de una década. Como todos sabemos este proyecto concluyó con uno de los mayores logros del ser humano en toda su historia: el dı́a 20 de julio de 1969 el astronauta Neil Armstrong consiguió uno de los más esperados sueños de todo ser humano: pisar la Luna. Una vez conseguidos todos los hitos posibles y demostrada la posibilidad de que el hombre llegue al espacio, la carrera espacial entra en una fase más cientı́fica y las misiones se plantean con criterios más racionales, aunque durante la guerra frı́a algunos de los resultados cientı́ficos y tecnológicos derivados de la carrera espacial, como por ejemplo los modelos precisos de potencial terrestre, son declarados información clasificada. El final de la guerra frı́a pone en peligro la industria espacial soviética, que en ese momento tiene como misión estrella la estación espacial Mir, haciendo incluso peligrar la vida de alguno de sus astronautas. Afortunadamente esto da pie a un inicio de colaboración entre agencias, incluida la Agencia Europea del Espacio (ESA), creada en el año 1975, que aunque dista todavı́a mucho de ser óptimo, ha dado lugar a uno de los proyectos de cooperación internacionales más ambiciosos y útiles, la Estación Espacial Internacional (ISS). Este medio siglo de navegación espacial ha venido caracterizado por dos grandes retos, que a veces se confunden, pero que corresponden a dos aspectos muy distintos de la navegación espacial: Satélites artificiales terrestres 253 Los satélites artificiales, que son objetos en órbita alrededor de la Tierra que ayudan al hombre en su desarrollo tecnológico y cientı́fico. La navegación interplanetaria, que partir de naves que se alejan de la Tierra permite explorar el sistema solar y que algún dı́a pueden llevar al hombre a otros planetas. 16.2 Satélites artificiales terrestres Los satélites artificiales terrestres son objetos construidos por el hombre y situados en el espacio, en órbita alrededor de la Tierra, a una altitud, sobre la superficie terrestre, que siempre es menor de unos 40000 km. Podemos establecer varias clasificaciones de los satélites artificiales atendiendo a diversos aspectos. Nos fijaremos aquı́ únicamente en tres aspectos: masa del satélite, tipo de la misión y órbita del satélite. Revisaremos en este apartado las dos primeras clasificaciones dejando la última para el siguiente capı́tulo, después de haber analizado con más detalle las órbitas de los satélites. En esta caracterización se hará mención de algunos conceptos que se irán profundizando a lo largo de ésta última parte del libro. La clasificación del satélite en cuanto a su masa no es una clasificación fundamental, pero en este momento de desarrollo de la tecnologı́a se hace cada vez más importante porque incide en el coste del lanzamiento y en la capacidad técnica o cientı́fica de la misión a realizar. En la clasificación más moderna podemos considerar como pequeño un satélite por debajo de 500 kg. Entre éstos podemos hablar de: minisatélites, entre 100 y 500 kg, microsatélites, entre 10 y 100 kg, nanosatélites, entre 1 y 10 kg, y finalmente los picosatélites con un peso menor o alrededor de 1 kg. Por encima de los pequeños satélites nos podemos encontrar satélites de tamaño medio, entre 500 y 1000 kg y los grandes satélites con más de 1000 kg. Aunque al comienzo de la era espacial los satélites eran pequeños por las necesidades y condicionamientos del lanzamiento, poco a poco fueron aumentando en tamaño y masa. El gran handicap de la industria espacial es el enorme coste de las naves capaces de poner en órbita un satélite artificial. Únicamente las grandes agencias espaciales, soportadas por grandes presupuestos, son capaces de construir dichas naves, por lo que inicialmente fueron las únicas en participar en la carrera espacial. La posibilidad de alquilar dichas naves ha abierto la tecnologı́a espacial a otras entidades como gobiernos, empresas privadas, universidades, que son capaces de construir un satélite y alquilar la nave que realiza el lanzamiento de dicho satélite. El coste de dicho lanzamiento y el de la construcción del satélite artificial se reducen en función del tamaño y masa del mismo, lo que ha propiciado un aumento del número de misiones de satélites de pequeña masa. 254 Navegación espacial En el otro extremo nos encontramos los grandes satélites artificiales, entre los que podemos destacar, en primer lugar, la estación espacial internacional, ISS, de 450 toneladas de peso, 1200 m3 de espacio útil y unas dimensiones de 108 ⇥ 80 m. y por otro lado algún satélite de observación astronómica, como el Hubble, que pesa 11 toneladas y tiene forma de tubo de telescopio de 13 metros de largo con unos paneles solares a los lados. Para comprender el enorme y rápido desarrollo de la industria espacial es mejor observar la clasificación de los satélites artificiales en función del tipo de misión que realizan. Esto nos hará comprender la utilidad real de los satélites artificiales. Aparte del uso militar de los satélites artificiales, del que no hablaremos en este libro, podemos dividir el tipo de misiones espaciales en cinco grupos: Satélites de comunicaciones. Satélites de navegación. Satélites de observación terrestre. Satélites cientı́ficos. Estaciones espaciales. 16.2.1 Satélites de comunicaciones El problema de las comunicaciones fue visto desde el principio como uno de los campos donde la tecnologı́a de los satélites podı́a ser de utilidad. Un primer intento de comunicar dos estaciones desde un satélite fue realizado a través del satélite Score, lanzado en 1958, y que portaba una grabadora que grababa mensajes al pasar por una estación y los reproducı́a al pasar por otra. El primer satélite de comunicaciones fue el Echo, lanzado por los Estados Unidos el 12 de agosto de 1960. Este satélite no es realmente un satélite de comunicaciones como los que actualmente se lanzan, sino que se trataba de un satélite pasivo, de órbita baja, que se limitaba a reenviar a una estación la señal recibida desde otra durante el paso del satélite por encima de la estación. Telstar fue el primer satélite activo1 de comunicaciones. El primer Telstar fue construido por la empresa AT&T y lanzado por la NASA en 1963, tenı́a una órbita muy excéntrica e inclinada. Éste fue el primero de una larga serie de satélites lanzados por dicha empresa de comunicaciones y que todavı́a siguen lanzándose. En la actualidad se encuentran operacionales los satélites Telstar 11N, Telstar 12 y Telstar 18, y el último Telstar 14R, lanzado en mayo de 2011. Obviamente la tecnologı́a y el tipo de órbita han cambiado mucho durante este periodo. Los actuales satélites de comunicaciones utilizan preferentemente órbitas geosı́ncronas o geoestacionarias, que permiten el mantenimiento de una antena permanentemente dirigida al satélite, sin necesidad de efectuar un seguimiento del 1 Con receptor y emisor de señales. Satélites artificiales terrestres 255 mismo para emitir o recibir la señal. El primer satélite geosı́ncrono fue el Syncom 2 lanzado el año 1963 y que permitió realizar una conexión telefónica intercontinental, mientras que Syncom 3, lanzado al año siguiente en una órbita geoestacionaria, permitió la transmisión de las imágenes de los juegos olı́mpicos de Japón del año 1964. Como ejemplo de satélite geoestacionario de comunicaciones podemos mencionar el español Hispasat, que en realidad no está formado por uno, sino tres Hispasat (1C, 1D y 1D) situados en una longitud de 30 W. Al mismo sistema de comunicaciones Hispasat pertenecen también los dos satélites Amazonas (I y II) situados en una longitud de 61 W. El problema de las comunicaciones por satélite se complica en lugares como Rusia donde las elevadas latitudes no permiten la recepción de buenas señales con satélites geoestacionarios. Para resolver este problema se pusieron en órbita los satélites Molniya que dieron nombre a un tipo de órbita que se estudiará posteriormente. Estos satélites también han jugado un importante papel en el desarrollo de la industria espacial. El siguiente paso en el desarrollo de la tecnologı́a por satélite lo dieron las llamadas constelaciones de satélites, que consisten en una misión formada, no por uno, sino por muchos satélites puestos en varias órbitas distintas, situando además varios satélites espaciados en cada una de dichas órbitas. El sistema Iridium, para usos de telefonı́a, está formado por 66 satélites, en 11 órbitas polares bajas, a unos 785 km de altitud, con lo que se consigue una excelente cobertura desde cualquier lugar y en cualquier instante. El primer satélite de la constelación Iridium fue lanzado el 1 de noviembre de 1998 y aunque la empresa que lo comercializaba entró en bancarrota al año siguiente, el servicio fue reestablecido el año 2001 y sigue activo en este momento. 16.2.2 Satélites de navegación Otro importante problema resuelto por los satélites es el de la navegación. Desde siempre el problema de la determinación de la posición de un viajero ha movido a desarrollar sofisticados métodos de Astronomı́a de posición. Actualmente, el uso de los satélites artificiales ha elevado la precisión del cálculo de la posición a lı́mites insospechados. El primer satélite de navegación fue el Transit, lanzado en el año 1960. El satélite emitı́a en una frecuencia determinada desde una posición conocida de su órbita, la frecuencia recibida por el receptor varia ligeramente por el efecto Doppler, lo que permite obtener la posición del receptor. La aproximación lograda mediante el uso de los sucesivos satélites Transit permitı́a a los barcos obtener, en intervalos de entre 35 y 100 minutos, una posición con un error del orden de los 100 metros. 256 Navegación espacial Los satélites Transit siguen actualmente en funcionamiento, aunque desde el año 1996 han sido totalmente sustituidos por el sistema de navegación GPS (Global Positioning System). Este sistema está basado en una constelación de 24 satélites en 6 planos orbitales diferentes, con unas órbitas relativas que aseguran que sobre cada punto de la Tierra existen, en cada instante, varios de estos satélites de los que se puede recibir una señal. Cada satélite dispone además de dos relojes atómicos que le marcan su hora con una considerable precisión. Un receptor en Tierra, recibiendo la señal de varios de estos satélites, puede calcular, por triangulación espacial, su posición y velocidad en tiempo real, con una precisión de unos pocos metros en la posición y 0.1 m/s en la velocidad. Asimismo, se recibe la hora del sistema también llamada tiempo GPS. La precisión del sistema GPS puede ser mejorada notablemente, hasta centı́metros en algunos casos, por técnicas de corrección diferencial en el cálculo de la posición, combinadas con el apoyo de otros medios entre los que se encuentra, por ejemplo, el sistema EGNOS, que es la primera aportación importante europea a los sistemas de navegación. La disponibilidad, cada vez mayor, de los receptores de GPS, ası́ como su tamaño y precio, cada vez menor, ha popularizado enormemente su uso en los últimos años. Un sistema similar, con 24 satélites en tres órbitas, llamado GLONASS, ha sido desarrollado por Rusia y está operativo desde octubre de 2011. Desde entonces, muchos de sistemas de navegación, incluidos los incorporados a algunos smartphones, integran los servicios de GLONASS junto con los de GPS. Ante la importancia creciente de dichos sistemas, la Unión Europea está desarrollando un sistema de navegación propio, el sistema Galileo. Este sistema, aparte de evitar la dependencia tecnológica de Europa en un campo tan importante como es las aplicaciones de la navegación, pretende también mejorar la precisión y las prestaciones de los anteriores sistemas. El sistema Galileo, que deberı́a haber estado funcionando en 2010, ha sufrido numerosos retrasos que han llevado a que los cuatro primeros satélites, para la fase de validación en órbita, terminen de lanzarse en octubre de 2012. Está previsto que los 30 satélites de la constelación, situados en tres planos distintos, estén lanzados y el sistema esté completamente operativo en el año 2019. Galileo es un sistema civil, lo que asegura para la industria una continuidad de uso, no expuesta a criterios militares y polı́ticos que pueden llevar, en determinadas circunstancias, a una degradación e incluso paralización de la información emitida por el satélite. Por otro lado, Galileo no pretende competir, sino colaborar con los sistemas GPS y GLONASS; se prevé que los receptores Galileo sean compatibles con la señal de los anteriores. Además Galileo garantizará la fiabilidad de sus sistemas informando al usuario de cualquier posible fallo con un segundo de tiempo como máximo. Esta caracterı́stica es crucial para su uso en aviación, pues ası́ se podrá realizar de forma automática el aterrizaje de aviones. Otra caracterı́stica importante de Galileo es la función SAR (global Search and Rescue), que mediante un transpondedor situado en el satélite podrá transferir avisos de Satélites artificiales terrestres 257 emergencia para operaciones de rescate. En los últimos años se ha hecho notar la entrada de China en el desarrollo de la industria del espacio. Aunque en un principio realizó una inversión en el programa europeo Galileo, posteriormente decidió la construcción de su propio sistema de navegación, BeiDou Navigation System. Este sistema, cuyos primeros satélites fueron lanzados en el año 2000, tiene un diseño completamente diferente a las tres constelaciones GPS, GLONASS y Galileo, pues está basado en satélites geoestacionarios que no dan una cobertura global sino que ésta está limitada a la región asiática. 16.2.3 Satélites de observación terrestre El espacio es el mejor lugar para observar la superficie de la Tierra, por lo que los satélites se han constituido en el mejor instrumento para esta observación. Atendiendo a su aplicación, podemos distinguir cuatro tipos diferentes de satélites de observación terrestre: satélites geodésicos, satélites cartográficos, satélites meteorológicos, satélites medioambientales. Una de las primeras necesidades de la industria aeroespacial fue la determinación precisa del geoide (forma de la Tierra) que nos diera un modelo preciso de potencial terrestre para poder calcular las órbitas con suficiente precisión. Aunque el estudio de la órbita de cualquier satélite artificial permite mejorar los elementos del potencial terrestre, ha habido una serie de misiones diseñadas especı́ficamente para este fin. Una de las primeras y más importantes ha sido el programa Lageos, Laser Geodynamics Satellites, que ha puesto en órbita dos naves: Lageos-1, lanzado en 1976 y Lageos-2, lanzado en 1992, con el objetivo de una determinación de precisión del geoide y de los movimientos de las placas tectónicas asociados a la deriva continental. Otro uso de los satélites de observación terrestre es el de la cartografı́a de precisión de la Tierra y la toma de imágenes de alta resolución de la misma. Un ejemplo de ello es la aparición de la aplicación Google Maps, y otras que le van a seguir, que permiten una visión, en el futuro tridimensional, de gran precisión, de cualquier lugar de la Tierra, con una simple conexión a internet. Los satélites meteorológicos se dedican exclusivamente a la observación de la atmósfera en su conjunto. La comprensión de la dinámica atmosférica, el comportamiento de las masas nubosas o el movimiento del aire frı́o o caliente resultan indispensables para realizar predicciones del clima, pues sus efectos impactan de manera irremediable en las actividades de los seres humanos aquı́ en la Tierra. 258 Navegación espacial El primer satélite meteorológico fue el Tiros-1, lanzado en abril de 1960 después del fracaso del Vanguard 2. Después de éste ha habido muchos otros satélites meteorológicos situados en dos tipos de órbitas: polares o geoestacionarias. Los geoestacionarios, situados en un punto del ecuador, permiten obtener imágenes continuadas de todo un hemisferio que pueden presentarse como fijas o, si se unen varias, como una pelı́cula de la evolución de la atmósfera. En Europa disponemos de varios Meteosat situados sobre el océano Atlántico. Los satélites meteorológicos en órbita polar, como los de la serie NOAA mantienen una órbita que pasa varias veces al dı́a por un lugar concreto de la Tierra a la misma hora local2 lo que les da las mismas condiciones de iluminación. Finalmente, el cada vez mayor interés que el ser humano muestra por la ecologı́a está llevando a desarrollar una serie de misiones espaciales de estudio del medio ambiente. Como ejemplo mencionaremos únicamente el satélite europeo Envisat, Environmental Satellite, uno de los mayores satélites de observación terrestre jamás construido. Fue lanzado en marzo de 2002 y estuvo operativo hasta abril de 2012. Mediante sofisticados instrumentos ópticos y de radar ha realizado una continua observación de la atmósfera, los océanos, las zonas terrestres y las regiones polares de la Tierra. Su misión ha sido la de controlar el calentamiento global, el grado de la contaminación atmosférica y controlar los riesgos de desastres naturales para poder mitigar sus efectos. 16.2.4 Satélites cientı́ficos La ausencia de gravedad y de atmósfera hacen del espacio exterior un lugar privilegiado para realizar determinados experimentos cientı́ficos que en la superficie terrestre podrı́an quedar “contaminados”. La posibilidad de enviar al espacio satélites muy pequeños, de bajo coste en su construcción y en su lanzamiento, ha multiplicado la realización, desde satélites artificiales expresamente diseñados para ello, de muchos experimentos cientı́ficos individuales, tanto de empresas como de organismos de investigación y universidades. Sin embargo, la mejor posibilidad para la ciencia la proporciona la existencia de laboratorios estables en órbita, donde poder realizar una mayor variedad de experimentos. Éste es uno de los principales usos de las estaciones espaciales, que serán discutidas en el siguiente apartado. Afortunadamente para el ser humano la atmósfera terrestre nos proporciona un elemento fundamental, el oxı́geno, y nos protege de las peligrosas radiaciones procedentes del espacio. Sin embargo, la atmósfera es un elemento muy perjudicial para la Astronomı́a pues distorsiona las imágenes recibidas y no permite la observación de determinadas longitudes de onda. Los satélites nos proporcionan la oportunidad de superar la atmósfera terrestre y realizar observaciones mucho más precisas y por ello la Astronomı́a ha sido una de las ciencias más beneficiadas por el desarrollo de la industria espacial. 2 Satélites heliosı́ncronos (estudiados en el siguiente capı́tulo). Satélites artificiales terrestres 259 Aunque ha habido muchas misiones cientı́ficas para la observación del espacio destacaré únicamente dos: El satélite europeo Hipparcos y el telescopio espacial Hubble, HST. El satélite astrométrico Hipparcos, lanzado en agosto de 1989 y activo hasta 1993 ha permitido, entre otras muchas cosas, la medición precisa de posiciones y movimientos propios de cientos de miles de estrellas, dando lugar a dos catálogos: Hipparcos y Ticho que constituyen, por su precisión, el sistema de referencia estelar básico para los próximos años y ha llevado a modificar la escala cósmica de distancias o la edad del Universo. El telescopio Hubble, de 2.5 metros de diámetro, fue lanzado en 1990, aunque un error en su diseño impidió, durante unos años, obtener la gran nitidez de imágenes que de él se esperaba. La reparación de su miopı́a fue efectuada en órbita por el transbordador espacial en el año 1997. Este telescopio ha permitido realizar grandes descubrimientos astronómicos, tanto antes como después de la reparación. Se estima que cientı́ficos de más de 45 paı́ses han realizados unas 5000 publicaciones en revistas especializadas de resultados obtenidos por las observaciones del Hubble. Su sustitución está prevista por el James Webb Space telescope, un telescopio con un espejo de 6.5 m de diámetro cuyo lanzamiento está previsto para el año 2018. 16.2.5 Estaciones espaciales Al contrario que los satélites artificiales estándar, que son naves más o menos pequeñas pero diseñadas únicamente para llevar instrumentos con los que realizar la misión para la que están diseñados, las estaciones espaciales son grandes estructuras en órbita donde el hombre puede vivir durante periodos de tiempo más o menos largos. Las estaciones espaciales constituyen un laboratorio donde estudiar la interacción del hombre y el espacio con vistas a una futura exploración del mismo. Asimismo permite estudiar la acción de la falta de gravedad sobre cualquier fenómeno cientı́fico por lo que constituye un inmejorable escenario para el desarrollo de la ciencia. Hasta el momento ha habido cuatro estaciones espaciales: dos rusas Salyut y Mir, otra norteamericana Skylab y una internacional, la única actualmente en órbita, la Estación Espacial Internacional, ISS. La misión Salyut constituye el primer esfuerzo serio del ser humano en poner una estación en órbita. En realidad no fue una sino siete naves distintas. Las cinco primeras, al igual que la norteamericana Skylab, fueron lanzadas en una sola pieza incluyendo en ellas toda la instrumentación y medios necesarios para su vida útil, lo que redujo ésta considerablemente. La Salyut 1 fue lanzada el 19 de abril de 1971 y se desintegró en la atmósfera el 11 de octubre del mismo año. La Salyut 5 estuvo en órbita desde el 22 de junio de 1976 hasta el 8 de agosto de 1977. Todas 260 Navegación espacial ellas tuvieron un máximo de dos o tres visitas de varios astronautas. La nave Skylab fue puesta en órbita el 14 de mayo de 1973, recibiendo tres visitas, cada una con tres astronautas, la última de una duración de 84 dı́as y que terminó el 8 de febrero de 1974. A partir de ese dı́a no fue más usada hasta que se estrelló en la atmósfera el 11 de julio de 1979. Con las Salyut 6 y 7 se ensaya un nuevo concepto de estación espacial, pues se prueba su forma modular y un esquema de funcionamiento que permite reponer su soporte vital para alargar el tiempo de vida de la misión. De esta forma, la Salyut 7 estuvo en órbita 3216 dı́as entre 1982 y 1991 recibiendo 26 visitas, 12 tripuladas y 15 no tripuladas y estando ocupada durante 816 dı́as. El primer módulo de la estación espacial Mir fue lanzado el 19 de febrero de 1986, mientras que el resto de módulos, hasta seis, fueron lanzados entre 1988 y 1996. El 23 de marzo de 2001 terminó la misión Mir con su reentrada controlada en la atmósfera y posterior destrucción, siendo, junto con el proyecto Apolo, una de las misiones concluidas más importante de la carrera espacial. La estación Mir fue habitada continuamente hasta 1999, en un principio por cosmonautas rusos, aunque posteriormente con la caı́da de la Unión Soviética y la pérdida de presupuestos de la Agencia Espacial Rusa se llegó a un punto de colaboración con la NASA que permitió, por un lado, la llegada de astronautas norteamericanos a la Mir y por otro un comienzo de colaboración que dio lugar al proyecto de la Estación Espacial Internacional ISS, al que se adhirieron posteriormente Europa, Japón y Canadá. La ISS, cuya construcción comenzó el 20 de noviembre de 1998, es un proyecto muy importante por su carácter de colaboración entre agencias espaciales, contrario al espı́ritu de lucha entre éstas heredado de los comienzos de la carrera espacial coincidentes en el tiempo con la guerra frı́a. 16.2.6 Vehı́culos de transporte de carga Para el buen funcionamiento de un estación espacial es necesario disponer de vehı́culos de carga que puedan llevar y traer de la estación instrumentos y personas. Esto exige que dichos vehı́culos no queden en órbita o se destruyan en la reentrada sino que deben poder ser recuperados con su carga intacta. La ida y vuelta a la estación Mir era realizada por dos tipos de naves: Soyuz y Progress. La nave Soyuz está formada por varias partes: el módulo de servicio, el módulo orbital y la cápsula de la tripulación. El módulo de servicio es el cohete o vehı́culo de lanzamiento, propiamente dicho, que impulsa la nave a la órbita adecuada. El módulo orbital contiene el equipo necesario para la supervivencia de la tripulación, tiene forma esférica y está situado en la parte delantera del vehı́culo. Finalmente, la cápsula de la tripulación es la única parte del vehı́culo que llega a la Tierra, por lo que va equipada de un escudo térmico y dos paracaı́das. Tiene forma de campana y en su interior pueden ir hasta tres tripulantes. Durante el aterrizaje se abre el paracaı́das y el escudo térmico se desprende para poder Satélites artificiales terrestres 261 utilizar una serie de retrocohetes de combustible sólido, situados en la base de la cápsula, que frenan el impacto con el suelo. La primera nave Soyuz fue enviada al espacio en 1967 y aunque ha tenido una enorme evolución se sigue usando en la actualidad con el mismo diseño básico. El modelo usado para los viajes a la Mir fue la Soyuz-TM, y desde 2002 se usa la Soyuz-TMA para viajes a la ISS. Una versión más simplificada de la nave Soyuz, que no puede volver a la Tierra, es la nave Progress, con su versión actual la Progress-M. Esta nave puede cargar instrumentos y material hacia la estación espacial y es cargada de desechos de la estación para su destrucción en la reentrada en la atmósfera. El uso de vehı́culos recuperables pero no reutilizables parecı́a demasiado costoso, sobre todo para misiones con grandes necesidades de uso de dichos vehı́culos como una estación espacial. Por ello, la NASA decidió comenzar el programa del Space Shuttle o transbordador espacial. Tras el lanzamiento del Columbia el 12 de abril del 1981 se dispuso de las únicas naves reutilizables3 capaces de transportar material y tripulación y que pueden poner satélites en órbitas bajas, ası́ como repararlos y traerlos de vuelta a la Tierra. Un transbordador espacial está formada por el cohete lanzador, no reutilizable, formado por un gran tanque de combustible central y dos cohetes laterales. Esta parte se desprende unos 8.5 minutos después del lanzamiento, destruyéndose antes de llegar a la Tierra. La parte reutilizable tiene forma de un pesado avión, de unos 37 metros de longitud y 24 de envergadura, que toma Tierra en una gran pista de aterrizaje. Un transbordador puede llevar una carga de unas 28 toneladas y devolver a la Tierra unas 14. Puede llegar a una altitud de 1000 km, aunque nunca lo ha hecho más allá de 600 km, altitud conseguida en su misión para reparar el telescopio Hubble. El 8 de julio de 2011 se lanzó al espacio el Atlantis, siendo ésta la última misión de un transbordador espacial. Hasta entonces ha habido una flota de 5 transbordadores que han realizado un total de 135 misiones que han dado unas 21158 vueltas a la Tierra en más 1330 dı́as de vuelo. Se han realizado con ellos 9 misiones a la estación Mir y 37 a la ISS. Las tragedias del Challeger, que se destruyó, en 1986, 73 segundos después de su lanzamiento, y del Columbia, perdido el 1 de febrero de 2003 en su reentrada a la atmósfera, han paralizado en parte la construcción de la ISS y han llevado a la NASA a replantear sus prioridades. Estas tragedias nos recuerdan que la conquista espacial tiene poco más de medio siglo y, aunque la tecnologı́a ha mejorado mucho en los últimos años, los vuelos espaciales todavı́a tienen una importante componente de riesgo como en su dı́a lo tuvieron la navegación marı́tima y la aérea. Afortunadamente, la gran seguridad y fiabilidad de las naves Soyuz han permitido que el proyecto de la ISS no se paralizara completamente aunque si se ha ralentizado notablemente. 3 Los proyectos Hermes (ESA) y Burán (Rusia), similares al transbordador espacial, fueron cancelados. 262 Navegación espacial Actualmente la NASA no contempla una revisión del transbordador espacial, sino la construcción de una nueva generación de vehı́culos, llamados Orion(MPCV) (Multi-Purpose Crew Vehicle), junto con una nueva gama de cohetes lanzadores. Con el nuevo proyecto, la NASA apuesta por naves tripuladas no reutilizables que sirvan, tanto para lanzamientos a la ISS, como hacia la Luna y Marte. En 2006 la Agencia Espacial Rusa, junto con la ESA y posteriormente la Agencia Japonesa (JAXA) deciden construir el sistema ACTS (Advanced Crew Tansportation System), aunque posteriormente dicha colaboración quedó suspendida. 16.2.7 Basura espacial Desde 1957 se han lanzado al espacio miles de objetos. Todos ellos han sido lanzados desde un cohete con una serie de etapas que se iban separando y dejando caer a la Tierra, sin embargo, la altitud a la que se separan las distintas etapas y las explosiones ocurridas en las últimas fases han provocado que múltiples fragmentos de distintos tamaños de estos cohetes hayan permanecido en órbitas bajas y no hayan caı́do directamente a la Tierra. Por otro lado, un satélite puesto en órbita tiene una vida limitada por la cantidad de combustible que carga para realizar las maniobras que lo mantienen en su órbita y por la operatividad de sus instrumentos. Cuando un satélite termina su vida útil puede, si posee el combustible necesario, ser impulsado a una órbita suficientemente baja para que la atmósfera terrestre lo destruya o puede ser dejado en órbita indefinidamente. Otros objetos han sido destruidos deliberadamente como el satélite meteorológico Chino FY-1C, de la serie Fengyun, que fue destruido en enero de 2007 para probar un misil Chino antisatélites. Esto creó más de 2300 fragmentos mayores que una pelota de golf y al menos 150000 fragmentos de basura espacial. Se estima que de los más de 9000 grandes objetos todavı́a en órbita, solamente el 7 % están activos, mientras que encontramos más del 22 % de naves obsoletas, el 17 % de restos de cohetes y el 13 % de objetos relacionados con las misiones. Todos los objetos que de una u otra forma han quedado en órbita y que no son satélites activos, junto con otros objetos más pequeños procedentes de restos de asteroides y cometas, forman una enorme capa alrededor de la Tierra llamada basura espacial. En estos momentos se estima que la basura espacial está formada por más de 20000 objetos mayores de 10 cm, unos 600000 de entre 1 y 10 cm y más de 300 millones de menos de 1 cm. Las probabilidades de colisión de uno de estos fragmentos con alguno de los satélites activos no es despreciable, por lo que la comunidad cientı́fica está realizando un gran esfuerzo en solucionar este problema que aumenta dı́a a dı́a con cada lanzamiento de naves al espacio. La mayor parte de la basura espacial se encuentra en órbitas bajas, entre 600 y 2000 km por encima de la superficie terrestre. La mayor concentración se da entre los 800 km y 1500 km de altitud. El rozamiento atmosférico, que es mayor Navegación interplanetaria 263 cuanto más próximos estemos a la Tierra, produce una disminución progresiva de la altitud de estos cuerpos que llegan a caer a la Tierra después de unos dı́as si su altitud es menor que 200 km, en unos pocos años para altitudes hasta 600 km, en décadas si están entre 600 y 800 km y en más de un siglo en altitudes mayores que los 1000 km. En estas altitudes la velocidad media de estos objetos es de unos 7 km/s, aunque el valor medio de la velocidad de un impacto es de unos 10 km/s. Con esta velocidad la energı́a de un objeto esférico de aluminio de 1 cm es comparable a la de un automóvil a 90 km/h. En la altitud de las órbitas geoestacionarias la densidad de la basura espacial es mucho menor, sin embargo, un objeto en esta órbita nunca volverá por si solo hacia la Tierra. Para evitar esto, normalmente al final de la vida útil de estos satélites se guarda un poco de combustible4 para situarlo en una órbita cementerio situada a unos 300 km más de altitud. Los objetos en órbita de más de 3 mm pueden ser detectados por medio de observaciones de radar y ópticas realizadas desde la Tierra, sin embargo, únicamente se puede realizar un seguimiento orbital de estos objetos cuando su tamaño es mayor de 10 cm. La ISS y otros grandes satélites, tienen prevista la realización de maniobras especiales para esquivar los objetos de más de 10 cm cuando la probabilidad de colisión es muy alta. La media de realizaciones de dichas maniobras es de una cada uno o dos años. Los objetos de menos de 1 cm no suelen provocar grandes daños pues estas naves llevan protección suficiente para impactos con dichos objetos. El mayor peligro son los objetos de entre 1 y 10 cm, que pueden producir daños considerables pero no se tiene un conocimiento preciso de su órbita. A pesar de todo, en medio siglo de navegación solo se ha producido un accidente grave, el 10 de febrero del 2009, cuando colisionaron, destruyéndose mutuamente, los satélites Iridium 33 y Cosmos 2251. Sin embargo, resulta imprescindible la toma en consideración de este problema y la colaboración para su solución. El Comité de coordinación entre-agencias para la basura espacial (IADC) ha elaborado una serie de propuestas que han servido como base a la normativa adoptada por el comité de las Naciones Unidas para usos pacı́ficos del espacio exterior. 16.3 Navegación interplanetaria El segundo gran reto planteado por la navegación espacial es el viaje por el sistema solar alejándonos del entorno de la Tierra. Prescindiremos, por ahora, de las diferencias en la dinámica del problema y nos centraremos en las diferencias derivadas de la utilidad o rentabilidad de dicho viaje. Ası́ como de la industria de los satélites artificiales podemos sacar consecuencias tecnológicas directas, relacionadas con las comunicaciones, la navegación, el 4 Es suficiente con el combustible necesario para mantener el satélite en su órbita geoestacionaria durante tres meses. 264 Navegación espacial conocimiento del clima, etc; la exploración del espacio exterior no nos proporciona, por el momento, consecuencias tan directas, sino únicamente las indirectas, obtenidas como consecuencia de descubrimientos realizados en el curso del desarrollo de una misión. Ası́ distinguiremos dos tipos de misiones: Las encaminadas a la llegada del hombre a la Luna o Marte y su posterior colonización. Las puramente cientı́ficas encaminadas a un mayor conocimiento del sistema solar. Incluimos en las primeras sólo la Luna o Marte porque el viaje a otros cuerpos del sistema solar queda todavı́a demasiado alejado en el futuro. Las misiones no tripuladas a la Luna o Marte pueden encuadrarse en ambos tipos, pues un mayor conocimiento de estos cuerpos contribuirá a una más segura colonización de los mismos. Con la llegada del hombre a la Luna, en 1969, se constató una realidad: el hombre es capaz de conquistar el espacio pero la tecnologı́a de aquel momento no permitı́a hacerlo con seguridad. Probablemente la tecnologı́a actual no sea todavı́a capaz de este reto, pero el potencial humano, cientı́fico y tecnológico, es tal que le pueden permitir abordarlo si no está sujeto por condicionamientos polı́ticos o militares. Obviamente, las condiciones deberı́an ser las de una profunda colaboración entre todas las agencias del espacio soportadas, tanto por los gobiernos como por la industria. En estas condiciones, aunque el costo de dicha misión serı́a muy elevado, la cantidad de resultados cientı́ficos que pueden revertir en la sociedad es muy grande, como ya lo demostró el proyecto Apolo. Piénsese que el reto de llevar el hombre a Marte no puede considerarse únicamente como un largo viaje, y pensar únicamente en los problemas dinámicos y tecnológicos de la nave, sino que debe abordarse el principal problema que debe ser resuelto antes del inicio del viaje: ¿Cómo llevar a varios seres humanos en un viaje tal, que entre la ida, la vuelta y la estancia debe durar más de dos años, alimentarlos, darles de beber, protegerlos de un medio hostil, mantenerlos en buen estado de salud y devolverlos a la Tierra sanos y salvos? Si este problema se resuelve implicarı́a un avance sin precedentes en la medicina, en el problema de la escasez de agua dulce, en el desarrollo de fuentes de alimentación, lo que puede, si no resolver, si paliar algunos de los problemas de la humanidad. 16.3.1 Viajes a la Luna Los viajes del hombre a la Luna han tenido dos partes separadas por el final de la misión Apolo. Una primera, inmersa en el comienzo de la carrera espacial, en la que han participado únicamente USA y la URSS y cuyo objetivo principal fue que el hombre pisara la Luna. La segunda, más abierta a otros paı́ses, ha sido realizada con naves no tripuladas. Navegación interplanetaria 265 En la caso de la Unión Soviética se han enviado misiones a la Luna, entre 1959 y 1976, con dos tipos de naves diferentes, las Luna y las Zond, veinticuatro de las primeras y cinco de las segundas. De ellas veinte misiones han terminado con éxito y en la carrera por ser los primeros en lograr alguna meta han conseguido los siguientes hitos: la primera órbita de aproximación a la Luna, el primer alunizaje suave, la primera nave en impactar con la Luna, el primer orbitador lunar y la primera nave que después de alunizar regresó a la Tierra. Durante esta primera época Norteamérica ha realizado cuatro proyectos distintos pero todos de apoyo al objetivo final de poner un hombre en la Luna. El proyecto Ranger, entre 1961 y 1965, envió nueve naves para obtener imágenes de la Luna antes de impactar en ella. El proyecto Surveyor, entre 1966 y 1968, envió siete naves con las que los USA ensayaron un alunizaje suave. La misión Lunar Orbiter realizada entre 1966 y 1967 tenı́a por objeto orbitar la Luna para realizar una completa cartografı́a con objeto de elegir los lugares de alunizaje. Finalmente el proyecto Apolo, realizado entre 1963 y 1972 consiguió el objetivo final de pisar la Luna. El proyecto Apolo comenzó con la muerte en Tierra de los tripulantes del Apolo 1. A pesar del desastroso comienzo y de otro amago de catástrofe del Apolo 13, la misión acabó siendo un completo éxito y en seis ocasiones, con los Apolo 11, 12, 14, 15, 16 y 17, se pudo pisar la Luna y devolver a los astronautas a la Tierra con sus muestras de suelo lunar. A partir de ese momento concluyen las misiones a la Luna, hasta el instante en que la nave Galileo, en su viaje a Júpiter, realiza una aproximación a la Luna para aprovechar su impulso gravitacional. Después de esto es Japón en 1990, quien vuelve a enviar una nave a la Luna, la Hiten (Muses-A), que llega a realizar una aproximación, orbitar y finalmente impactar en la Luna. Estados Unidos vuelve a enviar dos misiones: la Clementine, en 1994 y Lunar Prospector en 1996. Ambas realizan misiones totalmente cientı́ficas, entre otras, el análisis de la existencia de hielo en los polos de la Luna. Mediante estas misiones se consigue un gran conocimiento, no solo de la cartografı́a de la Luna, sino también de su campo gravitacional, lo que será fundamental para el futuro mantenimiento de satélites artificiales lunares. Una de las últimas misiones importantes, por el momento, se trata de la europea SMART-1, que comenzó su viaje en septiembre de 2003, llegó a la Luna en noviembre de 2004 y concluyó su misión impactando en su superficie en septiembre 2006. La razón de una misión tan larga, y la importancia de esta misión, es el ensayo de los nuevos propulsores iónicos de la nave que la han impulsado en una lenta aproximación a la Luna, pero a un coste muy bajo. Naturalmente, este tipo de propulsores no es adecuado para un viaje tripulado a la Luna, pero abre nuevas perspectivas a la navegación por el sistema solar. En la actualidad existen muchas misiones no tripuladas planeadas y en diversos grados de desarrollo. Además de las misiones Norteamericanas, Rusas, Europeas 266 Navegación espacial y Japonesas, tanto China como la India se han añadido al grupo de paı́ses con alguna misión lunar activa. Hay que destacar también la aparición de propuestas que involucran a la industria privada, como por ejemplo el Google Lunar X Prize 5 que, organizado por el X Prize Foundation y patrocinado por Google, ofrece un premio de 30 millones de dólares al equipo que consiga enviar una nave a la Luna, poniendo en su superficie un robot que deberá moverse por ella al menos 500 metros y enviar a la Tierra imágenes y video de alta definición. En este momento hay veinticinco equipos de todo el mundo registrados oficialmente en la competición. Mucha gente se pregunta si el hombre volverá a ir a la Luna y cuándo será esto. Tras más de cincuenta años de experiencia en el espacio, la tecnologı́a espacial ha alcanzado unos niveles que hacen relativamente fácil, aunque muy costoso, el situar de nuevo un hombre en la Luna con cierta seguridad. Aunque hay varias misiones, de casi todas las agencias espaciales, que planean llevar tripulaciones humanas a la Luna entre el 2020 y el 2030, es muy difı́cil, con la situación económica actual, saber si alguna de ellas llegará a buen puerto. Lo más probable es que todas las misiones actuales se retrasen. Lo que parece claro es que el hombre volverá a la Luna, y cuando lo haga será para quedarse, situando bases estables en su superficie y usándola como trampolı́n para futuras misiones mucho más ambiciosas a Marte y al resto del sistema solar. 16.3.2 Viajes a Marte Las misiones Apolo han sido las únicas misiones tripuladas realizadas en el espacio exterior. El resto de misiones únicamente han tenido objetivos cientı́ficos conducentes a una profundización del conocimiento del sistema solar. Sin embargo, separamos del resto los viajes a Marte debido a que éstos son el laboratorio de aprendizaje para una futura colonización de este planeta. La primera era de la carrera espacial no paró en la Luna sino que se extendió a otros planetas como Marte. Tras una serie de intentos, comenzados por los soviéticos en 1960, la primera nave que sobrevoló el planeta Marte fue la estadounidense Mariner 4, en julio de 1965. A ésta le siguieron las Mariner 6 y 7, en el año 69, y la Mariner 9, en el 71. Los soviéticos consiguieron orbitar por primera vez en torno a Marte en el año 1971 con la Mars 2 y un aterrizaje suave el 2 de diciembre de 1971 con la Mars 3, sin embargo, los instrumentos de esta última dejaron de funcionar 20 segundos después del aterrizaje. El mayor éxito de aquella fase lo obtuvieron las dos naves Viking, que alcanzaron Marte en 1976, posándose en la superficie y realizando un gran número de experimentos y descubrimientos cientı́ficos. Salvo los intentos de los soviéticos con las naves Phobos, en 1988, no fue hasta 1996, veinte años después de los Viking, cuando se vuelve al planeta Marte con 5 http://www.googlelunarxprize.org Navegación interplanetaria 267 dos importantes misiones: Mars Global Surveyor y Mars Pathfinder. La principal caracterı́stica de la primera fue su fase final de aproximación a Marte utilizando el rozamiento de la atmósfera marciana. La segunda consiguió posar en Marte un vehı́culo móvil, Rover, para una investigación más profunda del planeta. Además, con el desarrollo de la segunda misión se consiguió probar la posibilidad de realizar misiones muy complejas con una tecnologı́a mucho más barata que la utilizada hasta ese momento. La conquista de Marte ha estado también plagada de sonoros fracasos. El más conocido es el de las naves Mars Climate Orbiter y Mars Polar Lander. El error de la primera fue debido a no convertir unidades inglesas en unidades métricas a la hora de mandarles los comandos para su inserción en la órbita marciana. Ello provocó que la nave tuviese una altitud menor entre 80 y 90 km a la planeada, lo que causó que el esfuerzo y la fricción destruyera la nave. Ha habido otros fracasos como el de la nave japonesa Nozomi lanzada en julio de 1998. Europa también ha realizado su proyecto de viaje a Marte con la nave Mars Express lanzada el 2 de junio de 2003. Esta misión estaba formada por un orbitador, que debı́a realizar, entre otras cosas, una cartografı́a de precisión del planeta, aparte de otros estudios cientı́ficos como la búsqueda de agua, y un módulo de aterrizaje llamado Beagle. El Beagle se perdió al posarse en la superficie, sin embargo el orbitador continúa con éxito su misión. Casi simultáneamente a la Mars Express, aprovechando la oposición del planeta de dicho año fueron lanzadas también la Mars Reconnaissance Orbiter y las Mars Exploration Rover, con dos Rovers que se incorporaron al estudio de la superficie de Marte. La Mars Reconnaissance Orbiter se convirtió con la Mars Express, el Mars Odyssey, lanzado en 2001 y el Mars Global Surveyor en el cuarto satélite artificial de Marte. Recientemente, el 6 de agosto de 2012, se posó con éxito en la superficie un nuevo vehı́culo, el Curiosity. 16.3.3 Exploración del sistema solar En el medio siglo de tecnologı́a espacial, tanto el Sol, como todos los planetas y algún cometa y asteroide, han sido visitados por alguna nave de fabricación humana. El caso de Plutón es la única excepción hasta julio del 2015, cuando previsiblemente la nave New Horizons, lanzada en enero de 2006, lo sobrevolará, fotografiando tanto Plutón como su luna Caronte, para iniciar después un viaje hacia el cinturón de Kuiper, fuente de los cometas de corto periodo, donde se espera observar de cerca alguno de sus objetos. Antes de este intento de llegar y observar los confines del sistema solar se han lanzado al espacio profundo muchas sondas espaciales, para realizar muy variadas observaciones cientı́ficas que han cambiado profundamente nuestro conocimiento del entorno. Durante los años sesenta y principios de los setenta únicamente Venus, aparte de Marte, fue visitado por sondas espaciales. Los americanos usaron las Mariner 268 Navegación espacial y los soviéticos las Venera. Las Mariner 2 y 5 sobrevolaron Venus en 1962 y 1967 respectivamente, mientras que la Mariner 10, en 1974, sobrevoló Venus y después se acercó a Mercurio, llegando a 327 km de su superficie. Esta ha sido la única nave que se ha acercado a Mercurio hasta marzo de 2011 en que la nave Messenger, lanzada en agosto del 2004, fue insertada en su órbita. Los Venera son una larga serie de 16 naves lanzadas a Venus entre 1961 y 1983. Estas naves han realizado aproximaciones, han orbitado el planeta y se han posado en su superficie. Viajes más recientes a Venus han sido realizados con los proyectos Vega, proyecto sovietico continuación de los Venera en 1984 y 1985, y los norteamericanos Pioneer Venus, en 1978, y Magellan que entre 1990 y 1994 cartografió el planeta y estudió su campo gravitatorio. Actualmente aparte del Messenger la Agencia Europea del Espacio ha enviado la nave Venus Express, lanzada el 9 de noviembre de 2005 y que llegó a Venus en abril del 2006. La primera nave que viajó al exterior del sistema solar fue la Pioneer 10, lanzada por la NASA el 3 abril de 1972 y que el 3 de diciembre de 1973 llegó a su máxima aproximación al Júpiter pasando a unos 200000 km de éste y siguiendo en un viaje de escape del sistema solar. La Pioneer 11, lanzada en 1973 aprovechó el impulso gravitacional de Júpiter para acercarse por primera vez a Saturno, pasando el 1 de septiembre de 1979 a 21000 km de Saturno y finalmente alejarse del sistema solar. Además de la Pioneer 10 la única misión exclusiva a Júpiter fue la misión Galileo, lanzada en 1989, consistente en un orbitador y una sonda que se introdujo en la atmósfera de Júpiter. El resto de misiones han consistido en aproximaciones a Júpiter que han aprovechado su impulso para viajar a otros cuerpos. Además de la Pioneer 11, la Voyager 1, lanzada en 1977 y Cassini, lanzada en 1997, han pasado por Júpiter y continuado su viaje hasta Saturno. Esta última ha sido una misión entre la NASA y la ESA que han portado una sonda atmosférica, la Huygens, separada de la Cassini en diciembre de 2004 y que se introdujo en la atmósfera y aterrizó en Titán, el satélite de Saturno el 14 de enero de 2005. Mención especial merece la sonda Voyager 2 que fue lanzada en 1977 e inició un viaja que recorre casi todo el sistema solar pasando por las proximidades de Júpiter, Saturno, Urano y Neptuno aprovechando en cada uno su impulso gravitacional para aumentar su velocidad sin gasto de combustible y saltar al siguiente planeta. Actualmente se encuentra a unos 15000 millones de kilómetros del Sol. También se han realizado misiones de observación al Sol. De estas mencionaremos dos por sus especiales caracterı́sticas astrodinámicas. Por un lado la nave Ulysses es una sonda solar construida en colaboración por la NASA y la ESA y lanzada en 1990. Esta sonda está diseñada para estudiar y observar el Sol desde una posición nunca conseguida hasta ahora. La sonda tiene una órbita heliocéntrica polar que la separa del plano de la eclı́ptica. Además, en su paso por la eclı́ptica la nave realiza una aproximación al planeta Júpiter. Otra nave de observación solar, también proyecto conjunto NASA-ESA, es la SOHO, Solar and Heliospheric Observator, que fue lanzada en 1995 y cuya prin- Navegación interplanetaria 269 cipal caracterı́stica es realizar la observación del Sol desde el punto de Lagrange L1 del sistema Tierra-Sol. Los objetos menores, asteroides y cometas, también han tenido sus misiones espaciales en esta última época. Por un lado, para estudiar de cerca estos cuerpos con vistas a un mayor conocimiento del origen del sistema solar, y por otro, por los nuevos retos astrodinámicos que suponen. Mencionaré únicamente tres de las últimas misiones realizadas a estos cuerpos: Near y Deep Impact de la NASA, y Rosseta de la ESA. La misión Near, rebautizada como Near-Shoemaker fue diseñada para estudiar de cerca el asteroide Eros. Independientemente de los experimentos fı́sicos hay que destacar que la dinámica orbital en torno a un cuerpo de estas caracterı́sticas es muy compleja porque dicho cuerpo, al contrario que los planetas, tiene una forma fuertemente no esférica, muy irregular, que produce unas perturbaciones muy mal modeladas. El 17 de febrero de 1996 fue lanzado al espacio, el 14 de febrero de 2000 fue puesto en órbita alrededor de Eros y finalmente fue acercándose a su superficie con una serie de complejas maniobras hasta que el 12 de febrero de 2001 se poso en ella y continuó operando hasta que se perdió su señal el 28 de febrero. La Deep Impact fue lanzada el 12 de enero de 2005 para realizar un encuentro con el cometa 9P/Tempel 1 y lanzarle desde allı́ un proyectil el 1 de julio de 2005 para observar los efectos del mismo sobre el cometa. La Rosseta, lanzada el 2 de abril de 2004 tiene prevista una compleja órbita, que incluye varias aproximaciones a la Tierra y Marte para tomar impulso gravitacional y en la que durante varios años realizará aproximaciones a varios asteroides y cometas. La última aproximación se ha realizado en 2010 al asteroide 21 Lutetia, para entrar en modo pasivo hasta 2014 cuando después de aproximarse y orbitar alrededor del cometa 67P/Churyumov–Gerasimenko se posará en su superficie. 270 Navegación espacial Capı́tulo 17 Órbitas de satélites artificiales terrestres 17.1 Movimiento del satélite sobre la superficie terrestre En capı́tulos anteriores se ha analizado la órbita de cualquier cuerpo celeste incluidos los satélites artificiales. El hecho de considerar la Tierra, o algún planeta de caracterı́sticas similares, como cuerpo central de la órbita, añade a ésta propiedades que deben ser estudiadas separadamente de las del movimiento kepleriano. Por un lado, hay que considerar que la observación no se realiza desde el origen del sistema de referencia, o foco de la órbita relativa, sino desde algún lugar de la superficie de la Tierra que rota respecto al sistema espacial. En este capı́tulo se estudian, en primer lugar, las consecuencias de este tipo de observación. Por un lado, se analiza la trayectoria del satélite sobre la superficie de la Tierra en función de los elementos orbitales del mismo. La curva ası́ generada, llamada traza, nos dará mucha información sobre distintos aspectos de la misión que dicho satélite debe cumplir. Por otro lado, determinaremos la condición para que un satélite sea visible desde una cierta estación en un momento dado. Puesto que el movimiento no es exactamente kepleriano, se analizan los tipos de perturbaciones más importantes en la órbita de un satélite artificial y los efectos que éstas producen sobre la órbita y además sobre la traza y observabilidad del satélite. Finalmente, se hace un repaso de los principales tipos de satélite en función de su misión, que viene condicionada por su traza y por lo tanto por sus 272 Órbitas de satélites artificiales terrestres elementos orbitales. 17.1.1 La órbita en la superficie terrestre: traza La misión para la que está construido un satélite artificial depende, en gran medida, de la zona de la Tierra que el satélite sobrevuela en cada instante y de la visibilidad de un satélite desde un observatorio o estación de seguimiento. Para comprender mejor los distintos tipos de misiones espaciales analizaremos la traza de un satélite, esto es, el lugar geométrico de los puntos de la superficie de la Tierra para los cuales el satélite está en el cenit en un instante dado. Conociendo en cada momento el punto de la traza que ocupa un satélite podremos decir que zonas de la Tierra son visibles para el satélite y si el satélite es visible o no para una determinada estación de seguimiento. Supondremos un satélite cuyos elementos orbitales, referidos al sistema ecuatorial, son (a, e, i, ⌦, !, T ). La traza de este satélite se obtendrá calculando en cada instante t las coordenadas geográficas del satélite s (t), s (t) y dibujando éstas sobre un mapa de la Tierra. Para calcular s , s observemos la figura 17.1 que representa la órbita del satélite S en un sistema de coordenadas ecuatoriales. S0 S s x !+f ⌦ S0 i ⌦ N G s GMST + s GMST N ⌦ Figura 17.1: Posición de un satélite artificial sobre la superficie terrestre. d0 representa la latitud del satélite s , que coincide En dicha figura el arco SS con la declinación s , mientras que d S 0 es la ascensión recta del mismo que puede ponerse en función del tiempo sidéreo medio en Greenwich GMST y la longitud d del satélite como ↵s = GMST + s , De esta forma N S 0 = GMST + s ⌦. Las coordenadas polares esféricas del satélite en el sistema de coordenadas nodal-espacial serán (r, GMST + s ⌦, s ). De éste pasamos al orbital por medio Movimiento del satélite sobre la superficie terrestre 273 de la matriz de giro R1 (i)R3 (! + f ). Aplicando esta rotación obtendremos 0 1 0 1 r cos s cos(GMST + s ⌦) r cos(! + f ) @ r cos s sen(GMST + s ⌦) A = @ r cos i sen(! + f ) A , (17.1) r sen s r sen i sen(! + f ) o lo que es igual s s = = asen [sen i sen(! + f )] , ⌦ GMST + atan [cos(! + f ), cos i sen(! + f )] . (17.2) Dados los elementos orbitales y un instante de tiempo absoluto t, expresado en cualquier clase de tiempo de los estudiados en el capı́tulo 5, podemos obtener tanto GMST como el valor de f . Las ecuaciones (17.2) nos darán el valor de s , s en ese instante. En lo que sigue analizaremos las propiedades de la traza de un satélite en función de sus elementos orbitales. Observemos la primera de las ecuaciones (17.2). La variable f recorre, en una vuelta o perı́odo del satélite, todos los valores entre 0 y 2⇡, por tanto, al ser ! constante podemos asegurar que i s i, esto es, la latitud del satélite está acotada entre los valores1 [ i, i] correspondientes a la inclinación. Además, s varı́a periódicamente, con el mismo perı́odo que la órbita del satélite. 6 5 4 3 2 1 (a) Cuatro satélites de inclinaciones: 10 , 30 , (b) Seis vueltas de un satélite de semieje a = 60 y 90 r . Perigeos numerados sucesivamente. Figura 17.2: Traza de varios satélites en función de la excentricidad y el semieje. La figura 17.2(a) nos muestra las trazas correspondientes a una vuelta de cuatro satélites que tienen los elementos orbitales comunes a = r , e = 0, ⌦ = 190 , ! = 0 , T = 0, mientras que sus inclinaciones respectivas son i = 10 , 30 , 60 y 90 . Esta última órbita es llamada órbita polar, pues pasa por los polos en su recorrido por un meridiano. El argumento del periastro ! aparece como una constante aditiva dentro de una función periódica, por lo que no modifica la forma de la traza, sino que indica 1 (i 90 ) s (90 i) si la órbita es retrógrada. 274 Órbitas de satélites artificiales terrestres únicamente la posición del perigeo de la órbita, siendo su latitud geográfica l constante, mientras que la longitud varı́a de un vuelta a otra en una cantidad igual al periodo de la órbita. Puede verse en la figura 17.2(b) cinco órbitas sucesivas de un satélite de elementos orbitales a = r , e = 0, i = 60 , ⌦ = 0 , ! = 0 , T = 0. Los cinco perigeos sucesivos aparecen numerados. (a) Quince vueltas de un satélite de periodo (b) Quince vueltas de un satélite de periodo aproximado 1h 24m 29s . igual a 12h . Figura 17.3: Ejemplo de órbita de traza densa y órbita de traza periódica. El semieje, o lo que es igual, el periodo, es el elemento orbital de mayor influencia sobre la forma de la traza del satélite, pues marca la periodicidad de la misma. Como se ha indicado antes, s varı́a periódicamente por depender de f y de constantes. Sin embargo s depende también de GMST que también es periódica, pero con un periodo de 2⇡ rad/dı́a distinto del periodo de f . De hecho, la forma de la traza es la misma figura para cada vuelta, pero de una vuelta a otra la figura se desplaza en longitud una cantidad que depende del periodo orbital, esto es, del semieje. En efecto, supongamos el instante de paso por el nodo, para el cual ! + f = 0 y por tanto GMST = ⌦ s . Si llamamos GMST 1 al tiempo sidéreo del primer paso por el periastro y GMST 2 al del segundo, tendremos 1 2 = GMST 2 GMST 1 , esto es, la variación de la longitud geográfica de la posición del nodo, y con él de toda la traza, es igual a la diferencia de tiempos sidéreos, o lo que es igual, al periodo de la órbita expresado en unidades de tiempo sidéreo. Cuanto mayor sea el semieje (periodo), mayor será el desplazamiento de la traza entre una vuelta y la siguiente. Las figuras 17.3(a), 17.3(b), 17.4(a) representan satélites de elementos orbitales comunes e = 0, i = 60 , ⌦ = 0 , ! = 0 , T = 0. En el caso 17.3(a) (a = r , P = 1h 24m 29s ) puede verse la traza producida por quince vueltas, que tiende a llenar completamente el mapa entre las dos latitudes lı́mite. La figura 17.3(b) muestra las quince vueltas de un satélite de periodo igual a 12h de tiempo sidéreo, que equivale a la de dos vueltas pues el periodo de rotación de la Tierra es exactamente 2 veces el de la órbita. Por último en la figura 17.4(a) se representan Movimiento del satélite sobre la superficie terrestre 275 (a) Traza de seis satélites de semiejes: 1, 2, 3, 5, (b) Cuatro satélites geosı́ncronos con inclina6, 6.61. Este último corresponde a un periodo ciones 60 , 40 , 20 y 5 . de 24h . Figura 17.4: Traza en función del semieje y órbita geosı́ncrona. siete órbitas con semiejes respectivos a = 1, 2, 3, 4, 5, 6, 6.61, éste último correspondiente a una órbita de periodo igual a 24h de tiempo sidéreo, que llamaremos órbita geosı́ncrona, y tiene forma de ocho. Cuando en una órbita geosı́ncrona la inclinación disminuye el ocho se va estrechando y acortando (figura 17.4(b)) hasta el momento en que i = 0 , valor para el cual la traza se reduce a un punto en el ecuador. Este tipo de órbita, de gran importancia para las comunicaciones, es llamada órbita geoestacionaria. Es importante destacar que este razonamiento se ha establecido a partir de un reloj de tiempo sidéreo, luego cuando se habla de órbitas geosı́ncronas o geoestacionarias como órbitas de periodo igual que un dı́a debe entenderse éste como un dı́a sidéreo que, como vimos en el capı́tulo 5, dura unos cuatro minutos menos que el dı́a medio. (a) Traza de tres satélites cuyo ángulo del nodo (b) Tres satélites geosı́ncronos con inclinación vale: 0 , 30 , 60 . 60 y ángulos del nodo: 0 , 30 y 60 . Figura 17.5: Influencia del ángulo del nodo en la traza. El ángulo del nodo aparece únicamente en la segunda ecuación, por lo que afecta únicamente a la longitud geográfica s . Sin embargo, por ser ⌦ constante, su efecto sobre la traza es mantener la forma geométrica de la misma pero desplazando toda ella una distancia ⌦. En la figura 17.5(a), se observa el desplazamiento de toda la traza al variar el ángulo del nodo. Esto es particularmente importan- 276 Órbitas de satélites artificiales terrestres te para satélites geosı́ncronos (figura 17.5(b)), pues define la zona de visibilidad del mismo, y mucho más para los geoestacionarios, pues caracteriza la longitud nominal del satélite. (a) Traza de tres satélites de excentricidades (b) Traza de dos satélites geosı́ncronos con ex0, 0.5, 0.7. Los puntos señalan posiciones equi- centricidades 0 y 0.3. distantes en t. Figura 17.6: Influencia de la excentricidad en la traza. Por lo que respecta a la excentricidad, ésta aparece implicitamente en f , pues es necesaria para obtener f en función de e. Como sabemos, la anomalı́a media ` es una variable angular con el mismo periodo que f , pero que, por ser lineal con el tiempo, representa un recorrido de la órbita con velocidad angular constante n. La diferencia entre ` y f es pequeña, por lo que considerar ` en lugar de f en (17.2), lo que equivale a suponer e = 0, hace inapreciable la variación de la forma de la órbita. El mayor efecto que produce la excentricidad es sobre la velocidad con que el satélite recorre la traza, permaneciendo mucho más tiempo sobre determinadas regiones de la Tierra, las que estén más próximas al apoastro, que sobre otras. La figura 17.6(a) muestra perfectamente este hecho pues representa tres órbitas de excentricidades respectivas e = 0, 0.5, 0.7. Los puntos negros representan puntos equidistantes en el tiempo, en órbitas de excentricidad cero estos puntos están también equidistantes en distancia, para órbitas excéntricas los puntos se acercan en la zona del apoastro, donde el satélite permanece por más tiempo, y se alejan en la zona del periastro. Con objeto de observar mejor las trazas se han tomado distintos valores de ⌦. La figura 17.6(b) muestra el curioso efecto del aumento de la excentricidad sobre la órbita goesı́ncrona que tiende a tumbar el ocho. 17.1.2 Visibilidad de un satélite desde una estación Supongamos una estación de seguimiento de satélites situada en un punto O, de la superficie terrestre, caracterizado por sus coordenadas geográficas o , o . El objetivo de esta estación es la observación visual o radioeléctrica del satélite o de las señales que éste envı́a, por lo que será necesario conocer bajo que condiciones y en qué instantes el satélite será observable desde la estación. Cualquier señal enviada por un satélite sufre distorsiones al atravesar las capas bajas de la atmósfera. Según el tipo de observación que queramos realizar, Movimiento del satélite sobre la superficie terrestre 277 existirá un cierto ángulo lı́mite ✏ tal que, cuando el satélite esté a una distancia angular del horizonte menor que el ángulo ✏, dicha observación es imposible y por tanto consideraremos que el satélite no es visible. La estación puede realizar una observación cuando éste cruza el llamado cono de visibilidad, que es un cono de eje vertical y ángulo 90 ✏. S ✏ S r O O ✏ ✏ ' r S0 T T Figura 17.7: Cono de visibilidad de un satélite desde una estación terrestre. Si consideramos como aproximación una Tierra esférica de radio r , igual al radio ecuatorial, la figura 17.7 nos marca el lı́mite de observación del satélite S desde O. Dicho lı́mite estará representado por el ángulo ' de la figura. Para obtener éste, basta aplicar las propiedades de los triángulos planos T OS y T SS 0 , que nos dan r cos ✏ = r cos(' + ✏), por lo que se tendrá ' = acos ⇣r cos ✏ ⌘ ✏. (17.3) r El ángulo ' representa el lı́mite de la distancia angular entre la estación y la proyección del satélite sobre la superficie terrestre, o punto que ocupa en la traza en dicho instante. Si dicha distancia es menor o igual que ', el satélite es visible. Para obtener la distancia angular entre un punto de la traza ( s , s ) y la estación ( o , o ) basta considerar como el ángulo entre los vectores cart(1, s , s ) y cart(1, o , o ), por lo que efectuando el producto escalar, se obtiene la relación cos = sen o sen s + cos o cos s cos( o s ). (17.4) Si llevamos las expresiones (17.2) de ( s , s ) a la ecuación (17.4) obtendremos los valores de (t). Por último la condición ⇣r ⌘ (t) < acos cos ✏ ✏, (17.5) r 278 Órbitas de satélites artificiales terrestres indica los instantes de visibilidad del satélite desde la estación. Esta condición puede ponerse también como cos( + ✏) > 17.2 r cos ✏. r (17.6) El problema principal del satélite Analizando los valores de los distintos armónicos del potencial terrestre2 se comprueba que el término J2 , debido al achatamiento, es dominante frente al resto de armónicos. J2 es del orden de 10 3 frente al valor inferior a 10 6 del resto. Por ello, la perturbación sobre la órbita de un satélite artificial terrestre producida por el término del potencial que contiene al armónico J2 es dominante frente a la de los demás armónicos, ası́ como también lo es frente al resto de perturbaciones que actúan sobre este satélite. De forma genérica, con la formulación de la perturbación en forma asintótica respecto a un pequeño parámetro vista en el capı́tulo 12, podemos tomar J2 como pequeño parámetro y modelar el problema orbital a partir de un orden cero, que representa el problema kepleriano, una perturbación de primer orden producida por este término y una perturbación de segundo orden que engloba el resto de perturbaciones. Prescindiendo del efecto de todas las perturbaciones excepto del achatamiento formularemos el llamado problema principal del satélite artificial, que nos da una primera aproximación al modelo orbital que mejora notablemente el kepleriano. Para comprobar el efecto de esta perturbación sobre el movimiento kepleriano usaremos las ecuaciones (12.15), donde el término Vp debido al achatamiento, (14.19), se expresará como Vp = µ ⇣ r ⌘2 J2 P2 (sen ), r r con r el radio ecuatorial terrestre y donde hemos usado en lugar de , pues esta coordenada representa la declinación del satélite, al coincidir el plano fundamental del sistema terrestre rotante con el ecuatorial. Por otro lado, si aplicamos la tercera de las igualdades (9.13), sen = sen i sen(! + f ), y desarrollamos la expresión se llega a la igualdad Vp = ✏ Rp siendo ✏ = 1 ⇥ 3 sen2 i sen2 (! + f ) r3 J2 y Rp = µ r2 /2, una constante. ⇤ 1 , Basta tener en cuenta las derivadas de r y f respecto de los elementos orbitales, que se han encontrado en el capı́tulo 12, para calcular las derivadas de Vp respecto de cada uno de los elementos orbitales. Estas derivadas pueden ser llevadas a 2 Esto es también cierto, aunque en menor grado, para los potenciales de Marte y la Luna. Efectos sobre el satélite de otras perturbaciones 279 (12.15) para obtener las expresiones ( , f ) que permiten formular las ecuaciones (12.30) y, mediante éstas, las variaciones de primer orden de los elementos orbitales en el problema principal del satélite. Si calculamos las integrales (12.30) entre 0 y 2⇡ obtendremos la variación de primer orden, , de cada parámetro de la órbita de un satélite artificial, en cada vuelta del satélite. Tras una serie de cálculos se obtienen las siguientes variaciones a e i = = = ⌦ = ! = 0, 0, 0, 3J2 rp2 ⇡ cos i, a2 (1 e2 )2 3J2 rp2 ⇡ (1 5 cos2 i). 2a2 (1 e2 )2 (17.7) De las igualdades anteriores podemos deducir que ningún elemento orbital, salvo ⌦ y !, presenta variación en el primer orden. En el caso de ⌦ esta variación representa la precesión del nodo de la órbita. La precesión del nodo es mayor cuanto más pequeña sea la inclinación de la órbita, y se hace cero para órbitas polares. En órbitas retrógradas el nodo se adelanta en lugar de retrasarse. El efecto de esta perturbación sobre la traza desplaza el punto de corte de la órbita en el ecuador hacia el oeste si es directa y hacia el este si es retrógrada. En una órbita geosı́ncrona, aunque el efecto es menor al aparecer el semieje en el denominador, la figura de ocho cerrada se abre, si es geoestacionaria el punto sobre el ecuador que ocupa la órbita se desplaza al oeste. En el caso de ! la variación es proporcional al valor de (1 5 cos2 i), y nula cuando este término vale cero, lo cual coincide con una inclinación i = 63 260 5.00 82, que será llamada inclinación crı́tica, y que ha tenido una gran importancia en el desarrollo de los satélites artificiales. Esta inclinación tiene la importante propiedad de mantener constante el valor del argumento del perigeo, sin embargo, desde el punto de vista dinámico representa una singularidad esencial del problema principal. 17.3 Efectos sobre el satélite de otras perturbaciones Como se ha dicho en el apartado anterior, el resto de perturbaciones producirá en el satélite un efecto mucho menor que el efecto producido por el achatamiento. Sin embargo, resulta muy útil conocer, a rasgos generales, como influye cada una de las perturbaciones, con objeto de saber cuáles debemos incluir en el modelo de integración cuando se diseña la misión espacial. 280 Órbitas de satélites artificiales terrestres Sin entrar en un estudio detallado de cada una de las perturbaciones podemos resumir algunas de las consecuencias y sus comparaciones en los siguientes puntos: Las cuatro perturbaciones más importantes en la órbita de un satélite son: el potencial terrestre, excluido J2 , el rozamiento atmosférico, la presión de radiación solar y la perturbación luni-solar. Para satélites de órbita baja son muy importantes el potencial terrestre y el rozamiento atmosférico, mientras que los otros dos tienen un efecto muy pequeño. Para satélites muy altos, por ejemplo los geoestacionarios, el efecto más importante es la perturbación luni-solar y luego la presión de radiación. El potencial terrestre perturba muy poco y el rozamiento atmosférico es nulo. La presión de radiación solar, que varı́a muy poco con la altitud del satélite, produce variaciones periódicas en los elementos orbitales y se iguala en magnitud con el rozamiento atmosférico a unos 800 km de altitud. El rozamiento atmosférico es muy importante, cuando al altitud es muy baja, por eso las órbitas bajas deben tener una mı́nima altitud para que el efecto del rozamiento sea menor que el del achatamiento. El efecto del rozamiento atmosférico, cuando actúa sobre órbitas muy excéntricas, no reduce la distancia mı́nima en el perigeo rp , sino que reduce progresivamente la excentricidad. Puede pensarse en este efecto como una reducción pequeña de la velocidad en la dirección tangente que ocurre únicamente a cada paso del satélite por el perigeo, pues debido a la excentricidad el resto de la órbita casi no está afectada por el rozamiento de la atmósfera. Cuando el rozamiento atmosférico actúa de forma continua, lo que ocurre en órbitas de baja excentricidad, se produce una disminución progresiva de la distancia rp en el perigeo con lo que la órbita termina chocando con la Tierra. La combinación del rozamiento atmosférico con el efecto del tercer cuerpo puede producir efectos indeseados sobre el valor de rp , que afectan considerablemente al tiempo de vida del satélite, por lo que es preciso un estudio de las posiciones de la Luna y el Sol antes del lanzamiento para minimizar este efecto. La perturbación producida por la Luna tiene aproximadamente una magnitud doble que la producida por el Sol. Para órbitas bajas el efecto de la perturbación luni-solar es pequeño en comparación con el resto. Para órbitas geoestacionarias es tan importante como el achatamiento terrestre. Clasificación de los satélites artificiales según su órbita 281 La perturbación producida por los planetas es muy pequeña siendo las más importantes, por este orden, las de Venus y Júpiter. El efecto de éstos siempre está por debajo del efecto relativista, que es del orden de 10 10 , es decir extremadamente pequeño. 17.4 Clasificación de los satélites artificiales según su órbita Una vez estudiado el efecto de la órbita en el movimiento de un satélite sobre la superficie terrestre y los efectos que las perturbaciones producen sobre ésta, podemos clasificar los tipos de satélites en función de las caracterı́sticas orbitales. Las órbitas más frecuentes son órbitas circulares o de muy pequeña excentricidad. Dentro de éstas la primera clasificación viene dada por la altitud del satélite sobre la superficie terrestre. 17.4.1 Órbitas bajas (LEO) Aunque no existe una clasificación rigurosa de las órbitas por su altitud se estima que una órbita baja, LEO 3 , es una órbita situada a una altitud entre 200 km y los 800 km. Las órbitas de altitud menor no son estables debido a la disminución progresiva de su altitud por el efecto del rozamiento atmosférico. Aunque órbitas de mayor altitud podrı́an considerarse como órbitas bajas la existencia del cinturón de Van Allen impide situar satélites a dichas altitudes. En 1958 las naves Explorer I y III confirmaron la existencia de los cinturones de radiación de Van Allen, que consisten en dos anillos de forma toroidal4 alrededor del ecuador de la Tierra. Dicha zona está formada por partı́culas cargadas, protones en el anillo interior y electrones en el exterior, que son atrapados por el campo magnético terrestre. El anillo interior está situado entre los 800 y los 6000 km de altitud sobre la superficie terrestre y alcanza su máxima densidad a los 3000 km de altitud. El anillo exterior tiene su mayor densidad entre los 15000 km y los 20000 km de altitud. A partir de los 50 o 60 de latitud norte o sur la densidad de los cinturones es muy pequeña. La energı́a de las partı́culas de los cinturones de Van Allen puede dañar y degradar seriamente los componentes electrónicos de los satélites y hace peligrar la salud de un ser humano que esté permanentemente expuesto a ellas. Por ello determinadas misiones, sobre todo las misiones largas y las tripuladas, deben ser situadas a una altitud que interfiera lo mı́nimo posible con esta zona. La seguridad de la zona de órbitas bajas, por debajo del cinturón interior de Van Allen, la hace una zona especialmente útil para las misiones tripuladas como 3 Low Earth Orbit. una rosquilla o donuts. 4 Como 282 Órbitas de satélites artificiales terrestres la estación espacial internacional, ISS5 , que está situada a unos 350 km de altitud en una órbita casi circular inclinada 51 . Otra caracterı́stica de las órbitas LEO es que el coste de satelización es pequeño comparado con otro tipo de órbitas. Basta un cohete lanzador de dos etapas para situar un satélite en una órbita baja. El mayor problema de dichas órbitas es que el rozamiento producido por la atmósfera requiere un mayor gasto de combustible para su mantenimiento en órbita, por lo que la elección de esta altitud para el estación espacial supone un compromiso entre seguridad y coste de la misión. Un satélite bajo tiene un semieje pequeño y por tanto un periodo corto, por lo que puede completar entre 14 y 16 vueltas a la Tierra por dı́a. Además, como se ve en su traza densa (figura 17.3(a)), puede observar, en algún momento, cualquier punto de la superficie terrestre de latitud menor que la inclinación. Esta caracterı́stica hace este tipo de órbitas muy útiles para cualquier misión de tipo geodésico (medida del potencial terrestre), fotográfico, meteorológico, medio ambiental, etc. 17.4.2 Órbitas medias (MEO) Se consideran órbitas medias, MEO 6 a las órbitas situadas más allá del cinturón interior de Van Allen y hasta los 35000 km. En esta zona, evitando el cinturón exterior o protegiéndose de él, se sitúan los satélites de las constelaciones usadas para la navegación, como GPS o Galileo. Tanto el sistema GPS como GLONNAS usan altitud de unos 20000 km con órbitas de periodo orbital de 12 horas. Galileo se situará en órbitas de 23220 km de altitud y 56 de inclinación. 17.4.3 Órbitas geoestacionarias (GEO) Los últimos tipos de órbitas que estudiaremos son las órbitas geosı́ncronas y las órbitas geoestacionarias, GEO. En ambos casos el periodo orbital está sincronizado con la rotación de la Tierra, las geoestacionarias, además, tienen inclinación nula, es decir, son órbitas ecuatoriales. La idea de situar satélites en estas órbitas fue publicada en 1928 por Herman Potocnik, aunque luego fueron popularizadas por el autor de ciencia-ficción Artur C. Clarke. Estas son las únicas órbitas altas por lo que al contrario que las bajas y las medias no serán denominadas ası́. Como se observa por su traza (figura 17.4(b)) las órbitas geoestacionarias ocupan un punto fijo del ecuador terrestre, salvo la deriva producida por las perturbaciones que debe ser corregida cada cierto tiempo. De esta forma, una antena fija puede estar apuntando constantemente al satélite lo que los hace muy útiles para las comunicaciones, especialmente para la transmisión de señales de 5 International 6 Medium Space Station. Earth Orbit. Clasificación de los satélites artificiales según su órbita 283 televisión. Además de su uso en televisión y telecomunicaciones estas órbitas son usadas para satélites meteorológicos como los GOES (norteamericanos), Meteosat (europeos) y GMS (japoneses). La altitud de esta órbitas es de 35786 km, es decir poseen un semieje de 42164 km. El área de visibilidad de estos satélites es de aproximadamente el 43 % de la superficie del hemisferio que definen. Se excluyen las regiones por encima o debajo de los 70 de latitud (norte y sur). Esta caracterı́stica, sujeta a su inclinación, hace que el número de satélites geoestacionarios esté limitado, pues estos únicamente pueden estar en un estrecho anillo que rodea el ecuador, de radio 42164 km, en el que se encuentran unos 300 satélites. 17.4.4 Satélites Molniya y Tundra La mala cobertura de los satélites geoestacionarios por encima de los 70 constituyó un gran handicap para el desarrollo de los sistemas de comunicaciones soviéticos. Para solucionar esto aprovecharon tres propiedades de las órbitas de los satélites artificiales vistas con anterioridad: Los satélites de gran excentricidad permanecen gran parte de su tiempo en las proximidades del apogeo y pasan muy rápido por el resto de las regiones. La excentricidad de estos satélites es aproximadamente 0.7. Un satélite en inclinación crı́tica mantiene el perigeo, y como consecuencia el apogeo, estacionario, es decir ocupa siempre el mismo lugar. Un periodo orbital igual a medio dı́a sidéreo hace que cada 24h el satélite repita su traza, pasando por los mismos lugares. Las órbitas con estas propiedades fueron llamadas órbitas Molniya, tomando el nombre del primer satélite lanzado en dicha órbita el Molniya 1. La figura 17.8, que representa la trayectoria diaria, dos vueltas, de un satélite de este tipo dice por si sola las posibilidades de estos satélites, si tenemos en cuenta que la mayor parte del tiempo el satélite se enFigura 17.8: Dos vueltas de la órbita de un satélite cuentra en la zona del hemisMolniya. ferio norte de la gráfica. Para conseguir esta trayectoria basta usar los elementos orbitales dichos y situar el apogeo por encima del punto sobre el que se quiera tener el satélite el mayor tiempo posible. 284 Órbitas de satélites artificiales terrestres Este tipo de satélites han sido usados, tanto para usos civiles, de comunicaciones, como militares, por la Unión Soviética y por los Estados Unidos. Las posibilidades del sistema aumentan si en lugar de uno se sitúan tres satélites en la misma órbita, asegurando que en cada momento del dı́a uno de los tres satélites está volando por encima de la zona de cobertura. El inconveniente principal de este sistema es que en las estaciones de Tierra se hace necesario el uso de dos antenas de rastreo. Ya que la distancia estaciónsatélite cambia continuamente, la potencia recibida varı́a y lo mismo ocurre con la frecuencia en recepción debido al efecto Doppler. Se hace necesaria una programación previa que permita comunicar simultáneamente a las estaciones de Tierra el instante en que deben cambiar de satélite. Por otro lado, como la altitud del satélite varı́a, el haz de cobertura también variará. Los satélites Molniya llevan una antena de rastreo que debe permanecer orientada hacia las estaciones de Tierra operativas. Otro tipo de órbitas que usan la inclinación crı́tica son las órbitas Tundra. Su diferencia con las órbitas Molniya es que su excentricidad no es tan grande, generalmente entre 0.25 y 0.4 y tienen un perı́odo de 24h . Estas son órbitas geosı́ncronas, que tienen una traza en forma de ocho. Situando el apogeo en un punto del hemisferio norte se consigue que el satélite recorre la parte superior del ocho la mayor parte de su tiempo, con lo que con dos satélites en la misma órbita, separados 180 se consigue una completa cobertura de la misma. 17.4.5 Satélites heliosı́ncronos Al igual que las órbitas Molniya, los satélites en órbita heliosı́ncrona son satélites que aprovechan las caracterı́sticas del problema principal del satélite, en concreto la precesión del nodo, para conseguir una determinada caracterı́stica. En este caso, se trata de que en cada punto de la órbita, definido por una anomalı́a dada, las condiciones de iluminación del Sol sobre el punto de la superficie terrestre que el satélite sobrevuela son idénticas para cada vuelta, o lo que es igual, el ángulo horario H del Sol en ese punto es el mismo. Esto es especialmente útil para los satélites de observación terrestre, por lo que casi todos aprovechan esta caracterı́stica. Para comprender esto recordemos las expresiones (3.13) y (5.1), que reunidas nos permiten escribir GMST = ↵ + H , (17.8) donde GMST es el instante de la observación, es la longitud de un observador, ↵ es la ascensión recta en ese instante de un astro cualquiera, en este caso tomaremos el Sol, y H es el ángulo horario del mismo astro observado en el instante y lugar dados. Por otro lado, la segunda de las expresiones (17.2) nos permite asegurar que la longitud del punto de la traza desde un instante cualquiera de la órbita de ano- Clasificación de los satélites artificiales según su órbita malı́a verdadera f1 a otro f2 = f1 + 2⇡ pasa de un valor por la expresión 2 1 = ⌦ (GMST 2 1 a otro GMST 1 ), 285 2 relacionados (17.9) siendo ⌦ la variación del ángulo del nodo en una vuelta, que en una órbita kepleriana vale cero, pero cuando la órbita está perturbada por el achatamiento terrestre viene dado por (17.7). Particularizando (17.8) para los dos instantes, tomando el Sol como el astro para el cual se dan ↵ y H, y llevando todo a la expresión (17.9) podremos poner H2 H1 = ⌦ ↵, (17.10) donde ↵ = ↵2 ↵1 representa la variación de la ascensión recta del Sol en una vuelta de la órbita. Si hacemos coincidir la variación, en una vuelta, de la ascensión recta del Sol con la del nodo de la órbita, el ángulo horario del Sol en el lugar sobrevolado por el satélite coincidirá en el instante inicial y al cabo de una vuelta, cumpliéndose las condiciones deseadas. Para comprobar de manera práctica lo que esto supone en el diseño de las órbitas de satélites artificiales tendremos en cuenta que este tipo de satélites de observación tienen una órbita baja, por lo que las órbitas heliosı́ncronas son siempre órbitas LEO. Por otro lado, como el periodo orbital de un satélite LEO es pequeño, podemos simplificar el movimiento del Sol, tomando el Sol medio en lugar de verdadero, por lo que éste da una vuelta completa en el ecuador con una velocidad angular de 2⇡/365.2422 rad/dı́a, por lo que durante un periodo P del satélite el valor de ↵ vendrá dado por 2⇡P/(365.2422 ⇥ 24 ⇥ 60), dando P en minutos. Si ahora calculamos ⌦ en una vuelta, por medio de la relación (17.7), para un satélite en orbita circular e = 0 y radio a = 1.125, lo que equivale aproximadadmente a 800 km de altitud, se obtiene la inclinación necesaria para que la condición se cumpla, en este caso i = 98. 6. Esto nos da una órbita casi polar y retrógrada muy habitual en este tipo de satélites. 17.4.6 Órbitas de transferencia geoestacionarias (GTO) Estas órbitas permiten pasar un satélite de una órbita baja circular y ecuatorial a una órbita geoestacionaria. Para ello la órbita tiene que ser muy excéntrica y tener una distancia en el perigeo, rp , que coincida con el radio de la órbita baja y una distancia en el apogeo, ra , que coincida con el radio de la órbita geoestacionaria. A partir de estos valores es fácil deducir el semieje y la excentricidad de esta órbita, que valdrán r rLEO r + rLEO a = GS , e = GS , 2 2a donde rGS , rLEO representan respectivamente los radios de las órbitas geoestacionaria y baja. 286 Órbitas de satélites artificiales terrestres Capı́tulo 18 Maniobras orbitales 18.1 Introducción En el capı́tulo anterior se ha analizado la relación entre los elementos orbitales de un satélite artificial y las caracterı́sticas concretas de la misión para la que dicho satélite ha sido diseñado. Llamaremos órbita nominal del satélite a la órbita en la que será situado para cumplir su misión. En este capı́tulo analizaremos las fases que conducen hasta la inserción del satélite en su órbita nominal. Incluiremos, desde el lanzamiento del mismo, hasta las correcciones de la órbita, o maniobras, que lo llevarán en sucesivas etapas a su órbita nominal o que permitirán la corrección de la misma cuando el efecto de las perturbaciones lo aleje de ésta. Con objeto de una mayor claridad en la exposición de estos temas simplificaremos el complejo sistema técnico que encierran, centrándonos principalmente en los aspectos dinámicos del mismo. 18.2 La velocidad y la navegación espacial La órbita de una nave espacial es la solución del sistema de ecuaciones diferenciales (12.1), en la que se incluyen todas las perturbaciones, para un conjunto de valores iniciales dado por el vector de estado (x0 , X 0 ) en el instante inicial t = t0 . Si cambiamos las condiciones iniciales, la posición, la velocidad o ambas obtenemos otra órbita diferente caracterizada por las nuevas condiciones iniciales. Esta afirmación, que se deduce trivialmente de la teorı́a de las ecuaciones diferenciales ordinarias, tiene unas consecuencias dinámicas obvias pero que es conveniente destacar. 288 Maniobras orbitales Las pelı́culas de ciencia ficción han popularizado una serie de naves espaciales que distan mucho de lo que es la navegación por el espacio. Estas naves son presentadas como un vehı́culo similar, en cuanto a su comportamiento, a un avión, que es fácilmente maniobrado por un piloto que modifica en tiempo real la trayectoria de la nave. La realidad es muy distinta. La intervención del piloto en la trayectoria de una nave únicamente tiene importancia en las reentradas a la atmósfera de los transbordadores espaciales, que realmente se convierten en grandes aviones y en las últimas fases de aproximación entre dos naves que se acoplan, como las llegadas a la estación espacial. El resto del tiempo los viajes espaciales son más parecidos a los viajes en tren donde las vı́as han quedado fijadas por la ecuación diferencial y por las condiciones iniciales y éstas han fijado también el horario del tren. Para cambiar de ruta, tanto la vı́a como los horarios, debemos fijarnos de nuevo en los parámetros que modifican la órbita. La ecuación diferencial es siempre la misma, luego únicamente el cambio de las condiciones iniciales, o valores de la posición y velocidad en un cierto instante, permitirá el cambio de trayectoria. Pensemos ahora que tenemos un satélite artificial en una órbita dada, por ejemplo una órbita ecuatorial y queremos darle una cierta inclinación. Supongamos que estamos en el instante t0 y tenemos una posición y velocidad que nos aseguran la órbita ecuatorial; para el cambio de órbita debemos cambiar, en ese mismo instante t0 , la posición y la velocidad, pero es fácil comprender que no podemos modificar la posición de la nave instantáneamente. Ası́ pues, el único recurso que nos queda es modificar la velocidad y obtener unas condiciones iniciales, (x0 , X 0 + v), que transferirán la nave a una nueva órbita que tiene un punto en común con la anterior. El cambio de velocidad, producido por la variación de la cantidad de movimiento de la nave al expulsar masa a gran velocidad, es la única forma posible, en la actualidad, de cambiar la órbita. A esta acción le llamaremos maniobra orbital y sus caracterı́sticas serán estudiadas en el presente capı́tulo. Además de los cambios de órbita durante una misión, la velocidad juega también un importante papel en el lanzamiento al espacio de una nave, condicionando si ésta puede o no entrar en órbita y si la órbita puede o no alejarse de la Tierra lo suficiente para alcanzar otros cuerpos del sistema solar. Para comprender esto nos olvidaremos, por ahora, de la dirección del vector velocidad y consideraremos algunas propiedades del movimiento orbital derivadas únicamente de su norma, basadas en la expresión (8.11) y en su particularización a los distintos tipos de movimientos dada en la tabla (8.1). Supongamos que queremos poner en órbita un satélite artificial alrededor de un cuerpo o planeta de radio rP . Para ello realizaremos el lanzamiento del satélite, que en esencia consiste en un procedimiento, que describiremos en los siguientes apartados, para situar el satélite en una posición del espacio, a una cierta distancia rP del centro de masas del planeta y con una cierta velocidad. La velocidad y la navegación espacial 289 Para comprender el efecto de la velocidad en la puesta en órbita del satélite partiremos de la expresión mP vs2 = G , (18.1) rP que nos da el cuadrado de la velocidad de una órbita circular, (tabla 8.1), a una distancia rP de un planeta de masa mP . A la velocidad vs le llamaremos velocidad de satelización y representa la mı́nima velocidad necesaria para que una nave, dejada libre a una distancia rP del centro del planeta, entre en órbita alrededor del mismo, convirtiéndose en un satélite artificial, y no vuelva a caer a la superficie. Las propiedades del movimiento kepleriano indican que un cuerpo de masa cualquiera, situado a una cierta distancia de otro con cualquier velocidad, se moverá en órbita kepleriana alrededor del segundo. Para ver que esto no contradice lo afirmado en el párrafo anterior tendremos en cuenta que, a partir de la expresión de la velocidad para una órbita elı́ptica cualquiera, se obtiene fácilmente que, para una distancia r0 y una velocidad v0 , el semieje de la órbita es igual a a= 2µ µr0 . r0 v02 Si la velocidad fuese inferior a la velocidad de una órbita circular, esto es v02 < µ/r0 , se llegarı́a finalmente a que a < r0 , y por otro lado a que la distancia en el periastro rp = a(1 e) < a < r0 . Si r0 coincide con el radio del planeta rP resultará que la distancia en el periastro serı́a menor que el radio del planeta, por lo que el satélite chocarı́a con la superficie del mismo. A un cuerpo con una trayectoria elı́ptica de este tipo, esto es, con una velocidad menor que la de satelización a una distancia rP , se le llama misil balı́stico. Para la misma distancia, un aumento de v supone un aumento de la energı́a, obteniéndose una órbita elı́ptica. Si aumentamos lo suficiente la velocidad, la energı́a llegará a anularse y la órbita pasará a ser parabólica. En este caso ve2 = 2 G mP . rP (18.2) p A esta velocidad, 2 veces mayor que la velocidad de satelización, se le llama velocidad de escape, puesto que a partir de ella la órbita ya no es periódica y la nave, llamada ahora sonda espacial, se aleja indefinidamente del planeta. vs ve Tierra 7.91 11.18 Luna 1.68 2.36 Marte 3.55 5.02 Venus 7.33 10.36 Tabla 18.1: Velocidades de satelización y escape en km/s 290 Maniobras orbitales En la tabla 18.1 pueden verse los valores de la velocidad de satelización y escape para la Tierra, la Luna, Marte y Venus. Todas las velocidades están expresadas en km/s. Estas velocidades indican que el coste de puesta en órbita de una misión espacial es mucho menor si se realiza desde la Luna en lugar de realizarlo desde la Tierra mientras que desde Marte el coste es la mitad que desde la Tierra. Aumentando más la velocidad se obtienen órbitas hiperbólicas en las que la sonda siempre se aleja del planeta. Es interesante observar que puede considerarse que, cuando la distancia entre el satélite y el planeta es lo suficientemente grande, el planeta ya no atrae gravitacionalmente a la sonda, sin embargo, ésta no se para y continúa su viaje con una velocidad que nunca es menor que la llamada velocidad residual ✓ ◆ 2 1 µ 2 v1 = lı́m µ + = . (18.3) r!1 r a a 18.3 Propulsión de naves espaciales Para entender las relaciones entre la dinámica de la navegación espacial y cuestiones tan importantes para el coste de una misión como la cantidad de combustible que debe llevar y el tiempo de vida estimado de la misión, será necesario comprender algunos conceptos de la propulsión de las naves espaciales. Una maniobra orbital consiste en una modificación de la velocidad del satélite basada en la ley de conservación del momento lineal o cantidad de movimiento. El efecto de los cohetes consiste en la expulsión de una cierta cantidad de masa a una cierta velocidad, lo que produce un aumento de la velocidad del satélite en sentido contrario a la expulsión. Existen diversos métodos de expulsión de esta masa pero por el momento pensaremos en un proceso de combustión y en la expulsión a gran velocidad de los gases de dicha combustión. Llamaremos c a la velocidad efectiva de eyección1 de los gases para un cohete dado, y b = ṁ 0 la velocidad constante de pérdida de masa para dicho cohete. Si m es la masa total y X la velocidad en el instante anterior al encendido de los cohetes, la ley de conservación de la cantidad de movimiento nos indica que la variación de la velocidad v después de un intervalo de tiempo t viene dada por (m b t)(X + v) + (b t)(X + c) m X = F ext t, donde F ext es la resultante de las fuerzas exteriores que actúan sobre la nave. Las principales fuerzas externas son la fuerza de gravedad, el rozamiento atmosférico, etc. 1 La velocidad efectiva no coincide con la velocidad real de expulsión de gases, pues ésta queda modificada por la distinta presión relativa de los gases y del aire. La relación viene dada por c = vr + (pg pa )A/b, donde vr es la velocidad real de expulsión, pg , pa las presiones de los gases y la atmósfera y A el área de la tobera de expulsión. Propulsión de naves espaciales 291 Desarrollando esta expresión se llega a m que, dividida por v b t( v c) = F ext t, t y tomando lı́mites cuando m lı́m t!0 ⇣ v = b lı́m t!0 t v t ! 0, nos conduce a ⌘ c + F ext , o lo que es igual m dv dm = c + F ext , dt dt (18.4) que es la llamada ecuación del cohete. El término Fc = dm c= dt b c, (18.5) es el empuje o fuerza que el cohete ejerce sobre la nave. La dirección del vector c es la dirección hacia la que se expulsan los gases en la combustión y puede ser modificada, por ello, los dos parámetros que caracterizan realmente un cohete son las normas, c y Fc = b c, de los vectores anteriores y que, por extensión, se llaman también velocidad efectiva y empuje del cohete. En la práctica no se usa la velocidad efectiva, sino ésta dividida por el valor de la constante g0 de la aceleración de la gravedad en un punto del ecuador terrestre. Ası́, definiremos el impulso especı́fico como la cantidad Isp = c . g0 (18.6) La cantidad Isp , ası́ definida, se representa en segundos, mientras que el empuje se representa en newtons2 . Existirán dos tipos de cohetes en función de su empuje. Los que tienen un gran empuje, en general mucho mayor que la fuerza de gravedad, y los de bajo empuje, o microempuje, que es menor que la fuerza de gravedad. Estos últimos comunican al satélite una pequeña aceleración durante un periodo de tiempo largo, en contraposición con los de gran empuje que son encendidos durante un periodo de tiempo muy corto, despreciable frente al periodo orbital, y que durante este periodo producen una gran aceleración. En general supondremos que el impulso proporcionado por estos últimos es instantáneo. La variación de la velocidad de la nave durante el proceso de encendido de motores se obtendrá integrando la ecuación (18.4) entre los instantes de encendido y apagado de motores. Si consideramos el encendido de un cohete de alto empuje, mucho mayor que las fuerzas de gravedad y rozamiento atmosférico, podemos 2N = m kg s 2. 292 Maniobras orbitales suponer que la suma de las fuerzas externas es nula. Integrando la ecuación (18.4) del cohete en estas condiciones se llega a ⇣m ⌘ 0 v = c log . m La anterior relación indica que la variación de la velocidad de la nave lleva la dirección opuesta a la de la expulsión de los gases, que puede ser elegida orientando las toberas, por ello, el parámetro más importante de la maniobra es la variación de la norma de la velocidad, que se puede poner como ⇣m ⌘ ⇣m ⌘ 0 0 v = c log = Isp g0 log , (18.7) m m y es proporcional a la velocidad efectiva (impulso especı́fico) y al logaritmo del cociente entre la masa inicial, m0 y la masa m al final del encendido, que es la inicial menos la expulsada. Al valor v, que indica la variación de la norma del vector velocidad en una maniobra, se le llama impulso total o más habitualmente delta uve. Si queremos calcular el tiempo de encendido de un cohete de parámetros Fc , Isp , para conseguir un impulso v, bastará tener en cuenta que en un tiempo t se habrá expulsado una cantidad de masa igual a b t, luego si la masa inicial es m0 la final será m = m0 bt, que llevada a (18.7) nos da t= m0 ⇣ 1 b e v/c ⌘ = m0 Isp g0 ⇣ 1 Fc e v/Isp g0 ⌘ , (18.8) donde hemos sustituido b por su valor en términos de Fc e Isp . A lo largo de la vida de un satélite se realizan múltiples maniobras, en cada una de las cuales se produce un impulso total vi de acuerdo con la expresión (18.7). La suma de estos impulsos, que se podrá poner como ✓ ◆ ✓ ◆ X X mi 1 m0 v= vi = c log = c log , mi mn i i es llamada velocidad caracterı́stica y depende de la cantidad de masa total expulsada o combustible utilizado. El coste de una misión, que depende de la cantidad de combustible cargado en la nave, se minimiza si conseguimos minimizar la velocidad caracterı́stica. Llamemos mc a la cantidad total de combustible que carga una nave y mn a su peso sin combustible, su carga útil, entonces la velocidad caracterı́stica del conjunto de todas las maniobras realizadas hasta que la nave se queda sin combustible se podrá poner en cualquiera de las dos formas siguientes: ✓ ◆ mn + mc mc v = c log , = e v/c 1. (18.9) mn mn Propulsión de naves espaciales 293 Las dos relaciones anteriores indican la cantidad total de combustible, en relación con la carga útil, que debe llevar una nave cuya misión requiera en total una velocidad caracterı́stica v. Hay que recordar que la velocidad caracterı́stica es la suma de los delta uve de cada una de las maniobras realizadas en la misión. Se pueden realizar cuantas maniobras se quiera, y distribuirlas como se desee, con la única condición de que la velocidad caracterı́stica queda condicionada por la cantidad total de combustible y no por la potencia de los cohetes. La ecuación (18.9) ha sido obtenida en ausencia de fuerzas externas, sin embargo, en la realidad, el resto de fuerzas que actúan sobre el satélite contribuyen a disminuir el valor del delta uve obtenido con la misma cantidad de combustible. Esta disminución de la eficiencia de cada maniobra es proporcional al tiempo de duración del encendido de los motores. Cuanta menos duración tenga el encendido, menor será la pérdida de impulso. Obviamente, cuanto mayor sea el empuje del cohete se precisará un menor tiempo de encendido por lo que la maniobra será más efectiva. Actualmente existen dos tipos de cohetes en uso: los de propulsión quı́mica y los de propulsión iónica o eléctrica. Los cohetes de propulsión quı́mica poseen bajo impulso especı́fico pero la cantidad de masa expulsada es muy grande por lo que consiguen un gran impulso total, o lo que es igual, consiguen una gran variación de la velocidad en poco tiempo de encendido. Como en el espacio exterior no hay oxı́geno para quemar el combustible, el cohete debe llevar almacenado en tanques no sólo el propelente o combustible, sino también el oxidante o comburente. Los combustibles quı́micos pueden ser sólidos, que habitualmente llevan mezclado el propelente y el oxidante y los combustibles lı́quidos, que almacenan ambos por separado. Los combustibles sólidos alcanzan velocidades de expulsión de gases entre 1000 y 4000 m/s y pueden conseguir empujes de entre 1000 y 107 N, mientras los cohetes con bipropelentes lı́quidos expulsan los gases entre 1000 y 4700 m/s y alcanzan empujes de entre 0.1 y 107 N. Los cohetes de propulsión quı́mica son los más usados en la navegación espacial. El impulso especı́fico entre 200 y 500 segundos es pequeño pero lo compensan con el gran empuje que pueden conseguir. Existen tres tipos de cohetes de esta clase: los de pequeño impulso, entre 0.1 y 10 N útiles para las maniobras de cambio de actitud; los de impulso medio, entre 200 y 400 N, útiles para realizar maniobras de cambio de órbita; y finalmente los grandes cohetes de un empuje del orden de millones de newtons que son los usados por los lanzadores para poner las naves en órbita. Los cohetes iónicos aı́slan iones y los lanzan a una gran velocidad con lo que se consiguen grandes impulsos especı́ficos, sin embargo, el impulso total es muy pequeño, puesto que la masa expulsada es muy pequeña. La ventaja frente a los de propulsión quı́mica es que pueden mantenerse en funcionamiento durante grandes perı́odos de tiempo con poco coste de combustible, por lo que serán mucho más adecuados para la navegación interplanetaria no tripulada. Un motor iónico puede producir un impulso especı́fico de 8000 a 80000 segundos, pero su empuje 294 está entre los 10 Maniobras orbitales 3 y los 10 N. El efecto de este tipo de motores es igual al de una pequeña perturbación que actúa de manera continuada. Este tipo de efecto es similar al que puede producir otro de los sistemas de propulsión propuestos, aunque todavı́a no probados: la vela solar. En este caso se trata del efecto continuado de la presión de radiación solar sobre una vela de grandes dimensiones. Esto puede producir una fuerza de unos 9 N por km2 de vela, siempre en la dirección opuesta al Sol, sin gasto alguno de combustible. Los motores iónicos han sido probados en la misión de la ESA Smart-1, que ha llevado una nave a la Luna con un motor iónico de 70 milinewtons en una trayectoria espiral, esto es, con el semieje creciendo poco a poco de forma continua. La duración del viaje ha sido de 14 meses, frente a una duración menor de cuatro dı́as de una trayectoria convencional pero con un coste muchı́simo menor. En lo que sigue estudiaremos el efecto sobre las órbitas de los satélites de maniobras producidas por cohetes de propulsión quı́mica y supondremos que el impulso total se ha producido por un encendido instantáneo de los cohetes que origina una discontinuidad en la velocidad sin cambio de posición. Para terminar este apartado, y una vez visto lo que la tecnologı́a de cohetes puede proporcionarnos en la actualidad, revisaremos una serie de magnitudes que informarán sobre los costes de cada tipo de misión. Por un lado el proceso más caro de un misión espacial es el proceso de lanzamiento, que exige conseguir una velocidad de 7.9 km/s, lo que requiere una cantidad de combustible enorme. Esta es la razón principal por la que el proceso de lanzamiento y el resto de la misión se consideran por separado, requieren distinta tecnologı́a y abordan problemas muy diferentes. El uso de los cohetes, una vez puesto el satélite en órbita, es mucho más moderado que en la fase del lanzamiento. Los cohetes tienen un empuje mucho menor que los usados en el lanzamiento y las necesidades de combustible son mucho más pequeñas, aunque varı́an mucho en función del tipo de misión. Por ejemplo, un satélite en órbita geoestacionaria necesita, para una misión de una vida media de unos 10 años, puesta inicialmente en una órbita GTO, un delta uve caracterı́stico de unos 2000 m/s, algo menor o mayor dependiendo de la inclinación de la órbita de aparcamiento inicial, que dependerá de la latitud del lugar del lanzamiento. Esta cantidad puede suponer entre unos 800 o 1000 kg de combustible para una nave con una masa inicial de unos 2000 kg y un motor de Isp = 300 s. Las maniobras necesarias para corregir el rozamiento atmosférico de una órbita LEO son muy frecuentes pero de pequeño delta uve, no mayor que 100 m/s dependiendo de la altitud. Esto puede suponer, para una altitud de 450 km y un Isp = 250 s un gasto de 12.8 kg de combustible por año. Aunque el cálculo del impulso total necesario para cada una de las distintas maniobras será estudiado más adelante podemos adelantar las magnitudes de alguna de estas maniobras. Ası́ por ejemplo: el paso de una órbita LEO a una GTO Lanzamiento de satélites artificiales 295 requiere 2500 m/s; para pasar de una GTO a una geoestacionaria es necesario 1500 m/s; el paso desde el perigeo de una órbita GTO a una órbita de escape de la Tierra es de 700 m/s; la inserción en una órbita lunar de una órbita de escape de la Tierra son 700 m/s; etc. 18.4 Lanzamiento de satélites artificiales El proceso inicial en la puesta en órbita de una nave solo puede ser llevado a cabo por medio de un vehı́culo de grandes dimensiones llamado cohete portador o vector de lanzamiento. Posteriormente, cuando el satélite ya esté en órbita, pequeños motores, llamados también cohetes 3 serán usados para efectuar las maniobras de transferencia que lleven el satélite a su órbita nominal o que lo mantengan en ella. Hemos de pensar en un satélite artificial como en un objeto pequeño, sin capacidad para cargar grandes cantidades de combustible y, por tanto, sin posibilidad de navegar libremente en el espacio, estando limitada esta navegación a la órbita en la que ha sido dejado y a pequeñas correcciones de dicha órbita realizadas con una cantidad limitada de combustible o con la energı́a generada por los paneles solares que en ocasiones se le añaden. Por ello, es muy importante considerar por separado el proceso de lanzamiento, que exige el uso de los vectores de lanzamiento, y el desarrollo del resto de la misión a partir del instante de puesta en órbita. Un cohete portador consiste en un vehı́culo de grandes dimensiones, con una gran cantidad de combustible, que tras un periodo de combustión consigue comunicar al satélite una velocidad de módulo igual o mayor que la velocidad de satelización. Una vez terminada esta combustión el satélite se separa del cohete y comienza su misión en solitario. Para una mayor eficiencia en la puesta en órbita del satélite, los cohetes portadores son construidos con varias fases con sus correspondientes depósitos de combustible y motores. Estas fases son sucesivamente abandonadas y caen a la Tierra una vez que el combustible se ha consumido. El satélite ocupa generalmente una pequeña parte del cohete, en el extremo superior del mismo, y es llamado en Astronáutica la carga útil. En lo que sigue, por simplificar, supondremos que el cohete tiene únicamente dos fases y la carga útil. Existen dos formas distintas de poner el satélite en órbita según queramos una órbita baja o alta. Analizaremos la primera, pues la segunda se realiza en dos etapas, una primera etapa que es idéntica a la de las órbitas bajas y una segunda que consiste en una corrección de la órbita previa a la definitiva. La primera etapa consiste en el lanzamiento del cohete desde un lugar de la superficie terrestre caracterizado por su latitud geográfica l . Inicialmente los mo3 Suele utilizarse indistintamente la palabra cohete tanto para el vehı́culo lanzador como para los motores de éste o de el propio satélite. 296 Maniobras orbitales tores son encendidos y el cohete lanzado verticalmente. Inmediatamente después de que comience la ascensión del vehı́culo se le comunica una lenta rotación que orienta el eje longitudinal del cohete, que señala la dirección del vector velocidad, hacia un lugar del espacio de acimut As y distancia cenital (90 s ). Antes de llegar al punto S, final de la trayectoria del cohete, se abandona la primera fase del mismo, que cae a la Tierra y se enciende la segunda que lo lleva hacia S. En este punto se separa la segunda fase de la carga útil y ésta es dejada en su órbita con una velocidad dada por el vector X s . Las caracterı́sticas técnicas y económicas del lanzamiento obligan a que el punto S se encuentre a una distancia entre 200 y 500 km del lugar del lanzamiento, por lo que, sin pérdida de generalidad, podemos suponer para el punto S una latitud s = l , igual a la de la base de lanzamiento. Xs S L Obsérvese que la segunda fase queda también en órbita junto con la carga útil, sin embargo, las proFigura 18.1: Lanzamiento de un satélite arpiedades aerodinámicas de ésta hatificial. cen que se vea rápidamente afectada por el rozamiento atmosférico, frenándola4 y obligándola a caer a la Tierra. La caı́da de la primera fase a la Tierra y la posibilidad de accidente previo y caı́da prematura del cohete a la Tierra limitan el acimut o dirección de lanzamiento. Generalmente, las bases de lanzamiento están situadas junto al mar, o en regiones ampliamente despobladas, de manera que el acimut del lanzamiento está condicionado por la dirección que menor riesgo de accidente entrañe. Supondremos el satélite puesto en órbita en el punto S con una velocidad X s de módulo vs y coordenadas angulares As , s respecto de un sistema de coordenadas horizontales: 0 1 vs cos s sen As X s = @ vs cos s cos As A . vs sen s (18.10) Z Xs vs Sur s As El valor de X s no sirve para establecer la velocidad inicial del satélite Figura 18.2: Vector velocidad del satélite. en el problema de dos cuerpos, y con ello establecer su órbita, pues este vector debe estar referido a un sistema inercial, 4 El propio rozamiento evita el peligro al quemar totalmente la nave antes de su caı́da. Lanzamiento de satélites artificiales 297 y el sistema de coordenadas horizontales no lo es debido a la rotación de la Tierra. Si tenemos en cuenta la relación de la velocidad expresada en un sistema inercial y otro que gire con velocidad angular ! podremos poner X o = X s + ! ⇥ xs , donde xs es la posición del satélite. P Z En nuestro caso ! es un vector de módulo 2⇡ radianes/dı́a, que lleva la dirección del polo norte. El vector xs , que representa la posición del satélite, forma un ángulo igual a 90 l con ! (ver figura 18.3). Por tanto ! xs Sur |! ⇥ xs | = ! r0 cos l, mientras que la dirección de ! ⇥ xs debe ser perpendicular a xs , esto es, pertenece al plano horizontal, y llevará la dirección este, es decir ! ⇥ xs = ( ! r0 cos Figura 18.3: Rotación de la Tierra y posición del satélite. 0 vs cos X o = @ vs cos vs sen s s sen As cos As s Por tanto se tendrá 1 !ro cos l A, l , 0, 0). (18.11) que representa la velocidad absoluta del satélite, aunque expresada en el sistema horizontal. El término ! ro cos l , es la contribución de la velocidad de rotación de la Tierra a la velocidad del satélite. En estas condiciones, las coordenadas polares esféricas (vo , Ao , o ) pueden considerarse como la velocidad, acimut y altura del satélite en el instante inicial. En particular, puede observarse que vo2 = vs2 2 vs ! cos s cos l sen As + ! 2 ro2 cos2 l. (18.12) Analizando detalladamente la expresión anterior se concluye que la contribución de la rotación de la Tierra a la velocidad del satélite es máxima, con el consiguiente ahorro de energı́a, cuando As = 270 , esto es, cuando el cohete es lanzado en dirección este, o bien cuando l = 0 , esto es cuando se lanza desde el ecuador. Este ahorro puede suponer hasta un 6 % de la velocidad requerida. El ahorro en función del acimut del lanzamiento se debe combinar con las restricciones de seguridad de cada base y ha propiciado que tanto la base americana 298 Maniobras orbitales de Cabo Cañaveral (Florida) como la francesa de Kourou (en la Guayana Francesa) se encuentren en la orilla atlántica del continente americano desde donde puede dirigirse el cohete hacia el este con total seguridad. Además, ambas bases están muy próximas al ecuador, l = 25 N en el primer caso y l = 5 N en el segundo. En lo que sigue, supondremos que hemos dejado el satélite en una posición definida por su distancia al centro de la Tierra, ro , su latitud l , que se considera igual a la de la base de lanzamiento y su velocidad inicial dada por vo , Ao , o . Estudiaremos ahora los elementos orbitales de este satélite en función de los cinco parámetros. Teniendo en cuenta la cantidad de energı́a necesaria para alcanzar la velocidad de satelización, o una velocidad mayor, se considera que la velocidad conseguida permitirá únicamente órbitas elı́pticas, siendo necesaria una transferencia entre órbitas para conseguir posteriormente una órbita parabólica o hiperbólica. Por tanto, en este apartado consideraremos únicamente órbitas elı́pticas y aplicaremos las fórmulas del movimiento orbital particularizadas al caso elı́ptico. Como sabemos, en el movimiento elı́ptico la velocidad se puede poner como ✓ ◆ 1 2 vo2 = µ , ro a de donde obtenemos a= 2µ ro µ , r0 vo2 (18.13) que nos da el semieje de la órbita. Por otro lado G = |xo ⇥ Xo | = ro vo |sen(90 pues o o )| = ro vo cos o, es el ángulo entre xo , dirección del cenit, y Xo . A partir de ahı́ p= G2 r2 v 2 cos2 = o o µ aµ o , y por último, teniendo en cuenta la relación p = a(1 e2 = 1 ro2 vo2 cos2 aµ o , e2 ), podemos poner (18.14) que nos da la excentricidad de la nueva órbita. A partir de la expresión de la excentricidad podemos extraer alguna conclusión sobre los parámetros del lanzamiento. En primer lugar, suponiendo la velocidad vo igual a la de satelización, el factor ro2 vo2 /aµ es igual a la unidad, por lo que para poner el satélite en órbita baja hay que conseguir al final de la fase de lanzamiento un valor de o próximo a cero para conseguir una órbita poco excéntrica. Una gran excentricidad en este tipo de órbita puede provocar la colisión del satélite con la Tierra, pues la distancia en el periastro, rp = a(1 e), puede hacerse menor que el radio de la Tierra. Lanzamiento de satélites artificiales 299 Una órbita alta puede conseguirse, bien a partir de una órbita baja y una transferencia orbital Xo como las que serán analizadas al s final de este capı́tulo, o bien por un tipo diferente de lanzamiento en el que en lugar un ángulo o pequeño y una velocidad de satelización, se obtiene un o de unos 45 y una velocidad mucho menor (figura 18.4). De esta forma se consigue una órbita balı́stica que deberı́a volver a chocar con la Tierra. Sin embargo, en la parte más alejada de la superficie teFigura 18.4: Otro tipo de lanzamiento. rrestre se encienden los motores de la segunda fase del cohete para obtener una velocidad que ponga el satélite en una órbita de mayor altitud. Para continuar con la obtención de los elementos orbitales recordemos la expresión de r en función de la anomalı́a excéntrica y la ecuación de Kepler r = nt = a(1 E e cos E), e sen E. De la primera obtenemos la relación cos E = a r ae . Por otro lado, derivando ambas y sustituyendo el valor de d E/d t, se llega a rṙ x·X sen E = p = p , e µa e µa por lo que podremos finalmente poner E = atan( a r x·X , p ). ae e µa (18.15) Esta relación, aplicada al instante S donde comienza la órbita del satélite, nos dará a r ro vo sen o E = atan( , ), (18.16) p ae e µa donde observamos que un valor de al periastro. o próximo a 0 nos asegura que S está próximo 300 Maniobras orbitales A partir de este valor de Eo podemos obtener la época de paso por el periastro como s a3 T = to (Eo e sen Eo ), (18.17) µ Para obtener los elementos angulares de la órbita, obsérvese la figura 18.5 donde SMST representa el instante de tiempo sidéreo local del satélite en el momento en que es dejado en órbita. Este tiempo puede conocerse fácilmente a partir del tiempo sidéreo local de la estación de lanzamiento y la diferencia de longitudes entre L y S. P Ao S l ! + fo S0 La primera consecuencia que i puede observarse es que un aciSMST ⌦ mut Ao menor que 180 nos da N una órbita retrógrada, mientras que un acimut mayor que 180 nos da una órbita directa. Estu- Figura 18.5: Posición de S en la esfera celeste. diaremos únicamente estas últimas, para las cuales, aplicando las fórmulas de Bessel al triángulo esférico N SS 0 , se llega a las expresiones cos i cos Ao sen l = = = sen Ao cos l , tan l cot(! + fo ), cot Ao tan(SMST ⌦). (18.18) La primera de las relaciones nos indica que la inclinación de la órbita depende del acimut del lanzamiento y de la latitud de la base. Observando esta relación se llega a la conclusión de que únicamente podemos conseguir órbitas ecuatoriales si lanzamos el cohete desde el ecuador en dirección este, mientras que una órbita polar se consigue bien lanzando exactamente desde el polo norte o sur, o bien lanzando hacia el norte o el sur desde cualquier lugar de la Tierra. Este hecho limita la industria espacial de muchos paı́ses que no disponen de bases cerca del ecuador, por lo que no pueden poner directamente en órbita satélites geoestacionarios de comunicaciones. La tercera relación nos da el valor de SMST ⌦ en función de l y Ao . Esta relación nos indica la hora del lanzamiento para conseguir un valor dado del ángulo del nodo. Esto define una primera condición para la llamada ventana de lanzamiento, que es el perı́odo de tiempo en que un satélite puede ser lanzado al espacio para conseguir una órbita determinada. Otras condiciones son de tipo Corrección de órbitas 301 técnico como la iluminación del Sol, el campo de visión de sensores estelares, visibilidad desde ciertas estaciones, etc. Hasta aquı́ se han tratado dos tipos de lanzamientos, los que ponen el satélite en una órbita LEO y los que permiten ponerlo en órbitas más altas por medio de una órbita balı́stica y un impulso en el apogeo. Existe una tercera forma, muy usada para lanzar satélites a órbitas geoestacionarias basada en otra etapa más en el cohete portador. Una vez puesta la carga útil y la última etapa en una órbita LEO, se utilizan los motores de la última etapa para poner el conjunto en una órbita GTO que tiene su apogeo en un punto del anillo geoestacionario. El satélite se deja finalmente en esta órbita y deben ser los motores del satélite los que realicen una maniobra en el apogeo de la órbita GTO para dejarlo en órbita geoestacionaria. Puesto que el lanzamiento no se puede realizar exactamente desde el ecuador la órbita inicial está ligeramente inclinada. Esta inclinación, dependiente de la latitud del lugar de lanzamiento, se hereda en las órbitas GTO y sólo se corrige cuando se realiza la maniobra de paso a órbita geoestacionaria pues, como se verá mas tarde, en ese punto es mucho más económica. 18.5 Corrección de órbitas Una vez puesto en órbita un satélite artificial debemos buscar la manera de modificar su órbita, bien porque ésta no es la órbita nominal del satélite, que no siempre puede conseguirse directamente en el lanzamiento, o bien porque las perturbaciones van degradando poco a poco la órbita nominal que debe ser corregida para que el satélite pueda seguir desempeñando la función para la que ha sido diseñado. Supongamos que un satélite artificial se encuentra en una órbita inicial, Oi , de elementos orbitales (ai , ei , ii , ⌦i , !i , Ti ). En el instante t su posición y velocidad vendrán dados pos xi , X i . Si en dicho instante comunicamos un impulso que varı́a la velocidad a X f = X i + v, la órbita final Of vendrá dada por los elementos orbitales (af , ef , if , ⌦f , !f , Tf ) obtenidos a partir de la posición y velocidad iniciales xf = xi , X f . El método de Laplace permitirá obtener dichos elementos orbitales. El paso del satélite desde la órbita inicial Oi a una órbita final Of se puede realizar de dos formas distintas según que éstas tengan o no un punto común. Llamaremos corrección de la órbita a la realización de una maniobra orbital simple, efectuada en un punto de intersección de las dos órbitas, y que modifica los elementos de una órbita inicial y los transforma en los de la órbita final. Si las dos órbitas no tienen un punto en común el paso de una órbita a otra será llamado transferencia orbital y deberá ser realizado con un mı́nimo de dos maniobras. El problema de las correcciones orbitales o maniobras orbitales simples tiene una gran influencia en la duración final de la misión espacial. En efecto, cada maniobra exige un vi para el cual se gasta una cierta cantidad de combustible. 302 Maniobras orbitales En el momento en que no hay más combustible la vida activa del satélite acaba, pues ya no podremos corregir la órbita y ésta se degradará por el efecto de las perturbaciones. Ası́, la cantidad total de combustible determina el v caracterı́stico, que es la suma de todos los vi de las sucesivas maniobras. La estrategia de las correcciones orbitales debe ser diseñada de manera que se minimice la suma de los vi para conseguir alargar al máximo la vida del satélite. No existe una estrategia óptima y, en muchas ocasiones, ésta depende de diversos factores y no solo el gasto de combustible. Sin embargo, el estudio de las caracterı́sticas dinámicas de los distintos tipos de correcciones, junto con las de las transferencias orbitales, nos ayudará en la elección de la estrategia final de las maniobras. Nuestro problema será obtener el impulso necesario v para pasar de Oi a Of , y que debe ser aplicado en el punto común de ambas órbitas. Por su simplicidad e importancia analizaremos por separado tres formas posibles de correcciones orbitales: una corrección general, la corrección del plano de la órbita y la de la forma de la órbita manteniendo el plano. 18.5.1 Corrección general de la órbita Para realizar una corrección de la órbita en una única maniobra basta con que exista un punto de intersección entre la órbita inicial y la final para lo que debe aplicarse el procedimiento desarrollado en el apartado 9.6. Una vez comprobado que existe tal punto, en los apartados 9.6.2 y 9.6.3 se presenta un procedimiento para calcular las anomalı́as verdaderas fi , ff 5 del punto de intersección en ambas órbitas, lo que nos indica dónde debe efectuarse la maniobra. Con los valores de fi , ff basta aplicar las expresiones de cálculo de efemérides (9.30) para obtener los vectores velocidad X i , X f con los que calcular el impulso v = X f X i. En general no suelen aplicarse maniobras generales sino que éstas se dividen en varias maniobras consecutivas que cambian solo parte de los elementos orbitales, bien los que definen el plano orbital o los que determinan la forma y dimensiones de la órbita. 18.5.2 Cambio del plano orbital Si queremos cambiar el plano orbital sin modificar la forma de la órbita deberemos efectuar una maniobra que no modifique la energı́a, que es inversamente proporcional al semieje a, ni el módulo del momento angular, que define el semilado recto p de la órbita, y junto con el valor de a, su excentricidad e. El valor de la energı́a podı́a ponerse como 2h = v 2 µ/r, por lo que para mantenerla constante, debe mantenerse constante el módulo de la velocidad. 5 Allı́ llamadas f1 , f2 . Corrección de órbitas 303 Si la velocidad inicial es X i = R u + T v, expresada en el sistema orbital, ensayaremos una maniobra que produzca una velocidad final X f = R u + T cos A v + T sen A n, esto es, una velocidad que tiene su componente tangencial girada un ángulo A respecto a u. Se comprueba fácilmente que vi2 = R2 + T 2 = vf2 , por lo que la energı́a, y con ella el semieje se mantienen constantes. A esta maniobra se le llama giro a velocidad constante. Si llamamos Gi al momento angular de la órbita inicial y Gf al de la órbita final, se tendrá Gf = = = xf ⇥ X f r u ⇥ (R u + T cos A v + T sen A n) rT cos A n rT sen A v. Por otro lado, Gi = rT n, por lo que G2i = G2f , esto es, el módulo del momento angular no varı́a, y por tanto p y e no varı́an. El vector de Laplace A indica la nueva dirección espacial de la lı́nea de los ápsides, sin embargo, puede comprobarse que ni !i ni Ti varı́an. El incremento de la velocidad para pasar de X i a X f será v = Xf cuya norma X i = T (1 cos A) v T sen A n, v vendrá dada por ( v)2 = T 2 (1 cos A)2 + T 2 sen2 A = 2T 2 (1 cos A) = 4T 2 sen2 A , 2 o lo que es igual A , (18.19) 2 donde T es la componente transversal de la velocidad en la órbita inicial, esto es v = 2 T sen T = rf˙ = p µ pi r2 f˙ Gi = = . r r r La expresión (18.19) tiene unas interesantes consecuencias dinámicas, pues nos indica que el coste de un cambio orbital es proporcional a la velocidad tangencial lo que lo hace en general muy costoso. En efecto, pensemos en una órbita circular, que por otro lado es una de las más habituales, en ella la velocidad radial es R = 0 p y toda la velocidad es transversal, T = µ/r. Como veremos más adelante, el paso de unap órbita ecuatorial a una polar exige un ángulo A = 90 , luego se tendrá que v = 2µ/r, esto es, mayor que la velocidad de la órbita. Si r coincide con el 304 Maniobras orbitales radio de la Tierra ésta se transforma en la velocidad de escape, es decir es mucho mas caro transformar una órbita baja circular y ecuatorial en una órbita polar que poner en órbita el satélite. Afortunadamente el proceso de lanzamiento permite obtener directamente la inclinación nominal eligiendo adecuadamente el acimut del lanzamiento. Una variación pequeña del plano orbital, hace que sen A/2 sea muy pequeño lo que reduce el coste de la maniobra. A pesar de esto, este tipo de maniobras debe llevarse a cabo lo más alejados de la Tierra que sea posible pues cuanto mayor sea el valor de r menor será el coste. Para encontrar el valor del ángulo girado en función de la inclinación y el ángulo del nodo de ambas órbitas, basta tener en cuenta que dicho ángulo coincide con el ángulo entre los dos planos de la órbita definidos por los vectores ni , nf y haciendo uso de la tercera de las ecuaciones (9.11) se tendrá cos A = ni · nf = cos ii cos if + sen ii sen if cos(⌦f ⌦i ). (18.20) Si no se modifica el ángulo del nodo podemos simplificar la expresión anterior y poner A = if ii . Para calcular el punto donde debe realizarse la maniobra basta calcular la anomalı́a verdadera del punto de intersección en ambas órbitas. Para ello, debe aplicarse el proceso seguido en el apartado 9.6.2, que aparte de indicarnos si esta maniobra es posible si hay algún punto de intersección, nos da una expresión de las anomalı́as fi , ff de dicho punto en sendas órbitas. Aunque con lo visto hasta aquı́ se tiene toda la información necesaria para realizar este tipo de maniobra, puede resultar inA teresante averiguar cual es la latitud geográfica del punto donde I debe efectuarse. Para ello, si dibujamos la trayectoria en la esfeA ra celeste, la dirección de la misma vendrá dada por la componente de la velocidad en el plano if T tangente a la trayectoria en ese ⌦i punto, por tanto, el ángulo enNf ⌦f ii tre los dos planos será igual a A en el punto donde se realiza la Ni maniobra. La posición relativa de las dos órbitas en la esfera celesFigura 18.6: Cambio del plano orbital. te puede verse en la figura 18.6. Sea la latitud del punto I donde se realiza la inyección de combustible o maniobra, aplicando la fórmula de los senos de Bessel a los triángulos esféricos Nf T I y Ni Nf I, y combinándolas Corrección de órbitas 305 adecuadamente, se obtendrá sen = sen(⌦f ⌦i ) sen ii sen if , sen A (18.21) esto es, la latitud del lugar donde debe efectuarse la maniobra. De esta expresión se deduce que para un cambio de inclinación, sin cambiar el nodo, la maniobra debe realizarse al cruzar la órbita el ecuador = 0 . 18.5.3 Corrección de la órbita en su plano El plano de la órbita viene caracterizado por la dirección del vector momento angular G = x ⇥ X, por lo que, al no modificar la posición x, basta que el nuevo vector velocidad X f esté contenido en el plano de la órbita inicial Oi para que ésta no varı́e, manteniéndose constantes los valores de la inclinación if = ii y el ángulo del nodo ⌦f = ⌦i . Xf Xi f i r O f1 f2 O1 O2 !2 !1 Nodo a2 a1 Figura 18.7: Corrección de la órbita en su plano. Como en la maniobra de cambio de plano es preciso demostrar, en primer lugar, la existencia de un punto de intersección, mediante el proceso descrito en el apartado 9.6.3 donde se encuentran los valores fi , ff 6 , de las anomalı́as verdaderas de la intersección en las dos órbitas, cuyo significado puede verse en la figura 18.7. Para ello se resuelve la ecuación C cos fi + S sen fi = P, (18.22) siendo C = pf ei pi ef cos(!i S = pi ef sen(!i !f ), P = pi pf . !f ), (18.23) Para encontrar la variación v de la velocidad basta recordar que, si las órbitas son elı́pticas, se tendrá ✓ ◆ ✓ ◆ 1 1 2 2 2 2 vi = µ , vf = µ . r ai r af El ángulo ponerse como 6 Allı́ entre la dirección radial y la velocidad, definido en (9.22), podı́a = atan(r/v, rf˙/v). En el movimiento orbital rf˙ = G/r > 0, luego se usaba la notación f1 , f2 . 306 Maniobras orbitales sen > 0, por tanto, la reducción del posible rango de valores de permite poner = acos(ṙ/v). Por otro lado, la ecuación (8.11) de la expresión de r en polares se deduce que e sen f = acos p , (18.24) 1 + 2e cos f + e2 lo que nos da los valores de i , f sin más que añadir el correspondiente subı́ndice a los elementos orbitales en la expresión anterior. Basta recordar que X = v cos u + v sen v = v cos u + para obtener, tanto X i como X f y por tanto tendrá a partir de la relación ( v)2 = vf2 + vi2 18.5.4 vG v, r v. Asimismo, el módulo se ob- 2 vi vf cos( f i ). (18.25) Cambio de la forma de la órbita Un caso particular del anterior consiste en cambiar la forma y dimensiones de la órbita sin modificar su plano ni su posición relativa en éste. Esto equivale a mantener constante el valor de !, ⌦, i y variar a y e. En este caso !1 = !2 por lo que, particularizados los coeficientes (18.23), la ecuación (18.22) podrá ponerse como cos f = p1 e 1 p2 p2 , p1 e 2 (18.26) siendo f la anomalı́a de la intersección en ambas órbitas, que coincide por ser común la lı́nea de los ápsides. En el caso de que alguna de las órbitas sea circular, al imponer !1 = !2 , hemos tomado un origen ficticio de anomalı́as verdaderas de las órbitas circulares en el perigeo de la órbita no circular. Una maniobra muy frecuente consiste en fijar la distancia mı́nima, o distancia en el periastro, rp del satélite y modificar la máxima ra . Si tenemos en cuenta que para una elipse se tiene p = rp (1 + e) = ra (1 e), (18.27) la ecuación (18.26) se pondrá cos f = rp (1 + e1 ) rp (1 + e2 )e1 rp (1 + e2 ) = 1, rp (1 + e1 )e2 por lo que dicha maniobra deberá realizarse en el periastro con un ángulo = 0, es decir con un impulso en la dirección tangencial, aumentando la velocidad, si queremos alejar el apoastro y disminuyéndola si queremos acercarlo. Corrección de órbitas 307 X X v v (a) v < 0. Menor distancia ra (b) v > 0. Mayor distancia ra Figura 18.8: Cambio de la distancia en el apocentro. Observemos que en este caso, extrayendo la raı́z cuadrada de (18.25), se obtiene v = vf vi , que sale positiva al aumentar la velocidad y negativa al disminuir. Obviamente v es una norma luego debe ser siempre positivo, pero en los impulsos tangenciales, donde las velocidades se suman y restan linealmente, el signo indica que el impulso debe ser efectuado en la dirección del vector velocidad (positivo) o la contraria (negativo). De la misma forma puede demostrarse que para aumentar o disminuir la distancia en el periastro, manteniendo la del apoastro, debe efectuarse la maniobra en el apoastro, f = 180 , también en la dirección tangencial. 308 Maniobras orbitales Capı́tulo 19 Transferencias y encuentros orbitales 19.1 Transferencias orbitales El problema de las transferencias orbitales consiste en el paso de una órbita inicial a otra final que no tiene ningún punto en común con la inicial. Para esta transferencia son necesarios, al menos, dos impulsos v o maniobras. Para ello, elegiremos un punto cualquiera de la órbita inicial y otro de la órbita final, e iremos construyendo una cadena de órbitas de transferencia intermedias de manera que la primera órbita de transferencia pase por el punto elegido de la órbita inicial y un punto de la segunda órbita de transferencia, que cada órbita de transferencia tenga un punto en común con la anterior y con la siguiente y finalmente que la última órbita de transferencia pase por el punto elegido de la órbita final. Cuando el orbitador pase por cada punto en común efectuaremos una maniobra que lo cambie de órbita hasta que se encuentre en la órbita final. Ası́ pues, si hay n órbitas de transferencia efectuaremos n + 1 maniobras. Puesto que podemos elegir cualquier punto en las órbitas inicial y final y un número indeterminado de órbitas intermedias nos encontramos un número infinito de posibilidades de realizar una transferencia, por lo que debemos tener un buen criterio de búsqueda y elección para resolver este problema. El problema de construir la transferencia óptima consiste en elegir, de entre todas las posibles combinaciones de maniobras que pasen de una órbita inicial a una final, aquella que menor coste tenga, teniendo en cuenta que el coste es función de la velocidad caracterı́stica de la transferencia. En muchas ocasiones hay que considerar 310 Transferencias y encuentros orbitales también otro parámetro en este estudio: el tiempo de la transferencia, o tiempo transcurrido entre la primera y la última maniobra. Puede darse el caso de que tengamos una posible transferencia, algo más barata que otra, pero que tenga un tiempo de transferencia considerablemente mayor, lo que puede hacer inviable la misma. Aunque la transferencia entre dos órbitas puede conseguirse siempre mediante dos impulsos, no se puede decir que la velocidad caracterı́stica, o suma de los módulos de los impulsos, sea óptima cuando su número es dos, de hecho, veremos casos en los que se consigue una minimización de esta velocidad aumentando el número de maniobras. Antes de comenzar el estudio de algunas transferencias orbitales, tendremos en cuenta que un impulso tangencial es el que proporciona la mayor variación de la energı́a de la órbita original ya que la energı́a de la órbita depende del cuadrado de la velocidad, y por otro lado vf2 = vi2 + 2 v + 2v i v, nos da una mayor velocidad final cuando v es tangencial. De acuerdo con esto, la mejor forma de aprovechar el impulso suministrado por un cohete es aplicarlo en la dirección del movimiento. La búsqueda de una transferencia óptima es un problema muy complicado que requiere de sofisticadas técnicas matemáticas y que en este momento no está completamente resuelto. Con objeto de ilustrar el problema consideraremos modelos simplificados de transferencias donde los impulsos sean tangenciales y estén efectuados en dos puntos caracterı́sticos de la órbita: el apogeo o el perigeo. En particular estudiaremos el proceso de transferencia entre dos órbitas circulares coplanarias de radios respectivos ri , rf . 19.1.1 Transferencias de Hohmann y bielı́ptica En el año 1925 Hohmann conjeturó que la trasferencia de mı́nimo coste entre dos órbitas circulares es la compuesta de dos impulsos tangenciales realizados en el perigeo y apogeo (o viceversa) de una elipse tangente en estos puntos a las dos órbitas. Este tipo de órbita es la usada por las órbitas GTO que conectan dos órbitas circulares coplanarias, las órbitas LEO y las geoestacionarias y una de las posibles opciones para viajes a planetas. Las figuras 19.1(a) y 19.1(b) muestran las dos posibles situaciones que se pueden presentar según que queramos aumentar o disminuir el radio de la órbita. Supondremos que r1 es el radio de la inicial y r2 es el radio de la órbita final. En el punto M1 se realiza la primera maniobra consistente en un impulso tangencial v1 en el sentido de la velocidad (si queremos aumentar el radio r1 ) o en sentido contrario (si queremos disminuirlo). Tras esta maniobra, la órbita se convierte en una elipse, órbita de Hohmann, en la que M1 es el perigeo (o Transferencias orbitales 311 v1 M2 r2 r1 v1 M1 r2 M1 r1 v2 M2 v2 (a) Aumento del radio orbital. (b) Disminución del radio orbital. Figura 19.1: Transferencia de Hohmann. apogeo), pues al mantener la dirección de la velocidad esta debe ser perpendicular a la dirección radial, pues ası́ ocurre siempre en órbitas circulares, sin embargo, en órbitas elı́pticas este hecho obliga a que el punto sea el perigeo o apogeo. Tras recorrer la mitad de la órbita elı́ptica la segunda maniobra se realizará en el apogeo (perigeo) de la misma M2 , efectuando un impulso tangencial de módulo v2 adecuado para que la nueva órbita sea circular y tenga exactamente el radio r2 deseado. Las condiciones impuestas en el apartado anterior obligan a que la órbita intermedia tenga un valor de la distancia en el perigeo igual al menor de los radios, mientras que la distancia en el apogeo debe coincidir con el mayor. Por ello, suponiendo r1 < r2 se tendrá r1 = a(1 e), r2 = a(1 + e), de donde obtendremos los elementos orbitales de la órbita de transferencia: a= r1 + r2 , 2 e= r2 r 1 . r1 + r 2 (19.1) En el caso de que r1 > r2 tendremos e= r1 r2 , r 1 + r2 por lo que finalmente podremos poner, para cualquier caso e= |r1 r2 | . r 1 + r2 (19.2) 312 Transferencias y encuentros orbitales El tiempo total de duración de la transferencia será igual a la mitad del periodo de la órbita elı́ptica de transferencia, esto es, s s P a3 (r1 + r2 )3 Ttr = =⇡ =⇡ , (19.3) 2 µ 8µ p y llamando P1 = 2⇡ r13 /µ al periodo de la órbita circular de radio r1 se tendrá r (1 + k)3 Ttr = P1 , (19.4) 32 donde hemos llamado k = r2 /r1 a la razón de los radios de las órbitas. Para calcular el coste de la transferencia hemos de calcular los valores de la velocidad antes y después de cada maniobra. La primera pasa de una órbita circular de radio r1 a otra elı́ptica de semieje (r1 + r2 )/2 y una distancia r1 del foco. Ası́ pues s r 2µr2 µ v1 = . (19.5) r1 (r1 + r2 ) r1 La segunda pasa un punto de la misma elipse a una distancia r2 del foco a una órbita circular de radio r2 , luego s r µ 2µr1 v2 = . r2 r2 (r1 + r2 ) Los valores v1 , v2 , ası́ obtenidos, pueden ser positivos o negativos, indicando en este último caso un frenado o disminución de la velocidad. Calcularemos la velocidad caracterı́stica sumándo los módulos de estas cantidades. p Con objeto de quitar las dimensiones de esta cantidad dividiremos por v1 = µ/r1 lo que nos dará v v1 v2 = + , v1 v1 v1 que tras sencillas operaciones podrá ponerse como s s r v 2k 1 2 = 1 + . (19.6) v1 (1 + k) k (1 + k)k La figura 19.2 nos muestra el coste v/v1 de la transferencia en función de k, esto es, de la relación de los radios de las dos circunferencias. Observamos dos comportamientos distintos según k sea menor o mayor que la unidad, esto es, según aumentemos o disminuyamos el radio de la órbita. Cuando disminuimos la órbita por debajo de la mitad del radio inicial el coste se eleva muchı́simo, tendiendo a infinito al tender k a 0. El aumento de k por encima de la unidad supone un aumento del coste hasta un valor máximo 0.5363 que se alcanza enpk = 15.58. A partir de ahı́ el coste va disminuyendo, tendiendo asintóticamente a 2 1 ⇡ 0.41. Transferencias orbitales 313 Esta gráfica permite establecer curiosas conclusiones como que únicamente para valores de 0.49 < k < 3.3 es menos costosa esta trasferencia que un escape, etc. v 1.0 v1 0.8 0.6 0.4 La búsqueda de otro tipo de transferencias entre dos órbitas circulares llevó a estudiar la 0.01 0.1 1 10 100 transferencia bielı́ptica que conecta las dos circulares con tres Figura 19.2: Coste de la transferencia de Hohimpulsos (figura 19.3(a)). El primann en función de la relación de radios (escala mero lleva a una órbita elı́ptica logarı́tmica). cuyo apogeo está a una distancia rb mayor que el radio de la segunda órbita. Desde este punto Mb una nueva maniobra nos lleva a otra elipse cuyo perigeo está exactamente a una distancia r2 . Desde ahı́ la tercera maniobra pone el satélite en la órbita final. 0.2 B H 0.08 0.06 v2 M2 vb M1 rb 0.04 Mb k 20 v1 (a) Transferencia bielı́ptica. 60 100 (b) Diferencia entre el coste de la transferencia bielı́ptica y la de Hohmann para k > 1. Figura 19.3 Analizaremos en la misma forma que antes la velocidad caracterı́stica en función de k y de otro parámetro kb = rb /r. La figura 19.3(b) muestra la diferencia entre la velocidad caracterı́stica en la transferencia bielı́ptica para kb = 2k, y la velocidad caracterı́stica en la transferencia de Hohmann para valores de k mayores que la unidad. Puede comprobarse que la transferencia bielı́ptica es más económica que la de Hohmann cuando k > 13.87. Sin embargo, la diferencia es siempre pequeña, lo que combinado con el hecho de que el tiempo de transferencia es mucho mayor, pues deben recorrerse dos medias elipses, ambas mayores que la de Hohmann, hace que esta mejora del coste no sea útil en la práctica. 314 19.1.2 Transferencias y encuentros orbitales Transferencia óptima en dos maniobras La comparación entre la transferencia de Hohmann y la bielı́ptica nos ha mostrado las peculiaridades del cálculo de transferencias que nunca nos aseguran mejores resultado con el mı́nimo número de maniobras. Sin embargo, si que podremos obtener la transferencia óptima cuando fijamos en dos el número de maniobras y fijamos también el punto donde se realizan. Supondremos una órbita inicial Oi y otra final Of que no tienen ningún punto en común. Buscaremos una órbita de transferencia que conecte un punto cualquiera de la órbita inicial P1 2 Oi , con un punto cualquiera de la órbita final P2 2 Of , de manera que la velocidad caracterı́stica sea mı́nima. El recorrido entre P1 y P2 se realizará por una de las infinitas órbitas de transferencia Ot (x1 , x2 ), que conecta P1 con P2 . La primera maniobra, realizada en el punto P1 , de vector de posición x1 , pasará de una velocidad, X 1 , antes de la maniobra, a X i , después de la maniobra. Si llamamos {u1 , v 1 , n} al sistema orbital de la órbita O1 en P1 podremos poner, por un lado X 1 = R1 u1 + T1 v 1 , y por otro X i = Ri u1 + Ti v 1 + Ni n. De esta forma el v de esta maniobra vendrá dado por q v1 (R1 , T1 ) = (Ri R1 )2 + (Ti T1 )2 + Ni2 . (19.7) La segunda maniobra se realizará en el punto P2 , de vector de posición x2 , donde la velocidad del satélite pasará del valor X f = Rf u2 + Tf v 2 + Nf n, antes de la maniobra, al valor X 2 = R2 u2 + T2 v 2 , después, y donde hemos considerado que {u2 , v 2 , n} es el sistema orbital de la órbita O2 en P2 . El v de la segunda maniobra vendrá dado por q v2 (R2 , T2 ) = (Rf R2 )2 + (Tf T2 )2 + Nf2 . (19.8) Para efectuar la transferencia de mı́nimo coste del satélite desde la órbita inicial Oi a la órbita final Of debemos elegir dos puntos P1 , P2 y una órbita de transferencia Ot (x1 , x2 ) que haga mı́nimo el valor del v = v1 + v2 total. Para hacer esto, partiremos de dos puntos P1 , P2 elegidos y aplicaremos el método de los multiplicadores de Lagrange para minimizar la función v(R1 , T1 , R2 , T2 ) = q q (Ri R1 )2 + (Ti T1 )2 + Ni2 + (19.9) (Rf R2 )2 + (Tf T2 )2 + Nf2 , (19.10) sujeta a las relaciones (11.14, 11.16, 11.18) entre los parámetros (R1 , T1 , R2 , T2 ). Cuando w = 0 deberemos sustituir la restricción (11.18) por la (11.19). Si hacemos un barrido de puntos P1 , P2 de cada una de las dos órbitas y calculamos la velocidad caracterı́stica mı́nima en cada caso podemos comparar estas velocidades mı́nimas y decidir entre que puntos haremos la transferencia. Encuentros orbitales 315 vm w 0 180 360 Figura 19.4: Transferencias entre dos órbitas circulares coplanarias. Para comprobar la validez del método, reproduciremos un resultado clásico de dinámica orbital: la órbita de transferencia de Hohmann. Supondremos dos órbitas circulares coplanarias de radios r1 y r2 . Al ser coplanarias, el triángulo OP1 P2 formado con dos puntos cualesquiera P1 y P2 de las dos órbitas circulares está en el mismo plano que las dos órbitas por lo que la órbita de transferencia estará también en el mismo plano. Además, por ser órbitas circulares el resultado obtenido será idéntico para cualquier elección del punto inicial P1 , dependiendo únicamente del ángulo de transferencia w en lugar de depender de cada una de las anomalı́as de los puntos de salida y llegada. La figura 19.4 representa, a la izquierda, las órbitas de transferencia de velocidad caracterı́stica mı́nima para los distintos valores de w, mientras que a la derecha se representa el valor de vm (w). Como puede observarse el mı́nimo se obtiene para un valor de w = 180 , lo que concuerda con el resultado conocido, enunciado por Hohmann, de que la órbita de transferencia de mı́nimo coste entre dos órbitas circulares coplanarias conecta los dos puntos alineados con el centro de atracción, por medio de una órbita que tiene su periastro y apoastro en estos dos puntos. 19.2 Encuentros orbitales En el apartado anterior se ha analizado la realización de transferencias orbitales que permiten que una nave pase de una órbita inicial a otra final sin ningún punto en común con la primera, sin embargo, no se ha tenido en cuenta en ningún momento en que instante entra la nave en la segunda órbita. Este valor es fundamental cuando no se trata de un simple cambio de órbita, sino que se pretende que la nave alcance otro cuerpo que ocupaba esa segunda órbita. 316 Transferencias y encuentros orbitales Una maniobra del tipo enunciado en el párrafo anterior se llama encuentro espacial 1 y tiene muchas utilidades en Astrodinámica, bien para reunir dos naves, por ejemplo un transbordador espacial y la ISS, o bien para llegar con una nave hasta la Luna o un planeta. Para resolver este problema comenzaremos llamando objetivo, y representándolo por O a la nave o cuerpo que queremos alcanzar e interceptor a la nave que modifica su órbita en busca del objetivo. Tendremos dos posibles estrategias de aproximación: situar el interceptor en la órbita del objetivo en un punto distinto al que ocupa éste y realizar una maniobra de espera del objetivo o bien hacer entrar al interceptor en la órbita del objetivo en el mismo punto que ocupa el objetivo en el instante de entrada. 19.2.1 Maniobra de espera En el primer caso supondremos que ya se ha situado el interceptor en una órbita idéntica a la del objetivo, salvo un valor distinto de la época del paso por el periastro, que hace que interceptor y objetivo estén permanentemente separados en esta órbita. Existen varias estrategias para hacer coincidir ambos cuerpos, aunque describiremos aquı́ una de las más sencillas que consiste en esperar a que el interceptor pase por el periastro y aplicar en ese punto un v tangencial, bien negativo o positivo, que lo sitúe en una órbita de periodo menor o mayor que la órbita del objetivo y esperar a que objetivo e interceptor pasen simultáneamente por el punto común de ambas. O fo I v Sea fo la anomalı́a verdade- Figura 19.5: Órbita de espera del interceptor I ra del objetivo en el instante TI para alcanzar el objetivo O. Caso en que se acorta de paso por el periastro del inter- el periodo del interceptor. ceptor (ver figura 19.5). Una vez obtenido fo podremos calcular el tiempo relativo de O en ese punto t = to TO , es decir el tiempo que ha tardado O en pasar del periastro al punto de anomalı́a fo . A partir de ese instante el tiempo que tardará en pasar por el periastro de nuevo será nO PO t, siendo nO el número de pasos. Si el interceptor realiza una maniobra tangencial en el periastro, llegará a un periodo orbital PI de forma que los pasos sucesivos por el punto donde se ha 1 En inglés space rendezvous. Encuentros orbitales 317 realizado la maniobra se efectuarán en los instantes nI PI , siendo nI el número de vueltas. Si han pasado nO vueltas del objetivo y nI del interceptor antes de pasar simultáneamente por el punto común de las dos órbitas, el tiempo transcurrido será el mismo, por lo que se cumplirá la relación nO PO t = nI PI , de la cual podemos deducir n P t PI = O O . (19.11) nI El objetivo es encontrar un valor PI , compatible con el problema, a partir de dos número enteros positivos cualesquiera nO , nI . Para comprobar la idoneidad de PI habrá que deducir, a partir de él, el semieje mayor de la nueva órbita, y puesto la distancia en el periastro rp se mantiene, calcular a partir de a y rp el valor de la excentricidad e. Aunque nO , nI pueden ser elegidos arbitrariamente, con la condición de que los valores calculados de a, e sean correctos, es conveniente comprender el significado de ambos valores para una elección adecuada. El parámetro clave es nI . Cuanto mayor sea nI menor será el v, por lo que el coste será menor, sin embargo el tiempo de espera para el encuentro será mayor. Hemos planteado esta maniobra en el periastro, pero se puede plantear de forma similar desde el apoastro. En este caso hay que añadir una condición adicional, pues si la maniobra exige acortar el periodo esto implicará acortar la distancia rp en el periastro, que debe ser siempre mayor que el radio del planeta situado en el foco de las dos órbitas. En el caso más simple de que la órbita objetivo sea circular no existe periastro ni apoastro, por lo que la maniobra se puede realizar desde cualquier punto por igual. Hay que tener en cuenta que en este caso si se acorta el periodo debe comprobarse el nuevo valor de rp pues en este caso el punto de la maniobra actúa de apoastro de la nueva órbita. 19.2.2 Encuentro directo en transferencias generales El encuentro directo consiste en encontrar la órbita de transferencia entre dos órbitas dadas añadiendo la condición de que la posición del orbitador y del interceptor deben coincidir en el instante que la órbita de transferencia se cruza con la órbita final. Esta condición introduce mayor complejidad al problema de las transferencias, pues a la condición de minimizar el v añade otra nueva condición que fija el tiempo de tránsito en la órbita de transferencia. Siempre es útil contar con una solución inicial del problema, aunque la que vamos a dar en primer lugar no será, en general, la óptima. 318 Transferencias y encuentros orbitales Llamemos OI a la órbita del interceptor y OO a la del objetivo. Supondremos que en el insIf tante ti el interceptor se encuenOf tra en el punto xI = P Ii de xO OI y el objetivo se encuentra en P xO = P Oi de OO . En ese insOt xI tante queremos realizar una maOI niobra que pase el interceptor a una órbita de transferencia Ot . Ii OO que tenga un punto de intersección con la órbita objetivo OO , y Oi que éste se alcance al cabo de un tiempo t de manera que en el instante tf = ti + t tanto el in- Figura 19.6: Encuentro espacial entre dos órbitas terceptor como el objetivo coin- cualesquiera. cidan en el punto xO = P Of . Para encontrar la órbita de transferencia basta tener en cuenta que en el instante tf se debe verificar también que xO = P If , es decir, éste debe ser el punto de la órbita de transferencia que se alcanza en tf . Ası́ pues, el problema consiste en resolver el problema de Lambert que encuentre la órbita kepleriana que une xI con xO en un tiempo t. Obviamente la eficiencia de esta transferencia estará en función de una buena elección de el punto xI y de t. 19.2.3 Encuentros en transferencias de Hohmann Oe Oi P ✓ O I I N El problema de los encuentros espaciales desde órbitas distintas se simplifica, al igual que el de las transferencias, cuando las órbitas OI y OO son circulares y coplanarias. En este caso realizaremos una transferencia de Hohmann, puesto que sabemos que es la óptima, ahora bien, puesto que esta transferencia se puede iniciar desde cualquier punto de la órbita inicial, por ser esta circular, esperaremos a que la posición relativa inicial de I y O sea la adecuada para su encuentro. Para ver cual es ese punto es conveniente cambiar el sistema de referencia y pasar a otro cuyo plano sea el de Figura 19.7: Sistema sinódico P IO. Encuentros orbitales 319 la órbita, caracterizado por el vector n común en la órbita del objetivo y del interceptor, cuyo eje Ox sea la dirección del interceptor, es decir, la del vector P I. A este sistema le llamaremos sistema sinódico y es el utilizado para estudiar los movimientos geocéntricos de los planetas. La posición del objetivo O, en este sistema, quedará caracterizada por el ángulo ✓ de la figura 19.7. Obsérvese que en esta figura se han representado los dos posibles casos según que la órbita del objetivo tenga un radio menor (Oi ), o mayor (Of ) que la del interceptor. Si xI (t) representa la posición del interceptor en su órbita en cada instante, y xO (t) la del objetivo, el ángulo ✓, que puede tomar cualquier valor en [0, 2⇡), se podrá obtener aplicando la relación (1.25), es decir: ✓(t) = atan [xI (t) · xO (t), n · (xI (t) ⇥ xO (t))] . (19.12) Por otro lado, los ángulos I , O que representan, respectivamente, la posición de I y O respecto de una dirección fija P N , se podrán poner como I = nI (t TI ), O = nO (t TO ), siendo nI , nO , los movimientos medios de las órbitas OI y OO . Por tanto, el valor de ✓ = O se pondrá también como I ✓ = nS (t TS ), (19.13) donde nS = nO nI es la velocidad angular constante del movimiento de O en el sistema sinódico. Observemos que, cuando el objetivo, Oi , tiene un radio menor que el interceptor, se tendrá nO > nI , por lo que nS > 0, y por tanto el ángulo ✓ será creciente, es decir, el objetivo se moverá respecto al interceptor en sentido directo. Cuando el objetivo, Oe , tiene un radio mayor que el interceptor el ángulo ✓ será decreciente, es decir el objetivo se moverá en sentido retrógrado respecto al interceptor. El movimiento de O en el sistema sinódico tiene un periodo S, que llamaremos periodo sinódico, que representa el periodo en el cual se repiten todas las configuraciones posibles de los tres puntos P, I, O. El punto óptimo para realizar la tranferencia, que vendrá caracterizado por un valor del ángulo ✓, se repetirá cada periodo sinódico, por lo que este juega un importante papel en la navegación espacial. Para encontrar el periodo sinódico basta tener en cuenta la relación entre movimiento medio y el periodo, n = 2⇡/P , que añadida a las relaciones entre nS , nO y nI , junto con la condición de que el periodo tiene que ser positivo, nos dará la expresión 1 1 1 = . (19.14) S PO PI 320 Transferencias y encuentros orbitales Por último buscaremos el ángulo ✓IO , que forma el objetivo con el interceptor en el instante adecuado, para que la transferencia de Hohmann haga coincidir ambos en el punto final de esta transferencia. Las figuras 19.8(a) y 19.8(b) nos muestran las dos situaciones posibles según que el interceptor tenga un radio menor (figura 19.8(a)) o mayor (figura 19.8(b)) que el objetivo. Oi ✓IO If Of P Oi ✓IO Ii Ii (a) Aumento del radio orbital. P If Of (b) Disminución del radio orbital. Figura 19.8: Encuentro desde una transferencia de Hohmann. En ambos casos el tiempo de tránsito Ttr del interceptor desde Ii a If vendrá dado por (19.3). Durante ese tiempo el ángulo recorrido por el objetivo es igual a nO Ttr , y este ángulo es igual a ⇡ ✓IO si el objetivo tiene un radio mayor, e igual a ⇡ + ✓IO si lo tiene menor. Ası́ pues se tendrá: ✓IO = 8 > > > > ⇡ > > < nO Ttr > > > > > > : nO Ttr ⇡ = = ⇡ 1 ⇡ nO nO s s (rI + rO )3 8µ (rI + rO ) 8µ 3 ! ! , 1 , rI < rO , (19.15) rI > rO . Únicamente cuando el ángulo ✓, dado por (19.12), alcance el valor ✓IO se podrá realizar la maniobra que permita este encuentro. Esta posición se repetirá cada periodo sinódico, representando también el periodo sinódico el máximo tiempo de espera necesario para poder realizar esta transferencia. Para encontrar el tiempo de espera hasta realizar un encuentro de estas caracterı́sticas basta conocer el valor del ángulo ✓ y tener en cuenta la relación ✓ = nS (t TS ) de la cual obtendremos el tiempo de espera hasta el comienzo de Viaje a Marte en una órbita de transferencia de Hohmann 321 la primera maniobra que será t= ✓ ✓IO nS . Finalmente, sumando a t el tiempo Ttr de la transferencia se obtiene el tiempo de espera hasta el encuentro espacial. 19.3 Viaje a Marte en una órbita de transferencia de Hohmann Para ilustrar lo visto hasta aquı́ efectuaremos el estudio de un viaje a Marte tripulado, lo que exige realizar tanto el viaje de ida como el de vuelta. Los resultados que obtendremos pueden ser fácilmente extrapolados a cualquier otro tipo de transferencia de Hohmann entre planetas. Para comenzar supondremos un modelo simplificado en el que tanto la Tierra como Marte tienen órbitas circulares y coplanarias. Los radios respectivos de dichas órbitas son 1 y 1.524 U.A. lo que nos da unas velocidades orbitales de 29.785 km/s para la Tierra y 24.130 km/s para Marte. Aplicando la relación (19.5) deducimos que el v necesario para entrar en una órbita de Hohmann hacia Marte es de 2.945 km/s. Para que la nave entre en la órbita de transferencia de Hohmann, que es una órbita que tiene el Sol como cuerpo central, debe salir de la atracción gravitacional de la Tierra. En el capı́tulo siguiente analizaremos las fases de una misión interplanetaria que incluyen, para nuestro viaje, una salida de la Tierra en una órbita hiperbólica y una entrada en Marte. Por el momento baste decir que para conseguir el v indicado en el párrafo anterior es necesario aplicar a la nave un v = 3.656 km/s desde una órbita de aparcamiento en la Tierra. La duración de la órbita de transferencia, hasta la llegada de la sonda a las proximidades de Marte, viene dada por (19.3), lo que nos da un valor para el caso de Marte de unos 258 dı́as o 0.7087 años. Hemos despreciado, por ser muy pequeños en comparación con el de la transferencia, el tiempo hasta que la nave sale de la atracción gravitacional terrestre y el tiempo de aproximación a Marte desde que entra en su esfera de influencia gravitacional. Para una misión tripulada debemos traer de regreso la nave lo que exige otra órbita de Hohmann de la misma duración entre Marte y la Tierra. Sin embargo, como se ha visto en el capı́tulo anterior la entrada en una órbita de Hohmann debe realizarse en un instante preciso de la configuración Sol-Tierra-Marte para que la nave llegue al final de su viaje en el momento en que llega el planeta. Esto obliga a alargar la misión para esperar en Marte a que la configuración de los planetas sea adecuada para el regreso a la Tierra. Para analizar la duración exacta de este viaje observaremos la figura 19.9 donde se han representado las distintas fases del mismo. 322 Transferencias y encuentros orbitales La expresión (19.14) nos da un perı́odo sinódico del planeta Marte de unos 780 dı́as (2.14 años), luego la ventana de lanzamiento a una órbita de Hohmann se repite cada poco más de dos años. M3 Las relaciones (19.15) nos dan M2 la posición relativa que deben tener la Tierra y Marte para co- M4 menzar las dos órbitas Hohmann de la misión. En efecto ✓T M = ⇡ nM Ttr = 44. 34, ✓M T = nT Ttr ⇡ = 75. 14. M1 T1 T4 T3 T2 Comienza el viaje en el instante t1 = 0 en el que la Tierra está en T1 y Marte en M1 y el Figura 19.9: Viaje de ida y vuelta a Marte en una transferencia de Hohmann. ángulo entre ambos es ✓T M . En ese momento comienza la primera órbita de transferencia que lleva la sonda al punto M2 donde está Marte en t2 = Ttr . En ese instante la Tierra está en T2 . En lo que sigue llamaremos M = nM (t TM ), T = nT (t TT ), (19.16) a las posiciones angulares de Marte y la Tierra en un instante t cualquiera. Si tomamos como origen de ángulos la dirección de la Tierra en el instante t1 = 0 se podrá poner M = nM (t1 TM ) = ✓T M , T = nT (t1 TT ) = 0, de donde se deduce que TM = ✓T M /nM , TT = 0. Con estos valores y la expresión (19.16) encontramos que las posiciones angulares de Marte y la Tierra en t2 = Ttr son M = 180 , T = 255. 138, que nos da una diferencia angular de 284. 862 que no permite la inserción en una órbita de regreso. La relación (19.13) nos da el valor del ángulo relativo entre Marte y la Tierra. Si particularizamos esta relación para el instante t2 obtenemos TS , valor que posteriormente utilizaremos para ver el tiempo que debe transcurrir hasta el instante t3 en que el ángulo toma el valor ✓M T que permite el comienzo de la segunda maniobra de Hohmann. Este valor nos da un tiempo de espera te que resulta ser te = 1.24403 años. Por tanto, la tercera parte del viaje comienza en el instante t3 = te + Ttr en el que Marte está en M3 y la Tierra en T3 . El viaje termina en el instante t4 = t3 + Ttr , esto es, después del tiempo de la transferencia de Hohmann cuando la sonda llega a la Tierra, que está en T4 y Marte se encuentra en M4 . De esta forma la misión ha durado un tiempo igual a te + Ttr = 2.661 años. Capı́tulo 20 Navegación interplanetaria 20.1 Sondas espaciales En los capı́tulos anteriores se ha estudiado el movimiento de los satélites artificiales terrestres, aunque las ideas y conceptos establecidos son fácilmente exportables a cualquier otro tipo de nave orbitando en torno a un planeta o un satélite natural como la Luna. Estos vehı́culos seguirán siendo llamados satélites artificiales. Distinguiremos los satélites artificiales, que siempre permanecen en órbita elı́ptica alrededor de un planeta, de las naves que realizan un viaje entre cuerpos distintos del sistema solar. A estos vehı́culos les llamaremos sondas espaciales. La caracterı́stica fundamental de las sondas espaciales es que no permanecen siempre dentro del campo gravitacional de un único cuerpo, sino que durante su viaje van cambiando de foco de atracción. Un viaje de la Tierra a la Luna podrá ser considerado inicialmente como un viaje en órbita alrededor de la Tierra, con la correspondiente perturbación orbital producida por la Luna. Cuando la sonda se acerque lo suficiente a la Luna el problema kepleriano cambiará, pues a partir de ese instante el foco principal de atracción gravitacional pasará a ser la Luna pasando la sonda a orbitar en torno a la Luna con una perturbación que le producirá la presencia de la Tierra. Un viaje de la Tierra a Marte resulta más complejo pues a lo largo de dicho viaje la sonda podrá considerarse como atraı́da por la Tierra y Marte, cuando esté suficientemente próxima a dichos planetas, y atraı́da por el Sol durante el resto del viaje. 324 Navegación interplanetaria Una aproximación rigurosa a estos recorridos debe obtenerse a partir de una formulación del problema de n cuerpos, pues la sonda es atraida gravitacionalmente por todos y cada uno de los astros del sistema solar. Únicamente métodos numéricos que integren dicho problema nos darán una descripción precisa del movimiento. Sin embargo, en la fase de diseño de la misión, que debe ser establecida con todo detalle mucho antes del lanzamiento de la nave, podemos aprovecharnos del hecho que aprendimos al estudiar el modelo de n cuerpos y que establece que en las proximidades de un planeta la atracción gravitacional del resto de los cuerpos del sistema solar resulta ser una pequeña perturbación sobre el modelo kepleriano formado por el planeta y la sonda. La primera fase de estudio y diseño de este tipo de misiones consiste en despreciar esta perturbación y estudiar la órbita completa como una sucesión de segmentos de órbitas keplerianas que se unen en los puntos en que deja de actuar como foco un cuerpo y otro pasa a ser el foco principal. Puesto que las órbitas keplerianas son cónicas, a las órbitas usadas en la navegación planetaria se les llama cónicas enlazadas. El punto donde la órbita cambia de cónica por pasar a depender de otro foco atractor será estudiado en el apartado siguiente. Cuando se estudia la órbita de una sonda interplanetaria deben considerarse también los cambios de sistema de referencia debidos a las caracterı́sticas de los distintos focos de atracción. Ası́, las órbitas de satélites artificiales están siempre referidas a un sistema ecuatorial por ser éste el que mejor se adapta al movimiento de la Tierra. Sin embargo, las órbitas de los cuerpos del sistema solar se dan siempre en el sistema de coordenadas eclı́pticas lo que debe tenerse muy presente en la fase de estudio de la misión. Debe recordarse también que el eje de rotación de cada planeta no es paralelo al de la Tierra, o lo que es igual, el plano de su ecuador no coincide con el del ecuador terrestre. Esto hay que tenerlo presente cuando el objetivo final de la nave sea orbitar en torno al planeta o la Luna en cuyo caso deben usarse las expresiones de la rotación al sistema planetográfico. En lo que sigue comenzaremos el estudio de las trayectorias interplanetarias desde una órbita de aparcamiento en torno a la Tierra, esto es, una órbita circular baja. Analizaremos, de forma elemental, los pasos que debemos seguir para situar dicha sonda en las proximidades de otro cuerpo del sistema solar. Anteriormente veı́amos que las maniobras de cambio de plano eran, en general, enormemente costosas por lo que, de aquı́ en adelante, supondremos el sistema solar coplanario y la órbita inicial situada con la inclinación y ángulos del nodo adecuados obtenidos directamente en la fase de lanzamiento. Estudiaremos como realizar un viaje interplanetario sin realizar más maniobras que la inyección inicial realizada desde la órbita de aparcamiento para poner la sonda en la ruta interplanetaria. Para modificar la cónica y poner las naves en órbita en torno a los planetas se usarán los cambios en la velocidad de la nave producidos por la aproximación de la nave a los distintos planetas que, como veremos, modifican la velocidad, produciendo un efecto equivalente a las maniobras orbitales en los satélites artificiales. Esfera gravitacional de influencia 20.2 325 Esfera gravitacional de influencia Para comprender las rutas interplanetarias, formadas por cónicas enlazadas, será preciso determinar a partir de que punto podemos considerar que una sonda no depende de la atracción gravitacional de un cuerpo y pasa a depender de otro. Esta región del espacio será aproximadamente una esfera alrededor del foco atractor. Existen dos tipos de esferas gravitacionales que no serán consideradas aquı́ por su falta de interés práctico. Por un lado las esferas de Hill que se corresponden con la zona del problema restringido alrededor de los primarios donde está confinado el movimiento de satélite para determinados valores de la integral de Jacobi. Por otro lado se tiene la esfera de gravitación que está determinada por el lugar geométrico de los puntos donde se iguala la atracción gravitacional de los primarios. Para definir con mayor precisión la región que represente el punto donde acaba la atracción gravitacional pensemos en los dos problemas. Por un lado un viaje Tierra-Luna y por otro un viaje Tierra-Planeta (para cualquier planeta). Sobre una nave próxima a la Tierra aparece la perturbación Luni-Solar que puede crecer, en función de la posición relativa del Sol y la Luna, cuando la nave se aleja de la Tierra. Hasta la distancia de la Luna la perturbación que produce el Sol continua siendo pequeña por lo que en este caso el Sol no podrá ser tomado como foco atractor en ningún momento en el viaje entre la Tierra y la Luna. Sin embargo, cuando la nave se acerque a la Luna la atracción de ésta crecerá hasta hacerse mayor que la debida a la Tierra. El modelo adecuado en este caso es el del problema restringido de tres cuerpos con la Tierra y la Luna como primarios y la Tierra como astro principal. Pensemos ahora en un viaje entre dos planetas. En las proximidades del primer planeta el Sol ejerce un efecto perturbador de tercer cuerpo que aumenta a medida que la nave se aleja del planeta, sin embargo, durante ese periodo el efecto del segundo planeta es despreciable. Durante el periodo intermedio es el Sol el que ejerce de astro principal. Para ver cuando uno de los planetas es el foco primario debemos considerar de nuevo el problema restringido, los dos primarios serán el Sol y el planeta, mientras que la nave será el tercer cuerpo de masa despreciable. En ambos casos tenemos un sistema con dos primarios P0 , P1 , de masas m0 m1 , y el terx0 x1 cer cuerpo S de masa despreciaP0 P1 ble. Tal como vemos en la figura ↵1 ↵0 r 20.1 llamaremos xo = P0 S, x1 = P0 S, r = P0 P1 de forma que las Figura 20.1: Posición relativa de la sonda S resecuaciones (13.14), (13.15) se especto de los planetas P0 , P1 . cribirán como ✓ ◆ x0 x1 r ẍ0 = µ0 3 µ1 + , (20.1) r0 r13 r3 S 326 Navegación interplanetaria ẍ1 x1 µ1 3 r1 = µ0 ✓ x0 r + 3 r03 r ◆ , (20.2) donde ri = k xi k, µi = Gmi , i = 0, 1. Las ecuaciones (20.1), (20.2) se pueden poner como ẍ0 = K0 + P 0 , (20.3) ẍ1 = K1 + P 1 , (20.4) donde Ki representa la fuerza de atracción kepleriana de Pi sobre S y P i la perturbación que produce P(1 i) . Se usará una u otra ecuación según el valor relativo de la fuerza de atracción kepleriana de cada cuerpo y la perturbación producida por el otro, para ello consideraremos el cociente k P (1 i) k/k K(1 i) k, i = 0, 1, que será "✓ ◆2 #1/2 2 1/2 r(1 k P (1 i) k xi r mi 2 1 1 xi · r i) = µi + = r + + 2 k K(1 i) k µ(1 i) ri3 r3 m(1 i) (1 i) ri4 r4 ri3 r3 1/2 ⇣ r ⌘4 ⇣ r ⌘2 mi r(1 i)2 i i = 1 + 2 cos ↵ . i m(1 i) ri2 r r (20.5) Supondremos que el astro de menos masa P1 es el foco de atracción del problema cuando la relación entre la fuerza perturbadora y la atracción kepleriana sea menor que para P0 , es decir cuando k P 1 k/k K1 k < k P 0 k/k K0 k, o lo que es igual cuando k P 0 k/k K0 k = > 1. k P 1 k/k K1 k Si consideramos las dos expresiones (20.5) para i = 0, 1, llamamos i = ri /r y observamos que, de acuerdo con las propiedades del triángulo de la figura 20.1, se tiene que r = r0 cos ↵0 + r1 cos ↵1 , podremos poner s m21 04 1 + 14 2 12 cos ↵1 = 2 4 . m0 1 1 + 04 2 0 (1 1 cos ↵1 ) Expresando 0 en términos de 1 , a partir del teorema del coseno aplicado al triángulo de la figura 20.1, tendremos que 02 = 1 + 12 2 cos ↵1 . Llevando a la expresión anterior y desarrollando en serie de potencias de 1 se obtendrá m2 1 1 = 12 5 p + O( 1 ) . m0 1 1 + 3 cos2 ↵1 Puesto que 1 debe ser muy pequeño cuando la fuerza de atracción de P1 sea dominante, la condición > 1 se podrá poner como 5 1 < m21 1 m21 p < . 2 m0 1 + 3 cos2 ↵1 m20 Salida del campo gravitacional de un planeta 327 La condición anterior indica el instante a partir del cual podemos considerar que el foco del problema deja de ser el astro principal P0 y pasa a ser P1 . Puesto que 1 = r1 /r la condición anterior representa una esfera de radio r1 = r ✓ m1 m0 ◆2/5 , (20.6) que se llamará esfera de influencia. En el caso del sistema Tierra-Luna, la esfera de influencia de la Luna, que indica cuando las sondas espaciales están dentro del campo gravitacional de la Luna, tiene unos 66000 km de radio. La esfera de influencia de la Tierra en el sistema Sol-Tierra tiene un radio de 924000 km, lo que incluye a la propia Luna que se puede considerar dentro del campo gravitacional terrestre. La esfera de influencia de Marte en el sistema Sol-Marte tiene un radio de 378000 km. 20.3 Salida del campo gravitacional de un planeta Tanto el proceso de alejamiento de un planeta como el de aproximación al mismo, que será estudiado en el siguiente apartado, deben ser analizados dentro de la esfera de influencia del planeta que determina la región lı́mite a partir de la cual supondremos que la gravedad del planeta no afecta a la órbita del mismo en torno al Sol1 . La primera operación a realizar para navegar de un planeta del sistema solar a otro es la salida del campo gravitacional del primero. Supondremos que la sonda se libera de la atracción de la gravedad del planeta cuando sale fuera de la esfera de influencia en una órbita hiperbólica respecto al mismo. De esta forma nos aseguramos que el la sonda no tiene un movimiento periódico que la hace regresar al planeta. En la aproximación al modelo real, formada por cónicas enlazadas, supondremos además que el radio de la esfera de influencia del cuerpo atractor puede ser considerado infinitesimal si se compara con el radio de su órbita e infinitamente grande comparada con el radio del cuerpo. Supondremos que la sonda se encuentra inicialmente en una órbita de aparcamiento alrededor del planeta. Esta órbita es una órbita baja y circular situada en un plano adecuado obtenido en el proceso de lanzamiento. La maniobra para alejar la nave del planeta consiste en un empuje tangencial en un punto adecuado de la órbita de aparcamiento que lo inserte en una órbita hiperbólica (figura 20.2) que cortará en algún punto la esfera de influencia del planeta. 1 Aquı́ excluimos los viajes a la Luna. 328 Navegación interplanetaria La hipótesis anterior, que supone que la esfera de influencia tiene radio infinito respecto del radio del planeta, determina que la velocidad de la nave al cruzar la esfera de influencia lleva la dirección de la ası́ntota a la hipérbola y su norma coincide con la velocidad residual. A dicha velocidad, expresada con respecto a un sistema inercial con centro en el planeta, le llamaremos v1 . v1 xSOI rSOI ra fSOI T fA v A Puesto que las velocidades circular y parabólica, de una órbita kepleriana a una distancia r del centro de masas p del planeta, p vienen dadas por µ/r y 2µ/r Figura 20.2: Salida del campo gravitacional de respectivamente, el v necesario un planeta. para obtener la órbita parabólica p p desde un punto de la órbita de aparcamiento verificará v > ( 2 1) µ/ra , siendo ra el radio de la órbita de aparcamiento. 2 Por otro lado, la relación v1 = µ/a nos dice que para conseguir una velocidad v1 , cuando la sonda alcance el lı́mite de la esfera de influencia, el semieje de la órbita hiperbólica de salida debe ser a= µ . 2 v1 (20.7) Además, puesto que el impulso es tangencial en una órbita circular y la nueva órbita es hiperbólica el punto de la maniobra es el periastro de la nueva órbita, por tanto ra = a(e 1), de donde obtenemos finalmente que e= 2 v1 ra + 1. µ (20.8) El valor de v podrá ser calculado exactamente si tenemos en cuenta que pasamos de una órbita circular vc2 = µ/ra a una hiperbólica vh2 = µ(2/r + 1/a) = 2 2µ/r + v1 , por lo que obtendremos finalmente: r r 2µ µ 2 v= + v1 . (20.9) ra ra Una vez conocido el valor del v debemos averiguar en que punto de la órbita de aparcamiento debe efectuarse la maniobra, para lo cual consideraremos que el Entrada en el campo gravitacional de un planeta 329 punto de la esfera de influencia de radio rSOI se alcanza cuando rSOI = a(e2 1) , 1 + e cos fSOI o lo que es igual en un punto que forma un ángulo ✓ ◆ 1 a(e2 1) fSOI = acos 1 , e rSOI con la dirección del punto de salida. Para ser coherentes con la hipótesis de partida podemos suponer que rSOI = 1 lo que nos da un ángulo ✓ ◆ 1 fA = acos , (20.10) e que coincide con la dirección de la ası́ntota. Sustituyendo el valor de fA en (18.24), que representa el ángulo entre la dirección radial y la del vector velocidad expresado en términos de e y f , se obtiene que = 0, lo que indica que la dirección del vector velocidad al final de la maniobra lleva la dirección radial (del planeta a la sonda). A partir del instante en que la sonda sale de la esfera de influencia la órbita será considerada como una órbita alrededor del Sol. En estas condiciones el parámetro µ cambia, pues en la órbita alrededor del planeta valı́a µ = µP = GmP , mientras que la órbita solar vale µ = µ = Gm . La hipérbola inicial se enlazará en ese momento con la cónica que la sonda recorra alrededor del Sol. Esta nueva órbita se obtendrá partiendo de las condiciones iniciales, posición y velocidad en ese instante, que vendrán dadas por x =r , X = v + v1 , (20.11) donde r , v representan la posición y velocidad del planeta respecto del Sol y donde además se ha despreciado la posición de la sonda xSOI respecto del planeta. 20.4 Entrada en el campo gravitacional de un planeta La entrada en el campo gravitacional de un planeta coincide con el instante en el que la sonda entra dentro su esfera de influencia. Como veremos en este apartado, esta entrada puede dar lugar a tres tipos distintos de comportamientos que dependen del la dirección y la norma del vector velocidad de la sonda relativo al planeta en el momento de la entrada en la esfera de influencia. Para estudiar el proceso que sigue a la entrada de la sonda en el campo gravitacional, o la esfera de influencia, supondremos que esta entrada se realiza de 330 Navegación interplanetaria acuerdo con las caracterı́sticas de la figura 20.3 donde vemos que la velocidad forma un ángulo ↵ 2 [0, ⇡/2] con la dirección radial de la sonda desde el planeta dada por u. Situando el vector n que define el plano orbital hacia arriba del plano impedimos que ↵ sea mayor que ⇡, haciendo que los valores de ↵ en el intervalo (⇡/2, ⇡) correspondan a una salida de la esfera de influencia en lugar de una entrada. Si llamamos v = n ⇥ u podemos definir el sistema orbital de la sonda respecto al planeta, que comienza en ese punto. En este sistema los vectores de posición y velocidad inicial en el instante de la entrada se podrán poner como xP = r u, X P = v cos ↵ u + v sen ↵ v, donde r es el radio de la esfera de influencia y v la norma del vector velocidad de la sonda relativo al planeta. v v ↵ P u xSOI S El algoritmo visto en el capı́tulo 9 permite obtener los elementos orbitales de la nueva órbita a partir de la posición y velocidad anteriores. A partir de Figura 20.3: Condiciones de entrada de una sonlos vectores momento angular y da en la esfera de influencia de un planeta. de Laplace podemos determinar el semilado recto p y la excentricidad e y, con éstos, la distancia en el periastro rp = p/(1 + e). Hemos realizado este estudio tomando unos valores de r = 1, µ = 1 que generalizan los resultados para cualquier caso sin más que cambiar la unidad de longitud para hacerla igual al radio de la esfera de influencia y la unidad de tiempo que haga µ = 1. La figura 20.4 muestra las curvas de nivel de la función e = e(↵, v) que nos da la excentricidad en función de el ángulo ↵ y de v. En dicha figura el eje Ox representa el ángulo ↵, mientras que el eje Oy representa la velocidad v. El valor v = 1.41, que representa la velocidad de escape para r = 1, separa dos regiones del espacio fásico, la zona inferior de la figura representa órbitas elı́pticas mientras que la superior representa órbitas hiperbólicas. La excentricidad aumenta en la zona inferior conforme la curvas se desplazan a la izquierda, mientras que en la zona superior las curvas más altas representan excentricidades mayores. Por otro lado hemos representado en la misma figura la curva rp (↵, v) = RP , donde rp es la distancia en el periastro de la nueva órbita y RP el radio del planeta. Esta curva separa la figura en otras dos zonas que representan las órbitas para las cuales el radio del planeta es mayor o menor que la distancia en el periastro. Entrada en el campo gravitacional de un planeta 331 Si el radio del planeta es mayor que rp se produce una colisión de la sonda con el planeta. 3 Ası́ pues, la figura 20.4 nos muestra los tres posibles casos: 1 1. Colisión de la sonda con el planeta (zona oscura). 2 1 2. Entrada en una órbita elı́ptica (periódica) de captura de la sonda. 2 3. Entrada en una órbita hiperbólica en la que se realiza una aproximación entre la sonda y el planeta a partir de la cual ésta vuelve a alejarse hasta que sale de nuevo de la esfera de influencia alejándose de la atracción del planeta. 3 0 0 0.5 1 1.5 Figura 20.4: Gráfica de contorno de la excentricidad de la órbita de entrada en un planeta en función del ángulo (eje Ox) y de la velocidad (eje Oy). Estos tres casos se ilustran en la figura 20.5 con tres ejemplos de los tres tipos de órbitas. O1 representa una órbita de colisión, O2 una órbita de captura y O3 una órbita de aproximación. En el perigeo de una órbita elı́ptica del tipo O2 podemos realizar una maniobra para reducir el semieje de esta órbita, o bien, si el planeta tiene una atmósfera suficientemente densa y la distancia en el perigeo adecuada realizar un aerofrenado, esto es, disminuir el semieje usando el frenado atmosférico. Una maniobra adecuada, efectuada en el instante preciso, permite también la captura de la sonda por el planeta desde las órbitas de colisión y de aproximación. O2 O3 O1 Las órbitas de aproximación tienen una gran utilidad astrodinámica porque constituyen un Figura 20.5: Tres tipos de órbitas de entrada en método muy barato de modificar la esfera de influencia de un planeta la velocidad de la nave utilizando la gravitación del planeta en una maniobra llamada asistencia gravitacional que estudiaremos en el siguiente apartado. 332 20.5 Navegación interplanetaria Impulso gravitacional Para reducir el coste de las maniobras necesarias para un viaje interplanetario puede usarse la órbita de aproximación a un planeta con objeto de conseguir una variación de la velocidad, o impulso, basado en la geometrı́a de la órbita hiperbólica de aproximación. Dicho impulso será llamado impulso gravitacional. La figura 20.6 muestra lo que ocurre cuando entramos en la esfera de influencia del planeta con una velocidad v e1 de norma v1 y dirección la de la ası́ntota de entrada. v s1 ⌫ La órbita seguida por la sonda pasa muy cerca del planeta a una distancia en el periastro de rP y llega de nuevo al lı́mite de la esfera de influencia con una velocidad v s1 que tiene la misma norma que v e1 y forma con ella un ángulo ⌫. rp v e1 Relacionando la figura 20.6 con la 20.2 podemos comprobar que = ⇡ fA , de donde, a par- Figura 20.6: Hipérbola de aproximación al platir de (20.10), podemos deducir neta. que ⌫/2 = fA ⇡/2 y finalmente ⌫ 1 = . 2 e Por otro lado, la expresión (20.8) se pondrá ahora sen e= 2 v1 rp + 1, µ donde el hemos sustituido ra por la distancia rp en el periastro. De esta forma podremos poner también ⌫ µ . (20.12) sen = 2 r 2 µ + v1 p La figura 20.7 representa la variación de la velocidad en el impulso gravitacional, para ello tengamos en cuenta que si v e1 , v s1 son la velocidad de entrada y salida de la sonda respecto al planeta, estas velocidades referidas al Sol se pondrán como X i = v P + v e1 , X f = v P + v s1 , (20.13) donde v P representa la velocidad del planeta respecto del Sol y X i , X f las velocidades inicial y final de la sonda al entrar y al salir de la esfera de influencia en la órbita de aproximación al planeta. Impulso gravitacional 333 v Xf v s1 El impulso obtenido con esta maniobra será v e1 . ⌫ ve (20.14) 1 Una simple inspección de la vP figura 20.7 permite deducir que basta cambiar la geometrı́a de la hipérbola para conseguir distintos impulsos, tanto en norma como en dirección. La situación del Figura 20.7: Impulso gravitacional. plano de la órbita hiperbólica tiene también una gran importancia en la dirección del impulso gravitacional, sin embargo, esto no será analizado en el presente libro. Xi Para conocer el valor de ( v)2 = (v s1 v = Xf X i = v s1 v tendremos en cuenta que 2 v e1 )2 = 2v1 2 2 2v1 cos ⌫ = 4v1 sen2 ⌫ , 2 por lo que aplicando (20.12) obtenemos v = 2v1 sen ⌫ 2 v1 µ = . 2 r 2 µ + v1 p Estudiando el Delta uve como función p de v1 podemos deducir fácilmente que tiene un máximo para el valor v1 = µ/rp . Un estudio para los diferentes planetas del sistema solar nos da los valores del máximo v que se puede conseguir con una órbita de aproximación a cada planeta que son de 7.91 km/s para la Tierra, 3.55 km/s para Marte, 42.73 km/h para Júpiter, etc. 334 Navegación interplanetaria Bibliografı́a Abad, A., Docobo, J., y Elipe,. A. (2002) Curso de Astronomı́a. Colección de textos docentes. Universidad de Zaragoza. Baker, R. M. and Makemson, M. W. (1960) An Introduction to Astrodynamics. Academic Press. New York and London. Barrabés, E., Gomez, G. and Rodriguez–Cababal J. (2004) Notes for the Gravitational Assisted Trajectories. Advanced Topics in Astrodynamics. Summer Course. Barcelona. Bate, R. B. Mueller D. D. and White, J. E. (1971) Fundamentals of Astrodynamics. Dover Publications Inc. Battin, R. H. (1999) An Introduction to the Mathematics and Methods of Astrodynamics, Revised Edition. AIAA Education Series. Published by American Institute of Aeronautics ans Astronautics, Inc. Beutler, G. (2005) Methods of Celestial Mechanics. Springer. Bond, V. R. and Allman, M. C. (1996) Modern Astrodynamics. Fundamentals and Perturbation Methods. Princeton University Press. Brown, C.D. (1998) Spacecraft Mission Design. Second Edition. AIAA Education Series. Published by American Institute of Aeronautics ans Astronautics, Inc. Capderou, M. (2005) Satellites. Orbits and missions. Elsevier. Chao, C-C. (2005) Applied Orbit Perturbation and Maintenance. The Aerospace Press. Curtis, H. D. (2009) Orbital Mechanics for Engineering Students. Springer. CNES, (1995) Spaceflight Dynamics. Vols I, II. Cépadues-Editions. Toulouse. France. Danby, J. M. (1962) Fundamental of Celestial Mechanics. Willmann-Bell, Inc. Elices, T. (1991) Introducción a la Dinámica Espacial. Instituto Nacional de Técnica Aeroespacial. Madrid. 335 336 Bibliografı́a ESA. Página web: http://www.esa.int/ Gurzadyan. G.(1996) Theory of Interplanetary Flights. Gordon and Breach Publishers. Logsdon, T. (1998) Orbital Mechanics. Theory and Applications. John Wiley & Sons, Inc. Milani, A., Nobili, A. M. and Farinella, P. (1987) Non-gravitational perturbations and satellite geodesy. Adams Hilger. Montenbruck, O. and Gill, E. (2000) Satellite Orbits. Models, Methods and Applications. Springer. Moulton, F. R. (1970) An Introduction to Celestial Mechanics. Dover Publications Inc. New York. NASA. Página web: http://www.nasa.gov/home/ Prussing, J. E and Conway, B. A. (1993) Orbital Mechanics. Oxford University Press. Schaub, H. and Junkins, J. (2003) Analytical Mechanics of Space Systems. AIAA Education Series. Published by American Institute of Aeronautics ans Astronautics, Inc. Seidelmann, P.K. et al. (2007) Report of the IAU/IAG Working Group on cartographic coordinates and rotational elements. Celestial Mechanics and Dynamical Astronomy. 98, pp 155-180. Sidi, M. J. (1997) Spacecraft Dynamics & Control. A practical engineering approach. Cambridge University Press. Vallado, D. A. (1997) Fundamentals of Astrodynamics and Applications. Space Technology Series. McGraw Hill. Weiland, C. (2010) Orbital Mechanics for Engineering Students. Springer. Wertz, J. R. and Larson, W. J.. (1999) Space Mission Analysis and Design. Kluwer Academic Publishers. Wiesel, W. E. (2010) Modern Astrodynamics. Aphelion Press Índice alfabético A aceleración de arrastre . . . . . . . . . . . . . . . . . . . 101 de coriolis . . . . . . . . . . . . . . . . . . . . 101 del origen . . . . . . . . . . . . . . . . . . . . 101 radial . . . . . . . . . . . . . . . . . . . . . . . . 102 relativa . . . . . . . . . . . . . . . . . . . . . . . 101 transversal . . . . . . . . . . . . . . . . . . . 102 achatamiento . . . . . . . . . . . . . . . . . . . . . . . 46 acimut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 across-plane . . véase dirección normal across-track véase dirección normal a la tangente aerofrenado . . . . . . . . . . . . . . . . . . . . . . . 331 afelio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 along-track véase dirección tangencial altitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 máxima . . . . . . . . . . . . . . . . . . . . . . 143 mı́nima. . . . . . . . . . . . . . . . . . . . . . .143 altura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 ángulo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5 de rotación del planeta . . . . . . . . 51 de rotación terrestre . . . . . . . 64, 77 de transferencia . . . . . . . . . . . . . . 177 de trayectoria de vuelo . . . . . . . 151 del nodo . . . . . . . . . . . . . . . . . . . . . 143 determinación de un . . . . . . . . . . . . 5 determinación principal de un . . . 5 directo . . . . . . . . . . . . . . . . . . . . . . . . 13 horario . . . . . . . . . . . . . . . . . . . . . . . . 41 retrógrado . . . . . . . . . . . . . . . . . . . . . 13 sentido de un . . . . . . . . . . . . . . . . . . 13 ángulos de Euler . . . . . . . . . . . . . . . . . . . 32 anomalı́a excéntrica . . . . . . . . . . . . . . . . . . . . 134 media . . . . . . . . . . . . . . . . . . . . . . . . 135 verdadera . . . . . . . . . . . . . . . . . . . . 127 año . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 anomalı́stico . . . . . . . . . . . . . . . . . . . 81 beseliano . . . . . . . . . . . . . . . . . . . . . . 93 bisiesto . . . . . . . . . . . . . . . . . . . . . . . . 90 juliano. . . . . . . . . . . . . . . . . . . . .82, 93 sidéreo . . . . . . . . . . . . . . . . . . . . . . . . 81 trópico . . . . . . . . . . . . . . . . . . . . . . . . 81 apoastro . . . . . . . . . . . . . . . . . . . . . . . . . . 128 apogeo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 argumento del periastro . . . . . . . . . . . 144 armónicos teserales . . . . . . . . . . . . . . . . . . . . . . 225 zonales . . . . . . . . . . . . . . . . . . . . . . . 225 ascensión recta . . . . . . . . . . . . . . . . . 42, 59 atmospheric drag . véase rozamiento atmosférico azimut . . . . . . . . . . . . . . . . . . . véase acimut B basura espacial . . . . . . . . . . . . . . . . . . . 262 C cálculo de efemérides . . . . . . . . . . . . . . 151 calendario gregoriano . . . . . . . . . . . . . . . . . . . . . 91 juliano. . . . . . . . . . . . . . . . . . . . . . . . .90 cantidad de movimiento . . . . . . . . . . . . 98 carga útil . . . . . . . . . . . . . . . . . . . . . . . . . 292 cenit . . . . . . . . . . . . . . . . . . . . . . . véase zenit cinturones de Van Allen . . . . . . . . . . . 281 coeficiente balı́stico . . . . . . . . . . . . . . . . . . . . . . 236 de rozamiento . . . . . . . . . . . . . . . . 236 coeficientes de normalización . . . . . . 222 337 338 coeficientes de transición. . . . . . . . .véase funciones f y g cohete . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 portador . . . . . . . . . . . . . . . . . . . . . 295 cónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 apocentro . . . . . . . . . . . . . . . . . . . . 111 directriz . . . . . . . . . . . . . . . . . . . . . . 110 eje . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 elipse. . . . . . . . . . . . . . . . . . . . . . . . . 111 excentricidad . . . . . . . . . . . . . . . . . 110 foco . . . . . . . . . . . . . . . . . . . . . . . . . . 110 hipérbola . . . . . . . . . . . . . . . . . . . . . 112 parábola . . . . . . . . . . . . . . . . . . . . . 112 pericentro . . . . . . . . . . . . . . . . . . . . 111 semieje mayor . . . . . . . . . . . . . . . . 112 semieje menor . . . . . . . . . . . . . . . . 112 semilado recto . . . . . . . . . . . . . . . . 111 cónicas enlazadas . . . . . . . . . . . . . . . . . 324 cono de visibilidad . . . . . . . . . . . . . . . . 277 constante de gravitación universal 115, 207 constelaciones de satélites . . . . . . . . . 255 coordenadas areográficas . . . . . . . . . . . . . . . . . . . . 50 cartesianas . . . . . . . . . . . . . . . . . . . . 14 de la época J2000.0 . . . . . . . . . . . . 58 horizontales . . . . . . . . . . . . . . . . . . . 40 medias . . . . . . . . . . . . . . . . . . . . . . . . 58 planetográficas. . . . . . . . . . . . . . . . .50 polares . . . . . . . . . . . . . . . . . . . . . . . . 14 colatitud . . . . . . . . . . . . . . . . . . . . 14 colongitud . . . . . . . . . . . . . . . . . . . 14 distancia . . . . . . . . . . . . . . . . . . . . 14 latitud . . . . . . . . . . . . . . . . . . . . . . 14 longitud . . . . . . . . . . . . . . . . . . . . . 14 rectangulares . . . . . . . . . . . . . . . . . . 14 selenográficas . . . . . . . . . . . . . . . . . . 50 verdaderas . . . . . . . . . . . . . . . . . . . . . 58 corrección de la órbita . . . . . . . . . . . . 301 cuaternio . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 conjugado . . . . . . . . . . . . . . . . . . . . . 34 parte imaginaria . . . . . . . . . . . . . . . 34 parte real . . . . . . . . . . . . . . . . . . . . . . 34 cuerpo central . . . . . . . . . . . . . . . . . . . . 123 curvas de velocidad cero . . . . . . . . . . 217 Índice alfabético D declinación . . . . . . . . . . . . . . . . . 41, 42, 59 delta uve . . . . . . . . . . . . . . . . . . . . . . . . . 292 desarrollos de Hansen . . . . . . . . . . . . . 138 determinación de órbitas . . . . . . . . . . 151 dı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 medio . . . . . . . . . . . . . . . . . . . . . . . . . 78 sidéreo . . . . . . . . . . . . . . . . . . . . . . . . 77 dirección normal . . . . . . . . . . . . . . . . . . . . . . . 102 normal a la tangente . . . . . . . . . 151 radial . . . . . . . . . . . . . . . . . . . . . . . . 102 tangente . . . . . . . . . . . . . . . . . . . . . 150 transversal . . . . . . . . . . . . . . . . . . . 102 vertical . . . . . . . . . . . . . . . . . . . . . . . . 38 distancia cenital . . . . . . . . . . . . . . . . . . . . 40 E eclı́ptica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 oblicuidad de . . . . . . . . . . . . . . . . . . 38 ecuación de Barker . . . . . . . . . . . . . . . . . . . . 133 de Kepler . . . . . . . . . . . . . . . . . . . . 135 de Kepler universal . . . . . . . . . . . 170 de los equinoccios . . . . . . . . . . . . . . 64 de Sundman . . . . . . . . . . . . . . . . . . 131 del centro. . . . . . . . . . . . . . . . . . . . . .78 del cohete . . . . . . . . . . . . . . . . . . . . 291 del tiempo . . . . . . . . . . . . . . . . . . . . . 78 fundamental de Newton . . . . . . . 98 ecuaciones de Gauss . . . . . . . . . . . . . . . . . . . . . 196 de Lagrange . . . . . . . . . . . . . . . . . . 194 ecuador . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 aparente . . . . . . . . . . . . . . . . . . . . . . . 57 de la fecha . . . . . . . . . . . . . . . . . . . . . 57 del planeta . . . . . . . . . . . . . . . . . . . . 50 intermedio . . . . . . . . . . . . . . . . . . . . . 57 medio . . . . . . . . . . . . . . . . . . . . . . . . . 57 verdadero. . . . . . . . . . . . . . . . . . . . . .57 efemérides planetarias . . . . . . . . . . . . . 201 elementos de dos lı́neas . véase variables TLE medios . . . . . . . . . . . . . . . . . . . . . . . 198 orbitales. . . . . . . . . . . . . . . . . . . . . .145 Índice alfabético osculadores . . . . . . . . . . . . . 192, 198 elevación . . . . . . . . . . . . . . . . . véase altura empuje . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 encuentro espacial . . . . . . . . . . . . . . . . 316 energı́a orbital . . . . . . . . . . . . . . . . . . . . 125 época . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 orbital . . . . . . . . . . . . . . . . . . . . . . . 142 equinoccio . . . . . . . . . . . . . . . . . . . . . . . . . 38 de la fecha . . . . . . . . . . . . . . . . . . . . . 57 medio . . . . . . . . . . . . . . . . . . . . . . . . . 57 verdadero de la fecha . . . . . . . . . . 57 esfera celeste . . . . . . . . . . . . . . . . . . . . . . . . . 16 cı́rculo máximo . . . . . . . . . . . . . . . . 16 cı́rculo menor . . . . . . . . . . . . . . . . . . 16 de gravitación . . . . . . . . . . . . . . . . 325 de Hill . . . . . . . . . . . . . . . . . . . . . . . 325 de influencia . . . . . . . . . . . . . . . . . 327 Euler ángulos de . . . . . . . . . . . . . . . . . . . . . 32 parámetros de . . . . . . . . . . . . . . . . . 33 excentricidad . . . . . . . . . . . . . . . . . . . . . 143 339 atan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 cart . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 de Stump↵ . . . . . . . . . . . . . . . . . . . 163 polar . . . . . . . . . . . . . . . . . . . . . . . . . . 16 funciones f y g de Lagrange . . . . . . 118 G giro a velocidad constante . . . . . . . . . 303 H hodógrafa . . . . . . . . . . . . . . . . . . . . . . . . . . 98 hora oficial española . . . . . . . . . . . . . . . . 88 horizonte . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 I impulso especı́fico . . . . . . . . . . . . . . . . . . . . . 291 gravitacional . . . . . . . . . . . . . . . . . 332 total . . . . . . . . . . . . . . véase delta uve inclinación . . . . . . . . . . . . . . . . . . . . . . . . 143 crı́tica . . . . . . . . . . . . . . . . . . . . . . . . 279 instante . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 de paso por el periastro . . . . . . 132 F orbital . . . . . . . . . . . . . . . . . . . . . . . 142 fecha juliana . . . . . . . . . . . . . . . . . . . . . . . 92 interceptor . . . . . . . . . . . . . . . . . . . . . . . . 316 modificada. . . . . . . . . . . . . . . . . . . . .93 flujo solar . . . . . . . . . . . . . . . . . . . . . . . . . 239 L fly path angle . . . . . . . véase ángulo de latitud trayectoria de vuelo eclı́ptica . . . . . . . . . . . . . . . . . . . . . . . 43 flyby . . . . véase órbita de aproximación geocéntrica . . . . . . . . . . . . . . . . . . . . 47 fórmulas geográfica . . . . . . . . . . . . . . . . . 43, 47 de Bessel ley de los senos . . . . . . . . . . . . . . . . . 19 de las áreas . . . . . . . . . . . . . . 99, 131 del coseno . . . . . . . . . . . . . . . . . . . 18 de Newton . . . . . . . . . . . . . . . . . . . 115 polar del coseno . . . . . . . . . . . . . 20 leyes de Kepler . . . . . . . . . . . . . . . . . . . 109 tercera . . . . . . . . . . . . . . . . . . . . . . 20 lı́nea tercera polar . . . . . . . . . . . . . . . . 20 de los ápsides . . . . . . . . . . . . . . . . 127 de Poisson. . . . . . . . . . . . . . . . . . . .100 de los nodos . . . . . . . . . . . . . . . . . . 143 fuerza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 longitud función del periastro. . . . . . . . . . . . . . . . . .144 acos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 eclı́ptica . . . . . . . . . . . . . . . . . . . . . . . 43 arccos. . . . . . . . . . . . . . . . . . . . . . . . . . .7 geográfica . . . . . . . . . . . . . . . . . . . . . 46 arcsin . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 media . . . . . . . . . . . . . . . . . . . . . . . . 144 arctan . . . . . . . . . . . . . . . . . . . . . . . . . . 7 asin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 low earth orbit . . . . véase órbita baja 340 Índice alfabético M baja . . . . . . . . . . . . . . . . . . . . . . . . . . 281 cementerio . . . . . . . . . . . . . . . . . . . 263 maniobra orbital . . . . . . . . . . . . . . . . . . 288 de aproximación . . . . . . . . . . . . . . 331 matriz de captura . . . . . . . . . . . . . . . . . . . 331 de nutación . . . . . . . . . . . . . . . . . . . . 67 de colisión . . . . . . . . . . . . . . . . . . . . 331 de precesión . . . . . . . . . . . . . . . . . . . 65 de Hohmann . . . . . . . . . . . . . . . . . 310 de precesión–nutación . . . . . . . . . 69 de transferencia . . . . . . . . . . . . . . 175 de rotación . . . . . . . . . . . . . . . . . . . . 28 geoestacionaria. . . . . . . . . .275, 282 de rotación elemental . . . . . . . . . . 30 geosı́ncrona . . . . . . . . . . . . . 275, 282 de tambaleo . . . . . . . . . . . . . . . . . . . 62 halo . . . . . . . . . . . . . . . . . . . . . . . . . . 216 del sesgo de la referencia . . . . . . . 70 heliosı́ncrona . . . . . . . . . . . . . . . . . 284 ortogonal . . . . . . . . . . . . . . . . . . . . . . 27 kepleriana . . . . . . . . . . . . . . . . . . . . 141 medium earth orbit . . . . véase órbita media . . . . . . . . . . . . . . . . . . . . . . . . 282 media Molniya . . . . . . . . . . . . . . . . . . . . . . 283 meridiano . . . . . . . . . . . . . . . . . . . . . . . . . . 41 nominal . . . . . . . . . . . . . . . . . . . . . . 287 cero . . . . . . . . . . . . . . . . . . . . . . . 46, 50 osculatriz. . . . . . . . . . . . . . . . . . . . .198 de referencia.véase meridiano cero polar . . . . . . . . . . . . . . . . . . . . . . . . . 273 del lugar. . . . . . . . . . . . . . . . . . . . . . .41 promediada . . . . . . . . . . . . . . . . . . 198 misil balı́stico . . . . . . . . . . . . . . . . . . . . . 289 Tundra . . . . . . . . . . . . . . . . . . . . . . . 284 modelo de atmósfera de Harris–Priester . . . . . . . . . . . . 237 orbitador . . . . . . . . . . . . . . . . . . . . . . . . . 123 de Jaccia . . . . . . . . . . . . . . . . . . . . . 238 orientación . . . . . . . . . . . . . . . . . . . . . . . . . 13 exponencial . . . . . . . . . . . . . . . . . . 237 origen celeste intermedio. . . . . . . . . . . . . .60 momento angular . . . . . . . . 98, 124, 209 terrestre intermedio . . . . . . . . . . . . 60 movimiento kepleriano . . . . . . . . . . . . . . . . . . . . 117 P medio . . . . . . . . . . . . . . . . . . . . . . . . 135 paralelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 orbital . . . . . . . . . . . . . . . . . . . . . . . 192 parámetro orbital . . . . . . . . . . . . . . . . . 142 relativo. . . . . . . . . . . . . . . . . . . . . . .116 parámetros de Euler. . . . . . . . . . . . . . . .33 patched conics. . . . . . . . .véase cónicas N enlazadas nadir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 payload . . . . . . . . . . . . . . véase carga útil Neper analogı́as de . . . . . . . . . . . . . . . . . . . 21 periastro . . . . . . . . . . . . . . . . . . . . . . . . . . 128 regla del pentágono de . . . . . . . . . 20 perigeo . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 nutación . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 perihelio . . . . . . . . . . . . . . . . . . . . . . . . . . 128 en longitud . . . . . . . . . . . . . . . . . . . . 67 periodo de Chandler . . . . . . . . . . . . . . . . . . . 55 en oblicuidad . . . . . . . . . . . . . . . . . . 67 orbital . . . . . . . . . . . . . . . . . . 114, 129 O sinódico . . . . . . . . . . . . . . . . . . . . . . 319 objetivo. . . . . . . . . . . . . . . . . . . . . . . . . . .316 perturbación oblicuidad de corto periodo . . . . . . . . . . . . . . 197 de la eclı́ptica. . . . . . . . . . . . . . . . . .38 de largo periodo . . . . . . . . . . . . . . 197 media . . . . . . . . . . . . . . . . . . . . . 57, 67 directa . . . . . . . . . . . . . . . . . . . . . . . 210 verdadera de la fecha . . . . . . . . . . 57 empı́rica. . . . . . . . . . . . . . . . . . . . . .248 órbita indirecta . . . . . . . . . . . . . . . . . . . . . 210 Índice alfabético luni-solar . . . . . . . . . . . . . . . . . . . . . 210 secular . . . . . . . . . . . . . . . . . . . . . . . 197 plano de la eclı́ptica . . . . . . véase eclı́ptica del ecuador . . . . . . . . . véase ecuador fundamental . . . . . . . . . . . . . . . . . . . 37 horizontal . . . . . . . . . véase horizonte polinomios asociados de Legendre . . . . . . . . 220 de Legendre . . . . . . . . . . . . . . . . . . 220 polo celeste . . . . . . . . . . . . . . . . . . . . . . . . . 38 celeste de efemérides . . . . . . . . . . . 60 celeste intermedio. . . . . . . . . . . . . .60 de la eclı́ptica. . . . . . . . . . . . . . . . . .42 del planeta . . . . . . . . . . . . . . . . . . . . 50 del sistema . . . . . . . . . . . . . . . . . . . . 37 movimiento del . . . . . . . . . . . . . . . . 55 terrestre . . . . . . . . . . . . . . . . . . . . . . . 38 potencial perturbador . . . . . . . . . . . . . 192 precesión . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 precesión del nodo . . . . . . . . . . . . . . . . 279 primer meridiano véase meridiano cero problema de n cuerpos . . . . . . . . . . . . . . . . . 207 de dos cuerpos . . . . . . . . . . . . . . . 115 de Lambert . . . . . . . . . . . . . . . . . . 175 de las transferencias orbitales . 175 kepleriano . . . . . . . . . . . . . . . . . . . . 117 no perturbado . . . . . . . . . . . . . . . . 199 principal del satélite . . . . . . . . . . 278 propagador . . . . . . . . . . . . . . . . . . . . . . . 201 SGP4/SDP4 . . . . . . . . . . . . . . . . . 203 propulsión iónica . . . . . . . . . . . . . . . . . . . . . . . . 293 quı́mica . . . . . . . . . . . . . . . . . . . . . . 293 punto vernal . . . . . . . . . véase equinoccio puntos de Lagrange . . . . . . . . . . . . . . . 213 341 estado del . . . . . . . . . . . . . . . . . . . . . 86 marcha del . . . . . . . . . . . . . . . . . . . . 86 rendezvous. .véase encuentro espacial S satélite artificial . . . . . . . . . . . . . . . . . . 289 eclipses en . . . . . . . . . . . . . . . . . . . . 246 segundo atómico internacional . . . . . . . . . . 85 intercalar . . . . . . . . . . . . . . . . . . . . . . 87 semieje mayor. . . . . . . . . . . . . . . . . . . . .143 semilatus rectum . véase semilado recto sentido de giro . . . . . . . . . . . . . . . . . . . . . 12 sistema de referencia . . . . . . . . . . . . . . . . 4 apsidal . . . . . . . . . . . . . . . . . . . . . . . 149 baricéntrico . . . . . . . . . . . . . . . . . . . . 39 baricéntrico celeste . . . . . . . . . . . . 58 celeste intermedio. . . . . . . . . . . . . .60 celeste internacional . . . . . . . . . . . 59 cilı́ndrico . . . . . . . . . . . . . . . . . . . . . 157 de Frenet . . . . . . . . . . . . . . . . . . . . . 150 dextrógiro . . . . . . . . . . . . . . . . . . . . . 10 directo . . . . . . . . . . . . . . . . . . . . . . . . 10 eclı́ptico . . . . . . . . . . . . . . . . . . . . . . . 42 ecuador verdadero–equinoccio medio . . . . . . . . . . . . . . . . . . . . . . . . 58 ecuatorial. . . . . . . . . . . . . . . . . . . . . .42 ecuatorial de la época J2000.0 . 58 ecuatorial medio . . . . . . . . . . . . . . . 58 ecuatorial verdadero de la fecha57 espacial . . . . . . . . 59, 101, 123, 146 espacial geocéntrico . . . . . . . . . . . . 59 espacial planetocéntrico . . . . . . . . 59 geocéntrico . . . . . . . . . . . . . . . . . . . . 39 geocéntrico celeste . . . . . . . . . . . . . 58 geográfico . . . . . . . . . . . . . . . . . . . . . 46 heliocéntrico . . . . . . . . . . . . . . . . . . . 39 horario . . . . . . . . . . . . . . . . . . . . . . . . 41 horizontal . . . . . . . . . . . . . . . . . . . . . 40 inercial . . . . . . . . . . . . . . . . . . . . . . . . 99 R inercial con centro en la Tierra117 radio levógiro. . . . . . . . . . . . . . . . . . . . . . . .10 ecuatorial. . . . . . . . . . . . . . . . . . . . . .46 nodal . . . . . . . . . . . . . . . . . . . . . . . . 147 polar . . . . . . . . . . . . . . . . . . . . . . . . . . 46 nodal–espacial . . . . . . . . . . . . . . . . 147 reloj atómico . . . . . . . . . . . . . . . . . . . . . . . 85 orbital . . . . . . . . . . . . . . . . . . 102, 149 342 origen del . . . . . . . . . . . . . . . . . . . . . . . 4 ortogonal . . . . . . . . . . . . . . . . . . . . . . . 9 ortonormal . . . . . . . . . . . . . . . . . . . . . . 9 planetocéntrico . . . . . . . . . . . . 39, 51 planetográfico . . . . . . . . . . . . . . . . . 50 retrógrado . . . . . . . . . . . . . . . . . . . . . 10 rotación . . . . . . . . . . . . . . . . . . . . . . . 25 selenocéntrico. . . . . . . . . . . . . . . . . .39 terrestre intermedio . . . . . . . . . . . . 60 topocéntrico . . . . . . . . . . . . . . . . . . . 39 sonda espacial . . . . . . . . . . . . . . . 289, 323 space debris . . . véase basura espacial swingby véase órbita de aproximación T tiempo atómico internacional . . . . . . . . . . 85 civil local . . . . . . . . . . . . . . . . . . . . . . 79 coordenada baricéntrico. . . . . . . .90 coordenada geocéntrico . . . . . . . . 90 de efemérides . . . . . . . . . . . . . . . . . . 84 de zona . . . . . . . . . . . . . . . . . . . . . . . . 88 dinámico baricéntrico . . . . . . . . . . 89 dinámico terrestre . . . . . . . . . . . . . 89 GPS . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 medio . . . . . . . . . . . . . . . . . . . . . . . . . 78 medio de Greenwich . . . . . . . . . . . 80 sidéreo . . . . . . . . . . . . . . . . . . . . 44, 75 sidéreo aparente . . . . . . . . . . . . . . . 76 sidéreo aparente en Greenwich 64, 76 sidéreo local medio . . . . . . . . . . . . 76 sidéreo medio . . . . . . . . . . . . . . . . . . 76 sidéreo medio en Greenwich64, 76 solar . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 solar medio . . . . . . . . . . . . . . . . . . . . 78 solar verdadero . . . . . . . . . . . . . . . . 77 terrestre . . . . . . . . . . . . . . . . . . . . . . . 89 universal TU0. . . . . . . . . . . . . . . . . . . . . . . . .79 TU1. . . . . . . . . . . . . . . . . . . . . . . . .80 TU2. . . . . . . . . . . . . . . . . . . . . . . . .80 universal coordinado . . . . . . . . . . . 87 UTC . . . . . . . . . . . . . . . . . . . . . . . . 80 transferencia Índice alfabético bielı́ptica . . . . . . . . . . . . . . . . . . . . . 313 de Hohmann . . . . . . véase órbita de Hohmann orbital . . . . . . . . . . . . . . . . . . . . . . . 301 traslación . . . . . . . . . . . . . . . . . . . . . . . . . . 25 traza . . . . . . . . . . . . . . . . . . . . . . . . . 271, 272 triángulo esférico . . . . . . . . . . . . . . . . . . . . . . . . 17 polar . . . . . . . . . . . . . . . . . . . . . . . . . . 19 two line elements . . . . véase variables TLE V variable dinámica . . . . . . . . . . . . . . . . . 142 variables de Delaunay . . . . . . . . . . . . . . . . . . 162 de estado . . . . . . . . . . . . . . . . . . . . . 141 de Hill . . . . . . . . . . . . véase variables polares–nodales de Whittaker . . . . . . véase variables polares–nodales equinocciales . . . . . . . . . . . . . . . . . 145 no singulares . . . . . . . . . . . . . . . . . 145 polares–nodales . . . . . . . . . . . . . . 159 TLE . . . . . . . . . . . . . . . . . . . . 201, 203 vector componentes de un. . . . . . . . . . . . . .4 de estado . . . . . . . . . . . . . . . . . . . . . 142 de Laplace . . . . . . . . . . . . . . . . . . . 124 de posición . . . . . . . . . . . . . . . . . . . . 97 dirección de un . . . . . . . . . . . . . . . . . 5 longitud de un . . . . . . . . . . . . . . . . . . 4 norma de un . . . . . . . . . . . . . . . . . . . . 4 rotación . . . . . . . . . . . . . . . . . . . . . . . 29 vectores ángulo entre . . . . . . . . . . . . . . . . . . . . 5 ortogonales . . . . . . . . . . . . . . . . . . . . . 4 producto escalar de . . . . . . . . . . . . . 4 producto mixto de . . . . . . . . . . . . . . 9 producto vectorial de . . . . . . . . . . . 8 velocidad angular de un sistema de referencia 100 areolar . . . . . . . . . . . . . . . . . . . . . . . . 99 caracterı́stica . . . . . . . . . . . . . . . . . 292 Índice alfabético de escape. . . . . . . . . . . . . . . . . . . . .289 de pérdida de masa . . . . . . . . . . . 290 de satelización . . . . . . . . . . . . . . . . 289 efectiva. . . . . . . . . . . . . . . . . . . . . . .290 radial . . . . . . . . . . . . . . . . . . . . . . . . 102 residual . . . . . . . . . . . . . . . . . . . . . . 290 transversal . . . . . . . . . . . . . . . . . . . 102 ventana de lanzamiento . . . . . . . . . . . 300 Z zenit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 343