Astrodinámica - Abad Medina

Astrodinámica Alberto Abad ©As t r o d i n á mi c a ©Al b e r t oAb a d , 2 0 1 2 Gr u p od eMe c á n i c aEs p a c i a l Un i v e r s i d a dd eZa r a g o z a Za r a g o z a . Sp a i n . e ma i l :a b a d @u n i z a r . e s we b :h t t p : / / g me . u n i z a r . e s I SBNp a p e l :9 7 8 8 4 6 8 6 2 8 5 7 8 Ed i t o rBu b o kPu b l i s h i n gS. L. I mp r e s oe nEs p a ñ a / Pr i n t e di nSp a i n iii Para Pili, Pablo, Cristina, Cari y Alejo. iv Índice general Prólogo y agradecimientos I XI Sistemas de referencia en Astrodinámica 1 1 Sistemas de referencia en IR3 1.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 El espacio afı́n IR3 : sistemas de referencia . . . . . . . . . 1.3 Producto escalar: IR3 como espacio euclı́deo . . . . . . . . 1.4 Ángulos y funciones circulares inversas . . . . . . . . . . . 1.5 Producto vectorial y mixto . . . . . . . . . . . . . . . . . 1.6 Sistemas de referencia ortonormales . . . . . . . . . . . . 1.7 Otras propiedades de los distintos productos de vectores . 1.8 Ángulo orientado entre dos vectores . . . . . . . . . . . . 1.9 Coordenadas cartesianas y polares . . . . . . . . . . . . . 1.10 Trigonometrı́a esférica . . . . . . . . . . . . . . . . . . . . 1.10.1 Fórmulas de Bessel . . . . . . . . . . . . . . . . . . 1.10.2 Regla del pentágono de Neper . . . . . . . . . . . . 1.10.3 Analogı́as de Neper . . . . . . . . . . . . . . . . . . 1.10.4 Algoritmo para la resolución de triángulos esféricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 4 4 5 8 9 11 12 14 16 18 20 21 22 2 Cambios del sistema de referencia: rotaciones 2.1 Introducción . . . . . . . . . . . . . . . . . . . . 2.2 Rotaciones en IR3 . . . . . . . . . . . . . . . . . 2.3 Composición de rotaciones . . . . . . . . . . . . 2.4 Rotación de un vector alrededor de un eje . . . 2.5 Rotaciones elementales . . . . . . . . . . . . . . 2.6 Ángulos de Euler . . . . . . . . . . . . . . . . . 2.7 Rotaciones y cuaternios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 25 26 28 29 30 32 33 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Fundamentos de los sistemas de referencia en el espacio 37 3.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 3.2 Sistema de referencia horizontal . . . . . . . . . . . . . . . . . . . . 39 3.3 Sistema de referencia horario . . . . . . . . . . . . . . . . . . . . . 41 v Índice general vi 3.4 3.5 3.6 3.7 3.8 . . . . . . . . . . . . . . . . . . . . 42 42 43 45 50 4 Sistemas de referencia espaciales precisos 4.1 Movimientos del polo y del equinoccio . . . . . . . . . . . . . 4.2 Sistemas de referencia espaciales precisos . . . . . . . . . . . . 4.3 Transformaciones entre sistemas de referencia precisos . . . . 4.3.1 Movimiento del polo . . . . . . . . . . . . . . . . . . . 4.3.2 Cambios de origen en el ecuador intermedio . . . . . . 4.3.3 Precesión . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.4 Nutación . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.5 Tratamiento actual de la precesión y nutación . . . . . 4.3.6 Desviación entre los sistemas E oo y SG . . . . . . . . . 4.3.7 Transformación general de coordenadas . . . . . . . . 4.4 Relación de los sistemas precisos con los sistemas idealizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 53 57 60 62 64 65 67 68 70 71 71 5 Referencia temporal 5.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Relojes basados en la rotación terrestre . . . . . . . . . . . . 5.2.1 Tiempo sidéreo . . . . . . . . . . . . . . . . . . . . . . 5.2.2 Ángulo de rotación terrestre . . . . . . . . . . . . . . . 5.2.3 Tiempo solar y tiempo medio . . . . . . . . . . . . . . 5.2.4 Tiempo universal . . . . . . . . . . . . . . . . . . . . . 5.3 Movimiento orbital de la Tierra: el año . . . . . . . . . . . . 5.4 Relación entre el tiempo sidéreo y el tiempo medio . . . . . . 5.5 Escalas de tiempo uniforme . . . . . . . . . . . . . . . . . . . 5.5.1 Tiempo de efemérides y tiempo atómico internacional 5.5.2 Tiempo universal coordinado . . . . . . . . . . . . . . 5.5.3 Tiempo de zona y tiempo oficial . . . . . . . . . . . . 5.6 Escalas modernas de tiempo . . . . . . . . . . . . . . . . . . . 5.7 Tiempos coordenada . . . . . . . . . . . . . . . . . . . . . . . 5.8 Calendario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.9 Determinación de una época . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 73 75 75 77 77 79 81 82 84 84 86 88 88 90 90 91 II Sistema de referencia ecuatorial . . . . . . . . . . . Sistema de referencia eclı́ptico . . . . . . . . . . . . Relación entre los sistemas de referencia espaciales Sistema de referencia geográfico . . . . . . . . . . . Sistema de referencia planetográfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Movimiento kepleriano 6 Revisión de elementos de dinámica clásica 6.1 Introducción . . . . . . . . . . . . . . . . . . 6.2 Movimiento de una masa puntual . . . . . . 6.3 Sistemas inerciales y no inerciales . . . . . 6.4 Movimiento de una partı́cula en su plano . 95 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 . 97 . 97 . 99 . 101 Índice general 6.5 6.6 6.7 6.8 vii Sistemas dinámicos . . . . . . . . . . . . Ecuaciones de Lagrange y de Hamilton . Transformaciones canónicas . . . . . . . Ecuación de Hamilton–Jacobi y ecuación . . . . . . de . . . . . . . . . . . . . . . . . . Delaunay . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 104 105 107 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 109 109 110 111 112 112 113 115 116 118 8 Integración del problema kepleriano 8.1 Modelo orbital kepleriano . . . . . . . . . . . . . . . . . . . 8.2 Primeras integrales . . . . . . . . . . . . . . . . . . . . . . . 8.3 Deducción de la primera y segunda leyes de Kepler . . . . . 8.4 Tercera ley de Kepler: unidades . . . . . . . . . . . . . . . . 8.5 Ley horaria del movimiento . . . . . . . . . . . . . . . . . . 8.5.1 Formulación regularizada del movimiento kepleriano 8.5.2 Caso parabólico . . . . . . . . . . . . . . . . . . . . . 8.5.3 Caso elı́ptico . . . . . . . . . . . . . . . . . . . . . . 8.5.4 Resolución de la ecuación de Kepler . . . . . . . . . 8.5.5 Caso hiperbólico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 123 124 126 129 130 131 133 134 136 138 7 Movimiento kepleriano 7.1 Introducción . . . . . . . . . . . . 7.2 Leyes de Kepler . . . . . . . . . . 7.3 Propiedades de las cónicas . . . . 7.3.1 Elipses: 0  e < 1 . . . . . 7.3.2 Parábolas: e = 1 . . . . . 7.3.3 Hipérbolas: e > 1 . . . . . 7.4 Ley de gravitación de Newton . . 7.5 Problema de dos cuerpos . . . . . 7.6 Movimiento relativo o kepleriano 7.7 Funciones f y g de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Órbitas keplerianas 141 9.1 Caracterización de las órbitas keplerianas . . . . . . . . . . . . . . 141 9.2 Elementos orbitales ordinarios . . . . . . . . . . . . . . . . . . . . . 143 9.3 Variables no singulares . . . . . . . . . . . . . . . . . . . . . . . . . 145 9.4 Sistemas de referencia orbitales . . . . . . . . . . . . . . . . . . . . 146 9.4.1 Sistema espacial . . . . . . . . . . . . . . . . . . . . . . . . 146 9.4.2 Sistema nodal–espacial . . . . . . . . . . . . . . . . . . . . . 147 9.4.3 Sistema nodal . . . . . . . . . . . . . . . . . . . . . . . . . . 147 9.4.4 Sistema apsidal . . . . . . . . . . . . . . . . . . . . . . . . . 149 9.4.5 Sistema orbital . . . . . . . . . . . . . . . . . . . . . . . . . 149 9.4.6 Sistema de Frenet . . . . . . . . . . . . . . . . . . . . . . . 150 9.5 Relaciones entre el vector de estado y los elementos orbitales . . . 151 9.5.1 Determinación de la órbita a partir de las condiciones iniciales152 9.5.2 Cálculo de efemérides . . . . . . . . . . . . . . . . . . . . . 153 9.6 Intersección de dos órbitas keplerianas . . . . . . . . . . . . . . . . 154 9.6.1 Pertenencia de un punto a una órbita . . . . . . . . . . . . 154 Índice general viii 9.6.2 Intersección de órbitas no coplanarias . . 9.6.3 Intersección de órbitas coplanarias . . . . 9.6.4 Colisiones . . . . . . . . . . . . . . . . . . Variaciones de los sistemas de referencia . . . . . Variables polares–nodales . . . . . . . . . . . . . Variables de Delaunay en el movimiento elı́ptico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155 155 157 157 158 160 10 Formulación universal del problema kepleriano 10.1 Introducción . . . . . . . . . . . . . . . . . . . . . 10.2 Funciones V de Stump↵ . . . . . . . . . . . . . . 10.3 Funciones V0 , V1 . . . . . . . . . . . . . . . . . . 10.4 Formulación universal del problema kepleriano . 10.5 Coeficientes de transición en forma cerrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 163 163 168 169 172 11 Órbitas keplerianas que pasan por dos puntos 11.1 Problema de transferencias orbitales y problema de Lambert . 11.2 Órbitas de transferencia . . . . . . . . . . . . . . . . . . . . . . 11.2.1 Plano de la órbita . . . . . . . . . . . . . . . . . . . . . 11.2.2 Ángulo de transferencia . . . . . . . . . . . . . . . . . . 11.3 Elementos del triángulo OP1 P2 . . . . . . . . . . . . . . . . . . 11.4 Hodógrafa en P1 y P2 . . . . . . . . . . . . . . . . . . . . . . . 11.5 Órbitas de energı́a mı́nima . . . . . . . . . . . . . . . . . . . . . 11.6 Órbitas de energı́a h > hm . . . . . . . . . . . . . . . . . . . . . 11.7 Conjunto de las órbitas que pasan por dos puntos . . . . . . . . 11.8 Tiempo de tránsito . . . . . . . . . . . . . . . . . . . . . . . . . 11.9 Órbitas keplerianas que pasan por dos puntos en dos instantes . . . . . . . . . . . . . . . . . . . . . . 175 175 176 177 177 177 179 182 182 185 186 187 9.7 9.8 9.9 III Movimiento orbital 189 12 Movimiento orbital 12.1 Ecuaciones del movimiento orbital . . . . . . . . . . . . 12.2 Ecuaciones de Lagrange . . . . . . . . . . . . . . . . . . 12.3 Ecuaciones de Gauss . . . . . . . . . . . . . . . . . . . . 12.4 Perturbaciones de corto y largo periodo y seculares . . . 12.5 Método de aproximaciones sucesivas . . . . . . . . . . . 12.6 Perturbaciones de primer orden en el movimiento orbital 12.7 Propagadores orbitales . . . . . . . . . . . . . . . . . . . 12.8 Propagador SGP4/SDP4 y variables TLE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 191 192 195 197 198 199 200 203 13 Problema de n cuerpos 13.1 Formulación del problema de n cuerpos . . 13.2 Modelo planetario . . . . . . . . . . . . . . 13.3 Perturbación luni-solar del satélite artificial 13.4 Problema de tres cuerpos . . . . . . . . . . 13.4.1 Problema restringido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 207 209 210 211 211 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Índice general ix 13.4.2 Problema restringido circular . . . . . . . . . . . . . . . . . 212 13.4.3 Puntos de Lagrange . . . . . . . . . . . . . . . . . . . . . . 213 13.4.4 Curvas de velocidad cero . . . . . . . . . . . . . . . . . . . 216 14 Atracción de sólidos 14.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . 14.2 Polinomios de Legendre . . . . . . . . . . . . . . . . . . 14.3 Potencial gravitatorio de un planeta . . . . . . . . . . . 14.4 Modelos de potencial gravitatorio . . . . . . . . . . . . . 14.5 Evaluación del potencial planetario y la fuerza derivada 14.6 Potencial terrestre en variables polares nodales . . . . . 14.7 Ecuaciones del movimiento en el sistema planetográfico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219 219 220 223 226 228 230 231 15 Otras perturbaciones 15.1 Rozamiento atmosférico . . . . . . . . . . . . . . 15.2 Presión de radiación solar . . . . . . . . . . . . . 15.3 Eclipses . . . . . . . . . . . . . . . . . . . . . . . 15.3.1 Semidiámetros y distancia angular . . . . 15.3.2 Condiciones para un eclipse . . . . . . . . 15.3.3 Área de un segmento circular . . . . . . . 15.3.4 Magnitud del eclipse . . . . . . . . . . . . 15.3.5 Eclipses en satélites artificiales terrestres . 15.4 Perturbaciones relativistas . . . . . . . . . . . . . 15.5 Perturbaciones empı́ricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 235 239 241 241 242 243 245 246 247 248 IV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Navegación espacial 16 Navegación espacial 16.1 Introducción . . . . . . . . . . . . . . . . 16.2 Satélites artificiales terrestres . . . . . . 16.2.1 Satélites de comunicaciones . . . 16.2.2 Satélites de navegación . . . . . . 16.2.3 Satélites de observación terrestre 16.2.4 Satélites cientı́ficos . . . . . . . . 16.2.5 Estaciones espaciales . . . . . . . 16.2.6 Vehı́culos de transporte de carga 16.2.7 Basura espacial . . . . . . . . . . 16.3 Navegación interplanetaria . . . . . . . . 16.3.1 Viajes a la Luna . . . . . . . . . 16.3.2 Viajes a Marte . . . . . . . . . . 16.3.3 Exploración del sistema solar . . 249 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 251 253 254 255 257 258 259 260 262 263 264 266 267 Índice general x 17 Órbitas de satélites artificiales terrestres 17.1 Movimiento del satélite sobre la superficie terrestre . . . 17.1.1 La órbita en la superficie terrestre: traza . . . . . 17.1.2 Visibilidad de un satélite desde una estación . . . 17.2 El problema principal del satélite . . . . . . . . . . . . . 17.3 Efectos sobre el satélite de otras perturbaciones . . . . . 17.4 Clasificación de los satélites artificiales según su órbita . 17.4.1 Órbitas bajas (LEO) . . . . . . . . . . . . . . . . 17.4.2 Órbitas medias (MEO) . . . . . . . . . . . . . . 17.4.3 Órbitas geoestacionarias (GEO) . . . . . . . . . 17.4.4 Satélites Molniya y Tundra . . . . . . . . . . . . 17.4.5 Satélites heliosı́ncronos . . . . . . . . . . . . . . . 17.4.6 Órbitas de transferencia geoestacionarias (GTO) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 271 272 276 278 279 281 281 282 282 283 284 285 18 Maniobras orbitales 18.1 Introducción . . . . . . . . . . . . . . . . . 18.2 La velocidad y la navegación espacial . . . 18.3 Propulsión de naves espaciales . . . . . . . 18.4 Lanzamiento de satélites artificiales . . . . 18.5 Corrección de órbitas . . . . . . . . . . . . 18.5.1 Corrección general de la órbita . . 18.5.2 Cambio del plano orbital . . . . . 18.5.3 Corrección de la órbita en su plano 18.5.4 Cambio de la forma de la órbita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 287 287 290 295 301 302 302 305 306 19 Transferencias y encuentros orbitales 19.1 Transferencias orbitales . . . . . . . . . . . . . . . . . . . 19.1.1 Transferencias de Hohmann y bielı́ptica . . . . . . 19.1.2 Transferencia óptima en dos maniobras . . . . . . 19.2 Encuentros orbitales . . . . . . . . . . . . . . . . . . . . . 19.2.1 Maniobra de espera . . . . . . . . . . . . . . . . . 19.2.2 Encuentro directo en transferencias generales . . . 19.2.3 Encuentros en transferencias de Hohmann . . . . . 19.3 Viaje a Marte en una órbita de transferencia de Hohmann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 309 309 310 314 315 316 317 318 321 20 Navegación interplanetaria 20.1 Sondas espaciales . . . . . . . . . . . . . . . . . . 20.2 Esfera gravitacional de influencia . . . . . . . . . 20.3 Salida del campo gravitacional de un planeta . . 20.4 Entrada en el campo gravitacional de un planeta 20.5 Impulso gravitacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323 323 325 327 329 332 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Bibliografı́a 335 Índice alfabético 337 Prólogo y agradecimientos La Tierra es la cuna de la inteligencia, pero no se puede vivir siempre en una cuna. Konstantin E. Tsiokovsky, 1911. La tecnologı́a espacial es responsable de una buena parte de los avances tecnológicos actuales. La investigación y desarrollo en cuestiones cientı́ficas y técnicas relativas a los satélites artificiales y la navegación espacial resultan fundamentales para un rápido avance cientı́fico y tecnológico. Son muchas las actividades cotidianas que no podrı́amos realizar de no existir satélites artificiales orbitando alrededor de la Tierra. En efecto, en las noticias de televisión son frecuentes las conexiones con paı́ses de otros continentes; recibimos canales de televisión a través de las antenas parabólicas; hablamos con otros paı́ses por teléfono con igual o mejor cobertura que en la misma ciudad; vemos fotografı́as de las borrascas, lo que permite la predicción del tiempo; sabemos los minutos que faltan hasta que llegue el próximo autobús; tenemos información de los minutos y segundos que lleva de ventaja el ciclista escapado sobre el pelotón que lo persigue, etc. Además, hay otros usos más sofisticados, como el poder obtener imágenes de galaxias extremadamente alejadas, hacer un seguimiento del avance de la desertificación en los Monegros, una estimación de la nieve acumulada en el Pirineo, localización de una colonia de linces ibéricos, detectar bancos de pesca, o hacer llegar la educación a lugares remotos, como la selva brasileña, por poner unos cuantos ejemplos. Pero todas estas posibilidades son relativamente recientes; el primer satélite artificial, el Sputnik I se lanzó en 1957. La era espacial, en el momento de escribir estas lı́neas, no tiene más que 55 años. Uno de los aspectos fundamentales para el éxito de una misión artificial es el xii establecimiento de una órbita precisa que le permita desarrollar, durante el mayor periodo de tiempo posible, la misión para la que ha sido concebido. Los fundamentos del análisis del movimiento orbital de los satélites artificiales, ası́ como el de otras naves espaciales cuyo propósito sea la exploración del espacio exterior, se basan en las consecuencias de la ley de gravitación universal enunciada por Newton. Esta ley, que determina el movimiento de cualquier cuerpo en el espacio, natural o artificial, dio lugar a la Mecánica Celeste, que nació como la disciplina cientı́fica que estudia el movimiento de planetas, cometas, asteroides y cualquier otro cuerpo sometido a la ley de gravitación de Newton. Las caracterı́sticas especiales de alguno de los problemas dinámicos planteados en el estudio de las órbitas de los satélites artificiales llevaron a definir una nueva disciplina cientı́fica, la Astrodinámica, heredera de la Mecánica Celeste, que estudia principalmente el movimiento en el espacio de los objetos artificiales. Aunque la causa fundamental del movimiento sigue siendo la ley de gravitación de Newton, en Astrodinámica hay que considerar otro tipo de fuerzas no gravitacionales que modifican las consecuencias de esta ley. Por otro lado, la Astrodinámica añade a la Mecánica Celeste un nuevo problema, como es el diseño de complejas trayectorias para las naves espaciales que les permitan realizar, con las limitaciones energéticas actuales, cualquier recorrido por el sistema solar. El presente libro pretende dar una visión general de los principales puntos que aborda la Astrodinámica, para ello se ha dividido en cuatro partes: sistemas de referencia, movimiento kepleriano, movimiento orbital y navegación espacial. En la primera parte del libro se aborda un problema previo a la navegación espacial, la determinación precisa de la posición y velocidad de un cuerpo en el espacio. En primer lugar se realiza un repaso de una serie de herramientas básicas, que van, desde el concepto de ángulo y vector, hasta el de sistema de referencia y el estudio de las rotaciones de estos sistemas. Una vez establecidos los conceptos básicos se pasa al estudio de los sistemas de referencia astronómicos considerando las variaciones de estos sistemas debidas a los pequeños movimientos de los planos fundamentales del ecuador y la eclı́ptica. En este punto se han introducido todas las recomendaciones y normas dictadas por la Unión Astronómica Internacional (IAU) en el año 2000, y en vigor desde el año 2003, que vienen a modificar las teorı́as de la precesión y nutación de los años 1976 y 1980. Finalmente se estudia el parámetro que actúa de variable independiente en las teorı́as dinámicas, esto es, el tiempo. Puesto que cualquier misión espacial establecerá su referencia temporal a través de un reloj, se estudian los distintos tipos de relojes y tiempos que nos da la Astronomı́a. En la segunda parte del libro se estudia en profundidad el movimiento kepleriano. Las leyes de Kepler describen el comportamiento de la solución de un modelo teórico basado en el movimiento relativo de dos masas puntuales que interaccionan gravitacionalmente de acuerdo con la ley de Newton. No solo se integra el problema, sino que se realiza un estudio cualitativo exhaustivo del mismo, que es necesario para comprender la complejidad del modelo orbital real. Se analiza la geometrı́a de este movimiento, ası́ como distintos conjuntos de variables que lo xiii describen y varios sistemas de referencia asociados a las órbita keplerianas. Finalmente se estudia el problema de contorno consistente en el análisis del conjunto de órbitas keplerianas que pasan por dos puntos. La tercera parte trata del modelo orbital real. Se analizan los distintos efectos que pueden modificar una órbita kepleriana: forma no esférica de la Tierra y de los planetas; atracción gravitacional de otros cuerpos; frenado atmosférico; presión de radiación solar; efectos relativistas; etc. Se estudia la formulación del problema de tres cuerpos, que es el siguiente en complejidad al modelo kepleriano de dos cuerpos, y se analiza un caso particular, el problema restringido, que determina muchas de las caracterı́sticas dinámicas de la navegación interplanetaria. Finalmente, se obtienen las ecuaciones que permiten estudiar los modelos de movimiento orbital a partir de aproximaciones al modelo kepleriano. La parte final aborda los aspectos que se refieren a la navegación espacial, tanto de satélites artificiales como de sondas interplanetarias. El primer capı́tulo de esta parte analiza la historia del primer medio siglo de navegación espacial, no tanto desde un punto de vista cronológico, sino describiendo la historia de cada tipo de misión, procurando dar de esta forma una visión más coherente de la industria espacial actual. Se estudian por separado los satélites artificiales y la navegación interplanetaria. En los primeros se analiza la interacción entre éstos y la Tierra, que condiciona el tipo de misión en función de las zonas de la Tierra que el satélite sobrevuela. También se estudian los distintos tipos de maniobras, incluido el lanzamiento, que permiten modificar una órbita; ası́ como las trasferencias orbitales, o conjunto de maniobras que conectan órbitas sin un punto en común. El último capı́tulo estudia los conceptos básicos para el diseño de las trayectorias interplanetarias a partir de la unión de fragmentos de órbitas keplerianas. El presente libro ha sido escrito después de muchos años de estar encargado de la docencia de las asignaturas de Astronomı́a y Mecánica Celeste de la licenciatura de Matemáticas en la Universidad de Zaragoza. Parte de las notas escritas como consecuencia de dicha docencia se plasmaron en un libro titulado Curso de Astronomı́a y escrito en colaboración con José Angel Docobo y Antonio Elipe. A ellos quiero agradecer el uso, en éste libro, de ciertas partes del anterior, con objeto de dejar cerrados algunos temas. De esta forma, el lector interesado únicamente en Astrodinámica no tendrá la necesidad de navegar en otro libro más orientado a la Astronomı́a. Con este libro he intentado llenar una laguna en la literatura en español de temas de Astrodinámica, pues son muy escasos los libros de estas caracterı́sticas que pueden encontrarse en las librerı́as. Escribir el libro en español me ha hecho reflexionar sobre la adaptación de los términos cientı́ficos a nuestra lengua y me ha conducido a unas consideraciones sobre terminologı́a que, equivocadas o no, he intentado plasmar en el libro. En este punto quiero agradecer a mi colega Luis Florı́a sus fructı́feras e ilustrativas conversaciones sobre el tema. El inglés se ha convertido en la lengua común de la ciencia, es por ello corriente que determinados xiv términos no se traduzcan o la traducción sea poco meditada. Al escribir este libro he intentado utilizar una terminologı́a que se adapte al máximo a las palabras y conceptos del español y a su significado cientı́fico. Esto debe ayudar a realizar una correcta interpretación de dichos términos cuando se pretende hacer divulgación de temas especializados a personas no expertas en la materia o no familiarizadas con la literatura técnica escrita en inglés. Ası́, en este libro he usado palabras no estándar como cónicas enlazadas en lugar de patched conics, órbitas de aproximación en lugar de flyby o swingby, etc. Al final de la obra, en el ı́ndice alfabético se han incorporado algunos de estos términos comunes en inglés con una indicación de la traducción usada en el libro. También resulta relacionado con el lenguaje otro aspecto que podrı́a no mencionar y dejar pasar desapercibido pero del que prefiero que quede constancia escrita. Ası́ como he intentado ser riguroso en la elección de la terminologı́a en español y por adelantado pido excusas por los posibles fallos cometidos en este empeño, también he prescindido de una norma de nuestro lenguaje que creo debe ser modificada. Es norma del español usar la coma como separador de la parte decimal de un número. A este respecto, creo firmemente que el lenguaje matemático, que es un lenguaje universal, debe estar por encima de cualquier localismo que únicamente lo dificulta. Aunque es bien cierto que la coma o el punto únicamente constituyen dos formas diferentes de representación de un mismo concepto, que es el número real, es también útil disponer de un representación universal que sea interpretada en la misma forma por cualquier persona. Por ello he optado por el uso del punto en lugar de la coma como separador decimal. La escritura de un libro de texto cientı́fico requiere la realización de profundas revisiones para garantizar la calidad del producto final. Sin embargo, la experiencia me indica que en cada revisión (no profesional) de un texto del tamaño de éste, siempre se encuentran nuevas erratas. No pienso que este libro quede totalmente exento de las mismas, por lo que intentaré, dentro de lo posible, informar al lector de todas las que se vayan encontrando después de la edición definitiva. Para ello puede consultarse la página web: gme.unizar.es/pages/libroastrodinamica, donde se informará, periódicamente, de las mismas, ası́ como de toda información útil relacionada con el libro. A lo largo del próximo año aparecerá también, como se menciona en el capı́tulo 12, el software Orbits, paquete de Mathematica que complementa este libro. En la página web: gme.unizar.es/software/orbits, aparecerán instrucciones sobre su descarga y uso. Quiero terminar este prólogo entrando en el apartado de agradecimientos. Es difı́cil intentar agradecer en unas pocas lı́neas a todos cuantos, de alguna forma, han colaborado, directa o indirectamente, en la escritura de este libro, al fin y al cabo, la escritura del libro está ı́ntimamente relacionada con una trayectoria profesional de más de 30 años. Por otro lado, quiero ser breve y no deseo olvidarme de nadie, ası́ que comenzaré con un agradecimiento genérico a todos los miembros del Grupo de Mecánica Espacial de la Universidad de Zaragoza y a todos los colegas y amigos de las Universidades de La Rioja, Santiago de Compostela, Murcia, Cartagena, Pamplona y del Real Observatorio de la Armada. xv Por otra parte, es de justicia escribir unas lineas aparte, y muy destacadas, para todos los miembros del grupo APSIDE (Asociación para la Promoción Social de la Investigación y el Desarrollo Espacial), sección aragonesa del proyecto SSETI (Student Space Exploration and Technology Initiative) a quienes dedico de manera especial este libro y que son quienes, de alguna forma, me han creado la obligación moral de escribirlo, terminarlo e intentar que sea una herramienta útil para todos aquellos estudiantes interesados en la industria espacial. El proyecto SSETI nació hace unos años como una iniciativa de la Agencia Espacial Europea (ESA) para formar a jóvenes estudiantes en el ámbito espacial. El proyecto pretendı́a agrupar universidades de toda Europa formando equipos que serı́an capaces de diseñar, construir y lanzar satélites. La novedad consistı́a en que todo el proyecto estarı́a dirigido y formado exclusivamente por estudiantes, contando con el apoyo de expertos de la Agencia y profesores de las universidades. Como primer objetivo se planteó la construcción y envı́o al espacio del satélite ESEO (European Student Earth Orbiter). Itziar Barat y Rubén Castro, estudiantes de la Facultad de Ciencias de la Universidad de Zaragoza, asumieron el liderazgo de un grupo de compañeros de las licenciaturas de Matemáticas y Fı́sicas y se encargaron del análisis de misión de ESEO, es decir, el diseño de la órbita y de todos los aspectos astrodinámicos derivados de la misma. Además convencieron a Antonio Elipe, que fue decano de la Facultad de Ciencias y Director del Instituto de Matemáticas y Aplicaciones de Aragón, y a mi mismo, para actuar como profesores tutores del proyecto Los miembros del SSETI han ido cambiando, en su mayor parte por terminar sus estudios de licenciatura. A lo largo de estos años varias generaciones de estudiantes han ido desarrollando sin desánimo el proyecto. Además de los ya mencionados debo nombrar también a Isaac Toda y Eva Tresaco en la segunda generación, a Julia Marı́n-Yaseli, David Vicente y Alejandro Vaquero en la tercera y el último por ahora, Jonatan Peris, que ha conseguido que la llama de la ilusión no se extinga. No son los únicos y ruego al resto de sus compañeros que me perdonen y que hagan suyo mi homenaje a todo el grupo. La falta de estabilidad de los grupos, que necesariamente debı́an cambiar algunos miembros cada año, hicieron ver a los organizadores de la ESA que los objetivos iniciales de ESEO eran demasiado ambiciosos, por lo que se planteó la necesidad de desarrollar un proyecto algo menos exigente que, por su duración, no desmotivara a los participantes. Ası́ nació SSETI-Express, un satélite artificial más pequeño desarrollado en dos años y lanzado al espacio el dı́a 27 de Octubre de 2005. Aunque la señal de dicho satélite se perdió por problemas en las baterı́as, podemos calificar sus resultados como de profundo éxito. Este éxito animó al uso de la experiencia adquirida para alcanzar mayores objetivos, como el proyecto ESMO (European Student Moon Orbiter) que trataba de enviar una nave a orbitar en torno a la Luna. Diversos acontecimientos posteriores, junto con la crisis económica, minimizaron los objetivos propuestos, aunque afortunadamente todavı́a subsiste una pequeña llama encendida, en espera de tiempos mejores. xvi Para un profesor nada hay tan importante como el éxito de sus alumnos, en este caso comprobado y reconocido. Por ello, quiero enviarles a todos ellos mi agradecimiento más profundo, por ser los culpables de la finalización del libro y por haber logrado que recuperara la ilusión por la docencia y demostrarme, y demostrar a muchos otros, que con voluntad y con esfuerzo cualquier joven preparado es capaz de conseguir lo que se proponga. Zaragoza, Agosto de 2012 Alberto Abad Parte I Sistemas de referencia en Astrodinámica 1 Capı́tulo 1 Sistemas de referencia en IR3 1.1 Introducción El objetivo del presente capı́tulo es recordar el concepto de sistema de referencia en IR3 , necesario para situar la posición de los astros y otros objetos en el espacio. Para ello, efectuaremos un breve repaso de las propiedades básicas del espacio vectorial real IR3 y de todos los conceptos asociados al mismo como los productos escalar, vectorial y mixto, ángulos, etc., que serán de gran importancia en el desarrollo del libro. Estas notas no constituyen un tratado de álgebra, de hecho, será necesaria una revisión de un libro especializado para una mejor comprensión de algunos de los conceptos aquı́ utilizados. Sin embargo, hemos preferido profundizar en algunos aspectos, como el de sentido de un ángulo y la orientación de los sistemas de referencia, pues estos conceptos, de gran importancia en la Astrodinámica, son a menudo tratados sin demasiado rigor. La trigonometrı́a esférica ha sido la herramienta tradicional para resolver problemas de Astronomı́a de Posición, donde el concepto de distancia entre puntos, imposible de medir por observación directa, es cambiado por el de distancia angular, sustituyendo los puntos de IR3 por su proyección en una esfera de radio arbitrario (tomado como unidad de longitud). En este libro, salvo en una ocasión, hemos utilizado el cálculo vectorial y matricial en lugar de las fórmulas de la trigonometrı́a esférica, lo que conduce a relaciones más fáciles de entender y que no contienen ambigüedades. Sin embargo, con objeto de que el lector pueda comprender algunas de las demostraciones que aparecen en libros clásicos de Astrodinámica desarrollaremos brevemente en este capı́tulo los fundamentos de la Sistemas de referencia en IR3 4 trigonometrı́a esférica. 1.2 El espacio afı́n IR3 : sistemas de referencia El espacio IR3 puede ser considerado como un conjunto de elementos, llamados puntos, que se representan por letras mayúsculas: O, P, Q, S, . . .; o bien, como el conjunto de vectores x de un espacio vectorial real de dimensión tres. Estas dos formas de ver IR3 pueden relacionarse si consideramos un punto cualquiera O 2 IR3 , que llamaremos origen, y asociamos a cada punto P un vector de IR3 , que llamaremos x = OP , y que geométricamente representa el segmento (vector) que une el punto O con el punto P . Si consideramos otro punto Q, tal que y = OQ, podremos poner QP = OP OQ = x y. De esta forma hemos dotado a IR3 de una estructura de espacio afı́n. Si consideramos una base (i1 , i2 , i3 ) de IR3 el elemento x 2 IR3 puede representarse por tres números reales (x1 , x2 , x3 ), que son llamados componentes del vector en dicha base, de manera que x = x1 i1 + x2 i2 + x3 i3 . Al conjunto formado por el origen y la base {O, i1 , i2 , i3 } le llamaremos sistema de referencia de IR3 . En este sistema de referencia el vector correspondiente al origen O tiene sus tres componentes nulas. 1.3 Producto escalar: IR3 como espacio euclı́deo Llamaremos producto escalar de dos vectores x, y, al número real x · y = x 1 y 1 + x 2 y 2 + x 3 y3 , (1.1) donde (x1 , x2 , x3 ), (y1 , y2 , y3 ) son las componentes de x, y en la base (i1 , i2 , i3 ). Aunque el valor obtenido con esta definición depende de la base donde estemos trabajando, puede demostrarse fácilmente que el valor del producto escalar es independiente de la base en la cual se calcule. El producto escalar nos permitirá definir los conceptos de ángulo y distancia. Diremos que dos vectores son ortogonales cuando su producto escalar sea cero. Llamaremos longitud o norma de un vector al escalar p k x k = x · x = (x2 )1/2 . De esta forma, la distancia entre dos puntos P, Q vendrá dada por la norma del vector QP = OP OQ. Todo vector x puede ser expresado en la forma x = k x k x̂, Ángulos y funciones circulares inversas 5 donde x̂ representa un vector de norma unidad en la misma dirección que x y por lo cual será llamado dirección. Esta propiedad permite caracterizar un vector por su norma y su dirección. El producto escalar de vectores verifica además las siguientes propiedades: x·y = x · (y + z) = ( x) · y = x·x x · x = 0 () y · x, x · y + x · z, (x · y), 0, x = 0. (1.2) La introducción de los conceptos de producto escalar y distancia y sus propiedades permiten considerar IR3 como espacio euclı́deo. Llamaremos ángulo entre dos vectores x, y, al número real ↵ que verifica y x · y = k x kk y k cos ↵. ↵ x 2⇡ ↵ Figura 1.1: Ángulo entre dos vectores. 1.4 (1.3) Las propiedades de la función coseno, ası́ como la propia geometrı́a de la figura 1.1, nos indican la existencia de dos posibles soluciones de la anterior ecuación que se corresponden con los dos ángulos ↵, 2⇡ ↵. Ángulos y funciones circulares inversas Observando la figura 1.1 podemos pensar en un ángulo como el arco o trayectoria recorrido por el vector x hasta llegar a la dirección ocupada por el vector y. Para llegar a y puede pasarse varias veces por su posición, lo que equivale a dar varias vueltas y se corresponde con las propiedades de periodicidad de la función coseno. Ası́ pues, desde el punto de vista de la definición anterior, el ángulo entre dos vectores o direcciones puede considerarse idéntico si le restamos o sumamos un número entero de vueltas, esto es, un múltiplo de 2⇡. Con objeto de evitar esta múltiple definición y precisar más este concepto definiremos en IR una relación de equivalencia R2⇡ de la siguiente forma: dados x, y 2 IR diremos que x está relacionado con y, esto es xR2⇡ y, si y solo si existe un k 2 ZZ tal que x y = 2k⇡. El conjunto A de las clases de equivalencia definidas por R2⇡ coincide con el conjunto cociente IR /2⇡ZZ y hereda la estructura de grupo conmutativo. Los elementos de A serán llamados ángulos. Un representante cualquiera de cada clase de A, que viene dado por un número real, será llamado determinación del ángulo ↵. Llamaremos determinación principal de ↵ al número real perteneciente al intervalo [0, 2⇡) que sea representante Sistemas de referencia en IR3 6 de una clase de IR /2⇡ZZ. Obtener la determinación principal de un ángulo es lo mismo que calcular el resto de la división del número real que representa el ángulo por 2⇡ o bien obtener el valor congruente (módulo 2⇡) de éste número. Obsérvese que podemos definir un isomorfismo entre el conjunto A de ángulos y el intervalo [0, 2⇡) a través de la determinación principal de cada ángulo. Por ello, a partir de aquı́, cuando hablemos de ángulo nos referiremos siempre a su determinación principal o a su valor ↵ 2 [0, 2⇡). De esta forma quedarán justificadas igualdades del tipo ↵ + ⇡ = ↵ ⇡ y otras que aparecen cuando obtenemos la determinación principal de una combinación lineal de ángulos cuyo valor, obtenido por reglas aritméticas, excede de 2⇡ o es menor que 0. En ocasiones la práctica común exige la elección de otra determinación para los ángulos, basada en una definición de los mismos en el intervalo ( ⇡, ⇡]. Esta representación se establecerá para los ángulos definidos explı́citamente en dicho intervalo o en un subintervalo de éste. Las funciones trigonométricas o circulares sen, cos : IR tan : IR ! ! [ 1, 1], IR [{ 1, 1}, son tres1 funciones suprayectivas y periódicas, de periodo 2⇡, cuyas propiedades suponemos de sobra conocidas. A pesar de no ser biyectivas, su periodicidad permite la definición de una serie de funciones inversas llamadas arco coseno (acos), arco seno (asin) y arco tangente (atan) que serán biyectivas si restringimos el intervalo de definición acos : [ 1, 1] ! [0, ⇡], ⇡ ⇡ asen : [ 1, 1] ! [ , ], (1.4) 2 2 ⇡ ⇡ atan : IR [{ 1, 1} ! [ , ]. 2 2 Esta determinación de cuadrante es la usada habitualmente por todos los lenguajes de programación y calculadoras cuando se invocan las funciones inversas de las circulares. Nótese además que la función acos ası́ definida, cuando se usa para la obtención del ángulo entre dos vectores, determina el menor de los dos posibles o ángulo agudo. Habitualmente el uso de las funciones arco coseno, arco seno y arco tangente viene asociado a la resolución de ecuaciones del tipo cos ↵ = x, sen ↵ = x, ó tan ↵ = x. Si el significado geométrico de ↵ en dichas ecuaciones se restringe al intervalo de definición de las funciones, la solución de cada una de esas ecuaciones será única y vendrá dada por las funciones acos, asen, atan, respectivamente. En 1 Las funciones sec, cosec, cotan, pueden considerarse funciones auxiliares de sen, cos y tan y sus propiedades fácilmente deducibles a partir de ellas por lo que no son consideradas en esta exposición. Ángulos y funciones circulares inversas 7 caso contrario, si la solución puede ser un ángulo cualquiera en su determinación principal, tendremos dos posibles soluciones por cada ecuación, que vendrán expresadas por las funciones arccos, arcsin, arctan en lugar de acos, asen, atan, () ↵ = arccos x sen ↵ = x () ↵ = arcsen x () tan ↵ = x () ↵ = arctan x () cos ↵ = x ⇢ () ⇢ ⇢ ↵0 ↵1 = = acos x, acos x, ↵0 ↵1 = = ⇡ ↵0 ↵1 = = atan x, ⇡ + atan x. asen x, asen x, (1.5) Cuando conozcamos simultáneamente el coseno y el seno de un ángulo, cos ↵ = x, sen ↵ = y, éste podrá ser encontrado sin ambigüedad tomando la solución común de entre las dos obtenidas a partir de arccos x, arcsen y. Al igual que en algunos lenguajes de programación, que definen una función arco tangente con dos argumentos para resolver dicho caso, en lo que sigue utilizaremos la función atan(x, y) que determina, sin ambigüedad, el ángulo ↵ que formap el punto (x, y) 2 IR2 {(0, 0)} con el eje Ox del plano, esto es, cuyo coseno es x/ x2 + y 2 y cuyo p 2 2 seno es y/ x + y . ↵ = atan(x, y) () 8 > < cos ↵ = > : sen ↵ = x p , 2 x + y2 y p . 2 x + y2 (1.6) Nótese que hemos usado un orden de variables distinto a la función atan2 de FORTRAN, pues hemos considerado que esta forma concuerda más con el lenguaje habitual de las Matemáticas, donde la primera coordenada x suele representar el coseno, y la segunda, y, el seno. Propiedad.- La ecuación ↵ = x, 2 tiene una única solución dada por la expresión tan (1.7) ↵ = 2 atan x. En efecto, aplicando la función inversa ⇢ ↵ = arctan x = ⇡ 2 + (1.8) atan x, atan x, y llamando ↵0 , ↵1 a las dos soluciones, se tendrá ↵1 = 2(⇡ + atan x) = 2⇡ + 2 atan x = 2 atan x = ↵0 . (1.9) Sistemas de referencia en IR3 8 Propiedad.- Las dos soluciones de la ecuación A, B, C 2 IR, A = C cos ↵ + S sen ↵, (1.10) vienen dadas por la expresión ↵ = atan(C, S) arccos ✓ A p 2 C + S2 ◆ . (1.11) En efecto, si llamamos M, m, a las constantes definidas por C = M cos m, o lo que es igual M= podremos poner p C 2 + S2, S = M sen m, m = atan (C, S) , A = M cos m cos ↵ + M sen m sen ↵ = M cos(m ↵), de donde invirtiendo se llega a m ↵ = arccos y finalmente ↵=m 1.5 arccos ✓ A M ◆ , ✓ A M ◆ . Producto vectorial y mixto Como sabemos, dos vectores linealmente independientes de IR3 determinan un plano. Además, podemos definir dos direcciones distintas, ortogonales al plano, equivalentes a los conceptos relativos de encima y debajo del plano. Por otro lado, las dos direcciones ortogonales al plano son opuestas entre si. Para caracterizar estas dos direcciones estableceremos el concepto de producto vectorial. Supongamos dos vectores x, y que forman entre si un ángulo2 ↵ = acos(x · y). Llamaremos producto vectorial de dos vectores x, y, y lo representaremos por x ⇥ y, a un vector que se caracteriza por: Su norma, k x ⇥ y k = k x kk y k sen ↵. Su dirección, ortogonal al plano definido por x, y, que viene definida por la dirección de avance de un sacacorchos o tornillo3 cuando gira para llevar el vector x hacia el vector y por el camino más corto (ángulo agudo ↵). Sistemas de referencia ortonormales 9 x⇥y y x x⇥y y x Figura 1.2: Producto vectorial de dos vectores. La figura 1.2 representa los dos posibles vectores x⇥y según la posición relativa de x e y. Puede observarse también que las dos únicas direcciones ortogonales al plano definido por dichos vectores se representan por los vectores x ⇥ y e y ⇥ x, que además verifican la relación x⇥y = y ⇥ x. Al producto escalar de un vector x por el vector resultante del producto vectorial de otros dos y ⇥ z, que puede también denotarse como [x, y, z] = x· (y ⇥ z), se le suele llamar producto mixto de tres vectores. 1.6 Sistemas de referencia ortonormales La definición de ortogonalidad nos permite definir un sistema de referencia donde los vectores de la base son ortogonales4 entre si i1 · i2 = i1 · i3 = i2 · i3 = 0. A dicho sistema de referencia le llamaremos sistema de referencia ortogonal. Si además los vectores tienen norma unidad i21 = i22 = i23 = 1, el sistema será llamado sistema de referencia ortonormal. De acuerdo con lo visto en el apartado anterior, dados dos vectores ortogonales y unitarios i1 , i2 , existen únicamente dos direcciones ortogonales al plano definido 2 Como se ha dicho antes hemos elegido el menor de los dos posibles o ángulo agudo. que un sacacorchos avanza hacia arriba cuando gira en sentido contrario a las agujas del reloj y hacia abajo en caso contrario. 4 Tres vectores de IR3 ortogonales entre si son linealmente independientes. 3 Recuérdese Sistemas de referencia en IR3 10 por i1 y i2 . Estas dos direcciones son las representadas por los vectores i1 ⇥ i2 e i2 ⇥ i1 , que en ambos casos tienen norma unidad de acuerdo con la definición de producto vectorial. De esta forma se llega a las dos posibles elecciones de sistemas de referencia ortonormales: sistema directo (llamado también sistema dextrógiro o de orientación positiva) cuando i3 = i1 ⇥ i2 y sistema retrógrado (sistema levógiro o de orientación negativa) cuando i3 = i2 ⇥ i1 . i3 i3 i2 i1 i1 i2 Figura 1.3: Sistema de referencia de orientación positiva (izquierda) y de orientación negativa (derecha). Nótese la posición distinta de los vectores i1 , i2 en ambos sistemas. Propiedad.- Para todo sistema ortogonal directo se verifica 1. i3 = i1 ⇥ i2 , i1 = i2 ⇥ i3 , i2 = i3 ⇥ i1 . (1.12) 2. Dados dos vectores x = x1 i1 + x2 i2 + x3 i3 , y = y1 i1 + y2 i2 + y3 i3 , su producto vectorial se puede expresar como x⇥y = (x2 y3 = i1 x1 y1 x3 y2 )i1 + (x3 y1 i2 x2 y2 i3 x3 y3 x1 y3 )i2 + (x1 y2 x2 y1 )i3 (1.13) . 3. Dados tres vectores x = x1 i1 + x2 i2 + x3 i3 , y = y1 i1 + y2 i2 + y3 i3 y z = z1 i1 + z2 i2 + z3 i3 , su producto mixto se puede expresar como [x, y, z] = x1 y1 z1 x2 y2 z2 x3 y3 z3 . (1.14) Otras propiedades de los distintos productos de vectores 11 Propiedad.- Para todo sistema ortogonal retrógrado se verifica 1. i3 = i2 ⇥ i1 , i2 = i1 ⇥ i3 , i1 = i3 ⇥ i2 , (1.15) 2. Dados dos vectores x = x1 i1 + x2 i2 + x3 i3 , y = y1 i1 + y2 i2 + y3 i3 , su producto vectorial se puede expresar como x⇥y = (y2 x3 = i1 y1 x1 y3 x2 )i1 + (y3 x1 i2 y2 x2 i3 y3 x3 y1 x3 )i2 + (y1 x2 y2 x1 )i3 (1.16) . 3. Dados tres vectores x = x1 i1 + x2 i2 + x3 i3 , y = y1 i1 + y2 i2 + y3 i3 y z = z1 i1 + z2 i2 + z3 i3 , su producto mixto se puede expresar como [x, y, z] = x1 z1 y1 x2 z2 y2 x3 z3 y3 . (1.17) Las dos propiedades anteriores caracterizan los sistemas directos y retrógrados cuya representación gráfica puede verse en la figura 1.3. La definición de producto vectorial no es útil para el cálculo del mismo. Para realizar este cálculo es necesario acudir a una de las expresiones (1.13) o (1.16). Hay que hacer notar aquı́ que únicamente la primera es usada en la mayorı́a de los libros y las librerı́as de los lenguajes de programación. Esto supone que de manera implı́cita dichos libros y programas trabajan con un sistema de referencia ortogonal directo. En Astronomı́a, se utilizan dos sistemas de coordenadas, horizontales y horarias, que se definen habitualmente a través de sistemas de referencia retrógrados. En este libro, con objeto de evitar el problema generado por las distintas propiedades del producto vectorial, utilizaremos únicamente sistemas directos, para lo que redefiniremos las coordenadas asociadas a los sistemas retrógrados. 1.7 Otras propiedades de los distintos productos de vectores Daremos a continuación otras propiedades de los productos de vectores que son independientes de la orientación de la base elegida para su cálculo. Estas propiedades serán usadas a lo largo del libro. Sistemas de referencia en IR3 12 Propiedad .- Las relaciones siguientes son válidas independientemente del sistema de referencia en el que expresemos los vectores: x ⇥ (y + z) = x ⇥ y + x ⇥ z, (1.18) (x ⇥ y)2 = k x k2 k y k2 (1.19) (x ⇥ y) ⇥ z = (x · z)y (y · z)x, (1.20) x ⇥ (y ⇥ z) = (x · z)y (x · y)z. (1.21) (x · y)2 , Propiedad.- El área de un triángulo de vértices O, P, Q viene dada por el valor de k x ⇥ y k/2, siendo x = OP , y = OQ. Propiedad.- Dados dos vectores ortogonales a, b, y un escalar c, el sistema x⇥a x·a tiene como única solución x= En efecto, = = b, c, (1.22) a ⇥ b + ca . a·a a ⇥ b = a ⇥ (x ⇥ a) = (a · a)x (1.23) (a · x)a, de donde despejando se llega a la solución. 1.8 Ángulo orientado entre dos vectores La ecuación (1.3) nos ha permitido introducir el concepto de ángulo y su medida a través del producto escalar. La solución de dicha ecuación conduce, como se ve en la figura 1.1, a dos valores, ↵ y 2⇡ ↵, que representan igualmente al ángulo salvo que las propiedades geométricas de un determinado problema restrinjan el rango de valores a un subintervalo de [0, 2⇡). También podremos discriminar uno de los dos posibles valores cuando definamos un sentido de recorrido de los ángulos y tomemos uno de los dos vectores como origen (de aquı́ en adelante x). Generalmente se considera sentido de giro positivo al recorrido en sentido contrario a las agujas del reloj y sentido de giro negativo al recorrido en sentido de las agujas de un reloj. En dinámica suele hablarse también de sentido directo y sentido retrógrado respectivamente. Habitualmente se considera positivo el signo de los ángulos medidos en sentido directo y negativo los medidos en sentido retrógrado. La anterior definición contiene también una ambigüedad, pues el sentido positivo se transforma en negativo, y viceversa, cuando miramos la figura desde el otro Ángulo orientado entre dos vectores 13 lado del plano determinado por los vectores x, y. Dicha ambigüedad quedará eliminada fijando, mediante el producto vectorial de los dos vectores, el subespacio desde el cual observamos el giro. Para fijar los conceptos de ángulo directo o retrógrado entre dos vectores x, y, o ángulo que va de x a y en sentido positivo o negativo, debemos fijar, en primer lugar, una orientación o dirección n, definida a partir del vector (x⇥y)/k x⇥y k o del vector (y⇥x)/k x⇥y k. Fijado n, hablaremos de ángulo directo, o recorrido en sentido positivo o directo, como aquel que lleva el vector x hacia y en el sentido de giro contrario a las agujas del reloj visto desde la dirección del espacio definida por el vector n. Un ángulo retrógrado, o recorrido en sentido negativo o retrógrado, es el ángulo recorrido en sentido contrario al anterior. Habitualmente todos los libros usan, sin mencionarlo, la orientación definida por n = (x ⇥ y)/k x ⇥ y k. El concepto de sistema ortogonal directo nos va a permitir determinar, de una manera precisa, el ángulo directo entre dos vectores x, y, una vez hayamos definido la orientación n. En efecto, por ser n ortogonal a x podemos definir un sistema de referencia ortonormal directo formado por los vectores {i1 = x/k x k, i2 = n⇥x/k n⇥x k, i3 = n}. Notemos que por ser n y x ortogonales se tiene k n⇥x k = k x k y por tanto i2 = (n ⇥ x)/k x k. El vector ŷ, que pertenece al plano formado por i1 y i2 podrá expresarse como ŷ = p i1 + q i2 , o lo que es igual y = k y kp i1 + k y kq i2 . Si llamamos ↵ = atan(p, q) tendremos que y = k y k cos ↵ i1 + k y k sen ↵ i2 , de donde podremos poner k y k cos ↵ = y · i1 = x·y , kxk k y k sen ↵ = y · i2 = y · (n ⇥ x) n · (x ⇥ y) = , kxk kxk y finalmente k x kk y k cos ↵ = x · y, k x kk y k sen ↵ = n · (x ⇥ y), (1.24) o lo que es igual ↵ = ↵(x, y, n) = atan (x · y, n · (x ⇥ y)) . (1.25) La expresión (1.25) nos da de manera precisa y única el valor del ángulo que va de x a y en sentido positivo desde la orientación definida por el vector n. Sistemas de referencia en IR3 14 1.9 Coordenadas cartesianas y polares Las componentes (x, y, z) de un vector x = x i1 + y i2 + z i3 , expresado en un sistema de referencia ortogonal directo {i1 , i2 , i3 }, serán llamadas coordenadas cartesianas o coordenadas rectangulares y representan: Las proyecciones del vector x sobre los ejes Ox, Oy y Oz o direcciones i1 , i2 e i3 respectivamente. Los cosenos directores, o cosenos de los ángulos que forma el vector x con los ejes Ox, Oy y Oz: x y z = = = k x k cos(x, i1 ) k x k cos(x, i2 ) k x k cos(x, i3 ) = = = x · i1 , x · i2 , x · i3 . En Astronomı́a, donde en ocasiones la medida de la distancia a los astros no es conocida, resulta de particular importancia el uso de las coordenadas polares esféricas que separan la distancia al origen de las otras coordenadas angulares. Para definir las coordenadas polares esféricas (figura 1.4) consideraremos, en primer lugar, un vector l de norma igual a k x k y cuya dirección representa la intersección del plano formado por x e i3 con el plano Oxy formado por i1 e i2 . Llamaremos longitud al ángulo desde i1 hasta l medido en sentido directo tomando como orientación la definida por el vector i3 . La longitud puede tomar un valor cualquiera 2 [0, 2⇡). Llamaremos latitud al ángulo entre l y x. Este ángulo se considera positivo si el vector x está en el lado del espacio correspondiente a i3 y negativo si está en el correspondiente a i3 . De esta forma 2 [ ⇡/2, ⇡/2]. Por último llamaremos distancia r a la norma k x k. Las coordenadas (r, , ) serán llamadas coordenadas polares esféricas o simplemente coordenadas esféricas y se caracterizan principalmente por separar la distancia r de las cantidades angulares adimensionales , . En ocasiones hablaremos de la colatitud o ángulo ˜ = ⇡/2 2 [0, ⇡] entre i3 y x y de la colongitud o ángulo ˜ entre i2 y l, medido en sentido retrógrado. Fácilmente comprobamos que también se verifica ˜ = ⇡/2 2 [0, 2⇡). El uso de la colatitud y la colongitud permite usar los sistemas de coordenadas (r, , ˜), (r, ˜ , ), (r, ˜ , ˜) como alternativa al sistema de coordenadas polares esféricas. Observando la figura 1.4 se deduce fácilmente que un vector unitario l̂ perteneciente al plano Oxy y que tiene una longitud , forma tres ángulos ( , ⇡/2 , ⇡/2) con los tres vectores de la base, por lo que sus componentes, dadas por los cosenos directores serán ⇡ ⇡ l̂ = cos i1 + cos( ) i2 + cos i3 = cos i1 + sen i2 . 2 2 Coordenadas cartesianas y polares 15 De esta forma, se tendrá, por un lado i3 l = r cos i1 + r sen i2 , y por otro, x x ˜ i2 r cos l + r cos ˜ i3 = r cos l + r sen i3 , por lo que finalmente se llega a la expresión del vector en coordenadas polares esféricas ˜ i1 = l x = Figura 1.4: Coordenadas polares esféricas. r cos cos i1 + r sen cos i2 + r sen i3 , (1.26) lo que demuestra que las coordenadas cartesianas pueden expresarse en función de las polares esféricas en la forma: x y z = = = r cos cos , r cos sen , r sen . (1.27) Asimismo, invirtiendo las relaciones anteriores obtenemos las coordenadas esféricas en función de las rectangulares: p r = x2 + y 2 + z 2 , z (1.28) = asen , r = atan(x, y). Puesto que el paso de cartesianas a polares y el de polares a cartesianas serán muy usados a lo largo del libro estableceremos, de aquı́ en adelante una notación más compacta que establece el nombre de una función que a través de los algoritmos (1.27) y (1.28) realiza la transformación. Llamaremos cart() a la función que obtiene el vector x = (x, y, z) a partir del vector de coordenadas polares (r, , ), 0 1 0 x r cos cos x = @ y A = @ r cos sen z r sen 1 A = cart(r, , ). (1.29) Para referirnos a cada una de sus componentes podremos usar las funciones: x = cart1 (r, , ), y = cart2 (r, , ), z = cart3 (r, , ). (1.30) Sistemas de referencia en IR3 16 Por otro lado, la función polar() representará la inversa de la anterior, es decir, nos dará el vector de coordenadas polares en función del vector en cartesianas (r, , ) = polar(x). (1.31) Para referirnos a cada coordenada polar por separado usaremos las funciones siguientes: r = polarr (x), = polar (x), = polar (x). (1.32) Combinando el uso de la colatitud y colongitud con las coordenadas polares podremos poner: x = x = x = r sen ˜ cos i1 + r cos ˜ cos i2 + r sen i3 , r cos sen ˜ i1 + r sen sen ˜ i2 + r cos ˜ i3 , r sen ˜ sen ˜ i1 + r cos ˜ sen ˜ i2 + r cos ˜ i3 , (1.33) (1.34) (1.35) o bien usando la función cart() escribiremos x = cart(r, 1.10 ⇡ 2 ˜ , ) = cart(r, , ⇡ 2 ˜) = cart(r, ⇡ 2 ˜, ⇡ 2 ˜). Trigonometrı́a esférica Una de las caracterı́sticas de la observación astronómica es la imposibilidad de una medición visual directa de la distancia al astro, pudiéndose medir únicamente distancias angulares. Las coordenadas polares resultan perfectamente adaptadas a la premisa anterior pues separan la distancia r al astro de las dos coordenadas angulares. Desde un punto de vista práctico prescindir de la distancia equivale a suponer todos los astros proyectados sobre una esfera de radio arbitrario que tomaremos como unidad. Esta esfera es llamada esfera celeste. En el caso de las órbitas de los cuerpos del sistema solar y de las naves espaciales la distancia es mucho menor que la distancia a las estrellas por lo que debe ser tomada en consideración, sin embargo, los parámetros angulares de su órbita pueden separarse y ser estudiados sustituyendo la órbita por su proyección en la esfera celeste que será una circunferencia. La necesidad de relacionar puntos en una esfera nos lleva a considerar una herramienta muy usada en Astronomı́a clásica: la trigonometrı́a esférica. En este libro se ha limitado al máximo el uso de triángulos esféricos, sin embargo, por claridad en la lectura de otros libros de Astrodinámica y Mecánica Celeste se estudian en este apartado las fórmulas básicas de la trigonometrı́a esférica: las fórmulas de Bessel. Comenzaremos recordando que la intersección de la esfera con un plano que pase por su centro es una circunferencia que llamaremos cı́rculo máximo. Si el plano no pasa por el centro de la esfera el cı́rculo será llamado cı́rculo menor. Trigonometrı́a esférica 17 Por otro lado, dados dos puntos en una esfera, existe uno y solo un cı́rculo máximo que pasa por ellos, pues estos dos puntos, junto con el centro determinan un plano que corta a la esfera en dicho cı́rculo máximo. Nótese que el cı́rculo máximo es el equivalente a la recta en la geometrı́a plana. En geometrı́a plana, queda perfectamente determinado el concepto de segmento de recta como la parte de la recta que une dos puntos. Sin embargo, dados dos puntos en la esfera, al ser cerrado el cı́rculo máximo que los une, quedan determinados dos segmentos y no uno. Para evitar confusiones consideraremos únicamente como segmento que une dos puntos al menor de ambos. Uno de los parámetros que representan un segmento de recta es su longitud. Esto ocurre también cuando consideramos un segmento de cı́rculo máximo, sin embargo, puesto que al trabajar en la esfera se pretende eliminar el concepto de distancia, o lo que es igual las dimensiones de longitud, deberemos sustituir el concepto de longitud del segmento por algún otro concepto equivalente. Para ello, basta recordar la expresión l = r✓, que relaciona la longitud del segmento de circunferencia con el producto del arco que éste abarca por el radio de la circunferencia. Si consideramos el radio como unidad de distancia, la longitud del segmento equivale al arco. Ası́ pues, a partir de ahora, cuando hablemos de longitud del segmento que une dos puntos de la esfera, entenderemos como tal el arco que dicho segmento abarca, expresado en radianes. Tres puntos no alineados en un plano forman un triángulo plano, que queda caracterizado por seis parámetros: la longitud de los tres lados y los ángulos que forman entre si los tres lados. Si tomamos tres puntos sobre una esfera podemos unirlos dos a dos por medio de segmentos de cı́rculo máximo (figura 1.5). La figura formada en la esfera por estos tres segmentos será llamada triángulo esférico. A b c B a C Figura 1.5: Triángulo esférico. Un triángulo esférico viene caracterizado también por seis elementos: la longitud de sus tres lados (a, b, c), que como hemos dicho antes viene expresada en Sistemas de referencia en IR3 18 radianes, y por sus tres ángulos (A, B, C) que quedan definidos por los tres ángulos que forman entre si los planos que definen cada par de cı́rculos máximos. Debido a la forma de elegir el segmento entre los dos posibles, los tres lados verifican la relación a 2 [0, ⇡], b 2 [0, ⇡], c 2 [0, ⇡]. De la misma forma esto obliga a que se verifiquen también las relaciones A 2 [0, ⇡], B 2 [0, ⇡], C 2 [0, ⇡]. La trigonometrı́a esférica permite obtener los seis elementos de un triángulo esférico a partir de tres cualesquiera de ellos. 1.10.1 Fórmulas de Bessel Con objeto de encontrar las fórmulas que nos permitirán resolver un triángulo esférico, definiremos un sistema de referencia en el que el origen coincida con el centro de la esfera. De esta forma los vectores, de norma unidad, que unen el origen con cada vértice del triángulo esférico serán llamados a = OA, b = OB, c = OC. Elegiremos un sistema de referencia ortogonal directo de forma que i3 = a, y b esté en el plano formado por Oxz. Ası́, atendiendo a la figura 1.6, podemos deducir que: a b c = = = i3 , sen c i1 + cos c i3 , sen b cos A i1 + sen b sen A i2 + cos b i3 . (1.36) Puesto que el ángulo entre cada par de vectores es igual al lado que forman sus vértices podremos poner, por un lado b · c = cos a, a A b ⇡ 2 c ⇡ 2 c b A Figura 1.6: Vectores que definen los vértices del triángulo. y por otro, sustituyendo el valor de los vectores dado por las relaciones (1.36), obtendremos b · c = cos b cos c + sen b sen c cos A. Igualando las dos últimas ecuaciones se obtiene la expresión cos a = cos b cos c + sen b sen c cos A, (1.37) que es la conocida como primera fórmula de Bessel o fórmula del coseno. Tanto en la anterior como en todas las fórmulas de la trigonometrı́a esférica podemos permutar las tres letras que representan lados y ángulos distintos. De esta forma las fórmulas obtenidas no serán únicas. En particular, la primera fórmula de Bessel debe leerse de la siguiente forma: el coseno de un lado es igual al producto Trigonometrı́a esférica 19 de los cosenos de los otros dos lados más el producto de los senos de los otros dos lados por el coseno del ángulo opuesto al primer lado. Ası́ tendremos tres y no una fórmula del coseno. Por otro lado, llamaremos A, B, C a los vectores unitarios ortogonales a los planos que contienen cada lado del triángulo esférico y cuya expresión viene dada como C= o lo que es igual a⇥b , ka ⇥ bk B= c⇥a , kc ⇥ ak A= b⇥c , kb ⇥ ck (1.38) cos c sen A sen b cos A cos c sen b cos b sen c sen A sen b sen c i1 + i2 + i3 , sen a sen a sen a B = sen A i1 cos A i2 , A = C = i2 . (1.39) Los extremos de los vectores A, B, C forman otro triángulo esférico (figura 1.7), que es llamado triángulo polar, cuyos lados son a0 = ⇡ A, b0 = ⇡ B, c0 = ⇡ C y cuyos ángulos son A0 = ⇡ a, B 0 = ⇡ b, C 0 = ⇡ c. Por ser ⇡ B el ángulo entre A y C tendremos, por un lado, que A a kA ⇥ C k = = k A kk C k sen(⇡ B) sen B, y por otro lado C c b A ⇡ 2 B A sen2 B = k A⇥C k2 = (A⇥C)·(A⇥C). Si sustituimos las expresiones dadas en (1.39), desarrollamos y efectuamos ciertas simplificaciones, llegaremos a la igualdad sen a sen B = sen b sen A. (1.40) Figura 1.7: Triángulo polar. Escribiendo esta expresión para todas las permutaciones de letras se obtiene la segunda fórmula de Bessel o fórmula de los senos que puede también expresarse en la forma siguiente sen a sen b sen c = = . sen A sen B sen C (1.41) Por último, si calculamos el producto escalar de A por C, tendremos por un lado A · C = cos(⇡ B) = cos B, Sistemas de referencia en IR3 20 y por otro A·C = cos b sen c + sen b cos c cos A , sen a lo que lleva finalmente a obtener la tercera fórmula de Bessel sen a cos B = cos b sen c sen b cos c cos A. (1.42) Las tres fórmulas de Bessel son válidas para cualquier triángulo esférico, por tanto lo serán también para el triángulo polar. Ası́ pues si las aplicamos para los elementos a0 = ⇡ A, b0 = ⇡ B, c0 = ⇡ C, A0 = ⇡ a, B 0 = ⇡ c, C 0 = ⇡ c, obtendremos, por un lado cos A = cos B cos C + sen B sen C cos a, (1.43) que será llamada primera fórmula polar, y por otro sen A cos b = cos B sen C + sen B cos C cos a, (1.44) que será llamada tercera fórmula polar. La segunda de Bessel aplicada al triángulo polar vuelve a dar la misma expresión, por lo que ha sido omitida y es la razón por la que no hemos definido ninguna segunda fórmula polar. 1.10.2 Regla del pentágono de Neper Las fórmulas de Bessel se simplifican cuando alguno de los elementos, bien sea un lado o un ángulo, vale 90 . A un triángulo de este tipo le llamaremos respectivamente triángulo rectilátero o triángulo rectángulo. Neper reunió todas las formulas de Bessel particularizadas para ambos casos y consiguió enunciar una regla muy simple, llamada regla del pentágono de Neper, que relaciona entre si todos los elementos de estos triángulos. Estas reglas van asociadas a cada uno de los pentágonos dibujados en las figuras 1.8(a), 1.8(b). Estos pentágonos pueden modificarse con una permutación cualquiera de las letras en él representadas. Hay dos reglas para cada pentágono que se pueden enunciar de la siguiente forma: El coseno de un elemento situado en un vértice es igual al producto de las cotangentes de los elementos situados en vértices contiguos. El coseno de un elemento situado en un vértice es igual al producto de los senos de los elementos situados en vértices opuestos. Trigonometrı́a esférica 21 a B 180 C A = 90 90 c 90 b b c a = 90 90 (a) Triángulo rectángulo. A C 90 B (b) Triángulo rectilátero. Figura 1.8: Pentágono de Neper. 1.10.3 Analogı́as de Neper Las cinco fórmulas de Bessel, y las que se derivan de la posible permutación de letras, permiten la resolución de cualquier tipo de triángulo esférico a partir de tres datos del mismo. Sin embargo, con objeto de discriminar de forma sencilla entre dos posibles soluciones es conveniente el uso de otro conjunto de fórmulas, obtenidas a partir de las anteriores, que serán llamadas analogı́as de Neper. Las analogı́as de Neper5 pueden escribirse como: A 2 a tan 2 tan = = cos sec b c 2 B C 2 b+c 2 B+C cos 2 sec B+C , 2 b+c tan . 2 cot (1.45) Veremos únicamente la obtención de la primera, pues el resto se obtiene de manera idéntica. Para ello, reuniremos convenientemente las expresiones (1.41) llegando a sen a (sen B + sen C) = sen A (sen b + sen c), por otro lado, aplicando dos de las permutaciones de las terceras fórmulas de Bessel (1.42), se llega a sen a(cos B + cos C) = (1 cos A)(cos c sen b + cos b sen c), que divididas nos conducen a sen B + sen C = cos B + cos C (1 sen A (sen b + sen c) . cos A)(cos c sen b + cos b sen c) 5 Existen otras expresiones similares, pero éstas nos dan la información suficiente para completar el algoritmo del próximo apartado. Sistemas de referencia en IR3 22 Usando simples relaciones trigonométricas se llega finalmente a tan B+C b c b+c A = cos sec cot , 2 2 2 2 que coincide con la primera de las expresiones (1.45). 1.10.4 Algoritmo para la resolución de triángulos esféricos Podemos encontrar un algoritmo muy simple para resolver cualquier triángulo esférico si tenemos en cuenta las siguientes propiedades derivadas de las funciones trigonométricas: Cualquier lado o ángulo de un triángulo esférico está en el primer o segundo cuadrante luego para determinarlo unı́vocamente se precisa conocer su coseno. La tangente del ángulo mitad determina, sin ambigüedad el cuadrante de cualquier ángulo. La resolución de un triángulo esférico del que conocemos tres elementos se realizará mediante seis conjuntos de fórmulas que representan casos idénticos salvo una permutación de letras. 1. Tres ángulos (A, B, C) conocidos. Solución única obtenida a partir de las tres fórmulas polares del coseno. 2. Tres lados (a, b, c) conocidos. Solución única obtenida a partir de las tres fórmulas del coseno. 3. Conocidos dos lados y un ángulo de manera que el ángulo no sea opuesto a ninguno de los dos lados. Esto corresponde a los tres casos: (a, b, C), (a, c, B), (b, c, A). Cada uno de estos casos tiene solución única en la que el tercer lado se obtiene por aplicación directa de la fórmula del coseno, y una vez obtenido éste, los otros dos ángulos se obtienen como en el segundo caso por aplicación de las fórmulas del coseno. 4. Conocidos dos ángulos y un lado de manera que el lado no sea opuesto a ninguno de los dos ángulos. Esto corresponde a los tres casos: (A, B, c), (A, C, b), (B, C, a). Cada uno de estos casos tiene solución única en la que el tercer ángulo se obtiene por aplicación directa de la fórmula polar del coseno, y una vez obtenido éste, los otros dos lados se obtienen como en el primer caso por aplicación de las fórmulas polares del coseno. Trigonometrı́a esférica 23 5. Conocidos dos lados y un ángulo de manera que el ángulo sea opuesto a alguno de los dos lados. Esto corresponde a los seis casos: (a, b, A), (a, b, B), (a, c, A), (a, c, C), (b, c, B), (b, c, C). Cada uno de estos casos tiene solución doble. Por ejemplo el caso (a, b, A) se resuelve aplicando en primer lugar la fórmula de los senos para obtener B. Del seno se obtienen dos valores B1 , B2 que serán llevados junto con los de (a, b, A) a las analogı́as de Neper para obtener c y C. El resto de casos se resuelve también con una aplicación de la fórmula de los senos y luego las dos analogı́as de Neper. 6. Conocidos dos ángulos y un lado de manera que el lado sea opuesto a alguno de los dos ángulos. Esto corresponde a los seis casos: (A, B, a), (A, B, b), (A, C, a), (A, C, c), (B, C, b), (B, C, c). Cada uno de estos casos tiene solución doble. Por ejemplo el caso (A, B, a) se resuelve aplicando en primer lugar la fórmula de los senos para obtener b. Del seno se obtienen dos valores b1 , b2 que serán llevados junto con los de (a, b, A) a las analogı́as de Neper para obtener c y C. El resto de caos se resuelve también con una aplicación de la fórmula de los senos y luego las dos analogı́as de Neper. La indicación de solución única o doble de cada uno de los seis casos representa únicamente el número máximo de soluciones. En todos los casos puede haber menos soluciones. La anulación de la solución obtenida se realizará cuando se obtenga un valor mayor que la unidad para un seno o un coseno o al aplicar las analogı́as de Neper se obtenga un ángulo mayor que 180 . 24 Sistemas de referencia en IR3 Capı́tulo 2 Cambios del sistema de referencia: rotaciones 2.1 Introducción Si tenemos un punto P , referido a un sistema de referencia {O, i1 , i2 , i3 }, y queremos expresarlo en el sistema {O0 , f 1 , f 2 , f 3 } debemos transformar la expresión del vector OP en la base inicial {i1 , i2 , i3 } en la expresión del vector O0 P en la base del sistema final {f 1 , f 2 , f 3 }. Para ello debemos realizar dos operaciones: una traslación del origen, dada por la relación OP = OO0 + O0 P , un cambio de base para expresar los tres vectores de la relación anterior en la base del sistema final. En adelante prescindiremos de la traslación, suma del vector OO0 , por la simplicidad de esta operación y porque en la práctica casi todos los cambios de sistema de referencia que trataremos en este libro mantienen fijo el origen. Un cambio entre dos bases ortonormales de IR3 con la misma orientación será llamado rotación del sistema de referencia. 26 2.2 Cambios del sistema de referencia: rotaciones Rotaciones en IR3 Sea un vector x 2 IR3 que, expresado en la base1 I = {i1 , i2 , i3 }, tiene la forma x = x1 i 1 + x2 i 2 + x3 i 3 , (2.1) mientras que en la base F = {f 1 , f 2 , f 3 } se escribe x = X1 f 1 + X2 f 2 + X3 f 3 . (2.2) Para relacionar las componentes de x en ambas bases tendremos en cuenta, por un lado, que por ser F base de IR3 cualquier vector de IR3 podrá ser expresado en dicha base, por tanto, podremos escribir: i1 i2 i3 = = = r11 f 1 + r12 f 2 + r13 f 3 , r21 f 1 + r22 f 2 + r23 f 3 , r31 f 1 + r32 f 2 + r33 f 3 , (2.3) mientras que, por ser I base de IR3 , cualquier vector de IR3 podrá ser expresado en dicha base en la forma: f1 f2 f3 = = = s11 i1 + s12 i2 + s13 i3 , s21 i1 + s22 i2 + s23 i3 , s31 i1 + s32 i2 + s33 i3 . (2.4) Por ser las bases ortonormales, las componentes de un vector pueden obtenerse a través de los cosenos directores, luego se tendrá rij = cos(ii , f j ) = ii · f j = cos(f j , ii ) = sji , lo que permite finalmente escribir: f1 f2 f3 = = = r11 i1 + r21 i2 + r31 i3 , r12 i1 + r22 i2 + r32 i3 , r13 i1 + r23 i2 + r33 i3 . (2.5) Si en la igualdad (2.2) sustituimos los vectores f i por las expresiones dadas en (2.5), y la igualamos, componente a componente, a (2.1), obtendremos tres relaciones que en forma matricial se podrán poner como 0 1 0 x1 r11 @ x2 A = @ r21 x3 r31 r12 r22 r32 10 1 r13 X1 r23 A @ X2 A . r33 X3 (2.6) 1 Cuando no haya ambigüedad en el origen identificaremos con el mismo nombre al sistema de referencia y a la base que lo forma. Rotaciones en IR3 27 De la misma forma, sustituyendo en la igualdad (2.1) los vectores ii por las expresiones dadas en (2.3) e igualando, componente a componente, a (2.2) obtendremos la relación inversa de (2.6) en la forma 0 1 0 10 1 X1 r11 r21 r31 x1 @ X2 A = @ r12 r22 r32 A @ x2 A . (2.7) X3 r13 r23 r33 x3 De aquı́ en adelante, dado un vector cualquiera x de IR3 , utilizaremos un subı́ndice que coincida con el nombre de un sistema de referencia para indicar el vector columna formado por las componentes de x en la base de dicho sistema de referencia. De esta forma xI , xF serán: 0 1 0 1 x1 X1 xI = @ x 2 A , xF = @ X 2 A . x3 X3 Por otro lado, llamando RIF 0 r11 = @ r21 r31 r12 r22 r32 1 r13 r23 A , r33 (2.8) a la matriz cuyas columnas son las componentes de la base F en términos de la base I, la relación (2.6) se podrá poner como xI = RIF xF , (2.9) mientras que la matriz RF I 0 r11 = @ r12 r13 r21 r22 r23 permite poner la ecuación (2.7) en la forma 1 r31 r32 A , r33 xF = R F I xI . (2.10) (2.11) A partir de las propiedades anteriores se demuestra que la inversa de una matriz de rotación coincide con su traspuesta RF I = RIF1 = RTIF . Las matrices que cumplen esta importante propiedad son llamadas matrices ortogonales. La notación anterior, que usa dos subı́ndices que representan los nombres de los dos sistemas de referencia, no presenta ningún tipo de ambigüedad en la expresión de la rotación. Sin embargo, esto no sucede ası́ cuando se define 28 Cambios del sistema de referencia: rotaciones el concepto de matriz de rotación. Revisando la literatura nos encontramos dos definiciones distintas que responden a dos convenios diferentes. Los dos convenios son correctos siempre que no se mezclen entre si. Convenio A.- Llamaremos matriz de rotación entre los sistemas de referencia I y F, y la representaremos por el sı́mbolo R a la matriz RIF que permite expresar el vector xI como producto de la matriz R por el vector xF . Convenio B.- Llamaremos matriz de rotación entre los sistemas de referencia I e a la matriz R que permite expresar y F, y la representaremos por el sı́mbolo R FI e por el vector x . el vector xF como producto de la matriz R I Puede parecer absurdo introducir en este texto ambos convenios, sobre todo después de haber establecido inicialmente una notación que no contiene ninguna ambigüedad, sin embargo, hemos preferido introducir las dos notaciones con objeto de no modificar expresiones que son de uso común en la comunidad cientı́fica, en la que no siempre coincide el convenio utilizado para expresar las rotaciones. Siempre que sea posible utilizaremos los subı́ndices para evitar confusiones, en otros casos utilizaremos la notación con o sin tilde para especificar el convenio utilizado sin recordarlo en cada caso. 2.3 Composición de rotaciones Supongamos que partimos de un sistema de referencia S1 y vamos aplicando sucesivamente rotaciones que pasan de S1 a S2 , de S2 a S3 , etc. Llamaremos, respectivamente, ei = R Ri = RSi Si+1 , R , Si+1 Si a las matrices de cada rotación en ambos convenios. Sustituyendo sucesivamente el vector xSi por el producto RSi Si+1 xSi+1 se podrá poner x S1 = R S 1 S2 R S2 S3 . . . R Sn 1 Sn x Sn , (2.12) obteniéndose la matriz de giro como producto de las sucesivas matrices de giro en el orden en que éstos se producen. La expresión (2.12) puede ponerse también en la forma e xSn = Rx , S1 xS1 = RxSn , donde hemos llamado R = R1 R2 . . . Rn 1, (2.13) (2.14) a la matriz de giro compuesto en el primer convenio y e=R en R 1 e2R e1, ...R (2.15) a la matriz de giro compuesto en el segundo convenio. Podemos observar que el orden de las matrices en el producto cambia de un convenio al otro. Rotación de un vector alrededor de un eje 2.4 29 Rotación de un vector alrededor de un eje â (x · â)â x R[↵, â][x] Estudiaremos ahora el problema de la rotación de un vector x, un cierto ángulo ↵, alrededor de un eje â. El valor positivo o negativo del ángulo ↵ girado vendrá definido por la orientación dada por el vector â. Llamaremos R[↵, â][x] al vector resultante de la rotación que puede verse en la figura 2.1. Para obtener el valor de dicho vector elegiremos un sistema de referencia ortogonal directo en el R[↵, â][(â ⇥ x) ⇥ â] que â representa el eje Oz, el eje Oy vendrá definido por el vector Figura 2.1: Rotación de un vector alrededor de â⇥x, ortogonal a â, y por último el eje Ox por la dirección (â ⇥ un eje. x) ⇥ â, la única posible para que el sistema sea ortogonal y directo. De esta forma hemos elegido una base ortogonal {(â ⇥ x) ⇥ â, â ⇥ x, â}. (â ⇥ x) ⇥ â â ⇥ x La propiedad (1.20) permite escribir x = (x · â)â + (â ⇥ x) ⇥ â, por lo que, de acuerdo con la figura 2.1, tendremos R[↵, â][x] = (x · â)â + R[↵, â][(â ⇥ x) ⇥ â]. Teniendo en cuenta que R[↵, â][(â ⇥ x) ⇥ â] pertenece al plano Oxy y tiene una longitud ↵, podremos poner R[↵, â][(â ⇥ x) ⇥ â] = [(â ⇥ x) ⇥ â] cos ↵ + (â ⇥ x) sen ↵, y finalmente expresar el resultado del giro del vector x en la forma R[↵, â][x] = (x · â)â + [(â ⇥ x) ⇥ â] cos ↵ + (â ⇥ x) sen ↵. (2.16) Propiedad.- El resultado de aplicar consecutivamente a un vector x un giro de ángulo ↵ y otro de ángulo ↵ respecto a un cierto eje â es el mismo vector x, esto es, se verifica la relación R[↵, â][R[ ↵, â][x]] = x. 30 Cambios del sistema de referencia: rotaciones Propiedad.- La rotación de ángulo ( ↵) alrededor del eje ( â) es idéntica a la de ángulo ↵ alrededor del eje â, o lo que es igual, se verifica la relación R[↵, â][x] = R[ ↵, â][x]. Si aplicamos una rotación de ángulo dado ↵ alrededor de un eje â = a1 i1 + a2 i2 + a3 i3 al sistema de referencia I = {i1 , i2 , i3 }, éste se transformará en el sistema F = {f 1 , f 2 , f 3 } de manera que la expresión de los vectores f j vendrá dada por f j = R[↵, â][ij ]. Particularizando la relación (2.16) con la expresión de â = a1 i1 +a2 i2 +a3 i3 en la base I, obtendremos las expresiones de los elementos de la base F en términos de la base I, con lo que podremos calcular la matriz de rotación RIF 0 a21 + (a22 + a23 ) cos ↵ @ a1 a2 (1 cos ↵) + a3 sen ↵ a1 a3 (1 cos ↵) a2 sen ↵ a1 a2 (1 cos ↵) a3 sen ↵ a22 + (a21 + a23 ) cos ↵ a2 a3 (1 cos ↵) + a1 sen ↵ 1 a1 a3 (1 cos ↵) + a2 sen ↵ a2 a3 (1 cos ↵) a1 sen ↵ A . a23 + (a21 + a22 ) cos ↵ (2.17) Llamando, como en (2.8), rij a las componentes de esta matriz podemos concluir que se verifican las relaciones: 2 cos ↵ 2 a1 sen ↵ 2 a2 sen ↵ 2 a3 sen ↵ = = = = r11 + r22 + r33 r32 r23 , r13 r31 , r21 r12 , 1, (2.18) que permiten obtener la rotación alrededor de un eje que pasa de uno a otro sistema de referencia. Puede observarse que las ecuaciones (2.18) producen dos soluciones correspondientes a las dos rotaciones de signos opuestos vistas en la última propiedad. 2.5 Rotaciones elementales Llamaremos rotación elemental de eje j a aquella que transforma una base ortonormal I = {i1 , i2 , i3 } en otra también ortonormal F = {f 1 , f 2 , f 3 } manteniendo fijo el eje j, esto es ij = f j . Dichas rotaciones consisten (ver figura 2.2) en girar el sistema de referencia un cierto ángulo ✓ alrededor del eje definido por ij . La matriz de una rotación de este tipo será llamada Rj (✓). Calcularemos únicamente el valor de la matriz R1 (✓), siendo igual el cálculo de las otras dos R2 (✓), R3 (✓). Para ello tendremos en cuenta que, de acuerdo con el apartado anterior y la relación (2.16), los vectores de la nueva base {f 1 , f 2 , f 3 } vendrán dados por las expresiones f j = R[✓, i1 ][ij ] = (ij · i1 )i1 + [(i1 ⇥ ij ) ⇥ i1 ] cos ✓ + (i1 ⇥ ij ) sen ✓. Rotaciones elementales f3 31 i3 i3 i3 ⌘ f 3 f2 ✓ f3 ✓ f2 ✓ i2 ✓ i1 ⌘ f 1 ✓ i2 ⌘ f 2 i2 ✓ i1 i1 f1 f1 Figura 2.2: Rotaciones elementales alrededor de los tres ejes. De acuerdo con las condiciones de ortonormalidad de la base I y aplicando la anterior relación a los tres ı́ndices j = 1, 2, 3, se obtendrá: f1 f2 f3 = = = i1 , cos ✓ i2 + sen ✓ i3 , sen ✓ i2 + cos ✓ i3 . (2.19) Teniendo en cuenta como se forman las matrices de rotación, a partir de las expresiones de los vectores de la base, la matriz de giro alrededor del eje Ox podrá expresarse, de acuerdo con los dos convenios establecidos, en la forma: 0 1 0 1 1 0 0 1 0 0 e1 (✓) = @ 0 sen ✓ A , R cos ✓ sen ✓ A . (2.20) R1 (✓) = @ 0 cos ✓ 0 sen ✓ cos ✓ 0 sen ✓ cos ✓ De manera similar al eje Oy: 0 cos ✓ 0 R2 (✓) = @ sen ✓ y respecto a Oz: 0 cos ✓ R3 (✓) = @ sen ✓ 0 pueden obtenerse las matrices de giro elemental respecto 0 1 0 1 sen ✓ 0 A, cos ✓ 1 sen ✓ 0 cos ✓ 0 A , 0 1 0 cos ✓ e2 (✓) = @ 0 R sen ✓ 0 e3 (✓) = @ R cos ✓ sen ✓ 0 0 1 0 1 sen ✓ 0 A, cos ✓ (2.21) 1 0 0 A. 1 (2.22) sen ✓ cos ✓ 0 Las matrices anteriores representan, respectivemente, las matrices de rotación respecto a los tres ejes expresadas en los dos convenios. A partir de las propiedades de las funciones trigonométricas puede demostrarse fácilmente la relación ei (✓) = Ri ( ✓). R (2.23) 32 2.6 Cambios del sistema de referencia: rotaciones Ángulos de Euler Cualquier rotación de un sistema I = {i1 , i2 , i3 } a otro F = {f 1 , f 2 , f 3 } puede ser expresada a través de la composición de una serie de giros elementales. Esta descomposición, que puede ser efectuada de diversas maneras, será presentada aquı́ a través de los llamados ángulos de Euler que es su forma más común. Para ello supondremos que el plano de los vectores i1 , i2 es distinto al formado por f 1 , f 2 . Puesto que el origen O pertenece a ambos planos debe existir una recta común que estará caracterizada por el vector direccional l= i3 ⇥ f 3 . k i3 ⇥ f 3 k Como se ve en la figura (2.3) al ángulo entre el vector i1 y l le llamaremos ⌦. De esta forma si efectuamos una rotación de eje Oz y ángulo ⌦ pasaremos a un sistema de referencia I 0 dado por los vectores {l, i3 ⇥ l, i3 }. i3 f3 f2 I Desde la dirección l, eje Ox del ✓ I ⌦ nuevo sistema de referencia, podel mos efectuar un giro de ángulo I, i1 ángulo entre los vectores i3 y f 3 , Figura 2.3: Ángulos de Euler. que pasa al nuevo sistema de referencia I 00 = {l, f 3 ⇥ l, f 3 }, donde el eje Oz ya coincide con el del sistema F. f1 i2 Finalmente, llamando ✓ al ángulo que forman las direcciones l con f 1 , podemos efectuar un giro de eje Oz que pase al sistema de referencia final F = {f 1 , f 2 , f 3 }. Llamaremos ángulos de Euler a los tres ángulos (⌦, I, ✓) introducidos en los párrafos anteriores. Por medio de estos ángulos podemos representar cualquier rotación como composición de las tres rotaciones elementales anteriores en la forma xI = R3 (⌦)R1 (I)R3 (✓) xF , (2.24) o en el segundo convenio e3 (✓)R e1 (I)R e3 (⌦)x . xF = R I Esta relación, junto con la propiedad (2.23), permite poner la expresión anterior en la forma xF = R3 ( ✓)R1 ( I)R3 ( ⌦)xI , lo que nos indica que si (⌦, I, ✓) son los tres ángulos de Euler que pasan de I a F, entonces los ángulos ( ✓, I, ⌦) son los ángulos de Euler que pasan de F a I. Cuando los planos i1 , i2 y f 1 , f 2 coincidan el problema es mucho más simple, pues en este caso una única rotación alrededor del eje Oz es suficiente para pasar al Rotaciones y cuaternios 33 sistema de referencia final. Manteniendo la forma de definir los ángulos de Euler podemos considerar este caso como una rotación de ángulos de Euler (⌦, I = 0 , ✓ = 0 ). Dados dos sistemas de referencia I y F, en los que conocemos las expresiones de los vectores de la base de F expresados en la base de I, podemos obtener los ángulos de Euler que pasan de I a F a través de un sencillo algoritmo. El ángulo ⌦ es la longitud del vector l, o de i3 ⇥ f 3 en el sistema de referencia I, por lo que podemos poner ⌦ = polar ((i3 ⇥ f 3 )I ). (2.25) El ángulo I es el ángulo entre los vectores i3 y f 3 , luego verifica I = acos(i3 · f 3 ), (2.26) expresión que nos da sin ambigüedad este ángulo pues pertenece al intervalo [0, ⇡]. Finalmente, el ángulo ✓ es la longitud del vector f 1 en el sistema de referencia I 00 = {l, f 3 ⇥ l, f 3 }, por tanto tendremos e1 (I)R e3 (⌦)(f 1 ) ). ✓ = polar ((f 1 )I00 ) = polar (R I (2.27) Si tenemos las expresiones de la base de I en términos de la base de F, para encontrar los ángulos de Euler basta encontrar, por el procedimiento anterior, los ángulos de Euler que pasan de F a I y cambiarles el signo y el orden. 2.7 Rotaciones y cuaternios La expresión (2.17), de la matriz RIF que pasa de I a F, puede ponerse, después de una serie de manipulaciones algebraicas, en la forma2 0 2 1 q0 + q12 q22 q32 2(q1 q2 q0 q3 ) 2(q1 q3 + q0 q2 ) @ 2(q1 q2 + q0 q3 ) q02 q12 + q22 q32 2(q2 q3 q0 q1 ) A , (2.28) 2 2(q1 q3 q0 q2 ) 2(q2 q3 + q0 q1 ) q0 q12 q22 + q32 donde: q0 = cos ↵ , 2 qi = ai sen ↵ , 2 (2.29) son llamados parámetros de Euler de la rotación. El tratamiento de las rotaciones por medio de los parámetros de Euler se simplifica si se introduce un conjunto de números, desarrollados por Hamilton, y que son llamados cuaternios. 2 En muchos libros aparece la traspuesta de esta matriz porque usan el convenio B. 34 Cambios del sistema de referencia: rotaciones Los cuaternios son una extensión de los números complejos que se definen a partir del elemento q = q 0 + i q1 + j q 2 + k q 3 , (2.30) donde se han introducido tres números imaginarios i, j, k, en lugar de uno, cuyos productos respectivos se definen como: i2 = j 2 = k 2 = 1, ij = ji = k, jk = kj = i, ki = ik = j. (2.31) A q0 le llamaremos parte real del cuaternio, mientras que el resto será la parte imaginaria. Podemos definir la suma, producto por un escalar y el producto de cuaternios como las operaciones entre polinomios, y aplicar las relaciones (2.31). De esta forma, dados dos cuaternios cualesquiera q a = q0a + i q1a + j q2a + k q3a , q b = q0b + i q1b + j q2b + k q3b y un número real r, tendremos q a + q b = (q0a + q0b ) + i (q1a + q1b ) + j (q2a + q2b ) + k (q3a + q3b ), (2.32) para la suma, r q a = r q0a + i r q1a + j r q2a + k r q3a , (2.33) para el producto por un escalar, y qa qb = (q0a q0b q1a q1b q2a q2b q3a q3b )+ i (q0a q1b + q1a q0b + q2a q3b q3a q2b )+ j (q0a q2b + q2a q0b + q3a q1b q1a q3b )+ k (q0a q3b + q3a q0b + q1a q2b q2a q1b ), (2.34) para el producto. Estas operaciones dotan al conjunto de los cuaternios de una estructura de álgebra. Observemos que el producto de dos cuaternios tiene la propiedad asociativa, pero no la conmutativa. De forma similar que para los números complejos podemos definir el conjugado qe de un cuaternio q = q0 + i q1 + j q2 + k q3 como el cuaternio que tiene la misma parte real que q pero la parte imaginaria está cambiada de signo, esto es qe = q0 i q1 j q2 k q3 . Para relacionar las rotaciones con los cuaternios estableceremos una relación entre éstos y los vectores definiendo, a partir de un vector x cuyas componentes en una cierta base I son (x, y, z), el cuaternio de parte real nula x = i x + j y + k z. Con esta definición podemos demostrar, por simple comprobación, que la relación que nos da el cambio de base de un vector x, que en forma matricial se puede poner como xI = RIF xF , Rotaciones y cuaternios 35 tiene su equivalente, a partir de un producto de cuaternios3 , en la expresión xI = q xF qe, (2.35) donde q = q0 + q1 i + q2 j + q3 k, y (qo , q1 , q2 , q3 ) representan los parámetros de Euler de la rotación. La composición de dos rotaciones que pasan de Ia a Ib y de éste a F se realizarán a partir de dos cuaternios: q a , q b . De esta forma xIa = q a xIb qea , por lo que finalmente podremos poner xIb = q b xF qeb , xIa = q a q b xF qeb qea = q xF qe, q = qa qb . (2.36) Ası́ pues, el cuaternio asociado a la composición de las dos rotaciones viene dado por el producto de los cuaternios de cada una de las rotaciones en el orden de aplicación de éstas. Las rotaciones elementales R1 (✓), R2 (✓), R3 (✓) vienen caracterizadas, respectivamente, por los siguientes cuaternios: (cos ✓/2 + i sen ✓/2), (cos ✓/2 + j sen ✓/2), (cos ✓/2 + k sen ✓/2). Por otro lado, si tenemos una rotación definida a partir de los tres ángulos de Euler ⌦, I, ✓, el cuaternio asociado a esta rotación será el producto de los tres cuaternios q = (cos ⌦ ⌦ I I ✓ ✓ + k sen )(cos + i sen )(cos + k sen ), 2 2 2 2 2 2 cuyas componentes son: I ⌦+✓ cos , 2 2 I ⌦ ✓ q1 = sen cos , 2 2 I ⌦ ✓ q2 = sen sen , 2 2 I ⌦+✓ q3 = cos sen . 2 2 q0 = cos 3 En los libros que utilizan el convenio de matrices B, se define como qe x q. (2.37) 36 Cambios del sistema de referencia: rotaciones Capı́tulo 3 Fundamentos de los sistemas de referencia en el espacio 3.1 Introducción En el capı́tulo primero se ha establecido que un sistema de referencia está formado por un punto origen O y una base ortonormal directa {i1 , i2 , i3 }. Para determinar esta base es suficiente, desde el punto de vista práctico, especificar dos elementos: El plano fundamental o plano formado por los vectores i1 e i2 . Este plano puede sustituirse por el vector i3 que es perpendicular al plano fundamental o bien, si trabajamos en la esfera celeste, por un punto que representa el polo del sistema o punto intersección del eje i3 con la esfera. Una dirección origen de coordenadas representada por el vector i1 , o bien el punto de la esfera celeste intersección de ésta con la dirección origen. A este punto le llamaremos por extensión el origen del sistema. A partir de estos dos elementos quedan unı́vocamente determinados los vectores i1 e i3 , ası́ como i2 , pues la condición de sistema ortonormal directo obliga a tomar i2 = i3 ⇥ i1 . Observando los fenómenos astronómicos más simples y conocidos se pueden establecer tres planos que serán la base de los cuatro sistemas de referencia comúnmente utilizados en Astronomı́a. Estos sistemas, junto con los planetográficos presentados al final del capı́tulo, constituyen el fundamento de los sistemas de 38 Fundamentos de los sistemas de referencia en el espacio referencia en el espacio que serán útiles tanto para el establecimiento de las coordenadas astronómicas y geográficas o planetográficas como para el establecimiento de sistemas de referencia para la navegación espacial. En los dos próximos capı́tulos distinguiremos entre los sistemas de referencia idealizados, que parten de la premisa de que los planos y puntos usados como referencia están fijos en el espacio, y los sistemas de referencia precisos, que toman en consideración, de forma rigurosa, las variaciones de estos planos y puntos. Si atendemos al movimiento orbital de la Tierra en torno al Sol, las leyes enunciadas por Kepler nos indican que éste tiene lugar en un plano que es llamado plano de la eclı́ptica. Por otro lado, la Tierra es un sólido de revolución que gira, con velocidad angular constante, alrededor de un eje. El plano perpendicular a dicho eje es llamado plano del ecuador y la intersección del eje de rotación con la superficie de la Tierra y con la esfera celeste nos define, respectivamente, el polo terrestre y el polo celeste. Los planos del ecuador y la eclı́ptica son, en una primera aproximación, planos fijos en el espacio. Su intersección (ver figura 3.1), representada por el sı́mbolo , es un punto llamado equinoccio 1 o punto vernal. El ángulo ✏ entre los dos planos es llamado oblicuidad de la eclı́ptica y tiene un valor aproximado de 23 270 . eclı́ptica ✏ ecuador La combinación de la atracción gravitacional junto con la rotación de la Tierra determinan, para cada observador situado en su superficie, una dirección privilegiada, llamada dirección vertical, que se observa de manera muy precisa con una simple plomada. El Figura 3.1: Planos del ecuador y de la plano perpendicular a la vertical de un eclı́ptica. lugar es el llamado plano horizontal u horizonte. Puesto que la dirección de la vertical depende del lugar, el plano horizontal resulta ser un plano distinto para cada observador. Mediante estos planos y sus intersecciones definiremos los elementos necesarios para establecer las bases de los sistemas de referencia fundamentales, pero además, deberemos establecer el origen del sistema. Utilizaremos distinto nombre según el origen elegido, ası́ llamaremos a los sistemas: 1 En realidad existen dos equinoccios: el de primavera o punto en el que el Sol cruza el ecuador con declinaciones crecientes (acercándose al polo norte) y el equinoccio de otoño, que es el punto opuesto. De aquı́ en adelante cuando hablemos del equinoccio nos referiremos al equinoccio de primavera. Sistema de referencia horizontal 39 topocéntrico, si el origen es un lugar en la superficie de la Tierra, geocéntrico, si el origen es el centro de masas de la Tierra, heliocéntrico, si el origen es el centro de masas del Sol, baricéntrico, si el origen es el baricentro del sistema solar, planetocéntrico, si el origen es el centro de masas de un planeta, selenocéntrico, si el origen es el centro de masas de la Luna. El cambio entre sistemas con centros diferentes requerirá aplicar una traslación, para lo que será necesario el vector de posición relativa entre los dos centros expresado en la base correspondiente. Finalmente introduciremos una breve nota relativa a la notación utilizada, de aquı́ en adelante, para dar nombre a los sistemas de referencia. Utilizaremos una letra mayúscula caligráfica que hará mención, bien al plano fundamental, o bien a su polo. Un subı́ndice indicará el origen. Ası́, un sistema cuyo plano fundamental sea el ecuador y origen el equinoccio se representará por E , donde la letra E hace mención al plano del ecuador, mientras para un sistema cuyo plano fundamental sea el de la eclı́ptica, y que tenga el mismo origen, usaremos la notación K , que hace mención al polo de la eclı́ptica en lugar del plano. Puesto que en lo que sigue se hará hincapié en el cambio de base no se especificará, en general, el origen O del sistema. 3.2 Sistema de referencia horizontal Situando un punto de la superficie terrestre como origen del sistema de referencia, elegiremos su plano horizontal como primer plano fundamental. El eje ortogonal al plano horizontal (dirección vertical) corta a la esfera celeste en dos puntos llamados zenit2 , Z, y nadir, N . Llamaremos Z 3 al vector unitario que une el origen con el zenit. Para determinar un sistema de referencia ortonormal directo a partir Z 3 habrá que fijar las direcciones fundamentales Z 1 y Z 2 sobre el plano del horizonte. La Tierra gira alrededor de un eje que une los polos. Para un observador del hemisferio norte, el polo norte, que puede ser observado cerca de la estrella polar, señala el Norte geográfico. Debido a la rotación de la Tierra, todos los astros salen por el horizonte hacia el Este (aunque no exactamente por él), se van elevando sobre el horizonte, alcanzan su máxima elevación precisamente en la dirección Sur, y se ponen de nuevo hacia el Oeste (aunque no exactamente por él). Tenemos, pues, los cuatro puntos cardinales, la dirección Norte–Sur que se puede determinar fácilmente por observación, y la Este–Oeste perpendicular a la anterior. 2 Palabra de origen árabe que significa punto situado sobre nuestra cabeza. 40 Fundamentos de los sistemas de referencia en el espacio Si llamamos Z 1 al vector unitario en la dirección Oeste y Z 2 al vector unitario en la dirección Sur, junto con la dirección vertical que determina Z 3 , queda establecida la base que determina el sistema de referencia horizontal. El origen natural de este sistema es el lugar de observación, sin embargo, en ocasiones trasladaremos el origen de dicho sistema al centro de masas de la Tierra. En general, si no hay confusión con el origen, hablaremos del sistema ZW = {Z 1 , Z 2 , Z 3 }. Z3 z Z2 h A Z1 W (Oeste) S (Sur) Horizonte Podemos definir las coordenadas horizontales como las coordenadas polares esféricas en el sistema de referencia horizontal. Llamaremos Acimut3 , Figura 3.2: Sistema de referencia horizonA 2 [0, 2⇡), a la colongitud, medida tal ZW . Coordenadas horizontales. sobre el horizonte a partir del vector Z 2 , y distancia cenital, z 2 [0, ⇡], a la colatitud, medida a partir del eje Z 3 . Con esto, si las coordenadas horizontales de un astro son (A, z), su vector de posición x será x = sen z sen A Z 1 + sen z cos A Z 2 + cos z Z 3 , (3.1) o bien, con la notación introducida en los capı́tulos anteriores, xZW = cart(r, ⇡ 2 A, ⇡ 2 z), (3.2) donde se ha considerado que el punto está a una distancia r en lugar de tomarlo en la esfera celeste. En ocasiones se sustituye la distancia cenital por su complementario (latitud), y a esta coordenada se le llama altura, o elevación, h = ⇡/2 z. Dado que se ha tomado como plano fundamental el horizonte y como direcciones fundamentales los puntos cardinales y la vertical, resulta claro que se trata de un sistema de coordenadas locales, es decir, dependen del punto de la superficie de la Tierra tomado como origen. 3 Esta es la definición usada habitualmente en Astronomı́a y la que mantendremos a lo largo de este libro porque nos permite una fácil relación con el sistema de referencia horario. En geodesia, cartografı́a y navegación suele medirse desde el Norte y no desde el Sur por lo que diferirá en 180 de la utilizada aquı́. Sistema de referencia horario 3.3 41 Sistema de referencia horario Tomemos de nuevo como origen el observador y definamos un sistema de referencia en el que el plano del ecuador, o uno paralelo a éste que pase por el observador, sea el plano fundamental. De esta forma P 3 es el vector unitario en la dirección del polo norte. La intersección entre el ecuador y el horizonte determina la lı́nea Este–Oeste. Tomamos como vector P 1 el vector unitario en la dirección Oeste y como vector P 2 el producto P 2 = P 3 ⇥ P 1 . Con esta definición, los vectores P 1 y Z 1 coinciden. Al sistema EW = {P 1 , P 2 , P 3 } le llamaremos sistema de referencia horario. P (Polo norte) P3 H P1 W Ecuador Los semicı́rculos máximos que unen los polos se denominan meridianos. En Paralelo particular, al meridiano que contiene al zenit, es decir, al que contiene los extremos de los vectores Z 3 y P 3 , se le llama meridiano del lugar. A los planos paralelos al ecuador se les conoce como paralelos. P2 Meridiano Figura 3.3: Sistema de referencia horario EW . Coordenadas horarias. Las coordenadas polares que determinan la dirección de un astro E en este sistema de referencia son: el ángulo horario H 2 [0, 2⇡), que representa la colongitud, y que, por la razón que expondremos más adelante, se suele expresar en horas y la declinación 2 [ ⇡/2, ⇡/2], que representa la latitud. Con esto, el vector unitario x en la dirección del punto E es x = cos sen H P 1 + cos cos H P 2 + sen P 3 , (3.3) o también, situando el punto a una distancia r, tendremos xEW = cart(r, ⇡ 2 H, ). (3.4) Debido al movimiento diurno, todos los puntos de la esfera celeste giran alrededor del eje de los polos, permaneciendo a la misma distancia angular con respecto al ecuador, esto es, recorriendo un paralelo. De esta forma, su declinación, , permanecerá constante, mientras que el ángulo horario, H, dará una vuelta completa en un dı́a; de ahı́ el nombre de “horario” y el que se represente en horas. Al igual que sucedı́a con las coordenadas horizontales se trata de un sistema de coordenadas locales puesto que los vectores fundamentales P 1 y P 2 dependen del lugar elegido. 42 3.4 Fundamentos de los sistemas de referencia en el espacio Sistema de referencia ecuatorial Para que el sistema de referencia no dependa de la posición del observador ni del movimiento diurno usaremos de nuevo el plano del ecuador como plano fundamental, pero elegiremos como dirección origen, esto es como vector e1 , la dirección del equinoccio . El vector e3 coincidirá con la dirección del polo, es decir, e3 = P 3 y el vector e2 es el producto e2 = e3 ⇥ e1 . Además, supondremos el origen en el centro de masas de la Tierra. De esta forma definimos el sistema de referencia ecuatorial E = {e1 , e2 , e3 }. P e3 Paralelo e1 ↵ Ecuador e2 Meridiano Las coordenadas polares, longitud y latitud en este caso, que determinan la dirección de un astro E en este sisteFigura 3.4: Sistema de referencia E . Coorma de referencia, reciben el nombre de: denadas ecuatoriales. ascensión recta ↵ 2 [0, 2⇡), que también se suele expresar en horas, y declinación 2 [ ⇡/2, ⇡/2]. Ası́, el vector unitario x en la dirección del punto E será x = cos cos ↵ e1 + cos sen ↵ e2 + sen e3 , (3.5) o también, situando el punto a una distancia r, tendremos xE = cart(r, ↵, ). (3.6) Se trata, como ya hemos advertido, de un sistema de coordenadas absoluto, es decir, las coordenadas (↵, ) de un astro son independientes del lugar de observación y del movimiento diurno, pues el punto también es arrastrado por dicho movimiento. 3.5 Sistema de referencia eclı́ptico La mayor parte de los objetos del sistema solar ocupan posiciones próximas a la eclı́ptica por lo que, en ocasiones, se suele utilizar otro sistema de coordenadas cuyo plano fundamental sea la eclı́ptica. Para ello, definimos el sistema de referencia eclı́ptico, K = {K 1 , K 2 , K 3 }, de tal modo que el vector K 1 coincide con la dirección del equinoccio, K 1 = e1 , el vector K 3 es la dirección perpendicular a la eclı́ptica, cuya intersección con la esfera celeste será llamada polo de la eclı́ptica, y el vector restante el producto K 2 = K 3 ⇥ K 1 . Relación entre los sistemas de referencia espaciales Las coordenadas polares que determinan la dirección de un astro E en este sistema de referencia son: la longitud eclı́ptica 2 [0, 2⇡) y la latitud eclı́ptica 2 [ ⇡/2, ⇡/2]. El vector unitario x en la dirección del punto E es K3 x = K2 K1 43 cos cos K 1 + cos sen K 2 + sen K 3 , (3.7) o también, situando el punto a una distancia r, tendremos Eclı́ptica xK = cart(r, , ). Figura 3.5: Sistema de referencia eclı́ptico K . Coordenadas eclı́pticas. (3.8) Al igual que el sistema ecuatorial, éste es un sistema de coordenadas absoluto. En el caso particular del Sol la definición del plano de la eclı́ptica determina que su latitud eclı́ptica es siempre nula, por ello su posición queda determinada únicamente por su longitud eclı́ptica que se denota por el sı́mbolo . 3.6 Relación entre los sistemas de referencia espaciales P3 ⇡ 2 Z3 P2 P 1 ⌘ Z1 Z2 Figura 3.6: Transformación entre los sistemas horizontal y horario. Para relacionar los sistemas de referencia horizontal Z y horario P basta tener en cuenta que de acuerdo con la definición de las coordenadas geográficas, que veremos con detalle en un próximo apartado de este capı́tulo, llamaremos latitud de un lugar al ángulo entre la dirección vertical y el ecuador terrestre, que en la figura 3.6 se representa como el ángulo entre los vectores Z 3 y P 2 . Observando la figura 3.6 podemos concluir que para pasar del sistema horizontal al horario basta girar un ángulo igual a (⇡/2 ) alrededor del eje Ox. Por tanto, la matriz de giro entre estos dos sistemas será RZW EW = R1 (⇡/2 ), (3.9) 44 Fundamentos de los sistemas de referencia en el espacio y la relación entre las coordenadas en ambos sistemas vendrá dada por la expresión xZW = RZW EW xEW que, desarrollada, se escribirá en la forma: sen z sen A = cos sen H, sen z cos A = cos cos H sen sen cos , cos z = cos cos H cos + sen sen , (3.10) mientras que su inversa, xEW = REW ZW xZW , será: cos sen H = sen z sen A, cos cos H = sen z cos A sen + cos z cos , sen = sen z cos A cos + cos z sen . (3.11) Para establecer la relación entre los sistemas horario y ecuatorial tengamos en cuenta la figura 3.7. Habitualmente se llama tiempo sidéreo, ST , al ángulo horario del equinoccio . Este ángulo varı́a, por la rotación de la Tierra, entre 0h y 24h a lo largo de un dı́a por lo que representa el reloj natural de la Astronomı́a. P 3 ⌘ e3 ↵ H ST Sur P2 (Sur) L H ↵ e1 ( ) ST L Figura 3.7: Transformación entre los sistemas horario y ecuatorial. Para pasar del sistema horario al ecuatorial debemos girar alrededor de P 3 o eje Oz el ángulo entre P 1 y e1 , esto es ⇡/2 ST . La matriz de giro entre ambos sistemas será REW E = R3 (⇡/2 ST ). (3.12) La relación entre las coordenadas puede obtenerse, bien por la expresión xE = RE EW xEW , o bien, teniendo en cuenta que la declinación es común en ambos sistemas, basta observar la figura 3.7 para comprobar que ST = ↵ + H. (3.13) Sistema de referencia geográfico K3 ✏ e3 K2 e2 e1 ⌘ K 1 Figura 3.8: Transformación entre los sistemas ecuatorial y eclı́ptico. 45 Finalmente, para relacionar el sistema ecuatorial con el eclı́ptico basta recordar que la oblicuidad de la eclı́ptica ✏ es el ángulo entre los planos del ecuador y la eclı́ptica y, por tanto, también entre los vectores e3 y K 3 (figura 3.8). Si tenemos esto en cuenta, ası́ como el hecho de que los vectores e1 y K 1 coinciden, podemos concluir que el paso del sistema ecuatorial al eclı́ptico se realiza por una rotación elemental de ángulo ✏ alrededor del eje Ox, o lo que es igual, por medio de una matriz de rotación RE K = R1 (✏). (3.14) La relación entre las coordenadas en ambos sistemas vendrá dada por la expresión xE = RE K xK que, desarrollada, se escribirá en la forma: cos cos ↵ = cos cos , cos sen ↵ = cos sen cos " sen sen ", sen = cos sen sen " + sen cos ", (3.15) mientras que la relación inversa será: cos cos cos sen sen 3.7 = cos cos ↵, = cos sen ↵ cos " + sen sen ", = cos sen ↵ sen " + sen cos ". (3.16) Sistema de referencia geográfico Estudiando la figura que adopta un fluido en rotación en ausencia de fuerzas externas se comprueba que una de las posibles soluciones es un elipsoide de revolución achatado por los polos. De hecho, se ha comprobado que esta figura se aproxima mucho a la forma real no solo de la Tierra son de otros cuerpos como la Luna, Marte u otros planetas. Además, en todos los casos, el eje de simetrı́a de este elipsoide de revolución está tan próximo al eje de rotación del planeta que, en una primera aproximación, pueden considerarse idénticos. La necesidad de situar geográficamente puntos sobre la superficie de la Tierra ha llevado a definir un sistema de coordenadas geográficas sobre el elipsoide. La inclusión del concepto de altitud, para representar puntos de la Tierra que no se encuentren exactamente en el elipsoide, permite extender el uso de estas coordenadas geográficas para la determinación de la posición geográfica de los satélites artificiales. 46 Fundamentos de los sistemas de referencia en el espacio Para introducir unas coordenadas geográficas estableceremos un sistema de referencia G = {T, g 1 , g 2 , g 3 }, que llamaremos sistema de referencia geográfico 4 , donde T representa el centro de masas de la Tierra y g 3 el eje de revolución del elipsoide que también llamaremos eje polar pues por el momento supondremos que coincide con el eje de rotación del planeta. Por extensión el plano de g 2 y g 3 será el ecuador. Finalmente debemos elegir un meridiano cero también llamado meridiano de referencia o primer meridiano, tradicionalmente el meridiano de Greenwich. Este meridiano de referencia fija la posición del vector g 1 y por tanto la de g 2 = g 3 ⇥ g 1 . Las dimensiones del elipsoide quedan caracterizadas por un parámetro a que representa el radio ecuatorial del elipsoide y por el achatamiento f = (a b)/a, donde b es llamado radio polar. La combinación de la atracción gravitacional junto con la rotación de la Tierra determinan, para cada observador en la superficie, la dirección vertical de la que ya hemos hablado antes. Sin embargo, esta dirección no coincide exactamente con la normal al elipsoide de revolución en un punto, presentando desviaciones que han de ser determinadas para poder pasar de un sistema a otro. En el caso de la Tierra las desviaciones son del orden de 500 a 1000 , por lo que para la mayorı́a de aplicaciones astronómicas y astrodinámicas podemos prescindir de estas pequeñas diferencias y supondremos que la normal al elipsoide y la dirección de la plomada coinciden. g3 z b T a P ⇠ S S a b g2 ⇢ g1 a x Figura 3.9: Sistema de referencia geográfico. Veamos cómo podemos situar un punto S sobre las superficie del elipsoide. Las coordenadas polares esféricas de ese punto serán (⇢, , ), donde ⇢ es la distancia radial al centro de la Tierra, la longitud geográfica es el ángulo diedro que forma el meridiano de referencia con el meridiano del punto S. La longitud, que suele expresarse en horas, será tomada, de aquı́ en adelante, como un ángulo entre 0h y 4 En este sistema hemos usado un sı́mbolo G independiente del polo, del ecuador y del origen, pues estos puntos en el caso del elipsoide de referencia terrestre deberán ser redefinidos con más cuidado. Sistema de referencia geográfico 47 24h medido en sentido contrario a las agujas del reloj, lo que en la Tierra supone medirlo hacia el este. Habitualmente, cuando se da la posición geográfica de un lugar de la Tierra, suele utilizarse el convenio de dar el ángulo entre 0h y 12h hacia el este o el oeste, por lo que cuando se da longitud oeste será preciso cambiarle el signo y sumarle 24h para aplicar el convenio usado en este libro. Para determinar la latitud observaremos la figura de la derecha de 3.9, que representa la elipse meridiana, esto es, la intersección del plano del meridiano del lugar S con el elipsoide de referencia. Aquı́ distinguiremos dos puntos: el punto S del elipsoide del que estamos definiendo las coordenadas y un punto P que está a una distancia ⇠ de S sobre la vertical de éste. A ⇠ le llamaremos altitud de P . Definiremos en primer lugar las coordenadas de S y luego veremos como afecta en las coordenadas el hecho habitual de que el punto de la superficie de la Tierra, cuyas coordenadas se miden, no esté exactamente sobre en el elipsoide sino a una altitud ⇠ respecto a éste. El ángulo , denominado latitud geocéntrica, es el ángulo formado por el semieje mayor de la elipse meridiana con el radio que pasa por el punto S. Sin embargo, en coordenadas astronómicas suele emplearse la llamada latitud geográfica, de sı́mbolo , que es el ángulo formado por la normal a la elipse meridiana en el punto S (que como hemos mencionado anteriormente, haremos coincidir con la dirección de la plomada) con el semieje mayor de dicha elipse. Las dos longitudes , 2 [ ⇡/2, ⇡/2], aunque se suelen expresar siempre como cantidades positivas indicando si es latitud norte (N) o sur (S). Para establecer la relación entre ambas latitudes consideraremos un sistema de referencia plano en la elipse meridiana cuyos ejes Ox y Oz coinciden con la dirección de los semiejes mayor y menor de la elipse. En este sistema la ecuación de la elipse meridiana se puede poner como x2 z2 + = 1. a2 b2 La pendiente de la recta normal a la elipse es tan mientras que el ángulo dx a2 z = 2 , dz b x = viene dado por tan tan = 1 1 e2 = z/x, con lo que resulta tan , (3.17) siendo e la excentricidad del elipsoide que se obtiene a partir del radio ecuatorial a y el achatamiento f . El radio vector ⇢ se obtiene también sin dificultad, aunque con un poco más de cálculo. A partir de la ecuación de la elipse, b2 x 2 + a 2 z 2 = a 2 b2 , 48 Fundamentos de los sistemas de referencia en el espacio y teniendo en cuenta que x = ⇢ cos , se tiene ⇢2 = x2 = a 2 b2 + a2 sen2 b2 cos2 Por otra parte, al ser b2 x sen a4 z 2 cos2 , b4 sen2 z = ⇢ sen , = a2 (1 e2 ) . 1 e2 cos2 (3.18) = a2 z cos , resulta y de ahı́, z2 = b4 sen2 , a2 cos2 + b2 sen2 y con esto ⇢2 = x 2 + z 2 = a2 [cos2 + (1 e2 )2 sen2 ] . 1 e2 sen2 (3.19) Ahora bien, normalmente los lugares de observación no se encuentran sobre el elipsoide de referencia, sino a una cierta altitud, por eso se hace necesario el obtener las coordenadas de un lugar P situado a una altitud ⇠ sobre el horizonte. Recordemos que la latitud se mide sobre la normal al elipsoide. Por ello, se introducen unas cantidades C y S de modo que las coordenadas del punto resultan ser: x = ⇢ cos = a C cos , (3.20) z = ⇢ sen = a S sen . Dividiendo estas dos ecuaciones, se tiene S tan C = tan = b2 tan a2 = (1 f )2 tan , lo que, llevado a la ecuación de la elipse, nos da 1= x2 z2 + = C 2 [cos2 a2 b2 de donde se obtiene finalmente: p C = 1/ 1 f (2 + (1 f ) sen2 , f )2 sen2 )], S = C(1 f )2 . Con esto, si el punto P 0 se encuentra a una altitud ⇠ tendremos x0 z0 = = x+ x z+ z = = (a C + ⇠) cos , (a S + ⇠) sen , (3.21) siendo x0 , z 0 sus coordenadas sobre el plano del meridiano del observador. A partir de lo dicho hasta ahora podemos llamar coordenadas geográficas de un punto al conjunto de elementos ( , , ⇠) que describe su posición con respecto al elipsoide de referencia. Teniendo en cuenta todo lo anterior la expresión del Sistema de referencia geográfico 49 vector de posición de este punto, xG , expresado en el sistema de referencia G, vendrá dada por 0 (a C + ⇠) cos cos xG = @ (a C + ⇠) cos sen (a S + ⇠) sen 1 A. (3.22) En el caso de la Tierra, el IERS (International Earth Rotation and Reference System Service) ha definido el ITRS (International Terrestrial Reference System) como el elipsoide de referencia terrestre oficial. Tras muchos años de estudio de la forma de la Tierra, y una necesidad cada vez más imperiosa de precisión, se han modificado muchos de los estándares clásicos y se ha creado este marco teórico preciso que se debe materializar en modelos calculados que se adapten a este sistema. El ITRS es un modelo de elipsoide cuyo polo es el llamado IRP (Polo de referencia del IERS) y cuyo meridiano cero es el llamado IRM (Meridiano de referencia del IERS). Este sistema se ha creado de forma que sea consistente con el modelo del BIH de 1984, con el polo ajustado al antiguo CIO (Origen internacional convencional) que ha sido suprimido. De acuerdo con el convenio de notación establecido antes el sistema de referencia asociado a este modelo deberı́a llamarse IRP IRM sin embargo, por claridad, hemos preferido continuar usando para este sistema el sı́mbolo G. Una materialización de este sistema es el actual elipsoide WGS84 (World Geodetic System 1984) que es el modelo donde se representan las coordenadas emitidas por los satélites GPS. Debido a la importancia de esta información usaremos de aquı́ en adelante este modelo como modelo de la Tierra. El modelo WGS84 es consistente con ITRS con una aproximación de unos pocos centı́metros, por lo que será suficiente para todas nuestras aplicaciones. Los parámetros de dicho modelo se caracterizan por los siguientes elementos: el radio ecuatorial, que de aquı́ en adelante se denotará por r en lugar de a, y que vale r = 6378137 m, y f = 1/298.257223563. De esta forma el radio polar mide 6356752.3142 m. El meridiano de referencia IRM no coincide exactamente con el meridiano de Greenwich sino que está desplazado unos 100 m. hacia el este. Cuando las coordenadas de un lugar no se obtienen con GPS sino a partir de los modelos geodésicos de cada paı́s o región no se usa el modelo WGS84 sino que se usan modelos regionales mucho más precisos para una zona determinada pero que no son consistentes para la globalidad del globo terrestre. El modelo Español está integrado en el modelo Europeo ED50, y en él se dan todas las coordenadas geográficas oficiales. Existen métodos sencillos que permiten transformar las coordenadas entre ambos sistemas que no vamos a ver aquı́ porque exceden del propósito de este libro. El modelo llamado ETRS89 es una adaptación europea al modelo ITRS, o bien al WGS84. 50 Fundamentos de los sistemas de referencia en el espacio 3.8 Sistema de referencia planetográfico Teniendo en cuenta la posibilidad futura de enviar misiones, tanto a la Luna como a Marte, y aprovechando que la forma de dichos cuerpos es, como en el caso de la Tierra, un elipsoide de revolución, estableceremos un sistema genérico de coordenadas que llamaremos coordenadas planetográficas, que serán llamadas selenográficas en el caso de la Luna y areográficas en el caso de Marte5 y que en esencia son idénticas a las establecidas para la Tierra. El sistema de referencia donde se definirán las coordenadas planetográficas será llamado sistema p3 polo del planeta de referencia planetográfico P = {P, p1 , p2 , p3 }, donde p3 representa el eje de revolución que también llamaremos eje polar pues supondreS mos que coincide con el eje de rotab 6 ción del planeta . A la intersección P del eje de revolución y de rotación p2 a con la superficie del elipsoide le llamaremos polo del planeta. El plano p1 ecuador del planeta de los vectores p1 , p2 será llamado, por extensión, ecuador del planeta. Finalmente debemos elegir un meridiano cero o primer meridiano. Es- Figura 3.10: Sistema de referencia planete meridiano de referencia fija la po- tográfico. sición del vector p1 y por tanto la de p2 = p3 ⇥ p1 . En el caso de la Luna los valores que determinan el elipsoide son a = 1738.1 km, f = 0.0012, por lo que el radio polar será b = 1736.0 km. El primer meridiano está situado casi en centro de la cara visible y su velocidad de rotación, que determinará la posición del meridiano cero desde una dirección fija, es de una vuelta cada 27.321661 dı́as. Para Marte se tiene un radio ecuatorial de a = 3397 km y un achatamiento de f = 0.00736. El primer meridiano pasa por el crater Airy-0 y tiene un perı́odo de rotación de 1.025957 dı́as. Una vez creado el sistema planetográfico, donde podremos establecer la topografı́a del planeta, será necesaria la relación de éste con un sistema fijo como el ecuatorial a través de un sistema intermedio que llamaremos planetocéntrico. La forma usual de definir los elementos del sistema planetográfico P = {P, p1 , p2 , p3 } con respecto al sistema ecuatorial E = {P, e1 , e2 , e3 } es definir las coordenadas ecuatoriales del polo del planeta, (↵0 , 0 ), y determinar lo que llamaremos 5 Ares 6 El es el nombre griego de Marte. plano del ecuador de un planeta no coincide con el plano del ecuador terrestre. Sistema de referencia planetográfico 51 ángulo de rotación, W , que forma el vector p1 con respecto a la intersección del ecuador del planeta con el ecuador celeste. Comprobaremos a continuación que estos tres parámetros permiten efectuar el cambio entre los dos sistemas de referencia anteriores. p3 ⇡ 2 0 p1 P e1 ⇡ 2 $ W + ↵0 Suponiendo que el planeta rota con velocidad angular constante alrededor de su eje de rotación, el ángulo de rotación representa la posición instantánea del meridiano principal con respecto a una posición fija. Este ángulo, que es en cierto modo equivalente al tiempo sidéreo en la Tierra, podrá ponerse como W = W0 + t Wr , donde W0 representa el valor del ángulo en un cierto instante origen, t es el tiempo transcurrido desde ese instante origen medido en dı́as, y Wr es igual a 2⇡/Pr siendo Pr el periodo de rotación del planeta en dı́as. Llamaremos $ y a los puntos del ecuador del planeta que representan los extremos de los vectores p1 y P 1 = (e3 ⇥ p3 )/k e3 ⇥ p3 k. Este último determina la intersección del ecuador celeste y el del planeta y representa el primer meridiano o meridiano cero del planeta. De esta forma podemos definir dos sistemas de referencia asociados a la rotación del planeta, por un lado el que habı́amos llamado antes sistema planetográfico {P, p1 , p2 , p3 }, similar al geográfico en la Tierra, que es un sistema que rota con el planeta y que de ahora en adelante denotaremos por el sı́mbolo P$ y otro sistema que llamaremos sistema de referencia planetocéntrico P = {P, P 1 , P 2 , P 3 }, con P 3 = p3 y P2 = P 3 ⇥ P 1 , que es un sistema fijo pero cuyo plano fundamental coincide con el ecuador del planeta. Figura 3.11: Movimiento del sistema planetográfico respecto al sistema ecuatorial. Si (↵0 , 0) representan las coordenadas del polo del planeta podremos poner p3 = cos ↵0 cos 0 e1 + sen ↵0 cos 0 e3 + sen 0 e3 , por lo que podemos deducir fácilmente que P 1 = (e3 ⇥ p3 )/k e3 ⇥ p3 k = sen ↵0 e1 + cos ↵0 e2 , lo que equivale a decir que la ascensión recta de del punto se muestra en la figura 3.11. vale (⇡/2 + ↵0 ), como La inclinación entre los dos ecuadores viene dada por el ángulo entre los vectores e3 y p3 que es igual a (⇡/2 0 ). 52 Fundamentos de los sistemas de referencia en el espacio Con todo ésto podemos deducir que los ángulos de Euler que pasan del sistema E a P$ son (⇡/2 + ↵0 , ⇡/2 0 , W ) por lo que la matriz de rotación entre ambos sistemas será RE P$ = R3 (⇡/2 + ↵0 )R1 (⇡/2 (3.23) 0 )R3 (W ), y la matriz de paso de E a P será simplemente RE P = R3 (⇡/2 + ↵0 )R1 (⇡/2 0 ). (3.24) En el informe de G. Seidelmann et al.7 (2007) aparecen los valores de los elementos (↵0 , 0 , W ) para todos los planetas, la Luna y otros cuerpos del sistema solar obtenidos por el grupo de trabajo formado por la IAU para el estudio de la rotación de los planetas. 7 Ver bibliografı́a. Capı́tulo 4 Sistemas de referencia espaciales precisos 4.1 Movimientos del polo y del equinoccio Al introducir los sistemas de referencia espaciales en el capı́tulo anterior se ha supuesto que el ecuador y la eclı́ptica son planos fijos y, por tanto, que el equinoccio representa un punto fijo en la esfera celeste. Además, para definir las coordenadas geográficas y planetográficas hemos considerado que el eje de rotación del planeta, que define su polo y su ecuador, y el eje de revolución del elipsoide de referencia del planeta coinciden. La realidad es que ninguna de las premisas anteriores es cierta por lo que deben detallarse mucho más las definiciones a la hora de definir sistemas de referencia que cumplan los requerimientos de precisión de la Astrometrı́a y Astrodinámica actuales. Para entender el problema debemos comprender mejor el movimiento de rotación de los planetas. Supondremos, como primera aproximación, que éstos son sólidos rı́gidos, cuyo movimiento rotacional se describe por las ecuaciones de Euler del movimiento del sólido: I1 !˙ 1 + (I3 I2 !˙ 2 + (I1 I3 !˙ 3 + (I2 I 2 ) !2 !3 I 3 ) !1 !3 I 1 ) !1 !2 = = = µ1 , µ2 , µ3 , (4.1) donde I1 , I2 , I3 son los momentos principales de inercia del sólido, y ! = !1 p1 + !2 p2 + !3 p3 es el vector velocidad angular de rotación del sólido expresada en el sistema de referencia planetográfico P = {p1 , p2 , p3 }, que supondremos coincide 54 Sistemas de referencia espaciales precisos con el de ejes principales de inercia. Finalmente µ1 p1 + µ2 p2 + µ3 p3 representa el momento de las fuerzas externas que actúan sobre el sólido. La integración de las ecuaciones anteriores determinará el valor del vector !. Una vez obtenido éste podremos decir que el sólido rota con una velocidad angular ˆ del vector ! = k ! k alrededor de un eje cuya dirección coincide con la dirección ! !. Si suponemos que no actúa ninguna fuerza exterior sobre el sólido (µ1 = µ2 = µ3 = 0) y que éste es de revolución alrededor del eje Oz (I1 = I2 ), las ecuaciones de Euler (4.1) se transforman en: I1 !˙ 1 + (I3 I1 !˙ 2 + (I1 I3 !˙ 3 = 0. I1 ) !2 !3 = 0, I3 ) !1 !3 = 0, (4.2) De la tercera de estas ecuaciones se obtiene inmediatamente que !3 = ⌦ = constante. ! Las dos primeras ecuaciones (4.2) se pueden escribir como: !˙ 1 + !˙ 2 (4.3) p3 !2 = 0, E !1 = 0, E donde hemos introducido la constante E = I3 I1 I1 ⌦. p2 La solución de estas ecuaciones será !1 = A cos( !2 = A sen( Et + B), t E + B), (4.4) p1 donde A, la fase, y B, la amplitud, son constantes de integración. Las expresiones (4.3) y (4.4) determinan la velocidad angular de un pla- Figura 4.1: Movimiento del eje de rotación neta, considerando éste como un elip- de un sólido libre. soide rı́gido y sobre el que no actúan fuerzas externas. El valor p constante de A y ⌦ nos indica que la norma de la velocidad angular ! = A2 + ⌦2 es una constante, mientras que su dirección describe un cono alrededor del eje p3 , tal como se observa en la figura 4.1. Por ello, podemos decir que, en estas condiciones, un planeta gira con velocidad angular constante alrededor de un eje que describe un cono en torno al eje de simetrı́a del elipsoide. De esta forma vemos que el polo del planeta, esto es, el extremo del eje de rotación, no coincide con el polo del sistema planetocéntrico. Movimientos del polo y del equinoccio 55 En el caso de la Tierra, los valores de I1 , I2 , I3 verifican, aproximadamente, la relación (I3 I1 )/I1 ⇡ 2 ⇥ 10 5 . Con estos valores el periodo de rotación alrededor del eje de simetrı́a es de unos 304 dı́as, mientras que el valor de A es muy pequeño, de forma que la distancia angular entre la posición del polo de sistema planetográfico, extremo de p3 , y el polo de rotación, extremo de !, no es mayor que 0.00 2, lo que equivale a decir que la separación de estos dos puntos en la superficie terrestre nunca es mayor de 10 m. De acuerdo con la definición de dı́a, como el periodo de tiempo en que la Tierra da una vuelta alrededor de su eje de rotación, se tendrá que el valor de ! es exactamente de 2⇡ radianes por dı́a. Chandler observó, en 1891, que el periodo de 304 dı́as del eje de rotación, llamado en su honor periodo de Chandler, es realmente de unos 433 dı́as. Esta discrepancia se debe al hecho de que la Tierra no es completamente rı́gida, sino que tiene deformaciones elásticas. Además, también se observan fluctuaciones de periodo anual debidas a los cambios estacionales en la distribución de masas de aire, de aguas, deshielos, etc., e incluso variaciones irregulares, debidas a terremotos, volcanes, etc., es decir, a un cambio en la distribución de masas de la Tierra. Por otro lado, hemos estudiado una aproximación del problema real, pues no se han considerado los valores de las componentes, (µ1 , µ2 , µ3 ), del momento de las fuerzas producidas por el Sol, la Luna y los planetas. Figura 4.2: Gráfica del movimiento del polo. Datos del IERS. La gráfica 4.2 muestra los datos de movimiento del polo obtenidos por el IERS (International Earth Rotation and Reference Systems Service) para el perı́odo 56 Sistemas de referencia espaciales precisos comprendido entre 1890 y 2000, donde se da el desplazamiento, en segundos de arco, en el plano horizontal con centro en el polo del sistema de coordenadas geográfico y cuyo eje OX representa la dirección del meridiano cero de este sistema. Estos puntos representan el polo verdadero de rotación de la Tierra en cada instante y en consecuencia el ecuador verdadero de cada fecha. Incluyen todos los efectos que actúan sobre el eje de rotación y no pueden ser previstos a priori, sino que se calculan por observación. El IERS es el organismo internacional encargado del cálculo y distribución de estos datos. Hasta aquı́ se ha considerado únicamente la variación del eje de rotación terrestre debida al movimiento del sólido libre. Esta variación se ha representado a través del movimiento del polo y se ha referido al sistema sistema geográfico, solidario con el planeta. La variación del eje de rotación debida al efecto gravitacional del Sol y la Luna, por un lado, y de los planetas por otro, se estudia a través del movimiento del plano del ecuador, más concretamente a través del movimiento del equinoccio, y se refiere a un sistema espacial en lugar del sistema geográfico. Hiparco observó que el equinoccio se desplazaba sobre la eclı́ptica con un movimiento retrógrado de 2 cada 144 años, o lo que es igual, de 50.00 2 por año. Este desplazamiento fue llamado precesión de los equinoccios. Este fenómeno, debido en parte a la variación del plano del ecuador, tiene como consecuencia el desplazamiento del polo norte celeste, que completa una vuelta alrededor del polo de la eclı́ptica en unos 26000 años. El problema de la rotación de la Tierra, considerando todos los elementos que influyen en esta rotación, es uno de los más difı́ciles de la Mecánica Celeste. Esta complejidad es debida, sobre todo, a la falta de esfericidad de la Tierra y a que tanto el Sol, la Luna, como los planetas se mueven en órbitas cuyos elementos orbitales no se pueden expresar en forma cerrada, es decir, por medio de funciones elementales. La solución de las ecuaciones diferenciales que rigen este movimiento solamente se puede conocer mediante desarrollos en serie del tipo !✓ ◆ 1 1 1 X X X sen i k qj = si t + mk t (ci t + d), cos i=0 i=0 k=0 es decir, como suma de términos seculares (series de potencias en t) y términos mixtos (combinación de términos seculares y periódicos). Pues bien, los términos seculares son los responsables de la precesión, mientras que los periódicos y mixtos lo son de la nutación, término cuya raı́z latina nutare significa cabeceo1 . En este libro no estudiaremos la obtención de estas magnitudes, sino el efecto que producen en los sistemas de referencia espaciales. 1 Véase la sección 12.4 de este libro para una descripción de los distintos tipos de perturbaciones. La precesión se corresponde con las perturbaciones de largo periodo, mientras que la nutación es una perturbación de corto periodo. Sistemas de referencia espaciales precisos 57 Tanto el ecuador como la eclı́ptica se mueven. Al ecuador en un cierto instante, que representaremos por E, se le llama actualmente ecuador intermedio, aunque ha sido llamado también ecuador verdadero, ecuador aparente o ecuador de la fecha2 . A la intersección del ecuador intermedio con la eclı́ptica de la fecha se le llama equinoccio verdadero de la fecha o simplemente equinoccio de la fecha y se representa por , mientras que el ángulo entre estos dos planos es la oblicuidad verdadera de la fecha, ✏0 . ✏ Em E m ✏0 0 m eclı́ptica El ecuador intermedio o verdadero se obtiene corrigiendo por precesión y nutación el ecuador de un instante inicial. Si solamente corregimos por precesión, es decir, prescindimos de las variaciones periódicas que son mucho más pequeñas que las debidas a la precesión, obtenemos otro plano, próximo al ecuador verdadero, que se llama ecuador medio y se representa por E m . La intersección de la eclı́ptica con el ecuador medio se llama equinoccio medio, m , y el ángulo entre los dos planos oblicuidad media, ✏. La nutación establece la posición relativa en el espacio de los puntos y m , ası́ como de la diferencia entre las oblicuidades ✏ y ✏0 . Por otro lado, el punto m da, por el efecto de precesión, una vuelta completa al ecuador medio en un periodo de unos 26000 años. Figura 4.3: Precesión y nutación. Los puntos y m pertenecen a planos ecuatoriales distintos, sin embargo, en 0 ocasiones se habla de un punto llamado, por extensión, equinoccio medio, m en la figura (4.3), que es un punto del ecuador verdadero que pertenece al mismo meridiano que el equinoccio medio m . 4.2 Sistemas de referencia espaciales precisos La aparición del fenómeno de precesión-nutación obliga a una definición precisa de los sistemas de referencia basados en el ecuador. Podemos definir varios sistemas asociados a éste: Sistema ecuatorial verdadero de la fecha, E = {e1 , e2 , e3 }. Este sistema está basado en el ecuador intermedio y el equinoccio, , de la fecha. 2 De aquı́ en adelante usaremos indistintamente las palabras ...de la fecha o ...de la época para designar un elemento que depende de un instante dado. 58 Sistemas de referencia espaciales precisos m m Sistema ecuatorial medio, E mm = {em 1 , e2 , e3 }. Es el sistema referido al ecuador y equinoccio medios. Es el sistema verdadero sin corregir por nutación. Sistema ecuatorial de la época J2000.0 3 , E oo = {eo1 , eo2 , eo3 }. Este sistema es un sistema fijo definido a partir de la posición del ecuador y el equinoccio medios en un instante determinado, concretamente J2000.0. A partir de este sistema una corrección por precesión nos lleva al sistema E mm , mientras que una corrección por precesión y nutación nos lleva a E . 0 , que tiene como plano Sistema de ecuador verdadero–equinoccio medio, E m 0 fundamental el plano del ecuador verdadero y como origen el punto m . A las coordenadas ecuatoriales, medidas en cada uno de los tres primeros sistemas, se les da el nombre de coordenadas verdaderas, coordenadas medias y coordenadas de la época J2000.0. Para disponer de un sistema de referencia fijo, donde un objeto celeste sin movimiento propio tenga unas coordenadas constantes, y que sirva como sistema inercial al plantear las ecuaciones del movimiento de los cuerpos celestes, se definió con precisión el sistema ecuatorial E oo , que se materializó en la obtención del catálogo FK5, que no es sino el conjunto de las posiciones de una serie de objetos celestes medidas con una gran precisión y referidas a E oo . La comparación de las posiciones de otros objetos celestes con los del catálogo FK5 permite calcular las coordenadas precisas de dicho objeto. La Unión Astronómica Internacional, teniendo en cuenta la necesidad de una precisión mucho mayor que la obtenida con el uso del sistema E oo , estudió entre los años 1991 y 2000 una serie de cambios en la definición de los sistemas de referencia para hacerlos más rigurosos y precisos. Estos cambios fueros establecidos y están en vigor desde el año 2003. En primer lugar, de la misma forma que hace unos años en el tema de la medida del tiempo, se ha partido de una concepción de los sistemas de referencia basada en la teorı́a de la relatividad, lo que conduce a dos tipos de sistemas distintos: el sistema de referencia baricéntrico celeste, BCRS y el sistema de referencia geocéntrico celeste, GCRS. Ambos sistemas, definidos dentro del contexto de la teorı́a de la relatividad en la geometrı́a del espacio tiempo 4-dimensional, son dos sistemas centrados respectivamente en el baricentro del sistema solar y en el de la Tierra y con su tiempo propio, el tiempo coordenada baricéntrico TCB y el tiempo coordenada geocéntrico TCG . Ambos difieren fundamentalmente en el origen, pues sus ejes, que constituirán un sistema ortogonal directo, son paralelos y llevan direcciones fijas en el espacio4 . 3 El instante o época J2000.0 corresponde al dı́a 1 de enero de 2000 a las 12h TT y será explicado con detalle en el próximo capı́tulo. 4 Están definidos como cinemáticamente no rotantes, lo que significa que sus ejes no tienen rotación sistemática con respecto a objetos muy distantes en el universo sin movimiento propio. Sistemas de referencia espaciales precisos 59 Aunque la orientación de los ejes en la definición del sistema BCRS no está definida formalmente, estos ejes coinciden con los del sistema llamado Sistema de referencia celeste internacional, ICRS, cuya materialización práctica, al igual que el FK5 lo era del sistema E oo , viene dada por el ICRF5 , que no es sino el conjunto de posiciones de un gran número de radiofuentes extragalácticas. Los ejes de este sistema ICRS, que en la práctica coincide con el BCRS, están definidos de manera que sean consistentes con el sistema E oo , con una diferencia de alineación menor que 0.00 02, lo que es despreciable para la mayorı́a de las aplicaciones. En adelante llamaremos sistema espacial, S = {e1 , e2 , e3 }, a un sistema de referencia, que independientemente del origen, tiene unos ejes paralelos al ICRS. En particular tendremos: Sistema espacial geocéntrico 6 , SG , también llamado GCRS y que es el sistema espacial con centro en el centro de masas de la Tierra. Sistema espacial planetocéntrico, SP , o sistema espacial con centro en el centro de masas de un planeta P . El sistema SG (SP ) será el sistema que usaremos a partir de ahora para cualquier observación realizada desde la Tierra (planeta) y sobre todo, por ser éste un sistema inercial, para el planteamiento de las ecuaciones del movimiento de los satélites artificiales. El sistema SG es el sustituto actual de E oo , aunque como hemos dicho antes la diferencia entre ellos es muy pequeña. La transformación de uno a otro será estudiada más adelante. Por otro lado, aunque el plano fundamental del sistema SG es muy próximo al ecuador del instante J2000.0 no coincide exactamente con él por lo que las coordenadas obtenidas en este sistema no son exactamente ecuatoriales. Sin embargo, se ha mantenido el nombre de ascensión recta y declinación para las coordenadas en este sistema, especificando, cuando haya posibilidad de confusión, en cuál de los dos sistemas han sido medidas. Para obtener las coordenadas de un punto en el sistema SG debemos partir del sistema geográfico G, definido en el capı́tulo anterior, pues es en éste donde el IERS determina la posición del polo y, por tanto, del ecuador verdadero que es el que va asociado a la observación, por ello, para entender el proceso que relaciona los diferentes sistemas de referencia, debemos encontrar todo el conjunto de relaciones y sistemas intermedios que ligan los sistemas G y SG . En primer lugar llamaremos 5 HCRF es el nombre de otra materialización de este sistema de menor precisión que ICRF y obtenida con medidas realizadas desde el satélite Hipparcos. 6 Este nombre no es utilizado fuera de este libro pero nos ha parecido coherente su introducción, dentro del contexto de esta obra, con objeto de simplificar y sistematizar la gran cantidad de nombres que aparecen. 60 Sistemas de referencia espaciales precisos Polo celeste intermedio, CIP, o simplemente P , al polo verdadero que el IERS sitúa en el sistema de referencia G. El nombre de polo celeste intermedio viene a sustituir al de polo celeste de efemérides, CEP, usado hasta 2003. Perpendicular al eje determinado por este punto se encuentra el plano del ecuador intermedio con el que antes habı́amos definido el sistema E usando como origen el equinoccio de la fecha. Uno de los objetivos de la reforma de los sistemas de referencia de la IAU es obtener una mayor precisión, lo que se consigue minimizando al máximo las fuentes de error. El problema del movimiento del equinoccio proviene de dos movimientos: el del ecuador y el de la eclı́ptica. Si prescindimos de la eclı́ptica, para lo cual basta elegir un origen distinto al equinoccio, conseguiremos transformar el problema en uno en el que solo intervenga la rotación de la Tierra y no los problemas orbitales que perturban la eclı́ptica. Para definir otros orı́genes en el ecuador verdadero se ha introducido el concepto de origen no rotante que consiste en elegir un punto en el ecuador verdadero móvil de manera que la posición instantánea de ese punto siempre se mantiene perpendicular al ecuador, esto es, siempre se mueve en la dirección del polo P . De otra forma el movimiento de este punto presentarı́a una componente alrededor del eje polar que introducirı́a cierto movimiento espurio en el ángulo de rotación. Ası́, han sido definidos dos nuevos puntos: Origen celeste intermedio, CIO, representado por , que sustituye al equinoccio como origen de coordenadas. Origen terrestre intermedio, TIO, representado por $, que representa un punto en el ecuador que rota con la Tierra. Este punto sustituye al antiguo meridiano de Greenwich aunque está muy próximo al mismo. Los sistemas de referencia asociados a estos orı́genes y que tienen el ecuador intermedio como plano fundamental son llamados: Sistema celeste intermedio, E = {e1 , e2 , e3 }. $ $ Sistema terrestre intermedio, E$ = {e$ 1 , e2 , e3 }. 4.3 Transformaciones entre sistemas de referencia precisos En este apartado desarrollaremos las transformaciones necesarias para relacionar entre si todos los sistemas de referencia espaciales. Para esto seguiremos el esquema de la tabla 4.1, donde cada número representa una transformación entre dos sistemas contiguos, de manera que componiendo transformaciones podamos finalmente relacionar G con SG . Cada número del esquema corresponde a una de las siguientes transformaciones: Transformaciones entre sistemas de referencia precisos Gx ? ? T1? y E$x ? ? T2a? y Ex ? ? T6? y SG T2b ! T5 ! xE ? ? ?T3 y m E xm ? ? ?T4 y T2c ! E 61 0 m E oo Tabla 4.1: Transformaciones entre sistemas de referencia precisos. T1. La corrección por el movimiento del polo. T2. Tres cambios de origen en el ecuador intermedio que relacionan los sistemas 0 con origen en , $, y m . T3. La corrección por nutación. T4. La corrección por precesión. T5. La desviación entre los sistemas E oo y SG . T6. El tratamiento conjunto de la precesión-nutación sin usar el equinoccio. Como puede verse en la tabla 4.1 existen dos caminos para relacionar G con SG . El camino clásico, (T1,T2b,T3,T4,T5), usa la teorı́a de la precesión y nutación clásica basada en el equinoccio. Sin embargo, el moderno, (T1,T2a,T6), no usa el equinoccio. En lo que sigue describiremos ambos caminos, con los parámetros del camino clásico adaptados a los modelos desarrollados por la IAU en el año 2000. En los siguientes subapartados se describe cada transformación por separado, dando tanto los parámetros que la caracterizan como la matriz de transformación. En algunos casos escribiremos la expresión precisa de los parámetros en términos de una variable temporal Ts 7 que se explicará con detalle en el capı́tulo siguiente y que representa el número de siglos julianos transcurridos entre el instante del cálculo y un instante estándar J2000.0. En otros casos no se escribe la expresión debido a su enorme volumen. Tanto en estos casos como en los primeros, quien tenga necesidad de su uso, puede acudir al conjunto de rutinas SOFA8 y NOVAS9 , ambas escritas en lenguaje C y FORTRAN y desarrolladas respectivamente por 7T 2451545.0)/36525. s = (JDTT 8 http://www.iau-sofa.rl.ac.uk/ 9 http://aa.usno.navy.mil/software/novas/novas info.html 62 Sistemas de referencia espaciales precisos la Unión Astronómica Internacional y el USNO (U.S. Naval Observatory). Estas rutinas de software libre abarcan todas las transformaciones descritas en este capı́tulo. 4.3.1 Movimiento del polo (T1) El movimiento del polo permite relacionar el sistema geográfico G con el sistema E$ cuyo polo, CIP, y ecuador, son los verdaderos de la fecha y su origen es el origen terrestre intermedio, TIO (figura 4.4). Llamaremos matriz de tambaleo a la matriz que pasa del sistema E$ al sistema geográfico G RE$ G = W = W (xp , yp , s0 ), (4.5) donde (xp , yp , s0 ) son los tres parámetros que caracterizan el movimiento del polo. Por un lado (xp , yp ) representan la posición del polo instantáneo de rotación, CIP, respecto al sistema G, mientras que s0 es el localizador del TIO, es decir, representa el desplazamiento del origen de longitudes hasta el TIO, por lo que determina la posición exacta del primer meridiano de E$ . El valor de s0 viene dado por s0 = 0.00 000047 Ts , por lo que es despreciable para la mayor parte de las aplicaciones. El polo instantáneo, CIP, está muy próximo al polo internacional de referencia, IRP, su distancia es menor que 0.00 2, por lo que su posición en la esfera se puede aproximar por las coordenadas del punto en un sistema horizontal con centro en el polo de referencia y cuyo eje Ox representa la posición del meridiano origen, IRM, y el eje Oy la dirección Oeste (figura 4.4 izquierda). El IERS determina y publica en sus boletines A y B, unas coordenadas (x, y) que constituyen una buena aproximación a la posición del polo, expresadas en el sistema anterior, que deben ser corregidas por unos elementos (xp , yp ) = (x, y) + ( x, x)marea + ( x, x)nutación , que corresponden a la correcciones por marea oceánica y por nutación y que son menores que 0.00 01. Observando la derecha de la figura 4.4, y tras efectuar tres rotaciones elementales, llegamos a la relación RGE$ = R1 (yp )R2 (xp )R3 ( s0 ), cuya inversa es W = RE$ G = R3T ( s0 )R2T (xp )R1T (yp ), o teniendo en cuenta las relaciones entre las matrices de rotación elemental en sus dos convenios, tendremos finalmente e 3 ( s0 )R e2 (xp )R e1 (yp ), W =R (4.6) que es la expresión que habitualmente aparece en la literatura. Si efectuamos el producto de matrices anteriores, tenemos en cuenta que para un valor muy pequeño de un ángulo a, expresado en radianes, se puede poner Transformaciones entre sistemas de referencia precisos yp IRP g3 xp Oeste yp IRP 63 e$ 3 xp IRM g1 CIP e$ 1 IRM Meridiano origen s0 Figura 4.4: Movimiento del polo. cos a ⇡ 1, sen a ⇡ a, y despreciamos los productos de dos pequeños arcos, se obtendrá una expresión más simple de W , suficientemente aproximada en la mayor parte de las aplicaciones: 0 1 1 s0 xp 1 yp A . W ⇡ @ s0 xp yp 1 La longitud y latitud de un punto de la superficie terrestre, en el sistema geográfico G, son dos valores constantes ( 0 , 0 ) que junto con la altitud determinan la posición del punto. Sin embargo, la longitud y latitud de un punto de la superficie no son constantes cuando se considera el ecuador verdadero y el origen $. Las coordenadas de un punto en este sistema E$ serán dos variables que representaremos por ( , ). Este valor es muy importante pues son las coordenadas que deben usarse para la observación astronómica y las que definen con precisión las escalas de tiempo basadas en la rotación terrestre. ( El valor de ( , ), se obtendrá a partir de las coordenadas del observador 0 ) y del movimiento del polo W por medio de la expresión 0, cart(1, , ) = W cart(1, 0, 0 ). (4.7) Aunque la expresión anterior es exacta, el valor, extremadamente pequeño, de xp , yp y s0 permite obtener una aproximación que da directamente la longitud y latitud en la forma = o + tan = o + (xp cos o (xp sen o o + yp cos yp sen o) , o) , (4.8) 64 Sistemas de referencia espaciales precisos expresión válida tomando xp , yp en radianes. 4.3.2 Cambios de origen en el ecuador intermedio (T2) En el ecuador intermedio existen cuatro puntos que son orı́genes de cuatro sistemas de referencia distintos: el origen intermedio terrestre, TIO o $, el origen intermedio celeste, CIO o y finalmente el equinoccio verdadero, y el equinoccio 0 medio m . Para transformar entre si los sistemas de referencia que tienen como plano fundamental el ecuador y estos puntos como orı́genes basta efectuar un giro de eje Oz con el ángulo adecuado. El ángulo entre el punto $ y el equinoccio no es sino el ángulo horario del equinoccio medido desde el meridiano principal. Es por $ tanto el tiempo sidéreo del meridiano que pasa por $. Este meridiano no es el mismo que el meridiano de Greenwich, sin embar✓ go, se ha mantenido a este ángulo el nombre de tiempo sidéreo en Greenwich. Por otra parte, puesGAST to que está asociado al equinoccio GMST verdadero10 se le da el nombre de 0 tiempo sidéreo aparente en Greenm wich y se representará por las letras GAST . El ángulo entre este pun0 to y el equinoccio medio m repreFigura 4.5: Cambios de origen en el ecuador sentará el tiempo sidéreo medio en intermedio. Greenwich, GMST . El ángulo entre $ y se define de manera que estos dos puntos sean orı́genes no rotantes, se le llama ángulo de rotación terrestre, y se denota por las siglas ERA o por el sı́mbolo ✓. Una vez definidos estos dos ángulos podemos determinar las matrices de rotación que representan el cambio de origen en la forma: e3 (✓), RE$ E = R3 ( ✓) = R e3 (GAST ), RE$ E = R3 ( GAST ) = R mientras que la relación ente los sistemas E y E RE E 0 m = R3 ( EE), 0 m (4.9) viene dada por EE = GAST GMST . (4.10) Al ángulo EE se le llama ecuación de los equinoccios y su valor viene dado por la expresión EE = 10 Esto + 0.00 00264096 sen ⌦ + 0.00 00006352 sen 2⌦ + . . . , se estudiará con detalle en el siguiente capı́tulo. (4.11) Transformaciones entre sistemas de referencia precisos 65 que depende del valor de la nutación en longitud, dado en (4.18), y de algunos términos lunisolares como ⌦ y otros. En la anterior expresión hemos escrito únicamente los tres términos más importantes. 4.3.3 Precesión (T4) eo3 La precesión es la transformación entre el ecuador y equinoccio medios del año J2000.0, que definen el sistema E oo , y el ecuador y equinoccio medios de una fecha, que definen el sistema E mm . Esta transformación se puede modelar por medio de dos conjuntos de parámetros diferentes. La primera aproximación se describe con cuatro parámetros que relacionan la posición del ecuador medio de las dos épocas con el plano de la eclı́ptica en J2000.0 y en la fecha. Los cuatro parámetros (✏o , A , !A , A ), que pueden verse en la figura 4.6, representan lo siguiente: em 3 eclı́ptica en J2000.0 ✏o ⇤ ecuador medio en J2000.0 o A !A A m eclı́ptica ecuador medio Figura 4.6: Precesión: transformación con cuatro rotaciones. ✏o es el valor de la oblicuidad media de la época J2000.0, es decir, el ángulo entre el ecuador medio y la eclı́ptica en J2000.0, que tiene un valor constante. es el ángulo entre el equinoccio medio de J2000.0, o , y un punto ⇤ que representa la intersección del plano de la eclı́ptica en J2000.0 con el ecuador medio de la fecha. A !A es el ángulo entre el plano de la eclı́ptica en J2000.0 y el ecuador medio de la fecha. A es el ángulo entre el punto ⇤ y el equinoccio medio m. Se llama matriz de precesión y se representa por la letra P a la matriz de paso del sistema medio Emm a la del sistema ecuatorial en J2000.0, E oo , esto es, a la matriz RE m E o . m o Para obtener la expresión de P en términos de los cuatro parámetros anteriores, observaremos la figura 4.6, donde podemos concluir que RE o E m = o m R1 (✏o )R3 ( A )R1 ( !A )R3 ( A ). Teniendo en cuenta que P es la transpuesta de la anterior tendremos que P = R3T ( A )R1T ( !A )R3T ( A )R1T (✏o ) y aplicando la relación entre las matrices de rotación con ambos convenios se llaga a la expresión 66 Sistemas de referencia espaciales precisos e3 ( P =R A e 1 ( ! )R e3 ( )R A A e1 (✏o ), )R (4.12) que es una de las dos expresiones habituales de la matriz de precesión. La expresión de los cuatro ángulos en función del tiempo, dado por la variable Ts , es la siguiente: = 23h 26m 21.s 406 = 84381.00 406, A = 5038.00 481507 Ts 1.00 0790069 Ts2 0.00 00114045 Ts3 + 0.00 000132851 Ts4 !A = ✏0 0.00 025754 Ts + 0.00 0512623 Ts2 0.00 00772503 Ts3 0.00 000000467 Ts4 + 0.00 0000003337 Ts5 , A = 10.00 556403 Ts 2.00 3814292 Ts2 0.00 00121197 Ts3 + 0.00 000170663 Ts4 ✏o 0.00 0000000951 Ts5 , (4.13) 0.00 0000000560 Ts5 . Aunque la IAU recomienda usar estos cuatro parámetros para calcular la matriz de precesión, existe otro conjunto de tres parámetros, (zA , ✓A , ⇣A ), idénticos a los clásicos de la teorı́a de la precesión previa al año 2000, pero que han sido modificados para adaptarlos a la mayor precisión de las nueva teorı́as. En lugar de trabajar sobre el ecuador los antiguos parámetros describen la posición del polo del sistema E mm respecto del sistema E oo como se ve en la figura 4.7. En esta figura se observa como el ángulo ✓A representa el ángulo entre los vectores eo3 y el vector em 3 , mientras que zA es el ángulo entre el meridiano principal y el cı́rculo máximo que une los dos polos en el sistema de referencia medio y ⇣A el mismo ángulo en el sistema de referencia medio de J2000.0. eo3 ✓A em 3 ⇣A zA o ecuador medio en J2000.0 m ecuador medio En estas condiciones la mam o triz P de paso de E m a E o se obtendrá como composición de Figura 4.7: Precesión: transformación con tres tres rotaciones: P = REm E o = rotaciones R3 (zA )R2 ( ✓A )R3 (⇣A ) y finalmente pondremos la expresión habitual e 3 ( z )R e1 (✓ )R e3 ( ⇣ ). P =R A A A (4.14) Transformaciones entre sistemas de referencia precisos 67 Las expresiones de los tres ángulos, en función del tiempo dado por la variable Ts , son las siguientes: ⇣A = zA = ✓A = 2.00 650545 + 2306.00 083227 Ts + 0.00 2988499 Ts2 + 0.00 01801828 Ts3 0.00 000005971 Ts4 0.00 0000003173 Ts5 , 2.00 650545 + 2306.00 077181 Ts + 1.00 0927348 Ts2 + 0.00 01826837Ts3 0.00 000028596 Ts4 0.00 0000002904 Ts5 , 2004.00 191903 Ts 0.00 4294934 Ts2 0.00 04182264 Ts3 0.00 000007089 Ts4 0.00 0000001274 Ts5 , (4.15) mientras que el valor del ángulo ✏, que representa la oblicuidad media o ángulo entre el ecuador medio y la eclı́ptica, es igual a ✏ = ✏o + 4.3.4 46.00 836769 Ts 0.00 0001831 Ts2 0.00 00200340 Ts3 0.00 000000576 Ts4 0.00 0000000434 Ts5 . (4.16) Nutación (T3) La nutación produce un pequeño desplazamiento del ecuador, a lo largo de la eclı́ptica, desde el ecuador y equinoccio medios hasta el ecuador y equinoccio verdaderos. Se mide a partir de dos ángulos: la nutación en longitud, , que mide el ángulo entre el equinoccio medio y el verdaderos en la eclı́ptica, y la nutación en oblicuidad, ✏, que mide la diferencia entre la oblicuidad media, ✏, o ángulo entre la eclı́ptica y el ecuador medio y la oblicuidad verdadera, ✏0 , o ángulo entre la eclı́ptica y el ecuador verdadero. em 3 e3 eclı́ptica ✏ em 1 ✏0 = ✏ + ecuador medio ✏ ecuador de la fecha e1 Figura 4.8: Nutación. Se llama matriz de nutación a la matriz de rotación que pasa del sistema E al sistema E mm que, de acuerdo con la figura 4.8, se podrá poner como N = RE E m = m R1 (✏0 )R3 ( )R1 ( ✏), de donde finalmente llegaremos a la expresión e1 ( ✏ N =R e3 ( ✏)R e1 (✏). )R (4.17) 68 Sistemas de referencia espaciales precisos Los valores de ✏y se obtienen a partir de las dos series: = ✏ = N X i=1 N X (Si + Si0 TS ) sen j + Ci00 cos j Si00 j, (4.18) (Ci + Ci0 TS ) cos + sen j, i=1 siendo i = K X j (Ts ), j=1 donde, para el modelo de nutación MHB, que es aceptado en el modelo IAU2000, se tiene N = 1365 términos de la series, y K = 14 parámetros angulares dependientes de las órbitas del Sol y la Luna. Este modelo ha sustituido al antiguo modelo de Wahr en el que las series de la nutación tenı́an 136 términos. 4.3.5 Tratamiento actual de la precesión y nutación (T6) El tratamiento moderno de la precesión y nutación se basa en la posición del sistema E respecto del sistema SG a través de tres parámetros (X, Y, s), que, de forma similar al movimiento del polo, representan la posición del CIP en SG y la corrección s del origen del sistema o localizador del CIO. e3 d e3 E E s Los valores de (X, Y ) representan dos de los tres cosenos directores del vector e3 , respecto de la base {e1 , e2 , e3 } del sistema SG , de forma que e3 = Xe1 + Y e2 + Ze3 , e1 e2 e1 e2 Figura 4.9: Transformación conjunta precesión– nutación. Si llamamos (E, d) a la longitud y la colatitud del vector e3 en el sistema SG se tendrán las relaciones: X = sen d cos E, Y = sen d sen E, donde el valor de Z es muy próximo a la unidad. Z = cos d, (4.19) Transformaciones entre sistemas de referencia precisos 69 En la figura 4.9 se puede observar la posición del sistema E , cuya base es {e1 , e2 , e3 }, respecto del sistema SG , cuya base es {e1 , e2 , e3 }. Llamaremos matriz de precesión–nutación a la matriz C = RE S que pasa de E a SG . G Observando la figura 4.9 podemos concluir que la matriz de rotación entre los dos sistemas es RS E = R3 (E)R2 (d)R3 ( E)R3 ( s), de donde se deduce G finalmente que C = RE S = R3 ( s)T R3 ( E)T R2 (d)T R3 (E)T y por tanto G e3 ( s)R e3 ( E)R e2 (d)R e3 (E). C=R (4.20) Hemos calculado la matriz de rotación en términos de (E, d), sin embargo, se ha dicho antes que esta transformación se plantea en términos de (X, Y ). Para expresar C en términos de X, Y hay que efectuar el producto de las tres mae3 ( E)R e2 (d)R e3 (E), aplicar las relaciones (4.19), y realizar una serie de trices R manipulaciones trigonométricas y simplificaciones para obtener 0 e3 ( s) @ C=R 1 bX 2 bXY X bXY 1 bY 2 Y 1 1 X A, Y 2 2 b(X + Y ) (4.21) donde, teniendo en cuenta que el valor de Z es pequeño, el valor de b = 1/(1 + Z) se puede aproximar, hasta una precisión del orden de 0.00 000001 por la expresión b = 1/2 + (X 2 + Y 2 )/8, de forma que Z no aparece en la matriz. La teorı́a IAU2000 para la precesión y nutación establece unos valores: X= 0.00 01661699 + 2004.00 19174288 Ts 0.00 42721905 Ts2 0.00 19862054 Ts3 0.00 00004605 Ts4 + 0.00 00000598 Ts5 P + i [(as,0 )i sen( j ) + (ac,0 )i cos( j )] P + i [(as,1 )i t sen( j ) + (ac,1 )i t cos( j )] P + i [(as,2 )i t2 sen( j ) + (ac,2 )i t2 cos( j )] +···, Y = 0.00 00695078 0.00 02538199 Ts 22.00 40725099 Ts2 +0.00 00184228 Ts3 + 0.00 00111306 Ts4 + 0.00 00000099 Ts5 P + i [(bc,0 )i cos( j ) + (bs,0 )i sen( j )] P + i [(bc,1 )i t cos( j ) + (bs,1 )i t sen( j )] P + i [(bc,2 )i t2 cos( j ) + (bs,2 )i t2 sen( j )] +···, con los términos de X e Y . j dependientes de la nutación. La expresión de s es similar a la 70 Sistemas de referencia espaciales precisos 4.3.6 Desviación (T5) entre los sistemas E oo y SG Finalmente veremos como pasar del nuevo sistema fundamental SG al antiguamente usado E oo y viceversa. Para ello tendremos en cuenta que la posición de los dos polos y la dirección de los orı́genes respectivos está muy próxima, además la posición de los unos respecto a los otros es fija. Los parámetros que describen esta pequeña desviación son las coordenadas (⇠o , ⌘o ) del polo de E o en el sistema SG . Como puede verse en la figura 4.10 estas coordenadas están dadas en un sistema de dos dimensiones, tangente al polo de SG , y cuyas direcciones O⇠, O⌘ representan el meridiano origen y el de un valor ⇡/2. En este sistema el polo de E oo ocupa la posición ⇠o = 0.00 016617, ⌘o = 0.00 0068192. El desplazamiento del origen se mide por el valor d↵0 = 0.00 0146. Polo E o eo3 (⇠o , ⌘o ) |⌘o | |⌘o | |⇠o | e2 e3 |⇠o | Polo SG ⇠ ⌘ eo1 |d↵o | Figura 4.10: Desviación del sistema E o . La llamada matriz del sesgo de la referencia y denotada por la letra B determina la transformación del sistema E o al sistema SG , es decir B = RE o S . G De acuerdo con la figura 4.10, la matriz RS E o se obtendrá componiendo tres G rotaciones R3 ( |d↵o |)R2 ( |⇠o |)R1 (|⌘o |), que de acuerdo con los signos de d↵o , |⇠o | y |⌘o | se pondrá RS E o = R3 (d↵o )R2 (⇠o )R1 ( ⌘o ). Finalmente, podremos poner G RE o S = R1 ( ⌘o )T R2 (⇠o )T R3 (d↵o )T , o lo que es igual G e 1 ( ⌘o ) R e2 (⇠o )R e3 (d↵o ). B=R (4.22) Si efectuamos el producto de matrices anterior y después aproximamos las funciones trigonométricas por el arco o por la unidad, como ya se ha hecho en un cálculo anterior, se obtendrá una expresión más simple de B, suficientemente Relación de los sistemas precisos con los sistemas idealizados 71 aproximada en la mayor parte de las aplicaciones: 0 1 1 d↵o ⇠o 1 ⌘o A . B ⇡ @ d↵o ⇠o ⌘o 1 4.3.7 Transformación general de coordenadas Finalmente, reuniendo todas las transformaciones dadas hasta aquı́, podemos obtener la expresión de la transformación general de coordenadas entre el sistema geográfico y el sistema GCRS o el del equinoccio y ecuador medios del J2000.0. Las transformaciones pueden resumirse en las siguientes expresiones: xS G xS G xE oo xE oo = = = = e3 ( ✓) W CT R T T T e B P N R3 ( GAST ) W e3 ( ✓) W B CT R e3 ( GAST ) W PT NT R xG xG xG xG = = = = e3 (✓) C WTR e3 (GAST ) N P B W R e3 (✓) C B T WTR T e W R3 (GAST ) N P y sus transpuestas: 4.4 T xG , xG , xG , xG , xS G , xS G , xE oo , xE oo . (4.23) (4.24) Relación de los sistemas precisos con los sistemas idealizados En el capı́tulo anterior se han definido una serie de sistemas idealizados basados en la consideración de planos fijos del ecuador y la eclı́ptica. Si tenemos en cuenta el movimiento de éstos deberemos establecer una serie de premisas que condicionarán las relaciones entre todos los sistemas. En primer lugar deberemos considerar que el sistema horizontal se establece a partir de la dirección del zenit y del sur como origen del acimut. La dirección sur se puede definir a partir del meridiano del lugar, por observación de la culminación superior de los astros, o bien a partir de la dirección sur prefijada geográficamente. El primer caso define unas coordenadas horizontales relacionadas con unas coordenadas horarias definidas sobre el ecuador verdadero, mientras que en el segundo caso el ecuador es el ecuador fijo de la Tierra o lo que es igual el plano Oxy del sistema geográfico. Los dos sistemas horizontales basados en estas dos diferentes elecciones son distintos y su relación con el sistema ecuatorial viene dada, en el 72 Sistemas de referencia espaciales precisos primer caso, a través de la latitud del lugar, corregida del movimiento del polo, mientras que en el segundo se relacionan a partir de la latitud o del lugar sin corregir por el movimiento del polo. De cualquier manera, el movimiento del polo es muy pequeño y no conocido a priori por lo que en la mayor parte de las aplicaciones se pueden hacer coincidir ambos sistemas. El sistema horario y el ecuatorial se entenderán referidos al ecuador verdadero. Entenderemos por eclı́ptica la de la fecha. El paso al sistema de referencia eclı́ptico se puede hacer, bien desde el sistema ecuatorial verdadero de la fecha, cuya intersección con la eclı́ptica es el equinoccio verdadero , y su ángulo con ella es la oblicuidad verdadera ✏0 , o bien desde el ecuador medio de la fecha, cuya intersección con la eclı́ptica es el equinoccio medio m y su ángulo con ésta es la oblicuidad media ✏. Finalmente, hay que decir que los elementos de la rotación de un planeta, coordenadas del polo y posición del meridiano origen, son medidos en el sistema espacial con centro en el centro de masas del planeta SP por lo que la matriz RE P$ , dada en (3.23), representa realmente la matriz RSP P$ , esto es, el paso del sistema celeste de referencia al planetográfico. Capı́tulo 5 Referencia temporal 5.1 Introducción La naturaleza del tiempo es una complicada cuestión a la que ni la Filosofı́a ni la Fı́sica han dado una respuesta definitiva. Nos limitaremos a tratar el tiempo como una variable independiente que sirve como referencia para describir la evolución de los fenómenos fı́sicos o dinámicos. Mediante la medida del tiempo se persiguen dos finalidades distintas: por un lado, se trata de fijar el instante en que sucede un determinado acontecimiento, problema cronológico, y por otro, medir el intervalo de tiempo transcurrido entre dos acontecimientos, problema cronométrico. Para la primera cuestión es necesario fijar una época origen y, a partir de ella, contar el número de ciclos (o fracción) de un fenómeno periódico que han transcurrido desde entonces, por ejemplo, el número de veces que el Sol ha pasado por el meridiano del lugar. Con respecto al aspecto cronométrico, el tiempo puede estar o no asociado a una época determinada. Por ejemplo, a un ciclista que corre una etapa, solamente le interesa saber el número de minutos, segundos y fracciones de segundo que han transcurrido desde que partió de la salida hasta que cruza la lı́nea de meta. La fecha le interesa solamente para saber donde debe estar cierto dı́a a cierta hora. Con respecto al intervalo de tiempo, es esencial la sincronización. En efecto, siguiendo con el sı́mil anterior, el ciclista debe tener su reloj sincronizado con el reloj de la organización, pues de lo contrario, podrı́a llegar tarde a la salida. El problema de la sincronización se hace más acuciante en determinados problemas como la navegación aérea, las telecomunicaciones, electrónica, etc.. Determinadas actividades requieren relojes o instrumentos de medida sencillos, 74 Referencia temporal mientras que otras los necesitan mucho más precisos. Ası́, los pueblos primitivos se regı́an por el movimiento del Sol, puesto que les condicionaba sus actividades diarias, horas de descanso, de vigilia y comidas. Algunas ciencias, como la Geologı́a y la Astronomı́a, manejan intervalos de tiempo del orden de miles y millones de años, por lo que un par de años le es indiferente; por el contrario, la Electrónica necesita saber medir fracciones muy pequeñas de segundo, por ejemplo, si un ordenador va a 132 MHz, quiere decir que necesitan contar 132,000,000 oscilaciones en un segundo, para lo que necesitan un reloj con una precisión mucho mayor. Como vemos, dependiendo del usuario, se necesitan distintos grados de precisión, lo que hace que se manejen distintas escalas de tiempo. Desde los albores de la humanidad, el movimiento de los astros ha marcado las primeras escalas de tiempo, por lo que todavı́a se siguen utilizando. El año, el mes y el dı́a han sido las unidades naturales obtenidas a partir de tres diferentes ciclos astronómicos. Grosso modo, éstos se pueden definir como: Año, el periodo de una revolución completa de la Tierra alrededor del Sol. Mes, el intervalo transcurrido entre dos Lunas llenas sucesivas. Dı́a, el tiempo entre dos pasos consecutivos del Sol por su punto más alto sobre el horizonte. Las tres unidades anteriores determinan el marco habitual donde circunscribimos el concepto tiempo, sin embargo, su definición conlleva una serie de dificultades que hacen necesario un estudio profundo de las mismas para alcanzar los requerimientos actuales en la medida del tiempo. Por un lado el año no contiene un número exacto de dı́as, ni un número exacto de meses y el mes tampoco contiene un número exacto de dı́as. Por otra parte, a lo largo del año, la duración del dı́a, definido como el intervalo de tiempo entre dos pasos consecutivos del Sol por el meridiano del lugar, no es la misma, pues la Tierra se mueve sobre una elipse, viajando en ocasiones más rápida y en otras más lenta. Si en lugar de basar la duración del dı́a sobre el movimiento del Sol, se basa sobre el movimiento de las estrellas, resultará que este dı́a de las estrellas, dı́a sidéreo, es unos 4 minutos más corto que el dı́a solar. Sin embargo, como las estrellas están muy alejadas, este tiempo no varı́a con la época del año en la que nos encontremos. Además, tal como se empezó a sospechar en el siglo XVII, la Tierra no gira uniformemente alrededor de su eje, sino que tiene fluctuaciones y, además, se va frenando gradualmente. Por otra parte, los polos terrestres, que determinan el eje de giro de la Tierra, sobre el que hemos definido el dı́a, también se mueven unos pocos metros en un año, lo que produce discrepancias del orden de unos 30 milisegundos de un año al siguiente. Se hace necesario, por tanto, un reloj que mida periodos constantes uniformemente. Esto se ha conseguido mediante la frecuencia de radiación emitida por un átomo de cesio. Pero como todas las unidades de tiempo habituales (hora, dı́a, mes, año, etc.) tienen un origen astronómico, ha Relojes basados en la rotación terrestre 75 sido preciso definir distintas escalas de tiempo, que veremos más adelante, con objeto de unificar las medidas de relojes astronómicos y atómicos. 5.2 Relojes basados en la rotación terrestre Desde un punto de vista práctico, podemos definir un dı́a como el intervalo de tiempo transcurrido entre dos pasos consecutivos de una cierta referencia espacial, situada en la esfera celeste, por un meridiano terrestre. De esta manera, podemos construir nuestro reloj tomando las 0h como la posición del punto del ecuador que se encuentra en el mismo meridiano que el punto de referencia y dividir el ecuador en 24 sectores. El ángulo entre la dirección del meridiano y la del punto de referencia, ángulo horario, medido en horas, nos determina la hora de nuestro reloj (Figura 5.1). Punto de referencia 0h Tierra 18h 6h Meridiano 12h Figura 5.1: Reloj natural basado en la rotación terrestre. 5.2.1 A pesar de la aparente sencillez de este reloj, aparecen ya los primeros problemas en la determinación de la hora. En primer lugar la falta de uniformidad de la rotación terrestre de la que prescindiremos por el momento. Por otro lado, cada meridiano señala una dirección diferente, por lo que la hora del reloj depende del meridiano elegido, lo que significa que la hora dada por este reloj es local, esto es, depende del lugar en que la midamos. Por último, debemos elegir el punto de referencia. La mejor referencia posible serı́a un punto fijo en el ecuador; sin embargo, esto no será posible desde un punto de vista práctico. Por ello, el movimiento del punto de referencia deberá ser tenido en cuenta para corregir la hora dada por el reloj. Tiempo sidéreo Las estrellas no sirven como punto de referencia, pues su movimiento propio, aunque pequeño, es en muchos casos muy mal conocido; es por lo que se utiliza como referencia el equinoccio , cuyo movimiento por precesión y nutación es lento y está muy bien estudiado. Llamaremos tiempo sidéreo al tiempo asociado a un reloj basado en la rotación terrestre y que toma como referencia el punto . Es decir, el tiempo sidéreo, ST , será el ángulo horario del punto . 76 Referencia temporal Al estudiar la precesión y nutación vimos que pueden definirse tres equinoccios diferentes. El equinoccio 0 de la época J2000.0, el equinoccio verdadero de la fecha , que es el anterior corregido por precesión y nutación y el equinoccio medio m , que es el de la época J2000.0 corregido solo por precesión. Aunque el equinoccio 0 representa una posición fija en el espacio— por lo que constituirı́a la referencia perfecta— no se utiliza, pues no va ligado a la observación astronómica como sucede con los otros dos. La complejidad del modelo de la nutación y su pequeño valor hacen que en general sea suficiente tomar como referencia el equinoccio medio, lo que nos lleva a definir el tiempo sidéreo medio. Este es el que se usa habitualmente, salvo para casos de gran precisión. Si se toma el equinoccio de la época hablaremos de tiempo sidéreo aparente. Llamaremos tiempo sidéreo local aparente, LAST , al ángulo horario del equinoccio de la fecha. El ángulo horario del equinoccio medio será llamado tiempo sidéreo local medio, LMST . Este ángulo es el que coincide con el tiempo sidéreo ST , y está asociado a la observación astronómica. La diferencia entre los dos tipos de tiempo sidéreo local será igual a la diferencia de la ascensión recta del equinoccio medio y el de la época que, de acuerdo con la teorı́a de la nutación, podrá ponerse como LAST donde LMST = EE, EE es la ecuación de los equinoccios, definida en (4.11). El hecho de ser local obliga a usar un reloj distinto en cada lugar. Para corregir esto, utilizaremos de manera global el reloj de tiempo sidéreo de un lugar determinado. L Tradicionalmente para ello se utili(meridiano local) zaba el observatorio de Greenwich definiendo el tiempo sidéreo medio en Greenwich, GMST , y el tiempo sidéreo aparente en Greenwich, GAST , cuya relación vendrá daL ST G da también a través de la ecuación (TIO, $) m G ST de los equinoccios. Las resoluciones de la IAU del año 2000 han sustituido el meridiano de Greenwich o por el origen terrestre intermedio (TIO, $) como origen del sistema Figura 5.2: Tiempos sidéreos. geográfico por lo que no tenı́a sentido mantener el meridiano de Greenwich como lugar común para la medida de un tiempo sidéreo universal, sin embargo, la generalización del uso de los nombres anteriores ha obligado a mantenerlos aunque modificando su definición para usar el nuevo origen. Relojes basados en la rotación terrestre 77 La figura 5.2 permite encontrar la relación entre los tiempos sidéreos locales y en Greenwich a través de la longitud, , del lugar como GMST = LMST , GAST = LAST . (5.1) A partir de ahora, salvo que se diga lo contrario, despreciaremos la nutación y hablaremos únicamente del tiempo sidéreo refiriéndonos al tiempo sidéreo medio y llamaremos dı́a sidéreo a un periodo de 24h de tiempo sidéreo medio. 5.2.2 Ángulo de rotación terrestre El modelo de movimiento del polo y rotación de la Tierra establecido por la Unión Astronómica Internacional en el año 2000, presentado en el capı́tulo 4, establece dos puntos de referencia no rotantes en el ecuador verdadero o intermedio: el origen intermedio terrestre (TIO, $) y el origen celeste intermedio (CIO, ), que representan respectivamente el origen de un sistema rotante con la Tierra y el de un sistema fijo. Estos puntos están próximos, aunque no son iguales, al meridiano de Greenwich y al equinoccio. Al ángulo entre estos dos puntos se le llama ángulo de rotación terrestre (ERA, ✓) y puede verse en la figura 4.5. Los puntos que lo forman están definidos de manera que su variación con respecto al tiempo coincida exactamente con la velocidad angular de rotación de la Tierra d✓ = !. dt En realidad este ángulo no representa un tiempo, pero su variación lo relaciona directamente con éste y su significado es equivalente al del GAST cuando se utiliza el CIO en lugar del equinoccio. 5.2.3 Tiempo solar y tiempo medio El equinoccio es, por su lento movimiento, la mejor referencia posible para la definición del dı́a. Sin embargo, el concepto de dı́a ha venido siempre asociado a la sucesión dı́a–noche debida a la permanencia del Sol por encima del horizonte. Esto nos lleva a considerar el Sol como referencia y por ello definir un nuevo tiempo, el tiempo solar. Se define el tiempo solar o tiempo solar verdadero como el ángulo horario del Sol, H . Esta definición presenta la ventaja de adaptarse mejor al concepto de tiempo en la vida civil, pero tiene el inconveniente de que el punto de referencia tiene movimiento mucho más rápido que el del equinoccio. En efecto, mientras el equinoccio medio se mueve unos 0.s 0084 por dı́a, el Sol se mueve aproximadamente 1 por dı́a. 78 Por otro lado, se presenta un problema mucho más serio debido a que el desplazamiento aparente del Sol en torno a la Tierra no es uniforme, a causa de la excentricidad de la órbita. Por ello, puesto que el valor de H no varı́a de modo uniforme, no puede ser usado como reloj, y se hace necesaria la construcción de un reloj uniforme basado en la hora solar. Referencia temporal (TIO, $) G 24h ET Hm En lugar del Sol, tomaremos como L referencia un punto imaginario, que llaH (meridiano maremos Sol medio (Sm ), que recolocal) rre el ecuador con velocidad constante Sol igual al movimiento medio de la órbiSol medio ta aparente del Sol alrededor de la Tierra1 . Aunque dicho punto no es visible, Figura 5.3: Tiempo solar y tiempo medio. la posición del Sol medio sobre el ecuador viene definida por su ascensión recta ↵m que es calculada por la Mecánica Celeste. Llamaremos tiempo medio o tiempo solar medio al ángulo horario Hm del Sol medio. Este es el tipo de tiempo que nos permitirá una mayor aproximación al tiempo usado habitualmente por todos nosotros. Al intervalo de 24h horas de tiempo medio le llamaremos dı́a medio. La relación del tiempo medio con el tiempo solar vendrá dado a través de la ecuación del tiempo ET = H Hm , (5.2) que debe ser aplicada siempre que observemos la hora dada por un reloj de Sol, tiempo solar y queramos transformarla en tiempo medio (figura 5.3). La figura 5.4 nos muestra la evolución de la ecuación del tiempo, cuyo valor es calculado por la Mecánica Celeste, a lo largo del año. Como puede observarse, la ecuación del tiempo posee dos máximos, dos mı́nimos y cuatro ceros a lo largo del año. Aproximadamente, los ceros se producen el 16 de abril, 13 de junio, 1 de 1 Lógicamente, este punto no puede ser cualquiera, sino que debe definirse con precisión a partir de razonamientos basados en las propiedades de la órbita kepleriana del Sol en torno a la Tierra que se verán en la segunda parte de este libro. Para ello, imaginemos otro punto, que llamaremos Sol ficticio Sf , que se mueve sobre la eclı́ptica, órbita del Sol, con velocidad constante n, y que coincide con el Sol en el perigeo ⇧ de la órbita del Sol. Ası́ pues, sobre la eclı́ptica, el c = f (anomalı́a verdadera), mientras que ⇧S df = ` (anomalı́a media). Pues bien, el Sol arco ⇧S medio definido anteriormente, es tal que se mueve sobre el ecuador, con la misma velocidad n que Sf y coincide con éste en el equinoccio ; por ello, y prescindiendo del pequeño efecto de la precesión que no afecta por igual a las coordenadas ecuatoriales y eclı́pticas, podemos admitir que la ascensión recta ↵m del Sol medio coincide con la longitud eclı́ptica L de Sf . Con esto, la diferencia ↵m = L = f `. La expresión f ` es llamada ecuación del centro. Relojes basados en la rotación terrestre 79 15m 10m 5m 50 100 150 200 250 300 350 dı́as 5m 10m Figura 5.4: Ecuación del tiempo ET. El eje horizontal representa los dı́as transcurridos desde el comienzo del año. El eje vertical representa los minutos de desfase entre el tiempo solar y el tiempo medio. septiembre y 25 de diciembre; el máximo absoluto el 3 de noviembre (unos 16m ) y el máximo relativo el 14 de mayo (unos 4m ); el mı́nimo absoluto el 11 de febrero (unos 4m ) y el mı́nimo relativo el 26 de julio (unos 6m ). 5.2.4 Tiempo universal El tiempo utilizado en la vida civil está basado en el tiempo medio. Sin embargo, dada su definición como el ángulo horario del Sol medio, se desprende un aspecto que no concuerda con el uso civil. En efecto, para usos comunes, el dı́a comienza a media noche, cuando el Sol tiene un ángulo horario de 12h y no al mediodı́a, cuando el ángulo horario es 0h . Este desfase se corrige añadiendo 12h al tiempo medio. Por ello, en 1925 se definió el tiempo civil local como Tc = Hm + 12h . (5.3) De nuevo, este tiempo sigue teniendo un carácter local. Ası́, la hora civil de Santiago de Compostela diferirı́a de la hora de Zaragoza en unos 30m debido a la diferencia de longitud, por lo que el tiempo civil no es todavı́a el candidato más adecuado para la creación de un reloj que nos sea de utilidad y de uso sencillo y común. Hasta finales del siglo XIX, cada paı́s tenı́a establecido su propio meridiano origen con objeto de proporcionar una hora común al paı́s, y que sirviera de referencia a los marinos para determinar la longitud a que se encontraban los barcos en sus largas travesı́as marı́timas. Con objeto de tener un tiempo común para todos los lugares, se toma de nuevo el origen terrestre intermedio (TIO, $) en sustitución del meridiano del observatorio de Greenwich, y a la hora civil en este meridiano se le llama Tiempo Universal Cero, UT0 . La relación de este tiempo 80 Referencia temporal con el tiempo civil vendrá dada a partir de la longitud, 0, UT0 = Tc del lugar en la forma o. (5.4) En la ecuación anterior (5.4), se relaciona el tiempo civil obtenido a partir de la observación del ángulo horario del Sol medio con la longitud o del observatorio, sin corregir ésta por el efecto del movimiento del polo. Si empleamos la longitud corregida, tendremos el llamado Tiempo Universal Uno, UT1 , cuya relación, de acuerdo con la primera de las ecuaciones (4.8), será UT1 = UT0 tan o (xp sen o + yp cos o ), (5.5) donde UT1 representa la medida de la rotación real de la Tierra independientemente de la localización del observador. El ángulo de rotación de la Tierra ha sido definido de manera que tenga una relación lineal con UT1 y está dado en términos de rotaciones de la Tierra (unidades de 2⇡ radianes) desde el 2000 Enero 1 a las 12h de UT1 . Su valor es igual a ✓ = 0.7790572732640 + 1.00273781191135448 Td , (5.6) donde Td 2 representa el número de dı́as, de tiempo UT1 , transcurridos desde el instante origen. El valor de ✓, en radianes, se obtiene multiplicando la cantidad anterior por 2⇡. En ambientes no astronómicos se utiliza a veces el término Tiempo Medio de Greenwich (GMT ). Antes de 1926 dicho término se referı́a realmente al tiempo medio del meridiano de Greenwich, sin embargo, desde 1926 se utiliza para referirse al tiempo civil de Greenwich, o lo que es igual al tiempo universal, sin especificación del tipo (en su forma de uso más reciente se identifica con el Tiempo Universal Coordinado UTC que veremos después). Esta ambigüedad de la definición y su distinta interpretación antes y después de 1926 han llevado a la Unión Astronómica Internacional a desaconsejar su uso. El tiempo UT1 muestra irregularidades causadas por determinadas variaciones de la rotación terrestre, que son de tipo secular (como el frenado que sufre por rozamiento de las aguas con el fondo marino), periódicas (mareas lunares, desplazamientos estacionales de grandes masas de agua en estado sólido, lı́quido o gaseoso), e irregulares (terremotos, volcanes, etc.). Las variaciones periódicas permiten corregir el UT1 y definir el llamado Tiempo Universal Dos, UT2 , cuya relación con UT1 viene dada por UT2 UT1 = 0.s 022 sen(2⇡t) 0.s 012 cos(2⇡t) 0.s 006 sen(4⇡t) + 0.s 007 sen(4⇡t), donde t es la fracción de año trópico (que se verá en la siguiente sección) transcurrido desde el momento en que la longitud del Sol medio es de 280 . Este tiempo no será usado en la práctica, por lo que en adelante lo consideraremos igual a UT1 . 2T d = JDUT1 2451545.0. Movimiento orbital de la Tierra: el año 5.3 81 Movimiento orbital de la Tierra: el año El concepto de año viene asociado al movimiento orbital de la Tierra en torno al Sol o, de forma equivalente, al del Sol en torno a la Tierra. Suele llamarse año al periodo de dicha órbita, que de acuerdo con las leyes de Kepler serı́a constante si el Sol y la Tierra estuviesen aislados formando un problema de dos cuerpos. Las perturbaciones ocasionadas por el resto de los planetas producen una variación del periodo orbital, lo que nos lleva a la conclusión de que la duración del año no es constante. Por otro lado, la definición del año como el tiempo transcurrido entre dos pasos del Sol por un punto determinado de la eclı́ptica requiere la elección de una referencia donde medir el paso del Sol. Si la órbita fuese kepleriana, cualquier punto nos darı́a el mismo valor del año; sin embargo, como la órbita está perturbada, la elección del punto de referencia mediante el cual medimos el periodo adquiere una importancia fundamental, pues su movimiento se combina con la variación del periodo orbital, dando lugar a años con diferente duración. Podemos pensar en varias referencias para medir la duración del año. Por un lado, el perigeo3 de la órbita. Este es el punto de referencia más adecuado si pensamos en la integración del problema dinámico teniendo en cuenta que las ecuaciones del movimiento vendrán expresadas en un ángulo medido desde el perigeo, la anomalı́a verdadera, que varı́a de 0 a 2⇡ entre un perigeo y otro. Llamaremos año anomalı́stico, Aa , al intervalo de tiempo transcurrido entre dos pasos consecutivos del Sol por el perigeo. Llamaremos año sidéreo, As , al intervalo de tiempo transcurrido entre dos pasos consecutivos del Sol por el equinoccio o de una época fija. Conocida por integración la duración del año anomalı́stico, la misma integración nos dará el movimiento del perigeo lo que permitirá obtener el año sidéreo. Los años sidéreo y anomalı́stico vienen definidos a través de una referencia ligada al movimiento orbital, sin embargo, no son éstos los más útiles desde el punto de vista práctico. De hecho, una de las ventajas del uso del año como medida del tiempo es su relación con las estaciones que se definen a partir del paso del Sol por los equinoccios y solsticios. Por ello, es conveniente usar como referencia el equinoccio medio de la época para que la medida del año venga asociada intrı́nsecamente al comienzo de la primavera astronómica en el hemisferio norte. Se llama año trópico, At , al intervalo de tiempo transcurrido entre dos pasos consecutivos del Sol por el equinoccio medio. Por observación, se puede calcular la duración, en dı́as medios, del año trópico, resultando ser aproximadamente de unos 365.2422. Que el año no tenga un número exacto de dı́as ha creado numerosos problemas a la hora de confeccionar 3 Punto de mayor proximidad entre el Sol y la Tierra. El concepto de perigeo será definido con precisión en el capı́tulo 8. 82 Referencia temporal calendarios y es el motivo de la introducción de los años bisiestos. Por ello se introduce un nuevo tipo de año, llamado año juliano, que tiene exactamente 365.25 dı́as medios. La Mecánica Celeste establece la duración, expresada en dı́as medios, del año anomalı́stico y el año sidéreo, que resulta ser Aa = 365.25964134 + 0.0000000304 Ts , As = 365.25636042 + 0.0000000011 Ts . (5.7) Para obtener la duración del año trópico bastará combinar la duración del año sidéreo con el valor de la precesión en longitud para establecer el valor At = 365.24219897 + 0.0000000614 Ts . (5.8) La duración de estos años se puede tomar, de manera bastante aproximada, como Aa = 365.2596, As = 365.2564, At = 365.2422, dı́as medios. 5.4 Relación entre el tiempo sidéreo y el tiempo medio Para encontrar la relación entre el tiempo sidéreo y el tiempo medio en cualquiera de sus versiones anteriores, hay que considerar el tiempo que tarda el Sol medio en pasar dos veces consecutivas por el equinoccio medio, es decir, el año trópico. Supongamos que un cierto dı́a, el equinoccio medio y el meridiano del lugar están en la misma dirección, que coincide con la del meridiano del lugar (posición (1) de la figura 5.5). Al cabo de un dı́a sidéreo, el equinoccio volverá a pasar por el meridiano del lugar (posición (2) de la figura 5.5), sin embargo el Sol medio todavı́a no habrá culminado, faltándole un ángulo ⇣. El dı́a sidéreo es, por tanto, más corto que el el dı́a medio. Sol ⇣ ⇣ (2) Tierra (1) Al cabo de un año trópico, el Sol y el equinoccio volverán a estar alineados en el mismo meridiano pero mientras el Sol ha pasado un cierto número Figura 5.5: Relación entre la duración del de veces por el meridiano del lugar, el dı́a medio y el dı́a sidéreo. Relación entre el tiempo sidéreo y el tiempo medio 83 equinoccio habrá pasado exactamente un dı́a más (puesto que la Tierra ha dado exactamente una vuelta en el año trópico), lo que significa que si el año trópico tiene una duración de At dı́as medios, su valor en dı́as sidéreos será exactamente At + 1, luego se verifica que (At + 1) dı́as sidéreos = At dı́as medios. Esto nos dará la relación entre el dı́a medio y el dı́a sidéreo que, para el valor At = 365.2422 dado anteriormente, permite poner: 1 d.s. 1 d.m. 365.2422 = 0.9972696 d.m. = 23h 56m 4.s 09053 de tiempo medio, 366.2422 366.2422 = = 1.0027379 d.s. = 24h 3m 56.s 55537 de tiempo sidéreo, 365.2422 = que nos dan la relación entre el dı́a sidéreo y el medio. Como podemos apreciar, el dı́a sidéreo es unos cuatro minutos más corto que el medio. También podemos definir la función Intsid (), que transforma tiempo medio en sidéreo, y la función Intmed (), que transforma tiempo sidéreo en medio. Estas funciones vendrán dadas por: Intsid (x) = 1.0027379 x, Intmed (x) = 0.9972696 x, Intsid (x) = At + 1 x, At Intmed (x) = At x. At + 1 (5.9) Las expresiones de arriba en (5.9) son aproximadas, mientras que las de abajo nos dan el valor exacto si sustituimos At por su valor, expresado en dı́as medios. Nótese que la función Intsid () es la inversa de Intmed (). Las funciones anteriores nos van a permitir transformar el tiempo universal, en cualquiera de sus versiones, en tiempo sidéreo y viceversa. Para ello, supongamos un lugar de longitud y un instante caracterizado por una hora sidérea LMST , una hora de tiempo civil Tc y una hora de tiempo universal UT . A partir de ahora usaremos UT sin especificar si es UT1 o UT0 , pues la elección dependerá de si la longitud está o no corregida por el movimiento del polo. Llamaremos GMST0 a la hora GMST cuando sean las 0h de tiempo universal, esto es, cuando comience el dı́a medio en el meridiano origen. Fácilmente se comprueba que en ese instante, la hora sidérea local será LMST 0 = GMST0 + . Para calcular la hora sidérea en el instante UT habrá que añadir a LMST 0 el intervalo de tiempo sidéreo correspondiente a las horas de UT transcurridas, esto es, LMST = GMST0 + + Intsid (UT ), (5.10) relación fundamental que permite pasar de tiempo universal a tiempo sidéreo. De un modo sencillo podemos invertir la anterior relación, obteniendo la fórmula de paso de tiempo sidéreo a universal UT = Intmed (LMST GMST0 ). (5.11) 84 Referencia temporal Notemos que para convertir tiempo sidéreo a universal es necesario el valor de GMST0 , esto es, el tiempo sidéreo en Greenwich a las cero horas de UT de un determinado dı́a. El valor de GMST0 , acorde con el modelo de precesión del año 2000 es igual a GMST0 = 361658.00 2406561 + 129598159.00 7606402 Tsu + 4612.00 15739966 Ts + 1.00 39667721 Ts2 0.00 00009344 Ts3 + 0.00 00001882 Ts4 , (5.12) donde Ts y Tsu representan el UT1 y TT 4 ambos expresados en siglos julianos desde J2000.0. 5.5 Escalas de tiempo uniforme La Mecánica de Newton admite la existencia de un tiempo uniforme y absoluto que es el usado en las ecuaciones del movimiento de los cuerpos. Durante siglos, la rotación terrestre ha sido considerada uniforme y por ello el tiempo que de ella se ha derivado, UT , se ha supuesto coincidente con el tiempo absoluto de la Mecánica. Sin embargo, a finales del siglo XVII, Flamstead ya sugirió que la rotación de la Tierra podrı́a cambiar de estación en estación, debido a las masas de aire y agua que la envuelven y que se desplazan en las distintas estaciones del año. El desarrollo de la Mecánica Celeste permitió lograr, a comienzos del presente siglo, unas teorı́as del movimiento de los planetas suficientemente precisas para comprobar que la rotación de la Tierra no es un fenómeno totalmente uniforme. En efecto, Newcomb observó un desfase entre la observación de los planetas y sus posiciones calculadas. Posteriores investigaciones han llevado a la conclusión de que la Tierra se retrasa en su rotación unos 30s por siglo. 5.5.1 Tiempo de efemérides y tiempo atómico internacional La Astronomı́a, necesitada de mayor precisión en los cálculos, definió una nueva escala de tiempo, el tiempo de efemérides, ET , basada en la dinámica del sistema solar y uniforme por definición. La Mecánica Celeste fue la ciencia encargada de medir el desfase T = ET UT , (5.13) entre el tiempo de efemérides y el tiempo universal que continúa siendo el tiempo tomado como base para las aplicaciones en la vida civil. La época origen desde la que se mide el tiempo de efemérides es el instante de la media noche media (Hm = 12h ) del dı́a que comienza el año 1900. Teniendo en 4 Ver apartado 5.6 Escalas de tiempo uniforme 85 cuenta la duración del año trópico de 1900, igual a 365.242198781 dı́as medios, la Unión Astronómica Internacional (IAU) eligió, en 1956, como unidad fundamental de tiempo el segundo, definido como la fracción 1/31556925.975 de la duración del año trópico de 1900. Esta unidad, puesto que se refirió a un año concreto, es independiente de la rotación terrestre y del año que se considere. En 1900, dos relojes, uno de UT y otro de ET deberı́an marcar la misma hora, pero en el momento en que se definió el ET habı́a un desfase entre ellos de unos 32.s 184 debido al deceleración en rotación de la Tierra. Al contrario de los tiempos definidos hasta aquı́, que conllevan una inexactitud asociada a la no periodicidad del fenómeno por medio del cual se definen, el ET es uniforme por definición, aunque su medida, basada en la observación y el cálculo de las posiciones de los planetas, no es exacta. Sin embargo, el avance es sustancial, pues cualquier mejora en la medida, cientı́fica o tecnológica, supone un progreso en la exactitud del tiempo obtenido, mientras que antes siempre nos encontrábamos con la inexactitud propia del fenómeno que define el reloj. La medida del tiempo basado en el tiempo de efemérides estuvo vigente hasta 1967, año en que se introduce oficialmente el tiempo atómico internacional (TAI ), basado en fenómenos cuánticos propios del interior de la materia. La unidad básica del TAI es el segundo atómico internacional que se define como la duración de 9192631770 periodos de la radiación correspondiente a la transición entre los dos niveles hiperfinos del estado fundamental del átomo de Cesio 133. Este segundo, que es la unidad de tiempo en el sistema internacional (SI), se definió de modo que su duración coincidiera con la del segundo de efemérides establecida anteriormente. La mayor precisión conseguida en la medida de TAI por medio de los relojes atómicos aconsejó la utilización de este tiempo como estándar a partir de 1967. La siguiente tabla nos da una idea de la precisión de estos relojes: Reloj ET , Cristal de cuarzo Rubidio Cesio Maser hidrógeno Pérdida de un segundo en 30 años 30000 años 300000 años 30000000 años El tiempo de efemérides y el tiempo atómico internacional son, en teorı́a, el mismo tiempo uniforme, pero con objeto de ajustar el TAI a UT , hubo que tener en cuenta el desfase entre el UT y el ET y eso hizo que las escalas no tuviesen el mismo origen. Por ello, en la Asamblea General de la IAU de 1976 en Grenoble, se adoptó la resolución de que el instante 00h 00m 00.s 00 del 1 de Enero de 1977 TAI sea el 00h 00m 32.s 184 del 1 de Enero de 1977 del correspondiente a la escala ET con lo que se tiene que ET = TAI + 32.s 184. (5.14) 86 5.5.2 Referencia temporal Tiempo universal coordinado A pesar de la variedad de tiempos que hemos definido, aún no hemos llegado al tiempo que realmente estamos utilizando en nuestra vida cotidiana. Para ello vamos a dar antes un par de definiciones aplicables a cualquier reloj y analizaremos su significado. Llamaremos estado de un reloj, E.R., a la diferencia entre la hora que marca el reloj y la hora exacta. Un valor positivo del estado de un reloj corresponde a un reloj adelantado, mientras que un valor negativo indica que el reloj está atrasado (Figura 5.6(a)). t Zona de adelanto Reloj 1 Reloj 2 Zona de atraso (a) Estado Reloj 3 (b) Marcha Figura 5.6: Estado y marcha de un reloj. En ambas figuras el eje horizontal representa la hora exacta, mientras que el eje vertical representa la hora marcada por el reloj. Llamaremos marcha de un reloj, m, a la variación del estado del reloj en un cierto intervalo de tiempo E.R.2 E.R.1 m= , t2 t 1 es decir, lo que el reloj adelanta o atrasa en dicho intervalo (dı́a, año, etc.). La gráfica 5.6(b) nos muestra tres tipos diferentes de relojes. El reloj 1 es un reloj que tiene un estado constante, esto es, una marcha nula. Este reloj es un reloj uniforme pero que mantiene una diferencia constante con la hora exacta. El reloj 2, tiene una marcha constante, atrasa una cantidad de tiempo constante cada cierto periodo de tiempo, al cabo del cual, el reloj es puesto de nuevo en hora. Por último, el tercer reloj muestra un reloj de marcha constante pero no corregida, por lo que su estado es cada vez mayor. Con estas ideas podemos ilustrar el comportamiento de nuestros relojes de TAI , ET y UT en la figura 5.7. Despreciando la marcha del TAI (1s cada 30000000 años), éste será tomado como tiempo uniforme. El tiempo efemérides, por definición, es también uniforme; sin embargo, su estado es constantemente igual a 32.s 184 que corresponde a un reloj Escalas de tiempo uniforme 87 ET TAI UTC Figura 5.7: Tiempo universal coordinado. como el del tipo primero de la Figura 5.6(b). Por su parte, el tiempo universal va manteniendo una marcha no nula, debido a la variación de la velocidad de rotación de la Tierra. Evidentemente, este reloj (es la Tierra) no puede ser corregido, por lo que es similar al del tipo 3 mostrado en la Figura 5.6(b). Ası́ pues, tenemos por un lado un reloj atómico, casi perfecto, y que de momento, es el tipo de tiempo que se puede medir con mayor precisión, y un mal reloj, formado por la Tierra y el Sol, pero que rige la vida diaria y las costumbres humanas. Se hace necesario, por tanto, relacionar este tiempo TAI con el UT , menos consistente y determinado a partir de la rotación de la Tierra. Esta relación se obtiene con un nuevo tiempo, el llamado tiempo universal coordinado 5 , UTC , introducido en 1972, a caballo entre el TAI y el UT , puesto que prácticamente es el TAI y apenas se desvı́a del UT1 . Este nuevo tiempo, UTC , cumple las siguientes condiciones: 1. Su diferencia, DUT1 , con el tiempo universal debe ser siempre inferior a 0.s 9, esto es, DUT1 = UT1 UTC < 0.s 9. 2. Su diferencia, DTA = TAI -UTC , con el tiempo atómico internacional debe ser un número entero de segundos. Esto se consigue mediante un segundo intercalar, de modo análogo a como sucede con los años. Cuando la diferencia DUT1 va a exceder 0.s 9, se añade un segundo. Este segundo intercalar, normalmente, se le añade al último minuto del año en diciembre, o al último minuto de junio, lo que se anuncia con suficiente antelación por los organismos encargados del tiempo. En el momento de terminar este libro 5 También llamado a veces tiempo zulú y GMT , aunque este nombre ya hemos dicho antes que es confuso y por ello desaconsejado. 88 Referencia temporal el valor de DTA es de 35s con el último segundo intercalar introducido el 30 de Junio de 2012. El UTC es el tiempo difundido por las señales horarias con una precisión de ±0.s 00002 y es tomado como base para definir la hora oficial de cada paı́s o zona. 5.5.3 Tiempo de zona y tiempo oficial El tiempo universal coordinado nos da un tiempo medio común, pero referido al meridiano origen. Un sistema de estándares para todo el globo terrestre está basado en las zonas o husos horarios, basados en incrementos de 15 (una hora) de longitud, aunque, en la práctica, son los gobiernos de los distintos paı́ses quienes decretan el llamado tiempo de zona (ZT ), tomando generalmente como base un número entero de horas que represente la longitud media m de una zona o paı́s determinado, de modo que ZT = UTC + m. (5.15) Sin embargo, este tiempo de zona no suele ser el que un paı́s adopta para su territorio, la llamada hora oficial, sino que ésta se regula mediante criterios polı́ticos o económicos. Ası́, hora oficial española (TE ), viene dada como: TE invierno = UTC + 1h , TE verano = UTC + 2h , siendo TE invierno la hora oficial desde el último domingo del mes de octubre al último domingo del mes de marzo, y TE verano la del resto del año. La diferencia de longitud obliga a definir una hora menos para Canarias. Notemos que realmente, nuestro tiempo de zona no corresponde con nuestro huso horario (el meridiano de Greenwich pasa por la penı́nsula), sino que llevamos el llamado CET (Central European Time), el tiempo de la zona de la Europa central. 5.6 Escalas modernas de tiempo Tanto el TAI como el ET son esencialmente el mismo tiempo dentro del contexto de la mecánica newtoniana, pues ambos señalan un tiempo absoluto. La IAU en el año 1976, considerando la precisión alcanzada entonces en la medida del tiempo, señaló la necesidad de introducir las variaciones de tiempo derivadas de la teorı́a de la relatividad. Ambos tiempos están medidos desde un observatorio terrestre en movimiento y, por lo tanto, son distintos de los que se medirı́an desde otro lugar, como el baricentro del sistema solar. Esto resulta de particular importancia si pensamos en que todas la teorı́as dinámicas del movimiento de los planetas, a partir de las que se obtiene el tiempo de efemérides, están formuladas tomando como origen del sistema de referencia el baricentro del sistema solar. Escalas modernas de tiempo 89 Para resolver esta ambigüedad se definieron dos nuevas clases de tiempo, que están vigentes a partir del año 1984. Estos nuevos tiempos son llamados tiempo terrestre, TT , (anteriormente llamado tiempo dinámico terrestre, TDT ), y el tiempo dinámico baricéntrico, TDB . El tiempo terrestre coincide exactamente con el tiempo de efemérides y no es sino una continuación del ET a partir del 1 de Enero de 1977. De ahı́ que su relación con el TAI sea TT = TAI + 32.s 184. (5.16) El tiempo dinámico baricéntrico (TDB ) es la variable independiente de la ecuaciones del movimiento con respecto al baricentro del sistema solar. La introducción de TT viene condicionada por la necesidad de un tiempo en el cual se formulen las ecuaciones geocéntricas del movimiento, en contraposición con el tiempo de las ecuaciones baricéntricas TDB . En los anuarios astronómicos, todas las efemérides referidas a posiciones geocéntricas vienen expresadas en TT , mientras que las referidas a posiciones baricéntricas vienen en TDB . La aplicación de la teorı́a de la relatividad a las ecuaciones del movimiento planetario permite obtener las relaciones entre TT y TDB que, simplificada, puede ponerse como TDB = TT + 0.s 001658 sen(g + 0.0167 sen g), con g = 357. 53+35999. 050 Ts . En la expresión anterior faltan los términos lunares y planetarios que son del orden de 0.s 00001 y los diarios, del orden de 0.s 000001. Teniendo en cuenta las relaciones entre los tiempos TT , ET y TAI podemos obtener la relación T = TT UTC = DTA + 32.s 184, (5.17) que, a partir del segundo intercalar introducido a mediados del año 2012 es de 67.s 184. Desde el año 1980, atendiendo a la importancia creciente del uso de la constelación de satélites GPS, se ha definido un nuevo tiempo, el llamado tiempo GPS (GPST ), que es el emitido por dichos satélites. Este tiempo está también medido con relojes atómicos y difiere del TAI en una cantidad constante de 19s GPST = TAI 19s . (5.18) De esta forma la introducción de segundos intercalares producirá una diferencia variable de un número entero de segundos con el UTC . Esta diferencia, será GPST UTC = DTA o lo que es igual, 16s desde el 1 de Julio de 2012. 19s , (5.19) 90 Referencia temporal 5.7 Tiempos coordenada El tiempo coordenada representa la coordenada tiempo de los sistemas relativistas baricéntrico y geocéntrico. El tiempo coordenada baricéntrico (TCB ) es el tiempo del sistema BCRS, mientras que el tiempo coordenada geocéntrico (TCG ) es el tiempo del sistema GCRS. De acuerdo con las definiciones de la IAU la relación entre el TCG y el TT viene dada por la expresión d TT =1 d TCG LG , donde LG es una constante adimensional fundamental cuyo valor es 6.969290134⇥ 10 10 . Estableciendo un instante inicial e integrando se obtiene la relación TCG TT = LG (JDTT 2443144.5) ⇥ 86400, (5.20) donde la diferencia viene dada en segundos. El primer orden de la relación entre el TCB y el TCG es TCB TCG = LC (JDTT siendo LC = 1.48082686741 ⇥ 10 no lineales que no se han escrito. 5.8 8 2443144.5) ⇥ 86400, (5.21) . Esta diferencia tiene además otros términos Calendario Para referir cronológicamente los acontecimientos históricos se construyeron calendarios que tratan de combinar los conceptos básicos de dı́a y año para establecer referencias que permitan identificar instantes concretos del tiempo o épocas. La duración del año no es un número entero de dı́as, por lo que la creación de calendarios ha sido una labor compleja. Estudiaremos aquı́ únicamente el calendario en vigor en el mundo occidental, aunque resulta muy interesante realizar un análisis del resto de calendarios. El calendario intenta reproducir el año trópico, pues de esta forma el comienzo de las estaciones tendrá lugar siempre en las mismas fechas del año. La duración aproximada del año trópico es de 365.2422 dı́as medios, lo que llevó a Julio César— a instancias de Sosı́genes— a la promulgación del calendario juliano, constituido por ciclos de tres años de 365 dı́as y otro, llamado año bisiesto, de 366 dı́as. En promedio, el año del calendario Juliano tiene una duración de 365.25 dı́as. Esta cantidad es muy próxima a la duración del año trópico, pero lleva un desfase de 0.0078 dı́as al año o lo que es igual, de casi un dı́a cada 128 años. Determinación de una época 91 Este desfase, con el paso del tiempo, se fue haciendo cada vez más evidente, de modo que los comienzos de las estaciones se adelantaban varios dı́as. Esto, junto con el hecho de volver a tener la fecha de Pascua en las fechas esperadas6 , motivó una profunda reforma del calendario, impulsada por el papa Gregorio XIII, que se conoce con el nombre de Reforma Gregoriana. Al calendario que se adoptó se le dio el nombre de calendario gregoriano. Este reforma corrigió el desfase acumulado e intentó paliar en lo posible el desfase para los años venideros. Como en el año 1512 la primavera comenzaba el 11 de marzo, la reforma gregoriana dispuso, en primer lugar, la desaparición de 10 dı́as, por lo que al 4 de octubre de 1582 le siguió el 15 de octubre de 1582, con lo que se restauraba el equinoccio al 21 de marzo. Además, se siguió con el sistema de años bisiestos, pero de modo que los últimos años de siglo (años que acaben en 00) , no serán bisiestos, excepto aquellos múltiplos de 400. De esta forma, no fueron o no serán bisiestos los años 1700, 1800, 1900, 2100, 2200, 2300, etc., aunque sı́ los años 1600, 2000, 2400, etc. Con este método, la duración del año es de 365.2425 dı́as, por lo que se acumula un error de 1 dı́a en 3314 años, que podrı́a ser recogido con una nueva reforma, pero dado que el número de años que han de transcurrir para que tenga lugar ese desfase, se optó por dejarlo ası́. Como el motivo principal de esta reforma fue religioso, inicialmente fue aceptada sólo por los paı́ses católicos romanos. Los paı́ses protestantes la introdujeron bastantes años más tarde y los ortodoxos incluso la rechazaron hasta comienzos del siglo XX. 5.9 Determinación de una época Una vez establecido el calendario, una fecha se localiza mediante el dı́a, mes y año y se se quiere precisar más, la hora. Desde el punto de vista astronómico, expresaremos un instante o época, T , dando los datos correspondiente en el siguiente orden: año, mes, dı́a y hora. Ası́ hablaremos del 2000 Enero 1 a las 12h UTC como el mediodı́a del uno de Enero del año 2000. En ocasiones, también emplearemos el número 0 para indicar el dı́a, ası́ Enero 0 a las 12h corresponde al 31 de Diciembre a las 12h . Sin embargo, desde un punto de vista matemático, este uso del calendario, no es muy práctico; basta simplemente con calcular el intervalo de tiempo transcurrido entre dos fechas separadas varios meses para constatar lo tedioso que resulta la operación, puesto que hay que tener en cuenta el número de dı́as que tiene cada mes y si aparece involucrado algún año bisiesto o no en el lapso de tiempo considerado. Una escala continua simplificarı́a notablemente el cálculo. Esto se consiguió con el llamado periodo juliano, propuesto por Scaliger en 1582, y que recibe el nombre por su padre, Julio Scaliger. 6 En el Concilio de Nicea se estableció que la Pascua de Resurrección se celebrase el domingo siguiente al primer plenilunio después del 21 de Marzo. 92 Referencia temporal El periodo juliano es una escala continua de tiempo, con su origen en el 4713 A.C. Enero 1d .5, esto es a las 12h TT del dı́a 1 de Enero del año -4712 del calendario Juliano proléptico7 , de modo que los años tienen una duración fija de 365.25 dı́as. Este punto inicial, aparentemente caprichoso, fue una cuidadosa elección por parte de Scaliger de tres ciclos: el ciclo solar de 28 años (cuando los dı́as de la semana y las fechas del calendario se repiten en el calendario Juliano), el ciclo de 19 años de los números áureos (cuando las fases de la luna se repiten en las mismas fechas del calendario) y el ciclo de 15 años de indicción (ciclo de impuestos romano). El número de dı́a juliano (JDN) correspondiente a un dı́a solar es el número entero de dı́as transcurridos entre la época origen y el mediodı́a de ese dı́a. El modo de calcular el JDN es simple: supongamos que queremos calcular el JDN del 1 de Enero de 1998, para ello basta con calcular el número de años transcurrido desde el origen, multiplicar por 365.25, tomar el entero por exceso de la operación, restar el número de dı́as suprimidos mediante la reforma gregoriana y añadir el número de dı́as dentro del año. En nuestro ejemplo, es 4712 + 1998 = 2450827.5, cuyo entero por exceso es 2450828. A este número hay que restarle 13 dı́as (10 de la reforma y tres por 1700, 1800 y 1900 que no fueron bisiestos), con lo que obtenemos 2450815. La fecha juliana (JD) de un instante, es el número de dı́a juliano de ese dı́a, más la fracción de dı́a desde el mediodı́a hasta ese instante. Puesto que en la determinación de la fecha juliana se utiliza la hora, la IAU recomienda usar como tiempo el TT , aunque pueden usarse otros tipos de tiempo como el UT1 , UTC , etc. En estos casos, además de las correcciones oportunas, habrá que especificar el tipo de tiempo usado, por ello hablaremos del JDTT , JDUT1 , JDUTC , etc. Si no se especifica nada se entiende que JD = JDTT . Siguiendo con el mismo ejemplo de antes el 1 de Enero de 1998 es 2450815, luego para encontrar la fecha juliana de ese mismo dı́a a las 0h TT se deberá restar 0.5 a dicho número pues es la fracción de dı́a que falta hasta las 12h TT. Ası́ pues tendremos que la fecha juliana será 2450814.5 y se representará por las letras JD seguidas de ese número JD 2450814.58 . La fecha juliana almacena en un solo número real toda la información necesaria para determinar cualquier instante o época histórica. La parte entera lleva la información del dı́a y la parte decimal de la hora. Este procedimiento limita, desde el punto de vista informático, la precisión en la determinación de la época. Por ejemplo en la época actual, y aproximadamente hasta el año 22666, se precisan siete dı́gitos para el dı́a, por lo que si almacenamos el dato en una variable de doble precisión de un ordenador nos quedan unos 7 u 8 dı́gitos para la hora, lo que supone una precisión aproximada de unos 0.s 01. 7 El calendario juliano proléptico contiene año cero, de forma que el año 1 A.C. corresponde con el año 0, el 2 A.C. con el -1, etc. 8 En la página web http://aa.usno.navy.mil/faq/docs/JD Formula.php puede verse una sencilla fórmula, y su algoritmo escrito en FORTRAN, para realizar este cálculo. Determinación de una época 93 Con objeto de reducir el número de dı́gitos necesarios para almacenar el dı́a y que la fecha juliana comience a medianoche, se suele usar, siempre que no haya lugar a confusión, la fecha juliana modificada (MJD), que no es sino la fecha juliana (JD) menos 2 400 000.5. En nuestro ejemplo, la MJD correspondiente al 1 de Enero de 1998 a las 0h es 50814.0. Con esto aumentamos a 0.s 0001 la precisión en el almacenamiento de la hora. Si se quiere más precisión será necesario almacenar por separado el dı́a y la hora. Existen otras dos formas de caracterización de una época basadas en el concepto de año en lugar del dı́a. Fueron desarrolladas para establecer la variable temporal de las teorı́as dinámicas del sistema solar. Para ello, además de caracterizar la época se establecieron épocas estándar de referencia desde donde se medı́an perı́odos de tiempo. Con anterioridad a 1976, la época estándar estaba basada en el llamado año beseliano. Bessel definió éste como un año de duración idéntica al año trópico y que comienza en el instante en que la ascensión recta del Sol medio, afectada por aberración y contada desde el equinoccio medio es de 280 . Esta elección aparentemente artificial está hecha con la intención de aproximar al máximo el comienzo del año trópico con el del calendario. El año beseliano se representa con una B seguida de un número que indica el año beseliano y un decimal para la fracción de año trópico transcurrida desde el comienzo del año beseliano. Ası́ B1900.0 representa exactamente el comienzo del año beseliano 1900, mientras que B1900.5 representa medio año trópico después. Con esta notación, para establecer un intervalo de tiempo entre dos épocas basta con restar las cantidades y conocer la duración del año trópico. La primera época origen estándar establecida fue B1900.0 y representa el instante B1900.0 = 1900 Enero 0d .813 ET . Posteriormente, hacia la mitad del siglo XX, se usó B1950.0 como época estándar. La duración variable del año trópico hace difı́cil la medición de intervalos entre dos épocas. Esto aconsejó buscar un nuevo método de representación de una época, basado esta vez en el año juliano, que se representa con una J seguida de un número que representa el año y un decimal que representa la fracción de año juliano desde el comienzo de éste. La época estándar establecida en 1976 fue la época J2000.0, que es el año 2000 Enero 1 a las 12h TDB , es decir, el JD 2451545.0, que ya nos ha aparecido en alguna fórmula de este capı́tulo y el anterior. Este nuevo sistema se adapta muy bien al uso del dı́a como unidad para expresar un cierto intervalo de tiempo, lo que resulta muy conveniente en determinado tipo de observaciones. Además, para sustituir el lapso de tiempo transcurrido en las fórmulas mencionadas, basta con calcular la fecha juliana del dı́a requerido y sustraerla de la del instante J2000.0. 94 Referencia temporal Las épocas fundamentales pueden ponerse en la forma: B1900.0 = J2000.0 = JD2415020.31352, JD2451545.0, por lo que las relaciones entre las tres formas de caracterizar una época se expresarán como: JD 2415020.31352 B = 1900.0 + , 365.24219878 (5.22) JD 2451545.0 J = 2000.0 + . 365.25 A partir del año juliano puede definirse la variable Ts , que se usa habitualmente en las teorı́as dinámicas y que hemos utilizado en el capı́tulo anterior y en éste, como la fracción de siglo juliano desde la época J2000.0,es decir Ts = JD 2451545 . 36525 (5.23) Parte II Movimiento kepleriano 95 Capı́tulo 6 Revisión de elementos de dinámica clásica 6.1 Introducción Este capı́tulo contiene un rápido repaso a algunos de los conceptos fundamentales de la Mecánica, necesarios para poder comprender parte de este libro y expresados con una notación adaptada a éste. Su presentación, en algunos casos, no es muy detallada, pues esto nos llevarı́a a una complicación innecesaria para nuestros objetivos. Remitimos al lector a libros especializados del tema para una mejor comprensión del mismo. 6.2 Movimiento de una masa puntual Supongamos un punto P que se mueve en el espacio y cuya posición, con respecto a un cierto origen O, viene dada por un vector x(t) = OP , llamado vector de posición. Éste varı́a con respecto a una variable independiente t que llamaremos tiempo y que será considerado absoluto1 de acuerdo con los axiomas de la Mecánica enunciados por Newton. Si establecemos un sistema de referencia S = {O, e1 , e2 , e3 }, en el cual el vector de posición se expresa como x(t) = x1 (t) e1 + x2 (t) e2 + x3 (t) e3 , llamaremos trayectoria relativa al sistema S a la curva (x1 (t), x2 (t), x3 (t)), dada en coordena1 Independiente de las condiciones cinemáticas y dinámicas del observador. 98 Revisión de elementos de dinámica clásica das paramétricas y definida en el intervalo I = [t0 , t1 ] 2 IR. Si la curva se reduce a un punto, diremos que la partı́cula está en reposo o equilibrio. Llamaremos velocidad del punto al vector X(t) que determina la variación de x(t) con respecto al tiempo X(t) = ẋ(t) = dx(t) . dt El lugar geométrico de los extremos del vector velocidad X(t) es llamado hodógrafa. Si la velocidad de un punto es un vector constante diremos que el movimiento es uniforme. De aquı́ en adelante el punto, o puntos, encima de la variable representarán las derivadas respecto a t. Llamaremos aceleración del punto al vector a(t) que determina la variación de X(t) con respecto al tiempo a(t) = Ẋ(t) = ẍ(t). Un movimiento uniforme viene caracterizado por una aceleración nula. Los tres conceptos anteriores son puramente geométricos y definen la cinemática del punto P . Si al punto P le añadimos el concepto de masa m, como una constante asociada al punto, podremos llamar a P partı́cula material y esto nos permitirá definir dos nuevos conceptos que caracterizarán la dinámica del punto: el momento lineal y el momento angular. Se denomina momento lineal, o cantidad de movimiento, de una partı́cula P , de masa m, al vector p = mX. Por otro lado, llamaremos momento angular de P al vector G = x ⇥ p = m(x ⇥ X). Newton establece el concepto de fuerza como la variación de la cantidad de movimiento de una partı́cula, esto es, F = ṗ = mẊ = ma, (6.1) que es la ecuación fundamental de Newton de la Mecánica. Si conocemos la fuerza que actúa sobre una partı́cula, el conjunto de tres ecuaciones diferenciales de orden dos (6.1), junto con unas condiciones iniciales x(t0 ), X(t0 ), permite averiguar, por integración, la trayectoria de la partı́cula. Aunque el movimiento sea espacial, esto es, no esté restringido a un plano, siempre puede considerarse como instantáneamente plano, puesto que en cada instante la partı́cula se encuentra en el plano instantáneo definido por los vectores de posición y velocidad. La dirección del vector momento angular G, que es por definición perpendicular a x y X, define el plano instantáneo del movimiento, es por ello que si el momento angular de una partı́cula tiene dirección constante, su movimiento es plano. Sistemas inerciales y no inerciales Q x P 99 La norma del momento angular puede ponerse como k G k = 2mk V A k, donde V A = (x ⇥ X)/2 es la llamada velocidad areolar de P . Su significado geométrico es evidente si recordamos que dado el vector x = VA O Figura 6.1: Velocidad areolar. lı́m t!0 t = lı́m t!0 1 (x ⇥ 2 1 (x ⇥ 2 x), su norma k k mide el área del triángulo OP Q de la figura 6.1. Pasando al lı́mite tendremos x 1 ) = (x ⇥ X) = V A . t 2 Ası́ pues, V A mide el área elemental barrida por el vector de posición. Cuando la velocidad areolar, o lo que es igual el módulo del momento angular, es constante, se dice que P cumple la ley de las áreas. 6.3 Sistemas inerciales y no inerciales Otro de los principios establecidos por Newton garantiza la existencia de ciertos sistemas de referencia, que llamaremos sistemas inerciales, con respecto a los cuales una partı́cula libre2 se mantiene en reposo o se mueve con una trayectoria rectilı́nea y uniforme. Para comprender mejor el concepto de sistema inercial supondremos que existe un punto fijo F , en el espacio, y tres direcciones ortogonales fijas dadas por los vectores {f 1 , f 2 , f 3 } con las que definiremos un sistema de referencia fijo F = {F, f 1 , f 2 , f 3 }, en el que la posición, velocidad y aceleración de un punto P vendrán dadas por: r = F P , v = ṙ, a = r̈. Sea otro sistema de referencia, S = {O, s1 , s2 , s3 }, en el que tanto el origen O como las direcciones de los vectores de la base pueden moverse. Puesto que consideramos sistemas de referencia ortonormales, la única forma que tienen de moverse los vectores de la base es que ésta gire. Este movimiento implica que se verifiqua la condición ṡi 6= 0. Si ṡi = 0 diremos que el sistema se traslada. Llamaremos xo = F O al vector de posición del origen del sistema S respecto del sistema fijo F. Su velocidad y aceleración vendrán dadas por los vectores v o = ẋo , ao = ẍo . P3 Si el sistema S gira se tendrá ṡi 6= 0 y por tanto se podrá poner ṡi = j=1 aij sj , donde fácilmente puede comprobarse que se verifica aij = ṡi · sj . 2 Partı́cula sobre la que no actúa ninguna fuerza externa. 100 Revisión de elementos de dinámica clásica Por otro lado, puesto que consideramos únicamente sistemas ortonormales, se verificarán las relaciones si · si = 1, si · sj = 0, que derivadas conducen a 2ṡi · si = 0, ṡi · sj + si · ṡj = 0, o lo que es igual a aii = 0, aij + aji = 0. Llamando ahora !3 = a12 , !2 = a13 , !1 = a23 , podremos poner finalmente 0 1 0 10 1 ṡ1 0 !3 !2 s1 @ ṡ2 A = @ !3 0 ! 1 A @ s2 A , ṡ3 !2 !1 0 s3 o lo que es igual ṡi = ! ⇥ si , P3 (6.2) donde el vector ! = i=1 !i si será llamado velocidad angular del sistema. Las ecuaciones (6.2), llamadas fórmulas de Poisson, caracterizan la rotación de un sistema de referencia. Llamaremos x al vector OP , esto es, al vector de posición de P cuyas componentes en el sistema S son (x1 , x2 , x3 ). Para calcular la velocidad y aceleración de P relativa al sistema S bastará derivar x respecto al tiempo con lo que tendremos ẋ = 3 X ẋi si + i=1 3 X xi ṡi = x0 + i=1 3 X i=1 xi (! ⇥ si ) = x0 + ! ⇥ 3 X x i si , i=1 P3 donde, de aquı́ en adelante, llamaremos x0 = i=0 ẋi si , esto es, al resultado de derivar las tres componentes del vector sin considerar la variación de los vectores de la base. Ası́ llegamos a la expresión ẋ = x0 + ! ⇥ x. (6.3) Esta expresión puede usarse para el cálculo de la derivada segunda obteniéndose finalmente ẍ = = = dx0 d(! ⇥ x) + dt dt (x00 + ! ⇥ x0 ) + ! 0 ⇥ x + ! ⇥ (x0 + ! ⇥ x) (6.4) x00 + 2 ! ⇥ x0 + ! 0 ⇥ x + ! ⇥ (! ⇥ x), donde hemos tenido en cuenta que de acuerdo con (6.3) !˙ = ! 0 . Las ecuaciones anteriores permiten obtener la velocidad y aceleración de un punto P , relativa a un sistema S, como: ẋ = x0 + ! ⇥ x, ẍ = x00 + 2! ⇥ x0 + ! 0 ⇥ x + ! ⇥ (! ⇥ x). (6.5) Ahora ya estamos en condiciones de relacionar la posición, velocidad y aceleración de P en los sistemas fijo y móvil. Para ello, a partir de la relación entre las posiciones r = F P = F O + OP = xo + x, Movimiento de una partı́cula en su plano 101 obtendremos la velocidad v = ṙ = ẋo + ẋ = v o + x0 + ! ⇥ x, y finalmente la aceleración a = r̈ = ẍo + ẍ = ao + x00 + 2! ⇥ x0 + ! 0 ⇥ x + ! ⇥ (! ⇥ x). La expresión anterior para la aceleración puede expresarse en la forma a = x00 + aa + ac + ao , (6.6) siendo x00 la aceleración relativa, ac = 2 ! ⇥ x0 , la aceleración de coriolis, aa = ! 0 ⇥ x + ! ⇥ (! ⇥ x), la aceleración de arrastre y ao la aceleración del origen. La ecuación fundamental de Newton (6.1) se expresará finalmente como F = ma = mx00 + maa + mac + mao , (6.7) lo que muestra que la formulación de las ecuaciones del movimiento en un sistema fijo y otro móvil es distinta pues en el móvil a la aceleración relativa (o vector de las derivadas segundas de las componentes) debemos añadir las aceleraciones del origen, de arrastre y de coriolis. El concepto de sistema móvil, utilizado en el párrafo anterior, queda muy impreciso. Podemos precisarlo más atendiendo a la propia ecuación (6.7). Diremos que un sistema S es inercial si las ecuaciones del movimiento de un punto P en dicho sistema se pueden expresar como F = mẍ = mx00 , esto es, cuando las aceleraciones de arrastre, de coriolis y del origen son nulas. Esto ocurre únicamente cuando el origen tiene un movimiento rectilı́neo y uniforme (ao = 0) y cuando los ejes del sistema no rotan (! = 0), esto es, cuando el sistema está fijo o se traslada con un movimiento rectilı́neo y uniforme. De aquı́ en adelante supondremos la existencia de un sistema inercial S = {O, e1 , e2 , e3 } que llamaremos sistema espacial. En este sistema se tendrá x = P3 P3 P3 0 00 i=0 xi ei , ẋ = x = i=0 ẋi ei y ẍ = x = i=0 ẍi ei . Por tanto, las ecuaciones del movimiento vendrán dadas por F = mẍ. 6.4 (6.8) Movimiento de una partı́cula en su plano Hemos dicho anteriormente que el movimiento de la partı́cula tiene lugar en un plano, no necesariamente fijo, definido por el vector G. Con objeto de simplificar algunas de las propiedades del movimiento será conveniente definir nuevos sistemas de referencia, que pueden no ser inerciales, donde algunos parámetros dinámicos se formularán de forma mucho más sencilla. 102 Revisión de elementos de dinámica clásica Para ello pongamos en primer lugar G = G n, x = r u donde n, u representan las direcciones de los vectores G, x y G, r sus normas. Por ser n y u ortogonales podemos definir un nuevo vector v = n ⇥ u de forma que U = {O, u, v, n} sea un sistema de referencia ortonormal directo que llamaremos sistema orbital. Las direcciones definidas por u, v, n serán llamadas respectivamente dirección radial, dirección transversal y dirección normal, y el plano Oxy representa el plano instantáneo del movimiento. e3 n v u p2 v x X u p1 e2 O e1 ✓ p1 Figura 6.2: Sistema de referencia orbital. Con objeto de estudiar mejor el movimiento de una partı́cula en su plano es conveniente elegir un sistema de coordenadas polares, para lo cual, puesto que ya tenemos O como origen de coordenadas, basta definir una dirección constante en el plano, p1 , desde donde medir el ángulo ✓ de coordenadas polares (figura 6.2). Si llamamos p2 = n ⇥ p1 , podremos definir un sistema de referencia ortonormal {O, p1 , p2 , n}, tal que las direcciones p1 , p2 son constantes, esto es, ṗ1 = 0, ṗ2 = 0. Las expresiones de u, v en la base p1 , p2 , n serán: u = cos ✓ p1 + sen ✓ p2 , v sen ✓ p1 + cos ✓ p2 , = que derivadas conducen a las igualdades: u̇ = ✓˙ v, v̇ = ✓˙ u. (6.9) Teniendo en cuenta las relaciones anteriores y la expresión del vector de posición en la base orbital x = ru, se llega fácilmente, por derivación, a las expresiones: X a = = ẋ ẍ = = ṙ u + r✓˙ v, ˙ v, (r̈ r✓˙2 ) u + (r✓¨ + 2ṙ✓) (6.10) que expresan la velocidad y aceleración de P en el sistema orbital y define los con˙ ası́ como los de aceleración ceptos de velocidad radial ṙ, velocidad transversal r✓, 2 ˙ ¨ ˙ radial (r̈ r✓ ) y aceleración transversal (r✓ + 2ṙ✓). Sistemas dinámicos 103 El vector velocidad areolar se podrá expresar, en el sistema orbital, como VA= 6.5 1 2˙ r ✓ n. 2 (6.11) Sistemas dinámicos Supondremos un sistema dinámico formado por N puntos Pi , i = 1, . . . , N, de masas mi y cuya posición viene expresada en un sistema inercial por los vectores xi . Como sabemos la dinámica de este sistema de puntos viene descrita por el conjunto de ecuaciones resultante de la aplicación de la ecuación fundamental de Newton a cada una de las partı́culas Fi = dpi , dt i = 1, . . . , N, siendo pi = mi ẋi . (6.12) En general los puntos Pi no se mueven libremente sino que están sujetos a una serie de condiciones, o ligaduras, que no son sino relaciones funcionales entre los vectores de posición del tipo f (x1 , x2 , . . . , xN ; t) = 0. Ejemplos de ligaduras de este tipo son las relaciones entre los puntos de un sólido: (xi xj )2 = c2ij o el que una partı́cula que se mueve en una curva o superficie, etc. Normalmente nos referiremos a cada partı́cula por un vector xi , de tres coordenadas cartesianas, por lo que un sistema de N puntos viene representado por 3N coordenadas. Si el sistema tiene k ligaduras o ecuaciones de relación, podrán introducirse n = 3N k coordenadas independientes, q = (q1 , . . . , qn ), de forma que podamos expresar las posiciones de las partı́culas como xi = xi (q; t), i = 1, . . . , N. A este conjunto de coordenadas independientes les llamaremos coordenadas generalizadas, mientras que al espacio n-dimensional de las coordenadas libres le llamaremos espacio de configuración. Las derivadas de las coordenadas generalizadas q̇ = (q̇1 , . . . , q̇n ) son las velocidades generalizadas. Llamaremos número de grados de libertad al número n de coordenadas libres del sistema. Se llama energı́a cinética de un sistema dinámico a la función T = N X 1 i=0 2 mi ẋ2i . Para expresar la energı́a cinética en función de las coordenadas generalizadas tendremos en cuenta que xi = xi (q1 , . . . qn ), por tanto ẋi = @xi dq @x + = @q dt @t i (q, q̇, t), 104 Revisión de elementos de dinámica clásica y finalmente se tendrá T = T (q, q̇, t). Se llama energı́a potencial del sistema a una función escalar V cuyo gradiente coincide con la resultante F de las fuerzas que actúan sobre una partı́cula. ✓ ◆ @V @V F = rV = ,..., . @q1 @qn Cuando V existe sólo depende de q, no depende ni de q̇ ni de t. Por tanto V = V (q). 6.6 Ecuaciones de Lagrange y de Hamilton Llamaremos función lagrangiana de un sistema dinámico a la expresión L(q, q̇, t) = T (q, q̇, t) + V (q). (6.13) Las ecuaciones del movimiento de un sistema mecánico (6.12) pueden expresarse en términos de la función lagrangiana en la forma ✓ ◆ d @L @L = 0, i = 1, . . . , n, (6.14) dt @ q̇ i @q i o lo que es igual ⌘ d ⇣ rq̇ L rq L = 0. (6.15) dt Estas ecuaciones serán llamadas ecuaciones de Lagrange y su solución equivale a la solución de las ecuaciones de Newton del sistema. Definiremos los momentos (generalizados), p = (p1 , . . . , pn ), a partir de las igualdades @L pi = . (6.16) @ q̇i Estas funciones nos permiten expresar las velocidades generalizadas q̇i en la forma q̇i = q̇i (q, p, t). Al espacio 2n dimensional (q, p) le llamaremos espacio fásico (o espacio de las fases). Llamaremos función hamiltoniana, o también hamiltoniano H, a la transformada de Legendre de la función lagrangiana considerada como función de q̇, esto es H(q, p, t) = p · q̇(q, p, t) L(q, q̇(q, p, t), t). (6.17) El sistema de ecuaciones de Lagrange (6.14) es equivalente a las ecuaciones: q̇ = @H = rp H, @p ṗ = @H = @q rq H, (6.18) Transformaciones canónicas 105 que son llamadas ecuaciones de Hamilton del sistema. En ocasiones utilizaremos una notación más compacta en la que llamaremos x = (q, p) 2 IRn ⇥ IRn al vector de coordenadas y momentos (en este orden), de forma que el hamiltoniano se expresará como H(x, t) = H(q, p, t). (6.19) La evolución dinámica del sistema viene dada por las ecuaciones de Hamilton ẋ = J rx H, donde J es la matriz antisimétrica J = ✓ 0n In In 0n (6.20) ◆ , que verifica J 1 = J T = J , y donde 0n , In , representan, respectivamente, las matrices nula y unidad de orden n. 6.7 Transformaciones canónicas Sea la transformación del espacio fásico : IR2n ! IR2n : x = (q, p) ! y = (Q, P ), definida por las expresiones y = y(x, t), que supondremos de clase C (1) y tal que det 6= 0 en el dominio (x, t) que se considere, siendo la matriz jacobiana 0 1 @y1 @y1 . . . ✓ ◆ B @x @x2n C 1 @yi B C ... ... = y x = rx y = = B ... (6.21) C. @xj @ @y @y2n A 2n ... @x1 @x2n Una transformación que satisface las condiciones anteriores se dice transformación canónica, si y solo si, existe una constante µ tal que se satisface la relación3 J T = µJ . La constante µ es llamada multiplicador de la transformación. En particular, si µ = 1 la transformación se llama transformación completamente canónica (t.c.c). Propiedad.- Una transformación es canónica, si y solo si se tiene T J = µJ . Propiedad.- El conjunto de las transformaciones canónicas forma grupo con respecto a la composición de transformaciones. Las transformaciones completamente canónicas forman un subgrupo del grupo anterior. Hay que recordar aquı́ que la composición de dos transformaciones canónicas es otra transformación canónica de multiplicador el producto de los multiplicadores. 3 Una matriz A que satisfaga la condición AJ AT = J será llamada matriz simpléctica. 106 Revisión de elementos de dinámica clásica Además, si 1 , 2 son las matrices jacobianas correspondientes a dos transformaciones canónicas, la matriz jacobiana de la composición es el producto 1 2 . Por otro lado, la transformación identidad (cuya matriz jacobiana es I2n ) T es una transformación canónica de multiplicador 1, pues I2n J I2n = J . Esta transformación representa el elemento neutro del grupo de transformaciones. Por último, la inversa de una transformación canónica de matriz jacobiana 1 y multiplicador µ, es otra transformación canónica de matriz jacobiana y multiplicador 1/µ. La propiedad anterior nos asegura que para cada t.c.c : y = y(x, t) existe una transformación inversa ' : x = x(y, t). Esta transformación puede ser aplicada a la función F (x, t), definida en el espacio fásico, con lo que obtendremos la función transformada '⇤ F (y, t) = F (x(y, t), t). Propiedad.- Una transformación y = y(x, t) es canónica si y solo si existe una función W, y una función resto, R = R(t), tal que d W = 2Rdt µx·J dx+y·J dy, siendo µ constante. Propiedad.- Una transformación y = y(x) es completamente canónica si y solo si existe una función W tal que se verifica una cualquiera de las relaciones siguientes: dW dW dW dW = = = = q · d p + P · d Q, q · dp Q · dP, p · dq + Q · dP, p · d q P · d Q. (6.22) Propiedad.- Sean S (1) (P , q, t), S (2) (p, Q, t), S (3) (p, P , t), S (4) (p, q, t) funciones (1) (2) (3) (4) de clase C (2) tales que det(S ) 6= 0, det(S ) 6= 0, det(S ) 6= 0, det(S ) 6= Pq pQ pP qQ 0, entonces las ecuaciones: p q = = q p = = rq S (1) , rp S (2) , rP S (3) , rq S (4) , Q P = = Q P = = rP S (1) , rQ S (2) , rP S (3) , rQ S (4) , R(1) R(2) R(3) R(4) = = = = (1) St , (2) St , (3) St , (4) St , (6.23) definen transformaciones completamente canónicas de función resto R(i) . A las funciones S (i) se les llama función generatriz (o generador) de la transformación, y a las transformaciones generadas se les llama transformaciones de contacto. Ecuación de Hamilton–Jacobi y ecuación de Delaunay 6.8 107 Ecuación de Hamilton–Jacobi y ecuación de Delaunay Propiedad.- Si existe una función S(P , q, t) generatriz, del tipo S (1) , de una transformación completamente canónica que satisface la ecuación de Hamilton– Jacobi H(q, rq S, t) + St = 0, (6.24) entonces las nuevas variables y momentos (Q, P ) son constantes (integrales) del sistema dinámico de hamiltoniano H. Si el hamiltoniano H es conservativo se tendrá H(q, rq S) = St = P1 , donde P1 es una constante que suele tomarse como nuevo primer momento. De esta forma S = P1 t + W(P , q), y la ecuación de Hamilton–Jacobi se transforma en H(q, rq W) = P1 . (6.25) Encontrar una función W solución de la ecuación anterior equivale a encontrar una transformación canónica que transforma el hamiltoniano en K(Q, P ) = P1 . Poincaré generaliza este resultado y propone buscar un generador S(P , q) que sea solución de la ecuación en derivadas parciales H(q, rq S) = K(rP S, P ), (6.26) de manera que la transformación completamente canónica generada por ella transforme el hamiltoniano en K(y, Y ). A dicha ecuación le llamó ecuación de Delaunay por su similitud con la usada por éste para la teorı́a de la Luna. 108 Revisión de elementos de dinámica clásica Capı́tulo 7 Movimiento kepleriano 7.1 Introducción El movimiento de los planetas es uno de los problemas que más interés ha suscitado a lo largo de la historia de la ciencia. La explicación de este movimiento favoreció el desarrollo de numerosos métodos matemáticos y fı́sicos e incluso la creación de nuevas disciplinas cientı́ficas con las que abordar el aparentemente simple pero sutilmente complejo problema. Aunque a este tema han dedicado sus esfuerzos muchos de los mejores cientı́ficos, tanto antes como después de Kepler y Newton, a ellos dos se deben las bases sobre las que se sustentan, tanto la Mecánica Celeste, como la Astrodinámica y que serán descritas a lo largo de este capı́tulo. 7.2 Leyes de Kepler El paso fundamental en la explicación del movimiento de los planetas lo dio Johannes Kepler (1571-1630), quien a partir de las excelentes observaciones llevadas a cabo por su maestro, el astrónomo danés Tycho Brahe (1546-1601), dedujo las tres leyes llamadas leyes de Kepler 1 , que pueden enunciarse de la siguiente manera: 1. Los planetas se mueven en órbitas planas alrededor del Sol, siendo las áreas descritas proporcionales a los tiempos empleados en describirlas (figura 7.1). 1 Las dos primeras leyes las publicó en 1609 en su obra Astronomia Nova, mientras que la tercera fue posterior (1619) y apareció en Harmonicie Mundi. Libri V. 110 Movimiento kepleriano 2. Las órbitas descritas por los planetas son elipses, de las cuales, el Sol ocupa un foco. 3. Los cubos de los semiejes mayores de las órbitas planetarias son proporcionales a los cuadrados de los tiempos empleados en recorrerlas. Lo que sigue de capı́tulo lo dedicaremos a desarrollar las herramientas necesarias para comprender las leyes de Kepler y, a partir de ellas, desvelar el camino seguido por Newton para enunciar la ley de gravitación universal que es el fundamento de la Mecánica Celeste y de la Astrodinámica. 7.3 Figura 7.1: Ley de las áreas. Propiedades de las cónicas La segunda ley de Kepler establece la elipse como la figura del movimiento orbital de los planetas. Las consecuencias de la ley de Newton, que se verán después, añaden la parábola y la hipérbola como posible movimiento orbital. Estas tres figuras geométricas tienen en común la propiedad que las define como el lugar geométrico de los puntos tales que la razón de sus distancias a un punto fijo, foco, y a una recta también fija, directriz, es una constante e > 0, que llamaremos excentricidad. Estas figuras son llamadas cónicas y sus propiedades determinan muchas de las propiedades del movimiento orbital por lo que son analizadas en este apartado. De acuerdo con la anterior definición, y la figura 7.2 se tendrá FP r =e= , PQ p/e r cos ✓ (7.1) P Q r ✓ D donde hemos introducido el parámeF (foco) eje directriz tro p > 0, que es igual a h e, siendo h la distancia entre el foco y la diFigura 7.2: Eje y directriz de una cónica. rectriz. A la recta perpendicular a la directriz que pasa por el foco se le llamará eje de la cónica. De acuerdo con (7.1), la ecuación de la cónica en coordenadas polares, con origen en F y cuyo eje es el de la cónica, tendrá la forma: r= p . 1 + e cos ✓ (7.2) Propiedades de las cónicas 111 La constante e determina la forma de la cónica, mientras que p nos da la escala de longitud. Al parámetro p se la suele llamar semilado recto 2 , pues para ✓ = ⇡/2, r = p, luego representa la mitad de la cuerda perpendicular al eje que pasa por el foco. Nótese que el caso e = 0, que se obtiene como caso lı́mite cuando la directriz se encuentra a una distancia infinita, corresponde a la curva r = p, esto es, a una circunferencia de radio p. La ecuación (7.2) puede ser escrita como p = 1 + e cos ✓. r (7.3) Los valores ✓ = 0, ✓ = ⇡ corresponden, respectivamente, al máximo y mı́nimo de p/r, esto es, al mı́nimo y máximo de r. Sin embargo, cuando e 1, el valor ✓ = ⇡ carece de sentido pues por ser r una distancia, p/r debe ser estrictamente positivo. De acuerdo con esta propiedad distinguiremos tres casos según los valores de e. 7.3.1 Elipses: 0  e < 1 Llamaremos elipse a un cónica cuya excentricidad esté entre cero y uno. En este caso tendremos un valor mı́nimo y máximo de r en dos puntos, que llamaremos respectivamente pericentro y apocentro. Las distancias al foco en estos puntos vienen dadas por: p p rp = , ra = . (7.4) 1+e 1 e Introduzcamos tres nuevas constantes por medio de las relaciones: p p pe a= , c = ae = , b = a 1 e2 , (7.5) 2 2 1 e 1 e y definamos un sistema de referencia plano en el que el origen O es un punto del eje de la cónica a una distancia c del foco en la dirección opuesta a la directriz, y el eje Ox es el eje de la cónica, mientras que el eje Oy es perpendicular a Ox. En este sistema de referencia las coordenadas cartesianas de un punto de la elipse vendrán dadas por x = y = c + r cos ✓ = r sen ✓ = c+ p cos ✓ , 1 + e cos ✓ p sen ✓ . 1 + e cos ✓ (7.6) Puede comprobarse fácilmente que un punto P de coordenadas (x, y) dadas por las expresiones anteriores verifica la ecuación x2 y2 + 2 = 1. 2 a b 2 Semilatus rectum. (7.7) 112 Movimiento kepleriano Las distancias a y b son llamadas, respectivamente, semieje mayor y semieje menor de la elipse y su significado puede verse en la figura 7.3. F0 7.3.2 = = c F rp a De acuerdo con la primera de las expresiones (7.5) podemos expresar las distancias (7.4) al pericentro y apocentro como: rp ra a b Figura 7.3: Elipse. a (1 e), a (1 + e). (7.8) Parábolas: e = 1 Cuando la excentricidad vale uno, la cónica es llamada parábola. En este caso únicamente hay pericentro, por lo que tenemos una curva abierta. La distancia mı́nima al foco es ahora rp = p/2. Si elegimos un sistema da referencia plano, con origen en el periastro y eje Ox el de la cónica con coordenadas positivas en la dirección opuesta a la directriz, las coordenadas cartesianas de un punto de la parábola serán x = y = p 2 p cos ✓ , 1 + cos ✓ p sen ✓ , 1 + cos ✓ (7.9) de donde fácilmente obtenemos como ecuación de la parábola la expresión y 2 = 2px, (7.10) cuya gráfica puede verse en la figura 7.4(a). 7.3.3 Hipérbolas: e > 1 Las cónicas con excentricidad mayor que uno, llamadas hipérbolas, únicamente poseen pericentro por lo que, como las parábolas, son curvas abiertas. Si introducimos las cantidades: a= p e2 1 , c = ae, b=a p e2 1, (7.11) y definimos un sistema de referencia plano con origen en un punto del eje de la cónica a una distancia c del foco en la dirección de la directriz y eje Ox el de la Ley de gravitación de Newton 113 cónica, las coordenadas cartesianas de un punto p de la hipérbola serán x = y = p cos ✓ , 1 + e cos ✓ p sen ✓ . 1 + e cos ✓ ae (7.12) La ecuación de la hipérbola será por tanto x2 a2 y2 = 1, b2 (7.13) que de acuerdo con la figura 7.4(b) tiene dos ramas simétricas. El valor de la distancia al pericentro será en este caso rp = a (e 1). (7.14) y p 2 p 2 x F rp b c O a c (a) Parábola (b) Hipérbola Figura 7.4: Cónicas abiertas 7.4 Ley de gravitación de Newton Las leyes de Kepler suponen el penúltimo eslabón en la carrera por comprender y explicar el movimiento de los planetas. Éstas describen con exactitud el movimiento de los mismos pero, sin embargo, no dan una explicación fı́sica de las causas del movimiento. El último paso lo da Isaac Newton (1642–1727) quien, a partir de estas leyes y tras poner las bases de la Mecánica y del Cálculo Diferencial, enuncia la ley de gravitación universal que ha seguido vigente hasta la 114 Movimiento kepleriano introducción de la teorı́a de la relatividad, pero que todavı́a sigue dando respuesta a la mayor parte de las cuestiones que plantea el movimiento orbital. En lugar de limitarnos a enunciar la ley de gravitación deduciremos ésta a partir de las leyes de Kepler. Para ello formularemos las leyes de Kepler desde un punto de vista más matemático. De acuerdo con la segunda ley, un planeta se mueve en una órbita elı́ptica, que expresada en coordenadas polares es r= a(1 e2 ) , 1 + e cos ✓ (7.15) donde a y e son dos constantes que representan el semieje y la excentricidad de la elipse, mientras que r depende de t a través del ángulo ✓. La tercera ley de Kepler nos indica que la razón a3 /P 2 es constante para todos los planetas. Aquı́ hemos llamado P al periodo orbital del planeta. Si el movimiento es plano, el vector posición x lo podemos descomponer en dos direcciones, la radial (u = x/r) y la transversal (v), perpendicular a la radial, de modo que los vectores posición, velocidad y aceleración son: x = u r, ˙ ẋ = u ṙ + v r✓, 2 ˙ ¨ ẍ = u (r̈ r✓ ) + v (2ṙ✓˙ + r✓). (7.16) La velocidad areolar (área barrida por el radio vector por unidad de tiempo) es ˙ r2 ✓/2; pues bien, la primera ley nos dice que esta expresión es una constante, que se podrá obtener dividiendo el valor de un área barrida (que sepamos calcular) por el tiempo invertido en describirla. En un periodo P , el área barrida será precisamente el área de la elipse (⇡ab), ası́ pues, p 1 2 ˙ ⇡ab ⇡ a2 1 e 2 r ✓= = , (7.17) 2 P P pero esta expresión es una cantidad constante, por lo que derivando, se tiene que ˙ d(r2 ✓) ¨ = 0, = r(2ṙ✓˙ + r✓) dt o lo que es lo mismo, la aceleración transversal (7.16) es nula, y la aceleración solamente tiene componente radial, luego la fuerza que produce el movimiento debe ser radial (recordemos que la segunda ley de la Mecánica de Newton establece que la fuerza = masa ⇥ aceleración). En consecuencia, la fuerza que ejerce el Sol sobre un planeta de masa m será x F = m(r̈ r✓˙2 ) . r Derivando la ecuación de la elipse (7.15) y teniendo en cuenta la expresión (7.17) de la velocidad areolar obtenida a partir de la tercera ley de Kepler, llegamos a F = m 4⇡ 2 a3 x= P 2 r3 m x, r3 Problema de dos cuerpos 115 donde hemos llamado a la constante derivada de la tercera ley de Kepler. Finalmente, por el principio de acción y reacción de Newton, la fuerza ejercida por el Sol sobre el planeta debe ser igual en norma, pero de sentido contrario, a la que ejerce el planeta sobre el Sol, luego de modo análogo se tendrá m =m , siendo m la masa del Sol y la constante para la órbita del Sol respecto del planeta. De acuerdo con esa igualdad, podremos poner m = m = G, donde hemos introducido una nueva constante G que llamaremos constante de gravitación universal. Esto conduce finalmente a la expresión final de la fuerza de atracción que el Sol ejerce sobre el planeta F = G mm x , r2 r (7.18) que nos permite enunciar la Ley de Newton, que dice: la fuerza que ejerce el Sol sobre un planeta es atractiva, lleva la dirección de ambos cuerpos y es proporcional al producto de las masas de éstos, e inversamente proporcional al cuadrado de su distancia mutua. 7.5 Problema de dos cuerpos La ley de Newton, que ha sido enunciada en el apartado anterior para dos planetas, puede extenderse a dos masas puntuales cualesquiera siendo la base del problema fundamental de la Astrodinámica o Mecánica Celeste, que será llamado problema de dos cuerpos, y que consiste en el estudio del movimiento de dos masas puntuales P1 , P2 , de masas respectivas m1 , m2 , que interaccionan gravitacionalmente bajo la ley de atracción universal enunciada por Newton. P2 x r2 r1 P1 O Figura 7.5: Problema de dos cuerpos. Para formular este problema llamaremos r 1 , r 2 respectivamente, a los vectores de posición OP1 , OP2 , y x al vector de posición relativa P1 P2 y supondremos que están referidos a un sistema de referencia ortogonal, directo e inercial. En virtud de la segunda ley de la mecánica de Newton (fuerza = masa ⇥ aceleración), se tiene que: m1 r̈ 1 = m2 r̈ 2 = m1 m2 x , r2 r m1 m2 x G , r2 r G (7.19) 116 Movimiento kepleriano donde r = k x k es la distancia mutua entre P1 y P2 , y G la constante de gravitación universal. El sistema (7.19) constituye un sistema diferencial de orden doce, por lo que la integración del problema quedará resuelta si encontramos doce integrales independientes del mismo. El problema queda fácilmente reducido a otro de orden seis si tenemos en cuenta que sumando las ecuaciones (7.19) se tiene m1 r̈ 1 + m2 r̈ 2 = 0, de donde, de manera inmediata obtenemos m1 r 1 + m2 r 2 = m r c = At + B, (7.20) donde r c representa la posición del centro de masas del sistema y m = m1 + m2 . Los vectores constantes A, B constituyen las seis primeras integrales del problema. La expresión (7.20), también llamada integral del centro de masas, nos indica que el centro de masas de un sistema formado por dos cuerpos que se atraen según la ley de gravitación de Newton, se mueve con un movimiento rectilı́neo y uniforme. 7.6 Movimiento relativo o kepleriano Las integrales del centro de masas pueden aprovecharse para formular las ecuaciones (7.19) de manera más simple. Para ello, tengamos en cuenta las relaciones m rc x = = m2 r 2 r2 + m1 r 1 , r1 , (7.21) que pueden invertirse en la forma: r1 = r2 = m2 x, m m1 rc + x. m rc (7.22) Las anteriores relaciones indican que una vez conocida la evolución temporal del vector del centro de masas r c y la del vector de posición relativa x conoceremos también la de r 1 y r 2 , por lo que el problema queda resuelto. Las seis integrales (7.20) determinan el movimiento de r c , por lo que basta encontrar el movimiento relativo de P2 respecto a P1 para que el problema quede completamente resuelto. En efecto, derivando dos veces la segunda de las ecuaciones (7.21) con respecto al tiempo y sustituyendo el valor de las segundas derivadas dado en (7.19), llegamos a las ecuaciones del movimiento relativo que pueden ponerse como: ẍ = µ x, r3 (7.23) Movimiento relativo o kepleriano 117 donde r = k x k y µ = G m = G(m1 + m2 ), siendo m la suma de las masas de P1 y P2 . La ecuación (7.23) rige el movimiento relativo de P2 en torno a P1 y es, en realidad, la ecuación que gobierna toda la Astrodinámica, pues cuando nos referimos al movimiento orbital, estamos siempre hablando del movimiento relativo, bien en torno al Sol, como en el caso de los planetas, bien en torno a la Tierra, en el caso de los satélites artificiales. Al modelo planteado por el sistema de ecuaciones diferenciales (7.23) le llamaremos problema kepleriano y al movimiento derivado de la solución de dichas ecuaciones le llamaremos movimiento kepleriano. Además, en este caso diremos que P2 está en órbita kepleriana alrededor de P1 . Aunque el problema de dos cuerpos ha sido formulado en un sistema P2 de referencia inercial, el problema kepleriano se formula en un sistema con centro en P1 y ejes paralelos a los del x sistema inercial (figura 7.6). Este sistema no rota, pero su origen se mueve con el movimiento de P1 que no P1 será en general rectilı́neo y uniforme sino que posee una aceleración y por tanto no será inercial. Esto no es problema pues las ecuaciones (7.23) no son una aplicación directa de la ley Figura 7.6: Movimiento relativo de P2 en fundamental de Newton, que debe ser torno a P1 . formulada obligatoriamente en un sistema inercial, sino que se trata de un modelo matemático obtenido por reducción del problema de dos cuerpos aplicando la integral del centro de masas. La aplicación práctica de las ecuaciones (7.23) al movimiento de un satélite artificial se formula en un sistema con centro en el centro de masas de la Tierra y ejes fijos, un sistemas de este tipo es llamado sistema inercial con centro en la Tierra, ECI, que aunque no es inercial cumple la misma función que uno inercial para este problema. Los sistemas SG (GCRS) y E o constituyen los dos ejemplos de sistemas de este tipo que usaremos para formular el movimiento de los satélites artificiales. Además de la ecuación de orden dos (7.23), las ecuaciones del movimiento kepleriano pueden ponerse como un sistema de ecuaciones de orden uno en la forma: ẋ = X, (7.24) µ Ẋ = x, r3 donde X es el vector velocidad cuya norma será llamada v. El problema kepleriano puede ser también expresado en forma hamiltoniana. Para ello supondremos un sistema dinámico cuyo hamiltoniano, que llamaremos 118 Movimiento kepleriano hamiltoniano kepleriano, tendrá la forma Hk (x, X) = 1 X ·X 2 µ , r (7.25) donde x son las coordenadas y X los momentos y hemos llamado energı́a cinética del movimiento relativo al primer sumando y energı́a potencial del movimiento relativo al segundo. Las ecuaciones de Hamilton aplicadas al hamiltoniano Hk son: ẋ = rX H k = X, Ẋ = rx H k = µ x, r3 (7.26) y por tanto son idénticas a las ecuaciones (7.24) del movimiento kepleriano, por ello, podemos concluir que éste está representado por un sistema dinámico de hamiltoniano Hk . 7.7 Solución explı́cita del problema kepleriano: funciones f y g de Lagrange La teorı́a de ecuaciones diferenciales ordinarias nos asegura que las ecuaciones (7.24) tienen una única solución para un conjunto de condiciones iniciales dado por el vector de posición y velocidad x0 , X 0 en un instante t0 . Si encontramos la expresión de la posición y velocidad para un instante dado t en términos de las condiciones iniciales x = x(t, x0 , X 0 ), X = X(t, x0 , X 0 ) podemos dar el problema por integrado. Para encontrar la solución anterior excluiremos el caso en que xo y X 0 sean colineales, que como veremos en el capı́tulo siguiente corresponde a una solución particular del problema: las órbitas rectilı́neas. Sabiendo de antemano que las soluciones del problema estarán en un plano fijo y que xo y X 0 son dos vectores linealmente independientes en dicho plano y, por tanto, forman una base del mismo, entonces existirán dos escalares f, g, dependientes del instante t y del instante t0 , tales que se verifica x = f (t; t0 ) x0 + g(t; t0 ) X 0 . (7.27) Derivando esta expresión se tendrá también que X= @f (t; t0 ) @g(t; t0 ) x0 + X 0. @t @t (7.28) Las funciones f y g de Lagrange, también llamadas coeficientes de transición, no constituyen una forma eficiente de calcular las posiciones y velocidades de un cuerpo en órbita pues, como veremos ahora, sus expresiones explı́citas en función Funciones f y g de Lagrange 119 del tiempo no pueden ser expresadas en forma cerrada, esto es, sin recurrir a desarrollos en series de potencias del tiempo. Dichos desarrollos deben ser truncados y por tanto no producen una buena aproximación a la solución. Además dichos desarrollos son válidos únicamente en un entorno pequeño de t0 . A pesar de lo dicho estudiaremos aquı́ estas funciones pues su significado es muy útil para comprender algunas propiedades de este tipo de movimiento y además son la base de algunos métodos de determinación de órbitas a partir de datos de observación, aunque éstos no serán tratados en este libro. Para ello, veremos a continuación algunas propiedades de dichas funciones. Propiedad.- Las funciones f (t; t0 ), g(t; t0 ) son soluciones de la ecuación diferencial ¨+ µ = 0, (7.29) r(t) de forma que f es la solución particular de (7.29) determinada unı́vocamente por las condiciones iniciales: f (t0 , t0 ) = 1, @f (t0 ; t0 ) = 0, @t (7.30) mientras que g es la solución particular de (7.29) determinada unı́vocamente por las condiciones iniciales: g(t0 , t0 ) = 0, @g(t0 ; t0 ) = 1. @t (7.31) Para demostrar ésto basta tener en cuenta la ecuación fundamental del movimiento orbital µ Ẋ = x, r3 donde sustituyendo las igualdades (7.27) y (7.28) obtenemos  2  2 @ f (t; t0 ) µ @ g(t; t0 ) µ + f (t; t ) x + + 3 g(t; t0 ) X 0 = 0. 0 0 @t2 r3 @t2 r La independencia lineal de x0 y X 0 nos asegura que se verificará: @ 2 f (t; t0 ) µ + 3 f (t; t0 ) @t2 r = 0, @ 2 g(t; t0 ) µ + 3 g(t; t0 ) @t2 r = 0, por lo que f y g verifican (7.29). Se completa la demostración observando que las condiciones iniciales de f y g se corresponden con las obtenidas particularizando en t = t0 las igualdades (7.27) y (7.28). 120 Movimiento kepleriano Para obtener una expresión explı́cita de las funciones f y g en función de t desarrollaremos estas funciones en serie de potencias de t. Para la obtención de dichas series usaremos un procedimiento recursivo que se adapta muy bien a su implementación en un ordenador mediante programas de manipulación algebraica y simbólica. La ecuación (7.29) puede ponerse como ¨= R , donde hemos llamado µ . r3 La función R es asimismo solución de la ecuación diferencial R= Ṙ = (7.32) 3R S, que se obtiene sin más que derivar (7.32) y llamar S a la función ṙ S= , r (7.33) que derivada conduce a la expresión ṙ2 rr̈ Ṡ = r2 . Por otro lado, considerando las constantes3 h = v 2 /2 relación v 2 = ṙ2 + r2 ✓˙2 , llegamos a las expresiones G2 , r2 ṙ2 = v 2 v 2 = 2h + ˙ y la µ/r y G = r2 ✓, 2µ , r que derivadas permiten poner r̈ G2 = 4 r r µ , r3 y finalmente Ṡ = G2 r4 R S2 = v2 ṙ2 r2 R S= v2 r2 R 2S, expresión que puede ponerse como Ṡ = W donde hemos llamado W = R 2S, v2 X2 = . r2 r2 (7.34) 3 El significado de estas expresiones y la demostración de que son constantes aparecerá en el apartado 8.2 del próximo capı́tulo. Funciones f y g de Lagrange 121 Por último, derivando W se tiene Ẇ = = 2(X · Ẋ)r2 v 2 rṙ r4 µ ṙ v 2 ṙ 2 3 2 3 r r r µ x·X r3 r2 = 2 = 2S(R + W ). 2 v 2 ṙ r3 El cálculo de las funciones f y g está basado en la resolución del sistema de ecuaciones diferenciales: ¨ = R , Ṙ = 3RS, Ṡ = Ẇ = W R 2S, (7.35) 2S(R + W ), cuya solución será expresada por medio de series de potencias en la forma: f = g = R = S = W = X fi (t t0 ) i , gi (t t0 ) i , i 0 X Ri (t t0 ) i , Si (t t0 ) i , i 0 X Wi (t i 0 X i 0 X (7.36) t0 ) i , i 0 con las condiciones iniciales siguientes: f0 = 1 , f1 = 0, g0 = 0 , g1 = 1, R0 = S0 = W0 = µ , r03 x0 · X 0 , r02 X 20 , r02 (7.37) Sustituyendo (7.36) en (7.35), e igualando término a término se llega a las 122 Movimiento kepleriano relaciones: (n + 1)(n + 2)fn+2 (n + 1)(n + 2)gn+2 (n + 1)Rn+1 n X = i=0 n X = Ri f n i , Ri g n i , i=0 n X = 3 Ri Sn i , i=0 (n + 1)Sn+1 (n + 1)Wn+1 = Wn = 2 Rn n X 2 (7.38) n X Si Sn i , i=0 Si (Rn i + Wn i ), i=0 donde se ha tenido en cuenta la propiedad X X X X ( am xm )( bn x n ) = ( ai bj i )xj . m 0 n 0 j 0 0ij Si en (7.38) hacemos n = 0 obtendremos 2f2 = R0 f 0 = R0 , 2g2 = f2 = R0 , 2 g2 = 0. y por tanto R0 g0 = 0, Además se tendrá: R1 = S1 = W1 = 3R0 S0 , W0 R0 2S02 , 2S0 (R0 + W0 ), lo que permitirá pasar a n = 1 y obtener 6f3 = R0 f 1 R1 f 0 , 6g3 = R0 g 1 R1 g 0 , de donde R 0 S0 R0 , g3 = . 2 6 De esta forma, por iteración podemos obtener cualquier fn , gn en función de f0 , f1 , g0 , g1 , R0 , S0 , W0 . Hasta orden tres se tendrá: f3 = f (t; t0 ) = 1 1 R0 (t 2 g(t; t0 ) = (t t0 ) 1 t0 )2 + R0 S0 (t 2 1 R0 (t 6 t0 ) 3 + . . . t0 ) 3 + . . . (7.39) Capı́tulo 8 Integración del problema kepleriano 8.1 Modelo orbital kepleriano P x X Llamaremos problema kepleriano al estudio del movimiento de una masa puntual P , que llamaremos orbitador 1 , relativo a un cuerpo central 2 O (figura 8.1) regido por el sistema de ecuaciones diferenciales O ẋ = X, Ẋ = µ x, r3 (8.1) donde x y X son los vectores de posición y velocidad de P expresados en un sistema de referencia inercial centrado en O, que llamaremos sistema Figura 8.1: Movimiento kepleriano. espacial, r = k x k es la distancia de P a O y v = k X k es la norma del vector velocidad. En el capı́tulo anterior hemos introducido el parámetro µ = Gm, siendo m la suma de las masas de P y O. Mientras que G se considera una constante universal, no lo será µ, pues depende de las masas de los dos cuerpos. Sin embargo, puesto 1 Satélite, 2 Sol, sonda, planeta, cometa, asteroide, etc. planeta, etc. 124 Integración del problema kepleriano que, fijado el problema, los dos cuerpos siempre serán los mismos y la masa será constante, de aquı́ en adelante utilizaremos el parámetro µ, en lugar de G, para caracterizar el tipo de órbita. Este parámetro adquiere particular importancia en el caso de órbitas de estrellas dobles donde, en general, las masas son desconocidas, y por lo tanto µ también lo es. En este capı́tulo describiremos el comportamiento del modelo orbital kepleriano, tanto desde el punto de vista geométrico como astronómico y astrodinámico. Dicha descripción debe reproducir y explicar las tres leyes de Kepler, pues este modelo proviene de dichas leyes. Para ello, buscaremos integrales (constantes) del problema con un significado cinemático y dinámico preciso. 8.2 Primeras integrales Llamaremos momento angular 3 de P al vector G = x ⇥ X. (8.2) Denotaremos con G a la norma del vector G y n a su dirección, de forma que G = G n. Propiedad.- El momento angular G, de una partı́cula que se mueve en un campo de atracción newtoniano de acuerdo con la ecuación (8.1), es constante. En efecto, derivando G tendremos µ (x ⇥ x) = 0, r3 Ġ = ẋ ⇥ X + x ⇥ Ẋ = X ⇥ X lo que demuestra la propiedad. El vector A=X ⇥G µ x, r (8.3) será llamado vector de Laplace 4 . Llamaremos A a la norma del vector de Laplace y a a su dirección, de forma que A = A a. Propiedad.- El vector de Laplace A, de una partı́cula que se mueve en un campo de atracción newtoniano de acuerdo con la ecuación (8.1), es constante. Para demostrarlo tengamos en cuenta, en primer lugar, que d(r 1 x) =r dt 3 Esta 1 X r 2 ṙx = r 3 (r2 X rṙx), definición no coincide con el concepto mecánico del momento angular de una partı́cula, pues no está multiplicado por la masa, sino que es un parámetro, sin significado fı́sico, definido en el problema kepleriano para simplificar su integración. Lo mismo ocurrirá con la energı́a h que se definirá más tarde. 4 Llamado a veces Laplace-Runge-Lenz. Primeras integrales 125 donde r2 = x · x, y por tanto r ṙ = x · X. Esto, junto con la propiedad (1.20), permite poner: d(r 1 x) 1 = 3 G ⇥ x. (8.4) dt r Derivando A tendremos Ȧ = Ẋ ⇥ G µ d(r 1 x) = dt µ x⇥G r3 µ G ⇥ x = 0, r3 lo que demuestra la propiedad. Las tres componentes del vector G y las tres de A constituyen seis integrales del sistema diferencial de orden seis5 (8.1). Si estas integrales fuesen independientes el problema estarı́a totalmente integrado, sin embargo, no lo son, como se demuestra en la siguiente propiedad. Propiedad.- Los vectores G y A no constituyen seis integrales independientes del sistema diferencial. En efecto, si G = 0, entonces A = µr 1 x, de donde A · A = µ2 r 2 x2 = µ2 , por lo tanto, las tres componentes de A poseen una relación de dependencia por ser su norma constante. Si G 6= 0 basta tener en cuenta que G · A = 0, lo que determina una dependencia entre las seis integrales. Otra importante constante, que constituirá una nueva integral aunque no independiente de las anteriores como veremos más adelante, es la constante definida por medio de la expresión 1 2 µ v , (8.5) 2 r que será llamada energı́a orbital. En la definición (8.5) llamaremos energı́a cinética T al término v 2 /2 y energı́a potencial V a µ/r. Realmente dichas expresiones no constituyen la energı́a cinética y potencial del problema de dos cuerpos, sino las de un modelo teórico que se comporte igual que el problema del movimiento relativo. Ésta es la razón por la que el valor constante de h no se deduce del teorema de conservación de la energı́a, sino que debe ser demostrado. h= En efecto ḣ = X · Ẋ + µ µ (x · X) = X · (Ẋ + 3 x) = 0. 3 r r La relación entre A, G y h puede verse en la siguiente propiedad. Propiedad.- Para una partı́cula sometida a un campo de atracción newtoniano, las constantes A, G y h verifican la relación A2 = 2hG2 + µ2 . 5 Seis ecuaciones de orden uno. (8.6) 126 Integración del problema kepleriano En efecto, teniendo en cuenta la definición de A y la relación dada en (1.19), se deduce que ✓ ◆ 2µ 2 2 A =A·A= v G2 + µ 2 , r lo que demuestra (8.6). 8.3 Deducción de la primera y segunda leyes de Kepler A falta de la última integral, que deduciremos en el apartado (8.5), el problema ha quedado cerrado desde el punto de vista mecánico. Sin embargo, esto no es ası́ si atendemos a su aspecto astrodinámico o de interpretación de los resultados. La ley de atracción de Newton se obtiene como consecuencia de las leyes de Kepler del movimiento de los planetas. Por ello, para completar el problema debemos obtener aquéllas a partir de las integrales obtenidas aquı́. Este proceso nos llevará a la obtención de las leyes de Kepler, ası́ como también a otras consecuencias interesantes del movimiento kepleriano. Atenderemos, en primer lugar, al valor del momento angular G que puede ser cero o distinto de cero. Propiedad.- El momento angular G = 0 si y solo si el movimiento tiene lugar en una lı́nea recta que pasa por el centro de atracción. du d(r 1 x) = = 0 lo dt dt que representa que el vector unitario en la dirección del orbitador P (radial) es una constante, o lo que es igual, que P se mueve en lı́nea recta. Si tenemos en cuenta la ecuación (8.4) observamos que Por otro lado, si la trayectoria es rectilı́nea, u = (r 1 x) es un vector constante, luego su derivada es cero, por tanto G⇥x es cero en cualquier instante. Puesto que x no puede ser idéntico al vector nulo en todo instante, necesariamente G debe ser paralelo a x, además G es perpendicular a x por definición, luego necesariamente G = 0. Propiedad.- El momento angular G 6= 0 si y solo si el movimiento no es rectilı́neo y tiene lugar en un plano fijo en el espacio, perpendicular a G y que pasa por el centro de atracción. Efectivamente, si G 6= 0, entonces G·x = 0 para cualquier x, luego la partı́cula siempre está en un plano perpendicular a G y que pasa por O. Por otro lado, si el movimiento tiene lugar en un plano y no es rectilı́neo x y X pertenecen a dicho plano y no son paralelos, luego G 6= 0. Esta última proposición demuestra que el movimiento es plano. Además, podemos observar que el vector G, de norma constante, representa el doble del vector Deducción de la primera y segunda leyes de Kepler 127 velocidad areolar, por lo que también verifica la ley de las áreas. Ası́ pues, queda comprobada la primera ley de Kepler y parte de la segunda (movimiento plano). Veamos ahora las propiedades que se derivan del vector de Laplace. Propiedad.- El vector de Laplace verifica las siguientes identidades: A·x = A⇥x = G2 µr, rṙG, A·X = A⇥X = µṙ, ⇣ v2 µ⌘ G, r (8.7) cuya demostración es inmediata a partir de la definición del vector A. En el caso de movimiento rectilı́neo G = 0 y por lo tanto A = µ u = µ(r 1 x), luego el vector de Laplace lleva la dirección del movimiento y además su norma es igual a µ. Por otro lado, si G 6= 0, la relación A·G = 0 indica que el vector A está siempre en el plano del movimiento. Tendremos dos casos según el valor de A. Propiedad.- Para cualquier valor de G 6= 0 el movimiento de la partı́cula tiene lugar en una cónica de excentricidad A/µ. En efecto, si A = 0, de acuerdo con la segunda relación en (8.7), ṙ = 0, luego r es constante, esto es, la órbita es circular. Además, de acuerdo con la primera de las expresiones (8.7), G2 µ r = 0, luego el radio será igual a G2 /µ. P x f O A Figura 8.2: Anomalı́a verdadera f . Si A 6= 0, llamaremos anomalı́a verdadera f 6 al ángulo entre el vector A y el vector de posición x, que vendrá dado por la expresión A · x = A r cos f. Combinando esta igualdad con la primera de las expresiones (8.7) podemos poner r= p , 1 + e cos f (8.8) donde hemos llamado: p= G2 , µ e= A . µ (8.9) La ecuación (8.8) representa una cónica de semilado recto p y excentricidad e, donde la anomalı́a verdadera corresponde al ángulo polar medido desde el eje definido por el vector de Laplace. A la dirección de A que, como vemos, juega un importante papel en la dinámica del problema de los dos cuerpos le llamaremos lı́nea de los ápsides y representa el 6 No confundir con el coeficiente de transición que se denotará siempre en la forma f (t, t0 ). 128 Integración del problema kepleriano eje de la cónica y por lo tanto la dirección donde se alcanza la mı́nima distancia, y la máxima si existe, entre el orbitador y el cuerpo central. A la posición de mı́nima distancia le llamaremos periastro, perigeo o perihelio si el foco es, respectivamente, un astro cualquiera, la Tierra o el Sol. Al punto de máxima distancia le llamaremos apoastro o bien apogeo o afelio. La última proposición demuestra la primera ley de Kepler del movimiento. Kepler habla de elipses puesto que sus leyes describen únicamente movimientos de planetas para los cuales no aparece ningún otro tipo de órbitas, sin embargo, la ley permite órbitas no cerradas (parábolas o hipérbolas). Nótese que si G = 0 la relación (8.6) coincide con la obtenida previamente, A = µ2 , mientras que para G 6= 0 se tendrá h= A2 µ 2 , 2G2 (8.10) que describe la energı́a como una función cuadrática de A. De acuerdo con esta relación podemos caracterizar el tipo de movimiento en función de la energı́a. En efecto, fijado G, h tiene un mı́nimo igual a µ2 /2G2 que se alcanza para órbitas circulares, esto es, para A = 0. Si la órbita es elı́ptica se tiene 0 < A < µ y por tanto h < 0. Para una órbita parabólica A = µ, luego h = 0. Por último, una órbita hiperbólica tiene h > 0 por ser A > µ. Por otro lado, teniendo en cuenta que para el movimiento elı́ptico se tiene a= p 1 e2 = G2 /µ µG2 = = 1 A2 /µ2 µ 2 A2 µ , 2h y para el hiperbólico a= p e2 1 = G2 /µ µG2 µ = = , 2 2 2 2 A /µ 1 A µ 2h encontramos la relación entre la energı́a y el semieje de la órbita. La definición de h, (8.5), combinada con su expresión en función del semieje de la órbita y de su excentricidad permite encontrar una expresión, muy útil, de la velocidad ✓ ◆ 2 1 e2 v2 = µ , (8.11) r p que particularizada para cada tipo de órbita puede verse, junto con otros parámetros, en la tabla (8.1). Tercera ley de Kepler: unidades lineal G=0 129 circular G>0 elı́ptica G>0 parabólica G>0 hiperbólica G>0 A=0 0<A<µ A=µ A>µ p=0 p=a>0 p = a(1 p>0 p = a(e2 e=1 e=0 0<e<1 e=1 e>1 h=0 h= h= v2 = µ2 <0 2G2 µ a e2 ) > 0 µ <0 2a ✓ ◆ 2 1 v2 = µ r a h= v2 = 2µ r 1) > 0 µ >0 2a ✓ ◆ 2 1 v2 = µ + r a Tabla 8.1: Parámetros del movimiento kepleriano. 8.4 Tercera ley de Kepler: unidades Por último comprobaremos la tercera ley de Kepler. Para ello, tendremos de nuevo en cuenta la relación p = G2 /µ. Por un lado recordemos que G es la norma del momento angular y, como se vio en el apartado 6.2, el doble de la velocidad areolar, lo que indica que G representa el doble del área barrida por unidad de tiempo. Si consideramos únicamente órbitas elı́pticas, que son las únicas para las que se puede aplicar esta ley, llamamos P al tiempo total invertido en recorrer toda la órbita o periodo de la órbita, y tenemos en cuenta que el área de una elipse es ⇡ab, tendremos G= 2⇡ab . P Por otro lado, puesto que para una elipse p = b2 /a y además µ = Gm se tendrá finalmente la relación a3 G m = µ = 4⇡ 2 2 , (8.12) P que constituye lo que, de aquı́ en adelante, denominaremos tercera ley de Kepler y que es válida solamente para el movimiento elı́ptico. La tercera ley, tal como la enunció Kepler, decı́a que la razón del cubo de los semiejes y los cuadrados de los periodos de las órbitas de los planetas era una constante. Si tenemos un planeta de masa m1 y periodo P1 y otro de masa m2 y periodo P2 , y el Sol tiene masa ms se tendrán las relaciones: G(ms + m1 ) = 4⇡ 2 a31 , P12 G(ms + m2 ) = 4⇡ 2 a32 , P22 130 Integración del problema kepleriano que divididas nos darán a31 a32 ms + m1 1 + m1 /ms : = = = P12 P22 ms + m2 1 + m2 /ms ⇡ 1, lo que nos lleva a la conclusión de que la tercera ley, tal como fue enunciada por Kepler, es falsa. Sin embargo, si tenemos en cuenta el pequeño valor de la masa de los planetas en relación con la del Sol, podemos aproximar mi /ms por cero, y por tanto puede considerarse como la unidad, lo que indica que para el grado de precisión de las observaciones de la época de Kepler la tercera ley podı́a considerarse como válida tal como él la enunció. La expresión (8.12) permite además analizar más a fondo el valor de la constante G. De hecho, G es una constante universal, pero no es adimensional, esto es, su valor numérico depende de las unidades de distancia, tiempo y masa con las que estemos trabajando. La ecuación dimensional se deduce de la expresión (8.12) y se puede poner como [G] = L3 T 2 M 1 , lo que permite su cálculo en cualquier sistema de unidades a partir de su valor fundamental establecido por la IAU que es igual a G = 6.672 ⇥ 10 11 m3 s 2 kg. En la práctica usaremos la constante µ = Gm en lugar de G pues, de este modo, se elimina la masa de la ecuación dimensional y su valor depende únicamente de las unidades de longitud y tiempo elegidas. Sin embargo, hay que considerar que µ ya no será una constante universal sino que depende del tipo de órbita y de las unidades de longitud y tiempo y, por tanto, no es igual para la órbita de un satélite artificial en torno a la Tierra7 µ = Gm = 0.00553033 r3 min 2 , que para la órbita de un planeta8 µ = Gm = 0.000295939 U.A.3 dias 2 . Es muy importante notar que una vez elegido µ, en un conjunto de unidades, el resto de variables dinámicas del problema deben ser representadas en esas mismas unidades. 8.5 Ley horaria del movimiento Las cinco integrales independientes obtenidas hasta aquı́ nos dan únicamente una visión geométrica global de la órbita, pues determinan la curva, o trayectoria, que recorre el orbitador, pero no determinan la posición del mismo en cada 7 Las unidades más adecuadas para órbitas terrestres son el radio ecuatorial r y el minuto. unidades más adecuadas para órbitas alrededor del Sol son la unidad astronómica (U.A.) que representa la distancia media de la Tierra al Sol y el dı́a medio. A veces se puede usar el año. 8 Las Ley horaria del movimiento 131 instante de tiempo. Para obtener esta posición será preciso determinar el valor de la distancia r en función del tiempo t o bien, de forma alternativa, el valor de la anomalı́a verdadera f en función de t. Para ello será necesario encontrar e integrar la relación diferencial de r o f con t obtenida a partir de la ley de las áreas que es, dentro de las leyes de Kepler, la que establece la dinámica de la partı́cula. Las fórmulas (6.10) permiten expresar los vectores de posición y velocidad en el plano orbital: x = ru, X = ṙu + rf˙v. Donde hemos tomado como eje Ox la dirección del vector de Laplace y por tanto el ángulo polar ✓ es ahora la anomalı́a verdadera f . De esta forma, si consideramos únicamente órbitas no colineales (G 6= 0), podremos poner G = x ⇥ X = r2 f˙n, luego p r2 f˙ = G = µ p . (8.13) Teniendo en cuenta el valor de la constante G, esta relación, llamada ley de las áreas, nos dará la clave para la descripción de la evolución temporal del movimiento. La posición de la partı́cula en cada instante viene dada por sus coordenadas polares r y f , luego conocida la variación de éstas con el tiempo, conoceremos la última integral y quedará resuelto el problema que nos ocupa. A partir de la relación r = p/(1 + e cos f ), dada en (8.8), puede obtenerse por simple derivación pe sen f f˙ e ṙ = = r2 f˙ sen f, (1 + e cos f )2 p y teniendo en cuenta (8.13) podemos poner ṙ = Ge sen f, p (8.14) que nos dará la variación horaria de r con respecto al tiempo en función de la anomalı́a verdadera f . Además, si podemos integrar (8.13), obtendremos la variación de f con el tiempo y por tanto la ley horaria del movimiento. 8.5.1 Formulación regularizada del movimiento kepleriano Para realizar esta integración de una manera más sencilla introduciremos un cambio de escala de tiempo, o cambio de variable, que regulariza la ecuación diferencial en r, esto es, la convierte en un sistema lineal de orden dos con coeficientes constantes. Para ello definiremos un nuevo tiempo s por medio de la ecuación de Sundman: r d s = d t. (8.15) 132 Integración del problema kepleriano Si tomamos como origen del nuevo tiempo el instante T de paso por el periastro, y elegimos s de forma que valga cero en el instante T , se tendrá la relación Z t d⌧ s(t) = , s(T ) = 0. (8.16) r(⌧ ) T El instante T corresponde al valor de f = 0, por lo que podremos poner p r(T ) = rp = , ṙ(T ) = 0. (8.17) 1+e Si denotamos con un punto la derivada respecto a t y con tilde la derivada respecto a s podremos poner: ds dt dt ds = ṡ = 0 t = = 1 , r(t) (8.18) r(s). De acuerdo con la primera de las expresiones (8.18) podemos decir que s es estrictamente creciente con t. Por otro lado, integrando la segunda podremos poner Z s (t T) = r(s)d s. (8.19) 0 En otras palabras, (8.16) tiene una única inversa dada por (8.19). La regla de la cadena permite calcular fácilmente la derivada respecto a s de un elemento cualquiera , que podrá ponerse como 0 = ˙ t0 = r ˙ , lo que permite expresar las ecuaciones del movimiento relativo (7.24) en la forma µ x0 = r X, X0 = x. (8.20) r2 Por otro lado, si recordamos la relación r ṙ = x · X, podremos poner r0 = r ṙ = x · X, lo que nos permite decir, por un lado, que r0 (s = 0) = 0, y por otro, derivando de nuevo µ r00 = x0 · X + x · X 0 = rX · X x · x = rv 2 µ. r2 Por último, sustituyendo el valor de v 2 por el que se deduce de (8.5) se llega fácilmente a la ecuación r00 2h r = µ, (8.21) que es una ecuación lineal de segundo orden de coeficientes constantes que nos servirá para encontrar la posición de la partı́cula en cualquier instante. Aunque puede encontrarse una solución de (8.21) válida para cualquier tipo de movimiento, buscaremos en primer lugar soluciones particulares que serán válidas, por separado, para cada tipo distinto de órbita. Ley horaria del movimiento 8.5.2 133 Caso parabólico En este caso h = 0 y por tanto la ecuación (8.21) se transforma en r00 = µ. De esta forma, una primera integración nos dará r0 = µs + C1 , donde C1 tomará el valor cero por ser r0 (s = 0) = 0. Por último r= µ 2 s + C2 , 2 de donde C2 = p/2 puesto que r(s = 0) = r(T ) = p/2. Por tanto, la solución podrá ponerse como 1 r = (µs2 + p). (8.22) 2 De acuerdo con esto, la cuadratura (8.19) puede ser fácilmente calculada obteniéndose µ 2(t T ) = s3 + ps, (8.23) 3 relación conocida en Mecánica Celeste como ecuación de Barker. En el caso parabólico se tiene e = 0 y por tanto r= p p f = (1 + tan2 ). 1 + cos f 2 2 Comparando esta expresión con (8.22) obtendremos tan2 f µs2 = . 2 p No existirá ambigüedad de signo al extraer la raı́z cuadrada si pensamos que s es positivo cuando t > T o, lo que es igual, cuando f es positivo. Por tanto, podemos poner r f µ tan = s, (8.24) 2 p y por último 2 r µ (t p3 T) = 1 f f tan3 + tan . 3 2 2 Para invertir esta relación basta definir dos ángulos f1 , f2 , tales que f 2 = 2 cot 2f1 = cot f1 tan3 f1 = tan tan f2 , 2 tan f1 , (8.25) 134 Integración del problema kepleriano y de esta forma tan3 f f2 = cot 2 2 tan f2 + 3(tan f 2 cot f ) = 2 cot f2 3 tan f , 2 luego finalmente se tendrá r µ 2 (t p3 T) = 2 cot f2 , 3 relación que permite obtener a partir de t, f2 y posteriormente f1 y f . 8.5.3 Caso elı́ptico En el caso elı́ptico ( 2h) > 0 y la solución de la ecuación (8.21) podrá ponerse como p r = a + C1 cos( 2hs + C2 ), (8.26) donde C1 , C2 son las constantes de integración, y a = µ/2h es el semieje mayor de la elipse. Derivando la expresión de r se tendrá p p r 0 = C1 2h sen( 2hs + C2 ). Sustituyendo los valores iniciales y teniendo en cuenta que, en este caso, la distancia en el periastro es rp = a(1 e) se obtendrán las relaciones: C1 cos C2 = a e, C1 sen C2 = 0, de donde se deduce que C1 = a e, C2 = 0 y por tanto p r = a(1 e cos[ 2hs]). (8.27) De acuerdo con esta relación la cuadratura (8.19) podrá ponerse como Z s i p p 1 1 hp (t T ) = (1 e cos[ 2hs]) d s = p 2hs e sen( 2hs) . a 2h 0 En la expresiónpanterior puede observarse la necesidad de introducir una nueva variable, E = 2hs, que será llamada anomalı́a excéntrica. De esta forma, la ecuación anterior se podrá poner como p 2h (t T ) = E e sen E. a Por otro lado, introduciendo una constante n > 0, por medio de la expresión µ = n2 a 3 , (8.28) y teniendo en cuenta la relación µ = ( 2h)a, podremos poner n(t T) = ` = E e sen E, (8.29) Ley horaria del movimiento 135 que será llamada ecuación de Kepler y donde hemos introducido la anomalı́a media ` = n(t T ). Si tenemos en cuenta la relación (8.28) y la comparamos con la tercera ley de Kepler del movimiento elı́ptico (8.12) podemos deducir que n= 2⇡ , P es decir, n representarı́a la velocidad angular si el movimiento fuese circular, con velocidad angular constante, por ello, llamaremos a n movimiento medio y en adelante podremos llamar tercera ley de Kepler tanto a (8.12) como a (8.28). La definición de anomalı́a excéntrica y la expresión (8.27) permiten expresar r en función de E en la forma r = a(1 e cos E). (8.30) Para establecer la relación entre la anomalı́a verdadera y la anomalı́a excéntrica, basta tener en mente las relaciones a(1 e2 ) = a(1 1 + e cos f r= e cos E), de donde, despejando cos f , se tiene cos f = cos E e , 1 e cos E (8.31) lo que permite poner f 2 f 2 cos2 2 2 sen2 = 1 cos f = = 1 + cos f = (1 + e)(1 cos E) 1 e cos E (1 e)(1 + cos E) 1 e cos E P0 P E f O Figura 8.3: Relación entre las anomalı́as verdadera y excéntrica = = 1+e E 2 sen2 , 1 e cos E 2 1 e E 2 cos2 , 1 e cos E 2 y dividiendo ambas igualdades se obtiene finalmente r f 1+e E tan = tan , (8.32) 2 1 e 2 que es la fórmula más frecuentemente empleada para relacionar las dos anomalı́as, pues es fácilmente invertible y porque el uso de la tangente del ángulo mitad nos asegura el cuadrante correcto en la obtención de la anomalı́a. 136 Integración del problema kepleriano Las relaciones entre estas anomalı́as permiten comprobar el significado geométrico de E que puede verse en la figura 8.3. En efecto, un punto P 0 en una circunferencia de radio a, cuya coordenada x coincida con la del astro P en su órbita, forma un ángulo E con el eje de la elipse, medido éste desde el centro de la elipse. Las distintas anomalı́as en un problema kepleriano elı́ptico representan variables angulares que recorren un arco igual a 2⇡ mientras t recorre todo un periodo P. Puede verse fácilmente que en el movimiento circular las tres anomalı́as coinciden. 8.5.4 Resolución de la ecuación de Kepler El cálculo de la anomalı́a media ` a partir de la excéntrica E es inmediato por aplicación directa de la ecuación de Kepler. Sin embargo, no lo es el caso inverso. No existe ninguna expresión algebraica cerrada que nos resuelva este problema, por lo que obtendremos de manera separada las dos aproximaciones posibles al mismo. Por un lado, la resolución numérica de la ecuación de Kepler, por otro, su resolución por medio de un desarrollo en serie. Por la simplicidad de la ecuación de Kepler, bastará en general, salvo para excentricidades muy grandes, utilizar el método de Newton–Raphson para el cálculo aproximado de raı́ces de una ecuación no lineal. Si queremos encontrar la solución de la ecuación (x) = 0 y x0 es un valor aproximado de dicha solución, el método de Newton–Raphson nos asegura que la sucesión de números (xn 1 ) xn = xn 1 , (8.33) 0 (x n 1) converge a la raiz de la ecuación (x) = 0. En nuestro caso, la ecuación es (E) = ` E + e sen E = 0. Para excentricidades pequeñas el valor de E debe ser próximo a `, por lo que en general será suficiente tomar E0 = `, o bien E0 = ` + e sen `, y construir la sucesión: ` (En 1 e sen En 1 ) En = En 1 + , (8.34) 1 e cos En 1 que converge al valor deseado. De acuerdo con la ecuación de Kepler, y en las condiciones del teorema de la función implı́cita, E puede ser vista como función de e y `, desarrollable en serie de potencias de e en la forma E(e, `) = X @j E @ej j 0 e=0 ej . j! Ley horaria del movimiento 137 Basta encontrar las derivadas de E respecto a la excentricidad y particularizar su valor para e = 0 para obtener los coeficientes de dicho desarrollo. De acuerdo con la ecuación de Kepler se tendrá E e sen E = ` =) (E)e=0 = `, y derivando sucesivamente la misma ecuación obtendremos @E @e sen E e cos E @E @E = 0 =) @e @e = sen `, e=0 para la derivada primera, @2E @e2 cos E @E @e cos E @E @E 2 + e sen E( ) @e @e @2E @e2 e cos E @2E = 0 =) @e2 = 2 sen ` cos ` = sen 2`, e=0 para la derivada segunda, etc. Finalmente obtenemos E = ` + e sen ` + e2 e3 sen 2` + (sen 3` 2 8 sen `) + . . . y reordenando términos, tomando hasta orden 5 en e, se obtiene E ` = e3 e5 + + 8 192 2 4 6 e e e ( + + + 2 6 32 3e3 27e5 ( + 8 128 e4 ( + 3 125e5 ( + 384 (e . . .) sen `+ . . .) sen 2`+ . . .) sen 3`+ . . .) sen 4`+ . . .) sen 5` + . . . Hay que hacer notar que la serie anterior no es absolutamente convergente, por lo que la reordenación de términos efectuada modifica el radio de convergencia, siéndolo únicamente para e < 0.6627. Además, la convergencia es muy lenta, por lo que tendrá muy poca aplicación práctica si los valores de la excentricidad no son muy pequeños. Aunque hemos obtenido únicamente la expresión de E como desarrollo en serie de potencias de e, de manera similar podemos obtener desarrollos de sen E y cos E y a partir de éstos podemos expresar cualquier función de la forma ⇣ r ⌘n ⇣ r ⌘n ⇣ r ⌘n , cos mf, sen mf, a a a 138 Integración del problema kepleriano para n, m enteros cualesquiera, dando lugar a los desarrollos de Hansen que permiten expresar explı́citamente cualquier variable del movimiento orbital elı́ptico como función de `, y por tanto de t. 8.5.5 Caso hiperbólico En este caso h > 0 y la solución de (8.21) se expresará como p r = a + C1 cosh( 2h s + C2 ), donde C1 , C2 son las constantes de integración y a = µ/2h el semieje mayor de la hipérbola. Derivando tenemos: p p r0 = 2hC1 senh( 2h s + C2 ), p r00 = 2hC1 cosh( 2h s + C2 ), de donde, sustituyendo los valores iniciales y teniendo en cuenta que la distancia en el periastro es ahora rp = a(e 1), se tendrán las relaciones: C1 cosh(C2 ) = a e, C1 senh(C2 ) = 0, de las cuales deducimos que C1 = a e, C2 = 0, y por último p r = a(e cosh[ 2h s] 1). (8.35) De acuerdo con esta relación, la cuadratura (8.19) podrá ponerse como Z s p p p 1 1 (t T ) = (e cosh[ 2h s] 1)d s = p [e senh( 2h s) 2h s]. a 2h 0 p Si introducimos la nueva variable F = 2h s podremos poner p 2h (t T ) = e senh F F. a Por otro lado si introducimos, al igual que en el movimiento elı́ptico, una constante n tal que µ = n2 a3 , y teniendo en cuenta la relación µ = 2ha, podremos poner finalmente n(t T ) = ` = e senh F F. (8.36) La ecuación anterior será llamada, por extensión, ecuación de Kepler del movimiento hiperbólico. Nótese que aquı́ el movimiento medio n no tiene el mismo significado que en el caso elı́ptico por no ser la órbita periódica, sin embargo, la relación µ = n2 a3 extiende al movimiento hiperbólico la tercera ley de Kepler. La relación de r con F quedará establecida a partir de (8.35) como r = a(e cosh F 1). (8.37) Ley horaria del movimiento 139 Para establecer la relación con f bastará recordar que r= a(e2 1) = a(e cosh F 1 + e cos f 1), de donde, despejando cos f tendremos cos f = e cosh F . e cosh F 1 Por último, pasando al ángulo mitad como en el caso elı́ptico, se llega a r f e+1 F tan = tanh , 2 e 1 2 después de tomar la raı́z positiva al no existir ambigüedad si consideramos que cuando t > T , tanto f como F son positivas. Para invertir la ecuación de Kepler en el caso hiperbólico usaremos también el método de Newton con la iteración dada por (8.33). En este caso, tendremos (F ) = ` + F e senh F = 0, y por tanto, considerando solo el caso de F y ` positivo, pues el negativo es simétrico, la sucesión para invertir la ecuación será Fn = Fn 1 + ` + (Fn 1 e senh Fn e cosh Fn 1 1 1) . (8.38) Para encontrar el valor inicial de la sucesión F0 expresaremos la ecuación de Kepler del movimiento hiperbólico (8.36) en términos de la función exponencial en lugar del seno hiperbólico e e exp(F ) + exp( F ) 2 2 F ` = 0. (8.39) Si suponemos que F no es demasiado pequeño podemos admitir que el sumando e exp(F )/2 es mucho mayor que e exp( F )/2 F y que, por tanto, podremos e poner exp(F ) ` ⇡ 0, luego podemos tomar como valor inicial 2 ✓ ◆ 2` F0 = Log . e Se ha comprobado que el número de iteraciones se reduce si en lugar de este valor inicial se toma ✓ ◆ 2` F0 = Log + k , k > 0, e lo que proviene de no despreciar totalmente el término F de (8.39). Un valor óptimo de k es el valor k = 1.8. 140 Integración del problema kepleriano Capı́tulo 9 Órbitas keplerianas 9.1 Caracterización de las órbitas keplerianas Llamaremos órbita kepleriana, y la denotaremos con el sı́mbolo O, a la solución de las ecuaciones del problema kepleriano (8.1) para unas condiciones iniciales dadas. Entenderemos por órbita, no solo la trayectoria del orbitador, sino todos sus parámetros, tanto estáticos o constantes, como dinámicos o variables. Las ecuaciones del problema kepleriano (8.1) constituyen un sistema de seis ecuaciones diferenciales de orden uno. De acuerdo con la teorı́a de ecuaciones diferenciales ordinarias una solución de dicho sistema vendrá dada como x = x(t, C), donde C = (C1 , C2 , C3 , C4 , C5 , C6 ) representa un vector de seis constantes independientes que llamaremos variables de estado porque permiten determinar cualquier parámetro de la órbita en cualquier instante, es decir, caracterizan la órbita. Los seis elementos que componen las variables de estado son constantes de la órbita o variables dinámicas particularizadas para un instante dado. En este último caso hay que dar el valor de éstas ası́ como el instante t0 en que han sido calculadas. Una vez determinado el conjunto de variables de estado, la órbita quedará caracterizada por éste y pondremos O(C) si los elementos del vector de estado son constantes de la órbita y O(t0 , C) si son variables particularizadas en t0 . Las variables de estado pueden ser elegidas de diversas maneras. La más natural, desde el punto de vista de las ecuaciones diferenciales, es a través de los valores del vector de posición, x0 , y velocidad, X 0 , para un instante dado. Al 142 Órbitas keplerianas vector de dimensión seis, compuesto por las componentes de los vectores x0 y X 0 , se le llama vector de estado. De esta forma una órbita kepleriana podrá ser representada como O(t0 , x0 , X 0 ). Cada aspecto y propiedad de una órbita kepleriana O puede ser representado por un parámetro orbital o variable dinámica. Estos parámetros pueden ser constantes, como la excentricidad e o la norma del momento angular G, o variables, como el vector de posición x o la anomalı́a verdadera f . Una vez conocidos los seis o siete elementos que caracterizan la órbita, ésta queda completamente determinada junto con todos sus parámetros. En el caso de que un parámetro, que de forma genérica llamaremos , sea constante, utilizaremos la notación (O), pues este parámetro solo depende de la órbita, sin embargo, cuando el parámetro sea variable dependerá a su vez del instante o época orbital ⌧ en que sea calculado, por lo que pondremos (⌧, O). Ası́ como la órbita se podı́a caracterizar por distintos conjuntos de elementos, el instante en que calculamos un parámetro orbital variable también puede representarse en distintas formas: tiempo absoluto t, tiempo relativo al periastro t T, anomalı́a media `, anomalı́a excéntrica E, anomalı́a verdadera f , alguna posición particular: periastro, apoastro, nodo, etc. Conociendo uno cualquiera de los elementos anteriores y la propia órbita, los algoritmos vistos en el capı́tulo anterior permiten obtener los demás, por lo que cualquiera de ellos caracteriza el instante o época orbital ⌧ . Las variables de estado constituyen un conjunto de seis elementos independientes entre si, sin embargo, cuando comparamos dos conjuntos de variables de estado deberán existir relaciones de dependencia entre ambos, pudiéndose obtener los primeros en función de los segundos y viceversa. Hay que tener en cuenta que cualquiera de las variables de estado es un parámetro orbital y por lo tanto debe ser posible su obtención en función de cualquier otro conjunto de variables de estado. En lo que sigue veremos varios conjuntos distintos de variables de estado. Además del vector de estado estudiaremos también los elementos orbitales y varios conjuntos de variables derivados de ellos, ası́ como las variables de Delaunay y las variables polares-nodales. La demostración de que dichos conjuntos representan variables de estado de la órbita vendrá de obtener cada conjunto de elementos en función de otro que ya lo sea y viceversa. Elementos orbitales ordinarios 9.2 143 Elementos orbitales ordinarios La integración de este problema, vista en el capı́tulo anterior, conduce a la obtención de seis constantes, G, A, que caracterizan muchas de las propiedades del movimiento kepleriano. Ya hemos visto que entre estos vectores existe una relación funcional, luego no definen un conjunto de variables de estado sino que representan únicamente cinco de los seis elementos necesarios. Sin embargo, ninguno de estos cinco elementos representa directamente las propiedades de la órbita por lo que su uso no será de utilidad práctica. En su lugar usaremos algunos de los parámetros que definen la geometrı́a de la trayectoria. El sexto elemento deberá añadirse después de considerar algún parámetro relacionado con la dinámica del orbitador. En primer lugar tomaremos los dos elementos que caracterizan la forma de la cónica, esto es, el semieje mayor a (o el semilado recto1 p) y la excentricidad e. En el caso de órbitas de cometas suele sustituirse el semieje a por una cantidad, q, que representa la distancia del cometa al Sol en el perihelio. La distancia en el perihelio vale q = rp = a(1 e), por lo que conocido q puede hallarse a y por tanto a puede sustituirse por q. Para satélites artificiales se sustituye el par de elementos a, e, por la mı́nima y máxima altitud rm , rM , del satélite sobre la superficie terrestre. La relación de estas cantidades con la distancia en el perigeo y el apogeo viene dada por rp = rm + r , ra = rM + r , y a partir de ellos podemos obtener a = (ra + rp )/2, e = (ra rp )/(ra + rp ). Las variables a y e, o cualquiera de sus variantes, caracterizan la forma y dimensiones de la cónica. Para completar la información sobre la trayectoria necesitaremos situarla en el espacio, para lo cual basta observar la figura 9.1 y recordar que la órbita está contenida en un plano perpendicular al vector G o, lo que es igual, a su dirección n. Supondremos, por ahora, que la órbita no coincide con el plano Oxy del sistema espacial, esto es, que n ⇥ e3 6= 0. Puesto que el plano de la órbita y el plano fundamental del sistema espacial Oxy no son paralelos, necesariamente se cortarán en una recta que pasa por O y pertenece a ambos planos y que llamaremos lı́nea de los nodos. Tomaremos como dirección positiva de dicha recta la que contiene el nodo ascendente, o punto de la órbita en el que el orbitador pasa de coordenadas z negativas a positivas. El vector unitario l define la lı́nea de los nodos y forma un ángulo ⌦, ángulo del nodo, con e1 . El ángulo ⌦ puede tomar cualquier valor entre 0 y 2⇡. El ángulo que forman el vector n con e3 será llamado inclinación, y denotado por i, y representa también el ángulo entre el plano Oxy y el de la órbita. El ángulo i puede tomar un valor cualquiera entre 0 y ⇡. El vector n representa también el sentido de la rotación de la partı́cula alrededor del eje definido por n pues, debido a su definición, ésta tiene siempre lugar en sentido contrario a las agujas del reloj si se observa desde el extremo de n. Ası́ pues, el ángulo que forma n con e3 indica también el sentido de giro 1 Recordemos que el semieje mayor no está definido para la parábola. 144 Órbitas keplerianas e3 P x n u i A a f ! O e1 ⌦ e2 l i Figura 9.1: Órbita kepleriana en el espacio. observado desde un punto cualquiera de la parte positiva del eje Oz. Un ángulo i entre 0 y ⇡/2 indicará una órbita directa (sentido de giro contrario a las agujas del reloj), mientras que una inclinación entre ⇡/2 y ⇡ indicará una órbita retrógrada (sentido de giro igual al de las agujas del reloj). De esta forma, podemos separar el sentido de giro observado de la dinámica del sistema, en la que consideraremos siempre f˙ > 0, esto es, una anomalı́a verdadera estrictamente creciente. Los dos ángulos ⌦, i representan la posición del plano de la órbita en el espacio, pero para poder situar con exactitud la cónica en el espacio hay que situar la dirección del eje de la cónica dentro de su plano. El eje de la cónica lleva la dirección de la lı́nea de los ápsides, a, que forma un ángulo ! con la lı́nea de los nodos. Dicho ángulo será llamado argumento del periastro, representa la posición relativa de la cónica en su plano y es la tercera variable angular de la órbita. El argumento del periastro toma un valor cualquiera entre 0 y 2⇡. Cuando la inclinación de la órbita vale cero, la lı́nea de los nodos no está definida, por lo que tampoco lo estarán ⌦ ni !. En esta ocasión tiene sentido definir el ángulo entre la dirección de e1 y la de a, ángulo que llamaremos longitud del periastro ! ˜ . Nótese que dicho parámetro tiene también sentido para órbitas de inclinación no nula sin más que definirlo como ! ˜ = ⌦ + !. Por otro lado, cuando e = 0, queda indefinido a y por tanto quedan indefinidos !y! ˜ . Para eliminar esta indefinición se introduce la longitud media a través de la relación = ! ˜ + ` = ⌦ + ! + `, que contiene la anomalı́a media `, y que queda definida, tanto para órbitas circulares, como para cualquier otro tipo de órbita. Variables no singulares 145 Se han completado ası́ los cinco elementos que caracterizan la forma, dimensiones y situación en el espacio de la órbita. Para caracterizar su dinámica basta considerar la constante T que indica la época en la que el orbitador pasa por el periastro. Aunque el elemento T es constante hay que tener en cuenta que, para órbitas elı́pticas, éste varı́a de una vuelta a otra aumentando en una cantidad igual al periodo orbital P . Además, de la misma forma que se sustituyen a y e, puede sustituirse T por = nT . Otra alternativa, muy frecuentemente usada para definir la sexta constante, es el valor de la anomalı́a media, `0 , en un cierto instante t = t0 . Llamaremos elementos orbitales al conjunto de seis constantes (a, e, i, ⌦, !, T ), sin embargo, en ocasiones, atendiendo a las caracterı́sticas de la órbita pueden modificarse éstos y sustituirse por algunos de los valores alternativos anteriores. Por ejemplo, para el estudio de órbitas planetarias, que tienen inclinaciones y excentricidades muy pequeñas, suele utilizarse, en lugar de los elementos orbitales el conjunto de constantes (a, e, i, ⌦, ! ˜ , 0 ), donde 0 es la longitud media en un instante inicial t0 dado. La equivalencia entre los elementos orbitales y los elementos (t0 , x0 , X 0 ), quedará probada si demostramos que unos se pueden obtener a partir de los otros y viceversa, lo que comprobaremos posteriormente en este mismo capı́tulo. Por tanto, la órbita se puede caracterizar como O(a, e, i, ⌦, !, T ) o bien como O(t0 , x0 , X 0 ). A partir de esta equivalencia, para probar que cualquier otro conjunto de seis constantes o de seis constantes y variables, junto con el instante en que se han medido o calculado, caracterizan la órbita O basta comprobar su equivalencia con los elementos orbitales. 9.3 Variables no singulares El problema que aparece cuando la excentricidad, e, o la inclinación, i, toman valores muy pequeños o cero, no es tanto la indefinición de las variables, sino la aparición de singularidades debidas a la existencia de términos en e y sen i en los denominadores de las ecuaciones que expresan el movimiento orbital perturbado. Para evitar este tipo de singularidades se introduce un nuevo conjunto de variables que son llamadas variables equinocciales o variables no singulares y que se definen por medio de las expresiones: a, = ! ˜ + `0 , h = p = e sen ! ˜, i tan sen ⌦, 2 k = q = e cos ! ˜, i tan cos ⌦. 2 (9.1) Estas variables2 han sido definidas, en ocasiones, a través de términos en tan i o sen i en lugar de tan i/2, sin embargo, esto introduce otro tipo de singularidades para órbitas de inclinación i = 90 . Las variables, tal como las hemos definido 2 No confundir la h de las variables equinocciales con la energı́a de la órbita. 146 Órbitas keplerianas nosotros, son válidas para 0  i < 180 . Otro conjunto de variables similar, que se usa para órbitas retrógradas, son las llamadas variables equinocciales retrógradas, definidas por las relaciones a, = ! ˜ + `0 , hr = pr = e sen ! ˜, i cot sen ⌦, 2 kr = qr = e cos ! ˜, i cot cos ⌦, 2 (9.2) válidas para 0 < i  180 . 9.4 Sistemas de referencia orbitales Hemos dedicado la primera parte de este libro al estudio de los sistemas de referencia espaciales cuyo conocimiento es imprescindible para ubicar con precisión la posición de cualquier cuerpo en el espacio. Las caracterı́sticas del movimiento orbital hacen necesaria la introducción de nuevos sistemas de referencia, adaptados a este problema, donde se formulen, de manera sencilla, algunos de los parámetros del mismo. En las figuras (9.2), (9.3), (9.4), (9.5), (9.6), se representarán con lı́nea discontinuas tanto los vectores de la base del sistema de referencia como el octante que estos forman. Asimismo, en lugar de la órbita y el ecuador (o la eclı́ptica en su caso) se representará su proyección en una esfera unidad, por lo que todos los vectores mostrados serán unitarios, incluida la posición x que se sustituirá por su dirección u. 9.4.1 Sistema espacial Para la integración del problema de los dos cuerpos hemos supuesto que estamos refiriendo todos los vectores a un sistema de referencia inercial, con centro en el cuerpo central de la órbita, al que llamaremos sistema espacial 3 y que denotaremos S = {e1 , e2 , e3 }. En este sistema los vectores de posición y velocidad se expresarán como: x X = = x e1 + y e2 + z e3 , X e1 + Y e2 + Z e3 , (9.3) e3 n u ( ) e1 ↵( ) e2 Figura 9.2: Sistema espacial {e1 , e2 , e3 }. Coordenadas astronómicas del orbitador. o lo que es igual, con la notación introducida en el capı́tulo 2, pondremos: 0 1 0 1 x X xS = @ y A , X S = @ Y A . (9.4) z Z 3 En el caso de órbitas de satélites éste será el sistema SG (SP ) descrito en la página 59. Sistemas de referencia orbitales 147 Si la órbita representada es la de un satélite artificial, o un satélite natural (luna) en torno a un planeta, el sistema espacial adecuado será un sistema ecuatorial y por tanto podremos poner xS = cart(r, ↵, ), (9.5) donde ↵, representan la ascensión recta y declinación. El sistema espacial más adecuado, en el caso de órbitas en torno al Sol, será eclı́ptico y por tanto pondremos xS = cart(r, , ), (9.6) donde , representan la longitud y latitud eclı́ptica respectivamente. De aquı́ en adelante supondremos, salvo que se indique lo contrario, órbitas de satélites expresadas en un sistema ecuatorial en la forma (9.5). 9.4.2 Sistema nodal–espacial e3 n u e1 l ↵ e3 ⇥ l ⌦ Figura 9.3: Sistema nodal–espacial {l, e3 ⇥ l, e3 }. Sustituiremos la dirección de e1 como origen de coordenadas por la del vector l que representa la dirección de la lı́nea de los nodos. De esta forma, tendremos un nuevo sistema de referencia, P = {l, e3 ⇥ l, e3 }, que llamaremos sistema nodal–espacial. Es fácil observar que el paso del sistema espacial al sistema nodal–espacial se efectúa por medio de una matriz de giro que realiza una rotación elemental de eje Oz y ángulo ⌦. GSP = R3 (⌦). (9.7) Como puede observarse en la figura 9.3 las coordenadas polares del vector x, en el sistema espacial–nodal, son (r, ↵ ⌦, ), por lo que podremos escribir 0 1 r cos cos(↵ ⌦) xP = cart(r, ↵ ⌦, ) = @ r cos sen(↵ ⌦) A . (9.8) r sen 9.4.3 Sistema nodal A partir de la dirección n del momento angular G, esto es G = Gn, y de la lı́nea de los nodos l, que es perpendicular a n, podemos definir un sistema de referencia ortogonal directo N = {l, m, n}, que llamaremos sistema nodal, introduciendo el vector m = n ⇥ l. 148 Órbitas keplerianas Fácilmente se observa en la figura 9.4 que para pasar del sistema nodalespacial al nodal basta girar alrededor de l un ángulo igual a la inclinación i, por tanto tendremos GPN = R1 (i). n e3 m (9.9) Finalmente, para obtener la matriz de giro del sistema espacial al nodal basta combinar las dos anteriores, obteniéndose GSN = GSP GPN = R3 (⌦)R1 (i). (9.10) u !+f e2 e1 l Figura 9.4: Sistema nodal {l, m, n}. Las columnas de la matriz de rotación GSN representan las componentes de los vectores de la base final (nodal) en términos de la inicial (espacial), por ello, podremos poner: l m n = = = cos ⌦ cos i sen ⌦ sen i sen ⌦ e1 e1 e1 + + sen ⌦ e2 cos i cos ⌦ e2 sen i cos ⌦ e2 + + sen i cos i , e3 , e3 . (9.11) Usando este sistema de referencia puede encontrarse una expresión sencilla de las coordenadas ecuatoriales de un satélite artificial. En efecto, basta tener en cuenta que el ángulo entre l y x es igual a ! + f y por tanto podremos poner 0 1 r cos(! + f ) xN = cart(r, ! + f, 0) = @ r sen(! + f ) A . (9.12) 0 Si además tenemos en cuenta la relación xP = GPN xN = R1 (i)xN , ası́ como la expresión (9.8), obtendremos finalmente 0 1 0 1 cos cos(↵ ⌦) cos(! + f ) @ cos sen(↵ ⌦) A = @ cos i sen(! + f ) A , (9.13) sen sen i sen(! + f ) o bien, de forma más precisa: ↵ ⌦ = = polar (R1 (i)xN ), polar (R1 (i)xN ), (9.14) que nos da las coordenadas astronómicas del orbitador en términos de los elementos orbitales y las funciones polar , polar definidas en (1.32). Dividiendo entre si las dos primeras componentes de (9.13) llegamos a las relaciones: sen = sen i sen(! + f ), (9.15) tan(↵ ⌦) = cos i tan(! + f ). Sistemas de referencia orbitales 9.4.4 149 Sistema apsidal n e3 b u ! e1 e2 a l Figura 9.5: Sistema apsidal {a, b, n}. Si usamos la lı́nea de los ápsides como eje Ox, en lugar de la lı́nea de los nodos, definiremos un nuevo sistema de referencia que llamaremos sistema apsidal. Para ello, tendremos en cuenta que los vectores a y n son ortogonales y, por tanto, podemos definir el vector b = n ⇥ a y con él el sistema de referencia ortogonal directo A = {a, b, n} que será llamado sistema apsidal. El sistema apsidal tiene el mismo eje Oz que el nodal y los vectores a, b están girados un ángulo ! respecto de l, m. Por ello, la matriz de giro del sistema nodal al apsidal vendrá dada por GN A = R3 (!), por lo que la relación entre los vectores de ambas bases vendrá dada por las expresiones: a = cos ! l + sen ! m, (9.16) b = sen ! l + cos ! m. Finalmente la matriz de giro del sistema espacial al apsidal vendrá dada por GSA = R3 (⌦)R1 (i)R3 (!). Si tenemos en cuenta las propiedades de las cónicas y que la lı́nea de los ápsides representa el eje de coordenadas polares podremos poner 0 1 r cos f xA = cart(r, f, 0) = @ r sen f A . (9.17) 0 9.4.5 Sistema orbital Tanto el sistema nodal como el apsidal representan sistemas fijos y, por tanto, inerciales. Sin embargo, en ocasiones es conveniente usar otro, que será móvil, pero cuyo eje Ox coincida con la dirección radial. Para ello, llamaremos u al vector unitario en la dirección radial, de forma que x = ru, y v al definido por v = n ⇥ u. Al sistema U = {u, v, n} le llamaremos sistema orbital. 150 Órbitas keplerianas Los vectores (u, v) se obtienen a partir de (a, b) por medio de un giro alrededor de n y ángulo f , y a partir de (l, m) por medio de un giro alrededor de n y ángulo ! + f . Por esto podemos definir las siguientes matrices de giro: GAU = R3 (f ), GN U = R3 (! + f ), GSU = R3 (⌦)R1 (i)R3 (! + f ). e3 n v u e1 l Figura 9.6: Sistema orbital {u, v, n}. La expresión de los vectores del sistema orbital en función de los del sistema espacial vendrá dada por: u = v = (cos ⌦ cos(f + !) cos i sen ⌦ sen(f + !)) +(sen ⌦ cos(f + !) + cos i cos ⌦ sen(f + !)) + sen i sen(f + !) e1 e2 e3 , (cos ⌦ sen(f + !) + cos i sen ⌦ cos(f + !)) (sen ⌦ sen(f + !) cos i cos ⌦ cos(f + !)) + sen i cos(f + !) e1 e2 e3 . (9.18) Teniendo en cuenta la definición de u y la expresión del vector velocidad en el sistema orbital dada en (6.10) podremos poner: x X o lo que es igual 9.4.6 = = 0 ru ṙu 1 r xU = @ 0 A , 0 + rf˙v 0 , , 1 ṙ X U = @ rf˙ A . 0 (9.19) (9.20) Sistema de Frenet En Astrodinámica es muy usado otro sistema de referencia en el que el plano Oxy también coincide con el plano del movimiento, pero en el que la dirección principal coincide con la del vector velocidad, también llamada dirección tangente. En efecto, el vector velocidad podrá ponerse como X = v t, donde v es la norma y t la dirección del vector velocidad o tangente a la trayectoria. Tomando la dirección t como eje Ox y n como eje Oz, definiremos el sistema de referencia ortonormal directo F = {t, w, n} que será llamado, de aquı́ en adelante, sistema de Frenet. Este sistema es también llamado triedro de Frenet. Relaciones entre el vector de estado y los elementos orbitales b t u t a Figura 9.7: Ángulo entre la dirección radial y tangente o ángulo de trayectoria de vuelo. 151 La notación empleada aquı́ no coincide con la usada habitualmente en Matemáticas, pues la dirección definida por w, que nosotros llamaremos dirección normal a la tangente suele llamarse normal y por ello se emplea la notación, n, mientras que la definida por n, suele llamarse binormal y se denota b. Si llamamos (figura 9.7) al ángulo entre u y t, medido en sentido directo, con la orientación definida por n, y tenemos en cuenta la expresión (1.25) tendremos = atan(t · u, t · v), (9.21) que de acuerdo con la segunda de las expresiones (9.19) podrá ponerse como ṙ rf˙ = atan( , ). v v Al ángulo 9.5 (9.22) se le denomina ángulo de trayectoria de vuelo. Relaciones entre el vector de estado y los elementos orbitales Hasta aquı́ hemos visto la definición de dos tipos de variables de estado: el vector de estado, formado por la posición x0 y la velocidad X 0 en un instante t0 y los elementos orbitales. En este apartado veremos las relaciones entre estos dos conjuntos de variables de estado que permitirán obtener cada uno de ellos en función del otro. La obtención de los elementos orbitales a partir de una posición y velocidad forma parte de un problema más general llamado determinación de órbitas que intenta obtener los elementos de una órbita kepleriana a partir de datos de observación de la misma. Al problema inverso que nos da la posición y velocidad en un instante a partir de los elementos orbitales le llamaremos cálculo de efemérides. 152 9.5.1 Órbitas keplerianas Determinación de la órbita a partir de las condiciones iniciales Supongamos conocidas la posición y la velocidad x0 , X 0 en un instante dado t0 , ası́ como la constante µ. Fácilmente podemos obtener: r0 = k x0 k, G = x0 ⇥ X 0 , A = X0 ⇥ G h = 1 X0 · X0 2 G = k G k, µ x0 , r0 µ . r0 A = k A k, Por tanto, aparte de las constantes de integración G, A, h, hemos obtenido también los elementos: A G2 e= , p= , µ µ y según que el valor de e sea menor o mayor que uno tendremos 8 p > , si e < 1, < 1 e2 a= p > : , si e > 1. 2 e 1 Una vez obtenida la forma de la órbita, buscaremos su posición relativa en el espacio para lo cual encontraremos, en primer lugar, el valor de los vectores del sistema orbital (u0 , v 0 , n) para t = t0 , expresados en el sistema espacial, a partir de la expresiones: x0 G u0 = , n = , v 0 = n ⇥ u0 . r0 G Si tenemos en cuenta la expresión del vector n dada en (9.11), podremos poner sen ⌦ sen i cos ⌦ sen i cos i de donde: i ⌦ = = = = = n · e1 , n · e2 , n · e3 , acos(n · e3 ), atan( n · e2 , n · e1 ), (9.23) (9.24) lo que nos da la inclinación y el ángulo del nodo de la órbita sin ningún tipo de ambigüedad excepto en el caso en que la inclinación es cero (o 180 ), pues entonces la definición de ⌦ = atan(0, 0) no tiene sentido. En este caso adoptaremos, por convenio, un valor ⌦ = 0. Además, puesto que conocemos A y A podemos obtener a = A/A y tener en cuenta la expresión de a en el sistema espacial que, Relaciones entre el vector de estado y los elementos orbitales 153 particularizada para i = 0, nos da a = cos(! + ⌦) e1 + sen(! + ⌦) e2 , por lo que en este caso tendremos ! ˜ = atan(a · e1 , a · e2 ), (9.25) que sustituirá al argumento del periastro. Nótese que esta expresión no es válida para inclinaciones distintas de 0 o 180 . El cálculo de ! para inclinaciones distintas de 0 o 180 se realizará a partir de las expresiones obtenidas de multiplicar por e3 las expresiones de la base del sistema orbital en función de las del sistema espacial, esto es: u0 · e 3 v 0 · e3 = = sen i sen(! + f0 ), sen i cos(! + f0 ), (9.26) de donde obtenemos (! + f0 ) = atan (v 0 · e3 , u0 · e3 ) . (9.27) Basta recordar que, de acuerdo con la definición de la anomalı́a verdadera, se tiene: a · u0 = cos f0 , (9.28) a · v0 = sen f0 , luego lo que permite obtener !. f0 = atan(a · u0 , a · v 0 ), (9.29) Una vez calculado f0 y conocido el tipo de órbita, las relaciones entre t y f , obtenidas en el capı́tulo 8, permiten obtener T sin más que hacer t = t0 . Si la excentricidad es igual a cero , esto es A = a = 0, no pueden aplicarse las relaciones (9.25) ni (9.29). En este caso adoptaremos, por convenio, el valor a = l si i 6= 0 o i 6= 180 y el valor a = e1 = l si i = 0 o i = 180 . 9.5.2 Cálculo de efemérides El cálculo de la posición x y la velocidad X en un instante t a partir de los elementos orbitales puede obtenerse de manera inmediata formulando la rotación que pasa del sistema espacial al orbital, esto es: xS = GSU xU , X S = GSU X U , que, teniendo en cuenta las expresiones (9.20) y la expresión de la matriz de giro GSU , permiten escribir: 0 1 0 1 x r @ y A = R3 (⌦)R1 (i)R3 (! + f ) @ 0 A , z 0 (9.30) 0 1 0 1 ṙ X @ Y A = R3 (⌦)R1 (i)R3 (! + f ) @ rf˙ A . Z 0 154 Órbitas keplerianas Finalmente basta recordar las expresiones de r, ṙ y f˙ en función de f , dadas en (8.8), (8.13), (8.14), y la relación de f con t, dada en el capı́tulo 8 para cada tipo de movimiento. 9.6 Intersección de dos órbitas keplerianas La búsqueda de los posibles puntos de intersección de dos órbitas keplerianas resulta de gran utilidad, tanto para detectar posibles colisiones (cometas o asteroides con la Tierra, satélites artificiales entre si, etc.), como para conocer el punto donde encender los motores de una nave y modificar ası́ su órbita. 9.6.1 Pertenencia de un punto a una órbita Antes de abordar este problema más general resolveremos un pequeño problema consistente en averiguar si una órbita kepleriana dada, O, pasa por un punto P y si esto es ası́, determinar el instante de paso. Supongamos conocido el vector de posición de P , xS , en el sistema espacial S y llamemos xA al mismo vector en el sistema apsidal. Las relaciones entre los distintos sistemas orbitales vistas anteriormente permiten poner xA = GAS xS , donde GAS es la matriz de paso del sistema apsidal al espacial para dicha órbita. Las coordenadas polares esféricas de P en este sistema apsidal vendrán dadas por: rA = polarr (GAS xS ), A = polar (GAS xS ), A = polar (GAS xS ). Si el punto P pertenece a la órbita O sus coordenadas polares esféricas en el sistema apsidal serán (r, f, 0), por lo que finalmente podremos establecer las condiciones de pertenencia y el instante de paso con las siguientes condiciones: Un punto P , de vector de posición xS , pertenece a la órbita O si se cumplen, simultáneamente, las condiciones: rA = p 1 + e cos( A) , A = 0, (9.31) siendo p y e el semilado recto y la excentricidad de la órbita O. Si xS representa una dirección y no la posición exacta de un punto, basta la segunda de las condiciones anteriores para asegurar que la órbita pasa por algún punto que tiene la dirección xS . Intersección de dos órbitas keplerianas 155 Si el punto P , de vector de posición xS , pertenece a la órbita O el instante de paso del orbitador por ese punto puede calcularse a partir de su anomalı́a verdadera f dada por la relación f= A. (9.32) Una vez establecidas las anteriores relaciones podemos abordar el cálculo del punto o puntos, si los hay, que pertenecen simultáneamente a dos órbitas O1 , O2 . Distinguiremos dos casos según que las órbitas sean coplanarias (mismo valor de i, ⌦ y n, o no lo sean. 9.6.2 Intersección de órbitas no coplanarias En el caso de que las órbitas no sean coplanarias los vectores n1 , n2 , que definen el plano de la órbita, no serán colineales, por lo que podremos definir las direcciones: n1 ⇥ n2 n2 ⇥ n1 ua = , ub = , k n1 ⇥ n2 k k n2 ⇥ n1 k que representan las dos únicas direcciones en las que las órbitas pueden tener un punto común. Llamaremos u a cada una de las dos direcciones anteriores y realizaremos el proceso siguiente para cada una de las dos. En primer lugar calcularemos los valores: f1 = polar (GA1 S u), f2 = polar (GA2 S u), (9.33) que representan los valores de la anomalı́a media de el posible punto de intersección en cada una de las órbitas. De esta forma pueden calcularse los vectores xi = x(fi , Oi ), i = 1, 2, (9.34) que representan el vector de posición del posible punto de intersección en las dos órbitas. Para comprobar que hay punto de intersección basta comprobar que x1 = x2 . 9.6.3 Intersección de órbitas coplanarias Excluiremos el caso en que a1 = a2 , e1 = e2 , i1 = i2 , ⌦1 = ⌦2 , !1 = !2 para el que existen infinitos puntos comunes por ser órbitas coincidentes. Supondremos por tanto que i1 , = i2 , ⌦1 = ⌦2 y que alguno o los tres elementos a, e, i son distintos en las dos órbitas. En este caso n1 y n2 son colineales por lo que no podemos determinar la dirección de la intersección por medio de el producto vectorial de éstos. 156 Órbitas keplerianas De acuerdo con la figura 9.8 impondremos que en el punto de intersección la distancia r en ambas órbitas debe ser la misma, por lo que podremos poner r= 1 p1 = e1 cos f1 1 p2 , e2 cos f2 r = r1 = r2 O f1 donde f1 y f2 corresponden a las anomalı́as verdaderas del punto o los puntos de intersección en cada una de las órbitas. Puesto que el plano de ambas órbitas es el mismo, también coincidirá la dirección del nodo, por lo que se tendrá la relación f1 + !1 = f 2 + !2 , f2 O1 O2 !2 !1 a2 Nodo a1 Figura 9.8: Punto de intersección de dos órbitas coplanarias. lo que permite escribir p1 p2 = 1 + e1 cos f1 1 + e2 cos(f1 + !1 !2 ) , expresión que, desarrollada, puede ponerse como C cos f1 + S sen f1 = P, (9.35) siendo: C = p2 e 1 p1 e2 cos(!1 S = p1 e2 sen(!1 P = p1 !2 ), !2 ), p2 . La ecuación (9.35) coincide con la expresión (1.10) por lo que usando su solución (1.11), que puede ser doble, única o incompatible, podremos poner f1 = atan(C, S) + sen p P , C2 + S2 f2 = f 1 + ! 1 !2 . (9.36) que representan los valores de la anomalı́a media de el posible punto de intersección en cada una de las órbitas. Al igual que en caso no coplanario, los vectores xi = x(fi , Oi ), i = 1, 2, representan el vector de posición del posible punto de intersección en las dos órbitas. Para comprobar que hay punto de intersección basta comprobar que x1 = x2 . Variaciones de los sistemas de referencia 9.6.4 157 Colisiones Una vez comprobada la existencia de uno o varios puntos de intersección de las dos órbitas la comprobación de la colisión exige que los dos orbitadores pasen simultáneamente por el punto intersección. Para comprobar esta condición deberemos calcular en cada punto de intersección el valor del tiempo absoluto ti = t(fi , Oi ) y comprobar que t1 = t2 . 9.7 Variaciones de los sistemas de referencia La importancia del sistema S = {e1 , e2 , e3 } radica en que, salvo el movimiento del origen, es un sistema inercial, esto es, se verifica que dei = 0. En el problema keperiano los sistemas nodal y apsidal son también inerciales, sin embargo, el sistema orbital y el sistema de Frenet no lo son. Cuando se consideran las perturbaciones orbitales únicamente el sistema espacial sigue siendo inercial. En este apartado obtendremos la variación de dichos sisz temas lo que además nos permitirá definir, posteriormente, otros dos conjuntos de variables de ese3 tado: las variables de Delaunay r y las polares-nodales. Para ello x introduciremos un nuevo sistema de referencia auxiliar, no dee2 finido antes, y que está asocia⇢ do a las coordenadas cilı́ndricas u⇢ e1 y a las esféricas. A dicho sistema le llamaremos sistema cilı́ndrico, y está formado por los vectores Figura 9.9: Coordenadas cilı́ndricas y esféricas. (u , e ⇥ u , e ), donde u defi⇢ 3 ⇢ 3 ⇢ ne la dirección de la proyección del orbitador en el plano fundamental definido por e1 y e2 (figura 9.9). Si llamamos ( , ) a la longitud y latitud de P , tendremos que: u⇢ = cos e1 + sen e2 , (9.37) e 3 ⇥ u⇢ = sen e1 + cos e2 . La variación de este sistema de referencia puede obtenerse diferenciando (9.37), de forma que: du⇢ d(e3 ⇥ u⇢ ) = = sen d e1 + cos d e2 cos d e1 sen d e2 = = (e3 ⇥ u⇢ ) d , u⇢ d . (9.38) Si en lugar de u⇢ tomamos como eje Ox la dirección l de la intersección del plano orbital con el plano fundamental podemos definir, por un lado, el sistema nodal-espacial (l, e3 ⇥l, e3 ) (figura 9.3) y, por otro lado, el sistema nodal (l, m, n). 158 Órbitas keplerianas En el primer caso tendremos: l e3 ⇥ l = = cos ⌦ e1 + sen ⌦ e2 , sen ⌦ e1 + cos ⌦ e2 , (9.39) (e3 ⇥ l) d⌦, l d⌦. (9.40) de donde diferenciando obtenemos: dl d(e3 ⇥ l) = = En el segundo: m n = = que diferenciadas dan: dm dn = = cos i (e3 ⇥ l) + sen i e3 , sen i (e3 ⇥ l) + cos i e3 , (9.41) n di + cos i d(e3 ⇥ l), m di sen i d(e3 ⇥ l). (9.42) Finalmente, reuniendo (9.40) y (9.42) se llega a dl dm dn = = = (e3 ⇥ l) d⌦, n di cos i l d⌦, m di + sen i l d⌦. (9.43) En este estudio prescindiremos del sistema apsidal, cuyas variaciones son idénticas a las del orbital cambiando ✓ por !. Para estudiar las variaciones del sistema orbital (u, v, n) recordemos que se verifica: u v = = cos ✓ l + sen ✓ m, sen ✓ l + cos ✓ m, (9.44) y por tanto du = v d✓ + cos ⌦ dl + sen ✓ dm = v d✓ + cos ✓ (e3 ⇥ l) d⌦ + sen ✓ n di sen ✓ cos i l d⌦. Si tenemos en cuenta que, de acuerdo con (9.41), se tiene e3 ⇥ m = cos i (e3 ⇥ (e3 ⇥ l)) = cos i l, podremos poner finalmente: du = dv = 9.8 v d✓ + sen ✓ n di + (e3 ⇥ u) d⌦, u d✓ + cos ✓ n di + (e3 ⇥ v) d⌦. Variables polares–nodales Teniendo en cuenta las expresiones dadas en (9.19) podremos poner X · dx = (ṙ u + G v)(u dr + r du). r (9.45) Variables polares–nodales 159 Después de sustituir du por su valor (9.45), poniendo (! + f ) en lugar de ✓, y tras aplicar las propiedades de ortogonalidad entre u, v y n, ası́ como su relación con e3 , y desarrollar, se obtendrá finalmente X · dx = ṙdr + Gd(! + f ) + G(e3 · n)d⌦. (9.46) Si definimos ahora un conjunto de seis variables por medio de las siguientes igualdades: r R = ṙ , ✓ = !+f , ⌫ = ⌦, , ⇥ = G , N = G (e3 · n) = G cos i, (9.47) la igualdad (9.46), expresada en estas variables, podrá ponerse como X · dx = Rdr + Gd✓ + N d⌫, (9.48) lo que demuestra que la transformación de (x, X) a (r, ✓, ⌫, R, ⇥, N ) es completamente canónica. N = G cos i = H ⇥=G e3 G r n x i e2 e1 ✓ ⌫=⌦=h l Figura 9.10: Coordenadas polares-nodales. Al conjunto de variables canónicas (r, ✓, ⌫, R, ⇥, N ) se le llama variables polares–nodales y también variables de Hill o variables de Whittaker. Nótese que N representa la proyección del momento angular sobre el eje Oz. El significado del resto de las variables es evidente de acuerdo con la definición. Al ser las variables polares– nodales un conjunto de variables canónicas, el hamiltoniano del problema kepleriano se obtendrá aplicando directamente la transformación. Para ello recordemos que la velocidad puede expresarse como v 2 = ṙ2 + r2 f˙2 = R2 + ⇥2 , r2 por lo que la función de Hamilton del problema kepleriano se expresará en la forma 1 ⇥2 µ Hk = (R2 + 2 ) . (9.49) 2 r r 160 9.9 Órbitas keplerianas Variables de Delaunay en el movimiento elı́ptico A partir de las variables polares–nodales obtendremos otro conjunto de variables muy útiles en el estudio de las perturbaciones orbitales: las variables de Delaunay. En esta sección introduciremos estas variables en su forma clásica, esto es, definidas únicamente para el movimiento elı́ptico, sin embargo, su extensión a los otros tipos de movimientos puede ser efectuada sin grandes dificultades. Denotaremos las nuevas variables como (`, g, h, L, G, H), siendo H = N, h = ⌫, es decir, con el último momento y variable iguales a los de las variables polares–nodales. Para obtener la transformación haremos uso de la ecuación de Hamilton– Jacobi que nos permite obtener una transformación canónica a partir de la ecuación en derivadas parciales obtenida de sustituir, en el hamiltoniano, los momentos por las derivadas de la función generatriz respecto de las variables. Teniendo en cuenta la expresión (9.49), igualando ésta a la energı́a, que en el caso elı́ptico4 se puede poner como µ/2a, y después de sustituir los momentos por las derivadas de la función generatriz S respecto de las variables, llegaremos a la ecuación de Hamilton–Jacobi "✓ ◆ ✓ ◆2 # 2 @S @S 1 µ µ 1 + = . (9.50) 2 @r @✓ r2 r 2a La solución de esta ecuación podrá ser obtenida ensayando una expresión de S separada en las variables r y ✓, esto es con S = S1 (r) + S2 (✓), en cuyo caso tendremos  ◆2 ✓ ◆2 # 1 @S1 @S2 1 µ µ + = , 2 2 @r @✓ r r 2a que puede también ponerse como ✓ @S2 @✓ ◆2 = 2µr µr2 a r2 ✓ @S1 @r ◆2 = P22 , donde P2 debe ser constante pues iguala una función que depende exclusivamente de ✓ con otra que solo depende de r. Ası́ pues, podremos poner por un lado S2 (✓) = P2 ✓, y por otro @S1 1 = @r r r 2µr µr2 a P22 , 4 Esta restricción hace que las variables que se definen aquı́ sean válidas únicamente para el caso elı́ptico. Variables de Delaunay en el movimiento elı́ptico 161 lo que permite expresar S como Z S = P2 ✓ r r0 r 2µ r P22 , r2 µ a (9.51) donde el lı́mite inferior de integración r0 será elegido posteriormente. De acuerdo con la teorı́a de Hamilton–Jacobi una función generatriz S(q, P ) define una transformación canónica (q, p) ! (Q, P ) a través de las ecuaciones: p= @S , @q Q= @S . @P En nuestro caso tomaremos como variables y momentos viejos las variables polares– nodales, q1 = r, q2 = ✓, p1 = R, p2 = ⇥, de donde llegaremos a las relaciones: r @S @S 2µ µ P22 ṙ = R = p1 = = = , @q1 @r r a r2 (9.52) @S @S ⇥ = G = p2 == = = P2 . @q1 @✓ p Elegiremos como nuevos momentos (P1 = µ a, P2 ). El segundo coincide con ⇥ o, lo que es igual, con la norma del momento angular G, por ello se utiliza esta última notación en el contexto de las variables de Delaunay, P2 = G. Respecto a P1 , suele usarse la letra L, esto es P1 = L. De esta forma, las nuevas coordenadas serán: Z r @S 2µ2 P1 3 s Q1 = = dr, @P1 r0 2µ µ2 P22 2 r P12 r2 Z r @S 2P2 s Q2 = = ✓ + dr, @P2 r0 2µ µ2 P22 2 2r r P12 r2 donde, teniendo en cuenta las relaciones (9.52) además de los valores de P1 , P2 , y por otro lado las relaciones drp = ṙdt, df = Gdt/r2 y la definición del movimiento medio en el caso elı́ptico n = µ/a3 , se llega a: Q1 = Z r r0 Q2 = ✓ + r Z µ 1 dr = a3 ṙ r r0 Z t ndt, t0 G dr = ✓ + r2 ṙ Z f df. f0 Estas expresiones nos permiten elegir el lı́mite inferior de integración como el periastro de la órbita, por lo que r0 = rp , t0 = T, f0 = 0, lo que, junto con la 162 Órbitas keplerianas relación ✓ = ! + f , nos lleva a las expresiones Q1 = n(t T ) = `, (9.53) Q2 = ! = g, donde hemos sustituido la notación de ! por g para emplear la notación clásica de las variables de Delaunay. Todo lo anterior nos permite definir el conjunto de variables de Delaunay (`, g, h, L, G, H) como el conjunto de variables obtenidas a partir de las relaciones: ` = L = n(t T ) p µa , g , G = ! , h = ⌦, , H = G cos i. (9.54) Finalmente, puesto que el hamiltoniano del movimiento kepleriano coincide con la energı́a, y ésta en el caso elı́ptico vale µ/2a, podremos expresar la función de Hamilton en variables de Delaunay como Hk = µ2 . 2L2 (9.55) Capı́tulo 10 Formulación universal del problema kepleriano 10.1 Introducción La distinta formulación de los tres tipos de movimiento resulta poco práctica para el estudio de movimientos orbitales perturbados en las proximidades de un movimiento parabólico, donde cualquier perturbación puede producir una transición entre movimientos periódicos y no periódicos o viceversa. En este apartado describiremos una nueva formulación universal, esto es, válida para los tres tipos de movimientos simultáneamente, que está basada en el uso de la variable s, definida en (8.15), como variable independiente y de las funciones de Stump↵. 10.2 Funciones V de Stump↵ Llamaremos funciones de Stump↵ al conjunto de funciones de variable compleja definidas como cn (z) = X k 0 ( 1)k zk , (2k + n)! n = 0, 1, 2, . . . (10.1) Dado que estas series de potencias son absolutamente convergentes en todo el plano complejo, las funciones cn (z) están definidas para cada valor de z. Cuando z toma valores reales, las funciones cn (z) serán reales. 164 Formulación universal del problema kepleriano Llamaremos funciones V de Stump↵ al conjunto de funciones definidas a partir de las de Stump↵ como n 2 Vn (x; ↵) = x cn (↵x ) = X ( 1)k ↵k x2k+n , (2k + n)! n = 0, 1, 2, . . . , (10.2) k 0 donde x 2 IR es la variable y ↵ 2 IR un parámetro. De acuerdo con la definición (10.1) las funciones c0 , c1 pueden identificarse con las funciones elementales siguientes: 8 p si x > 0, < cos x 1 si x = 0, c0 (x) = p : cosh x si x < 0, p 8 sen x > > (10.3) p si x > 0, > > x > < 1 si x = 0, c1 (x) = > p > > senh x > > : p si x < 0. x De aquı́ pueden deducirse fácilmente las relaciones: 8 p si ↵ > 0, < cos( ↵ x) 1 si ↵ = 0, V0 (x; ↵) = p : cosh( ↵ x) si ↵ < 0, p 8 sen( ↵ x) > > p si ↵ > 0, > > ↵ > < x si ↵ = 0, V1 (x; ↵) = > p > > senh( ↵ x) > > : p si ↵ < 0. ↵ (10.4) Asimismo puede verse, a partir de la definición, que se verifican las siguientes igualdades: Vn ( x; ↵) = Vn (x; ↵), V0 (0, ↵) Vn (0, ↵) = 1, = 0, (10.5) n 1. Propiedad.- La relación entre dos funciones Vn y Vn+2p viene dada por la fórmula Vn (x; ↵) p 1 X ( ↵)k x2k x = ( ↵)p Vn+2p (x; ↵). (2k + n)! n k=0 (10.6) Funciones V de Stump↵ 165 La propiedad puede demostrarse sin más que tener en cuenta que Vn puede ponerse también como Vn (x; ↵) = x n X ( ↵)k x2k , (2k + n)! k 0 de donde el término de la izquierda de (10.6) se obtiene restando los p primeros términos de Vn , con lo que llegamos a xn X ( ↵)k x2k . (2k + n)! k p Una simple reestructuración de ı́ndices, definiendo m = k p, permite expresar dicho término como X ( ↵)m+p x2m+2p X ( ↵)m x2m xn = ( ↵)p xn+2p = ( ↵)p Vn+2p (x; ↵), (2m + 2p + n)! (2m + n)! m 0 m 0 con lo que queda demostrada la propiedad. Particularizando (10.6) para p = 1 se obtiene una relación que será muy usada Vn (x; ↵) + ↵ Vn+2 (x; ↵) = xn . n! (10.7) Esta expresión nos da un procedimiento recursivo que permite evaluar Vn para cualquier valor de x y ↵ 6= 0, siempre que podamos evaluar V0 y V1 , lo que resulta sencillo a partir de las expresiones (10.4). Cuando ↵ = 0, basta particularizar la definición (10.2) con lo que se obtiene Vn (x; 0) = xn . n! (10.8) Este no será el mejor método de evaluación de las funciones V de Stump↵, sin embargo, es un procedimiento sencillo que puede implementarse fácilmente en un ordenador y que puede hacer manejables y prácticas estas funciones. Propiedad.- La familia de funciones V de Stump↵ es cerrada respecto a la diferenciación e integración, es decir: @ Vn (x; ↵) @x @ V0 (x; ↵) @x Z x Vn (s; ↵)d s 0 = = = Vn 1 (x; ↵), ↵ V1 (x; ↵), n 1, (10.9) Vn+1 (x; ↵). Para demostrar esta propiedad basta aplicar la derivación e integración, término a término, en la serie que define estas funciones. 166 Formulación universal del problema kepleriano Propiedad.- La familia de funciones V de Stump↵ verifica las relaciones: 8 > Vn m si n m, m @ Vn (x; ↵) < = m n @ V0 (x; ↵) > @xm : si n < m. @xm n (10.10) ( m ( ↵) 2 V0 (x; ↵) si m es par, @ m V0 (x; ↵) = m+1 @xm ( ↵) 2 V1 (x; ↵) si m es impar. La relación anterior se demuestra, por simple comprobación, a partir de la proposición anterior. Propiedad.- Las derivadas de las funciones V respecto al parámetro vienen dadas por las expresiones @ Vn (x; ↵) 1 = [n Vn+2 (x; ↵) @↵ 2 x Vn+1 (x; ↵)] . (10.11) En efecto, derivando en la definición (10.2) se tiene @ Vn (x; ↵) X ( 1)p p↵p 1 x2p+n 1 X ( 1)m 2(m + 1)↵m x2m+2+n = = . @↵ (2p + n)! 2 (2m + 2 + n)! m 0 k 1 Por último basta tener en cuenta que 2m + 2 2m + 2 + n n 1 = = (2m + 2 + n)! (2m + 2 + n)! (2m + 1 + n)! n , (2m + 2 + n)! para demostrar la proposición enunciada. Propiedad.- Las n + 1 primeras funciones Vn (x; ↵) constituyen un sistema de funciones linealmente independientes para cualquier valor de n. Para comprobar que n + 1 funciones x0 , x1 , . . . , xn son linealmente independientes, es preciso comprobar que el wronskiano es distinto de cero, esto es w(x0 , x1 , . . . , xn ) = x0 x00 ... (n) x0 x1 x01 x2 x02 (n) x1 (n) x2 ... ... xn x0n ... (n) xn 6= 0. En nuestro caso, el wronskiano se obtiene a partir de la expresión de las derivadas n-simas de las funciones. Comprobaremos únicamente el caso n = 3, para cualquier otro n el procedimiento será idéntico. w(V0 , V1 , V2 , V3 , ) = V0 ↵ V1 ↵ V0 ↵ 2 V1 V1 V0 ↵ V1 ↵ V0 V2 V1 V0 ↵ V1 V3 V2 V1 V0 . Funciones V de Stump↵ 167 Multiplicando la primera y segunda filas por ↵ y sumándosela a la tercera y cuarta respectivamente se obtiene, después de aplicar la relación (10.7), w(V0 , V1 , V2 , V3 ) = V0 ↵ V1 0 0 V1 V0 0 0 V2 V3 V1 V2 1 x 0 1 = V02 +↵ V 2 . Observando las derivadas de V0 y V1 respecto a x obtenemos que 0 0 V0 V0 +↵ V1 V1 = 0, por lo que podemos poner 2 2 V0 +↵ V1 = constante, basta tener en cuenta los valores de V0 y V1 en x = 0 para deducir que 2 2 V0 (x; ↵) + ↵ V1 (x; ↵) = 1, y por tanto w(V0 , V1 , V2 , V3 ) = 1, con lo que queda demostrada la proposición. Propiedad.- Vn (x; ↵) es solución de la ecuación diferencial lineal homogénea dm+2 y dm y + ↵ = 0, dxm+2 dxm para todo n  m + 1. Para demostrar esto basta tener en cuenta la expresión de las derivadas nsimas y (10.7). Propiedad.- Dado un número real arbitrario ↵, la función y(x; ↵) = m+1 X k=0 k Vk (x; ↵), (10.12) es la solución general de la ecuación diferencial dm+2 y dm y + ↵ = 0, dxm+2 dxm m 0. (10.13) La demostración es trivial pues cada una de las las m + 2 funciones Vk es, según la proposición anterior, solución de la ecuación y éstas son linealmente independientes. 168 10.3 Formulación universal del problema kepleriano Funciones V0 , V1 Las funciones V0 , V1 constituyen la extensión natural de las funciones cos, cosh por un lado y sen, senh por otro. Además, cualquier otra función Vn puede expresarse en términos de las dos primeras, por lo que éstas juegan un importante papel en Astrodinámica. Ya hemos visto como la propiedad fundamental de las funciones circulares puede extenderse a las de Stump↵ por medio de la igualdad (10.7), particularizada para n = 0 en la forma: 2 2 V0 (x; ↵) + ↵ V1 (x; ↵) = 1. (10.14) Por otro lado, puede demostrarse fácilmente la extensión de las propiedades de adición y ángulo doble de las funciones circulares, obteniendose: V0 (x ± y; ↵) = V0 (x; ↵) V0 (y; ↵) ⌥ ↵ V1 (x; ↵) V1 (y; ↵), (10.15) V1 (x ± y; ↵) = V1 (x; ↵) V0 (y; ↵) ± V0 (x; ↵) V1 (y; ↵), (10.16) V0 (2x; ↵) = V0 (x; ↵) (10.17) V1 (2x; ↵) 2 ↵ V12 (x; ↵) = = 2 V02 (x; ↵) = 2 V0 (x; ↵) V1 (x; ↵). 1=1 2↵ V12 (x; ↵), (10.18) De la misma forma que el cociente de funciones circulares e hiperbólicas da lugar a la función tangente y tangente hiperbólica, podemos introducir la función Vt (x; ↵) = V1 (x; ↵) . V0 (x; ↵) (10.19) Finalmente, considerando la definición de las funciones inversas de las circulares e hiperbólicas podemos definir las inversas de las de Stump↵, una vez fijado ↵ y estudiado el rango de definición de éstas que coincide con el de sus homólogas circulares e hiperbólicas. 8 acos x > si ↵ > 0, < p↵ 1 (10.20) V0 (x; ↵) = acosh x > : p si ↵ < 0, ↵ 1 V1 (x; ↵) = p 8 asen( ↵ x) > > p > > ↵ > < x > p > > asenh( ↵ x) > > : p ↵ si ↵ > 0, si ↵ = 0, si ↵ < 0, (10.21) Formulación universal del problema kepleriano 1 Vt (x; ↵) 10.4 = p 8 atan( ↵ x) > > p > > ↵ > < x > p > > atanh( ↵ x) > > : p ↵ 169 si ↵ > 0, si ↵ = 0, si ↵ < 0. (10.22) Formulación universal del problema kepleriano Para obtener expresiones del problema kepleriano válidas para cualquier tipo de movimiento volveremos a la ecuación (8.21) que, después de derivar respecto a s, se transforma en r000 2hr0 = 0. (10.23) De acuerdo con las propiedades de las funciones de Stump↵, vistas en 10.2, una solución general de la ecuación homogénea (10.23) podrá expresarse como r(s) = donde 0, 1, 2 0 V0 (s, 2h) + 1 V1 (s, 2h) + 2 V2 (s, 2h), (10.24) son tres constantes de integración. Todas las ecuaciones diferenciales que aparecerán en esta sección tendrán el mismo parámetro ↵ = 2h por lo que en todas las ocasiones llegaremos a funciones de la forma Vn (s, 2h). Teniendo en cuenta que h es un constante del movimiento, no existirá ambigüedad si en la notación suprimimos el argumento 2h y escribimos Vn (s). Cuando no exista tampoco ambigüedad en la variable temporal s podremos también poner, por brevedad Vn . Derivando dos veces la expresión (10.24) y teniendo en cuenta los valores particulares de Vn (0), se tendrá: r(s = 0) = r0 = 0, 0 = 1, 00 = r00 r000 r (s = 0) r (s = 0) = = 2h 0 + 2, donde, para generalizar, se ha considerado el cero de s en un instante t0 que, por ahora, no tiene que coincidir con T . Aplicando la relación (8.21) para obtener r000 en función de r0 , r00 , se podrá poner finalmente r(s) = r0 V0 (s) + r00 V1 (s) + µ V2 (s). (10.25) Por otro lado, integrando la ecuación (8.19) con el valor de r dado por (10.25), se obtiene finalmente t t0 = r0 V1 (s) + r00 V2 (s) + µ V3 (s), (10.26) 170 Formulación universal del problema kepleriano que será llamada ecuación de Kepler universal, pues, al igual que (10.25), es válida para cualquier tipo de movimiento. Finalmente, si derivamos respecto a s la expresión x0 = r ẋ, obtendremos µ x, r x00 = r0 ẋ + r2 ẍ = r0 ẋ o lo que es igual rx00 = r0 x0 µx. (10.27) Derivando nuevamente y aplicando la relación (8.21) se llega fácilmente a x000 2hx0 = 0, cuya solución se podrá poner como x= 0 V0 + 1 V1 + 2 V2 , donde ahora 0 , 1 , 2 representan tres vectores constantes cuyos valores, después de derivar, igualar a cero y expresar x000 en función de x0 , x00 de acuerdo con (10.27), pueden expresarse como ✓ ◆ r00 0 µ 0 = x , = x , = x + 2h x0 . 0 0 1 2 0 r0 0 r0 Por tanto, x(s) será igual a  ✓ ◆  µ r0 x(s) = V0 + 2h V2 x0 + V1 + 0 V2 x00 , r0 r0 relación que, tras aplicar la propiedad V0 2h V2 = 1, adopta la forma   µ r00 0 x(s) = 1 V 2 x0 + V 1 + V 2 x0 . r0 r0 (10.28) En este apartado hemos supuesto el instante inicial t0 distinto, en principio, de T , por tanto, las fórmulas son válidas para cualquier instante inicial. Sin embargo, cuando t0 = T tendremos p r00 = rp0 = 0, r0 = rp = , 1+e con lo que las expresiones anteriores se simplificarán, obteniendose las relaciones: r t x T = rp V0 (s) + µ V2 (s), = rp V1 (s) + µ V3 (s),  µ 1 V2 (s) xp + V1 (s)x0p . rp = (10.29) Formulación universal del problema kepleriano 171 Las dos primeras expresiones pueden simplificarse más teniendo en cuenta las relaciones V0 2h V2 = 1, V1 2h V3 µ + 2hrp = s, = µe, (10.30) esta última puede obtenerse sin más que tener en cuenta h= A2 µ 2 µ2 e2 µ2 µ(e2 1) = = , 2G2 2µp 2p rp = p . 1+e Sustituyendo (10.30) en (10.29) se obtiene por un lado: r t T = rp + µe V2 (s), = rp s + µe V3 (s), (10.31) y por otro: µ [1 e V0 (s)], 2h (10.32) µ t T = [s e V1 (s)], 2h ecuaciones similares a las dadas para cada uno de los movimientos elı́ptico e hiperbólico pero que no son válidas para el cálculo en el caso parabólico, por lo que dejan de ser universales. r = Si atendemos a la definición de los vectores a, b, del sistema apsidal, podemos poner xp = rp a, X p = vp b, donde vp representa la velocidad en el periastro, por lo que x0p = rp X p = rp vp b. La relación anterior puede modificarse si tenemos en cuenta que, por un lado p G = µp y además G = x ⇥ X = xp ⇥ X p , luego se tendrá finalmente rp vp = rp vp sen 90 = xp Xp sen(xp , X p ) = G = p µp. Reuniendo las anteriores relaciones y llevándolas a la tercera ecuación (10.29) se llega finalmente a p x = [rp µ V2 (s)] a + µp V1 (s) b, (10.33) que comparada con (9.17) permite poner r cos f = rp µ V2 (s), r sen f = p µp V1 (s). (10.34) 172 Formulación universal del problema kepleriano Teniendo en cuenta las expresiones de r, r cos f y las relaciones (10.30) obtendremos fácilmente las expresiones f = r + r cos f 2 f 2 r sen2 = r r cos f, 2 2 r cos2 = rp [1 + V0 (s)], = µ(1 + e) V2 (s) = µ(1 + e) [1 2h V0 (s)]. Por último, las expresiones (10.17) conducen a p r cos f s p = rp V0 ( ), 2 2 p que divididas nos dan f tan = 2 10.5 r sen r p f s = µ(1 + e) V1 ( ), 2 2 µ s (1 + e) Vt ( ). p 2 (10.35) (10.36) Coeficientes de transición en forma cerrada Las propiedades del movimiento kepleriano permiten expresar las funciones f , g en forma cerrada, esto es, sin los desarrollos en serie de las expresiones (7.39), aunque en dichas expresiones no aparecerá t explı́citamente. El valor de f y g se obtiene fácilmente si tenemos en cuenta la relación (10.28)  µ 0 x(s) = 1 V2 (s) x0 + [r0 V1 (s) + r0 V2 (s)] X 0 , r0 donde hemos tenido en cuenta que x00 = r0 X 0 . Por tanto, podremos poner por un lado µ f (t; t0 ) = 1 (10.37) V2 (s), r0 y por otro g(t; t0 ) = r0 V1 (s) + r00 V2 (s). Finalmente, si tenemos también en cuenta (10.26) llegamos a la igualdad g(t; t0 ) = (t t0 ) µ V3 (s). (10.38) Las expresiones (10.37) y (10.38) nos dan el valor de f y g en forma cerrada en función de s. Las derivadas de f y g respecto a t serán @f µ = V1 (s), @t rr0 @g =1 @t µ V2 (s). r Coeficientes de transición en forma cerrada Recordando que µ V2 = r0 (1 173 f ) se llega a @g r0 =1 [1 f (t; t0 )] . @t r Por otro lado, la relación (10.26) puede ponerse como V1 = = 1 [(t t0 ) r00 V2 µ V3 ] r0  1 r0 r00 g(t; t0 ) + (1 f ) , r0 µ = 1 [g(t; t0 ) r0 (10.39) r00 V2 ] lo que permite poner @f r0 S0 r0 R 0 = [1 f (t; t0 )] g(t; t0 ), (10.40) @t r r con lo que se completa la relación de fórmulas necesarias para el cálculo de efemérides. Por su importancia veremos en que se transforman las expresiones (10.37) y (10.38) en el movimiento elı́ptico, para el cual 2h < 0 y por tanto: p 2h V2 (s, 2h) = 1 V0 (s, 2h) = 1 cos 2hs, p sen 2hs p 2h V3 (s, 2h) = s V1 (s, 2h) = s , 2h para llegar finalmente a: f (t; t0 ) = 1+ g(t; t0 ) = (t ⌘ p µ ⇣ 1 cos 2hs , 2hr0 p p µ 2hs sen 2hs p t0 ) + . 2h 2h Al integrar en forma separada el movimiento elı́ptico habı́amos definido la anop malı́a media como E = 2hs, después de suponer que el instante t0 coincidı́a con la época de paso por el periastro, esto es t0 = T, E = 0. Sin embargo, para encontrar la expresión de f (t; t0 ), g(t; t0 ), válida para cualquier t0 es preciso p suponer que t0 puede ser cualquier instante, para lo cual tomaremos E E0 = 2hs, y de ahı́: µ f (t; t0 ) = 1 [1 cos(E E0 )] , 2hr0 µ g(t; t0 ) = (t t0 ) + [(E E0 ) sen(E E0 )] . ( 2h)(3/2) Finalmente, si tenemos en cuenta que el movimiento es elı́ptico tendremos que 2h = µ/a = n2 a3 /a = n2 a2 , que llevado a las igualdades anteriores nos da: a f (t; t0 ) = 1 [1 cos(E E0 )] , r0 (10.41) 1 g(t; t0 ) = (t t0 ) + [(E E0 ) sen(E E0 )] . n 174 Formulación universal del problema kepleriano Capı́tulo 11 Órbitas keplerianas que pasan por dos puntos 11.1 Problema de transferencias orbitales y problema de Lambert Plantearemos ahora una una importante pregunta de la dinámica orbital: ¿qué órbita u órbitas permiten llegar a un cuerpo en el espacio desde una posición inicial P1 a otra final P2 ? Esta pregunta conduce a dos problemas distintos según que impongamos o no el tiempo de tránsito entre las dos posiciones. El problema de las transferencias orbitales busca el conjunto O(P1 , P2 ) de todas las órbitas keplerianas que pasan por los dos puntos. A cada una de las infinitas soluciones de este problema se le denomina órbita de transferencia y su conocimiento es de gran aplicación en tecnologı́a espacial para estudiar el problema de la conexión de dos puntos en el espacio a través de un satélite artificial o sonda espacial. Si entre todas las órbitas de transferencia que conectan dos puntos buscamos aquellas que tardan un tiempo dado en pasar de un punto a otro, nos encontramos con un problema clásico de la Mecánica Celeste llamado problema de Lambert. Ası́ como el problema de las transferencias tiene infinitas soluciones, el problema de Lambert tiene una única solución. El problema de Lambert va asociado al problema de determinación de una órbita cuando tenemos información parcial de la misma en varios instantes diferentes, lo que ocurre, por ejemplo, en el caso de cometas, asteroides, etc. 176 Órbitas keplerianas que pasan por dos puntos En este capı́tulo abordamos ambos problemas. En primer lugar buscaremos, y caracterizaremos en función de su energı́a, todas las órbitas que pasan por dos puntos diferentes. Posteriormente encontraremos la relación de la energı́a de la órbita con el tiempo de tránsito entre los puntos P1 y P2 y de esta forma encontraremos un método de resolución del problema de Lambert. Los métodos habitualmente desarrollados en la literatura cientı́fica para la resolución del problema de Lambert son distintos al presentado en este libro. No pretendemos con esto dar ningún método alternativo, de hecho, este método no es comparable con otros ni en precisión ni en velocidad, sin embargo, nos ha parecido útil su inclusión en el libro pues conecta, de manera más natural, la resolución de ambos problemas y es más claro desde el punto de vista didáctico. 11.2 Órbitas de transferencia Sean dos puntos P1 , P2 , que en el e3 P2 nd sistema espacial S, con origen O en el cuerpo central, pueden represenlr id tarse a través de los vectores x1 = Od OP1 , x2 = OP2 , que supondremos P1 no colineales. Supongamos que existe una cónica que pasa por P1 y P2 y tiee2 ne el punto O como foco. Esta cónica Or puede dar lugar a dos órbitas kepleria⌦d nas, una directa Od y otra retrógrada e1 ld Or , según que, visto desde la direcnr ción de e3 , el orbitador vaya de P1 a P2 en el sentido directo o retrógrado Figura 11.1: Órbitas de transferencia direcrespectivamente (figura 11.1). Ambas ta, O , y retrógrada, O . r d órbitas tienen en común el plano orbital y su sistema nodal se caracteriza por unos vectores l, n cuya relación entre si es ld = lr , nd = nr . Para buscar todas las órbitas keplerianas que pasan por P1 y P2 buscaremos por separado las órbitas directas y las retrogradas, duplicandose, de esta forma, el conjunto de soluciones encontradas. Llamemos np = (x1 ⇥ x2 )/k x1 ⇥ x2 k, y supongamos que np · e3 0. Si queremos órbitas directas partiremos de un valor n = nd = np , mientras que si queremos órbitas retrógradas tomaremos n = nr = np . Cuando np · e3 < 0, tomaremos n = nd = np para órbitas directas y n = nr = np para órbitas retrogradas. Elementos del triángulo OP1 P2 11.2.1 177 Plano de la órbita Fijado n podemos obtener el sistema orbital en el punto P1 y el P2 a través de las expresiones: x1 u1 = , n, v 1 = n ⇥ u1 , r1 (11.1) x2 u2 = , n, v 2 = n ⇥ u2 . r2 El valor del vector n determinará, sin ambigüedad, el plano del movimiento a través de los elementos ⌦, i dados por medio de las expresiones (9.24). Además, una vez obtenidos éstos, podemos calcular los vectores l, m del sistema de referencia nodal. En particular tendremos l = cos ⌦ e1 + sen ⌦ e2 . 11.2.2 (11.2) Ángulo de transferencia Hemos dicho anteriormente que una órbita kepleriana, vista desde el vector n, siempre es directa, puesto que las anomalı́as son siempre crecientes. Dicho ésto, y una vez fijado n tras decidir si queremos una órbita directa o retrógrada, llamaremos ángulo de transferencia al ángulo directo, con la orientación dada por n, que lleva el vector x1 al x2 . Este ángulo, que puede tomar cualquier valor entre 0 y 2⇡, viene determinado unı́vocamente por la expresión (1.25), esto es w = atan (x1 · x2 , n · (x1 ⇥ x2 )) , w 2 [0, 2⇡). El ángulo de transferencia puede ponerse también como: r1 r2 cos w r1 r2 sen w 11.3 x1 · x2 , n · (x1 ⇥ x2 ). (11.3) Elementos del triángulo OP1 P2 2 P2 r2 c O = = wt r1 1 P1 Figura 11.2: Triángulo OP1 P2 . mientras que el semiperı́metro valdrá El triángulo OP1 P2 de la figura 11.2, juega un importante papel en el estudio de las transferencias orbitales. El ángulo wt , con vértice en O, coincide con el ángulo de transferencia w cuando éste es menor que ⇡ y con 2⇡ w cuando es mayor que ⇡. En cualquier caso se tendrá cos wt = cos w. Además, la cuerda c subtendida por los dos puntos P1 y P2 se obtendrá con la relación c2 = x212 = (x2 x1 )2 = r12 + r22 2r1 r2 cos wt = r12 + r22 2r1 r2 cos w, = (r1 + r2 + c)/2. 178 Órbitas keplerianas que pasan por dos puntos Teniendo en cuenta el valor de c2 podremos poner (r1 + r2 + c)(r1 + r2 (r1 + c r2 )(r2 + c c) = 2r1 r2 (1 + cos w) = r1 ) = 2r1 r2 (1 = cos w) w , 2 w 4r1 r2 sen2 . 2 4r1 r2 cos2 Por otro lado (r1 + r2 c) = 2( c), (r1 + c r2 ) = 2( r2 ), (r2 + c r1 ) = 2( r1 ), lo que conduce a las expresiones: w 2 w r1 r2 sen2 2 r1 r2 cos2 = = ( c), ( r1 )( r2 ). Si extraemos la raı́z cuadrada y tenemos en cuenta los signos del seno y coseno de w/2, según el cuadrante de w, podremos poner w cos = 2 w s ( c) , r1 r2 w sen = 2 s ( r1 )( r1 r2 r2 ) , (11.4) donde hemos llamado w = ⇢ 1 1 si si w < ⇡, w > ⇡. (11.5) Definiremos los ángulos exteriores 1 , 2 como los ángulos que llevan respectivamente de x1 a x12 y de x12 a x2 en sentido positivo desde la orientación dada por n. Si tenemos en cuenta la expresión (1.24) del seno y coseno del ángulo orientado entre dos vectores y la definición de 1 , podremos poner c r1 cos c r1 sen 1 1 = = x1 · x12 n · (x1 ⇥ x12 ) x1 · (x2 x1 ) n · [x1 ⇥ (x2 x1 )] = = = = x1 · x2 r12 , n · (x1 ⇥ x2 ), lo que, teniendo en cuenta (11.3), conduce a las relaciones c cos c sen 1 1 = = r2 cos w r1 , r2 sen w. (11.6) Hodógrafa en P1 y P2 179 Combinando convenientemente las relaciones anteriores y tras una serie de cálculos, podremos poner cos2 sen El signo de 1 2 1 2 1 2 = = 1 (1 + cos 2 1 (1 cos 2 1) = 1) = ( c)( r1 ) , cr1 ( r2 ) . cr1 se obtiene a partir del de w por medio de las relaciones w<⇡, 1 que permiten analizar el signo de s ( c)( 1 cos = w 2 cr1 < ⇡, w>⇡, 1 > ⇡, 1 /2 según el cuadrante de w y poner finalmente s r1 ) ( r2 ) 1 , sen = . (11.7) 2 cr1 Con un proceso similar podemos obtener también las igualdades s s ( c)( r ) ( r1 ) 2 2 2 cos = w , sen = . 2 cr2 2 cr2 11.4 (11.8) Hodógrafa en P1 y P2 La velocidad de un punto en una órbita kepleriana puede expresarse, en el sistema de referencia orbital, como X = R u + T v, (11.9) donde u, v representan la dirección radial y transversal y R = ṙ, T = r f˙, siendo f la anomalı́a verdadera. De las propiedades de las órbitas keplerianas podemos deducir fácilmente las relaciones: r p pµ p µ r= , R=e sen f, T = , (11.10) 1 + e cos f p r o lo que es igual: p e cos f = r 1, e sen f = R r p , µ p= r2 T 2 . µ (11.11) De acuerdo con las relaciones (11.10), los valores de R, T están restringidos a los rangos r r µ µ T > 0, e Re . (11.12) p p 180 Órbitas keplerianas que pasan por dos puntos La segunda relación no constituye realmente una restricción al valor de la componente radial de la velocidad, sino una relación entre la velocidad y la órbita kepleriana que ésta genera. De hecho, cualquier valor de R determina un vector velocidad cuyos elementos orbitales verifican dicha relación. Si f1 , f2 representan la anomalı́a verdadera en cada uno de los dos puntos, P1 , P2 , se tendrá que el ángulo de transferencia w es igual a w = f2 f1 . (11.13) Si particularizamos la primera de las expresiones (11.10) para el punto P2 (subı́ndice 2) y sustituimos f2 por w + f1 , nos queda una expresión en e sen f1 , e cos f1 . En dicha expresión sustituiremos estos elementos por su valor en función de R1 y T1 , obtenido particularizando (11.11) para P1 . Todo este proceso nos conduce a la relación 1 (R1 , T1 ) = a1 T12 + b1 R1 T1 + c1 = 0, (11.14) donde a1 = r1 r2 cos w , r2 b1 = sen w, µ(1 c1 = cos w) . r1 (11.15) Particularizando de nuevo la primera de las ecuaciones (11.10), en este caso en el punto P1 , sustituyendo f1 por w f2 , y por último sustituyendo sen f2 y cos f2 por su valor en función de R2 y T2 , se obtendrá la relación 2 (R2 , T2 ) = a2 T22 + b2 R2 T2 + c2 = 0, (11.16) donde a2 = r2 r1 cos w , r1 b2 = sen w, µ(1 c2 = cos w) . r2 (11.17) La expresión 1 (R1 , T1 ) = 0 define la relación entre las componentes del vector velocidad X 1 para que el punto P2 pertenezca a la órbita O(x1 , X 1 ). Análogamente 2 (R2 , T2 ) = 0 implica que la órbita O(x2 , X 2 ) pase por P1 . p Finalmente, a partir de las relaciones (11.11), podemos obtener el valor de µp y e2 por las expresiones ✓ ◆2 r 2 R2 T 2 rT p 2 µp = rT, e = + 1 . µ2 µ Una órbita kepleriana que pase por P1 y P2 debe tener unos valores p, e constantes por lo que deben verificarse las relaciones r1 T 1 r12 R12 T12 + µ2 ✓ r1 T 1 µ ◆2 1 r22 R22 T22 µ2 ✓ r2 T 2 µ r2 T 2 = 0, (11.18) ◆2 = 0. (11.19) 1 Hodógrafa en P1 y P2 181 Cualquiera de estas dos condiciones, (11.18 y 11.19), junto con (11.14 y 11.16), constituyen un conjunto de tres relaciones independientes entre las componentes R1 , T1 , R2 , T2 de la velocidad para que la órbita kepleriana pase por los dos puntos y nos asegura que las órbitas O(x1 , X 1 ) y O(x2 , X 2 ) coinciden. Por simplicidad, parece lógico elegir como tercera condición la expresión 3 (R1 , T1 , R2 , T2 ) = r1 T 1 r2 T2 = 0. (11.20) Sin embargo, cuando el ángulo de trasferencia sea w = ⇡, el valor de bi en las dos primeras condiciones se hace cero, por lo que estas condiciones se transforman en a1 T12 + c1 = 0, a2 T22 + c2 = 0, que no forman un sistema independiente con la condición (11.20). En éste la expresión de 3 en la tercera condición, 3 (R1 , T1 , R2 , T2 ) = 0, es la parte izquierda de (11.19). La relación (11.14) indica cómo debe ser el vector velocidad en el punto P1 para que la órbita kepleriana generada pase por el punto P2 . Esta relación representa la ecuación de una hipérbola con dos ramas separadas por las ası́ntotas T1 = 0 y a1 T1 + b1 R1 = 0. La primera de las condiciones (11.12), indica que la hodógrafa queda representada únicamente por la rama superior de la hipérbola. La figura 11.3 presenta dos de estas curvas para valores distintos de ci , positivo y negativo. p La velocidad v1 = R12 + T12 , en el punto P1 , puede ser repreT1 sentada en la gráfica 11.3 como una semicircunferencia de radio v1 . Si esta semicircunferencia tiene algún punto en común con la hodógrafa los puntos de intersección señalan las velocidades en P1 que permiten que la órbita pase por P2 . De acuerdo con la gráfica existirá un valor mı́nimo de la velocidad por debajo del cual Figura 11.3: Hodógrafa en P1 no hay intersección entre la hodógrafa y la semicircunferencia, lo que representa que no es posible, con esa velocidad, conectar P1 con P2 con una órbita kepleriana. R1 Por encima de esa velocidad mı́nima existirán, para cada valor de v1 , dos puntos de la hodógrafa, lo que representa dos órbitas keplerianas de transferencia. Para la velocidad mı́nima existirá una única órbita kepleriana de transferencia. 182 11.5 Órbitas keplerianas que pasan por dos puntos Órbitas de energı́a mı́nima Para conocer el valor de la velocidad mı́nima que permite conectar los dos puntos será preciso minimizar la función v12 = R12 + T12 sujeta a la condición 2 1 (R1 , T1 ) = a1 T1 + b1 R1 T1 + c1 = 0. El método de los multiplicadores de Lagrange, permite obtener1 el valor p ✓ ◆ 2c1 (a1 + a21 + b21 ) 1 1 2 vm = = 2µ , b21 r1 donde se ha expresado vm en términos de r1 , r2 y w, y posteriormente se han aplicado las relaciones entre los lados y los ángulos del triángulo OP1 P2 , siendo el semiperı́metro del triángulo. Teniendo en cuenta la relación entre la velocidad en un punto y la energı́a de la órbita h = v 2 /2 µ/r, y aplicándola al punto P1 con la velocidad mı́nima, obtendremos la energı́a de la órbita de velocidad mı́nima h= µ , (11.21) que representa, por tanto, la órbita de mı́nima energı́a entre P1 y P2 . Esta energı́a es negativa, por lo que la órbita correspondiente será elı́ptica, y de semieje igual a a = /2. Cualquier otra órbita de O(P1 , P2 ) tendrá una energı́a h > hm y por tanto un semieje a > /2. 11.6 Órbitas de energı́a h > hm Igual que hemos razonado antes sobre la velocidad en la gráfica 11.3 puede razonarse sobre la energı́a. A partir del valor de la energı́a mı́nima hm , cualquier valor de la energı́a h, mayor que hm , conduce a dos órbitas keplerianas que conectan los dos puntos. Estas dos órbitas se deducen a partir de los dos vectores velocidad (R1 , T1 ) intersección de la hodógrafa con la semicircunferencia cuyo radio es igual a la velocidad correspondiente a la energı́a h. Para obtener estos valores bastará resolver el sistema de ecuaciones 1 2 (R + T12 ) 2 1 µ r1 h = 0, a1 T12 + b1 R1 T1 + c1 = 0, (11.22) que tendrá dos soluciones para cada valor de h > hm . Una vez obtenidos los valores de R1 y T1 , ası́ como el sistema orbital, (u1 , v1 , n), en P1 , la relación (11.9) permite obtener el vector X 1 en el sistema espacial y 1 Se obtienen cuatro extremos de los que se desechan tres por dar un valor de T negativo o 1 imaginario. Órbitas de energı́a h > hm 183 con éste y x1 , los elementos de la órbita O(x1 , X 1 ) que coincide con la órbita de transferencia Ot (x1 , x2 ) de energı́a h. Una vez obtenida la órbita podemos obtener fácilmente el tiempo t que se emplea en llegar desde P1 hasta P2 . Este tiempo depende de la energı́a h, por lo que se convierte en una función t(h). Para encontrar los valores R1 , T1 de la velocidad podemos utilizar un método numérico que resuelva el sistema de ecuaciones no lineal (11.22). Sin embargo, la aplicación de las funciones de Stump↵ permite encontrar analı́ticamente estas dos órbitas. Para ver esto efectuaremos el siguiente cambio de variable: R1 = x cos T1 = x sen 1 y sen 2 1 + y cos 2 1 2 1 2 , , mediante el cual la ecuación de la hodógrafa en P1 se transforma en x2 tan 1 2 y 2 cot 1 2 = 2µ w tan , r1 2 (11.23) y la norma de la velocidad en P1 se expresará ahora como v12 = R12 + T12 = x2 + y 2 . (11.24) El sistema de ecuaciones (11.22) se ha transformado en un sistema lineal, en las variables x2 , y 2 , de ecuaciones (11.23) y (11.24). Modificaremos ligeramente este sistema sustituyendo en la última ecuación el valor de la velocidad por su expresión en función de una energı́a h cualquiera, mayor que la energı́a mı́nima, esto es 2µ x2 + y 2 = v12 = + 2h. r1 Resolviendo este sistema, después de sustituir el valor de tan w/2 por su expresión en función de los elementos del triángulo OP1 P2 , se llega a x2 = y2 = c)( r1 ) , cr1 cr1 r2 ( r2 ) 2µ + 2h . cr1 cr1 2µ r1 + 2h ( Si introducimos las cantidades auxiliares , por medio de las igualdades s r , = 2 V1 1 ( ; 2h), V1 ( ; 2h) = 2 2µ 2µ s (11.25) r c c 1 , = 2 V1 ( ; 2h), V1 ( ; 2h) = 2 2µ 2µ 184 Órbitas keplerianas que pasan por dos puntos ası́ como las constante xp , yp en la forma r1 , cr1 x2p = 2µ r2 , cr1 yp2 = 2µ podremos poner x2 = x2p V02 ( ), 2 y 2 = yp2 V02 ( ), 2 donde, una vez fijado el nivel h de energı́a, hacemos desaparecer de las funciones de Stump↵ el segundo parámetro. Al estudiar la figura 11.3, en relación con la hodógrafa del movimiento en P1 , hemos visto como la única rama posible es aquella para la cual T1 es positiva, lo que equivale a considerar la rama superior. Al efectuar el giro, la rama anterior de la hipérbola se transforma en aquella para la cual x > 0. Teniendo esto en cuenta, podemos extraer la raı́z cuadrada en las expresiones anteriores, llegándose a x = xp V0 ( ), 2 y = ±yp V0 ( ), 2 que nos da los dos posibles valores de la velocidad asociados a un nivel de energı́a h > hm . Las dos velocidades nos indicarán que para cada nivel de energı́a existen dos posibles órbitas keplerianas, que pasan por P1 , P2 . Volviendo de nuevo a la expresión de la hodógrafa antes de efectuar el giro tendremos T1 = x sen 1 2 + y cos 1 2 1 1 = xp V0 ( ) sen ± yp V0 ( ) cos , 2 2 2 2 donde sustituyendo el seno y coseno de ( 1 /2) por su valor, dado en (11.7), llegamos a s 2µ p T1 = ( r1 )( r2 ) V0 ( ) cr1 2µ 2 s p 2µ w c ± ( r1 )( r2 ) V0 ( ) cr1 2µ 2  2µ p = ( r1 )( r2 ) V 0 ( ) V 1 ( ) ± w V 0 ( ) V 1 ( ) , cr1 2 2 2 2 y finalmente a T1 = 2µ p ( cr1 r1 )( r2 ) V 1 ✓ ± 2 w ◆ , (11.26) que nos da los dos valores de la velocidad transversal asociados a la energı́a h. Conjunto de las órbitas que pasan por dos puntos 185 Recordando la expresión p = r2 T 2 /µ, del semilado recto en función de la velocidad transversal, podemos obtener el semilado recto de cada una de las dos órbitas correspondientes a la energı́a h en la forma ✓ ◆ ( r2 )( r1 ) 2 ± w p± = pi = 4µ , (11.27) V1 c2 2 donde hemos asociado el ı́ndice de p al signo correspondiente. Observemos que el valor de p± para w coincide con el de p⌥ para 2⇡ w, y viceversa. 11.7 Conjunto de las órbitas que pasan por dos puntos Hemos visto que para cada tipo de transferencia, directa o retrógrada, obtenemos un ángulo de transferencia w, y a partir de éste los dos elementos que definen el plano de la órbita ⌦, i que son comunes para todas las órbitas que pasan por los dos puntos. Una vez fijado w, podemos obtener el valor hm de la órbita de mı́nima energı́a que pasa por los dos puntos. Obtenido éste, cada valor h > hm nos dará dos órbitas O1 (h), O2 (h), cuyos elementos orbitales serán obtenidos en este apartado. Fijado h, su signo, combinado con la expresión del semieje en función de la energı́a, nos permite calcular el semieje de la órbita. Además, los semilados rectos de las dos órbitas vienen dados por los valores p± de la ecuación (11.27). Si fijamos, en lo que sigue, el semilado p de una de estas dos órbitas, esto es p+ o p , podemos obtener el resto de elementos orbitales para esa órbita. Si llamamos W = f2 + f1 y recordamos que w = f2 f1 , ası́ como las expresiones (11.11), que nos dan el valor de e cos f y e sen f , podremos poner ✓ ◆ w W 1 1 p p cos cos = (cos f1 + cos f2 ) = + 2 , 2 2 2 2e r1 r2 ✓ ◆ w W 1 1 p p sen sen = (cos f1 cos f2 ) = , 2 2 2 2e r1 r2 que finalmente conduce a W 2 W e sen 2 e cos = = ✓ ◆ 1 p p w + 2 sec , 2 r1 r2 2 ✓ ◆ 1 p p w csc , 2 r1 r2 2 que nos permite calcular e y W para cada uno de los dos casos. A partir de w y W podemos calcular, sin ambigüedad, f1 y f2 f1 = W +w , 2 f2 = W w 2 . (11.28) 186 Órbitas keplerianas que pasan por dos puntos Puesto que conocemos el vector l del sistema nodal y el vector u1 del sistema orbital en P1 podemos calcular el ángulo ✓1 que va de l a u1 . Por otro lado, como sabemos que ✓1 = ! + f1 , esto nos permite calcular el valor del argumento del periastro !. El último elemento orbital, la época de paso por el periastro, puede ser calculado si tenemos en cuenta la relación (10.36) que invertida nos da unos valores de s1 , s2 , correspondientes a f1 , f2 , en la forma r p 1 fi si = 2 Vt 1 ( tan ; 2h). µ1+e 2 A partir de s1 la segunda ecuación (10.29) t nos da el valor de t1 T si conocemos t1 . 11.8 T = rp s + µe V3 (s), (11.29) T , lo que permite calcular la época de paso por el periastro Tiempo de tránsito La misma ecuación (11.29) nos permite obtener una expresión que nos da el tiempo de tránsito entre P1 y P2 , para cada una de las órbitas con energı́a h, como p t(h) = (s2 s1 ) + µe [V3 (s2 ) V3 (s1 )] . (11.30) 1+e La figura 11.4(a) nos muestra la gráfica correspondiente a los tiempos de transferencia, en función de la energı́a h, después de fijar los puntos P1 , P2 y el tipo de transferencia (directa o retrógrada). La figura 11.4(b) muestra el conjunto de todas las órbitas de transferencia para el mismo caso. En la figura 11.4(a) podemos comprobar que no hay ningún valor a la izquierda de la energı́a mı́nima hm . El valor tm corresponde al tiempo de transferencia de la órbita elı́ptica correspondiente a esta energı́a. Esta órbita es la órbita Em de la figura 11.4(b). Si aumentamos la energı́a a un valor hm < h < 0 nos encontramos dos valores de t, ambos correspondientes a las dos órbitas elı́pticas correspondientes a la energı́a h. Uno de los tiempos es menor que tm , el correspondiente a la órbita E1 de la figura 11.4(b), mientras que el otro es mayor que tm y corresponde a E2 . Como se ve en la figura 11.4(b) el tiempo de tránsito en cada caso se corresponde con un mayor arco recorrido. Si continuamos aumentando h, con valores negativos tendiendo su valor hacia cero, una de las dos ramas de la curva tiende a 1 mientras que el otro tiende al valor de tp correspondiente a la órbita parabólica de energı́a h = 0 (órbita P en la figura 11.4(b)). Órbitas keplerianas que pasan por dos puntos en dos instantes 187 E2 t Em hm h 0 E1 P (a) Tiempo de tránsito H (b) Tipo de órbitas Figura 11.4: Transferencias en función de la energı́a h Finalmente, para valores de energı́a positivos, órbitas hiperbólicas, encontramos dos valores de t uno positivo y otro negativo. El valor negativo puede olvidarse, pues corresponde a una órbita imposible que proviene, en el lı́mite, de las órbitas elı́pticas de excentricidad muy grande y tiempo de tránsito tendiendo a infinito, que en el lı́mite se transforman en una parábola y posteriormente en hipérbolas. La única órbita posible para una energı́a positiva h es la que tiene un tiempo de tránsito positivo y menor que tp (órbita H en la figura 11.4(b)). 11.9 Órbitas keplerianas que pasan por dos puntos en dos instantes dados t1 , t2 Si atendemos a la figura 11.4(a) podemos comprobar que, dado un tiempo t de tránsito entre P1 y P2 , existe una y sólo una órbita de trasferencia ente los dos puntos, lo que demuestra que la solución del problema de Lambert es única. Habitualmente, cuando se requiere la resolución de problema de Lambert para el cálculo de las órbitas keplerianas que pasan por dos puntos en dos instantes dados t1 , t2 , suele recurrirse, entre otros, al método iterativo de Gauss. En este apartado vamos a proponer un nuevo método, basado en las propiedades del tiempo de transferencia del apartado anterior y que será muy simple de implementar y comprender y además es válido para cualquier tipo de movimiento. El lector interesado puede acudir a la literatura clásica, donde se describen otros método que resuelven el mismo problema de forma más eficiente aunque, generalmente, menos didáctica. 188 Órbitas keplerianas que pasan por dos puntos Una vez fijado el sentido de la transferencia, y por tanto su ángulo w, intentaremos invertir la ecuación (11.30), esto es, intentaremos obtener el valor de la energı́a h que nos da el tiempo de transferencia t = t2 t1 especificado2 . No conocemos de manera explı́cita la función t = t(h) que nos da el tiempo de la transferencia en función de la energı́a, ni su derivada, por lo que no podemos utilizar el clásico método de Newton para el cálculo de las raı́ces de la ecuación. Sin embargo, la suavidad de la gráfica de dicha función, ası́ como el conocimiento sencillo, de los puntos tm , tp , que separan los distintos comportamientos de la función, permiten aplicar el método de la secante o regula–falsi, que aunque de convergencia no demasiado rápida nos da unos resultados suficientemente buenos en cualquier circunstancia. Dada una función f (x) = 0 y un intervalo [a, b] donde existe una sola raı́z, y por tanto signo(f (a)) 6= signo(f (b)), el método de la secante calcula un punto c, más próximo a la raı́z, por medio de la expresión c=a (b a)f (a) . f (b) f (a) Si dicho punto no está suficientemente cerca de la raı́z, sustituimos el intervalo [a, b] por otro [a, c] o bien [c, b] según que signo(f (a)) 6= signo(f (c)) o bien signo(f (c)) 6= signo(f (b)). Una vez tomado este nuevo intervalo se repite el proceso de forma iterativa. Con objeto de elegir el intervalo, de manera que el método sea convergente, basta comparar t2 t1 con tm y tp . 0 < tp < tm < t2 t2 t2 t2 t2 t1 t1 t1 t1 t1 , < = < = tp , tp , tm , tm , La función f (h) se elige de entre las dos siguientes: ) ) ) ) ) it h 2 [0, 1), h = 0, h 2 [hm , 0], h = hm , h 2 [hm , 0]. teniendo en cuenta las tres reglas Si t2 t1 < tp se toma un valor cualquiera h0 positivo y se elige el valor f (h) = t(h), tal que t(h0 ) > 0. Si tp < t2 t1 < tm se toma un valor cualquiera h0 negativo y mayor que hm y se elige el valor f (h) = t(h), tal que t(h0 ) < tm . Si tm < t2 t1 se toma un valor cualquiera h0 negativo y mayor que hm y se elige el valor f (h) = t(h), tal que t(h0 ) > tm . 2 Para aplicar este método podemos conocer el intervalo de tiempo de paso por P1 y t2 de paso por P2 . t o bien los instantes t1 Parte III Movimiento orbital 189 Capı́tulo 12 Movimiento orbital 12.1 Ecuaciones del movimiento orbital En el capı́tulo 7 se han presentado las ecuaciones del movimiento kepleriano, bien en su forma de ecuaciones de orden dos (7.23), o bien como ecuaciones de orden uno (7.24). Ambos conjuntos de ecuaciones responden al modelo, que hemos llamado movimiento kepleriano, del movimiento relativo de un punto material respecto de otro, cuando ambos están atraı́dos por la ley de atracción gravitacional de Newton. Este modelo es una aproximación a la realidad, pues parte de dos premisas que son falsas: no existen dos cuerpos aislados y éstos en ningún caso representan puntos infinitesimales sino que son sistemas finitos de masas (sólidos). Además, existen muchos otros efectos, gravitacionales y no gravitacionales, que modifican el comportamiento del movimiento kepleriano y que dan lugar a lo que llamaremos movimiento orbital, que constituye una mejor aproximación al movimiento de los cuerpos observado en el sistema solar. La mayor parte de los problemas orbitales pueden ser formulados a través de un sistema de ecuaciones diferenciales similar a las del modelo kepleriano: ẍ + µ x = P, r3 (12.1) donde se añade el vector P, que representa la perturbación o aceleración que produce la perturbación. El sistema dado por (12.1) puede representarse también como: ẋ = X, (12.2) µ x + P. Ẋ = 3 r 192 Movimiento orbital Cuando se verifique la condición k P k ⌧ µ/r2 , esto es, cuando la aceleración que produce la perturbación sea mucho menor que la kepleriana, la solución del sistema (12.1) o (12.2), será llamada movimiento kepleriano perturbado o simplemente movimiento orbital. Si existe una función Vp tal que se cumpla P= podemos definir un hamiltoniano H H(x, X) = Hk + Vp = rx Vp , 1 X ·X 2 (12.3) µ + Vp , kxk (12.4) como suma del hamiltoniano kepleriano Hk , dado en (7.25), y la función Vp que llamaremos potencial perturbador. Las ecuaciones de Hamilton aplicadas a este hamiltoniano coinciden con las ecuaciones (12.2) del movimiento orbital, por lo que ambos sistemas son equivalentes y llamaremos a H(x, X) hamiltoniano del movimiento orbital. 12.2 Ecuaciones de Lagrange El movimiento orbital, en ausencia de perturbaciones, coincide con el kepleriano y puede ser descrito a través de un conjunto de constantes como son los elementos orbitales. Cuando aparecen pequeñas perturbaciones el modelo puede considerarse como instantáneamente kepleriano, esto es, en un cierto instante t0 el movimiento puede ser descrito a través de seis constantes (a0 , e0 , i0 , ⌦0 , !0 , T0 ), llamadas elementos orbitales osculadores, que varı́an para un instante posterior. De esta forma, los elementos orbitales pasan de ser constantes a ser variables en t y las funciones (a(t), e(t), i(t), ⌦(t), !(t), T (t)) permiten establecer la órbita osculatriz para cada instante y, con ella, cualquier elemento, incluidas la posición y la velocidad. Para encontrar las ecuaciones que rigen la variación de los elementos orbitales con respecto al tiempo, que integradas nos determinarán el movimiento orbital, deduciremos la relación diferencial entre éstas y las variables de Delaunay, vistas en el apartado 9.9. Diferenciando la expresión que define el movimiento medio n2 a3 = µ, podemos poner 2na3 dn + 3n2 a2 da = 0, de donde obtenemos dn = Diferenciando la expresión ` = n(t dado en (12.5) obtenemos d` = n dt n dT 3n da. 2a (12.5) T ) y sustituyendo el valor de dn por el 3n (t 2a T ) da. (12.6) Ecuaciones de Lagrange 193 Las identidades g = !, h = ⌦, permiten poner dg = d!, dh = d⌦. (12.7) Las expresiones de los momentos de Delaunay (9.54) pueden ponerse también como L2 = µ a, G2 = L2 (1 e2 ), H = G ci , donde hemos introducido la notación ci = cos i, si = sen i, (12.8) que será usada de aquı́ en adelante. Diferenciando la primera de las relaciones anteriores se tiene dL = µ da. 2L (12.9) Diferenciando la expresión de G y sustituyendo dL por su valor (12.9) se llega a dG = µG da 2L2 L2 e de. G (12.10) Finalmente, tras haber sustituido dG por su valor, dado en (12.10), se obtendrá para H dH = µG ci da 2L2 L2 e ci de + Gsi di. G (12.11) Reuniendo las expresiones (12.6),(12.7),(12.9),(12.10),(12.11), resolviendo el sistema de ecuaciones en da, de, di, d⌦, d!, dT y sustituyendo las diferenciales por las derivadas respecto al tiempo obtendremos finalmente: da dt de dt di dt d⌦ dt d! dt dT dt = = = = = = 2L dL , µ dt G2 dL G dG , 3 eL dt eL2 dt ci dG 1 dH , Gsi dt Gsi dt dh , dt dg , dt 1 d` 3L dL 1 (t T ) . n dt aµ dt (12.12) 194 Movimiento orbital Si expresamos el hamiltoniano del movimiento orbital H en variables de Delaunay µ2 H= + Vp , 2L2 las ecuaciones de Hamilton en estas variables serán: d` dt dg dt dh dt = = = µ2 @Vp + , L3 @L @Vp , @G @Vp , @H dL dt dG dt dH dt = = = @Vp , @` @Vp , @g @Vp . @h (12.13) Aplicando la regla de la cadena para expresar las derivadas de Vp respecto de las variables de Delaunay en función de las derivadas de Vp respecto de elementos orbitales se tendrá @Vp @Vp @a @Vp @e @Vp @i @Vp @⌦ @Vp @! @Vp @T = + + + + + , @ @a @ @e @ @i @ @⌦ @ @! @ @T @ donde (12.14) representa una cualquiera de las variables de Delaunay. Llevando (12.14) a (12.13), éstas a (12.12) y sustituyendo las variables de Delaunay por los elementos orbitales se llegará finalmente a las expresiones: da dt de dt di dt d⌦ dt d! dt d` dt = = = = = = 2 @Vp , na @` p 1 e2 @Vp 1 e2 @Vp , na2 e @! na2 e @` 1 @Vp c @Vp p p i , 2 2 2 2 na 1 e si @⌦ na 1 e si @! 1 @Vp p , nap2 1 e2 si @i 1 e2 @Vp c @Vp p i + , na2 e @e na2 1 e2 si @i 2 @Vp 1 e2 @Vp n+ + , na @a na2 e @e (12.15) que son llamadas ecuaciones de Lagrange del movimiento planetario o simplemente ecuaciones de Lagrange y nos dan la variación de los elementos orbitales de la órbita perturbada por un potencial Vp .1 La última ecuación de Lagrange nos da la variación de la anomalı́a media con respecto al tiempo en lugar de la variación de la época de paso por el periastro. 1 En alguna publicación encontraremos las mismas expresiones con signo de V cambiado, p debido a que toman Vp como la función de fuerzas en lugar del potencial. Ecuaciones de Gauss 195 p Esto es ası́ porque teniendo en cuenta la relación ` = µ/a3 (t T ) podemos obtener la variación de T a partir de la de `. Esta relación es más útil pues permite expresar un cambio de variable de t a ` o, a través de ésta, a las anomalı́as verdadera o excéntrica, que será la variable independiente en la que vendrá expresada habitualmente la perturbación. 12.3 Ecuaciones de Gauss Para determinado tipo de perturbaciones y de análisis es mejor la formulación de las ecuaciones usando la fuerza perturbadora en lugar del potencial. Como sabemos, la relación entre ambas vendrá dada por rx Vp = P, (12.16) donde P = P S representa la fuerza expresada en el sistema de referencia espacial. Habitualmente la fuerza perturbadora viene expresada en el sistema de referencia orbital, P U , por medio de las componentes (Pu , Pv , Pn ), o en el de Frenet P F con las componentes (Pt , Ps , Pn ). La relación entre el P y P U viene dada por P = P S = R3 (⌦)R1 (i)R3 (! + f )P U , (12.17) esto es, se obtiene mediante el giro que pasa del sistema espacial al orbital. Combinando (12.16) con (12.17) se obtiene la expresión de rx Vp en función de las componentes de la fuerza en el sistema orbital. Finalmente, las expresiones de las derivadas @Vp /@ , donde sigma representa cualquier elemento orbital, se obtienen aplicando la regla de la cadena a través de la expresión @Vp = rx Vp · x , @ (12.18) @x @y @z donde x = ( , , ) se obtiene derivando, respecto a cada variable orbital @ @ @ , las componentes del vector x x = R3 (⌦)R1 (i)R3 (! + f )r, donde hemos llamado r = (r, 0, 0). (12.19) 196 Movimiento orbital Realizando todo este conjunto de operaciones se llega a las expresiones: @Vp @a @Vp @e @Vp @i @Vp @⌦ @Vp @! @Vp @` = r Pu , a = a cos f Pu r(2 + e cos f ) sen f Pv , 1 e2 = r sen(! + f )Pn , = rci Pv + rsi cos(! + f )Pn , = rPv , (12.20) = ae sen f p Pu 1 e2 a2 (1 p r 1 e2 ) Pv . e2 Finalmente, sustituyendoplos valores de las expresiones (12.20) en las ecuaciones (12.15), y llamando ⌘ = 1 e2 , obtenemos las ecuaciones: da dt de dt di dt d⌦ dt d! dt d` dt = = = = = = 2e sen f 2a⌘ Pu + Pv , n⌘ nr ✓ 3 ◆ ⌘ sen f ⌘ r⌘ Pu + Pv , an e r n a2 e n r cos(! + f ) Pn , a2 n ⌘ r sen(! + f ) Pn , a2 n si ⌘ ⌘ cos f r(2 + e cos f ) sen f r sen(! + f ) ci Pu + Pv + Pn , aen a2 n e ⌘ a 2 n si ⌘ ✓ ◆ 2 r ⌘ 2 cos f r(2 + e cos f ) sen f n+ + Pu Pn . a2 n aen a2 e n (12.21) que son llamadas ecuaciones de Gauss. Observando las ecuaciones de Gauss podemos sacar una serie de conclusiones interesantes del movimiento orbital: El semieje y la excentricidad solo están perturbados por la componente radial y transversal de la fuerza perturbadora. Si esta fuerza es perpendicular al plano orbital el semieje y la excentricidad no varı́an. La inclinación y el ángulo del nodo solo dependen de la componente normal de la fuerza perturbadora. Si esta fuerza está contenida en el plano del movimiento la inclinación y el ángulo del nodo, o lo que es igual el plano orbital, no varı́an. Perturbaciones de corto y largo periodo y seculares 197 Si tenemos en cuenta las relaciones entre (Pu , Pv , Pn ) y (Pt , Ps , Pn ) dadas por P U = R3 ( ) · P F y las llevamos a (12.21) podemos obtener otra versión de las ecuaciones de Gauss en función de las componentes de la fuerza en el sistema de Frenet. 12.4 Perturbaciones de corto y largo periodo y seculares Cuando se analiza el comportamiento del movimiento orbital frente al kepleriano, sea cual sea el tipo de fuerza externa que actúa sobre el orbitador, se observan tres tipos distintos de perturbaciones en el movimiento orbital. Supongamos que queremos analizar la evolución de un elemento orbital, , que en el movimiento kepleriano representa una constante y por tanto viene representado, en la gráfica 12.1, por una lı́nea recta. En el movimiento orbital este parámetro dejará de ser constante y su variación vendrá representada por la función (t) que puede contener términos de tres tipos: Términos de tipo polinómicos en t. Estos términos producen un desplazamiento secular de la gráfica de respecto de su valor kepleriano constante. Términos en seno y coseno de las variables angulares !, ⌦, i. Puesto que el valor de estas variables angulares varı́a muy lentamente estos términos producen una oscilación periódica, de periodo muy grande. Estos términos son llamados de largo periodo. Finalmente aparecen senos y cosenos de la variable ` que tiene el periodo de la órbita. Estos términos producen pequeñas oscilaciones en torno a la combinación de la perturbación secular y de largo periodo, y son llamados de corto periodo. Figura 12.1: Perturbaciones de corto y largo periodo y seculares. Si se precisa la posición y velocidad de un cuerpo en su órbita en una instante dado es preciso obtener las tres perturbaciones. Sin embargo, si únicamente se desea conocer como evolucionará una órbita a largo plazo, sin preocuparnos de la posición instantánea del cuerpo, podemos prescindir de las perturbaciones de corto periodo y analizar únicamente las de largo periodo y seculares. 198 Movimiento orbital Esto enlaza con el concepto, muy usado en Astrodinámica, de elementos osculadores y elementos medios. Los elementos orbitales, que son constantes en el movimiento kepleriano, se convierten en funciones de t en el movimiento orbital. A los elementos orbitales particularizados en un instante dado se les llama elementos osculadores, porque en dicho instante estos elementos definen una órbita kepleriana instantánea, llamada órbita osculatriz, que tiene un punto de contacto con la órbita real, justo en el punto del espacio que ocupa el orbitador en el instante en que se han calculado los elementos orbitales. La órbita osculatriz en cada instante representa perfectamente todas las caracterı́sticas de la órbita real pero únicamente en ese instante. Los elementos medios son los elementos que se obtienen promediando los elementos osculadores en un periodo orbital. Esto supone, en la práctica, eliminar las perturbaciones de corto periodo, lo que nos permite conocer la evolución de largo periodo y secular. La aplicación de las expresiones del movimiento kepleriano a la órbita promediada, formada a partir de los elementos medios, nos da únicamente una aproximación al comportamiento de la órbita real. 12.5 Método de aproximaciones sucesivas Las perturbaciones de los problemas orbitales vienen expresadas habitualmente como un desarrollo en serie de potencias de un pequeño parámetro ✏. Las bases matemáticas del tratamiento asintótico de las teorı́as de perturbaciones están a menudo camufladas por el gran número de variables y de términos de sus expresiones. Un ejemplo muy simple nos servirá para ilustrar, tanto el método clásico de aproximaciones sucesivas, como el concepto de orden de aproximación de una teorı́a. Sea la ecuación diferencial de primer orden dada por ẋ = 2 ✏ t x, x0 = x(t = 0), ✏ ⌧ 1, (12.22) cuya solución general puede expresarse en la forma 2 x = x0 e✏t , (12.23) cuyo desarrollo en serie de potencias en torno a ✏ viene dado por la expresión  X ✏i ✏2 x = x0 t2i = x0 1 + ✏t2 + t4 + . . . . (12.24) i! 2 i 0 Podemos suponer la solución x(t) de la ecuación (12.22) como el resultado de perturbar la ecuación diferencial ẋ = 0, cuya solución es x = x0 , con una pequeña perturbación 2 ✏ t x0 . De esta forma, la solución del problema perturbado será x = x0 + ✏x1 (t) + ✏2 x2 (t) + . . . . (12.25) Perturbaciones de primer orden en el movimiento orbital 199 El método de aproximaciones sucesivas consistirá en calcular sucesivamente, orden a orden, las expresiones de x1 (t), x2 (t), etc. Como primera aproximación a la ecuación diferencial (12.22) usaremos la solución de ésta haciendo ✏ = 0, esto es de ẋ = 0, que integrada nos da x = x0 . Ésta será llamada solución de orden cero o del problema no perturbado, porque en ella no aparece ✏ ni, por lo tanto, el efecto de la perturbación. En el problema orbital la solución de orden cero coincidirá con la del modelo kepleriano. Una solución más aproximada se obtiene tomando como ecuación diferencial el resultado de sustituir la solución de orden cero en la ecuación (12.22), con lo que la ecuación diferencial se transforma en ẋ = 2 ✏ t x0 , o bien, dx = 2 ✏ t x0 dt, cuya integración nos da Z t x x0 = 2 ✏ x0 t dt = ✏ x0 t2 , 0 ⇥ ⇤ o lo que es igual x = x0 1 + ✏ t2 , que es llamada solución de primer orden, pues en ella aparecen términos lineales en ✏. Para aumentar la aproximación, introduzcamos la solución de primer orden en la ecuación original (12.22) lo que nos lleva a la ecuación diferencial que integrada resulta ⇥ ⇤ dx = 2✏x0 1 + ✏ t2 t, dt (12.26)  ✏2 4 t , (12.27) 2 y es llamada solución de orden dos. El proceso puede repetirse hasta obtener la precisión deseada, obteniéndose términos cada vez más pequeños que se aproximan cada vez más a la solución correcta. Como puede verse, la solución de orden n corresponde a truncar el desarrollo en serie (12.24) en el orden n. x0 1 + ✏ t2 + 12.6 Perturbaciones de primer orden en el movimiento orbital En el problema orbital no perturbado el valor de Vp = 0, llevado a las ecuaciones de Lagrange (12.15), nos permite obtener la solución de orden cero, que puede expresarse en elementos orbitales como = 0 , donde usaremos el sı́mbolo para representar uno cualquiera de los seis elementos orbitales y para el vector de elementos orbitales ordinarios = (a, e, i, ⌦, !, T ). El valor de la perturbación Vp no suele venir expresado en función de t sino de la anomalı́a verdadera f o la excéntrica E, por lo que las ecuaciones de Lagrange estarán expresadas en una de las dos formas que siguen: ˙ = ( , f) = ( , E). (12.28) 200 Movimiento orbital La solución de primer orden se obtendrá sustituyendo por 0 en la parte derecha de las ecuaciones de Lagrange e integrando éstas. De esta forma, el sistema de ecuaciones diferenciales puede tratarse como seis ecuaciones diferenciales que pueden integrarse de manera independiente, obteniendo, por separado, la variación de primer orden de cada uno de los elementos orbitales por medio de las ecuaciones ˙ = ( 0, f ) = ( 0 , E). (12.29) Si Vp viene expresada en función de f será necesario sustituir ˙ por d /d f . Para ello, teniendo en cuenta la ley de las áreas r2 f˙ = G, podremos poner d d dt r2 = = ( df dt df G 0, f ) = p2 ( 0, f ) , G (1 + e cos f )2 que integrada nos dará la solución de primer orden 0 = Z p2 G f 0 ( 0, f ) d f. (1 + e cos f )2 (12.30) Si Vp viene expresada en función de E será necesario sustituir ˙ por d /d E. Para ello, teniendo en cuenta la ecuación de Kepler, n t = E e sen E, podremos poner Ė = n/(1 e cos E) = na/r, y por tanto d d dt r = = ( dE dt dE na 0 , E) = 1 ( na 0 , E)(1 e cos E), que integrada nos dará la solución de primer orden 0 1 = na Z E ( 0 , E)(1 e cos E)d E. (12.31) 0 La elección de (12.30) o (12.31) para la integración dependerá de cual de las dos es más fácil de integrar. En general el criterio buscado será que las expresiones trigonométricas aparezcan siempre en el numerador del integrando. Si en las ecuaciones (12.30) y (12.31) tomamos el valor 2⇡ como lı́mite superior de integración lo que obtenemos es la variación de primer orden de cada elemento orbital en un periodo o vuelta de la órbita. Esto es equivalente a promediar sobre la variable ` y por tanto eliminar la dependencia de esta variable. Lo que obtenemos entonces es la variación de largo periodo y secular que nos indicará la evolución a largo plazo de la órbita. 12.7 Propagadores orbitales La variación de primer orden de los elementos orbitales nos da un grado de aproximación mejor que la aproximación kepleriana y puede ser suficiente para Propagadores orbitales 201 determinadas aplicaciones, sin embargo, no lo es cuando se requiere una gran precisión. El objetivo de este libro se aparta de la Mecánica Celeste clásica por lo que no abordaremos el problema del movimiento de planetas y otros astros del sistema solar, de hecho, supondremos que se dispone de un modelo preciso del movimiento del mismo, sin el cual no podremos formular perturbaciones como la del tercer cuerpo o la presión de radiación que veremos en capı́tulos posteriores. Este modelo de sistema solar puede encontrarse2 en las rutinas JPL Planetary and Lunar Ephemerides DE405. Como se verá en capı́tulos posteriores la formulación de las perturbaciones que actúan sobre la órbita de una nave espacial es muy compleja, además, en la mayor parte de los casos, contiene elementos mal modelados o de muy difı́cil cálculo, por ello, una integración de precisión de un problema orbital resulta una ardua tarea. Tradicionalmente existen tres formas de abordar esta integración: los métodos analı́ticos, que en Astrodinámica se llaman a veces métodos generales de perturbaciones; los numéricos, también llamados métodos especiales de perturbaciones; y finalmente los seminuméricos. La existencia de una expresión analı́tica que determine la evolución de un parámetro orbital con respecto al tiempo es la situación óptima para el estudio de un sistema dinámico, sin embargo, esto exige una integración analı́tica de las ecuaciones diferenciales de dicho sistema lo que en la mayor parte de los casos resulta una tarea casi imposible. En el caso de que no se disponga de dicho modelo analı́tico será necesario acudir a un modelo numérico, que partiendo del valor de los parámetros orbitales en el instante inicial, construye la solución, paso a paso en el tiempo, hasta llegar al instante deseado. En el caso de la navegación espacial no es posible encontrar una integración analı́tica para un modelo que considere todas las perturbaciones, sin embargo, si son posibles estas integraciones efectuando ciertas restricciones en los modelos perturbadores con lo que se pierde precisión en el modelo. Estas soluciones son, en ocasiones, un buen compromiso entre eficiencia computacional y precisión y juegan un importante papel en estudios de comportamiento orbital a largo plazo, tiempo de vida de una misión, análisis de determinados tipos de órbitas particulares, etc. Dentro de los métodos analı́ticos más usados tenemos el modelo SGP4, que es el origen de las variables TLE. Esta variables, junto con el método analı́tico al que están asociadas, serán descritas en el siguiente apartado. Los modelos seminuméricos combinan ambas técnicas para aprovechar la precisión de los numéricos y la eficiencia de los analı́ticos. Sea cual sea el método de integración usado, el objetivo final es generar una secuencia de efemérides del orbitador a partir de las condiciones iniciales de un problema orbital. La herramienta que se encargará de construir tal secuencia de efemérides se llama propagador y debe estar formada por una serie de elementos 2 ftp://[email protected]/pub/eph/planets 202 Movimiento orbital que analizaremos en este apartado. Estableceremos cuatro módulos básicos que debe tener un propagador Tratamiento de los sistemas de referencia. Formulación del modelo de fuerzas. Integrador. Análisis de los resultados. La integración del problema se debe realizar en un sistema de referencia inercial, habitualmente elegiremos el sistema SG , sin embargo, muchos de los elementos de las perturbaciones son formulados en otros sistemas, y el análisis de los resultados exige también dichos cambios; por ello es muy importante disponer en el propagador de una herramienta para realizar todos los posibles cambios de referencia vistos en los capı́tulos 3, 4 y 7. En cuanto a la formulación del modelo el propagador debe permitir la elección de distintos modelos de perturbaciones, pero es importante que pueda formular al menos las cuatro perturbaciones más importantes del satélite: potencial terrestre, rozamiento atmosférico, presión de radiación solar y perturbación de un tercer cuerpo. Para la formulación de estos modelos se debe disponer de varios modelos de potencial terrestre o planetario, con la posibilidad de elegir el grado máximo que se tomará en el potencial elegido. El potencial planetario debe ser elegido entre alguno de los posibles modelos que se mencionan en el capı́tulo 15. Finalmente, la formulación del modelo de presión de radiación y la del tercer cuerpo exigen el cálculo de efemérides de cuerpos del sistema solar, bien sea el modelo DE405 del JPL u otro menos preciso. En cuanto al integrador podemos elegir entre una serie de métodos numéricos, aunque hay que conocer las caracterı́sticas de cada método para aplicar el más indicado al problema. Finalmente se debe disponer de una serie de herramientas para el análisis de los resultados, entre ellas, todas las relaciones del movimiento kepleriano, el cálculo de eclipses, las trayectorias del satélite sobre la superficie terrestre o traza, etc. La construcción de un propagador orbital es una compleja tarea que excede las posibilidades de la mayor parte de los usuarios que necesiten utilizarlos. Afortunadamente existe un buen número de propagadores, tanto profesionales como software libre. Entre los profesionales señalaremos únicamente uno de los más usados y conocidos: el propagador comercial STK3 de Analytical Graphics Inc’s. Este software, del que existe una versión de prueba gratuita, consta además de un potente entorno gráfico donde analizar y formular cualquier aspecto de una misión espacial con una serie de herramientas matemáticas muy sofisticadas. 3 STK: http://www.agi.com Propagador SGP4/SDP4 y variables TLE 203 Entre los propagadores de libre distribución nos encontramos dos tipos diferentes: los que tienen un entorno gráfico tipo STK y las librerı́as de software. Entre los que poseen un entorno gráfico destacaremos el software GMAT4 , que está siendo desarrollado por la NASA. A fecha de agosto de 2012 dispone de una versión beta, pero casi completamente operativa, para Windows y de las fuentes en C++ para el resto de los sistemas operativos. Como librerı́as de software mencionaremos tres: una escrita en lenguaje C++, llamada GAL5 (General Astrodynamics Library), y otras dos escritas en lenguaje JAVA, por un lado JAT6 (Java Astrodynamics Toolkit) y por otro OREKIT 7 (ORbits Extrapolation KIT). En todos los casos se trata de librerı́as de bajo nivel, que incorporan métodos muy precisos y modernos, pero cuyo uso entraña cierta dificultad. Para estudios más simples, que no requieran de los complicados desarrollos realizados por un propagador, resulta útil disponer de herramientas menos complicadas integradas en entornos de desarrollo de tipo matemático como Matlab o Mathematica. Estas herramientas suelen ser más sencillas de usar y proporcionan mejores y más rápidos resultados en el análisis de aspectos concretos de una misión espacial. Integrado en Matlab podemos mencionar ODTBX8 (Orbit Determination Toolbox) desarrollado por la NASA. El paquete Orbits9 , integrado en Mathematica, está siendo actualmente desarrollado por varios miembros del Grupo de Mecánica Espacial de la Universidad de Zaragoza y aparecerá próximamente en la página web del grupo señalada al pie de página. 12.8 Propagador SGP4/SDP4 y variables TLE No todo usuario que deba realizar un seguimiento de un satélite artificial dispone de un buen propagador ni de los datos del vector de estado inicial necesarios para propagar la órbita. La solución en este caso consiste en usar el propagador analı́tico SGP4/SDP4, cuyas rutinas, de libre distribución, están escritas en FORTRAN aunque hay versiones en C y C++, y obtener los datos de dicho satélite en el formato TLE, elementos de dos lı́neas, catalogados, actualizados y distribuidos10 junto con el software, por el NORAD (North American Aerospace Defense Command). En el año 1966 se desarrolló el modelo SGP, Simplified General Perturbations, basado en una simplificación de la teorı́a de Kozai, que considera el efecto del rozamiento atmosférico. Este modelo parte de un conjunto de constantes que 4 GMAT: http://gmat.gsfc.nasa.gov http://www.amsat-bda.org/GAL Home.html 6 JAT: http://jat.sourceforge.net 7 OREKIT:https://www.orekit.org 8 ODTBX: http://opensource.gsfc.nasa.gov/projects/ODTBX 9 Orbits: http://gme.unizar.es/software/orbits 10 http://celestrak.com/ 5 GAL: 204 Movimiento orbital representan, entre otros parámetros, unos valores medios de los elementos orbitales a partir de los cuales se realiza la propagación. Estos elementos reciben el nombre de elementos de dos lı́neas, TLE, y serán descritos más adelante. Posteriormente, hacia 1970, se crea un segundo modelo que efectúa una simplificación de la teorı́a de Brouwer. Este modelo, llamado SGP4 es distinto y más preciso que el anterior, aunque sus constantes se adaptan a la definición de los TLE para hacerlos compatibles. Esto será cierto para todos los modelos posteriores. El siguiente modelo SDP4 es una adaptación del modelo SGP4 a satélites de periodo mayor o igual que 225 minutos, lo que corresponde a una altitud de unos 6000 km. El modelo SDP4 añade la perturbación Luni-Solar y algunos armónicos del potencial terrestre que afectan a órbitas de periodo igual a medio dı́a o un dı́a. Finalmente, en 1980, se crearon los modelos SGP8/SDP8 que incluye otros modelos de atmósfera y efectúa la integración de una manera distinta. Los modelos SGP4/SDP4 son los más usados y aseguran una probabilidad del 90 % de que el satélite se encuentre a una distancia menor de 5 km de la posición calculada si los elementos TLE del satélite están suficientemente actualizados. Sin embargo, cuando los TLE son antiguos la órbita se degrada mucho y no es fiable. La actualización de los TLE de los satélites debe ser muy frecuente cuando el satélite es de órbita baja y obligatoria cuando se realiza alguna maniobra que lo cambie de órbita. Los elementos obtenidos al propagar una órbita a partir de los elementos TLE por medio de el modelo SGP4/SDP4 se suponen referidos a un sistema de referencia centrado en la Tierra y que tiene el ecuador verdadero de la fecha como plano fundamental y el equinoccio medio como eje Ox. Este sistema coincide 0 con el sistema E m definido en el capı́tulo 4. Los elementos TLE sirven de elementos iniciales para el cálculo de los elementos osculadores de la órbita de un satélite artificial en un instante dado. Estos elementos vienen dados con el siguiente formato: AAAAAAAAAAAAAAAAAAAAAAAA 1 NNNNNA NNNNNAAA NNNNN.NNNNNNNN +.NNNNNNNN +NNNNN-N +NNNNN-N N NNNNN 2 NNNNN NNN.NNNN NNN.NNNN NNNNNNN NNN.NNNN NNN.NNNN NN.NNNNNNNNNNNNNN donde A representa cualquier carácter y N un dı́gito. Este formato proviene de las lı́neas de 80 caracteres de los sistemas de entradasalida, basados en fichas perforadas, de los antiguos ordenadores y es un formato de tres lı́neas en lugar de las dos que anuncia su nombre. La primera lı́nea, llamada lı́nea 0 es un nombre de 24 caracteres consistente con la longitud de los nombres del catálogo de satélites del NORAD. Los elementos de la lı́nea uno se describen a continuación, dando en primer lugar el número de columna y después la descripción: 01 Número de la lı́nea. Propagador SGP4/SDP4 y variables TLE 205 03-07 Número del satélite. 08 Clasificación: S significa secreto o clasificado, U significa no clasificado. 10-11 Dos últimos dı́gitos del año de lanzamiento. 12-14 Número de orden del lanzamiento en el año. 15-17 Pieza del lanzamiento. 19-20 Dos últimos dı́gitos del año. 21-32 Dı́a del año y fracción. 34-43 Primera derivada del movimiento medio ṅ. Tanto este campo como el siguiente utilizan una notación decimal especial. Los primeros campos son la mantisa sin el punto decimal, los dos últimos el exponente, ası́ -12345-6 representa 0.12345 ⇥ 10 6 . 45-52 Segunda derivada del movimiento medio n̈. Suele ponerse igual a cero. 54-61 Término balı́stico modificado. 63 Número de veces que han sido actualizados estos elementos. 65-69 Números de control. Los elementos de la lı́nea 2 son 01 Número de la lı́nea. 03-07 Número del satélite. 09-16 Inclinación, i, en grados. 18-25 Angulo del Nodo, ⌦, en grados. 27-33 Excentricidad, e. No se pone el punto decimal al principio. 35-42 Argumento del perigeo, !, en grados. 44-51 Anomalı́a media, `, en grados. 53-63 Movimiento medio, n en revoluciones por dı́a. 64-68 Número de vueltas en la época. 69 Números de control. Hay que recordar que estos elementos son elementos medios, no osculadores, esto es, no podemos obtener directamente, a partir de ellos, el vector de estado en un instante. Para hacer esto es necesario obtener antes los elementos osculadores aplicando el modelo SGP4/SDP4. El cálculo de los elementos TLE a partir de los elementos osculadores requiere un proceso numérico que no va a ser desarrollado en este libro. 206 Movimiento orbital Capı́tulo 13 Problema de n cuerpos 13.1 Formulación del problema de n cuerpos La ley de atracción gravitacional de Newton puede formularse de la siguiente manera: “La atracción mutua ejercida entre si por dos puntos materiales P1 , P2 , de masas respectivas m1 , m2 , es directamente proporcional al producto de las masas e inversamente proporcional al cuadrado de la distancia r entre los dos cuerpos”. La constante de proporcionalidad G es llamada constante de gravitación universal. La ley anterior es la base de todo el estudio de los movimientos orbitales, tanto en el sistema solar como fuera de él, pues determina también la dinámica de los sistemas estelares múltiples. Si pensamos en el sistema solar y prescindimos, por el momento, del hecho de que todos los cuerpos del mismo son sólidos (rı́gidos o no), la forma más general de modelar el movimiento de estos cuerpos es a través del llamado problema de n cuerpos, que consiste en el estudio de n puntos materiales atraı́dos entre si por la ley de atracción gravitacional enunciada por Newton. Si llamamos Pi , i = 1, . . . n, a los n puntos, mi a sus masas y r i = OPi a sus vectores de posición referidos a un sistema de referencia ortogonal directo e inercial, las ecuaciones del movimiento de cada uno de esos puntos podrá formularse como n X mi mk mi r̈ i = G r ik , i = 1, . . . n, (13.1) 3 rik k=1(k6=i) donde hemos llamado r ik = r k r i y rik = k r ik k. 208 Problema de n cuerpos La integración algebraica de este problema de orden 6 n resulta imposible, en la práctica, cuando n > 2. Como veremos a continuación podremos encontrar 10 integrales del mismo de manera sencilla, pero ya en el caso n = 3 las dos integrales que resuelvan completamente el problema solo pueden obtenerse en algunos casos particulares. Pj r ij rj Pi O ri Afortunadamente, en la mayor parte de los problemas reales, la magnitud de las masas y las distancias mutuas entre los distintos puntos es Figura 13.1: Posiciones relativas de dos puntos en el problema de n cuerpos. tal que permite tomar el modelo más simple de dos cuerpos, el astro del que estudiamos la órbita y el principal que será el Sol o la Tierra, y considerar la acción del resto de los astros como una pequeña perturbación a este modelo. No es nuestro propósito efectuar un estudio riguroso del problema de n cuerpos que puede verse en muchos tratados de Mecánica Celeste, sin embargo, obtendremos ahora las 10 integrales anunciadas anteriormente por su importante significado astronómico. En primer lugar, si sumamos las n ecuaciones (13.1), obtendremos n X mi r̈ i = 0, i=0 que tras una doble integración nos lleva a la condición n X mi r i = At + B, (13.2) i=0 donde A, B representan 6 constantes de integración, llamadas integrales del centro de masas, que indican que el movimiento del centro de masas del sistema formado por los n puntos es rectilı́neo y uniforme. Desde el punto de vista práctico, suponiendo que el sistema solar está aislado, esto nos indica un movimiento en lı́nea recta y con velocidad constante para todo el sistema solar en su conjunto, mientras que, a su vez, todos los cuerpos del mismo se mueven alrededor del centro de masas. Pensemos que, debido a la gran masa del Sol, el centro de masas del sistema solar está en el interior del mismo, por lo que tendrá bastante sentido considerar el Sol como origen y estudiar el movimiento de todos los astros en torno al Sol. Por otro lado, multiplicando vectorialmente cada una de las ecuaciones (13.1) por r i y teniendo en cuenta las propiedades del sumatorio extendido a dos ı́ndices Modelo planetario 209 tendremos n X i=0 mi r i ⇥ r¨i = G X X mi mk i lo que permite poner k 3 rik n X i=0 r i ⇥ r ik = G X X mi mk i k 3 rik r i ⇥ r k = 0, mi r i ⇥ r˙i = G, (13.3) donde G representa el momento angular del sistema que resulta ser constante. De esta forma tenemos 3 nuevas integrales del problema de n cuerpos. La última integral del problema es la integral de la energı́a. 13.2 Modelo planetario Teniendo en cuenta la gran masa del Sol, comparada con la de cualquier planeta, las ecuaciones del movimiento de cada planeta podrán formularse de forma similar a las ecuaciones del movimiento kepleriano, con unos términos adicionales que constituyen una perturbación a este modelo debida al resto de planetas. Para ello, volvamos a las ecuaciones (13.1) y formulemos, a partir de ellas, las del movimiento relativo, esto es, las ecuaciones que rigen la variación de los vectores r ij . Para ello basta considerar r̈ ij = r̈ j r̈ i , (13.4) que da lugar a la expresión r̈ ij = X r ij G(mi + mj ) 3 + G mk rij k6=i,j r jk 3 rjk r ik 3 rik ! . (13.5) Supondremos ahora el modelo extendido a n + 1 puntos i = 0, 1, . . . n de forma que la masa de P0 sea muy grande en relación con las demás m0 mi , i = 1, . . . , n, lo cual resulta cierto en el caso del Sol y el sistema solar. Si llamamos ahora xi = P0 Pi = r 0n , ri = k xi k, lo que en la práctica equivale a tomar P0 como origen, podremos poner las ecuaciones del movimiento anteriores como ✓ ◆ X xi xk xi xk ẍi + µi 3 = G mk , (13.6) ri k xk xi k3 k xk k3 k6=i,n donde µi = G(m0 + mi ). Nótese que el término de la izquierda de estas ecuaciones es idéntico al de las ecuaciones (7.23), mientras que el de la derecha no es cero, sino que es proporcional 210 Problema de n cuerpos a la masa de cada uno de los otros cuerpos, por lo que tendrá un valor pequeño en módulo. Al considerar esta aproximación en el sistema solar podremos suponer todos los valores µi = Gm0 , lo que supone en la práctica despreciar la masa de los planetas frente a la del Sol. La perturbación que cada punto Pk ejerce sobre la órbita de Pi respecto a P0 viene dada por dos sumandos. El primero depende de la posición de Pi y por ello se llama atracción o perturbación directa, mientras que el segundo no depende de la posición de Pi y es llamado atracción o perturbación indirecta. 13.3 Perturbación luni-solar del satélite artificial Cuando se considera el problema del movimiento de un satélite artificial en torno a la Tierra, la aproximación kepleriana consistente en tomar la Tierra y el satélite como puntos aislados puede resultar insuficiente si se tiene en cuenta que tanto el Sol como la Luna están perturbando este modelo. Para estudiar esta perturbación se tiene en cuenta que la combinación de masa y distancia, tanto de la Luna como del Sol, permiten una formulación basada en el modelo planetario, tomando La Tierra como cuerpo central y el satélite como orbitador y considerando que la Luna y el Sol perturban este movimiento actuando como un tercer cuerpo en el modelo planetario. Llamando x a la posición de un satélite respecto de la Tierra y escribiendo el subı́ndice k para expresar un tercer cuerpo que perturba este movimiento, podremos poner ✓ ◆ x xk x xk ẍ + µ 3 = Gmk = Pk. (13.7) r k xk x k3 k xk k3 Este modelo permitirá estudiar, tanto el efecto producido por el Sol en la órbita de la Luna en torno a la Tierra, como la perturbación que el Sol y la Luna producen en la órbita de un satélite artificial. Dada la función escalar Vk = Gmk ✓ 1 k xk xk x · xk k xk k3 ◆ , podemos comprobar, por simple derivación, que su gradiente respecto a x podrá ponerse en la forma P k = rx Vk , lo que permitirá decir que la función hamiltoniana del problema del movimiento orbital, perturbado por un tercer cuerpo, puede expresarse como ✓ ◆ 1 µ 1 x · xk H = H0 + Vk = X · X Gmk , (13.8) 2 kxk k xk x k k xk k3 donde H0 es el hamiltoniano del problema no perturbado o kepleriano y Vk el potencial perturbador. Problema de tres cuerpos 13.4 211 Problema de tres cuerpos Si en lugar de n se consideran únicamente tres masas puntuales se tiene el llamado problema general de tres cuerpos. Ası́ como el problema de dos cuerpos es un problema integrable, el tercer cuerpo añade a la dinámica del sistema una enorme complejidad que lo hace no integrable salvo en unos pocos casos particulares. Sin embargo, éste es el sistema que debe considerarse cuando se piensa en el movimiento de una nave espacial en el interior del sistema Tierra-Luna, o por ejemplo el movimiento de un asteroide o cometa próximo a Júpiter, lo que obliga a considerar el sistema Sol-Júpiter-Asteroide. Si particularizamos para tres cuerpos las ecuaciones del movimiento relativo de n cuerpos dadas por (13.5) tendremos: r 12 3 + Gm3 r12 = G(m1 + m2 ) r̈ 13 = r 13 G(m1 + m3 ) 3 + Gm2 r13 r̈ 23 = G(m2 + m3 ) r̈ 12 r 23 3 + Gm1 r23 ✓ ✓ ✓ r 23 3 r23 r 13 3 r13 r 32 3 r32 r 12 3 r12 r 31 3 r31 r 21 3 r21 ◆ ◆ ◆ , (13.9) , (13.10) . (13.11) El movimiento de P3 en torno a P1 y P2 viene representado por las ecuaciones (13.10) y (13.11) respectivamente, pero en ocasiones suele expresarse éste con respecto al centro de masas C del sistema formado por los primarios P1 y P2 . Si llamamos r = CP3 al vector de posición de P3 respecto a C y tenemos en cuenta que CP3 = CP1 + P1 P3 , que CP1 = OP1 OC y que P1 P3 = r 13 , OP1 = r 1 y OC = (m1 r 1 + m2 r 2 )/(m1 + m2 ), podremos poner finalmente r = r 13 m2 r 12 , m1 + m2 que derivada dos veces y junto con (13.10) y(13.9) permite poner r̈ = 13.4.1 G(m1 + m3 ) r 13 3 r13 Gm2 r 23 3 r23 G m2 m3 m1 + m2 ✓ r 23 3 r23 r 13 3 r13 ◆ . (13.12) Problema restringido La complejidad del problema general de tres cuerpos se reduce notablemente si aplicamos una caracterı́stica que se presenta en muchos problemas: la masa del tercer cuerpo es despreciable frente a la de los otros dos que son llamados primarios. Esto es cierto, por ejemplo, en el caso de los Asteroides cuando se comparan con el Sol y Júpiter y lo es también para cualquier nave espacial en el sistema Tierra-Luna. 212 Problema de n cuerpos Supondremos, por tanto, que el punto P3 tiene masa despreciable frente a la de P1 y P2 , es decir supondremos que m3 = 0 con lo que la ecuación (13.9) se transforma en r 12 r̈ 12 = G(m1 + m2 ) 3 , (13.13) r12 que nos indica que P3 no modifica el movimiento de los primarios, P1 , P2 , que se rigen por las ecuaciones del problema de los dos cuerpos, esto es, presentan un movimiento kepleriano. La propiedad anterior reduce el problema restringido al estudio del movimiento de P3 . Para ello usaremos las ecuaciones (13.10) o (13.11) que particularizadas para m3 = 0 se transforman en ✓ ◆ r 13 r 23 r 12 r̈ 13 = Gm1 3 Gm2 , (13.14) 3 + r3 r13 r23 12 ✓ ◆ r 23 r 13 r 12 r̈ 23 = Gm2 3 Gm1 , (13.15) 3 3 r23 r13 r12 o bien, la ecuación de P3 respecto al centro de masas C de P1 y P2 , que vendrá dada por la ecuación (13.12) que, particularizada para m3 = 0, será r̈ = 13.4.2 Gm1 r 13 3 r13 Gm2 r 23 3 . r23 (13.16) Problema restringido circular Para realizar un análisis cualitativo de este problema resulta conveniente restringir un poco más las condiciones del mismo, teniendo en cuenta que las conclusiones del análisis que realicemos se podrán extender a problemas más generales. En este caso, supondremos que la órbita de los primarios es una órbita circular que se encuentra el el plano fundamental (Oxy) del sistema inercial. Tomaremos el radio de la órbita de los primarios como unidad de longitud y elegiremos una unidad de tiempo en la que el periodo de los primarios sea 2⇡ o, lo que es igual, su movimiento medio o velocidad angular n = 1. De esta forma, el ángulo que forma el eje de los primarios con el eje Ox del sistema inercial será igual al ángulo n t, es decir al tiempo t. Por último, la suma de las masas de los primarios será tomada como unidad de masa m1 + m2 = 1, lo que nos permite definir un nuevo parámetro ⌘ = m2 , que transforma el valor de la masa de P1 en m1 = 1 ⌘. En estas condiciones podemos cambiar el sistema de referencia para pasar al sistema sinódico que es un sistema basado en la órbita de los primarios, en el que el plano Oxy coincide con el plano de la órbita, el eje Ox es la dirección de la recta que une P1 con P2 y el origen coincide con su centro de masas. El paso a Problema de tres cuerpos 213 este sistema se pondrá representar a partir de la matriz de rotación R3 (t) en la forma r = R3 (t)⇣, r 13 = R3 (t)⇣ 1 , r 23 = R3 (t)⇣ 2 , (13.17) donde ⇣ = (x, y, z) representa el vector de posición de P3 respecto al centro de masas de los primarios en el sistema de referencia sinódico. El vector ⇣ i representa el vector que une Pi con P3 expresado también en el sistema sinódico. En este sistema, y con las unidades establecidas, se tendrá CP 1 = ( ⌘, 0, 0), CP 2 = (1 ⌘, 0, 0) y CP 3 = ⇣ = (x, y, z), por lo que ⇣ 1 = (x + ⌘, y, z), ⇣ 2 = (x + ⌘ 1, y, z). (13.18) Por otro lado, derivando r = R3 (t)⇣ y agrupando la expresión se puede demostrar que 0 1 ẍ 2ẏ x r̈ = R3 (t) @ ÿ + 2ẋ y A . (13.19) z̈ Finalmente, si llevamos (13.17), (13.18) y (13.19) a (13.16) e igualamos componente a componente podremos poner: x+⌘ x+⌘ 1 ẍ 2ẏ x = (1 ⌘) 2 ⌘ , r1 r22 y y ÿ + 2ẋ y = (1 ⌘) 2 ⌘ 2 , (13.20) r1 r2 z z z̈ = (1 ⌘) 2 ⌘ 2 , r1 r2 donde r12 = (x + ⌘)2 + y 2 + z 2 , r22 = (x + ⌘ 13.4.3 1)2 + y 2 + z 2 . Puntos de Lagrange En todo sistema dinámico el conocimiento de las soluciones de equilibrio resulta de gran interés para el estudio cualitativo global del sistema. En el problema restringido de tres cuerpos existen cinco soluciones de equilibrio, los puntos de Lagrange, que se pueden extender al problema general de tres cuerpos, y que tienen una gran importancia desde el punto de vista de la Astrodinámica. Un punto de equilibrio es un punto en el que un cuerpo situado con una velocidad inicial nula se mantiene indefinidamente en esa posición. Para encontrar los puntos de equilibrio basta tener en cuenta que estos verificarán: x = x0 , y = y0 , z = z0 por lo que se tendrá ẋ = ẏ = ż = 0, ẍ = ÿ = z̈ = 0, condiciones que llevadas a (13.20) nos dan x+⌘ x+⌘ ⌘ 3 r1 r23 y y y (1 ⌘) 3 ⌘ 3 r1 r2 z z (1 ⌘) 3 ⌘ 3 r1 r2 x (1 ⌘) 1 = 0, = 0, = 0. (13.21) 214 Problema de n cuerpos De la última de las ecuaciones anteriores se deduce que z = 0, luego las soluciones de equilibrio deben estar en el plano del movimiento de los primarios. La segunda ecuación se cumplirá si se verifica 1 (1 ⌘) 1 r13 ⌘ 1 = 0. r23 para lo cual basta que r1 = r2 = 1, en cuyo caso se cumple también la primera. Existen dos puntos que cumplen esta condición, junto con z = 0 y son los dos puntos del plano de los primarios que forman con ellos un triángulo equilátero. Estos son los llamados puntos L4 y L5 de Lagrange. Si los puntos no forman un triángulo equilátero la única forma de verificarse la segunda condición será con y = 0 que, junto con z = 0, indica que las soluciones de equilibrio restantes deben estar en el eje de los primarios. Si hacemos y = z = 0 se tendrá r1 = |x + ⌘|, r2 = |x + ⌘ primera ecuación (13.21) se escribirá como x (1 ⌘) x+⌘ |x + ⌘|3 ⌘ x+⌘ |x + ⌘ 1| por lo que la 1 = 0, 1|3 (13.22) ecuación que representa un polinomio de grado tres cuyas tres soluciones, para un valor concreto de ⌘, representan los tres puntos de equilibrio colineales que son llamados puntos L1 , L2 y L3 de Lagrange. L3 L1 P1 L2 P2 Figura 13.2: Posiciones relativas de L1 , L2 , L3 para distintos valores de ⌘. La figura 13.2 representa, para los distintos valores de ⌘ entre 0 y 1 (eje vertical), las posiciones relativas de los tres puntos de equilibrio. Siempre hay un punto entre P1 y P2 que es llamado L1 y que está más próximo al menos masivo de los primarios. Los otros dos puntos se encuentran detrás de cada primario, y más próximo a éste cuanto menor sea su masa. Problema de tres cuerpos L5 L3 P1 L 1 P2 L 2 L4 Figura 13.3: Puntos de Lagrange en el problema de tres cuerpos. 215 La masa de la Luna es aproximadamente 81 veces menor que la de la Tierra, lo que nos da un valor, para el sistema Tierra-Luna, de ⌘ = 0.0123. El punto L1 se encuentra entre la Tierra y la Luna a un distancia de la Tierra igual 0.836182 si se toma como unidad la distancia Tierra-Luna. Si tomamos una distancia media de 384400 km, el punto L1 está a 321094 km de la Tierra y 62906 km de la Luna. El punto L2 se encuentra detrás de la Luna a una distancia de unos 60002 km de ésta. En la figura 13.3 se representan los cinco puntos de Lagrange para un sistema en el que la masa de P2 es menor que la de P1 . Los puntos triangulares del sistema Sol-Júpiter son llamados también puntos troyanos porque en sus proximidades se han encontrado una serie de pequeños asteroides, llamados también troyanos, con un peculiar movimiento asociado a dichos puntos y a la dinámica del problema de tres cuerpos. En efecto, las órbitas pasan por las proximidades de L4 y comienzan un viaje que les lleva por detrás de L3 hasta llegar a las proximidades de L5 . Este punto se rodea y comienza un nuevo viaje que pasa entre L3 y P1 pero más próximo al primero hasta que llega de nuevo a L4 rodeándolo y comienza de nuevo este ciclo. Figura 13.4: Órbitas en herradura. Este tipo de órbitas, de las que podemos observar un ejemplo en la figura 13.4, son llamadas órbitas en herradura y dan idea de la complejidad que puede llegar a tener la dinámica de tres cuerpos. Además de los ejemplos de órbitas naturales próximas, o relativas, a puntos de equilibrio, como las de los asteroides troyanos, podemos beneficiarnos de ellos para construir cierto tipo de órbitas muy útiles desde el punto de vista de la navegación espacial. Por ejemplo, las propiedades de un punto de Lagrange de equilibrio estable, permitirı́a situar en sus proximidades una estación espacial cuyo 216 Problema de n cuerpos mantenimiento en órbita serı́a muy barato. Otro ejemplo lo contituyen un tipo de órbitas periódicas, llamadas órbitas halo, alrededor del punto L2 del sistema Tierra–Luna, por detrás de ésta, de gran importancia para las comunicaciones con futuras bases espaciales fijas situadas en la cara oculta de la Luna. 13.4.4 Curvas de velocidad cero Si definimos la función ⌦= 1 2 1 ⌘ ⌘ (x + y 2 ) + + , 2 r1 r2 (13.23) las ecuaciones (13.20) podrán ponerse como ẍ 2ẏ x = ÿ + 2ẋ y = z̈ + z = @⌦ , @x @⌦ , @y @⌦ . @z (13.24) Por otro lado, derivando el cuadrado de la velocidad se tendrá dv 2 d = (ẋ2 + ẏ 2 + ż 2 ) = 2ẍẋ + 2ÿ ẏ + 2z̈ ż. dt dt Si en esta expresión sustituimos ẍ, ÿ, z̈ por sus valores obtenidos de (13.24) y aplicamos la regla de la cadena, llegaremos a la relación diferencial dv 2 d⌦ =2 , dt dt que integrada da v 2 = 2⌦ + J, (13.25) siendo J una constante que llamaremos constante de Jacobi. El valor de la constante de Jacobi, que se determina a partir de las Figura 13.5: Curvas de nivel de ⌦(x, y). condiciones iniciales, condicionará el movimiento del punto. En efecto, dado un valor de la constante de Jacobi Jo , la ecuación 2⌦(x, y) + Jo = 0, (13.26) Problema de tres cuerpos 217 1 2 3 4 5 6 7 8 9 Figura 13.6: Evolución de las regiones del movimiento en el problema restringido circular de tres cuerpos para distintos valores de la integral de Jacobi. determina una curva en el plano Oxy que delimita dos regiones del plano. Dichas regiones corresponden a las zonas donde se verifica respectivamente 2⌦(x, y) < Jo y 2⌦(x, y) > Jo . La condición (13.25) que debe cumplir el cuerpo en su movimiento obliga a que 2⌦(x, y) > Jo , pues el cuadrado de la velocidad no puede ser negativo. Por este motivo a esta curva se le llama curva de velocidad cero. La figura (13.5) muestra el conjunto de curvas de nivel de la función ⌦(x, y). La figura (13.6) representa nueve valores distintos de la constante de Jacobi y las curvas de velocidad en cada uno de los casos. En todos ello el área oscura representa la región donde el movimiento es posible, mientras que en el área blanca el movimiento es imposible. Podemos establecer las siguientes condiciones relativas a cada uno de los nueve 218 Problema de n cuerpos casos: 1. En el primer caso el movimiento es posible en una zona externa y dos zonas interiores, casi circulares, alrededor de los dos cuerpos primarios. Las zonas internas son mayores cuanto más masivo sea el correspondiente primario. Con este valor de la constante de Jacobi un cuerpo no puede viajar de un primario a otro. Un cuerpo en el exterior no puede acercarse a los primarios. Los cinco puntos de Lagrange se encuentran en la zona prohibida. 2. Para un determinado valor de J0 las dos zonas alrededor de los primarios, que cada vez son menos circulares, se unen en un punto de contacto que corresponde al punto L1 . La zona externa va acercándose a los primarios. 3. Se abre un camino que permite el viaje entre los dos primarios, pero siempre pasando muy próximos a L1 . Obsérvese que en la zona próxima al punto L2 se va haciendo cada vez más estrecha la zona prohibida. 4. La zona exterior y las interiores se unen en el punto L2 . 5. Se abre un camino que conecta el exterior con el interior a través de L2 . Un cuerpo puede salir al exterior del sistema desde P1 pero pasando primero cerca de L1 y luego cerca de L2 . 6. La zona prohibida es una banda cada vez más estrecha que contiene los puntos L3 , L4 y L5 . La curva se va estrechando cerca de L3 . En estas condiciones son posibles las órbitas en herradura pero sin llegar a entrar la partı́cula en la zona prohibida. 7. Las paredes de la zona prohibida se unen en L3 . 8. La zona prohibida, que hasta este momento era única se convierte en dos regiones, cada una de las cuales contiene a uno de los puntos triangulares. Son posibles órbitas que rodeen al punto triangular por el exterior de la zona prohibida. 9. La zona prohibida se hace cada vez más pequeña. Los puntos triangulares siempre están en el interior de estas zonas. Capı́tulo 14 Atracción de sólidos 14.1 Introducción Otra aproximación en el modelo orbital consiste en considerar sólidos rı́gidos en lugar de puntos materiales, donde la atracción gravitacional ejercida por el sólido se extiende a cada fracción infinitesimal del mismo, considerada ésta como un punto material. El problema más general es el problema de n sólidos, que extiende el de n cuerpos. Sin embargo, si el último ya era imposible de estudiar de forma general mucho más lo será el primero. Podemos disminuir la complejidad del problema tomando n = 2, esto es, considerando el problema de dos sólidos. Esta simplificación sigue siendo igualmente difı́cil de abordar con carácter general, por lo que finalmente reduciremos el problema a su forma más simple, esto es, estudiaremos la atracción gravitacional entre un sólido y un punto material. Esto dará lugar a dos problemas diferentes según que estudiemos el movimiento del sólido o el del punto. El movimiento de un sólido atraı́do gravitacionalmente por un punto material, que no va a ser considerado en el presente libro, permite estudiar, mediante complejos métodos de perturbaciones, el movimiento orbital y rotacional del sólido de forma simultánea. Con él podremos analizar, entre otros, el problema de la rotación de los satélites artificiales, de particular importancia cuando éstos deben estar siempre dirigidos en una cierta dirección del espacio, como es el caso de los satélites con paneles para la recepción de energı́a solar. Otro importante problema que se estudia con este modelo es el de la rotación terrestre, que da lugar a los modelos de precesión y nutación descritos en la primera parte del libro. 220 Atracción de sólidos El problema que estudiaremos con algo más de detalle, por sus implicaciones en el movimiento orbital de satélites artificiales, es el del movimiento orbital de un punto atraı́do por un sólido. Este será el caso de cualquier satélite orbitando en torno a un planeta o cuerpo celeste. 14.2 Polinomios de Legendre La principal herramienta para el desarrollo del potencial del sólido son los polinomios de Legendre, que representan un conjunto de polinomios ortogonales1 . Llamaremos polinomio de Legendre de grado n al polinomio definido por la siguiente expresión 1 dn 2 Pn (t) = n (t 1)n . (14.1) 2 n! dtn De esta forma, los tres primeros polinomios de Legendre serán 1 P0 (t) = 1, P1 (t) = t, P2 (t) = (3t2 1). (14.2) 2 El resto pueden obtenerse por medio de la definición (14.1) o bien por la relación siguiente (n + 1) Pn+1 (t) (2n + 1) t Pn (t) + n Pn 1 (t) = 0, que permite, de forma iterativa, obtener el polinomio de cualquier grado en función, exclusivamente, de los dos primeros: P0 (t) y P1 (t). Resultan también de gran interés los polinomios asociados de Legendre 2 Pnm (t), de grado n y orden m, que se definen a partir de las derivadas, Qnm (t), de los polinomios de Legendre en la forma: dm Pn (t). (14.3) dtm La definición anterior permite encontrar otra relación entre los polinomios de Legendre y los polinomios asociados t2 )(m/2) Qnm (t), Pnm (t) = (1 Qnm (t) = Pn (t) = Pn0 (t) = Qn0 (t). (14.4) Para evaluar los polinomios asociados podremos usar las tres relaciones siguientes p Pmm (t) = (2m 1) 1 t2 Pm 1,m 1 , Pm+1,m (t) = Pnm = 1 Un (2m + 1) t Pmm (t), 1 n m ((2n 1) t Pn 1,m (t) (n + m 1) Pn 2,m (t)) . (14.5) estudio detallado de estos polinomios y de sus propiedades fundamentales puede encontrarse en cualquier libro de polinomios ortogonales. 2 En muchas ocasiones, por ejemplo en el software Mathematica, se definen como polinomios asociados de Legendre los polinomios Pnm (t) cuya relación con los usados en este libro viene dada por Pnm (t) = ( 1)m Pnm (t). Polinomios de Legendre 221 que permiten, de forma iterativa, obtener el polinomio de cualquier grado y orden en función, exclusivamente, del polinomio P00 (t) = 1. Teniendo en cuenta la relación entre Pnm y Qnm obtendremos las relaciones entre los polinomios Qnm que resultan, salvo la primera, idénticas a las anteriores Qmm (t) = (2m 1) Qm Qm+1,m (t) = (2m + 1) t Qmm (t), Qnm = 1 n m ((2n 1,m 1 , 1) t Qn 1,m (t) (n + m 1) Qn 2,m (t)) . (14.6) Estas relaciones permiten también la iteración a partir del valor Q00 (t) = 1. En la expresión del potencial de un planeta, que se desa50 rrollará más adelante, aparecen los polinomios Pnm evaluados en puntos del intervalo [ 1, 1]. Pa30 ra valores grandes del grado n los valores de los coeficientes son muy pequeños, mientras que los valores de los polinomios asocia10 dos de Legendre son muy grann des. De hecho, cuando i = j se 5 15 25 35 alcanza un valor máximo3 igual, Figura 14.1: Gráfica de los valores log10 (2n 1)!! en valor absoluto, a (2n 1)!!. El en función del grado n. número de dı́gitos de este valor es aproximadamente log10 (2n 1)!! y ha sido representado gráficamente en la figura 14.1 para valores de n menores de 36. Estos valores tan grandes deben ser multiplicados por los valores de los armónicos del potencial terrestre que son muy pequeños. Resulta muy poco conveniente, desde el punto de vista numérico, multiplicar cantidades muy pequeñas por cantidades muy grandes. Para paliar en lo posible el error computacional derivado de este hecho, se utiliza la siguiente propiedad Z 1 Pnm (x)Pkm (x) dx = 1 donde ij 3 Por ejemplo, P25,25 (0) = = ⇢ 0 1 2 (n + m)! (2n + 1)(n m)! si si i 6= j, i = j. 58435841445947272053455474390625. nk . (14.7) 222 Atracción de sólidos Esta propiedad demuestra la ortogonalidad de los mismos y permite su normalización por medio de la relación s ⇤ m)! m (2n + 1)(n P̄nm (t) = Nnm Pnm (t), Nnm = , (14.8) (n + m)! ⇤ donde m = 2 0m vale 1 si m = 0 y 2 si m > 0. A los valores Nnm les llamaremos coeficientes de normalización. La figura 14.2 presenta una gráfica con los valores numéricos de p̄nm = maxx2[ 1,1] |P̄nm (x)|, (14.9) que representa el máximo alcanzado por el polinomio normalizado4 dentro del intervalo [ 1, 1] para n  36, m  n. Las caracterı́sticas de los resultados obtenidos pueden destacarse en los siguientes puntos: 10 p̄nm 8 6 4 2 5 15 25 35 n Figura 14.2: Valores de p̄nm con 0  m  n. Cada lı́nea vertical de puntos representa los valores p̄nm para un valor n fijo que coincide con la abscisa x y los valores de m entre 0 y n. p p̄nm  p̄n0 = 2n + 1, siendo 0  m  n. p Para n = 36 el valor de p̄36,0 es una cota de todos los demás y vale 73 = 8.544. Los coeficientes de normalización Nnm , dados en (14.8), permiten también normalizar las derivadas de los polinomios de Legendre Qnm definiendo los valores normalizados como Q̄nm (t) = Nnm Qnm (t). (14.10) Aplicando estas relaciones en (14.6) podremos obtener las relaciones entre las derivadas normalizadas en la forma: s ⇤ m 2m + 1 Q̄mm (t) = Q̄m 1,m 1 , ⇤ 2m m 1 p Q̄m+1,m (t) = 2m + 3 t Q̄mm (t), Q̄nm (t) 4 Para = s (2n + 1)(2n 1) t Q̄n 1,m (t) (n m)(n + m) s (2n + 1)(n + m 1)(n m 1) Q̄n (2n 3)(n m)(n + m) el ejemplo anterior el polinomio normalizado vale P̄25,25 (0) = (14.11) 2,m (t). 3.38409. Potencial gravitatorio de un planeta 223 ⇤ ⇤ Observemos que el cociente m / m 1 , que aparece en la primera iteración, vale 2 cuando m = 1 y 1 para cualquier otro valor de m. El valor para iniciar esta iteración será, en este caso, Q̄00 (t) = 1. 14.3 Potencial gravitatorio de un planeta Cada punto P de un sólido, (figura 14.3), ejerce sobre un orS bitador S una fuerza de atracción cuyo potencial viene dado, al igual que en el caso de dos cuerpos, por la expresión x P xp G O dm , donde hemos llamado a la distancia de P a S, hemos tomado como unidad de masa la de S y hemos llamado dm al elemento diferencial de masa del punto P . Figura 14.3: Potencial creado por cada punto P de un sólido. V = G Z dm El potencial creado por el sólido en S vendrá dado por la integral extendida a toda la masa del sólido . (14.12) M Si x, xp representan los vectores de posición respectivos de S y P , referidos a un sistema con centro en el centro de masas del sólido, y el ángulo entre dichos vectores, tendremos 2 = (x xp )2 = x2 + x2p 2k x kk xp k cos = k x k2 (1 2x↵ + x2 ), donde hemos llamado x = k xp k/k x k, ↵ = cos . Finalmente, puesto k x k, podremos poner 1 1 1 = p . r 1 2x↵ + x2 p El término 1/ 1 2x↵ + x2 suele sustituirse por su desarrollo en potencias X 1 p = Pn (↵)xn , 1 2x↵ + x2 n 0 cuyos coeficientes son los polinomios de Legendre. que r = (14.13) serie de (14.14) 224 Atracción de sólidos Para calcular la integral (14.12) a lo largo de toda la masa del sólido formularemos el problema en un sistema de coordenadas planetográficas (ver apartado 3.8), esto es, basado en el plano ecuatorial del planeta, rotando con él, y con un origen de longitudes establecido a priori. Si llamamos ( , ), respectivamente a la longitud y latitud planetográfica del satélite y (⇤, ) a las de un punto P del planeta, las direcciones de los vectores de posición del planeta y el satélite serán x̂S = cart(1, , ), x̂P = cart(1, ⇤, ). El coseno del ángulo entre estos dos vectores vendrá dado por el producto escalar de ambos, lo que lleva a la expresión cos = x̂S · x̂P = sen sen + cos cos cos(⇤ ). (14.15) La relación anterior, llevada a los polinomios de Legendre, permite obtener la siguiente una propiedad, que no demostraremos Pn (cos ) = Pn (sen )Pn (sen ) + 2 n X (n j=1 j)! Pnj (sen )Pnj (sen ) cos j(⇤ (n + j)! ). (14.16) Por otro lado, la expresión (14.12) del potencial del sólido se podrá poner como Z Z ⇣ ⌘n dm GX ⇢ V = G = Pn (cos ), r M M r n 0 de donde, usando la relación (14.16), llegamos a  GM GM X ⇣ rp ⌘n V = + Jn Pn (sen ) r r r n 1 n X j=1 Pnj (sen ) (Cnj cos j + Snj sen j )5 , siendo rp el radio ecuatorial del planeta, M la masa del mismo y Z ✓ ◆n 1 ⇢ Pn (cos ) dm, Jn = M M rp Z ✓ ◆n 2 j)! ⇢ 0m (n Cnj = Pnj (sen ) cos j⇤ dm, M (n + j)! M rp Z ✓ ◆n 2 j)! ⇢ 0m (n Snj = Pnj (sen ) sen j⇤ dm, M (n + j)! M rp donde hemos tomado Jn = 3 (14.17) (14.18) Cn0 y hemos considerado que se verifica Sn0 = 0. Potencial gravitatorio de un planeta 225 Consideremos ahora la definición de la matriz de inercia de un sólido, cuyos elementos se expresan como Z Iij = (r2 ij xi xj )dm, M y la de su centro de masas rc = xc1 e1 + xc2 e2 + xc3 e3 e1 = M Z e2 x1 dm + M M Z e3 x2 dm + M M Z x3 dm, M donde r2 = x21 + x22 + x23 y ij vale 0 o 1 según i y j sean iguales o distintos. Expresando estas integrales en coordenadas polares esféricas y comparándolas con las expresiones (14.18) podemos llegar, tras una serie de cálculos, a las siguientes igualdades xc 2xc 2xc J1 = 3 , C11 = 1 , S11 = 2 , rp rp rp que nos indican que, eligiendo el centro de masas del planeta como origen de coordenadas, se llega a J1 = 0, C11 = 0, S11 = 0, lo que permite poner V = GM GM X ⇣ rp ⌘n + r r r n 2  Jn Pn (sen ) n X j=1 3 Pnj (sen ) (Cnj cos j + Snj sen j )5 . (14.19) Por otro lado, encontramos que J2 = 1 (I11 + I22 2M rp 2I33 ), (14.20) que nos da el valor del coeficiente J2 en términos de los momentos de inercia. Todos los demás coeficientes pueden ser encontrados en términos de los elementos de la matriz de inercia. Los coeficientes Jn de la expresión (14.19) del potencial del sólido son llamados armónicos zonales, mientras que los Cij , Sij , j 6= 0, son los armónicos teserales. Una idea más precisa acerca del significado de éstos coeficientes puede encontrarse en cualquier libro de Geodesia. Notemos que cuando el sólido es de revolución la simetrı́a del mismo hace que las integrales que definen los armónicos teserales sean todas cero, por lo que en este caso Cij = 0, Sij = 0, y el potencial contiene sólo términos zonales. 226 Atracción de sólidos Si además de ser de revolución posee simetrı́a respecto al plano Oxy, entonces los términos zonales impares son también cero, J2n+1 = 0. Fijándonos en la expresión de J2 observamos que este término nos da una medida de la diferencia entre el momento de inercia del eje Oz respecto a los otros dos ejes, es decir, J2 nos indicará el achatamiento del planeta. Ya se ha dicho antes que órdenes n del potencial muy altos nos dan valores de Pnm muy grandes y valores de los armónicos Cnm , Snm muy pequeños. El producto del coeficiente de normalización Nnm , dado en (14.8), por el polinomio Pnm conduce a la obtención de un nuevo polinomio P̄nm de valor moderado. Si se usa esta normalización en la expresión del potencial debemos sustituir los armónicos Cnm , Snm por los armónicos normalizados C̄nm , S̄nm , introducidos por Kaula y que se definen por medio de las expresiones: ⇢ C̄nm S̄nm 1 = Nnm ⇢ Cnm Snm . (14.21) Aunque fue Kaula quien introdujo los coeficientes normalizados, en su teorı́a del satélite utiliza coeficientes sin normalizar. Fueron Heiskanen y Moritz en 1967 quienes los utilizaron por primera vez en la teorı́a del potencial. El tratamiento numérico de modelos de potencial de grado alto hace imprescindible su normalización, por lo que todos los modelos se presentan con el valor de los armónicos normalizados. Sin embargo, el tratamiento analı́tico, que no puede ser llevado todavı́a a órdenes muy altos, suele realizarse con los coeficientes sin normalizar, pues de este modo, el manejo de los polinomios de Legendre es más sencillo al no ser necesario el uso de los coeficientes de normalización que introducen números irracionales. La introducción de los coeficientes (14.21) permite expresar el potencial en la forma " n # GM GM X ⇣ rp ⌘n X V = C̄nm cos m + S̄nm sen m P̄nm (sen ) . r r r m=0 n 2 (14.22) El primer sumando de la expresión anterior, que llamaremos potencial kepleriano, corresponde al potencial creado por una masa puntual y coincide con el potencial que producirı́a el planeta si fuese un punto o una esfera homogénea. El resto de términos constituyen el potencial perturbador Vp que es producido por la forma no esférica del planeta. 14.4 Modelos de potencial gravitatorio La obtención de los términos del potencial terrestre se realiza principalmente a partir de las perturbaciones observadas en las órbitas de los satélites artificiales. Modelos de potencial gravitatorio 227 El lanzamiento, en 1957, del Sputnik I y sus primeras observaciones permitieron a King-Hele obtener en 1958 una precisión de 4 dı́gitos en el cálculo de J2 , lo que mejoraba en dos dı́gitos la que se poseı́a hasta entonces. Otros satélites lanzados poco después, como el Vanguard I en 1959, permitieron también detectar el coeficiente J3 que indica la asimetrı́a norte-sur del geoide. Desde ese momento el conocimiento de los coeficientes del potencial terrestre ha avanzado mucho, como modelos militares clasificados en un primer momento y como modelos de dominio público de gran precisión en la actualidad. Entre los modelos actuales podemos destacar el modelo JGM-3 desarrollado en la Universidad de Texas y que alcanza un grado 70 ⇥ 70. Aunque JGM-3 es un modelo de gravedad global muy elaborado para determinación de órbitas con precisión, nuevos modelos son continuamente desarrollados. Una muestra de ello es la colaboración del NASA/GSFC, la National Imagery and Mapping Agency (NIMA) y la Universidad del Estado de Ohio (OSU), que publicó el EGM96S (Earth Gravity Model), de grado y orden 70, y el modelo EGM96, de grado y orden 360. Posteriormente, el National Geospatial-Intelligence Agency (NGA), organismo que e 2003 sustituyó al NIMA, generó el modelo más preciso hasta el momento, el EGM2008, que tiene un grado y orden igual a 2159. El estudio del potencial lunar comienza con el lanzamiento, en 1966, del satélite lunar ruso Luna-10 que demostró el achatamiento de la Luna. Los datos de la misión Clementine permitieron construir el modelo GLGM-2 de grado y orden 70. Este modelo fue mejorado con las observaciones del Lunar Prospector con el nuevo modelo LP75D de grado y orden 75 y finalmente con el LP165P, de grado y orden 165. En el caso del planeta Marte el primer análisis preciso del campo gravitatorio llegó a partir de los datos de seguimiento del Mariner 9. Dicha nave estuvo orbitando alrededor de Marte durante 11 meses, desde noviembre de 1971, con una órbita de unas 12 horas de periodo, altitudes entre 1390 y 1650 km y 64 de inclinación. También se descubrió que el campo gravitatorio de Marte era mucho más irregular que el de la Tierra, con variaciones totales sobre el geoide por encima de los 2000 m frente a los menos de 200 m para el caso terrestre. Una altura del geoide superior a 1200 m fue detectada en Tharsis y reveló el alto valor del cociente C2 2 /S2 2 del campo gravitatorio de Marte. Con datos de la misión Mars Observer y otras anteriores se desarrolló el modelo de potencial Goddard Mars Model-1, o GMM-1 de grado y orden 50. Posteriormente la misión Mars Global Surveyor (MGS), junto con los datos obtenidos por el Mars Orbiter Laser Altimeter (MOLA) permitió obtener un modelo gravitatorio de Marte de grado y orden 80, el Goddard Mars Model 2B (GMM-2B) y posteriormente una mejora del mismo, también de grado y orden 80, llamada MGM1025. Las observaciones por radiometrı́a Doppler, realizadas por la sonda Magallanes en la superficie del planeta Venus, han permitido obtener varios modelos de 228 Atracción de sólidos potencial para este planeta. Comenzando por el modelo MGNP120P de grado y orden 120, posteriormente mejorado con el modelo MGNP180U, de grado y orden 180. Tierra 1.0826 · 10 2.5324 · 10 1.6193 · 10 2.2772 · 10 5.3965 · 10 J2 J3 J4 J5 J6 Luna 2.032 · 10 8.476 · 10 9.592 · 10 7.154 · 10 1.358 · 10 3 6 6 7 7 4 6 6 7 5 Marte 1.955 · 10 3.145 · 10 1.538 · 10 5.719 · 10 4.849 · 10 3 5 5 6 6 Venus 4.404 · 10 2.109 · 10 2.147 · 10 4.669 · 10 1.165 · 10 6 6 6 7 7 Tabla 14.1: Valor de los primeros armónicos zonales para la Tierra, la Luna, Marte y Venus. En la tabla 14.1 se muestran los valores de los seis primeros armónicos, sin normalizar, del potencial de la Tierra, la Luna, Marte y Venus extraidos de los modelos JGM-3, LP165P, GMM-2B y MGNP180U respectivamente. 14.5 Evaluación del potencial planetario y la fuerza derivada La expresión del potencial perturbador de un planeta puede también ponerse como n GM X X VP = Vnm , (14.23) rp m=0 n 2 donde hemos llamado Vnm = ⇢n+1 C̄nm um + S̄nm vm Q̄nm (w1 ), siendo ⇢n = um vm wm = = = ⇣ r ⌘n (14.24) p , r cos m cosm , sen m cosm , senm . (14.25) Si expresamos el vector x en el sistema planetográfico, llamamos (x, y, z) a sus componentes x = x p1 + y p2 + z p3 = r cos cos p1 + r sen cos p2 + r sen p3 , y por otro lado llamamos u a la dirección radial u = x/r = u p1 + v p2 + w p3 , podemos expresar en función de ellos los elementos: u0 u1 = = 1, u = x/r, v0 v1 = = 0, v = y/r, w0 w1 = = 1, w = z/r. (14.26) Evaluación del potencial planetario y la fuerza derivada 229 La evaluación del término Vnm del potencial se realiza por un procedimiento iterativo usando, por un lado, las expresiones (14.11) y por otro las relaciones um = um 1 u1 vm 1 v1 , vm = v m 1 u1 + um 1 v1 , (14.27) que terminan con los valores (14.26). Para calcular la perturbación que el planeta ejerce sobre la órbita del satélite usaremos la relación PP = rx V p = n GM X X P nm , rp m=0 n 2 P nm = rx Vnm . Por otro lado, si observamos la expresión (14.24) y las relaciones iterativas que construyen el término Vnm , podemos concluir que éste término depende únicamente de las variables (r, u, v, w), por lo que podremos poner rx Vnm = @Vnm @Vnm @Vnm @Vnm rx u + rx v + rx w + rx r. @u @v @w @r Teniendo en cuenta que r = k x k, u = x/k x k, v = y/k x k, w = z/k x k, se deducen facilmente las expresiones: rx u = rx v = rx w = rx r = 1 p r 1 1 p r 2 1 p r 3 u. u u, r v u, r w u, r Por otro lado es fácil deducir que: ✓ ◆ @Vnm @um @vm = ⇢n+1 C̄nm + S̄nm Q̄nm (w1 ), @u @u @u ✓ ◆ @Vnm @um @vm = ⇢n+1 C̄nm + S̄nm Q̄nm (w1 ), @v @v @v @Vnm = ⇢n+1 C̄nm um + S̄nm vm n,m Q̄n,m+1 (w1 ), @w @Vnm n+1 = ⇢n+2 C̄nm um + S̄nm vm Q̄nm (w1 ), @r rp (14.28) (14.29) siendo n,m = Nn,m /Nn,m+1 el valor obtenido en la derivación de la expresión (14.10) y la definición de Qn,m . Simplificando esta expresión se obtiene r p 1 n (n + 1), (n m) (n + m + 1). n,0 = n,m = 2 230 Atracción de sólidos El proceso de cálculo quedará completado si obtenemos las derivadas parciales de um , vm con respecto a las variables u y v. Para calcular estas derivadas tendremos en cuenta que um y vm coinciden con la parte real e imaginaria del número complejo cosm cos m + i cosm sen m . De acuerdo con las propiedades de los números complejos éste último es la potencia m-sima del número cos cos + i cos sen = u + iv. Por tanto podremos poner finalmente que um = <[(u + iv)m ], vm = =[(u + iv)m ], De donde, por simple derivación, se llega a las relaciones: @um @u @um @v = m um = @vm @u @vm @v 1, m vm 1, = m vm 1, = m um 1, (14.30) que completan el proceso de cálculo de la fuerza perturbadora del planeta. Aunque las expresiones (14.29) no son válidas cuando m = 0 pueden usarse si extendemos el conjunto de subı́ndices de um , vm , añadiendo los elementos u 14.6 1 = 0, v 1 = 0. Potencial terrestre en variables polares nodales La relación entre las coordenadas planetográficas y las polares– nodales puede deducirse a partir de la figura 14.4, donde podemos observar que el vector x tiene, en el sistema nodal-espacial P, unas coordenadas polares (r, ⌫, ), y de éste pasamos al sistema orbital por medio de la matriz de giro R1 (i)R3 (✓), luego podremos poner el vector cart(r, p3 n i x p1 ⌫ l ⌫, ), como el resultado del producto R1 (i)R3 (✓) cart(r, 0, 0). p2 ✓ ⌫ Figura 14.4: Relación entre las coordenadas polares-nodales y las planetográficas. Igualando ambos vectores y tras una serie de cálculos, llegamos a cos ✓ cos i sen ✓ sen i sen ✓ = = = cos cos( cos sen( sen , ⌫), ⌫), (14.31) Ecuaciones del movimiento en el sistema planetográfico 231 expresiones que, desarrolladas y combinadas con (14.25), nos conducen a cos ✓ cos i sen ✓ sen i sen ✓ = = = u1 cos ⌫ + v1 sen ⌫, v1 cos ⌫ u1 sen ⌫, w1 . (14.32) Finalmente, invirtiendo estas relaciones se llega a u1 = v1 = w1 = 1 (1 ci ) cos(✓ 2 1 (1 ci ) sen(✓ 2 si sen ✓, 1 ⌫) + (1 + ci ) cos(✓ + ⌫), 2 1 ⌫) + (1 + ci ) sen(✓ + ⌫), 2 (14.33) donde hemos llamado N ci = cos i = , ⇥ si = sen i = r 1 N2 . ⇥2 (14.34) Estas relaciones permiten expresar las ui , vi , wi , y a través de ellas la expresión del potencial en términos de las variables r, ✓, ⌫, y de los momentos R, ⇥, N . Las relaciones (14.33) permiten deducir que los términos zonales Jn Pn (w1 ) del potencial no contienen la variable ⌫, mientras que esta variable aparece cuando se consideran los términos teserales. 14.7 Ecuaciones del movimiento en el sistema planetográfico Al plantear las ecuaciones del movimiento de un satélite en torno a un planeta debemos considerar el hecho de que el sistema de referencia donde se ha formulado el potencial y, consecuentemente, la fuerza perturbadora es el sistema geográfico o planetográfico, que es un sistema rotante y por ello no inercial. Las ecuaciones del movimiento podrán ser formuladas siguiendo uno cualquiera de los dos caminos siguientes: Multiplicar la fuerza perturbadora por la matriz de giro, RSP , que pasa de un sistema de referencia espacial, que es inercial, al sistema planetográfico P. Formular las ecuaciones del movimiento en un sistema no inercial. En el primer caso las ecuaciones del movimiento serán ẍ + µ x = RSP P P , r3 (14.35) 232 Atracción de sólidos donde P P ha sido calculado en el apartado 14.5. Para formular el movimiento orbital en el sistema rotante será preciso usar la ecuación (6.5). De esta forma, las ecuaciones (12.1), se pondrán como x00 + 2! ⇥ x0 + ! 0 ⇥ x + ! ⇥ (! ⇥ x) + µ x = PP , r3 (14.36) donde P P = rx Vp es la perturbación y el vector ! representa el vector de rotación de la Tierra o de un planeta, que es constante, por lo que ! 0 = 0 y por tanto el sumando ! 0 ⇥ x desaparece de esta ecuación. Podemos fácilmente comprobar que la solución a este problema es equivalente a la de un sistema dinámico de hamiltoniano H(x, X) = 1 X ·X 2 µ kxk ! · (x ⇥ X) + Vp , (14.37) donde las coordenadas de x son las variables y las de X son los momentos. En efecto, las ecuaciones de Hamilton correspondientes a dicho sistema se expresarán como x0 = rX H = X ! ⇥ x, (14.38) µ X0 = rx H = !⇥X x r V , x p r3 0 0 donde hemos puesto x , X pues en dichas ecuaciones entran únicamente las derivadas respecto al tiempo de las variables y los momentos, esto es, de las coordenadas de x, X, por ello no es necesario derivar los vectores respecto a los elementos de la base del sistema de referencia. Es importante hacer notar que el vector X, de momentos, representa la velocidad absoluta expresada en el sistema rotante y no la velocidad relativa. Derivando respecto al tiempo las componentes de los vectores de la primera de las ecuaciones anteriores, después de despejar X, se llega a la expresión X 0 = x00 + ! ⇥ x0 + ! 0 ⇥ x = x00 + ! ⇥ x0 , que igualada a la segunda nos lleva a x00 + ! ⇥ x0 + ! ⇥ (x0 + ! ⇥ x) + µ x= r3 rx Vp = P P , que coincide con (14.36) haciendo ! 0 = 0. Ası́ pues, al formular el movimiento orbital de un satélite artificial en el sistema de referencia rotante de un planeta el hamiltoniano del problema se pondrá como H(x, X) = Hk + Hr + Vp , (14.39) Hr (x, X) = (14.40) donde ! · (x ⇥ X). Ecuaciones del movimiento en el sistema planetográfico 233 es el término debido a la rotación del planeta, también llamado término de Coriolis. El término Hr , expresado en variables polares-nodales de acuerdo con la definición de aquéllas, se pondrá como Hr = ! · (x ⇥ X) = ! N, (14.41) !H. (14.42) mientras que en en variables de Delaunay será Hr = ! · (x ⇥ X) = La ausencia de ⌫ y N (h y H) en el hamiltoniano del problema, cuando se formula en un sistema inercial, hace que ⌫ y N sean constantes por lo que el número de grados de libertad se reduce en una unidad. Cuando el problema se formula en un sistema rotante hemos de añadir al Hamiltoniano el término ! N , siendo la variable ⌫ ignorable. Esto conduce a las integrales: N constante y ⌫ = ! t, esto es, el nodo varı́a linealmente en el sistema rotante. Aquı́ el número de grados de libertad puede reducirse igualmente. Este resultado puede extenderse cuando en la perturbación no aparece explı́citamente la variable ⌫. 234 Atracción de sólidos Capı́tulo 15 Otras perturbaciones 15.1 Rozamiento atmosférico Las distintas capas de la atmósfera terrestre: troposfera, estratosfera, mesosfera, termosfera y exosfera, llegan a alcanzar una altitud de 1000 km por encima de la superficie, disminuyendo exponencialmente en densidad desde la superficie hasta las regiones exteriores. El rozamiento producido por la atmósfera en esta región contribuye a disminuir la velocidad de cualquier vehı́culo que se mueva dentro de ella. La fuerza que la atmósfera ejerce sobre un satélite artificial es muy grande a altitudes bajas, de hecho, no suelen situarse satélites artificiales por debajo de los 350 km, pues su órbita serı́a demasiado inestable y la acción de la atmósfera los harı́a caer rápidamente a la Tierra. Esta fuerza se aprovecha en la práctica para frenar una nave espacial cuando se le hace regresar a la superficie terrestre. Sin embargo, esta maniobra se hace muy peligrosa para una altitud de unos 120 km1 , donde se considera que el satélite efectúa su reentrada en la atmósfera, pues es donde se comienzan a observar los efectos de la atmósfera sobre la nave. La fuerza de rozamiento atmosférico lleva la dirección opuesta a la velocidad del satélite relativa a la atmósfera, depende, fundamentalmente, de su densidad y de la superficie en contacto entre el satélite y la atmósfera. La expresión de la aceleración (perturbación) producida por esta fuerza en el satélite puede expresarse 1 No confundir con los 100 km de la llamada lı́nea de Karman que la Federación Internacional de Astronáutica fija como lı́mite de la atmósfera y que representa la altitud por encima de la cual un avión no puede volar por fuerzas de tipo aerodinámico. 236 Otras perturbaciones como P AT = 1 A Cd ⇢ k v kv. 2 m (15.1) El coeficiente Cd es un coeficiente de rozamiento adimensional que describe la interacción de la atmósfera con la superficie material del satélite y depende de las propiedades quı́micas y fı́sicas de la atmósfera, la geometrı́a del satélite y de propiedades de los materiales del mismo. Tiene un valor entre 1 y 3 pero no es conocido con precisión hasta que no se efectúa una determinación precisa de la órbita del satélite. Suele tomarse igual a 2 como primera aproximación en el caso de satélites esféricos mientras que se establece un valor entre 2 y 2.3 para satélites de forma convexa. El área A es la superficie efectiva del satélite o el área normal al satélite en la dirección del movimiento. Es función de su geometrı́a y de su actitud u orientación en el espacio, por ello depende de t. Al factor B = Cd A/m, resultante de dividir por la masa del satélite el producto del coeficiente de rozamiento y el área efectiva, se le llama coeficiente balı́stico. El vector v representa la velocidad del satélite con respecto al aire circundante. La dinámica de la atmósfera es muy compleja, sin embargo, podemos aproximar el valor de v por medio de la expresión v=X ! ⇥x vv , (15.2) donde x, X representan la posición y velocidad del satélite respecto del sistema inercial, ! la velocidad angular de rotación de la Tierra y v v la velocidad del viento. El error al no considerar la velocidad del viento puede ser de un máximo del 5 % de la fuerza del rozamiento. La velocidad v se calcula en un sistema de referencia rotante con la Tierra, el sistema E$ , donde el vector ! = (0, 0, ! ), siendo ! = 0.7292 ⇥ 10 4 rad/s, por eso el vector P AT debe transformarse finalmente al sistema espacial multiplicándolo por la matriz de rotación RSE$ . Finalmente, para completar el modelo debe obtenerse un valor de la densidad ⇢ de la atmósfera. Esta densidad es una función poco conocida que depende de un gran número de parámetros como la altitud, longitud, latitud, actividad solar, ı́ndice geomagnético, tiempo, etc., y que es tratada a partir de modelos más o menos complejos que dan una estimación de la densidad de la atmósfera en cada punto. Existen dos tipos de modelos: estáticos y modelos que varı́an con el tiempo. Los primeros son mucho más simples y fáciles de usar pero no dan precisión suficiente en determinados problemas. Los segundos pueden ser extremadamente complejos en su aplicación y difı́ciles de calcular por lo que en muchas ocasiones deben ser sustituidos por los primeros. Comenzaremos con uno de los modelos más simples que supone que la densidad decrece exponencialmente desde la superficie de la Tierra. Este modelo, llamado Rozamiento atmosférico 237 modelo exponencial, está basado en una fórmula del tipo ✓ ◆ h0 h ⇢ = ⇢o exp , H0 (15.3) donde ⇢0 es la densidad de referencia en una altitud h0 mientras que H0 es un factor de escala. Los valores de ⇢o , h0 , H0 , para distintas altitudes h, se toman de la tabla 15.1 h0 0 25 30 40 50 60 70 80 90 100 110 120 130 140 ⇢0 1.225 3.899 ⇥10 1.774 ⇥10 3.972 ⇥10 1.057 ⇥10 3.206⇥10 8.770⇥10 1.905⇥10 3.396⇥10 5.297⇥10 9.661⇥10 2.438⇥10 8.484⇥10 3.845⇥10 2 2 3 3 4 5 5 6 7 8 8 9 9 H0 7.249 6.349 6.682 7.554 8.382 7.714 6.549 5.799 5.382 5.877 7.263 9.473 12.636 16.149 h0 150 180 200 250 300 350 400 450 500 600 700 800 900 1000 ⇢0 2.070 ⇥ 10 9 5.464 ⇥10 10 2.789 ⇥10 10 7.248 ⇥10 11 2.418⇥10 11 9.158⇥10 12 3.725⇥10 12 1.585⇥10 12 6.967⇥10 13 1.454⇥10 13 3.614⇥10 14 1.170⇥10 14 5.254⇥10 15 3.019⇥10 15 H0 22.523 29.740 37.105 45.546 53.628 53.298 58.515 60.828 63.822 71.835 88.667 124.64 181.05 268.00 Tabla 15.1: Tabla de valores de referencia en el modelo exponencial de densidad atmosférica. Las unidades de h0 y H0 están en km, mientras que ⇢0 está expresado en kg/m3 . El modelo de Harris–Priester es otro modelo estático pero que que produce muy buenos resultados por lo que es ampliamente usado y recomendado y da una aproximación suficiente para muchas aplicaciones. Este modelo está basado en la solución de la ecuación de conducción del calor bajo condiciones casi hidrostáticas. Su formulación se efectúa por medio de dos valores mı́nimo y máximo de la densidad para una altitud h que se obtienen a partir de las expresiones ✓ ◆ hi h ⇢m (h) = ⇢m (hi ) exp , Hm ✓ ◆ hi h ⇢M (h) = ⇢M (hi ) exp , hi  h  hi+1 , HM donde h es la altitud del satélite sobre el elipsoide de referencia. Los valores de los parámetros hi , ⇢m (hi ), ⇢M (hi ) son tomados de la tabla 15.2, mientras que Hm , HM se obtienen a partir de las expresiones Hm (h) = hi hi+1 , ln (⇢m (hi+1 )/⇢m (hi )) 238 Otras perturbaciones hi 100 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 280 290 300 320 340 360 380 400 ⇢m (hi ) 4.974⇥10 2.490⇥10 8.377⇥10 3.899⇥10 2.122⇥10 1.263⇥10 8.008⇥10 5.283⇥10 3.617⇥10 2.557⇥10 1.839⇥10 1.341⇥10 9.949⇥10 7.488⇥10 5.709⇥10 4.403⇥10 3.430⇥10 2.697⇥10 2.139⇥10 1.708⇥10 1.099⇥10 7.214⇥10 4.824⇥10 3.274⇥10 2.249⇥10 7 8 9 9 9 9 10 10 10 10 10 10 11 11 11 11 11 11 11 11 11 12 12 12 12 ⇢M (hi ) 4.974⇥10 2.490⇥10 8.710⇥10 4.059⇥10 2.215⇥10 1.344⇥10 8.758⇥10 6.010⇥10 4.297⇥10 3.162⇥10 2.396⇥10 1.853⇥10 1.455⇥10 1.157⇥10 9.308⇥10 7.555⇥10 6.182⇥10 5.095⇥10 4.226⇥10 3.526⇥10 2.511⇥10 1.819⇥10 1.337⇥10 9.955⇥10 7.492⇥10 7 8 9 9 9 9 10 10 10 10 10 10 10 10 11 11 11 11 11 11 11 11 11 12 12 hi 420 440 460 480 500 520 540 560 580 600 620 640 660 680 700 720 740 760 780 800 840 880 920 960 1000 ⇢m (hi ) 1.558⇥10 1.091⇥10 7.701⇥10 5.474⇥10 3.916⇥10 2.819⇥10 2.042⇥10 1.488⇥10 1.092⇥10 8.070⇥10 6.012⇥10 4.519⇥10 3.430⇥10 2.620⇥10 2.043⇥10 1.607⇥10 1.281⇥10 1.036⇥10 8.496⇥10 7.069⇥10 4.680⇥10 3.200⇥10 2.210⇥10 1.560⇥10 1.150⇥10 12 12 13 13 13 13 13 13 13 14 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 ⇢M (hi ) 5.684⇥10 4.355⇥10 3.362⇥10 2.612⇥10 2.042⇥10 1.605⇥10 1.267⇥10 1.005⇥10 7.997⇥10 6.390⇥10 5.123⇥10 4.121⇥10 3.325⇥10 2.691⇥10 3.325⇥10 1.779⇥10 1.452⇥10 1.190⇥10 9.776⇥10 8.059⇥10 5.741⇥10 4.210⇥10 3.130⇥10 2.360⇥10 1.810⇥10 12 12 12 12 12 12 12 12 13 13 13 13 13 13 13 13 13 13 14 14 14 14 14 14 14 Tabla 15.2: Tabla de valores de referencia en el modelo de Harris–Priester de densidad atmosférica. Las unidades de hi están en km, mientras que ⇢m , ⇢M están expresados en kg/m3 . HM (h) = hi hi+1 . ln (⇢M (hi+1 )/⇢M (hi )) La densidad ⇢ a una altitud h se obtendrá finalmente por medio de la expresión ✓ ◆(n/2) 1 u·a ⇢(h) = ⇢m (h) + (⇢M (h) ⇢m (h)) + , (15.4) 2 2 donde u es la dirección del satélite y a = cart(1, ↵ + 30 , ), siendo ↵ , la ascensión recta y declinación del Sol. El exponente n toma un valor igual a 2 para órbitas bajas y 6 para órbitas polares. Entre los modelos no estáticos más usados se encuentran los modelos de Jaccia, en particular los modelos J71 y J77 que son unos modelos muy precisos pero muy difı́ciles de usar y que no abordaremos en este libro. Presión de radiación solar 15.2 239 Presión de radiación solar Cualquier cuerpo en el espacio recibe una radiación del Sol que produce una fuerza que depende de la superficie del cuerpo expuesta a la radiación solar, de sus propiedades de absorción y de la presión ejercida por esta radiación. Para formular la fuerza producida por la radiación solar comenzaremos con un parámetro llamado intensidad o flujo solar = A E , t donde E es la energı́a recibida en un tiempo t y en una superficie A. La intensidad solar ha sido calculada a partir de la estimación del número de fotones por centı́metro cuadrado que llegan a una distancia igual a una unidad astronómica y la energı́a de un fotón. Aunque el valor de no es exactamente constante, para la mayorı́a de las aplicaciones es suficiente tomarlo igual a = 1367W/m2 . Por otro lado, si tenemos en cuenta la ecuación de Einstein E = mc2 , se deduce fácilmente que pf = mc = Ef /c, lo que nos da la norma de la cantidad de movimiento de un fotón siendo Ef su energı́a. A partir de este valor y teniendo en cuenta la cantidad de fotones que impactan sobre un cuerpo, lo que se relaciona con la intensidad solar, podemos deducir que el impulso o variación de la cantidad de movimiento, en un tiempo t, de un cuerpo que absorbe toda la energı́a, o lo que es igual, que recibe toda la cantidad de movimiento de los fotones, es igual a Ef e = c p= c A t e , siendo A el área la sección del cuerpo que recibe la radiación o área efectiva, y e la dirección del cuerpo al Sol. De esta forma, la fuerza que actúa sobre dicho cuerpo puede ponerse como F abs = donde P c Ae = P Ae , representa la presión de radiación solar P = c = 4.56 ⇥ 106 m 1 kg s 2 que se ha calculado a partir de los valores constantes de , y c. En la expresión anterior de la fuerza, y en lo que sigue, se ha supuesto que el fotón incide perpendicular a la superficie del satélite, esto es, el ángulo de incidencia vale cero. Esto es una aproximación al modelo real en el que debemos considerar este ángulo y la actitud del satélite, sin embargo, para la mayorı́a de las aplicaciones esta aproximación será suficiente. Pensemos, por ejemplo, en la aplicación de este modelo a un satélite en el que la mayor superficie la forman los paneles solares que deben estar siempre orientados perpendicularmente al Sol. 240 Otras perturbaciones En el caso de que el cuerpo refleje toda la energı́a, de forma especular, el momento angular pf del fotón pasa a ser pf , en lugar de anularse como en el caso de la completa absorción. Debido a esto el impulso y por tanto la fuerza serán el doble de la anterior F ref = 2P A e . En la práctica parte de la radiación se refleja y parte se absorbe por lo que el modelo de fuerza producido por la radiación solar será F r = ✏ F ref + (1 ✏)F abs = P (1 + ✏) A e , donde ✏ es un parámetro de reflectividad del cuerpo que toma un valor entre 0 (completa absorción) y 1 (completa reflexión). Habitualmente se sustituye este parámetro por Cr = (1 + ✏), cuyo valor es igual a 1.21 para los paneles solares y 1.81 para el aluminio. Finalmente se tendrá Fr = P Cr A e . El valor de la presión de radiación solar P ha sido calculado para una unidad astronómica de distancia rAU 2 , sin embargo, la distancia del cuerpo al Sol r varı́a con el tiempo, produciendo, para un satélite artificial terrestre, una variación de ±3.3 % en la presión de radiación. Puesto que el flujo solar decrece con el cuadrado de la distancia al Sol podemos establecer finalmente que el valor de la aceleración producida en el satélite por la presión de la radiación solar es P RAD = P Cr A 2 x x r , m AU k x x k3 donde hemos tenido en cuenta que la distancia del satélite al Sol es k x su dirección e = (x x )/k x x k. (15.5) x ky La presión de radiación solar disminuye cuando no es visible toda la superficie del Sol y desaparece cuando éste no es visible, de ahı́ la importancia del estudio del fenómeno de los eclipses desde el punto de vista de la navegación espacial. De hecho, la expresión (15.5) debe ser sustituida por la siguiente P RAD = (x, x ) P Cr A 2 x x r , m AU k x x k3 (15.6) donde (x, x ) es una función que depende de la posición del satélite y del Sol y que representa la fracción del disco solar visible. Si el disco del Sol es totalmente visible, es decir no hay eclipse, entonces = 1. Si el disco solar está totalmente oculto por algún planeta o cuerpo, entonces = 0. El valor de tomará un valor entre 0 y 1 cuando el Sol está parcialmente eclipsado. 2 El factor r AU se introduce en la expresión para unificar las unidades en que ha sido calculada la presión de radiación con las unidades que se usan para formular las ecuaciones del movimiento. Eclipses 15.3 241 Eclipses El fenómeno de la presión de radiación solar afecta a cualquier nave espacial, tanto sea una sonda espacial interplanetaria como satélite artificial orbitando en torno a la Tierra, la Luna o un planeta. Además, la visibilidad del Sol afecta también al funcionamiento de muchos sistemas de la nave que dependen de la recepción de energı́a en los paneles solares, por ello es tan importante el conocimiento de los posibles eclipses en cualquier misión espacial. No debemos quedarnos únicamente en los producidos por la Tierra al interponerse por delante del Sol en un satélite artificial, sino que debemos estudiar la producción de eclipses cuando el cuerpo que lo produce no sea la Tierra. De hecho la Luna también puede producir eclipses en un satélite artificial terrestre. 15.3.1 Semidiámetros y distancia angular La producción de un eclipse está relacionada con el tamaño del semidiámetro observado del Sol y el del planeta, o cuerpo P que pueda eclipsarlo, y la distancia angular entre ambos. S s s sP RP R P Figura 15.1: Separación angular y semidiámetros del Sol y el planeta desde el satélite artificial. Como puede verse en la figura 15.1, la relación entre la distancia angular s y los semidiámetros s y sP nos indicará la existencia o no de eclipses. Para calcular éstas bastará obtener unas sencillas relaciones angulares y trigonométricas. 242 Otras perturbaciones Supongamos que los vectores de posición del planeta y del Sol, vistos desde el satélite, vienen dados por SP , S respectivamente. El semidiámetro sP (s ) del planeta P (Sol) se obtendrá teniendo en cuenta el triángulo rectángulo formado por el satélite S, el centro del planeta P (centro del Sol ) y el punto de tangencia de la recta tangente al planeta (Sol) desde S. Si RP , R representan el radio del planeta y Sol y k SP k, k S k la distancia entre el satélite y el planeta y el Sol, entonces podremos poner ✓ ◆ ✓ ◆ RP R sP = asen , s = asen . (15.7) k SP k kS k Por otro lado, la separación angular entre el Sol y el planeta, vistos desde el satélite, vendrán dados por el producto escalar de SP y S , por lo que podremos poner ✓ ◆ SP · S s = acos . (15.8) k SP kk S k Los valores de s, s , sP pueden calcularse en cualquier instante del tiempo si se conocen con precisión las posiciones del satélite, el planeta y el Sol. 15.3.2 Condiciones para un eclipse Atendiendo al valor relativo de las cantidades s, s , sP podemos decir en cualquier momento si se está produciendo un eclipse y de qué tipo. Obviamente, cuando la distancia angular s sea mayor que la suma s + sP , los centros aparentes del Sol y el planeta estarán suficientemente alejados por lo que no habrá ningún eclipse y la superficie del Sol se verá en su totalidad. (a) Comienzo del eclipse parcial. (b) Final del eclipse parcial. Figura 15.2: Posiciones de comienzo y final de un eclipse parcial. En el momento en que s = s + sP se produce la situación de la figura 15.2(a) donde los discos de el Sol y el planeta entran en contacto y por tanto el disco del Sol, que siempre estará más alejado, se oculta por detrás del disco del planeta comenzando el eclipse parcial. Eclipses 243 El eclipse parcial termina cuando uno de los discos está totalmente dentro del otro, lo que sucede, como vemos en la figura 15.2(b), en el momento en que s = |s sP |. En esta relación hemos tenido que poner el valor absoluto porque pueden darse dos casos según que el disco aparente del planeta sea mayor o menor que el del Sol. Esta situación no podrá darse cuando el satélite sea terrestre y el planeta que produce el eclipse la Tierra, pues en este caso el diámetro aparente de la Tierra es mucho mayor que el del Sol, pero si el que produce el eclipse es la Luna la situación relativa puede conducir al caso de que el disco del Sol sea mayor que el de la Luna. (a) Eclipse total (b) Eclipse anular Figura 15.3: Eclipses total y anular. Cuando s < |s sP | pueden producirse dos casos. Si el planeta tiene mayor semidiámetro, esto es s < sP y s < sP s , entonces el disco del planeta oculta totalmente el del Sol (figura 15.3(a)) produciéndose un eclipse total de Sol. Si por el contrario es el Sol el que tiene mayor semidiámetro, esto es sP < s y s<s sP , entonces el disco del planeta tapará únicamente parte del disco solar (figura 15.3(b)) produciéndose un eclipse anular. Podemos resumir las cuatro condiciones en los siguientes puntos: No hay eclipse: s + sP < s . Eclipse parcial: |s Eclipse total sP | < s < s + sP . : s < s P y s < sP Eclipse anular : sP < s 15.3.3 ys<s s . sP . Área de un segmento circular Para calcular la magnitud de un eclipse parcial hemos de tener en cuenta que, cuando éste se produce, la parte de disco oculta está formada por dos segmentos circulares como puede observarse en la figura 15.4. Cuando cortamos un cı́rculo de radio r por una recta secante QQ0 (figura 15.5) éste queda dividido en dos zonas o segmentos circulares, uno pequeño, que 244 Otras perturbaciones Figura 15.4: Segmentos circulares ocultos durante un eclipse parcial. no contiene el centro y que tiene un área A y otro grande, que contiene al centro, que tiene un área (⇡r2 A). Para caracterizar estos dos segmentos observaremos que la recta QQ0 divide al diámetro perpendicular en dos segmentos de longitud l = y y l = x + r = 2r y. Este parámetro l, que llamaremos longitud del segmento circular, determina a cual de los dos segmentos nos referimos. Q r z A ✓ r P x y Calcularemos, en primer lugar, el área A del menor de los segmentos. Para esto basta tener en cuenta que Q0 2 esta área es igual al área ✓ r del sector circular P QQ0 menos el área z x del triángulo P QQ0 . Simples relacio- Figura 15.5: Área de un segmento circular. nes geométricas permiten poner ✓ ◆ p r y A = r2 acos (r y) 2ry y 2 . r A partir de esta relación es fácil obtener el área del segmento en función de la longitud l, que puede ser mayor o menor que r. Ası́ tendremos la expresión: ✓ ◆ 8 p r l > 2 > r acos (r l) 2rl l2 , l < r, < r ✓ ◆ A(l, r) = (15.9) p > l r > : ⇡r2 r2 acos + (l r) 2rl l2 , l > r, r donde A(l, r) es una función que permite calcular el área de segmento de longitud l en un cı́rculo de radio r. Eclipses 15.3.4 245 Magnitud del eclipse Queda por calcular, finalmente, el valor de la función que determina la magnitud del eclipse, definiendo éste como la fracción de la superficie del disco solar oscurecida por el planeta. Aunque en (15.6) se ha definido este parámetro como función de x y x , expresaremos como función de los tres parámetros s, s , sP , que como sabemos se podrán calcular en términos de x y x . Comenzaremos por el caso del eclipse parcial, donde debemos buscar, en primer lugar, la longitud de los dos segmentos de cı́rculo que determinan la zona del disco solar oculta. Las dos situaciones, que corresponden a la figura 15.4, se representan también en los dos triángulos de la figura 15.6, de los cuales debemos obtener las longitudes de los segmentos de cı́rculo lm y lM . S sM sm z lM ✓M xM PM lm C M xm S0 Cm ✓m Pm S sM ✓M PM sm lM CM xM z ✓m Pm lm xm S 0 Cm Figura 15.6: Triángulo SPm PM . Los subı́ndices m y M usados en esta figura se definen de manera que se corresponden con el valor mı́nimo y máximo de los semidiámetros del Sol y el planeta, esto es sm = mı́n(s , sP ), sM = máx(s , sP ). (15.10) Calcularemos únicamente las longitudes lm y lM para el caso del triángulo de arriba de la figura. Las expresiones finales de lm y lM son idénticas en los dos casos. Si llamamos xm y xM a las distancias respectivas de Pm y PM a S 0 se tendrá la relación xm + xM = s. 246 Otras perturbaciones Por otro lado el teorema de Pitágoras aplicado a los triángulos Pi SS 0 nos da las relaciones z 2 + x2i = s2i para i = m, M . Restando ambas relaciones se obtiene s2M s2m = x2M x2m = (xM + xm )(xM xm ) = s(xM xm ), que junto con la expresión del párrafo anterior nos da un sistema lineal mediante el cual obtenemos xm = s2 s2M + s2m , 2s xM = s2 + s2M 2s s2m Observando la figura se deducen las relaciones li = si permiten escribir, para todos los casos, las expresiones lm = s m s2 s2M + s2m , 2s lM = s M s2 + s2M 2s . xi , i = m, M , que s2m . (15.11) Si tenemos en cuenta finalmente que el área del disco solar es ⇡s2 y que el área ocultada corresponde a dos segmentos circulares de longitudes respectivas li y radios ri , con i = m, M , podremos dar la siguiente expresión para la magnitud de un eclipse parcial = ⇡s2 A(lm , sm ) ⇡s2 A(lM , sM ) . Para un eclipse anular, en el que el semidiámetro del Sol es mayor que el del planeta, se tendrá ⇡s2 ⇡s2P s2P = = 1 . ⇡s2 s2 Finalmente podemos reunir todas las expresiones para la magnitud de un eclipse: 8 si > > 1, > > > si > 0, > > < 2 sP (s, s , sP ) = 1 si 2 > > s > > > 2 > A(lm , sm ) A(lM , sM ) > > ⇡s si : ⇡s2 y dar una expresión general s + sP < s, s < sP y s < s P s , sP < s y s < s sP , |s sP | < s < s + sP , (15.12) donde sm , sM , lm , lM vienen dados por (15.10) y (15.11). 15.3.5 Eclipses en satélites artificiales terrestres En el caso de los satélites artificiales terrestres pueden darse dos tipos distintos de eclipses: los producidos por la Tierra y los producidos por la Luna. Los primeros solo pueden ser parciales o totales, mientras que los segundos pueden ser parciales, totales o anulares. Perturbaciones relativistas 247 En ambos casos podemos usar las expresiones vistas en la sección 15.3 donde se tendrán las relaciones S = x x, SL = xL x, ST = x, siendo x el vector de posición del satélite, y xL , x los vectores de posición de la Luna y del Sol desde la Tierra. 15.4 Perturbaciones relativistas La formulación del movimiento orbital deberı́a, en rigor, ser efectuada de acuerdo con la teorı́a de la relatividad general en lugar de usar la ecuación fundamental de Newton de la Mecánica. La complejidad de esta formulación y el pequeño efecto que produce sobre la órbita obtenida por medio del planteamiento clásico hacen que la corrección relativista sea también tratada como una pequeña perturbación al modelo kepleriano. Este modelo, basado en la teorı́a newtoniana más las correcciones post-newtonianas, es llamado aproximación post-newtoniana. La aproximación post-newtoniana al problema de n cuerpos conduce a las ecuaciones EIH (Einstein, Infeld y Ho↵man). Estas ecuaciones han permitido descubrir el mayor efecto de la relatividad sobre el movimiento orbital, en concreto para las órbitas de los planetas: el desplazamiento del perihelio o variación del ángulo !. Este efecto fue detectado a mediados del siglo XIX en el planeta Mercurio y fue cuantificado por medio de la aproximación post-newtoniana en una variación por vuelta de != 24 ⇡ 3 a2 . P 2 c2 (1 e2 ) En el caso de Mercurio la anterior relación conduce a un valor de ! = 4.82⇥10 7 radianes, lo que equivale a unos 4300 por siglo. Para el planeta Venus el avance del perihelio es de 8.00 64 por siglo. La contribución post-newtoniana a la aceleración de un satélite artificial terrestre puede expresarse como ✓ ◆ µ 1 4µ PPN = 3 2 v 2 x + 4(x · X)X . (15.13) r c r Para una órbita circular se tendrá x · X = 0 y v 2 = µ/r, por lo tanto, la expresión (15.13) se transformará en ✓ ◆ µ x 3v 2 PPN = 3 , (15.14) r c2 248 Otras perturbaciones es decir coincide con la aceleración en el problema kepleriano multiplicada por el factor 3v 2 /c2 que vale aproximadamente 10 10 , lo que constituye una perturbación muy pequeña. 15.5 Perturbaciones empı́ricas Todos los modelos de fuerzas tratados en este capı́tulo aplican simplificaciones basadas en el desconocimiento y la imposibilidad de modelar algunos de los múltiples parámetros que en ellas aparecen. Incluso considerando el gran esfuerzo desarrollado en la obtención de modelos precisos de las fuerzas que actúan sobre el satélite siempre tendremos un grado de incertidumbre derivado del mal conocimiento de los parámetros y su variación. Para tener en cuenta el efecto de todas estas fuerzas mal modeladas, o incluso no modeladas, se ha introducido el concepto de fuerza o perturbación empı́rica. Estas aceleraciones tienen una expresión muy simple, basada en unos parámetros sin significado fı́sico, que pueden ser obtenidos por métodos de determinación de órbitas una vez que el satélite está en el espacio. Obviamente estas técnicas no sirven para un conocimiento previo de la órbita, sino para un conocimiento de alta precisión de la misma a posteriori. Pueden modelarse dos tipos de fuerzas empı́ricas: fuerzas tangentes a la órbita y fuerzas con una frecuencia de una revolución (one-cycle-orbital revolution 1CPR). Las aceleración de las fuerzas empı́ricas en la dirección tangente se expresa en la forma P T AN = Ct t, (15.15) donde Ct es el parámetro tangencial empı́rico y t es la dirección del vector velocidad. La aceleración producida por las fuerzas 1CPR suelen expresarse de la siguiente manera P 1CP R = C cos ✓ + S sen ✓, (15.16) donde ✓ es el argumento de latitud, C = Cu u+Cv v+Cn n y S = Su u+Sv v+Sn n, siendo Cu , Cv , Cn , Su , Sv , Sn los parámetros empı́ricos de la perturbación y u, v, n los vectores del sistema orbital donde se ha formulado la expresión de P 1CP R . Tanto esta fuerza P 1CP R como P T AN deben expresarse finalmente en el sistema orbital. Parte IV Navegación espacial 249 Capı́tulo 16 Navegación espacial 16.1 Introducción El afán viajero del ser humano, junto con su necesidad de supervivencia y su espı́ritu explorador y aventurero impulsaron, en la antigüedad, su expansión por toda la Tierra, viajando, tanto por tierra como por mar, pese a los peligros que este tipo de viajes comportaban. A pesar de que su sueño se extendı́a fuera de la Tierra, no fue hasta el comienzo del siglo XX cuando el hombre consigue por primera vez alejarse de la superficie, en primer lugar a sus proximidades con la aviación y posteriormente, a partir del año 1957, hacia el espacio, iniciando una actividad que solo tiene medio siglo pero que ya ha cambiado el modo de vivir del hombre. Aunque el concepto del cohete, dispositivo propulsado a reacción por la expulsión de los gases generados por una combustión, es conocido desde la invención de la pólvora por los chinos, no es hasta los trabajos de tres pioneros: el ruso Konstantin Tsiolkovski(1857-1935), el norteamericano Robert H. Goddard (1882-1945) y el alemán Hermann Oberth(1894-1989), cuando se ponen las bases de la tecnologı́a moderna de cohetes que permitió poco después el desarrollo de la industria espacial. Estos cientı́ficos proponen y desarrollan el uso de combustible lı́quido en lugar de sólido, los estabilizadores de los cohetes por medio de giróscopos, etc. El primer precedente moderno de los actuales cohetes, que son la base para el envı́o de naves al espacio, son los misiles V2 desarrollados por Alemania durante la segunda guerra mundial bajo la dirección de Wernher von Braun. Tras la derrota de ésta sus cientı́ficos son repartidos entre Estados Unidos y la Unión Soviética. Ambos estados inician, en paralelo, una desaforada carrera espacial establecida 252 Navegación espacial como un campo de batalla más de la guerra frı́a. En este primer periodo Estados Unidos no logra un proyecto común por discrepancias entre los distintos ejércitos y por ello la URSS, con un equipo dirigido por Sergei Korolev, consigue tomar ventaja enviando al espacio el Sputnik I el dı́a 4 de octubre de 1957. El Sputnik I, de 83 kg de peso, fue situado en una órbita de 250 km de altitud, donde permaneció hasta su incineración, en su reentrada en la atmósfera, el 3 de enero de 1958. Casi a continuación la URSS lanza un segundo satélite, el Sputnik II, que transportaba en su interior al primer ser vivo que viajó al espacio: la perrita Laika, que falleció unos 10 dı́as después de entrar en órbita. Estos dos éxitos consecutivos de la industria espacial soviética forzaron a los norteamericanos a dos lanzamientos casi seguidos: el Vanguard-1, lanzado por la armada el 5 de diciembre de 1957 y que fracasó y el Explorer I, lanzado con éxito por el ejército el 31 de diciembre de 1957. Sin embargo, la consecuencia más importante para Norteamérica, derivada de sus primeros fracasos, fue la creación de una agencia espacial para coordinar todos los esfuerzos en esta carrera, ası́, el 1 de octubre de 1958 comienza a operar la NASA con cuatro laboratorios y unos 8000 empleados. Planteada la carrera espacial como consecución de hitos y no con una estrategia cientı́fica, es la URSS la que sigue, durante mucho tiempo, llevando la iniciativa: obtiene las primeras imágenes de la cara oculta de la Luna el 4 de octubre de 1959; es la primera que pone un ser humano, Yury Gagarin, en órbita el 12 de abril de 1961; etc. Todo esto lleva a la administración Kennedy, a plantear, en un famoso discurso pronunciado el 25 de mayo de 1961, la consecución de un ambicioso proyecto que tenı́a como objetivo que el hombre pisara la Luna antes de una década. Como todos sabemos este proyecto concluyó con uno de los mayores logros del ser humano en toda su historia: el dı́a 20 de julio de 1969 el astronauta Neil Armstrong consiguió uno de los más esperados sueños de todo ser humano: pisar la Luna. Una vez conseguidos todos los hitos posibles y demostrada la posibilidad de que el hombre llegue al espacio, la carrera espacial entra en una fase más cientı́fica y las misiones se plantean con criterios más racionales, aunque durante la guerra frı́a algunos de los resultados cientı́ficos y tecnológicos derivados de la carrera espacial, como por ejemplo los modelos precisos de potencial terrestre, son declarados información clasificada. El final de la guerra frı́a pone en peligro la industria espacial soviética, que en ese momento tiene como misión estrella la estación espacial Mir, haciendo incluso peligrar la vida de alguno de sus astronautas. Afortunadamente esto da pie a un inicio de colaboración entre agencias, incluida la Agencia Europea del Espacio (ESA), creada en el año 1975, que aunque dista todavı́a mucho de ser óptimo, ha dado lugar a uno de los proyectos de cooperación internacionales más ambiciosos y útiles, la Estación Espacial Internacional (ISS). Este medio siglo de navegación espacial ha venido caracterizado por dos grandes retos, que a veces se confunden, pero que corresponden a dos aspectos muy distintos de la navegación espacial: Satélites artificiales terrestres 253 Los satélites artificiales, que son objetos en órbita alrededor de la Tierra que ayudan al hombre en su desarrollo tecnológico y cientı́fico. La navegación interplanetaria, que partir de naves que se alejan de la Tierra permite explorar el sistema solar y que algún dı́a pueden llevar al hombre a otros planetas. 16.2 Satélites artificiales terrestres Los satélites artificiales terrestres son objetos construidos por el hombre y situados en el espacio, en órbita alrededor de la Tierra, a una altitud, sobre la superficie terrestre, que siempre es menor de unos 40000 km. Podemos establecer varias clasificaciones de los satélites artificiales atendiendo a diversos aspectos. Nos fijaremos aquı́ únicamente en tres aspectos: masa del satélite, tipo de la misión y órbita del satélite. Revisaremos en este apartado las dos primeras clasificaciones dejando la última para el siguiente capı́tulo, después de haber analizado con más detalle las órbitas de los satélites. En esta caracterización se hará mención de algunos conceptos que se irán profundizando a lo largo de ésta última parte del libro. La clasificación del satélite en cuanto a su masa no es una clasificación fundamental, pero en este momento de desarrollo de la tecnologı́a se hace cada vez más importante porque incide en el coste del lanzamiento y en la capacidad técnica o cientı́fica de la misión a realizar. En la clasificación más moderna podemos considerar como pequeño un satélite por debajo de 500 kg. Entre éstos podemos hablar de: minisatélites, entre 100 y 500 kg, microsatélites, entre 10 y 100 kg, nanosatélites, entre 1 y 10 kg, y finalmente los picosatélites con un peso menor o alrededor de 1 kg. Por encima de los pequeños satélites nos podemos encontrar satélites de tamaño medio, entre 500 y 1000 kg y los grandes satélites con más de 1000 kg. Aunque al comienzo de la era espacial los satélites eran pequeños por las necesidades y condicionamientos del lanzamiento, poco a poco fueron aumentando en tamaño y masa. El gran handicap de la industria espacial es el enorme coste de las naves capaces de poner en órbita un satélite artificial. Únicamente las grandes agencias espaciales, soportadas por grandes presupuestos, son capaces de construir dichas naves, por lo que inicialmente fueron las únicas en participar en la carrera espacial. La posibilidad de alquilar dichas naves ha abierto la tecnologı́a espacial a otras entidades como gobiernos, empresas privadas, universidades, que son capaces de construir un satélite y alquilar la nave que realiza el lanzamiento de dicho satélite. El coste de dicho lanzamiento y el de la construcción del satélite artificial se reducen en función del tamaño y masa del mismo, lo que ha propiciado un aumento del número de misiones de satélites de pequeña masa. 254 Navegación espacial En el otro extremo nos encontramos los grandes satélites artificiales, entre los que podemos destacar, en primer lugar, la estación espacial internacional, ISS, de 450 toneladas de peso, 1200 m3 de espacio útil y unas dimensiones de 108 ⇥ 80 m. y por otro lado algún satélite de observación astronómica, como el Hubble, que pesa 11 toneladas y tiene forma de tubo de telescopio de 13 metros de largo con unos paneles solares a los lados. Para comprender el enorme y rápido desarrollo de la industria espacial es mejor observar la clasificación de los satélites artificiales en función del tipo de misión que realizan. Esto nos hará comprender la utilidad real de los satélites artificiales. Aparte del uso militar de los satélites artificiales, del que no hablaremos en este libro, podemos dividir el tipo de misiones espaciales en cinco grupos: Satélites de comunicaciones. Satélites de navegación. Satélites de observación terrestre. Satélites cientı́ficos. Estaciones espaciales. 16.2.1 Satélites de comunicaciones El problema de las comunicaciones fue visto desde el principio como uno de los campos donde la tecnologı́a de los satélites podı́a ser de utilidad. Un primer intento de comunicar dos estaciones desde un satélite fue realizado a través del satélite Score, lanzado en 1958, y que portaba una grabadora que grababa mensajes al pasar por una estación y los reproducı́a al pasar por otra. El primer satélite de comunicaciones fue el Echo, lanzado por los Estados Unidos el 12 de agosto de 1960. Este satélite no es realmente un satélite de comunicaciones como los que actualmente se lanzan, sino que se trataba de un satélite pasivo, de órbita baja, que se limitaba a reenviar a una estación la señal recibida desde otra durante el paso del satélite por encima de la estación. Telstar fue el primer satélite activo1 de comunicaciones. El primer Telstar fue construido por la empresa AT&T y lanzado por la NASA en 1963, tenı́a una órbita muy excéntrica e inclinada. Éste fue el primero de una larga serie de satélites lanzados por dicha empresa de comunicaciones y que todavı́a siguen lanzándose. En la actualidad se encuentran operacionales los satélites Telstar 11N, Telstar 12 y Telstar 18, y el último Telstar 14R, lanzado en mayo de 2011. Obviamente la tecnologı́a y el tipo de órbita han cambiado mucho durante este periodo. Los actuales satélites de comunicaciones utilizan preferentemente órbitas geosı́ncronas o geoestacionarias, que permiten el mantenimiento de una antena permanentemente dirigida al satélite, sin necesidad de efectuar un seguimiento del 1 Con receptor y emisor de señales. Satélites artificiales terrestres 255 mismo para emitir o recibir la señal. El primer satélite geosı́ncrono fue el Syncom 2 lanzado el año 1963 y que permitió realizar una conexión telefónica intercontinental, mientras que Syncom 3, lanzado al año siguiente en una órbita geoestacionaria, permitió la transmisión de las imágenes de los juegos olı́mpicos de Japón del año 1964. Como ejemplo de satélite geoestacionario de comunicaciones podemos mencionar el español Hispasat, que en realidad no está formado por uno, sino tres Hispasat (1C, 1D y 1D) situados en una longitud de 30 W. Al mismo sistema de comunicaciones Hispasat pertenecen también los dos satélites Amazonas (I y II) situados en una longitud de 61 W. El problema de las comunicaciones por satélite se complica en lugares como Rusia donde las elevadas latitudes no permiten la recepción de buenas señales con satélites geoestacionarios. Para resolver este problema se pusieron en órbita los satélites Molniya que dieron nombre a un tipo de órbita que se estudiará posteriormente. Estos satélites también han jugado un importante papel en el desarrollo de la industria espacial. El siguiente paso en el desarrollo de la tecnologı́a por satélite lo dieron las llamadas constelaciones de satélites, que consisten en una misión formada, no por uno, sino por muchos satélites puestos en varias órbitas distintas, situando además varios satélites espaciados en cada una de dichas órbitas. El sistema Iridium, para usos de telefonı́a, está formado por 66 satélites, en 11 órbitas polares bajas, a unos 785 km de altitud, con lo que se consigue una excelente cobertura desde cualquier lugar y en cualquier instante. El primer satélite de la constelación Iridium fue lanzado el 1 de noviembre de 1998 y aunque la empresa que lo comercializaba entró en bancarrota al año siguiente, el servicio fue reestablecido el año 2001 y sigue activo en este momento. 16.2.2 Satélites de navegación Otro importante problema resuelto por los satélites es el de la navegación. Desde siempre el problema de la determinación de la posición de un viajero ha movido a desarrollar sofisticados métodos de Astronomı́a de posición. Actualmente, el uso de los satélites artificiales ha elevado la precisión del cálculo de la posición a lı́mites insospechados. El primer satélite de navegación fue el Transit, lanzado en el año 1960. El satélite emitı́a en una frecuencia determinada desde una posición conocida de su órbita, la frecuencia recibida por el receptor varia ligeramente por el efecto Doppler, lo que permite obtener la posición del receptor. La aproximación lograda mediante el uso de los sucesivos satélites Transit permitı́a a los barcos obtener, en intervalos de entre 35 y 100 minutos, una posición con un error del orden de los 100 metros. 256 Navegación espacial Los satélites Transit siguen actualmente en funcionamiento, aunque desde el año 1996 han sido totalmente sustituidos por el sistema de navegación GPS (Global Positioning System). Este sistema está basado en una constelación de 24 satélites en 6 planos orbitales diferentes, con unas órbitas relativas que aseguran que sobre cada punto de la Tierra existen, en cada instante, varios de estos satélites de los que se puede recibir una señal. Cada satélite dispone además de dos relojes atómicos que le marcan su hora con una considerable precisión. Un receptor en Tierra, recibiendo la señal de varios de estos satélites, puede calcular, por triangulación espacial, su posición y velocidad en tiempo real, con una precisión de unos pocos metros en la posición y 0.1 m/s en la velocidad. Asimismo, se recibe la hora del sistema también llamada tiempo GPS. La precisión del sistema GPS puede ser mejorada notablemente, hasta centı́metros en algunos casos, por técnicas de corrección diferencial en el cálculo de la posición, combinadas con el apoyo de otros medios entre los que se encuentra, por ejemplo, el sistema EGNOS, que es la primera aportación importante europea a los sistemas de navegación. La disponibilidad, cada vez mayor, de los receptores de GPS, ası́ como su tamaño y precio, cada vez menor, ha popularizado enormemente su uso en los últimos años. Un sistema similar, con 24 satélites en tres órbitas, llamado GLONASS, ha sido desarrollado por Rusia y está operativo desde octubre de 2011. Desde entonces, muchos de sistemas de navegación, incluidos los incorporados a algunos smartphones, integran los servicios de GLONASS junto con los de GPS. Ante la importancia creciente de dichos sistemas, la Unión Europea está desarrollando un sistema de navegación propio, el sistema Galileo. Este sistema, aparte de evitar la dependencia tecnológica de Europa en un campo tan importante como es las aplicaciones de la navegación, pretende también mejorar la precisión y las prestaciones de los anteriores sistemas. El sistema Galileo, que deberı́a haber estado funcionando en 2010, ha sufrido numerosos retrasos que han llevado a que los cuatro primeros satélites, para la fase de validación en órbita, terminen de lanzarse en octubre de 2012. Está previsto que los 30 satélites de la constelación, situados en tres planos distintos, estén lanzados y el sistema esté completamente operativo en el año 2019. Galileo es un sistema civil, lo que asegura para la industria una continuidad de uso, no expuesta a criterios militares y polı́ticos que pueden llevar, en determinadas circunstancias, a una degradación e incluso paralización de la información emitida por el satélite. Por otro lado, Galileo no pretende competir, sino colaborar con los sistemas GPS y GLONASS; se prevé que los receptores Galileo sean compatibles con la señal de los anteriores. Además Galileo garantizará la fiabilidad de sus sistemas informando al usuario de cualquier posible fallo con un segundo de tiempo como máximo. Esta caracterı́stica es crucial para su uso en aviación, pues ası́ se podrá realizar de forma automática el aterrizaje de aviones. Otra caracterı́stica importante de Galileo es la función SAR (global Search and Rescue), que mediante un transpondedor situado en el satélite podrá transferir avisos de Satélites artificiales terrestres 257 emergencia para operaciones de rescate. En los últimos años se ha hecho notar la entrada de China en el desarrollo de la industria del espacio. Aunque en un principio realizó una inversión en el programa europeo Galileo, posteriormente decidió la construcción de su propio sistema de navegación, BeiDou Navigation System. Este sistema, cuyos primeros satélites fueron lanzados en el año 2000, tiene un diseño completamente diferente a las tres constelaciones GPS, GLONASS y Galileo, pues está basado en satélites geoestacionarios que no dan una cobertura global sino que ésta está limitada a la región asiática. 16.2.3 Satélites de observación terrestre El espacio es el mejor lugar para observar la superficie de la Tierra, por lo que los satélites se han constituido en el mejor instrumento para esta observación. Atendiendo a su aplicación, podemos distinguir cuatro tipos diferentes de satélites de observación terrestre: satélites geodésicos, satélites cartográficos, satélites meteorológicos, satélites medioambientales. Una de las primeras necesidades de la industria aeroespacial fue la determinación precisa del geoide (forma de la Tierra) que nos diera un modelo preciso de potencial terrestre para poder calcular las órbitas con suficiente precisión. Aunque el estudio de la órbita de cualquier satélite artificial permite mejorar los elementos del potencial terrestre, ha habido una serie de misiones diseñadas especı́ficamente para este fin. Una de las primeras y más importantes ha sido el programa Lageos, Laser Geodynamics Satellites, que ha puesto en órbita dos naves: Lageos-1, lanzado en 1976 y Lageos-2, lanzado en 1992, con el objetivo de una determinación de precisión del geoide y de los movimientos de las placas tectónicas asociados a la deriva continental. Otro uso de los satélites de observación terrestre es el de la cartografı́a de precisión de la Tierra y la toma de imágenes de alta resolución de la misma. Un ejemplo de ello es la aparición de la aplicación Google Maps, y otras que le van a seguir, que permiten una visión, en el futuro tridimensional, de gran precisión, de cualquier lugar de la Tierra, con una simple conexión a internet. Los satélites meteorológicos se dedican exclusivamente a la observación de la atmósfera en su conjunto. La comprensión de la dinámica atmosférica, el comportamiento de las masas nubosas o el movimiento del aire frı́o o caliente resultan indispensables para realizar predicciones del clima, pues sus efectos impactan de manera irremediable en las actividades de los seres humanos aquı́ en la Tierra. 258 Navegación espacial El primer satélite meteorológico fue el Tiros-1, lanzado en abril de 1960 después del fracaso del Vanguard 2. Después de éste ha habido muchos otros satélites meteorológicos situados en dos tipos de órbitas: polares o geoestacionarias. Los geoestacionarios, situados en un punto del ecuador, permiten obtener imágenes continuadas de todo un hemisferio que pueden presentarse como fijas o, si se unen varias, como una pelı́cula de la evolución de la atmósfera. En Europa disponemos de varios Meteosat situados sobre el océano Atlántico. Los satélites meteorológicos en órbita polar, como los de la serie NOAA mantienen una órbita que pasa varias veces al dı́a por un lugar concreto de la Tierra a la misma hora local2 lo que les da las mismas condiciones de iluminación. Finalmente, el cada vez mayor interés que el ser humano muestra por la ecologı́a está llevando a desarrollar una serie de misiones espaciales de estudio del medio ambiente. Como ejemplo mencionaremos únicamente el satélite europeo Envisat, Environmental Satellite, uno de los mayores satélites de observación terrestre jamás construido. Fue lanzado en marzo de 2002 y estuvo operativo hasta abril de 2012. Mediante sofisticados instrumentos ópticos y de radar ha realizado una continua observación de la atmósfera, los océanos, las zonas terrestres y las regiones polares de la Tierra. Su misión ha sido la de controlar el calentamiento global, el grado de la contaminación atmosférica y controlar los riesgos de desastres naturales para poder mitigar sus efectos. 16.2.4 Satélites cientı́ficos La ausencia de gravedad y de atmósfera hacen del espacio exterior un lugar privilegiado para realizar determinados experimentos cientı́ficos que en la superficie terrestre podrı́an quedar “contaminados”. La posibilidad de enviar al espacio satélites muy pequeños, de bajo coste en su construcción y en su lanzamiento, ha multiplicado la realización, desde satélites artificiales expresamente diseñados para ello, de muchos experimentos cientı́ficos individuales, tanto de empresas como de organismos de investigación y universidades. Sin embargo, la mejor posibilidad para la ciencia la proporciona la existencia de laboratorios estables en órbita, donde poder realizar una mayor variedad de experimentos. Éste es uno de los principales usos de las estaciones espaciales, que serán discutidas en el siguiente apartado. Afortunadamente para el ser humano la atmósfera terrestre nos proporciona un elemento fundamental, el oxı́geno, y nos protege de las peligrosas radiaciones procedentes del espacio. Sin embargo, la atmósfera es un elemento muy perjudicial para la Astronomı́a pues distorsiona las imágenes recibidas y no permite la observación de determinadas longitudes de onda. Los satélites nos proporcionan la oportunidad de superar la atmósfera terrestre y realizar observaciones mucho más precisas y por ello la Astronomı́a ha sido una de las ciencias más beneficiadas por el desarrollo de la industria espacial. 2 Satélites heliosı́ncronos (estudiados en el siguiente capı́tulo). Satélites artificiales terrestres 259 Aunque ha habido muchas misiones cientı́ficas para la observación del espacio destacaré únicamente dos: El satélite europeo Hipparcos y el telescopio espacial Hubble, HST. El satélite astrométrico Hipparcos, lanzado en agosto de 1989 y activo hasta 1993 ha permitido, entre otras muchas cosas, la medición precisa de posiciones y movimientos propios de cientos de miles de estrellas, dando lugar a dos catálogos: Hipparcos y Ticho que constituyen, por su precisión, el sistema de referencia estelar básico para los próximos años y ha llevado a modificar la escala cósmica de distancias o la edad del Universo. El telescopio Hubble, de 2.5 metros de diámetro, fue lanzado en 1990, aunque un error en su diseño impidió, durante unos años, obtener la gran nitidez de imágenes que de él se esperaba. La reparación de su miopı́a fue efectuada en órbita por el transbordador espacial en el año 1997. Este telescopio ha permitido realizar grandes descubrimientos astronómicos, tanto antes como después de la reparación. Se estima que cientı́ficos de más de 45 paı́ses han realizados unas 5000 publicaciones en revistas especializadas de resultados obtenidos por las observaciones del Hubble. Su sustitución está prevista por el James Webb Space telescope, un telescopio con un espejo de 6.5 m de diámetro cuyo lanzamiento está previsto para el año 2018. 16.2.5 Estaciones espaciales Al contrario que los satélites artificiales estándar, que son naves más o menos pequeñas pero diseñadas únicamente para llevar instrumentos con los que realizar la misión para la que están diseñados, las estaciones espaciales son grandes estructuras en órbita donde el hombre puede vivir durante periodos de tiempo más o menos largos. Las estaciones espaciales constituyen un laboratorio donde estudiar la interacción del hombre y el espacio con vistas a una futura exploración del mismo. Asimismo permite estudiar la acción de la falta de gravedad sobre cualquier fenómeno cientı́fico por lo que constituye un inmejorable escenario para el desarrollo de la ciencia. Hasta el momento ha habido cuatro estaciones espaciales: dos rusas Salyut y Mir, otra norteamericana Skylab y una internacional, la única actualmente en órbita, la Estación Espacial Internacional, ISS. La misión Salyut constituye el primer esfuerzo serio del ser humano en poner una estación en órbita. En realidad no fue una sino siete naves distintas. Las cinco primeras, al igual que la norteamericana Skylab, fueron lanzadas en una sola pieza incluyendo en ellas toda la instrumentación y medios necesarios para su vida útil, lo que redujo ésta considerablemente. La Salyut 1 fue lanzada el 19 de abril de 1971 y se desintegró en la atmósfera el 11 de octubre del mismo año. La Salyut 5 estuvo en órbita desde el 22 de junio de 1976 hasta el 8 de agosto de 1977. Todas 260 Navegación espacial ellas tuvieron un máximo de dos o tres visitas de varios astronautas. La nave Skylab fue puesta en órbita el 14 de mayo de 1973, recibiendo tres visitas, cada una con tres astronautas, la última de una duración de 84 dı́as y que terminó el 8 de febrero de 1974. A partir de ese dı́a no fue más usada hasta que se estrelló en la atmósfera el 11 de julio de 1979. Con las Salyut 6 y 7 se ensaya un nuevo concepto de estación espacial, pues se prueba su forma modular y un esquema de funcionamiento que permite reponer su soporte vital para alargar el tiempo de vida de la misión. De esta forma, la Salyut 7 estuvo en órbita 3216 dı́as entre 1982 y 1991 recibiendo 26 visitas, 12 tripuladas y 15 no tripuladas y estando ocupada durante 816 dı́as. El primer módulo de la estación espacial Mir fue lanzado el 19 de febrero de 1986, mientras que el resto de módulos, hasta seis, fueron lanzados entre 1988 y 1996. El 23 de marzo de 2001 terminó la misión Mir con su reentrada controlada en la atmósfera y posterior destrucción, siendo, junto con el proyecto Apolo, una de las misiones concluidas más importante de la carrera espacial. La estación Mir fue habitada continuamente hasta 1999, en un principio por cosmonautas rusos, aunque posteriormente con la caı́da de la Unión Soviética y la pérdida de presupuestos de la Agencia Espacial Rusa se llegó a un punto de colaboración con la NASA que permitió, por un lado, la llegada de astronautas norteamericanos a la Mir y por otro un comienzo de colaboración que dio lugar al proyecto de la Estación Espacial Internacional ISS, al que se adhirieron posteriormente Europa, Japón y Canadá. La ISS, cuya construcción comenzó el 20 de noviembre de 1998, es un proyecto muy importante por su carácter de colaboración entre agencias espaciales, contrario al espı́ritu de lucha entre éstas heredado de los comienzos de la carrera espacial coincidentes en el tiempo con la guerra frı́a. 16.2.6 Vehı́culos de transporte de carga Para el buen funcionamiento de un estación espacial es necesario disponer de vehı́culos de carga que puedan llevar y traer de la estación instrumentos y personas. Esto exige que dichos vehı́culos no queden en órbita o se destruyan en la reentrada sino que deben poder ser recuperados con su carga intacta. La ida y vuelta a la estación Mir era realizada por dos tipos de naves: Soyuz y Progress. La nave Soyuz está formada por varias partes: el módulo de servicio, el módulo orbital y la cápsula de la tripulación. El módulo de servicio es el cohete o vehı́culo de lanzamiento, propiamente dicho, que impulsa la nave a la órbita adecuada. El módulo orbital contiene el equipo necesario para la supervivencia de la tripulación, tiene forma esférica y está situado en la parte delantera del vehı́culo. Finalmente, la cápsula de la tripulación es la única parte del vehı́culo que llega a la Tierra, por lo que va equipada de un escudo térmico y dos paracaı́das. Tiene forma de campana y en su interior pueden ir hasta tres tripulantes. Durante el aterrizaje se abre el paracaı́das y el escudo térmico se desprende para poder Satélites artificiales terrestres 261 utilizar una serie de retrocohetes de combustible sólido, situados en la base de la cápsula, que frenan el impacto con el suelo. La primera nave Soyuz fue enviada al espacio en 1967 y aunque ha tenido una enorme evolución se sigue usando en la actualidad con el mismo diseño básico. El modelo usado para los viajes a la Mir fue la Soyuz-TM, y desde 2002 se usa la Soyuz-TMA para viajes a la ISS. Una versión más simplificada de la nave Soyuz, que no puede volver a la Tierra, es la nave Progress, con su versión actual la Progress-M. Esta nave puede cargar instrumentos y material hacia la estación espacial y es cargada de desechos de la estación para su destrucción en la reentrada en la atmósfera. El uso de vehı́culos recuperables pero no reutilizables parecı́a demasiado costoso, sobre todo para misiones con grandes necesidades de uso de dichos vehı́culos como una estación espacial. Por ello, la NASA decidió comenzar el programa del Space Shuttle o transbordador espacial. Tras el lanzamiento del Columbia el 12 de abril del 1981 se dispuso de las únicas naves reutilizables3 capaces de transportar material y tripulación y que pueden poner satélites en órbitas bajas, ası́ como repararlos y traerlos de vuelta a la Tierra. Un transbordador espacial está formada por el cohete lanzador, no reutilizable, formado por un gran tanque de combustible central y dos cohetes laterales. Esta parte se desprende unos 8.5 minutos después del lanzamiento, destruyéndose antes de llegar a la Tierra. La parte reutilizable tiene forma de un pesado avión, de unos 37 metros de longitud y 24 de envergadura, que toma Tierra en una gran pista de aterrizaje. Un transbordador puede llevar una carga de unas 28 toneladas y devolver a la Tierra unas 14. Puede llegar a una altitud de 1000 km, aunque nunca lo ha hecho más allá de 600 km, altitud conseguida en su misión para reparar el telescopio Hubble. El 8 de julio de 2011 se lanzó al espacio el Atlantis, siendo ésta la última misión de un transbordador espacial. Hasta entonces ha habido una flota de 5 transbordadores que han realizado un total de 135 misiones que han dado unas 21158 vueltas a la Tierra en más 1330 dı́as de vuelo. Se han realizado con ellos 9 misiones a la estación Mir y 37 a la ISS. Las tragedias del Challeger, que se destruyó, en 1986, 73 segundos después de su lanzamiento, y del Columbia, perdido el 1 de febrero de 2003 en su reentrada a la atmósfera, han paralizado en parte la construcción de la ISS y han llevado a la NASA a replantear sus prioridades. Estas tragedias nos recuerdan que la conquista espacial tiene poco más de medio siglo y, aunque la tecnologı́a ha mejorado mucho en los últimos años, los vuelos espaciales todavı́a tienen una importante componente de riesgo como en su dı́a lo tuvieron la navegación marı́tima y la aérea. Afortunadamente, la gran seguridad y fiabilidad de las naves Soyuz han permitido que el proyecto de la ISS no se paralizara completamente aunque si se ha ralentizado notablemente. 3 Los proyectos Hermes (ESA) y Burán (Rusia), similares al transbordador espacial, fueron cancelados. 262 Navegación espacial Actualmente la NASA no contempla una revisión del transbordador espacial, sino la construcción de una nueva generación de vehı́culos, llamados Orion(MPCV) (Multi-Purpose Crew Vehicle), junto con una nueva gama de cohetes lanzadores. Con el nuevo proyecto, la NASA apuesta por naves tripuladas no reutilizables que sirvan, tanto para lanzamientos a la ISS, como hacia la Luna y Marte. En 2006 la Agencia Espacial Rusa, junto con la ESA y posteriormente la Agencia Japonesa (JAXA) deciden construir el sistema ACTS (Advanced Crew Tansportation System), aunque posteriormente dicha colaboración quedó suspendida. 16.2.7 Basura espacial Desde 1957 se han lanzado al espacio miles de objetos. Todos ellos han sido lanzados desde un cohete con una serie de etapas que se iban separando y dejando caer a la Tierra, sin embargo, la altitud a la que se separan las distintas etapas y las explosiones ocurridas en las últimas fases han provocado que múltiples fragmentos de distintos tamaños de estos cohetes hayan permanecido en órbitas bajas y no hayan caı́do directamente a la Tierra. Por otro lado, un satélite puesto en órbita tiene una vida limitada por la cantidad de combustible que carga para realizar las maniobras que lo mantienen en su órbita y por la operatividad de sus instrumentos. Cuando un satélite termina su vida útil puede, si posee el combustible necesario, ser impulsado a una órbita suficientemente baja para que la atmósfera terrestre lo destruya o puede ser dejado en órbita indefinidamente. Otros objetos han sido destruidos deliberadamente como el satélite meteorológico Chino FY-1C, de la serie Fengyun, que fue destruido en enero de 2007 para probar un misil Chino antisatélites. Esto creó más de 2300 fragmentos mayores que una pelota de golf y al menos 150000 fragmentos de basura espacial. Se estima que de los más de 9000 grandes objetos todavı́a en órbita, solamente el 7 % están activos, mientras que encontramos más del 22 % de naves obsoletas, el 17 % de restos de cohetes y el 13 % de objetos relacionados con las misiones. Todos los objetos que de una u otra forma han quedado en órbita y que no son satélites activos, junto con otros objetos más pequeños procedentes de restos de asteroides y cometas, forman una enorme capa alrededor de la Tierra llamada basura espacial. En estos momentos se estima que la basura espacial está formada por más de 20000 objetos mayores de 10 cm, unos 600000 de entre 1 y 10 cm y más de 300 millones de menos de 1 cm. Las probabilidades de colisión de uno de estos fragmentos con alguno de los satélites activos no es despreciable, por lo que la comunidad cientı́fica está realizando un gran esfuerzo en solucionar este problema que aumenta dı́a a dı́a con cada lanzamiento de naves al espacio. La mayor parte de la basura espacial se encuentra en órbitas bajas, entre 600 y 2000 km por encima de la superficie terrestre. La mayor concentración se da entre los 800 km y 1500 km de altitud. El rozamiento atmosférico, que es mayor Navegación interplanetaria 263 cuanto más próximos estemos a la Tierra, produce una disminución progresiva de la altitud de estos cuerpos que llegan a caer a la Tierra después de unos dı́as si su altitud es menor que 200 km, en unos pocos años para altitudes hasta 600 km, en décadas si están entre 600 y 800 km y en más de un siglo en altitudes mayores que los 1000 km. En estas altitudes la velocidad media de estos objetos es de unos 7 km/s, aunque el valor medio de la velocidad de un impacto es de unos 10 km/s. Con esta velocidad la energı́a de un objeto esférico de aluminio de 1 cm es comparable a la de un automóvil a 90 km/h. En la altitud de las órbitas geoestacionarias la densidad de la basura espacial es mucho menor, sin embargo, un objeto en esta órbita nunca volverá por si solo hacia la Tierra. Para evitar esto, normalmente al final de la vida útil de estos satélites se guarda un poco de combustible4 para situarlo en una órbita cementerio situada a unos 300 km más de altitud. Los objetos en órbita de más de 3 mm pueden ser detectados por medio de observaciones de radar y ópticas realizadas desde la Tierra, sin embargo, únicamente se puede realizar un seguimiento orbital de estos objetos cuando su tamaño es mayor de 10 cm. La ISS y otros grandes satélites, tienen prevista la realización de maniobras especiales para esquivar los objetos de más de 10 cm cuando la probabilidad de colisión es muy alta. La media de realizaciones de dichas maniobras es de una cada uno o dos años. Los objetos de menos de 1 cm no suelen provocar grandes daños pues estas naves llevan protección suficiente para impactos con dichos objetos. El mayor peligro son los objetos de entre 1 y 10 cm, que pueden producir daños considerables pero no se tiene un conocimiento preciso de su órbita. A pesar de todo, en medio siglo de navegación solo se ha producido un accidente grave, el 10 de febrero del 2009, cuando colisionaron, destruyéndose mutuamente, los satélites Iridium 33 y Cosmos 2251. Sin embargo, resulta imprescindible la toma en consideración de este problema y la colaboración para su solución. El Comité de coordinación entre-agencias para la basura espacial (IADC) ha elaborado una serie de propuestas que han servido como base a la normativa adoptada por el comité de las Naciones Unidas para usos pacı́ficos del espacio exterior. 16.3 Navegación interplanetaria El segundo gran reto planteado por la navegación espacial es el viaje por el sistema solar alejándonos del entorno de la Tierra. Prescindiremos, por ahora, de las diferencias en la dinámica del problema y nos centraremos en las diferencias derivadas de la utilidad o rentabilidad de dicho viaje. Ası́ como de la industria de los satélites artificiales podemos sacar consecuencias tecnológicas directas, relacionadas con las comunicaciones, la navegación, el 4 Es suficiente con el combustible necesario para mantener el satélite en su órbita geoestacionaria durante tres meses. 264 Navegación espacial conocimiento del clima, etc; la exploración del espacio exterior no nos proporciona, por el momento, consecuencias tan directas, sino únicamente las indirectas, obtenidas como consecuencia de descubrimientos realizados en el curso del desarrollo de una misión. Ası́ distinguiremos dos tipos de misiones: Las encaminadas a la llegada del hombre a la Luna o Marte y su posterior colonización. Las puramente cientı́ficas encaminadas a un mayor conocimiento del sistema solar. Incluimos en las primeras sólo la Luna o Marte porque el viaje a otros cuerpos del sistema solar queda todavı́a demasiado alejado en el futuro. Las misiones no tripuladas a la Luna o Marte pueden encuadrarse en ambos tipos, pues un mayor conocimiento de estos cuerpos contribuirá a una más segura colonización de los mismos. Con la llegada del hombre a la Luna, en 1969, se constató una realidad: el hombre es capaz de conquistar el espacio pero la tecnologı́a de aquel momento no permitı́a hacerlo con seguridad. Probablemente la tecnologı́a actual no sea todavı́a capaz de este reto, pero el potencial humano, cientı́fico y tecnológico, es tal que le pueden permitir abordarlo si no está sujeto por condicionamientos polı́ticos o militares. Obviamente, las condiciones deberı́an ser las de una profunda colaboración entre todas las agencias del espacio soportadas, tanto por los gobiernos como por la industria. En estas condiciones, aunque el costo de dicha misión serı́a muy elevado, la cantidad de resultados cientı́ficos que pueden revertir en la sociedad es muy grande, como ya lo demostró el proyecto Apolo. Piénsese que el reto de llevar el hombre a Marte no puede considerarse únicamente como un largo viaje, y pensar únicamente en los problemas dinámicos y tecnológicos de la nave, sino que debe abordarse el principal problema que debe ser resuelto antes del inicio del viaje: ¿Cómo llevar a varios seres humanos en un viaje tal, que entre la ida, la vuelta y la estancia debe durar más de dos años, alimentarlos, darles de beber, protegerlos de un medio hostil, mantenerlos en buen estado de salud y devolverlos a la Tierra sanos y salvos? Si este problema se resuelve implicarı́a un avance sin precedentes en la medicina, en el problema de la escasez de agua dulce, en el desarrollo de fuentes de alimentación, lo que puede, si no resolver, si paliar algunos de los problemas de la humanidad. 16.3.1 Viajes a la Luna Los viajes del hombre a la Luna han tenido dos partes separadas por el final de la misión Apolo. Una primera, inmersa en el comienzo de la carrera espacial, en la que han participado únicamente USA y la URSS y cuyo objetivo principal fue que el hombre pisara la Luna. La segunda, más abierta a otros paı́ses, ha sido realizada con naves no tripuladas. Navegación interplanetaria 265 En la caso de la Unión Soviética se han enviado misiones a la Luna, entre 1959 y 1976, con dos tipos de naves diferentes, las Luna y las Zond, veinticuatro de las primeras y cinco de las segundas. De ellas veinte misiones han terminado con éxito y en la carrera por ser los primeros en lograr alguna meta han conseguido los siguientes hitos: la primera órbita de aproximación a la Luna, el primer alunizaje suave, la primera nave en impactar con la Luna, el primer orbitador lunar y la primera nave que después de alunizar regresó a la Tierra. Durante esta primera época Norteamérica ha realizado cuatro proyectos distintos pero todos de apoyo al objetivo final de poner un hombre en la Luna. El proyecto Ranger, entre 1961 y 1965, envió nueve naves para obtener imágenes de la Luna antes de impactar en ella. El proyecto Surveyor, entre 1966 y 1968, envió siete naves con las que los USA ensayaron un alunizaje suave. La misión Lunar Orbiter realizada entre 1966 y 1967 tenı́a por objeto orbitar la Luna para realizar una completa cartografı́a con objeto de elegir los lugares de alunizaje. Finalmente el proyecto Apolo, realizado entre 1963 y 1972 consiguió el objetivo final de pisar la Luna. El proyecto Apolo comenzó con la muerte en Tierra de los tripulantes del Apolo 1. A pesar del desastroso comienzo y de otro amago de catástrofe del Apolo 13, la misión acabó siendo un completo éxito y en seis ocasiones, con los Apolo 11, 12, 14, 15, 16 y 17, se pudo pisar la Luna y devolver a los astronautas a la Tierra con sus muestras de suelo lunar. A partir de ese momento concluyen las misiones a la Luna, hasta el instante en que la nave Galileo, en su viaje a Júpiter, realiza una aproximación a la Luna para aprovechar su impulso gravitacional. Después de esto es Japón en 1990, quien vuelve a enviar una nave a la Luna, la Hiten (Muses-A), que llega a realizar una aproximación, orbitar y finalmente impactar en la Luna. Estados Unidos vuelve a enviar dos misiones: la Clementine, en 1994 y Lunar Prospector en 1996. Ambas realizan misiones totalmente cientı́ficas, entre otras, el análisis de la existencia de hielo en los polos de la Luna. Mediante estas misiones se consigue un gran conocimiento, no solo de la cartografı́a de la Luna, sino también de su campo gravitacional, lo que será fundamental para el futuro mantenimiento de satélites artificiales lunares. Una de las últimas misiones importantes, por el momento, se trata de la europea SMART-1, que comenzó su viaje en septiembre de 2003, llegó a la Luna en noviembre de 2004 y concluyó su misión impactando en su superficie en septiembre 2006. La razón de una misión tan larga, y la importancia de esta misión, es el ensayo de los nuevos propulsores iónicos de la nave que la han impulsado en una lenta aproximación a la Luna, pero a un coste muy bajo. Naturalmente, este tipo de propulsores no es adecuado para un viaje tripulado a la Luna, pero abre nuevas perspectivas a la navegación por el sistema solar. En la actualidad existen muchas misiones no tripuladas planeadas y en diversos grados de desarrollo. Además de las misiones Norteamericanas, Rusas, Europeas 266 Navegación espacial y Japonesas, tanto China como la India se han añadido al grupo de paı́ses con alguna misión lunar activa. Hay que destacar también la aparición de propuestas que involucran a la industria privada, como por ejemplo el Google Lunar X Prize 5 que, organizado por el X Prize Foundation y patrocinado por Google, ofrece un premio de 30 millones de dólares al equipo que consiga enviar una nave a la Luna, poniendo en su superficie un robot que deberá moverse por ella al menos 500 metros y enviar a la Tierra imágenes y video de alta definición. En este momento hay veinticinco equipos de todo el mundo registrados oficialmente en la competición. Mucha gente se pregunta si el hombre volverá a ir a la Luna y cuándo será esto. Tras más de cincuenta años de experiencia en el espacio, la tecnologı́a espacial ha alcanzado unos niveles que hacen relativamente fácil, aunque muy costoso, el situar de nuevo un hombre en la Luna con cierta seguridad. Aunque hay varias misiones, de casi todas las agencias espaciales, que planean llevar tripulaciones humanas a la Luna entre el 2020 y el 2030, es muy difı́cil, con la situación económica actual, saber si alguna de ellas llegará a buen puerto. Lo más probable es que todas las misiones actuales se retrasen. Lo que parece claro es que el hombre volverá a la Luna, y cuando lo haga será para quedarse, situando bases estables en su superficie y usándola como trampolı́n para futuras misiones mucho más ambiciosas a Marte y al resto del sistema solar. 16.3.2 Viajes a Marte Las misiones Apolo han sido las únicas misiones tripuladas realizadas en el espacio exterior. El resto de misiones únicamente han tenido objetivos cientı́ficos conducentes a una profundización del conocimiento del sistema solar. Sin embargo, separamos del resto los viajes a Marte debido a que éstos son el laboratorio de aprendizaje para una futura colonización de este planeta. La primera era de la carrera espacial no paró en la Luna sino que se extendió a otros planetas como Marte. Tras una serie de intentos, comenzados por los soviéticos en 1960, la primera nave que sobrevoló el planeta Marte fue la estadounidense Mariner 4, en julio de 1965. A ésta le siguieron las Mariner 6 y 7, en el año 69, y la Mariner 9, en el 71. Los soviéticos consiguieron orbitar por primera vez en torno a Marte en el año 1971 con la Mars 2 y un aterrizaje suave el 2 de diciembre de 1971 con la Mars 3, sin embargo, los instrumentos de esta última dejaron de funcionar 20 segundos después del aterrizaje. El mayor éxito de aquella fase lo obtuvieron las dos naves Viking, que alcanzaron Marte en 1976, posándose en la superficie y realizando un gran número de experimentos y descubrimientos cientı́ficos. Salvo los intentos de los soviéticos con las naves Phobos, en 1988, no fue hasta 1996, veinte años después de los Viking, cuando se vuelve al planeta Marte con 5 http://www.googlelunarxprize.org Navegación interplanetaria 267 dos importantes misiones: Mars Global Surveyor y Mars Pathfinder. La principal caracterı́stica de la primera fue su fase final de aproximación a Marte utilizando el rozamiento de la atmósfera marciana. La segunda consiguió posar en Marte un vehı́culo móvil, Rover, para una investigación más profunda del planeta. Además, con el desarrollo de la segunda misión se consiguió probar la posibilidad de realizar misiones muy complejas con una tecnologı́a mucho más barata que la utilizada hasta ese momento. La conquista de Marte ha estado también plagada de sonoros fracasos. El más conocido es el de las naves Mars Climate Orbiter y Mars Polar Lander. El error de la primera fue debido a no convertir unidades inglesas en unidades métricas a la hora de mandarles los comandos para su inserción en la órbita marciana. Ello provocó que la nave tuviese una altitud menor entre 80 y 90 km a la planeada, lo que causó que el esfuerzo y la fricción destruyera la nave. Ha habido otros fracasos como el de la nave japonesa Nozomi lanzada en julio de 1998. Europa también ha realizado su proyecto de viaje a Marte con la nave Mars Express lanzada el 2 de junio de 2003. Esta misión estaba formada por un orbitador, que debı́a realizar, entre otras cosas, una cartografı́a de precisión del planeta, aparte de otros estudios cientı́ficos como la búsqueda de agua, y un módulo de aterrizaje llamado Beagle. El Beagle se perdió al posarse en la superficie, sin embargo el orbitador continúa con éxito su misión. Casi simultáneamente a la Mars Express, aprovechando la oposición del planeta de dicho año fueron lanzadas también la Mars Reconnaissance Orbiter y las Mars Exploration Rover, con dos Rovers que se incorporaron al estudio de la superficie de Marte. La Mars Reconnaissance Orbiter se convirtió con la Mars Express, el Mars Odyssey, lanzado en 2001 y el Mars Global Surveyor en el cuarto satélite artificial de Marte. Recientemente, el 6 de agosto de 2012, se posó con éxito en la superficie un nuevo vehı́culo, el Curiosity. 16.3.3 Exploración del sistema solar En el medio siglo de tecnologı́a espacial, tanto el Sol, como todos los planetas y algún cometa y asteroide, han sido visitados por alguna nave de fabricación humana. El caso de Plutón es la única excepción hasta julio del 2015, cuando previsiblemente la nave New Horizons, lanzada en enero de 2006, lo sobrevolará, fotografiando tanto Plutón como su luna Caronte, para iniciar después un viaje hacia el cinturón de Kuiper, fuente de los cometas de corto periodo, donde se espera observar de cerca alguno de sus objetos. Antes de este intento de llegar y observar los confines del sistema solar se han lanzado al espacio profundo muchas sondas espaciales, para realizar muy variadas observaciones cientı́ficas que han cambiado profundamente nuestro conocimiento del entorno. Durante los años sesenta y principios de los setenta únicamente Venus, aparte de Marte, fue visitado por sondas espaciales. Los americanos usaron las Mariner 268 Navegación espacial y los soviéticos las Venera. Las Mariner 2 y 5 sobrevolaron Venus en 1962 y 1967 respectivamente, mientras que la Mariner 10, en 1974, sobrevoló Venus y después se acercó a Mercurio, llegando a 327 km de su superficie. Esta ha sido la única nave que se ha acercado a Mercurio hasta marzo de 2011 en que la nave Messenger, lanzada en agosto del 2004, fue insertada en su órbita. Los Venera son una larga serie de 16 naves lanzadas a Venus entre 1961 y 1983. Estas naves han realizado aproximaciones, han orbitado el planeta y se han posado en su superficie. Viajes más recientes a Venus han sido realizados con los proyectos Vega, proyecto sovietico continuación de los Venera en 1984 y 1985, y los norteamericanos Pioneer Venus, en 1978, y Magellan que entre 1990 y 1994 cartografió el planeta y estudió su campo gravitatorio. Actualmente aparte del Messenger la Agencia Europea del Espacio ha enviado la nave Venus Express, lanzada el 9 de noviembre de 2005 y que llegó a Venus en abril del 2006. La primera nave que viajó al exterior del sistema solar fue la Pioneer 10, lanzada por la NASA el 3 abril de 1972 y que el 3 de diciembre de 1973 llegó a su máxima aproximación al Júpiter pasando a unos 200000 km de éste y siguiendo en un viaje de escape del sistema solar. La Pioneer 11, lanzada en 1973 aprovechó el impulso gravitacional de Júpiter para acercarse por primera vez a Saturno, pasando el 1 de septiembre de 1979 a 21000 km de Saturno y finalmente alejarse del sistema solar. Además de la Pioneer 10 la única misión exclusiva a Júpiter fue la misión Galileo, lanzada en 1989, consistente en un orbitador y una sonda que se introdujo en la atmósfera de Júpiter. El resto de misiones han consistido en aproximaciones a Júpiter que han aprovechado su impulso para viajar a otros cuerpos. Además de la Pioneer 11, la Voyager 1, lanzada en 1977 y Cassini, lanzada en 1997, han pasado por Júpiter y continuado su viaje hasta Saturno. Esta última ha sido una misión entre la NASA y la ESA que han portado una sonda atmosférica, la Huygens, separada de la Cassini en diciembre de 2004 y que se introdujo en la atmósfera y aterrizó en Titán, el satélite de Saturno el 14 de enero de 2005. Mención especial merece la sonda Voyager 2 que fue lanzada en 1977 e inició un viaja que recorre casi todo el sistema solar pasando por las proximidades de Júpiter, Saturno, Urano y Neptuno aprovechando en cada uno su impulso gravitacional para aumentar su velocidad sin gasto de combustible y saltar al siguiente planeta. Actualmente se encuentra a unos 15000 millones de kilómetros del Sol. También se han realizado misiones de observación al Sol. De estas mencionaremos dos por sus especiales caracterı́sticas astrodinámicas. Por un lado la nave Ulysses es una sonda solar construida en colaboración por la NASA y la ESA y lanzada en 1990. Esta sonda está diseñada para estudiar y observar el Sol desde una posición nunca conseguida hasta ahora. La sonda tiene una órbita heliocéntrica polar que la separa del plano de la eclı́ptica. Además, en su paso por la eclı́ptica la nave realiza una aproximación al planeta Júpiter. Otra nave de observación solar, también proyecto conjunto NASA-ESA, es la SOHO, Solar and Heliospheric Observator, que fue lanzada en 1995 y cuya prin- Navegación interplanetaria 269 cipal caracterı́stica es realizar la observación del Sol desde el punto de Lagrange L1 del sistema Tierra-Sol. Los objetos menores, asteroides y cometas, también han tenido sus misiones espaciales en esta última época. Por un lado, para estudiar de cerca estos cuerpos con vistas a un mayor conocimiento del origen del sistema solar, y por otro, por los nuevos retos astrodinámicos que suponen. Mencionaré únicamente tres de las últimas misiones realizadas a estos cuerpos: Near y Deep Impact de la NASA, y Rosseta de la ESA. La misión Near, rebautizada como Near-Shoemaker fue diseñada para estudiar de cerca el asteroide Eros. Independientemente de los experimentos fı́sicos hay que destacar que la dinámica orbital en torno a un cuerpo de estas caracterı́sticas es muy compleja porque dicho cuerpo, al contrario que los planetas, tiene una forma fuertemente no esférica, muy irregular, que produce unas perturbaciones muy mal modeladas. El 17 de febrero de 1996 fue lanzado al espacio, el 14 de febrero de 2000 fue puesto en órbita alrededor de Eros y finalmente fue acercándose a su superficie con una serie de complejas maniobras hasta que el 12 de febrero de 2001 se poso en ella y continuó operando hasta que se perdió su señal el 28 de febrero. La Deep Impact fue lanzada el 12 de enero de 2005 para realizar un encuentro con el cometa 9P/Tempel 1 y lanzarle desde allı́ un proyectil el 1 de julio de 2005 para observar los efectos del mismo sobre el cometa. La Rosseta, lanzada el 2 de abril de 2004 tiene prevista una compleja órbita, que incluye varias aproximaciones a la Tierra y Marte para tomar impulso gravitacional y en la que durante varios años realizará aproximaciones a varios asteroides y cometas. La última aproximación se ha realizado en 2010 al asteroide 21 Lutetia, para entrar en modo pasivo hasta 2014 cuando después de aproximarse y orbitar alrededor del cometa 67P/Churyumov–Gerasimenko se posará en su superficie. 270 Navegación espacial Capı́tulo 17 Órbitas de satélites artificiales terrestres 17.1 Movimiento del satélite sobre la superficie terrestre En capı́tulos anteriores se ha analizado la órbita de cualquier cuerpo celeste incluidos los satélites artificiales. El hecho de considerar la Tierra, o algún planeta de caracterı́sticas similares, como cuerpo central de la órbita, añade a ésta propiedades que deben ser estudiadas separadamente de las del movimiento kepleriano. Por un lado, hay que considerar que la observación no se realiza desde el origen del sistema de referencia, o foco de la órbita relativa, sino desde algún lugar de la superficie de la Tierra que rota respecto al sistema espacial. En este capı́tulo se estudian, en primer lugar, las consecuencias de este tipo de observación. Por un lado, se analiza la trayectoria del satélite sobre la superficie de la Tierra en función de los elementos orbitales del mismo. La curva ası́ generada, llamada traza, nos dará mucha información sobre distintos aspectos de la misión que dicho satélite debe cumplir. Por otro lado, determinaremos la condición para que un satélite sea visible desde una cierta estación en un momento dado. Puesto que el movimiento no es exactamente kepleriano, se analizan los tipos de perturbaciones más importantes en la órbita de un satélite artificial y los efectos que éstas producen sobre la órbita y además sobre la traza y observabilidad del satélite. Finalmente, se hace un repaso de los principales tipos de satélite en función de su misión, que viene condicionada por su traza y por lo tanto por sus 272 Órbitas de satélites artificiales terrestres elementos orbitales. 17.1.1 La órbita en la superficie terrestre: traza La misión para la que está construido un satélite artificial depende, en gran medida, de la zona de la Tierra que el satélite sobrevuela en cada instante y de la visibilidad de un satélite desde un observatorio o estación de seguimiento. Para comprender mejor los distintos tipos de misiones espaciales analizaremos la traza de un satélite, esto es, el lugar geométrico de los puntos de la superficie de la Tierra para los cuales el satélite está en el cenit en un instante dado. Conociendo en cada momento el punto de la traza que ocupa un satélite podremos decir que zonas de la Tierra son visibles para el satélite y si el satélite es visible o no para una determinada estación de seguimiento. Supondremos un satélite cuyos elementos orbitales, referidos al sistema ecuatorial, son (a, e, i, ⌦, !, T ). La traza de este satélite se obtendrá calculando en cada instante t las coordenadas geográficas del satélite s (t), s (t) y dibujando éstas sobre un mapa de la Tierra. Para calcular s , s observemos la figura 17.1 que representa la órbita del satélite S en un sistema de coordenadas ecuatoriales. S0 S s x !+f ⌦ S0 i ⌦ N G s GMST + s GMST N ⌦ Figura 17.1: Posición de un satélite artificial sobre la superficie terrestre. d0 representa la latitud del satélite s , que coincide En dicha figura el arco SS con la declinación s , mientras que d S 0 es la ascensión recta del mismo que puede ponerse en función del tiempo sidéreo medio en Greenwich GMST y la longitud d del satélite como ↵s = GMST + s , De esta forma N S 0 = GMST + s ⌦. Las coordenadas polares esféricas del satélite en el sistema de coordenadas nodal-espacial serán (r, GMST + s ⌦, s ). De éste pasamos al orbital por medio Movimiento del satélite sobre la superficie terrestre 273 de la matriz de giro R1 (i)R3 (! + f ). Aplicando esta rotación obtendremos 0 1 0 1 r cos s cos(GMST + s ⌦) r cos(! + f ) @ r cos s sen(GMST + s ⌦) A = @ r cos i sen(! + f ) A , (17.1) r sen s r sen i sen(! + f ) o lo que es igual s s = = asen [sen i sen(! + f )] , ⌦ GMST + atan [cos(! + f ), cos i sen(! + f )] . (17.2) Dados los elementos orbitales y un instante de tiempo absoluto t, expresado en cualquier clase de tiempo de los estudiados en el capı́tulo 5, podemos obtener tanto GMST como el valor de f . Las ecuaciones (17.2) nos darán el valor de s , s en ese instante. En lo que sigue analizaremos las propiedades de la traza de un satélite en función de sus elementos orbitales. Observemos la primera de las ecuaciones (17.2). La variable f recorre, en una vuelta o perı́odo del satélite, todos los valores entre 0 y 2⇡, por tanto, al ser ! constante podemos asegurar que i  s  i, esto es, la latitud del satélite está acotada entre los valores1 [ i, i] correspondientes a la inclinación. Además, s varı́a periódicamente, con el mismo perı́odo que la órbita del satélite. 6 5 4 3 2 1 (a) Cuatro satélites de inclinaciones: 10 , 30 , (b) Seis vueltas de un satélite de semieje a = 60 y 90 r . Perigeos numerados sucesivamente. Figura 17.2: Traza de varios satélites en función de la excentricidad y el semieje. La figura 17.2(a) nos muestra las trazas correspondientes a una vuelta de cuatro satélites que tienen los elementos orbitales comunes a = r , e = 0, ⌦ = 190 , ! = 0 , T = 0, mientras que sus inclinaciones respectivas son i = 10 , 30 , 60 y 90 . Esta última órbita es llamada órbita polar, pues pasa por los polos en su recorrido por un meridiano. El argumento del periastro ! aparece como una constante aditiva dentro de una función periódica, por lo que no modifica la forma de la traza, sino que indica 1 (i 90 )  s  (90 i) si la órbita es retrógrada. 274 Órbitas de satélites artificiales terrestres únicamente la posición del perigeo de la órbita, siendo su latitud geográfica l constante, mientras que la longitud varı́a de un vuelta a otra en una cantidad igual al periodo de la órbita. Puede verse en la figura 17.2(b) cinco órbitas sucesivas de un satélite de elementos orbitales a = r , e = 0, i = 60 , ⌦ = 0 , ! = 0 , T = 0. Los cinco perigeos sucesivos aparecen numerados. (a) Quince vueltas de un satélite de periodo (b) Quince vueltas de un satélite de periodo aproximado 1h 24m 29s . igual a 12h . Figura 17.3: Ejemplo de órbita de traza densa y órbita de traza periódica. El semieje, o lo que es igual, el periodo, es el elemento orbital de mayor influencia sobre la forma de la traza del satélite, pues marca la periodicidad de la misma. Como se ha indicado antes, s varı́a periódicamente por depender de f y de constantes. Sin embargo s depende también de GMST que también es periódica, pero con un periodo de 2⇡ rad/dı́a distinto del periodo de f . De hecho, la forma de la traza es la misma figura para cada vuelta, pero de una vuelta a otra la figura se desplaza en longitud una cantidad que depende del periodo orbital, esto es, del semieje. En efecto, supongamos el instante de paso por el nodo, para el cual ! + f = 0 y por tanto GMST = ⌦ s . Si llamamos GMST 1 al tiempo sidéreo del primer paso por el periastro y GMST 2 al del segundo, tendremos 1 2 = GMST 2 GMST 1 , esto es, la variación de la longitud geográfica de la posición del nodo, y con él de toda la traza, es igual a la diferencia de tiempos sidéreos, o lo que es igual, al periodo de la órbita expresado en unidades de tiempo sidéreo. Cuanto mayor sea el semieje (periodo), mayor será el desplazamiento de la traza entre una vuelta y la siguiente. Las figuras 17.3(a), 17.3(b), 17.4(a) representan satélites de elementos orbitales comunes e = 0, i = 60 , ⌦ = 0 , ! = 0 , T = 0. En el caso 17.3(a) (a = r , P = 1h 24m 29s ) puede verse la traza producida por quince vueltas, que tiende a llenar completamente el mapa entre las dos latitudes lı́mite. La figura 17.3(b) muestra las quince vueltas de un satélite de periodo igual a 12h de tiempo sidéreo, que equivale a la de dos vueltas pues el periodo de rotación de la Tierra es exactamente 2 veces el de la órbita. Por último en la figura 17.4(a) se representan Movimiento del satélite sobre la superficie terrestre 275 (a) Traza de seis satélites de semiejes: 1, 2, 3, 5, (b) Cuatro satélites geosı́ncronos con inclina6, 6.61. Este último corresponde a un periodo ciones 60 , 40 , 20 y 5 . de 24h . Figura 17.4: Traza en función del semieje y órbita geosı́ncrona. siete órbitas con semiejes respectivos a = 1, 2, 3, 4, 5, 6, 6.61, éste último correspondiente a una órbita de periodo igual a 24h de tiempo sidéreo, que llamaremos órbita geosı́ncrona, y tiene forma de ocho. Cuando en una órbita geosı́ncrona la inclinación disminuye el ocho se va estrechando y acortando (figura 17.4(b)) hasta el momento en que i = 0 , valor para el cual la traza se reduce a un punto en el ecuador. Este tipo de órbita, de gran importancia para las comunicaciones, es llamada órbita geoestacionaria. Es importante destacar que este razonamiento se ha establecido a partir de un reloj de tiempo sidéreo, luego cuando se habla de órbitas geosı́ncronas o geoestacionarias como órbitas de periodo igual que un dı́a debe entenderse éste como un dı́a sidéreo que, como vimos en el capı́tulo 5, dura unos cuatro minutos menos que el dı́a medio. (a) Traza de tres satélites cuyo ángulo del nodo (b) Tres satélites geosı́ncronos con inclinación vale: 0 , 30 , 60 . 60 y ángulos del nodo: 0 , 30 y 60 . Figura 17.5: Influencia del ángulo del nodo en la traza. El ángulo del nodo aparece únicamente en la segunda ecuación, por lo que afecta únicamente a la longitud geográfica s . Sin embargo, por ser ⌦ constante, su efecto sobre la traza es mantener la forma geométrica de la misma pero desplazando toda ella una distancia ⌦. En la figura 17.5(a), se observa el desplazamiento de toda la traza al variar el ángulo del nodo. Esto es particularmente importan- 276 Órbitas de satélites artificiales terrestres te para satélites geosı́ncronos (figura 17.5(b)), pues define la zona de visibilidad del mismo, y mucho más para los geoestacionarios, pues caracteriza la longitud nominal del satélite. (a) Traza de tres satélites de excentricidades (b) Traza de dos satélites geosı́ncronos con ex0, 0.5, 0.7. Los puntos señalan posiciones equi- centricidades 0 y 0.3. distantes en t. Figura 17.6: Influencia de la excentricidad en la traza. Por lo que respecta a la excentricidad, ésta aparece implicitamente en f , pues es necesaria para obtener f en función de e. Como sabemos, la anomalı́a media ` es una variable angular con el mismo periodo que f , pero que, por ser lineal con el tiempo, representa un recorrido de la órbita con velocidad angular constante n. La diferencia entre ` y f es pequeña, por lo que considerar ` en lugar de f en (17.2), lo que equivale a suponer e = 0, hace inapreciable la variación de la forma de la órbita. El mayor efecto que produce la excentricidad es sobre la velocidad con que el satélite recorre la traza, permaneciendo mucho más tiempo sobre determinadas regiones de la Tierra, las que estén más próximas al apoastro, que sobre otras. La figura 17.6(a) muestra perfectamente este hecho pues representa tres órbitas de excentricidades respectivas e = 0, 0.5, 0.7. Los puntos negros representan puntos equidistantes en el tiempo, en órbitas de excentricidad cero estos puntos están también equidistantes en distancia, para órbitas excéntricas los puntos se acercan en la zona del apoastro, donde el satélite permanece por más tiempo, y se alejan en la zona del periastro. Con objeto de observar mejor las trazas se han tomado distintos valores de ⌦. La figura 17.6(b) muestra el curioso efecto del aumento de la excentricidad sobre la órbita goesı́ncrona que tiende a tumbar el ocho. 17.1.2 Visibilidad de un satélite desde una estación Supongamos una estación de seguimiento de satélites situada en un punto O, de la superficie terrestre, caracterizado por sus coordenadas geográficas o , o . El objetivo de esta estación es la observación visual o radioeléctrica del satélite o de las señales que éste envı́a, por lo que será necesario conocer bajo que condiciones y en qué instantes el satélite será observable desde la estación. Cualquier señal enviada por un satélite sufre distorsiones al atravesar las capas bajas de la atmósfera. Según el tipo de observación que queramos realizar, Movimiento del satélite sobre la superficie terrestre 277 existirá un cierto ángulo lı́mite ✏ tal que, cuando el satélite esté a una distancia angular del horizonte menor que el ángulo ✏, dicha observación es imposible y por tanto consideraremos que el satélite no es visible. La estación puede realizar una observación cuando éste cruza el llamado cono de visibilidad, que es un cono de eje vertical y ángulo 90 ✏. S ✏ S r O O ✏ ✏ ' r S0 T T Figura 17.7: Cono de visibilidad de un satélite desde una estación terrestre. Si consideramos como aproximación una Tierra esférica de radio r , igual al radio ecuatorial, la figura 17.7 nos marca el lı́mite de observación del satélite S desde O. Dicho lı́mite estará representado por el ángulo ' de la figura. Para obtener éste, basta aplicar las propiedades de los triángulos planos T OS y T SS 0 , que nos dan r cos ✏ = r cos(' + ✏), por lo que se tendrá ' = acos ⇣r cos ✏ ⌘ ✏. (17.3) r El ángulo ' representa el lı́mite de la distancia angular entre la estación y la proyección del satélite sobre la superficie terrestre, o punto que ocupa en la traza en dicho instante. Si dicha distancia es menor o igual que ', el satélite es visible. Para obtener la distancia angular entre un punto de la traza ( s , s ) y la estación ( o , o ) basta considerar como el ángulo entre los vectores cart(1, s , s ) y cart(1, o , o ), por lo que efectuando el producto escalar, se obtiene la relación cos = sen o sen s + cos o cos s cos( o s ). (17.4) Si llevamos las expresiones (17.2) de ( s , s ) a la ecuación (17.4) obtendremos los valores de (t). Por último la condición ⇣r ⌘ (t) < acos cos ✏ ✏, (17.5) r 278 Órbitas de satélites artificiales terrestres indica los instantes de visibilidad del satélite desde la estación. Esta condición puede ponerse también como cos( + ✏) > 17.2 r cos ✏. r (17.6) El problema principal del satélite Analizando los valores de los distintos armónicos del potencial terrestre2 se comprueba que el término J2 , debido al achatamiento, es dominante frente al resto de armónicos. J2 es del orden de 10 3 frente al valor inferior a 10 6 del resto. Por ello, la perturbación sobre la órbita de un satélite artificial terrestre producida por el término del potencial que contiene al armónico J2 es dominante frente a la de los demás armónicos, ası́ como también lo es frente al resto de perturbaciones que actúan sobre este satélite. De forma genérica, con la formulación de la perturbación en forma asintótica respecto a un pequeño parámetro vista en el capı́tulo 12, podemos tomar J2 como pequeño parámetro y modelar el problema orbital a partir de un orden cero, que representa el problema kepleriano, una perturbación de primer orden producida por este término y una perturbación de segundo orden que engloba el resto de perturbaciones. Prescindiendo del efecto de todas las perturbaciones excepto del achatamiento formularemos el llamado problema principal del satélite artificial, que nos da una primera aproximación al modelo orbital que mejora notablemente el kepleriano. Para comprobar el efecto de esta perturbación sobre el movimiento kepleriano usaremos las ecuaciones (12.15), donde el término Vp debido al achatamiento, (14.19), se expresará como Vp = µ ⇣ r ⌘2 J2 P2 (sen ), r r con r el radio ecuatorial terrestre y donde hemos usado en lugar de , pues esta coordenada representa la declinación del satélite, al coincidir el plano fundamental del sistema terrestre rotante con el ecuatorial. Por otro lado, si aplicamos la tercera de las igualdades (9.13), sen = sen i sen(! + f ), y desarrollamos la expresión se llega a la igualdad Vp = ✏ Rp siendo ✏ = 1 ⇥ 3 sen2 i sen2 (! + f ) r3 J2 y Rp = µ r2 /2, una constante. ⇤ 1 , Basta tener en cuenta las derivadas de r y f respecto de los elementos orbitales, que se han encontrado en el capı́tulo 12, para calcular las derivadas de Vp respecto de cada uno de los elementos orbitales. Estas derivadas pueden ser llevadas a 2 Esto es también cierto, aunque en menor grado, para los potenciales de Marte y la Luna. Efectos sobre el satélite de otras perturbaciones 279 (12.15) para obtener las expresiones ( , f ) que permiten formular las ecuaciones (12.30) y, mediante éstas, las variaciones de primer orden de los elementos orbitales en el problema principal del satélite. Si calculamos las integrales (12.30) entre 0 y 2⇡ obtendremos la variación de primer orden, , de cada parámetro de la órbita de un satélite artificial, en cada vuelta del satélite. Tras una serie de cálculos se obtienen las siguientes variaciones a e i = = = ⌦ = ! = 0, 0, 0, 3J2 rp2 ⇡ cos i, a2 (1 e2 )2 3J2 rp2 ⇡ (1 5 cos2 i). 2a2 (1 e2 )2 (17.7) De las igualdades anteriores podemos deducir que ningún elemento orbital, salvo ⌦ y !, presenta variación en el primer orden. En el caso de ⌦ esta variación representa la precesión del nodo de la órbita. La precesión del nodo es mayor cuanto más pequeña sea la inclinación de la órbita, y se hace cero para órbitas polares. En órbitas retrógradas el nodo se adelanta en lugar de retrasarse. El efecto de esta perturbación sobre la traza desplaza el punto de corte de la órbita en el ecuador hacia el oeste si es directa y hacia el este si es retrógrada. En una órbita geosı́ncrona, aunque el efecto es menor al aparecer el semieje en el denominador, la figura de ocho cerrada se abre, si es geoestacionaria el punto sobre el ecuador que ocupa la órbita se desplaza al oeste. En el caso de ! la variación es proporcional al valor de (1 5 cos2 i), y nula cuando este término vale cero, lo cual coincide con una inclinación i = 63 260 5.00 82, que será llamada inclinación crı́tica, y que ha tenido una gran importancia en el desarrollo de los satélites artificiales. Esta inclinación tiene la importante propiedad de mantener constante el valor del argumento del perigeo, sin embargo, desde el punto de vista dinámico representa una singularidad esencial del problema principal. 17.3 Efectos sobre el satélite de otras perturbaciones Como se ha dicho en el apartado anterior, el resto de perturbaciones producirá en el satélite un efecto mucho menor que el efecto producido por el achatamiento. Sin embargo, resulta muy útil conocer, a rasgos generales, como influye cada una de las perturbaciones, con objeto de saber cuáles debemos incluir en el modelo de integración cuando se diseña la misión espacial. 280 Órbitas de satélites artificiales terrestres Sin entrar en un estudio detallado de cada una de las perturbaciones podemos resumir algunas de las consecuencias y sus comparaciones en los siguientes puntos: Las cuatro perturbaciones más importantes en la órbita de un satélite son: el potencial terrestre, excluido J2 , el rozamiento atmosférico, la presión de radiación solar y la perturbación luni-solar. Para satélites de órbita baja son muy importantes el potencial terrestre y el rozamiento atmosférico, mientras que los otros dos tienen un efecto muy pequeño. Para satélites muy altos, por ejemplo los geoestacionarios, el efecto más importante es la perturbación luni-solar y luego la presión de radiación. El potencial terrestre perturba muy poco y el rozamiento atmosférico es nulo. La presión de radiación solar, que varı́a muy poco con la altitud del satélite, produce variaciones periódicas en los elementos orbitales y se iguala en magnitud con el rozamiento atmosférico a unos 800 km de altitud. El rozamiento atmosférico es muy importante, cuando al altitud es muy baja, por eso las órbitas bajas deben tener una mı́nima altitud para que el efecto del rozamiento sea menor que el del achatamiento. El efecto del rozamiento atmosférico, cuando actúa sobre órbitas muy excéntricas, no reduce la distancia mı́nima en el perigeo rp , sino que reduce progresivamente la excentricidad. Puede pensarse en este efecto como una reducción pequeña de la velocidad en la dirección tangente que ocurre únicamente a cada paso del satélite por el perigeo, pues debido a la excentricidad el resto de la órbita casi no está afectada por el rozamiento de la atmósfera. Cuando el rozamiento atmosférico actúa de forma continua, lo que ocurre en órbitas de baja excentricidad, se produce una disminución progresiva de la distancia rp en el perigeo con lo que la órbita termina chocando con la Tierra. La combinación del rozamiento atmosférico con el efecto del tercer cuerpo puede producir efectos indeseados sobre el valor de rp , que afectan considerablemente al tiempo de vida del satélite, por lo que es preciso un estudio de las posiciones de la Luna y el Sol antes del lanzamiento para minimizar este efecto. La perturbación producida por la Luna tiene aproximadamente una magnitud doble que la producida por el Sol. Para órbitas bajas el efecto de la perturbación luni-solar es pequeño en comparación con el resto. Para órbitas geoestacionarias es tan importante como el achatamiento terrestre. Clasificación de los satélites artificiales según su órbita 281 La perturbación producida por los planetas es muy pequeña siendo las más importantes, por este orden, las de Venus y Júpiter. El efecto de éstos siempre está por debajo del efecto relativista, que es del orden de 10 10 , es decir extremadamente pequeño. 17.4 Clasificación de los satélites artificiales según su órbita Una vez estudiado el efecto de la órbita en el movimiento de un satélite sobre la superficie terrestre y los efectos que las perturbaciones producen sobre ésta, podemos clasificar los tipos de satélites en función de las caracterı́sticas orbitales. Las órbitas más frecuentes son órbitas circulares o de muy pequeña excentricidad. Dentro de éstas la primera clasificación viene dada por la altitud del satélite sobre la superficie terrestre. 17.4.1 Órbitas bajas (LEO) Aunque no existe una clasificación rigurosa de las órbitas por su altitud se estima que una órbita baja, LEO 3 , es una órbita situada a una altitud entre 200 km y los 800 km. Las órbitas de altitud menor no son estables debido a la disminución progresiva de su altitud por el efecto del rozamiento atmosférico. Aunque órbitas de mayor altitud podrı́an considerarse como órbitas bajas la existencia del cinturón de Van Allen impide situar satélites a dichas altitudes. En 1958 las naves Explorer I y III confirmaron la existencia de los cinturones de radiación de Van Allen, que consisten en dos anillos de forma toroidal4 alrededor del ecuador de la Tierra. Dicha zona está formada por partı́culas cargadas, protones en el anillo interior y electrones en el exterior, que son atrapados por el campo magnético terrestre. El anillo interior está situado entre los 800 y los 6000 km de altitud sobre la superficie terrestre y alcanza su máxima densidad a los 3000 km de altitud. El anillo exterior tiene su mayor densidad entre los 15000 km y los 20000 km de altitud. A partir de los 50 o 60 de latitud norte o sur la densidad de los cinturones es muy pequeña. La energı́a de las partı́culas de los cinturones de Van Allen puede dañar y degradar seriamente los componentes electrónicos de los satélites y hace peligrar la salud de un ser humano que esté permanentemente expuesto a ellas. Por ello determinadas misiones, sobre todo las misiones largas y las tripuladas, deben ser situadas a una altitud que interfiera lo mı́nimo posible con esta zona. La seguridad de la zona de órbitas bajas, por debajo del cinturón interior de Van Allen, la hace una zona especialmente útil para las misiones tripuladas como 3 Low Earth Orbit. una rosquilla o donuts. 4 Como 282 Órbitas de satélites artificiales terrestres la estación espacial internacional, ISS5 , que está situada a unos 350 km de altitud en una órbita casi circular inclinada 51 . Otra caracterı́stica de las órbitas LEO es que el coste de satelización es pequeño comparado con otro tipo de órbitas. Basta un cohete lanzador de dos etapas para situar un satélite en una órbita baja. El mayor problema de dichas órbitas es que el rozamiento producido por la atmósfera requiere un mayor gasto de combustible para su mantenimiento en órbita, por lo que la elección de esta altitud para el estación espacial supone un compromiso entre seguridad y coste de la misión. Un satélite bajo tiene un semieje pequeño y por tanto un periodo corto, por lo que puede completar entre 14 y 16 vueltas a la Tierra por dı́a. Además, como se ve en su traza densa (figura 17.3(a)), puede observar, en algún momento, cualquier punto de la superficie terrestre de latitud menor que la inclinación. Esta caracterı́stica hace este tipo de órbitas muy útiles para cualquier misión de tipo geodésico (medida del potencial terrestre), fotográfico, meteorológico, medio ambiental, etc. 17.4.2 Órbitas medias (MEO) Se consideran órbitas medias, MEO 6 a las órbitas situadas más allá del cinturón interior de Van Allen y hasta los 35000 km. En esta zona, evitando el cinturón exterior o protegiéndose de él, se sitúan los satélites de las constelaciones usadas para la navegación, como GPS o Galileo. Tanto el sistema GPS como GLONNAS usan altitud de unos 20000 km con órbitas de periodo orbital de 12 horas. Galileo se situará en órbitas de 23220 km de altitud y 56 de inclinación. 17.4.3 Órbitas geoestacionarias (GEO) Los últimos tipos de órbitas que estudiaremos son las órbitas geosı́ncronas y las órbitas geoestacionarias, GEO. En ambos casos el periodo orbital está sincronizado con la rotación de la Tierra, las geoestacionarias, además, tienen inclinación nula, es decir, son órbitas ecuatoriales. La idea de situar satélites en estas órbitas fue publicada en 1928 por Herman Potocnik, aunque luego fueron popularizadas por el autor de ciencia-ficción Artur C. Clarke. Estas son las únicas órbitas altas por lo que al contrario que las bajas y las medias no serán denominadas ası́. Como se observa por su traza (figura 17.4(b)) las órbitas geoestacionarias ocupan un punto fijo del ecuador terrestre, salvo la deriva producida por las perturbaciones que debe ser corregida cada cierto tiempo. De esta forma, una antena fija puede estar apuntando constantemente al satélite lo que los hace muy útiles para las comunicaciones, especialmente para la transmisión de señales de 5 International 6 Medium Space Station. Earth Orbit. Clasificación de los satélites artificiales según su órbita 283 televisión. Además de su uso en televisión y telecomunicaciones estas órbitas son usadas para satélites meteorológicos como los GOES (norteamericanos), Meteosat (europeos) y GMS (japoneses). La altitud de esta órbitas es de 35786 km, es decir poseen un semieje de 42164 km. El área de visibilidad de estos satélites es de aproximadamente el 43 % de la superficie del hemisferio que definen. Se excluyen las regiones por encima o debajo de los 70 de latitud (norte y sur). Esta caracterı́stica, sujeta a su inclinación, hace que el número de satélites geoestacionarios esté limitado, pues estos únicamente pueden estar en un estrecho anillo que rodea el ecuador, de radio 42164 km, en el que se encuentran unos 300 satélites. 17.4.4 Satélites Molniya y Tundra La mala cobertura de los satélites geoestacionarios por encima de los 70 constituyó un gran handicap para el desarrollo de los sistemas de comunicaciones soviéticos. Para solucionar esto aprovecharon tres propiedades de las órbitas de los satélites artificiales vistas con anterioridad: Los satélites de gran excentricidad permanecen gran parte de su tiempo en las proximidades del apogeo y pasan muy rápido por el resto de las regiones. La excentricidad de estos satélites es aproximadamente 0.7. Un satélite en inclinación crı́tica mantiene el perigeo, y como consecuencia el apogeo, estacionario, es decir ocupa siempre el mismo lugar. Un periodo orbital igual a medio dı́a sidéreo hace que cada 24h el satélite repita su traza, pasando por los mismos lugares. Las órbitas con estas propiedades fueron llamadas órbitas Molniya, tomando el nombre del primer satélite lanzado en dicha órbita el Molniya 1. La figura 17.8, que representa la trayectoria diaria, dos vueltas, de un satélite de este tipo dice por si sola las posibilidades de estos satélites, si tenemos en cuenta que la mayor parte del tiempo el satélite se enFigura 17.8: Dos vueltas de la órbita de un satélite cuentra en la zona del hemisMolniya. ferio norte de la gráfica. Para conseguir esta trayectoria basta usar los elementos orbitales dichos y situar el apogeo por encima del punto sobre el que se quiera tener el satélite el mayor tiempo posible. 284 Órbitas de satélites artificiales terrestres Este tipo de satélites han sido usados, tanto para usos civiles, de comunicaciones, como militares, por la Unión Soviética y por los Estados Unidos. Las posibilidades del sistema aumentan si en lugar de uno se sitúan tres satélites en la misma órbita, asegurando que en cada momento del dı́a uno de los tres satélites está volando por encima de la zona de cobertura. El inconveniente principal de este sistema es que en las estaciones de Tierra se hace necesario el uso de dos antenas de rastreo. Ya que la distancia estaciónsatélite cambia continuamente, la potencia recibida varı́a y lo mismo ocurre con la frecuencia en recepción debido al efecto Doppler. Se hace necesaria una programación previa que permita comunicar simultáneamente a las estaciones de Tierra el instante en que deben cambiar de satélite. Por otro lado, como la altitud del satélite varı́a, el haz de cobertura también variará. Los satélites Molniya llevan una antena de rastreo que debe permanecer orientada hacia las estaciones de Tierra operativas. Otro tipo de órbitas que usan la inclinación crı́tica son las órbitas Tundra. Su diferencia con las órbitas Molniya es que su excentricidad no es tan grande, generalmente entre 0.25 y 0.4 y tienen un perı́odo de 24h . Estas son órbitas geosı́ncronas, que tienen una traza en forma de ocho. Situando el apogeo en un punto del hemisferio norte se consigue que el satélite recorre la parte superior del ocho la mayor parte de su tiempo, con lo que con dos satélites en la misma órbita, separados 180 se consigue una completa cobertura de la misma. 17.4.5 Satélites heliosı́ncronos Al igual que las órbitas Molniya, los satélites en órbita heliosı́ncrona son satélites que aprovechan las caracterı́sticas del problema principal del satélite, en concreto la precesión del nodo, para conseguir una determinada caracterı́stica. En este caso, se trata de que en cada punto de la órbita, definido por una anomalı́a dada, las condiciones de iluminación del Sol sobre el punto de la superficie terrestre que el satélite sobrevuela son idénticas para cada vuelta, o lo que es igual, el ángulo horario H del Sol en ese punto es el mismo. Esto es especialmente útil para los satélites de observación terrestre, por lo que casi todos aprovechan esta caracterı́stica. Para comprender esto recordemos las expresiones (3.13) y (5.1), que reunidas nos permiten escribir GMST = ↵ + H , (17.8) donde GMST es el instante de la observación, es la longitud de un observador, ↵ es la ascensión recta en ese instante de un astro cualquiera, en este caso tomaremos el Sol, y H es el ángulo horario del mismo astro observado en el instante y lugar dados. Por otro lado, la segunda de las expresiones (17.2) nos permite asegurar que la longitud del punto de la traza desde un instante cualquiera de la órbita de ano- Clasificación de los satélites artificiales según su órbita malı́a verdadera f1 a otro f2 = f1 + 2⇡ pasa de un valor por la expresión 2 1 = ⌦ (GMST 2 1 a otro GMST 1 ), 285 2 relacionados (17.9) siendo ⌦ la variación del ángulo del nodo en una vuelta, que en una órbita kepleriana vale cero, pero cuando la órbita está perturbada por el achatamiento terrestre viene dado por (17.7). Particularizando (17.8) para los dos instantes, tomando el Sol como el astro para el cual se dan ↵ y H, y llevando todo a la expresión (17.9) podremos poner H2 H1 = ⌦ ↵, (17.10) donde ↵ = ↵2 ↵1 representa la variación de la ascensión recta del Sol en una vuelta de la órbita. Si hacemos coincidir la variación, en una vuelta, de la ascensión recta del Sol con la del nodo de la órbita, el ángulo horario del Sol en el lugar sobrevolado por el satélite coincidirá en el instante inicial y al cabo de una vuelta, cumpliéndose las condiciones deseadas. Para comprobar de manera práctica lo que esto supone en el diseño de las órbitas de satélites artificiales tendremos en cuenta que este tipo de satélites de observación tienen una órbita baja, por lo que las órbitas heliosı́ncronas son siempre órbitas LEO. Por otro lado, como el periodo orbital de un satélite LEO es pequeño, podemos simplificar el movimiento del Sol, tomando el Sol medio en lugar de verdadero, por lo que éste da una vuelta completa en el ecuador con una velocidad angular de 2⇡/365.2422 rad/dı́a, por lo que durante un periodo P del satélite el valor de ↵ vendrá dado por 2⇡P/(365.2422 ⇥ 24 ⇥ 60), dando P en minutos. Si ahora calculamos ⌦ en una vuelta, por medio de la relación (17.7), para un satélite en orbita circular e = 0 y radio a = 1.125, lo que equivale aproximadadmente a 800 km de altitud, se obtiene la inclinación necesaria para que la condición se cumpla, en este caso i = 98. 6. Esto nos da una órbita casi polar y retrógrada muy habitual en este tipo de satélites. 17.4.6 Órbitas de transferencia geoestacionarias (GTO) Estas órbitas permiten pasar un satélite de una órbita baja circular y ecuatorial a una órbita geoestacionaria. Para ello la órbita tiene que ser muy excéntrica y tener una distancia en el perigeo, rp , que coincida con el radio de la órbita baja y una distancia en el apogeo, ra , que coincida con el radio de la órbita geoestacionaria. A partir de estos valores es fácil deducir el semieje y la excentricidad de esta órbita, que valdrán r rLEO r + rLEO a = GS , e = GS , 2 2a donde rGS , rLEO representan respectivamente los radios de las órbitas geoestacionaria y baja. 286 Órbitas de satélites artificiales terrestres Capı́tulo 18 Maniobras orbitales 18.1 Introducción En el capı́tulo anterior se ha analizado la relación entre los elementos orbitales de un satélite artificial y las caracterı́sticas concretas de la misión para la que dicho satélite ha sido diseñado. Llamaremos órbita nominal del satélite a la órbita en la que será situado para cumplir su misión. En este capı́tulo analizaremos las fases que conducen hasta la inserción del satélite en su órbita nominal. Incluiremos, desde el lanzamiento del mismo, hasta las correcciones de la órbita, o maniobras, que lo llevarán en sucesivas etapas a su órbita nominal o que permitirán la corrección de la misma cuando el efecto de las perturbaciones lo aleje de ésta. Con objeto de una mayor claridad en la exposición de estos temas simplificaremos el complejo sistema técnico que encierran, centrándonos principalmente en los aspectos dinámicos del mismo. 18.2 La velocidad y la navegación espacial La órbita de una nave espacial es la solución del sistema de ecuaciones diferenciales (12.1), en la que se incluyen todas las perturbaciones, para un conjunto de valores iniciales dado por el vector de estado (x0 , X 0 ) en el instante inicial t = t0 . Si cambiamos las condiciones iniciales, la posición, la velocidad o ambas obtenemos otra órbita diferente caracterizada por las nuevas condiciones iniciales. Esta afirmación, que se deduce trivialmente de la teorı́a de las ecuaciones diferenciales ordinarias, tiene unas consecuencias dinámicas obvias pero que es conveniente destacar. 288 Maniobras orbitales Las pelı́culas de ciencia ficción han popularizado una serie de naves espaciales que distan mucho de lo que es la navegación por el espacio. Estas naves son presentadas como un vehı́culo similar, en cuanto a su comportamiento, a un avión, que es fácilmente maniobrado por un piloto que modifica en tiempo real la trayectoria de la nave. La realidad es muy distinta. La intervención del piloto en la trayectoria de una nave únicamente tiene importancia en las reentradas a la atmósfera de los transbordadores espaciales, que realmente se convierten en grandes aviones y en las últimas fases de aproximación entre dos naves que se acoplan, como las llegadas a la estación espacial. El resto del tiempo los viajes espaciales son más parecidos a los viajes en tren donde las vı́as han quedado fijadas por la ecuación diferencial y por las condiciones iniciales y éstas han fijado también el horario del tren. Para cambiar de ruta, tanto la vı́a como los horarios, debemos fijarnos de nuevo en los parámetros que modifican la órbita. La ecuación diferencial es siempre la misma, luego únicamente el cambio de las condiciones iniciales, o valores de la posición y velocidad en un cierto instante, permitirá el cambio de trayectoria. Pensemos ahora que tenemos un satélite artificial en una órbita dada, por ejemplo una órbita ecuatorial y queremos darle una cierta inclinación. Supongamos que estamos en el instante t0 y tenemos una posición y velocidad que nos aseguran la órbita ecuatorial; para el cambio de órbita debemos cambiar, en ese mismo instante t0 , la posición y la velocidad, pero es fácil comprender que no podemos modificar la posición de la nave instantáneamente. Ası́ pues, el único recurso que nos queda es modificar la velocidad y obtener unas condiciones iniciales, (x0 , X 0 + v), que transferirán la nave a una nueva órbita que tiene un punto en común con la anterior. El cambio de velocidad, producido por la variación de la cantidad de movimiento de la nave al expulsar masa a gran velocidad, es la única forma posible, en la actualidad, de cambiar la órbita. A esta acción le llamaremos maniobra orbital y sus caracterı́sticas serán estudiadas en el presente capı́tulo. Además de los cambios de órbita durante una misión, la velocidad juega también un importante papel en el lanzamiento al espacio de una nave, condicionando si ésta puede o no entrar en órbita y si la órbita puede o no alejarse de la Tierra lo suficiente para alcanzar otros cuerpos del sistema solar. Para comprender esto nos olvidaremos, por ahora, de la dirección del vector velocidad y consideraremos algunas propiedades del movimiento orbital derivadas únicamente de su norma, basadas en la expresión (8.11) y en su particularización a los distintos tipos de movimientos dada en la tabla (8.1). Supongamos que queremos poner en órbita un satélite artificial alrededor de un cuerpo o planeta de radio rP . Para ello realizaremos el lanzamiento del satélite, que en esencia consiste en un procedimiento, que describiremos en los siguientes apartados, para situar el satélite en una posición del espacio, a una cierta distancia rP del centro de masas del planeta y con una cierta velocidad. La velocidad y la navegación espacial 289 Para comprender el efecto de la velocidad en la puesta en órbita del satélite partiremos de la expresión mP vs2 = G , (18.1) rP que nos da el cuadrado de la velocidad de una órbita circular, (tabla 8.1), a una distancia rP de un planeta de masa mP . A la velocidad vs le llamaremos velocidad de satelización y representa la mı́nima velocidad necesaria para que una nave, dejada libre a una distancia rP del centro del planeta, entre en órbita alrededor del mismo, convirtiéndose en un satélite artificial, y no vuelva a caer a la superficie. Las propiedades del movimiento kepleriano indican que un cuerpo de masa cualquiera, situado a una cierta distancia de otro con cualquier velocidad, se moverá en órbita kepleriana alrededor del segundo. Para ver que esto no contradice lo afirmado en el párrafo anterior tendremos en cuenta que, a partir de la expresión de la velocidad para una órbita elı́ptica cualquiera, se obtiene fácilmente que, para una distancia r0 y una velocidad v0 , el semieje de la órbita es igual a a= 2µ µr0 . r0 v02 Si la velocidad fuese inferior a la velocidad de una órbita circular, esto es v02 < µ/r0 , se llegarı́a finalmente a que a < r0 , y por otro lado a que la distancia en el periastro rp = a(1 e) < a < r0 . Si r0 coincide con el radio del planeta rP resultará que la distancia en el periastro serı́a menor que el radio del planeta, por lo que el satélite chocarı́a con la superficie del mismo. A un cuerpo con una trayectoria elı́ptica de este tipo, esto es, con una velocidad menor que la de satelización a una distancia rP , se le llama misil balı́stico. Para la misma distancia, un aumento de v supone un aumento de la energı́a, obteniéndose una órbita elı́ptica. Si aumentamos lo suficiente la velocidad, la energı́a llegará a anularse y la órbita pasará a ser parabólica. En este caso ve2 = 2 G mP . rP (18.2) p A esta velocidad, 2 veces mayor que la velocidad de satelización, se le llama velocidad de escape, puesto que a partir de ella la órbita ya no es periódica y la nave, llamada ahora sonda espacial, se aleja indefinidamente del planeta. vs ve Tierra 7.91 11.18 Luna 1.68 2.36 Marte 3.55 5.02 Venus 7.33 10.36 Tabla 18.1: Velocidades de satelización y escape en km/s 290 Maniobras orbitales En la tabla 18.1 pueden verse los valores de la velocidad de satelización y escape para la Tierra, la Luna, Marte y Venus. Todas las velocidades están expresadas en km/s. Estas velocidades indican que el coste de puesta en órbita de una misión espacial es mucho menor si se realiza desde la Luna en lugar de realizarlo desde la Tierra mientras que desde Marte el coste es la mitad que desde la Tierra. Aumentando más la velocidad se obtienen órbitas hiperbólicas en las que la sonda siempre se aleja del planeta. Es interesante observar que puede considerarse que, cuando la distancia entre el satélite y el planeta es lo suficientemente grande, el planeta ya no atrae gravitacionalmente a la sonda, sin embargo, ésta no se para y continúa su viaje con una velocidad que nunca es menor que la llamada velocidad residual ✓ ◆ 2 1 µ 2 v1 = lı́m µ + = . (18.3) r!1 r a a 18.3 Propulsión de naves espaciales Para entender las relaciones entre la dinámica de la navegación espacial y cuestiones tan importantes para el coste de una misión como la cantidad de combustible que debe llevar y el tiempo de vida estimado de la misión, será necesario comprender algunos conceptos de la propulsión de las naves espaciales. Una maniobra orbital consiste en una modificación de la velocidad del satélite basada en la ley de conservación del momento lineal o cantidad de movimiento. El efecto de los cohetes consiste en la expulsión de una cierta cantidad de masa a una cierta velocidad, lo que produce un aumento de la velocidad del satélite en sentido contrario a la expulsión. Existen diversos métodos de expulsión de esta masa pero por el momento pensaremos en un proceso de combustión y en la expulsión a gran velocidad de los gases de dicha combustión. Llamaremos c a la velocidad efectiva de eyección1 de los gases para un cohete dado, y b = ṁ 0 la velocidad constante de pérdida de masa para dicho cohete. Si m es la masa total y X la velocidad en el instante anterior al encendido de los cohetes, la ley de conservación de la cantidad de movimiento nos indica que la variación de la velocidad v después de un intervalo de tiempo t viene dada por (m b t)(X + v) + (b t)(X + c) m X = F ext t, donde F ext es la resultante de las fuerzas exteriores que actúan sobre la nave. Las principales fuerzas externas son la fuerza de gravedad, el rozamiento atmosférico, etc. 1 La velocidad efectiva no coincide con la velocidad real de expulsión de gases, pues ésta queda modificada por la distinta presión relativa de los gases y del aire. La relación viene dada por c = vr + (pg pa )A/b, donde vr es la velocidad real de expulsión, pg , pa las presiones de los gases y la atmósfera y A el área de la tobera de expulsión. Propulsión de naves espaciales 291 Desarrollando esta expresión se llega a m que, dividida por v b t( v c) = F ext t, t y tomando lı́mites cuando m lı́m t!0 ⇣ v = b lı́m t!0 t v t ! 0, nos conduce a ⌘ c + F ext , o lo que es igual m dv dm = c + F ext , dt dt (18.4) que es la llamada ecuación del cohete. El término Fc = dm c= dt b c, (18.5) es el empuje o fuerza que el cohete ejerce sobre la nave. La dirección del vector c es la dirección hacia la que se expulsan los gases en la combustión y puede ser modificada, por ello, los dos parámetros que caracterizan realmente un cohete son las normas, c y Fc = b c, de los vectores anteriores y que, por extensión, se llaman también velocidad efectiva y empuje del cohete. En la práctica no se usa la velocidad efectiva, sino ésta dividida por el valor de la constante g0 de la aceleración de la gravedad en un punto del ecuador terrestre. Ası́, definiremos el impulso especı́fico como la cantidad Isp = c . g0 (18.6) La cantidad Isp , ası́ definida, se representa en segundos, mientras que el empuje se representa en newtons2 . Existirán dos tipos de cohetes en función de su empuje. Los que tienen un gran empuje, en general mucho mayor que la fuerza de gravedad, y los de bajo empuje, o microempuje, que es menor que la fuerza de gravedad. Estos últimos comunican al satélite una pequeña aceleración durante un periodo de tiempo largo, en contraposición con los de gran empuje que son encendidos durante un periodo de tiempo muy corto, despreciable frente al periodo orbital, y que durante este periodo producen una gran aceleración. En general supondremos que el impulso proporcionado por estos últimos es instantáneo. La variación de la velocidad de la nave durante el proceso de encendido de motores se obtendrá integrando la ecuación (18.4) entre los instantes de encendido y apagado de motores. Si consideramos el encendido de un cohete de alto empuje, mucho mayor que las fuerzas de gravedad y rozamiento atmosférico, podemos 2N = m kg s 2. 292 Maniobras orbitales suponer que la suma de las fuerzas externas es nula. Integrando la ecuación (18.4) del cohete en estas condiciones se llega a ⇣m ⌘ 0 v = c log . m La anterior relación indica que la variación de la velocidad de la nave lleva la dirección opuesta a la de la expulsión de los gases, que puede ser elegida orientando las toberas, por ello, el parámetro más importante de la maniobra es la variación de la norma de la velocidad, que se puede poner como ⇣m ⌘ ⇣m ⌘ 0 0 v = c log = Isp g0 log , (18.7) m m y es proporcional a la velocidad efectiva (impulso especı́fico) y al logaritmo del cociente entre la masa inicial, m0 y la masa m al final del encendido, que es la inicial menos la expulsada. Al valor v, que indica la variación de la norma del vector velocidad en una maniobra, se le llama impulso total o más habitualmente delta uve. Si queremos calcular el tiempo de encendido de un cohete de parámetros Fc , Isp , para conseguir un impulso v, bastará tener en cuenta que en un tiempo t se habrá expulsado una cantidad de masa igual a b t, luego si la masa inicial es m0 la final será m = m0 bt, que llevada a (18.7) nos da t= m0 ⇣ 1 b e v/c ⌘ = m0 Isp g0 ⇣ 1 Fc e v/Isp g0 ⌘ , (18.8) donde hemos sustituido b por su valor en términos de Fc e Isp . A lo largo de la vida de un satélite se realizan múltiples maniobras, en cada una de las cuales se produce un impulso total vi de acuerdo con la expresión (18.7). La suma de estos impulsos, que se podrá poner como ✓ ◆ ✓ ◆ X X mi 1 m0 v= vi = c log = c log , mi mn i i es llamada velocidad caracterı́stica y depende de la cantidad de masa total expulsada o combustible utilizado. El coste de una misión, que depende de la cantidad de combustible cargado en la nave, se minimiza si conseguimos minimizar la velocidad caracterı́stica. Llamemos mc a la cantidad total de combustible que carga una nave y mn a su peso sin combustible, su carga útil, entonces la velocidad caracterı́stica del conjunto de todas las maniobras realizadas hasta que la nave se queda sin combustible se podrá poner en cualquiera de las dos formas siguientes: ✓ ◆ mn + mc mc v = c log , = e v/c 1. (18.9) mn mn Propulsión de naves espaciales 293 Las dos relaciones anteriores indican la cantidad total de combustible, en relación con la carga útil, que debe llevar una nave cuya misión requiera en total una velocidad caracterı́stica v. Hay que recordar que la velocidad caracterı́stica es la suma de los delta uve de cada una de las maniobras realizadas en la misión. Se pueden realizar cuantas maniobras se quiera, y distribuirlas como se desee, con la única condición de que la velocidad caracterı́stica queda condicionada por la cantidad total de combustible y no por la potencia de los cohetes. La ecuación (18.9) ha sido obtenida en ausencia de fuerzas externas, sin embargo, en la realidad, el resto de fuerzas que actúan sobre el satélite contribuyen a disminuir el valor del delta uve obtenido con la misma cantidad de combustible. Esta disminución de la eficiencia de cada maniobra es proporcional al tiempo de duración del encendido de los motores. Cuanta menos duración tenga el encendido, menor será la pérdida de impulso. Obviamente, cuanto mayor sea el empuje del cohete se precisará un menor tiempo de encendido por lo que la maniobra será más efectiva. Actualmente existen dos tipos de cohetes en uso: los de propulsión quı́mica y los de propulsión iónica o eléctrica. Los cohetes de propulsión quı́mica poseen bajo impulso especı́fico pero la cantidad de masa expulsada es muy grande por lo que consiguen un gran impulso total, o lo que es igual, consiguen una gran variación de la velocidad en poco tiempo de encendido. Como en el espacio exterior no hay oxı́geno para quemar el combustible, el cohete debe llevar almacenado en tanques no sólo el propelente o combustible, sino también el oxidante o comburente. Los combustibles quı́micos pueden ser sólidos, que habitualmente llevan mezclado el propelente y el oxidante y los combustibles lı́quidos, que almacenan ambos por separado. Los combustibles sólidos alcanzan velocidades de expulsión de gases entre 1000 y 4000 m/s y pueden conseguir empujes de entre 1000 y 107 N, mientras los cohetes con bipropelentes lı́quidos expulsan los gases entre 1000 y 4700 m/s y alcanzan empujes de entre 0.1 y 107 N. Los cohetes de propulsión quı́mica son los más usados en la navegación espacial. El impulso especı́fico entre 200 y 500 segundos es pequeño pero lo compensan con el gran empuje que pueden conseguir. Existen tres tipos de cohetes de esta clase: los de pequeño impulso, entre 0.1 y 10 N útiles para las maniobras de cambio de actitud; los de impulso medio, entre 200 y 400 N, útiles para realizar maniobras de cambio de órbita; y finalmente los grandes cohetes de un empuje del orden de millones de newtons que son los usados por los lanzadores para poner las naves en órbita. Los cohetes iónicos aı́slan iones y los lanzan a una gran velocidad con lo que se consiguen grandes impulsos especı́ficos, sin embargo, el impulso total es muy pequeño, puesto que la masa expulsada es muy pequeña. La ventaja frente a los de propulsión quı́mica es que pueden mantenerse en funcionamiento durante grandes perı́odos de tiempo con poco coste de combustible, por lo que serán mucho más adecuados para la navegación interplanetaria no tripulada. Un motor iónico puede producir un impulso especı́fico de 8000 a 80000 segundos, pero su empuje 294 está entre los 10 Maniobras orbitales 3 y los 10 N. El efecto de este tipo de motores es igual al de una pequeña perturbación que actúa de manera continuada. Este tipo de efecto es similar al que puede producir otro de los sistemas de propulsión propuestos, aunque todavı́a no probados: la vela solar. En este caso se trata del efecto continuado de la presión de radiación solar sobre una vela de grandes dimensiones. Esto puede producir una fuerza de unos 9 N por km2 de vela, siempre en la dirección opuesta al Sol, sin gasto alguno de combustible. Los motores iónicos han sido probados en la misión de la ESA Smart-1, que ha llevado una nave a la Luna con un motor iónico de 70 milinewtons en una trayectoria espiral, esto es, con el semieje creciendo poco a poco de forma continua. La duración del viaje ha sido de 14 meses, frente a una duración menor de cuatro dı́as de una trayectoria convencional pero con un coste muchı́simo menor. En lo que sigue estudiaremos el efecto sobre las órbitas de los satélites de maniobras producidas por cohetes de propulsión quı́mica y supondremos que el impulso total se ha producido por un encendido instantáneo de los cohetes que origina una discontinuidad en la velocidad sin cambio de posición. Para terminar este apartado, y una vez visto lo que la tecnologı́a de cohetes puede proporcionarnos en la actualidad, revisaremos una serie de magnitudes que informarán sobre los costes de cada tipo de misión. Por un lado el proceso más caro de un misión espacial es el proceso de lanzamiento, que exige conseguir una velocidad de 7.9 km/s, lo que requiere una cantidad de combustible enorme. Esta es la razón principal por la que el proceso de lanzamiento y el resto de la misión se consideran por separado, requieren distinta tecnologı́a y abordan problemas muy diferentes. El uso de los cohetes, una vez puesto el satélite en órbita, es mucho más moderado que en la fase del lanzamiento. Los cohetes tienen un empuje mucho menor que los usados en el lanzamiento y las necesidades de combustible son mucho más pequeñas, aunque varı́an mucho en función del tipo de misión. Por ejemplo, un satélite en órbita geoestacionaria necesita, para una misión de una vida media de unos 10 años, puesta inicialmente en una órbita GTO, un delta uve caracterı́stico de unos 2000 m/s, algo menor o mayor dependiendo de la inclinación de la órbita de aparcamiento inicial, que dependerá de la latitud del lugar del lanzamiento. Esta cantidad puede suponer entre unos 800 o 1000 kg de combustible para una nave con una masa inicial de unos 2000 kg y un motor de Isp = 300 s. Las maniobras necesarias para corregir el rozamiento atmosférico de una órbita LEO son muy frecuentes pero de pequeño delta uve, no mayor que 100 m/s dependiendo de la altitud. Esto puede suponer, para una altitud de 450 km y un Isp = 250 s un gasto de 12.8 kg de combustible por año. Aunque el cálculo del impulso total necesario para cada una de las distintas maniobras será estudiado más adelante podemos adelantar las magnitudes de alguna de estas maniobras. Ası́ por ejemplo: el paso de una órbita LEO a una GTO Lanzamiento de satélites artificiales 295 requiere 2500 m/s; para pasar de una GTO a una geoestacionaria es necesario 1500 m/s; el paso desde el perigeo de una órbita GTO a una órbita de escape de la Tierra es de 700 m/s; la inserción en una órbita lunar de una órbita de escape de la Tierra son 700 m/s; etc. 18.4 Lanzamiento de satélites artificiales El proceso inicial en la puesta en órbita de una nave solo puede ser llevado a cabo por medio de un vehı́culo de grandes dimensiones llamado cohete portador o vector de lanzamiento. Posteriormente, cuando el satélite ya esté en órbita, pequeños motores, llamados también cohetes 3 serán usados para efectuar las maniobras de transferencia que lleven el satélite a su órbita nominal o que lo mantengan en ella. Hemos de pensar en un satélite artificial como en un objeto pequeño, sin capacidad para cargar grandes cantidades de combustible y, por tanto, sin posibilidad de navegar libremente en el espacio, estando limitada esta navegación a la órbita en la que ha sido dejado y a pequeñas correcciones de dicha órbita realizadas con una cantidad limitada de combustible o con la energı́a generada por los paneles solares que en ocasiones se le añaden. Por ello, es muy importante considerar por separado el proceso de lanzamiento, que exige el uso de los vectores de lanzamiento, y el desarrollo del resto de la misión a partir del instante de puesta en órbita. Un cohete portador consiste en un vehı́culo de grandes dimensiones, con una gran cantidad de combustible, que tras un periodo de combustión consigue comunicar al satélite una velocidad de módulo igual o mayor que la velocidad de satelización. Una vez terminada esta combustión el satélite se separa del cohete y comienza su misión en solitario. Para una mayor eficiencia en la puesta en órbita del satélite, los cohetes portadores son construidos con varias fases con sus correspondientes depósitos de combustible y motores. Estas fases son sucesivamente abandonadas y caen a la Tierra una vez que el combustible se ha consumido. El satélite ocupa generalmente una pequeña parte del cohete, en el extremo superior del mismo, y es llamado en Astronáutica la carga útil. En lo que sigue, por simplificar, supondremos que el cohete tiene únicamente dos fases y la carga útil. Existen dos formas distintas de poner el satélite en órbita según queramos una órbita baja o alta. Analizaremos la primera, pues la segunda se realiza en dos etapas, una primera etapa que es idéntica a la de las órbitas bajas y una segunda que consiste en una corrección de la órbita previa a la definitiva. La primera etapa consiste en el lanzamiento del cohete desde un lugar de la superficie terrestre caracterizado por su latitud geográfica l . Inicialmente los mo3 Suele utilizarse indistintamente la palabra cohete tanto para el vehı́culo lanzador como para los motores de éste o de el propio satélite. 296 Maniobras orbitales tores son encendidos y el cohete lanzado verticalmente. Inmediatamente después de que comience la ascensión del vehı́culo se le comunica una lenta rotación que orienta el eje longitudinal del cohete, que señala la dirección del vector velocidad, hacia un lugar del espacio de acimut As y distancia cenital (90 s ). Antes de llegar al punto S, final de la trayectoria del cohete, se abandona la primera fase del mismo, que cae a la Tierra y se enciende la segunda que lo lleva hacia S. En este punto se separa la segunda fase de la carga útil y ésta es dejada en su órbita con una velocidad dada por el vector X s . Las caracterı́sticas técnicas y económicas del lanzamiento obligan a que el punto S se encuentre a una distancia entre 200 y 500 km del lugar del lanzamiento, por lo que, sin pérdida de generalidad, podemos suponer para el punto S una latitud s = l , igual a la de la base de lanzamiento. Xs S L Obsérvese que la segunda fase queda también en órbita junto con la carga útil, sin embargo, las proFigura 18.1: Lanzamiento de un satélite arpiedades aerodinámicas de ésta hatificial. cen que se vea rápidamente afectada por el rozamiento atmosférico, frenándola4 y obligándola a caer a la Tierra. La caı́da de la primera fase a la Tierra y la posibilidad de accidente previo y caı́da prematura del cohete a la Tierra limitan el acimut o dirección de lanzamiento. Generalmente, las bases de lanzamiento están situadas junto al mar, o en regiones ampliamente despobladas, de manera que el acimut del lanzamiento está condicionado por la dirección que menor riesgo de accidente entrañe. Supondremos el satélite puesto en órbita en el punto S con una velocidad X s de módulo vs y coordenadas angulares As , s respecto de un sistema de coordenadas horizontales: 0 1 vs cos s sen As X s = @ vs cos s cos As A . vs sen s (18.10) Z Xs vs Sur s As El valor de X s no sirve para establecer la velocidad inicial del satélite Figura 18.2: Vector velocidad del satélite. en el problema de dos cuerpos, y con ello establecer su órbita, pues este vector debe estar referido a un sistema inercial, 4 El propio rozamiento evita el peligro al quemar totalmente la nave antes de su caı́da. Lanzamiento de satélites artificiales 297 y el sistema de coordenadas horizontales no lo es debido a la rotación de la Tierra. Si tenemos en cuenta la relación de la velocidad expresada en un sistema inercial y otro que gire con velocidad angular ! podremos poner X o = X s + ! ⇥ xs , donde xs es la posición del satélite. P Z En nuestro caso ! es un vector de módulo 2⇡ radianes/dı́a, que lleva la dirección del polo norte. El vector xs , que representa la posición del satélite, forma un ángulo igual a 90 l con ! (ver figura 18.3). Por tanto ! xs Sur |! ⇥ xs | = ! r0 cos l, mientras que la dirección de ! ⇥ xs debe ser perpendicular a xs , esto es, pertenece al plano horizontal, y llevará la dirección este, es decir ! ⇥ xs = ( ! r0 cos Figura 18.3: Rotación de la Tierra y posición del satélite. 0 vs cos X o = @ vs cos vs sen s s sen As cos As s Por tanto se tendrá 1 !ro cos l A, l , 0, 0). (18.11) que representa la velocidad absoluta del satélite, aunque expresada en el sistema horizontal. El término ! ro cos l , es la contribución de la velocidad de rotación de la Tierra a la velocidad del satélite. En estas condiciones, las coordenadas polares esféricas (vo , Ao , o ) pueden considerarse como la velocidad, acimut y altura del satélite en el instante inicial. En particular, puede observarse que vo2 = vs2 2 vs ! cos s cos l sen As + ! 2 ro2 cos2 l. (18.12) Analizando detalladamente la expresión anterior se concluye que la contribución de la rotación de la Tierra a la velocidad del satélite es máxima, con el consiguiente ahorro de energı́a, cuando As = 270 , esto es, cuando el cohete es lanzado en dirección este, o bien cuando l = 0 , esto es cuando se lanza desde el ecuador. Este ahorro puede suponer hasta un 6 % de la velocidad requerida. El ahorro en función del acimut del lanzamiento se debe combinar con las restricciones de seguridad de cada base y ha propiciado que tanto la base americana 298 Maniobras orbitales de Cabo Cañaveral (Florida) como la francesa de Kourou (en la Guayana Francesa) se encuentren en la orilla atlántica del continente americano desde donde puede dirigirse el cohete hacia el este con total seguridad. Además, ambas bases están muy próximas al ecuador, l = 25 N en el primer caso y l = 5 N en el segundo. En lo que sigue, supondremos que hemos dejado el satélite en una posición definida por su distancia al centro de la Tierra, ro , su latitud l , que se considera igual a la de la base de lanzamiento y su velocidad inicial dada por vo , Ao , o . Estudiaremos ahora los elementos orbitales de este satélite en función de los cinco parámetros. Teniendo en cuenta la cantidad de energı́a necesaria para alcanzar la velocidad de satelización, o una velocidad mayor, se considera que la velocidad conseguida permitirá únicamente órbitas elı́pticas, siendo necesaria una transferencia entre órbitas para conseguir posteriormente una órbita parabólica o hiperbólica. Por tanto, en este apartado consideraremos únicamente órbitas elı́pticas y aplicaremos las fórmulas del movimiento orbital particularizadas al caso elı́ptico. Como sabemos, en el movimiento elı́ptico la velocidad se puede poner como ✓ ◆ 1 2 vo2 = µ , ro a de donde obtenemos a= 2µ ro µ , r0 vo2 (18.13) que nos da el semieje de la órbita. Por otro lado G = |xo ⇥ Xo | = ro vo |sen(90 pues o o )| = ro vo cos o, es el ángulo entre xo , dirección del cenit, y Xo . A partir de ahı́ p= G2 r2 v 2 cos2 = o o µ aµ o , y por último, teniendo en cuenta la relación p = a(1 e2 = 1 ro2 vo2 cos2 aµ o , e2 ), podemos poner (18.14) que nos da la excentricidad de la nueva órbita. A partir de la expresión de la excentricidad podemos extraer alguna conclusión sobre los parámetros del lanzamiento. En primer lugar, suponiendo la velocidad vo igual a la de satelización, el factor ro2 vo2 /aµ es igual a la unidad, por lo que para poner el satélite en órbita baja hay que conseguir al final de la fase de lanzamiento un valor de o próximo a cero para conseguir una órbita poco excéntrica. Una gran excentricidad en este tipo de órbita puede provocar la colisión del satélite con la Tierra, pues la distancia en el periastro, rp = a(1 e), puede hacerse menor que el radio de la Tierra. Lanzamiento de satélites artificiales 299 Una órbita alta puede conseguirse, bien a partir de una órbita baja y una transferencia orbital Xo como las que serán analizadas al s final de este capı́tulo, o bien por un tipo diferente de lanzamiento en el que en lugar un ángulo o pequeño y una velocidad de satelización, se obtiene un o de unos 45 y una velocidad mucho menor (figura 18.4). De esta forma se consigue una órbita balı́stica que deberı́a volver a chocar con la Tierra. Sin embargo, en la parte más alejada de la superficie teFigura 18.4: Otro tipo de lanzamiento. rrestre se encienden los motores de la segunda fase del cohete para obtener una velocidad que ponga el satélite en una órbita de mayor altitud. Para continuar con la obtención de los elementos orbitales recordemos la expresión de r en función de la anomalı́a excéntrica y la ecuación de Kepler r = nt = a(1 E e cos E), e sen E. De la primera obtenemos la relación cos E = a r ae . Por otro lado, derivando ambas y sustituyendo el valor de d E/d t, se llega a rṙ x·X sen E = p = p , e µa e µa por lo que podremos finalmente poner E = atan( a r x·X , p ). ae e µa (18.15) Esta relación, aplicada al instante S donde comienza la órbita del satélite, nos dará a r ro vo sen o E = atan( , ), (18.16) p ae e µa donde observamos que un valor de al periastro. o próximo a 0 nos asegura que S está próximo 300 Maniobras orbitales A partir de este valor de Eo podemos obtener la época de paso por el periastro como s a3 T = to (Eo e sen Eo ), (18.17) µ Para obtener los elementos angulares de la órbita, obsérvese la figura 18.5 donde SMST representa el instante de tiempo sidéreo local del satélite en el momento en que es dejado en órbita. Este tiempo puede conocerse fácilmente a partir del tiempo sidéreo local de la estación de lanzamiento y la diferencia de longitudes entre L y S. P Ao S l ! + fo S0 La primera consecuencia que i puede observarse es que un aciSMST ⌦ mut Ao menor que 180 nos da N una órbita retrógrada, mientras que un acimut mayor que 180 nos da una órbita directa. Estu- Figura 18.5: Posición de S en la esfera celeste. diaremos únicamente estas últimas, para las cuales, aplicando las fórmulas de Bessel al triángulo esférico N SS 0 , se llega a las expresiones cos i cos Ao sen l = = = sen Ao cos l , tan l cot(! + fo ), cot Ao tan(SMST ⌦). (18.18) La primera de las relaciones nos indica que la inclinación de la órbita depende del acimut del lanzamiento y de la latitud de la base. Observando esta relación se llega a la conclusión de que únicamente podemos conseguir órbitas ecuatoriales si lanzamos el cohete desde el ecuador en dirección este, mientras que una órbita polar se consigue bien lanzando exactamente desde el polo norte o sur, o bien lanzando hacia el norte o el sur desde cualquier lugar de la Tierra. Este hecho limita la industria espacial de muchos paı́ses que no disponen de bases cerca del ecuador, por lo que no pueden poner directamente en órbita satélites geoestacionarios de comunicaciones. La tercera relación nos da el valor de SMST ⌦ en función de l y Ao . Esta relación nos indica la hora del lanzamiento para conseguir un valor dado del ángulo del nodo. Esto define una primera condición para la llamada ventana de lanzamiento, que es el perı́odo de tiempo en que un satélite puede ser lanzado al espacio para conseguir una órbita determinada. Otras condiciones son de tipo Corrección de órbitas 301 técnico como la iluminación del Sol, el campo de visión de sensores estelares, visibilidad desde ciertas estaciones, etc. Hasta aquı́ se han tratado dos tipos de lanzamientos, los que ponen el satélite en una órbita LEO y los que permiten ponerlo en órbitas más altas por medio de una órbita balı́stica y un impulso en el apogeo. Existe una tercera forma, muy usada para lanzar satélites a órbitas geoestacionarias basada en otra etapa más en el cohete portador. Una vez puesta la carga útil y la última etapa en una órbita LEO, se utilizan los motores de la última etapa para poner el conjunto en una órbita GTO que tiene su apogeo en un punto del anillo geoestacionario. El satélite se deja finalmente en esta órbita y deben ser los motores del satélite los que realicen una maniobra en el apogeo de la órbita GTO para dejarlo en órbita geoestacionaria. Puesto que el lanzamiento no se puede realizar exactamente desde el ecuador la órbita inicial está ligeramente inclinada. Esta inclinación, dependiente de la latitud del lugar de lanzamiento, se hereda en las órbitas GTO y sólo se corrige cuando se realiza la maniobra de paso a órbita geoestacionaria pues, como se verá mas tarde, en ese punto es mucho más económica. 18.5 Corrección de órbitas Una vez puesto en órbita un satélite artificial debemos buscar la manera de modificar su órbita, bien porque ésta no es la órbita nominal del satélite, que no siempre puede conseguirse directamente en el lanzamiento, o bien porque las perturbaciones van degradando poco a poco la órbita nominal que debe ser corregida para que el satélite pueda seguir desempeñando la función para la que ha sido diseñado. Supongamos que un satélite artificial se encuentra en una órbita inicial, Oi , de elementos orbitales (ai , ei , ii , ⌦i , !i , Ti ). En el instante t su posición y velocidad vendrán dados pos xi , X i . Si en dicho instante comunicamos un impulso que varı́a la velocidad a X f = X i + v, la órbita final Of vendrá dada por los elementos orbitales (af , ef , if , ⌦f , !f , Tf ) obtenidos a partir de la posición y velocidad iniciales xf = xi , X f . El método de Laplace permitirá obtener dichos elementos orbitales. El paso del satélite desde la órbita inicial Oi a una órbita final Of se puede realizar de dos formas distintas según que éstas tengan o no un punto común. Llamaremos corrección de la órbita a la realización de una maniobra orbital simple, efectuada en un punto de intersección de las dos órbitas, y que modifica los elementos de una órbita inicial y los transforma en los de la órbita final. Si las dos órbitas no tienen un punto en común el paso de una órbita a otra será llamado transferencia orbital y deberá ser realizado con un mı́nimo de dos maniobras. El problema de las correcciones orbitales o maniobras orbitales simples tiene una gran influencia en la duración final de la misión espacial. En efecto, cada maniobra exige un vi para el cual se gasta una cierta cantidad de combustible. 302 Maniobras orbitales En el momento en que no hay más combustible la vida activa del satélite acaba, pues ya no podremos corregir la órbita y ésta se degradará por el efecto de las perturbaciones. Ası́, la cantidad total de combustible determina el v caracterı́stico, que es la suma de todos los vi de las sucesivas maniobras. La estrategia de las correcciones orbitales debe ser diseñada de manera que se minimice la suma de los vi para conseguir alargar al máximo la vida del satélite. No existe una estrategia óptima y, en muchas ocasiones, ésta depende de diversos factores y no solo el gasto de combustible. Sin embargo, el estudio de las caracterı́sticas dinámicas de los distintos tipos de correcciones, junto con las de las transferencias orbitales, nos ayudará en la elección de la estrategia final de las maniobras. Nuestro problema será obtener el impulso necesario v para pasar de Oi a Of , y que debe ser aplicado en el punto común de ambas órbitas. Por su simplicidad e importancia analizaremos por separado tres formas posibles de correcciones orbitales: una corrección general, la corrección del plano de la órbita y la de la forma de la órbita manteniendo el plano. 18.5.1 Corrección general de la órbita Para realizar una corrección de la órbita en una única maniobra basta con que exista un punto de intersección entre la órbita inicial y la final para lo que debe aplicarse el procedimiento desarrollado en el apartado 9.6. Una vez comprobado que existe tal punto, en los apartados 9.6.2 y 9.6.3 se presenta un procedimiento para calcular las anomalı́as verdaderas fi , ff 5 del punto de intersección en ambas órbitas, lo que nos indica dónde debe efectuarse la maniobra. Con los valores de fi , ff basta aplicar las expresiones de cálculo de efemérides (9.30) para obtener los vectores velocidad X i , X f con los que calcular el impulso v = X f X i. En general no suelen aplicarse maniobras generales sino que éstas se dividen en varias maniobras consecutivas que cambian solo parte de los elementos orbitales, bien los que definen el plano orbital o los que determinan la forma y dimensiones de la órbita. 18.5.2 Cambio del plano orbital Si queremos cambiar el plano orbital sin modificar la forma de la órbita deberemos efectuar una maniobra que no modifique la energı́a, que es inversamente proporcional al semieje a, ni el módulo del momento angular, que define el semilado recto p de la órbita, y junto con el valor de a, su excentricidad e. El valor de la energı́a podı́a ponerse como 2h = v 2 µ/r, por lo que para mantenerla constante, debe mantenerse constante el módulo de la velocidad. 5 Allı́ llamadas f1 , f2 . Corrección de órbitas 303 Si la velocidad inicial es X i = R u + T v, expresada en el sistema orbital, ensayaremos una maniobra que produzca una velocidad final X f = R u + T cos A v + T sen A n, esto es, una velocidad que tiene su componente tangencial girada un ángulo A respecto a u. Se comprueba fácilmente que vi2 = R2 + T 2 = vf2 , por lo que la energı́a, y con ella el semieje se mantienen constantes. A esta maniobra se le llama giro a velocidad constante. Si llamamos Gi al momento angular de la órbita inicial y Gf al de la órbita final, se tendrá Gf = = = xf ⇥ X f r u ⇥ (R u + T cos A v + T sen A n) rT cos A n rT sen A v. Por otro lado, Gi = rT n, por lo que G2i = G2f , esto es, el módulo del momento angular no varı́a, y por tanto p y e no varı́an. El vector de Laplace A indica la nueva dirección espacial de la lı́nea de los ápsides, sin embargo, puede comprobarse que ni !i ni Ti varı́an. El incremento de la velocidad para pasar de X i a X f será v = Xf cuya norma X i = T (1 cos A) v T sen A n, v vendrá dada por ( v)2 = T 2 (1 cos A)2 + T 2 sen2 A = 2T 2 (1 cos A) = 4T 2 sen2 A , 2 o lo que es igual A , (18.19) 2 donde T es la componente transversal de la velocidad en la órbita inicial, esto es v = 2 T sen T = rf˙ = p µ pi r2 f˙ Gi = = . r r r La expresión (18.19) tiene unas interesantes consecuencias dinámicas, pues nos indica que el coste de un cambio orbital es proporcional a la velocidad tangencial lo que lo hace en general muy costoso. En efecto, pensemos en una órbita circular, que por otro lado es una de las más habituales, en ella la velocidad radial es R = 0 p y toda la velocidad es transversal, T = µ/r. Como veremos más adelante, el paso de unap órbita ecuatorial a una polar exige un ángulo A = 90 , luego se tendrá que v = 2µ/r, esto es, mayor que la velocidad de la órbita. Si r coincide con el 304 Maniobras orbitales radio de la Tierra ésta se transforma en la velocidad de escape, es decir es mucho mas caro transformar una órbita baja circular y ecuatorial en una órbita polar que poner en órbita el satélite. Afortunadamente el proceso de lanzamiento permite obtener directamente la inclinación nominal eligiendo adecuadamente el acimut del lanzamiento. Una variación pequeña del plano orbital, hace que sen A/2 sea muy pequeño lo que reduce el coste de la maniobra. A pesar de esto, este tipo de maniobras debe llevarse a cabo lo más alejados de la Tierra que sea posible pues cuanto mayor sea el valor de r menor será el coste. Para encontrar el valor del ángulo girado en función de la inclinación y el ángulo del nodo de ambas órbitas, basta tener en cuenta que dicho ángulo coincide con el ángulo entre los dos planos de la órbita definidos por los vectores ni , nf y haciendo uso de la tercera de las ecuaciones (9.11) se tendrá cos A = ni · nf = cos ii cos if + sen ii sen if cos(⌦f ⌦i ). (18.20) Si no se modifica el ángulo del nodo podemos simplificar la expresión anterior y poner A = if ii . Para calcular el punto donde debe realizarse la maniobra basta calcular la anomalı́a verdadera del punto de intersección en ambas órbitas. Para ello, debe aplicarse el proceso seguido en el apartado 9.6.2, que aparte de indicarnos si esta maniobra es posible si hay algún punto de intersección, nos da una expresión de las anomalı́as fi , ff de dicho punto en sendas órbitas. Aunque con lo visto hasta aquı́ se tiene toda la información necesaria para realizar este tipo de maniobra, puede resultar inA teresante averiguar cual es la latitud geográfica del punto donde I debe efectuarse. Para ello, si dibujamos la trayectoria en la esfeA ra celeste, la dirección de la misma vendrá dada por la componente de la velocidad en el plano if T tangente a la trayectoria en ese ⌦i punto, por tanto, el ángulo enNf ⌦f ii tre los dos planos será igual a A en el punto donde se realiza la Ni maniobra. La posición relativa de las dos órbitas en la esfera celesFigura 18.6: Cambio del plano orbital. te puede verse en la figura 18.6. Sea la latitud del punto I donde se realiza la inyección de combustible o maniobra, aplicando la fórmula de los senos de Bessel a los triángulos esféricos Nf T I y Ni Nf I, y combinándolas Corrección de órbitas 305 adecuadamente, se obtendrá sen = sen(⌦f ⌦i ) sen ii sen if , sen A (18.21) esto es, la latitud del lugar donde debe efectuarse la maniobra. De esta expresión se deduce que para un cambio de inclinación, sin cambiar el nodo, la maniobra debe realizarse al cruzar la órbita el ecuador = 0 . 18.5.3 Corrección de la órbita en su plano El plano de la órbita viene caracterizado por la dirección del vector momento angular G = x ⇥ X, por lo que, al no modificar la posición x, basta que el nuevo vector velocidad X f esté contenido en el plano de la órbita inicial Oi para que ésta no varı́e, manteniéndose constantes los valores de la inclinación if = ii y el ángulo del nodo ⌦f = ⌦i . Xf Xi f i r O f1 f2 O1 O2 !2 !1 Nodo a2 a1 Figura 18.7: Corrección de la órbita en su plano. Como en la maniobra de cambio de plano es preciso demostrar, en primer lugar, la existencia de un punto de intersección, mediante el proceso descrito en el apartado 9.6.3 donde se encuentran los valores fi , ff 6 , de las anomalı́as verdaderas de la intersección en las dos órbitas, cuyo significado puede verse en la figura 18.7. Para ello se resuelve la ecuación C cos fi + S sen fi = P, (18.22) siendo C = pf ei pi ef cos(!i S = pi ef sen(!i !f ), P = pi pf . !f ), (18.23) Para encontrar la variación v de la velocidad basta recordar que, si las órbitas son elı́pticas, se tendrá ✓ ◆ ✓ ◆ 1 1 2 2 2 2 vi = µ , vf = µ . r ai r af El ángulo ponerse como 6 Allı́ entre la dirección radial y la velocidad, definido en (9.22), podı́a = atan(r/v, rf˙/v). En el movimiento orbital rf˙ = G/r > 0, luego se usaba la notación f1 , f2 . 306 Maniobras orbitales sen > 0, por tanto, la reducción del posible rango de valores de permite poner = acos(ṙ/v). Por otro lado, la ecuación (8.11) de la expresión de r en polares se deduce que e sen f = acos p , (18.24) 1 + 2e cos f + e2 lo que nos da los valores de i , f sin más que añadir el correspondiente subı́ndice a los elementos orbitales en la expresión anterior. Basta recordar que X = v cos u + v sen v = v cos u + para obtener, tanto X i como X f y por tanto tendrá a partir de la relación ( v)2 = vf2 + vi2 18.5.4 vG v, r v. Asimismo, el módulo se ob- 2 vi vf cos( f i ). (18.25) Cambio de la forma de la órbita Un caso particular del anterior consiste en cambiar la forma y dimensiones de la órbita sin modificar su plano ni su posición relativa en éste. Esto equivale a mantener constante el valor de !, ⌦, i y variar a y e. En este caso !1 = !2 por lo que, particularizados los coeficientes (18.23), la ecuación (18.22) podrá ponerse como cos f = p1 e 1 p2 p2 , p1 e 2 (18.26) siendo f la anomalı́a de la intersección en ambas órbitas, que coincide por ser común la lı́nea de los ápsides. En el caso de que alguna de las órbitas sea circular, al imponer !1 = !2 , hemos tomado un origen ficticio de anomalı́as verdaderas de las órbitas circulares en el perigeo de la órbita no circular. Una maniobra muy frecuente consiste en fijar la distancia mı́nima, o distancia en el periastro, rp del satélite y modificar la máxima ra . Si tenemos en cuenta que para una elipse se tiene p = rp (1 + e) = ra (1 e), (18.27) la ecuación (18.26) se pondrá cos f = rp (1 + e1 ) rp (1 + e2 )e1 rp (1 + e2 ) = 1, rp (1 + e1 )e2 por lo que dicha maniobra deberá realizarse en el periastro con un ángulo = 0, es decir con un impulso en la dirección tangencial, aumentando la velocidad, si queremos alejar el apoastro y disminuyéndola si queremos acercarlo. Corrección de órbitas 307 X X v v (a) v < 0. Menor distancia ra (b) v > 0. Mayor distancia ra Figura 18.8: Cambio de la distancia en el apocentro. Observemos que en este caso, extrayendo la raı́z cuadrada de (18.25), se obtiene v = vf vi , que sale positiva al aumentar la velocidad y negativa al disminuir. Obviamente v es una norma luego debe ser siempre positivo, pero en los impulsos tangenciales, donde las velocidades se suman y restan linealmente, el signo indica que el impulso debe ser efectuado en la dirección del vector velocidad (positivo) o la contraria (negativo). De la misma forma puede demostrarse que para aumentar o disminuir la distancia en el periastro, manteniendo la del apoastro, debe efectuarse la maniobra en el apoastro, f = 180 , también en la dirección tangencial. 308 Maniobras orbitales Capı́tulo 19 Transferencias y encuentros orbitales 19.1 Transferencias orbitales El problema de las transferencias orbitales consiste en el paso de una órbita inicial a otra final que no tiene ningún punto en común con la inicial. Para esta transferencia son necesarios, al menos, dos impulsos v o maniobras. Para ello, elegiremos un punto cualquiera de la órbita inicial y otro de la órbita final, e iremos construyendo una cadena de órbitas de transferencia intermedias de manera que la primera órbita de transferencia pase por el punto elegido de la órbita inicial y un punto de la segunda órbita de transferencia, que cada órbita de transferencia tenga un punto en común con la anterior y con la siguiente y finalmente que la última órbita de transferencia pase por el punto elegido de la órbita final. Cuando el orbitador pase por cada punto en común efectuaremos una maniobra que lo cambie de órbita hasta que se encuentre en la órbita final. Ası́ pues, si hay n órbitas de transferencia efectuaremos n + 1 maniobras. Puesto que podemos elegir cualquier punto en las órbitas inicial y final y un número indeterminado de órbitas intermedias nos encontramos un número infinito de posibilidades de realizar una transferencia, por lo que debemos tener un buen criterio de búsqueda y elección para resolver este problema. El problema de construir la transferencia óptima consiste en elegir, de entre todas las posibles combinaciones de maniobras que pasen de una órbita inicial a una final, aquella que menor coste tenga, teniendo en cuenta que el coste es función de la velocidad caracterı́stica de la transferencia. En muchas ocasiones hay que considerar 310 Transferencias y encuentros orbitales también otro parámetro en este estudio: el tiempo de la transferencia, o tiempo transcurrido entre la primera y la última maniobra. Puede darse el caso de que tengamos una posible transferencia, algo más barata que otra, pero que tenga un tiempo de transferencia considerablemente mayor, lo que puede hacer inviable la misma. Aunque la transferencia entre dos órbitas puede conseguirse siempre mediante dos impulsos, no se puede decir que la velocidad caracterı́stica, o suma de los módulos de los impulsos, sea óptima cuando su número es dos, de hecho, veremos casos en los que se consigue una minimización de esta velocidad aumentando el número de maniobras. Antes de comenzar el estudio de algunas transferencias orbitales, tendremos en cuenta que un impulso tangencial es el que proporciona la mayor variación de la energı́a de la órbita original ya que la energı́a de la órbita depende del cuadrado de la velocidad, y por otro lado vf2 = vi2 + 2 v + 2v i v, nos da una mayor velocidad final cuando v es tangencial. De acuerdo con esto, la mejor forma de aprovechar el impulso suministrado por un cohete es aplicarlo en la dirección del movimiento. La búsqueda de una transferencia óptima es un problema muy complicado que requiere de sofisticadas técnicas matemáticas y que en este momento no está completamente resuelto. Con objeto de ilustrar el problema consideraremos modelos simplificados de transferencias donde los impulsos sean tangenciales y estén efectuados en dos puntos caracterı́sticos de la órbita: el apogeo o el perigeo. En particular estudiaremos el proceso de transferencia entre dos órbitas circulares coplanarias de radios respectivos ri , rf . 19.1.1 Transferencias de Hohmann y bielı́ptica En el año 1925 Hohmann conjeturó que la trasferencia de mı́nimo coste entre dos órbitas circulares es la compuesta de dos impulsos tangenciales realizados en el perigeo y apogeo (o viceversa) de una elipse tangente en estos puntos a las dos órbitas. Este tipo de órbita es la usada por las órbitas GTO que conectan dos órbitas circulares coplanarias, las órbitas LEO y las geoestacionarias y una de las posibles opciones para viajes a planetas. Las figuras 19.1(a) y 19.1(b) muestran las dos posibles situaciones que se pueden presentar según que queramos aumentar o disminuir el radio de la órbita. Supondremos que r1 es el radio de la inicial y r2 es el radio de la órbita final. En el punto M1 se realiza la primera maniobra consistente en un impulso tangencial v1 en el sentido de la velocidad (si queremos aumentar el radio r1 ) o en sentido contrario (si queremos disminuirlo). Tras esta maniobra, la órbita se convierte en una elipse, órbita de Hohmann, en la que M1 es el perigeo (o Transferencias orbitales 311 v1 M2 r2 r1 v1 M1 r2 M1 r1 v2 M2 v2 (a) Aumento del radio orbital. (b) Disminución del radio orbital. Figura 19.1: Transferencia de Hohmann. apogeo), pues al mantener la dirección de la velocidad esta debe ser perpendicular a la dirección radial, pues ası́ ocurre siempre en órbitas circulares, sin embargo, en órbitas elı́pticas este hecho obliga a que el punto sea el perigeo o apogeo. Tras recorrer la mitad de la órbita elı́ptica la segunda maniobra se realizará en el apogeo (perigeo) de la misma M2 , efectuando un impulso tangencial de módulo v2 adecuado para que la nueva órbita sea circular y tenga exactamente el radio r2 deseado. Las condiciones impuestas en el apartado anterior obligan a que la órbita intermedia tenga un valor de la distancia en el perigeo igual al menor de los radios, mientras que la distancia en el apogeo debe coincidir con el mayor. Por ello, suponiendo r1 < r2 se tendrá r1 = a(1 e), r2 = a(1 + e), de donde obtendremos los elementos orbitales de la órbita de transferencia: a= r1 + r2 , 2 e= r2 r 1 . r1 + r 2 (19.1) En el caso de que r1 > r2 tendremos e= r1 r2 , r 1 + r2 por lo que finalmente podremos poner, para cualquier caso e= |r1 r2 | . r 1 + r2 (19.2) 312 Transferencias y encuentros orbitales El tiempo total de duración de la transferencia será igual a la mitad del periodo de la órbita elı́ptica de transferencia, esto es, s s P a3 (r1 + r2 )3 Ttr = =⇡ =⇡ , (19.3) 2 µ 8µ p y llamando P1 = 2⇡ r13 /µ al periodo de la órbita circular de radio r1 se tendrá r (1 + k)3 Ttr = P1 , (19.4) 32 donde hemos llamado k = r2 /r1 a la razón de los radios de las órbitas. Para calcular el coste de la transferencia hemos de calcular los valores de la velocidad antes y después de cada maniobra. La primera pasa de una órbita circular de radio r1 a otra elı́ptica de semieje (r1 + r2 )/2 y una distancia r1 del foco. Ası́ pues s r 2µr2 µ v1 = . (19.5) r1 (r1 + r2 ) r1 La segunda pasa un punto de la misma elipse a una distancia r2 del foco a una órbita circular de radio r2 , luego s r µ 2µr1 v2 = . r2 r2 (r1 + r2 ) Los valores v1 , v2 , ası́ obtenidos, pueden ser positivos o negativos, indicando en este último caso un frenado o disminución de la velocidad. Calcularemos la velocidad caracterı́stica sumándo los módulos de estas cantidades. p Con objeto de quitar las dimensiones de esta cantidad dividiremos por v1 = µ/r1 lo que nos dará v v1 v2 = + , v1 v1 v1 que tras sencillas operaciones podrá ponerse como s s r v 2k 1 2 = 1 + . (19.6) v1 (1 + k) k (1 + k)k La figura 19.2 nos muestra el coste v/v1 de la transferencia en función de k, esto es, de la relación de los radios de las dos circunferencias. Observamos dos comportamientos distintos según k sea menor o mayor que la unidad, esto es, según aumentemos o disminuyamos el radio de la órbita. Cuando disminuimos la órbita por debajo de la mitad del radio inicial el coste se eleva muchı́simo, tendiendo a infinito al tender k a 0. El aumento de k por encima de la unidad supone un aumento del coste hasta un valor máximo 0.5363 que se alcanza enpk = 15.58. A partir de ahı́ el coste va disminuyendo, tendiendo asintóticamente a 2 1 ⇡ 0.41. Transferencias orbitales 313 Esta gráfica permite establecer curiosas conclusiones como que únicamente para valores de 0.49 < k < 3.3 es menos costosa esta trasferencia que un escape, etc. v 1.0 v1 0.8 0.6 0.4 La búsqueda de otro tipo de transferencias entre dos órbitas circulares llevó a estudiar la 0.01 0.1 1 10 100 transferencia bielı́ptica que conecta las dos circulares con tres Figura 19.2: Coste de la transferencia de Hohimpulsos (figura 19.3(a)). El primann en función de la relación de radios (escala mero lleva a una órbita elı́ptica logarı́tmica). cuyo apogeo está a una distancia rb mayor que el radio de la segunda órbita. Desde este punto Mb una nueva maniobra nos lleva a otra elipse cuyo perigeo está exactamente a una distancia r2 . Desde ahı́ la tercera maniobra pone el satélite en la órbita final. 0.2 B H 0.08 0.06 v2 M2 vb M1 rb 0.04 Mb k 20 v1 (a) Transferencia bielı́ptica. 60 100 (b) Diferencia entre el coste de la transferencia bielı́ptica y la de Hohmann para k > 1. Figura 19.3 Analizaremos en la misma forma que antes la velocidad caracterı́stica en función de k y de otro parámetro kb = rb /r. La figura 19.3(b) muestra la diferencia entre la velocidad caracterı́stica en la transferencia bielı́ptica para kb = 2k, y la velocidad caracterı́stica en la transferencia de Hohmann para valores de k mayores que la unidad. Puede comprobarse que la transferencia bielı́ptica es más económica que la de Hohmann cuando k > 13.87. Sin embargo, la diferencia es siempre pequeña, lo que combinado con el hecho de que el tiempo de transferencia es mucho mayor, pues deben recorrerse dos medias elipses, ambas mayores que la de Hohmann, hace que esta mejora del coste no sea útil en la práctica. 314 19.1.2 Transferencias y encuentros orbitales Transferencia óptima en dos maniobras La comparación entre la transferencia de Hohmann y la bielı́ptica nos ha mostrado las peculiaridades del cálculo de transferencias que nunca nos aseguran mejores resultado con el mı́nimo número de maniobras. Sin embargo, si que podremos obtener la transferencia óptima cuando fijamos en dos el número de maniobras y fijamos también el punto donde se realizan. Supondremos una órbita inicial Oi y otra final Of que no tienen ningún punto en común. Buscaremos una órbita de transferencia que conecte un punto cualquiera de la órbita inicial P1 2 Oi , con un punto cualquiera de la órbita final P2 2 Of , de manera que la velocidad caracterı́stica sea mı́nima. El recorrido entre P1 y P2 se realizará por una de las infinitas órbitas de transferencia Ot (x1 , x2 ), que conecta P1 con P2 . La primera maniobra, realizada en el punto P1 , de vector de posición x1 , pasará de una velocidad, X 1 , antes de la maniobra, a X i , después de la maniobra. Si llamamos {u1 , v 1 , n} al sistema orbital de la órbita O1 en P1 podremos poner, por un lado X 1 = R1 u1 + T1 v 1 , y por otro X i = Ri u1 + Ti v 1 + Ni n. De esta forma el v de esta maniobra vendrá dado por q v1 (R1 , T1 ) = (Ri R1 )2 + (Ti T1 )2 + Ni2 . (19.7) La segunda maniobra se realizará en el punto P2 , de vector de posición x2 , donde la velocidad del satélite pasará del valor X f = Rf u2 + Tf v 2 + Nf n, antes de la maniobra, al valor X 2 = R2 u2 + T2 v 2 , después, y donde hemos considerado que {u2 , v 2 , n} es el sistema orbital de la órbita O2 en P2 . El v de la segunda maniobra vendrá dado por q v2 (R2 , T2 ) = (Rf R2 )2 + (Tf T2 )2 + Nf2 . (19.8) Para efectuar la transferencia de mı́nimo coste del satélite desde la órbita inicial Oi a la órbita final Of debemos elegir dos puntos P1 , P2 y una órbita de transferencia Ot (x1 , x2 ) que haga mı́nimo el valor del v = v1 + v2 total. Para hacer esto, partiremos de dos puntos P1 , P2 elegidos y aplicaremos el método de los multiplicadores de Lagrange para minimizar la función v(R1 , T1 , R2 , T2 ) = q q (Ri R1 )2 + (Ti T1 )2 + Ni2 + (19.9) (Rf R2 )2 + (Tf T2 )2 + Nf2 , (19.10) sujeta a las relaciones (11.14, 11.16, 11.18) entre los parámetros (R1 , T1 , R2 , T2 ). Cuando w = 0 deberemos sustituir la restricción (11.18) por la (11.19). Si hacemos un barrido de puntos P1 , P2 de cada una de las dos órbitas y calculamos la velocidad caracterı́stica mı́nima en cada caso podemos comparar estas velocidades mı́nimas y decidir entre que puntos haremos la transferencia. Encuentros orbitales 315 vm w 0 180 360 Figura 19.4: Transferencias entre dos órbitas circulares coplanarias. Para comprobar la validez del método, reproduciremos un resultado clásico de dinámica orbital: la órbita de transferencia de Hohmann. Supondremos dos órbitas circulares coplanarias de radios r1 y r2 . Al ser coplanarias, el triángulo OP1 P2 formado con dos puntos cualesquiera P1 y P2 de las dos órbitas circulares está en el mismo plano que las dos órbitas por lo que la órbita de transferencia estará también en el mismo plano. Además, por ser órbitas circulares el resultado obtenido será idéntico para cualquier elección del punto inicial P1 , dependiendo únicamente del ángulo de transferencia w en lugar de depender de cada una de las anomalı́as de los puntos de salida y llegada. La figura 19.4 representa, a la izquierda, las órbitas de transferencia de velocidad caracterı́stica mı́nima para los distintos valores de w, mientras que a la derecha se representa el valor de vm (w). Como puede observarse el mı́nimo se obtiene para un valor de w = 180 , lo que concuerda con el resultado conocido, enunciado por Hohmann, de que la órbita de transferencia de mı́nimo coste entre dos órbitas circulares coplanarias conecta los dos puntos alineados con el centro de atracción, por medio de una órbita que tiene su periastro y apoastro en estos dos puntos. 19.2 Encuentros orbitales En el apartado anterior se ha analizado la realización de transferencias orbitales que permiten que una nave pase de una órbita inicial a otra final sin ningún punto en común con la primera, sin embargo, no se ha tenido en cuenta en ningún momento en que instante entra la nave en la segunda órbita. Este valor es fundamental cuando no se trata de un simple cambio de órbita, sino que se pretende que la nave alcance otro cuerpo que ocupaba esa segunda órbita. 316 Transferencias y encuentros orbitales Una maniobra del tipo enunciado en el párrafo anterior se llama encuentro espacial 1 y tiene muchas utilidades en Astrodinámica, bien para reunir dos naves, por ejemplo un transbordador espacial y la ISS, o bien para llegar con una nave hasta la Luna o un planeta. Para resolver este problema comenzaremos llamando objetivo, y representándolo por O a la nave o cuerpo que queremos alcanzar e interceptor a la nave que modifica su órbita en busca del objetivo. Tendremos dos posibles estrategias de aproximación: situar el interceptor en la órbita del objetivo en un punto distinto al que ocupa éste y realizar una maniobra de espera del objetivo o bien hacer entrar al interceptor en la órbita del objetivo en el mismo punto que ocupa el objetivo en el instante de entrada. 19.2.1 Maniobra de espera En el primer caso supondremos que ya se ha situado el interceptor en una órbita idéntica a la del objetivo, salvo un valor distinto de la época del paso por el periastro, que hace que interceptor y objetivo estén permanentemente separados en esta órbita. Existen varias estrategias para hacer coincidir ambos cuerpos, aunque describiremos aquı́ una de las más sencillas que consiste en esperar a que el interceptor pase por el periastro y aplicar en ese punto un v tangencial, bien negativo o positivo, que lo sitúe en una órbita de periodo menor o mayor que la órbita del objetivo y esperar a que objetivo e interceptor pasen simultáneamente por el punto común de ambas. O fo I v Sea fo la anomalı́a verdade- Figura 19.5: Órbita de espera del interceptor I ra del objetivo en el instante TI para alcanzar el objetivo O. Caso en que se acorta de paso por el periastro del inter- el periodo del interceptor. ceptor (ver figura 19.5). Una vez obtenido fo podremos calcular el tiempo relativo de O en ese punto t = to TO , es decir el tiempo que ha tardado O en pasar del periastro al punto de anomalı́a fo . A partir de ese instante el tiempo que tardará en pasar por el periastro de nuevo será nO PO t, siendo nO el número de pasos. Si el interceptor realiza una maniobra tangencial en el periastro, llegará a un periodo orbital PI de forma que los pasos sucesivos por el punto donde se ha 1 En inglés space rendezvous. Encuentros orbitales 317 realizado la maniobra se efectuarán en los instantes nI PI , siendo nI el número de vueltas. Si han pasado nO vueltas del objetivo y nI del interceptor antes de pasar simultáneamente por el punto común de las dos órbitas, el tiempo transcurrido será el mismo, por lo que se cumplirá la relación nO PO t = nI PI , de la cual podemos deducir n P t PI = O O . (19.11) nI El objetivo es encontrar un valor PI , compatible con el problema, a partir de dos número enteros positivos cualesquiera nO , nI . Para comprobar la idoneidad de PI habrá que deducir, a partir de él, el semieje mayor de la nueva órbita, y puesto la distancia en el periastro rp se mantiene, calcular a partir de a y rp el valor de la excentricidad e. Aunque nO , nI pueden ser elegidos arbitrariamente, con la condición de que los valores calculados de a, e sean correctos, es conveniente comprender el significado de ambos valores para una elección adecuada. El parámetro clave es nI . Cuanto mayor sea nI menor será el v, por lo que el coste será menor, sin embargo el tiempo de espera para el encuentro será mayor. Hemos planteado esta maniobra en el periastro, pero se puede plantear de forma similar desde el apoastro. En este caso hay que añadir una condición adicional, pues si la maniobra exige acortar el periodo esto implicará acortar la distancia rp en el periastro, que debe ser siempre mayor que el radio del planeta situado en el foco de las dos órbitas. En el caso más simple de que la órbita objetivo sea circular no existe periastro ni apoastro, por lo que la maniobra se puede realizar desde cualquier punto por igual. Hay que tener en cuenta que en este caso si se acorta el periodo debe comprobarse el nuevo valor de rp pues en este caso el punto de la maniobra actúa de apoastro de la nueva órbita. 19.2.2 Encuentro directo en transferencias generales El encuentro directo consiste en encontrar la órbita de transferencia entre dos órbitas dadas añadiendo la condición de que la posición del orbitador y del interceptor deben coincidir en el instante que la órbita de transferencia se cruza con la órbita final. Esta condición introduce mayor complejidad al problema de las transferencias, pues a la condición de minimizar el v añade otra nueva condición que fija el tiempo de tránsito en la órbita de transferencia. Siempre es útil contar con una solución inicial del problema, aunque la que vamos a dar en primer lugar no será, en general, la óptima. 318 Transferencias y encuentros orbitales Llamemos OI a la órbita del interceptor y OO a la del objetivo. Supondremos que en el insIf tante ti el interceptor se encuenOf tra en el punto xI = P Ii de xO OI y el objetivo se encuentra en P xO = P Oi de OO . En ese insOt xI tante queremos realizar una maOI niobra que pase el interceptor a una órbita de transferencia Ot . Ii OO que tenga un punto de intersección con la órbita objetivo OO , y Oi que éste se alcance al cabo de un tiempo t de manera que en el instante tf = ti + t tanto el in- Figura 19.6: Encuentro espacial entre dos órbitas terceptor como el objetivo coin- cualesquiera. cidan en el punto xO = P Of . Para encontrar la órbita de transferencia basta tener en cuenta que en el instante tf se debe verificar también que xO = P If , es decir, éste debe ser el punto de la órbita de transferencia que se alcanza en tf . Ası́ pues, el problema consiste en resolver el problema de Lambert que encuentre la órbita kepleriana que une xI con xO en un tiempo t. Obviamente la eficiencia de esta transferencia estará en función de una buena elección de el punto xI y de t. 19.2.3 Encuentros en transferencias de Hohmann Oe Oi P ✓ O I I N El problema de los encuentros espaciales desde órbitas distintas se simplifica, al igual que el de las transferencias, cuando las órbitas OI y OO son circulares y coplanarias. En este caso realizaremos una transferencia de Hohmann, puesto que sabemos que es la óptima, ahora bien, puesto que esta transferencia se puede iniciar desde cualquier punto de la órbita inicial, por ser esta circular, esperaremos a que la posición relativa inicial de I y O sea la adecuada para su encuentro. Para ver cual es ese punto es conveniente cambiar el sistema de referencia y pasar a otro cuyo plano sea el de Figura 19.7: Sistema sinódico P IO. Encuentros orbitales 319 la órbita, caracterizado por el vector n común en la órbita del objetivo y del interceptor, cuyo eje Ox sea la dirección del interceptor, es decir, la del vector P I. A este sistema le llamaremos sistema sinódico y es el utilizado para estudiar los movimientos geocéntricos de los planetas. La posición del objetivo O, en este sistema, quedará caracterizada por el ángulo ✓ de la figura 19.7. Obsérvese que en esta figura se han representado los dos posibles casos según que la órbita del objetivo tenga un radio menor (Oi ), o mayor (Of ) que la del interceptor. Si xI (t) representa la posición del interceptor en su órbita en cada instante, y xO (t) la del objetivo, el ángulo ✓, que puede tomar cualquier valor en [0, 2⇡), se podrá obtener aplicando la relación (1.25), es decir: ✓(t) = atan [xI (t) · xO (t), n · (xI (t) ⇥ xO (t))] . (19.12) Por otro lado, los ángulos I , O que representan, respectivamente, la posición de I y O respecto de una dirección fija P N , se podrán poner como I = nI (t TI ), O = nO (t TO ), siendo nI , nO , los movimientos medios de las órbitas OI y OO . Por tanto, el valor de ✓ = O se pondrá también como I ✓ = nS (t TS ), (19.13) donde nS = nO nI es la velocidad angular constante del movimiento de O en el sistema sinódico. Observemos que, cuando el objetivo, Oi , tiene un radio menor que el interceptor, se tendrá nO > nI , por lo que nS > 0, y por tanto el ángulo ✓ será creciente, es decir, el objetivo se moverá respecto al interceptor en sentido directo. Cuando el objetivo, Oe , tiene un radio mayor que el interceptor el ángulo ✓ será decreciente, es decir el objetivo se moverá en sentido retrógrado respecto al interceptor. El movimiento de O en el sistema sinódico tiene un periodo S, que llamaremos periodo sinódico, que representa el periodo en el cual se repiten todas las configuraciones posibles de los tres puntos P, I, O. El punto óptimo para realizar la tranferencia, que vendrá caracterizado por un valor del ángulo ✓, se repetirá cada periodo sinódico, por lo que este juega un importante papel en la navegación espacial. Para encontrar el periodo sinódico basta tener en cuenta la relación entre movimiento medio y el periodo, n = 2⇡/P , que añadida a las relaciones entre nS , nO y nI , junto con la condición de que el periodo tiene que ser positivo, nos dará la expresión 1 1 1 = . (19.14) S PO PI 320 Transferencias y encuentros orbitales Por último buscaremos el ángulo ✓IO , que forma el objetivo con el interceptor en el instante adecuado, para que la transferencia de Hohmann haga coincidir ambos en el punto final de esta transferencia. Las figuras 19.8(a) y 19.8(b) nos muestran las dos situaciones posibles según que el interceptor tenga un radio menor (figura 19.8(a)) o mayor (figura 19.8(b)) que el objetivo. Oi ✓IO If Of P Oi ✓IO Ii Ii (a) Aumento del radio orbital. P If Of (b) Disminución del radio orbital. Figura 19.8: Encuentro desde una transferencia de Hohmann. En ambos casos el tiempo de tránsito Ttr del interceptor desde Ii a If vendrá dado por (19.3). Durante ese tiempo el ángulo recorrido por el objetivo es igual a nO Ttr , y este ángulo es igual a ⇡ ✓IO si el objetivo tiene un radio mayor, e igual a ⇡ + ✓IO si lo tiene menor. Ası́ pues se tendrá: ✓IO = 8 > > > > ⇡ > > < nO Ttr > > > > > > : nO Ttr ⇡ = = ⇡ 1 ⇡ nO nO s s (rI + rO )3 8µ (rI + rO ) 8µ 3 ! ! , 1 , rI < rO , (19.15) rI > rO . Únicamente cuando el ángulo ✓, dado por (19.12), alcance el valor ✓IO se podrá realizar la maniobra que permita este encuentro. Esta posición se repetirá cada periodo sinódico, representando también el periodo sinódico el máximo tiempo de espera necesario para poder realizar esta transferencia. Para encontrar el tiempo de espera hasta realizar un encuentro de estas caracterı́sticas basta conocer el valor del ángulo ✓ y tener en cuenta la relación ✓ = nS (t TS ) de la cual obtendremos el tiempo de espera hasta el comienzo de Viaje a Marte en una órbita de transferencia de Hohmann 321 la primera maniobra que será t= ✓ ✓IO nS . Finalmente, sumando a t el tiempo Ttr de la transferencia se obtiene el tiempo de espera hasta el encuentro espacial. 19.3 Viaje a Marte en una órbita de transferencia de Hohmann Para ilustrar lo visto hasta aquı́ efectuaremos el estudio de un viaje a Marte tripulado, lo que exige realizar tanto el viaje de ida como el de vuelta. Los resultados que obtendremos pueden ser fácilmente extrapolados a cualquier otro tipo de transferencia de Hohmann entre planetas. Para comenzar supondremos un modelo simplificado en el que tanto la Tierra como Marte tienen órbitas circulares y coplanarias. Los radios respectivos de dichas órbitas son 1 y 1.524 U.A. lo que nos da unas velocidades orbitales de 29.785 km/s para la Tierra y 24.130 km/s para Marte. Aplicando la relación (19.5) deducimos que el v necesario para entrar en una órbita de Hohmann hacia Marte es de 2.945 km/s. Para que la nave entre en la órbita de transferencia de Hohmann, que es una órbita que tiene el Sol como cuerpo central, debe salir de la atracción gravitacional de la Tierra. En el capı́tulo siguiente analizaremos las fases de una misión interplanetaria que incluyen, para nuestro viaje, una salida de la Tierra en una órbita hiperbólica y una entrada en Marte. Por el momento baste decir que para conseguir el v indicado en el párrafo anterior es necesario aplicar a la nave un v = 3.656 km/s desde una órbita de aparcamiento en la Tierra. La duración de la órbita de transferencia, hasta la llegada de la sonda a las proximidades de Marte, viene dada por (19.3), lo que nos da un valor para el caso de Marte de unos 258 dı́as o 0.7087 años. Hemos despreciado, por ser muy pequeños en comparación con el de la transferencia, el tiempo hasta que la nave sale de la atracción gravitacional terrestre y el tiempo de aproximación a Marte desde que entra en su esfera de influencia gravitacional. Para una misión tripulada debemos traer de regreso la nave lo que exige otra órbita de Hohmann de la misma duración entre Marte y la Tierra. Sin embargo, como se ha visto en el capı́tulo anterior la entrada en una órbita de Hohmann debe realizarse en un instante preciso de la configuración Sol-Tierra-Marte para que la nave llegue al final de su viaje en el momento en que llega el planeta. Esto obliga a alargar la misión para esperar en Marte a que la configuración de los planetas sea adecuada para el regreso a la Tierra. Para analizar la duración exacta de este viaje observaremos la figura 19.9 donde se han representado las distintas fases del mismo. 322 Transferencias y encuentros orbitales La expresión (19.14) nos da un perı́odo sinódico del planeta Marte de unos 780 dı́as (2.14 años), luego la ventana de lanzamiento a una órbita de Hohmann se repite cada poco más de dos años. M3 Las relaciones (19.15) nos dan M2 la posición relativa que deben tener la Tierra y Marte para co- M4 menzar las dos órbitas Hohmann de la misión. En efecto ✓T M = ⇡ nM Ttr = 44. 34, ✓M T = nT Ttr ⇡ = 75. 14. M1 T1 T4 T3 T2 Comienza el viaje en el instante t1 = 0 en el que la Tierra está en T1 y Marte en M1 y el Figura 19.9: Viaje de ida y vuelta a Marte en una transferencia de Hohmann. ángulo entre ambos es ✓T M . En ese momento comienza la primera órbita de transferencia que lleva la sonda al punto M2 donde está Marte en t2 = Ttr . En ese instante la Tierra está en T2 . En lo que sigue llamaremos M = nM (t TM ), T = nT (t TT ), (19.16) a las posiciones angulares de Marte y la Tierra en un instante t cualquiera. Si tomamos como origen de ángulos la dirección de la Tierra en el instante t1 = 0 se podrá poner M = nM (t1 TM ) = ✓T M , T = nT (t1 TT ) = 0, de donde se deduce que TM = ✓T M /nM , TT = 0. Con estos valores y la expresión (19.16) encontramos que las posiciones angulares de Marte y la Tierra en t2 = Ttr son M = 180 , T = 255. 138, que nos da una diferencia angular de 284. 862 que no permite la inserción en una órbita de regreso. La relación (19.13) nos da el valor del ángulo relativo entre Marte y la Tierra. Si particularizamos esta relación para el instante t2 obtenemos TS , valor que posteriormente utilizaremos para ver el tiempo que debe transcurrir hasta el instante t3 en que el ángulo toma el valor ✓M T que permite el comienzo de la segunda maniobra de Hohmann. Este valor nos da un tiempo de espera te que resulta ser te = 1.24403 años. Por tanto, la tercera parte del viaje comienza en el instante t3 = te + Ttr en el que Marte está en M3 y la Tierra en T3 . El viaje termina en el instante t4 = t3 + Ttr , esto es, después del tiempo de la transferencia de Hohmann cuando la sonda llega a la Tierra, que está en T4 y Marte se encuentra en M4 . De esta forma la misión ha durado un tiempo igual a te + Ttr = 2.661 años. Capı́tulo 20 Navegación interplanetaria 20.1 Sondas espaciales En los capı́tulos anteriores se ha estudiado el movimiento de los satélites artificiales terrestres, aunque las ideas y conceptos establecidos son fácilmente exportables a cualquier otro tipo de nave orbitando en torno a un planeta o un satélite natural como la Luna. Estos vehı́culos seguirán siendo llamados satélites artificiales. Distinguiremos los satélites artificiales, que siempre permanecen en órbita elı́ptica alrededor de un planeta, de las naves que realizan un viaje entre cuerpos distintos del sistema solar. A estos vehı́culos les llamaremos sondas espaciales. La caracterı́stica fundamental de las sondas espaciales es que no permanecen siempre dentro del campo gravitacional de un único cuerpo, sino que durante su viaje van cambiando de foco de atracción. Un viaje de la Tierra a la Luna podrá ser considerado inicialmente como un viaje en órbita alrededor de la Tierra, con la correspondiente perturbación orbital producida por la Luna. Cuando la sonda se acerque lo suficiente a la Luna el problema kepleriano cambiará, pues a partir de ese instante el foco principal de atracción gravitacional pasará a ser la Luna pasando la sonda a orbitar en torno a la Luna con una perturbación que le producirá la presencia de la Tierra. Un viaje de la Tierra a Marte resulta más complejo pues a lo largo de dicho viaje la sonda podrá considerarse como atraı́da por la Tierra y Marte, cuando esté suficientemente próxima a dichos planetas, y atraı́da por el Sol durante el resto del viaje. 324 Navegación interplanetaria Una aproximación rigurosa a estos recorridos debe obtenerse a partir de una formulación del problema de n cuerpos, pues la sonda es atraida gravitacionalmente por todos y cada uno de los astros del sistema solar. Únicamente métodos numéricos que integren dicho problema nos darán una descripción precisa del movimiento. Sin embargo, en la fase de diseño de la misión, que debe ser establecida con todo detalle mucho antes del lanzamiento de la nave, podemos aprovecharnos del hecho que aprendimos al estudiar el modelo de n cuerpos y que establece que en las proximidades de un planeta la atracción gravitacional del resto de los cuerpos del sistema solar resulta ser una pequeña perturbación sobre el modelo kepleriano formado por el planeta y la sonda. La primera fase de estudio y diseño de este tipo de misiones consiste en despreciar esta perturbación y estudiar la órbita completa como una sucesión de segmentos de órbitas keplerianas que se unen en los puntos en que deja de actuar como foco un cuerpo y otro pasa a ser el foco principal. Puesto que las órbitas keplerianas son cónicas, a las órbitas usadas en la navegación planetaria se les llama cónicas enlazadas. El punto donde la órbita cambia de cónica por pasar a depender de otro foco atractor será estudiado en el apartado siguiente. Cuando se estudia la órbita de una sonda interplanetaria deben considerarse también los cambios de sistema de referencia debidos a las caracterı́sticas de los distintos focos de atracción. Ası́, las órbitas de satélites artificiales están siempre referidas a un sistema ecuatorial por ser éste el que mejor se adapta al movimiento de la Tierra. Sin embargo, las órbitas de los cuerpos del sistema solar se dan siempre en el sistema de coordenadas eclı́pticas lo que debe tenerse muy presente en la fase de estudio de la misión. Debe recordarse también que el eje de rotación de cada planeta no es paralelo al de la Tierra, o lo que es igual, el plano de su ecuador no coincide con el del ecuador terrestre. Esto hay que tenerlo presente cuando el objetivo final de la nave sea orbitar en torno al planeta o la Luna en cuyo caso deben usarse las expresiones de la rotación al sistema planetográfico. En lo que sigue comenzaremos el estudio de las trayectorias interplanetarias desde una órbita de aparcamiento en torno a la Tierra, esto es, una órbita circular baja. Analizaremos, de forma elemental, los pasos que debemos seguir para situar dicha sonda en las proximidades de otro cuerpo del sistema solar. Anteriormente veı́amos que las maniobras de cambio de plano eran, en general, enormemente costosas por lo que, de aquı́ en adelante, supondremos el sistema solar coplanario y la órbita inicial situada con la inclinación y ángulos del nodo adecuados obtenidos directamente en la fase de lanzamiento. Estudiaremos como realizar un viaje interplanetario sin realizar más maniobras que la inyección inicial realizada desde la órbita de aparcamiento para poner la sonda en la ruta interplanetaria. Para modificar la cónica y poner las naves en órbita en torno a los planetas se usarán los cambios en la velocidad de la nave producidos por la aproximación de la nave a los distintos planetas que, como veremos, modifican la velocidad, produciendo un efecto equivalente a las maniobras orbitales en los satélites artificiales. Esfera gravitacional de influencia 20.2 325 Esfera gravitacional de influencia Para comprender las rutas interplanetarias, formadas por cónicas enlazadas, será preciso determinar a partir de que punto podemos considerar que una sonda no depende de la atracción gravitacional de un cuerpo y pasa a depender de otro. Esta región del espacio será aproximadamente una esfera alrededor del foco atractor. Existen dos tipos de esferas gravitacionales que no serán consideradas aquı́ por su falta de interés práctico. Por un lado las esferas de Hill que se corresponden con la zona del problema restringido alrededor de los primarios donde está confinado el movimiento de satélite para determinados valores de la integral de Jacobi. Por otro lado se tiene la esfera de gravitación que está determinada por el lugar geométrico de los puntos donde se iguala la atracción gravitacional de los primarios. Para definir con mayor precisión la región que represente el punto donde acaba la atracción gravitacional pensemos en los dos problemas. Por un lado un viaje Tierra-Luna y por otro un viaje Tierra-Planeta (para cualquier planeta). Sobre una nave próxima a la Tierra aparece la perturbación Luni-Solar que puede crecer, en función de la posición relativa del Sol y la Luna, cuando la nave se aleja de la Tierra. Hasta la distancia de la Luna la perturbación que produce el Sol continua siendo pequeña por lo que en este caso el Sol no podrá ser tomado como foco atractor en ningún momento en el viaje entre la Tierra y la Luna. Sin embargo, cuando la nave se acerque a la Luna la atracción de ésta crecerá hasta hacerse mayor que la debida a la Tierra. El modelo adecuado en este caso es el del problema restringido de tres cuerpos con la Tierra y la Luna como primarios y la Tierra como astro principal. Pensemos ahora en un viaje entre dos planetas. En las proximidades del primer planeta el Sol ejerce un efecto perturbador de tercer cuerpo que aumenta a medida que la nave se aleja del planeta, sin embargo, durante ese periodo el efecto del segundo planeta es despreciable. Durante el periodo intermedio es el Sol el que ejerce de astro principal. Para ver cuando uno de los planetas es el foco primario debemos considerar de nuevo el problema restringido, los dos primarios serán el Sol y el planeta, mientras que la nave será el tercer cuerpo de masa despreciable. En ambos casos tenemos un sistema con dos primarios P0 , P1 , de masas m0 m1 , y el terx0 x1 cer cuerpo S de masa despreciaP0 P1 ble. Tal como vemos en la figura ↵1 ↵0 r 20.1 llamaremos xo = P0 S, x1 = P0 S, r = P0 P1 de forma que las Figura 20.1: Posición relativa de la sonda S resecuaciones (13.14), (13.15) se especto de los planetas P0 , P1 . cribirán como ✓ ◆ x0 x1 r ẍ0 = µ0 3 µ1 + , (20.1) r0 r13 r3 S 326 Navegación interplanetaria ẍ1 x1 µ1 3 r1 = µ0 ✓ x0 r + 3 r03 r ◆ , (20.2) donde ri = k xi k, µi = Gmi , i = 0, 1. Las ecuaciones (20.1), (20.2) se pueden poner como ẍ0 = K0 + P 0 , (20.3) ẍ1 = K1 + P 1 , (20.4) donde Ki representa la fuerza de atracción kepleriana de Pi sobre S y P i la perturbación que produce P(1 i) . Se usará una u otra ecuación según el valor relativo de la fuerza de atracción kepleriana de cada cuerpo y la perturbación producida por el otro, para ello consideraremos el cociente k P (1 i) k/k K(1 i) k, i = 0, 1, que será "✓ ◆2 #1/2  2 1/2 r(1 k P (1 i) k xi r mi 2 1 1 xi · r i) = µi + = r + + 2 k K(1 i) k µ(1 i) ri3 r3 m(1 i) (1 i) ri4 r4 ri3 r3  1/2 ⇣ r ⌘4 ⇣ r ⌘2 mi r(1 i)2 i i = 1 + 2 cos ↵ . i m(1 i) ri2 r r (20.5) Supondremos que el astro de menos masa P1 es el foco de atracción del problema cuando la relación entre la fuerza perturbadora y la atracción kepleriana sea menor que para P0 , es decir cuando k P 1 k/k K1 k < k P 0 k/k K0 k, o lo que es igual cuando k P 0 k/k K0 k = > 1. k P 1 k/k K1 k Si consideramos las dos expresiones (20.5) para i = 0, 1, llamamos i = ri /r y observamos que, de acuerdo con las propiedades del triángulo de la figura 20.1, se tiene que r = r0 cos ↵0 + r1 cos ↵1 , podremos poner s m21 04 1 + 14 2 12 cos ↵1 = 2 4 . m0 1 1 + 04 2 0 (1 1 cos ↵1 ) Expresando 0 en términos de 1 , a partir del teorema del coseno aplicado al triángulo de la figura 20.1, tendremos que 02 = 1 + 12 2 cos ↵1 . Llevando a la expresión anterior y desarrollando en serie de potencias de 1 se obtendrá  m2 1 1 = 12 5 p + O( 1 ) . m0 1 1 + 3 cos2 ↵1 Puesto que 1 debe ser muy pequeño cuando la fuerza de atracción de P1 sea dominante, la condición > 1 se podrá poner como 5 1 < m21 1 m21 p < . 2 m0 1 + 3 cos2 ↵1 m20 Salida del campo gravitacional de un planeta 327 La condición anterior indica el instante a partir del cual podemos considerar que el foco del problema deja de ser el astro principal P0 y pasa a ser P1 . Puesto que 1 = r1 /r la condición anterior representa una esfera de radio r1 = r ✓ m1 m0 ◆2/5 , (20.6) que se llamará esfera de influencia. En el caso del sistema Tierra-Luna, la esfera de influencia de la Luna, que indica cuando las sondas espaciales están dentro del campo gravitacional de la Luna, tiene unos 66000 km de radio. La esfera de influencia de la Tierra en el sistema Sol-Tierra tiene un radio de 924000 km, lo que incluye a la propia Luna que se puede considerar dentro del campo gravitacional terrestre. La esfera de influencia de Marte en el sistema Sol-Marte tiene un radio de 378000 km. 20.3 Salida del campo gravitacional de un planeta Tanto el proceso de alejamiento de un planeta como el de aproximación al mismo, que será estudiado en el siguiente apartado, deben ser analizados dentro de la esfera de influencia del planeta que determina la región lı́mite a partir de la cual supondremos que la gravedad del planeta no afecta a la órbita del mismo en torno al Sol1 . La primera operación a realizar para navegar de un planeta del sistema solar a otro es la salida del campo gravitacional del primero. Supondremos que la sonda se libera de la atracción de la gravedad del planeta cuando sale fuera de la esfera de influencia en una órbita hiperbólica respecto al mismo. De esta forma nos aseguramos que el la sonda no tiene un movimiento periódico que la hace regresar al planeta. En la aproximación al modelo real, formada por cónicas enlazadas, supondremos además que el radio de la esfera de influencia del cuerpo atractor puede ser considerado infinitesimal si se compara con el radio de su órbita e infinitamente grande comparada con el radio del cuerpo. Supondremos que la sonda se encuentra inicialmente en una órbita de aparcamiento alrededor del planeta. Esta órbita es una órbita baja y circular situada en un plano adecuado obtenido en el proceso de lanzamiento. La maniobra para alejar la nave del planeta consiste en un empuje tangencial en un punto adecuado de la órbita de aparcamiento que lo inserte en una órbita hiperbólica (figura 20.2) que cortará en algún punto la esfera de influencia del planeta. 1 Aquı́ excluimos los viajes a la Luna. 328 Navegación interplanetaria La hipótesis anterior, que supone que la esfera de influencia tiene radio infinito respecto del radio del planeta, determina que la velocidad de la nave al cruzar la esfera de influencia lleva la dirección de la ası́ntota a la hipérbola y su norma coincide con la velocidad residual. A dicha velocidad, expresada con respecto a un sistema inercial con centro en el planeta, le llamaremos v1 . v1 xSOI rSOI ra fSOI T fA v A Puesto que las velocidades circular y parabólica, de una órbita kepleriana a una distancia r del centro de masas p del planeta, p vienen dadas por µ/r y 2µ/r Figura 20.2: Salida del campo gravitacional de respectivamente, el v necesario un planeta. para obtener la órbita parabólica p p desde un punto de la órbita de aparcamiento verificará v > ( 2 1) µ/ra , siendo ra el radio de la órbita de aparcamiento. 2 Por otro lado, la relación v1 = µ/a nos dice que para conseguir una velocidad v1 , cuando la sonda alcance el lı́mite de la esfera de influencia, el semieje de la órbita hiperbólica de salida debe ser a= µ . 2 v1 (20.7) Además, puesto que el impulso es tangencial en una órbita circular y la nueva órbita es hiperbólica el punto de la maniobra es el periastro de la nueva órbita, por tanto ra = a(e 1), de donde obtenemos finalmente que e= 2 v1 ra + 1. µ (20.8) El valor de v podrá ser calculado exactamente si tenemos en cuenta que pasamos de una órbita circular vc2 = µ/ra a una hiperbólica vh2 = µ(2/r + 1/a) = 2 2µ/r + v1 , por lo que obtendremos finalmente: r r 2µ µ 2 v= + v1 . (20.9) ra ra Una vez conocido el valor del v debemos averiguar en que punto de la órbita de aparcamiento debe efectuarse la maniobra, para lo cual consideraremos que el Entrada en el campo gravitacional de un planeta 329 punto de la esfera de influencia de radio rSOI se alcanza cuando rSOI = a(e2 1) , 1 + e cos fSOI o lo que es igual en un punto que forma un ángulo  ✓ ◆ 1 a(e2 1) fSOI = acos 1 , e rSOI con la dirección del punto de salida. Para ser coherentes con la hipótesis de partida podemos suponer que rSOI = 1 lo que nos da un ángulo ✓ ◆ 1 fA = acos , (20.10) e que coincide con la dirección de la ası́ntota. Sustituyendo el valor de fA en (18.24), que representa el ángulo entre la dirección radial y la del vector velocidad expresado en términos de e y f , se obtiene que = 0, lo que indica que la dirección del vector velocidad al final de la maniobra lleva la dirección radial (del planeta a la sonda). A partir del instante en que la sonda sale de la esfera de influencia la órbita será considerada como una órbita alrededor del Sol. En estas condiciones el parámetro µ cambia, pues en la órbita alrededor del planeta valı́a µ = µP = GmP , mientras que la órbita solar vale µ = µ = Gm . La hipérbola inicial se enlazará en ese momento con la cónica que la sonda recorra alrededor del Sol. Esta nueva órbita se obtendrá partiendo de las condiciones iniciales, posición y velocidad en ese instante, que vendrán dadas por x =r , X = v + v1 , (20.11) donde r , v representan la posición y velocidad del planeta respecto del Sol y donde además se ha despreciado la posición de la sonda xSOI respecto del planeta. 20.4 Entrada en el campo gravitacional de un planeta La entrada en el campo gravitacional de un planeta coincide con el instante en el que la sonda entra dentro su esfera de influencia. Como veremos en este apartado, esta entrada puede dar lugar a tres tipos distintos de comportamientos que dependen del la dirección y la norma del vector velocidad de la sonda relativo al planeta en el momento de la entrada en la esfera de influencia. Para estudiar el proceso que sigue a la entrada de la sonda en el campo gravitacional, o la esfera de influencia, supondremos que esta entrada se realiza de 330 Navegación interplanetaria acuerdo con las caracterı́sticas de la figura 20.3 donde vemos que la velocidad forma un ángulo ↵ 2 [0, ⇡/2] con la dirección radial de la sonda desde el planeta dada por u. Situando el vector n que define el plano orbital hacia arriba del plano impedimos que ↵ sea mayor que ⇡, haciendo que los valores de ↵ en el intervalo (⇡/2, ⇡) correspondan a una salida de la esfera de influencia en lugar de una entrada. Si llamamos v = n ⇥ u podemos definir el sistema orbital de la sonda respecto al planeta, que comienza en ese punto. En este sistema los vectores de posición y velocidad inicial en el instante de la entrada se podrán poner como xP = r u, X P = v cos ↵ u + v sen ↵ v, donde r es el radio de la esfera de influencia y v la norma del vector velocidad de la sonda relativo al planeta. v v ↵ P u xSOI S El algoritmo visto en el capı́tulo 9 permite obtener los elementos orbitales de la nueva órbita a partir de la posición y velocidad anteriores. A partir de Figura 20.3: Condiciones de entrada de una sonlos vectores momento angular y da en la esfera de influencia de un planeta. de Laplace podemos determinar el semilado recto p y la excentricidad e y, con éstos, la distancia en el periastro rp = p/(1 + e). Hemos realizado este estudio tomando unos valores de r = 1, µ = 1 que generalizan los resultados para cualquier caso sin más que cambiar la unidad de longitud para hacerla igual al radio de la esfera de influencia y la unidad de tiempo que haga µ = 1. La figura 20.4 muestra las curvas de nivel de la función e = e(↵, v) que nos da la excentricidad en función de el ángulo ↵ y de v. En dicha figura el eje Ox representa el ángulo ↵, mientras que el eje Oy representa la velocidad v. El valor v = 1.41, que representa la velocidad de escape para r = 1, separa dos regiones del espacio fásico, la zona inferior de la figura representa órbitas elı́pticas mientras que la superior representa órbitas hiperbólicas. La excentricidad aumenta en la zona inferior conforme la curvas se desplazan a la izquierda, mientras que en la zona superior las curvas más altas representan excentricidades mayores. Por otro lado hemos representado en la misma figura la curva rp (↵, v) = RP , donde rp es la distancia en el periastro de la nueva órbita y RP el radio del planeta. Esta curva separa la figura en otras dos zonas que representan las órbitas para las cuales el radio del planeta es mayor o menor que la distancia en el periastro. Entrada en el campo gravitacional de un planeta 331 Si el radio del planeta es mayor que rp se produce una colisión de la sonda con el planeta. 3 Ası́ pues, la figura 20.4 nos muestra los tres posibles casos: 1 1. Colisión de la sonda con el planeta (zona oscura). 2 1 2. Entrada en una órbita elı́ptica (periódica) de captura de la sonda. 2 3. Entrada en una órbita hiperbólica en la que se realiza una aproximación entre la sonda y el planeta a partir de la cual ésta vuelve a alejarse hasta que sale de nuevo de la esfera de influencia alejándose de la atracción del planeta. 3 0 0 0.5 1 1.5 Figura 20.4: Gráfica de contorno de la excentricidad de la órbita de entrada en un planeta en función del ángulo (eje Ox) y de la velocidad (eje Oy). Estos tres casos se ilustran en la figura 20.5 con tres ejemplos de los tres tipos de órbitas. O1 representa una órbita de colisión, O2 una órbita de captura y O3 una órbita de aproximación. En el perigeo de una órbita elı́ptica del tipo O2 podemos realizar una maniobra para reducir el semieje de esta órbita, o bien, si el planeta tiene una atmósfera suficientemente densa y la distancia en el perigeo adecuada realizar un aerofrenado, esto es, disminuir el semieje usando el frenado atmosférico. Una maniobra adecuada, efectuada en el instante preciso, permite también la captura de la sonda por el planeta desde las órbitas de colisión y de aproximación. O2 O3 O1 Las órbitas de aproximación tienen una gran utilidad astrodinámica porque constituyen un Figura 20.5: Tres tipos de órbitas de entrada en método muy barato de modificar la esfera de influencia de un planeta la velocidad de la nave utilizando la gravitación del planeta en una maniobra llamada asistencia gravitacional que estudiaremos en el siguiente apartado. 332 20.5 Navegación interplanetaria Impulso gravitacional Para reducir el coste de las maniobras necesarias para un viaje interplanetario puede usarse la órbita de aproximación a un planeta con objeto de conseguir una variación de la velocidad, o impulso, basado en la geometrı́a de la órbita hiperbólica de aproximación. Dicho impulso será llamado impulso gravitacional. La figura 20.6 muestra lo que ocurre cuando entramos en la esfera de influencia del planeta con una velocidad v e1 de norma v1 y dirección la de la ası́ntota de entrada. v s1 ⌫ La órbita seguida por la sonda pasa muy cerca del planeta a una distancia en el periastro de rP y llega de nuevo al lı́mite de la esfera de influencia con una velocidad v s1 que tiene la misma norma que v e1 y forma con ella un ángulo ⌫. rp v e1 Relacionando la figura 20.6 con la 20.2 podemos comprobar que = ⇡ fA , de donde, a par- Figura 20.6: Hipérbola de aproximación al platir de (20.10), podemos deducir neta. que ⌫/2 = fA ⇡/2 y finalmente ⌫ 1 = . 2 e Por otro lado, la expresión (20.8) se pondrá ahora sen e= 2 v1 rp + 1, µ donde el hemos sustituido ra por la distancia rp en el periastro. De esta forma podremos poner también ⌫ µ . (20.12) sen = 2 r 2 µ + v1 p La figura 20.7 representa la variación de la velocidad en el impulso gravitacional, para ello tengamos en cuenta que si v e1 , v s1 son la velocidad de entrada y salida de la sonda respecto al planeta, estas velocidades referidas al Sol se pondrán como X i = v P + v e1 , X f = v P + v s1 , (20.13) donde v P representa la velocidad del planeta respecto del Sol y X i , X f las velocidades inicial y final de la sonda al entrar y al salir de la esfera de influencia en la órbita de aproximación al planeta. Impulso gravitacional 333 v Xf v s1 El impulso obtenido con esta maniobra será v e1 . ⌫ ve (20.14) 1 Una simple inspección de la vP figura 20.7 permite deducir que basta cambiar la geometrı́a de la hipérbola para conseguir distintos impulsos, tanto en norma como en dirección. La situación del Figura 20.7: Impulso gravitacional. plano de la órbita hiperbólica tiene también una gran importancia en la dirección del impulso gravitacional, sin embargo, esto no será analizado en el presente libro. Xi Para conocer el valor de ( v)2 = (v s1 v = Xf X i = v s1 v tendremos en cuenta que 2 v e1 )2 = 2v1 2 2 2v1 cos ⌫ = 4v1 sen2 ⌫ , 2 por lo que aplicando (20.12) obtenemos v = 2v1 sen ⌫ 2 v1 µ = . 2 r 2 µ + v1 p Estudiando el Delta uve como función p de v1 podemos deducir fácilmente que tiene un máximo para el valor v1 = µ/rp . Un estudio para los diferentes planetas del sistema solar nos da los valores del máximo v que se puede conseguir con una órbita de aproximación a cada planeta que son de 7.91 km/s para la Tierra, 3.55 km/s para Marte, 42.73 km/h para Júpiter, etc. 334 Navegación interplanetaria Bibliografı́a Abad, A., Docobo, J., y Elipe,. A. (2002) Curso de Astronomı́a. Colección de textos docentes. Universidad de Zaragoza. Baker, R. M. and Makemson, M. W. (1960) An Introduction to Astrodynamics. Academic Press. New York and London. Barrabés, E., Gomez, G. and Rodriguez–Cababal J. (2004) Notes for the Gravitational Assisted Trajectories. Advanced Topics in Astrodynamics. Summer Course. Barcelona. Bate, R. B. Mueller D. D. and White, J. E. (1971) Fundamentals of Astrodynamics. Dover Publications Inc. Battin, R. H. (1999) An Introduction to the Mathematics and Methods of Astrodynamics, Revised Edition. AIAA Education Series. Published by American Institute of Aeronautics ans Astronautics, Inc. Beutler, G. (2005) Methods of Celestial Mechanics. Springer. Bond, V. R. and Allman, M. C. (1996) Modern Astrodynamics. Fundamentals and Perturbation Methods. Princeton University Press. Brown, C.D. (1998) Spacecraft Mission Design. Second Edition. AIAA Education Series. Published by American Institute of Aeronautics ans Astronautics, Inc. Capderou, M. (2005) Satellites. Orbits and missions. Elsevier. Chao, C-C. (2005) Applied Orbit Perturbation and Maintenance. The Aerospace Press. Curtis, H. D. (2009) Orbital Mechanics for Engineering Students. Springer. CNES, (1995) Spaceflight Dynamics. Vols I, II. Cépadues-Editions. Toulouse. France. Danby, J. M. (1962) Fundamental of Celestial Mechanics. Willmann-Bell, Inc. Elices, T. (1991) Introducción a la Dinámica Espacial. Instituto Nacional de Técnica Aeroespacial. Madrid. 335 336 Bibliografı́a ESA. Página web: http://www.esa.int/ Gurzadyan. G.(1996) Theory of Interplanetary Flights. Gordon and Breach Publishers. Logsdon, T. (1998) Orbital Mechanics. Theory and Applications. John Wiley & Sons, Inc. Milani, A., Nobili, A. M. and Farinella, P. (1987) Non-gravitational perturbations and satellite geodesy. Adams Hilger. Montenbruck, O. and Gill, E. (2000) Satellite Orbits. Models, Methods and Applications. Springer. Moulton, F. R. (1970) An Introduction to Celestial Mechanics. Dover Publications Inc. New York. NASA. Página web: http://www.nasa.gov/home/ Prussing, J. E and Conway, B. A. (1993) Orbital Mechanics. Oxford University Press. Schaub, H. and Junkins, J. (2003) Analytical Mechanics of Space Systems. AIAA Education Series. Published by American Institute of Aeronautics ans Astronautics, Inc. Seidelmann, P.K. et al. (2007) Report of the IAU/IAG Working Group on cartographic coordinates and rotational elements. Celestial Mechanics and Dynamical Astronomy. 98, pp 155-180. Sidi, M. J. (1997) Spacecraft Dynamics & Control. A practical engineering approach. Cambridge University Press. Vallado, D. A. (1997) Fundamentals of Astrodynamics and Applications. Space Technology Series. McGraw Hill. Weiland, C. (2010) Orbital Mechanics for Engineering Students. Springer. Wertz, J. R. and Larson, W. J.. (1999) Space Mission Analysis and Design. Kluwer Academic Publishers. Wiesel, W. E. (2010) Modern Astrodynamics. Aphelion Press Índice alfabético A aceleración de arrastre . . . . . . . . . . . . . . . . . . . 101 de coriolis . . . . . . . . . . . . . . . . . . . . 101 del origen . . . . . . . . . . . . . . . . . . . . 101 radial . . . . . . . . . . . . . . . . . . . . . . . . 102 relativa . . . . . . . . . . . . . . . . . . . . . . . 101 transversal . . . . . . . . . . . . . . . . . . . 102 achatamiento . . . . . . . . . . . . . . . . . . . . . . . 46 acimut . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 across-plane . . véase dirección normal across-track véase dirección normal a la tangente aerofrenado . . . . . . . . . . . . . . . . . . . . . . . 331 afelio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 along-track véase dirección tangencial altitud . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 máxima . . . . . . . . . . . . . . . . . . . . . . 143 mı́nima. . . . . . . . . . . . . . . . . . . . . . .143 altura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 ángulo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5 de rotación del planeta . . . . . . . . 51 de rotación terrestre . . . . . . . 64, 77 de transferencia . . . . . . . . . . . . . . 177 de trayectoria de vuelo . . . . . . . 151 del nodo . . . . . . . . . . . . . . . . . . . . . 143 determinación de un . . . . . . . . . . . . 5 determinación principal de un . . . 5 directo . . . . . . . . . . . . . . . . . . . . . . . . 13 horario . . . . . . . . . . . . . . . . . . . . . . . . 41 retrógrado . . . . . . . . . . . . . . . . . . . . . 13 sentido de un . . . . . . . . . . . . . . . . . . 13 ángulos de Euler . . . . . . . . . . . . . . . . . . . 32 anomalı́a excéntrica . . . . . . . . . . . . . . . . . . . . 134 media . . . . . . . . . . . . . . . . . . . . . . . . 135 verdadera . . . . . . . . . . . . . . . . . . . . 127 año . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 anomalı́stico . . . . . . . . . . . . . . . . . . . 81 beseliano . . . . . . . . . . . . . . . . . . . . . . 93 bisiesto . . . . . . . . . . . . . . . . . . . . . . . . 90 juliano. . . . . . . . . . . . . . . . . . . . .82, 93 sidéreo . . . . . . . . . . . . . . . . . . . . . . . . 81 trópico . . . . . . . . . . . . . . . . . . . . . . . . 81 apoastro . . . . . . . . . . . . . . . . . . . . . . . . . . 128 apogeo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 argumento del periastro . . . . . . . . . . . 144 armónicos teserales . . . . . . . . . . . . . . . . . . . . . . 225 zonales . . . . . . . . . . . . . . . . . . . . . . . 225 ascensión recta . . . . . . . . . . . . . . . . . 42, 59 atmospheric drag . véase rozamiento atmosférico azimut . . . . . . . . . . . . . . . . . . . véase acimut B basura espacial . . . . . . . . . . . . . . . . . . . 262 C cálculo de efemérides . . . . . . . . . . . . . . 151 calendario gregoriano . . . . . . . . . . . . . . . . . . . . . 91 juliano. . . . . . . . . . . . . . . . . . . . . . . . .90 cantidad de movimiento . . . . . . . . . . . . 98 carga útil . . . . . . . . . . . . . . . . . . . . . . . . . 292 cenit . . . . . . . . . . . . . . . . . . . . . . . véase zenit cinturones de Van Allen . . . . . . . . . . . 281 coeficiente balı́stico . . . . . . . . . . . . . . . . . . . . . . 236 de rozamiento . . . . . . . . . . . . . . . . 236 coeficientes de normalización . . . . . . 222 337 338 coeficientes de transición. . . . . . . . .véase funciones f y g cohete . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295 portador . . . . . . . . . . . . . . . . . . . . . 295 cónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 apocentro . . . . . . . . . . . . . . . . . . . . 111 directriz . . . . . . . . . . . . . . . . . . . . . . 110 eje . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 elipse. . . . . . . . . . . . . . . . . . . . . . . . . 111 excentricidad . . . . . . . . . . . . . . . . . 110 foco . . . . . . . . . . . . . . . . . . . . . . . . . . 110 hipérbola . . . . . . . . . . . . . . . . . . . . . 112 parábola . . . . . . . . . . . . . . . . . . . . . 112 pericentro . . . . . . . . . . . . . . . . . . . . 111 semieje mayor . . . . . . . . . . . . . . . . 112 semieje menor . . . . . . . . . . . . . . . . 112 semilado recto . . . . . . . . . . . . . . . . 111 cónicas enlazadas . . . . . . . . . . . . . . . . . 324 cono de visibilidad . . . . . . . . . . . . . . . . 277 constante de gravitación universal 115, 207 constelaciones de satélites . . . . . . . . . 255 coordenadas areográficas . . . . . . . . . . . . . . . . . . . . 50 cartesianas . . . . . . . . . . . . . . . . . . . . 14 de la época J2000.0 . . . . . . . . . . . . 58 horizontales . . . . . . . . . . . . . . . . . . . 40 medias . . . . . . . . . . . . . . . . . . . . . . . . 58 planetográficas. . . . . . . . . . . . . . . . .50 polares . . . . . . . . . . . . . . . . . . . . . . . . 14 colatitud . . . . . . . . . . . . . . . . . . . . 14 colongitud . . . . . . . . . . . . . . . . . . . 14 distancia . . . . . . . . . . . . . . . . . . . . 14 latitud . . . . . . . . . . . . . . . . . . . . . . 14 longitud . . . . . . . . . . . . . . . . . . . . . 14 rectangulares . . . . . . . . . . . . . . . . . . 14 selenográficas . . . . . . . . . . . . . . . . . . 50 verdaderas . . . . . . . . . . . . . . . . . . . . . 58 corrección de la órbita . . . . . . . . . . . . 301 cuaternio . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 conjugado . . . . . . . . . . . . . . . . . . . . . 34 parte imaginaria . . . . . . . . . . . . . . . 34 parte real . . . . . . . . . . . . . . . . . . . . . . 34 cuerpo central . . . . . . . . . . . . . . . . . . . . 123 curvas de velocidad cero . . . . . . . . . . 217 Índice alfabético D declinación . . . . . . . . . . . . . . . . . 41, 42, 59 delta uve . . . . . . . . . . . . . . . . . . . . . . . . . 292 desarrollos de Hansen . . . . . . . . . . . . . 138 determinación de órbitas . . . . . . . . . . 151 dı́a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 medio . . . . . . . . . . . . . . . . . . . . . . . . . 78 sidéreo . . . . . . . . . . . . . . . . . . . . . . . . 77 dirección normal . . . . . . . . . . . . . . . . . . . . . . . 102 normal a la tangente . . . . . . . . . 151 radial . . . . . . . . . . . . . . . . . . . . . . . . 102 tangente . . . . . . . . . . . . . . . . . . . . . 150 transversal . . . . . . . . . . . . . . . . . . . 102 vertical . . . . . . . . . . . . . . . . . . . . . . . . 38 distancia cenital . . . . . . . . . . . . . . . . . . . . 40 E eclı́ptica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 oblicuidad de . . . . . . . . . . . . . . . . . . 38 ecuación de Barker . . . . . . . . . . . . . . . . . . . . 133 de Kepler . . . . . . . . . . . . . . . . . . . . 135 de Kepler universal . . . . . . . . . . . 170 de los equinoccios . . . . . . . . . . . . . . 64 de Sundman . . . . . . . . . . . . . . . . . . 131 del centro. . . . . . . . . . . . . . . . . . . . . .78 del cohete . . . . . . . . . . . . . . . . . . . . 291 del tiempo . . . . . . . . . . . . . . . . . . . . . 78 fundamental de Newton . . . . . . . 98 ecuaciones de Gauss . . . . . . . . . . . . . . . . . . . . . 196 de Lagrange . . . . . . . . . . . . . . . . . . 194 ecuador . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 aparente . . . . . . . . . . . . . . . . . . . . . . . 57 de la fecha . . . . . . . . . . . . . . . . . . . . . 57 del planeta . . . . . . . . . . . . . . . . . . . . 50 intermedio . . . . . . . . . . . . . . . . . . . . . 57 medio . . . . . . . . . . . . . . . . . . . . . . . . . 57 verdadero. . . . . . . . . . . . . . . . . . . . . .57 efemérides planetarias . . . . . . . . . . . . . 201 elementos de dos lı́neas . véase variables TLE medios . . . . . . . . . . . . . . . . . . . . . . . 198 orbitales. . . . . . . . . . . . . . . . . . . . . .145 Índice alfabético osculadores . . . . . . . . . . . . . 192, 198 elevación . . . . . . . . . . . . . . . . . véase altura empuje . . . . . . . . . . . . . . . . . . . . . . . . . . . 291 encuentro espacial . . . . . . . . . . . . . . . . 316 energı́a orbital . . . . . . . . . . . . . . . . . . . . 125 época . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 orbital . . . . . . . . . . . . . . . . . . . . . . . 142 equinoccio . . . . . . . . . . . . . . . . . . . . . . . . . 38 de la fecha . . . . . . . . . . . . . . . . . . . . . 57 medio . . . . . . . . . . . . . . . . . . . . . . . . . 57 verdadero de la fecha . . . . . . . . . . 57 esfera celeste . . . . . . . . . . . . . . . . . . . . . . . . . 16 cı́rculo máximo . . . . . . . . . . . . . . . . 16 cı́rculo menor . . . . . . . . . . . . . . . . . . 16 de gravitación . . . . . . . . . . . . . . . . 325 de Hill . . . . . . . . . . . . . . . . . . . . . . . 325 de influencia . . . . . . . . . . . . . . . . . 327 Euler ángulos de . . . . . . . . . . . . . . . . . . . . . 32 parámetros de . . . . . . . . . . . . . . . . . 33 excentricidad . . . . . . . . . . . . . . . . . . . . . 143 339 atan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 cart . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 de Stump↵ . . . . . . . . . . . . . . . . . . . 163 polar . . . . . . . . . . . . . . . . . . . . . . . . . . 16 funciones f y g de Lagrange . . . . . . 118 G giro a velocidad constante . . . . . . . . . 303 H hodógrafa . . . . . . . . . . . . . . . . . . . . . . . . . . 98 hora oficial española . . . . . . . . . . . . . . . . 88 horizonte . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 I impulso especı́fico . . . . . . . . . . . . . . . . . . . . . 291 gravitacional . . . . . . . . . . . . . . . . . 332 total . . . . . . . . . . . . . . véase delta uve inclinación . . . . . . . . . . . . . . . . . . . . . . . . 143 crı́tica . . . . . . . . . . . . . . . . . . . . . . . . 279 instante . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 de paso por el periastro . . . . . . 132 F orbital . . . . . . . . . . . . . . . . . . . . . . . 142 fecha juliana . . . . . . . . . . . . . . . . . . . . . . . 92 interceptor . . . . . . . . . . . . . . . . . . . . . . . . 316 modificada. . . . . . . . . . . . . . . . . . . . .93 flujo solar . . . . . . . . . . . . . . . . . . . . . . . . . 239 L fly path angle . . . . . . . véase ángulo de latitud trayectoria de vuelo eclı́ptica . . . . . . . . . . . . . . . . . . . . . . . 43 flyby . . . . véase órbita de aproximación geocéntrica . . . . . . . . . . . . . . . . . . . . 47 fórmulas geográfica . . . . . . . . . . . . . . . . . 43, 47 de Bessel ley de los senos . . . . . . . . . . . . . . . . . 19 de las áreas . . . . . . . . . . . . . . 99, 131 del coseno . . . . . . . . . . . . . . . . . . . 18 de Newton . . . . . . . . . . . . . . . . . . . 115 polar del coseno . . . . . . . . . . . . . 20 leyes de Kepler . . . . . . . . . . . . . . . . . . . 109 tercera . . . . . . . . . . . . . . . . . . . . . . 20 lı́nea tercera polar . . . . . . . . . . . . . . . . 20 de los ápsides . . . . . . . . . . . . . . . . 127 de Poisson. . . . . . . . . . . . . . . . . . . .100 de los nodos . . . . . . . . . . . . . . . . . . 143 fuerza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 longitud función del periastro. . . . . . . . . . . . . . . . . .144 acos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 eclı́ptica . . . . . . . . . . . . . . . . . . . . . . . 43 arccos. . . . . . . . . . . . . . . . . . . . . . . . . . .7 geográfica . . . . . . . . . . . . . . . . . . . . . 46 arcsin . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 media . . . . . . . . . . . . . . . . . . . . . . . . 144 arctan . . . . . . . . . . . . . . . . . . . . . . . . . . 7 asin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 low earth orbit . . . . véase órbita baja 340 Índice alfabético M baja . . . . . . . . . . . . . . . . . . . . . . . . . . 281 cementerio . . . . . . . . . . . . . . . . . . . 263 maniobra orbital . . . . . . . . . . . . . . . . . . 288 de aproximación . . . . . . . . . . . . . . 331 matriz de captura . . . . . . . . . . . . . . . . . . . 331 de nutación . . . . . . . . . . . . . . . . . . . . 67 de colisión . . . . . . . . . . . . . . . . . . . . 331 de precesión . . . . . . . . . . . . . . . . . . . 65 de Hohmann . . . . . . . . . . . . . . . . . 310 de precesión–nutación . . . . . . . . . 69 de transferencia . . . . . . . . . . . . . . 175 de rotación . . . . . . . . . . . . . . . . . . . . 28 geoestacionaria. . . . . . . . . .275, 282 de rotación elemental . . . . . . . . . . 30 geosı́ncrona . . . . . . . . . . . . . 275, 282 de tambaleo . . . . . . . . . . . . . . . . . . . 62 halo . . . . . . . . . . . . . . . . . . . . . . . . . . 216 del sesgo de la referencia . . . . . . . 70 heliosı́ncrona . . . . . . . . . . . . . . . . . 284 ortogonal . . . . . . . . . . . . . . . . . . . . . . 27 kepleriana . . . . . . . . . . . . . . . . . . . . 141 medium earth orbit . . . . véase órbita media . . . . . . . . . . . . . . . . . . . . . . . . 282 media Molniya . . . . . . . . . . . . . . . . . . . . . . 283 meridiano . . . . . . . . . . . . . . . . . . . . . . . . . . 41 nominal . . . . . . . . . . . . . . . . . . . . . . 287 cero . . . . . . . . . . . . . . . . . . . . . . . 46, 50 osculatriz. . . . . . . . . . . . . . . . . . . . .198 de referencia.véase meridiano cero polar . . . . . . . . . . . . . . . . . . . . . . . . . 273 del lugar. . . . . . . . . . . . . . . . . . . . . . .41 promediada . . . . . . . . . . . . . . . . . . 198 misil balı́stico . . . . . . . . . . . . . . . . . . . . . 289 Tundra . . . . . . . . . . . . . . . . . . . . . . . 284 modelo de atmósfera de Harris–Priester . . . . . . . . . . . . 237 orbitador . . . . . . . . . . . . . . . . . . . . . . . . . 123 de Jaccia . . . . . . . . . . . . . . . . . . . . . 238 orientación . . . . . . . . . . . . . . . . . . . . . . . . . 13 exponencial . . . . . . . . . . . . . . . . . . 237 origen celeste intermedio. . . . . . . . . . . . . .60 momento angular . . . . . . . . 98, 124, 209 terrestre intermedio . . . . . . . . . . . . 60 movimiento kepleriano . . . . . . . . . . . . . . . . . . . . 117 P medio . . . . . . . . . . . . . . . . . . . . . . . . 135 paralelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 orbital . . . . . . . . . . . . . . . . . . . . . . . 192 parámetro orbital . . . . . . . . . . . . . . . . . 142 relativo. . . . . . . . . . . . . . . . . . . . . . .116 parámetros de Euler. . . . . . . . . . . . . . . .33 patched conics. . . . . . . . .véase cónicas N enlazadas nadir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 payload . . . . . . . . . . . . . . véase carga útil Neper analogı́as de . . . . . . . . . . . . . . . . . . . 21 periastro . . . . . . . . . . . . . . . . . . . . . . . . . . 128 regla del pentágono de . . . . . . . . . 20 perigeo . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 nutación . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 perihelio . . . . . . . . . . . . . . . . . . . . . . . . . . 128 en longitud . . . . . . . . . . . . . . . . . . . . 67 periodo de Chandler . . . . . . . . . . . . . . . . . . . 55 en oblicuidad . . . . . . . . . . . . . . . . . . 67 orbital . . . . . . . . . . . . . . . . . . 114, 129 O sinódico . . . . . . . . . . . . . . . . . . . . . . 319 objetivo. . . . . . . . . . . . . . . . . . . . . . . . . . .316 perturbación oblicuidad de corto periodo . . . . . . . . . . . . . . 197 de la eclı́ptica. . . . . . . . . . . . . . . . . .38 de largo periodo . . . . . . . . . . . . . . 197 media . . . . . . . . . . . . . . . . . . . . . 57, 67 directa . . . . . . . . . . . . . . . . . . . . . . . 210 verdadera de la fecha . . . . . . . . . . 57 empı́rica. . . . . . . . . . . . . . . . . . . . . .248 órbita indirecta . . . . . . . . . . . . . . . . . . . . . 210 Índice alfabético luni-solar . . . . . . . . . . . . . . . . . . . . . 210 secular . . . . . . . . . . . . . . . . . . . . . . . 197 plano de la eclı́ptica . . . . . . véase eclı́ptica del ecuador . . . . . . . . . véase ecuador fundamental . . . . . . . . . . . . . . . . . . . 37 horizontal . . . . . . . . . véase horizonte polinomios asociados de Legendre . . . . . . . . 220 de Legendre . . . . . . . . . . . . . . . . . . 220 polo celeste . . . . . . . . . . . . . . . . . . . . . . . . . 38 celeste de efemérides . . . . . . . . . . . 60 celeste intermedio. . . . . . . . . . . . . .60 de la eclı́ptica. . . . . . . . . . . . . . . . . .42 del planeta . . . . . . . . . . . . . . . . . . . . 50 del sistema . . . . . . . . . . . . . . . . . . . . 37 movimiento del . . . . . . . . . . . . . . . . 55 terrestre . . . . . . . . . . . . . . . . . . . . . . . 38 potencial perturbador . . . . . . . . . . . . . 192 precesión . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 precesión del nodo . . . . . . . . . . . . . . . . 279 primer meridiano véase meridiano cero problema de n cuerpos . . . . . . . . . . . . . . . . . 207 de dos cuerpos . . . . . . . . . . . . . . . 115 de Lambert . . . . . . . . . . . . . . . . . . 175 de las transferencias orbitales . 175 kepleriano . . . . . . . . . . . . . . . . . . . . 117 no perturbado . . . . . . . . . . . . . . . . 199 principal del satélite . . . . . . . . . . 278 propagador . . . . . . . . . . . . . . . . . . . . . . . 201 SGP4/SDP4 . . . . . . . . . . . . . . . . . 203 propulsión iónica . . . . . . . . . . . . . . . . . . . . . . . . 293 quı́mica . . . . . . . . . . . . . . . . . . . . . . 293 punto vernal . . . . . . . . . véase equinoccio puntos de Lagrange . . . . . . . . . . . . . . . 213 341 estado del . . . . . . . . . . . . . . . . . . . . . 86 marcha del . . . . . . . . . . . . . . . . . . . . 86 rendezvous. .véase encuentro espacial S satélite artificial . . . . . . . . . . . . . . . . . . 289 eclipses en . . . . . . . . . . . . . . . . . . . . 246 segundo atómico internacional . . . . . . . . . . 85 intercalar . . . . . . . . . . . . . . . . . . . . . . 87 semieje mayor. . . . . . . . . . . . . . . . . . . . .143 semilatus rectum . véase semilado recto sentido de giro . . . . . . . . . . . . . . . . . . . . . 12 sistema de referencia . . . . . . . . . . . . . . . . 4 apsidal . . . . . . . . . . . . . . . . . . . . . . . 149 baricéntrico . . . . . . . . . . . . . . . . . . . . 39 baricéntrico celeste . . . . . . . . . . . . 58 celeste intermedio. . . . . . . . . . . . . .60 celeste internacional . . . . . . . . . . . 59 cilı́ndrico . . . . . . . . . . . . . . . . . . . . . 157 de Frenet . . . . . . . . . . . . . . . . . . . . . 150 dextrógiro . . . . . . . . . . . . . . . . . . . . . 10 directo . . . . . . . . . . . . . . . . . . . . . . . . 10 eclı́ptico . . . . . . . . . . . . . . . . . . . . . . . 42 ecuador verdadero–equinoccio medio . . . . . . . . . . . . . . . . . . . . . . . . 58 ecuatorial. . . . . . . . . . . . . . . . . . . . . .42 ecuatorial de la época J2000.0 . 58 ecuatorial medio . . . . . . . . . . . . . . . 58 ecuatorial verdadero de la fecha57 espacial . . . . . . . . 59, 101, 123, 146 espacial geocéntrico . . . . . . . . . . . . 59 espacial planetocéntrico . . . . . . . . 59 geocéntrico . . . . . . . . . . . . . . . . . . . . 39 geocéntrico celeste . . . . . . . . . . . . . 58 geográfico . . . . . . . . . . . . . . . . . . . . . 46 heliocéntrico . . . . . . . . . . . . . . . . . . . 39 horario . . . . . . . . . . . . . . . . . . . . . . . . 41 horizontal . . . . . . . . . . . . . . . . . . . . . 40 inercial . . . . . . . . . . . . . . . . . . . . . . . . 99 R inercial con centro en la Tierra117 radio levógiro. . . . . . . . . . . . . . . . . . . . . . . .10 ecuatorial. . . . . . . . . . . . . . . . . . . . . .46 nodal . . . . . . . . . . . . . . . . . . . . . . . . 147 polar . . . . . . . . . . . . . . . . . . . . . . . . . . 46 nodal–espacial . . . . . . . . . . . . . . . . 147 reloj atómico . . . . . . . . . . . . . . . . . . . . . . . 85 orbital . . . . . . . . . . . . . . . . . . 102, 149 342 origen del . . . . . . . . . . . . . . . . . . . . . . . 4 ortogonal . . . . . . . . . . . . . . . . . . . . . . . 9 ortonormal . . . . . . . . . . . . . . . . . . . . . . 9 planetocéntrico . . . . . . . . . . . . 39, 51 planetográfico . . . . . . . . . . . . . . . . . 50 retrógrado . . . . . . . . . . . . . . . . . . . . . 10 rotación . . . . . . . . . . . . . . . . . . . . . . . 25 selenocéntrico. . . . . . . . . . . . . . . . . .39 terrestre intermedio . . . . . . . . . . . . 60 topocéntrico . . . . . . . . . . . . . . . . . . . 39 sonda espacial . . . . . . . . . . . . . . . 289, 323 space debris . . . véase basura espacial swingby véase órbita de aproximación T tiempo atómico internacional . . . . . . . . . . 85 civil local . . . . . . . . . . . . . . . . . . . . . . 79 coordenada baricéntrico. . . . . . . .90 coordenada geocéntrico . . . . . . . . 90 de efemérides . . . . . . . . . . . . . . . . . . 84 de zona . . . . . . . . . . . . . . . . . . . . . . . . 88 dinámico baricéntrico . . . . . . . . . . 89 dinámico terrestre . . . . . . . . . . . . . 89 GPS . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 medio . . . . . . . . . . . . . . . . . . . . . . . . . 78 medio de Greenwich . . . . . . . . . . . 80 sidéreo . . . . . . . . . . . . . . . . . . . . 44, 75 sidéreo aparente . . . . . . . . . . . . . . . 76 sidéreo aparente en Greenwich 64, 76 sidéreo local medio . . . . . . . . . . . . 76 sidéreo medio . . . . . . . . . . . . . . . . . . 76 sidéreo medio en Greenwich64, 76 solar . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 solar medio . . . . . . . . . . . . . . . . . . . . 78 solar verdadero . . . . . . . . . . . . . . . . 77 terrestre . . . . . . . . . . . . . . . . . . . . . . . 89 universal TU0. . . . . . . . . . . . . . . . . . . . . . . . .79 TU1. . . . . . . . . . . . . . . . . . . . . . . . .80 TU2. . . . . . . . . . . . . . . . . . . . . . . . .80 universal coordinado . . . . . . . . . . . 87 UTC . . . . . . . . . . . . . . . . . . . . . . . . 80 transferencia Índice alfabético bielı́ptica . . . . . . . . . . . . . . . . . . . . . 313 de Hohmann . . . . . . véase órbita de Hohmann orbital . . . . . . . . . . . . . . . . . . . . . . . 301 traslación . . . . . . . . . . . . . . . . . . . . . . . . . . 25 traza . . . . . . . . . . . . . . . . . . . . . . . . . 271, 272 triángulo esférico . . . . . . . . . . . . . . . . . . . . . . . . 17 polar . . . . . . . . . . . . . . . . . . . . . . . . . . 19 two line elements . . . . véase variables TLE V variable dinámica . . . . . . . . . . . . . . . . . 142 variables de Delaunay . . . . . . . . . . . . . . . . . . 162 de estado . . . . . . . . . . . . . . . . . . . . . 141 de Hill . . . . . . . . . . . . véase variables polares–nodales de Whittaker . . . . . . véase variables polares–nodales equinocciales . . . . . . . . . . . . . . . . . 145 no singulares . . . . . . . . . . . . . . . . . 145 polares–nodales . . . . . . . . . . . . . . 159 TLE . . . . . . . . . . . . . . . . . . . . 201, 203 vector componentes de un. . . . . . . . . . . . . .4 de estado . . . . . . . . . . . . . . . . . . . . . 142 de Laplace . . . . . . . . . . . . . . . . . . . 124 de posición . . . . . . . . . . . . . . . . . . . . 97 dirección de un . . . . . . . . . . . . . . . . . 5 longitud de un . . . . . . . . . . . . . . . . . . 4 norma de un . . . . . . . . . . . . . . . . . . . . 4 rotación . . . . . . . . . . . . . . . . . . . . . . . 29 vectores ángulo entre . . . . . . . . . . . . . . . . . . . . 5 ortogonales . . . . . . . . . . . . . . . . . . . . . 4 producto escalar de . . . . . . . . . . . . . 4 producto mixto de . . . . . . . . . . . . . . 9 producto vectorial de . . . . . . . . . . . 8 velocidad angular de un sistema de referencia 100 areolar . . . . . . . . . . . . . . . . . . . . . . . . 99 caracterı́stica . . . . . . . . . . . . . . . . . 292 Índice alfabético de escape. . . . . . . . . . . . . . . . . . . . .289 de pérdida de masa . . . . . . . . . . . 290 de satelización . . . . . . . . . . . . . . . . 289 efectiva. . . . . . . . . . . . . . . . . . . . . . .290 radial . . . . . . . . . . . . . . . . . . . . . . . . 102 residual . . . . . . . . . . . . . . . . . . . . . . 290 transversal . . . . . . . . . . . . . . . . . . . 102 ventana de lanzamiento . . . . . . . . . . . 300 Z zenit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 343

Astrodinámica - Abad Medina

Documentos relacionados

Productos

Apoyo

Astrodinámica - Abad Medina

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib