Mecanica Clasica Avanzada

Jorge Mahecha Gómez Mecánica clásica avanzada Mahecha Gómez, Jorge Mecánica clásica avanzada / Jorge Mahecha Gómez. – Medellı́n : Editorial Universidad de Antioquia, 2006. xiv, 608 p. : il., diagrs. ; 24 cm. Incluye bibliografı́a e ı́ndice. ISBN: 958-655-847-9 1. Mecánica 2. Estática 3. Cinemática 4. Dinámica I. Tı́t. 531 cd 19 ed. A1072576 CEP-Banco de la República-Biblioteca Luis-Ángel Arango Mecánica clásica avanzada Jorge Mahecha Gómez Ciencia y Tecnologı́a Editorial Universidad de Antioquia Colección Ciencia y Tecnologı́a c Jorge Mahecha Gómez c Editorial Universidad de Antioquia ISBN: 958-655-847-9 Primera edición: enero de 2006 Diseño de cubierta: Erledy Arana Grajales, Imprenta Universidad de Antioquia Diagramación: Patricia Arredondo Corrección de textos: Arley Cárdenas Coordinación editorial: Gonzalo Montoya Velásquez Impresión y terminación: Imprenta Universidad de Antioquia Impreso y hecho en Colombia / Printed and made in Colombia Prohibida la reproducción total o parcial, por cualquier medio o con cualquier propósito, sin autorización escrita de la Editorial Universidad de Antioquia Editorial Universidad de Antioquia Teléfono: (574) 210 50 10. Telefax: (574) 263 82 82 E-mail: [email protected] Página web: www.editorialudea.com Apartado 1226. Medellı́n. Colombia Imprenta Universidad de Antioquia Teléfono: (574) 210 53 30. Telefax: (574) 210 53 32 E-mail: [email protected] Índice general 1. Fundamentos de la mecánica newtoniana 1.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Sistema de referencia. Estado de un sistema mecánico. Ligaduras. Ecuaciones de movimiento para un sistema de partı́culas. Variables dinámicas. Problemas separables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Ecuaciones generales de la estática y la dinámica 2.1. Las ligaduras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Las coordenadas generalizadas . . . . . . . . . . . . . . . . . . . . . . . 2.3. Los desplazamientos virtuales . . . . . . . . . . . . . . . . . . . . . . . 2.4. La ecuación general de la estática . . . . . . . . . . . . . . . . . . . . . . 2.5. Las ecuaciones de la estática en coordenadas generalizadas . . . . . . . . 2.6. La ecuación general de la dinámica . . . . . . . . . . . . . . . . . . . . . 2.7. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas holónomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas no holónomos. Uso de coordenadas no independientes . . . . . . . . . . 3. El principio de Hamilton y las ecuaciones de Lagrange 3.1. Forma integral de la ecuación general de la dinámica para un sistema holónomo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. El principio de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Algunas propiedades de la función lagrangiana . . . . . . . . . . . . . . 3.4. Simetrı́as de la lagrangiana y teoremas de conservación . . . . . . . . . 3.5. El teorema del virial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4. La formulación hamiltoniana 4.1. Las variables hamiltonianas de estado . . . . . . . . . . 4.2. Simetrı́as y el teorema de conservación . . . . . . . . . . 4.3. La segunda forma del principio de Hamilton . . . . . . 4.4. Las transformaciones puntuales. Las transformaciones en 4.5. Las transformaciones canónicas o de contacto . . . . . . . . . . . . . . . . . . . . . . . . v . . . . . . 1 1 3 7 7 12 15 19 28 35 . 40 . 46 55 . . . . . 55 58 67 68 80 85 . . . . . . . . . . 85 . . . . . . . . . . 94 . . . . . . . . . . 97 el espacio de fases101 . . . . . . . . . . 107 vi 4.6. La función generatriz de una transformación canónica . . . . . . . . . . . . . . . . . . . . . . . . 108 4.7. La evolución temporal de un sistema considerada como una transformación canónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 4.8. El teorema de Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 5. Movimiento de dos partı́culas que interactúan por medio de una fuerza central 5.1. Coordenadas de centro de masa y coordenadas relativas . . . . . . . . . . . . . . . 5.2. El oscilador armónico tridimensional . . . . . . . . 5.3. El potencial 1/r . . . . . . . . . . . . . . . . . . . . 5.4. El problema de la dispersión bajo fuerzas centrales 125 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 136 140 156 6. Pequeñas oscilaciones de sistemas de varios grados de libertad 167 6.1. Modos normales de oscilación. Caso no degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 6.2. Modos normales de oscilación. Caso degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 6.3. Un campo mecánico unidimensional: la cuerda uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 7. Cinemática del cuerpo rı́gido 7.1. Definición de cuerpo rı́gido . . . . . . . . . . . . . . . . . . . . 7.2. Sistemas de coordenadas espacial y del cuerpo rı́gido . . . . . . . . . . . . . . . . . . . . . . . . . 7.3. Los cosenos directores . . . . . . . . . . . . . . . . . . . . . . . 7.4. El teorema de Euler acerca del movimiento de un cuerpo rı́gido 7.5. El rotador rı́gido . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6. Los ángulos de Euler . . . . . . . . . . . . . . . . . . . . . . . 7.7. Descripción de las rotaciones en términos de n̂ y Φ. Parámetros 7.8. Representación del grupo de rotaciones por medio de matrices 2 × 2. Los parámetros de Cayley-Klein . . . . . . . . . . . . . . . . . . . . . . . . . . 7.9. Las rotaciones infinitesimales. Cinemática de las rotaciones . . 205 . . . . . . 205 . . . . . . . . . . . . . . . . . . . . . . . . . de Euler . . . . . . 206 210 217 221 222 226 . . . . . . 230 . . . . . . 241 8. Dinámica del cuerpo rı́gido 253 8.1. El tensor de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 8.2. Diagonalización del tensor de inercia . . . . . . . . . . . . . . . . . . . . . 260 8.3. Las ecuaciones de movimiento de Euler . . . . . . . . . . . . . . . . . . . 268 8.4. El movimiento de un cuerpo rı́gido libre . . . . . . . . . . . . . . . . . . . 277 8.5. El trompo con el punto inferior fijo en un campo gravitacional homogéneo 295 8.6. Movimiento en un sistema de referencia no inercial . . . . . . . . . . . . . 310 vii 9. Las 9.1. 9.2. 9.3. 9.4. 9.5. 9.6. 9.7. 9.8. 9.9. transformaciones canónicas La acción en función de las variables de estado . . . . . La integral invariante de Poincaré-Cartán . . . . . . . . El principio de mı́nima acción y expresiones equivalentes El teorema de Li Hua Chung . . . . . . . . . . . . . . . Las transformaciones canónicas . . . . . . . . . . . . . . La ecuación de Hamilton-Jacobi . . . . . . . . . . . . . . Las transformaciones canónicas infinitesimales . . . . . . Los corchetes de Poisson . . . . . . . . . . . . . . . . . . Pruebas del carácter canónico de una transformación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 319 323 328 332 343 364 374 378 400 10.La ecuación de Hamilton-Jacobi con variables de acción-ángulo 10.1. Los invariantes adiabáticos . . . . . . . . . . . . . . . . . . . . . . 10.2. Los toroides invariantes . . . . . . . . . . . . . . . . . . . . . . . . 10.3. Las variables acción-ángulo . . . . . . . . . . . . . . . . . . . . . . 10.4. Problema de Kepler (coordenadas esféricas) . . . . . . . . . . . . . 10.5. Problema de Kepler (coordenadas parabólicas) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 415 415 420 429 445 462 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.Teorı́a de perturbaciones 11.1. Teorı́a de perturbaciones dependiente del tiempo . . . . . . . . . . . . . 11.2. Teorı́a de perturbaciones independiente del tiempo . . . . . . . . . . . . 11.3. Multiplicidad de conjuntos de variables acción-ángulo en los sistemas degenerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.4. Teorı́a de perturbaciones de sistemas degenerados . . . . . . . . . . . . 11.5. Perturbaciones adiabáticas . . . . . . . . . . . . . . . . . . . . . . . . . . 11.6. Sistema de osciladores lineales con acoplamiento no lineal . . . . . . . . 11.7. Movimiento cerca de una resonancia aislada . . . . . . . . . . . . . . . 11.8. Movimientos regulares e irregulares . . . . . . . . . . . . . . . . . . . . . 479 . 480 . 482 . . . . . . 488 494 504 508 513 522 12.Correspondencia con la mecánica cuántica de Heisenberg 549 12.1. Representación matricial de variables dinámicas . . . . . . . . . . . . . . . 550 12.2. Corchetes de Poisson y conmutadores de matrices clásicas . . . . . . . . . 555 12.3. Problemas mecánicos a la manera de Heisenberg . . . . . . . . . . . . . . 558 12.4. Ecuación de Hamilton-Jacobi y diagonalización de la matriz hamiltoniana 561 12.5. Teorı́a de perturbaciones con matrices clásicas . . . . . . . . . . . . . . . 564 13.Correspondencia con la mecánica cuántica de Schrödinger 13.1. Ideas de Hamilton acerca de las transformaciones canónicas . 13.2. Función de distribución de probabilidades . . . . . . . . . . . 13.3. La mecánica ondulatoria . . . . . . . . . . . . . . . . . . . . . 13.4. La función de onda semiclásica según Keller y Maslov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 567 567 573 580 585 A Isabel. A Clara. A Eduardo y Andrés. Prefacio No trataré de exponer razones para la aparición de un nuevo texto de mecánica clásica. La acogida que reciba mi trabajo en la comunidad universitaria indicará si en su concepción y realización satisface una necesidad existente en este campo. Hay bellas canciones tradicionales, pero ello no impide que aparezcan nuevas composiciones. Tampoco se pide a un compositor que diga las necesidades del público que pretende complacer. Tal vez en toda obra que se realice sin interés de lucro, la principal motivación esté en el placer experimentado por el autor al superar paulatinamente el reto que voluntariamente se ha impuesto. Considero que estas reflexiones son válidas respecto al presente trabajo. Aunque la redacción del manuscrito y el trabajo mecanográfico se realizaron fuera de la Universidad, es justo reconocer que el origen y la finalidad del texto, ası́ como su reprodución, están dentro de ella. He dictado el curso de Mecánica Clásica Avanzada en varias ocasiones y el presente trabajo tiene como núcleo los manuscritos de las clases distribuidos a los alumnos. Con sus discusiones muchos estudiantes colaboraron positivamente. Algunos colegas me contribuyeron con sugerencias y discusiones útiles, como los señores Fernando Medina, Alberto Sánchez, Augusto Montes, Román Castañeda y Roberto Martı́nez. Debo reconocer que la idea de escribir un libro de mecánica clásica la recibı́ del profesor Fabio Machado. He tratado de hacer una presentación de los temas en forma muy clara, lo cual desafortunadamente ha resultado en contra de la concisión. Especialmente en los ejemplos, no aconsejo una lectura sino un desarrollo de los problemas por parte del lector. Por tratarse de un texto de estudio y no de una obra divulgativa, no he considerado necesario esforzarme por suprimir algunas fórmulas y frases redundantes. He tratado más bien de evitar los errores en el contenido. De antemano pido excusas a los lectores por las deficiencias estilı́sticas de mi trabajo, y especialmente por los errores que puedan encontrar. El plan de la obra consiste en desarrolar los temas tradicionales (formulaciones dalambertiana, lagrangiana y hamiltoniana, fuerzas centrales, cuerpo rı́gido, pequeãs oscilaciones, transformaciones canónicas, el método de Hamilton-Jacobi y la teorı́a clásica de perturbaciones), con la elaboración de ciertos puntos en los que no se profundiza en los textos usuales, y especialmente en buscar ilustraciones concretas. He tratado también algunos problemas de la mecánica clásica que son objeto de investigación en la actualidad. El lector encontrará una presentación más completa que en los textos tradicionales de muchas cuestiones como: el tratamiento de sistemas holónomos, el uso de las coordenadas generalizadas, las transformaciones canónicas, el oscilador isotrópico, el método variacional, la cuerda uniforme, los parámetros de Euler y los parámetros de Cayley-Klein, las funciones elı́pticas de Jacobi, las ecuaciones de Euler en sistemas de referencia rotantes, la brújula de Foucault, la formulación de la mecánica según Poincaré, el teorema de Liouville sobre los sistemas integrables, un tratamiento exhaustivo del problema de Kepler con variables acción-ángulo, la teorı́a canónica de perturbaciones, el teorema de K.A.M, los movimientos caóticos en sistemas hamiltonianos, una formulación de la mecánica clásica con matrices, dos presentaciones de los fundamentos de la mecánica x cuántica, y muchos otros temas que yo no soy el llamado a valorar. El tratamiento de la mecánica basado en la teorı́a matemática de las variedades diferenciales y en el cálculo diferencial e integral de Cartan ha sido excluido por obvias razones. Esto no implica que le reste valor al uso de las matemáticas contemporáneas. El matemático A. N. Kolmogorov decı́a que es mucho más importante obtener resultados correctos que rigurosos. Para un fı́sico lo anterior es profundamente válido: no hay nada menos riguroso desde el punto de vista teórico que un resultado experimental, pero tampoco nada que sea más cierto ni bello. La aplicación de la teorı́a de grupos a las vibraciones moleculares, los campos mecánicos, los sistemas con vı́nculos, los fractales y el caos en sistemas disipativos, son algunos temas importantes de la mecánica clásica contemporánea que no han sido incluidos. Tal vez si es posible una segunda edición? Mis obras de consulta son excelentes textos (ver bibliografı́a) como los de Whittaker, Landau-Lifshitz, Arnold, Gantmacher, Goldstein, Born, Corben-Stehle, Marion, Lanczos, etc., ası́ como numerosas monografı́as y artı́culos especializados. Mi trabajo se alimenta en gran parte de estas obras aunque me he esforzado por evitar el plagio. Dejo a los lectores la determinación del grado de originalidad del libro que tienen en sus manos. Esta es una obra de referencia para profesores y estudiantes de cursos de pregrado y posgrado en fı́sica, y puede servir como texto guı́a mediante una adecuada selección de los temas, complementado con ejercicios. Con los capı́tulos I, II, III, IV, V y VI, y un resumen del VII, puede cubrirse el curso de pregrado. Con un resumen de unas quince horas del curso de pregrado, los capı́tulos VIII y IX, y una selección de temas de los capı́tulos X, XI, XII y XIII puede cubrirse el curso de postgrado. La comprensión de este material facilita la solución de problemas de investigación y escuchar sin grandes dificultades conferencias en el campo de la dinámica clásica. JORGE MAHECHA GÓMEZ Medellı́n, Junio de 1987. 1 Fundamentos de la mecánica newtoniana 1.1. Conceptos preliminares Mecánica. Es la ciencia que estudia el comportamiento de la materia a partir del movimiento de las partı́culas constituyentes. En la mecánica la máxima información acerca de un sistema de partı́culas consiste en obtener las posiciones y velocidades de cada una de ellas en cada instante de tiempo, respecto a un sistema de referencia dado. Para la solución de cualquier problema mecánico es necesario: definir un sistema de referencia, hallar las coordenadas más adecuadas para describir el sistema y plantear las ecuaciones de movimiento de cuya solución se obtendrán las coordenadas y velocidades en función del tiempo. Importancia. El mundo percibido por el hombre directamente a través de sus sentidos se denomina macroscópico. La mecánica clásica brinda la formulación más completa del comportamiento de la mayorı́a de fenómenos macroscópicos, por ello es el instrumento teórico por excelencia en ramas como: arquitectura e ingenierı́a de construcciones, ingenierı́a mecánica que está en la base de la moderna industria de la maquinaria, la aeronáutica y la astronáutica, la geofı́sica, etc. Podemos decir que la ciencia de la mecánica ha sido estimulada por el desarrollo de la gran industria y a la vez le ha contribuido a ésta de manera importante. La mecánica clásica no es una ciencia acabada. En primer lugar, hay muchos problemas fundamentales que son estudiados en la actualidad (Arnold, Abraham, Maslov, etc. son nombres asociados a desarrollos contemporáneos de la mecánica). En segundo lugar, hay problemas fundamentales de la fı́sica (entendida como la ciencia o conjunto de ciencias que estudian las propiedades elementales de la materia) que utilizan la mecánica clásica como teorı́a básica en el grado de validez de la misma (metrologı́a, fı́sica de los plasmas, estado sólido, astrofı́sica, sistemas atómicos, sistemas nucleares y de partı́culas elementales en estados altamente excitados, etc.). Una revisión de los temas en que trabaja una inmensa mayorı́a de los fı́sicos contemporáneos nos muestra que sus objetos de investigación no son las teorı́as fundamentales sino problemas especı́ficos referentes a las propiedades de sistemas fı́sicos reales (núcleos, sólidos, átomos, gases, lı́quidos, luz, 1 2 / Mecánica clásica avanzada etc.). Una visión histórica nos muestra que los virajes en el desarrollo de la fı́sica se han producido a partir de las investigaciones en problemas especı́ficos que se salen del rango de validez de las teorı́as existentes. O sea que las modernas teorı́as fı́sicas no han invalidado la mecánica clásica sino que simplemente han restringido su rango de validez. Por último, en la mecánica clásica está el germen de las teorı́as más completas como la mecánica cuántica o la relatividad general. Tales teorı́as utilizan los conceptos de la mecánica clásica y los introducen en sus formalismos cambiándoles el contenido. Las nociones de energı́a, momentum, velocidad, posición, etc., tienen su origen en la mecánica clásica, pero mantienen una importancia relevante dentro de las nuevas teorı́as. Podemos concluir que un conocimiento riguroso de la mecánica clásica es indispensable para el estudio cabal de la mecánica cuántica y demás teorı́as contemporáneas. Rango de validez. La mecánica clásica no relativı́stica es aplicable cuando las velocidades involucradas son mucho menores que la velocidad de la luz.1 La aplicabilidad de la mecánica cuántica a sistemas microscópicos como átomos y moléculas está restringida a los estados en los cuales el producto del momento lineal de las partı́culas por la dimensión caracterı́stica de la región que ocupan sea del orden Hde la constante de Planck (o más exactamente, la mecánica clásica es aplicable cuando pdq ≫ h). No es exacto afirmar que la mecánica clásica es aplicable sólo en el mundo macroscópico. Hay problemas de microfı́sica como: átomos en estados excitados, la dispersión de electrones por una radiación LASER, el movimiento de electrones en algunas moléculas, el movimiento de electrones en campos eléctricos y magnéticos, etc., en los cuales se puede utilizar la mecánica clásica. En fin, sólo un análisis del problema especı́fico que se tenga permite decidir si la mecánica clásica es aplicable, si se puede usar como una aproximación o si es completamente inadecuada. Modelos fundamentales en la mecánica. En las teorı́as mecánicas los cuerpos reales son representados por medio de nociones abstractas como las de ”punto material”(partı́cula), ”sólido rı́gido”, etc. Un punto material es un cuerpo cuyas dimensiones, forma y estructura interna carecen de importancia para la resolución de un determinado problema; esto ocurre cuando las dimensiones que aparecen en el problema son mucho más grandes que las de los cuerpos involucrados y cuando la estructura interna dé lugar a efectos secundarios en el contexto en que se trabaja. Un sólido rı́gido es un cuerpo que se considera formado por gran cantidad de partı́culas, de tal modo que la distancia entre dos cualesquiera es constante y que la forma y dimensiones del cuerpo no cambian cuando éste se mueve. Usualmente un sólido rı́gido se considera formado de un número muy grande de partı́culas, que con muy buena aproximación se pueden considerar formando una distribución continua de masa. En la interacción de dos cuerpos rı́gidos por contacto se asumen dos modelos: el contacto perfectamente liso y el perfectamente rugoso. Lo anterior es importante en el análisis de las fuerzas internas llamadas de ligadura. Otro modelo es el de cuerpo deformable, básico en las teorı́as de campos mecánicos. Partes de la mecánica. Tradicionalmente se divide en estática, cinemática y 1 Estamos adoptando el punto de vista que consiste en considerar como clásica a toda teorı́a fı́sica que no dé cuenta de los efectos indeterministas de tipo cuántico y permite una descripción causal en sentido clásico. En particular, consideramos clásicas las teorı́as especial y general de la relatividad. Fundamentos de mecánica newtoniana / 3 dinámica. En el curso se tratan dos clases de temas: 1) Generales. Leyes generales de la estática y la dinámica (formalismos lagrangiano, hamiltoniano, poissoniano y de Hamilton-Jacobi), cinemática y dinámica del movimiento de rotación. 2) Espaciales. Problema de los dos cuerpos, movimiento del sólido rı́gido y vibraciones mecánicas. Las teorı́as, incluyendo la mecánica clásica, adquieren su verdadera relevancia cuando se las aplica a situaciones reales. Las teorı́as tratan de las leyes generales pero el desarrollo de la fı́sica se halla impulsado por el estudio de problemas especı́ficos. Por esto, hacemos especial énfasis en los ejemplos y en la presentación de cálculos detallados. 1.2. Sistema de referencia. Estado de un sistema mecánico. Ligaduras. Ecuaciones de movimiento para un sistema de partı́culas. Variables dinámicas. Problemas separables. Sistema de referencia. Se entiende por tal a un cuerpo rı́gido real o ficticio que sirve de referencia para estudiar el movimiento del sistema mecánico considerado. Se supone que tal sistema de referencia está rı́gidamente unido con un sistema de coordenadas; esto permite ubicar la posición de cada partı́cula del sistema mecánico respecto del sistema de referencia. Además en el sistema de referencia hay un “cronómetro” que permite determinar los instantes en que cada partı́cula del sistema ocupa una posición dada del espacio. El sistema de referencia no tiene ninguna propiedad que pueda afectar al sistema mecánico, aunque sı́ es de esperarse que la descripción obtenida dependa del estado del movimiento del sistema de referencia. Ası́ como para especificar la longitud de un objeto se requiere un patrón de longitud con una unidad de medida asociada, la descripción del movimiento de un sistema mecánico requiere de un “patrón”mecánico que no es más que el sistema de referencia. La unidad de medida es análoga al sistema de coordenadas. La elección del sistema de coordenadas en un sistema de referencia es cuestión de comodidad. Hay un número infinito de sistemas de coordenadas posible. Con una elección de sistema de coordenadas se busca que las ecuaciones de movimiento sean fácilmente solubles y que la solución sea lo más simple posible. En cualquier sistema de coordenadas es posible escribir las ecuaciones de movimiento, pero puede ocurrir que no sean solubles. Encontrar el adecuado sistema de coordenadas que permita resolver las ecuaciones de movimiento es un importante problema matemático que llega a involucrar la teorı́a de grupos, la geometrı́a diferencial y otras ramas de las matemáticas. Estado de un sistema mecánico. Es necesario distinguir los conceptos de estado y de descripción de estado. La noción de estado es intuitiva (análoga a las nociones de longitud, duración, etc.), involucra sólo aspectos cualitativos, de carácter objetivo. La descripción del estado implica nociones geométricas a través del sistema de referencia 4 / Mecánica clásica avanzada y el sistema de coordenadas que es necesario elegir (hay analogı́a con las nociones de distancia, intervalo de tiempo, etc., que implican aspectos cuantitativos). Clásicamente para la especificación o descripción completa del estado de un sistema mecánico se requiere, por ejemplo, conocer la posición y velocidad de cada una de las partı́culas en un tiempo dado. Es imposible obtener la descripción del estado sin tener un sistema de referencia y un sistema de coordenadas. En cualquier rama de la fı́sica, y en general cualquier ciencia cuantitativa, se requiere de la noción de estado. El tipo de descripción depende del sistema que se trate: el estado de un sistema de partı́culas en mecánica clásica se describe mediante posiciones y velocidades; en mecánica cuántica se describe mediante la función de onda del sistema. El estado termodinámico de un sistema macroscópico se describe mediante un conjunto de variables termodinámicas como P , V , T , etc. En economı́a, el estado finanaciero de una empresa, por ejemplo, se describe mediante una serie de parámetros que evolucionan con el tiempo; qué parámetros son relevantes, depende del modelo, ası́ como de la ecuación de evolución. El sistema de referencia se denomina a veces espacio fı́sico de representación. El sistema de coordenadas permite representar cada estado del sistema por un punto. La representación de los estados ya forma parte de la teorı́a fı́sica, pero siempre existe el supuesto de que hay una correspondencia que permite asociar a cada estado de movimiento del sistema un punto del espacio de representación, o, para ser más exactos, una trayectoria en dicho espacio. A un sistema de N partı́culas se le asocian 3N coordenadas y 3N velocidades. Los estados del sistema se pueden representar por puntos del espacio de representación, llamado espacio de configuración, y sus vectores tangente y velocidades. También los estados se pueden representar por puntos del espacio de fases 6N dimensional. Una descripción puede ser por medio de las 6N cantidades: { x1 (t), y1 (t), z1 (t); x2 (t), y2 (t), z2 (t); ...xN (t), yN (t), zN (t); (1.1) ẋ1 (t), ẏ1 (t), ż1 (t); ẋ2 (t), ẏ2 (t), ż2 (t); ...ẋN (t), ẏN (t), żN (t) } También es posible una descripción en términos de las coordenadas en dos tiempos diferentes, t y t′ . No basta, pues, conocer los valores iniciales de las coordenadas ya que además se requiere información acerca de cómo cambian con el tiempo para poder predecir cuál será la configuración del sistema en otro tiempo. Para lo anterior desde el punto de vista meramente matemático, se requerirı́a conocer todas las derivadas temporales de las coordenadas y velocidades que en un tiempo determinan los valores de las mismas en cualquier otro instante. En conclusión, el espacio de representación para un sistema de N partı́culas tiene 6N dimensiones. Los distintos formalismos de la mecánica se caracterizan, entre otras cosas, por el tipo de espacio de representación que emplean. La formulación newtoniana utiliza las posiciones y velocidades de las partı́culas. La formulación lagrangiana, las coordenadas y velocidades generalizadas. Las formulaciones de Hamilton y Poisson, las coordenadas y momentos generalizados. La formulación de Hamilton-Jacobi utiliza constantes de movimiento. La mecánica cuántica utiliza otro tipo de descrición del estado: los vectores de estado del espacio de Hilbert del sistema. Ligaduras. Si con sólo cambiar las fuerzas y las condiciones iniciales las partı́culas del sistema pueden ocupar cualquier posición en el espacio o cualquier velocidad, Fundamentos de mecánica newtoniana / 5 se dice que el sistema es libre. Si lo anterior no es posible, es porque hay restricciones, llamadas ligaduras mecánicas. Las ligaduras disminuyen el número de cantidades independientes necesarias para especificar completamente el estado del sistema. Si hay k condiciones de ligadura independientes, el número de cantidades independientes necesarias para especificar la configuración del sistema (llamado el número de grados de libertad) será 3N − k = 1. En lo que sigue supondremos conocidos los conceptos referentes a: trayectoria, primera ley de Newton, sistemas de referencia inerciales, segunda y tercera ley de Newton, trabajo y energı́a, y teoremas de conservación del momento lineal, la energı́a y el momento angular. Ecuaciones de movimiento para un sistema de partı́culas. Supondremos que las fuerzas que actúan sobre una partı́cula son función de las coordenadas y velocidades de todas las partı́culas del sistema, y que se pueden descomponer a una parte debida a efectos exteriores al sistema y a otra debida a las demás partı́culas del sistema. La fuerza neta sobre la partı́cula i (i = 1, 2, ...N ) será: F~i (~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t) = F~ei ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t + N X ′~ Fij j=1 (1.2) ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t Se supone que las partı́culas del sistema sólo interactúan entre pares; la prima en la sumatoria indica que excluye j = i. En el caso más general F~ei y F~ij dependen de las coordenadas y de las velocidades de todo el sistema. Usualmente se cumple lo siguiente: (a) Las fuerzas entre las partı́culas i y j dependen sólo de las coordenadas y de las velocidades de éstas; (b) La fuerza externa sobre la partı́cula i sólo depende de sus coordenadas y velocidades: F~i ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t = F~ei (~ri , ~r˙ i ; t) + N X ′~ Fij (~ri , ~rj , ~r˙ i , ~r˙ j ) (1.3) j=1 Las ecuaciones de movimiento serán: N X j=1 ′~ Fij ~ri , ~rj , ~r˙ i , ~r˙ j + F~ei ~ri , ~r˙ i ; t = mi~¨r i i = 1, 2, ...N (1.4) Este último es un sistema de N ecuaciones diferenciales, en general no lineales, de segundo orden, acopladas, con N incógnitas (~r1 , ~r2 , ...~rN ), o si se quiere, de 3N ecuaciones diferenciales escalares con 3N incógnitas. La solución de estas ecuaciones contiene 6N constantes de integración, que pueden tomarse como las 3N coordenadas y las 3N velocidades en el tiempo t = t0 , y proporciona directamente la especificación completa del estado del sistema. 6 / Mecánica clásica avanzada Variables dinámicas. Cualquier función del estado del sistema y del tiempo se denomina una variable dinámica. Las coordenadas o las velocidades mismas son variables dinámicas. También lo son el momento angular, la energı́a, el momento lineal, las coordenadas del centro de masa, etc. Un conjunto de 6N funciones (independientes entre sı́) de las coordenadas y las velocidades constituye un conjunto completo de variables dinámicas y sirve para especificar completamente el estado del sistema. Una clase especial de variables dinámicas es constituida por las constantes de movimiento. Un conjunto máximo de constantes de movimiento, 6N , permite describir completamente el estado del sistema. En mecánica cuántica pueden haber a lo sumo 3N constantes de movimiento independientes, exactamente definidas; entonces las otras 3N constantes serán completamente indefinidas. La mecánica newtoniana en su forma original es adecuada para el estudio de sistemas libres. Para sistemas con ligaduras es más conveniente el formalismo lagrangiano. Desde el punto de vista teórico es deseable un formalismo en el cual las ecuaciones del movimiento sean covariantes y en el cual la mecánica se deduzca de principios más generales (variacionales); en este sentido también es más útil la mecánica lagrangiana. Problemas separables. Son aquellos en los cuales el sistema de ecuaciones de movimiento acopladas, es posible mediante algún cambio de variables reducirlo a un sistema de 3N ecuaciones diferenciales desacopladas, o sea, 3N ecuaciones donde en cada ecuación hay sólo una incógnita. En principio algunos problemas mecánicos son separables, pero en la mayorı́a de los casos esto es un problema muy difı́cil (o imposible) de resolver matemáticamente. Algunos problemas que han sido resueltos matemáticamente son: el de N partı́culas en un campo externo pero no interactuantes entre sı́; N partı́culas en un campo externo interactuando entre sı́ con fuerzas restauradoras lineales (cadena de osciladores acoplados, molécula lineal poliatómica, etc.); dos partı́culas interactuando entre sı́ a través de un potencial central (problema de dos cuerpos, por ejemplo); sólido rı́gido con un punto fijo en un campo gravitacional homogéneo. Pero la mayor parte de los problemas mecánicos no se han podido resolver analı́ticamente, por ejemplo, el problema de tres partı́culas interactuando entre sı́ a traves de un potencial central de tipo gravitacional (problema de los tres cuerpos), o el problema de una partı́cula cargada en presencia del campo electrostático de una carga fija y un campo magnético homogéneo. Los problemas solubles clásicamente lo son también cuánticamente; en cuanto a la búsqueda de soluciones analı́ticas exactas, la mecánica cuántica no aporta mucho en relación con la mecánica clásica, sin embargo, la mecánica cuántica ha alcanzado una mayor flexibilidad en la búsqueda de soluciones aproximadas al problema de muchas partı́culas interactuantes entre sı́. 2 Ecuaciones generales de la estática y la dinámica 2.1. Las ligaduras Esta noción aparece en fı́sica macroscópica con frecuencia y raras veces en fı́sica microscópica. Es de interés en las aplicaciones técnicas, como el diseño de maquinaria. Por ejemplo, en la definición de sólido rı́gido aparece el concepto de ligadura. Este sistema se define por la condición que la distancia entre cualquier par de partı́culas permanece fija. Para N = 2, el cuerpo rı́gido consiste de dos partı́culas a una distancia fija entre sı́; la condición de ligadura es: (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 = constante (2.1) El sistema posee seis coordenadas, pero la ligadura permite expresar una de ellas en términos de las otras, quedando sólo 6 − 1 = 5 coordenadas independientes. Por tales coordenadas pueden tomarse las tres del centro de masa y dos ángulos que especifican la orientación respecto al centro de masa. Para N = 3 hay nueve coordenadas y tres condiciones de ligadura que pueden expresarse en forma vectorial como: |r~1 − r~2 | = a |r~2 − r~3 | = b (2.2) |r~3 − r~1 | = c Hay sólo 9 − 3 = 6 coordenadas independientes que pueden tomarse ası́: tres para especificar la posición del centro de masa del sistema total y tres ángulos que especifican la orientación del plano de las partı́culas con el centro de masa fijo. Para un sólido rı́gido en general se requieren 3N coordenadas pero habrá cierto número de condiciones de ligadura independientes. El número total de coordenadas independientes requeridas para especificar la posición de un sólido rı́gido son seis, que pueden 7 8 / Mecánica clásica avanzada tomarse ası́: las tres coordenadas del centro de masa y tres ángulos que especifican la orientación del cuerpo con el centro de masa fijo. Se dice que un sólido rı́gido de N partı́culas tiene seis grados de libertad y 3N − 6 condiciones de ligadura. Otros tipos de ligaduras son las siguientes: (a) Hay alguna condición que obliga a las partı́culas a moverse sobre una superficie o en una lı́nea. En una superficie cada partı́cula posee sólo dos coordenadas independientes, o sea que el sistema tendrá N condiciones de ligadura y 2N grados de libertad. Para un sistema de partı́culas sobre un plano las condiciones de ligadura son las siguientes, si se toma en el plano x − y: zi = 0 ; i = 1, 2, ... N (2.3) Para una esfera de radio a y tomando el centro de la esfera como origen de coordenadas las ligaduras son: x2i + yi2 + zi2 − a2 = 0 ; i = 1, 2, ... N (2.4) (b) Si hay cuerpos rı́gidos en contacto que ruedan sin deslizarse sobre un plano. Sea un cilindro de radio a que rueda sin deslizar sobre el plano z = 0. El cilindro requiere de seis coordenadas para especificar su posición, pero hay dos condiciones de ligadura. zCM = a (2.5) 2 ẋ2CM + ẏCM = a2 φ̇2 ~ CM y R ~˙ CM son la posición y velocidad del centro de masa y φ̇ es la velocidad donde R angular de rotación alrededor del eje del cilindro. Si se escoge el sistema de coordenadas de modo que el eje del cilindro sea paralelo al eje x, la ecuación (2.5) puede integrarse para dar: yCM = aφ (2.6) La ecuación (2.5) puede también integrarse directamente para obtener una relación entre el ángulo de giro del cilindro y el desplazamiento del centro de masa. En (2.6) se ha escogido a φ de modo que yCM = 0 cuando φ = 0. Las ligaduras de “rodar” relacionan las velocidades entre sı́ y con las coordenadas, y en general son no holónomas, o sea no integrables. Son los casos de un disco o una esfera rodando sobre un plano. Para un disco rodando sobre un plano se requieren dos coordenadas para especificar la posición del centro de masa, una para especificar el giro alrededor del eje y dos para especificar la posición del plano del disco. Hay dos ligaduras de “rodar” que relacionan las componentes de la velocidad del centro de masa con la velocidad angular de rotación al rededor del eje (véase la figura 2.1). Una de las coordenadas necesarias para especificar el plano del disco puede tomarse como el ángulo que hace el eje del disco con la dirección x. La otra coordenada la especificamos exigiendo que el plano del disco sea siempre perpendicular al plano x − y. Una condición de ligadura es zCM = a. Las otras dos coordenadas del centro de masa Ecuaciones generales de la estática y la dinámica / 9 z y a ϕ v α x Figura 2.1 Disco rodando sobre un plano son las mismas del punto de contacto del disco con el plano. Las condiciones de ligadura de rodar son: que la magnitud de la velocidad del centro de masa sea proporcional a φ̇, v = aφ̇ (2.7) y que la dirección de la velocidad del centro de masa siempre esté en el plano de rotación del disco, ẋ = v senα ẏ = −v cos α (2.8) De estas tres condiciones de ligadura sólo hay dos independientes: dx − a senα dφ =0 dy + a cos α dφ =0 (2.9) Las ecuaciones (2.9) no se pueden integrar para obtener relaciones que involucren sólo cantidades finitas. Para poder hacer esto serı́a necesario hallar ciertas funciones f (x, α; φ) y g(y, α; φ) tales que al multiplicar por ellas las ecuaciones (2.9) se obtengan diferenciales exactos. Lo anterior no es posible, o sea que las relaciones (2.9) no pueden usarse para expresar una coordenada en términos de las demás; esto implica que las condiciones de ligadura deben considerarse simultáneamente con la solución del problema mecánico, que contendrá sólo tres coordenadas independientes. Los anteriores ejemplos nos muestran que un sistema de N partı́culas y k condiciones de ligadura tendrá 3N − k grados de libertad. Un cuerpo rı́gido tendrá 6 − k grados 10 / Mecánica clásica avanzada de libertad. Las condiciones de ligadura para un sistema de partı́culas pueden siempre expresarse en la forma: fα (~r1 , ~r2 , ... ~rN ; ~r˙ 1 , ~r˙ 2 , ... ~r˙ N ; t) = 0; α = 1, 2, ... k (2.10) Ligaduras holonómicas. También se llaman integrables, finitas o geométricas. Su nombre se deriva de las raı́ces griegas nomos (ley) y holo (entero, todo). Estas ligaduras sólo restringen las posiciones posibles del sistema, o sea que se pueden expresar por medio de igualdades que no involucran las velocidades. Para un sistema de N partı́culas son de la forma: fα (~r1 , ~r2 , ... ~rN ; t) = 0 α = 1, 2, ... h (2.11) Para un cuerpo rı́gido son: ~ θ, φ, ψ; t) = 0 fα (R, α = 1, 2, ... h (2.12) ~ denota la posición del centro de masa, φ, θ, ψ son tres ángulos que especifican donde R la orientación del cuerpo con el centro de masa fijo y h es el número de condiciones de ligadura holónomas. Un sistema se dice que es holónomo si no tiene ligaduras diferenciales no integrables. Ligaduras no holonómicas. También se llaman no integrables, diferenciales o cinemáticas. Son aquellas que no pueden integrarse. Para un cuerpo rı́gido son de la forma: ~ R, ~˙ θ, φ, ψ, θ̇, φ̇, ψ̇; t) = 0 ; fα (R, α = 1, 2, ... n (2.13) donde n es el número de ligaduras no holónomas. En la mayorı́a de los casos (por ejemplo el de la figura 2.1), se pueden expresar en la forma: ~lα · R ~˙ + mα θ̇ + nα φ̇ + σα ψ̇ + Pα = 0 ; α = 1, 2, ... n (2.14) ~ θ, φ, ψ, t. La generalización de (2.12), donde ~lα , mα , nα , σα , Pα , son funciones de R, (2.13) y (2.14) para sistemas de cuerpos rı́gidos es inmediata. Para un sistema de N partı́culas usualmente son de la forma: N X i=1 ~lα · r~˙i + Dα = 0 ; i α = 1, 2, ... n (2.15) donde ~lαi y Dα son funciones de ~r1 , ~r2 , ... ~rN , t. Ligaduras reonómicas. Del griego reo (flujo). Son las ligaduras, holonómicas o no holonómicas, que dependen del tiempo. Serı́a el caso de dos partı́culas unidas entre sı́ por una varilla cuya longitud varı́a con el tiempo de manera conocida: |~r1 − ~r2 | = l(t) (2.16) Ligaduras escleronómicas. Del griego esclero (duro). Son las ligaduras rı́gidas o que no cambian con el tiempo. Es el caso de dos partı́culas unidas entre sı́ por una Ecuaciones generales de la estática y la dinámica / 11 varilla rı́gida. La noción de ligadura involucra dos aspectos. Por una parte, indica que el número de variables independientes necesarias para especificar el estado del sistema es menor. En segundo lugar aparecen las llamadas fuerzas de ligadura, que no se pueden conocer a priori porque dependen del problema especı́fico, es decir de las fuerzas aplicadas y de las condiciones iniciales. Vemos que las ligaduras introducen nuevas incógnitas en el problema. Las ligaduras consideradas como fuerzas. La noción de ligadura es puramente macroscópica. Viendo las cosas en detalle en los ejemplos, notamos que las ligaduras son el resultado de interacciones. Ası́, en el caso de la partı́cula que se mueve sobre la esfera, deben existir fuerzas que impiden que la partı́cula salga de la superficie, bien sea hacia afuera o hacia adentro (por esto se dice que esta ligadura es bilateral. En el caso en que la partı́cula pudiera ocupar sólo cualquier posición dentro de la esfera se dice que la ligadura es unilateral). En el caso del disco que rueda sin deslizar, debe haber algún tipo de interacción entre la superficie del disco y la del plano en la zona de contacto. En todos estos casos sucede que es imposible conocer las fuerzas a priori, independientemente de las fuerzas aplicadas y de las condiciones iniciales. Por ejemplo, en el caso de las dos partı́culas unidas por una varilla, no sabemos cuál es la fuerza que ejerce la varilla sobre ellas. Obviamos esta dificultad diciendo simplemente que hay una “ligadura”: |~r1 − ~r2 | = l (2.17) Pero podemos, si queremos, modelar dicha fuerza, digamos que considerándola como un caso lı́mite de una interacción del tipo restauradora lineal. Ası́, las fuerzas de la varilla sobre las partı́culas serı́an de la forma: F~1′ = −k ′ (r − l)û F~2′ = k ′ (r − l)û (2.18) donde k ′ serı́a la constante de resorte, l la separación de las partı́culas en la posición de equilibrio y û un vector unitario en la dirección del vector ~r2 − ~r1 = ~r. En el caso de dos partı́culas interactuando a través de una fuerza central es posible separar el movimiento en dos partes: el movimiento del centro de masa, y el movimiento de una partı́cula de masa reducida µ respecto al centro de masa bajo una interacción idéntica a la interacción entre las dos partı́culas originales. Entonces, el movimiento relativo descrito como el movimiento de la partı́cula ficticia de masa µ obedece la ecuación: s r 2E k′ r−l = sen (t − t0 ) (2.19) k′ µ donde E es la energı́a del movimiento, que consideraremos tiene un valor finito dado. Cuando k ′ → ∞, la frecuencia de las oscilaciones aumenta, en tanto que r − l tiende a cero, obteniéndose la relación cinemática r = l. Por otra parte, como la energı́a E depende de otras condiciones –fuerzas externas y condiciones de ligadura–, es realmente indeterminada a priori. Sólo un modelo microscópico nos permitirı́a estimar el valor de 12 / Mecánica clásica avanzada k ′ . Por lo tanto las fuerzas de ligadura F~ ′ 1 y F~ ′ 2 son indeterminadas; su valor depende de la solución al problema mecánico completo. Es claro que la indeterminación en las fuerzas de ligadura no proviene de la omisión de los detalles microscópicos, pues aun a escala microscópica las interacciones dependerı́an del movimiento completo del sistema. 2.2. Las coordenadas generalizadas Grados de libertad. El número de grados de libertad de un sistema mecánico es igual al número de coordenadas independientes necesarias para especificar completamente cada configuración del sistema. Entendemos por configuración la posición que ocupa cada una de las partı́culas del sistema. Si hay h condiciones de ligadura holónomas y n condiciones de ligadura no holónomas (o sea si hay k = n + h condiciones de ligadura independientes), el número l de grados de libertad será: l = 3N − h − n (2.20) Clasificación de los grados de libertad. Sea un sistema de partı́culas sin ligaduras, k = 0. Sus 3N coordenadas se pueden clasificar en traslacionales y rotacionales (cuando describen el movimiento del centro de masa y las rotaciones del sistema respecto al centro de masa), y en vibracionales (cuando describen los movimientos relativos de las partı́culas que no trasladan el centro de masa y no rotan el sistema). Por ejemplo, sea un sistema de dos partı́culas –molécula diatómica–, las seis coordenadas se pueden clasificar en tres grados de libertad traslacionales, dos grados de libertad rotacionales y un grado de libertad vibracional; en el caso de tratarse de una molécula de H2 , además hay grados de libertad internos a las dos partı́culas: seis grados de libertad correspondientes a los dos electrones, un grado de libertad interno, el espı́n para cada núcleo y para cada electrón. Las modernas teorı́as de las partı́culas elementales consideran que a su vez el protón y el electrón poseen otros grados de libertad internos. Gran parte de los modelos que se construyen en la fı́sica consisten en hallar cuáles son los grados de libertad que tienen más relevancia para una situación dada. Ası́ por ejemplo, en la mecánica se omiten los grados de libertad microscópicos. Las coordenadas generalizadas. Sea un sistema de N partı́culas con h condiciones de ligadura holónomas, dadas por las ecuaciones (2.11). Estas ecuaciones permiten expresar a h coordenadas en términos de 3N − h coordenadas, que sólo serán independientes en el caso en que no haya ligaduras no holónomas. Es conveniente realizar una transformación de coordenadas de modo que se eliminen del problema las h coordenadas superfluas; para ello basta exigir que la transformación anule idénticamente las funciones fα en las ecuaciones (2.11) y (2.12). Es decir, si: xi = xi (q1 , q2 , ... q3N −h , t) yi = yi (q1 , q2 , ... q3N −h , t) zi = zi (q1 , q2 , ... q3N −h , t) ; (2.21) i = 1, 2, ... N Ecuaciones generales de la estática y la dinámica / 13 donde q1 , q2 , ... q3N −h son las coordenadas generalizadas y la transformación dependerá del tiempo si las ligaduras holónomas son además reónomas. La transformación además debe cumplir que se anulen idénticamente las funciones: f~α (q1 , q2 , ... q3N −h , t) ≡ fα [~r1 (q1 , q2 , ... q3N −h , t), ~r2 (q1 , q2 , ... q3N −h , t), ... t] (2.22) para α = 1, 2, ... h Usaremos la siguiente notación: los subı́ndices latinos se refieren a cantidades que se pueden asociar a las partı́culas. Para nombrar las coordenadas generalizadas reservamos los subı́ndices griegos: qν (ν = 1, 2, ... 3N − h). Para nombrar el conjunto de todas las coordenadas generalizadas usamos la notación (q). Más adelante usaremos también la notación ~q. Si k = h, o sea si n = 0, entonces q será un conjunto de coordenadas generalizadas independientes. Por ejemplo, para una partı́cula que se puede mover sólo sobre una esfera de radio a la condición de ligadura está dada por la ecuación (2.4); o sea que, por ejemplo, si el radio de la esfera cambia con el tiempo de manera conocida, f (x, y, z, t) ≡ x2 + y 2 + z 2 − a2 (t) (2.23) el sistema tiene una coordenada superflua que se puede eliminar introduciendo unas coordenadas en la superficie de la esfera. Si tomamos como coordenadas generalizadas los ángulos θ y φ definidos por: x(θ, φ, t) = a(t) senθ cos φ y(θ, φ, t) = a(t) senθ senφ (2.24) z(θ, φ, t) = a(t) cos θ Vemos que f (θ, φ, t) se anula idénticamente, o sea que la condición de ligadura (2.4), se reduce a 0 = 0. Veamos otro ejemplo, sea el sistema formado por dos bolas pegadas entre sı́ por varillas rı́gidas sin masa y una de ellas unida por una varilla rı́gida sin masa a un punto fijo. Este sistema se denomina péndulo doble (véase figura 2.2). El sistema posee seis coordenadas que no son independientes. Supongamos que sólo hay movimientos permitidos en un plano. Entonces las condiciones de ligadura serán, z1 = 0 z2 = 0 x22 + y22 − l22 = 0 (x1 − x2 )2 + (y1 − y2 )2 + l12 = 0 (2.25) donde tomamos el plano x − y como el plano de movimiento, y el origen de coordenadas en el extremo fijo de la varilla l2 . El sistema tendrá dos grados de libertad que son las 14 / Mecánica clásica avanzada 0 θ2 l2 m2 θ1 l1 m1 Figura 2.2 Péndulo doble coordenadas θ1 , θ2 definidas por: x1 − x2 = l1 cos θ1 , x2 = l2 cos θ2 , z1 ≡ 0 y1 − y2 = l1 sen θ1 , y2 = l2 sen θ2 , z2 ≡ 0 (2.26) son unas coordenadas generalizadas, ya que reducen las ecuaciones (2.25) a la identidad 0 = 0. Las coordenadas generalizadas se refieren al sistema como un todo y no a las partı́culas individuales. Además, no necesitan tener dimensiones de longitud. En general, cualquier conjunto de 3N − h variables dinámicas independientes del sistema puede servir de sistema de coordenadas generalizadas. Velocidades generalizadas. Son las derivadas totales de las coordenadas generalizadas respecto al tiempo: (q̇) = (q˙1 , q˙2 , ... q̇3N −h ) (2.27) En coordenadas cartesianas se cumple que el momento está relacionado con la velocidad mediante la relación ~p = m~v. En coordenadas generalizadas no existe una relación de este tipo en general. Espacio de configuración. Es un espacio definido por las l coordenadas independientes del sistema, donde l = 3N −k. Al describir un sistema con ligaduras por medio del espacio 3N dimensional, estamos usando un espacio euclidiano (en ausencia de fuerzas, una partı́cula se mueve en lı́nea recta); entonces las trayectorias no rectilı́neas inmediatamente se atribuyen a la presencia de fuerzas de ligadura. Al describir un sistema con Ecuaciones generales de la estática y la dinámica / 15 ligaduras por medio del espacio de configuración l-dimensional, usamos un espacio no euclidiano; entonces las trayectorias no rectilı́neas se atribuyen no a fuerzas, sino a la curvatura del espacio, como en relatividad general. 2.3. Los desplazamientos virtuales Sea un sistema sujeto a k condiciones de ligadura, h holónomas, dadas por las ecuaciones (2.11) y n no holónomas dadas por las ecuaciones (2.15), o por (2.12) y (2.14) respectivamente si se trata de un cuerpo rı́gido, o sus generalizaciones para un sistema de cuerpos rı́gidos. Para una configuración dada del sistema en un tiempo t, sólo hay ciertas velocidades compatibles con las n condiciones de ligadura no holónomas. O sea que hay n componentes de las velocidades que se pueden expresar en función de las 3N − n componentes restantes. Velocidades posibles. Son las velocidades que para una configuración dada (~r1 , ~r2 , ... ~rN ) del sistema en el tiempo t son compatibles con las k condiciones de ligadura. Sólo hay entre las velocidades posibles un conjunto de velocidades (~r˙ 1 , ~r˙ 2 , ... ~r˙ N ) que efectivamente toma el sistema. Las velocidades reales se hallan solamente al resolver el problema mecánico completo. Desplazamientos posibles. Son los ~r˙ i = ~r˙ i dt, i = 1, 2, ... N , cuando las ~r˙ i son las velocidades posibles. Cuando las ~r˙ i son las velocidades reales para una configuración dada, d~ri = ~r˙ i dt son los desplazamientos reales. Tanto los desplazamientos reales como los posibles deben ser compatibles con las h condiciones de ligadura holónomas; es decir, estas deben satisfacerse tanto en la configuración (~r1 , ~r2 , ... ~rN ) como en la configuración (~r1 + d~r1 , ~r2 + d~r2 , ... ~rN + d~rN ), siendo los d~ri desplazamientos posibles. Se sigue entonces que los desplazamientos posibles deben satisfacer simultáneamente las k = h + n condiciones, N X i=1 ~lα · d~ri + Dα dt = 0 i N X ∂fα i=1 ∂~ri · d~ri + α = 1, 2, ... n ∂fα dt = 0 α = 1, 2, ... h ∂t (2.28) (2.29) que se siguen de (2.11) y (2.15). ∂/∂~ri denota el gradiente respecto a las coordenadas de la partı́cula i. Desplazamientos virtuales. Son los desplazamientos posibles cuando se dejan fijas las ligaduras durante el desplazamiento. Por ejemplo, si en la situación representada por la figura 2.1 se permite que el plano x−y se mueva de manera conocida, las ligaduras serán reónomas; supongamos que se trate sólo de un movimiento del plano en la dirección z. En un desplazamiento virtual del disco se deja el plano x − y fijo mientras se efectúa 16 / Mecánica clásica avanzada el desplazamiento. En un desplazamiento posible, el centro de masa del disco tiene movimiento en la dirección z y en el plano x − y; en un desplazamiento virtual el centro de masa sólo se mueve en el plano x − y. Para hallar la condición para que los desplazamientos virtuales sean compatibles con las ligaduras, consideremos dos conjuntos de desplazamientos posibles durante un tiempo dt, d~ri = ~vi dt y d′~ri = ~vi′ dt, donde ~vi y ~vi′ son dos conjuntos de velocidades posibles. Los d~ri satisfacen las ecuaciones (2.28) y (2.29) y d′~ri satisface, N X i=1 ~lα · d′~ri + Dα dt = 0 ; i N X ∂fα i=1 ∂~ri · d′~ri + ∂fα dt = 0 ; ∂t α = 1, 2, ... n α = 1, 2, ... h (2.30) (2.31) En las ecuaciones (2.30) y (2.31), ~lαi y Dα están evaluadas en ~r1 , ~r2 , ... ~rN , t y análogamente ∂fα /∂~ri y ∂fα /∂t. Definimos los desplazamientos virtuales δ~ri como: δ~ri = d′~ri − d~ri (2.32) y las condiciones de su compatibilidad con las ligaduras son: N X i=1 ~lα · δ~ri = 0 ; i N X ∂fα i=1 ∂~ri · δ~ri = 0 ; α = 1, 2, ... n α = 1, 2, ... h (2.33) (2.34) Ejemplo 2.3.1 Sea una partı́cula sometida a una fuerza externa F~ (x, y, t) y constreñida a moverse solamente sobre una superficie descrita por la ecuación Φ(x, y, z) = 0 (2.35) Como la ligadura es holónoma, vemos que cualquier velocidad es posible si es tangente a la superficie. La única condición sobre los desplazamientos virtuales es que sean compatibles con la ligadura. En este caso es que satisfagan la ecuación (2.34), donde Φ hace las veces de fα , es decir, ∂Φ ∂Φ ∂Φ δx + δy + δz = 0 ∂x ∂y ∂z (2.36) O sea que δx, δy, δz no pueden ser arbitrarios; sólo dos de ellos pueden serlo. En otras palabras, hay dos grados de libertad. La ecuación de movimiento, F~ = m ~¨r, y la ecuación de ligadura (2.35), deben ser compatibles. En efecto, (2.35) impone condiciones a las velocidades posibles y a las aceleraciones posibles: ∂Φ ˙ · ~r = 0 ∂~r (2.37) Ecuaciones generales de la estática y la dinámica / 17 d ∂Φ ¨ ∂Φ ~r˙ · + ~r · =0 dt ∂~r ∂~r (2.38) la ecuación de movimiento será compatible con (2.38) sólo si: d ∂Φ F~ ∂Φ ~r˙ · + · =0 dt ∂~r m ∂~r (2.39) Como F~ puede darse arbitrariamente, vemos que sólo por accidente se cumplirı́a (2.39). Por tanto concluimos que la superficie debe reaccionar sobre la partı́cula con una ~ que dependerá de las condiciones iniciales, de la fuerza aplicada fuerza suplementaria R ~ se llama fuerza de reacción de la ligadura y ha de y de la ecuación de la superficie. R ser tal que: ~ m~¨r = F~ + R (2.40) Ahora tenemos seis incógnitas para el problema: x, y, z, Rx , Ry , Rz , en tanto hay sólo las cuatro ecuaciones siguientes: mẍ = Fx + Rx mÿ = Fy + Ry (2.41) mz̈ = Fz + Rz Φ(x, y, z) = 0 Faltan pues, dos ecuaciones adicionales. Para obtenerlas basta imponer la condición ~ no realiza trabajo al efectuarse un de que la ligadura sea ideal. Esto quiere decir que R desplazamiento virtual. Es claro que si la superficie no tiene rozamiento (idealmente ~ será siempre normal a la superficie y como δ~r debe estar sobre la superficie se suave), R ~ y ~r son perpendiculares, sigue que R ~ · δ~r = 0 R (2.42) o también, Rx δx + Ry δy + Rz δz = 0 (2.43) ~ no realiza trabajo en desplazamientos virtuales. Según la ecuación Es decir, R (2.36), δx, δy y δz no son independientes. Podemos expresar a δz en términos de δx y δy. Entonces la ecuación (2.33) puede escribirse en la forma: Rx − Rz ∂Φ/∂x ∂Φ/∂z ∂Φ/∂y δx + Ry − Rz δy = 0 ∂Φ/∂z (2.44) 18 / Mecánica clásica avanzada ~ ha de satisfacer Como δx, δy son diferentes de cero y arbitrarios, se sigue que R además las ecuaciones: ∂Φ/∂x ∂Φ/∂z Rx = Rz Ry = ∂Φ/∂y Rz ∂Φ/∂z (2.45) completándose ası́ las seis ecuaciones requeridas. Las ligaduras ideales. Se dice que las condiciones de ligadura sobre un sistema mecánico son ideales si se cumple que el trabajo realizado por las fuerzas de reacción de las ligaduras al efectuar desplazamientos virtuales de todas las partı́culas es cero: N X i=1 ~ i · δ~ri = 0 R (2.46) Las fuerzas de fricción dependen del tipo de ligadura, sin embargo para este tipo de fuerzas deben emplearse métodos que no impliquen la noción de “ligadura ideal”. “Ensambles” y desplazamientos virtuales. Entenderemos por “ensamble” a un conjunto de réplicas iguales de un sistema dinámico, donde la única diferencia entre las réplicas es la configuración, que debe ser compatible con las condiciones de ligadura, además, en estas réplicas las ligaduras están en idéntica condición; es decir, entre un sistema y otro, para un tiempo dado, las ligaduras son idénticas. Podemos imaginar las configuraciones de estos sistemas formando una red o matriz bidimensional: los elementos de las “filas” constituyen un “ensamble” y las “columnas” dan los distintos estados de un sistema cuando evoluciona el tiempo; cada fila está caracterizada por un valor del tiempo y cada columna por una configuración. Al cambiar t a un valor vecino t + dt los sistemas del ensamble experimentan desplazamientos reales (de una fila a otra). Al realizarse un desplazamiento virtual, un sistema se convierte en otro vecino (de una columna pasa a otra). Ejemplo 2.3.2 Sean dos partı́culas de masas m1 y m2 que interactúan entre sı́ a través de una varilla rı́gida sin masa. Están sometidas a una fuerza externa y en un estado de movimiento arbitrario. Se trata de mostrar que la ligadura es ideal. Todos los desplazamientos infinitesimales que no cambian la longitud de la varilla son virtuales. Las fuerzas ejercidas por la varilla sobre las partı́culas son de ligadura y dependerán del estado de movimiento y de las fuerzas aplicadas sobre las partı́culas. Por ejemplo, si rotan al rededor del centro de masa, las fuerzas de ligadura dependerán de la velocidad angular de rotación. ~1 y R ~ 2 las fuerzas ejercidas por la varilla sobre las partı́culas, y G ~1 y G ~2 Sean R las fuerzas ejercidas por las partı́culas sobre la varilla, por la tercera ley de Newton se ~ 1 = −R ~1 y G ~ 2 = −R ~ 2. cumple que G Ecuaciones generales de la estática y la dinámica / 19 ~1 y G ~ 2 podrı́an producir aceleración del centro de masa de la varilla y aceleración G angular, pero como la masa de la varilla es cero, lo mismo que el momento de inercia, ~1 + G ~ 2 = 0, lo mismo que el torque. Por lo tanto también se cumple que se sigue que G ~ ~ R1 = −R2 y como no hay torques, estos vectores estarán a lo largo de la varilla. El trabajo virtual de las fuerzas de ligadura será: ~ 1 · δ~r1 + R ~ 2 · δ~r2 = R ~ 2 · (δ~r2 − δ~r1 ) R (2.47) Si llamamos ~r = ~r2 − ~r1 , δ~r = δ~r2 − δ~r1 , entonces un desplazamiento virtual δ~r puede descomponerse en uno perpendicular a la varilla y en uno paralelo a la misma, δ~r = δ~r⊥ + δ~rk (2.48) Como la varilla es rı́gida, δ~rk → 0, luego: ~ 1 · δ~r1 + R ~ 2 · δ~r2 = R ~ 2 · δ~r = R ~ 2 · δ~r⊥ R (2.49) ~ 2 está a lo largo de la varilla, luego R ~ 1 · δ~r2 = 0 concluyéndose por tanto que la pero R ~ 1 · δ~r1 y R ~ 2 · δ~r2 no son cero por separado, pero sı́ su suma. ligadura es ideal. R 2.4. La ecuación general de la estática Sea un sistema de N partı́culas. La fuerza sobre la partı́cula i se puede descomponer (a) ~ i ). Si el en una fuerza aplicada (F~i ) y en una fuerza de reacción de las ligaduras (R sistema está en equilibrio se debe cumplir que: (a) ~ i = ~0 ; F~i = F~i + R i = 1, 2, ...N (2.50) El trabajo virtual de las F~i también será cero, N X i=1 F~i · δ~ri = N X i=1 (a) F~i · δ~ri + N X i=1 ~ i · δ~ri = 0 R (2.51) ~ i no sean nulas, será nulo el Si suponemos que las ligaduras son ideales, ası́ las R (a) trabajo virtual realizado por ellas, ecuación (2.46). Aun en el equilibrio las F~i no serán nulas, pero de (2.46) y (2.51) se sigue que el trabajo virtual de las fuerzas aplicadas debe ser cero: N X i=1 (a) F~i · δ~ri = 0 (2.52) La ecuación (2.52) se llama la ecuación general de la estática o también el principio de los trabajos virtuales. El contenido de la ecuación (2.52) es el siguiente: “para que alguna configuración del sistema, compatible con las ligaduras, sea una posición de equilibrio, es necesario y suficiente que en esa posición la suma de los trabajos virtuales de las fuerzas efectivas sea cero”. Este enunciado se llama la “regla de oro de la mecánica” y fue formulado por J. Bernoulli en 1717. 20 / Mecánica clásica avanzada La compatibilidad de los desplazamientos virtuales con las ligaduras se expresa a través de las ecuaciones (2.34). Por lo tanto los desplazamientos virtuales δ~ri en la ecuación (2.52) no serán independientes, por lo que se pueden expresar k de ellos en términos de los 3N − k restantes. Las coordenadas generalizadas independientes permiten hallar una expresión a partir de (2.52) que contenga los desplazamientos independientes e igualar a cero los coeficientes. Este procedimiento hace posible hallar la configuración de equilibrio pero no las fuerzas de ligadura. Sistema de ecuaciones de la estática. La solución de un problema de estática consiste en hallar la configuración de equilibrio (xi , zi , yi para i = 1, 2, ... N ), y las fuerzas de reacción de las ligaduras (Rxi , Ryi , Rzi para i = 1, 2, ... N ). Son seis incógnitas que se obtienen resolviendo simultáneamente las siguientes ecuaciones algebraicas: (a) ~i = 0 ; F~i + R N X i=1 i = 1, 2, ... N (2.53) ~ i · δ~ri = 0 R (2.54) fα (~r1 , ~r2 , ... ~rN ) = 0 ; α = 1, 2, ... k (2.55) (a) ~ i en la posición Como las F~i son funciones conocidas de las coordenadas, las R de equilibrio se hallan con sólo conocer dicha posición, o sea que en (2.53) son 3N ~ i . Para hallar la configuración de equilibrio basta resolver ecuaciones que determinan las R las ecuaciones: N X i=1 (a) F~i · δ~ri = 0 y fα (~r1 , ~r2 , ... ~rN ) = 0 ; α = 1, 2, ... k (2.56) Como (2.55) debe cumplirse en las configuraciones ~r1 , ~r2 , ... ~rN y ~r1 + δ~r1 , ~r2 + δ~r2 , ... ~rN + δ~rN , es cierto que: N X ∂fα i=1 ∂~ri · δ~ri = 0 ; α = 1, 2, ... k (2.57) Con lo cual es posible expresar k desplazamientos en términos de 3N − k. Escribamos el conjunto de 3N coordenadas x1 , y1 , z1 , x2 , y2 , z2 , ...xN , yN , zN , en la forma u1 , u2 , ... u3N de modo que tomamos a u1 , u2 , ... uk como k coordenadas que se pueden expresar en términos de las coordenadas uk+1 , uk+2 , ... u3N que tomaremos como (a) 3N − k coordenadas independientes. Llamaremos análogamente Fs a las componentes (a) Fus . Con estas modificaciones las ecuaciones de la estática pueden escribirse como: 3N X Fs(a) δus = 0 (2.58) s=1 fα (u1 , u2 , ... u3N ) = 0 ; 3N X ∂fα s=1 ∂us δus = 0 ; α = 1, 2, ... k (2.59) Ecuaciones generales de la estática y la dinámica / 21 Introducimos las k cantidades λ1 , λ2 , ... λk , llamadas multiplicadores indeterminados de Lagrange, de la siguiente manera: multiplicamos las ecuaciones (2.59) que relacionan los δus por λα y sumamos sobre α para obtener: 3N X k X ∂fα λα δus = 0 ∂us s=1 α=1 (2.60) Ahora sumamos (2.58) y (2.60): ! k 3N X X ∂f α δus = 0 Fs(a) + λα ∂us α=1 s=1 (2.61) Tenemos k cantidades indeterminadas, λα , que podemos escoger de tal manera que en (2.61) se anulen los coeficientes de los k desplazamientos dependientes δu1 , δu2 , ... δuk , es decir, Fs(a) + k X λα α=1 ∂fα = 0; ∂us s = 1, 2, ... k (2.62) Ahora, con (2.62), quedará (2.61) convertida en una combinación lineal igualada a cero de las cantidades linealmente independientes δuk+1 , δuk+2 , ... δu3N . Lo anterior es posible sólo si se anulan los coefientes, lo cual, junto con (2.62) conduce a: Fs(a) + k X λα α=1 ∂fα = 0; ∂us s = 1, 2, ... 3N (2.63) La ecuación general de la estática (2.58) queda convertida en las 3N ecuaciones (2.63). Ahora hay k incógnitas adicionales, o sea 3N + k en total. Pero hay 3N + k ecuaciones que son las (2.55) y las (2.63). La solución nos dará la posición de equilibrio del sistema. Las fuerzas de ligadura se hallan de cualquiera de las expresiones: Rs = −Fs(a) (u1 , u2 , ... u3N ) ; Rs = k X α=1 λα s = 1, 2, ... 3N ∂ fα (u1 , u2 , ... u3N ) ; ∂us (2.64) s = 1, 2, ...k (2.65) Ejemplo 2.4.1 Sean dos partı́culas de masas m1 y m2 , unidas por una varilla rı́gida sin masa y colocadas dentro de un cascarón esférico, en presencia de la gravedad (véase figura la 2.3). Hallar la posición de equilibrio y las fuerzas de reacción de las ligaduras. Las ecuaciones de ligadura, cuando se toma el origen de coordenadas en el centro de la esfera, son: (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − l2 = 0 x21 + y12 + z12 − a2 = 0 x22 + y22 + z22 − a2 = 0 (2.66) 22 / Mecánica clásica avanzada Donde a es el radio de la esfera y l ≤ 2a la longitud de la varilla. Tomando el eje z en la dirección vertical, las fuerzas aplicadas son: (a) F~1 = −m1 g k̂ ; (a) F~2 = −m2 g k̂ (2.67) Ecuación de equilibrio (2.58): −m1 g δz1 − m2 g δz2 = 0 (2.68) k a m 1 0 m l 2 Figura 2.3 Masas m1 y m2 unidas por una varilla rı́gida sin masa y colocadas dentro de un cascarón esférico Compatibilidad de los desplazamientos virtuales con las ligaduras: (x1 − x2 )δx1 + (x2 − x1 )δx2 + (y1 − y2 )δy1 + (y2 − y1 )δy2 + (z1 − z2 )δz1 + (z2 − z1 )δz2 = 0 (2.69) x1 δx1 + y1 δy1 + z1 δz1 = 0 x2 δx2 + y2 δy2 + z2 δz2 = 0 Las ecuaciones (2.69) indican que sólo tres desplazamientos virtuales pueden darse independientemente. Escogeremos independientes a δy1 , δy2 , δz2 y dependientes a δx1 , δx2 , δz1 . Las seis ecuaciones correspondientes a las dadas por la expresión (2.63) se obtienen usando la matriz de tres filas y seis columnas ∂fα /∂us donde α = 1, 2, 3 y Ecuaciones generales de la estática y la dinámica / 23 s = 1, 2, ... 6. α = 1, 2, 3 corresponden a las ecuaciones (2.66) respectivamente y las us corresponden a x1 , x2 , z1 , y1 , y2 , z2 respectivamente. Los elementos de la matriz ∂fα /∂us son:   a −a b c −c −b     ∂fα  x 0 z y 0 0 = (2.70) 1 1 1   ∂us   0 x2 0 0 y2 z2 donde a = x1 − x2 , b = z1 − z2 y c = y1 − y2 . Las ecuaciones (2.63) serán: 0 + λ1 (x1 − x2 ) + λ2 x1 + 0 = 0 (2.71) 0 + λ1 (x2 − x1 ) + 0 + λ3 x2 = 0 (2.72) −m1 g + λ1 (z1 − z2 ) + λ2 z1 + 0 = 0 (2.73) 0 + λ1 (y1 − y2 ) + λ2 y1 + 0 = 0 (2.74) 0 + λ1 (y2 − y1 ) + 0 + λ3 y2 = 0 (2.75) −m2 g + λ1 (z2 − z1 ) + 0 + λ3 z2 = 0 (2.76) De (2.71), (2.72) y (2.73) obtenemos para λ1 , λ2 , λ3 : λ1 = m1 g x1 ; x2 z1 − x1 z2 λ2 = m1 g x2 − x1 x2 z1 − x1 z2 x1 x1 − x2 λ3 = m1 g x2 x2 z1 − x1 z2 (2.77) Reemplazando a (2.77) en (2.74), (2.75) y (2.76), obtenemos: x2 y1 − x1 y2 = 0; x2 z1 − x1 z2 x1 x2 y1 − x1 y2 =0 x2 x2 z1 − x1 z2 x1 x2 z1 − x1 z2 m2 + =0 m1 x2 x2 z1 − x1 z2 (2.78) Si se cumple que x2 z1 − x1 z2 = 0, las ecuaciones (2.78) se convierten en: x2 y1 − x1 y2 = 0; x2 z1 − x1 z2 = 0 (2.79) La otra posibilidad es que x2 z1 − x1 z2 no sea cero. En este caso, de (2.78) salen las dos relaciones diferentes: x1 m2 x1 y2 = x2 y1 ; =− (2.80) x2 m1 La solución (2.79) no tiene sentido pues implica: ~r1 × r~2 = (y1 z2 − z1 y2 )î − (x1 z2 − z1 x2 )ĵ + (x1 y2 − x2 y1 )k̂ = 0 (2.81) 24 / Mecánica clásica avanzada O sea que los vectores de posición de las partı́culas son paralelos, independientemente de las masas y la longitud de la varilla. Esta solución podrı́a ser aceptable en los casos lı́mites en que l = 0 o l = 2a. La solución (2.80) da:1 y1 m2 =− ; y2 m1 x1 m2 =− x2 m1 (2.82) Las relaciones (2.82) implican que el centro de masa se encuentra siempre sobre el eje z. Las ecuaciones de ligadura se pueden escribir como: 2a2 − 2x1 x2 − 2y1 y2 − 2z1 z2 − l2 = 0 (2.83) x21 + y12 + z12 − a2 = 0 (2.84) x22 + y22 + z22 − a2 = 0 (2.85) De reemplazar (2.82) en (2.83) obtenemos: 2a2 + 2 m2 2 m2 2 x +2 y − 2z1 z2 − l2 = 0 m1 2 m1 2 Usando (2.84) y (2.85) podemos escribir a (2.86) como: s 2 m m2 2 2 2 2 2 a − z2 − 2z2 a − (a2 − z22 ) − l2 = 0 2a + 2 m1 m1 Despejando en (2.87) a (a2 − z2 2 ) obtenemos luego para z22 : 2 m2 l2 2 1+ a − m1 2 z22 = 2 m2 2 m2 l a2 − 1+ m1 m1 z1 se obtiene de (2.74), (2.84) y (2.85): 2 m2 2 2 a − z1 = a2 − z22 m1 Lo cual conduce a: 2 m2 l 2 m2 2 a − 1+ m1 m1 2 z22 = 2 m1 m1 2 l 1+ a2 − m1 m1 (2.86) (2.87) (2.88) (2.89) (2.90) Se ve fácilmente que al intercambiar las partı́culas, o sea en (2.88) al reemplazar m2 por m1 y viceversa se obtiene (2.90). 1 En (2.77) resulta entonces que las λ son infinitas, o sea que las fuerzas de ligadura son infinitas. Ecuaciones generales de la estática y la dinámica / 25 Las ecuaciones (2.82) nos indican que: y1 y2 = x1 x2 (2.91) Observando la proyección de las partı́culas sobre el plano xy, vemos que la varilla debe cortar el eje z, lo cual está de acuerdo con el hecho de que el centro de masa está sobre el eje z en la posición de equilibrio. Lo anterior nos dice que la proyección de la varilla sobre el plano xy es una lı́nea recta que pasa por el origen. Debido a que de las tres ecuaciones (2.78) sólo se obtienen dos relaciones independientes, vemos que habrá una indeterminación en los valores de x1 y y1 (y correspondientemente de x2 , y2 ), lo cual es debido a la simetrı́a del problema bajo rotaciones en el eje z. Podemos determinar solamente a ax21 + y12 y ax22 + y22 : y m 1 ϕ2 ϕ1 x m 2 Figura 2.4 Proyección de las partı́culas m1 y m2 sobre el plano xy x22 + y22 = x21 + y12 = l2 l 2 a2 − 4 2 m2 m2 2 a2 1 + l − m1 m1 m2 m1 2 (2.92) (x22 + y22 ) De (2.86) y (2.68) obtenemos la siguiente expresión que nos permite analizar los signos de z1 y z2 : 2 m2 l4 m1 l2 1+ + a2 a2 − 2 m1 m2 4 z1 z2 = 2 m2 m1 a2 1 + − l2 m1 m2 (2.93) 26 / Mecánica clásica avanzada Supongamos que l = 2a, con m1 6= m2 . Entonces, z1 z2 = −a2 (2.94) De tal forma que (2.88), (2.90) y (2.83) a (2.85) dan z12 = z22 = a2 . Hay para este caso, pues, dos soluciones posibles: z1 = a, z2 = −a o z1 = −a, z2 = a, que corresponden a la varilla vertical. Si además m1 = m2 , (2.88), (2.89) y (2.90) conducen a valores indeterminados de z1 y z2 : cualquier posición es de equilibrio, lo cual está de acuerdo con que el centro de masa está en O para todas las posiciones de la varilla. Para m1 = m2 , con l arbitrario, se obtiene de (2.88), (2.89) y (2.90): z12 = z22 = a2 − l2 4 (2.95) y de (2.93) se obtiene: z 1 z 2 = a2 − l2 4 (2.96) que indica que z1 y z2 deben tener el mismo signo. Las condiciones de ligadura no contienen información acerca de si las partı́culas están dentro del cascarón o pegadas a él (pudiendo moverse sin fricción); por esto (2.96) admite dos soluciones: z1 = z2 = a2 − l2 /4 o z1 = z2 = −(a2 − l2 /4). Es claro que la segunda solución es la única aceptable cuando las partı́culas están colocadas simplemente dentro del cascarón. La posición del centro de masa en un caso general es: zCM = m1 z 1 + m2 z 2 = m1 + m2 m2 m2 m2 l 2 l2 2 2 ±m1 1 + ± m2 1 + a − a − m1 m 2 m1 2 s1 2 m2 2 m2 l a2 − 1+ (m1 + m2 ) m1 m1 (2.97) Es claro que cuando las partı́culas están dentro del cascarón debe excluirse la solución en que z1 y z2 tienen ambas signos positivos. Las otras soluciones son: Para z1 > 0 , z2 < 0: m2 1− a2 m1 zCM = s (2.98) 2 m m2 2 2 l a2 − 1+ m1 m1 Para z1 < 0 , z2 > 0: m2 − 1 a2 m1 zCM = s 2 m2 m2 2 1+ l a2 − m1 m1 (2.99) Ecuaciones generales de la estática y la dinámica / 27 Para z1 < 0 , z2 > 0: zCM m1 =− m1 + m2 s m2 1+ m1 2 a2 − m2 2 l m1 (2.100) Las ecuaciones (2.98), (2.99) y (2.100) serán la expresión correcta para zCM dependiendo del signo de z1 z2 en la ecuación (2.93). Estas ecuaciones pueden también escribirse como: zCM = zCM = m1 − m2 r m1 + m2 a2 − m2 − m1 r m1 + m2 a2 − zCM = − r a2 − a2 (2.101) 1 m1 m2 2 l m1 + m2 m1 + m2 a2 (2.102) 1 m1 m2 2 l m1 + m2 m1 + m2 1 m1 m2 2 l m1 + m2 m1 + m2 (2.103) Cuando p m1 = m2 sólo es válida (2.103). En ese caso, como es de esperarse zCM = z1 = z2 = − a2 − l2 /4. En general (2.101) y (2.102) sólo serán válidas cuando se cumple una de las desigualdades siguientes: m1 m2 a2 o l 2 > 2 1 + a2 (2.104) l2 > 2 1 + m1 m2 Para el cálculo de las fuerzas de reacción de las ligaduras se requiere evaluar los λα . Los denominadores en las ecuaciones (2.77) se calculan usando las ecuaciones (2.80): x2 m1 −z2 + z1 (2.105) = −zCM 1 + x1 m2 Con lo cual las ecuaciones (2.77) nos dan: λ1 = − m1 m2 g ; m1 + m2 zCM λ2 = m2 g ; zCM λ3 = m2 g zCM (2.106) De acuerdo con (2.65), (2.71) a (2.76), se puede hallar la contribución de cada ligadura a las fuerzas de reacción de las ligaduras. λ1 está asociada a la fuerza ejercida por la varilla sobre las partı́culas, λ2 a la fuerza ejercida por el cascarón sobre la partı́cula de masa m1 y λ3 a la fuerza ejercida por el cascarón sobre la partı́cula de masa m2 . Estas fuerzas, en forma vectorial, son respectivamente: λ1 (~r1 − ~r2 ); λ1 (~r2 − ~r1 ); λ2~r1 ; λ3~r2 (2.107) La fuerza total, de la varilla y el cascarón, sobre la partı́cula de masa m1 y sobre la de masa m2 respectivamente es: (λ1 + λ2 )~r1 − λ1~r; (λ1 + λ3 )~r2 − λ1~r1 (2.108) 28 / Mecánica clásica avanzada Utilizando las expresiones para los λα , las fuerzas ejercidas separadamente por la varilla y el cascarón sobre las partı́culas de masas m1 y m2 respectivamente, son: m1 m2 g ~r1 − ~r2 ; m1 + m2 zCM m1 m2 g ~r1 − ~r2 ; m1 + m2 zCM m1 g ~r1 ; zCM m2 g ~r2 zCM (2.109) Por ejemplo, tomemos la solución de equilibrio estable cuando l = 2a y m1 > m2 : x1 = x2 = y1 = y2 = 0, z1 = −a, z2 = a. En este caso r~1 = −ak̂, r~2 = ak̂, ~r1 − ~r2 = −2ak̂ y zCM será: m1 − m2 zCM = − a (2.110) m1 + m2 Las fuerzas ejercidas sobre m1 por la varilla y el cascarón respectivamente son: −2aλ1 k̂ = − 2m1 m2 g k̂ m1 − m2 y − aλ2 k̂ = m1 (m1 + m2 ) g k̂ m1 − m2 (2.111) Las fuerzas sobre la partı́cula de masa m2 son: 2aλ1 k̂ = 2m1 m2 g k̂ m1 − m2 y aλ3 k̂ = m2 (m1 + m2 ) g k̂ m1 − m2 (2.112) Las ecuaciones (2.111) y (2.112) nos dicen que la fuerza ejercida por el cascarón sobre m2 no es cero y que la fuerza ejercida por el cascarón sobre m2 es diferente de (m1 + m2 )g, lo cual contradice nuestra idea intuitiva de que las partı́culas están “colocadas” dentro del cascarón (véase figura 2.3). El resultado que acabamos de obtener nos dice que las partı́culas están “agarradas” del cascarón de alguna manera. Esto nos ilustra una propiedad de las ecuaciones de ligadura del tipo (2.88), (2.89), (2.90), o sea de las ligaduras holónomas bilaterales: las fuerzas de ligadura asociadas a las ligaduras bilaterales se pueden ejercer en dos direcciones. Por esto en la parte más alta del cascarón, ecuación (2.112), éste ejerce sobre la partı́cula de masa m2 una fuerza en la dirección z negativa. La fuerza total sobre m1 y la fuerza total sobre m2 , usando las ecuaciones (2.100) y (2.106), son respectivamente: m1 g ~ CM R ; zCM m2 g ~ CM R zCM (2.113) Cuando l = 2a, la fuerza neta ejercida por las ligaduras sobre m1 es m1 g k̂ y sobre m2 es m2 g k̂. Es decir, las ligaduras ejercen sobre cada partı́cula una fuerza que contrarresta su peso, como debe ser cuando las partı́culas están “agarradas” al cascarón. El estudio del caso en que las partı́culas están simplemente “colocadas” en el cascarón requiere reemplazar (2.66) por dos condiciones de ligadura unilaterales: r1 ≤ a, r2 ≤ a. La solución se obtiene fácilmente a partir de la hallada cuando las ligaduras son bilaterales. 2.5. Las ecuaciones de la estática en coordenadas generalizadas Las ligaduras hacen que los desplazamientos virtuales de las partı́culas (δx1 , δy1 , δz1 ; ... δxn , δyn , δzn ) no sean todos independientes. Por esto en la ecuación general de Ecuaciones generales de la estática y la dinámica / 29 la estática, ecuaciones (2.52) y (2.58), no se tienen combinaciones lineales de cantidades linealmente independientes y los coeficientes de los desplazamientos no se anulan. Si introducimos las coordenadas generalizadas independientes (q), para lo cual es necesario que el sistema sea holónomo, mediante las ecuaciones de transformación (2.21), podemos expresar los δ~ri en términos de los δqν : δ~ri = l X ∂~ri δqν ∂q ν ν=1 (2.114) donde l es el número de grados de libertad; l = 3N − k, con k = h, puesto que en estática no hay ligaduras no holónomas. Entonces la ecuación (2.52) toma la forma: ! l N N l X X X X ∂~ r ∂~ r i i (a) (a) F~i · F~i · δqν = 0 (2.115) δqν = ∂qν ∂qν ν=1 ν=1 i=1 i=1 En la ecuación (2.115) se tiene una combinación lineal de los desplazamientos virtuales independientes δqν igualada a cero. Por esto se debe cumplir que: Q(a) ν ≡ (a) N X ri (a) ∂~ = 0; F~i · ∂q ν i=1 ν = 1, 2, ... l (2.116) Qν se denomina la fuerza generalizada asociada al grado de libertad qν . En coor(a) denadas generalizadas las condiciones de equilibrio son Qν = 0 para ν = 1, 2, ... l, que proporciona un sistema de l ecuaciones algebraicas simultáneas con las l incógnitas q1 , q2 , ... ql que son las coordenadas generalizadas en la posición de equilibrio. En cuanto a las fuerzas de ligadura, de la ecuación (2.50) se sigue que la fuerza de reacción de las ligaduras asociada al grado de libertad qν también es cero: Eν = N X N X ∂~ri ~ i . ∂~ri = − R F~i (a) · ∂qν ∂qν i=1 i=1 ν = 1, 2, ... l (2.117) Se sigue de (2.117) que sólo serán diferentes de cero las fuerzas asociadas a las 3N − l = k coordenadas “superfluas”. Como en coordenadas generalizadas desaparecen las ecuaciones de ligadura, se sigue que las fuerzas de ligadura también se anulan, de acuerdo con la idea de que en el espacio de configuración no euclidiano, definido por las coordenadas generalizadas, el efecto de las ligaduras es asociado con la propiedad geométrica de “curvatura del espacio”. Fuerzas derivables de un potencial. Si las fuerzas aplicadas se pueden obtener a partir de una función V (~ rl , r~2 , ... ~rN , t) en la forma: ∂V (a) ; F~i = − ∂~ri i = 1, 2, ... N (2.118) Las condiciones de equilibrio en coordenadas generalizadas son, para este caso: Q(a) ν =− N X ∂V i=1 ∂~ri · ∂~ri ∂V =− ; ∂qν ∂qν i = 1, 2, ... l (2.119) 30 / Mecánica clásica avanzada Las ecuaciones (2.119) dicen que la posición de equilibrio estática es aquella para la cual la función de energı́a potencial tiene un mı́nimo o un máximo respecto a todas las coordenadas generalizadas. Sin definir estrictamente la estabilidad de un sistema, podemos decir que un mı́nimo en V corresponde a equilibrio estable, y un máximo a equilibrio inestable; las condiciones rigurosas de estabilidad están dadas por el teorema de Lagrange y los teoremas de Liapunov y Chetayev (véase el capı́tulo 5 del libro Lectures in analytical mechanics de Gantmacher). A manera de ilustración, consideraremos una partı́cula colocada sobre una esfera de radio a que puede variar con el tiempo. Las coordenadas generalizadas pueden tomarse como θ, φ, de acuerdo con la ecuación (2.24). A las fuerzas aplicadas se les pueden asociar las fuerzas generalizadas Qθ , Qφ . La condición de equilibrio es Qθ = Qφ = 0, o sea que no haya torques externos en las direcciones de θ y φ. En el equilibrio, la partı́cula se moverá sobre la superficie de la esfera sin aceleración o permanecerá en reposo respecto a la misma. Con coordenadas generalizadas no es posible obtener la fuerza de ligadura en la dirección radial. Ejemplo 2.5.1 Hallar la configuración de equilibrio para el problema del ejemplo 2.4.1 en coordenadas generalizadas. La figura 2.5 muestra una configuración general del sistema. Se requiere hallar tres parámetros independientes compatibles con las ligaduras y expresar en términos de ellos las coordenadas de las partı́culas. Luego, hallar las fuerzas generalizadas asociadas a esos parámetros. La configuración de equilibrio estará dada por los valores de los parámetros que anulan las fuerzas generalizadas. Las coordenadas generalizadas serán tres parámetros que ubican la posición del triángulo rı́gido: 012. Como el vector de posición del centro de masa ~rCM es fijo respecto al triángulo 012, dos parámetros podrı́an ser φCM , θCM y el tercer parámetro serı́a un ángulo de rotación del triángulo alrededor de ~rCM . Sin embargo, resultan más convenientes los tres ángulos de Euler que determinan la ubicación de un sistema de coordenadas cartesianas x′ , y ′ , z ′ , fijo al triángulo, respecto al sistema de coordenadas espacial x, y, z. Los ángulos de Euler permiten mediante tres rotaciones sucesivas obtener los ejes x′ , y ′ , z ′ a partir de los ejes x, y, z: primero se rota alrededor del eje z por un ángulo φ, con lo cual el eje x pasa a ser cierto eje ξ; luego se rota alrededor del eje ξ por un ángulo θ, con lo cual z pasará a ser cierto eje ξ ′ ; luego se rota alrededor del eje ξ ′ por un ángulo ψ, con lo cual se obtendrá la posición final de los ejes x′ , y ′ , z ′ . La figura 2.6 muestra estas tres rotaciones. La figura 2.7 muestra la ubicación del triángulo mediante los ángulos de Euler φ, θ, ψ. Se escoge el eje z ′ a lo largo de la lı́nea que une a O con el centro de masa, y ′ perpendicular a 0−CM en el plano del triángulo, y x′ perpendicular al plano del triángulo. Las coordenadas de las partı́culas respecto a los ejes x′ , y ′ , z ′ son: x′1 = 0 y1′ = −a sen z1′ = a cos β −α 2 β −α 2 x′2 = 0 y2′ = a sen z2′ = a cos β +α 2 β +α 2 (2.120) Ecuaciones generales de la estática y la dinámica / 31 z 2 l 1 θ2 θ1 r1 r2 y ϕ2 ϕ1 x Figura 2.5 Configuración de equilibrio del sistema de dos masas unidas por una varilla rı́gida (del ejemplo 2.4.1) ζ′ z,ζ z θ z zi ′ θ yi′ η′ η x ϕ x ζ y y y x ϕ ϕ ψ xi′ ζ′ Figura 2.6 Los ángulos de Euler φ, θ y ψ Llamando ~rm la posición del punto medio de la varilla, obtenemos la siguiente expresión que relaciona a cos α con cos β: ~rCM · ~rm = a2 (1 + cos β) = rCM rm cos α 2 (2.121) 32 / Mecánica clásica avanzada z zi ′ 2 z i′ 1 y i′ × CM 2 × CM 1 α θ a y β 0 a xi′ ϕ y i′ ψ 0 x Figura 2.7 Ubicación del triángulo mediante los ángulos de Euler De la definición de ~rCM y de la geometrı́a se sigue que: s l2 m1 m2 rCM = a 1 − 2 (m1 + m2 ) a2 rm = a r 1− l2 4a2 l2 cos β = 1 − 2 ; 2a (2.122) (2.123) β l sen = ; 2 2a β cos = 2 r 1− l2 4a2 (2.124) Usando (2.122), (2.123) y (2.124) se obtienen de (2.121) las siguientes expresiones para senα y cos α: sen α = l m1 − m2 s 2a m1 + m2 1− v u u u cos α = u u t 1 m1 m2 l2 (m1 + m2 )2 a2 l2 1− 2 4a m1 m2 l2 1− 2 (m1 + m2 ) a2 (2.125) De (2.120), (2.124) y (2.125) se deducen las siguientes expresiones para las coordenadas de las partı́culas respecto a los ejes x′ , y ′ y z ′ : x′1 = x′2 = 0 (2.126) Ecuaciones generales de la estática y la dinámica / 33 v u u m2 u u ′ y1 = −l u m1 + m2 t l2 4a2 m1 m2 l2 1− 2 (m1 + m2 ) a2 1− l2 m2 1− 2 2a m1 + m2 ′ z1 = a s m1 m2 l2 1− (m1 + m2 )2 a2 v u l2 u u 1− 2 m 1 u 4a y2′ = l u m1 + m2 t m1 m2 l2 1− 2 (m1 + m2 ) a2 m1 l2 1− 2 4a m1 + m2 ′ z2 = a s l2 m1 m2 1− (m1 + m2 )2 a2 (2.127) (2.128) (2.129) (2.130) Definamos las variables c = cos ψ, c′ = cosφ, c′′ = cos θ, s = senψ, s′ = senφ y s = senθ. Las ecuaciones de transformación del sistema de coordenadas x′ , y ′ , z ′ al sistema de coordenadas x, y, z son las siguientes [ver (2.118)]:   x      y =     z (2.131)   ′  c c′ − s s′ c′′ −s c′ − c′′ s′ c s′′ s′ x        c s′ + c′′ c′ s −s s′ + c′′ c′ c −s′′ c′   y ′        s′′ s s′′ c c′′ z′ ′′ Como las componentes del vector de posición del centro de masa en los ejes x′ , y ′ , z son: ′ ′ x′CM = yCM = 0; ′ = rCM , zCM (2.132) se deduce de (2.131) que respecto a los ejes x, y, z las coordenadas del centro de masa son: xCM = rCM senθ senφ yCM = −rCM senθ cos φ zCN = rCM cos θ (2.133) 34 / Mecánica clásica avanzada Las fuerzas generalizadas se obtienen usando las ecuaciones (2.67) y (2.116): Qν = −m1 g ∂z1 ∂z2 ∂zCM − m2 g = −g(m1 + m2 ) ∂qν ∂qν ∂qν (2.134) donde en este caso tomanos q1 = φ, q2 = θ, q3 = ψ. De (2.133) y (2.134) se sigue inmediatamente que: Qφ ≡0 Qψ ≡0 Qθ = (m1 + m2 )grCM senθ (2.135) Las condiciones de equilibrio son Qν = 0, lo cual da las siguientes ecuaciones: 0 = 0, 0 = 0, senθ = 0 (2.136) Se sigue de (2.136) que las configuraciones de equilibrio son aquellas para las cuales θ = 0 o θ = π, donde φ y ψ pueden tomar cualquier valor. Como para θ = 0 y θ = π, φ y ψ están en el mismo plano, realmente sólo hay un ángulo arbitrario: todas las configuraciones que se obtienen por rotar alrededor del vector de posición del centro de masa son de equilibrio, donde el centro de masa está sobre el eje z. Las configuraciones de equilibrio respecto a los ejes x, y, z se obtienen de (2.131) con ψ y φ arbitrarios:     ′  x cos(ψ ± φ) −sen(ψ ± φ) 0 x          ′   y  =  sen(φ ± ψ) cos(φ ± ψ)   0  y  (2.137)          z 0 0 ±1 z′ Donde el signo superior se refiere al caso en que θ = 0 y el inferior a φ = π. Explı́citamente (2.137) da: x = x′ cos(ψ ± φ) − y ′ sen(ψ ± φ) y = x′ sen(φ ± ψ) + y ′ cos(φ ± ψ) z = ±z ′ (2.138) en concordancia con lo dicho anteriormente. En la configuración de equilibrio estable, θ = π, las coordenadas de las partı́culas, de acuerdo con (2.138) y (2.126) a (2.130), son: m2 l2 1− 2 2a m1 + m2 ; z1 = −a s m1 m2 l2 1− (m1 + m2 )2 a2 m1 l2 1− 2 2a m1 + m2 z2 = −a s m1 m2 l2 1− (m1 + m2 )2 a2 (2.139) de acuerdo con los resultados obtenidos anteriormente [ecuaciones (2.88) y (2.90)]. Los resultados (2.80) también se obtienen directamente de (2.138). Ecuaciones generales de la estática y la dinámica / 35 2.6. La ecuación general de la dinámica Si un sistema no está en equilibrio, la fuerza neta sobre cada una de las partı́culas no es cero sino, de acuerdo con la segunda ley de Newton, es igual al producto de su masa por su aceleración: (a) ~ i = mi~¨ri ; F~i = F~i + R i = 1, 2, ...N (2.140) Debido a que consideramos ligaduras ideales, que no realizan trabajo sobre el sistema como un todo al desplazar virtualmente todas las partı́culas, se sigue que: n X i=1 (a) F~i − mi~¨r i · δ~ri = 0 (2.141) (a) La cantidad F~i − mi~¨r i ·δ~ri no es cero, pero su suma sı́ lo es. La fórmula (2.141) se llama la ecuación general de la dinámica o también el principio de D’alembert. Esta ecuación establece lo siguiente: “en todo instante en un sistema dinámico la suma de (a) las fuerzas efectivas F~i y de las fuerzas de inercia −mi~rï no realiza trabajo al efectuar desplazamientos virtuales del sistema”, o más en general establece que: “la ecuación general de la dinámica expresa una condición necesaria y suficiente para que un movimiento compatible con las ligaduras sea a la vez compatible con las fuerzas aplicadas”. Esta ecuación es aplicable a cualquier sistema ideal, holónomo o no holónomo. Como hay 3N − k desplazamientos virtuales independientes, la ecuación general de la dinámica proporciona 3N − k ecuaciones, al igualar a cero los coeficientes de los desplazamientos virtuales independientes, que junto con las k ecuaciones de ligadura constituye un sistema de 3N ecuaciones con 3N incógnitas. Esta vez, a diferencia del caso estático, las ecuaciones no serán algebraicas sino diferenciales. (a) (a+f ) = F~i − mi~rï la ecuación (2.141) queda ası́: Si llamamos F~i N X i=1 (a+f ) · δ~ri = 0 F~i (2.142) o sea que la ecuación general de la dinámica toma la misma forma de la ecuación general de la estática. Esta ecuación puede interpretarse como una ecuación para caracterizar en cada instante del tiempo la posición de equilibrio del sistema donde a las fuerzas (a) efectivas F~i se les adicionan las fuerzas ficticias o inerciales −mi~¨r i . Más precisamente, el principio de D’alembert (1760) dice: “cualquier posición de un sistema dinámico puede considerarse como una posición de equilibrio instantáneo si a las fuerzas aplicadas que actúan sobre el sistema se agregan las fuerzas ficticias o de inercia”. La regla de oro de J. Bernoulli queda aplicable también en la dinámica. A −mi~¨r i se llama fuerza inercial de D’alembert. En el problema estático asociado, las fuerzas de reacción de las ligaduras coinciden con las del problema original, dinámico. Ejemplo 2.6.1 Sea un recipiente lleno de agua que se mueve con una aceleración ~a perpendicular a la fuerza de gravedad (véase figura 2.8). Hallar la forma y la posición de la superficie del agua. 36 / Mecánica clásica avanzada Cuando ~a = 0, la única fuerza aplicada sobre cada elemento de volumen es la de gravedad; las fuerzas ejercidas por el resto del lı́quido pueden asumirse como de reacción. La forma de la superficie en el caso estático es plana y horizontal, perpendicular a la fuerza aplicada. dm –dma a ϕ ϕ F ( a) = –dmgk Figura 2.8 Diagrama de fuerzas ejercidas sobre el elemento de masa dm En el caso dinámico, a cada elemento de masa dm se le aplica adicionalmente una fuerza ficticia −dm ~a. La superficie del agua será ahora un plano perpendicular a la fuerza F~ (a+f ) . La inclinación de la superficie estará dada por: tan φ = a g (2.143) Ejemplo 2.6.2 Sean dos partı́culas en un doble plano inclinado, unidas por una cuerda inextensible sin masa (véase figura 2.9). Hallar la condición de equilibrio. Resolver el problema dinámico. Las ligaduras son: z1 = 0 z2 = 0 y1 = x1 tan α1 y2 = −x2 tan α2 (2.144) p p x21 + y12 + x22 + y22 = l Ecuaciones generales de la estática y la dinámica / 37 y α2 z α1 m m1 2 α2 α1 Figura 2.9 Dos partı́culas en un doble plano inclinado, unidas por una cuerda inextensible sin masa. Hay sólo un grado de libertad. Los desplazamientos virtuales son a lo largo de los planos, como los desplazamientos reales. El principio de los trabajos virtuales nos conduce a: −m1 g ĵ · δ~r1 − m2 g ĵ · δ~r2 = 0 (2.145) −m1 tan α δx1 + m2 tan α2 δx2 = 0 (2.146) es decir: De la condición de ligadura impuesta por la cuerda se obtiene: δx1 = cos α1 δx2 cos α2 (2.147) Con lo cual la ecuación de equilibrio queda ası́: cos α1 −m1 tan α1 + tan α2 δx2 = 0 cos α2 (2.148) Como δx2 es arbitrario, se obtiene que: m1 senα1 = m2 senα2 (2.149) O sea que cuando los ángulos y las masas sean tales que se cumple la anterior condición, el sistema estará en equilibrio en cualquier posición. Para el caso dinámico, o sea cuando m1 senα1 6= m2 senα1 , aplicamos la ecuación general de la dinámica: (m1~g − m1~a1 ) · δ~r1 + (m2~g − m2~a2 ) · δ~r2 = 0 (2.150) Las aceleraciones deben ser compatibles con las ligaduras, con lo cual se obtienen las siguientes relaciones: a1x = a2x cos α1 ; cos α2 a1y = a1x tan α1 ; a2y = −a2x tan α2 (2.151) 38 / Mecánica clásica avanzada Además, entre los desplazamientos virtuales hay estas tres relaciones: cos α2 senα2 δy1 = δx1 tan α1 ; δx2 = δx1 ; δy2 = −δx1 cos α1 cos α1 (2.152) Al expresar en la ecuación general de la dinámica todas las componentes de las aceleraciones en términos de a1x y todos los desplazamientos virtuales en términos de δx1 , obtenemos: " senα2 − m1 g tan α1 + m2 g senα1 (2.153) # −(m1 sec2 α1 + m2 sec2 α1 ) a1 x δx1 = 0 Con lo cual se obtiene a a1x y por consiguiente a a1y . La magnitud de ~a1 será: a1 = |m1 g senα1 − m2 g senα2 | m1 + m2 (2.154) La aceleración a2 tiene igual magnitud. Las componentes x de las aceleraciones son iguales y de signos contrarios. Sistema de ecuaciones de la dinámica. Para sistemas holónomos, el principio de D’alembert permite usar los resultados obtenidos en el caso estático. Las ecuaciones (a) (2.63) nos permiten obtener las ecuaciones de movimiento con sólo reemplazar a F~i (a) por F~i − mi~¨r i : (a) F~i − mi~¨r i + N X λα α=1 ∂fα =0 ∂~ri (2.155) Para un sistema no holónomo, además de lo anterior, los desplazamientos virtuales deben satisfacer las relaciones (2.33): N X i=1 ~lα · δ~ri = 0 ; i α = 1, 2, ... n (2.156) Debemos entonces introducir los multiplicadores de Lagrange adicionales µ1 , µ2 , ...µn , que escogeremos de modo que se anulen los coeficientes de los n desplazamientos dependientes adicionales. Para ello, multiplicamos (2.33) por µα y sumamos sobre α: N X n X i=1 α=1 µα ~lαi · δ~ri = 0 (2.157) Claramente se ve que en este caso las ecuaciones de movimiento tomarán la siguiente expresión: (a) mi~rï = F~i + h X α=1 n λα ∂fα X ~ + µα lαi ; ∂~ri α=1 i = 1, 2, ... N (2.158) Ecuaciones generales de la estática y la dinámica / 39 Estas 3N ecuaciones contienen las 3N + n + h incógnitas ~r1 , ~r2 , ... ~rN , λ1 , λ2 , ...λh , µ1 , µ2 , ...µn que junto con las n + h condiciones de ligadura (2.11) y (2.15) nos dan 3N + n + h ecuaciones con 3N + n + h incógnitas. Esta vez las ecuaciones serán diferenciales acopladas. Las fuerzas de ligadura estarán dadas por: ~i = R h X α=1 n λα ∂fα X ~ + µα lαi ; ∂~ri α=1 i = 1, 2, ... N (2.159) Las ecuaciones (2.158) se llaman ecuaciones de Lagrange de la primera clase y fueron dadas por Lagrange en el año de 1788. La ecuación (2.159) nos permite obtener la contribución de cada ligadura a las fuerzas de reacción de las ligaduras. Este formalismo es aplicable a cualquier sistema mecánico con ligaduras ideales, holónomo o no holónomo, sometido a fuerzas conservativas o no conservativas. Ejemplo 2.6.3 Sea un alambre largo, rı́gido, que gira uniformemente alrededor de un eje perpendicular a él. Una bolita se desliza en el alambre sin fricción. No hay fuerzas aplicadas (véase figura 2.10). Hallar la trayectoria de la partı́cula y las fuerzas de reacción de la ligadura. Elegimos las coordenadas de modo que el alambre permanece en el plano x − y. La ecuación de ligadura es: tan ωt x − y = 0 (2.160) y m ωt 0 x Figura 2.10 Alambre largo y rı́gido que gira uniformemente alrededor de un eje perpendicular a él. La masa m se desliza sobre él sin fricción. Las ecuaciones (2.158) y (2.159) para este caso son: mẍ = λ tan ωt (2.161) mÿ = −λ (2.162) Rx = λ tan ωt ; R − y = −λ (2.163) 40 / Mecánica clásica avanzada La ecuación de ligadura nos proporciona la siguiente ecuación diferencial, que junto con (2.161) y (2.162) nos permite obtener a x, y, λ: ÿ = ẍ tan ωt + 2ẋω sec2 ωt + 2ω 2 x sec2 ωt tan ωt (2.164) La ecuación diferencial para x es: ẍ + 2ω ẋ tan ωt + 2ω 2 x tan2 ωt = 0 (2.165) Haciendo la sustitución x = u cos ωt obtenemos la siguiente ecuación diferencial para u: ü − ω 2 u = 0 (2.166) Con lo cual la solución para x, y, λ es: x = A cosh ωt cos ωt (2.167) y = A cosh ωt senωt (2.168) λ = −2Amω 2 senhωt cos ωt (2.169) Las componentes de la fuerza de reacción de la ligadura son: Rx = −2Amω 2 senhωt senωt ; Ry = 2Amω 2 senhωt cos ωt (2.170) ~ con el eje x está dado por: El ángulo de R Ry = cot ωt Rx (2.171) ~ es siempre perpendicular al alambre y su magnitud es R = 2Amω 2 senhωt. o sea que R 2.7. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas holónomos Al introducir las coordenadas generalizadas independientes las ecuaciones de ligadura se satisfacen idénticamente. El paso a coordenadas generalizadas de la ecuación general de la dinámica se puede realizar en forma análoga al caso de la estática en virtud del principio de D’alembert. De acuerdo con las ecuaciones (2.142) y (2.116) las ecuaciones de movimiento en coordenadas generalizadas son: ) Q(a+f = ν N X ri (a+f ) ∂~ = 0; · F~i ∂qν i=1 ν = 1, 2, ... l (2.172) o, más explı́citamente, N ∂~r X i (a) = 0; F~i − mi~¨r i · ∂q ν i=1 ν = 1, 2, ... l (2.173) Ecuaciones generales de la estática y la dinámica / 41 Definimos la fuerza generalizada aplicada asociada al grado de libertad ν por: Q(a) ν = N X ri (a) ∂~ F~i · ∂qν i=1 (2.174) La fuerza generalizada asociada correspondiente a la fuerza de inercia se puede relacionar con la energı́a cinética de la siguiente manera: ) Q(f ν = = N X d~r˙i ∂~ri · dt ∂qν i=1 N X d ˙ ∂~ri d ∂~ri ˙ − mi ~ri · − mi~ri · dt ∂qν dt ∂qν − mi (2.175) i=1 Podemos expresar en (2.175) a ∂~ri /∂qν y su derivada temporal en términos de derivadas respecto a ~r˙ i . Para ello partimos de la siguiente expresión para ~r˙ i : ~r˙ i = l X ∂~ri ∂~ri q̇µ + ∂q ∂t µ µ=1 (2.176) mediante la cual obtenemos: ∂~ri ∂~r˙i = ; ∂ q̇ν ∂qν l X ∂ 2~ri d ∂~ri ∂ 2~ri = q̇µ + dt ∂qν ∂qµ ∂qν ∂t∂qν µ=1 (2.177) Por otra parte tenemos que: l X ∂~r˙ i ∂ d~ri ∂ 2~ri ∂ 2~ri = q̇µ + = ∂qν ∂qν dt ∂qν ∂qµ ∂qν ∂t µ=1 (2.178) De (2.177) y (2.178) se sigue entonces que: ∂~r˙i ∂~ri = ; ∂ q̇ν ∂qν d ∂~ri ∂~r˙i = dt ∂qν ∂qν (2.179) Mediante (2.179) el lado derecho de (2.175) se transforma en: ! # " N ˙i X ∂ ~ r d ˙ ∂~r˙ i − mi~r˙ i · = ~ri · mi − dt ∂q ∂qν ν i=1 (2.180) N N d X1 ∂ ˙2 X 1 ∂ ˙2 − mi ~ri + ~r mi dt i=1 2 ∂ q̇ν 2 ∂qν i i=1 Las ecuaciones (2.174) y (2.180) nos permiten escribir a (2.173) en la forma: Q(a) ν − ∂T d ∂T + = 0; dt ∂ q̇ν ∂qν ν = 1, 2, ... l (2.181) 42 / Mecánica clásica avanzada Igual que en el caso estático las fuerzas generalizadas de ligadura se anulan, según una ecuación análoga a la (2.117). Las ecuaciones (2.181) se denominan las ecuaciones de Lagrange de la segunda clase. En esas ecuaciones T es la energı́a cinética del sistema. Una vez resueltas las ecuaciones (2.181) mediante las fórmulas de transformación (2.21) y (2.23) se hallan los ~ri (t) (a) con los cuales se pueden hallar F~i (t) y ~¨ri que permiten obtener de (2.140) las fuerzas de reacción de las ligaduras. Fuerzas derivables de un potencial. Si todas las fuerzas aplicadas se pueden obtener de una función V mediante las fórmulas (2.118), las fuerzas generalizadas tomarán la forma: Q(a) ν =− ∂ V (q, t) ; ∂qν ν = 1, 2, ... l Como ∂V /∂ q̇ν = 0, (2.181) se pueden escribir: ∂ d ∂(T − V ) − (T − V ) = 0 ν = 1, 2, ... l dt ∂ q̇ν ∂qν (2.182) (2.183) T en coordenadas generalizadas depende de (q), (q̇) y de t en el caso en que las ligaduras sean reónomas. Se define la función lagrangiana, o simplemente “el lagrangiano” L ası́: L(q, q̇, t) ≡ T (q, q̇, t) − V (q, t) (2.184) Entonces las ecuaciones de movimiento para un sistema holónomo con fuerzas derivables de un potencial que no depende de las velocidades son: d ∂L ∂L − = 0; dt ∂ q̇ν ∂qν ν = 1, 2, ... l (2.185) Las ecuaciones (2.185) se denominan usualmente “ecuaciones de Lagrange” y hay una por cada grado de libertad del sistema. Covariancia de las ecuaciones de Lagrange. Sean dos conjuntos diferentes de coordenadas generalizadas (q) y (q) relacionadas mediante la transformación: qν = qν (q, t) ; q ν = q ν (q, t) ; ν = 1, 2, ... l (2.186) Esta transformación que no mezcla coordenadas con velocidades se denomina puntual. Queremos hallar si en las coordenadas (q) las ecuaciones de Lagrange toman la forma de (2.185) en las coordenadas (q). Mediante la transformación (2.186) tenemos que: l l X X ∂L ∂L ∂ q̇α ∂L ∂qα = = ∂ q̇ ∂ q̇α ∂qν ∂ q̇ν α ∂ q̇ ν α=1 α=1 (2.187) Ecuaciones generales de la estática y la dinámica / 43 donde L es la función de (q), (q̇) y t, que se obtiene de L(q, q̇, t) al realizar la transformación: L(q, q,˙ t) ≡ L q(q, t), q̇(q, q̇, t), t . Por otra parte: " l X d ∂L ∂qα d ∂L = dt ∂ q̇ν dt ∂ q̇α ∂qα α=1 !# l ∂L X ∂ 2 qα ∂ 2 qα (2.188) + + ∂ q̇α µ=1 ∂qµ ∂q ν ∂t∂q ν l X ∂L ∂qα ∂L ∂ q̇α ∂L = + ∂q µ ∂qα ∂q ν ∂ q̇α ∂qν α=1 (2.189) Entonces se sigue de (2.188), (2.189) y (2.185) que: l X d ∂L d ∂L ∂L ∂ q̇α ∂L − = =0 − dt ∂ q̇ν ∂q ν dt ∂ q̇α ∂qα ∂q ν α=1 (2.190) Es decir, la forma de las ecuaciones de Lagrange es la misma en cualquier sistema de coordenadas generalizadas. Es interesante la siguiente relación que se obtiene directamente usando la transformación puntual (2.186): l l X X ∂L ∂L q̇ ν q̇ν = ∂ q̇ ∂ q̇ν ν α=1 ν=1 (2.191) Sistema sin ligaduras. Si no hay ligaduras las fórmulas (2.185) siguen siendo válidas, donde l = 3N . Se sigue de (2.190) que cuando el sistema no tiene ligaduras las ecuaciones de Lagrange (2.185) constituyen la forma de las ecuaciones de movimiento en cualquier sistema de coordenadas, propiedad que no cumplen las ecuaciones de la segunda ley de Newton, que son de naturaleza vectorial: las ecuaciones de Lagrange contienen la misma información que la segunda ley de Newton con la ventaja adicional de ser ecuaciones completamente covariantes. En coordenadas cartesianas las fuerzas generalizadas son de la forma Qxi , Qyi , Qzi . Qxj = T = N X N X (a) ri (a) (a) ∂~ F~i · µ̂x δij = Fix = F~i · ∂x j i=1 i=1 N X 1 i=1 2 mi ẋ2i + ẏi2 + żi2 (2.192) (2.193) Con lo cual las ecuaciones (2.181) nos dan: (a) mi ẍi = Fix es decir, las ecuaciones de Lagrange conducen a la segunda ley de Newton. (2.194) 44 / Mecánica clásica avanzada Comparación de los formalismos newtoniano y lagrangiano. Llamaremos newtoniano al formalismo basado en la ecuación general de la dinámica directamente. Este formalismo tiene la ventaja de su generalidad. Sin embargo, para sistemas holónomos con fuerzas derivables de un potencial, el formalismo basado en las ecuaciones de Lagrange presenta algunas ventajas: las ecuaciones de movimiento se obtienen a partir de una sola función escalar, la lagrangiana L, en tanto que en el formalismo newtoniano se trabaja con las fuerzas que actúan sobre las partı́culas. El uso de coordenadas generalizadas permite en el formalismo lagrangiano eliminar del problema las fuerzas de ligadura y las coordenadas superfluas. En el formalismo lagrangiano se trabaja con l parametros independientes que no se refieren a las partı́culas sino al sistema como un todo, en cambio en el formalismo newtoniano se trabaja necesariamente con coordenadas de las partı́culas. Finalmente, la covariancia de las ecuaciones de Lagrange es claramente una ventaja del formalismo lagrangiano. Ejemplo 2.7.1 Sea un alambre largo y rı́gido que rota uniformemente alrededor de un punto O como se muestra en la figura 2.11. Una partı́cula de masa m está sometida a la ligadura de permanecer sobre el alambre. No hay fricción y actúa la fuerza de gravedad en el plano de rotación del alambre. Resolver el problema usando coordenadas generalizadas y las ecuaciones de Lagrange. y A c ωt h m β ωt O B x –mgj Figura 2.11 Alambre largo y rı́gido que gira uniformemente alrededor de un punto O Suponer que en t = 0 la partı́cula parte del punto C con velocidad cero a lo largo del alambre. La ligadura es holónoma y reónoma, dada por la ecuación de la linea del alambre: y = x tan β + OA (2.195) Ecuaciones generales de la estática y la dinámica / 45 De la geometrı́a se sigue que sen ωt = h/OA y tan β = − cot α, con lo cual la ecuación de ligadura toma la forma: x cos ωt + y senωt − h = 0 (2.196) Es una ligadura dependiente explı́citamente del tiempo. El sistema tiene sólo un grado de libertad. Podemos tomar como coordenada generalizada el desplazamiento de partı́cula sobre el alambre respecto el punto C. Las ecuaciones de transformación son: x(q, t) = q senωt + h cos ωt y(q, t) = −q cos ωt + h senωt (2.197) Al reemplazar (2.197) en (2.196) se obtiene la identidad 0 = 0. El lagrangiano del problema es: L= 1 m(ẋ2 + ẏ 2 ) − mgy 2 (2.198) L expresado en términos de la coordenada generalizada q y la velocidad generalizada q̇ es: L(q, q̇, t) = 21 m(q̇ 2 + q 2 ω 2 + h2 ω 2 − 2q̇hω) (2.199) −mg(h senωt − q cos ωt) Para escribir la ecuación de Lagrange se requiere conocer: ∂L = mqω 2 + mg cos α ; ∂q ∂L = m(q̇ − hω) ∂ q̇ (2.200) Con lo cual la ecuación de movimiento para la coordenada generalizada q (ecuación de Lagrange) es: q̈ − qω 2 = g cos ωt (2.201) Claramente la solución de (2.201) es de la forma: q = Aeωt + Be−ωt + C cos ωt (2.202) que satisface las condiciones iniciales q(0) = 0, q̇(0) = 0 sólo si A = B = −(1/2)C. C se determina reemplazando (2.202) en (2.201), obteniéndose finalmente para q(t): q(t) = g (cosh ωt − cos ωt) 2ω 2 (2.203) Las fuerzas de reacción de las ligaduras se determinan a partir de la ecuación (2.140): Rx = mẍ Ry = mg + mÿ (2.204) 46 / Mecánica clásica avanzada Las ecuaciones (2.197) y (2.203) permiten calcular a ẍ y ÿ: ẍ = q̈ senωt + 2q̇ω cos ωt − qω 2 senωt − hω 2 cos ωt ÿ = −q cos ωt + 2q̇ω senωt + qω 2 cos ωt − hω 2 senωt (2.205) Con lo cual se obtiene para Rx y Ry: Rx = mg(senhωt + 2senωt) cos ωt − mhω 2 cos ωt Ry (2.206) = mg(senhωt + 2senωt)senωt − mhω 2 senωt El vector ~l está dirigido a lo largo del alambre: ~l = îsenωt − ĵ cos ωt (2.207) ~ es cero: ~l· R ~ = 0 o sea que R ~ es siempre perpendicular El producto escalar de ~l con R al alambre. Su magnitud es: R = mg(senhωt + 2senωt) − mhω 2 2.8. (2.208) Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas no holónomos. Uso de coordenadas no independientes Con sistemas no holónomos no es posible, mediante la introducción de coordenadas generalizadas independientes, eliminar las condiciones de ligadura. Por alguna razón serı́a deseable trabajar con un conjunto de 3N coordenadas no cartesianas q1 , q2 , ... q3N , que no serán independientes. Incluso serı́a posible trabajar con un conjunto de 3N − h coordenadas generalizadas no independientes definido de tal manera que se eliminen del problema las ligaduras holónomas. En cualquiera de estos dos casos debemos trabajar con coordenadas generalizadas no independientes. Se trata de hallar las ecuaciones de movimiento usando estas coordenadas. Para ello basta partir de las ecuaciones de Lagrange de la segunda clase, ecuaciones (2.181), considerando esta vez las Qν como formadas de las fuerzas aplicadas y de las fuerzas de ligadura (2.159): ! h N n X X X ∂f ∂~ri α (a) λα F~i + Qν = + µα~lαi · ∂~ r ∂q i ν α=1 α=1 i=1 ν = 1, 2, ... 3N (2.209) definimos las cantidades dα y aαν de la siguiente manera: ∂fα ; dα = ∂t aαν = N X ∂fα i=1 ∂~ri · ∂~ri ∂fα = ∂qν ∂qν para α = 1, 2, ... h (2.210) Ecuaciones generales de la estática y la dinámica / 47 dα = Dα ; aαν = N X ~lα · ∂~r1 ∂qν i=1 para α = h + 1, h + 2, ... h + n = k (2.211) Con lo cual podemos escribir a (2.209) como: Qν = Q(a) ν + k X λα aαν (2.212) α=1 donde esta vez λα representan los k multiplicadores de Lagrange λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las ecuaciones de Lagrange de la segunda clase se pueden escribir entonces en la forma: k X ∂T d ∂T − = Qν(a) + λα aαν ; dt ∂ q̇ν ∂qν α=1 ν = 1, 2, ... 3N (2.213) En resumen, con las coordenadas generalizadas q1 , q2 , ... q3N las ecuaciones de ligadura se pueden escribir en la forma: 3N X aαν q̇α + dα = 0 ; α = 1, 2, ... h, h + 1, h + 2, ... h + n = k (2.214) α=1 que junto con las 3N ecuaciones de Lagrange nos proporcionan 3N + k ecuaciones con las 3N + k incógnitas siguientes: q1 , q2 , ... q3N , λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las fuerzas de Pkreacción de las ligaduras en estas coordenadas no independientes estarán dadas por α=1 λα aαν , o más explı́citamente: h X n ∂fα X + µα aαν Rν = λα ∂qα α=1 α=1 (2.215) Ejemplo 2.8.1 Resolver el problema del ejemplo 2.7.1 usando multiplicadores de Lagrange y coordenadas no independientes. Tomaremos a q y h como coordenadas generalizadas no independientes. En la ecuación de ligadura escribiremos a la distancia OC como h0 : f (x, y, t) = x cos ωt + y senωt − h0 (2.216) Haciendo la transformación de las coordenadas x, y a las coordenadas q, h, ecuación (2.197), obtenemos para ~r y f : f (q, h, t) = h − h0 (2.217) ~r(q, h, t) = q(î senωt − ĵ cos ωt) + h(î cos ωt + ĵ senωt) (2.218) 48 / Mecánica clásica avanzada con lo cual se obtienen las siquientes expresiones para los coeficientes aq , ah , d, según (2.210): aq = ∂f =0 ∂q ah = ∂f =1 ∂h (2.219) ∂f =0 ∂t Las fuerzas aplicadas generalizadas serán: d= Qν = −mg î · ∂~r ∂qν (2.220) con lo cual: Qh = −mg senωt ; Qq = mg cos ωt (2.221) La energı́a cinética será: T (q, q̇, h, ḣ, t) = 1 m(q̇ 2 + q 2 ω 2 + h2 ω 2 − 2q̇hω + 2q ḣω + ḣ2 ) 2 (2.222) Entonces las ecuaciones (2.213) serán: m(q̈ − ḣω) − m(qω 2 + ḣω) = mg cos ωt (2.223) m(ḧ + q̇ω) − m(hω 2 − q̇ω) = −mg sen ωt + λ La ecuación (2.214) será: ḣ = 0 ⇒ h = h0 (2.224) Reemplazando (2.224) en (2.223) obtenemos: q̈ − qω 2 = g cos ωt (2.225) λ = 2q̇ω − hω 2 + g senωt m La solución de las ecuaciones (2.225) de acuerdo con (2.224) será: g (cosh ωt − cos ωt) q = 2ω 2 λ = mg(senhωt + 2senωt) − mhω (2.226) 2 Las fuerzas generalizadas de ligadura serán, de (2.226) y (2.215): Rh = mg(senhωt + 2senωt) − mhω 2 ; Rq = 0 en completo acuerdo con los resultados de (2.208). (2.227) Ecuaciones generales de la estática y la dinámica / 49 Ejemplo 2.8.2 Sea un disco de radio R que rueda sobre un plano inclinado con el plano del disco perpendicular al plano inclinado (podrı́a ser una de las ruedas de un carro). Hallar y resolver las ecuaciones de movimiento. Tomaremos el plano xy en el plano inclinado, con lo cual se tendrá una configuración como en la figura 2.1. Las coordenadas del sistema serán: xCM , yCM , α, φ, que tomamos como coordenadas genaralizadas no independientes. De las ecuaciones de ligadura, no holónomas dadas por las ecuaciones (2.9): ẋ − R senα φ̇ = 0 (2.228) ẏ + R cos α φ̇ = 0 obtenemos las siquientes expresiones para los coeficientes aαν que aparecen en (2.214): a1x = 1 a1y = 0 a1α = 0 a1φ = −R senα a2x = 0 a2y = 1 a2α = 0 a2φ = R cos α (2.229) Los momentos de inercia de un disco alrededor de su eje y alrededor de un diámetro son respectivamente: 1 1 mR2 ; Iα = mR2 (2.230) 2 4 La energı́a cinética contendrá una parte debida al movimiento del centro de masa y otra debida al movimiento respecto al centro de masa:2 Iφ = 1 1 1 m(ẋ2 + ẏ 2 ) + mR2 φ̇2 + mR2 α̇2 (2.231) 2 4 8 Tomaremos los ejes xy de modo que el eje x esté horizontal y el eje y haciendo un ángulo β con la horizontal. Las fuerzas generalizadas serán entonces: T = (a) Q(a) α = Qφ = 0 ; Q(a) x = 0; Q(a) y = mg senβ (2.232) Usando las ecuaciones (2.229), (2.231) y (2.232), las ecuaciones (2.213) se transforman en: mẍ = µ1 mÿ = mg senβ + µ2 1 2 R mα̈ = 0 4 (2.233) 1 2 R mφ̈ = −µ1 R senα + µ2 R cos α 2 La tercera de las ecuaciones (2.233) nos da: α = ωα t + α0 2 Para una justificación rigurosa de (2.231) ver sección 8.3. (2.234) 50 / Mecánica clásica avanzada Las dos primeras ecuaciones (2.233) junto con las (2.228) nos dan las siguientes expresiones para µ1 y µ2 en términos de φ: µ1 = mRωα cos(ωα t + α0 ) φ̇ + mR cos(ωα t + α0 ) φ̈ (2.235) µ2 = mRωα sen(ωα t + α0 ) φ̇ − mR cos(ωα t + α0 )φ̈ − mg sen β Ahora, reemplazando a µ1 y µ2 en la última de las (2.233) obtenemos: 2 g φ̈ = − senβ cos(ωα t + α0 ) 3 R que al ser integrada nos da: 2g senβ cos(ωα t + α0 ) + At + B φ= 3Rωα2 Tomando la condición inicial φ(0) = 0 y φ̇(0) = 0, (2.237) será: 2g senβ[cos(ωα t + α0 ) − cosα0 + ωt senα0 ] φ= 3Rωα2 (2.236) (2.237) (2.238) Tomando además a α0 = 0, lo que equivale a tomar en t=0 a α = 0, obtenemos: α = ωα t φ =− µ1 µ2 2gsenβ ωt sen2 3Rωα2 2 2 = − mg senβsen2ωα t 3 2 = −mgβ 1 − cos 2ωα t 3 x g senβ =− 3ωα2 y = (2.239) 1 ωα t − sen2ωα t 2 gsenβ sen2 ωα t 3ωα2 Donde hemos tomado que x = 0, y = 0, ẋ = 0, ẏ = 0 en t = 0. Las fuerzas de reacción de las ligaduras serán, usando (2.215): Rx = µ1 Ry = µ2 Rα = 0 Rφ = −µ1 R senωα t + µ2 R cos ωα t 1 = − mgR senβ cos ωα t 3 (2.240) Ecuaciones generales de la estática y la dinámica / 51 Si se deja la rueda inicialmente alineada en el eje y, se tiene que ωα = 0, con lo cual: α= 0 φ= − x= 0 y= 1 gsenβ t2 3 g senβ 2 t 3R Rx = 0 Ry = 1 − mg senβ 3 Rα = 0 (2.241) 1 − mgR senβ 3 R= Si en vez de un disco se tuviera una masa que baja sin rozamiento a lo largo del eje y, la fuerza a lo largo del plano serı́a mg senβ. En este caso se tiene que el plano ejerce sobre la rueda una fuerza en y dada por (−1/3)mg senβ y que la hace rodar hacia abajo en la dirección de y positiva. Rφ es el torque que produce la rotación. La aceleración del centro de masa será (2/3)g senβ con lo cual y = (1/3) senβ t2 y φ = (1/3)g senβ t2 /R. Ejemplo 2.8.3 Sean dos partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida de longitud l, sin masa. El sistema de alguna manera está constreñido a moverse en un plano vertical, de modo que la velocidad del centro de masa siempre está en la dirección de la varilla (véase figura 2.12). Hallar y resolver las ecuaciones de movimiento. x r1 r r2 1 · α g 2 y Figura 2.12 Partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida y constreñidas a moverse en un plano vertical 52 / Mecánica clásica avanzada La ligadura holónoma es: |~r1 − ~r2 | = l (2.242) La ligadura no holónoma es: ẋ = tan α ẏ (2.243) Escogemos como coordenadas generalizadas no independientes a x, y y α. Definimos el vector ~l como: ~l = ~r1 − ~r2 (2.244) con magnitud l y dirección α. Las ecuaciones de transformación de coordenadas son: ~r1 = ~r + ~l 2 (2.245) ~l ~r2 = ~r − 2 La energı́a cinética se puede escribir como: 1 T = ẋ2 + ẏ 2 + l2 α̇2 4 (2.246) Los coeficientes en la ecuación de ligadura no holónoma son: ax = − tan α ; ay = 1 ; aα = 0 (2.247) La fuerza aplicada generalizada es: Qx = 0 ; Qy = 2g ; Qα = 0 (2.248) Las ecuaciones de Lagrange, (2.213), serán: 2ẍ = −µ tan α 2ÿ − 2g = µ 1 2 l α̈ = 2 0 (2.249) Para α se halla: α = ωt + δ (2.250) x, y y µ se hallan de las ecuaciones: 2ẍ = −µ tan(ωt + δ) 2ÿ = 2g + µ ẏ − ẋ tan(ωt + δ) = 0 (2.251) Ecuaciones generales de la estática y la dinámica / 53 ẋ obedece la ecuación diferencial: 2ẍ + 2ẋω tan α = g sen2α (2.252) Esta es una ecuación diferencial lineal de primer orden en ẋ cuya solución general está dada por una fórmula estándar. La solución para ẋ es: ẋ = − g (1 + cos 2α) + A cos α 2ω (2.253) Su integral nos da directamente: x=− A g (2ωt + sen2α) + senα + B Aω 2 ω (2.254) donde A y B son constantes de integración. Para y y µ se halla: y= A g cos 2α − cos α + C 2 4ω ω µ = −2g(1 + cos 2α) + 2Aω cos α (2.255) (2.256) Las fuerzas de reacción de las ligaduras serán: Rx = 2g sen2α − 2Aω senα Ry = −4g cos 2α + 2Aω cos α Rα = 0 (2.257) Se sigue que si al sistema se aplica una fuerza dada por (2.257), se moverá con la condición de ligadura (2.243). ω, δ, A, B, y C son constantes de integración que dependen de las condiciones iniciales. 54 / Mecánica clásica avanzada 3 El principio de Hamilton y las ecuaciones de Lagrange 3.1. Forma integral de la ecuación general de la dinámica para un sistema holónomo Trayectorias variadas. La ecuación general de la dinámica, ecuación (2.141), es válida en cada instante t, ya que por definición los δ~ri se realizan instantáneamente alrededor de la posición real del sistema. La ecuación general de la dinámica es un “principio diferencial” que expresa la anulación del trabajo virtual de las fuerzas de ligadura en cada instante t, o equivalentemente en cada configuración del sistema. Tomemos fijos t1 y t2 . Si en cada instante t, entre t1 y t2 , se realiza un desplazamiento virtual en las coordenadas de cada partı́cula, δ~ri (t), y se impone la condición δ~ri (t1 ) = δ~ri (t2 ) = 0 se obtendrá que la secuencia de desplazamientos virtuales define una trayectoria diferente entre t1 y t2 . A esta trayectoria se le denomina “trayectoria variada” y la trayectoria seguida por el sistema se denomina “trayectoria real” (véase figura 3.1 ). La función del tiempo ~ri (t) determina la trayectoria real y la función ~ri (t) + δ~ri (t) determina la trayectoria variada. A la función δ~ri (t) se le denomina la “variación” de la función ~ri (t). También se suele llamar “trayectoria recta” a la real y “trayectoria circuitosa” a la variada (véase figura 3.1). ~ri (t) es una representación paramétrica de la trayectoria con parámetro t. De acuerdo con los comentarios de la sección 2.3, el conjunto de desplazamientos virtuales en un tiempo t puede asociarse a un “ensamble” muy grande de sistemas. Las trayectorias se forman uniendo un elemento de una “fila”, t, a un elemento de la “fila” t + dt, en forma de “zig-zag” en la matriz bidimensional mencionada en la sección 2.3; una trayectoria será “recta”; todas las demás serán “circuitosas”. Si el trabajo virtual de las fuerzas de ligadura es cero en cada instante t: N X i=1 ~ i (t) · δ~ri (t) = 0, R (3.1) también será cero el promedio de los trabajos virtuales realizados por las fuerzas de 55 56 / Mecánica clásica avanzada z Trayectoria variada 2 δri mi 1 Trayectoria real ri y x Figura 3.1 Representación de trayectorias en desplazamientos virtuales ligadura entre t1 y t2 : 1 t2 − t1 Z N t2 X t1 i=1 ~ i (t) · δ~ri (t)dt = 0 R (3.2) Como consecuencia de lo anterior, la ecuación general de la dinámica toma la forma: Z N h t2 X t1 i=1 i (a) F~i (t) − mi~¨r i (t) · δ~ri (t)dt = 0 (3.3) Esta es una expresión integral, en términos ya no de desplazamientos virtuales sino de variaciones globales de las trayectorias de las partı́culas. Transformando la ecuación (3.3) llegaremos a una expresión completamente equivalente a la ecuación general de la dinámica y por lo tanto a las ecuaciones de Lagrange de la primera y de la segunda clase, para sistema holónomos. Cada punto de la trayectoria variada se puede obtener de un punto de la trayectoria real, para cada una de las partı́culas, por medio de un desplazamiento virtual. Como consecuencia de esto, tanto la trayectoria real como la variada han de ser compatibles con las condiciones de ligadura. En cada instante t podemos escribir los δ~ri como: δ~ri (t) = ~ri v (t) − ~ri r (t) (3.4) donde v denota “variada” y r “real”. Se impone la condición de que las variaciones se anulen en t1 y en t2 para cada partı́cula. Es decir que ~riv (t) = ~rir (t) en t = t1 y t = t2 para i = 1, 2, ...N . El principio de Hamilton y las ecuaciones de Lagrange / 57 La integral de acción. Es la integral (3.3) haciendo algunas transformaciones. En la ecuación (3.3) hacemos la siguiente transformación: d ˙ d mi~¨r i · δ~ri = mi~ri · δ~ri − mi~r˙ i · (δ~ri ) (3.5) dt dt Notando que las operaciones δ y d/dt conmutan: d d (δ~ri ) = [~ri v (t) − ~ri r (t)] = ~r˙ i v − ~r˙ i r = δ~r˙ i dt dt (3.6) podemos escribir a (3.5) en la forma: 1 2 d ˙ mi~ri · δ~ri − mi δ~r˙ i mi~¨r i · δ~ri = dt 2 (3.7) Con lo cual se tiene que: N X N X d mi~¨r i · δ~ri = dt i=1 i=1 mi~r˙ i · δ~ri ! −δ N X 1 i=1 2 2 mi~r˙ i Por tanto la ecuación (3.3) tomará la forma: # ! Z t2 "X N N N X 2 d X ˙ (a) ˙ ~ mi~ri dt = 0 Fi · δ~ri − mi~ri · δ~ri + δ dt i=1 t1 i=1 i=1 (3.8) (3.9) Notamos que en (3.9) aparecen el trabajo virtual de las fuerzas aplicadas, δA, y la energı́a cinética:1 δA = N X i=1 N (a) F~i · δ~ri ; T = 1 X ˙2 mi~ri 2 i=1 (3.10) O sea que (3.9) se puede escribir como: Z t2 t1 (δA + δT )dt − N X i=1 t2 mi~r˙ i · δ r~i =0 (3.11) t1 En virtud de la condición impuesta a los desplazamientos virtuales en t = t1 y t = t2 , el término integrado se anula con lo cual (3.11) queda finalmente: Z t2 (δA + δT )dt = 0 (3.12) t1 Podrı́a pensarse que la presencia de condiciones de ligadura harı́a que δ~ri (t1 ) = δ~ri (t2 ) = 0 no es posible imponerla para todas las coordenadas sino sólo para las independientes, quedando la posibilidad de que no se cumpla para las coordenadas dependientes. 1 Como para pasar de r a r +δ~ ri se requiere realizar un trabajo, la energı́a en cada trayectoria variada i i es diferente. Esto caracteriza al principio de Hamilton, a diferencia de otros principios variacionales como el de “mı́nima acción” (véase sección 9.3). 58 / Mecánica clásica avanzada Sin embargo este no es el caso, pues de una transformación a coordenadas generalizadas independientes q1 , q2 , ...ql se sigue que: δ~ri = l X ∂~ri δqν ∂qν ν=1 (3.13) Basta pues que se imponga la condición siguiente sobre los desplazamientos virtuales de las coordenadas generalizadas: δqν (t1 ) = δqν (t2 ) = 0 ; ν = 1, 2, ...l (3.14) para que se satisfaga la condición requerida para los desplazamientos virtuales δ~ri . En el caso particular en que las fuerzas aplicadas se pueden obtener como el gradiente de una función de las coordenadas y del tiempo, V (~r, t) vemos que: δV (~r, t) = N X ∂V i=1 ∂~ri .δ~ri = − N X i=1 (a) F~i .δ~ri = −δA (3.15) Para este caso la ecuación (3.12) toma la forma: Z t2 Z t2 Z t2 L dt = 0 δL dt = δ δ(T − V )dt = t1 t1 (3.16) t1 donde el segundo signo igual en (3.16) está justificado por lo siguiente: Z t2 Z t2 Z t2 Z t2 Z t2 r v v r L dt L dt = δ L dt − (L − L )dt = δL dt = t1 t1 t1 t1 (3.17) t1 Por medio de las transformaciones a coordenadas independientes se ve que T es función de (q), (q̇), t, y V es función de (q) y t, con lo cual (3.16) se puede escribir como: Z t2 L(q, q̇, t)dt = 0 (3.18) δS = δ t1 Esta ecuación es equivalente a la ecuación general de la dinámica y de ella se pueden obtener también las ecuaciones de Lagrange usando el cálculo variacional. A la integral S se la denomina integral de acción 3.2. El principio de Hamilton Es posible el desarrollo formal de la mecánica tomando la ecuación (3.12) como postulado fundamental en vez de partir del principio de D’Alembert, ecuación (2.141). En este formalismo se denomina al contenido de la ecuación (3.18), el principio de Hamilton. El principio de Hamilton para sistemas con fuerzas aplicadas derivables de un potencial. El movimiento del sistema, descrito por las coordenadas generalizadas qν (t), es tal que entre dos instantes t1 y t2 se satisface: Z t2 L(q1 , q2 , ...ql ; q̇1 , q̇2 , ...q̇l ; t)dt = 0 (3.19) δ t1 El principio de Hamilton y las ecuaciones de Lagrange / 59 Este es un principio variacional, formulado por W. Hamilton en 1835. Matemáticamente (3.19) es la condición para que la acción S sea una extremal. S es una funcional de la trayectoria q(t). En análisis de funciones, se tiene que si F (x1 , x2 , ...xn ) es una función de muchas variables, F tendrá un valor extremal, máximo o mı́nimo, si al realizar un cambio infinitesimal en las variables F no cambia al primer orden en dichos cambios infinitesimales. Es decir si: F (x1 + δx1 , x2 + δx2 , ...xn + δxn ) − F (x1 , x2 , ...xn ) (3.20) = δF (x1 , x2 , ...xn ) entonces: δF (x1 , x2 , ...xn ) = N X ∂F δxi + 0(δx2i ) = 0 ∂x i i=1 (3.21) Se sigue que F (x1 , x2 , ...xn ) será extremal para aquellos valores de x1 , x2 , ...xn que hacen que se anulen todas las derivadas parciales de primer orden de F : ∂F =0 ∂xi i = 1, 2, ...n (3.22) En el análisis de funciones F (x1 , x2 , ...xn ) es un número que se asocia al conjunto de números x1 , x2 , ...xn . Al cambiar los números x1 , x2 , ...xn cambia el número F . Se dice que F es extremal si no cambia al primer orden en δxi cuando los xi se cambian por xi + δxi . 2 En el análisis funcional I [f1 (x), f2 (x), ...fn (x)] es un número que se asocia al conjunto de funciones f1 (x), f2 (x), ...fn (x). Al cambiar las funciones f1 (x), f2 (x), ...fn (x) cambia el número I. Se dice que I es extremal si no cambia al primer orden en δfi (x) cuando las funciones fi (x) se cambian por las funciones fi (x) + δfi (x). A δfi (x) se le denomina variación de la función fi (x). Toda función continua en un punto x0 puede expandirse en serie de Taylor alrededor de x0 : fi (x) = ∞ X 1 (k) f (x0 )(x − x0 )k k! i (3.23) k=0 (k) donde fi (x0 ) denota el valor de la derivada k-ésima de la función fi (x) en x = x0 y (n) (0) fi (x0 ) ≡ fi (x0 ). Variando los parámetros fi (x0 ) para k = 0, 1, 2, ...∞ se obtiene una función diferente. S es una funcional de qν (t), pues a cada posible solución q1 (t), q2 (t), ...ql (t) le corresponde un valor definido a la integral de acción S. El principio de Hamilton dice que al variar las funciones qν (t) se obtiene el conjunto de funciones verdaderas que describen la evolución del sistema por hallar qué conjunto es el que hace que S sea una extremal. Para la mayorı́a de las situaciones fı́sicas se encuentra que S es mı́nima para 2 El máximo o mı́nimo de una función se halla resolviendo el sistema de ecuaciones algebraicas (3.22), como en la estática. Los extremales de una funcional se hallan resolviendo un sistema de ecuaciones diferenciales, como en la dinámica. 60 / Mecánica clásica avanzada la solución correcta. En otras palabras, S tiene un valor mı́nimo cuando las funciones qν (t) describen las trayectorias reales.3 El número S asignado a cualquier trayectoria variada es mayor que el número S asociado a la trayectoria real. Ejemplo 3.2.1 Ilustrar el principio de Hamilton con el problema del tiro parabólico en presencia del campo gravitacional (véase figura 3.2). Sabemos que la trayectoria real está descrita por: 1 2 gt 2 Eliminando el parámetro t se obtiene que la trayectoria es parabólica: g 2 x y= 2Vx2 x(t) = Vx t ; y(t) = (3.24) (3.25) Esta trayectoria pasa por el punto (x = 0, y = 0) en t = 0 y por el punto (x2 , y2 = gx22 /(2Vx2 )) en t = t2 (véase figura 3.2). La siguiente trayectoria variada pasa por los mismos puntos que la trayectoria real en t = t1 = 0 y t = t2 : x = Vx t y = y2 (3.26) ex/x2 − 1 e−1 Se trata de mostrar que la integral de acción tiene menor valor para la trayectoria real que para esta trayectoria variada. El lagrangiano del problema es: 1 m(ẋ2 + ẏ 2 ) + mgy 2 Sobre la trayectoria real L es: L= 1 m(Vx2 + g 2 t2 ) + 2 La integral de acción es: Z t2 1 L dt = mVx2 t2 + 2 0 L= (3.27) 1 1 mg 2 t2 = mVx2 + mg 2 t2 2 2 (3.28) 1 1 x2y2 mg 2 t32 = mVx x2 + 0, 666 mg 3 2 Vx (3.29) Sobre la trayectoria variada: ẋ = Vx ; ẏ y2 Vx eVx t/x x2 (e − 1) Con lo cual L es: 1 mgy2 Vx t/x2 y22 Vx2 2Vx t/x2 L = m Vx2 + + e − 1) (e 2 2 2 (e − 1) x2 e−1 3 De (3.30) (3.31) acuerdo con el principio de D’Alembert esto equivale a decir que las posiciones verdaderas son de “equilibrio” estable. El principio de Hamilton y las ecuaciones de Lagrange / 61 P1 x P2 (x2,y2) g y Figura 3.2 Trayectoria parabólica en presencia de un campo gravitacional. Trayectoria variada. La integral de acción es: Z t2 L dt = 0 1 81e − 60 mgx2 y2 mVx x2 + 2 72(e − 1) Vx (3.32) mgx2 y2 1 = mVx x2 + 0,689 2 Vx Vemos que la acción en la trayectoria real es menor que la acción en la trayectoria variada. Cuando no se conoce la trayectoria, es decir cuando no se ha resuelto el problema, el principio de Hamilton directamente no proporciona un método práctico: se requiere un método de ensayo y error; suponer una solución y evaluar S; obtener una “tabla” de soluciones posibles en función de la acción. La solución correcta serı́a aquella para la cual S es mı́nima. Ejemplo 3.2.2 Resolver el problema del oscilador armónico lineal usando directamente el principio de Hamilton, con las siguientes condiciones en t = 0 y t = t1 : x(0) = 0 , x(t1 ) = x1 , ẋ(0) = v0 (3.33) 62 / Mecánica clásica avanzada Las posibles funciones de t las asumiremos de la forma: ∞ X x(t) = a n tn (3.34) n=0 O sea que a cada conjunto de parámetros a0 , a1 , a2 , ...a∞ le corresponderá una solución.4 El conjunto de parámetros que determina la solución real es aquel para el cual δS = 0. De la condición x(0) = 0 se sigue que a0 = 0, con lo cual: ∞ X a n tn (3.35) x(t) = n=1 El lagrangiano para el oscilador armónico unidimensional es: 1 1 L = µẋ2 − kx2 2 2 Reemplazando (3.35) en (3.36) obtenemos: ∞ ∞ ∞ ∞ 1 XX 1 XX L= µ nman am tn+m−2 − k an am tn+m 2 n=1 m=1 2 n=1 m=1 Con lo cual la integral de acción será: Z t1 L dt = S= (3.36) (3.37) 0 ∞ ∞ nm 1 1XX n+m−1 n+m+1 t t −k an am µ 2 n=1 m=1 n+m−1 1 n+m+1 1 La condición δS = 0 nos da: "∞ # ∞ X X nm 1 am µ tn+m−1 − k tn+m+1 δan = 0 n+m−1 1 n+m+1 1 n=1 m=1 (3.38) (3.39) En la ecuación (3.39) los δan son los cambios de los coeficientes an que darán lugar a la variación δx(t). Los δan no son independientes, pues se debe además cumplir la condición δx(t1 ) = 0: n X δx(t1 ) = δan tn1 = 0 (3.40) n=1 En virtud de (3.40) un δan puede expresarse en términos de los demás. Vamos a introducir un multiplicador indeterminado λ multiplicando la ecuación (3.40) por λ y el resultado lo sumamos a la ecuación (3.39) para obtener: " ∞ ∞ X X mn µ t1n+m−1 n + m − 1 n=1 m=1 (3.41) 1 tn+m+1 am + λtn1 δan = 0 −k n+m+1 1 4 La ecuación (3.34) constituye una representación multiparamétrica de la trayectoria en el espacio de configuración. El principio de Hamilton y las ecuaciones de Lagrange / 63 Ahora escogemos a λ de modo que se anule el coeficiente de δa1 : ∞ X 1 m+2 µtm − k am + λt1 = 0 t 1 m+2 1 m=1 (3.42) En la ecuación (3.41) quedará una combinación lineal de los δa2 , δa3 , ...δa∞ , igualada a cero. Como estas cantidades son ahora independientes, se debe cumplir que sus coeficientes se anulen. Igualando a cero los coeficientes de δa2 , δa3 , ...δa∞ y reemplazando el valor de λ que se obtiene de (3.42), llegamos a: ∞ X m−1 m 1 m+2 µ am = 0 (3.43) t +k t m+n−1 1 (m + 2)(m + n + 1) 1 m=1 De (3.43) se obtiene la siguiente relación de recurrencia para coeficientes, por igualar a cero los coeficientes de las tm 1 : am = − k 1 am−2 ; µ m(m − 1) m = 2, 4, ... (3.44) Como a0 = 0, se sigue que: a0 = a2 = a4 = ... = 0 (3.45) Los coeficientes impares se pueden expresar en términos de a1 , que se determina de la condición ẋ(0) = v0 : a1 = v0 (3.46) Con lo cual se obtiene que: (m−1)/2 k (m−1)/2 1 v0 ; am = (−1) m! µ m = 1, 3, ... (3.47) o también en la forma: a2n+1 = (−1)n n k 1 v0 ; µ (2n + 1)! n = 0, 1, 2, ... (3.48) Con lo cual x(t) será: x(t) = v0 r ∞ 1 µX (−1)n k n=0 (2n + 1)! Llamando ω = x(t) = s !2n+1 k µ p k/m llegamos a: v0 sen(ωt) ω Claramente el método es engorroso en problemas más complicados. (3.49) (3.50) 64 / Mecánica clásica avanzada Deducción de las ecuaciones de Lagrange a partir del principio de Hamilton generalizado. La ecuación (3.12) se denomina el principio de Hamilton generalizado. Es aplicable a cualquier sistema holónomo independientemente de la naturaleza de las fuerzas aplicadas. Como T es una función de (q), (q̇), t, δT (q, q̇, t) = l X ∂T ν=1 ∂T δqν + δ q̇ν ∂qν ∂ q̇ (3.51) En tanto que δA puede escribirse en términos de las fuerzas generalizadas Qν : δA = N X i=1 (a) F~i · δ~ri = l X Qν δqν (3.52) ν=1 En δT podemos hacer la transformación siguiente: ∂T d ∂T ∂T d d ∂T δqν δ q̇ν = δqν − δqν = ∂ q̇ν ∂ q̇ dt dt ∂ q̇ν dt ∂ q̇ν (3.53) Reemplazando (3.51), (3.52) y (3.53) en la ecuación (3.12): Z t2 (δA + δT )dt = t1 l t1 X Z Qν δqν + t1 ν=1 + l X ∂T ν=1 ∂ q̇ν d ∂T − ∂qν dt ∂T ∂ q̇ν δqν dt (3.54) t2 δqν =0 t1 La parte integrada en (3.54) es nula debido a que las δqν se anulan en t = tl y t = t2 , con lo cual se llega a: ) Z t1 (X l ∂T d ∂T (3.55) Qν + δqν dt = 0 − ∂qν dt ∂ q̇ν t1 ν=1 Como las δqν son arbitrarias, el integrando es una función arbitraria del tiempo; si la integral es cero, es necesario entonces que el integrando sea cero. Ahora queda una combinación lineal de las cantidades independientes δqν igualada a cero, l X ν=1 ∂T d Qν + − ∂qν dt ∂T ∂ q̇ν δqν = 0 Como las δqν son independientes, se debe cumplir también que: d ∂T ∂T = 0 ; ν = 1, 2, ...l − Qν + ∂qν dt ∂ q̇ν (3.56) (3.57) El principio de Hamilton y las ecuaciones de Lagrange / 65 A estas ecuaciones no podrı́amos haber llegado cuando el sistema es no holónomo. Estas ecuaciones son las correspondientes ecuaciones en cálculo funcional a las ecuaciones (3.22) del cálculo de funciones, a las cuales se reducen en el caso estático cuando las fuerzas son derivables de un potencial. Hemos llegado a las ecuaciones de Lagrange de la segunda clase a partir del principio de Hamilton. Supongamos que las fuerzas aplicadas se pueden descomponer en una parte derivable de un potencial monogénico y otra no derivable de tal potencial. Se entiende por potencial monogénico o potencial generalizado a una función de las coordenadas, las velocidades y el tiempo, a partir de la cual se pueden derivar todas las fuerzas monogénicas del sistema, mediante las fórmulas: ∂V d ∂V (a) F~i = − + + F~i′ ; ∂~ri dt ∂~r˙ i i = 1, 2, ...N (3.58) Las fuerzas generalizadas correspondientes serán: Qν = − d ∂V ∂V + + fν ; ∂qν dt ∂ q̇ν ν = 1, 2, ...l (3.59) donde fν es la fuerza generalizada correspondiente a las fuerzas F~i′ . Es posible con este tipo de fuerzas definir una función lagrangiana asociada a las fuerzas derivables del potencial generalizado. fν contiene las fuerzas no incluidas en L. Las ecuaciones de Lagrange toman la forma: d ∂L ∂L − + fν = 0 ; ∂qν dt ∂ q̇ν ν = 1, 2, ...l (3.60) donde L está definido como: L(q, q̇, t) = T (q, q̇, t) − V (q, q̇, t) (3.61) El lagrangiano para N partı́culas en un campo electromagnético. Sea un sistema de partı́culas cargadas en presencia de un campo electromagnético descrito por ~ r , t) y B(~ ~ r , t). La fuerza de interacción con la partı́cula i es: los campos E(~ ~ ri , t) + qi ~ri × B(~ ~ ri , t) F~i ~ri , ~r˙ i , t = qi E(~ (3.62) c Los campos eléctrico y magnético se pueden derivar de los potenciales escalar y ~ vectorial φ, A: ~ r , t) ∂φ(~r, t) 1 ∂ A(~ − ∂~r c ∂t ~ r , t) = E(~ − ~ r , t) = B(~ ∂ ~ r , t) × A(~ ∂~r Entonces F~i se puede escribir como: ∂φ(~ri , t) 1 ∂A(ri~, t) 1 ∂ ~ ri , t) F~i (~ri , ~r˙ i , t) = qi − − + r~i × × A(~ ∂~ri c ∂t c ∂~ri (3.63) (3.64) 66 / Mecánica clásica avanzada Algunas manipulaciones con el rotacional nos llevan a:5 ~ ~ ∂ ~ ri , t) = ∂ ~r˙ i · A ~ i − dAi + ∂ Ai ~r˙ i × × A(~ ∂~ri ∂~ri dt ∂t (3.65) Con lo cual (3.63) se puede escribir como: F~i ~ri , ~r˙ i , t = (3.66) Como φ no depende de ~r˙ i : F~i ~ri , ~r˙ i , t = (3.67) ∂ ∂ ˙ ~ 1 ~ ri , t) − 1 d qi − ~ri · A(~ri , t) φ(~ri , t) − ~r˙ i · A(~ ∂~ri c c dt ∂~r˙ i qi ∂ − ∂~ri 1˙ 1 d ∂ 1˙ ~ φi − ~ri · Ai φi − ~ri · Ai + c c dt ∂~r˙ i c Si se define la función V : " # N X ˙i ~ r ~ ri , t) , qi φ(~ri , t) − · A(~ V ~r1 , ~r2 , ...~rN , ~r˙ 1 , ~r˙ 2 , ...~r˙ N , t = c i=1 (3.68) las fuerzas de interacción con el campo electromagnético se pueden derivar del potencial monogenico V : ∂V d ∂V F~i = − + ∂~ri dt ∂~r˙ i (3.69) Entonces el lagrangiano de un sistema de partı́culas en un campo electromagnético puede escribirse como: " !# N X 1 ˙2 ~r˙ i ~ ˙ ˙ ˙ L(~r1 , ~r2 , ...~rN , ~r1 , ~r2 , ...~rN , t) = (3.70) mi~ri − qi φi − · Ai 2 c i=1 En este lagrangiano no están incluidas las fuerzas de interacción de las partı́culas entre sı́. Fuerzas viscosas. Son un tipo de fuerzas que no se pueden derivar de un potencial. Para muchos casos de interés se pueden escribir en la forma: F~i′ = −~k.~r˙ i (3.71) Se define la función de disipación de Rayleigh como: N 5 Ver 1X F= kx ẋ2i + ky ẏi2 + kz żi2 2 i=1 el texto Mecánica clásica de Goldstein, 1a ed, sección 1.5. ¯ (3.72) El principio de Hamilton y las ecuaciones de Lagrange / 67 Las fuerzas viscosas (3.71) se pueden obtener como el gradiente de velocidades de F: ∂F F~i = − ∂~r˙ i (3.73) La fuerza generalizada correspondiente será: Fν = N X i=1 Fi′ · N X ∂~ri ∂F ∂~r˙ i ∂F · =− =− ˙ i ∂ q̇ν ∂qν ∂ q̇ν ∂ ~ r i=1 (3.74) Para el caso en que las fuerzas no potenciales sean todas viscosas, las ecuaciones de Lagrange toman la forma: ∂L ∂F d ∂L − + = 0; dt ∂ q̇ν ∂qν ∂ q̇ν ν = 1, 2, ...l (3.75) de modo que deben darse dos funciones escalares, L y F , para obtener las ecuaciones de movimiento. Estas serán las ecuaciones a aplicarse en el caso de un sistema de osciladores amortiguados por ejemplo; L contiene las fuerzas de “resorte” y F las fuerzas disipativas. 3.3. Algunas propiedades de la función lagrangiana Aditividad de L. Si el sistema consta de dos partes, A y B, que no interactúan, entonces el lagrangiano del sistema se descompone en dos partes: L = LA + LB . Donde LA contiene sólo las coordenadas y velocidades de la parte A y similarmente LB . Es el caso de dos partı́culas que se mueven en presencia de un campo externo sin interactuar entre sı́. También en el caso de un sistema de partı́culas que interactúan entre sı́ pero no con un campo externo, L se puede descomponer en una parte que contiene sólo las coordenadas y velocidades del centro de masa y otra que sólo contiene las coordenadas y velocidades de las partı́culas respecto al centro de masa: no hay interacción del movimiento del centro de masa con el movimiento respecto al centro de masa. Adición a L de una derivada total respecto al tiempo de una función arbitraria. Sean dos funciones lagrangianas, que dependen de las mismas coordenadas y velocidades generalizadas, tales que difieren por una derivada total respecto al tiempo: L′ (q, q̇, t) = L(q, q̇, t) + d f (g, t) dt (3.76) Las integrales de acción de L y de L′ tienen valores extremales simultáneamente: S ′ = S + f [q(t2 ), t2 ] − f [q(t1 ), t1 ] (3.77) Como δq(t2 ) = δq(t1 ) = 0 se sigue que δS ′ = δS = 0. Esto implica que L y L′ dan lugar a las mismas ecuaciones de movimiento; a este resultado se puede llegar de manera más convincente transformando las ecuaciones de Lagrange mismas.6 que eiS/h̄ es el lı́mite clásico de la función de onda Ψ. Entonces la arbitrariedad de f implica una arbitrariedad en la fase de Ψ. 6 Veremos 68 / Mecánica clásica avanzada Ejemplo 3.3.1 Sea una partı́cula libre, descrita en un sistema de referencia inercial O mediante el lagrangiano. L= 1 ˙2 m~r 2 (3.78) Si se realiza una transformación de Galileo, a un nuevo sistema de referencia inercial O′ que se mueve respecto a O con velocidad constante V~ : ~ ~υ = ~υ ′ + V (3.79) Entonces el lagrangiano en el nuevo sistema de referencia inercial será: 1 2 1 1 ~ +V ~2 (3.80) L′ = m~r˙ ′2 = m~r˙ + m −2~r · V 2 2 2 Los dos lagrangianos están relacionados ası́: d m ~ 2t L′ = L + −2~r · V~ + V (3.81) dt 2 A la función: m ~ +V ~ 2t −2~r · V (3.82) f (r, t) = 2 por razones que se verán más adelante, se le denomina “función generadora de la transformación de Galileo”. Vemos que: m ~ − 2~r2 · V ~ +V ~ 2 t2 − ~υ 2 t1 S′ = S + (3.83) 2~r1 · V 2 y por tanto δS ′ = δS dado que δ~r = δ~r ′ = 0 en t = t1 y t = t2 . 3.4. Simetrı́as de la lagrangiana y teoremas de conservación Simetrı́a. Se dice que L posee una simetrı́a cuando no cambia bajo una transformación de las coordenadas y del tiempo. Por ejemplo, sea una partı́cula libre, cuyo lagrangiano esté dado por (3.78). Se le realiza un desplazamiento de la partı́cula por una cantidad arbitraria ~a, ~r → ~r + ~a (3.84) como ~a˙ = 0, se sique que L no cambia. Se dice que este lagrangiano es simétrico bajo translaciones. Veremos que esta simetrı́a está asociada a la conservación del momento lineal. Si se realiza una rotación arbitraria de la partı́cula, digamos alrededor del eje z por un ángulo α, x → x cos α + y senα y → −x senα + y cos α z → z (3.85) El principio de Hamilton y las ecuaciones de Lagrange / 69 y L no cambia, se dice que L es simétrico bajo rotaciones alrededor del eje z arbitrarias. Veremos que esta simetrı́a está asociada con la conservación del momento angular. Si se realiza una inversión de las coordenadas, x, y, z → −x, −y, −z (3.86) y L no cambia, esto implica la conservación de la paridad: L es siempre par o impar en el transcurso del movimiento. Al aplicar un campo externo las simetrı́as de L dependerán de las simetrı́as del campo. Si el campo tiene menor simetrı́a que el lagrangiano libre, el nuevo lagrangiano tendrá la simetrı́a del campo. Supongamos que se coloca una fuerza constante y uniforme en la dirección z. L ahora será: L= 1 ˙2 m~r + Fz z 2 (3.87) Las simetrı́as de L son alteradas. Bajo la transformación de translación espacial, (3.84): L → L + Fz az (3.88) L se altera a no ser que az sea cero. Ya no habrá simetrı́a de translación a lo largo del eje z. Veremos que esto implica que sólo son constantes las componentes x y y del momento lineal. L no cambia bajo rotaciones alrededor del eje z (a lo largo del cual actúa la fuerza), pero obviamente no tendrá simetrı́a de rotación alrededor de ningún otro eje. Antes de aplicar la fuerza, L tenı́a simetrı́a de rotación alrededor de cualquier eje (simetrı́a esférica), ahora sólo tiene simetrı́a de rotación en el eje z (simetrı́a cilı́ndrica). Esta simetrı́a implica que sólo se conserva la componente z del momento angular, en tanto que en ausencia del campo se conservan las tres componentes. En general, hay una relación entre las simetrı́as de L y las variables dinámicas que se conservan. Variables dinámicas. A cualquier función del estado del sistema y del tiempo se le llama una variable dinámica. Para un sistema con l grados de libertad las variables dinámicas son de la forma Dα (q1 , q2 , ...ql , q̇1 , q̇2 , ...q̇l , t). Ejemplos de variables dinámicas son: ~ri ; P~ = mi~r˙ i ; N X i=1 mi~r˙ i ; ~li = mi~ri × ~r˙ i ; ~ = L N X i=1 mi~ri × ~r˙ i ; (3.89) T = N X 1 i=1 2 2 mi~r˙ i (3.90) Obviamente es posible definir un número infinito de variables dinámicas para un sistema dado, pero sólo hay un número de variables dinámicas independientes igual al doble del número de grados de libertad. En efecto, sólo es posible formar conjuntos de 2l funciones independientes de q1 , q2 , ... ql , q˙1 , q˙2 , ...q̇l , pero pueden definirse muchos conjuntos diferentes. En general las 2l variables dinámicas independientes de un sistema no son constantes de movimiento, aunque en principio siempre es posible encontrar un 70 / Mecánica clásica avanzada conjunto de 2l constantes de movimiento, si el sistema es integrable. Constantes de movimiento. Las ecuaciones de Lagrange dan lugar a un sistema de l ecuaciones diferenciales acopladas de segundo orden con 2l incógnitas, q1 , q2 , ...ql , q̇1 , q̇2 , ...q̇l , independientes entre sı́. La solución a las ecuaciones de movimiento contendrá 2l constantes de integración arbitrarias que determinan los valores iniciales de (q) y (q̇). En el capı́tulo 1 se definió la especificación del estado del sistema mecánico en un tiempo t por medio de los valores de las coordenadas y velocidades en ese instante. Ahora vemos que las constantes de integración determinan no sólo el estado en el tiempo inicial, sino además todos los estados subsiguientes. Con sólo dar valores a t, para unos valores dados de las constantes de integración, se obtienen los valores correspondientes de las variables de estado. Las constantes de integración suministran una noción global de estado: se dice que a cada conjunto de valores de las constantes de integración le corresponde un estado de movimiento del sistema. El tiempo inicial, o comienzo del movimiento, siempre puede tomarse como una de las constantes de integración. La integración de las ecuaciones de movimiento dará lugar a 2l funciones de la forma: qν = qν (c1 , c2 , ...c2l−1 , t + t0 ) (3.91) q̇ν = q̇ν (c1 , c2 , ...c2l−1 , t + t0 ) ; ν = 1, 2, ...l Podemos en principio invertir estas ecuaciones para expresar las 2l constantes de integración en función de (q), (q̇), t: t0 = −t + θ(q, q̇) ; cα = cα (q, q̇) ; α = 1, 2, ..,2l − 1 (3.92) Por otra parte, con las 2l constantes de integración se puede obtener cualquier otro conjunto de 2l constantes independientes. En conclusión, a cualquier sistema dinámico integrable se le pueden asociar 2l funciones de (q), (q̇) y t cuya derivada total respecto a t sea cero. Estas cantidades son variables dinámicas, o sea que para cada sistema mecánico integrable siempre es posible hallar 2l constantes de movimiento independientes, o en otras palabras 2l variables dinámicas que se conservan, si es integrable. En mecánica cuántica se pueden encontrar a lo sumo l variables dinámicas que pueden tomar simultáneamente valores constantes. Se dice que para un sistema cuántico de l grados de libertad hay sólo l operadores hermı́ticos independientes que conmutan entre sı́ y que tienen estados propios con valores definidos de las correspondientes variables dinámicas. Conservación de la energı́a. Se trata de mostrar que para aquellos sistemas en que L sea simétrica bajo el cambio del origen del tiempo hay una constante de movimiento que es la energı́a.7 Sea un sistema que cumple estas tres condiciones: (a) puede ser descrito completamente a partir de L, es decir, se puede definir una función V de la cual se obtienen todas las fuerzas; (b) el potencial no depende de las (q̇) ni de t; (c) el sistema es tal que L no dependerá explı́citamente de t al introducir las coordenadas generalizadas y además es esclerónomo. Mediante la condición (c) se garantiza que las 7 Veremos que si L no cambia al cambiar E, ∂L/∂E = 0, entonces t0 se conserva. Se dice que t0 y E son dos cantidades canónicamente conjugadas. El principio de Hamilton y las ecuaciones de Lagrange / 71 ligaduras no realizan trabajo sobre el sistema, entonces para tal sistema se cumple que L es simétrica bajo el cambio de origen del tiempo: ∂L ∂L =0 ⇒ =0 ∂t0 ∂t (3.93) La derivada total de L respecto al tiempo es: l ∂L ∂L dL X ∂L q̇ν + q̈ν + = dt ∂qν ∂ q̇ν ∂t i=1 (3.94) De las ecuaciones de Lagrange se tiene que: ∂L d ∂L = − fν ∂qν dt ∂ q̇ν (3.95) Con lo cual (3.94) toma la forma: l ∂L dL X d ∂L q̇ν − fν q̇ν + = dt dt ∂ q̇ν ∂t ν=1 (3.96) O sea que se cumple: dL dt l X ∂L q̇ν − L ∂ q̇ν ν=1 ! = l X ν=1 fν q̇ν − ∂L ∂t (3.97) La cantidad entre paréntesis se llama la función energı́a, denotada h(q, q̇, t) con lo cual: ḣ(q, q̇, t) = l X ν=1 fν q̇ν − ∂L ∂t (3.98) De las condiciones (a) y (c) y del hecho de que V no depende de t se sigue que fν = 0 y ∂L/∂t = 0, con lo cual: h(q, q̇, t) = constante (3.99) Esta constante se llama “energı́a” o “constante de Jacobi”. La función h es igual al hamiltoniano H. La diferencia es que éste se define como una función de (q), (p), t y aquella es función de (q), (q̇) y t. Veremos que si además se cumple que V no depende de las (q̇), h coincide con la energı́a total T +V . (a) implica que el sistema es holónomo. Teorema de Euler acerca de las funciones homogéneas. Sea una función f de n variables: f (x1 , x2 , ...xn ) tal que: F (λx1 , λx2 , ...λxn ) = λr F (x1 , x2 , ...xn ) (3.100) Se dice que F es una función homógenea de grado r. El teorema dice que: N X i=1 xi ∂F = rF ∂xi (3.101) 72 / Mecánica clásica avanzada La prueba es la siguiente: derivando ambos lados en (3.101) respecto a λ, d F (λx1 , λx2 , ...λxN ) = rλn−1 F (x1 , x2 , ...xn ) dλ (3.102) la derivada del lado izquierdo es: n X ∂F (λx1 , λx2 , ...λxN ) ∂(λxi ) d F (λx1 , λx2 , ...λxN ) = dλ ∂(λxi ) ∂λ i=1 (3.103) Se sigue entonces que: n X ∂F (λx1 , λx2 , ...λxN ) ∂(λxi ) i=1 xi = λn−1 rF (x1 , x2 , ...xn ) (3.104) Haciendo ahora λ = 1 se obtiene la igualdad (3.101). Teorema acerca de la energı́a cinética de un sistema esclerónomo. Si el sistema es descrito mediante coordenadas generalizadas, en virtud de la ecuación (2.176) la energı́a cinética puede escribirse como: N T = 1 X ˙2 mi~ri = 2 i=1 " l l 2 # l N X X ∂~ri ∂~ri X ∂~ri ∂~ri ∂~ri 1X mi · q˙ν q˙µ + 2 · q̇ν + 2 i=1 ∂qν ∂qµ ∂qν ∂t ∂t ν=1 µ=1 ν=1 (3.105) Como ~ri es función (q) y t, se sigue que T en coordenadas generalizadas toma la forma: T (q, q̇, t) = l X l X Aνµ (q, t)q̇ν q̇µ + ν=1 µ=1 l X Aν (q, t)q̇ν + A(q, t) (3.106) ν=1 O sea que T se puede escribir como la suma de tres funciones homogéneas de las velocidades generalizadas de grados 2, 1 y 0: T = T2 + T1 + T0 (3.107) Se sigue que para un sistema esclerónomo (∂~ri /∂t = 0) T (q, q̇, t) = T2 (q, q̇, t) = l X l X Aνµ (q, t)q̇ν q̇µ (3.108) ν=1 µ=1 Es decir, que la energı́a cinética es una función homogénea cuadrática en las velocidades. La función Aνµ (q, t) es simétrica: Aνµ (q, t) = Aµν (q, t) (3.109) El principio de Hamilton y las ecuaciones de Lagrange / 73 En virtud del teorema de Euler acerca de las funciones homogéneas se sigue que para un sistema esclerónomo: l X ∂T q̇ν = 2T ∂ q̇ν ν=1 (3.110) Conservación de la energı́a total T + V. Si se cumple (b), como L = T − V se sigue que: ∂L ∂T = ∂ q̇ν ∂ q̇ν (3.111) Entonces h tomará la forma, en virtud de (3.110) y (3.111): h(q, q̇, t) = l X ∂T q̇ν − T + V = T + V ∂ q̇ν ν=1 (3.112) En este caso h coincide con la energı́a total. Las fuerzas que son derivables de un potencial que no depende de las velocidades ni del tiempo se llaman fuerzas conservativas. Si V depende de las (q̇) cumpliéndose las otras condiciones, h es una constante de movimiento pero no es la energı́a total. Si se cumple (c) y que V no dependa de las (q̇), será cierto que h = T + V , pero h no será una constante de movimiento. En este caso: l X dE ∂L dh = = fν q̇ν − dt dt ∂t ν=1 (3.113) donde la dependencia que tiene L de t puede provenir sólo de que V dependa del tiempo. Si las fuerzas fν son viscosas y se pueden obtener de la función de disipación de Rayleigh, que es una función homogénea cuadrática de las velocidades, en virtud de las ecuaciones (3.72), (3.74) y (3.101), se sigue que: l X ν=1 fν q̇ν = − l X ∂F q̇ν = −2F ∂ q̇ν ν=1 (3.114) En este caso (3.113) será: ∂L dh = −2F − dt ∂t o ∂E ∂V = −2F + ∂t ∂t (3.115) En (3.115) resulta claro que la rata de cambio de la energı́a total consta de la rata de disipación de energı́a 2F y de la rata de suministro de energı́a debida a la variación temporal de V . Ejemplo 3.4.1 Hallar la constante de Jacobi y la rata de cambio de la energı́a total para una partı́cula cargada en presencia de un campo electromagnético. 74 / Mecánica clásica avanzada De acuerdo con la ecuación (3.70): L= 1 ˙2 q ~ m~r − qφ + ~r˙ · A 2 c (3.116) La función energı́a será: h= ∂L ˙ 1 2 · ~r − L = m~r˙ + qφ 2 ∂~r˙ (3.117) Se ve que h no es la energı́a total E = T + V , lo cual es consecuencia de que V dependa de la velocidad, h incluye sólo la energı́a potencial eléctrica. En virtud de (3.98) h será: ḣ = − ~ ∂L ∂V ∂φ q ˙ ∂ A = =q − ~r · ∂t ∂t ∂t c ∂t (3.118) O sea que en general h será constante de movimiento sólo si los campos no dependen ~ tengan una forma tal que h sea del tiempo, además del caso particular en que φ y A cero, como: q ~ E = h − ~r˙ · A c Se sigue que para un campo electromagnético estático: d q ˙ ~ − ~r · A Ė = dt c (3.119) (3.120) Es decir, E no se conserva porque el potencial magnético no es constante. Si se ~ sea uniforme, A ~ se puede aplica el campo electromagnético constante de modo que B escribir en la forma: ~ = 1B ~ × ~r A 2 (3.121) ~ es uniforme. En este caso el potencial magnético será: que satisface a (3.63) si B q ~ · (~r × ~r˙ ) = − q B ~ · ~l ~ = − q ~r˙ · (B ~ × ~r) = − q B − ~r˙ · A c 2c 2c 2mc (3.122) donde ~l es el momento angular de la partı́cula. Entonces (3.120) y (3.122) nos dan: Ė = − qB ˙ q ~ ~˙ B·l = − lB 2mc 2mc (3.123) ~ lo lB se conserva si L es simétrico bajo rotaciones alrededor del eje determinado por B, cual en general no se cumplirá; para ello basta que φ tenga simetrı́a cilı́ndrica alrededor ~ de B. Ejemplo 3.4.2 Una partı́cula está sometida al efecto de la gravedad y a la condición de ligadura de moverse siempre sobre un alambre circular de radio a. El alambre rota uniformemente con velocidad angular ω alrededor de un eje vertical en el plano del alambre que pasa por el centro. Calcular h y Ė y analizar su significado. El principio de Hamilton y las ecuaciones de Lagrange / 75 El problema tiene un grado de libertad. Tomemos el eje z en la dirección de la fuerza de gravedad, coincidiendo con el eje de rotación. Definamos un sistema de ejes que rotan solidariamente con el alambre ası́: el eje z ′ en la dirección de la fuerza de gravedad, coincidiendo con el eje de rotación; el eje y ′ en el plano del alambre; y el eje x′ perpendicular al alambre en el centro. Las fórmulas que expresan a x, y y z en términos de x′ , y ′ y z ′ son: x = x′ cos ωt − y ′ senωt ; y = x′ senωt + y ′ cos ωt ; z = z′ (3.124) Tomemos como coordenada generalizada el ángulo que hace el vector de posición de la partı́cula con el eje z ′ y en términos del cual podemos expresar a x′ , y ′ y z ′ , puesto que x′ = 0. Entonces, mediante (3.124) obtenemos: x = −a senq senωt ; y = a senq cos ωt ; z = a cos q (3.125) El lagrangiano del problema es en consecuencia: L(q, q̇, t) = 1 ma2 (q̇ 2 + ω 2 senq) + mga cos q 2 (3.126) El lector puede verificar fácilmente que si ω 2 < g/a, la posición q = 0 es de equilibrio estable con frecuencia de pequeñas oscilaciones dada por Ω = ω 2 − g/a. Si ω 2 > g/a, la posición de equilibrio estable no es q = 0 sino algún valor de q entre 0 y π/2 con frecuencia de pequeñas oscilaciones dada por Ω2 = g/a − ω 2 . Finalmente, si ω 2 ≫ g/a, la posición de equilibrio estable será q = π/2, siendo ω la frecuencia de pequeñas oscilaciones. Sabemos que si se cumplen las condiciones (a) y (b), pero no se cumple (c), es decir, si las ligaduras son reónomas, lo cual es el caso para este problema, entonces h no será la energı́a total. De (3.107) y (3.112) se sigue, usando el teorema de Euler acerca de las funciones homogéneas, que: h = 2T2 + T1 − L = T + V − T1 − 2T0 (3.127) De (3.98) se sigue que cuando fν = 0, ∂L = Ė − Ṫ1 − 2Ṫ0 (3.128) ∂t Por tanto, si como en este ejemplo las ligaduras reónomas no dan lugar a que t aparezca en L, h será constante de movimiento pero E no lo será. En efecto, en este caso las ligaduras realizan trabajo sobre el sistema ya que los desplazamientos virtuales son tangentes al alambre (o sea que éste no realiza trabajo virtual), pero como un desplazamiento real de la partı́cula no coincide con una virtual, la ligadura realiza trabajo bajo desplazamientos reales. Para este problema, T2 = 12 ma2 q̇ 2 ; T1 = 0 ; T0 = 1 2 2 2 ma ω sen q y V = −mga cos q. De (3.127) se sigue entonces que: ḣ = − 1 ma2 (q̇ 2 − ω 2 senq) − mga cos q (3.129) 2 la cual es una constante de movimiento. Podemos reinterpretar a h diciendo que es la energı́a total respecto al sistema de ejes rotantes x′ , y ′ y z ′ . La energı́a cinética h = T2 − T0 + V = 76 / Mecánica clásica avanzada es T ′ = (1/2)ma2 q̇ 2 y la energı́a potencial consta de dos partes, la energı́a potencial gravitacional y la energı́a potencial centrı́fuga que resulta debido a que el sistema de referencia x′ , y ′ y z ′ es no inercial, es decir: T′ = 1 ma2 q̇ 2 ; 2 1 V ′ = − ma2 ω 2 senq − mga cos q 2 (3.130) En efecto, V ′ puede escribirse como V ′ = −(1/2)maω 2y ′ − mgz ′ y de él se deriva la fuerza siguiente: 1 ∂V ′ F~ ′ = − ′ = maω 2 î′ + mg k̂ ′ ∂~r 2 (3.131) O sea que (1/2)maω 2 es la fuerza centrı́fuga; es como si existiera un campo gravitacional homogéneo en la dirección x′ . La energı́a total respecto a los ejes x, y y z será E y constará de dos términos: h y el trabajo realizado por el alambre. Como ḣ = 0, de (3.128) se sigue que: Ė = Ṫ1 + 2Ṫ0 = ma2 ω 2 cos q q̇ (3.132) Para pequeñas oscilaciones alrededor de q = 0, Ė es de la forma Ė= ma2 ω 3 q0 senΩt, o sea que E = h − (ma2 ω 3 /Ω)q0 cos Ωt, lo cual nos muestra que la energı́a total tendrá fluctuaciones periódicas. Conservación del momento lineal. Sea un sistema que cumple las siguientes condiciones: (a) se describe completamente a partir de un lagrangiano; (b) L no depende de alguna de las coordenadas generalizadas. Entonces se cumple: ∂L =0 ∂qν0 (3.133) donde la coordenada qν0 que no aparece en L se llama cı́clica o ignorable. La ecuación de Lagrange para la coordenada qν0 implica que: d ∂L = f0 (3.134) dt ∂ q̇ν0 O sea que si fν0 = 0 la siguiente cantidad se conserva: Pν0 ≡ ∂L = constante ∂ q̇ν0 (3.135) Se define el momento canónico conjugado a la coordenada qν ası́:8 Pν = ∂L ; ∂ q̇ν ν = 1, 2, ...l (3.136) luego, el momento canónico conjugado a una coordenada cı́clica es una constante de movimiento. Si L no depende de qν0 y fν0 = 0 se dice que el sistema es simétrico bajo cualquier cambio en la coordenada qν0 . 8 La palabra “canónico” viene desde de época de Hamilton; significa “de acuerdo con el canon”. Se usa ampliamente en fı́sica para designar diversos aspectos del formulismo hamiltoniano, que describe los sistemas mecánicos mediante las variables (q, p). El principio de Hamilton y las ecuaciones de Lagrange / 77 Sea un lagrangiano dado por (3.87). Como L no depende de x ni de y, se sigue que px = mẋ y py = mẏ son constantes de movimiento. Como L depende de z, pz = mż no se conserva. Si qν0 es una coordenada lineal, pν0 será un momento lineal. Homogeneidad espacial. Sea un sistema aislado. Es de esperarse que L no cambie cuando se traslada el sistema como un todo. Esto equivale a desplazar todas las partı́culas por la misma cantidad sin cambiarles su movimiento: ~r˙ i → ~r˙ i ~ri → ~ri + ~ǫ ; (3.137) Entonces el cambio experimentado por L será: δL = N N X X ∂L ∂L · δ~ri = ~ǫ · ∂~ r ∂~ qi i i=1 i=1 (3.138) Por hipótesis no hay ligaduras, con lo cual las ecuaciones de Lagrange nos dan: δL = ~ǫ · N N X d X d ∂L dP~ = ~ǫ · p~i = ~ǫ · , dt ∂~r˙ i dt i=1 dt i=1 (3.139) donde P~ es el momento total del sistema. Se sigue que si hay homogeneidad espacial, δL = 0, entonces se sigue que la variable dinámica ~ǫ· P~ se conserva. Como E es arbitrario, se sigue que P~ es una constante. Si sólo hay simetrı́a de translación en determinada dirección ~ǫ se sigue que sólo se conserva la componente de P~ en la dirección de ~ǫ. Como L = T − V y T sólo depende de las velocidades de las partı́culas, ∂V ∂L =− = F~i ∂~ri ∂~ri (3.140) Entonces en (3.138) se tiene: δL = ~ǫ · N X F~i (3.141) i=1 δL será cero si el sistema no está sometido a una fuerza neta externa, es decir si el sistema está aislado. O también: si el sistema es aislado, no debe haber fuerzas sobre el centro de masa: ∂V F~CM = − =0 (3.142) ~ CM ∂R luego V no depende de RCM y ésta será cı́clica. El momento canónico conjugado de ~ CM será el momento lineal total y será una constante de movimiento: R P~CM = N X ∂L ∂L ∂~r˙ i = · ~ CM ~˙ CM r˙ i ∂ R ∂R i=1 ∂ ~ (3.143) ~ CM está dado por Como R N 1X ˙ ˙ ~ CM R = mi~ri 2 i=1 (3.144) 78 / Mecánica clásica avanzada Se sigue que: ∂~r˙ i ~ = ~1 ˙ ~ ∂ RCM (3.145) ~1 es el diádico unidad, que se representa por una matriz unidad de dimensión donde ~ 3 × 3 (véase sección 7.4). Por tanto: N N X X ∂L ∂L mi~r˙ i = P~CM = = ˙ ˙~ ∂ ~ r i ∂ RCM i=1 i=1 (3.146) Conservación del momento angular. Sea un sistema que se describe completamente a partir de un lagrangiano y además tal que no depende de alguna coordenada angular qν0 , entonces su momento canónico conjugado será un momento angular que se conserva. Por ejemplo, sea una partı́cula cuyo lagrangiano es: 1 ˙2 m~r − V (~r) (3.147) 2 Sea n̂ un eje arbitrario y δφ una rotación alrededor de ese eje (véase figura 3.3). L= n δϕ δr r r + δr θ Figura 3.3 Rotación por ángulo δφ alrededor de n̂ Supongamos que φ es una de las coordenadas generalizadas del sistema. En una rotación alrededor de n̂ bajo un ángulo δφ, ~r se cambia en ~r + δ~r donde δ~r es un vector perpendicular a ~r y a n̂ y cuya magnitud es r senθ δφ. Por tanto se cumple que: δ~r = n̂ × ~rδφ (3.148) El principio de Hamilton y las ecuaciones de Lagrange / 79 y que: ∂~r = n̂ × ~r ∂φ (3.149) El momento canónico conjugado de φ será: pφ = ∂~r˙ ∂~r = m~r˙ · (n̂ × ~r) = n̂ · m~r × ~r˙ = m~r˙ · = m~r˙ · ∂φ ∂ φ̇ ∂ φ̇ ∂L (3.150) Se sigue que pφ es la componente del momento angular a lo largo de n̂. Si L no depende de φ, pφ es una constante de movimiento. Isotropı́a espacial. Sea un sistema tal que no cambia L cuando se rota como un todo alrededor de un eje n̂. Esto es, si para cada partı́cula: ~ri → ~ri + n̂ × ~ri δφ ; ~r˙ i → ~r˙ i + n̂ × ~r˙ i δφ el cambio en L será: X N N X ∂L ˙ ∂L p~˙ i · δ~ri + p~i · δ~r˙ i · δ~ri = · δ~ri + δL = ∂~ri ∂~r˙ i i=1 i=1 (3.151) (3.152) Usando (3.151) y usando la invariancia del triple producto escalar bajo permutación cı́clica de los factores: δL = N X d n̂ · ~ri × p~˙ i + p~i × ~r˙ i δφ = n̂δφ · ~ri × p~i dt i=1 i=1 N X (3.153) Con lo cual ~˙ δL = δφn̂ · L (3.154) ~ es el momento angular total. Por otra parte, en virtud de las ecuaciones de donde L Lagrange: δL = N X i=1 F~i · δ~ri + p~i · δ~ri = (3.155) N N X X ~ki = δφn̂ · K ~ ~ri × F~i + ~r˙ i × p ~i = δφn̂ · δφn̂ · i=1 i=1 ~ es el torque total, por tanto: donde K ∂L ~˙ = n̂ · K ~ = n̂ · L ∂φ (3.156) Si no hay torque neto sobre el sistema entonces éste será isótropo y en consecuencia se conserva el momento angular total. Si simplemente se anula el torque en cierta dirección, L será simétrico bajo rotaciones alrededor de esa dirección y se conservará la 80 / Mecánica clásica avanzada ~ en esa dirección. componente de L Integrales de movimiento aditivas. Para un sistema aislado la energı́a total ~ y el momento lineal P~ se conservan: hay siete constantes de E, el momento angular L movimiento. Quedan aún otras 6N − 7 constantes de movimiento. Estas siete constantes de movimiento tienen la caracterı́stica de ser aditivas. Es decir, si el sistema consta de varias partes que no interactúan, cada parte tendrá valores determinados de la energı́a, el momento angular y el momento lineal totales. Las correspondientes cantidades del sistema total se pueden obtener adicionando las respectivas constantes de movimiento de las partes. 3.5. El teorema del virial Es un teorema de naturaleza estadı́stica porque se refiere a promedios temporales. Sea un sistema que: (a) la energı́a potencial es función homogénea de las coordenadas; (b) el movimiento es tal que en todo momento las coordenadas y las velocidades toman valores finitos (el sistema es ligado). Se trata de calcular los valores medios de T y V cuando el tiempo tiende a infinito. Del teorema de Euler acerca de las funciones homogéneas se sigue: N X ∂T ˙ · ~ri = 2T ∂~r˙ i (3.157) i=1 Entonces se cumple, dado que V no depende de las velocidades: N N X d X ˙ ~p˙ i · ~ri p~i · ~ri − pi · ~ri = ~ 2T = dt i=1 i=1 i=1 N X 2T = N N X d X F~i · ~ri pi · ~ri − ~ dt i=1 i=1 (3.159) si tomamos en (3.159) la media temporal a ambos lados, ası́: Z 1 τ lı́m 2T dt = τ →∞ τ 0 1 lı́m τ →∞ τ N X i=1 p~i · ~ri ! τ 0 1 − lı́m τ →∞ τ (3.158) Z 0 N τ X i=1 (3.160) F~i · ~ri dt La condición (b) conduce a la anulación del primer miembro del lado derecho, con lo cual llegamos a: 2T = − N X i=1 F~i · ~ri , (3.161) El principio de Hamilton y las ecuaciones de Lagrange / 81 donde la barra indica promedio temporal. La ecuación (3.161) se denomina el teorema del virial. El lado derecho de (3.161) es el doble del llamado virial de Clausius. Si V es función homogénea de las coordenadas, se cumple: − N X i=1 F~i · ~ri = N X ∂V i=1 ∂~ri · ~ri = kV = 2T (3.162) donde k es el grado de homogeneidad de V . Como T + V = E es una constante, se sigue que T + V = E. Por lo tanto se cumple que: 2T + 2V = 2E ; kT + kV = kE (3.163) De (3.162) y (3.163) se sigue que: V = 2 E; 2+k T = k E; 2+k T = k V 2 (3.164) Para un potencial del tipo r−1 se cumple que 2T = −V = −2E. Para un potencial del tipo r2 se cumple: T = V = (1/2)E. Se deduce que para un potencial del tipo r−1 hay movimientos acotados solamente si E < 0, dado que T es positiva, y que para un potencial del tipo r2 sólo hay movimientos acotados para E > 0. Ley de Boyle. Sea un sistema constituido por un gas de moléculas en un recipiente. En este caso N es muy grande. Si la energı́a cinética media por partı́cula es t, entonces: T = Nt (3.165) La energı́a por partı́cula está relacionada con la temperatura θ a través de la relación: 3 t = kB θ (3.166) 2 donde kB es la constante de Boltzmann. La ecuación (3.166) se obtiene del teorema de la equipartición de la energı́a, según el cual por cada grado de libertad hay una energı́a de (1/2)kθ. La fuerza sobre la partı́cula i depende de la ligadura impuesta por el recipiente: ~i F~i = F~ig + R (3.167) F~ig donde es la fuerza ejercida por todas las otras partı́culas del gas sobre la partı́cula i ~ y Ri es la fuerza ejercida por las paredes del recipiente sobre la partı́cula i. Si llamamos I a: I= N X F~ig .~ri (3.168) i=1 El virial de Clausius se descompone en dos partes: N X i=1 F~i .~ri = I + N X i=1 ~ i .~ri R (3.169) 82 / Mecánica clásica avanzada ~ i actúan sólo cuando la partı́cula i choca con las paredes del recipiente. Las fuerzas R Estas fuerzas representan la reacción del muro a la colisión ejercida por los átomos sobre la pared. Esto es lo que se denomina la reacción a la presión P que ejerce el gas sobre el recipiente. PN ~ En un tiempo t dado, en i=1 R ri sólo contribuyen los términos correspondientes i ·~ a las partı́ulas que en ese instante chocan con las paredes del recipiente. Podemos dividir el área de las paredes en elementos infinitesimales de área dA. Todas las dN partı́culas que choquen sobre un dA dado tendrán aproximadamente el mismo radio vector ~ri que llamaremos ~r. La contribución de las dN partı́culas a la sumatoria será aproximadamente ~ dN · ~r, donde R ~ es la fuerza que ejerce el elemento de área sobre cada una de las dN R ~ dN = dR, ~ entonces tenemos que: partı́culas que inciden sobre ella. Si llamamos R N X i=1 ~ i · ~ri = R Z ~ ~r · dR (3.170) ~ en términos de la Si n̂ es un vector normal a la superficie, podemos escribir a dR presión de la siguiente manera: ~ = −n̂P dA dR (3.171) Como la presión es constante escribimos: N X i=1 ~ i · ~ri = −P R Z n̂ · ~r dA (3.172) Ahora, en virtud del teorema de la divergencia, podemos pasar de la integral de superficie a una integral de volumen: Z Z ~ ∇ · ~rdV = 3V (3.173) ~r · dS = V S Entonces: N X i=1 ~ i · ~ri = −3P V R (3.174) Como esta cantidad no depende del tiempo se sigue que: N X i=1 F~i · ~ri = I − 3P V (3.175) En virtud del teorema del virial, que es válido en este caso porque el movimiento es acotado, y usando (3.162) y (3.166) se sigue que: 3N KB θ = −I + 3P V (3.176) Llegándose a la ecuación de estado para un gas real: 1 P V = N KB θ + I 3 (3.177) El principio de Hamilton y las ecuaciones de Lagrange / 83 El término (1/3)I es una medida de la separación de la ecuación de estado del gas real respecto al ideal en el cual no se consideran los efectos de interacción entre las moléculas dada por 3.168, en tanto que P V proviene de la ligadura impuesta por el recipiente. 84 / Mecánica clásica avanzada 4 La formulación hamiltoniana 4.1. Las variables hamiltonianas de estado En el formalismo lagrangiano el estado de un sistema mecánico holónomo con l grados de libertad se describe por medio de las qν y q̇ν . Por medio de la función L(q, q̇, t) se hallan las ecuaciones de movimiento a partir de las ecuaciones de Lagrange. Las variables (q, q̇, t) se llaman variables lagrangianas. Hamilton (1805-1865) propuso describir el sistema mediante las variables (q, p, t), donde los pν son los momentos generalizados canónicamente conjugados a las coordenadas generalizadas qν definidos por: pν = ∂L(q, q̇, t) ; ∂ q̇ν ν = 1, 2, ...l (4.1) Las variables (q, p, t) se llaman variables hamiltonianas. Las ecuaciones (4.1) constituyen las fórmulas de transformación de las variables (q, q̇, t) a las variables (q, p, t). En (4.1) hay l ecuaciones que relacionan las l cantidades pν con las l cantidades q̇ν . En principio se pueden expresar las (q̇) en términos de las (p) por la transformación inversa: q̇ν = Φν (q, p, t) ; ν = 1, 2, ...l (4.2) Es claro que el estado del sistema puede ser descrito indistintamente por las variables lagrangianas o por las hamiltonianas. Decimos que L “genera” la transformación (q, q̇, t) → (q, p, t). Según (3.106) y (3.107) T se puede escribir como: T = T2 + T1 + T0 (4.3) Si V no depende de las (q̇), pν = l X ∂T ∂L = = Aνµ q̇µ + Aν ; ∂ q̇ν ∂ q̇ν µ=1 ν = 1, 2, ...l (4.4) Mediante este sistema de ecuaciones lineales podemos expresar a (q̇) en términos de (p): q̇ν = l X bνµ pµ + bν ; ν = 1, 2, ...l µ=1 85 (4.5) 86 / Mecánica clásica avanzada Si V depende de las (q), (q̇) en la forma: V (q, q̇, t) = l X Πν (q, t)q̇ν + Π(q, t) (4.6) ν=1 que serı́a por ejemplo la forma que tomarı́a el potencial electromagnético (3.68) al ser expresado en coordenadas generalizadas, entonces pν será: pν = l X µ=1 Aνµ q̇µ + Aν − Πν ; ν = 1, 2, ...l (4.7) Notación. Usaremos L para denotar a T −V , expresada en función de las variables lagrangianas. Es claro que al expresarla en términos de las variables hamiltonianas la función es diferente, aunque a veces, sin mucho rigor, se le escribe también como L. Lo correcto es: L(q, q̇, t) = L [q, q̇(q, p, t), t] = L(q, p, t) (4.8) Ejemplo 4.1.1 Sea el lagrangiano: 1 2 ~ r , t) − Π(~r, t) L(~r, ~r˙ , t) = m~r˙ − ~r˙ · Π(~ 2 (4.9) El momento canónico será: p= ~ ~ ∂L ~ ⇒ ~r˙ = p~ + Π = m~r˙ − Π ˙ m ∂~r (4.10) Con lo cual: L(~r, p~, t) = ~2 ~2 − Π p −Π 2m (4.11) La función hamiltoniana. Se definió en (3.97) la función energı́a como: h(q, q̇, t) = l X ∂L(q, q̇, t) q̇ν − L(q, q̇, t) ∂ q̇ν ν=1 (4.12) A la función energı́a expresada en términos de las variables hamiltonianas se le llama la función hamiltoniana: H(q, p, t) ≡ h(q, p, t) = h[q, q ′ (q, p, t), t] = l X ν=1 pν q̇ ν − L(q, p, t) (4.13) Los generadores de la transformación de Legendre. Sea X(x1 , x2 , ...xn ; α1 , α2 , ... αm ) una función que “genera” la siguiente transformación de variables (x1 , x2 , ...xn ) → (y1 , y2 , ...yn ): yi = ∂X ; ∂xi i = 1, 2, ...n (4.14) La formulación hamiltoniana / 87 entonces existe una transformación de las variables y1 , y2 , ...yn a las variables x1 , x2 , ...xn , la transformación inversa, “generada” por cierta función Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ): xi = ∂Y ; ∂yi i = 1, 2, ...n (4.15) Demostremos que las funciones X y Y están relacionadas por la fórmula: Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) = n X i=1 (4.16) xi yi − X(x1 , x2 , ...xn ; α1 , α2 , ...αm ) En efecto, es posible expresar las variables xi en términos de las yi : xi = fi (x1 , x2 , ...xn ; α1 , α2 , ...αm ) ; i = 1, 2, ...n (4.17) Con lo cual escribimos (4.16) como: Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) = n X k=1 (4.18) yk fk − X(f1 , f2 , ...fn , α1 , α2 , ...αm ) Entonces: n X ∂Y = ∂yi k=1 ∂fk yk + fk δik ∂yi n X ∂fk k=1 ∂fk yk − yk ∂yi ∂yi − n X ∂X ∂fk = ∂fk ∂yi k=1 (4.19) + fi = xi Demostremos el siguiente teorema: ∂X ∂Y =− ; ∂αi ∂αi i = 1, 2, ...m (4.20) Para evaluar ∂y/∂αi usemos la ecuación (4.18): n n k=1 k=1 X ∂fk X ∂X ∂fk ∂X ∂Y = yk − − ∂αi ∂αi ∂fk ∂αi ∂αi (4.21) En virtud de (4.14), los términos de la sumatoria se cancelan, con lo cual queda demostrado el teorema. Una transformación de este tipo es llamada transfomación de Legendre (1752-1833). En sı́ntesis, las fórmulas caracterı́sticas de una transformación de Legendre son: X = X(x1 , x2 , ...xn ; α1 , α2 , ...αm ) (4.22) 88 / Mecánica clásica avanzada Y = Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) yi = ∂X ; ∂xi Y = X k xi = ∂Y ; ∂yi xk yk − X ; (4.23) i = 1, 2, ...n ∂X ∂Y =− ; ∂αi ∂αi (4.24) i = 1, 2, ...m (4.25) Las ecuaciones de movimiento hamiltonianas. La transformación de las variables lagrangianas a las hamiltonianas es una transformación de Legendre generada por la función L. Aquı́ las q̇ν hacen el papel de las xi , el conjunto (q), t, hace el papel de las (α), y las pν hacen el papel de las yi ; L es X. Comparando (4.13) y (4.16) vemos que H es Y : H(q, p, t) = l X ν=1 pν q̇ν − L(q, q̇, t) (4.26) Es decir, L genera la transformación (q̇) → (p) y H genera la transformación inversa (p) → (q̇): q̇ν = ∂H(q, p, t) ∂pν (4.27) De las ecuaciones (4.20) se sigue inmediatamente que: ∂H ∂L =− ; ∂qν ∂qν ν = 1, 2, ...l (4.28) ∂H ∂L =− ∂t ∂t (4.29) teniendo en cuenta que el conjunto (q), t, hace el papel de las (α). De las ecuaciones de Lagrange se sigue que: ∂L d ∂L = − fν = ṗ − fν ; ∂qν dt ∂ q̇ν ν = 1, 2, ...l (4.30) Las ecuaciones (4.27) a (4.30) nos dan: q̇ν = ∂H ; ∂pν p˙ν = − ∂H + fν ; ∂qν ν = 1, 2, ...l (4.31) Las ecuaciones (4.31) se denominan las ecuaciones canónicas de Hamilton y constituyen las ecuaciones de movimiento en las variables hamiltonianas. Son 2l ecuaciones diferenciales que involucran sólo primeras derivadas de (q) y (p), en tanto que las de Lagrange son l ecuaciones deferenciales de segundo orden en las (q). En esencia sólo el segundo conjunto de ecuaciones (4.31) constituye las ecuacionnes de movimiento, pues el primer conjunto sólo proporciona la transformación inversa a pν = ∂L/∂ q̇ν . La formulación hamiltoniana / 89 La función hamiltoniana. H no sólo permite escribir las ecuaciones de movimiento sino que tiene significado fı́sico directo. Veamos qué es Ḣ: l X ∂H ∂H ∂H Ḣ = q̇ν + ṗν + ∂q ∂p ∂t ν ν ν=1 = l X [(fν − ṗν ) q̇ν + q̇ν ṗν ] + l X fν q̇ν + ν=1 = ν=1 ∂H ∂t (4.32) ∂H ∂t Si las ligaduras reónomas no dan lugar a que t aparezca en H y el potencial no depende del tiempo, ∂H/∂t = 0, y si además no hay fuerzas no derivables del potencial, se sigue que Ḣ = 0, o sea que H es una constante de movimiento. Si además las fuerzas son derivables de un potencial que no depende de las velocidades, sabemos de (3.112) que H = T + V . O sea que bajo estas condiciones la energı́a total E = T + V se conserva, de lo contrario se cumple que H es constante pero no es cierto que H = E. Si V no depende de (q̇) ni de t y las ligaduras reónomas no dan lugar a que t aparezca en H se cumple que ∂H/∂t = 0 y que H = T + V . En este caso: l d(T + V ) X dE = = fν q̇ν dt dt ν=1 (4.33) Luego, dE/dt es igual a la rata a la cual las fuerzas no conservativas realizan trabajo sobre el sistema. Si estas son nulas, la energı́a total se conserva. Por otra parte, si las fν son cero, o bien V depende de t, o las ligaduras reónomas dan lugar a que t aparezcan en H, dH ∂H = dt ∂t (4.34) Ejemplo 4.1.2 Usando la transformación de Legendre inversa, derivar las ecuaciones de movimiento lagrangianas a partir de las ecuaciones de movimiento hamiltonianas. Supongamos que fν = 0. Las ecuaciones de movimiento serán: q̇ν = ∂H ; ∂pν ṗ = − ∂H ; ∂qν ν = 1, 2, ...l (4.35) La transformación de Legendre inversa es (p) → (q̇) y está generada por H: q̇ν = ∂H(q, p, t) ; ∂pν ν = 1, 2, ...l (4.36) El generador de la transformación (q̇) → (p) es L: L(q, q̇, t) = l X ν=1 q̇ν pν − H(q, p, t) (4.37) 90 / Mecánica clásica avanzada En virtud del teorema dado por (4.20): ∂L ∂H =− ; ∂qν ∂qν ν = 1, 2, ...l ; ∂L ∂H =− ∂t ∂t (4.38) O sea: ∂L = ṗν ; ∂qν ν = 1, 2, ...l (4.39) Como L genera la transformación (q̇) → (p) pν = ∂L ; ∂ q̇ν ν = 1, 2, ...l (4.40) Con lo cual llegamos a las ecuaciones de Lagrange: d ∂L ∂L = ; ∂qν dt ∂ q̇ν ν = 1, 2, ...l (4.41) Ejemplo 4.1.3 Hallar las ecuaciones de movimiento correspondientes a las variables (p), (ṗ) y t obtenidas mediante una transformación de Legendre. El generador de la transformación (q) → (−ṗ) es H: −ṗν = ∂H ; ∂qν ν = 1, 2, ...l (4.42) Entonces el generador de la transformación (−ṗ) → (q) será cierta función L′ (p, ṗ, t) dada por: L′ (p, ṗ, t) = l X (−ṗν )qν − H(q, p, t) (4.43) ν=1 En virtud del teorema (4.20): ∂L′ ∂H =− ; ∂pν ∂pν ν = 1, 2, ...l; ∂L′ ∂H =− ∂t ∂t (4.44) Como en virtud de las ecuaciones de Hamilton: ∂H = q̇ν ; ∂pν ν = 1, 2, ...l (4.45) y debido a que L′ genera la transformación (−ṗ) → (q) −qν = ∂L′ ; ∂ ṗν ν = 1, 2, ...l (4.46) Se sigue de (4.44), (4.45) y (4.46) que: d ∂L′ ∂L′ = −q̇ν = ; ∂pν dt ∂ ṗν ν = 1, 2, ...l (4.47) La formulación hamiltoniana / 91 Entonces las ecuaciones de movimiento lagrangianas para las variables (p) y (ṗ) son: ∂L′ (p, ṗ, t) d ∂L′ (p, ṗ, t) − = 0; ∂pν dt ∂ ṗν ν = 1, 2, ...l (4.48) Esta es la representación de momentos, que nos dice que mediante las variables (p), (ṗ) es posible describir completamente el sistema. Ejemplo 4.1.4 Hallar las ecuaciones de movimiento lagrangianas y hamiltonianas para una partı́cula de masa m en el potencial V = −k/r (r distancia del origen a la partı́cula). L=T −V = 1 2 k mṙ + 2 r (4.49) L es esféricamente simétrico, luego se conserva el momento angular ~l = m~r × ~r˙ : ~l es constante en magnitud y dirección. Entonces ~r y ~r˙ son perpendiculares a ~l y en consecuencia el movimiento es en un plano. Elegimos un sistema de coordenadas polares en el plano del movimiento, con lo cual: L= k 1 m(ṙ2 + r2 φ̇2 ) + 2 r (4.50) El sistema, para ~l dado, tiene en esencia dos grados de libertad, luego hay dos ecuaciones de Lagrange: mr̈ − mrφ̇ + k =0 y r2 mr2 φ̇ = constante (4.51) Como ~l vale: ~l = m~r × ~r˙ = mr2 φ̇k̂ (4.52) donde k̂ es un vector unitario normal al plano del movimiento, se sigue de (4.51) y (4.52) que: mr̈ − k l2 + 2 =0 mr3 r (4.53) La anterior es una ecuación que permite hallar a r(t) para l dado. Una vez conocido r(t), tenemos que φ(t) se determina al integrar: φ̇ = l mr2 (4.54) Para pasar al formalismo hamiltoniano partimos de las fórmulas de transformación: pr = ∂L = mṙ ; ∂ ṙ pφ = ∂L = mr2 φ̇ = l = constante ∂ φ̇ (4.55) 92 / Mecánica clásica avanzada El hamiltoniano será: H(r, φ, pr , pφ ) = pr ṙ + pφ φ̇ − L = p2φ p2r 1 + 2 − m m r 2 p2φ p2r 2 + r m2 m2 r 4 ! − k r (4.56) Con lo cual: H= p2φ p2r k − =T +V + 2m 2mr2 r (4.57) Las ecuaciones de Hamilton serán: ṙ = − φ̇ = ∂H pr = ; ∂pr m pφ ∂H = ; ∂pφ mr2 ṗr = − p2φ k ∂H =− 3 + 2 ∂r mr r (4.58) ∂H ṗφ = − =0 ∂φ Las ecuaciones (4.58) de la izquierda no son más que las ecuaciones de la transformación inversa a (4.55). Al reemplazar éstas en las ecuaciones (4.58) de la derecha, se obtienen las ecuaciones (4.51), como es de esperarse. Es decir, el formalismo hamiltoniano no aporta nada nuevo en cuanto a las ecuaciones de movimiento se refiere. Notamos que φ es cı́clica tanto en L como en H. En consecuencia pφ se conserva. H presenta las mismas simetrı́as que L y por tanto tiene los mismos teoremas de conservación. Ejemplo 4.1.5 Hallar el hamiltoniano y las ecuaciones de movimiento para una partı́cula en un sistema de coordenadas que rota uniformemente con velocidad angular ~ω . En el sistema de ejes espaciales: 1 L ~r, ~r˙ = m~r˙2 − V (~r) 2 (4.59) Si instantáneamente coinciden los ejes espaciales y los ejes rotantes, se cumple que: ~r = ~r ~r˙ = ~r˙ + ~ ω × ~r (4.60) donde ~r es el vector de posición de la partı́cula respecto a los ejes rotantes y ~r˙ su velocidad en esos ejes. Entonces usando la transformación (4.60), (4.59) tomará la forma: 1 2 2 ˙ ˙ ˙ ~ ~ ~ ~ ~ ~ − V ~r L r, r = m r + 2r · ~ω × r + ~ω × r (4.61) 2 Las componentes del momento canónico son: px = ∂L ... ∂ ẋ (4.62) La formulación hamiltoniana / 93 O vectorialmente: ~p = ∂L = m ~r˙ + ~ ω × ~r ∂~r˙ (4.63) La velocidad expresada en términos del momento es: ~ ~r˙ = p − ~ ω × ~r m (4.64) El lagrangiano (4.61) en términos de las variables hamiltonianas es: 1 p2 L ~r, ~p = − V ~r 2m (4.65) El hamiltoniano será: H ~r, ~p = X ν pν q̇ ν − L = ~p · ~p − ~ω × ~r m Con lo cual: H= 1 p2 ~ ω × ~r + V ~r −p· ~ 2m ! − 1 p2 + V ~r 2m (4.66) (4.67) ˙ H es: En términos de ~r y ~r, h= 2 1 ~˙ 2 1 mr − m ~ ω × ~r + V ~r 2 2 (4.68) Nótese que el hamiltoniano correspondiente a L(~r, ~r˙ ) difiere de h por el término m(~ω × ~r)2 /2. Comparando las ecuaciones (4.61) y (4.68) vemos que h no es T + V . De acuerdo con (3.124), h es T + V sólo si T es función cuadrática de las velocidades, en tanto que en este caso hay en T términos de las formas T1 y T0 . T2 = 1 2 mṙ 2 T1 = m~r˙ · (~ ω × ~r ) T0 = (4.69) 1 m(~ ω × ~r)2 2 h es una constante de movimiento porque L no depende del tiempo y no hay fuerzas disipativas, pero E = T + V no es constante de movimiento. De acuerdo con (3.126): Ė = Ṫ1 + 2Ṫ0 (4.70) Vemos que T1 + 2T0 actúan como un trabajo sobre el sistema que hace que E no sea constante. Esto es debido a la rotación del sistema de coordenadas. Sucede que en este caso la transformación ~r → ~r depende del tiempo debido a la rotación, con lo cual la transformación es de tipo reónomo. T1 + 2T0 es un potencial “ficticio” inercial. T1 94 / Mecánica clásica avanzada está asociada con la fuerza de Coriolis y T0 con la fuerza centrı́fuga. H puede escribirse como: H= p2 −~ ω · ~r × ~p + V ~r 2m (4.71) en términos de ~l = ~r × ~p se escribe como: H= p2 −~ ω · ~l + V ~r 2m (4.72) como ~r depende explı́citamente del tiempo, es de esperarse que ~l no se conserve. Las ecuaciones de movimiento son: ∂H ~ ∂V = p × ~ω − ∂~r ∂~r ~p˙ = − ~r˙ = ~p ∂H = − ~ω × ~r m ∂~p (4.73) Como suponemos a ~ω constante, ~p × ~ω ~˙ 1 ∂V ~¨r = p − ~ − ~ω × ~r ω × ~r˙ = − m m m ∂~r (4.74) Expresando en (4.74) a ~p en términos de ~r˙ obtenemos: 1 ∂V ~¨r + 2~ ω × ~r˙ + ~ ω × ~ω × ~r = − m ∂~r (4.75) Vemos que la fuerza en el sistema rotante no es masa por aceleración, sino que tiene dos términos adicionales, el centrı́fugo y el de Coriolis, que caracterizan el movimiento de una partı́cula descrito desde un sistema de referencia no inercial. 4.2. Simetrı́as y el teorema de conservación Una coordenada cı́clica en L también es cı́clica en H. En efecto, de las ecuaciones de Lagrange y de las ecuaciones de Hamilton se sigue respectivamente que: ∂L ∂qν ṗν = fν + ṗν = ∂H ; fν − ∂qν (4.76) ν = 1, 2, ...l Con lo cual siempre se cumple: ∂L ∂H =− ; ∂qν ∂qν ν = 1, 2, ...l (4.77) La formulación hamiltoniana / 95 que en realidad es una propiedad general de la transformación de Legendre (q̇) → (p) según (4.28). Se sigue que todos los resultados obtenidos para L en cuanto a la relación entre simetrı́as y teoremas de conservación se aplican directamente en el formalismo hamiltoniano. De (4.32) se sigue que si no hay fuerzas disipativas y H no contiene el tiempo explı́citamente (o, de (4.29), cuando L no contiene el tiempo explı́citamente): dH ∂H =− =0 dt ∂t (4.78) Además, si la transformación a coordenadas generalizadas no contiene el tiempo explı́citamente y V no depende de las velocidades, H = T + V = E, o sea que la energı́a se conserva. Si H no depende de t pero hay fuerzas disipativas: l X dA dH = fν q̇ν = dt dt ν=1 (4.79) Si además H = T + V = E, se sigue: dA dE = dt dt (4.80) Si la transformación de coordenadas depende del tiempo explı́citamente, V no depende de (q̇) y fν = 0, T = T0 + T1 + T2 (4.81) entonces se sigue que: pν = 2 l X Aµν q̇µ + Aν ; ν = 1, 2, ...l (4.82) µ=1 con lo cual H = T2 − T0 + V = E − T1 − 2T0 (4.83) la H anterior en general no se conserva. Simetrı́as de cambio de escala. Supongamos que el sistema es conservativo, de modo que E = T + V . Por simplicidad supondremos que no hay ligaduras, de modo que las coordenadas cartesianas pueden tomarse como coordenadas generalizadas independientes. La simetrı́a de cambio de escala se da en una clase restringida de sistemas: aquellos en los cuales la energı́a potencial V es una función homogénea de grado k: V (λ~r1 , λ~r2 , ...λ~rN ) = λk V (~r1 , ~r2 , ...~rN ) (4.84) En coordenadas cartesianas T no depende de las coordenadas y es una función homogénea cuadrática de las velocidades: ˙ ) = λ2 T (~r˙ 1 , ~r˙ 2 , ...~r˙ N ) T (λ~r˙1 , λ~r˙2 , ...λ~rN (4.85) 96 / Mecánica clásica avanzada Supongamos la siguiente transformación de cambio de escala en las longitudes y tiempos: ~ri t → α~ri ; i = 1, 2, ...N (4.86) → βt Entonces: V → αk V ; T → 2 α T β (4.87) El cambio en H será: 2 α T + αk V H→ β (4.88) H será función homogénea de grado k bajo la transformación (4.86) si: α2 = αk ; β2 H → αk H (4.89) Esta transformación no cambia la forma de las ecuaciones de Hamilton: α2 1 β 2 ∂H α 1 ∂H → ~r˙ i = ; ~r˙ i = m ∂~r˙ i β m α ∂~r˙ i β i = 1, 2, ...N α2 α ∂H β 2 ∂H → m 2 ~¨r i = m~¨ri = − ∂~ri β α ∂~ri (4.90) (4.91) Esta transformación pertenece a la clase de las transformaciones canónicas, o sea a las transformaciones que no cambian la forma de las ecuaciones canónicas. La ecuación (4.86) dice que si las longitudes l se cambian por l′ = αl y los tiempos t por t′ = βt, el sistema tendrá simetrı́a de cambio de escala si α y β son tales que se cumple (4.89), β = α1−k/2 , o sea si la transformación en longitudes y tiempos cumple: ′ 1−k/2 t′ l (4.92) = t l La ecuación (4.92) permite obtener algunas simples relaciones entre los perı́odos de oscilación de sistemas periódicos que sólo difieren entre sı́ por sus dimensiones caracterı́sticas y para los cuales V sea función homogénea. Para el péndulo simple, donde el potencial mgz es función homogénea de grado 1: r t′ l′ = , (4.93) t l como se ve, es general; vale no sólo para pequeñas oscilaciones. La formulación hamiltoniana / 97 Para el oscilador armónico simple V es función homogénea de grado k = 2. En este caso: t′ =1 t (4.94) Nos dice que el perı́odo del movimiento no depende de la amplitud. Para el potencial gravitacional, V = −Gm1 m2 /r, k = −1. Entonces: t′ = t ′ 3/2 l l (4.95) En este caso la longitud caracterı́stica es la distancia media al sol. La ecuación (4.95) expresa la tercera ley de Kepler, que vale para un potencial del tipo 1/r solamente. Una transformación canónica se refiere sólo a transformaciones de las coordenadas y momentos, pero no del tiempo. Sin embargo, la transformación (4.86), cuando las coordenadas cartesianas son a la vez generalizadas, es equivalente a la transformación canónica ~ri → α~ri ; ~ pi → (α/β)~ pi , i = 1, 2, ...N . En rigor (4.86) debe llamarse transfomación de semejanza mecánica. 4.3. La segunda forma del principio de Hamilton La segunda forma del principio de Hamilton es simplemente el principio variacional del cual puede obtenerse la trayectoria del sistema en el espacio de fases. En otras palabras, se busca hallar qué principio variacional conduce a las ecuaciones de Hamilton como ecuaciones de Euler-Lagrange, en el espacio de fases: Z x2 ∂f d ∂f − =0 (4.96) f (y, y ′ , x)dx = 0 implica que δ ′ dx ∂y ∂y x1 Sea la función: L̃(q, p, q̇, ṗ, t) = l X ν=1 pν q̇ν − H(p, q, t) (4.97) L̃ es función de las variables señaladas tomadas independientemente. En particular (p) y (q̇) toman todos los valores compatibles con las ligaduras, independientemente de que se puedan relacionar mediante una transfomación de Legendre. Sea ahora el siguiente principio variacional en el espacio de fases: δ Z t2 L̃(q, p, q̇, ṗ, t) dt = 0 (4.98) t1 Con las condiciones en los extremos: δpν = 0 , δqν = 0 en t = t1 y t = t2 ; ν = 1, 2, ...l (4.99) 98 / Mecánica clásica avanzada Las ecuaciones correspondientes de Euler-Lagrange son: d ∂ L̃ ∂ L̃ − = 0; dt ∂ q̇ν ∂qν ν = 1, 2, ...l d ∂ L̃ ∂ L̃ − = 0; dt ∂ ṗν ∂pν ν = 1, 2, ...l (4.100) Las ecuaciones (4.97) y (4.100) conducen a las ecuaciones canónicas de Hamilton. L̃ y L coinciden solamente sobre las trayectorias verdaderas, para las cuales se debe cumplir que: pν = ∂L ∂ q̇ν ν = 1, 2, ...l (4.101) El espacio de fases. La formulación lagrangiana está definida en el espacio de configuración l-dimensional constituido por las coordenadas generalizadas q1 , q2 , ...ql . Matemáticamente, el espacio de configuración puede considerarse como una variedad diferenciable de l dimensiones. El espacio de los momentos generalizados también es l dimensional y está constituido por los p1 , p2 , ...pl y se llama espacio de los momentos, que también es una variedad diferenciable de l dimensiones. Como sabemos, el estado del sistema puede describirse igualmente por (q, q̇) o por (p, ṗ), o por dos puntos del espacio de configuración o el de momentos respectivamente. q1 , q2 , ...ql ; p1 , p2 , ...pl forman el espacio de fases que es una variedad diferenciable 2l-dimensional. Cada punto del espacio de fases representa un estado del sistema y cada trayectoria de fases representa un estado de movimiento del sistema. En efecto, las variables hamiltonianas (q, p) especifican exhaustivamente el estado del sistema. Ejemplo 4.3.1 Sea una partı́cula de masa m sometida a la condición de ligadura de moverse sobre la superficie de un cilindro, y sometida a una fuerza restauradora lineal dirigida hacia el centro del cilindro, F~ = −k~r, donde se toma el origen de coordenadas en el centro del cilindro. Hacer un estudio de la trayectoria en el espacio de fases. Tomando el eje z a lo largo del eje del cilindro, la condición de ligadura se puede expresar por: x2 + y 2 = R2 (4.102) Las coordenadas generalizadas pueden tomarse θ, z, donde θ es un ángulo en el plano perpendicular al eje del cilindro. Entonces L(θ, θ̇, z, ż) será: 1 1 m(R2 θ̇2 + ż 2 ) − k(R2 + z 2 ) 2 2 Los momentos canónicos son: L=T −V = pθ = mR2 θ̇ ; pz = mż (4.103) (4.104) El hamiltoniano será: H =T +V = 1 p2θ p2z + kz 2 + 2 2m 2mR 2 (4.105) La formulación hamiltoniana / 99 donde hemos suprimido una constante aditiva. Planteando las ecuaciones de Hamilton e integrándolas se llega a la solución: θ = θ0 + at z = z0 sen (4.106) r k t+δ m ! (4.107) donde θ0 , a, z0 y δ son constantes de integración. Las ecuaciones (4.106) y (4.107) permiten hallar la ecuación de la trayectoria en el espacio de configuración: ! r 1 k θ+φ , (4.108) z = z0 sen a m p gráficamente tomamos θ0 = 0, δ = 0, de modo que φ = 0. Llamando ω = k/m obtenemos: ω (4.109) θ = at ; z = z0 sen ωt ; z = z0 sen θ a x R –R m z –z0 z0 R y –R w=a Figura 4.1 Partı́cula constreñida a moverse sobre la superficie de un cilindro La figura 4.1 representa el caso en que ω = a. La trayectoria en el espacio de configuración siempre será cerrada cuando ω/a sea un número racional. La proyección del movimiento sobre el eje z es armónica simple y sobre el plano x − y es circular uniforme. Como l = 2, el espacio de fases es 4-dimensional, constituido por θ, pθ , z, pz . Como pθ es constante, pθ = mR2 a, basta representar la proyección del espacio 4-dimensional sobre el subespacio 3-dimensional θ, z, pz . La proyección de la trayectoria de fases sobre pθ es un punto. El movimiento en z es armónico simple. El diagrama de fases ż, z, es una elipse. Igualmente la proyección de la trayectoria de fases sobre el plano z, pz será una elipse. El 100 / Mecánica clásica avanzada diagrama de fases θ̇, θ, es una lı́nea recta, como también la proyección de la trayectoria de fases sobre el plano θ, pθ . La proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz , es una hélice elı́ptica. Esto es representado en la figura 4.2. pz Ez = cte pθ pθ = cte θ z pθ = mR2a pz2 1 Ez = + kz 2 zm i2 pθ pz pθ = cte θ z Superficie Ez = cte Figura 4.2 Arriba: diagramas de fases sobre los planos z-pz y θ-pθ respectivamente. Abajo: Proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz . Para este ejemplo, el principio de Hamilton dice que la trayectoria correcta en el espacio de configuración es aquella para la cual la integral de acción es extremal: # Z t2 "X Z t2 l ∂L L(q, q̇, t) dt = δ δ q̇ν − h(q, q̇, t) dt = 0 ∂ q̇ν t1 t1 ν=1 (4.110) {δqν (t1 ) = δqν (t2 ) = 0} En tanto que el principio de Hamilton en el espacio de fases (segunda forma del principio de Hamilton) dice que la trayectoria correcta en el espacio de fases es aquella para la cual es extremal la integral sobre dt de L̃ (véase figura 4.2): δ Z t2 L̃(q, q̇, p, ṗ, t) dt = δ Z l t2 X t1 ν=1 t1 [pν q̇ν − H(q, p, t)] dt = 0 δqν (t1 ) = δqν (t2 ) = 0 δpν (t1 ) = δpν (t2 ) = 0 (4.111) La formulación hamiltoniana / 101 4.4. Las transformaciones puntuales. Las transformaciones en el espacio de fases Puntuales son las transformaciones de un sistema de coordenadas generalizadas a otro: qν → q ν = q ν (q, t) ; ν = 1, 2, ...l (4.112) Las velocidades generalizadas se transforman como: q̇ µ = l X ∂q ν ∂q q̇µ + ν = q̇ ν (q, q̇, t) ; ∂qµ ∂t ν=1 ν = 1, 2, ...l (4.113) Bajo estas transformaciones, tanto las ecuaciones de Lagrange como las de Hamilton son covariantes. Transformaciones en el espacio de fases. Son transformaciones más generales que las puntuales. Si para definir el estado del sistema se requiere todo el espacio de fases, podemos pensar que cualquier conjunto de variables (2l) sirve equivalentemente para describir el estado. Un cambio de variables en el espacio de fases involucra no sólo las coordenadas generalizadas sino también los momentos: qν , pν → q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l (4.114) Ejemplo 4.4.1 Un oscilador armónico unidimensional. El espacio de fases es bidimensional, definido por las “coordenadas cartesianas” x − px . Definir en el espacio de fases una transformación a “coordenadas polares”; hallar a H y las ecuaciones de Hamilton en esas variables (véase figura 4.3). Nota: es irrelevante reemplazar a px por px /mω. La transformación a coordenadas polares está dada por: p2x = r2 m2 ω 2 px tan φ = mωx x+ (4.115) (4.116) Entonces H se transforma ası́: H= p2x 1 p2 1 1 + mω 2 x2 = mω 2 x2 + 2x 2 = mω 2 r2 2m 2 2 m ω 2 (4.117) Es decir, el nuevo hamiltoniano es: 1 mω 2 r2 2 Las ecuaciones de Hamilton se transforman ası́: ∂H ∂r ∂H ∂φ ∂H = + ẋ = ∂px ∂r ∂px ∂φ ∂px H= ∂H px 1 ∂H = + ∂r m2 ω 2 r ∂φ mωx sec2 φ (4.118) (4.119) 102 / Mecánica clásica avanzada px / mω r ϕ x Figura 4.3 Espacio de fases para el oscilador armónico unidimensional ṗx = − ∂H ∂x =− =− ∂H ∂φ ∂H ∂r + ∂r ∂x ∂φ ∂x −px ∂H x ∂H + ∂r r ∂φ mωx2 sec2 φ (4.120) Se obtiene entonces para ∂H/∂px y ∂H/∂x: ∂H ∂H senφ ∂H cos φ = + ∂px ∂r mω ∂φ mωr (4.121) ∂H ∂H ∂H sen φ = cos φ − ∂x ∂r ∂φ r Por otra parte se tiene para ẋ y ṗx : ẋ = ∂x ∂x φ̇ = cos φ ṙ − r senφ φ̇ ṙ + ∂r ∂φ (4.122) ṗx = ∂px ∂px φ̇ = mω senφ ṙ + mωr cos φ φ̇ ṙ + ∂r ∂φ o sea que las ecuaciones de Hamilton se transforman en: cos φ ṙ − r senφ φ̇ = ∂H senφ ∂H cos φ + ∂r mω ∂φ mωr (4.123) La formulación hamiltoniana / 103 mω senφ ṙ + mωr cos φ φ̇ = − ∂H ∂H senφ cos φ + ∂r ∂φ r (4.124) Podemos resolver simultáneamente a (4.123) y (4.124) para ṙ y φ̇. El resultado se obtiene fácilmente con notación matricial:    ṙ cos φ −senφ   = senφ cos φ rφ̇  ∂H senφ cos φ  ∂r 1     1 ∂H mω − cos φ senφ r ∂φ    (4.125)     Esto se puede escribir también como:     ṙ cos φ senφ cos φ −senφ    = −senφ cos φ senφ cos φ rφ̇  ∂H cos φ +senφ senφ cos φ  ∂r 1     mω  1 ∂H −senφ cos φ − cos φ senφ r ∂φ    De donde:  ∂H ṙ 0 1  ∂r  = 1    mω  1 ∂H −1 0 rφ̇ r ∂φ       (4.126)       1 ∂H   1    r ∂φ  =    mω  ∂H  − ∂r (4.127) Con lo cual las ecuaciones de movimiento en las nuevas variables son: r= 1 ∂H ; mωr ∂φ φ̇ = − 1 ∂H mωr ∂r (4.128) Vemos que en las variables (r, φ) las ecuaciones de movimiento no toman la misma forma que las ecuaciones canónicas (no son r = ∂H/∂φ; φ̇ = −∂H/∂r, por ejemplo). En general, una transformación de variables en el espacio fásico cambia la forma de las ecuaciones de movimiento. En general, las ecuaciones de Hamilton no son covariantes bajo transformaciones arbitrarias en el espacio de fases. Notemos sin embargo, que hay una transformación canónica en términos de (r, φ). Hagamos ahora el nuevo cambio de variables: (r, φ) → (r2 , φ) (4.129) 104 / Mecánica clásica avanzada Si llamamos ρ = r2 , tenemos que: ∂H ∂H = 2r ; ∂r ∂ρ ρ̇ = 2r ṙ (4.130) O sea que las ecuaciones de Hamilton para las variables (ρ, φ), que obtenemos de (4.128) y (4.130), son: mω ∂H ρ̇ = ; 2 ∂φ φ̇ = − 2 ∂H mω ∂ρ Notemos finalmente que si llamamos q, p, a: mω q = −φ ; p = ρ 2 (4.131) (4.132) las ecuaciones (4.131) se convierten en: ṗ = − ∂H ; ∂q q̇ = ∂H ∂p (4.133) O sea que la transformación en el espacio fásico bidimensional definida por: r √ 2p cos q ; x= px = − 2ωp senq mω (4.134) 2 mω p p x p= x2 + 2x 2 ; q = −tan−1 2 m ω mωx deja covariantes las ecuaciones de Hamilton, donde el nuevo hamiltoniano se obtiene del anterior simplemente expresando a x y px en función de q y p mediante las fórmulas (4.134): H = (q, p) = H [x(q, p), px (q, p)] (4.135) Se dice entonces que la transformación (4.134) es canónica. La referencia hecha en el enunciado al oscilador armónico no es importante, pues la covariancia de las ecuaciones de Hamilton bajo la transformación (4.134) no depende de la forma de H, siendo aplicable a cualquier sistema de un grado de libertad. En general, a la pregunta acerca de la covariancia de las ecuaciones de Hamilton bajo una transformación arbitraria en el espacio de fases, (q, p) → (q, p), se responde que no necesariamente son covariantes. Pero existe una clase de transformaciones para las cuales esto se cumple; tales transformaciones se llaman canónicas o de contacto. La transformación empleada en las ecuaciones (4.90), (4.91) y (4.134), son ejemplos de transformaciones canónicas. Ejemplo 4.4.2 Efectuar una rotación con velocidad angular constante a en el espacio de fases bidimensional. Mostrar que tal transformación es canónica sólo si al nuevo hamiltoniano se le adiciona un término. Mostrar que las fórmulas de transformación y el nuevo hamiltoniano se pueden obtener a partir de las primeras derivadas de cierta función F (q, q, t). Mostrar que F satisface una ecuación diferencial parcial si se anula el nuevo hamiltoniano, lo cual es posible para un oscilador armónico. La formulación hamiltoniana / 105 Las fórmulas de la transformación y su inversa son: p q = q cos at + sen at ; p = −cq sen at + p cos at c q q = q cos at − sen at ; p = cq sen at + p cos at c donde a y c son parámetros de la transformación que permanecen constantes. Es simple probar que:      q̇  q̇ cos at −sen at        =  ṗ ṗ sen at cos at c c   q  −sen at − cos at   +a   p  cos at −sen at c y que:     ∂H ∂H   cos at −sen at     ∂p ∂p       =    1 ∂H   1 ∂H  sen at cos at − − c ∂q c ∂q Igualando los lados derechos de (4.137) y (4.138) obtenemos:  ∂H      q  q̇ 0 −1   ∂p        =  + a  p   1 ∂H  q̇ 1 0 − c c c ∂q (4.136) (4.137) (4.138) (4.139) Las ecuaciones de movimiento para las variables q y p son: a ∂H = q̇ − p ; ∂q c ∂H = −ṗ − acq ∂q (4.140) Estas ecuaciones serán de forma canónica solamente si se cambia el nuevo hamiltoniano:1 2 p 1 (4.141) H(q, p) = H [q(q, p), p(q, p)] + a + cq 2 2 c Notemos que las ecuaciones (4.136) permiten expresar a p/c y p/c en términos de q, q: q − q cos at p = ; c sen at 1 En p −q + q cos at = c sen at (4.142) general una transformación dependiente del tiempo es canónica si H es igual a H más ciertos términos adicionales. 106 / Mecánica clásica avanzada Si F es la función de q, q y t siguiente: F (q, q, t) = c 2qq − (q 2 + q 2 ) cos at 2 sen at (4.143) Comparando a (4.142) y (4.143) vemos que: p= ∂F (q, q, t) ; ∂q p=− ∂F (q, q, t) ∂q (4.144) Como las ecuaciones (4.144) son completamente equivalentes a las ecuaciones de transformación (4.136), se dice que F es la función generatriz de la transformación, que será canónica solamente si el nuevo hamiltoniano es: H =H+ ∂F ∂t (4.145) puesto que, ∂F (q, q, t) −2qq cos at + q 2 + q 2 ca = ca = 2 ∂t 2 sen at 2 p2 2 q + 2 c (4.146) Los anteriores resultados valen para cualquier sistema de un grado de libertad. Para un oscilador armónico encontramos que: k 2 1 c2 p2 H[q(q, p), p(q, p)] = + q + − k q 2 sen2 at 2m 2 2 m (4.147) p2 k c 1 k q p sen at cos at + sen2 at + − − m c 2 c2 m Si escogemos el valor de c tal que: c2 = km (4.148) Obtenemos que: H(q, p) = k q2 a p2 + q 2 + ( + cq 2 ) 2m 2 2 c (4.149) H será cero solamente si a y c cumplen: 1 a + = 0; m c k + ac = 0 (4.150) Es decir, si a =√ −c/m = −k/c, valor que es compatible con el valor de c dado por (4.148). Como c = ± km, a debe valer: r k (4.151) a=± m Tomamos negativo el valor de c para que a sea positiva y coincida con la frecuencia p del oscilador ω = k/m. Notamos que H = 0 implica que q y p son constantes, o sea que las fórmulas (4.136) nos dan directamente la solución en términos de q y p que se La formulación hamiltoniana / 107 determinan por las condiciones iniciales de q y p.2 Es simple verificar que F satisface la ecuación diferencial llamada de Hamilton-Jacobi para el oscilador armónico: 2 ∂F 1 ∂F 1 + kq 2 + =0 (4.152) 2m ∂q 2 ∂t F es una solución de (4.152) que no posee la propiedad de ser la suma de una función de t y una función de q. Posteriormente veremos que (4.152) posee otra solución por el método de separación de variables (llamada solución completa) que genera otra trasformación canónica que anula el hamiltoniano para un oscilador armónico. 4.5. Las transformaciones canónicas o de contacto Estas transformaciones en el espacio de fases son importantes, entre otras cosas, porque conservan el formalismo canónico y permiten reemplazar el hamiltoniano H por una H que tenga una forma mucho más simple. Ası́ por ejemplo, es posible mediante una transformación canónica hacer que todas las coordenadas sean cı́clicas; con ello la solución de un problema mecánico se reduce a un problema de geometrı́a en el espacio de fases: hallar la transformación canónica adecuada. Ejemplo 4.5.1 Mostrar que la transformación de cambio de escala es canónica independientemente de las propiedades de homogeneidad del potencial. Tal transformación es: q ν = αqν ; pν = βpν ; α 6= 0 , β 6= 0 ; ν = 1, 2, ...l (4.153) Mediante esta transformación se tiene: ∂H ∂H =α ; ∂qν ∂q ν 1 q̇ν = q˙ν ; α ∂H ∂H =β ∂pν ∂pν 1 ṗν = ṗν ; β (4.154) ν = 1, 2, ...l con lo cual las ecuaciones de Hamilton se convierten en: q̇ ν = αβ ∂H ; ∂pν ṗν = −αβ ∂H ; ∂q ν ν = 1, 2, ...l (4.155) En las nuevas variables (q, p) las ecuaciones de movimiento serán de la forma canónica solamente si se cambia el hamiltoniano. H(q, p, t) = αβH(q, p, t) (4.156) 2 También H = 0 si tomamos C = mω, a = −ω. Como el punto representativo del estado del oscilador en el espacio fásico (véase figura 4.3), rota en el sentido de las agujas del reloj con velocidad angular ω, con las coordenadas q y q se verá el punto estacionario. H describe pues, un problema de equilibrio. 108 / Mecánica clásica avanzada Este ejemplo, al igual que los dos anteriores, ilustra el hecho de que el carácter canónico de una transformación es algo inherente a la transformación misma, independientemente de la forma del hamiltoniano, en particular, independientemente de sus propiedades de simetrı́a. Por esto cualquier sistema de l grados de libertad posee ecuaciones de movimiento covariantes bajo la transformación (4.153), aunque solamente si el potencial es función homogénea de las coordenadas el sistema posee simetrı́a de semejanza mecánica, ecuación (4.92). Ası́ mismo las transformaciones (4.115) y (4.116), no canónicas, y (4.134), canónica, pueden hacerse sin referencia alguna a la forma del hamiltoniano. Sin embargo, para un hamiltoniano dado, sólo cierta transformación canónica permite obtener un nuevo hamiltoniano de forma simple. Ası́, para un oscilador armónico lineal la transformación canónica (4.134) conduce a que H = ωp, o sea a que φ sea cı́clica en H. Sin embargo (4.134) es aplicable a cualquier sistema de un grado de libertad. De forma similar (4.136) conduce a H = 0 para el oscilador. Ejemplo 4.5.2 Mostrar que es canónica la transformación: q ν = αpν ; pν = βqν ; α 6= 0 , β 6= 0 ; ν = 1, 2, ...l (4.157) En este caso: H = −αβH (4.158) En particular, la transformación con α = 1, β = −1: q ν = pν ; pν = −qν ; ν = 1, 2, ...l, (4.159) es canónica con H = H. Este ejemplo muestra que las nociones de “coordenada” y “momento” pierden su sentido inicial, pues mediante una transformación canónica (T.C.) es posible hacer que los momentos pasen a hacer el papel de coordenadas y viceversa. Como en general q ν = q ν (q, p, t) y pν = pν (q, p, t), con las fórmulas inversas qν = qν (q, p, t); pν = pν (q, p, t), se ve que se requieren tanto (q) como (p) para poder especificar la posición del sistema en el espacio de configuración. (q) y (p) no son pues “coordenadas” y “momentos” generalizados, sino simplemente pares de cantidades canónicamente conjugadas. En conclusión, en el espacio de fases el estado del sistema se especifica mediante un conjunto completo (de 2l) de cantidades canónicamente conjugadas. 4.6. La función generatriz de una transformación canónica Las ecuaciones canónicas pueden deducirse de un principio variacional en el espacio de fases (segunda forma del principio de Hamilton) y viceversa: ! Z t2 X l ∂H δ pν q̇ν − H dt = 0 ↔ q̇ν = ∂pν t1 ν=1 (4.160) ∂H ; ν = 1, 2, ...l ṗν = − ∂qν La formulación hamiltoniana / 109 que: Si la transformación (q, p) ↔ (q, p) es canónica, entonces debe también cumplirse δ Z l X t2 t1 ! pν q̇ ν − H ν=1 ṗν = − ∂H ; ∂qν dt = 0 ↔ q̇ ν = ∂H ; ∂pν (4.161) ν = 1, 2, ...l Las ecuaciones (4.160) y (4.161) indican que hay dos expresiones variacionales de las cuales pueden deducirse las ecuaciones de Hamilton. De acuerdo con la propiedad enunciada en (3.76), se sigue que los integrandos en las variacionales deben diferir a lo sumo por la derivada total respecto al tiempo de una función arbitraria de las “coordenadas” de que depende dicho integrando y del tiempo, o sea de (q, p, t), o de (q, p, t): l X ν=1 pν q̇ν − H = l X ν=1 pν q̇ ν − H + d F (q, p, t) dt (4.162) Debido a que (q, p) y (q, p) están relacionadas mediante la transformación canónica, F (q, p, t) puede expresarse en función de cualquier subconjunto de 2l cantidades independientes extraidos del conjunto de 4l cantidades (q, p, q, p) dependientes. La ecuación (4.162) puede escribirse como: dF = l X ν=1 pν dqν − l X ν=1 pν dq ν + H − H dt (4.163) En el caso en que las 2l cantidades (q, q) sean independientes, podemos expresar a F en función de (q, q, t). En ese caso la T.C. se llama “transformación canónica libre de la primera clase”. Matemáticamente, la independencia de las 2l cantidades (q, q) se expresa mediante la condición de que el jacobiano de las (q) respecto a las (p) sea diferente de cero, lo cual garantiza que las (p) se puedan expresar en términos de las (q): ∂qµ q 1 , q 2 , ...q l J ≡ det 6= 0 (4.164) p1 , p2 , ...pl ∂pν Si se cumple (4.164) entonces es posible expresar los pν en función de (q, q, t) y por lo tanto representar cualquier función de (q, p, t) en términos de (q, q, t). En este caso es posible escribir: F (q, p, t) = F1 (q, q, t) (4.165) Esto permite escribir: dF = dF1 = l l X X ∂F1 ∂F1 ∂F1 dqν + dq ν + dt ∂qν ∂qν ∂t ν=1 ν=1 (4.166) Como las 2l + 1 cantidades (dq, dq, dt) son independientes, vemos que para una transfomación canónica libre de la primera clase, de (4.163) y (4.166) se sigue que: pν = ∂F1 (q, q, t) ; ∂qν pν = − ∂F1 (q, q, t) ; ∂qν ν = 1, 2, ...l (4.167) 110 / Mecánica clásica avanzada Además se sigue que: ∂F1 (q, q, t) (4.168) dt La ecuación (4.167) dice que a cada transformación canónica libre de la primera clase le corresponde una función F1 y viceversa. F1 se llama la función generatriz de la transformación canónica.3 H(q, p, t) − H(q, p, t) = Ejemplo 4.6.1 Hallar la transformación canónica generada por la función: F1 (q, q, t) = − l X qν q ν (4.169) ν=1 En (4.169) está implı́cito que (q) y (q) son independientes. Por lo tanto las fórmulas de la transformación canónica serán: ∂F1 (4.170) pν = = −q ν ⇒ q ν = −pν ; ν = 1, 2, ...l ∂qν pν = − ∂F1 = qν ⇒ pν = qν ; ∂qν ν = 1, 2, ...l (4.171) Es esencialmente la misma transformación (4.159), que intercambia coordenadas y momentos. Este ejemplo muestra que cada función de (q, q, t) define una transformación canónica Ejemplo 4.6.2 Probar que la transformación canónica (4.134) es libre de la primera clase. Hallar la correspondiente función F1 . Sea q = x y p = px . Las fórmulas de transformación serán entonces: r p 2p q= cos q ; p = − 2mωp sen q mω p2 1 p p = mω x2 + 2 2 ; q = −tan−1 2 m ω mωq El jacobiano (4.164) es trivial y diferente de cero: ∂q q J 6= 0 = p ∂p (4.172) (4.173) (4.174) O sea que la transformación es libre de la primera clase y puede ser generada por cierta función de las variables independientes q y q. La transformación no depende del tiempo, pues suponemos a m y a ω constantes. Notamos de (4.174) que toda transformación canónica no puntual es libre de primera clase para sistemas de un grado de libertad. F1 (q, q, t) ha de ser tal que, de acuerdo con (4.163): p2 1 dF1 = p dq − pdq = p dq − mω q 2 + 2 2 dq (4.175) 2 m ω 3 La función del ejemplo 4.4.2, (4.143), es la función generatriz de la transformación canónica (4.136). La formulación hamiltoniana / 111 Debemos expresar a p en términos de q y q lo cual se obtiene directamente de (4.173): p = −mωq tan q (4.176) Reemplazando a (4.176) en (4.175) obtenemos: 1 = −mωq tan q dq − mωq 2 sec2 q dq 2 1 2 q tan q = −mωd 2 dF1 (4.177) Se sigue entonces que, salvo una constante aditiva: 1 F1 (q, q) = − mωq 2 tan q 2 (4.178) Podemos probar directamente, usando las fórmulas (4.167), que F1 dada por (4.178) efectivamente genera la transformación dada por (4.172) y (4.173): ∂F1 = −mωq tan q ; ∂q ∂F1 1 = − mωq 2 sec2 q ∂q 2 (4.179) O sea que: p = −mωq tan q ; p= 1 mωq 2 sec2 q 2 (4.180) Al despejar en (4.180) a p y q obtenemos a (4.170), y al despejar a p y q obtenemos a (4.173). Notemos que −Et − mωq 2 tan q/2 es una solución a la ecuación de HamiltonJacobi (4.152). Ejemplo 4.6.3 Sea una partı́cula descrita por el hamiltoniano: H= p2 − aq 2m (4.181) donde m y a son constantes. Hallar la T.C. que lleva al hamiltoniano: H=0 (4.182) En las nuevas variables las ecuaciones de Hamilton con H = 0 conducen a la solución trivial: p = constante ; q = constante (4.183) La transformación ha de ser tal que se cumpla para F1 , según (4.167) y (4.168): ∂F1 = p; ∂q ∂F1 = −p ; ∂q −H = ∂F1 ∂t (4.184) 112 / Mecánica clásica avanzada Se sigue de (4.181) y (4.184) que F1 debe ser solución a la ecuación diferencial de Hamilton-Jacobi: 2 1 ∂ ∂ F1 (q, q, t) − aq = − F (q, q, t) (4.185) 2m ∂q ∂t La ecuación diferencial es de primer orden e involucra derivadas respecto a q y respecto a t. La solución debe contener constantes de integración arbitrarias; una de ellas puede ser aditiva. Podemos tomar a q como la constante no aditiva de integración. La ecuación (4.185) tiene una solución de la forma: F1 (q, q, t) = −qt + f (q, q) (4.186) La ecuación (4.186) equivale a tomar la constante q igual a la energı́a, puesto que H en (4.181) es constante, H = E: q=E (4.187) Con esta solución, (4.184) se reduce a: 2 1 df (q, q) − aq = q 2m dq Integrando (4.188) obtenemos: √ 2 2m (q + aq)3/2 + constante f (q, q) = ± 3 a Con lo cual, omitiendo la constante aditiva: √ 2 2m F1 (q, q, t) = −qt ± (q + aq)3/2 3 a (4.188) (4.189) (4.190) La ecuación (4.190) genera la siguiente transformación canónica, de acuerdo con las fórmulas (4.167): √ p 2m p −p = −t ± q + aq (4.191) p = ± 2m(q + aq) ; a Explı́citamente la transformación es: a q (t − p)2 q(q, p, t) = − + a 2m p(q, p, t) = (t − p)a ; p(q, p, t) = t − p ; a q(q, p, t) = p2 − aq 2m (4.192) (4.193) Como q y p son constantes, (4.192) proporciona la solución al problema del movimiento descrito por (4.181). En particular describe el problema del movimiento de una partı́cula en presencia de la gravedad (a = −mg , q = z , p = mż). z= 1 E − g(t − p) ; mg 2 mż − mg(t − p) (4.194) La formulación hamiltoniana / 113 Las constantes E y p tienen las siguientes expresiones en función de los valores de z y ż en t = 0: E= 1 mv 2 + mgz0 ; 2 0 p= v0 g (4.195) Entonces para z(t) y ż(t) obtenemos: 1 z = z0 + v0 t − gt2 ; ż = v0 − gt (4.196) 2 de acuerdo con el resultado obtenido usando métodos elementales. Es claro que la transformación dada por (4.192) y (4.193) es canónica independientemente de la forma de H y aplicable a cualquier sistema de un grado de libertad; sin embargo, sólo para H dado por (4.181) mediante (4.192) se consigue H = 0 y por tanto que q y p sean constantes. Este problema ilustra el método de resolver un problema mecánico mediante una transformación canónica sin integrar las ecuaciones de Hamilton. 4.7. La evolución temporal de un sistema considerada como una transformación canónica Sean qν0 y p0ν los valores de qν y pν en t = t0 (ν = l, 2, ...l). Estos valores determinarán todos los valores sucesivos de las (q, p), de modo que en un tiempo t podemos escribir: qν (t) = qν (q 0 , p0 , t − t0 ) ; ν = 1, 2, ...l (4.197) pν (t) = pν (q 0 , p0 , t − t0 ) La ecuación (4.197) puede considerarse como una cierta transformación en el espacio de fases, donde (q 0 , p0 ) son las viejas variables y (q, p) las nuevas. Esta transformación es canónica pues tanto (q 0 , p0 ) como (q, p) satisfacen las ecuaciones de Hamilton. La función generatriz de esta transformación satisface: dF = l X ν=1 p0ν dqν0 − l X ν=1 pν dqν + (H 0 − H) dt (4.198) Si no hay fuerzas disipativas y las ecuaciones que definen las coordenadas generalizadas no dependen del tiempo, H se conserva, H = H 0 , luego: dF = l X ν=1 p0ν dqν0 − l X ν=1 pν dqν = − l X ν=1 t pν dqν (4.199) t0 Por otra parte, escribamos la integral de acción entre t0 y t: Z t L dt S= t0 (4.200) 114 / Mecánica clásica avanzada Una variación de las (q) nos conduce a: Z tX l ∂L ∂L δS = δqν + δ q̇ν dt ∂ q̇ν t0 ν=1 ∂qν Z tX l d ∂L d ∂L ∂L δqν dt δqν + δqν − = dt ∂ q̇ν dt ∂ q̇ν t0 ν=1 ∂qν = Xl ν=1 ∂L δqν ∂ q̇ν t t0 (4.201) # Z t "X l ∂L d ∂L δqν dt + − dt ∂ q˙ν t0 ν=1 ∂qν Si asumimos que la trayectoria es real, se cumplen sobre ella las ecuaciones de Lagrange, luego: l X ∂L δqν δS = ∂ q̇ν ν=1 t = t0 l X ν=1 t (4.202) pν δqν t0 Comparando a (4.199) y (4.202) vemos que: F = −S (4.203) En conclusión, la acción es la función generatriz de la transformación canónica de evolución temporal del sistema. Ésta es una transformación del espacio de fases en sı́ mismo: cambia el punto del espacio de fases (q 0 , p0 ) por el punto del espacio de fases (q, p). En el ejemplo del oscilador armónico lineal, la figura 4.3 es una circunferencia. La evolución temporal consiste simplemente en una rotación del vector de posición del punto del espacio fásico que representa al sistema, lo cual también puede verse en las fórmulas (4.172), y más claramente aún mediante el ejemplo 4.4.2. 4.8. El teorema de Liouville El teorema de Liouville es un teorema básico para la mecánica estadı́stica, o sea la mecánica de sistemas tales que: (a) El número de grados de libertad es muy grande. (b) No se pueden determinar las 2l condiciones iniciales, y por lo tanto tampoco el estado del sistema en sentido clásico. Solamente se conoce el hamiltoniano del sistema, las condiciones de ligadura, y a lo sumo siete de las 2l constantes de movimiento (las ~ P~ ). aditivas: H, L, (c) Respecto a las condiciones iniciales, o sea a las posibles trayectorias del espacio de fases, sólo se pueden hacer suposiciones estadı́sticas. En particular se puede asumir que todas las trayectorias de fase compatibles con las ligaduras y con los valores de las siete constantes de movimiento aditivas son igualmente probables (distribución uniforme). En general, habrá una región del espacio de fases que es accesible al sistema y se puede postular alguna distribución de probabilidades de las distintas trayectorias de fase dentro de la región accesible (las trayectorias externas a la región accesible tienen probabilidad cero). La formulación hamiltoniana / 115 Ejemplo 4.8.1 Analizar un oscilador armónico lineal cuando sólo se conoce exactamente su energı́a. Mediante la transformación canónica (4.172), la dinámica del oscilador está descrita por: q= r 2p cos q ; mω p=− p 2mωp senq ; H = ωp = E (4.204) Las ecuaciones canónicas en las variables (q, p) tienen la solución: E = constante (4.205) ω donde δ es una constante arbitraria. La otra constante arbitraria es E. O sea que dados E y δ queda determinado completamente el estado de movimiento: r 2E cos (ωt + δ) q(E, δ, t) = mω 2 (4.206) √ p(E, δ, T ) = − 2mE sen(ωt + δ) q = ωt + δ ; p= p / mω r t>0 δ q (2E / mω 2 ) 1/2 t=0 Figura 4.4 Espacio de fases del oscilador armónico lineal para E conocida E define el radio de la trayectoria y δ el tiempo inicial de la misma (véase figura 4.4). p La región accesible la constituyen todos los puntos de una circunferencia de radio 2E/(mω 2 ). Las diferentes trayectorias están definidas por los valores de δ. Ejemplo 4.8.2 Analizar el oscilador tridimensional sometido a la ligadura de moverse únicamente sobre la superficie de un cilindro, cuando sólo se conoce exactamente la energı́a y el momento angular en la dirección z (ver ejemplo 4.3.1). 116 / Mecánica clásica avanzada La figura 4.2 muestra que cada valor de Ez determina un “cilindro” en el espacio de fases. La energı́a total es, de acuerdo con la ecuación (4.105): L2z (4.207) 2mR2 Parte de la energı́a está asociada al movimiento en z y parte a la rotación, siendo ambas constantes por separado. Para Lz arbitrario, la región accesible del espacio fásico está definida por el “cilindro” E = constante. Todos los puntos interiores a este cilindro son accesibles. Para Lz y Ez dados, habrá un conjunto infinito de trayectorias de fase en “espiral”, caracterizada cada una por los valores de θ0 y δ [ecuaciones (4.106) y (4.107)], que pueden estar entre 0 y 2π. En el caso en que se conozcan Lz y Ez , la distribución uniforme para este sistema es aquella en la cual todos los valores de θ0 y δ tienen igual probabilidad. En general cuando sólo se conocen exactamente la energı́a total, el momento lineal total y el momento angular total del sistema, además de las ligaduras, la región del espacio de fases accesible al sistema está definida por las ecuaciones: E = Ez + E(q, p) = E0 ; ~ p) = L ~0 ; L(q, P~ (q, p) = P~0 (4.208) que definen una variedad de 2l − 7 dimensiones en el espacio de fases.4 Las 2l − 7 constantes de movimiento adicionales no son determinadas; la distribución microcanónica asigna a cada uno de los estados caracterizados por (4.208) y los valores de las 2l − 7 constantes restantes igual probabilidad. Conjunto estadı́stico. Es una noción útil en los casos donde hay 2l−7 constantes de movimiento no determinadas. Consiste en un conjunto de sistemas iguales (el mismo número de grados de libertad, la misma clase de partı́culas y de interacciones, las mismas ligaduras y los mismos valores de las constantes de movimiento aditivas). Es decir, dos sistemas de un conjunto estadı́stico sólo pueden diferir por los valores de las 2l − 7 constantes no aditivas. Se considera que el número de sistemas es muy grande, de modo que es una muestra estadı́sticamente representativa de la distribución de los valores de las 2l − 7 constantes indeterminadas. En cada instante del tiempo, el estado de cada sistema del conjunto será representado por un punto del espacio fásico, y su estado de movimiento por una trayectoria de fases. El conjunto estadı́stico de sistemas de l grados de libertad estará representado en cada instante por un “enjambre” de puntos del espacio fásico. Como los sistemas del conjunto estadı́stico no interactúan, cada punto se mueve independientemente de los demás en el espacio fásico 2l-dimensional.5 Teorema de Liouville. En cada elemento de volumen del espacio fásico la densidad de puntos representativos del conjunto estadı́stico permanece constante en el tiempo. Sea dΓ = dq1 dq2 , ...dql dp1 , dp2 , ...dpl = dΓq dΓp un elemento de volumen infinitesimal del espacio de fases. Sea: dN = ρ(p, q, t)dΓq dΓp (4.209) 4 Estas constantes tienen la propiedad de ser aditivas. La variedad puede reducirse si tomamos en cuenta que asociadas a la posición del centro de masa de un sistema libre hay tres constantes; quedarı́an en ese caso 6N − 10 constantes no determinadas. 5 Un conjunto estadı́stico tiene analogı́a con los “ensambles” que mencionamos en la sección 2.3. La formulación hamiltoniana / 117 el número de sistemas dentro de dΓ. A ρ(q, p, t) se le llama la función de distribución estadı́stica y hace el papel de función de densidad de probabilidad en el espacio de fases. ρ satisface la condición de normalización: Z ρdΓq dΓp = 1 (4.210) donde la integral abarca todo el espacio de fases. Matemáticamente el teorema dice que: l ρ̇ = 0 o dρ X = dt ν=1 ∂ρ ∂ρ q̇ν + ṗν ∂qν ∂ ṗν + ∂ρ =0 ∂t (4.211) Una forma cualitativa de visualizarlo se da a continuación. Sea un volumen arbitrario del espacio de fases en t = t0 . Como el número de sistemas es muy grande, en la frontera de tal volumen habrá un gran número de puntos representativos de sistemas del conjunto, de modo que aproximadamente podemos decir que la frontera del elemento de volumen está definida por un conjunto de puntos representativos del conjunto estadı́stico. Cuando transcurre el tiempo, el volumen se mueve al moverse los puntos de la frontera. El tamaño del volumen podrá cambiar, pero no el número de puntos que lo constituyen. En efecto, sea (q, p) un punto arbitrario de la frontera. Todo punto que entre o salga del elemento de volumen deberá pasar por la frontera, pero al llegar a la frontera tendrá los mismos (q, p) de un punto de la misma. Ambos puntos tendrán las mismas condiciones iniciales para el movimiento posterior, en consecuencia deberán seguir moviéndose juntos. En conclusión, el número de puntos en cualquier región del espacio fásico es constante. Se puede demostar que: Z Z (4.212) dΓq dΓp = dΓq dΓp donde la transformación (q, p) → (q, p) es canónica. Como la evolución temporal es una T.C., se sigue que: Z Z dΓq0 dΓp0 = dΓq dΓp (4.213) Como no cambian con el tiempo ni el volumen ni el número de puntos dentro de él, la densidad será constante. Demostración del teorema de Liouville. Sea un conjunto estadı́stico de sistemas de un grado de libertad, entonces el espacio fásico es bidimensional y dΓ = dq dp. Además, dN = ρ dq dp es el número de sistemas en dΓ. Consideremos que cada uno de los sistemas del conjunto tiene energı́a entre E y E + ∆E. La figura 4.5 muestra la región accesible, definida por las lı́neas E = constante y E + ∆E =p constante (depser osciladores armónicos, tal región serı́a una corona circular de radios 2E/mω 2 y 2(E + ∆E)/mω 2 ). Cuando el tiempo transcurre, los puntos representativos del conjunto se mueven dentro de esta región. Entre t y t + dt entran al elemento de volumen dΓ todos los puntos que se mueven hacia el frente a las caras de la izquierda e inferior. El número de los puntos que entran a dΓ durante el tiempo dt 118 / Mecánica clásica avanzada p E + dE t t + dt dp E pdt (q,p) dq q qdt Figura 4.5 Espacio fásico. Región accesible definida por las lı́neas E = constante y E +∆E = constante. será igual a: ρq̇ dt dp + ρṗ dt dq (4.214) O sea que el número de puntos que entran a dΓ por unidad de tiempo es: ρq̇ dp + ρṗ dq = ρ(q̇ dp + ṗ dq) (4.215) Para hallar los puntos que salen, debemos considerar los que se mueven dentro de dΓ hacia las caras derecha y superior y que las alcanzarán en el tiempo dt. Esto se puede obtener de (4.215) mediante una expansión de Taylor alrededor de (q, p), para hallar (4.215) en (q + dq, p + dp): (ρq̇)|q+dq dp + (ρṗ)|p+dp dq̇ = ∂ ∂ (ρq̇) dq dp + ρṗ + (ρṗ) dp dq ρq̇ + ∂q ∂p (4.216) La variación del número de puntos dentro de dΓ es igual a lo que entra menos lo que sale por unidad de tiempo, o sea a (4.215) menos (4.216): ∂ ∂ − (ρq̇) + (ρṗ) dq dp (4.217) ∂q ∂p Dentro de dΓ la rata de incremento temporal de la densidad será ∂ρ/∂t y el cambio del número de puntos en dΓ por unidad de tiempo es (∂ρ/∂t).dq dp y debe ser igual a (4.217): ∂ ∂ ∂ρ dq dp = − (ρq̇) + (ρṗ) dq dp (4.218) ∂t ∂q ∂ρ La formulación hamiltoniana / 119 Se sigue entonces que: ∂ρ ∂ q̇ ∂ρ ∂ ṗ ∂ρ +ρ + q̇ + ρ + ṗ = 0 ∂t ∂q ∂q ∂p ∂p (4.219) Usando las ecuaciones de Halmilton se tiene: ∂ ṗ ∂2H ∂2H ∂ q̇ + = − =0 ∂q ∂p ∂q∂p ∂p∂q (4.220) Con lo cual (4.219) nos da el resultado: ∂ρ ∂ρ ∂ρ dρ + q̇ + ṗ = =0 ∂t ∂q ∂p dt (4.221) La generalización a sistemas de varios grados de libertad es análoga. En ese caso debemos reemplazar el plano p − q por el plano pν − qν correspondiente al grado de libertad ν. dΓ → dqν dpν es la proyección del elemento de volumen dΓq dΓp sobre el plano ν. Las lı́neas E y E + dE son el corte del plano ν con las hipersuperficies en el espacio de fases E = constante, E + dE = constante. dΓ será: dΓ = dΓp dΓq = dq1 dq2 ...dqν−1 dqν+1 ...dql dp1 dp2 (4.222) ...dpν−1 dpν+1 ...dpl dqν dpν = dΓν dqν dpν ; ν = 1, 2, ...l Debemos reemplazar las ecuaciones (4.215) y (4.216) por: ρ dΓν (q̇ dpν + ṗν dqν ) y, ∂ ν ν ρ dΓ q̇ν + (ρ dΓ q̇ν ) dqν dpν ∂qν ∂ ν ν + ρ dΓ ṗν + (ρ dΓ ṗν ) dpν dqν ∂pν (4.223) (4.224) Por tanto la variación del número de puntos en el área dqν dpν será igual a (4.223)(4.224): ∂ ∂ ν ν (ρ dΓ q̇ν ) + (ρ dΓ ṗν ) dqν dpν = − ∂qν ∂pν (4.225) ∂ ∂ (ρq̇ν ) + (ρṗν ) dΓ − ∂qν ∂pν La variación del número de puntos en todo el volumen dΓ es igual a la suma de las variaciones de los números de puntos sobre sus proyecciones q1 − p1 , q2 − p2 , ...ql − pl . Ésta será: l X ∂ ∂ (ρq̇ν ) + (ρṗν ) dΓ (4.226) − ∂qν ∂pν ν=1 Usando el resultado (4.220) para cada grado de libertad e igualando (4.226) a ∂ρ/∂t dΓ obtenemos el teorema de Liouville, ecuación (4.211). 120 / Mecánica clásica avanzada Ejemplo 4.8.3 Sea un conjunto de cuatro partı́culas iguales que se lanzan hacia arriba en un campo gravitacional uniforme, con las siguientes condiciones iniciales: z10 = z0 , z20 = z0 + ∆z0 z30 = z0 , z40 = z0 + ∆z0 pz10 = p0 , pz20 = p0 (4.227) pz30 = p0 + ∆p0 , pz40 = p0 + ∆p0 (a) Hallar la región que inicialmente ocupa el conjunto en el espacio de fases. (b) Hallar las trayectorias de fase de las partı́culas. (c) Considerar cómo cambia la región ocupada por el conjunto para t > 0. El espacio fásico de cada sistema es 6-dimensional, pero sólo hay variaciones en la proyección bidimensional z − pz . x, px , y y py permanecen constantes, ya que por definición las partı́culas no interactúan entre sı́. La energı́a de cada partı́cula es constante. Entonces: Hi = p2zi + mgzi = Ei = constante ; 2m i = 1, 2, 3, 4 (4.228) La ecuación de la trayectoria de cada partı́cula en el espacio de fases será parabólica: p (4.229) pzi = ± 2m(Ei − mgzi ) De acuerdo con (a) y (b) las Ei serán: p20 + mg(z0 + ∆z0 ) 2m E1 = p20 + mgz0 ; 2m E3 = (p0 + ∆p0 )2 + mgz0 2m E4 = (p0 + ∆p0 )2 + mg(z0 + ∆z0 ) 2m E2 = (4.230) Asumiendo positivos a ∆p0 y ∆z0 , vemos que: E4 > E3 ; E4 > E2 ; E3 > E1 ; E2 > E1 (4.231) Además, para precisar, asumamos que ∆p0 y ∆z0 son tales que E3 > E2 , de modo que: E4 > E3 > E2 > E1 (4.232) La solución a este problema es: pzi = pzi0 − mgt ; zi = zi0 + pzi0 1 t − gt2 ; m 2 i = 1, 2, 3, 4 (4.233) La formulación hamiltoniana / 121 De modo que: pz 1 = z1 = pz 3 = pz2 = p0 − mgt p0 − mgt ; z0 + p0 1 t − gt2 ; m 2 p0 + ∆p0 − mgt ; z2 = z0 + ∆z0 + p0 1 t − gt2 m 2 pz4 = p0 + ∆p0 − mgt (4.234) 1 p0 + ∆p0 t − gt2 m 2 z3 = z0 + z4 = z0 + ∆z0 + 1 p0 + ∆p0 t − gt2 m 2 Las ecuaciones (4.234) nos dicen que: Pz1 = pz2 = p < p0 ; z3 = z1 + z2 = z1 + ∆z0 ; ∆p0 t m Pz3 = pz4 = p + ∆p0 (4.235) ∆p0 t; z4 = z2 + m z4 = z3 + ∆Z0 z1 = z La figura 4.6 muestra la región ocupada por el conjunto en el espacio de fases, en t = 0 y en t > 0. Vemos que el área (volumen) del espacio fásico ocupada por el conjunto de sistemas permanece constante en el tiempo y es igual a: ∆z0 ∆p0 (4.236) Dicha región se mueve distorsionándose pero sin cambiar el valor del área. El resultado es el mismo en el caso en que dentro del área en mención haya un número arbitrario de puntos: el área de la región limitada por las lı́neas 1 − 2, 2 − 4, 3 − 4 y 1 − 3 permanecerı́a constante y todos los puntos quedarı́an dentro. La densidad de puntos en el espacio de fases también es una constante; en este caso. 4 = constante ∆z0 ∆p0 (4.237) De haber inicialmente en el centro del rectángulo una quinta partı́cula, esta permanecerı́a en el centro del cuadrilátero en t > 0. La figura 4.7 muestra las trayectorias de fase. Ejemplo 4.8.4 Sea una partı́cula que se lanza hacia arriba en presencia de un campo gravitacional uniforme. Sus condiciones iniciales se conocen con cierta indeterminación: 122 / Mecánica clásica avanzada pz p0 + ∆p0 3 4 1 2 ∆p0t / m p0 3 p + ∆p0 4 p 1 z0 + ∆z0 z0 2 z + ∆z0 z z Figura 4.6 Región ocupada por el conjunto de sistemas en el espacio de fases pz p0 + ∆p0 p0 3 4 1 2 z z0 z0 + ∆z0 2 1 3 1 2 4 3 4 Figura 4.7 Trayectorias de fase. Caso en que dentro del área hay un número arbitrario de puntos z(0) = z0 ± ∆z0 ; 2 pz (0) = p0 ± ∆p0 2 (4.238) Es decir, se sabe que en t = 0 la partı́cula está en un rectángulo de área ∆z0 ∆p0 en el espacio de fases. Analizar la evolución de la partı́cula. Basta considerar el movimiento de la partı́cula en los valores extremos de las condiciones iniciales (z0 − ∆z0 /2 , p0 − ∆p0 /2 ; z0 − ∆z0 /2 , p0 + ∆p0 /2 ; z0 + ∆z0 /2 , p0 − La formulación hamiltoniana / 123 ∆p0 /2 ; z0 + ∆z0 /2 , p0 + ∆p0 /2), que coinciden con las condiciones iniciales (4.227) del ejemplo anterior, cambiando z0 por z0 + ∆z0 /2 y p0 por p0 + ∆p0 /2. Se concluye inmediatamente que para una partı́cula se cumple: ∆z(t) ∆pz (t) = ∆z(0) ∆pz (0) = constante = ∆z0 ∆p0 (4.239) Para un valor dado de esta constante, si se reduce la indeterminación en z, se aumenta la indeterminación en ∆pz y viceversa. Clásicamente no hay lı́mite al valor más pequeño que puede tomar la constante ∆p0 ∆z0 . Cuánticamente no puede ser menor que h̄/2, donde h̄ es la constante de Planck, luego: ∆z ∆pz ≥ h̄ 2 (4.240) La ecuación (4.240) se denomina la desigualdad de Heisenberg. El resultado (4.239) es válido en general, de acuerdo con el teorema de Liouville. La proyección del volumen del espacio fásico dentro del cual inicialmente se encuentra la partı́cula, ∆Γ0 = ∆p10 ∆q10 ∆p20 ∆q20 ...∆pl0 ∆ql0 , sobre el plano qν − pν , tiene un área ∆pν0 ∆qν0 . Se tiene entonces que: ∆pν (t) ∆qν (t) = ∆pν0 ∆qν0 = constante (4.241) O sea que, cuánticamente se cumple que para cualquier par de variables canónicamente conjugadas: ∆pν ∆qν ≥ h̄ 2 (4.242) Clásicamente, para un valor dado de la constante ∆pν0 ∆qν0 , al aumentar la indeterminación de pν , se disminuye la indeterminación de qν y viceversa. Lo especı́fico de la desigualdad de Heisenberg (el “efecto cuántico”) es que la constante no puede ser cero sino que tiene un mı́nimo valor. 124 / Mecánica clásica avanzada 5 Movimiento de dos partı́culas que interactúan por medio de una fuerza central Éste es un problema que en principio es soluble de manera exacta para cualquier fuerza central. Pertenece a los pocos problemas de la mecánica clásica en que es posible la separación de las variables. Como se sabe, no existen soluciones analı́ticas exactas para el problema general de más de dos partı́culas interactuando mutuamente por fuerzas de dos partı́culas. 5.1. Coordenadas de centro de masa y coordenadas relativas En general las coordenadas de las partı́culas individuales, por ejemplo X1 , Y1 , Z1 , X2 , Y2 y Z2 , no permiten desacoplar las ecuaciones de movimiento. Sólo cuando las fuerzas son lineales ha sido diseñado un formulismo que desacopla las ecuaciones de movimiento mediante la transformación a coordenadas normales. Afortunadamente, el problema de dos partı́culas que interactúan a través de una fuerza central admite la separación de variables mediante la transformación a las coordenadas relativas y de centro de masa. ~ = m1~r1 + m2~r2 , ~r = ~r2 − ~r1 , R m1 + m2 (5.1) m m 2 1 ~− ~+ ~r1 = R ~r , ~r2 = R ~r M M Un potencial central es aquel que depende sólo de la distancia entre las partı́culas: V (~r1 , ~r2 ) = V (|~r2 − ~r1 |) = V (r) (5.2) Las fórmulas (5.1) permiten escribir la energı́a cinética ası́: T = 2 2 1 1 ~˙ 2 1 ˙ 2 1 m1~r˙ 1 + m2~r˙ 2 = M R + µ~r 2 2 2 2 125 (5.3) 126 / Mecánica clásica avanzada donde M es la masa total y µ la masa reducida: m1 m2 m1 + m2 Entonces en vez de L ~r1 , ~r2 , ~r˙ 1 , ~r˙ 2 podemos escribir: M = m1 + m2 ; µ= 2 ~˙ + 1 µ~r˙ 2 − V (r) ~ ~r˙ , R ~˙ = 1 M R L ~r, R; 2 2 (5.4) (5.5) ~ es cı́clica y por lo tanto el momento lineal del centro de masa es una constante de R movimiento. L consta de términos desacoplados, es decir, describe un sistema equivalente de dos partı́culas, una libre de masa M colocada en el centro de masa y otra de masa µ colocada por ejemplo en la posición de la partı́cula 2, y sometida al efecto de un centro de fuerzas inmóvil colocado en la posición de la partı́cula 1, y exactamente sometida a la misma energı́a potencial de interacción de las dos partı́culas originales: LCM = 1 ~˙ 2 MR ; 2 Lrel = 1 ˙2 µ~r − V (r) 2 (5.6) Lrel es esféricamente simétrico pues depende sólo de la magnitud de los vectores ~r y ~r˙ . En consecuencia, el momento angular de la partı́cula de masa reducida µ, ~l = ~r × µ~r˙ , es una constante de movimiento. Para pasar al formalismo hamiltoniano, evaluemos los momentos canónicos conju~ gados de ~r y R: p= ~ ∂L = µ~r˙ ; ∂~r˙ ∂L ~˙ = MR P~ = ˙ ~ ∂R (5.7) Entonces el hamiltoniano del sistema será: H= P~2 p~2 + + V (r) 2M 2µ (5.8) H es una constante de movimiento, ası́ como por separado lo son la energı́a del centro de masa y la de la partı́cula de masa reducida. Sistema de coordenadas de centro de masa. Es un sistema de coordenadas con origen colocado en el centro de masa. Las fórmulas de transformación son (véase la figura 5.1): ~r1c = ~r2c m2 m2 ~r (~r1 − ~r2 ) = − M m1 m1 m1 = (~r2 − ~r1 ) = ~r M M (5.9) Además se cumple que: m1~r1c + m2~r2c = 0 ; ~r2c − ~r1c = ~r No existen fórmulas que expresen a ~r1 , ~r2 en función de ~r1c y ~r2c . (5.10) Movimiento de dos partı́culas que interactúan ... / 127 La energı́a total de las dos partı́culas en el sistema de referencia del centro de masa es: Ec = 2 2 1 1 1 2 m1~r˙ 1c + m2~r˙ 2c + V (r) = µ~r˙ + V (r) 2 2 2 (5.11) y el momento angular respecto al centro de masa: ~ c = ~r1c × m1~r˙ 1c + ~r2c × m2~r˙ 2c = µ~r × ~r˙ L (5.12) 1 r1c r2c r1 2 R r2 O Figura 5.1 Sistema de coordenadas de centro de masa para dos partı́culas Se ve que la energı́a total en el sistema del centro de masa coincide con la energı́a total de la partı́cula de masa reducida, y el movimiento angular total coincide con el momento angular de la partı́cula de masa reducida. El momento angular total en el sistema de referencia del laboratorio es: ~ ×R ~˙ + µ~r × ~r˙ ~ = ~r1 × m1~r˙ 1 + ~r2 × (m2~r˙ 2 ) = M R (5.13) L vemos que es igual al momento angular del centro de masa más el momento angular respecto al sistema de referencia del centro de masa. Finalmente podemos afirmar que los aspectos no triviales del problema están en el movimiento de la partı́cula de masa reducida. Ecuaciones de Lagrange para las coordenadas relativas. Tomemos un sistema de coordenadas esféricas para ubicar la partı́cula de masa reducida µ (véase figura 128 / Mecánica clásica avanzada z êϕ êΦ êr r Θ y ϕ êΦ x Figura 5.2 Posición ~r de la partı́cula µ en coordenadas esféricas 5.2). No hay ninguna razón fı́sica para suponer dónde está el origen de ese sistema de coordenadas. Si queremos podemos colocarlo en el centro de masa o, como se propuso antes, en la posición de la partı́cula 1. Las componentes de ~r y ~r˙ es conveniente expresarlas en coordenadas esféricas; esto es simple mediante las fórmulas de transformación entre vectores unitarios: êr = senθ cos φ î + senθ senφ ĵ + cos θ k̂ êθ = −senφ î + cos φ ĵ êφ = senθ k̂ − cos θ (cos φ î + senφ ĵ) (5.14) y las fórmulas inversas: î = senθ cos φ êr − senφ êθ − cos θ cos φ êφ ĵ = senθ senφ êr + cos φ êθ − cos θ senφ êθ k̂ = cos θ êr + senθ êφ (5.15) éstos son dos conjuntos ortonormales de vectores de base (véase figura 5.2). Entonces ~r y ~r˙ tienen las siguientes expresiones: ~r = rêr ; ~r˙ = ṙêr − rθ̇êφ + r senθ φ̇êθ (5.16) Movimiento de dos partı́culas que interactúan ... / 129 El lagrangiano en coordenadas esféricas es: 1 L = µ r2 + r2 θ̇2 + r2 sen2 θ φ̇2 − V (r) (5.17) 2 donde hemos suprimido la parte correspondiente al centro de masa. La coordenada φ es cı́clica y por ello su momento canónico conjugado pφ es una constante de movimiento: pφ = ∂L ∂ φ̇ = µr2 sen2 θ φ̇ = constante (5.18) Debido a la simetrı́a de rotación del lagrangiano, todas las componentes del momento angular son constantes de movimiento. Las componentes esféricas, o sea, a lo largo de los vectores unitarios êr , êθ , êφ , son: lr = 0 , lφ = µr2 senθ φ̇ lθ = µr2 θ̇ , (5.19) en tanto que las componentes cartesianas son: lx = −µr2 (θ̇senφ + φ̇ senθ cos θ cos φ) ly = µr2 (θ̇ cos φ − φ̇ senθ cos θ senφ) (5.20) lz = µr2 sen2 θ φ̇ Los otros momentos canónicos conjugados son: pr = ∂L = µṙ ; ∂ ṙ pθ = ∂L ∂ θ̇ = µr2 θ̇ (5.21) pr y pθ no son constantes de movimiento. Podemos expresar las componentes de ~l, (5.19) y (5.20), en función de los momentos canónicos: lθ = pθ ; lφ = pφ ; senθ l2 = p2θ + p2φ sen2 θ (5.22) lx = −pθ senφ − pφ cot θ cos φ ly = −pθ cos φ − pφ cot θ senφ (5.23) lz = pφ Nótese la similitud de (5.23) con las correspondientes expresiones cuántico-mecánicas, y aun con las componentes l± = lx ± ily : l+ = (ipθ − pφ cot θ)eiφ ; l− = (−ipθ − pφ cot θ)e−iφ (5.24) En coordenadas esféricas la constante de movimiento pφ , el momento canónico conjugado a φ, coincide con la componente Z del momento angular. lθ y lφ no son constantes de movimiento, pero sı́ lx , ly y lz , como también: lr = 0 ; lz = pφ ; l2 = p2θ + p2φ = µ2 r4 (θ̇2 + sen2 θφ̇2 ) sen2 θ (5.25) 130 / Mecánica clásica avanzada de lo anterior se sigue que existe un valor mı́nimo de θ dado por: pφ senθmin = ; θmax = π − θmin l (5.26) Como ~l es constante, tenemos que los vectores ~r y ~r˙ siempre permanecerán en un plano perpendicular a ~l, o sea que cuando las fuerzas son centrales la partı́cula de masa reducida permanece siempre sobre un plano; las órbitas son planas. θmin y θmax son los ángulos de máximo y mı́nimo acercamiento de la partı́cula al eje Z respectivamente, donde θ̇ cambia de signo. Comparando la expresión (5.25) para ~l 2 , con (5.17), obtenemos: L= l2 1 − V (r) µṙ + 2 2µr2 (5.27) En esta forma se nota la completa simetrı́a esférica del lagrangiano, ya que sólo depende de r pues ~l es una constante. El hamiltoniano es: H= p2r l2 + V (r) + 2µ 2µr2 (5.28) En esta expresión para H podemos tomar ventaja del hecho de depender sólo de la parte radial: H describe el movimiento unidimensional equivalente de una partı́cula de masa µ en un potencial efectivo: Vef (r) = l2 + V (r) 2µr2 (5.29) La segunda ley de Kepler. Podemos definir las coordenadas de manera que desaparezca del problema uno de los ángulos. Si tomamos el eje Z de modo que coincida con la dirección de ~l, que es constante, entonces el movimiento permanecerá siempre sobre el plano X − Y : θ = π/2 = constante; θ̇ = 0, con lo cual la magnitud del momento toma la forma: l = pφ = µr2 φ̇ = constante (5.30) En el plano de la órbita, el área barrida por el radio vector en un tiempo dt es dA = (1/2)r2 dφ, siendo dφ el ángulo que gira el radio vector en el tiempo dt. Entonces, Ȧ = 1 2 l r φ̇ = = constante 2 2µ (5.31) Nos dice que la velocidad areolar es constante para cualquier movimiento bajo fuerzas centrales (segunda ley de Kepler, descubierta empı́ricamente en 1609 en observaciones planetarias. La primera y la tercera leyes de Kepler valen sólo para potenciales de la forma 1/r). El problema unidimensional equivalente. Del lagrangiano (5.27) se sigue la ecuación de movimiento: l2 d d V + = − Vef = fc + f (5.32) µr̈ = − dr 2µr2 dr Movimiento de dos partı́culas que interactúan ... / 131 donde f es la fuerza derivable de V y fc es la llamada fuerza centrı́fuga, derivada del potencial centrı́fugo l2 /(µr2 ). La ecuación radial (5.32) supone un observador fijo respecto a la dirección del radio; como el radio vector gira, para este observador aparece una fuerza inercial que es precisamente fc . Como el hamiltoniano (5.28) es una constante de movimiento, la energı́a total en el centro de masa, que llamaremos E, proporciona una ecuación diferencial para r que puede integrarse por cuadratura: Z r dr t − t0 = (5.33) 1/2 r0 2 l2 (E − V ) − 2 2 µ µ r de (5.33) en principio puede obtenerse a r en función del tiempo, para cada conjunto de valores de t0 , r0 , µ, E y l. Es de interés encontrar a r en función de φ, o sea, hallar la ecuación de la órbita en coordenadas polares en el plano de la misma. De (5.30) podemos notar que: ṙ = l dr µr2 dφ de donde: φ − φ0 = Z (5.34) r r0 l r2 dr 1/2 l2 2µ E − V − 2µr2 (5.35) De manera similar puede hallarse a φ(t) si se conoce a r(t): Z r l dt φ − φ0 = 2 r0 µ r (t) (5.36) Las fórmulas (5.34) y (5.35), recordemos, valen si se eligen las coordenadas de modo que el eje z coincide con la dirección de ~l. Para una elección general de las coordenadas, las expresiones para hallar la ecuación de la órbita y la dependencia temporal de θ y φ resultan más complicadas: estas fórmulas las consideramos más adelante usando el formalismo de Hamilton-Jacobi. La fórmula (5.33) no depende de la elección de las coordenadas. Hallemos ahora la llamada ecuación diferencial de la órbita. Es una ecuación diferencial para r en función de φ. Se halla a partir de (5.34) y de: ṙ = − l dυ ; µ dφ r̈ = − l2 2 d2 υ υ ; µ2 dφ2 donde υ = 1 r (5.37) Con la ayuda de (5.37), la ecuación (5.32) se transforma en la ecuación diferencial de la órbita: µ F (υ) d2 υ =− 2 2 , dφ2 l υ (5.38) donde F (υ) = f (1/υ). Esta ecuación permite, dada f (r) hallar a r(φ), y dada r(φ) hallar a f (r). 132 / Mecánica clásica avanzada Coordenadas de retorno. Son los valores de las coordenadas en que la respectiva velocidad se anula, o sea, que cambia de signo. Los puntos de retorno en r son aquellos para los cuales ṙ = 0, o sea, los que satisfacen la ecuación algebraica: l2 + V (r) − E = 0 2µr2 (5.39) En estos puntos la velocidad no es cero pues θ̇ y φ̇ no se anulan necesariamente. Si ocurre que ṙ se anula solo cuando r es finito y que el movimiento es acotado o ligado, habrá un punto de máximo acercamiento y uno de máximo alejamiento de la partı́cula al centro de fuerza. Si ṙ = 0 en un punto r → ∞, el movimiento es no ligado; éste es el caso de los procesos de colisiones o de dispersión. Los puntos de retorno en θ son aquellos en que θ̇ = 0, o sea pθ = 0; en esos puntos θ vale θmax o θmin , ecuación (5.26). La ecuación (5.26) nos dice que no existen valores de φ en los cuales φ̇ = 0; no hay puntos de retorno en φ. Si r tiene dos lı́mites, rmin y rmax , el movimiento es ligado y la órbita está contenida dentro de una corona limitada por las circunferencias r = rmin y r = rmax . La órbita puede o no ser cerrada; en general no lo será. Para los potenciales de la forma 1/r o r2 las órbitas son cerradas y pueden ser no circulares (son elı́pticas1 ). Para precisar, consideremos un oscilador bidimensional armónico en el plano de la órbita; este se obtiene tomando fuerzas restauradoras lineales perpendiculares de la forma fx = −kX x y fy = −kY y donde kX y kY son las “constantes de resorte”.2 La dependencia temporal de x y y es: x(t) = Ax sen(ωX t + φX ) ; y(t) = Ay sen(ωY t + φY ) (5.40) Eliminando t obtenemos la ecuación de la órbita en coordenadas cartesianas. Cuando ωX es un múltiplo racional de ωY la órbita es una figura de Lissajous. Si ωX = ωY , la figura es una elipse; si ωX y ωY difieren ligeramente, la elipse aparece como si estuviera sometida a un movimiento de precesión (véase figura 5.3). ∆α es el ángulo que se desplaza el semieje mayor cuando la variación temporal de r ha completado un perı́odo completo. La trayectoria será cerrada si después de cierto número de ciclos completos de variación r la trayectoria se repite; o sea si al transcurrir n perı́odos de variación de r, el radio a partir del cual la órbita se repite ha dado un número m de vueltas completas, es decir, si: n∆α = m2π (5.41) Si la condición (5.41) no se cumple, entonces la trayectoria no es cerrada y cuando t → ∞ llena toda la corona. Otra forma de obtener este resultado es la siguiente. El movimiento en r tiene una frecuencia νr y el movimiento angular tiene una frecuencia να . La órbita será cerrada sólo si νr y να son conmensurables. ~rmax y ~rmin se llaman vectores absidales. La órbita siempre es simétrica por reflexión en los vectores absidales, o sea que con sólo conocer la porción de órbita comprendida entre dos ~rmax y ~rmin consecutivos es posible por reflexión construir toda la órbita. Esto se puede obtener fácilmente analizando la ecuación diferencial de la órbita. 1 Para otros potenciales pueden haber órbitas cerradas no circulares pero sólo accidentalmente, es decir, para valores muy bien determinados de l y E. 2 Cuando k X 6= kY la fuerza es no central. Esto no es esencial, pues aun con fuerzas centrales puede presentarse la precesión de las órbitas. Movimiento de dos partı́culas que interactúan ... / 133 ∆α rmáx rmín Figura 5.3 Órbitas de un oscilador armónico bidimensional Ejemplo 5.1.1 Hallar la velocidad angular de precesión de la órbita de una partı́cula sometida a fuerzas restauradoras lineales con kX ≈ kY . Se cumple que ωX ≈ ωY . En (5.40) tomamos φX = φY = 0 y llamamos ∆ω a ωY − ωX . Para hallar la ecuación de la órbita notemos que, al primer orden en ∆ω t: y = AY cos ωY t = AY (cos ωX t − ∆ωt senωX t) (5.42) de este modo la ecuación de la órbita es, al primer orden en ∆ω t: y2 xy x2 + 2 +2 ∆ω t = 1 2 Ax Ay Ax Ay (5.43) que es la ecuación de una elipse con el eje mayor rotado. La ecuación (5.43) puede escribirse como una forma cuadrática no diagonal:    A2y Ax Ay ∆ω t x   = A2x A2y (x, y)  (5.44) 2 y Ax Ay ∆ω t Ax Para llevar (5.43) a la forma estándar de la ecuación de la elipse, realicemos una rotación de los ejes coordenados por cierto ángulo δ:     ′  x cos δ −senδ x  =   (5.45) ′ y senδ cos δ y 134 / Mecánica clásica avanzada Luego, la matriz de la forma cuadrática será diagonal si: tan 2δ = 2Ax Ay ∆ω t A2x − A2y (5.46) Si t es el tiempo que tarda r en completar un perı́odo en este problema de fuerza no central, entonces, al primer orden en ∆ωt, la velocidad angular de precesión de la órbita es: δ̇ ≈ Ax Ay (ωy − ωx ) A2x − A2y (5.47) si AX no es del orden de AY (órbitas muy excéntricas). Ejemplo 5.1.2 Hallar para qué valores del momento angular es posible que sea acotado el movimiento en presencia del potencial: A l2 V (r) = − e−αr r 2µr2 (5.48) La energı́a potencial efectiva es: l2 A Vef (r) = − e−αr + r 2µr2 (5.49) Vemos que Vef → +0 para r → ∞, y Vef → +∞ para r → 0. La figura 5.4 muestra la forma de Vef . Hay posibilidad de movimiento acotado sólo si Vef tiene un mı́nimo, o ′ sea si la ecuación Vef = 0 tiene solución, esto es: l2 Aα −αr Ae−αr − =0 e + r r2 µr3 (5.50) Si llamamos x = αr, entonces (5.50) se puede llevar a la forma: (x2 + x)e−x = αl2 µA (5.51) Hay solución solamente si la curva f (x) = (x2 + x)e−x corta a la recta αl2 /(µA) (véase figura 5.5), esto es, si: f (x0 ) > αl2 µA (5.52) donde x0 es la posición en la cual f (x) tiene un máximo. f ′ (x) = 0 si: x2 − x − 1 = 0 La única solución aceptable de (5.53) es: √ 1+ 5 ≈ 1,618 x0 = 2 (5.53) (5.54) Movimiento de dos partı́culas que interactúan ... / 135 Vef l2 2µr2 E 1/α r –Ae–αr/r Figura 5.4 Energı́a potencial efectiva Vef componente de los potenciales centrı́fugo y de Yukawa Entonces: √ 1+√5 f (x0 ) = 2 + 5 e− 2 ≈ 0,84 (5.55) ′ Hay solución a Vef (r) = 0 sólo si: 0, 84 > αl2 µA (5.56) Si (5.48) se usa para describir la interacción nuclear, por ejemplo entre un neutrón y un protón, habrá resonancias, o sea estados ligados de energı́a positiva, si se cumple la condición (5.56). El momento angular l = 0 presenta estados ligados pero no resonancias. Puede haber resonancias sólo si: 0, 84 µA > h̄2 α (5.57) La barrera que se forma en Vef se llama “barrera centrı́fuga”. Se entiende por resonancia (“de forma”) el efecto túnel que se produce cuando la partı́cula viene desde r → ∞ y atraviesa la barrera quedando atrapada por el pozo de potencial durante cierto tiempo. Este proceso no es clásicamente posible. 136 / Mecánica clásica avanzada αl 2 µA f(x) x0 Figura 5.5 Solución f (x) al potencial efectivo 5.2. El oscilador armónico tridimensional Es el problema del movimiento de la partı́cula de masa reducida en presencia de la interacción central: f~(r) = −kr êr (5.58) Solución en coordenadas cartesianas. Tomando coordenadas cartesianas en el plano de la órbita, la solución al oscilador armónico bidimensional es (5.40). La ecuación de la órbita es: x2 y2 2xy cos δ = sen2 δ ; + − A2x A2y Ax Ay δ = φy − φx (5.59) La ecuación (5.59) es la forma cuadrática bidimensional de la forma ~r · M̃~r = sen2 δ, donde M̃ es la matriz:   a − cos δ −1   ; a = Ay (5.60) M̃ = A−1 x Ay Ax −cosδ a−1 Realizando una rotación de coordenadas es posible diagonalizar a M̃ . Sea la rotación ~r = R̃~r ′ , entonces: ~r ′ · R̃T M̃ R̃~r ′ = sen2 δ (5.61) Movimiento de dos partı́culas que interactúan ... / 137 La matriz R̃ es ortogonal, R̃R̃T = I˜ y diagonaliza a M̃ si es de la forma:   cos α −senα 2 cos δ ; R̃ =  tan 2α = −1 a −a senα cos α (5.62) R̃T es la transpuesta de R̃. Por simplicidad tomaremos Ay = Ax (a = 1). Entonces α y M̃ diagonalizada son:  1 − cos δ 1  M̃ = 2 A 0 π α = (cos δ > 0) ; 4 0 1 + cos δ   (5.63) La ecuación de la órbita (5.60) se torna la estándar de la elipse, con semiejes mayor a y menor b, y excentricidad ǫ: r r δ 2 cos δ b2 δ a = A cos ; ǫ= 1− 2 = (5.64) b = A sen ; 2 2 a 1 + cos δ δ está relacionado con el momento angular y A con la energı́a total: l=− E senδ ; ω E = µA2 ω 2 (5.65) Entonces la excentricidad y el semieje mayor tienen la siguiente expresión en términos de E y l: s kl2   s 2 1− 2 2 µE kl  1E  s 1+ 1− (5.66) E2 = ; a2 = 2 2 k µE 2 kl 1+ µE Solución en coordenadas polares. En vez de hacer la transformación de coordenadas, usaremos las fórmulas halladas en el numeral anterior, cuando se toma el eje Z perpendicular al plano de la órbita. De la ecuación (5.35) se sigue: l φ − φ0 = √ 2µ Z r r0 r2 dr s l2 1 E − kr2 − 2 2µr2 (5.67) Haciendo la sustitución ρ = r2 , (5.67) toma la forma: l φ − φ0 = √ 2 µk Z r2 r02 ρ s dρ 2E l2 −ρ2 + ρ− k µk (5.68) 138 / Mecánica clásica avanzada La integral se halla en tablas de integrales. El resultado es:   r2 2 2Eρ 2l   −  1 l k µk  −1   √ s φ − φ0 = sen   2 µk  l 2 2 4E 4l √ ρ − µk k2 µk 2 (5.69) r0 Entonces llegamos a: r2 = B2 1 − e sen2(φ − φ0 + β0 ) (5.70) donde B, e y β0 son: B= s l2 µE ; e= s 1− kl2 µE 2 ; 2β0 = arcsen l2 µk r02 e r02 − (5.71) La ecuación de la elipse centrada y no rotada en coordenadas polares es: r2 = b2 1 − cos2 φ (5.72) ǫ2 Si se rota 45◦ toma la forma: b2 r2 = 1 − ǫ2 cos2 (φ − φ ) 4 = b2 /(1 − ǫ2 /2) ǫ2 1− sen2φ 2 − ǫ2 (5.73) Las ecuaciones (5.70) y (5.73) coinciden si: β0 = φ0 ; B2 = b2 2 ǫ 1− 2 ; e= ǫ2 2 − ǫ2 (5.74) Las ecuaciones (5.71) y (5.74) conducen a los valores hallados en (5.66) para los parámetros de la elipse en función de las constantes de movimiento. La órbita es una elipse y el centro de la misma coincide con el centro de fuerza. Cálculo de la variación temporal del radio. Para hacer este cálculo usamos la ecuación (5.33): Z r dr s (5.75) t − t0 = r0 1 2 l2 2 E − kr − 2 2 µ 2 µ r Los puntos de retorno se hallan resolviendo la ecuación (5.39): s ! 2 kl E E 2 1± 1− = (1 ± e) rmax, min = k µE 2 k (5.76) Movimiento de dos partı́culas que interactúan ... / 139 Vemos que: l rmax = a = p ; µE(1 − e) l rmin = b = p µE(1 + e) (5.77) Esto nos permite escribir la expresión bajo el signo de raı́z cuadrada en (5.75) como: r Z r µ rdr p t − t0 = (5.78) 2 k r0 (a − r2 )(r2 − b2 ) Haciendo el cambio de variable p = r−2 , llegamos a: 1 t − t0 = 2 r µ k Z r −2 r0−2 dρ p 2 ρ (a ρ − 1)(1 − b2 ρ) (5.79) La solución a esta integral se encuentra en tablas. El resultado es: 1 t = t0 = 2 r (a2 + b2 )ρ − 2 µ arcsen k ρ(a2 − b2 ) r0−2 (5.80) r −2 Incluyendo en t0 la parte que depende de r0 llegamos a: r2 = a2 + b 2 a2 − b 2 E + sen2ω(t − t0 ) = [1 + e sen2ω(t − t0 )] 2 2 k (5.81) l no puede ser arbitrario, está restringido al rango: 0≤l≤ E ω (5.82) La ecuación (5.82) corresponde al comportamiento cuántico, haciendo la correspondencia con los números cuánticos l → lh̄ y E = nh̄ω, donde los valores permitidos del número cuántico orbital l son: 0 ≤ l ≤ n; o sea l = 0, 1, 2, ...n. Cuando l = E/ω, e =p 0 y ǫ = 0, la órbita es circular pues según (5.81) el radio de la órbita es constante: r = E/k. Cuando l = 0, e = 1 y ǫ = 1, la órbita es rectilı́nea. Según (5.81) la variación temporal del radio será de forma pendular, con frecuencia ω y no 2ω como cuando e 6= 1: r= r π 2E cos ω(t − t0 − ) k 4ω (5.83) Para hallar a r(t) a partir de (5.81) se requiere realizar una expansión en serie infinita. Para l 6= 0 y diferente de un máximo valor, r(t) contiene la frecuencia fundamental 2ω y todos sus armónicos. 140 / Mecánica clásica avanzada 5.3. El potencial 1/r Se trata de estudiar el movimiento de la partı́cula de masa reducida bajo la fuerza: k f~(r) = − 2 êr r (5.84) Este problema es separable en coordenadas esféricas, en coordenadas parabólicas y tal vez en otras coordenadas. La solución en coordenadas parabólicas la hallaremos posteriormente con el formalismo de Hamilton-Jacobi. Aquı́ resolveremos el problema en coordenadas esféricas. La ecuación de la órbita. Es cómodo usar la ecuación diferencial de la órbita (5.38). La solución es simple; el resultado es: l2 /µk = 1 + ǫ cos(φ − φ0 ) r (5.85) donde ǫ y φ0 son las dos constantes de integración. Vemos que rmin ocurre cuando φ = φ0 si k es positiva, o sea que en ese caso φ0 determina la dirección del vector rmin . La órbita será simétrica respecto a la lı́nea φ = φ0 . Relacionemos a ǫ con las constantes de movimiento E y l. Los puntos de retorno rmin y rmax ocurren cuando ṙ = 0 en: E= 1 2 k l2 − µṙ + 2 2µr2 r (5.86) O sea que: rmin, max k =− 2E 1± s 2El2 1+ µk 2 ! (5.87) Cuál de los signos corresponde a rmin o rmax depende del signo de k y del signo de E.3 Si rmax es finito, el movimiento será ligado. Por otra parte, de (5.85) vemos que: rmin, max = l2 /µk 1±ǫ Comparando a (5.88) con (5.87) hallamos que: s 2El2 ǫ= 1+ µk 2 (5.88) (5.89) El signo de ǫ lo hemos tomado positivo. La ecuación (5.85) representa una sección cónica. Las secciones cónicas. Son las curvas que definen la intersección de un cono con un plano. Sobre el plano una curva cónica es el lugar geométrico de los puntos cuya 3 En estos puntos cambia el signo de la velocidad radial. Además, para E ≥ 0, según veremos, sólo existe un punto de retorno. Movimiento de dos partı́culas que interactúan ... / 141 distancia a un punto dado llamado foco es proporcional a la distancia a una lı́nea dada, la directriz. Si tomamos el origen del sistema de coordenadas polares en el foco y S es la distancia del foco a la directriz (véase figura 5.6), se sigue de la definición, llamando ǫ a la constante de proporcionalidad: r = ǫ [S − r cos (φ − φ0 )] (5.90) y • Directriz r S φ φ0 x Foco Figura 5.6 Elementos de las secciones cónicas ǫ debe ser positivo por ser la relación entre dos distancias. Se sigue de (5.90): ǫS = 1 + ǫ cos (φ − φ0 ) , ǫ>0 (5.91) r La curva es simétrica respecto a la lı́nea φ = φ0 . La longitud ǫS se llama parámetro de la sección cónica y ǫ se llama excentricidad. Hay distintos tipos de secciones cónicas dependiendo del valor de ǫ. Si ǫ = 1, se obtiene la parábola, es decir, el lugar geométrico de los puntos equidistantes del foco y de la directriz. El punto de máximo acercamiento al foco se llama vértice y está situado a una distancia S/2, en tanto que la máxima distancia es infinita: 1 S; rmax = ∞; ǫ = 1 (5.92) 2 Si ǫ < 1, se obtiene una elipse: curva con dos directrices y dos focos. Hay en este caso dos distancias absidales finitas: ǫS ǫS ; rmax = ; ǫ<1 (5.93) rmin = 1+ǫ 1−ǫ El promedio entre rmax y rmin lo llamaremos a, de modo que: rmin = S=a 1 − ǫ2 ; ǫ ǫS = a(1 − ǫ2 ) (5.94) 142 / Mecánica clásica avanzada La ecuación de una elipse en coordenadas polares con foco en el origen es: r= a(1 − ǫ2 ) 1 + ǫ cos (φ − φ0 ) (5.95) La ecuación de una elipse en coordenadas polares con centro en el origen es (5.72). Las directrices están a distancias a/ǫ del centro (véase figura 5.8). Los semiejes son a y √ b = a 1 − ǫ2 . D ε=1 S/2 )φ0 S F Figura 5.7 Sección cónica: la parábola D2 S ε<1 εS D1 εa F2 • ) φ0 S F1 a /ε Figura 5.8 Sección cónica: la elipse Si ǫ > 1, la cónica es una hipérbola: curva de dos ramas con sus correspondientes focos, directrices y ası́ntotas. De la definición (5.90) se sigue la siguiente ecuación para la rama 2, respecto al origen de coordenadas mostrado, la cual es consistente con (5.85) Movimiento de dos partı́culas que interactúan ... / 143 ε<1 2 D2 εS )φ0 D1 F2 S a aε 1 a/ε F1 Figura 5.9 Sección cónica: la hipérbola cuando k > 0 y φ0 se sustituye por φ0 + π: ǫ = −1 − ǫ cos (φ − φ0 ) ; rama 1 (k < 0) r (5.96) ǫ = 1 − ǫ cos (φ − φ0 ) ; rama 2 (k > 0) r Cuando φ − φ0 = π, r toma el valor rmin : (1) rmin = ǫS ; ǫ−1 (2) rmin = ǫS ; 1+ǫ (2) (1) rmin = rmin − 2a (2) (5.97) (1) cuando cos(φ − φ0 ) = 1/ǫ, r = rmax = ∞ y cuando cos(φ − φ0 ) = −1/ǫ, r = rmax = ∞. Si llamamos la distancia entre los vértices 2a, también se cumple que rmin = a(ǫ − 1). Las directrices están a distancias a/ǫ del centro. El parámetro S en función de a vale: S= ǫ2 − 1 a ǫ (5.98) r → ∞ cuando 1 − ǫ cos (φ − φ0 ) = 0, sobre la rama 2. Entonces el ángulo entre las dos ası́ntotas vale: 2 cos−1 ǫ−1 ; cos−1 ǫ−1 ≤ φ − φ0 ≤ π − cos−1 ǫ−1 (5.99) Relación entre el signo de k y E, y el tipo de cónica. La excentricidad y el parámetro están relacionados con la energı́a y el momento angular: s l2 2El2 (5.100) ; ǫ= 1+ ǫS = µ|k| µk 2 Si el potencial es repulsivo, k es negativo. En este caso, sólo es posible que la energı́a sea positiva, pues de lo contrario rmin serı́a negativo. Entonces ǫ es mayor que 144 / Mecánica clásica avanzada la unidad y la trayectoria de la partı́cula es hiperbólica, o sea que el movimiento es no ligado. Esto es consistente con el análisis de la curva de energı́a potencial efectiva cuando k es negativo: la energı́a potencial no tiene un mı́nimo y el movimiento resulta no acotado, con sólo un punto de retorno. Es el caso cuando la partı́cula llega desde el infinito y “rebota” en la barrera de potencial. Este comportamiento incluye también el caso lı́mite en que la energı́a es cero. Si el potencial es atractivo, k es positiva. En este caso se presentan tres posibilidades. Si E > 0, entonces ǫ > 1 y el movimiento es hiperbólico. No hay lı́mite al valor máximo que puede tomar l: 0≤l<∞ si E>0 (5.101) A este caso, y al caso en que k es negativo, corresponden las dos ramas de la hipérbola: si k es negativo, la partı́cula se mueve sobre la hipérbola correspondiente a D1 ; si k es positivo y E > 0, se mueve sobre la hipérbola correspondiente a D2 . Si E = 0 entonces ǫ = 1. l se conserva pero no es cero porque el parámetro de impacto es infinito y en r → ∞ la velocidad es cero: 0≤l<∞ si E=0 (5.102) El movimiento es no ligado y r → ∞ para dos valores de φ: φ = φ0 ± π. La trayectoria es parabólica y no tiene ası́ntotas (serı́an las rectas y = ±∞). De (5.92) se sigue que: rmin = 1 l2 S= ⇒ l 6= 0 2 2µk (5.103) Este caso se presenta cuando la partı́cula parte del reposo desde el infinito. Si E < 0, entonces ǫ < 1. En este caso: s 2|E|l2 <1 ǫ= 1− µk 2 Es claro que el rango de valores posibles de l es finito: r µ 0≤l≤ k 2|E| (5.104) (5.105) Esto es análogo al comportamiento del número cuántico orbital en el átomo de hidrógeno: l = 0, 1, ...n − 1. ǫ cos (φ − φ0 ) nunca vale uno y por eso r nunca es infinito: el movimiento es ligado. En este caso: rmin, max = k (1 ∓ ǫ) ; 2|E| a= k 2|E| (5.106) Si ǫ = 0 siendo E < 0 entonces la trayectoria es circular con radio: r= l2 k = =a µk 2|E| (5.107) Movimiento de dos partı́culas que interactúan ... / 145 Como r es constante, se sigue de (5.31) que φ̇ también es constante. Si ǫ = 1, entonces l = 0 y la trayectoria es la lı́nea recta φ = φ0 . En este caso: rmin = 0 ; rmax = a (5.108) Para ǫ < 1 la trayectoria es una elipse rotada en un ángulo φ0 y con semiejes mayor y menor dados por: a= k ; 2|E| b=a p l 1 − ǫ2 = p 2µ|E| (5.109) respectivamente. Vemos que b está comprendido, dependiendo de l, entre: 0≤b≤a (5.110) El hecho de que las trayectorias sean elı́pticas es consecuencia de la primera ley de Kepler (cuando k = GM m). Las figuras desde 5.10 hasta 5.13 muestran las curvas de energı́a potencial efectiva para cada uno de los casos. Del análisis de las mismas se obtiene cualitativamente el comportamiento descrito. Vef E r mín k<0 r Figura 5.10 Energı́a potencial efectiva. Trayectoria hiperbólica. La tercera ley de Kepler. El área de la elipse es: s p l 2 kl 2 = πa2 A = πab = πa 1 − ǫ2 = π 4|E| µ|E| lmax (5.111) Recordando la ecuación (5.31) para la velocidad areolar, obtenemos que: r πk p µ 3/2 A −2µE = 2π a (5.112) = τ= 2 2E k Ȧ 146 / Mecánica clásica avanzada Vef E r mín r k > 0, E > 0 Figura 5.11 Energı́a potencial efectiva. Trayectoria hiperbólica. Vef · E r rmín k > 0, E = 0 Figura 5.12 Energı́a potencial. Trayectoria parabólica. Vemos que el perı́odo del movimiento no depende del valor de l. Para la interacción gravitacional entre un planeta (masa m) y el Sol (masa M ), (5.112) toma la forma: s 1 a3/2 (5.113) τ = 2π G(m + M ) Como para los planetas del sistema solar m ≪ M , se sigue que τ ∝ a3/2 , que es el contenido de la tercera ley de Kepler, la cual como se ve, es un resultado aproximado. Movimiento de dos partı́culas que interactúan ... / 147 Vef l = l máx l l=0 · r r mín r máx k > 0, E < 0 E Figura 5.13 Energı́a potencial efectiva. Trayectoria elı́ptica. La ecuación de Kepler. Encontrar a r(t) es interesante en muchos casos, por ejemplo para predecir el movimiento de un satélite. Para hallar a r(t) debemos usar la ecuación (5.33). Por simplicidad, consideraremos sólo el caso k > 0, E < 0. Es conveniente expresar a E y l en términos de a y ǫ: p p k (5.114) E=− ; l = µka 1 − ǫ2 2a Entonces (5.33) toma la forma: r Z µa r rdr p t − t0 = 2 k r0 −r + 2ar − (1 − ǫ2 )a2 Usando la expresión para τ , ecuación (5.112), obtenemos: Z r r dr τ p t − t0 = 2πa r0 −r2 + 2ar − (1 − ǫ2 )a2 La solución a esta integral se encuentra en tablas. El resultado es: r−a 1p 2 2πa −r + 2ar − (1 − ǫ2 )a2 + arcsen (t + δ) = − τ a ǫa donde δ es una constante arbitraria. Definamos las siguientes variables: (5.115) (5.116) (5.117) 2π a−r (t + δ) ; ψ = cos−1 (5.118) τ ǫa Las cantidades M , ψ y φ reciben los siguientes nombres en astronomı́a: M , anomalı́a media; ψ, anomalı́a excéntrica y φ, anomalı́a verdadera (véase figura 5.14). De simples argumentos geométricos se sigue a partir de las fórmulas de la elipse que ψ y M tienen la siguiente interpretación geométrica: M= 148 / Mecánica clásica avanzada y R Q P M ψ r φ x Figura 5.14 Variables de la ecuación de Kepler. ψ es el ángulo del vector de posición del punto Q, tomando como origen el centro de la elipse. R es un punto que gira uniformemente sobre una circunferencia de radio a, con velocidad angular 2π/τ . φ y M sirven para describir la posición del punto p (véase el texto de Marion, Classical dynamics of particles and systems, segunda edición, sección 8,8). Expresando a (5.117) en función de (5.118) obtenemos: r = (1 − ǫ cos ψ)a ; M = ψ − ǫsenψ (5.119) En (5.119) hemos adicionado a M la constante π/2. La ecuación que relaciona a ψ con M se denomina la ecuación de Kepler, y permite expresar a r en función del tiempo. ψ es una función trascendental de M . Bessel halló en 1830 la solución exacta de la ecuación de Kepler en forma de serie de Fourier. El resultado es: ψ =M +2 ∞ X Jn (nǫ) n=1 sen(nM ) n (5.120) donde Jn son las funciones de Bessel de orden entero. Entonces la expresión para r(t) es: ( " r(t) = a 1 − ǫ cos 2πν(t + δ)+ ∞ X sen{2πnν(t + δ)} 2 Jn (nǫ) n n=1 #) Ejemplo 5.3.1 Demostrar la solución (5.120) de la ecuación de Kepler. (5.121) Movimiento de dos partı́culas que interactúan ... / 149 ψ es una función impar de M , luego su expansión de Fourier contendrá sólo funciones seno y además contiene una componente no oscilante que será M misma. Entonces busquemos soluciones de la forma: ψ=M+ ∞ X Cn sen(nM ) (5.122) n=1 La expansión de Fourier de la función ǫ senψ = f (M ) tiene coeficientes dados por: Z 2 π Cn = f (M ) sen(nM ) dM (5.123) π 0 Utilizando la ecuación de Kepler, el integrando en (5.123) será: Z 2ǫ π senψ sen[n(ψ − ǫ senψ)](1 − ǫ cos ψ)dψ Cn = π 0 (5.124) Efectuando los productos y expresando los productos de funciones seno como suma de funciones coseno llegamos a: Z ǫ πn cos[(n − 1)ψ − nǫsenψ] dψ − cos[(n + 1)ψ Cn = π 0 1 (5.125) −nǫsenψ] dψ − ǫ cos[(n − 2)ψ 2 o 1 −nǫ senψ]dψ + ǫ cos[(n + 2)ψ − nǫsenψ] dψ 2 La función de Bessel entera tiene la siguiente representación integral: Z 1 π Jκ (x) = cos (κθ − xsenθ)dθ ; κ : entero π 0 Con lo cual Cn toma la forma: h Cn = ǫ Jn−1 (nǫ) − Jn+1 (nǫ) i ǫ ǫ − Jn−2 (nǫ) + Jn+2 (nǫ) 2 2 (5.126) (5.127) Las funciones Jκ tienen la siguiente relación de recurrencia: Jκ+1 (x) = 2κ Jκ (x) − Jκ−1 (x) x (5.128) El uso de (5.128) nos permite llegar finalmente a: Cn = 2 Jn (nǫ) n (5.129) Con lo cual queda demostrada la expresión (5.120). Precesión de las órbitas elı́pticas. Vimos que, bajo fuerzas centrales, las órbitas son simétricas respecto a cualquier ábside, por lo tanto el ángulo entre cualquier par de lı́neas absidales consecutivas es el mismo. En el problema de Kepler (k > 0, E < 0), 150 / Mecánica clásica avanzada las órbitas son cerradas, o sea que el ángulo de precesión de los ábsides es cero. En el movimiento planetario, por ejemplo, hay efectos “perturbadores”, que hacen que el potencial no sea exactamente de la forma −k/r, aunque lo sea aproximadamente. Para el movimiento de la luna alrededor de la tierra, además de la interacción gravitacional entre estos dos cuerpos tomados como masas puntuales, hay efectos adicionales como una fuerza externa no central debida al campo gravitacional homogéneo producido por el sol sobre la órbita de la luna; esto se traduce en pequeñas oscilaciones del plano de la órbita. La tierra y la luna no son masas puntuales y por ello la interacción del tipo −k/r es sólo el primer término en una expansión multipolar, que dependerá de la distribución de masa de los cuerpos; la parte central de esta interacción dará lugar a la precesión de la órbita, o sea al giro del semieje mayor de la elipse, y la parte no central da lugar a movimientos giroscópicos de la tierra y la luna. En el caso de Mercurio hay efectos de precesión de su órbita debidos al efecto combinado de todos los demás cuerpos del sistema solar y efectos residuales que sólo son explicados por la teorı́a general de la relatividad. Ejemplo 5.3.2 Analizar la precesión de la órbita de una partı́cula que se mueve en presencia del potencial: V =− C k + 2; r 2r C ≪1 ka (5.130) γ =2 Figura 5.15 Trayectoria para γ = 2 Tenemos que la fuerza sobre la partı́cula es central, ası́ que ~l es constante. La ecuación diferencial de la órbita es: µ d2 υ + υ = − 2 2 (−kυ 2 + Cυ 3 ) ; dφ2 l υ υ= 1 r (5.131) Movimiento de dos partı́culas que interactúan ... / 151 γ =3 Figura 5.16 Trayectoria para γ = 3 La solución de (5.131) es: α = 1 + ǫ cos γ(φ − φ0 ) ; r γ 2 l2 α= ; µk γ= r 1+ µC l2 (5.132) donde ǫ y φ0 son constantes de integración. φ0 es la dirección del vector absidal rmin y ǫ se puede expresar en términos de las constantes de movimiento comparando las dos expresiones para las distancias de retorno. s ! k α 2El2 2 rmax, min = − = 1± 1+ γ (5.133) 2E µk 2 1±ǫ Se sigue entonces que: rmax − rmin E= = rmax + rmin s 1+ 2El2 2 γ ; µk 2 a=− k 2E (5.134) El efecto del término adicional es variar ligeramente la excentricidad de la órbita e introducir el factor de γ a φ − φ0 . Cuando r = rmin , φ = φ0 y cuando r = rmax , φ = φ0 + φ/γ. Entonces el ángulo entre los vectores absidades γmin y rmax es: φmax − φmin = π γ (5.135) 152 / Mecánica clásica avanzada γ=5 Figura 5.17 Trayectoria para γ = 5 y no π como cuando C = 0. De esta forma, al cumplir un perı́odo, el vector rmin sufre un desplazamiento angular dado por: 1 (5.136) ∆φ = 2π 1 − γ Si la partı́cula tarda un tiempo Tr en ir de un valor de rmin al consecutivo, tardará un tiempo mayor en φ dar una vuelta completa. La trayectoria será cerrada solamente si ∆φ es un submúltiplo racional de 2π, o sea, si γ es un número racional, lo cual ocurrirá sólo accidentalmente. Si r ≥ 1 la órbita es esencialmente una elipse que precesa; el semieje menor rmin rota 2π(1 − γ −1) por cada ciclo de variación de r. Ver figuras 5.15 a 5.18. Un ejemplo de aplicación del método variacional. Muchas veces no es posible resolver exactamente un problema mecánico, pero es deseable obtener información aproximada sobre el mismo. Supongamos que hay un sistema cuya solución conocemos exactamente y que tiene aspectos similares al sistema original para el cual no conocemos la solución; la solución para el sistema aproximado contendrá una serie de parámetros. El principio variacional de Rayleigh expresa que la energı́a del sistema es menor que el valor medio del hamiltoniano tomado sobre la trayectoria del sistema aproximado, de modo que del sistema aproximado se puede obtener una aproximación óptima al problema original buscando cuáles son los valores de los parámetros que minimizan al valor medio del hamiltoniano. En otras palabras: el sistema original posee un hamiltoniano Movimiento de dos partı́culas que interactúan ... / 153 γ = 1,33 Figura 5.18 Trayectoria para γ ≈ 1 que es función de las variables de estado, H(q, p); para cada estado de movimiento (q, p), H tendrá un valor definido. Si se toman q(t) y p(t) no de la solución exacta sino de una aproximada, el valor de H siempre será en promedio mayor que el que tendrı́a tomando para q(t), p(t), sus valores exactos. Este método está relacionado con el método variacional usado en mecánica cuántica para hallar la energı́a del estado base de un sistema usando funciones de onda de ensayo. Veamos cómo trabaja por medio de un ejemplo. Consideremos un átomo de litio y tratemos de hallar las energı́as del electrón externo usando la vieja mecánica cuántica. De acuerdo con el modelo de capas del átomo, el Li consta de dos electrones internos y uno externo. E. Schrödinger en 1921 propuso el siguiente modelo.4 El resto del átomo –los electrones internos– es reemplazado por una capa esférica de distribución uniforme de carga negativa, externa a la cual hay entonces un campo de fuerza coulombiano, correspondiente a una carga positiva +e del núcleo “apantallado” por dos electrones, y en el interior hay un campo coulombiano, correspondiente a una carga positiva +3e, la del núcleo. Llamemos ρ al radio del cascarón. Entonces la energı́a potencial en este modelo será:  2e2 3e2   − + r<ρ r ρ (5.137) V = 2   −e r>ρ r 4 Véase el texto The mechanics of the atom de Max Born, sección 28. 154 / Mecánica clásica avanzada donde la constante 2e2 /ρ asegura la continuidad de V en r = ρ. Para el caso en que la energı́a sea lo suficientemente alta, la órbita permanecerá a distancias del núcleo mayores que ρ, con lo cual la solución será, para el electrón externo, una trayectoria elı́ptica como en la figura 5.13. Pero cuando el perihelio de la órbita resulta menor que ρ, la órbita penetra al interior y no será más de forma elı́ptica pues será la correspondiente al potencial (5.137) que no es coulombiano. Si el electrón externo sólo permanece dentro de la esfera de radio ρ una fracción pequeña de tiempo es de esperarse que la órbita sea una elipse que precesa, como en la figura 5.18. Durante un perı́odo la órbita exacta correspondiente al potencial (5.137) diferirá poco de la órbita correspondiente al potencial coulombiano. Tomaremos entonces como soluciones de ensayo las órbitas elı́pticas en un potencial: V =− ze2 r (5.138) donde z será un parámetro variacional que se determina por la condición de que hHi sea un mı́nimo. Por simplicidad supondremos que el electrón externo está en un estado s, o sea que tiene l = 0. Para este caso, según (5.104) la excentricidad será ǫ = 1. Como V es central, el hamiltoniano es de la forma (5.28), o sea que interviene sólo la coordenada radial. Usando (5.119) y (5.118) obtenemos, tomando δ = 0: r = (1 − cos ψ)a ; 2πνt = ψ − senψ (5.139) La ecuación (5.139) permite escribir a r y ṙ en la forma: r = 2a sen2 ψ ; 2 ṙ = 2πνa cot ψ 2 (5.140) La ecuación (5.140) permite ahora expresar a H en términos de la solución de ensayo ası́: H=  3e2 2e2 2 ψ  2 ψ 2 2 2  − csc + 2π mν a cot   2 2a 2 ρ  2    2π 2 mν 2 a2 cot2 ψ − e csc2 ψ 2 2a 2 r<ρ (5.141) r>ρ El valor medio de H en un perı́odo será, usando la ecuación de Kepler: hHi = 2ν Z 1/(2ν) 0 2 Hdt = π Z π 0 ψ Hsen2 dψ 2 (5.142) Llamando ψ1 al valor de ψ cuando r = ρ obtenemos de (5.140): ψ1 = sen 2 r ρ 2a (5.143) Movimiento de dos partı́culas que interactúan ... / 155 Podemos separar la integral (5.142) en dos, de 0 a ψ1 y de ψ a π, con lo cual obtenemos después de manipulaciones simples: Z 2 ψ1 3e2 2e2 2 2 2 2 ψ 2ψ hHi = 2π mν a cos dψ − + sen π 0 2 2a ρ 2 (5.144) Z 2 e ψ 2 π dψ 2π 2 mν 2 a2 cos2 − + π ψ1 2 2a Efectuando las integraciones llegamos a: 2 2 e e2 e2 e2 hHi = − ψ1 + ψ1 − senψ1 + π 3 mν 2 a2 − π π a ρ ρ 2a (5.145) Es conveniente expresar a e2 /a en términos del número cuántico principal n, la energı́a de Rydberg y el parámetro z, ası́: z z e2 = e 2 = 2R a n a0 n (5.146) donde a0 es el radio de Bohr y R = e2 /a0 . Como a = n2 a0 /z, notamos por analogı́a que ρ será el radio de la órbita de los electrones internos, que se mueven en presencia del núcleo que tiene carga 3e, y están en la primera órbita que tiene n = 1; entonces ρ = a0 /3. De esta forma (5.143) es: r 1 z ψ1 = (5.147) sen 2 n 6 Usando (5.112) con k = ze2 obtenemos: π 2 mν 2 a2 = π z2 R 4 n2 de modo que (5.145) tomará la forma: " r 2z 1 z 2R 6 − 2 arcsen hHi = π n n 6 r # 1 z2 π z2 − 6z − 2 + −z n n 2n 2 (5.148) (5.149) z es un parámetro que se determina por la condición de que minimice a hHi, es decir, por la condición: ∂hHi =0 ∂z (5.150) Efectuando las manipulaciones algebraicas llegamos a que z satisface la siguiente ecuación trascendental: r π 1 z = sen (z − 1) (5.151) n 6 4 156 / Mecánica clásica avanzada de (5.151) se sigue que z debe ser positiva. Una vez hallada z de (5.151) se reemplaza en (5.149) para obtener la energı́a: " R n E= 2z(z − 1) 1 − 2 2n 2 # r 4n z2 +zn(1 − 6n) + 6n + 6z − 2 (5.152) π n De acuerdo con el principio variacional, la aproximación óptima por medio de órbitas de Kepler al movimiento bajo el potencial (5.137) se halla por medio del potencial coulombiano −ze2/r, donde z es el número que se obtiene de (5.151) para cada n. Los resultados que se obtienen al resolver numéricamente a (5.151) son aproximados, dando errores grandes para n = 2 y errores que van disminuyendo a medida que n aumenta; las energı́as variacionales siempre serán mayores que las experimentales. Ası́, por ejemplo, algunos resultados son: (n, Evar , Eexp )= (2; −0, 29; −0, 58); (8; −0, 06; -0, 12); (15; −0, 03; −0, 06); (40; -0, 01; −0, 03). Los resultados no son muy buenos pero ilustran el método variacional que es usado extensivamente en muchas ramas de la fı́sica; las discrepancias se deben en parte al modelo –suponer que el potencial es central y dado por (5.137)–, en parte al método variacional en sı́, y en parte al uso de la aproximación clásica. 5.4. El problema de la dispersión bajo fuerzas centrales Esta sección trata con las soluciones que describen estados no ligados; tales son los casos k < 0, k > 0 y E > 0 en el movimiento bajo el potencial −k/r. Cuando el problema es causal, es decir se conocen exactamente las constantes de movimiento y φ0 , las ecuaciones de la órbita nos dan la evolución de la partı́cula; este problema es estrictamente mecánico. En fı́sica microscópica, cuando se trabaja con átomos, moléculas o electrones, entre otros, una descripción mecánica es muy difı́cil; entonces se acude a conceptos estadı́sticos. En esta sección en gran parte trabajaremos con los conceptos estadı́sticos de la sección eficaz, aptos para sistemas microfı́sicos, aunque también se aplican por ejemplo en cosmologı́a. La sección eficaz de dispersión. Un experimento tı́pico de dispersión consiste en estudiar el efecto de un centro dirpersor sobre un haz de partı́culas. Se entiende por dispersión el proceso de colisión en el cual la dirección del movimiento de las partı́culas incidentes cambia al azar, como resultado de la interacción con el centro dispersor. En el estudio estadı́stico se hacen las siguientes suposiciones: todas las partı́culas del haz incidente son de la misma naturaleza y tienen la misma energı́a y dirección de la velocidad inicialmente. La interacción es de corto rango, de modo que a partir de distancias mayores que cierta cantidad α es esencialmente cero. El haz de partı́culas Movimiento de dos partı́culas que interactúan ... / 157 incidentes tiene una sección transversal A que es mucho mayor que el área efectiva de interacción σ = πα2 , las partı́culas se distribuyen al azar sobre el área de la sección transversal del haz. El haz tiene un número muy grande de partı́culas para permitir un tratamiento estadı́stico, pero no tan grande como para que una partı́cula del haz interfiera con otra. Toda partı́cula que se acerque al centro dispersor a una distancia menor que α es dispersada; la probabilidad a priori de una partı́cula ser dispersada es: p= σ ; A σ = πα2 (5.153) donde σ se llama sección eficaz total de dispersión y es una medida de la dispersión en cualquier ángulo. Llamaremos θ al ángulo entre la dirección del haz incidente y la del movimiento final de una partı́cula dispersada. Las partı́culas que incidan sobre el blanco con un parámetro de impacto s serán dispersadas en un ángulo θ; las que incidan con un parámetro de impacto s + ds serán dispersadas en un ángulo θ + dθ donde dθ es negativo. Todas las partı́culas que incidan sobre una corona circular de radios s y s + ds serán dispersadas dentro del rango angular θ y θ + dθ. Todas las partı́culas que incidan sobre el área dσ (área rayada en la figura 5.19) se dispersarán con ángulos entre θ y θ + dθ y φ + dφ. Como suponemos que r ≫ α, rd θ A dσ r dϕ θ θ + dθ dϕ ds Figura 5.19 Sección eficaz de dispersión entonces hemos notado que no hay diferencia esencial en suponer que las partı́culas emergen del centro dispersor en vez del centro del área rayada dσ. Estas partı́culas serán dispersadas dentro de un ángulo sólido dΩ dado por: dΩ = senθ dθ dφ (5.154) La probabilidad de dispersión dentro del ángulo dΩ se expresa en función de la llamada sección eficaz dσ. dp = dσ s ds dφ = A A (5.155) Supongamos que la intensidad del haz incidente es I: I= ∆N A ∆t (5.156) 158 / Mecánica clásica avanzada donde ∆N es el número de partı́culas incidentes que pasan por el área A durante el tiempo ∆t. De las ∆N que en ∆t pasan a través de A, solamente dN (θ) incidirán sobre el área dσ y serán dispersadas dentro de dΩ en el tiempo ∆t. Entonces la probabilidad de dispersión dentro de dΩ durante el tiempo ∆t será: dp = dN (θ) dσ = ∆N A (5.157) Se sigue entonces de (5.156) y (5.157) que: dN (θ) = Idσ ∆t (5.158) Definimos la sección eficaz diferencial σ(θ), como: σ(θ) = dσ dΩ (5.159) Se sigue entonces que: σ(θ) = 1 dN (θ) I(θ) = I I ∆t dΩ (5.160) Es decir, σ(θ) es igual al número total de las partı́culas dispersadas dentro de dΩ por unidad de tiempo y unidad de ángulo sólido, dividido por el número de partı́culas incidentes por unidad de área por unidad de tiempo. Como esta definición de σ(θ) incluye sólo conceptos macroscópicos, o sea conceptos de cantidades observables experimentalmente, entonces es válido también en mecánica cuántica. La siguiente expresión mecánica que resulta de (5.159) al reemplazar a dσ y dΩ en función de θ, φ y s sólo es válida en mecánica clásica, σ(θ) = dσ −s ds = dΩ senθ dθ (5.161) La ecuación (5.161) está expresada en función de s, que en microfı́sica no es accesible directamente al experimento. La relación entre las tres definiciones de sección eficaz (sección eficaz, sección eficaz total y sección eficaz diferencial) es: Z Z σ = dσ = σ(θ) dΩ (5.162) Ejemplo 5.4.1 Sea una esfera dura de radio a y masa infinita. Sobre ella incide un haz de partı́culas de masa m y radio b también duras, que se dispersan elásticamente al chocar. Hallar la sección eficaz diferencial (véase figura 5.20). El parámetro de impacto está dado por: s = (a + b) senα = (a + b) cos θ 2 (5.163) Movimiento de dos partı́culas que interactúan ... / 159 a z S b α α θ Figura 5.20 El haz partı́culas de masa m y radio b incide sobre una esfera de masa infinita y radio a Entonces: σ(θ) = 1 (a + b)2 ; 2 σ = π(a + b)2 (5.164) σ(θ) no depende de θ ni de la energı́a. Cuánticamente se halla que σ es cuatro veces mayor debido a efectos de difracción. Sección eficaz diferencial de Rutherford. Es la sección eficaz diferencial de dispersión coulombiana, cuando inciden partı́culas cargadas sobre un blanco de masa infinita y cargado eléctricamente. Asumamos que las cargas son positivas, ze y z ′ e, de modo que k es negativo, igual a −zz ′e2 . La figura 5.21 muestra la trayectoria de una de las partı́culas, que es hiperbólica. Tomamos por simplicidad a φ0 = 0 con lo cual obtenemos de acuerdo con la figura 5.9, la figura 5.21. De acuerdo con la definición de sección cónica, la ecuación de la hipérbola (rama 1 en la figura 5.9) es: QF2 = ǫQD2 (5.165) donde Q es el punto cuyo vector de posición es ~r, F2 es el foco de la derecha y D2 la directriz de la derecha. Entonces la ecuación de la trayectoria es: ǫs ǫs l2 /mk = −1 − ǫ cos φ ⇒ φ = π → rmin = = r ǫ−1 1−ǫ (5.166) Que también se obtiene directamente de (5.85) cuando k < 0 y φ0 se sustituye por φ0 + π. r → ∞ cuando −1 − ǫ cos φ = 0, o sea cuando φ toma el valor: 1 (5.167) φmin = cos−1 − ǫ φmin está relacionado con el ángulo de dispersión θ: φ π θ + θ = φmin ; θ + φ = π ⇒ φmin = + 2 2 2 (5.168) 160 / Mecánica clásica avanzada y • z′e Q  θ / 2    r Θ O ϕ •ze x v∞ •u S Figura 5.21 Dispersión de Rutherford. La trayectoria de las partı́culas es hiperbólica. Entonces: 1 θ θ cos φmin = −sen = − ⇒ ǫ = csc 2 ǫ 2 (5.169) Por otra parte ǫ está relacionado con E y l, o sea con υ∞ y con s: l = mυ∞ s ; E = 1 mυ∞ 2 2 (5.170) Como, según (5.89), ǫ2 = 1 + 2El2 /(mk 2 ), vemos que: s2 = k2 2 (ǫ − 1) 4E 2 (5.171) De (5.169) y (5.171) se sigue que: s= k θ cot 2E 2 Reemplazando a (5.172) en (5.161) obtenemos para σ(θ): 2 θ k csc4 σ(θ) = 4E 2 (5.172) (5.173) que es la fórmula de Rutherford.5 Como el resultado no depende del signo de k, la fórmula también es válida cuando el potencial es atractivo. 5 Hallada en 1911. En el tomo I del Berkeley physics course, al final del capı́tulo 15, puede verse el trabajo original de Rutherford. Movimiento de dos partı́culas que interactúan ... / 161 La fórmula (5.173) coincide exactamente con la formula cuántica no relativı́stica; es uno de los varios resultados en que para potenciales del tipo 1/r hay una identidad con los resultados cuánticos. La sección eficaz total que se calcula de (5.173) resulta infinita. Como σ es una medida de la dispersión, el área efectiva para la dispersión de Coulomb es infinita por ser un potencial de rango largo α = ∞. No importa a que distancia pase el proyectil del blanco siempre habrá dispersión en alguna dirección. Sistemas de referencia de centro de masa y de laboratorio. Hasta aquı́ las consideraciones de las órbitas se han hecho suponiendo que el centro de fuerzas es inmóvil, lo que equivale a decir que trabajamos en un sistema de referencia donde se mueve una partı́cula de masa reducida µ, que puede asumirse que está colocada en vez de la partı́cula 2, en tanto que el centro de fuerzas, inmóvil, está donde estaba la partı́cula 1. El radio vector ~r describe el movimiento de la partı́cula µ, ası́ como el movimiento relativo de las dos partı́culas originales [ecuaciones (5.9) a (5.13)]. Aquı́ analizaremos más en detalle la transformación de coordenadas, de manera adecuada a los procesos de dispersión bajo fuerzas centrales. Experimentalmente los procesos de dispersión se trabajan en el sistema de referencia de laboratorio. Los cálculos teóricos se hacen en el sistema de centro de masa, donde la dinámica de los problemas consiste en el movimiento de la partı́cula de masa µ. Es necesario encontrar la conexión entre los resultados teóricos y los experimentales. Todas las fórmulas anteriores de (5.153) a (5.173) han sido obtenidas suponiendo que el centro dispersor es fijo (véase figura 5.22). En el laboratorio usualmente una de las dos partı́culas, que llamaremos el blanco, está inicialmente en reposo y sobre ella incide el proyectil con cierta velocidad. La velocidad inicial del proyectil, cuando la separación de las dos partı́culas es mucho mayor que el rango de la interacción α, es ~υ y la del blanco ~ = 0. En el centro de masa estas dos velocidades son ~υc y V ~c respectivamente. La es V m -v v m m c.m. Laboratorio: inicial M1 vc x x c.m. v=0 vc Laboratorio: final Figura 5.22 Sistemas de referencia de centro de masa y de laboratorio velocidad del centro de masa respecto al laboratorio es constante, la llamaremos ~υ . m ~υ = ~υ (5.174) m+M Los momentos lineales de las partı́culas inicialmente, cuando su separación es muy grande de modo que no interactúan, son en el laboratorio: p~P L = m~υ ; pBL = 0 y en el centro de masa son: p~P C = m(~υ − ~υ) = µ~υ ; (5.175) ~pBC = M (0 − ~υ) = −µ~υ (5.176) 162 / Mecánica clásica avanzada Las energı́as cinéticas totales de acuerdo con lo hallado en (5.11) a (5.13) son: TL = 1 mυ 2 ; 2 TC = 1 2 µυ 2 (5.177) La energı́a cinética del centro de masa, que es constante, es: TC.M = 1 (M + m)υ 2 2 (5.178) De modo que si p ~ es el momento lineal relativo, las energı́as cinéticas están conectadas por: TL = p~2 P~ 2 + = TC.M + Tc 2(M + m) 2µ (5.179) o sea que en la región asintótica (r → ∞): TL = EL ; EC.M = TC.M = µ EL ; M EL = m EC µ (5.180) El momento lineal total anterior a la colisión (r → ∞), es igual al momento lineal total después de la colisión (r → ∞). Usaremos primas para denotar las cantidades en la región asintótica después de la colisión. En el centro de masa el momento lineal total es cero, de modo que: ~C = 0 ; m~υC + M V ′ ~′ =0 m~υC + MV C (5.181) La ecuación de la conservación de la energı́a total en el centro de masa es: 1 1 ~2 1 1 ~ ′2 2 ′2 m~υC + MV υC + MV C = m~ C 2 2 2 2 La fórmula (5.182) se puede escribir, usando (5.181), en la forma: m ′ m ′ ′ · ~υC + ~υC = ~υC ~υ ~υC · ~υC + M M C (5.182) (5.183) Se sigue entonces que: 2 ′2 υC = υC ; VC2 = VC′2 ; ′ mυC = mυC = M VC = M VC′ (5.184) es decir, las magnitudes de los cuatro momentos lineales, incidentes y emergentes, son iguales, de modo que en el centro de masa cada partı́cula queda después de la colisión con la misma energı́a inicial.6 En el proceso de colisión no interviene el ángulo φ, porque con fuerzas centrales el movimiento ocurre en un plano (véase figura 5.23). Analicemos ahora la relación entre los ángulos de dispersión θL y θC . La relación de las velocidades de centro de masa y laboratorio es: ′ ′ ~υL = ~υC + ~υ ; 6 Se V~L′ = V~C′ + ~υ (5.185) ve que la partı́cula µ no coincide con m cuando se toma el origen de ~ r en el centro de masa. Como sólo interesa θC , es irrelevante saber dónde está el origen de ~ r. Movimiento de dos partı́culas que interactúan ... / 163 v2′ m Vc′ m r Θc Θ2 v vc v r C.M. Centro de mesa M C.M. vc v=0 Laboratorio v2′ vc′ Figura 5.23 Sistemas laboratorio y centro de masa Sabemos que: υC = ~ M~ ~BC p = υ; m m ~C ′ = p~BC = −~υ V M (5.186) ′ Como υC = υC y VC′ = VC , la ecuación (5.186) nos dice que: ′ υC = M υ; m VC′ = −υ (5.187) ′ ′ O sea que si M > m entonces υC > υ = VC′ y si M < m, entonces υC < υ = VC′ . Podemos distinguir dos casos, M > m y M < m. Si m > M , de acuerdo con las figuras 5.24 y 5.25, θL es máximo cuando ~υC ′ es perpendicular a ~υL ′ , luego: senθLmax = ′ M υC = υ m (5.188) o sea que hay una región angular en el laboratorio que está prohibida cuando m > M . Si m < M , todos los valores de θL son posibles. La relación entre θC y θL es común para los casos m > M y m < M . Dicha relación se obtiene a partir de: υL senθL = υC senθC ; υL cos θL = υ + υC cos θC (5.189) Se sigue entonces que: tan θL = senθC ; cos θC + γ γ= m M (5.190) Vemos que si m ≪ M , entonces θL ≃ θC . Si m ≃ M y γ ≃ 1, entonces θL ≃ (1/2)θC . Hallemos ahora la relación entre las secciones eficaces diferenciales σL (θL ) y σc (θc ). La sección eficaz dσ es invariante por ser perpendicular a la dirección del movimiento del proyectil en los dos sistemas de referencia: dσC = dσL (5.191) 164 / Mecánica clásica avanzada v ′L vi′C ΘL ΘC v γ>1 Figura 5.24 Relación entre los ángulos de dispersión θC y θL con γ > 1 v ′L ΘL vi′C ΘC v γ<1 Figura 5.25 Relación entre los ángulos de dispersión θC y θL con γ < 1 de (5.159) se sigue entonces que: σC (θC )dΩC = σL (θC )dΩL ; σL (θL ) = σC (θC ) d(cos θC ) d(cos θL ) (5.192) Movimiento de dos partı́culas que interactúan ... / 165 Para hallar el factor en (5.192), notemos que de (5.190) se sigue: tan θC = senθL cos θL − γ 1+γ (5.193) Entonces usamos: d(cos θC ) d(cos θC ) d(tan θC ) = = d(cos θL ) d(tan θC ) d(cos θL ) Para obtener finalmente:7 2 p 2 sen2 θ + γ cos θ 1 − γ L L d(cos θC ) p = fγ (θL ) = d(cos θL ) 1 − γ 2 sen2 θL (5.194) (5.195) La fórmula σL (θL ) = fγ (θL )σC (θC ) da la conexión entre los cálculos teóricos, centro de masa, y las medidas experimentales, laboratorio. Si γ = 1, vemos que f1 (θL ) = 4 cos θL , y si γ = 0, f0 (θL ) = 1. Ejemplo 5.4.2 Hallar la sección eficaz diferencial de dispersión en el laboratorio para la colisión de dos esferas duras de masas m y M , y radios b y a respectivamente. En el centro de masa la dispersión es como en la figura 5.20, de modo que: σC (θC ) = 1 (a + b)2 4 (5.196) El resultado se obtiene usando la siguiente consideración: el problema es como si reemplazáramos la esfera de masa m por una de masa µ, y la esfera de masa M por una de masa infinita. Como la interacción es la misma, entonces el radio de la esfera de masa µ debe ser b y el de la esfera de masa infinita debe ser a. Como la ecuación (5.164) no depende del valor de la masa, se sigue el resultado (5.196). En el sistema de referencia de laboratorio la sección eficaz diferencial es: σL (θL ) = 1 (a + b)2 fγ (θL ) 4 (5.197) La sección eficaz diferencial en el centro de masa es isotrópica, en tanto que en el laboratorio sı́ habrá una dependencia angular. En virtud del resultado (5.188), la función fγ (θL ) debe definirse idénticamente igual a cero para ángulos θL mayores que θL máximo, cuando γ > 1. Ejemplo 5.4.3 Hallar la sección eficaz diferencial de Rutherford en el laboratorio cuando la masa de la carga ze es finita. 7 Ver la demostración en el texto Classical dynamics of particles and systems de Marion, 2a ed., ¯ sección 9.4. 166 / Mecánica clásica avanzada En el centro de masa σC (θC ) está dada por (5.173): 2 k θC σC (θC ) = csc4 ; k = −zz ′ e2 4E 2 En el laboratorio será:  σL (θL ) = k 4E 2   1 +  cos θL − γ 1+γ sen2 θL 2 −2     fγ (θL ) (5.198) (5.199) o sea que la dependencia angular en el laboratorio es mucho más complicada que en el centro de masa. Cuando γ = 1 sin embargo, los resultados son simples debido a que θC = 2θL y f1 (θL ) = 4 cos θL : 2 cos θL k ; γ=1 (5.200) σL (θL ) = 2E sen4 θL 6 Pequeñas oscilaciones de sistemas de varios grados de libertad En vez de exponer el formalismo general, resolveremos en detalle algunos problemas que ilustran los aspectos principales del mismo. Veremos que las fórmulas que se obtienen en forma de matrices se generalizan fácilmente. Al respecto, el lector puede ver los correspondientes capı́tulos en los textos de Goldstein, Hauser, Marion, Gantmacher, entre otros, donde además se explica en qué consiste la “pequeñez” de las oscilaciones. 6.1. Modos normales de oscilación. Caso no degenerado La molécula triatómica lineal. Oscilaciones longitudinales. La molécula triatómica lineal consta de dos átomos de masa m y uno de masa M , ligados entre sı́ por fuerzas interatómicas de modo que en la configuración de equilibrio la molécula es lineal, y al oscilar se conserva la forma lineal (véase figura 6.1). Supondremos que las interacciones más importantes se presentan entre los átomos 1 y 2, y 2 y 3; más adelante incluiremos una interacción un poco más general. La energı́a potencial de interacción entre dos átomos puede variar como un pozo de potencial, a grandes distancias es atractiva y a pequeñas distancias es repulsiva, con un mı́nimo en una distancia dada. Nos interesaremos en los movimientos que consisten en pequeñas oscilaciones alrededor de la posición en que la energı́a potencial tiene un mı́nimo, que es una posición de equilibrio estable. m M m x1 x2 x3 Figura 6.1 Molécula triatómica lineal 167 168 / Mecánica clásica avanzada Para estos movimientos se cumple: (a) La energı́a potencial es del tipo de un “resorte” con pequeñas elongaciones; (b) La energı́a cinética no depende de la posición, o sea, es función cuadrática homogénea de las velocidades, con coeficientes que no dependen de la posición. Ver la discusión detallada de lo anterior, por ejemplo en Gantmacher, numeral 40. El número de grados de libertad necesarios para especificar las oscilaciones longitudinales es 3 − 1 = 2 descontando la traslación del centro de masa. La longitud del “resorte” que une los átomos 1 y 2 es x2 − x1 . Supondremos que en la posición de equilibrio la longitud de este “resorte” es b, o sea que x20 − x10 = b, siendo xi0 la coordenada de la partı́cula i en la configuración de equilibrio. La elongación del resorte 1−2 será entonces: (x2 − x1 ) − b = (x2 − x20 ) − (x1 − x10 ) (6.1) ηi = xi − xi0 (6.2) Si llamamos a η1 , η2 y η3 la cantidad en que se separa cada átomo de su posición de equilibrio: podemos escribir las elongaciones de los resortes 1 − 2 y 2 − 3 como: η2 − η1 y η3 − η2 (6.3) de modo que la energı́a potencial para pequeñas oscilaciones será: 1 1 k(η2 − η1 )2 + (η3 − η2 )2 V = 2 2 (6.4) 1 2 2 2 k(η1 + 2η2 + η3 − 2η1 η2 − 2η2 η3 ) 2 donde k es la “constante de resorte”, cuyo valor depende de factores que no entraremos a considerar aquı́, pero que supondremos conocido. En (6.4) no se incluye interacción entre los átomos 1 y 3. Las coordenadas η1 , η2 , η3 , no son todas vibracionales pues sabemos que las vibraciones longitudinales requieren sólo dos coordenadas. V puede escribirse en la forma: 3 1 X kij ηi ηj (6.5) V = 2 i,j=1 donde kij son los elementos de la matriz 3 × 3, k̃:   1 −1 0      −1 2 −1 k̃ = k      0 −1 1 (6.6) k̃ es una matriz simétrica, kij = kji . La energı́a cinética es: 1 1 1 mẋ21 + M ẋ22 + mẋ23 T = 2 2 2 = 3 1 X mij η̇i η̇j 2 i,j=1 (6.7) Pequeñas oscilaciones de sistemas de varios grados de libertad / 169 donde mij son los elementos de la matriz 3 × 3, m̃, que es diagonal y por lo tanto simétrica:   m 0 0      m̃ =  0 M 0  (6.8)    0 0 m El lagrangiano del problema es: L= 3 1 X (mij η̇i η̇j − kij ηi ηj ) 2 i,j=1 (6.9) Para hallar las ecuaciones de Lagrange se requiere conocer las derivadas parciales de L respecto a ηi y η̇i . Para ello evaluemos a dL: dL = 3 1 X (mij dη̇i η̇j + mij η̇i dη̇j − kij dηi ηj + kij ηi dηj ) 2 i,j=1 (6.10) usando la simetrı́a de k̃ y m̃, un cambio adecuado de los ı́ndices mudos de la suma permite escribir,      3 3 3 X X X  mij η̇j  dη̇i −  kij ηj  dηi  (6.11) dL = i=1 j=1 j=1 con lo cual obtenemos: 3 3 X X ∂L ∂L kij ηj ; mij η̇j ; i = 1, 2, 3 =− = ∂ηi ∂ η̇i j=1 j=1 (6.12) Teniendo en cuenta que las mij son constantes, las ecuaciones de Lagrange son: 3 X (mij η̈j + kij nj ) = 0; i = 1, 2, 3 (6.13) j=1 Si definimos los vectores en el espacio de configuración del sistema,       0 η̈1 η1             ¨    ~   η= ~  η2  ; ~η =  η̈2  ; 0 =  0        0 η̈3 η3 (6.14) las ecuaciones de Lagrange (6.13) toman la forma condensada: m̃~ η¨ + k̃~η = ~0 (6.15) 170 / Mecánica clásica avanzada Veremos que (6.15) es la forma de la ecuación de movimiento para cualquier sistema de muchos grados de libertad con pequeñas oscilaciones. El sistema que consideramos tiene sólo oscilaciones en una dimensión; sin embargo, por tener tres grados de libertad para los movimientos longitudinales, el espacio de configuración de tales movimientos es tridimensional. El problema que sigue es buscar las soluciones de (6.15) que describirán el movimiento del punto del espacio de configuración. La ecuación para el vector ~η , (6.15), es lineal, luego la solución general puede expresarse como una combinación lineal de las soluciones linealmente independientes. Como el vector ~ η es tridimensional, existirán tres soluciones linealmente independientes, en términos de las cuales puede expandirse a ~η ; tales soluciones las llamaremos ~ηα con α = 1, 2, 3, de modo que la solución general de (6.15) será de la forma: ~η = C1 ~ η1 + C2 ~η2 + C3 ~η3 (6.16) Como la ecuación de movimiento es de segundo orden, la solución contendrá dos constantes de integración arbitrarias por cada grado de libertad. En total hay seis constantes de integración que son C1 , C2 , C3 , φ1 , φ2 , φ3 . Busquemos soluciones de la forma: ~ηα = ~ µα sen(ωα t + φα ); α = 1, 2, 3 (6.17) ~ α es un vector tridimensional constante y φα es una constante de integración. Las µ componentes de ~ µα son µα1 , µα2 , µα3 . En términos de las componentes, (6.17) será: ηαi = µαi sen(ωα t + φα ) ; i, α = 1, 2, 3 (6.18) En (6.18) el ı́ndice i se refiere a los grados de libertad, en tanto que α numera las soluciones diferentes. ωα es una constante que no debe depender de las constantes de integración. Debido a que sen(ωα t + φα ) y sen(ωβ t + φβ ) son linealmente independientes cuando ωα 6= ωβ , las ~ηα serán linealmente independientes cuando ωα 6= ωβ . Las soluciones de la forma (6.17) y (6.18) representan los movimientos en los cuales todas las partı́culas oscilan con la misma frecuencia y tienen una definida relación entre sus amplitudes de oscilación. La pregunta que sigue es: ¿cuánto valen las ωα y cuáles son las relaciones que deben existir entre las µαi ?. Para responderla, reemplacemos a (6.18) en (6.15): (−ωα2 m̃ + k̃)~ µα = ~0 , 3 X (ωα2 mij + kij )µαj = 0; i, α = 1, 2 , 3 (6.19) j=1 La ecuación (6.19) es un sistema de tres ecuaciones lineales algebraicas homogéneo, con las tres incógnitas µα1 , µα2 , µα3 , que tendrá solución para ciertos valores de ωα . Hallar a ~ µα equivale a realizar la siguiente operación con matrices: µα = (−ωα2 m̃ + k̃)−1~0 ~ (6.20) Vemos que ~ µα será no trivial, es decir, diferente del vector ~0 solamente si la matriz k) es singular, o sea si su determinante es cero. Esto introduce una condición que permite determinar las ωα : (−ωα2 m + det(ωα2 m̃ − k̃) = 0 (6.21) Pequeñas oscilaciones de sistemas de varios grados de libertad / 171 La ecuación (6.21) se llama ecuación secular o determinante secular. El término secular proviene del latin seculum, o sea, referente a los siglos; se usa a partir de una ecuación análoga en astronomı́a que aparece al realizar cálculos perturbativos que predicen efectos sobre las órbitas apreciables sólo en tiempos muy largos. De acuerdo con las ecuaciones (6.6) y (6.8) se tiene que: ωα2 m̃  mωα2 − k   − k̃ =    k 0 k M ωα2 k 0 k − 2k mωα2 − k       (6.22) El determinante de la matriz (6.22) es: det ωα2 m̃ − k̃ = mωα2 − k (M ωα2 − 2k)(mωα2 − k) − k 2 −k k(mωα2 − k) (6.23) Por tanto la ecuación (6.21) es una ecuación algebraica de tercer grado en ωα2 , que tendrá tres raı́ces que serán ω12 , ω22 y ω32 : M + 2m k (ω 2 − 0) ω 2 − k det ωα2 m̃ − k̃ = m2 M ω 2 − m Mm (6.24) = m2 M (ω 2 − ω22 )(ω 2 − ω12 )(ω 2 − ω32 ) En conclusión, las frecuencias con las cuales puede ocurrir la oscilación simultánea de las tres coordenadas son: ω12 = 0; ω22 = k m k 1+2 ; ω32 = m m M (6.25) Si m ≪ M entonces ω2 ≈ ω3 presentándose una cuasidegeneración. Hay una matriz 172 / Mecánica clásica avanzada de la forma (6.22) por cada una de las frecuencias (6.25): ω12 m̃ − k̃ = ω22 m̃ − k̃ =  −k k    k   0      k   k k ω32 m̃ − k̃ =         2 0 k m k M k k 0     k    M − 2m k m 0    k    −k −2k 0  0 (6.26) 0 k 0 M m k k 2 m k M          Entonces las ecuaciones (6.19), que nos dan las relaciones entre las componentes de los vectores ~ µ1 , µ ~ 2 y ~µ3 , son:  −k    k   0  0     k           2 0 µ11    k    µ12  µ13 −k −2k k 0 k k k 0 M m k k 2  µ21  µ31    µ22 k     µ23 0 M − 2m k m m k M k 0 k 0  k  m k M        µ32    µ33    =      =      =    0       0         0   0       0         0   0       0         0  (6.27) Pequeñas oscilaciones de sistemas de varios grados de libertad / 173 Siendo más explı́citos, respectivamente estas ecuaciones toman la forma: µ11 = µ12 ; µ11 − 2µ12 + µ13 = 0; µ12 = µ13 µ22 = 0; µ21 + µ23 = 0; µ22 = 0 2 (6.28) m M 2m µ31 + µ32 = 0; µ31 + µ32 + µ33 = 0; µ32 + µ33 = 0 M m M Las relaciones buscadas entre los componentes de los vectores ~µα para los movimientos en que las tres partı́culas oscilan con la misma frecuencia son: ω1 : µ11 = µ12 = µ13 ω2 : µ21 = −µ23 ; µ22 = 0 ω3 : µ31 = µ33 ; µ32 = − (6.29) 2m µ31 M Cada vector µα resulta indeterminado por una constante arbitraria, aunque las relaciones entre sus componentes están bien definidas:1       1 1 1              2m      (6.30) µ1 = µ11  1  ; ~ ~ µ2 = µ21  0  ; ~µ3 = µ31  −   M        1 −1 1 Notamos que ~ µ1 , ~ µ2 y ~ µ3 no son ortogonales, puesto que: ~µ1 · ~µ2 = 0; ~µ1 · ~µ3 = 2µ11 µ31 (1 − m/M ); ~ µ2 · ~ µ3 = 0. Es deseable, sin embargo, trabajar con vectores ortogonales. Los vectores siguientes son ortogonales:  √    √ m m      √    1/2 1/2    m̃ ~ µ1 = µ11  M  ; m̃ ~µ2 = µ21  0       √ √ − m m  √ m   −2m  m̃1/2 µ ~ 3 = µ31  √  M  √ m  (6.31)       1 Las trayectorias descritas en el espacio de configuración son rectilı́neas. ~ η1 corresponde a una lı́nea infinita, describe una translación no acotada a lo largo del vector ~ µ1 . ~ η2 y ~ η3 describen oscilaciones sobre segmentos rectos finitos a lo largo de los vectores ~ µ2 y ~ µ3 respectivamente. 174 / Mecánica clásica avanzada En vez de trabajar con estos vectores, es cómodo quedarse con los vectores (6.30), pero cambiando la definición del producto escalar. Definiremos el producto escalar de dos vectores ~ µ y ~ν ası́: (~ µ, ~ν ) = (m̃1/2 ~µ).(m̃1/2 ~ν ) = ~µ.(m̃~ν ) = 3 X mij µi νj (6.32) i,j=1 Podemos ahora escoger las constantes arbitrarias µ11 , µ21 y µ31 de modo que los vectores ~ µα formen una trı́ada ortonormal bajo el producto escalar (6.32), es decir, normalizar los vectores a la unidad: (~µα , ~να ) = 1; α = 1, 2, 3. Este procedimiento nos conduce inmediatamente a:     1 1        1 1     0  1 ; µ1 = √ ~ ~µ2 = √    2m + M   2m   −1 1  1       −2m  µ3 = r ~   m  M   2m(1 + 2 )  M 1 1 (6.33) La definición (6.32) se hace por comodidad matemática, pero nos aleja un poco del sentido fı́sico original. La exigencia de ortonormalidad nos conduce a vectores que no tienen dimensiones de desplazamiento y a soluciones que no dependen de las condiciones iniciales: contienen información sobre la relación de amplitudes pero no de su valor absoluto. Por esto se les llama “modos normales de oscilación”. Se dice que los movimientos longitudinales de la molécula triatómica lineal son no degenerados porque las frecuencias de los tres modos normales son diferentes; en otras palabras, no hay dos modos normales diferentes con la misma frecuencia. La frecuencia w1 , que es nula, no corresponde a una oscilación. Esto es consistente con la forma del vector propio correspondiente: las tres partı́culas se desplazan la misma cantidad en todo momento, o sea que la molécula se traslada. En sentido estricto sólo µ2,3 son modos normales de oscilación, de acuerdo con lo dicho anteriormente acerca de ~ que sólo hay dos coordenadas vibracionales longitudinales. En el modo ~µ2 la partı́cula 2 se queda quieta y las partı́culas 1 y 3 oscilan en contrafase. En el modo ~µ3 las partı́culas 1 y 3 oscilan en fase, pero la partı́cula 2 se desplaza respecto a 1 − 3 una cantidad que depende de las masas y es en sentido opuesto. En el modo ~µ2 cada “resorte” actúa p independientemente sobre una masa m; por esto la frecuencia correspondiente vale k/m. Si se quiere indicar la magnitud de las oscilaciones es conveniente definir otras soluciones, llamadas “coordenadas normales”, que, veremos, representan otro conjunto de coordenadas generalizadas independientes para describir el estado del sistema y contienen información sobre las condiciones iniciales. Pequeñas oscilaciones de sistemas de varios grados de libertad / 175 Coordenadas normales para la molécula triatómica lineal. Las ecuaciones de movimiento (6.13) son tres ecuaciones diferenciales de segundo orden acopladas. La solución (6.18) fue obtenida por “tanteo”. Un método directo de solución consiste en realizar una transformación de coordenadas donde las nuevas ecuaciones de movimiento resulten desacopladas. El lagrangiano (6.9) puede escribirse en forma compacta usando la notación matricial. Si ~η es un vector columna, ~η T es un vector fila: L= 1 ˙T ˙ 1 T η η m̃~ ~ η − ~η k̃~ 2 2 (6.34) L es una forma cuadrática no diagonal en η̇i y en ηi pues la matriz k̃ es no diagonal. Esto conduce a que las ecuaciones de movimiento sean acopladas. Si se realiza una transformación lineal de coordenadas que diagonalice a L, las correspondientes ecuaciones de movimiento serán no acopladas, pues en ese caso L consta de una suma de términos que dependen de sólo una de las coordenadas. Llamemos ~θ a las nuevas coordenadas generalizadas y ÃT la matriz de la transformación: η = ÃT ~ ~ θ (6.35) donde ÃT es la matriz transpuesta de Ã. En las nuevas variables L toma la forma: L= 1 ~˙ T ˙ θ Ãm̃ÃT θ~ − 2 1 ~T θ Ãk̃ ÃT ~θ 2 (6.36) Ahora exigimos que Ã sea tal que m̃′ = Ãk̃ÃT y k̃ ′ = Ãm̃ÃT sean ambas diagona′ les, es decir, tales que m′ij = m′i δij y kij = ki′ δij para i, j = 1, 2, 3 de modo que (6.36) queda ası́: 3 1X ′ 2 (m θ̇ − kα′ θα2 ) L= 2 α=1 α α (6.37) La ecuación de movimiento (6.37), será ahora: m′α θ̇α2 − kα′ θα2 = 0 (6.38) Las soluciones para las nuevas coordenadas, en función de las constantes de integración Cα y φα , serán: s ! kα′ (6.39) t + φα kα′ θα2 = 0; α = 1, 2, 3 θα = Cα sen m′α De (6.35) y (6.39) se sigue que: s ! 3 X kα′ ηi = Aαi Cα sen t + φα ; i = 1, 2, 3 m′α α=1 (6.40) Las coordenadas θα con α = 1, 2, 3, se llaman las coordenadas normales del sistema. El problema matemático ahora consiste en hallar las nueve componentes de la 176 / Mecánica clásica avanzada matriz Ã, que se obtienen resolviendo para las Aαi las ecuaciones que resultan de las condiciones: (Ãm̃ÃT )ij = m′i δij ; (Ãk̃ ÃT )ij = ki′ δij (6.41) A partir de (6.16) y (6.17) vemos que ~ηi toma la forma: ηi = 3 X Cα µαi sen(ωα + φα ) (6.42) α=1 Las expresiones (6.40) y (6.42) coinciden si se cumple que: kα′ ; i, α = 1, 2, 3 (6.43) m′α Llegamos a la conclusión de que los vectores propios, o modos normales de oscilacion ~ µα , son las filas de la matriz Ã, o sea las columnas de la matriz ÃT que realiza la transformación de ~η a θ~ según (6.35). Como los vectores ~µα son ortogonales y ortonormales según el producto escalar (6.32): Aαi = µαi y ωα2 = (µα , µβ ) = δαβ ; α, β = 1, 2, 3 (6.44) Podemos escribir (6.44) también en la forma: ~ Tα m̃~µβ = δαβ ; µ α, β = 1, 2, 3 (6.45) Explı́citamente (6.45) es: 3 X mij µαi µβj = δαβ ; α, β = 1, 2, 3 (6.46) i,j=1 Notamos la identidad entre las filas de Ã y los vectores ~µTα , y por lo tanto podemos escribir a (6.46) como: Ãm̃ÃT = I˜ (6.47) donde I˜ es la matriz unidad 3 × 3, o sea que m′i = 1 para i = 1, 2, 3. Entonces las condiciones que nos definen las frecuencias ωα2 y la matriz Ã son de (6.41), (6.43) y (6.47): (Ãm̃ÃT )ij = δij ; (Ãk̃ ÃT )ij = ωi2 δij ; i, j = 1, 2, 3 T ωα2 (6.48) Las columnas de Ã son los vectores ~µα y las son los elementos diagonales de la matriz k̃ ′ = Ãk̃ÃT . La ecuación (6.47) es la condición de que la matriz Ã sea ortogonal, o sea que preserve el producto escalar (6.32) en una transformación de coordenadas generalizadas. Explı́citamente la matriz ÃT es:   −1/2 −1/2 M 2m 1 1+   1 + 2m M      −1/2 −1/2    1   M 2m 2m (6.49) ÃT = √   1+ 1+ 0 −  2m  2m M 2M       −1/2 −1/2   2m M −1 1+ 1+ 2m M Pequeñas oscilaciones de sistemas de varios grados de libertad / 177 y la matriz k̃ ′ es:  0     0 ′ k̃ =     0 0 0      0    k 2m  1+ m M k m 0 (6.50) No es exacto que la coordenada normal correspondiente a ω1 = 0 sea de la forma (6.39). En efecto, para esta frecuencia la ecuación de movimiento es: θ̈1 = 0 (6.51) cuya solución es: θ1 = At + B (6.52) donde A y B son constantes de integración, aunque podrı́a llegarse a (6.52) de (6.39) mediante una expansión en serie de Maclaurin alrededor de ω1 = 0. Las otras dos coordenadas normales son: θα = Cα sen(ωα t + φα ) ; α = 2, 3 (6.53) donde Cα y φα se determinan de las condiciones iniciales. Las ecuaciones (6.52) y (6.53) nos permiten expresar los desplazamientos generales de las partı́culas, usando (6.35) y (6.49):   η2 = t + φ3 )  1    rAt + B + C2 sen(ω2 t + φ2 ) + C3 sen(ω √ r 3   2m 2m M 1+ 1+ M 2m   η3 =  η1 = t + φ3 )  1   rAt + B − 2m C3 sen(ω  √ r 3   M 2m 2m M 1+ 1+ M 2m  (6.54) 1  t + φ3 )   rAt + B − C2 sen(ω2 t + φ2 ) + C3 sen(ω  √ r 3   2m 2m M 1+ 1+ M 2m Esto nos dice que el movimiento más general de las partı́culas consiste en una traslación uniforme y en una superposición de oscilaciones de frecuencias ω2 y ω3 . La oscilación de la partı́cula 2 es de frecuencia ω2 en tanto que las oscilaciones de las 178 / Mecánica clásica avanzada partı́culas 1 y 3 se caracterizan por una diferencia de fase de π en la componente de frecuencia ω2 .2 Las constantes A, B, C2 , C3 , φ2 y φ3 se pueden expresar en términos de los valores en t = 0 de η1 , η2 , η3 , η̇1 , η̇2 y η̇3 a través de las fórmulas: ˙ ~ θ = (AT )−1 ~ η ; θ~ = Ãm̃~η ; ~θ = Ãm̃~η˙ (6.55) La matriz Ãm̃ explı́citamente es:  −1/2 −1/2 M m −1/2 M M 1+ m 1+  m 1+  2m 2m 2M   1  m 0 −m Ãm̃ = √  2m    −1/2 −1/2 −1/2  2m 2m 2m m 1+ −2m 1+ m 1+ M M M ˙ En tanto que θ~ y θ~ en t = 0 son:    B A      ˙   ~  θ~ =   C2 senφ2  θ =  ω2 C2 cos φ2    C3 senφ3 ω3 C3 cos φ3                  (6.56) (6.57) Los modos normales de oscilación no son entonces más que casos particulares de la solución general (6.54) en que sólo contribuye una de las componentes normales. Ası́ por ejemplo, el “modo 1” se obtiene haciendo C1 = C3 = 0. La transformación a coordenadas normales puede interpretarse como la correspondencia con un sistema equivalente que consiste en un conjunto de osciladores armónicos lineales no acoplados. La descomposición en modos normales es muy útil en otras ramas de la fı́sica como la teorı́a de campos, la cual tendremos ocasión de estudiar con un campo mecánico unidimensional. Los modos normales para la molécula triatómica lineal en oscilaciones longitudinales los podemos representar gráficamente (véase figura 6.2). Generalización del formalismo anterior. Si se tiene un conjunto de osciladores acoplados con pequeñas oscilaciones, de l grados de libertad oscilatorios, con frecuencias no degeneradas, podemos fácilmente generalizar el anterior formalismo. No es difı́cil ver que en general la matriz m̃ es simétrica, aunque no necesariamente diagonal. k̃ también es simétrica. De esto se deducen importantes propiedades de los vectores propios y frecuencias propias. Las matrices m̃ y k̃ son de dimensión l × l y los vectores del espacio de configuración son de l componentes. La ecuación (6.19) puede escribirse en cualquiera de las formas siguientes: µα = ωα2 ~µα (m̃−1 k̃)~ ~ α ) = ωα2 (m̃1/2 ~µα ) ó (m̃1/2 k̃m̃−1/2 )(m̃1/2 µ (6.58) 2 El vector η ~ con componentes (6.54) describe el movimiento de un punto del espacio de configuración. En el plano formado por µ ~2 y ~ µ3 , la proyección del movimiento da una figura de Lissajous. O sea que la trayectoria de configuración se obtiene al desplazar dicha proyección a lo largo de ~ µ1 . Por ejemplo, si m ≪ M , la trayectoria será una hélice elı́ptica alrededor de µ1 . Pequeñas oscilaciones de sistemas de varios grados de libertad / 179 1 2 3 ω1 = 0 x Traslación: η1 = η2 = η3 ω2 = ω3 = m √m ( 1 + M ( k ns √k x Vibración simétrica: η1= –η3 , η2 = 0 2m x Vibración asimétrica: η1 = η3 , η2 = –2m/M η1 Figura 6.2 Modos normales para la molécula triatómica lineal en oscilaciones longitudinales Con la primera forma podemos definir el producto escalar en términos del “tensor métrico” de cierto espacio Riemanniano, mij : ~ ~η ) = (ζ, l X mij ζi ηj (6.59) i,j=1 La ecuación (6.58) tiene la forma de una ecuación de valores propios y vectores propios de una matriz simétrica. En efecto, m̃−1 k̃ es el producto de matrices simétricas que, según es fácil mostrar, da una matriz simétrica. Entonces se cumplen los siguientes teoremas del algebra lineal: (a) los valores propios, ωα2 , de m̃−1 k̃ son reales y (b) los vectores propios, ~ µα , correspondientes a valores propios diferentes son ortogonales y linealmente independientes. La ecuación correspondiente a la (6.16) representa la expansión de un estado arbitrario de oscilación en un conjunto completo de vectores propios de la matriz m̃−1 k̃. La prueba de la ortogonalidad de los vectores propios es simple. Escribamos las ecuaciones de valores propios para ωα2 y ωβ2 : µα = ωα2 ~ µα ; (m̃−1 k̃)~ (m̃−1 k̃)~µβ = ωβ2 ~µβ (6.60) Tomemos el producto escalar de la primera por ~µβ y de la segunda por µ ~ α: (~ µβ , m−1 k̃~ µα ) = ωα2 (~ µβ , ~µα ) (6.61) µβ , ~µα ) µβ , ~ µα ) = ωβ2 (~ (m−1 k̃~ 180 / Mecánica clásica avanzada Como m̃−1 k̃ es simétrica, los lados izquierdos en (6.61) son iguales. En efecto: l l X X µα ) = (~ µβ , m̃−1 k̃~ µβi mij krs µαs (m̃)−1 jr i,j=1 r,s=1 l X = µβr krs µαs = r,s=1 krs µβr µαs r,s=1 l l X X (m̃−1 k̃~ µβ , ~ µα ) = l X (6.62) (m̃)−1 ir krs µβs mij µαj i,j=r r,s=1 l X = krs µβs µαr = r,s=1 l X ksr µβr µαs r,s=1 Entonces se sigue que: (ωα2 − ωβ2 )(~ µβ , ~µα ) = 0 (6.63) Si ωα2 6= ωβ2 entonces ~µα y ~µβ son ortogonales. Si α = β, (~µα , ~µα ) tiene algún valor que tomamos igual a 1, entonces, (~ µα , ~ µβ ) = δα,β α , β = 1, 2, l (6.64) Ahora, si definimos con las componentes de las µα una matriz Ã de dimensión l × l: Aαi = µαi ; α, i = 1, 2, ...l (6.65) Entonces la ecuación (6.64) no es más que la condición de ortogonalidad de Ã en el espacio riemanniano de configuración: Ãm̃ÃT = I˜ (6.66) La ortogonalidad ordinaria de una matriz es ÃÃT o Ã−1 = ÃT . La ecuación de valores propios k̃~ µα = ωα2 m̃~ µα puede escribirse en términos de la matriz diagonal ω̃, con 2 elementos ωα , ωαβ = ωα2 δαβ de la siguiente forma: Ãk̃ = ω̃Ãm̃ (6.67) Si multiplicamos por ÃT y usamos la ortogonalidad de Ã, (6.67) toma la forma: Ãk̃ ÃT = ω̃ (6.68) vemos que la matriz Ã realiza sobre k̃ una transformación que la diagonaliza, siendo las frecuencias propias los elementos diagonales. Las expresiones (6.66) y (6.68) nos dicen que Ã diagonaliza simultáneamente a m̃ y a k̃. m̃ es el tensor métrico en el espacio de configuración. Podemos entonces interpretar a Ã como la matriz de una transformación lineal en el espacio de configuración que nos hace pasar de unos ejes oblicuos, ηi , (con m̃ Pequeñas oscilaciones de sistemas de varios grados de libertad / 181 no diagonal; el producto escalar, en particular el lagrangiano, contiene productos cruza˜ dos de las componentes de los vectores) a unos ejes cartesianos ortogonales, θα (m̃ = I, de ahı́ que el lagrangiano en coordenadas normales tenga términos independientes entre sı́). Estos nuevos ejes son los ejes principales de k̃ porque mediante Ã, k̃ se transforma en ω̃ que es diagonal. Las coordenadas normales son un sistema de “ejes principales” en el espacio de configuración donde m̃ y k̃ son ambas diagonales.3 Esto tiene como consecuencia que las ecuaciones de movimiento de las coordenadas normales sean desacopladas: θ̈α +ωα2 θα = 0; α = 1, 2, ...l. 6.2. Modos normales de oscilación. Caso degenerado Las oscilaciones transversales de la molécula del tipo “CO2 ” no se pueden considerar con un modelo de “resortes”, pues con tal modelo estas oscilaciones son intrı́nsecamente no lineales. La demostración de esto se propone como ejercicio. Como el potencial tiene un mı́nimo en la posición de equilibrio aun para desplazamientos transversales, es válida una aproximación por un potencial parabólico, aunque la constante k no será la misma que en las oscilaciones longitudinales. Otro aspecto de las oscilaciones transversales es la degeneración de los modos normales que a continuación analizamos cualitativamente. Para especificar completamente la molécula, constituida a partir de tres partı́culas puntuales, se requieren nueve coordenadas. Hay un grado de libertad correspondiente a traslaciones a lo largo de la molécula (el modo ~µ1 analizado anteriormente) y dos grados de libertad traslacionales en direcciones perpendiculares al eje de la molécula. Además, para una posición dada del centro de masa, hay dos rotaciones alrededor de él, pues no tiene sentido una rotación alrededor del eje de la molécula. En total, pues, hay tres grados de libertad traslacionales y dos rotacionales, quedando cuatro grados de libertad vibracionales (dos longitudinales y dos transversales). La simetrı́a de rotación alrededor de la molécula implica que la constante k es la misma para cualquier desplazamiento transversal y como hay dos modos de oscilación transversales, éstos tendrán la misma frecuencia, es decir, la frecuencia de las oscilaciones transversales es degenerada. Los dos modos los podemos llamar modo “z” y modo “y”, como se representan en la figura 6.3. y y x z Modo y x z Modo z Figura 6.3 Modos de oscilación transversales. 3 En efecto, las filas de Ã determinan los vectores unitarios de los “ejes principales”, o sea los ~ µα . 182 / Mecánica clásica avanzada Un movimiento transversal arbitrario será una combinación de los modos “y” y “z”. Si las dos oscilaciones están en fase, el movimiento será lineal; si no, el movimiento será elı́ptico. Si la diferencia de fase es de 900 las partı́culas se moverán en trayectorias circulares, como se ve en la figura 6.4. Al aplicar el formalismo general al problema completo de la molécula del tipo “CO2 ”, se encuentra una ecuación secular de grado nueve en ω 2 pero a priori esperamos que los cinco grados de libertad no vibracionales den lugar a modos normales con frecuencia ω 2 = 0, que los dos grados de libertad oscilatorios longitudinales tengan dos frecuencias diferentes, y que los dos grados de libertad oscilatorios transversales den lugar a modos normales con frecuencia doble. Es decir, el problema completo tedrá una frecuencia quı́ntuple nula, dos frecuencias simples y una frecuencia doble; en total cuatro raı́ces diferentes. y En fase: oscilaciones lineales y En desfase: rotaciones x z x z Figura 6.4 Modos normales de oscilación: dos frecuencias simples y una frecuancia doble. La molécula triatómica lineal. Oscilaciones longitudinales y transversales. Consideraremos sólo el problema de hallar los modos normales de oscilación, ya que los modos traslacionales y rotacionales permiten un tratamiento trivial. Las coordenadas vibracionales se llaman coordenadas internas. Si imponemos la condición de que el centro de masa esté fijo y no haya rotaciones netas de la molécula, quedarán solamente las coordenadas internas. El cálculo lo realizaremos en tres dimensiones. ~ri es el vector de posición de la partı́cula i = 1, 2, 3 y ~ri0 el de la posición de equilibrio. La separación de la posición de equilibrio es para la partı́cula i es: d~i = ~ri − ~ri0 ; i = 1, 2, 3 (6.69) ~ 0 = m~r10 + M~r20 + m~r30 ~ = m~r1 + M~r2 + m~r3 = R R 2m + M 2m + M (6.70) d~i y ~ri son vectores ordinarios tridimensionales; no son vectores del espacio de configu~ y la consideraremos fija, es decir: ración. La coordenada del centro de masa es R Se sigue entonces que las componentes de los d~i no son independientes sino que están sometidos a las condiciones: md~1 + M d~2 + md~3 = 0 (6.71) La condición sobre la no rotación de la molécula alrededor del centro de masa es que el momento angular total sea cero: ~ = m~r1 × ~r˙ 1 + M~r2 × ~r˙ 2 + m~r3 × ~r˙ 3 L ˙ ˙ ˙ = m(~r10 + d~1 ) × d~1 + M (~r20 + d~2 ) × d~2 + m(~r30 + d~3 ) × d~3 = 0 (6.72) Pequeñas oscilaciones de sistemas de varios grados de libertad / 183 Las coordenadas de la posición de equilibrio son, tomando el origen de coordenadas en la posición de la partı́cula 2: ~r10 = −bî; ~r20 = 0; ~r30 = bî. Por lo tanto la ecuación (6.72) es: ~ = mbî × (d~˙ 3 − d~˙ 1 ) + m(d~1 × d~˙ 1 + d~3 × d~˙ 3 ) + M d~2 × d~˙ 2 = 0 L (6.73) para pequeñas oscilaciones se cumple que di ≪ b, lo cual nos permite escribir en vez de (6.73): ˙ ˙ î × (d~3 − d~1 ) = 0 (6.74) o más explı́citamente: d˙3y = d˙1y ; d˙3z = d˙1z (6.75) Integrando (6.75) obtenemos: d3y = d1y + Constante; d3z = d1z + Constante; las constantes deben anularse porque estas ecuaciones se deben cumplir aun en la posición de equilibrio: d3y = d1y ; d3z = d1z (6.76) La condición (6.71) vale también para las velocidades, de donde: m m ˙ ˙ ˙ d~2 = − (d~1 + d~3 ) ; d~2 = − (d~1 + d~3 ) M M (6.77) En conclusión, existen las siguientes cinco relaciones entre los nueve desplazamientos, lo cual nos deja con 9 − 5 = 4 grados de libertad internos: d1y = d3y ; d2y = − 2m d1y ; M d2x = − m (d1x + d3x ) M d1z = d3z d2z = − 2m d1z M (6.78) Existen además cinco relaciones similares a (6.78) para las velocidades de los desplazamientos. Tomaremos como coordenadas generalizadas independientes vibracionales a d1x , d3x , d1y , d1z , y las llamaremos η1 , η2 , η3 y η4 : η1 = d1x , η2 = d3x , η3 = d1y , η4 = d1z (6.79) Los otros cinco desplazamientos pueden expresarse en términos de los desplazamientos internos por medio de las relaciones (6.78). El espacio de configuración del sistema completo es 9-dimensional. El subespacio correspondiente a las oscilaciones puras es 4-dimensional. El vector del espacio de configuración que describe los movimientos de la molécula en que el centro de masa permanece fijo y no hay rotación de la misma es ~η . También: η~T = (η1 , η2 , η3 , η4 ) (6.80) 184 / Mecánica clásica avanzada Ahora debemos expresar el lagrangiano en función de ~η y ~η˙ . La energı́a cinética es: 2 1 1 ˙2 ˙2 ˙ ~ ~ T = m d1 + d3 + M d~2 2 2 (6.81) m2 2 1 ˙2 ˙ ~˙ ˙2 ˙ 2 2 2 ~ ~ ~ ˙ ˙ d1 + d3 + 2d1 · d3 m d1x + d3x + 2ḋ1y + 2d1z + = 2 2M Si usamos (6.78) y (6.79) para expresar todos los d~i en función de los η̇ν , ν = 1, 2, 3, 4 obtenemos para T (~η˙ ): m2 1 2m m 2 T = m 1+ η̇1 + η̇22 + m 1 + η̇32 + η̇42 + η̇1 η̇2 (6.82) 2 M M M puede escribirse ası́ con notación matricial: 1 ˙T ˙ η m̃~ ~ η 2 o usando la notación de producto escalar: T = 1 ˙ ˙ (~ η , ~η ) 2 donde m̃ es la matriz simétrica no diagonal siguiente:  m m2 m 1 + 0 0  M M    m m2  0 0 m 1+   M M  m̃ =   2m  0 0 2m 1 + 0  M     2m 0 0 0 2m 1 + M (6.83) (6.84) T =                  (6.85) En el cálculo de la energı́a potencial vamos a considerar un modelo más realista. Llamaremos k la constante de fuerza para los desplazamientos longitudinales relativos a la partı́cula 2; k ′ la constante de fuerza para los desplazamientos longitudinales de la partı́cula 1 relativos a la partı́cula 3, y a K a la constante de fuerza para los desplazamientos transversales. La constante K no se puede expresar en función de k y k ′ mediante un modelo de resortes. La energı́a potencial de interacción entre las partı́culas para pequeñas oscilaciones es: 1 1 V = k (d1x − d2x )2 + (d3x − d2x )2 + k ′ (d1x − d3x )2 2 2 1 + K (d1y − d2y )2 + (d3y − d2y )2 2 +(d1z − d2z )2 + (d3z − d2z )2 (6.86) Pequeñas oscilaciones de sistemas de varios grados de libertad / 185 Si usamos a (6.78) y (6.79) para expresar todos los d~i en función de los ην , ν = 1, 2, 3, 4 obtenemos para V (~ η ): 1 2m2 2m ′ V = k 1+ + k (η12 + η22 ) + 2 M2 M i 1h m m 4k 1+ − 2k ′ η1 η2 2 M M " 2 # 2m 1 (η32 + η42 ) + 2K 1 + 2 M + (6.87) En notación matricial V puede escribirse ası́: V = 1 T η k̃~η ~ 2 (6.88) o usando la notación de producto escalar: V = 1 (~ η , m̃−1 k̃~η ) 2 donde k̃ es la siguiente matriz simétrica no diagonal 4 × 4:  2m 2m2 m m ′ 2k (1+ )−k ′ 0 0  k(1+ M + M 2 )+k M M    m 2m 2m2 m   2k (1+ )−k ′ k(1+ 0 0 + 2 )+k ′  M M M M  k̃ =   2m 2  0 0 2K(1+ ) 0  M    2m 2 0 0 0 2K(1+ ) M El lagrangiano será: L= 1 1 ˙ ˙ η) (~ η , ~η ) − (~ η , m̃−1 k̃~ 2 2 (6.89)          (6.90)        (6.91) La ecuación de movimiento para ~η es: m̃~ η¨ + k̃~η¨ = 0 (6.92) Buscamos soluciones propias de la forma: ηα = ~ ~ µα sen(ωα t + φα ); α = 1, 2, 3, 4 (6.93) Al reemplazar (6.93) en (6.92) obtenemos: (m̃ωα2 − k̃)~ µα = ~0 (6.94) 186 / Mecánica clásica avanzada La ecuación (6.94) admite soluciones no triviales para los ~µα sólo si las ωα son tales que satisfacen la ecuación secular: det(m̃ωα2 − k̃) = 0 ; α = 1, 2, 3, 4 (6.95) Si usamos la siguiente notación (Classical mechanics, Corben-Stehle, capı́tulo 8): 2 2m m α = 2K 1 + ; α′ = 2m 1 + M M (6.96) m m2 2m β′ = + 2 2; β= M M M Podemos escribir: m̃ω 2 − k̃ =           m(1+β ′ )ω 2 −k(1+β)−k ′ ′ 2 mβ ω −kβ +k ′ mβ ′ ω 2 −kβ +k ′ ′ 2 m(1 +β )ω −k(1+β)−k ′ 0 0 0 0 0 0 α′ ω 2 − α 0 0 0 0 α′ ω 2 −α Usando la regla para el cálculo del determinante de una matriz M̃ : detM̃ = n X           Mij Cij (6.97) (6.98) i=1 donde Cij es el determinante de la matriz de los cofactores del elemento Mij : Cij = (−1)i+j Dij (6.99) donde Dij es el determinante menor complementario del elemento, entonces la ecuación secular es: n 2 o 2 m(1 + β ′ )ω 2 − k(1 + β) − k ′ − mβ ′ ω 2 − kβ + k ′ (α′ ω 2 − α)2 = 0 (6.100) Entonces el determinante consta de tres factores, dos de ellos lineales en ω 2 y uno cuadrático en ω 2 . Hay dos raı́ces dobles que son: α 2m K ω32 = ω42 = ′ = 1+ (6.101) α m M Las otras dos raı́ces son: ω12 = k + 2k ′ k ; ω22 = m m 2m 1+ M (6.102) Pequeñas oscilaciones de sistemas de varios grados de libertad / 187 ω1 y ω2 coinciden con las halladas cuando consideramos las oscilaciones longitudinales por separado, cuando k ′ = 0. La ecuación de valores propios (6.94) es de la forma:      0 Aα Bα 0 0 µα1               Bα Aα 0  0     µα2   0  =    (6.103)       0   µα3   0  0 C 0 α           0 µα4 0 0 0 Cα Los valores de las Aα , Bα y Cα son: 2m ′ m m A1 = 1+ k −k ; A2 = − k ′ − k M M M A3 = m 2m 2m 2m2 K 1+ 1+ −k 1+ − k′ + M M M M2 C1 = 2m 2m ′ k + 2k − K 1 + 2 1+ M M C2 = 2 2m 2 1+ (k − K) ; C3 = 0 M B1 = m m 2m ′ k −k ; B2 = −k ′ − k 1+ M M M B3 = K m M (6.104) 2m m m 1+ − 2k 1+ + k′ M M M La ecuación (6.103) da lugar a los cuatro siguientes sistemas de ecuaciones algebraicas: Aα µα1 + Bα µα2 = 0 ; Bα µα1 + Aα µα2 = 0 (6.105) Cα µα3 = 0 ; Cα µα4 = 0 ; α = 1, 2, 3, 4 Las primeras ecuaciones (6.105), dado que Aα y Bα no son cero, son: Aα µα2 µα1 =− =− ⇒ µα1 = ±µα2 Bα µα1 µα2 (6.106) Como se cumple que: A1 = B1 ; A2 = −B2 y A3 6= ±B3 (6.107) Entonces µα2 y µα1 deben necesariamente tener las relaciones: µ11 = −µ12 ; µ21 = µ22 ; µ31 = µ41 = µ32 = µ42 = 0 (6.108) 188 / Mecánica clásica avanzada Como C1 y C2 no son cero, en tanto que C3 es cero, se cumple: µ13 = µ23 = µ14 = µ24 = 0 (6.109) µ33 , µ43 , µ34 , µ44 : Arbitrarias Tenemos en este problema seis cantidades indeterminadas. O sea que aquı́ no hay simplemente una indeterminación por un factor arbitrario en los vectores ~µ3 y ~µ4 . Los vectores propios para este problema son de la forma siguiente:     1 1  1   −1     µ1 = µ11  ~  0  ; ~µ2 = µ21  0  0 0    µ3 = µ33  ~    0 0 1 µ34 µ33     ~ 4 = µ43  ; µ   0 0 1 µ44 µ43  (6.110)     Como en las ecuaciones (6.30), µ11 , µ21 , µ33 y µ43 pueden definirse por la condición de normalización, sin embargo µ43 y µ44 quedan aún indeterminadas. Hay un número infinito de vectores propios normalizados correspondientes a la frecuencia propia degenerada ω3 = ω4 . La condición de normalización es: ~ Tα m̃~µα = 1 ; α = 1, 2, 3, 4 µ (6.111) donde m̃ es la matriz (6.85). Esto nos conduce a los siguientes valores para µ11 , µ21 , µ33 y µ43 : 1 ; µ11 = √ 2m µα3 v u =u u t 1 2m 2m 1 + M µ21 = s 1 − µ2α4 ; 2m 2m 1 + M (6.112) α = 3, 4 Debido a que µ34 y µ44 son arbitrarios, µ ~ 3 y ~µ4 son linealmente independientes. ~3 y µ µ ~ 4 generan entonces un espacio de dimensión dos, siendo cualquier vector de este espacio un vector propio correspondiente al valor propio ω3 = ω4 . Podemos decir que a la frecuencia propia doblemente degenerada, ω3 = ω4 , le corresponde un conjunto infinito de vectores propios normalizados en un espacio bidimensional. Cualquier par de vectores linealmente independientes genera el espacio; por esto podemos sin perder generalidad escoger los vectores ~ µ3 y ~µ4 de modo que sean ortogonales entre sı́, bajo el producto escalar (6.59): µ33 µ43 + µ34 µ44 = 0 (6.113) Pequeñas oscilaciones de sistemas de varios grados de libertad / 189 Como definimos a µ33 y µ43 positivos en (6.113), entonces µ34 y µ44 deben tener signos opuestos; (6.112) y (6.113) conducen a: µ234 + µ244 = 1 2m 2m 1 + M (6.114) Todavı́a los vectores no están bien definidos pues aún hay infinitos pares de vectores ortonormales en el mencionado espacio bidimensional. ~µT3 y ~µT4 pueden escribirse en la forma: µ ~ T3 = µ ~ T4 = r 1 (0, 0, cos δ, senδ) 2m 2m(1 + ) M 1 r (0, 0, senδ, − cos δ) 2m 2m(1 + ) M (6.115) donde δ está comprendido entre 0 y π/2 de acuerdo con la elección del signo de µ33 y µ43 . Los vectores ~ µ3 y µ ~ 4 generan todas las posibles oscilaciones transversales con la frecuencia degenerada ω3 = ω4 . Los modos normales de oscilación transversales son: η~3T = µ ~ T3 sen(ω3 t + φ3 ) → (0, 0, d1y , d1z ) (6.116) η~4T = η~4T sen(ω3 t + φ4 ) Vemos que δ es esencialmente el ángulo de los vectores de desplazamientos en el plano y − z donde las oscilaciones normales tienen diferencia de fase arbitraria. z d1 (Modo µ3) δ y δ d1 (Modo µ4) Figura 6.5 Modos de oscilación transversales en el espacio de configuración 190 / Mecánica clásica avanzada Podemos tomar δ = 0, con lo cual ~µ3 corresponde a las oscilaciones en “y” y ~µ4 a las oscilaciones en “z”. Una oscilación transversal general será de la forma: ~η = C3 ~ η3 + C4 ~η4 (6.117) Sin perder generalidad η~T puede escribirse en la forma: ~η T = C [0, 0, senγ sen(ω3 t + φ3 ), cos γ sen(ω3 t + φ4 )] (6.118) φ3 y φ4 son arbitrarias. Si tomamos φ3 = φ4 obtenemos oscilaciones longitudinales en una dirección que hace un ángulo γ con el eje z. Si tomamos φ3 = 0 y φ4 = π/2, el movimiento será una circunferencia y en general será una elipse, donde γ será la dirección del eje mayor de la elipse. Recordando las fórmulas (6.78), d2y = − 2m 2m d1y ; d2z = − d1z M M (6.119) d3y = d1y ; d3z = d1z Vemos que el desplazamiento del átomo central es siempre contrario al de los laterales. En general, el átomo central gira en sentido contrario a los laterales, en una trayectoria elı́ptica, con una amplitud tal que el momento angular es cero. El movimiento transversal general es pues una rotación de cada átomo. Véase figuras 6.3 y 6.4. Si quisiéramos describir las nueve coordenadas del sistema, deberı́amos usar vectores 9dimensionales y matrices 9 × 9. Ası́ por ejemplo, en vez de ~µ3 y µ ~ 4 tendrı́amos, usando las fórmulas (6.78): ~eT3 = ~eT4 = 2m 1 (0, 1, 0; 0, − M , 0; 0, 1, 0) 2m 2m 1 + M s 1 2m s (0, 0, 1; 0, 0, − M ; 0, 0, 1) 2m 2m 1 + M (6.120) En el tratamiento completo aparecerán además los cinco vectores propios de frecuencia cero correspondientes a las tres traslaciones y las dos rotaciones. La degeneración puede ser removida por ejemplo introduciendo algún efecto que rompe la simetrı́a de rotación de la interacción alrededor del eje de la molécula (de la cual se derivó que K no depende de la dirección del desplazamiento). Si existiera algún efecto direccional (como una interacción entre espines), ya no habrı́a la simetrı́a rotacional en la interacción y desaparecerı́a la degeneración. Este tema es susceptible de un estudio más completo usando la teorı́a de grupos de simetrı́as. Los vectores propios constituyen representaciones del grupo de simetrı́as. El subespacio generado por ~µ3 y µ ~ 4 es una representación irreductible bidimensional del grupo de simetrı́as (rotaciones alrededor del eje de la molécula). En otros sistemas de osciladores acoplados las ligaduras pueden dar lugar a cambio de frecuencia y a supresión Pequeñas oscilaciones de sistemas de varios grados de libertad / 191 de la degeneración. Tratamiento usando el método de diagonalización. Buscaremos una matriz que diagonalice simultáneamente a m̃ y a k̃, de acuerdo con las fórmulas (6.66) y (6.68). Tanto m̃ como k̃ son diagonales en bloques de matrices 2 × 2; es razonable suponer que Ã sea de la misma forma:   D E 0 0      F G 0 0     Ã =  (6.121)    0 0 H K      0 0 L J Llamaremos A, B y C a los elementos de la matriz m̃ o de la matriz k̃. Se requiere entonces que mediante el siguiente producto se obtenga una matriz diagonal, con unos en la diagonal si A, B y C son los elementos de m̃, y con las ω 2 si son los elementos de k̃:     D F 0 0 A B 0 0 D E 0 0          F G 0 0  B A 0 0  E G 0 0               0 0 H K  0 0 C 0  0 0 H L          0 0 K J 0 0 0 C 0 0 L J (6.122)   d e 0 0      f g 0 0     =    0 0 h l      0 0 k j donde hemos llamado las variables d = A(E 2 +D2 )+2BDE, e = A(AD+EG)+B(DG+ EF ), f = A(F D + EG) + B(EF + GD), g = A(F 2 + G2 ) + 2BF G, h = C(H 2 + K 2 ), l = C(HL + JK), k = C(HL + JK) y j = C(J 2 + L2 ). Asumimos que los elementos de Ã no dependen de las constantes k, k ′ y K entonces, como los elementos de la matriz k̃ son combinaciones de las constantes, Ãk̃ÃT será diagonal sólo si: DF + EG = 0 ; DG + EF = 0 ; HL + JK = 0 (6.123) Esto implica las relaciones siguientes entre los elementos de A: G = F , D = −E o G = −F , D = E (6.124) 192 / Mecánica clásica avanzada ˜ Por Cuando A, B y C son los elementos de m̃, entonces (6.122) debe ser igual a I. tanto se cumple, usando las relaciones de la izquierda en (6.124), que: 2D2 A − 2BD2 = 1 ; 2F 2 A + 2F 2 B = 1 (6.125) C(H 2 + K 2 ) = C(J 2 + L2 ) = 1 Recordando la expresión para A y B en m̃, ecuación (6.85), obtenemos para D y F: D=√ 1 1 = −E ; F = s =G 2m 2m 2m 1 + M (6.126) En (6.126) por convención tomamos las raı́ces cuadradas positivas. Por otra parte, para H, K, L, J, obtenemos las relaciones: K = L , H = −J o K = −L , H = J (6.127) Como hay sólo tres ecuaciones para determinar las cuatro incógnitas H, K, J, L, podemos asignar el valor a una de ellas arbitrariamente. Sea que: cos δ π ; ≤δ≤ 2 2m 2m 1 + M H=s (6.128) Con ello obtenemos las siguientes expresiones para J, K, L: sen δ =L 2m 2m 1 + M J = −H ; K = s Entonces la matriz Ã tiene la siguente expresión explı́cita:  r r 2m 2m 1+ 0 0  1+ M M     1 1 1 0 0  Ã = r 2m   ) 2m(1 + 0 0 cos δ senδ M   0 0 senδ cosδ (6.129)             (6.130) Vemos que las filas de Ã coinciden con los vectores propios ~µα hallados anteriormente. Cuando tomamos como A, B y C los elementos de k̃ de la ecuación (6.96), encontramos: A(E 2 + D) + 2BDE = ω12 ; A(F 2 + G2 ) + 2BF G = ω22 (6.131) C(H 2 + K 2 ) = C(J 2 + L2 ) = ω32 Pequeñas oscilaciones de sistemas de varios grados de libertad / 193 donde ω12 , ω22 y ω32 están dados en las ecuaciones (6.101) y (6.102). En este problema el procedimiento de diagonalización se simplificó debido a la forma de m̃ y k̃ que nos permitió partir de la forma (6.121) para la matriz Ã. Para sistemas más complicados no es tan simple la elección de la forma de Ã. A pesar de esto, muchas veces la ecuación secular resulta mucho más complicada, por requerir primero la evaluación de un determinante y luego el cálculo de las raı́ces de una ecuación algebraica de grado l. En estos casos, donde l es grande y m̃ y k̃ complicadas, es más conveniente el método de la diagonalización, que se realiza usualmente en forma numérica, por ejemplo mediante el método numérico de diagonalización de Jacobi. Ejemplo 6.2.1 Una partı́cula se mueve en presencia de un potencial central de la forma: V (r) = − A (6.132) rn−1 suponiendo que la órbita es circular, hallar los valores de n para los cuales hay pequeñas oscilaciones estables. Este es un ejemplo de pequeñas oscilaciones alrededor de un movimiento estable. Se entiende por estabilidad el hecho de tender al estado de equilibrio al ser sometido el sistema a una distorsión. En fuerzas centrales la órbita es plana, con lo cual podemos describir la partı́cula con las coordenadas polares r, θ. El lagrangiano es: L= 1 A m(ṙ2 + r2 θ̇) + n−1 2 r (6.133) Las ecuaciones de movimiento de Lagrange son: mr̈ − mrθ̇2 + (n − 1)Ar−n = 0 mr2 θ̈ + 2mrṙ θ̇ = 0 (6.134) El movimiento de “equilibrio” es circular uniforme, o sea que son constantes: r = r0 y θ̇ = ω0 (6.135) Si se hacen pequeñas alteraciones a este movimiento estable, ρ al radio y φ̇ a la velocidad angular, habrá oscilaciones si el movimiento es estable, r = r0 + ρ y θ̇ = ω0 + φ̇ (6.136) En el movimiento de equilibrio se cumple que: mr0 ω02 = (n − 1)Ar0−n (6.137) Entonces las ecuaciones de movimiento para los pequeños desplazamientos ρ y φ̇, al primer orden en los mismos, son: mρ̈ − mω02 ρ − 2mr0 ω0 φ̇ − n(n − 1)Ar0−n−1 ρ = 0 mr02 φ̈ + 2mr0 ω0 ρ̇ = 0 (6.138) 194 / Mecánica clásica avanzada estas son ecuaciones lineales acopladas para ρ y φ̇. Buscamos ahora los “modos normales de oscilación” de ρ y φ̇: ρ = ρ0 sen(ωt + α) ; φ̇ = φ̇0 sen(ωt + α) (6.139) donde ω es la frecuencia propia del modo normal (esperamos que haya dos frecuencias), y α la fase, como en la ecuación (6.93). ρ0 y φ̇0 son las componentes de los vectores propios ~ µ, que satisfacen las ecuaciones algebraicas:   −m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 −2mω0 ωr0   2mω0 ωr0 mr02 ω     ρ0 0 =  × (6.140) 0 φ̇0 El sistema (6.140) tiene soluciones no triviales sólo si: mωr02 [−m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 + 4mω02 ω] = 0 (6.141) Las raı́ces de (6.141) son: ω2 = 0 y ω 2 = (3 − n)ω02 (6.142) La segunda raı́z si n < 3 conduce a una ω real, y si n > 3 es imaginaria. Si n=3 el movimiento es degenerado con dos raı́ces ω = 0. El movimiento será, pues, estable solamente si n < 3. Para una órbita de Kepler, por ejemplo n = 2. Entonces: ω02 = ω 2 (6.143) ω0 es la frecuencia de rotación de la partı́cula. ω es la frecuencia de las oscilaciones en el radio de la órbita y en la velocidad angular que coinciden con ω0 . Para un potencial central armónico, V = Ar2 , n = −1, entonces: ω = 2ω0 (6.144) La frecuencia ω 2 = 0 corresponde a un desplazamiento de una órbita circular a otra, o sea, a otro movimiento estable; no hay oscilaciones sino simplemente un cambio constante en el radio de la órbita y en la velocidad angular. Hay una forma simple de calcular directamente la frecuencia de las pequeñas oscilaciones. La partı́cula se mueve radialmente dentro un “pozo” que consta del potencial centrı́fugo y el potencial externo: Vef (r) = − A rn−1 1 A l2 + mr2 θ̇2 = − n−1 + 2 r 2mr2 (6.145) En el movimiento estable el potencial tiene un mı́nimo. Para pequeños desplazamientos del movimiento estable, el “pozo” de potencial puede aproximarse a un pozo Pequeñas oscilaciones de sistemas de varios grados de libertad / 195 parábolico. El problema consiste en determinar para qué valores de n es posible la formación del potencial parábolico. Vef (r) puede expandirse alrededor de r0 para pequeños desplazamientos: Vef (r) ≈ Vef (r0 ) + dVef (r) dr ρ+ r=r0 1 d2 Vef (r) 2 dr2 ρ2 = r=r0 (6.146) 1 Vef (r0 ) + kρ2 2 donde el término lineal en ρ se anula en el equilibrio y k es la “constante de resorte”: k= d2 Vef (r) dr2 (6.147) r=r0 La frecuencia de las pequeñas oscilaciones en r será: ω2 = 1 d2 Vef (r) m dr2 (6.148) r=r0 Efectuando las operaciones indicadas en (6.148), usando la relación (6.137) que se cumple en la posición de equilibrio, y notando que la magnitud del momento angular es l = mω0 r02 , llegamos finalmente al resultado ω 2 = (3 − n)ω02 , que nos da directamente la frecuencia de las pequeñas oscilaciones alrededor de la órbita circular estable. 6.3. Un campo mecánico unidimensional: la cuerda uniforme Primero estudiaremos el sistema de n partı́culas de masa m unidas entre sı́ por cuerdas elásticas sin masa. La cuerda uniforme se obtendrá del problema anterior como un caso lı́mite en que las masas se distribuyen uniformemente formando un continuo. La cuerda estirada sin masa con un conjunto discreto de masas. Sea una cuerda de longitud L a la cual se adhieren n masas iguales equidistantemente. La cuerda está estirada y fija en sus extremos. Estudiaremos las oscilaciones transversales. La longitud de cada segmento de cuerda en la posición de equilibrio es d = xi − xi−1 ; i = 1, 2, ...n + 1. Entonces L = (n + 1)d. Para los desplazamientos longitudinales, la energı́a potencial resulta de la elasticidad de la cuerda k. Para los desplazamientos transversales, la contribución de la elasticidad de la cuerda es de cuarto orden en la elongación, la demostración se propone como un ejercicio; ası́ que la contribución cuadrática viene directamente de la tensión de la cuerda τ . La tensión es independiente de los desplazamientos transversales si estos son infinitesimales. El trabajo realizado para estirar un segmento es igual a la tensión (constante) por la elongación. De modo que la energı́a potencial del segmento i cuando la partı́cula i − 1 se desplaza transversalmente ηi−1 , y la partı́cula i en ηi , es: i hp d2 + (ηi − ηi−1 )2 − d (6.149) Vi = τ 196 / Mecánica clásica avanzada η1 η2 x1 x0 = 0 ηi – 1 x2 ηi xi – 1 ηi + 1 ηi + 1 xi + 1 xi xi + 2 d ηn – 1 xn – 1 ηn xn x xn – 1 = L Figura 6.6 Cuerda estirada sin masa con un conjunto discreto de masas de modo que para pequeños desplazamientos la energı́a potencial total es: V = n+1 1τ X (ηi − ηi−1 )2 2d (6.150) i=1 El espacio de configuración es n-dimensional y las matrices m̃ y k̃ son de dimensión n × n. En notación matricial: 1 V = ~η T k~η (6.151) 2 donde η~T = (η1 , η2 , ...ηn ) y  2 −1    −1 2     0 −1   τ   0 k̃ =  0 d   .. ..  . .     0 0   0 0 la matriz k̃ es: 0 0 ··· 0 0 −1 0 ··· 0 0 −1 · · · 0 0 2 −1 2 ··· 0 0 .. . .. . .. . .. . .. . 0 0 ··· 2 −1 0 0 · · · −1 La energı́a potencial es: 2                        T T = ~η˙ m̃~η˙ (6.152) (6.153) donde la matriz m̃ es un múltiplo de la matriz unidad: m̃ = mI˜ (6.154) La ecuación de valores propios es: (−ωα2 m̃ + k̃)~ µα = ~0; α = 1, 2, ...n (6.155) Pequeñas oscilaciones de sistemas de varios grados de libertad / 197 Explı́citamente las ecuaciones de valores propios son: τ τ τ − µαi−1 + 2 − mωα2 µαi − µαi+1 = 0; i = 1, 2, ...n d d d (6.156) En (6.156) se debe cumplir µα0 = µα n+1 = 0. La matriz n × n en (6.155) es:           τ  2 −m̃ωα + k̃ =  d          λ −1 0 0 ··· −1 λ −1 0 ··· 0 −1 λ 0 0 −1 λ ··· .. . .. . .. . .. . .. . 0 0 0 0 ··· 0 0 0 0 ··· −1 · · · donde λ depende de ωα : λ = 2 − mωα2 0 0    0     0 0     τ 0 0   = D̃  d  .. ..  . .     λ −1    −1 λ 0 d τ (6.157) (6.158) Llamemos Dn al determinante de la matriz D̃, que es un polinomio de grado n en λ. Haciendo tomar a n los valores 1, 2, 3, ..., obtenemos la siguiente secuencia de polinomios: D1 = λ D2 = λ2 − 1 D3 = λ3 − 2λ = λD2 − D1 D4 = λ4 − 3λ2 + 1 = λD3 − D2 D5 = λ5 − 4λ3 + 3λ = λD4 − D3 D6 = .. . λ6 − 5λ4 + 6λ2 − 1 = λD5 − D4 .. . (6.159) Notamos la siguiente relación de recurrencia entre los polinomios: Dk = λDk−1 − Dk−2 ; k = 1, 2, ...n (6.160) 198 / Mecánica clásica avanzada Los coeficientes de las potencias de λ pueden escribirse en términos de los números combinatorios. Ası́ por ejemplo: 9 8 7 D9 = λ9 − λ7 + λ5 9 7 5 − D10 = − 6 3 10 10 7 4 λ3 + 10 λ 4 − λ + 5 1 9 8 6 2 λ 8 λ + 2 λ − 8 6 5 0 (6.161) 6 λ De (6.161) se puede obtener fácilmente una generalización. Las fórmulas resultantes se demuestran fácilmente por el método matemático de inducción,   n n/2 +k X   2 k+1 2k Dn =  (−1) λ si n es par  k=0 2k (6.162)   n + 1 (n−1)/2 +k X   2 k 2k+1 Dn = si n es impar   (−1) λ k=0 2k + 1 Es conveniente el siguiente cambio de variable: λ = 2 cos β (6.163) En términos de β obtenemos la secuencia siguiente de los Dk : D1 = 2 cos β D2 = 2 cos 2β + 1 D3 = 2(cos 3β + cos β) D4 = 2(cos 4β + cos 2β) + 1 D5 = 2(cos β + cos 3β + cos 5β) D6 = 2(cos 6β + cos 4β + cos 2β) + 1 (6.164) Se pasa de (6.159) a (6.164) usando identidades trigonométricas (fórmulas 5.53 a 5.67 del manual de fórmulas matemáticas de Spiegel). La generalización de (6.164) es Pequeñas oscilaciones de sistemas de varios grados de libertad / 199 simple; el resultado es: Dn = 2 n/2 X cos 2kβ + 1 ; si n es par k=1 (6.165) (n−1)/2 Dn = 2 X cos(2k + 1)β ; si n es impar k=0 Las fórmulas (6.165) se pueden simplificar usando cos 2kβ = (ei2β )k + (e−i2β )k 2 (6.166) y similarmente para (2n + 1)β. Notamos luego que se obtienen series geométricas de potencias. La expresión para la suma cerrada de una serie geométrica es conocida. En este caso la razón de la serie es e±2β : 1 + ei2β + (ei2β )2 + ...(ei2β )r = 1 − (ei2β )r+1 1 − ei2β (6.167) que vale si ei2β 6= 1. Ası́, si n es par: Dn = 2Re 1 − (ei2β )(n/2+1) −1 1 − ei2β (6.168) El resto es un cálculo trigonométrico. Para n impar el procedimiento es similar. El resultado final es que, para todo n: Dn = sen(n + 1)β ; senβ n par o impar (6.169) Se sigue entonces que la ecuación secular correspondiente a (6.156) es: sen(n + 1)βα = 0; α = 1, 2, ...n (6.170) Esta ecuación tiene n raı́ces, (n + 1)βα = απ, o sea: βα = α π ; α = 1, 2, ...n n+1 (6.171) Entonces los λ serán, usando (6.163): λα = 2 cos απ ; α = 1, 2, ...n n+1 (6.172) Recordando la relación entre las λα y las ωα , ecuación (6.158), obtenemos para las frecuencias propias: r απ τ ωα = 2 sen ; α = 1, 2, ...n (6.173) md 2(n + 1) 200 / Mecánica clásica avanzada Para hallar los  λα −1  −1 λα   0 −1   0 0   .. ..  . .   0 0 0 0 vectores propios, reemplazamos a (6.157) en (6.155):     0 0 ··· 0 0 µα1 0  µα2   0  −1 0 · · · 0 0          λα −1 · · · 0 0    µα3   0      −1 λα · · · 0 0   =    ..  .. .. .. ..   .. ..     .  . . . . .  .      0 0 · · · λα −1 µαn−1   0  0 0 · · · −1 λα µαn 0 (6.174) La ecuación (6.174) representa el siguiente sistema de ecuaciones lineales: µα2 µα3 µα4 µα5 = = = = .. . µαk = λα µα1 (λ2α − 1)µα1 (λ3α − 2λα )µα1 (λ4α − 3λ2α + 1)µα1 (6.175) Dk−1 (λα )µα1 .. . senkβα µα1 = senβα α, k = 1, 2, ...n La última lı́nea de (6.175) también puede obtenerse comparando a (6.160) con la relación de recurrencia para los µαk , (6.156): µα,k+1 = λα µα,k − µα,k−1 ; α, k = 1, 2, ...n (6.176) Entonces los vectores propios son: ~ Tα = µ µα1 (senβα , sen2βα , ...sennβα ); α = 1, 2, ...n senβα (6.177) µα1 es una constante que se determina por normalización: (~ µα , ~ µα ) = m~µTα · ~µα = m n µ2α1 X sen2 kβα = 1 sen2 βα (6.178) k=1 La sumatoria en (6.178) se puede tratar como una serie geométrica: n X n sen2 kβα = 1X (1 − cos 2kβα ) 2 k=0 k=1 n = n + 1 1 X i2βα k ) − Re (e 2 2 k=1 = n + 1 sen(n + 1) βα cos 2nβα − 2 2senβα (6.179) Pequeñas oscilaciones de sistemas de varios grados de libertad / 201 como, según (6.170), sen(n + 1)βα = 0, se sigue que: µ2α1 = 2 sen2 βα (n + 1)m (6.180) llamando M a la masa total, M = nm, (6.180) y (6.175) nos dan: r 2 αk π µαk = sen = µkα ; α, k = 1, 2, ...n M +m n+1 (6.181) Como debe ser, las ~ µα son ortogonales pues todas las frecuencias propias ωα son no degeneradas: n (~ µα , ~ µα ) = m~µα · µ ~β = 2 X senkβα senkββ = δαβ n+1 (6.182) k=1 Las coordenadas normales para este problema son: r τ απ θα = Cα sen 2 sen t + φα ; α = 1, 2, ...n md 2(n + 1) p La matriz Ã que realiza la transformación 2/(M + m) sen[αβπ/(n + 1)]:  2π π  sen n + 1 sen n + 1    4π  sen 2π sen r  n+1 n+1  2  Ã =  M +m  .. ..  . .     nπ 2nπ sen sen n+1 n+1 (6.183) de ~η a ~θ, η~ = Ãθ~ es simétrica, Aαβ =  nπ n+1    2nπ   · · · sen  n+1     .. ..  . .    2 n π  · · · sen n+1 · · · sen (6.184) Una oscilación arbitraria del sistema está descrita por una superposición de las oscilaciones propias: r τ αiπ απ ηi (t) = Cα sen sen 2t sen + φα n+1 md 2(n + 1) α=1 n X (6.185) En los modos normales de oscilación todas las partı́culas están sobre una curva sinusoidal cuya longitud de onda depende del orden del modo, o sea de la frecuencia ωα . Es una solución del tipo “onda estacionaria”, determinada por las condiciones de frontera µα0 = µαn+1 . Corben y Stehle obtienen a partir de esta solución la solución para una onda viajera, imponiendo las condiciones de frontera periódicas, µα0 = µαn y µα1 = µαn+1 . 202 / Mecánica clásica avanzada La cuerda uniforme. Lagrange demostró que mediante un procedimiento de paso al lı́mite las oscilaciones de la cuerda uniforme pueden obtenerse a partir de las de la cuerda cargada. La densidad lineal de masa ρ es: M nm n m ρ= = = (6.186) L L n+1 d en (6.173) puede obtenerse en el lı́mite en que n → ∞, m → 0, d → 0 manteniendo m/d constante: m (6.187) lı́m ρ = n→∞ d Entonces el lı́mite de ωα cuando n → ∞ es: r απ τ (n + 1)n sen ωα = 2 ρ L2 2(n + 1) (6.188) r r 2 τ απ π τ → =α ; α = 1, 2, ...∞ L ρ 2 L ρ p Esto expresa la Ley de Mersenne. ω1 = (π/L) τ /ρ es la frecuencia del tono fundamental de una cuerda y ωα es el armónico de orden α. Cuando n → ∞, el número de modos normales de oscilación es infinito aunque es contable. En cambio el ı́ndice que numera las partı́culas se convierte en una variable continua: x → kd ; k = 0, 1, 2, ...∞ ; d→0 (6.189) x es una variable que define la posición de la partı́cula k. Entonces la fórmula (6.181) se convierte en: r πx 2 µα,k → µα (x) = ; α = 1, 2, ...∞ (6.190) sen α M L Una oscilación general de la cuerda estará dada por: r ∞ X απx απ τ η(x, t) = Cα sen (6.191) sen t + φα L L ρ α=1 donde Cα y φα es un conjunto contable infinito de constantes arbitrarias. Ã ya no será una matriz, pues si bien las filas siguen siendo contables, las columnas forman un continuo. Las fórmulas de transformación entre las coordenadas ~η y las coordenadas ~θ son: ∞ X η(x, t) = µα (x)θα (t) (6.192) α=1 En vez de la matriz m̃ con elementos mij = mδij debemos tener una función delta de Dirac, de modo que Ãm̃ÃT = I˜ se convierte en: Z L Z L Z L ρ dx dy µα (x)δ(x − y)µβ (y) = ρµα (x)µβ (x)dx = 0 0 0 2 L Z o L βπx απx sen = δαβ dx sen L L (6.193) Pequeñas oscilaciones de sistemas de varios grados de libertad / 203 En vez de los elementos de m̃ y k̃, debemos tener: m(x, x′ ) = k(x, x′ ) = = ρδ(x − x′ ) τ [2δ(x − x′ ) − δ(x − x′ − d) − δ(x − x′ + d)] d2 d2 −τ 2 δ(x − x′ ) dx (6.194) Ãk̃ ÃT = ω̃ se convierte en: Z L Z L τ dx dx′ µα (x) 2δ(x − x′ ) − δ(x − x′ + d)− 2 d 0 0 δ(x − x′ − d) µβ (x) τ = 2 d ( τ d2 ( = 2 τ = ρ d2 1 2 δαβ − ρ Z ) L µα (x) [µβ (x − d) + µβ (x + d)] dx 0 2 2 δαβ − ρ M Z 0 L sen (6.195) ) βπx βπd απx 2sen cos dx L L L 4τ πβd βπd δαβ = 2 sen2 1 − cos δαβ L ρd 2L Entonces, los elementos diagonales de Ãk̃ ÃT son, tomando d → 0: ωβ2 = β 2 π2 τ L2 ρ (6.196) como debe ser. En vez de las ecuaciones algebraicas (6.156) tendremos ahora una ecuación diferencial. En efecto, (6.156) se convierte en: τ τ 2τ − µα (x − d) + − ρdωα2 µα (x) − µα (x + d) = 0 (6.197) d d d Podemos escribir a (6.197) en la forma: τ τ [µα (x) − µα (x − d)] − [µα (x + d) − µα (x)] = ρdωα2 µα (x) d d (6.198) En el lı́mite cuando d → 0, en el lado izquierdo obtenemos: −τ [µ′α (x) − µ′α (x + d)] = ρ dωα2 µα (x) (6.199) Tomando una vez más el lı́mite cuando d tiende a cero obtenemos: d2 µα (x) ρ 2 + ωα µα (x) = 0; α = 1, 2, ...∞ dx2 τ (6.200) 204 / Mecánica clásica avanzada Reemplazando a (6.196) en (6.200) vemos que efectivamente (6.190) es la solución de (6.200). De (6.188) podemos obtener la ecuación diferencial que obedece la amplitud dependiente del tiempo. En efecto: r ∞ απ 2 X ∂2η απx απ τ sen = − Cα sen t + φα ∂x2 L L L ρ α=1 (6.201) r ∞ απ 2 τ X ∂2η απx απ τ = − C sen sen t + φα ∂t2 L ρ L L ρ α=1 De donde: ρ ∂2η ∂2η − =0 2 ∂x τ ∂t2 (6.202) Esta ecuación se obtiene también directamente de (6.15) y (6.195). Es la ecuación de onda en una dimensión. Hemos llegado a la teorı́a de las ondas mecánicas. No seguiremos con el tema, que nos aleja del propósito del presente capı́tulo. 7 Cinemática del cuerpo rı́gido 7.1. Definición de cuerpo rı́gido Es un sistema de partı́culas sometidas a las siguientes ligaduras holónomas: |~ri − ~rj | = lij = Constante; i, j = 1, 2, ...N (7.1) El número de relaciones de este tipo es: N 2 = 1 N (N − 1) 2 (7.2) Para N > 7 el número de ligaduras excede el número de coordenadas 3N . En realidad, para N ≥ 4 el número de ligaduras independientes es menor que el número dado por (7.2). Sea un cuerpo rı́gido formado por más de tres partı́culas no colineales. Dados tres puntos no colineales del cuerpo rı́gido, las ligaduras fijan las posiciones de todos los demás puntos, pues para ubicar un punto en el espacio bastan sólo las distancias a tres puntos no colineales (véase figura 7.1). Luego, para especificar los grados de libertad de un cuerpo rı́gido, basta determinar el número de coordenadas independientes necesarias para ubicar la posición de tres puntos del cuerpo rı́gido. Como entre los tres puntos dados, no colineales, hay tres condiciones de ligadura, r12 = l12 , r23 = l23 , r13 = l13 , se necesitan 9 − 3 = 6 coordenadas independientes para especificar la posición de tres puntos no colineales del cuerpo rı́gido. En consecuencia el número de grados de libertad de un cuerpo rı́gido es seis. Otra manera de hallar lo anterior es la siguiente. Para especificar la posición del punto 1 se requieren tres coordenadas. Para especificar la posición del punto 2, dado el punto 1 y la distancia r12 se requieren dos coordenadas. Para especificar la posición del punto 3, dados los puntos 1 y 2 y las distancias r23 y r13 , se requiere sólo una coordenada. O sea que en total se requieren seis coordenadas para ubicar los tres puntos. 205 206 / Mecánica clásica avanzada i 2 l12 1 l23 l13 3 Figura 7.1 Posición de un punto respecto de tres puntos no colineales del cuerpo rı́gido 7.2. Sistemas de coordenadas espacial y del cuerpo rı́gido Para especificar la posición de un cuerpo rı́gido es suficiente: (a) Especificar la posición en el espacio de un punto cualquiera del cuerpo, para ello se requieren tres coordenadas; (b) Especificar la orientación del cuerpo respecto a unas coordenadas fijas en el punto mencionado, para ello se requieren tres coordenadas dado que seis es el número total de grados de libertad. El sistema de coordenadas η, ξ, ζ, está fijado al cuerpo rı́gido (véase figura 7.2). El sistema de coordenadas x′ , y ′ , z ′ , se obtiene del sistema x, y, z, sólo por translación al origen de coordenadas fijado al cuerpo rı́gido. z′ ζ z r′ r y′ a η y x′ ξ x Figura 7.2 Sistemas de coordenadas espacial y del cuerpo rı́gido Cinemática del cuerpo rı́gido / 207 Para una partı́cula del cuerpo rı́gido se tiene: ~r = ~r′ + ~a (7.3) En el sistema de coordenadas del cuerpo rı́gido la partı́cula tiene coordenadas η, ξ, ζ y en el sistema de coordenadas trasladado tiene coordenadas x′ , y ′ , z ′ . Estas coordenadas difieren por una rotación, o sea que están relacionadas entre sı́ mediante una transformación lineal:   ′   x η          ξ  = Ã  y ′  (7.4)         z′ ζ donde Ã es la matriz de la transformación. Llamemos las coordenadas ası́: x1 = x x′1 = x′ x1 = η a1 = ax x2 = y x′2 = y ′ x2 = ξ a2 = ay x3 = z x′3 = z ′ x3 = ζ a3 = az (7.5) Con lo cual podemos describir: xi = x′i + ai ; xi = 3 X aij x′j ; i = 1, 2, 3 (7.6) j=1 donde aij son los elementos de la matriz Ã. La transformación de las coordenadas espaciales (x) a las coordenadas del cuerpo rı́gido (x) son: xi = 3 X a−1 ij xj + ai i = 1, 2, 3 (7.7) j=1 −1 −1 donde a−1 . Obviamente aij no es l/aij ·. a−1 ij son los elementos de la matriz inversa ã ij son un conjunto de nueve números que especifican la dirección de los ejes de coordenadas fijos al cuerpo respecto a los ejes de coordenadas situados en el mismo punto de los anteriores pero no rotados respecto a los espaciales. Como la descripción del movimiento translacional del cuerpo rı́gido es posible usando los métodos de la cinemática de partı́culas, podemos sin perder generalidad hacer coincidir los sistemas de coordenadas (x) y (x′ ). Nos interesaremos pues, en la relación entre las coordenadas (x) y (x). La longitud del vector ~r es la misma en los dos sistemas de coordenadas con origen común: r2 = r 2 . Por tanto:   ! 3 3 3 3 X X X X −1  −1 2  aij xj a xk xi xi = r = ik i=1 i=1 j=1 3 X 3 X 3 X k=1 (7.8) r2 = i=1 xi xi = j=1 k=1 δjk xj xk 208 / Mecánica clásica avanzada Igualando las ecuaciones (7.8) obtenemos: ! 3 X 3 3 X 3 3 X X X −1 −1 δjk xj xk = aij aik xj xk j=1 k=1 j=1 k=1 (7.9) i=1 Como las x son independientes por definición, se sigue que: 3 X −1 a−1 ij aik = δjk (7.10) i=1 En términos de los elementos (Ã−1 T )lm de la matriz traspuesta de la matriz Ã−1 , que se obtiene por intercambio de filas y columnas, podemos escribir (7.10) como: 3 X ˜ jk (Ã−1 T )ij (Ã−1 )ik = (I) (7.11) i=1 donde I˜ es la matriz identidad 3 × 3. En forma de matriz (7.11) es: Ã−1 T Ã−1 = I˜ ⇒ Ã−1 = ÃT (7.12) donde hemos usado el hecho de que: Ã−1 Ã = I˜ y (Ã−1 T )T = Ã−1 . Llegamos a la conclusión que: Ã−1 = ÃT . Una matriz para la cual su inversa coincide con su transpuesta se llama ortogonal. La matriz de rotación Ã contiene nueve parámetros, pero entre ellos hay las relaciones: 3 X i=1 aji aTik = δjk ⇒ 3 X aji aki = δjk (7.13) i=1 Tres relaciones se obtienen cuando j = k: 3 X (aji )2 = 1; j = 1, 2, 3 (7.14) i=1 Hay seis relaciones cuando j 6= k: 3 X i=1 aji aki = 0 j 6= k; j, k = 1, 2, 3 (7.15) Pero de (7.15) también se sigue que: 3 X i=1 aki aji = 0 j 6= k; j, k = 1, 2, 3 (7.16) O sea que sólo hay tres relaciones independientes para j 6= k. En total hay seis relaciones entre los elementos de la matriz Ã. Como era de esperarse, Ã contiene sólo tres parámetros independientes. Cinemática del cuerpo rı́gido / 209 x2 x2 r,r x1 θ θ φ x1 Figura 7.3 Rotación de los ejes (x) alrededor del eje x3 = x3 . Ejemplo 7.2.1 Supongamos que los ejes (x) y (x) difieren simplemente por una rotación por un ángulo φ alrededor del eje x3 = x3 (véase figura 7.3). Encontrar las fórmulas de transformación. Las fórmulas de transformación se obtienen fácilmente de la figura 7.3, que representa el plano x1 − x2 : x= r cos θ x= r senθ (7.17) donde hemos usado que r = r. Como θ = θ − φ podemos escribir: cos θ = cos θ cos φ + senθ senφ (7.18) senθ = senθ cos φ − cos θ senφ Teniendo en cuenta que: x1 = r cos θ ; x2 = r senθ (7.19) Se sigue inmediatamente que las fórmulas de transformación son: x1 = x1 cos φ + x2 senφ x2 = −x1 senφ + x2 cos φ x3 = x3 (7.20) 210 / Mecánica clásica avanzada O en forma de matriz:    cos θ senφ x1        x2  =  −senφ cos φ       x3 0 0 0  x1        0   x2     x3 1 (7.21) Esta matriz satisface idénticamente las relaciones de ortogonalidad (7.13). Para j = k: j= primera fila , cos2 φ + sen2 φ + 02 = 1 j= segunda fila , sen2 φ + cos2 φ + 02 = 1 j= tercera fila , 02 + 02 + 12 = 1 (7.22) satisface también las relaciones para j 6= k (ortogonalidad de las filas entre sı́ o de las columnas entre sı́): j = 1, k = 2 ( 1a y 2a filas) : − cos φ senφ + senφ cosφ + 0 = 0 j = 1, k = 3 ( 1a y 3a filas) : 0 +0 +0 =0 j = 1, k = 2 ( 2a y 3a filas) : 0 +0 +0 =0 (7.23) y similarmente para la ortogonalidad entre columnas. En general, las relaciones (7.13) pueden expresarse en la siguiente manera. Para una matriz ortogonal Ã se cumple que el producto escalar de una fila por sı́ misma, o de una columna por sı́ misma, es igual a la unidad. Dos filas diferentes o dos columnas diferentes son ortogonales entre sı́. No es cierto sin embargo que una fila sea ortogonal a una columna. Es claro en el ejemplo anterior que Ã−1 = ÃT . 7.3. Los cosenos directores Sean dos sistemas de ejes cartesianos con origen común (x) y (x). Los ejes (x) están rotados respecto a los ejes (x). Sean ~e1 , ~e2 y ~e3 tres vectores unitarios a lo largo de los ejes x1 , x2 y x3 respectivamente. Sean ~e′1 , ~e′2 y ~e′3 los tres vectores unitarios a lo largo de los ejes x1 , x2 y x3 respectivamente. Se definen los cosenos directores de los ejes (x) respecto a los ejes (x) como los cosenos de los ángulos que hacen cada uno de los ejes (x) con cada uno de los ejes (x). Los denotaremos αij . De su definición se sigue que: αij = ~e′i · ~ej ; i, j = 1, 2, 3 (7.24) Es claro que αij es el coseno del ángulo entre el eje xi y el eje xj . En total hay nueve cosenos directores, que no son independientes. Es claro que la transformación de los vectores ~ei a los vectores ~e′i es: ~e′i = 3 X j=1 αij ~ej = 3 X j=1 (~e′i · ~ej )~ej (7.25) Cinemática del cuerpo rı́gido / 211 en efecto: ~e′i · ~ek = 3 X j=1 (~e′i · ~ej )(~ej · ~ek ) = 3 X j=1 (~e′i · ~ej )δjk = ~e′i · ~ek (7.26) Un vector cualquiera V~ puede expresarse de dos maneras equivalentes: 3 X V~ = Vi~ei = 3 X Vi′~e′i (7.27) i=1 i=1 Multiplicando escalarmente (7.27) a ambos lados por ~e′k : 3 X i=1 3 X Vi~ek · ~ei = i=1 Vi′~e′k · ~e′i = Vk′ (7.28) ~ se transforman de la siguiente manera: Por tanto se tiene que las componentes de V Vk′ = 3 X αkj Vj (7.29) j=1 En tanto que: ~e′k = 3 X αkj ~ej (7.30) j=1 Es decir, las componentes de los vectores se transforman de la misma manera que los vectores unitarios. Notamos que las componentes Vi y Vi′ de V~ se pueden escribir como: Vi = ~ei · V~ ; Vi′ = ~e′i · V~ (7.31) De acuerdo con (7.29): ~ = Vi′ = ~e′i · V 3 X j=1 (~e′i · ~ej )(~ej · V~ ) (7.32) ~ como ~e′ , según (7.32): Tomando V i 1= 3 X j=1 (~e′i · ~ej ) → 3 X α2kj = 1 ; i = 1, 2, 3 (7.33) j=1 ~ como ~e′ con k 6= i, según (7.32): Tomando V k 0= 3 X j=1 (~ei · ~ej )(~ej · ~e′k ) → 3 X j=1 αij αkj = 0 ; i, k = 1, 2, 3 (7.34) 212 / Mecánica clásica avanzada Vemos que la fórmula de transformación de los vectores ~e′i a los vectores ~ei es: ~ei = 3 X αij ~e′j = j=1 puesto que: ~ei · ~e′k = 3 X j=1 3 X j=1 (~e′j · ~ei )~e′j (~e′j · ~ei )δjk = (~e′k · ~ei ) (7.35) (7.36) Esto nos dice que la matriz traspuesta de (αij ) produce la rotación de los ejes (x) a los ejes (x). Las componentes de un vector se transforman según: Vk = 3 X αjk Vj′ = 3 X αTkj Vj′ (7.37) j=1 j=1 Las relaciones (7.33) y (7.34) entre los cosenos directores pueden escribirse como: 3 X αij αkj = j=1 3 X αij αTjk = δik (7.38) j=1 En sı́ntesis, vemos que la matriz de los (αij ) es ortogonal y cumple todas las propiedades de la matriz de rotación Ã. Los cosenos directores son los elementos de la matriz Ã. Dı́adas y diádicos. Se define un diádico como una entidad algebraica que se representa por una matriz 3 × 3, de la misma manera que un vector es una entidad algebraica que se representa por una matriz columna 3 × 1. De acuerdo con (7.27) un vector unitario se puede expresar como: ~e1 = 1 · ~e1 + 0 · ~e2 + 0 · ~e3 ~e2 = 0 · ~e1 + 1 · ~e2 + 0 · ~e3 ~e3 = 0 · ~e1 + 0 · ~e2 + 1 · ~e3 (7.39) Entonces los vectores unitarios se pueden representar por las tres matrices columna siguientes:       0 0 1                  (7.40) ~e1 →   0  ; ~e2 →  1  ; ~e3 →  0        1 0 0 ~ se puede representar mediante una matriz columna: Un vector arbitrario V         0 0 1 V1                 ~ →  V2  = V1  0  + V2  1  V3  0  (7.41) V                 1 0 V3 0 Cinemática del cuerpo rı́gido / 213 Análogamente podemos suponer que una matriz 3 × 3 es la representación de cierta entidad que llamaremos diádico. Una dı́ada unitaria es el análogo de un vector unitario y un diádico es el análogo de un vector cualquiera. Definimos la dı́ada unitaria como una entidad algebraica ~ei~ej que se puede representar por una matriz 3 × 3 que tiene un 1 en la fila i columna j, y cero en todos los otros lugares. Podemos formar nueve dı́adas unitarias. Ası́ por ejemplo:     1 0 0 0 0 0            ~e1~e1 →  0 0 0  ~e2~e3 →  0 0 1  (7.42)      0 0 0 0 0 0 Notamos que ~ei~ej se puede representar por el producto de una matriz columna por una matriz fila:     1 0 0 1          (1 0 0) =  0 0 0  0 ~e1~e1 →          0 0 0 0 (7.43)     0 0 0 0          (0 0 1) =  0 0 1  1 ~e2~e3 →          0 0 0 0 ~B ~ como un poliEs de notarse que en general ~ei~ej 6= ~ej ~ei . Definimos una dı́ada A nomio de dı́adas unitarias ası́: 3 X 3 X ~B ~ = Ai Bj ~ei~ej A i=1 j=1 (7.44) ~A ~= B 3 X 3 X Bi Aj ~ei~ej i=1 j=1 Un diádico en general es un polinomio de dı́adas unitarias, pero no necesariamente ~ B: ~ de la forma A 3 3 X X ~~ Dij ~ei~ej (7.45) D = i=1 j=1 ~~ Es claro que la representación de D es:   D11 D12 D13     ~~  D →  D21 D22 D23     D31 D32 D33 (7.46) 214 / Mecánica clásica avanzada Ası́ como el producto de un vector fila por una matriz da un vector fila y el producto de una matriz por un vector columna da un vector columna, definimos por analogı́a el producto de un vector por un diádico y de un diádico por un vector para obtener vectores. Definimos los productos entre dı́adas unitarias y vectores ası́: ~ = ~ei (~ej · V ~ ) = ~ei Vj ~ei~ej · V V~ · ~ei~ej = (7.47) ~ · ~ei )~ej = ~ej Vi (V y el producto entre diádicos y vectores ası́: ~~ ~ D ·V = 3 X 3 X ~~ V~ · D = 3 3 X X i=1 j=1 i=1 j=1   3 3 X X ~ =  Dij Vj  ~ei Dij ~ei ~ej · V i=1 j=1 ! 3 3 X X ~ · ~ei ~ej = Dij Vi ~ej Dij V j=1 i=1 Se define el diádico unidad como: ~ ~1 = ~e ~e + ~e ~e + ~e ~e 1 1 2 2 (7.48) 3 3 (7.49) ~ ~1 claramente tiene las propiedades: ~ ~= ~1 · A 3 3 X X ~ ~= ~ei Ai = A ~ei~ei · A i=1 i=1 ~ ·~ ~1 = A 3 X 3 X i=1 ~ · ~ei~ei = A (7.50) ~ Ai~ei = A i=1 La dı́ada ~ei~ej tiene la propiedad de proyección. Al multiplicarla por un vector se obtiene la componente del vector en la dirección ~ei : ~=A ~ · ~ei~ei = ~ei~ei · A 3 X j=1 Aj (~ei · ~ej )~ei = Ai~ei (7.51) Se define el producto escalar de dos matrices ası́: Ã : B̃ = 3 X 3 X Aij Bij (7.52) i=1 j=1 que corresponde al producto escalar de dos diádicos: ~~ ~~ A : B = Ã : B̃ (7.53) Para el diádico (7.44) y uno similar tenemos: ~B ~ :C ~D ~ = A 3 X i=1 ~ · C)( ~ B ~ · D) ~ Ai Bj Ci Dj = (A (7.54) Cinemática del cuerpo rı́gido / 215 Vemos que esto es lo mismo que: ~ ·A ~B ~ ·D ~ = C = 3 3 X X ~ · ~ei )(~ej · D) ~ Ai Bj (C 3 X 3 X ~ · A)( ~ B ~ D) ~ Aj Bj Ci Dj = (C i=1 j=1 i=1 j=1 (7.55) Por tanto: ~B ~ :C ~D ~ =C ~ ·A ~B ~ ·D ~ A (7.56) Veremos que existe completa correspondencia entre los diádicos y los tensores. Un tensor es una entidad algebraica, con componentes Tij tales que bajo rotaciones se transforma ası́: Tij′ = 3 X 3 X αik αjl Tkl (7.57) k=1 l=1 donde (αij ) son los elementos de la matriz de rotación. En efecto, Tij son los elementos ~ de la matriz que representa a cierto diádico T~ : ~ ~ Tij′ = T~ · ~e′i~e′j = ~e′i · T~ · ~e′j (7.58) ~ T~ se puede expresar bien en términos de ~ei~ej o de ~e′i~e′j : 3 3 3 3 XX XX ~ Tij′ ~e′i~e′j Tij ~ei~ej = T~ = (7.59) i=1 j=1 i=1 j=1 Por tanto (7.57) se puede escribir como: Tij′ = 3 X 3 X k=1 l=1 Tlk ~ei · ~ek ~el · ~ej = 3 X 3 X αik αjl Tkl (7.60) k=1 l=1 Se denomina relación de completidad de la base ~ei a: X ~ ~ei~ei = I~ (7.61) i=1 y relación de ortonormalidad de la base ~ei a: ~ei · ~ej = δij ; i, j = 1, 2, 3 (7.62) En mecánica cuántica la notación de Dirac es la notación diádica en el espacio de Hilbert. Dos forma. Se define el diádico antisimétrico: ~ei ∧ ~ej = ~ei~ej − ~ej ~ei (7.63) 216 / Mecánica clásica avanzada se cumple que ~ei ∧ ~ei = 0 y además: ~e1 ∧ ~e2 = ~e2 ∧ ~e3 =  0 1    −1 0   0 0  0    0   0 0 0    0   , ~e1 ∧ ~e3 =  0 0   0 0    0 0   −1 0 1    0  ,  0 (7.64)   0 1    −1 0 Una 2-forma entre dos vectores es: ~∧B ~ = A 3 X 3 X i=1 j=1 Ai Bj ~ei ∧ ~ej = 3 X 3 X i=1 j=1 (Ai Bj − Aj Bi )~ei~ej (7.65) Se cumplen las propiedades: ~ ·A ~∧B ~ ·D ~ = (C ~ · A)( ~ B ~ · D) ~ − (C ~ · B)( ~ A ~ · D) ~ C (7.66) ~∧B ~ :C ~ ∧D ~ = 2(D ~ · B)( ~ A ~ · C) ~ − 2(C ~ · B)( ~ A ~ · D) ~ A El deteminante de la matriz de rotación. Sabemos que la matriz de los cosenos directores de un sistema de ejes (x) rotado respecto a otro sistema de ejes (x) es ortogonal: ÃT Ã = I˜ (7.67) Tomando el determinante a cada lado de (7.67) y teniendo en cuenta el teorema matemático que dice que el determinante de un producto de matrices es igual al producto de los determinantes, tenemos que: det(ÃT Ã) = det ÃT · det Ã = det I˜ (7.68) otro teorema matemático dice que los determinantes de una matriz y de su traspuesta son iguales, entonces: det(Ã)2 = 1 ⇒ det Ã = ±1 (7.69) Es fácil ver que det Ã = −1 ocurre cuando la matriz Ã contiene una inversión del sistema de coordenadas. Entonces los desplazamientos de un sólido rı́gido con un punto fijo sólo pueden ser descritos mediante una matriz de determinante +1. Cinemática del cuerpo rı́gido / 217 7.4. El teorema de Euler acerca del movimiento de un cuerpo rı́gido El teorema dice: el desplazamiento general de un cuerpo rı́gido con un punto fijo es un giro alrededor de cierto eje. En otras palabras: es suficiente un solo giro para pasar de los ejes (x) fijos al cuerpo, a los ejes espaciales (x). El teorema se demuestra teniendo estas dos propiedades de una rotación alrededor de un eje: (a) El eje de rotación permanece inalterado; (b) La rotación no cambia la longitud de los vectores. El teorema de Euler queda demostrado si para una rotación arbitraria, descrita por la matriz Ã, podemos hallar siempre un vector que no cambie, es decir, que tenga las mismas componentes en los dos sistemas: ~ =V ~ V~ ′ = ÃV (7.70) Esta ecuación es un caso particular de: ~ = λV ~ V~ ′ = ÃV (7.71) Como Ã es unitaria (ortogonal) pero no hermı́tica (no simétrica), sus valores propios no tienen por qué ser reales. Esto nos permite enunciar el teorema de Euler de otra manera: “la matriz real y ortogonal que determina el movimiento fı́sico de un cuerpo rı́gido con un punto fijo siempre tiene el valor propio +1”. La ecuación de valores propios (7.71) puede escribirse: ˜V ~ = ~0 (Ã − λI) (7.72) Es un sistema homogéneo de tres ecuaciones lineales, donde las incógnitas son las componentes de V~ : (a11 − λ)V1 + a12 V2 + a13 V3 = 0 a21 V1 + (a22 − λ)V2 + a23 V3 = 0 a31 V1 + a32 V2 + (a33 − λ)V3 = 0 (7.73) Como es conocido, habrá solución no trivial sólo si el determinante de la matriz ˜ es igual a cero. Esto hace que exista solución solamente para ciertos valores de (Ã − λI) λ:   a11 − λ a12 a13      a22 − λ a23  (7.74) det  a21 =0   a31 a32 a33 − λ La ecuación (7.74) es de tercer grado en λ con coeficientes reales: λ3 + bλ2 + cλ + d = 0 (7.75) 218 / Mecánica clásica avanzada donde: b = −a11 − a22 − a23 c = a22 a11 + a33 a11 + a21 a33 − a23 a32 − a12 a21 − a13 a31 (7.76) d = a23 a32 a11 + a12 a21 a33 + a13 a31 a22 −a22 a33 a11 − a12 a23 a31 − a13 a21 a32 cuyas principales propiedades son: ~ podrı́a ser (a) λ puede ser complejo pero con módulo 1. Si λ es complejo, V 2 ~ ~ ~ ~ complejo. En este caso escribimos el módulo de V como |V | = V · V donde V~ † es la ~ y tomando el complejo conjugado: V ~ † = (V ~ T )⋆ . matriz fila que se obtiene trasponiendo V ′ ~ es la misma de V~ : La longitud de V ~ ′ |2 = V ~ ′† · V ~ ′ = (ÃV ~ )† · (ÃV~ ) = V ~ † ÃT ÃV~ |V (7.77) ~ ′ |2 = | V ~ |2 . Por otra parte, V ~ ′ = λV ~ , por Como Ã es ortogonal, se sigue que |V tanto: ~ ′ |2 = V ~ ′† · V ~ ′ = (λV ~ )† · (λV ~ ) = λ⋆ λV ~†·V ~ = |λ|2 |V ~ |2 |V (7.78) En conclusión: |λ|2 = 1 (7.79) (b) La ecuación secular (7.75) tiene al menos una raı́z real. Grafiquemos la ecuación real: f (x) = x3 + bx2 + cx + d (7.80) asumiremos x real. De la ecuación (7.76) sabemos que b, c y d son reales. Claramente: f (x) → ∞ para x → ∞ f (x) → −∞ para x → −∞ (7.81) Como f (x) es continua debe en alguna parte cruzar el eje x. Llamemos x = λ el punto donde corta el eje, o sea el cero de f (x): λ3 + bλ2 + cλ + d = 0 (7.82) Como por (a) sabemos que |λ| = 1, se sigue que el valor propio real debe ser λ = −1 o λ = +1 (véase figura 7.4). (c) Si λ es un valor propio compleio, λ⋆ también es un valor propio. Como a, b, c y d son reales, si λ es complejo y satisface (7.75) entonces λ⋆ también la satisface: de (a), (b) y (c) se sigue que la matriz Ã tendrá tres valores propios λ, λ⋆ , +1 o −1. Para cada valor propio habrá un vector propio: ~α = λα V~α ; ÃV α = 1, 2, 3 con λα = λ, λ⋆ , 1 o − 1 (7.83) Cinemática del cuerpo rı́gido / 219 y λ x Figura 7.4 Gráfico de la función real f (x) = x3 + bx2 + cx + d En términos de las componentes podemos escribir a (7.83) como: 3 X aij Vαj = λα Vαj = j=1 3 X λβ Vβi δαβ (7.84) β=1 Definimos las siguientes matrices formadas con las componentes de los vectores propios y con los valores propios: Ṽ = (Vαi ) , λ̃ = (λβ δαβ ) (7.85) Entonces (7.84) puede reinterpretarse como productos de matrices: ~ )αi = (Ṽ T λ̃T )iα = (Ṽ T λ̃)iα (ÃṼ T )iα = (λ̃V (7.86) O también: ÃṼ T = Ṽ T λ̃ ⇒ (Ṽ T )−1 ÃṼ T = λ̃ (7.87) Es decir, los vectores propios forman una matriz que diagonaliza a Ã siendo los elementos de la diagonal los valores propios. (d) El producto de las raı́ces de la ecuación secular es ±1. Tomando determinantes a ambos lados de (7.87) y teniendo en cuenta que el determinante de una matriz es igual al inverso del determinante de la matriz, obtenemos: 1 det Ã det Ṽ = det λ̃ ⇒ det Ã = det λ̃ det Ṽ (7.88) De (7.69) se sigue que: det λ̃ = ±1 (7.89) 220 / Mecánica clásica avanzada Hemos dicho que para rotaciones se debe cumplir que det Ã = +1 y para inversiones det Ã = −1. Entonces, cuando Ã representa rotaciones: det λ̃ = λ1 λ2 λ3 = |λ|2 λ3 = +1 (7.90) Como |λ|2 = +1 se sigue que siempre el valor propio real debe ser igual a +1. Esto es lo que afirma el teorema de Euler: existe un vector que no cambia al realizar una transformación cualquiera Ã (corresponde al valor propio +1). ~: Los vectores propios. El vector invariante bajo rotaciones es V ~ =V ~ ÃV (7.91) ~α formamos la matriz Ṽ que diagonaliza a Ã: Con las componentes de V Ṽ ÃṼ T = λ̃ (7.92) La traza de λ̃ es: tr λ = λ1 + λ2 + λ3 = λ + λ⋆ + 1 Como |λ| = 1, podemos escribir: λ = eiΦ (7.93) (7.94) De donde: tr λ̃ = 2 cos Φ + 1 (7.95) Como, según un teorema matemático, la traza es invariante bajo transformaciones de semejanza (Ṽ ÃṼ T es una transformación de semejanza sobre Ã): tr Ã = tr λ̃ = 1 + 2 cos Φ (7.96) Es decir, a11 + a22 + a33 = 1 + cos Φ (7.97) Podemos mediante una transformación de semejanza rotar los ejes de modo que ~ , de modo que la matriz de rotación tendrá la forma dada por x3 esté a lo largo de V (7.21):   cos φ senφ 0      −senφ cos φ 0 Ã =  (7.98)     0 0 1 Vemos entonces de (7.97) y (7.98) que cos φ = cos Φ, luego Φ puede identificarse ~ . La ecuación de valores como el ángulo de rotación alrededor del eje determinado por V propios para la matriz Ã es:      V1 V1 cos Φ senΦ 0            −senΦ cos Φ 0   V2  =  V2  (7.99)           V3 V3 0 0 1 Cinemática del cuerpo rı́gido / 221 Con lo cual obtenemos: V1 cos Φ + V2 senΦ = V1 −V1 senΦ + V2 cos Φ = V2 (7.100) V3 = V3 Esto nos da, multiplicando la primera por V2 y la segunda por V1 y restando: (V12 + V22 ) senΦ = 0 (7.101) Como Φ es arbitrario, los vectores propios deben cumplir V1 = V2 = 0, quedando ~ = V3~e3 . Para una elección general de los ejes, seguirá siendo V3 indeterminado, luego V ~ , pero no quedará determinado comválido que Φ representa la rotación alrededor de V ~ sino sólo su dirección: su magnitud quedará indeterminada. En pletamente el vector V cualquier caso la traza de Ã nos determina el ángulo de rotación. Teorema de Chasles. El desplazamiento más general de un cuerpo rı́gido consiste en una translación más una rotación. Este teorema se demuestra en el texto Dynamics of a rigid body, de Routh. 7.5. El rotador rı́gido Es un sólido rı́gido que se mueve sometido a la condición de ligadura que un punto permanezca fijo. Los movimientos de un rotador rı́gido quedarán especificados por medio de las tres componentes de la matriz Ã que relaciona las componentes de los vectores en el sistema de ejes espacial con el sistema de ejes unido al sólido rı́gido: ~r = Ã~r o xi = 3 X aij xj (7.102) j=1 En efecto, es suficiente especificar las tres coordenadas de un punto arbitrario del sólido rı́gido respecto al sistema de ejes espacial para conocer completamente la ubicación de todos los demás puntos del sólido rı́gido. Es decir, los tres parámetros independientes de la matriz Ã sirven para especificar las posiciones de un rotador rı́gido. Es claro que estos tres parámetros serán funciones del tiempo. El grupo de rotaciones. El conjunto de todas las infinitas rotaciones de un cuerpo rı́gido con un punto fijo constituye un grupo. Cada rotación Ã está especificada por tres parámetros independientes q1 , q2 y q3 . Un grupo es la siguiente estructura algebraica: (i) Existe un conjunto de elementos g = {Ã(q), ∀q1 , q2 , q3 }. (ii) Si Ã1 y Ã2 ∈ g entonces Ã1 Ã2 ∈ g. ˜ (iii) Si Ã ∈ g, ∃Ã−1 ∈ g tal que ÃÃ−1 = I. ˜ ˜ (iv) ∃I ∈ g tal que I Ã = Ã, ∀Ã ∈ g. (v) ∀ Ã, B̃, C̃ ∈ g se cumple Ã(B̃ C̃) = (ÃB̃)C̃. 222 / Mecánica clásica avanzada Estas propiedades se siguen del hecho de que las matrices de rotación son ortogonales. Es sencillo demostrar a partir de lo anterior que: (a) El producto de dos matrices ortogonales es ortogonal. (b) Como para toda matriz de rotación det Ã = 1, se sigue que toda matriz de rotación tiene inverso. (c) I˜ es ortogonal. (d) El producto de matrices obedece la ley asociativa. Las rotaciones consideradas en abstracto como simples transformaciones geométricas forman un grupo. El conjunto de matrices ortogonales 3 × 3 constituye una representación del grupo de rotaciones. 7.6. Los ángulos de Euler Los nueve cosenos directores no son independientes, sólo tres lo son. Podemos pensar que todos los cosenos directores sean expresados en términos de tres parámetros independientes φ, θ, ψ: αij = αij (φ, θ, ψ) ; i, j = 1, 2, 3 (7.103) La elección de estos tres parámetros independientes no es única. Una conveniente elección de φ, θ y ψ, es la siguiente (véase figura 7.5). Se puede efectuar la transformación de (x) a la posición del cuerpo rı́gido dada por (x) por medio de las siguientes rotaciones: una rotación por un ángulo φ alrededor del eje x3 , con lo cual los ejes cambian de (x) a (µ). Una rotación por un ángulo θ alrededor de µ1 , con lo cual los ejes se cambian de (µ) a (µ′ ). Finalmente una rotación por un ángulo ψ, alrededor del eje µ′3 , con lo cual los ejes se cambian de (µ′ ) a (x).1 Para expresar la matriz de rotación S̃ en términos de los ángulos φ, θ y ψ (ángulos de Euler) debemos calcular los cosenos directores en términos de estos ángulos. x3, µ 3 x3 µ3′ µ2′ µ2 ϕ x1 ϕ µ1 χ3, µ3′ θ x2 x2 x3 θ x2 x1 ϕ µ1, µi x2 x1 ϕ ψ x1 Línea de nodos Figura 7.5 Angulos de Euler 1 (θ, φ − π/2) son los ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 , y (θ, π/2 − ψ) son los ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 . Cinemática del cuerpo rı́gido / 223 Para hallar α11 = ~e′1 · ~e1 tomemos los planos que se cortan en la lı́nea de nodos y que contienen los ejes x1 − x2 y x1 − x2 como en la figura 7.6. Vemos que: x3 x3 π- θ α a φ ψ x2 x2 b l x1 θ x1 Figura 7.6 Planos que se cortan en la lı́nea de nodos a cos φ = b cos ψ (7.104) l2 = a2 + b2 − 2ab cos α (7.105) l2 = (a senφ)2 + (b senψ)2 − 2(a senφ)(b senψ) cos (π − θ) (7.106) Igualando (7.105) y (7.106) llegamos a: −b cos α = −a cos2 φ + b senφ senψ cos θ (7.107) Ahora, reemplazando (7.104) en (7.107) obtenemos finalmente: α11 = cos α = cos ψ cos φ − senφ senψ cos θ (7.108) α12 = ~e′1 · ~e2 se obtiene de α11 reemplazando a φ por φ + 3π/2: α12 = cos ψ senφ + cos φ senψ cos θ (7.109) α21 = ~e′2 · ~e1 se obtiene de α11 reemplazando a ψ por ψ + π/2: α21 = −senψ cos φ − senφ cos ψ cos θ (7.110) α22 = ~e′2 · ~e2 se obtiene de α21 reemplazando a φ por φ + 3π/2: α22 = −senψ cos φ + cos φ cos ψ cos θ (7.111) 224 / Mecánica clásica avanzada α33 = ~e′3 · ~e3 se obtiene directamente: α33 = ~e′3 · ~e3 = cos θ (7.112) α13 y α23 se obtienen de las relaciones de ortogonalidad siguientes, ecuación (7.38): α2j1 + α2j2 + α2j3 = 1 (7.113) Con lo cual se obtiene para α13 : α213 = 1 − (α211 + α212 ) = 1 − (1 − sen2 ψ sen2 θ) (7.114) ⇒ α13 = senψ senθ Similarmente, α221 + α222 = sen2 ψ + cos2 ψ cos2 θ, con lo cual: α23 = cos ψ senθ (7.115) Para calcular a α32 y a α31 usamos la ecuación (7.38) ası́: α31 α21 + α32 α22 + α33 α23 = 0 (7.116) α31 α11 + α32 α12 + α33 α13 = 0 (7.117) Multiplicando a (7.116) por α11 y a (7.117) por α21 y restando: α32 = α13 α21 − α23 α11 α33 α22 α11 − α12 α21 (7.118) Con lo cual se obtiene: α32 = −senθ cos φ (7.119) Por otra parte la relación (7.38) para la fila tres: α231 + α232 + α233 = 1 (7.120) nos permite escribir: α31 = senθ senφ (7.121) con lo cual la matriz de rotación es, en definitiva: Ã =  cos φ cos ψ − senφ cos θ senψ senφ cos ψ + cos φ cos θ senψ senθ senψ   (7.122)    − cos φ senψ − senφ cos θ cos ψ −senφ senψ + cos φ cos θ cos ψ senθ cos ψ      senφ senθ − cos φ senθ cos θ Por la forma como fue obtenida, a partir de los cosenos directores, se tiene que Ã es una matriz ortogonal. Es decir, que Ã−1 se obtiene simplemente trasponiendo a Ã. Cinemática del cuerpo rı́gido / 225 Del teorema de Euler se sigue que de alguna manera Ã representa una rotación única alrededor de cierto eje n̂ = c1~e1 + c2~e2 + c3~e3 bajo un ángulo Φ. El eje de rotación se halla resolviendo la ecuación de valores propios (7.91), con λ = 1: 3 X j=1 (aij − δij )Cj = 0 ; i = 1, 2, 3 (7.123) El resultado para los cosenos directores del eje n̂ es: C1 = senθ(cos ψ − cos φ) 2 senΦ C2 = senθ(senφ − senψ) 2senΦ (7.124) sen(Φ + ψ) (1 + cos θ) 2senΦ Donde Φ es el ángulo de rotación alrededor de n̂ que se halla a partir de la traza de Ã, ecuación (7.97): C3 = cos φ = 1 − tr Ã 2 (7.125) Calculando la traza de Ã se llega finalmente a: θ ψ+φ Φ (7.126) cos = cos cos 2 2 2 Como C12 + C22 + C32 = 1, vemos que dos cosenos directores de n̂ y Φ especifican la rotación.2 Se puede ver que Ã se puede obtener también a partir de la definición de los ángulos de Euler, de acuerdo con la figura 7.5:      x1 cos φ senφ 0 µ1            µ2  =  −senφ cos φ 0   x2  o ~µ = Ãφ ~x (7.127)           x3 µ3 0 0 1    ′   1 0 0 µ1 µ1         ′    µ2  =  0 cos θ senθ   µ2  o µ~′ = Ãθ ~µ (7.128)           µ3 0 −senθ cos θ µ′3   ′    µ1 cos ψ senψ 0 x1            x2  =  −senψ cos ψ 0   µ′2  o ~x = Ãψ µ ~′ (7.129)           µ′3 0 0 1 x3 2 Las ecuaciones (7.124) y (7.126) se obtienen al comparar los elementos de (7.122) y (7.138). 226 / Mecánica clásica avanzada De modo que ~x puede obtenerse de ~x a través de: ~x = Ãψ Ãθ Ãφ ~x = Ã~x (7.130) Ası́ que: Ã = Ãψ Ãθ Ãφ (7.131) Al hacer el producto de matrices se llega al resultado para la matriz Ã dado por (7.122). Definiciones alternas de los ángulos de Euler. La convención usada en mecánica cuántica en los textos de teorı́a de grupos de Wigner, y de momentos angulares de Rose, es diferente a la presentada anteriormente. Allı́ la segunda rotación es tomada no alrededor del eje intermedio µ1 sino alrededor de µ2 . Es la llamada “convención y” que obviamente dará lugar a expresiones diferentes para la matriz Ã. Es fácilmente demostrable que para obtener la matriz Ã en la convención “y” a partir de la matriz Ã en la convención “x” bastan las sustituciones: π φ →φ+ 2 (7.132) π ψ →ψ− 2 donde se entenderá a φ como el ángulo de la primera rotación y a ψ como el ángulo de la tercera rotación, con lo cual: senφ → cos φ cos φ → −senφ senψ → − cos ψ (7.133) cos ψ → senψ Se propone como ejercicio probar estas afirmaciones. Otra convención es la llamada convención “xyz”, usada en aeronáutica: la primera rotación es por ángulo φ alrededor de x3 , la segunda por ángulo θ alrededor de x2 y la tercera por ángulo ψ alrededor de x1 . Es la llamada secuencia 3 2 1. Por ejemplo, tomando los ejes de coordenadas fijos a un avión de la siguiente manera: x3 perpendicular al avión en el centro de masa, x2 paralelo a las alas y x1 a lo largo del eje principal del avión, una posición arbitraria de la nave se puede obtener a partir de la posición en que los ejes (x) coinciden con los ejes (x) por medio de la siguiente secuencia de rotaciones: una alrededor de x3 por ángulo φ, otra alrededor de x2 por ángulo θ y la tercera alrededor de x1 por un ángulo ψ. 7.7. Descripción de las rotaciones en términos de n̂ y Φ. Parámetros de Euler Hemos mostrado que los desplazamientos de un cuerpo rı́gido con un punto fijo se pueden expresar por medio de rotaciones. Cada rotación puede especificarse por tres Cinemática del cuerpo rı́gido / 227 parámetros independientes que pueden ser por ejemplo tres cosenos directores independientes, tres ángulos de Euler, o un eje de rotación y un ángulo. Vimos que las rotaciones constituyen un grupo matemático que tiene una representación obvia en términos de matrices 3 × 3 ortogonales (hay un homomorfismo entre las rotaciones fı́sicas y las matrices ortogonales 3 × 3). Queremos buscar una representación de la transformación de coordenadas en términos de los parámetros de una rotación: dos cosenos directores del eje de rotación y el ángulo de rotación. Formas “activa” y “pasiva” de una rotación. Hasta ahora hemos considerado que la matriz Ã rota los ejes coordenados, de modo que la ecuación ~r = Ã~r simplemente expresa cómo están relacionadas las componentes de un vector vistas respecto a dos diferentes sistemas de coordenadas: Ã actúa sobre el sistema de coordenadas dejando los vectores inalterados. Hay además la siguiente interpretación: Ã puede pensarse como un operador que actúa sobre los vectores ~r para cambiarlos por vectores diferentes ~r′ con respecto al mismo sistema de coordenadas. Por ejemplo, en dos dimensiones, en vez de rotar en el sentido contrario a las agujas del reloj al sistema de coordenadas por un ángulo φ, se puede rotar al vector ~r en el sentido del reloj por un ángulo φ para obtener el vector ~r′ (véase figura 7.7). Las componentes del nuevo vector, ~r′ , estarán entonces x2 x2 Pasiva: r = Ar r x1 r x2 Activa r ′ = Ar i r′ r i φ φ x1 x1 Figura 7.7 Formas activa y pasiva de una rotación relacionadas con las del viejo vector ~r, por medio de la ecuación ~r′ = Ã~r. En general Ã corresponde a una rotación en sentido contrario a las agujas del reloj por un ángulo φ cuando sea aplicada al sistema de coordenadas, y como una rotación en sentido de las agujas del reloj por un ángulo φ cuando sea aplicada a los vectores. Rotaciones finitas. Usaremos el punto de vista activo, según el cual en un sistema de coordenadas dado realizamos una rotación de un vector por un ángulo Φ alrededor de un eje n̂. Se trata de encontrar la matriz Ã que relaciona las componentes del viejo y del nuevo vector. De las figuras 7.8 y 7.9 se ve que: ~ + N~V + N~Q ~r′ = ON (7.134) donde los vectores tienen las siguientes expresiones en términos de ~r, n̂ y Φ, teniendo en 228 / Mecánica clásica avanzada N P V Φ Q r′ i r n O Figura 7.8 Rotación de un vector alrededor de un eje n̂. Vista lateral. N V Φ P r ×n Q Figura 7.9 Rotación de un vector alrededor de un eje n̂. Vista en dirección ~n. Cinemática del cuerpo rı́gido / 229 cuenta que N V = N Q cos Φ y V Q = N Q senΦ: ~ = ON (n̂ · ~r)n̂ N~Q = ~ ) cos Φ (~r − ON (7.135) V~Q = ~r × n̂ senΦ Con lo cual obtenemos: ~r′ = ~r cos Φ + n̂(n̂ · ~r)(1 − cos Φ) + ~r × n̂ senΦ (7.136) Esta fórmula es válida para cualquier rotación finita de un vector. Para Φ infinitesimal, dicha expresión toma la forma: ~r′ = ~r + ~r × n̂Φ (7.137) en concordancia con la fórmula (3.148). Escrita en forma de matriz, la ecuación (7.136) es:  ′ x1    ′ x2  =     x′3 (7.138)    x1 C1 C2 c + C3 senΦ C1 C3 c−C2 senΦ cos Φ+C12 c       2 C1 C2 c−C3 senΦ x2  c C C c+C senΦ cos Φ+C 2 3 1 2       x3 C1 C3 c+C2 senΦ C2 C3 c−C1 senΦ cos Φ+C32 c donde hemos llamado c = (1 − cos Φ). En (7.138) la matriz Ã depende de los cuatro parámetros no independientes C1 , C2 , C3 y Φ. Suele expresarse esta matriz en términos de los llamados parámetros de Euler, no independientes, e0 , e1 , e2 , e3 , definidos ası́: e0 = cos Φ 2 (7.139) Φ ei = Ci sen ; i = 1, 2, 3 2 En términos de estos parámetros (7.136) toma la forma: ~r′ = ~r(e20 − e21 − e22 − e23 ) + 2~e(~e · ~r) + 2(~r × ~e)e0 y la matriz Ã entonces será:  2 e0 + e21 − e22 − e23 2(e1 e2 + e0 e3 )   e20 − e21 + e22 − e23 Ã =   2(e1 e2 − e0 e3 )  2(e1 e3 + e0 e3 ) 2(e2 e3 − e0 e1 ) 2(e1 e3 − e0 e2 ) 2(e2 e3 + e0 e1 ) e20 − e21 − e22 + e23 (7.140)       (7.141) 230 / Mecánica clásica avanzada Usando las ecuaciones (7.124), (7.126) y (7.139) se obtienen las siguientes relaciones entre los parámetros de Euler y los ángulos de Euler: e0 = cos θ φ+ψ cos 2 2 e1 = sen φ−ψ θ cos 2 2 e2 = θ φ−ψ sen sen 2 2 e3 = cos (7.142) φ+ψ θ sen 2 2 Los parámetros y los ángulos de Euler fueron hallados por Euler en 1776, quien llamó ei a los parámetros simétricos. 7.8. Representación del grupo de rotaciones por medio de matrices 2 × 2. Los parámetros de Cayley-Klein Representación de un grupo. En el numeral 7.5 hemos mencionado que el conjunto de todos los desplazamientos de un cuerpo rı́gido con un punto fijo satisface los axiomas de un grupo matemático: (i) Dos desplazamientos sucesivos cualesquiera del cuerpo equivalen a un desplazamiento; (ii) Existe el desplazamiento identidad que consiste en no desplazar el cuerpo; (iii) Para todo desplazamiento existe el desplazamiento inverso o sea aquel que retorne el cuerpo a su posición original; (iv) Los desplazamientos sucesivos del cuerpo rı́gido satisfacen la propiedad asociativa. El conjunto de todas las matrices ortogonales 3 × 3 constituyen una representación del grupo de los desplazamientos de un rotador rı́gido en el sentido de que a cada desplazamiento del rotador se le puede asociar una matriz ortogonal 3 × 3 y sólo una. Se dice entonces que hay un homomorfismo entre el grupo de los desplazamientos del rotador rı́gido y el grupo de las matrices ortogonales 3×3. El grupo de matrices ortogonales 3×3 es llamado el grupo O(3). El grupo de las matrices ortogonales 3 × 3 con determinante +1, que en rigor es el que corresponde a los desplazamientos de un rotador rı́gido, se llama el grupo SO(3). Vectores y diádicos en un espacio bidimensional. En un espacio bidimensional, un vector arbitrario V~ puede expresarse en términos de los vectores unitarios ~e1 , e~2 : ~ = V1~e1 + V2~e2 . V ~ y ~ei pueden representarse por matrices 2 × 1: V  V~ →  V1 V2    ~e1 →  1 0    ~e2 →  0 1   (7.143) Cinemática del cuerpo rı́gido / 231 Podemos definir las dı́adas unitarias ~e1~e1 , ~e1~e2 , ~e2~e1 y ~e2~e2 , que pueden representarse por matrices 2 × 2:     1 0 0 1  ~e1~e2 →   ~e1~e1 →  0 0 0 0 (7.144)     0 0 0 0  ~e2~e2 →   ~e2~e1 →  1 0 0 1 En una dı́ada unitaria el primer vector se representa por una matriz columna y el segundo por una matriz fila. Por ejemplo:     1 0 1  ~e1~e2 →   (0 1) =  (7.145) 0 0 0 Nótese que:  0 ~e1 ∧ ~e2 = ~e1~e2 − ~e2~e1 =   1  −1 0 ~~ Un diádico D puede expresarse en términos de las dı́adas unitarias: ~~ D = D11~e1~e1 + D12~e1~e2 + D21~e2~e1 + D22~e2~e2 y puede representarse por medio de una matriz 2 × 2:   D11 D12 ~~  D → D21 D22 ~1, es: El diádico unidad, ~  ~ ~1 = ~e1~e1 + ~e2~e2 →  1 0 0 1 Se definen los diádicos ~ ~σ x , ~ ~σ y y  0 ~ ~σ x = ~e1~e2 + ~e2~e1 →  1  ~ ~σ y = −i~e1~e2 + i~e2~e1 →   ~ ~σ z = ~e1~e1 − ~e2~e2 →  1   (7.146) (7.147) (7.148) (7.149) ~~σ z de la siguiente manera:  1  = σ̃x 0 0 −i i 0 0 0 −1   = σ̃y   = σ̃z (7.150) 232 / Mecánica clásica avanzada Las dı́adas unitarias pueden expresarse en términos de ~~σ i y ~~1: ~e1~e1 = 1 ~ (~1 + ~~σ z ) ; 2 ~e1~e2 = 1 ~e2~e1 = (~ ~σ x − i~~σ y ) ; 2 1 ~ (~σ x + i~~σ y ) 2 1 ~ ~e2~e2 = (~1 − i~~σ z ) 2 (7.151) ~ Un diádico arbitrario puede igualmente expresarse en términos de ~1 y ~~σ i : 1 ~~ ~1 + 1 (V11 − V22 )~~σ z + 1 (V12 + V21 )~~σ x + i (V12 − V21 )~~σ y D = (V11 + V22 )~ 2 2 2 2 (7.152) O sea que cualquier diádico de traza cero puede expresarse en términos de ~~σ x , ~~σ y , ~ ~ ~ a cualquier diádico de traza cero: ~σ z . Llamaremos V ~ ~~σ y ~~σ z ~σ x ~ ~ = Vx √ V + Vy √ + Vz √ 2 2 2 (7.153) Existe un isomorfismo entre los diádicos bidimensionales de traza cero y los vectores ~ . En efecto, el conjunto de todos los diádicos bidimensionales de traza cero ordinarios V satisface las mismas propiedades que el conjunto de todos los vectores ordinarios: (i) La suma de dos diádicos de traza cero es un diádico de traza cero, la suma es conmutativa; (ii) El producto de un número por un diádico de traza cero es un diádico de traza cero; (iii) La suma de diádicos es asociativa; (iv) Existe el diádico cero. Además, si se define el producto escalar de dos diádicos como: ~ ~ ~ = V ⋆ W11 + V ⋆ W12 + V ⋆ W21 + V ⋆ W22 ~ : W V 11 12 21 22 (7.154) Vemos que este producto escalar satisface las mismas propiedades del producto escalar de vectores. Para ello es suficiente mostrar que: ~ ~σ i : ~ ~σ j = 2δij ; i, j = x, y, z (7.155) lo cual es evidente de las ecuaciones (7.150) y (7.154). En resumen, a cada diádico de traza cero de la forma (7.153) se le puede hacer corresponder el vector ordinario: ~ = Vx~e1 + Vy ~e2 + Vz ~e3 V (7.156) Homomorfismo entre las rotaciones en el espacio bidimensional y las ~ es rotado para convertirse en V ~ ′: rotaciones en el espacio ordinario. Si el vector V ~ ′ = ÃV ~ V (7.157) donde Ã es la matriz de rotación 3 × 3, el diádico correspondiente en el espacio bidimensional deberá presentar una transformación correspondiente en virtud del mencionado homomorfismo. Como: Vi′ = 3 X j=1 aij Vj (7.158) Cinemática del cuerpo rı́gido / 233 ~′ entonces V~ será: 3 3 1 ~ ′ XX ~σ i aij Vj √ ~ V~ = 2 i=1 j=1 (7.159) Por otra parte, una transformación de un diádico es de la forma: ~ ′ ~~ ~ ~~ † ~ ·Q V~ = Q ·V (7.160) ~~ † ~~ donde Q es el adjunto de Q: † ~~ Q = Q⋆11 ê1 ê1 + Q⋆21 ê1 ê2 + Q⋆12 ê2 ê1 + Q⋆22 ê2 ê2 ′ ~ ~ es: Explı́citamente V     2 2 X X ~′ =  Qij êi êj  ·  V Vkl êk êl  · i,j=1 2 X k,l=1 2 X Q⋆mn ên êm m,n=1 (7.161) ! (7.162) (Q̃Ṽ Q̃† )im êi êm i,m=1 ~′ Por otra parte V~ está dado por (7.159). Por tanto, según (7.152) y (7.153): 3 i 1 h Q̃Ṽ Q̃† + Q̃Ṽ Q̃† 2 12 21 3 i i h Q̃Ṽ Q̃† − Q̃Ṽ Q̃† 2 12 21 1 X √ a1j Vj = 2 j=1 1 X √ a2j Vj = 2 j=1 3 1 X √ a3j Vj = 2 j=1 (7.163) i 1 h − Q̃Ṽ Q̃† Q̃Ṽ Q̃† 2 22 11 ~~ Estas ecuaciones nos permiten relacionar Ã con Q̃. El diádico Q en (7.160) debe ser unitario: ~~ † ~~ ~~ ~~ † Q ·Q=1=Q ·Q (7.164) ~~ Si llamamos α, β, γ y δ las componentes de Q: ~~ Q = αê1 ê1 + βê1 ê2 + γê2 ê1 + δê2 ê2 (7.165) 234 / Mecánica clásica avanzada ~~ † ~~ Q .Q = (α⋆ ê1 ê1 + γ ⋆ ê1 ê2 + β ⋆ ê2 ê1 + δ ⋆ ê2 ê2 )· (αê1 ê1 + βê1 ê2 + γê2 ê1 + δê2 ê2 ) (|α|2 + |γ|2 )ê1 ê1 + (α⋆ β + γ ⋆ δ)ê1 ê2 = (7.166) +(β ⋆ α + δ ⋆ γ)ê2 ê1 + (|β|2 + |δ|2 )ê2 ê2 ê1 ê1 + ê2 ê2 + ê3 ê3 = ~~1 = Con lo cual obtenemos: |α|2 + |γ|2 = 1 α⋆ β + γ ⋆ δ = 0 (7.167) |β|2 + |δ|2 = 1 Las ecuaciones (7.167) representan cuatro condiciones sobre los elementos α, β, γ y δ, que por ser complejos contienen ocho parámetros. Las relaciones (7.167) dejan 8−4 = 4 parámetros independientes. Si además se impone la condición de que el determinante de Q̃ sea +1, obtenemos: αδ − βγ = 1 ⇒ β = −γ ⋆ ; δ = α⋆ ; αα⋆ + ββ ⋆ = 1 (7.168) Con lo cual quedan sólo tres parámetros independientes de los ocho que contiene Q̃. Entenderemos pues, que en (7.165) α, β, γ y δ satisfacen las condiciones de unitaridad (7.167) y de unimodularidad (7.168). En (7.163) se requiere conocer la matriz Q̃Ṽ Q̃† . Esto es:  Q̃Ṽ Q̃† =  = α β γ δ   V11 V12 V21 V22   α⋆ γ⋆ β⋆ δ⋆   |α|2 V11 +|β|2 V22 +α⋆ βV21 +αβ ⋆ V12 γ ⋆ αV11 +γ ⋆ βV21 +δ⋆ αV12 +βδ⋆ V22 α⋆ γV11 +α⋆ δV21 +β ⋆ γV12 +β ⋆ δV22 |γ|2 V11 +|δ|2 V22 +γ ⋆ δV21 +δ⋆ γV12 ! (7.169) Cinemática del cuerpo rı́gido / 235 De (7.163) y (7.169) obtenemos las siguientes relaciones: 3 √ X a1j Vj = (γ ⋆ α + α⋆ γ)V11 + (γ ⋆ β + α⋆ δ)V21 2 j=1 +(δ ⋆ α + β ⋆ γ)V12 + (βδ ⋆ + β ⋆ δ)V22 3 √ X a2j Vj = i(γ ⋆ α − α⋆ γ)V11 + i(γ ⋆ β − α⋆ δ)V21 2 j=1 (7.170) +i(δ ⋆ α − β ⋆ γ)V12 + i(βδ ⋆ − β ⋆ δ)V22 3 √ X a3j Vj = (|α|2 − |γ|2 )V11 + (|β|2 − |δ|2 )V22 2 j=1 +(α⋆ β − γ ⋆ δ)V21 + (αβ ⋆ − δ ⋆ γ)V12 Como por otra parte: V1 = 1 √ (V12 + V21 ) 2 V1 = i √ (V12 − V21 ) 2 V1 = 1 √ (V11 + V22 ) 2 (7.171) Obtenemos usando (7.170) y (7.171) las siguentes relaciones entre las componentes de Ã y las de Q̃, igualando coeficientes de los Vij : a13 = γ ⋆ α + α⋆ γ (a11 + ia13 ) = δ⋆α + β ⋆γ a23 = i(γ ⋆ α − α⋆ γ) (a21 + ia22 ) = i(δ ⋆ α − β ⋆ γ) a33 = |α|2 − |γ|2 (a31 + ia32 ) = αβ ⋆ − δ ⋆ γ (7.172) 236 / Mecánica clásica avanzada Con lo cual la matriz Ã toma la forma:  1 i 2 (α2 − γ 2 + δ 2 − β 2 ) (γ − α2 + δ 2 − β 2 ) γδ − αβ  2 2   1 2 i Ã =   (α2 + γ 2 − β 2 − δ 2 ) (α + γ 2 + β 2 + δ 2 ) −i(αβ + γδ)  2 2  βδ − αγ i(αγ + βδ) αδ + βγ         (7.173) donde hemos usado además las relaciones α⋆ = δ, γ ⋆ = −β de la ecuación (7.168). Ã es una matriz que está expresada en términos de α, β, γ, δ, o sea que los parámetros α, β, γ, δ, sirven para especificar las rotaciones de un cuerpo rı́gido. Son llamados los parámetros de Cayley-Klein, estudiados por estos autores en los años 1875-1879. En resumen, hemos mostrado que si al efectuar una rotación un vector V~ ′ se cambia ~ ′ = ÃV ~ , entonces el diádico V~~ en el espacio bidimensional que corresponde en el vector V ~ ′ ~~ ~~ ~~ † V ·Q . Por tanto, a cada rotación del cuerpo rı́gido a V~ se transforma en el diádico V~ = Q· ˜ y le corresponde una matriz Ã y una matriz Q̃ 2 × 2. La matriz Q̃ es unitaria, Q̃Q̃† = I, unimodular, det Q̃ = 1. El conjunto de todas las matrices unitarias y unimodulares 2 × 2 es llamado el grupo SU (2). Hay pues un homomorfismo entre los grupos SO(3) y SU (2). Si en (7.173) se hacen las siguientes sustituciones de los parámetros de Cayley-Klein en términos de e0 , e1 , e2 y e3 : α = e0 + ie3 ; γ = −β ⋆ β = e2 + ie1 ; (7.174) δ = α⋆ Se obtiene exactamente la matriz (7.141), o sea que en efecto e0 y ei son los parámetros de Euler definidos en (7.142). Usando (7.174) y las expresiones para e0 y ei en términos de los ángulos de Euler, ecuación (7.142), obtenemos para α, β, γ y δ en términos de los ángulos de Euler: α = ei(φ+ψ)/2 cos θ ; 2 β = iei(ψ−φ)/2 sen θ 2 (7.175) θ θ γ = ie−(ψ−φ)/2 sen ; δ = e−i(φ+ψ)/2 cos 2 2 ~~ El diádico Q definido en (7.166) puede escribirse en términos de los diádicos de ~ Pauli y el diádico unidad, ~~σ i , ~1, reemplazando (7.151) en (7.165): 1 i 1 ~~ ~ 1 Q = (α + δ)~1 + (α − δ)~~σ z + (β + γ)~~σ x + (β − γ)~~σ y 2 2 2 2 (7.176) que usando (7.174) toma la forma:3 ~~ ~1 + ie1~~σ x + ie2~~σ y + ie3~~σ z Q = e0~ 3 Los e0 , ei , forman un sistema de cuaterniones. (7.177) Cinemática del cuerpo rı́gido / 237 Para una rotación alrededor del eje x1 , de acuerdo con (7.142) se tiene que e1 = senθ/2, e2 = e3 = 0. Por tanto: θ~ ~~ ~1 + i sen θ ~ ~σ x Q θ = cos 2 2 (7.178) donde θ es el ángulo de rotación. Para una rotación por φ alrededor del eje x3 : φ~ ~~ ~1 + i sen φ ~ Q ~σ z φ = cos 2 2 (7.179) Cada diádico de Pauli ~ ~σ i está asociado con una rotación alrededor de un eje particular y puede considerarse como el “rotador unitario” para dicho eje. Ejemplo 7.8.1 Mostrar que los diádicos de Pauli anticonmutan mutuamente, esto es, que: ~ ~σ i · ~ ~σ j = −~ ~σ j · ~ ~σ i (7.180) Hagamos los nueve productos ~~σ i · ~~σ j , usando las definiciones (7.150): ~ ~ ~σ x · ~ ~σ x = ê1 ê1 + ê2 ê2 = ~1 ; ~~σ x · ~~σ y = iê1 ê1 − iê2 ê2 = i~~σ z ~ ~σ x · ~ ~σ z = −ê1 ê2 + ê2 ê1 = −i~~σy ; ~~σ y · ~~σ x = −iê1 ê1 + iê2 ê2 = −i~~σ z ~ ~1 ; ~σ y · ~ ~σ y = ê1 ê1 + ê2 ê2 = ~ ~~σ y · ~~σ z = iê1 ê2 + iê2 ê1 = i~~σ x ~ ~σ z · ~ ~σ x = ê1 ê2 − ê2 ê1 = i~ ~σ y ; ~~σ z · ~~σ y = −iê1 ê2 − iê2 ê1 = −i~~σx (7.181) ~ ~1 ~σ z · ~ ~σ z = ê1 ê1 + ê2 ê2 = ~ Las ecuaciones (7.181) se pueden escribir en forma compacta ası́: ~ ~1δij + i ~σ i · ~ ~σ j = ~ 3 X ǫijk ~ ~σ k (7.182) k=1 donde ǫij es el tensor de Levi-Civita completamente antisimétrico. Se puede ver directamente que las ~ ~σ i obedecen las relaciones de conmutación siguientes: ~ ~σ i · ~ ~σ j − ~ ~σ j · ~ ~σ i = 2i 3 X ǫijk ~~σ k (7.183) k=1 y de anticonmutación: ~ ~1δij ~σ i = 2~ ~σ j · ~ ~σ j + ~ ~σ i · ~ ~~ Ejemplo 7.8.2 Mostrar que Q θ puede escribirse simbólicamente como: (7.184) 238 / Mecánica clásica avanzada ~~ i~ ~ σx (θ/2) Q θ = e (7.185) 2 donde el exponencial denota una serie infinita de términos. Como según (7.181) ~~σ x ≡ 2n 2n+1 ~ ~ ~ ~σ x · ~ ~σ x = ~1, se sigue que ~~σ = ~1 y que ~~σ = ~~σ x para n = 0, 1, 2, ... Por lo tanto: x x θ ≡ cos ~ ~σ x 2 2n 1 θ ~~σ x θ (−1)n = ~~1 cos (2n)! 2 2 n=0 θ ~ sen ~σ x ≡ 2 2n+1 1 θ θ n ~ (−1) = ~~σ x sen ~σ x (2n + 1)! 2 2 n=0 ∞ X ∞ X (7.186) ~~ Con lo cual Q θ puede expresarse en la forma: θ θ θ θ ~ ~~ ~ ~ + +i~~σ x sen = cos(~~σ x ) + i sen(~~σ x ) = ei~σ x (θ/2) Q θ = 1 cos 2 2 2 2 (7.187) † Como ~ ~σ i son hermı́ticos, ~~σ i = ~~σ i , se sigue que: ~~ † −i~ ~ σx (θ/2) Q θ = e (7.188) Ejemplo 7.8.3 Hallar la forma de la matriz de rotación para una rotación arbitraria, definida por los ángulos de Euler. ~~ Q puede escribirse como el producto de tres rotaciones sucesivas, en virtud del homomorfismo con el grupo de rotaciones: ~ ~ ~ ~~ † Q = ei~σz (ψ/2) ei~σ µ1 (θ/2) ei~σ z (φ/2) (7.189) ~~ Las tres rotaciones que aparecen en Q son alrededor de los ejes z, µ1 y z. Es deseable expresarlas en términos de rotaciones alrededor de ejes del mismo sistema de coordenadas. Para ello hay que notar que cada uno de los diádicos que aparece en el operador de rotación está asociado con el respectivo eje de rotación. Como el eje x conduce al eje µ1 por medio de la rotación Aφ , correspondientemente ~ ~σ µ1 será, de acuerdo con la ecuación (7.160): ~ ~ ~ ~σ µ1 = ei~σ z (θ/2)~~σ x · e−i~σz (θ/2) (7.190) Como por otra parte: ~1 cos ei~σµ1 (θ/2) = ~ ~ θ θ + i~~σ µ1 sen 2 2 (7.191) ~~ Se sigue, usando la ecuación (7.190) y la unitariedad Q φ: ~ ~ ~ ~ ei~σµ1 (θ/2) = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (φ/2) (7.192) Cinemática del cuerpo rı́gido / 239 ~~ Por tanto Q toma la foma: ~ ~ ~ ~~ Q = ei~σz (ψ/2) ei~σ z (φ/2) ei~σ x (θ/2) (7.193) Por otra parte, el eje z se obtiene del eje µ′3 por medio de la rotación Aψ , y µ′1 se obtiene de µ3 = z por medio de Ãθ . Por lo tanto ~~σ z puede escribirse en términos de ~~σ z como: ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) ei~σ µ1 (θ/2)~ ~σ z e−i~σµ1 (θ/2) e−i~σz (ψ/2) (7.194) Usando (7.192): ~ ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · e−i~σz (φ/2) · σz .ei~σ z (φ/2) · e −i~ ~ σ x (θ/2) ·e −i~ ~ σ z (φ/2) ·e (7.195) −i~ ~ σ z (ψ/2) ~~ ~~ Notando que ~ ~σ z y Q φ conmutan y que Qφ es unitario: ~ ~ ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σx (θ/2) · σz · e−i~σ x (θ/2) · e−i~σz (φ/2) · e−i~σ z (ψ/2) (7.196) Se sigue entonces que: ~ ~ ei~σ z (ψ/2) = ~ ~ ~ ~ ei~σz (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σ z (ψ/2) · e−i~σ x (θ/2) · ~ (7.197) ~ e−i~σz (φ/2) · e−i~σz (ψ/2) O sea: ~ ~ ~ ~ ~ ~ ei~σ z (ψ/2) = ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σz (ψ/2) · e−i~σx (θ/2) · e−i~σz (φ/2) (7.198) ~~ Reemplazando (7.198) en (7.193) obtenemos para Q: ~ ~ ~ ~ ~ ~ ~ ~~ Q = ei~σz (φ/2) ·ei~σ x (θ/2) ·ei~σ z (ψ/2) ·e−i~σ x (θ/2) ·e−i~σ z (φ/2) ·ei~σ z (φ/2) ·ei~σ x (θ/2) (7.199) ~~ Con lo cual, usando la unitaridad de los operadores, se obtiene finalmente para Q: ~ ~ ~ ~~ Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2) (7.200) ~~ Hemos conseguido expresar a Q en términos de rotaciones alrededor de los ejes ~~ del sistema de coordenadas espacial. Es posible, de manera análoga, expresar a Q en ~~ términos de rotaciones respecto a los ejes fijos al cuerpo rı́gido Q de donde toma la forma: ~ ~ ~ ~~ Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2) (7.201) Ejercicio 7.8.1 Demostrar que si (e0 , ei ) y (e′0 , e′i ) son los parámetros de Euler que describen dos rotaciones A y A′ , entonces los parámetros de la rotación A” = A′ A están expresados en términos de los parámetros de las rotaciones A, A′ , por: 240 / Mecánica clásica avanzada e′1 ′ = e1 e′0 + e2 e′3 − e3 e′2 + e0 e′1 e′2 ′ = −e1 e′3 + e2 e′0 + e3 e′1 + e0 e′2 (7.202) e′3 ′ = e1 e′2 − e2 e′1 + e3 e′0 + e0 e′3 e′0 ′ = e0 e′0 − e1 e′1 − e2 e′2 − e3 e′3 Ejercicio 7.8.2 Demostrar que si (α, β, γ, δ) y (α′ , β ′ , γ ′ , δ ′ ) son los parámetros de CayleyKlein que describen dos rotaciones A y A′ , entonces los parámetros (α′′ , β ′′ , γ ′′ , δ ′′ ) de la rotación A′′ = A′ A están expresados en términos de los parámetros de A, A′ , por: α′′ = αα′ + γ ′ β β” = αβ ′ + βδ ′ γ ′′ = γα′ + δ ′ γ δ” = γβ ′ + δδ ′ (7.203) Ejercicio 7.8.3 Interpretación geométrica del homomorfismo entre SO(3) y SU (2). Sea una esfera y una figura geométrica F en ella (véase figura 7.10). Se coloca la esfera sobre un plano. La normal al plano en el punto de contacto corta a la esfera en el punto T . La proyección estereográfica de F en el plano es P . Al punto T se le llama vértice de la proyección. T n F P Figura 7.10 Figura geométrica F dentro de una esfera Al rotar la esfera alrededor de n̂, en la figura, F se cambia en F ′ y su proyección estereográfica P se cambia en P ′ . Entonces a cada rotación de la esfera le corresponde cierta transformación en el plano, llamada transformación homográfica. Estas transformaciones cambian cı́rculos en el plano por cı́rculos en el plano. Sea z = x + iy un punto del plano y z ′ = x′ + iy ′ el punto del plano que se obtiene de z mediante la transformación homográfica. (a) Mostrar que: z′ = az + b cz + d (7.204) Cinemática del cuerpo rı́gido / 241 donde a, b, c y d son constantes reales o complejas. (b) Mostrar que el resultado de dos homografı́as sucesivas: z′ = α′ z + β ′ γ ′z + δ′ y z ′′ = α′′ z ′ + β ′′ γ ′′ z ′ + δ ′′ (7.205) Es una homografı́a: z ′′′ = α′′′ Z + β ′′′ γ ′′′ Z + δ ′′′ (7.206) donde la relación entre (α′′′ , β ′′′ , γ ′′′ , δ ′′′ ) con (α′ , β ′ , γ ′ , δ ′ ) y (α′′ , β ′′ , γ ′′ , δ ′′ ) está dada por expresiones análogas a (7.203). Argumentar que lo anterior muestra cone~~ xión entre las rotaciones y las transformaciones homográficas, y que por tanto las Q del grupo SU (2) corresponden a transformaciones homográficas, donde los parámetros de Cayley-Klein son los parámetros que caracterizan la transformación homográfica correspondiente a una rotación de un sólido rı́gido (véase el texto de L.V. Ahlfors, Análisis de variable compleja, Aguilar, 1966). 7.9. Las rotaciones infinitesimales. Cinemática de las rotaciones Las coordenadas rı́gidamente unidas al cuerpo rı́gido permiten representar cualquier punto del mismo ~r = (x1 , x2 , x3 ). La rigidez del cuerpo se puede expresar diciendo que ningún punto se puede desplazar con relación al origen. Es decir: ~r˙ = 0 (7.207) Los desplazamientos del cuerpo son detectables en el sistema de coordenadas espacial relacionado con el del cuerpo rı́gido por medio de la matriz de rotación ÃT , ~r = ÃT ~r. Como el cuerpo rı́gido se desplaza respecto al sistema de coordenadas espacial, ÃT habrá de ser función del tiempo, con lo cual: ~r(t) = ÃT (t)~r (7.208) Es posible escoger los sistemas de coordenadas de modo que ~r(0) = ~r, lo cual implica que: ÃT (0) = I˜ (7.209) Podemos decir que el cuerpo rı́gido en el tiempo t estará descrito por la transformación ÃT (t) que evoluciona de manera continua a partir de la transformación identidad. Además es posible suponer que para un tiempo infinitesimal, ÃT (∆t) difiere de la identidad I˜ por términos del orden de ∆t. 242 / Mecánica clásica avanzada Rotaciones infinitesimales. Al cabo de un tiempo infinitesimal ∆t, un punto del cuerpo se habrá desplazado una cantidad infinitesimal ∆~r = ~r(∆t) − ~r(0) = ~r(∆t) − ~r0 , respecto a los ejes espaciales. Por lo tanto: ~r(∆t) = ~r0 + ∆~r (7.210) Existe alguna matriz, con componentes infinitesimales, ǫ̃(∆t), tal que: ∆~r = ǫ̃(∆t)~r0 (7.211) Por lo cual: ~r(∆t) = (I˜ + ǫ̃)~r0 = (I˜ + ǫ̃)~r(0) (7.212) La matriz I˜ + ǫ̃ describe cómo están relacionadas las componentes del vector de posición de un punto del cuerpo rı́gido en los sistemas de coordenadas espacial y del cuerpo rı́gido, según la interpretación pasiva de la matriz de rotación cuando los ejes fijos al cuerpo rı́gido han rotado alrededor de un eje n̂ un ángulo δΦ en el sentido de la mano derecha. Desde el punto de vista activo, I˜ + ǫ̃ describe cómo cambia el vector de posición de un punto del cuerpo rı́gido, en el sistema de coordenadas espacial, cuando se rota el cuerpo rı́gido alrededor del eje n̂ por un ángulo δΦ según la regla de la mano izquierda. De acuerdo con esta última interpretación, para Φ infinitesimal, Ã = I˜ + ǫ̃ estará dada por la ecuación (7.138):   1 C3 δΦ −C2 δΦ      −C δΦ 1 C δΦ I˜ + ǫ̃ =  (7.213) 3 1     C2 δΦ −C1 δΦ 1 donde C1 , C2 y C3 son los cosenos directores del eje de rotación. De acuerdo con (7.210), (7.137) y (7.211), podemos escribir: ∆~r = ǫ̃~r0 = (~r0 × n̂)δΦ = −(n̂δΦ) × ~r0 (7.214) Usando el tensor de Levi-Civita para expresar el producto vectorial: 3 X ǫij x0j = 3 X 3 X ǫijk x0j Ck δΦ (7.215) j=1 k=1 j=1 Como ~r0 es arbitrario, se debe cumplir: ǫij = 3 X ǫijk Ck δΦ (7.216) k=1 Es decir, la matriz ǫ̃ es completamente antisimétrica: ǫ̃T = −ǫ̃ y proporcional a δΦ. Las rotaciones infinitesimales próximas a la identidad tienen la propiedad conmutativa: (I˜ + ǫ̃a )(I˜ + ǫ̃b ) = I˜ + ǫ̃a + ǫ̃b + ǫ̃a ǫ̃b (I˜ + ǫ̃b )(I˜ + ǫ̃a ) = I˜ + ǫ̃b + ǫ̃a + ǫ̃b ǫ̃a (7.217) Cinemática del cuerpo rı́gido / 243 Vemos que al primer orden en la cantidad infinitesimal δΦ las rotaciones conmutan. En general dos rotaciones finitas no conmutan. Tampoco conmuta una rotación finita con una infinitesimal: Ã(I˜ + ǫ̃) = Ã + Ãǫ̃ (I˜ + ǫ̃)Ã = Ã + ǫ̃Ã (7.218) La rotación inversa a I˜ + ǫ̃ es I˜ − ǫ̃, al primer orden en δΦ: (I˜ + ǫ̃)(I˜ − ǫ̃) = I˜ − ǫ̃2 (7.219) O sea que: ~r0 = (I˜ − ǫ̃)~r (7.220) Por tanto al primer orden en δΦ, ǫ̃~r = ǫ̃~r0 = ∆~r. Generadores infinitesimales del grupo de rotaciones. La matriz ǫ̃ puede escribirse en la forma siguiente, según (7.213):     0 0 −1 0 0 0          δΦ + C2  0 0 0  δΦ 0 0 1 ǫ̃ = C1          1 0 0 0 −1 0 (7.221)   0 1 0      δΦ −1 0 0 +C3      0 0 0 o también: ǫ̃ = 3 X i=1 Ci G̃i δΦ = (C1 ê2 ∧ ê3 + C2 ê3 ∧ ê1 + C3 ê1 ∧ ê2 )δΦ (7.222) Las matrices G̃i se llaman los generadores infinitesimales del grupo de rotaciones. Satisfacen: 1 ~~ G i = ǫijk êj ∧ êk 2 (7.223) El conmutador de dos generadores obedece la siguiente propiedad: G̃i G̃j − G̃j G̃i = 3 X k=1 ǫijk G̃k (7.224) 244 / Mecánica clásica avanzada Las ecuaciones (7.224) definen el álgebra de Lie del grupo de rotaciones. Con esta notación podemos escribir a (7.214) como: 3 X d~r Ci G̃i ~r = dΦ i=1 (7.225) Estas fórmulas, como hemos dicho, están dentro de la interpretación activa de las rotaciones. Velocidad angular. Se define el vector velocidad angular como: d~r dΦ ⇒ = −~ω × ~r (7.226) dt dt El vector ~ ω está situado en el eje de la rotación. Esta dirección se conoce como eje instantáneo de rotación: el eje n̂ no cambia al realizar la rotación infinitesimal por un ángulo dΦ. Sin embargo el desplazamiento del cuerpo rı́gido puede involucrar el cambio del eje n̂. Por esta razón ~ω no es en general la derivada temporal de algún vector; en otras palabras, Ci dΦ no es el diferencial de alguna cantidad, a no ser que los Ci no cambien con el tiempo. ω = n̂ ~ Cálculo de d~r/dt cuando n̂ también cambia con el tiempo. En este caso partimos directamente de la expresión: ~r(t) = Ã(t)~r0 (7.227) donde de la matriz Ã convierte al vector ~r0 en el vector ~r. El vector ~r˙ estará dado por: ˙ r = Ã ˙ ÃT ~r ~r˙ = Ã~ 0 (7.228) Por otra parte, ~r0 = ÃT ~r nos da: ˙ T ~r = −ÃÃ ˙ T ~r ˙ T ~r + ÃT ~r˙ ⇒ ~r˙ = −(ÃT )−1 Ã 0 = Ã (7.229) Definimos la matriz Ω̃ ası́: ˙ T = Ã ˙ ÃT Ω̃ = −ÃÃ (7.230) De (7.228) y (7.229) vemos que ~r = Ω̃~r0 . Además: ˙ T = −(Ã ˙ ÃT )T = −Ω̃ Ω̃ = −ÃÃ (7.231) Por tanto Ω̃ es una matriz antisimétrica. Sus elementos son entonces de la forma: Ωij = 3 X ǫijk ωk (7.232) k=1 Entonces (7.228) se puede escribir como: ẋi = (Ω~r)i = 3 X 3 X j=1 k=1 ǫijk ωk xj = (~r × ~ω)i = −(~ω × ~r)i (7.233) Cinemática del cuerpo rı́gido / 245 Por tanto: ~r˙ = −~ ω × ~r (7.234) Podemos expresar a ωi en términos de las Ωij . Para ello multiplicamos (7.232) por ǫijl y sumamos sobre i, j: 3 3 X X ǫijl Ωij = 3 X 3 X ǫijl ǫijk ωk (7.235) i=1 k=1 i=1 j=1 Ahora usamos la siguiente propiedad de la densidad de Levi-Civita: 3 3 X X ǫijl ǫijk = 2δlk (7.236) i=1 j=1 con lo cual llegamos a: 3 ωl = 3 1 XX ǫijl Ωij 2 i=1 j=1 (7.237) Usando la definición de Ω̃, (7.230), obtenemos: 3 ωl = 3 3 1 XXX Ȧik Ajk ǫijl 2 i=1 j=1 (7.238) k=1 donde ~ ω es la velocidad angular de rotación del cuerpo rı́gido en el sistema de coordenadas espacial, de acuerdo con la interpretación activa de las rotaciones que estamos utilizando. La ecuación (7.238) permite hallar las componentes de ω en términos de la representación que se tenga de la matriz Ã. En términos de los parámetros Ci y Φ, usamos la expresión (7.138) para Ã. Notamos que los elementos de Ã son de la forma: Aij = δij cos Φ + Cj Ck (1 − cos Φ) + 3 X ǫjkl Cl senΦ (7.239) l=1 Con lo cual Ȧik es: Ȧik = −δik senΦ Φ̇ + 3 X d d [Ci Ck (1 − cos Φ)] + ǫjkm (Cm senΦ) dt dt m=1 (7.240) 246 / Mecánica clásica avanzada Como ATkj = Ajk , podemos escribir: 3 X k=1 Ȧik Ajk = −δik senΦ cos Φ Φ̇ + cos Φ 3 X ǫijm cos Φ m=1 Cj d [Ci Cj (1 − cos Φ)]+ dt d (Cm senΦ) − Ci Cj (1 − cos Φ)senΦ Φ̇+ dt d [Ci n̂(1 − cos Φ)] · n̂(1 − cos Φ)+ dt 3 X d ǫikm (Cm senΦ)Cj Ck (1 − cos Φ)− dt m=1 3 X ǫjil Cl sen2 Φ Φ̇ + l=1 3 X 3 X l=1 ǫjkl d [Ci Ck (1 − cos Φ)]Cl senΦ+ dt (δji δlm − δjm δli )Cl senΦ l,m=1 (7.241) d (Cm senΦ) dt P3 donde hemos usado la conocida propiedad del tensor de Levi-Civita, l=1 ǫkij ǫklm = δil δjm − δim δjl . Las ecuaciones (7.241) se simplifican notando que n̂.n̂˙ = 0 y n̂ × n̂ = 0 y P3 ~ ~ k=1 ǫijk Ai Bj = (A × B)k . Luego, al multiplicar por ǫikl y sumar sobre i y sobre j, notando además que ǫijk se anula cuando tiene subı́ndices repetidos, obtenemos finalmente para ~ ω: ω = n̂Φ̇ + n̂˙ × n̂(1 − cos Φ) + n̂˙ senΦ ~ (7.242) En términos de los parámetros de Euler, definidos en (7.139): ω = 2e0~e˙ − 2ė0~e + 2~e˙ × ~e ~ (7.243) Con la interpretación activa de las rotaciones, la velocidad angular que hemos obtenido nos permite hallar, por medio de (7.234), la forma en que cambia con el tiempo el vector de posición de un punto arbitrario del cuerpo rı́gido. La velocidad angular en la interpretación pasiva de las rotaciones. En esta interpretación, ~r(t) es el vector de posición de un punto en el sistema de coordenadas espacial, y ~r en el sistema de coordenadas del cuerpo rı́gido. En este caso: ~r(t) = ÃT (t)~r (7.244) y ~r˙ estará dado por: ~r˙ = Ω̃~r = −~ ω × ~r (7.245) Cinemática del cuerpo rı́gido / 247 ahora ~ ω es la velocidad angular de los ejes unidos al cuerpo rı́gido en el sistema de coordenadas espacial. El tratamiento es igual al anterior, con sólo reemplazar a Ã por ÃT : ˙ = Ã ˙ T Ã Ω̃ = −ÃT Ã (7.246) donde ÃT se obtiene de (7.138) con sólo reemplazar a Φ por −Φ. ~ω estará dada en términos de Ã por: 3 ωl = 3 3 1 XXX T Ȧik Akj ǫijl 2 i=1 j=1 (7.247) k=1 Se obtiene entonces que: ω ~ = −n̂Φ̇ + n̂˙ × n̂(1 − cos Φ) − n̂˙ senΦ (7.248) y en términos de los parámetros de Euler: ω ~ = −2ė0~e + 2e0~e˙ + 2~e˙ × ~e (7.249) ahora n̂ es el eje alrededor del cual giran los ejes coordenados unidos al cuerpo rı́gido, y Φ es el ángulo de rotación en el sentido de la regla de la mano derecha (contrario a las agujas del reloj). ~ ω puede también ser evaluada en términos de los ángulos de Euler. Para ello hay varias posibilidades de cálculo. (a) Considerar que ~ ω tiene componentes a lo largo de los ejes de las rotaciones sucesivas que definen los ángulos de Euler: ω ~ = φ̇êz + θ̇êµ1 + ψ̇êz (7.250) Obviamente (7.250) permite hallar a ω ~ respecto a los ejes espaciales (x, y, z) o respecto a los ejes rotantes (x, y, z). Para hallar a ~ω respecto a los ejes espaciales, basta expresar a ~eµ1 y êz en términos de (~ex , ~ey , ~ez ). Usando las expresiones (7.30), podemos escribir: êµ1 = (êµ1 · êx )êx + (êµ1 · êy )êy + (êµ1 · êz )êz = cos φ êx + senφ êy (7.251) êz = (êz · êx )êx + (êz · êy )êy + (êz · êz )êz = senθ senφ êx + senθ cos φêy + cos θêz donde en (7.251) hemos usado la ecuación (7.122). Las ecuaciones (7.251) permiten escribir a (7.250) en la forma: ω = (φ̇ + cos ψ̇)êz + (θ̇senθ − ψ̇ senψ cos φ)êy + ~ (θ̇ cos φ + ψ̇ senθ senφ)êx (7.252) 248 / Mecánica clásica avanzada De manera similar se obtiene para ~ω respecto a los ejes fijos al cuerpo rı́gido: ~ω = (ψ̇ + φ̇ cos θ)êz + (φ̇ senθ cos ψ − θ̇ senψ)êy (7.253) +(φ̇ senθ senψ + θ̇ cos ψ)êx (b) La otra posibilidad de cálculo consiste en usar la ecuación que define a Ω̃, (7.246). Ã se puede expresar como producto de tres rotaciones según (7.131). Por tanto: ˙ ˙ ˙ Ã Ã + Ã Ã Ω̃ = ÃTφ ÃTθ ÃTψ (Ã ψ θ Ãφ + Ãψ Ãθ Ãφ ) ψ θ φ (7.254) Usando la ortogonalidad de las matrices Ã: ˙ ˙ + ÃT ÃT Ã ˙ Ã + ÃT ÃT ÃT Ã Ω̃ = ÃTφ Ã φ θ φ θ ψ ψ Ãθ Ãφ φ θ φ (7.255) ˙ , ... Si llamamos Ω̃φ = ÃTφ Ã φ Ω̃ = Ω̃φ + ÃTφ Ω̃θ Ãφ + ÃTφ ÃTθ Ω̃φ Ãθ Ãφ Usando las definiciones (7.127) se llega fácilmente a:     0 0 0 0 1 0            Ω̃φ = φ̇  −1 0 0  Ω̃θ = θ̇  0 0 1       0 −1 0 0 0 0  0 1   Ω̃ψ = ψ̇   −1 0  0 0 0  (7.256) (7.257)   0    0 con lo cual (7.256) conduce al resultado (7.252). (c) Otra vı́a es expresar a ~ω en términos de los ángulos de Euler usando (7.249) y (7.142), lo cual se deja como ejercicio al lector. Las ecuaciones (7.252) y (7.253) muestran que no hay una relación simple entre las componentes de ~ ω expresadas respecto a los ejes fijos al sólido rı́gido y respecto a los ejes espaciales. La ecuación (7.247) da las componentes de ω ~ respecto a los ejes espaciales. Llamaremos ~ω a la velocidad angular respecto a los ejes fijos al sólido rı́gido. Para hallar ~ empecemos por notar que ~r˙ = Ω̃~r, de (7.245). Como ~r = ÃT ~r, tenemos que: ω ~r˙ = Ω̃ÃT ~r (7.258) De transformar ~r˙ a las coordenadas del sólido rı́gido obtenemos: Ã~r˙ = ÃΩ̃ÃT ~r (7.259) Cinemática del cuerpo rı́gido / 249 Claramente Ã~r˙ no es ~r˙ , puesto que esta última es cero. Usando (7.246) y la or˙ T , matriz que llamaremos Ω̃ que es Ω̃ togonalidad de Ã obtenemos que Ã Ω̃ Ã = ÃÃ transformada a las coordenadas fijas al sólido rı́gido. La matriz Ω̃ es antisimétrica: T ˙ ÃT = −ÃΩ̃ÃT = −Ω̃ ˙ ÃT = Ã(ÃT Ã) Ω̃ = Ã (7.260) por tanto puede expresarse como: Ωij = 3 X ǫijk ω k (7.261) k=1 Esto conduce a: ~ × ~r Ã~r˙ = Ω̃~r = −ω (7.262) Entonces se sigue que: 3 3 3 1 XXX ωl = ǫijk Aik ȦTkj 2 i=1 j=1 (7.263) k=1 ~ y ~ω en el punto de vista activo de Comparando a (7.238) y (7.263) vemos que ω las rotaciones son antiparalelas, como es de esperarse, o sea que, de acuerdo con (7.243): ~ = −2e0~e˙ + 2~eė0 − 2~e˙ × ~e ω (7.264) Usando (7.264) y (7.142) se obtiene el resultado (7.253). No existen en general, funciones λi (φ, θ, ψ) tales que: ωi = d λi (φ, θ, ψ) dλ (7.265) Por ejemplo, si ω1 = λ̇1 se deberı́a cumplir que: dλ1 dλ1 dλ1 φ̇ + θ̇ + ψ̇ = θ̇ cos θ + ψ̇ senθ senφ dφ dθ dψ (7.266) y por tanto: dλ1 dλ1 =0; = cos φ ; dφ dθ dλ1 = senθ senφ dψ (7.267) λ1 no existe puesto que: ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = −senφ ∂θ ∂φ ∂φ∂θ ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = cos θ senφ ∂ψ ∂θ ∂θ∂ψ ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = sen θ cos φ ∂ψ ∂φ ∂φ∂ψ (7.268) 250 / Mecánica clásica avanzada La ecuación (7.265) se cumple solamente cuando φ = θ = 0 o sea cuando ω1 = 0. Las componentes de ω ~ son combinaciones no integrables de φ̇, θ̇, ψ̇ (o de las derivadas temporales de los parámetros usados para describir la rotación), llamadas las derivadas de cuasicoordenadas, o seudocoordenadas. Las ecuaciones de Appell son las ecuaciones de movimiento cuando se usan seudocoordenadas para describir el sistema (véase el texto de Gantmacher, Lectures in analytical mechanics, sección 10). El cálculo de ωi implica considerar desplazamientos infinitesimales alrededor de una posición dada del sólido rı́gido. Pero hay maneras diferentes de realizar esos desplazamientos. Como una rotación finita no conmuta con una infinitesimal, depende del orden en que se efectúen las transformaciones. Es de esperarse que ωi sea una derivada total respecto al tiempo sólo en el caso en que el desplazamiento infinitesimal sea alrededor del mismo eje de rotación en que se hizo la rotación finita. Por ejemplo, si Ã = Ãφ y ǫ̃ = ǫ̃φ con θ = φ = 0, entonces ω1 = 0; ω2 = 0; ω3 = φ̇. Tasa de cambios temporales de un vector. Seguimos con el punto de vista ~ cambia con el tiempo en el sistema de pasivo de las rotaciones. Un vector arbitrario G ~ respecto a los ejes espaciales proviene coordenadas fijo al cuerpo rı́gido. El cambio de G de dos efectos: de la rotación del sistema de ejes del sólido rı́gido y de la rotación ~ Es decir: intrı́nseca de G. ~ ~˙ dG = G dt cuerpo ~ dG rotacional cuerpo = ~ −~ω × G (7.269) espacio dt En (7.269) ~ ω está dada por (7.248), que es el negativo de la velocidad angular que usan algunos autores para describir las rotaciones desde el punto de vista pasivo y para ~ ~ los cuales dG = −~ω × G dt. rotacional espacio ~ visto en los ejes espaciales es: Entonces el cambio en G ~ dG espacio ~ = dG cuerpo ~ − ~ω × Gdt (7.270) o también: ~ dG dt ! ~ dG dt = espacio ! cuerpo ~ − ~ω × G (7.271) ~ es: La segunda derivada temporal de G ~ d2 G 2 dt ! espacio = ~ d2 G 2 dt ! cuerpo − 2~ω × ~ −ω ~ +~ω × (~ω × G) ~˙ × G ~ dG dt ! espacio (7.272) Cinemática del cuerpo rı́gido / 251 La ecuación (7.270), y por tanto también (7.271) y (7.272), es válida sólo cuando los ejes espaciales y del cuerpo rı́gido coinciden instantáneamente. Para una posición arbitraria del cuerpo rı́gido se cumple: ~ = G ~ ÃG ~˙ = G ˙G ~ + ÃG ~˙ Ã ~¨ = G ¨ ¨G ˙G ~ + 2Ã ~˙ + ÃG ~ Ã (7.273) ~˙ y G ~¨ se pueden Las (7.273) pueden expresarse en función de ~ω . Los vectores G escribir respecto a los ejes espaciales ası́: ˙G ~˙ = G ~ y ~˙ + ÃT Ã ÃT G ¨~ ¨G ˙G ~¨ = G ~ ~˙ + ÃT Ã ÃT G + 2ÃT Ã (7.274) ˙ obtenemos: Usando la definición Ω̃ = −ÃT Ã, Ω̃˙ = 2 Ω̃ = ˙ T Ã ˙ − ÃT Ã ¨ −Ã ˙ T Ã −ÃT Ã ˙ = −Ã ˙ T Ã ˙ ⇒ Ω̃˙ = Ω̃2 − ÃT Ã ¨ Ã (7.275) De (7.275) se sigue que: ~˙ = G ~˙ − Ω̃G ~ ÃT G (7.276) ¨~ ˙ G ~¨ = G ~˙ + (Ω̃2 − Ω̃) ~ − 2Ω̃G ÃT G Usando (7.245) obtenemos: ~ = −~ ~ Ω̃G ω×G (7.277) ˙ T = d(Ω̃T )/dt = −Ω̃ ˙ se sigue también que: Como Ω̃ ~ = −~ ~ Ω̃˙ G ω˙ × G Además se cumple que: ~ = Ω̃ −~ ~ = −~ ~ Ω̃2 G ω×G ω × −~ω × G (7.278) (7.279) De (7.277) y (7.278) se obtiene para (7.276): ~˙ = G ~˙ + ~ ~ ω×G ÃT G ¨~ ~¨ = G ~˙ + ω ~ + ~ω˙ × G ~ + 2~ ω×G ~ × (~ω × G) Ã G T (7.280) 252 / Mecánica clásica avanzada Explı́citamente las ecuaciones (7.280) se pueden escribir ası́: ! ! i h dG ~ ~ d2 G ~ + ω ~ × G = Ã dt2 dt espacio cuerpo ~ d2 G 2 dt ! cuerpo h d2 G ~ = Ã 2 dt ! espacio + 2~ω × ~ dG dt ! (7.281) espacio i ~ + ~ω˙ × G ~ +~ω × (~ω × G) ˜ esto es, cuando Vemos que (7.271) y (7.272) coinciden con (7.281) cuando Ã = I, escogemos los ejes de modo que coincidan instantáneamente. En particular, para el vector de posición de una partı́cula moviéndose en el sistema de coordenadas fijo a la Tierra, siendo ~ω la velocidad angular de la Tierra respecto al ˜ sistema de ejes espacial, (7.281) nos da para Ã = I: ~¨r = ~¨r + 2~ ω × (~r˙ − ~ω × ~r ) + ~ω × (~ω × ~r ) + ~ω˙ × ~r (7.282) = ~¨r + 2~ ω × ~r˙ − ~ω × (~ω × ~r) + ~ω˙ × ~r Como para la Tierra ~ω = −n̂Φ̇ podemos escribir: ~¨r = ~¨r − 2Φ̇n̂ × ~r˙ − Φ̇2 n̂ × (n̂ × ~r) (7.283) ~ = m~¨r y F~ = m~¨r se sigue que: Como F ~ = F~ − 2mΦ̇n̂ × ~r˙ − mΦ2 n̂ × (n̂ × ~r) F (7.284) En el sistema de coordenadas rotante, fijo a la Tierra, la fuerza efectiva no es F~ = m~g sino que hay otros dos términos de naturaleza inercial. El segundo es la fuerza de Coriolis y el tercero es la fuerza centrı́fuga. La discusión completa de estos efectos puede verse en el texto Classical mechanics de Goldstein, sección 4-9, o en el texto Fı́sica, vol. I de Alonso-Finn, sección 6.5. 8 Dinámica del cuerpo rı́gido El fin de la dinámica del cuerpo rı́gido es describir la evolución del cuerpo rı́gido, o sea, hallar las coordenadas generalizadas de rotación en función del tiempo cuando son conocidas: (i) La distribución de masa del cuerpo rı́gido en reposo y (ii) Las fuerzas y ligaduras que actúan sobre él. Cuando no hay ligaduras, los ángulos de Euler constituyen un conjunto adecuado de coordenadas generalizadas independientes. Hay distintas formas de llegar a las ecuaciones de movimiento para los ángulos de Euler: a partir del lagrangiano, por medio de tres constantes de movimiento o por medio de las ecuaciones de movimiento de Euler. Cuál forma se utiliza es algo que depende del problema particular. 8.1. El tensor de inercia Un cuerpo rı́gido puede considerarse como un sistema de partı́culas sometido a las ligaduras de que cualquier par de partı́culas permanece siempre a la misma distancia una de la otra. En muchos casos es útil considerar una distribución continua de materia, de acuerdo con cierta función de densidad de masa ρ(~r). La masa total, para distribuciones discreta y continua respectivamente, es: M= N X mi ; M= i=1 Z ρ(~r)d3~r (8.1) Las correspondientes expresiones para la energı́a cinética y el momento angular son: T = N X 1 i=1 ~ = L N X i=1 2 2 mi~r˙ i ; mi~ri × ~r˙ i ; T = Z ~ = L 1 ρ(~r)~r˙ 2 d3~r 2 (8.2) Z (8.3) ρ(~r)~r × ~r˙ d3~r 253 254 / Mecánica clásica Similarmente el torque total es: ~ = K N X i=1 ~ri × F~i ; ~ = K Z ~r × F~ (~r) d3~r (8.4) donde F~ (~r) es la fuerza por unidad de volumen en el punto ~r. Las ecuaciones (8.2), (8.3) y (8.4) son cantidades evaluadas en el sistema de coordenadas espacial; es deseable expresarlas en función de las coordenadas del cuerpo rı́gido. ~ la Supondremos que el cuerpo rı́gido se translada a la vez que rota, siendo V velocidad de translación del origen de coordenadas fijo al cuerpo y ω ~ la velocidad angular de rotación. Las fórmulas de transformación para la posición y la velocidad de un punto arbitrario son, según las fórmulas (7.5), (7.244) y (7.245): ~ + AT ~r˙ − ~ω × ~r ′ ~r˙ = V ~r = V~ t + AT ~r ; (8.5) ~ constante. El vector ~ω está dado por (7.248). Por simplicidad hemos tomado a V Si el punto en consideración es del cuerpo rı́gido entonces se cumple que ~r˙ = 0. Constancia de ω respecto a diferentes sistemas de coordenadas fijos al cuerpo rı́gido. Sean O1 y O2 dos puntos del cuerpo rı́gido en los cuales se toma el ~1 y R ~ 2 son los vectores de origen de dos sistemas de coordenadas fijos al cuerpo rı́gido. R ~ ~2 −R ~ 1 es el vector posición de O1 y O2 respecto a los ejes espaciales, de modo que R = R de posición de O2 respecto a O1 . Sea ~ω1 la velocidad angular de los ejes del cuerpo rı́gido ~2 = R ~ +R ~1 y R ~1 = R ~2 − R ~ se con origen en O1 y ~ ω2 respecto a O2 . De las fórmulas R sigue que: ~2 dR dt = esp ~1 dR dt = esp ~1 dR dt ~2 dR dt + esp esp − ~ dR dt ~ dR dt = esp = esp ~1 dR dt ~2 dR dt + esp esp − ~ dR dt ~ dR dt 1 2 ~ −ω ~1 × R (8.6) ~ +ω ~2 × R (8.7) en donde usamos los resultados de (7.269) y siguientes. Por tratarse de un cuerpo rı́gido se sigue que: ~ dR dt = 1 ~ dR dt =0 (8.8) 2 Entonces obtenemos de (8.6) y (8.7): ~1 dR dt = esp ~1 dR dt esp ~ + ~ω2 × R ~ −ω ~1 × R (8.9) Por tanto: ~ =0 (~ ω2 − ω~1 ) × R (8.10) Dinámica del cuerpo rı́gido / 255 ~ siendo λ arbitraria. Como esta expresión debe cumplirse Entonces ~ ω2 − ω~1 = λR, en el caso lı́mite en que el cuerpo rı́gido esté en reposo, λ debe anularse, por lo que se llega al resultado importante de que el vector ~ω es independiente del punto del cuerpo rı́gido que se tome como origen del sistema de coordenadas fijo al cuerpo rı́gido. Energı́a cinética. La energı́a cinética respecto a los ejes espaciales, ecuación (8.2), puede descomponerse usando (8.5): h i 1X ~ 2 − 2V ~ · (~ ω × ~ri ) + (~ω × ~ri ′ )2 mi V 2 i=1 N T = (8.11) Si escogemos el origen de coordenadas del sistema de coordenadas del cuerpo rı́gido (que coincide con el origen de las coordenadas ~r ′ , según la figura 7.2) en el centro de masa, se cumple que: N X ′ ~ CM mi~ri ′ = M R =0 (8.12) i=1 Entonces se sigue que: N T = 1 ~2 1X mi (~ ω × ~ri ′ )2 MV + 2 2 i=r (8.13) Cuando los ejes del cuerpo rı́gido coinciden instantáneamente con los espaciales, ~r = ~ri ′ , en vez de (8.13) podemos escribir: N T = 2 1 ~2 1X ω × ~r i mi ~ MV + 2 2 i=r (8.14) La energı́a cinética, pues, consta de dos partes independientes: la energı́a cinética del centro de masa y la energı́a cinética de rotación respecto al centro de masa. Como ~ω depende de la orientación del cuerpo rı́gido, según (7.252), se sigue que la energı́a cinética de rotación depende de los ángulos de Euler y sus derivadas temporales: T = Ttraslacional + Trotacional (φ, θ, ψ, φ̇, θ̇, ψ̇) (8.15) Es conveniente escribir a Trotacional de la siguiente manera. Usamos la expresión para el producto cruz en términos del tensor de Levi-Civita: 2 ω × ~ri = ǫmnp ωn rip ǫmst ωs r it ~ (8.16) donde los ı́ndices mudos m, n, p, s, t, toman los valores 1, 2, 3, que representan a x, y, z, y usamos la convención de Einstein. El tensor de Levi-Civita tiene la propiedad: ǫmnp ǫmst = δns δpt − δnt δps de la cual se sigue que: 2 2 ~ · ~r i ω × ~ri = ω 2 r 2i − ω ~ (8.17) (8.18) 256 / Mecánica clásica La ecuación (8.18) permite escribir a Trotacional como: Trotacional = N X 1 mi r2i δst − ris r it ωs ωt 2 i=1 (8.19) Definimos el tensor de inercia ası́: Ist = N X i=1 mi (r 2i δst − r is r it ) (8.20) o usando la notación diádica, ecuación (7.45), N ~~ X mi r 2i ~~1 − ~r i r~i I= (8.21) i=1 ~ donde ~1 es el diádico unidad; vemos entonces que: 1 ~~ 1 ~ω · I · ~ω = ωs Ist ωt (8.22) 2 2 ~ ~ En la definición de I~ tomamos los ejes del cuerpo rı́gido; I~ es el tensor de inercia respecto a los ejes del cuerpo rı́gido con origen en el centro de masa. Sin embargo, cuando ~ = 0, T = Trotacional y la fórmula (8.22) resulta aplicable también en el caso en que el V origen de coordenadas no esté en el centro de masa. Trotacional = Momento angular. El momento angular en el sistema de coordenadas espacial, ecuación (8.3), puede descomponerse en una parte del centro de masa y una parte respecto al centro de masa. Cuando los ejes ~r ′ y ~r coinciden instantáneamente, el momento angular de rotación alrededor del centro de masa es: ~ rotacional = L N X i=1 N h 2 X i mi~r i × ω mi ~ω~ri − r i ω ~ × ~ri = ~ .~r i (8.23) i=1 Desarrollando el triple producto vectorial llegamos a una expresión que contiene el tensor de inercia: ~ rotacional = ~I~ · ~ω L (8.24) ~ rotacional son, usando los resultados de la sección 7.3: o sea que las componentes de L ~ (Lrotacional )s = ~es · I~ · ~ω ; s = 1, 2, 3 (8.25) ~ donde I~ es el tensor de inercia respecto a los ejes del cuerpo rı́gido con origen en el centro de masa. Momentos de inercia y productos de inercia. Los elementos diagonales del tensor de inercia reciben el nombre de momentos de inercia: N 2 X ~~ mi ~r i − r 2is ; s = 1, 2, 3 Iss = ~es · I · ~es = (8.26) i=1 Dinámica del cuerpo rı́gido / 257 ~ Los elementos no diagonales de I~ reciben el nombre de productos de inercia (y a veces el de momentos centrı́fugos respecto a los planos coordenados): Ist = − N X mi r is rit ; s 6= t = 1, 2, 3 i=1 (8.27) ~~ I es un tensor simétrico, por lo tanto puede ser diagonalizado mediante una transformación de semejanza realizada por una matriz ortogonal, sus valores propios son reales y sus vectores propios son ortogonales, de acuerdo con conocidos teoremas del álgebra de matrices.1 Momento de inercia respecto al eje de rotación. Por simplicidad tomaremos el caso en que el eje de rotación instantáneamente está fijo, de modo que ~ω está dada por la fórmula (7.226), ω ~ = ωn̂. Entonces de acuerdo con (8.22), Trotacional puede escribirse como: T = 1 2 Iω 2 (8.28) donde el número I está definido ası́: I = n̂ · I · n̂ = I n̂n̂ = N X i=1 h 2 i mi r 2i − ~ri · n̂ (8.29) I se denomina el momento de inercia respecto al eje de rotación. De manera similar puede calcularse el momento de inercia respecto a un eje arbitrario, que por supuesto será diferente del I dado en (8.29). La componente de Lrotacional en la dirección de n̂ es: ~ · n̂ = n̂ · ~I~ · n̂ Ln̂ = L ω = Iω (8.30) ~ rotacional al cuadrado es: La magnitud de L ~ ~ L2 = ~ ω · I~ · I~ · ω ~ 6= I 2 ω 2 (8.31) ~ será distinto de Ln̂ ; en otras palabras, en general L ~ y ~ω no son o sea que en general L paralelos. De acuerdo con la definición elemental, el momento de inercia del cuerpo rı́gido respecto al eje n̂ depende de las distancias Ai de las partı́culas al eje: In = N X A2i mi (8.32) i=1 De acuerdo con su definición: A2i = (~r i × n̂)2 = ~r i · n̂ × ~ri × n̂ 1 Véase (8.33) por ejemplo el texto de V. I. Smirnov, A course of higher mathematics, vol. III, numeral 40, Pergamon Press, 1964. 258 / Mecánica clásica Utilizando un desarrollo similar al de las ecuaciones (8.16), (8.17) y (8.18): n̂ × ~r i × n̂ = ~ri − n̂ n̂ · ~r i (8.34) Reemplazando (8.34) en (8.32) llegamos a: In = N X i=1 h 2 2 i mi ~r i − ~r i .n̂ (8.35) ~ Si n̂ es el eje de rotación vemos que In coincide con I = n̂ · I~ · n̂. Teorema de Steiner. Es un teorema que permite relacionar los momentos de inercia respecto a ejes diferentes. Se llama también el teorema de los momentos de inercia respecto a ejes paralelos. Si ~r es el vector de posición de la partı́cula i respecto a los ejes del cuerpo rı́gido con origen en el centro de masa y ~ri ′ respecto a los ejes ~ respecto al centro de masa, del cuerpo rı́gido con un origen diferente O′ , colocado en R entonces: ~ + ~r i ′ ~r i = R (8.36) Manipulaciones simples nos conducen a la relación: I ′ = I + M a2 (8.37) donde a2 es: ~ × n̂)2 a2 = (R (8.38) y I ′ es el momento de inercia respecto a un eje paralelo a n̂ que se separa de él una cantidad a. El teorema de Steiner para el tensor de inercia mismo es: ~~ ′ ~~ ~R ~ I = I + M R2~~1 − R (8.39) ~ ~ donde I~ es el tensor de inercia respecto al centro de masa y I~ ′ es el tensor de inercia ~ respecto a unos ejes del cuerpo rı́gido con origen en R respecto al centro de masa. ~ ~~ Ejemplo 8.1.1 Expresar a I~ en términos de R i definida ası́:   0 z i −y i     ~~  o sea : R 0 x −z R̃i =  i i  i = ǫmnl xil êm ên    y i −xi 0 (8.40) Utilizando la propiedad del tensor de Levi-Civita dada en (8.17), llegamos a la ~~ ~~ siguiente expresión par R i · Ri : ~~ ~~ ~ r i~r i − r 2i ~1 R i · Ri = ~ (8.41) Dinámica del cuerpo rı́gido / 259 ~~ Se sigue entonces la siguiente expresión para I: N X ~ ~ ~~ mi R i · R i I =− (8.42) i=1 Ejemplo 8.1.2 Hallar el lagrangiano para una placa uniforme rectangular rı́gida horizontal que está colocada sobre cuatro resortes iguales, para el caso en el cual el centro de la placa sólo puede tener movimientos perpendiculares a la placa. La placa sólo puede desplazarse verticalmente y girar de modo que el centro permanezca fijo. Entonces las correspondientes energı́as cinéticas son: 1 1 ~~ M Ż 2 ; Trotacional = ~ω · I.~ ω (8.43) 2 2 Para una placa rectangular homogénea rı́gida usamos la fórmula correspondiente a (8.21) para una distribución uniforme de masa: Z ~~ M 2~ ~ I= r I − ~r~r d2~r (8.44) A Ttraslacional = donde A es el área de la placa y d2~r el elemento diferencial de área. Tomando el plano x − y sobre la placa, con origen en el centro de la misma, y llamando 2a la longitud de la placa (dirección x) y 2b la anchura (dirección y), (8.44) toma la forma: Z Z M ~ ~~ (r2 I~ − ~r~r) dx dy (8.45) I= 4ab Con la elección de coordenadas que hemos hecho, los productos de inercia se anulan ~~ (I es diagonal). Los momentos de inercia son: 1 1 1 M b2 ; Iyy = M a2 ; Izz = M (a2 + b2 ) (8.46) 3 3 3 En vez de tomar como coordenadas generalizadas de rotación a los ángulos de Euler ordinarios, con lo cual la velocidad angular estarı́a dada por las fórmulas (7.252) o (7.253), tomaremos los ángulos de rotación alrededor de los tres ejes perpendiculares fijos a la placa. Esta es la llamada convención “xyz” de los ángulos de Euler; ver el final de la sección 7.6. Las componentes de ~ω a lo largo de los ejes de las rotaciones sucesivas que definen los ángulos de Euler en la convención “xyz” son: Ixx = ω ~ = φ̇ êz + θ̇ êµ2 + ψ̇ êµ′1 (8.47) Con lo cual se obtiene para las componentes de la velocidad angular respecto a los ejes del cuerpo rı́gido:2 ~ω = (ψ̇ − φ̇ senθ)êx̄ + (θ̇ cos ψ + φ̇ cos θ senψ)êy (8.48) +(−φ̇ senψ + φ̇ cos θ cos ψ)êz̄ 2 Las componentes respecto a los ejes espaciales son (ψ̇ cos θ cos φ − θ̇ senφ, φ̇ cos θ senφ + θ̇ cos φ, φ̇ − ψ̇ senθ). Véase apéndice B del texto de Goldstein, Classical mechanics, 2a ed., Addison Wesley, 1980. ¯ 260 / Mecánica clásica En las fórmulas dinámicas hemos supuesto que los ejes espacial y de cuerpo rı́gido coinciden instantáneamente. Por esto debemos tomar nulos los valores de los ángulos de ~ coinciden instantáneamente: Euler, con lo cual ω ~ yω ω = φ̇ êz + θ̇ êy + ψ̇ êx ~ (8.49) Entonces Trotacional será: Trotacional = 1 1 1 2 ψ̇ Ixx + θ̇2 Iyy + φ̇2 Izz 2 2 2 (8.50) Con la convención ordinaria para los ángulos de Euler aparecerán términos en φ̇ψ̇. La energı́a potencial en función de z y de los ángulos de Euler es: V = 1 1 1 1 (4k)z 2 + (4k)(aθ)2 + (4k)(bψ)2 + (4k ′ )(a2 + b2 )φ2 2 2 2 2 (8.51) En (8.51), k es la constante de estiramiento de los resortes, en tanto que k ′ es la constante asociada a los desplazamientos horizontales, en que no se estiran los resortes y por lo tanto k ′ no se puede expresar en función de k. El lagrangiano buscado es: L= M 2 2 1 |b ψ̇ + a2 φ̇2 + (a2 + b2 )φ̇2 | + M ż 2 − 2kz 2 6 2 2 2 2 2 ′ 2 2 (8.52) 2 −2ka θ − 2kb ψ − 2k (a + b )φ Vemos que z, φ, θ, ψ, son coordenadas normales. 8.2. Diagonalización del tensor de inercia El tensor de inercia es simétrico, Ist = Its , con lo cual sus valores propios son reales y los vectores propios correspondientes a valores propios diferentes son ortogonales. En ~ depende general los productos de inercia no son nulos, o sea que cada componente de L de todas las componentes de ω ~: Ls = Is1 ω1 + Is2 ω2 + Is3 ω3 ; s = 1, 2, 3 (8.53) ~ será proporcional a la si se anulan los productos de inercia, cada componente de L respectiva velocidad angular y T será una forma cuadrática en las componentes de ~ω sin términos cruzados. ~ Como I~ es simétrico, siempre es posible hallar un sistema de coordenadas fijo al cuerpo rı́gido en que sea diagonal. Esto se logra resolviendo el problema de valores ~~ propios y vectores propios para I: ~~ ~ ~α ; I · Xα = Iα X α = 1, 2, 3 (8.54) o en términos de las componentes: 3 X t=1 Irt Xαt = Iα Xαr ; r, α = 1, 2, 3 (8.55) Dinámica del cuerpo rı́gido / 261 Vamos a admitir que los valores propios Iα puedan ser complejos. Entonces Iβ⋆ satisface: 3 X ⋆ ⋆ ⋆ Xβr = Iβ⋆ Xβt ; t, β = 1, 2, 3 (8.56) Itr r=1 ⋆ Multiplicando a (8.55) por Xβr y a (8.56) por Xαt , sumando sobre r y t y restando los resultados obtenemos: 3 X 3 3 X 3 3 X X X ⋆ ⋆ ⋆ ⋆ ⋆ Irt Xαt Xβr − Itr Xβr Xαt = Iα Xαr Xβr Iβ r=1 t=1 t=1 t=1 r=1 (8.57) − 3 X ⋆ Xαt Xβt t=1 como Irt es real y simétrica, el lado izquierdo de (8.57) es nulo. El lado derecho puede escribirse como un producto escalar ordinario, quedando: ~α · X ~ ⋆ = 0 ; α, β = 1, 2, 3 (8.58) (Iα − Iβ⋆ )X β ~α ·X ~ ⋆ es real y positivo, que I ⋆ = Iα , Para α = β se sigue de (8.58), debido a que X α α ~α y X ~ β corresponden a valores propios o sea que los valores propios son reales. Cuando X ~ α normalizados diferentes, se sigue que son ortogonales. Escogiendo los vectores propios X ~ ~ β puede no ser a la unidad y notando que cuando ocurra que Iα = Iβ entonces Xα · X ~ 1, X ~2 y X ~ 3 , forman cero, pero que puede escogerse cero, obtenemos de esta manera que X una trı́ada ortonormal de vectores unitarios: ~α · X ~ β = δαβ ; X α, β = 1, 2, 3 (8.59) Analicemos más en detalle el caso en que ocurran valores propios degenerados, Iα = Iβ con α 6= β. De (8.58) se sigue que se debe cumplir, en el caso en que I1 6= I2 = I3 , ~1 · X ~2 = X ~1 · X ~ 3 = 0, pero no necesariamente se debe cumplir que X ~2 · X ~ 3 = 0. que X ~ Todos los vectores perpendiculares a X1 son vectores propios correspondientes al mismo valor propio I2 , formando un espacio bidimensional, o sea que sólo hay dos vectores propios de I2 linealmente independientes, con lo cual podemos escoger cualquier par de vectores ortogonales, lo cual nos está a su vez indicando que el sólido rı́gido posee ~ 1. simetrı́a de rotación alrededor del eje X ~α Los ejes principales y la transformación principal. Los vectores propios X constituyen un sistema de tres ejes cartesianos fijos al cuerpo rı́gido, respecto a los cuales el tensor de inercia es diagonal. Estos ejes se llaman ejes principales de inercia. Los valores propios Iα se llaman momentos principales de inercia. En cualquier caso es posible hallar una transformación de coordenadas que nos permita pasar a los ejes principales. Tal transformación se llama transformación principal y consiste en una rotación. De acuerdo con las fórmulas (7.30) y (7.60), las fórmulas de transformación para los vectores unitarios y para el tensor de inercia serán: ~r = X 3 X s=1 αrs ês ; ′ Irs 3 X t,u αrt αsu Itu ; r, s = 1, 2, 3 (8.60) 262 / Mecánica clásica donde αrs son los cosenos directores de la transformación. Vemos que las componentes de los nuevos vectores unitarios coinciden con los cosenos directores: Xrs = αrs ; r, s = 1, 2, 3 (8.61) Es decir, con los elementos de los vectores propios formamos una matriz que coincide con la matriz de la transformación principal siendo las filas de tal matriz formadas con las componentes de los vectores propios. Esta matriz es ortogonal. ~ r · ês y las Los cosenos directores también pueden escribirse en la forma αrs = X ~~ ~ ~ ′ ~ componentes del tensor de inercia en las formas Irs = Xr · I · Xs y Itu = êt · I~ · êu , con lo cual las ecuaciones (8.60) de la derecha quedan en la forma de la identidad siguiente: 3 X ~ s) ~ r · ~I~ · X ~s = ~ r · êt ) êt · ~I~ · êu (êu · X (8.62) X (X t,u=1 Como ′ Irs es diagonal, podemos escribir: ′ ~ r · ~I~ · X ~ s = Is δrs ; =X Irs r, s = 1, 2, 3 (8.63) ~ 3 = ~~1, obtenemos ~2 + X ~ 3X ~1 + X ~ 2X ~ r, X ~ 1X Usando la completidad de los vectores X ~ r y sumando sobre r la ecuación de valores propios para ~I. ~ al multiplicar a (8.63) por X En términos de componentes la ecuación de valores propios es (8.55): 3 X t=1 (Irt − Iα δrt )Xαt = 0 ; r, α = 1, 2, 3 (8.64) El anterior es un sistema de tres ecuaciones homogéneas en las incógnitas Xαt , que admite soluciones no triviales solamente si los Iα tienen un valor tal que se anule el determinante de la matriz de los coeficientes: ~~ ~ ~ det I − Iα 1 = 0 (8.65) que en forma explı́cita es:  Ixx − Iα Ixy   Ixy Iyy − Iα det    Ixz Iyz Ixz Iyz Izz − Iα    =0   (8.66) La ecuación (8.66) es cúbica en Iα , que tendrá tres raı́ces reales según hemos visto; esta ecuación se llama ecuación secular. Un cuerpo rı́gido cuyos tres momentos principales de inercia son diferentes es asimétrico. Si por ejemplo I1 = I2 6= I3 , el ~ 3 . Por simetrı́a de rotación cuerpo tiene simetrı́a de rotación alrededor del eje principal X entendemos una rotación que deja inalterado el tensor de inercia; tal rotación puede ~~ representarse mediante cierto diádico ortogonal R. ~~ ~~ ~~ −1 ~~ R ·I ·R = I (8.67) Dinámica del cuerpo rı́gido / 263 Mediante (8.67) la ecuación de valores propios para I1 puede escribirse como: ~~ ~~ ~~ −1 ~ ~~ ~ ~ ~1 = R · I · R · X1 = I1 X I · X1 = I1 X (8.68) ~~ o por la ortogonalidad de R: ~~ −1 ~ ~~ ~~ −1 ~ · X1 ) I · R X1 = I · (R (8.69) ~~ ~ ~1 y R Las ecuaciones (8.68) y (8.69) nos dicen que los vectores X X1 son vectores ~~ propios de I con el mismo valor propio I1 ; estos dos vectores no necesariamente son ortogonales pero sı́ son linealmente independientes y permiten escribir cualquier vector ~ 3 . Si I1 = I2 = I3 se dice que el cuerpo en el plano perpendicular al eje de simetrı́a X ~~ rı́gido es esférico; en este caso I será diagonal respecto a cualquier sistema de ejes del cuerpo rı́gido con origen en el centro de masa. Ejemplo 8.2.1 Sea un cuerpo rı́gido formado por once masas discretas iguales distribuidas como se muestra en la figura 8.1. Las ocho masas del plano están sobre una circunferencia de radio a, con un ángulo entre sı́ de 45o . Las masas del eje están a una distancia a del centro de la circunferencia. Al rotar el cuerpo alrededor del eje un ángulo 2π/8, coincide consigo mismo; se dice que posee un eje de simetrı́a de orden 8. Sobre el plano hay también cuatro ejes de simetrı́a de orden 2. Calcular las componentes del tensor de inercia para este cuerpo y mostrar que dos momentos principales de inercia son iguales. z y x Figura 8.1 Cuerpo rı́gido formado por once masas discretas iguales. Podemos elegir los ejes del cuerpo rı́gido de modo que coincidan con la posición de algunas de las masas, digamos, tomando el plano x − y en el plano de la figura y el eje z 264 / Mecánica clásica a lo largo del eje de simetrı́a. Con esta elección se anulan los productos de inercia o sea que dichos ejes forman un conjunto de ejes principales y los momentos de inercia serán también momentos principales de inercia. Los valores de los Iα son: I1 = Ixx = 6ma2 ; I2 = Iyy = 6ma2 ; I3 = Izz = 8ma2 (8.70) Vemos que ninguno de los tres momentos principales de inercia es mayor que la suma de los otros dos y que los momentos principales respecto a los ejes del plano de simetrı́a son iguales. Se puede demostrar que si en vez de x − y se toma cualquier par de ejes en ese plano, perpendiculares o no entre sı́, el tensor de inercia resulta diagonal, siempre que un eje pueda obtenerse a partir del otro eje mediante una de las operaciones de simetrı́a del cuerpo. Es decir, cualquier par de ejes no colineales que hagan entre sı́ un ángulo que sea un múltiplo de 2π/8, forma parte del conjunto de ejes principales del cuerpo. Usando el lenguaje de la teorı́a de grupos, decimos que el cuerpo rı́gido posee un grupo de simetrı́as de orden 8, el grupo puntual D4 , que consta de cuatro rotaciones alrededor del eje de simetrı́a de orden 8, y cuatro rotaciones de π alrededor de ejes horizontales. Además posee un conjunto de simetrı́as de reflexión en planos horizontales y verticales. El conjunto de los vectores propios correspondientes al valor propio degenerado I1 constituye una representación irreductible del grupo de simetrı́as D4 .3 El elipsoide de inercia. Sea n̂ el vector unitario que define una dirección cualquiera. El momento de inercia respecto al eje n̂ es: 3 X ~ I = n̂ · I~ · n̂ = nr Irs ns (8.71) r,s=1 donde nx , ny , nz , son los cosenos directores del eje (véase figura 8.2). Si tomamos un punto cualquiera sobre el eje, estará descrito respecto al centro de masa por el vector de posición ~r = (x, y, z) = r(nx , ny , nz ); por lo tanto si multiplicamos por r2 ambos lados en (8.71) obtenemos: In r2 = Ixx x2 + Iyy y 2 + Izz z 2 + 2Ixy xy + 2Ixz xz + Iyz yz (8.72) Ahora consideremos un conjunto de ejes que pasen por el centro de masa. Entonces podemos hallar el lugar geométrico de los puntos ~r para los cuales In r2 toma el mismo valor. Este lugar geométrico es una superficie elipsoidal llamada el elipsoide de inercia o elipsoide de momentos de inercia. Es claro que eligiendo adecuadamente el sistema de coordenadas fijo al cuerpo rı́gido4 se obtiene la ecuación estándar para un elipsoide: x2 y2 z2 + 2 + 2 =1 2 a b c (8.73) 3 Véase el capı́tulo de teorı́a de la simetrı́a en el libro de Mecánica cuántica no relativı́stica de LandauLifshitz. 4 Que coincide instantáneamente con el sistema de coordenadas espacial. Dinámica del cuerpo rı́gido / 265 La ecuación (8.73) se identificará con (8.72) si se satisfacen las relaciones: a2 = In r2 ; I1 I1 = Ixx ; b2 = In r2 ; I2 I2 = Iyy ; c2 = In r2 ; I3 I3 = Izz ; (8.74) Irs = 0 si r 6= s Es claro que tal sistema de coordenadas coincide con el sistema de ejes principales ortogonales del cuerpo rı́gido y que I1 , I2 , I3 , coinciden con los momentos principales de inercia. Cuerpo rígido r n Elipsoide de inercia: In r 2 = constante Figura 8.2 Superficie elipsoidal El elipsoide de inercia es una superficie de la forma: F (x, y, z) = 0 (8.75) La normal a F en un punto es el gradiente de F en ese punto. En los ejes principales de un elipsoide el gradiente es paralelo al eje: ∂F = K n̂ ∂~r En forma explı́cita (8.76) es: (8.76) ∂F = 2xIxx + 2yIxy + 2zIxz = Knx ∂x ∂F = 2xIxy + 2yIyy + 2zIyz = Kny ∂y (8.77) ∂F = 2xIxz + 2yIyz + 2zIzz = Knz ∂z Si estas ecuaciones las dividimos por 2r, luego multiplicamos la primera por nx y la tercera por nz , el resultado que se obtiene al sumarlas coincide con (8.72) si la constante 266 / Mecánica clásica K se identifica con K = 2rIn . Entonces (8.77) coincide con el siguiente sistema de ecuaciones: (Ixx − In )nx + Ixy ny + Ixz nz = 0 Ixy nx + (Iyy − In )ny + Iyz nz = 0 (8.78) Ixz nx + Iyz ny + (Izz − In )nz = 0 O sea que las ecuaciones (8.76), (8.77) y (8.78) nos dan los ejes principales y los momentos principales de inercia, ya que los ejes principales de inercia coinciden con los ejes principales del elipsoide de inercia. La construcción del elipsoide de inercia permite interesantes análisis cualitativos del movimiento del cuerpo rı́gido. Es la base de la representación de Poinsot para el estudio del movimiento de un cuerpo rı́gido no sometido a torques. Ejemplo 8.2.2 ¿Cuál es la relación entre el diámetro y la altura de un cilindro circular recto tal que el elipsoide de inercia en el centro del cilindro es una esfera? Tomamos el origen en el centro de masa. En virtud de la simetrı́a de rotación, cualquier par de ejes perpendiculares al eje y del cilindro forman un sistema de ejes principales. El momento de inercia Izz = I3 , siendo z el eje del cilindro, es: Z Z Z M I3 = (y 2 + x2 ) d3~r (8.79) V donde M es la masa total y V el volumen. Tomando el elemento de volumen como un anillo cilı́ndrico de radios ρ y ρ + dρ y altura dl: d3~r = 2πρ dρ dl (8.80) Entonces una integración elemental nos lleva a: I3 = 1 M R2 2 siendo R el radio de la circunferencia de la base del cilindro. El momento de inercia Ixx = I1 es: Z Z Z M I1 = (z 2 + y 2 ) d3~r V (8.81) (8.82) En las dos integrales que aparecen en (8.79) y (8.82) es cómodo tomar respectivamente los siguientes elementos de volumen: p (8.83) d3~r = πr2 dz y d3~r = 2lx dy = 2l R2 − y 2 dy Entonces obtenemos para I1 , que además será igual a I2 : 2 1 l I1 = M + R2 4 3 (8.84) Dinámica del cuerpo rı́gido / 267 El elipsoide de inercia será una esfera si I1 = I2 = I3 , de acuerdo con las fórmulas (8.74). De (8.81) y (8.84) se sigue entonces que: l2 = 3R2 (8.85) Ejemplo 8.2.3 Tres masas iguales están en los puntos (a, 0, 0), (0, a, 2a) y (0, 2a, a), hallar los momentos principales de inercia y un conjunto de ejes principales respecto al origen de coordenadas. Los elementos del  5 0 ~~  0 3 I= 0 −2 tensor de inercia para este problema son:  0 −2  2ma2 3 El valor del determinante secular, ecuación (8.66), es: ~~ ~ ~ det I − I 1 ⇒ (5 − i)[(3 − i)2 − 4] = 0 (8.86) (8.87) donde hemos llamado: i= I 2ma2 (8.88) Las tres raı́ces de la ecuación secular son entonces i = 5, 5, 1, con lo cual los tres momentos principales de inercia valen: I1 = 2ma2 ; I2 = 10ma2 ; I3 = 10ma2 (8.89) ~ ~ ~ Las ecuaciones de valores propios son ~i · X α = iα Xα , que explı́citamente son: (5 − iα )Xα1 = 0; (3 − iα )Xα2 − 2Xα3 = 0; −2Xα2 + (3 − iα )Xα3 = 0 ~ 1: X (8.90) Para i1 obtenemos las siguientes relaciones entre los componentes del vector propio X11 = 0 ; X12 = X13 (8.91) ~ 1 normalizado a la unidad es entonces: El vector propio X ~ 1 = 0, √1 , √1 X 2 2 (8.92) Para la raı́z doble i2 = i3 = 5 las relaciones entre los componentes de los vectores ~ 2, X ~ 3 , son: propios X 0.Xα1 = 0 ; Xα2 = −Xα3 ; α = 2, 3 (8.93) Vemos que los Xα1 pueden asignarse arbitrariamente, ya que la condición de normalización sólo nos permite expresar a Xα2 en función de Xα1 . Este comportamiento es caracterı́stico de los problemas de valores propios cuando hay degeneración. Una pareja 268 / Mecánica clásica posible de vectores propios normalizados y ortogonales correspondientes al valor propio degenerado i2 = i3 = 5 es: 1 1 ~ 3 = (1, 0, 0) ~ √ √ ; X (8.94) X2 = 0, − , 2 2 La matriz de la correspondiente transformación principal es:  1 1  √ √ 0  2 2       1  ÃT =  0 − √1 √     2 2    1 0 (8.95) 0 ~ 1 se puede construir Es claro que con cualquier par de ejes perpendiculares a X igualmente un sistema de ejes principales respecto al origen de coordenadas (véase figura 8.3). Otro problema serı́a hallar los momentos principales y los ejes principales respecto al centro de masa que está localizado en el punto: ~ = a , a, a R (8.96) 3 z m m x2 x1 x m y x3 Figura 8.3 Ejes principales de sistema de masas puntuales 8.3. Las ecuaciones de movimiento de Euler Vamos a suponer que el cuerpo rı́gido no tiene ligaduras adicionales a la de poderse mover sólo de modo que un punto permanezca fijo; entonces los ángulos de Euler son coordenadas generalizadas para la descripción del movimiento del cuerpo rı́gido. Dinámica del cuerpo rı́gido / 269 El lagrangiano del cuerpo rı́gido. La energı́a cinética es puramente rotacional y está dada por la ecuación (8.22). La energı́a potencial dependerá de la orientación del cuerpo, con lo cual la lagrangiana será: L(φ, θ, ψ; φ̇; θ̇, ψ̇) = 1 (I1 ωx2 + I2 ωy2 + I3 ωz2 ) − V (φ, θ, ψ) 2 (8.97) donde se supone que los ejes fijos al cuerpo rı́gido son ejes principales. Las fuerzas generalizadas de este problema son: Fφ = − ∂V ; ∂φ Fθ = − ∂V ; ∂θ Fψ = − ∂V ∂ψ (8.98) Fφ , Fθ y Fψ representan respectivamente el torque externo alrededor del eje espacial z, el torque alrededor de la lı́nea de nodos y el torque alrededor del eje principal del cuerpo rı́gido z. Las ecuaciones de movimiento de Euler. Son las ecuaciones de movimiento. La ecuación de Lagrange que contiene el torque alrededor de la coordenada z del cuerpo rı́gido es: ∂T ∂V d ∂T − =− = Kz dt ∂ ψ̇ ∂ψ ∂ψ (8.99) ~ obtenemos que: Recordando las fórmulas (7.253) para las componentes de ω ∂T ∂ωx ∂T ∂ωy ∂T = + = ωx ωy (I1 − I2 ) ∂ψ ∂ωx ∂ψ ∂ωy ∂ψ (8.100) Por otra parte: ∂T ∂T ∂ωz ∂T = I3 ωz = = ∂ω ∂ω ∂ ψ̇ z ∂ ψ̇ z (8.101) Entonces la ecuación de Lagrange (8.99) toma la forma: I3 ω̇z − ωx ωy (I1 − I2 ) = Kz (8.102) La ecuación (8.102) no depende de las coordenadas generalizadas especı́ficas que se usen para describir el movimiento; en particular no depende de la convención usada para definir los ángulos de Euler, ya que esta sólo influye en las expresiones para las ω. Si hubiéramos usado convenciones para los ángulos de Euler en que componentes de ~ se intercambiaran los papeles de los ejes z y x, y z y y respectivamente, las ecuaciones de movimiento serı́an en vez de (8.102), las siguientes: I2 ω̇y − ωx ωz (I3 − I1 ) = Ky I1 ω̇x − ωy ωz (I2 − I3 ) = Kx (8.103) Por tanto las ecuaciones (8.102) y (8.103) son tres ecuaciones diferenciales independientes que no dependen de la convención usada para definir los ángulos de Euler. En la convención adoptada en el numeral 7.6, las ecuaciones (8.103) no son las ecuaciones 270 / Mecánica clásica de lagrange para φ y θ, en tanto que (8.102) es la ecuación de Lagrange para ψ. No vale tampoco que Fφ y Fθ correspondan a Ky y Kx pues como digimos representan el torque alrededor de z, Kz , y el torque alrededor de la lı́nea de nodos, Kµ1 , respectivamente. Una deducción más simple de las ecuaciones de Euler es la siguiente: el torque total ~ respecto a los ejes espaciales: es igual a la rata de cambio temporal de L ~ ~ = dL K dt (8.104) esp ~ respecto a los ejes rotantes se introduce mediante la fórmula: La derivada de L ~ dL dt = esp ~ dL dt rot ~ + ~ω × L (8.105) donde hemos tomado los ejes coincidiendo instantáneamente. Las ecuaciones (8.104) y (8.105) nos dan: dLr + ǫr st ωs ωt Lt = Kr ; dt r = 1, 2, 3 (8.106) Como escogemos los ejes rotantes coincidiendo con los ejes principales se cumple que Lr = Ir ωr , de modo que obtenemos de (8.106) directamente las ecuaciones de Euler: Ir ω˙r + ǫr st ωs ωt Is = Kr ; r = 1, 2, 3 (8.107) Principales casos en que las ecuaciones de Euler se pueden reducir a cuadraturas. Las ecuaciones de Euler han sido reducidas a cuadraturas para valores arbitrarios de las constantes de movimiento en los siguientes casos: (a) El punto fijo es el centro de gravedad del cuerpo, de modo que no hay torques externos. Los valores de los momentos de inercia son arbitrarios. Es el problema del cuerpo rı́gido libre. Para el cuerpo rı́gido asimétrico (I1 6= I2 6= I3 ) el problema se reduce a cuadraturas en términos de funciones elı́pticas y fue resuelto por Euler en 1758. Para el cuerpo rı́gido simétrico (I1 = I2 6= I3 ) la solución está dada en términos de funciones trigonométricas. Para el cuerpo libre esférico (I1 = I2 = I3 ) la solución es trivial. (b) El caso en que dos momentos principales de inercia alrededor de un punto del cuerpo que no coincide con el centro de masa y fijo en el espacio son iguales (trompo simétrico con un punto fijo). Tanto el punto fijo como el centro de masa están sobre el eje de simetrı́a. No hay torques de fricción en el punto fijo y el único torque es producido por un campo gravitatorio homogéneo. El problema se reduce a cuadraturas en términos de funciones elı́pticas y fue resuelto por Lagrange en 1788. (c) En 1887 la señora S.V. Kovalevski halló otro ejemplo soluble. Es el caso en que dos momentos principales de inercia alrededor del punto fijo que no coincide con el centro de masa son iguales entre sı́, y dos veces más grandes que el tercero (I1 = I2 = 2I3 ). Además, el centro de masa está sobre el plano formado por los ejes principales correspondientes a los momentos principales iguales, y el único torque externo es el de la gravedad. La solución está expresada en términos de las funciones hiper-elı́pticas. Dinámica del cuerpo rı́gido / 271 Ejemplo 8.3.1 Sea un sistema de ejes primados que coinciden en el origen con un sistema de ejes inercial pero que rota con respecto a los ejes inerciales con una velocidad angular fija ω ~ 0 . Hallar las ecuaciones de movimiento de Euler para un cuerpo rı́gido que se mueve respecto a este sistema de ejes rotantes en el caso en que no haya torques externos, V = 0. El lagrangiano del sistema, considerado como un sistema de partı́culas, es: N L= 1 X ˙2 mi~ri 2 i=1 (8.108) Transformemos primero el lagrangiano de los ejes espaciales a los ejes rotantes, usando fórmulas de la sección 7.8. Llamemos Ã a la matriz de rotación de los ejes rotantes respecto a los ejes espaciales, más adelante usaremos la notación Ã′ para denotar la matriz de rotación de los ejes del cuerpo rı́gido respecto a los ejes rotantes. La velocidad angular total es Ω̃′ + Ã′ Ω̃ Ω̃′T y por esto no podemos decir a priori que el vector velocidad angular sea ω ~ +~ ω0 . Si ~r ′ es el vector de posición en los ejes rotantes, sabemos que: ~r ′ = Ã~r ; ˙ T ~r˙ ′ + ÃT ~r˙ ′ ~r˙ = Ã (8.109) de modo que: 2 ˙ Ã ˙ T ~r ′ ˙ ÃT ~r˙ ′ + ~r˙ ′T ÃÃ ˙ T ~r ′ + ~r ′T Ã ~r˙ = ~r˙ ′T ÃÃT ~r˙ ′ + ~r ′T Ã (8.110) Usando la siguiente definición de Ω̃′0 y las propiedades de Ã: ÃÃT = I˜ ; ˙ ÃT + ÃÃ ˙ T = 0; Ã ˙ ÃT ; Ω̃′0 = Ã ˙ ˙T Ω̃′2 0 = −ÃÃ (8.111) llegamos a: 2 r′ ~r˙ = ~r˙ ′2 + 2~r ′T Ω̃′0 ~r˙ ′ − ~r ′T Ω̃′2 0 ~ (8.112) Expresando ahora la matriz antisimétrica Ω̃′0 en términos del vector velocidad angular respecto a los ejes rotantes: Ω̃′0~r ′ = −~ ω0′ × ~r ′ ; Ω̃20~r ′ = ω ~ 0′ × (ω0′ × ~r ′ ) (8.113) Entonces podemos escribir a (8.112) como: 2 2 ~r˙ = ~r˙ ′ − 2~ ω0′ · (~r˙ ′ × ~r ′ ) − ω ~ 0 · [(~ω0′ × ~r ′ ) × ~r ′ ] La ecuación (8.114) puede llevarse a la forma: 2 2 ~r˙ = ~r˙ ′ + 2~ ω0′ · (~r ′ × ~r˙ ′ ) + ω ~ 0′ · ~~1 × ~r ′2 − ~r ′~r ′ · ~ω0′ (8.114) (8.115) con lo cual llegamos a la siguiente expresión para L: ~ ~′ + 1ω ~ ′ · I~ · ~ω0 L = T′ + ω ~ 0′ · L 2 0 (8.116) 272 / Mecánica clásica ~ ′ es el momento angular total respecto a los ejes rotantes e ~I~ es el momento de donde L inercia respecto a dichos ejes. Si ahora el cuerpo rı́gido se mueve respecto a los ejes primados con velocidad angular ~ ω , es claro que: T′ = 1~ ~ ω · ~I · ~ω 2 (8.117) ~ donde ~I es el momento de inercia respecto a los ejes del cuerpo rı́gido, que podemos tomarlos como ejes principales. Ahora se cumple que: ~r ′ = Ã′T ~r ; ~r = Ã′~r ′ ; ˙ ′ Ã′T ; ˜ = Ã Ω ˜ r = −~ω × ~r Ω~ (8.118) ˜ la matriz Ω̃′ respecto a los ejes del cuerpo rı́gido: Llamamos además Ω 0 0 ˜ ′ Ã′T ˜ = Ã′ Ω Ω 0 0 (8.119) Entonces el segundo término de la derecha en (8.112) puede escribirse ası́: T ˙ ′T ~r = 2(ω ˜ ′ Ã ~ 0 × ~r) · (~ω × ~r) 2~r ′T Ω̃′0~r˙ ′ = 2~r Ã′ Ω 0 El tercer término de (8.115) puede escribirse como: ~ ~1(~r ′ · ~r ′ ) − ~r ′~r ′ = ~~1r 2 − Ã′T ~r ~rÃ′ = Ã′T ~~1r2 − ~r ~r Ã′ (8.120) (8.121) Con lo cual construimos el tensor de inercia respecto a los ejes del cuerpo rı́gido. Finalmente, L toma la forma: L= N X ~ ~ 1~ ~ ~ × ~r i + 1 ω ~+ ~0 ~ 0 · ~I · ω mi ~ω 0 × ~ri · ω ω·I ·ω 2 2 i=1 (8.122) que aún puede transformarse en el segundo miembro para dar: L= ~ ~ 1~ ~ ~ + ~ω · ~I · ω ~0 + ω·I ·ω 2 1 ~ ~~ ~ ω0 · I · ω 0 2 (8.123) Vamos a suponer que ω ~ 0′ está en la dirección del eje x′3 , de modo que las componentes de ~ω 0 serán: ~ 0 = (senθ senψ, senθ cos φ, cos θ)ω0 ω (8.124) Entonces los términos que contienen a ~ω0 en (8.123) son de la forma: ~ ~ ~ · ~I · ~ω 0 + 1 ~ω0 · ~I · ~ω0 = ωx ω0 senθ senψ I1 ω 2 +ωy ω0 senθ cos ψ I2 + ωz ω0 cos θ I3 1 + (sen2 θ sen2 ψ I1 + sen2 θ cos2 ψ I2 + cos2 θI3 )ω02 2 (8.125) Dinámica del cuerpo rı́gido / 273 La derivada parcial de (8.125) respecto a ψ es: ω0 (ωy senθ senψ + ωx senθ cos ψ + ω0 sen2 θ senψ cos ψ)I1 +ω0 (−ωx senθ cos ψ − ωy senθ senψ − ω0 sen2 θ cos ψ senψ)I2 (8.126) = ω0 ωy senθ senψ(I1 − I2 ) + ω0 ωx senθ cos ψ(I1 − I2 ) +ω02 sen2 θ senψ cos ψ(I1 − I2 ) La derivada de estos términos respecto a ψ̇ es I3 ω0 cos θ de modo que la ecuación de Lagrange para ψ es: (ωx ωy + ωy ω0 senθ senψ + ωx ω0 senθ cos ψ (8.127) +ω02 sen2 θ senψ cos ψ)(I1 − I2 ) − (ω˙z − θ̇ ω0 senθ)I3 = 0 Esta ecuación podemos expresarla en términos de las componentes de ~ω 0 : (ωx + ω0x )(ωy + ω0y )(I1 − I2 ) − (ω̇z + ω̇0z )I3 = 0 (8.128) Usando los mismos argumentos que en las ecuaciones (8.102) y (8.103), podemos concluir que las otras dos ecuaciones de Euler son: (ωx + ω0x )(ωz + ω0z )(I3 − I1 ) − (ω̇y + ω̇0y )I2 = 0 (ωy + ω0y )(ωz + ω0z )(I2 − I3 ) − (ω̇x + ω̇0x )I1 = 0 (8.129) El resultado exhibe una dependencia “aditiva” con las velocidades angulares. Ejemplo 8.3.2 Si en el lagrangiano de un cuerpo rı́gido se realiza el siguiente cambio de variables: (φ, θ, ψ; φ̇, θ̇, ψ̇) → (φ, θ, ψ; ω 1 , ω 2 , ω2 ) (8.130) encontrar las ecuaciones de Lagrange correspondientes a las nuevas variables, o sea las ecuaciones de Euler.5 De acuerdo con las fórmulas (7.253), las fórmulas de transformación son: ω 1 = cos ψ θ̇ + senθ senψ φ̇ ; (8.131) ω 2 = −senψ θ̇ + senθ cos ψ φ̇ ; ω 3 = ψ̇ + cos θ φ̇ y las inversas: φ̇ = ψ̇ = 5 Ver senψ ω 1 + cos ψ ω2 ; senθ θ̇ = cos ψ ω1 − senψ ω2 − cot θ(senψ ω 1 + cos ψ ω 2 ) + ω3 el texto de Corben y Stehle, Classical mechanics, sección 77, capı́tulo 13, 1960. (8.132) 274 / Mecánica clásica Si llamamos q̇1 = φ̇, q̇2 = θ̇, q̇3 = ψ̇, estas fórmulas pueden escribirse en forma de matrices: ~ω = α̃~q˙ ; ~ q~˙ = β̃ ω donde α̃ y β̃ son:  senθ senψ   α̃ =   senθ cos ψ  cos θ     β̃ =    (8.133) cos ψ 0 −senψ 0    0    1 senψ senθ cos ψ senθ cos ψ −senψ −senψ cot θ − cos ψ cot θ 0  (8.134)    0    1 Si llamamos L̃(q, ω) a L[q, q̇(ω)] obtenemos que: ∂L ∂ L̃ ∂ L̃ ∂αsu = + q̇u ∂qr ∂qr ∂ωs ∂qr (8.135) d ∂ L̃ d ∂L = αsr dt ∂ q̇r dt ∂ωs (8.136) y que: Multiplicando a (8.135) y (8.136) por βrt y sumando sobre r llegamos a la siguiente expresión para las ecuaciones de Lagrange en L̃: ∂ L̃ ∂αsu ∂ L̃ βrt + βrt βuυ ω υ = ∂qr ∂ωs ∂qr βrt d ∂ L̃ ∂ L̃ ∂αsr αsr + βuυ ωυ βrt dt ∂ω s ∂ωs ∂qu (8.137) Usando la propiedad α̃β̃ = I˜ obtenemos finalmente: ∂ L̃ d ∂ L̃ ∂ L̃ βrt − = γtυs ωυ ; ∂qr dt ∂ωt ∂ω s donde: γtυs = ∂αsr ∂αsu − ∂qu ∂qr t = 1, 2, 3 βrt βuυ (8.138) (8.139) Para nuestro caso, el lagrangiano está dado por la ecuación (8.97): L̃(q, ω) = 1 ~ ~~ ~ ω · I · ω − V (q) 2 (8.140) Dinámica del cuerpo rı́gido / 275 y ası́: ∂ L̃ ∂V =− = Kr ; ∂qr ∂qr ∂ L̃ = ωr Ir ∂ωr (8.141) Por tanto obtenemos de (8.138): Kr βrt − ω̇ t It = 3 X γtυs ωυ ω s Is ; t = 1, 2, 3 (8.142) υ,s=1 Notemos que γtυs puede escribirse como Astυ − Atsυ , donde: Astυ = ∂αsm βmt βnυ ∂qn (8.143) que también puede escribirse como: ∂ α̃ β̃ βnυ Astυ = ∂qn st (8.144) De la expresión explı́cita para α̃ obtenemos que:   cot θ sen2 ψ cot θ senψ cos ψ 0     ∂ α̃ ∂ α̃ 2  cot θ cos ψ 0 β̃ = 0̃ ; β̃ =  cot θ senψ cos ψ  ∂q1 ∂q2   −senψ − cos ψ 0 ∂ α̃ β̃ = ∂q3  0   +   −1  0 1 0 1    −1 0   0 0 Se sigue entonces que:  cot θ sen2 ψ   Astυ =   cot θ senψ cos ψ  −senψ  0  0  (8.145)   0   0 cot θ senψ cos ψ 2 cot θ cos ψ − cos ψ 0    0   (cos ψ, senψ, 0)υ  0 st (8.146)   0 0   (−senψ cot θ, − cos ψ cot θ, 1)t  0 0 sυ Es simple concluir a partir de (8.146) que: γtυs = ǫtυs (8.147) 276 / Mecánica clásica Por tanto las ecuaciones (8.142) son: ω̇t It + 3 X ǫtυs ωυ ω s Is = Kr βrt ; t = 1, 2, 3 (8.148) υ,s=1 Kr son los torques alrededor de los ejes z, µ1 y z, en tanto que los lados derechos de (8.148) son los torques alrededor de los ejes x, y, z. Ejemplo 8.3.3 Otra variante de solución del ejemplo 8.3.1 puede obtenerse partiendo de las ecuaciones de Lagrange (8.138). Para este problema tenemos que: ∂ L̃ ~ ∂ω0 ω + ~ω 0 ) · I~ · = (~ ; ∂~q ∂~q ∂ L̃ ~ + ~ω 0 ) · ~I~ = (ω ~ ∂ω (8.149) En términos de componentes, las ecuaciones (8.138) son: 3 X r,m=1 βrt ∂ω0m (ω 0m + ωm )Im − ω̇ 0t + ω̇t It = ∂qr 3 X ǫtυs (ω s + ω0s )Is ω υ (8.150) υ,s=1 O en otra forma: (ω̇ 0t + ω̇t )It = 3 X ∂ω0m βrt − ǫt,m,r ω r (ω 0m + ω m )Im ∂qr r,m=1 Para cualquier función F se cumple que:  senψ/senθ cos ψ −senψ cot θ   ∂F β̃ =   cos ψ/senθ −senψ cos ψ cot θ ∂~q  0 0 1  ∂F/∂φ        ∂F/∂θ      ∂F/∂ψ ~ 0 , hallamos que: Usando la expresión (8.124) para ω   0 −ω03 ω 02     ∂ ~ω0  ω 0 −ω β̃ =  03 01   ∂~q   0 −ω 02 ω 01 (8.151) (8.152) (8.153) O en forma más explı́cita: ∂ ~ω0m βrt = −ǫmrt ω0r ∂qr (8.154) Dinámica del cuerpo rı́gido / 277 Con lo cual concluimos que (8.151) toma la forma: (ω̇ 0t + ω̇ t )It = 3 X r,m=1 ǫtrm (−ω0r − ωr )(ω 0m + ω m )Im (8.155) que coinciden con las ecuaciones (8.128) y (8.129) 8.4. El movimiento de un cuerpo rı́gido libre En este caso en las ecuaciones (8.102) y (8.103) no aparecen torques, Kr = 0. Esto se presenta, por ejemplo, cuando el centro de masa coincide con el punto fijo de modo que la gravedad no produce torques. El cuerpo rı́gido esférico. Se define por la condición I1 = I2 = I3 = I. ~ yω Es el único caso en el cual los vectores L ~ son paralelos: ~ = I~ L ω (8.156) ~ como ~ω serán constantes en magnitud y dirección. Cada Si no hay torques, tanto L punto del cuerpo rı́gido se moverá sobre trayectoria circular. No hay precesión de ~ω . La representación de Poinsot. Es una construcción geométrica que permite analizar el movimiento de un cuerpo rı́gido libre, el cual puede ser asimétrico. Fue elaborada por Poinsot (Parı́s, 1834) y se basa en el elipsoide de inercia, descrito en la sección 8.2. La ecuación del elipsoide de inercia está dada en (8.73). La normal al elipsoide en un punto cualquiera tiene la dirección del vector gradiente de F , siendo F la superficie (8.75): ∂F = (2xI1 , 2yI2 , 2zI3 ) = 2r(n1 I1 , n2 I2 , n3 I3 ) ∂~r (8.157) donde hemos tomado un sistema de ejes principales. Si escogemos el punto (x, y, z) sobre el eje de rotación, entonces: ω ~ = ω(n1 , n2 , n3 ) (8.158) De modo que (8.149) toma la forma: ∂F 2r 2r ~ = (ω1 I1 , ω2 I2 , ω3 I3 ) = L ∂~r ω ω (8.159) Hay dos puntos donde el eje de rotación corta la superficie del elipsoide de inercia. De (8.159) podemos concluir que en esos dos puntos siempre se cumple que la normal ~ Cuando no hay torques se cumple que L ~ y por a la superficie está en la dirección de L. ~ son constantes, independientemente de la forma que tenga el movimiento lo tanto ∇F del elipsoide de inercia, el cual se mueve solidariamente con el cuerpo rı́gido. La energı́a cinética se puede escribir en la forma: T = 1 ~ = ω ~r · L ~ ω·L ~ 2 2r (8.160) 278 / Mecánica clásica Cuerpo rígido Elipsoide de inercia b a 0 c r P L ∆ ω F Figura 8.4 Elipsoide de inercia que se puede llevar a la forma: ~ ·L ~ =0 (~r − d) (8.161) donde d~ es un vector definido por la relación: ~ = 2r T d~ · L ω (8.162) ~ entonces adquiere la forma: si escogemos a d~ paralelo a L, ~ L 2r T 2 d~ = ω L (8.163) ~ y es la normal al plano La expresión (8.161) es la ecuación de un plano, donde L y ~r es un punto del mismo. Como ~r es un punto particular (el punto donde se cortan el eje de rotación y el elipsoide de inercia) que puede estar cambiando con el tiempo, vemos entonces que el elipsoide se mueve de tal manera que el punto donde se corta con el eje de rotación siempre permanece sobre un plano (véase figura 8.4). d~ es un vector constante, pues usando las relaciones: Ir2 = constante y T = 1 2 Iω = constante 2 ~ podemos escribir el vector d~ como una expresión que solo depende de T y L: √ 2Ir2 T ~ L d~ = L2 (8.164) (8.165) Dinámica del cuerpo rı́gido / 279 ~ son constantes, el plano es constante y se llama plano invariable. d~ Como d~ y L es la perpendicular trazada desde el centro del elipsoide al plano tangente, o sea que es ~ la lı́nea que contiene a d~ se llama lı́nea invariable. igual a la proyección de ~r sobre L; Línea invariable Polodia Plano invariable 0 r d P Herpolodia r –d ω L Figura 8.5 El elipsoide de inercia rueda sin deslizar sobre el plano invariable Podemos concluir que el elipsoide de inercia toca al plano invariable en el punto donde el eje de rotación corta al elipsoide. El radio vector de O a P, ~r, está sobre el eje instantáneo de rotación; no hay movimiento relativo entre un punto del elipsoide y un punto del plano; por lo tanto el elipsoide de inercia rueda sin deslizar sobre el plano invariable; en efecto, P está sobre el eje de rotación y por ello es el único punto del elipsoide de inercia que está en reposo instantáneamente (véase figura 8.5). Como ω ~ es ~ es proporcional a d: ~ proporcional a ~r, la proyección de ~ω sobre L ~ ω ~ ·L ~ = 2T L ~ = L 2 L L2 r 2T ~ d Ir2 (8.166) ~ es constante; es decir, ω ~ o sea que la proyección de ~ ω sobre L ~ precesa alrededor de L, pero sin mantenerse constante el ángulo entre estos dos vectores, cuyo coseno está dado por: ~ ω ~ ·L Ir2 ω = ωL L r2 (8.167) ~ también puede Como ω y r pueden cambiar, se sigue que el ángulo entre ~ω y L cambiar, lo cual ocurre cuando el cuerpo es asimétrico. La curva trazada por el punto de contacto sobre el elipsoide de inercia se llama polodia (de odos, camino y polein, girar) y la curva correspondiente sobre el plano invariable se llama herpolodia (de herpeton, reptil). ~ no es constante, ver ecuación (8.105). De Respecto a los ejes del cuerpo rı́gido L modo que (8.160) ya no representa un plano, sino un elipsoide que es precisamente 280 / Mecánica clásica el elipsoide de inercia. Es fácil demostrar que respecto a los ejes del cuerpo rı́gido la ~ es una constante: magnitud de L d 2 ~ =0 ~ ·L ~˙ = −2L ~· ω ~ ×L (8.168) L = 2L dt Esto implica que respecto a los ejes del sólido rı́gido ~r está además sobre el elipsoide: I12 x2 + I22 y 2 + I32 z 2 = Ir2 L2 2T (8.169) La polodia es, en consecuencia, el lugar geométrico de los puntos del elipsoide de inercia que satisfacen simultáneamente las ecuaciones (8.73) y (8.169); es decir, es el lugar geométrico de la intersección de dos elipsoides cuyos semiejes están dados respectivamente por: a2 : Ir2 Ir2 L2 Ir2 Ir2 L2 Ir2 Ir2 L2 , ; b2 : , ; c2 : , I1 I1 2T I1 I2 I2 2T I2 I3 I3 2T I3 (8.170) La existencia de una intersección está asegurada por las desigualdades evidentes: ~ I = ~n · I~ · ~n ≥ I1 ; I ≤ I3 ⇒ 2T I1 < L2 < 2T I3 (8.171) siendo I1 el más pequeño de los tres momentos principales de inercia e I3 el mayor. El cuerpo rı́gido simétrico libre en la representación de Poinsot. Cuando I1 = I2 6= I3 , dos de los semiejes del elipsoide de inercia son iguales, siendo éste un elipsoide de revolución. Las ecuaciones de la polodia son (8.169) y (8.73): I1 (x2 + y 2 ) + I3 z 2 = Ir2 ; I12 (x2 + y 2 ) + I32 z 2 = De estas ecuaciones obtenemos las siguientes: L2 (I1 I3 − I32 )z 2 = Ir2 I1 − 2T 2 2 I1 (I1 − I3 )(x + y ) = Ir 2 L2 − I3 2T Ir2 L2 2T (8.172) (8.173) Vemos que la polodia está situada a una distancia constante del origen, sobre el eje de simetrı́a, y es una circunferencia. El elipsoide rueda sin deslizar sobre el plano siendo la polodia una circunferencia, o sea que ~r es paralelo ~ω (el vector de posición del centro de la polodia). El vector forma el mismo ángulo con ~ω, es decir que está a lo largo del eje de simetrı́a, siempre tienen el mismo ángulo; es decir, el eje de simetrı́a y ~ω forman un ángulo que permanece constante, lo cual significa que ω ~ efectúa un movimiento de precesión alrededor del eje de simetrı́a. La proyección de ~ω sobre el eje z es constante y las proyecciones sobre los ejes x y y ejecutan movimientos armónicos simples con cierta frecuencia Ω. Respecto a los ~ (véase figura 8.6). El vector ~ω ejes espaciales, como se dijo, ~ω precesa alrededor de L precesa en los dos sistemas de ejes generando dos conos. En el sistema espacial ~ω precesa Dinámica del cuerpo rı́gido / 281 Cono del cuerpo rígido 0 Cono fijo ω z L Figura 8.6 El cono del cuerpo rı́gido rueda sin deslizar sobre el cono fijo ~ y en el sistema del cuerpo rı́gido precesa alrededor del alrededor del vector constante L eje de simetrı́a. En conclusión, el movimiento del cuerpo rı́gido puede obtenerse a partir del movimiento del cono del cuerpo rı́gido que rueda sin deslizar sobre el cono fijo. Es claro que para un cuerpo no simétrico la polodia no será una circunferencia, ~ω ~ En el cuerpo rı́gido no será constante, como tampoco el ángulo entre los vectores ~ω y L. asimétrico se presentarán estos tres movimientos: rotación alrededor del eje instantáneo ~ de rotación; precesión del eje instantáneo de rotación alrededor del vector constante L ~ y nutación del eje instantáneo de rotación al cambiar el ángulo entre los vectores ~ω y L. Es claro que la frecuencia de nutación es el doble de la frecuencia de rotación. Solución de las ecuaciones de Euler para un cuerpo rı́gido simétrico libre. Las ecuaciones de Euler para este problema toman la forma: I1 ω̇x = ωy ωz (I1 − I3 ) (8.174) I1 ω̇y = −ωx ωz (I1 − I3 ) (8.175) I3 ω̇z = 0 (8.176) De (8.174) y (8.175) obtenemos las siguientes dos ecuaciones: I12 ω̈x + ωx ωz (I1 − I3 )2 = 0 ; I1 ω̇y = −ωz ωx (I1 − I3 ) (8.177) O sea que la solución a las ecuaciones de Euler puede escribirse como: ωx = A sen(|Ω|t + δ) ; ωy = Ω A cos(|Ω|t + δ) |Ω| (8.178) ωz = constante, donde Ω está definida por: Ω= I1 − I3 ωz I1 (8.179) 282 / Mecánica clásica El resultado nos dice que el vector ~ω precesa alrededor de z a una rata constante |Ω|. Como no hay nutación se dice que la precesión es regular. El resultado está de acuerdo con las conclusiones obtenidas mediante la construcción de Poinsot. Ejemplo 8.4.1 Analizar el movimiento rotacional de la Tierra con un modelo de cuerpo rı́gido simétrico libre. La Tierra puede suponerse aproximadamente como un elipsoide achatado y con una distribución uniforme de materia. Entonces la masa total puede asumirse que está en el centro de masa, de modo que con esta aproximación los demás cuerpos celestes no realizarán torques. Los momentos principales de inercia respecto al centro para un elipsoide son: 1 1 1 I2 = M (a2 + c2 ) ; I3 = M (a2 + b2 ) (8.180) I1 = M (b2 + c2 ) ; 5 5 5 Con este modelo tenemos que para la Tierra se cumple: I3 ≈ I1 = I2 ; c≈a=b (8.181) La relación entre los diámetros polar y ecuatorial nos da: c = 0, 9672 (8.182) a Tomando el eje z a lo largo del eje polar y sabiendo que la rotación completa alrededor de un eje es un dı́a, obtenemos: 2π = 7, 272 × 10−5 rad/s (8.183) dı́a La magnitud de la precesión, A, dependerá de la medida en que difieran ω y ωz , que es pequeña. La frecuencia de precesión está dada por: I1 − I3 c |Ω| = (8.184) ωz = 0, 00328ωz ωz ≈ 1 − I1 a ωz ≈ El perı́odo de precesión será pues de unos 305 dı́as. Se ha observado que tal precesión se presenta siendo su amplitud pequeña. El “radio” de la polodia es aproximadamente de 5 a 8 metros. La polodia es una curva complicada que exhibe algo ası́ como una nutación. El perı́odo observado es de unos 427 dı́as; es una precesión no atribuible a torques; las discrepancias se deben a la idealización del modelo. Esta precesión es diferente a la precesión de los equinoccios, debida a los torques ejercidos por el Sol y la Luna, pues en realidad el centro de masa de la Tierra no coincide con el centro geométrico, el perı́odo de esta precesión es de 25.800 años. Esta precesión tampoco es la responsable de las estaciones. Éstas se deben a que el plano de la elı́ptica hace un ángulo de 23◦ con el plano ecuatorial de la Tierra. Las funciones elı́pticas de Jacobi. Haremos un resumen de las principales propiedades de estas funciones que, sabemos, aparecen en la solución general para un cuerpo rı́gido libre asimétrico.6 6 Véase el texto de Abramowitz y Stegun, Handbook of mathematical functions, capı́tulos 16 a 18, 1965; y las referencias dadas en él, especialmente el curso de análisis de Whittaker y Watson. Dinámica del cuerpo rı́gido / 283 Si z es una variable compleja, en general una función elı́ptica Fpq (z) es una función que posee un cero en el punto z = p y un polo en el punto z = q, donde p y q son los puntos de una red rectangular infinita en el plano complejo. En la construcción de esta red se parte de una celdilla elemental constituida por un rectángulo cuyos vértices están en los puntos O, K, K + iK ′ , iK ′ , llamados respectivamente s, c, d, n. Los números reales K y K ′ están definidos de la siguiente manera en función de un parámetro real m, 0 ≤ m ≤ 1: K= Z π/2 0 dθ √ ; 1 − msen2 θ K′ = Z π/2 0 dθ p 1 − (1 − m)sen2 θ (8.185) K se llama el cuartiperı́odo real e iK ′ el cuartiperı́odo complejo de la función elı́ptica Fpq (z). Estas funciones se llaman funciones elı́pticas de Jacobi y usualmente se denotan en la forma pqz. Hay doce de estas funciones que son sc z, sd z, sn z, cs z, cd z, cn z, ds z, dn z, dc z, ns z, nc z, nd z. La definición de las funciones elı́pticas de Jacobi es: (i) pq z tiene solamente singularidades aisladas; tiene un cero en p y un polo en q; (ii) Las funciones pq z son periódicas. Entre p y q hay un semiperı́odo de la función pq z, siendo 2K, 2iK ′ , 2K + 2iK ′ los perı́odos. Ası́ por ejemplo, las funciones copolares con polo en iK ′ , sn, cn y dn tienen respectivamente los perı́odos 2iK ′ , 2K + 2iK ′ y 2K, o equivalentemente los perı́odos 4K, 4K y 2K. Las funciones elı́pticas de Jacobi pueden definirse también con respecto a ciertas integrales. Si: z= Z φ 0 dθ √ 1 − m sen2 θ (8.186) el ángulo φ es llamado la amplitud y m el parámetro. φ = am z (8.187) Entonces se definen las funciones ası́: sn z = sen φ ; cn z = cos φ ; dn z = p 1 − m sen2 φ (8.188) Todas las otras nueve funciones pueden expresarse en función del trio copolar sn, cn, dn. Estas funciones aparecen al evaluar ciertas integrales, llamadas integrales elı́pticas, que son de la forma: Z R(x, y) dx (8.189) donde R(x, y) es una función racional de x, y, donde y 2 es igual a un polimonio en x de grado 3 o de grado 4. Cuando R(x, y) sólo contiene potencias pares de y, o cuando el polimonio y 2 tiene un factor repetido la integral (8.189) es elemental. En todos los demás casos aparecerán las funciones elı́pticas. Cualquier integral elı́ptica puede expresarse 284 / Mecánica clásica en términos de las integrales elı́pticas de primera, segunda y tercera clase, definidas respectivamente por: Z φp Z φ dθ √ ; 1 − m sen2 θ dθ ; 1 − m sen2 θ 0 0 (8.190) Z φ dθ p (1 − n sen2 θ)(1 − m sen2 θ) 0 Cuando φ = π/2, las integrales (8.190) se llaman integrales elı́pticas completas de primera, segunda y tercera clase. Cuando el parámetro toma el valor cero las funciones elı́pticas coinciden con funciones circulares. Cuando el parámetro es tan pequeño que podemos despreciar términos de orden superior a m2 tenemos las aproximaciones: sn z = 1 sen z − m(z − sen z cos z) cos z + ... 4 cn z = 1 cos z + m(z − sen z cos z) sen z + ... 4 dn z = 1 1 − m sen2 z + ... 2 (8.191) 1 z − m(z − sen z cos z) + ... 4 Cuando m tiende a la unidad, las funciones elı́pticas coinciden con funciones hiperbólicas; por ejemplo sn z → tanh z; cn z → 1/ cosh z; dn z → 1/ cosh z. A partir de la ecuación diferencial que sirve para definir la función sn podemos obtener buena información del comportamiento de las funciones elı́pticas, para z real. La ecuación (8.186) equivale a la ecuación diferencial: 2 dφ = 1 − msen2 φ (8.192) dx an z = Mediante la sustitución y = sen φ, (8.192) se transforma en: 2 dy = (1 − y 2 )(1 − my 2 ) dx (8.193) 2 Claramente y = sen x es la solución cuando m = 0 (véase figura 8.7). (dy/dx) √ es igual a una función continua de y que se anula en y = ±1 y √ en y = ±1/ m; en m la derivada vale y = ±1 la derivada de esa función vale ±2(m − 1) y en y = ±1/ √ ∓2(m − 1)/ m. De (8.193) podemos deducir las siguientes propiedades de la solución, y = s nx: (i) Si y(x) es una solución, y(x + c) es una solución ya que ni y ni dy/dx cambian en una translación en el eje x. (ii) y(x) está siempre contenida √ entre los valores y = −1 y y = +1 puesto que para valores absolutos de y entre√1 y 1/ m, dy/dx es imaginaria, como también lo es para valores de y mayores que 1/ m. Dinámica del cuerpo rı́gido / 285 (iii) Como para todos los valores de y entre −1 y +1 la derivada dy/dx es no nula, se sigue que en el intervalo (−1, +1) no hay otros puntos diferentes a y = ±1 donde la pendiente se anule dentro del intervalo. (iv) Sólo hay una curva y(x) que toca una de las lı́neas y = −1 o y = +1 en un punto x0 dado. Para x < x0 y para x > x0 la pendiente de y en la vecindad de x0 tiene valores opuestos. Por ejemplo, si (x = x0 , y = −1) es el punto en cuestión, se sigue integrando (8.193): Z y dy p x − x0 = − 2 (1 − y )(1 − my 2 ) −1 (8.194) Z y dy p x − x0 = (1 − y 2 )(1 − my 2 ) −1 según que dy/dx sea negativa o positiva respectivamente. y y=1 dn x sn x x0 x 2K cn x y = –1 Figura 8.7 Funciones circulares cuando se desprecian términos de orden superior a m2 Cuando (x, y) tiende a (x0 , −1), las ecuaciones (8.194) dan la única curva y(x) que satisface la condición de tangencia. (v) La curva y(x) es inalterada mediante una reflexión en el origen. Basta con conocer la curva entre y = 0 y y = 1, o equivalentemente entre x = 0 y x = K para construir la curva total. (vi) La distancia en x entre dos sucesivos contactos de y(x) con las lı́neas y = −1 y y = +1 está dada por: Z +1 dy p (8.195) 2K = 2 (1 − y )(1 − my 2 ) −1 286 / Mecánica clásica (vii) De la simetrı́a de la curva respecto a la normal en el punto de contacto con una de las lı́neas y = −1 o y = +1, se sigue que y(x) es periódica con perı́odo 4K. Podemos entonces definir a sn x por las siguientes propiedades: 2 dsn x = (1 − sn2 x)(1 − msn2 x) ; sn0 = 0 dx (8.196) dsn x = 1 ; sn(x + 4K) = sn x dx x=0 Podemos definir las funciones cn x y dn x por las ecuaciones: cn2 x = 1 − sn2 x ; dn2 x = 1 − msn2 x (8.197) con la condición de que las funciones y sus derivadas sean continuas. Como 0 ≤ m ≤ 1, dnx siempre puede tomarse positiva. El perı́odo de cn x es 4K y el de dn x es 2K. Se sigue de (8.196) que: dsn x = cn x dn x dx (8.198) de (8.196) y (8.197) se sigue entonces que: dcn x = −sn x dn x ; dx ddn x = −m sn x cn x dx (8.199) La figura 8.7 muestra las funciones elı́pticas de Jacobi sn, cn y dn, para m = 1/2. Con las funciones elı́pticas es posible hallar fórmulas análogas a las de la trigonometrı́a ordinaria. Por ejemplo, la fórmula de adición para la función sn es: sn(u ± υ) = sn u cn υ dn υ ± sn υ cn u dn u 1 − m sn2 u sn2 υ (8.200) Algunos valores notables de sn son: sn 0 = 0 ; sn K = 1 ; 1 sn(K + iK ′ ) = √ ; m sn iK ′ = ∞ sn K 1 =p √ 2 1 + m1 (8.201) Con estas fórmulas podemos hallar la siguiente relación últil: 1 ±√ = ±sn(u ± iK ′ ) m sn u (8.202) dada por la fórmula 16.8.1 del libro de Abramowitz, Op. cit. Relacionadas con las funciones elı́pticas están las funciones θ, denotadas por θ1 (z, q), θ2 (z, q), θ3 (z, q), θ4 (z, q), cuyas definiciones están en la sección 16.27 del libro de Abramowitz. Otros autores usan la notación siguiente para las mismas funciones: θ11 , θ10 , θ00 , θ01 , como en el Tratado de mecánica analı́tica de Wittaker, o en el texto de mecánica de Dinámica del cuerpo rı́gido / 287 Landau (ver bibliografı́a). Nos interesará la función θ4 que tiene la siguiente expresión como un producto infinito (fórmula 16.37.4 del del libro de Abramowitz): 1/2 Y ∞ m θ4 (v) = θ4 (0) (1 − 2q 2n−1 cos 2v + q 4n−2 ) (8.203) 16qm21 n=1 donde m y m1 = 1 − m tienen la misma significación que en las funciones elı́pticas, y ϑ y q están definidas por: ′ πu ; q = e−πK /K (8.204) v= 2K La siguiente expresión para θ4 (v) como un producto infinito es más útil: θ4 (v) = constante ∞ Y (1 − q 2n−1 e2iv )(1 − q 2n−1 e−2iv ) (8.205) n=1 Tomando logaritmos en esta expresión y derivando respecto a v llegamos a la siguiente fórmula para la derivada logarı́tmica de θ4 : ∞ θ4′ (v) X −2iq 2n−1 e2iv 2iq 2n−1 e−2iv + = (8.206) θ4 (v) n=1 1 − q 2n−1 e2iv 1 − q 2n−1 e−2iv Esta expresión tiene polos simples donde θ4 tiene ceros simples, o sea cuando v es tal que: e±2iv = ei(2n−1)πiK ′ /K (8.207) es decir, cuando u = 2Kv/π, vale: urm = (2r + 1)iK ′ + 2mK ; r, n = 0, ±1, ±2. . . ± ∞ (8.208) Con esta expresión para los polos de θ4′ /θ4 podemos formar la serie de Laurent para esta función: +∞ +∞ X X brm θ4′ (v) = θ4 (v) r=−∞ m=−∞ v − vrm (8.209) donde brm son los residuos de la función que obtenemos de: brm = lı́m (v − vrm ) v→vrm θ4′ (v) θ4 (v) (8.210) Evaluando esta expresión llegamos finalmente a: +∞ +∞ X X 1 θ4′ (v) = θ4 (v) r=−∞ m=−∞ v − vrm (8.211) Solución de las ecuaciones de Euler para un cuerpo rı́gido asimétrico libre.7 Supondremos que I3 > I2 > I1 . De acuerdo con la representación de Poinsot, 7 Este problema fue resuelto por Jacobi en 1849. 288 / Mecánica clásica las ecuaciones de la polodia están dadas por la intersección del elipsoide de inercia con el elipsoide del momento angular: I1 ω21 + I2 ω 22 + I3 ω 23 = 2E (8.212) I12 ω21 + I22 ω 22 + I32 ω23 = L2 De estas ecuaciones podemos obtener las siguientes expresiones para ω21 y ω23 en función de ω 22 : ω21 = 1 [(2EI3 − L2 ) − I2 (I3 − I2 ) ω 22 ] I1 (I3 − I1 ) (8.213) ω23 = 1 [(L2 − 2EI3 ) − I2 (I2 − I1 ) ω 22 ] I3 (I3 − I1 ) (8.214) La ecuación de Euler para ω2 , (8.214), toma entonces la forma: ω̇2 = 1 √ (2EI3 − L2 ) − I2 (I3 − I2 )ω 22 · I2 I1 I3 2 (L − 2EI1 ) − I2 (I2 − I1 )ω 22 1/2 (8.215) Al separar variables e integrar obtenemos una expresión que se puede reducir a una integral elı́ptica incompleta de primera clase en la forma normal, llamando: b2 = 2EI3 − L2 ; I2 (I3 − I2 ) a2 = L2 − 2EI1 I2 (I2 − I1 ) (8.216) Si para precisar suponemos que 2EI3 > L2 > 2EI2 , encontramos entonces que a2 y b son positivas. Notamos que al expresar a L y a E en función del momento de inercia alrededor del eje de rotación I, esta condición nos dice que I3 > I > I2 > I1 , con lo cual obtenemos que a es mayor que b. Con estas sustituciones, y escogiendo t = 0 de modo que ω 2 sea igual a cero, la integral de (8.215) es de la forma: 2 I1 I2 I3 t= (I3 − I2 )(L2 − 2EI1 ) 1/2 Z 0 ω2 a dω 2 p 2 (a − ω 22 )(b2 − ω 22 ) (8.217) Mediante la fórmula 17.4.45 del Handbook of mathematical functions de Abramowitz y Stegun, la integral en (8.217) puede llevarse a la forma de una integral elı́ptica de primera clase con parámetro m dado por: m= I2 − I1 2EI3 − L2 b2 = 2 a I3 − I2 L2 − 2EI1 (8.218) Esta integral puede expresarse en términos de la función elı́ptica sn de acuerdo con (8.188). En efecto, haciendo en (8.217) la sustitución señalada en la fórmula del Handbook: ω2 = b sn v (8.219) Dinámica del cuerpo rı́gido / 289 y teniendo en cuenta que, según (8.198): dω 2 = b cn v dn v dv (8.220) obtenemos en el lugar de la integral de (8.217): Z v dn v dv ω2 √ = v = sn−1 2 b 1 − msn v 0 (8.221) Si llamamos: 1/2 (I3 − I2 )(L2 − 2EI1 ) c= I1 I2 I3 (8.222) entonces (8.217) se reduce, llamando b2 = b, a: ω 2 = b2 sn ct (8.223) Reemplazando a ω2 (t) en (8.213) y (8.214) obtenemos para ω 1 y ω 3 : ω1 = b1 sn ct ω3 = b3 sn ct (8.224) donde b1 y b3 están dadas por: b21 = 2EI3 − L2 ; I1 (I3 − I1 ) b23 = L2 − 2EI1 I3 (I3 − I1 ) (8.225) Al reemplazar la solución (8.224) en las ecuaciones de Euler, éstas resultan compatibles si el producto b1 b2 b3 es negativo. ω1 y ω2 son periódicas con perı́odo 4K y ω3 es periódica con perı́odo 2K, donde K es la integral elı́ptica completa de primera clase. El perı́odo que nos interesa es con respecto al tiempo que está dado por: T = 4K c (8.226) ~ De acuerdo con la construcción de Poinsot, al cabo de un tiempo T el vector ω completa un ciclo de precesión alrededor del eje z, es decir, ω 1 y ω 2 coinciden consigo mismas, en tanto que al cabo de un tiempo T /2, ω 3 coincide consigo misma. El problema no termina hallando a ω r (t), pues interesa describir el movimiento absoluto del cuerpo rı́gido en el espacio, o sea hallar los ángulos de Euler en función del tiempo. Reemplazando las expresiones (8.224) y (8.225) en (8.131), obtenemos tres ecuaciones diferenciales para θ, φ y ψ, cuya solución es complicada cuando los ejes espaciales se toman arbitrariamente, pero se simplifica un poco tomando el eje z en la dirección de ~ Como el ángulo polar y el ángula lı́nea invariable definida por el vector constante L. ~ lo acimutal del vector L, que coincide con el eje z, son respectivamente θ y π/2 − ψ, podemos sin más escribir: L1 = L senθ senψ ; L2 = L senθ cos ψ ; L3 = L cos ψ (8.227) 290 / Mecánica clásica Como Lr = Ir ω r obtenemos que: 1/2 I3 (L2 − 2EI1 ) I3 ω 3 = dn ct cos θ = L L2 (I3 − I1 ) tan ψ = I1 ω 1 I1 (I3 − I2 ) = I2 ω 2 I2 (I3 − I1 ) 1/2 (8.228) cn ct sn ct θ y ψ al igual que las componentes de ~ω son funciones periódicas, con perı́odo igual al de la función dn, o sea T /2. En efecto, dn z y cn z/sn z = cs z son coperiódicas con perı́odo 2K. El ángulo φ se puede obtener de (8.132) y (8.228). El resultado para φ̇ en función de las componentes de ~ω solamente es: φ̇ = I1 ω 21 + I2 ω 22 L I12 ω 21 + I22 ω22 (8.229) φ̇ es periódica con perı́odo T /2. En general, φ no se incrementará por un múltiplo de 2π en un perı́odo y por ello el movimiento del cuerpo rı́gido como un todo no es periódico, o sea que el cuerpo rı́gido en general no vuelve nunca a su posición inicial. En efecto, reemplazando en (8.229) las expresiones (8.224) y (8.225) obtenemos: φ̇ = L (I3 − I2 ) + (I2 − I1 )sn2 ct I1 (I3 − I2 ) + I3 (I2 − I1 )sn2 ct (8.230) Ahora, podemos definir una cantidad real β por medio de estas expresiones que son mutuamente consistentes: 1/2 1/2 I(I3 − I1 ) I3 (I − I1 ) ; cn iβ = sn iβ = i I1 (I3 − I) I1 (I3 − I) (8.231) 1/2 I2 (I3 − I1 ) dn iβ = I1 (I3 − I2 ) I que no es el momento de inercia respecto al eje de rotación, está dado por: L2 2E de modo que la expresión para m toma la forma: I= m= I3 − I I2 − I1 I − I1 I3 − I2 (8.232) (8.233) φ̇ toma la siguiente forma al reemplazar a (8.231) en (8.230): φ̇ = L I2 + (I1 dn2 iβ − I2 )sn2 ct I1 I2 1 − m sn2 iβ sn2 ct (8.234) Esta expresión es de la forma (Ax + Bsn2 ct)/(Cx + Dsn2 ct) o sea es el cociente de dos funciones lineales de x. Al efectuar el cociente llegamos a: 1 dn2 iβ sn2 ct 1 L +L − (8.235) φ̇ = I1 I2 I1 1 − m sn2 iβ sn2 ct Dinámica del cuerpo rı́gido / 291 Examinemos la estructura analı́tica del segundo término en (8.235). Tiene singularidades en los valores de ct tales que se anula el denominador: ±1 sn ct = √ = sn (±iβ + iK ′ ) m sn iβ (8.236) donde hemos usado la fórmula (8.202). Usando la propiedad de la función sn de ser doblemente periódica, con perı́odos 2iK ′ , 4K y 4K + 4iK ′, podemos concluir de (8.236) que snu = (−1)r sn (u + 2mK + 2riK ′ ) y por lo tanto: (−1)r ct = ±iβ + (2r + 1)iK ′ + 2mK ; r, m = 0, ±1, ±2, ... (8.237) Estos ceros del denominador son simples, o sea que la función puede expandirse en series de Laurent de la forma (8.209): " X +∞ +∞ X 1 1 arm L − I2 I1 r=−∞ m=−∞ (−1)r ct + iβ − urm (8.238) # brm − + constante (−1)r ct − iβ − urm Para evaluar los residuos, expandimos el denominador en (8.235) en serie de Taylor alrededor de los ceros, (8.237): 1 − m sn2 iβ sn2 ct = 1 − m sn2 iβ sn2 (±iβ + iK ′ ) + [(−1)r ct − (±iβ + urm )] 2m sn2 iβ sn(±iβ + iK ′ )· (8.239) cn(±iβ + iK ′ ) dn(±iβ + iK ′ ) donde hemos usado la periodicidad de las funciones elı́pticas. Usando (8.236) y luego las expresiones (8.231), llegamos a que arm y brm valen respectivamente: ± 1/2 dn iβ 1 I1 I2 (I3 − I2 )(I − I1 ) =± 2m sn iβ cn iβ 2i II3 (I2 − I1 ) (8.240) Los residuos del segundo término de (8.235) son entonces: ±i c 2 (8.241) Por tanto el segundo término del lado derecho de (8.235) es: " +∞ +∞ 1 c X X i r 2 r=−∞ m=−∞ (−1) ct + iβ − urm − # 1 + constante (−1)r ct − iβ − urm (8.242) 292 / Mecánica clásica Es fácil ver que u−r,−m = ur−1,m , con lo cual es posible hacer que los términos con r impares tengan la misma forma de los términos con r pares. Entonces (8.242) es igual a una expresión que no contiene el (−1)r . Usando la expresión (8.226) para c y luego multiplicando numeradores y denominadores por π/(2K), obtenemos: " +∞ +∞ π X X 1 i T r=−∞ m=−∞ π (ct + iβ) − vrm 2K (8.243) # 1 + constante − π (ct − iβ) − vrm 2K Comparando ahora a (8.243) con (8.236), obtenemos finalmente la siguiente expresión para φ̇ en términos de las funciones θ: " L iπ θ4′ [(ct + iβ)π/(2K)] φ̇ = + I1 T θ4 [(ct + iβ)π/(2K)] # θ4′ (iβπ/2K) θ4′ [(ct − iβ)π/(2K)] (8.244) −2 − θ4 [(ct − iβ)π/(2K)] θ4 (iβπ/(2K) La integración ahora es simple: 2π t + iα L i 2πi θ4′ (iα) T φ(t) = t + ln − 2π I1 T θ4 (iα) 2 θ4 t − iα T θ4 (8.245) donde definimos a α = πβ/(2K). De acuerdo con la expresión (8.203), la función θ4 (v) tiene perı́odo π y además es función par de v, de modo que al completarse un perı́odo de θ y ψ, o sea cuando t = T /2, el término logarı́tmico de φ se anula. Entonces: T L T θ′ (iα) φ = − πi 4 (8.246) 2 I1 2 θ4 (iα) Como θ4 tiene la expansión: θ4 (v) = 1 − 2q cos v + 2q 4 cos4 v − ... Entonces: T LT q senh2α − 2 q 4 senh4α + ... φ = + 4π 2 2I1 1 − 2q cosh 2α + 2q 4 cosh 4α − ... (8.247) (8.248) sólo en circunstancias muy especiales esta expresión será un múltiplo entero de 2π; por esta razón el cuerpo rı́gido no vuelve nunca a su posición inicial. Ejemplo 8.4.2 Estudiar la estabilidad de las rotaciones de un cuerpo rı́gido asimétrico libre alrededor de cada uno de los ejes principales. Dinámica del cuerpo rı́gido / 293 Asumamos que el cuerpo inicialmente gira alrededor del eje x1 y que además I3 > I2 > I1 . Por efecto de alguna pequeña perturbación el cuerpo adquiere rotaciones alrededor de los otros ejes; asumiremos que ω2 y ω3 son entonces cantidades pequeñas en comparación con ω1 . La ecuación de Euler para ω1 contendrá el producto ω2 ω3 , o sea que al primer orden en estas cantidades ω 1 es constante. Esto permite resolver fácilmente las otras dos ecuaciones de Euler: I3 − I1 I1 − I2 ω˙2 = ω 1 ω 3 ; ω˙3 = ω1 ω 2 (8.249) I2 I3 De aquı́ obtenemos la siguiente ecuación diferencial para ω2 : (I1 − I3 )(I1 − I2 ) 2 2 ω¨2 + ω1 ω2 = 0 I2 I3 (8.250) Esta ecuación tiene como solución: ω 2 = A sen(Ω1 t + δ) (8.251) donde A es una cantidad pequeña y Ω1 satisface: 1/2 (I3 − I1 )(I2 − I1 ) ω1 Ω1 = I2 I3 (8.252) Como Ω1 es real, entonces ω 2 y ω 3 tendrán movimientos oscilatorios con frecuencia Ω1 . La rotación alrededor de x1 es estable. De manera similar, cuando el cuerpo rota inicialmente alrededor de x3 , el movimiento es estable con frecuencia: 1/2 (I3 − I2 )(I3 − I1 ) ω3 (8.253) Ω3 = I1 I2 Sin embargo, cuando el cuerpo rota inicialmente alrededor de x2 el movimiento es inestable porque Ω2 resulta imaginario. O sea que para rotaciones alrededor del eje de menor momento de inercia o del eje de mayor momento de inercia hay estabilidad, siendo inestable la rotación alrededor del eje correspondiente al momento de inercia intermedio. Para un cuerpo rı́gido simétrico, digamos para el cual I1 = I2 , es fácil mostrar que solamente es estable la rotación alrededor del eje x3 . Ejemplo 8.4.3 Calcular los diferentes perı́odos asociados con el movimiento libre de un elipsoide homogéneo asimétrico cuyos semiejes tienen las longitudes a = 0, 1m, b = 0, 2m, c = 0, 3m y cuya masa es de 1 kg. Los valores iniciales de las componentes de la velocidad angular alrededor de los ejes principales son ω1 = πs−1 , ω 2 = 10πs−1 , ω 3 = πs−1 , asumiendo que I1 < I2 < I3 . De acuerdo con las fórmulas (8.180), los valores de los momentos principales de inercia son: I1 = 0, 010 kg m2 ; I2 = 0, 020 kg m2 ; I3 = 0, 026 kg m2 (8.254) Los valores de las constantes de movimiento 2E y L son: 2E = 2, 036π 2J ; L2 = 0, 040776π 2J2 s2 (8.255) 294 / Mecánica clásica Reemplazando estos valores en (8.232) hallamos que I vale: I = 0, 0200275 kg m2 (8.256) Definiendo el ángulo modular γ como m = sen2 γ, y usando la fórmula (8.218) para m hallamos que m y γ valen: m = 0, 9926866 ; γ = 85, 09◦ (8.257) La tabla 17.2 del texto de Abramowitz y Stegun nos da los siguientes valores para q, K y K ′ , usando interpolación lineal: K = 3, 8516333 ; K ′ = 1, 5736950 ; q = 0, 2770075 (8.258) La cantidad c, dada por (8.222), vale: c = 4, 8535462 πs−1 (8.259) El perı́odo de los ángulos θ y ψ es T = 4K/c, que tiene el valor 1,010 s. Para hallar el perı́odo de φ debemos calcular el valor de β. La fórmula (8.231) nos da que: dn iβ = 2, 3094003 (8.260) La transformación imaginaria de Jacobi dice que dn iβ = dc1 β, donde el subı́ndice indica que el módulo de la función elı́ptica es m1 . Notando que dc1 = dn1 /cn1 y luego expresando a cn1 y dn en función de sn1 , obtenemos que: sn21 β = 1 − dn2 iβ = 0, 8136155 1 − m − dn2 iβ (8.261) Entonces sn1 β = 0, 9020063. β será igual al valor de la integral elı́ptica incompleta de primera clase con ángulo modular γ1 = 90◦ − 85, 09◦ = 4, 91◦ y amplitud igual a arcsen(0, 9020063) = 64, 45◦. De la tabla 17.5 del manual hallamos el valor mediante interpolación: β = 1, 1258087 (8.262) Entonces α = πβ/(2K) = 0, 459134. Reemplazando este valor en (8.248) obtenemos: T φ = 7, 303 × 2π 2 (8.263) O sea que al movimiento en φ hay asociado otro perı́odo T ′ cuyo valor es T ′ = 0, 069 s, que es el perı́odo precesional alrededor de la lı́nea invariable, o sea el movimiento medio de φ. Este problema pertenece al caso tercero del ejemplo 8.4.2, donde se señaló que Ω22 resulta negativa. En efecto: Ω22 = ω22 (I2 − I1 )(I2 − I3 ) = −227, 759 s−2 I1 I3 a lo cual corresponde un tiempo caracterı́stico de 0, 0662 s. (8.264) Dinámica del cuerpo rı́gido / 295 8.5. El trompo con el punto inferior fijo en un campo gravitacional homogéneo Whittaker en su tratado de dinámica analı́tica define un trompo como un cuerpo rı́gido simétrico alrededor de un eje, que termina en una punta en un extremo del eje. Aquı́ estudiaremos el movimiento del trompo bajo la acción de la gravedad cuando la punta permanece fija. Este problema fue estudiado por Lagrange en 1788. La figura 8.8 muestra el sistema de ejes empleados. Los ejes x, y, z, son un sistema z z y c.g. l θ mg y 0 ψ x φ x Figura 8.8 Trompo con el punto inferior fijo en un campo gravitacional. Sistema de ejes. de ejes principales en el punto fijo O. Si los momentos principales respecto al centro de gravedad son I1c , I2c , I3c , podemos usar el teorema de Steiner para evaluarlos respecto al punto O: I1 = ml2 + I1c ; I2 = ml2 + I2c ; I3 = I3c (8.265) como el cuerpo rı́gido es simétrico entonces I1 = I2 . Las ecuaciones de movimiento. El lagrangiano respecto a los ejes x, y, z, es: L= 1 1 I1 (ωx2 + ωy2 ) + I3 ωz2 − mgl cos θ 2 2 (8.266) Usando las ecuaciones (8.131) que expresan las ωi en función de los ángulos de Euler podemos expresar a L en términos de los ángulos de Euler: L= 1 1 I1 (θ̇2 + φ̇2 sen2 θ) + I3 (ψ̇ + φ̇ cos θ)2 − mgl cos θ 2 2 (8.267) 296 / Mecánica clásica φ y ψ son coordenadas cı́clicas y por lo tanto sus momentos canónicos conjugados son constantes de movimiento: pφ = (I1 sen2 θ + I3 cos2 θ)φ̇ + I3 ψ̇ = Lz ≡ I1 b pψ = I3 (ψ̇ + φ̇ cos θ) = Lz = I3 ωz ≡ I1 a (8.268) a, b y ωz son constantes. El torque de la gravedad produce rotaciones sólo alrededor de la lı́nea de nodos, en tanto que alrededor de z y z no hay torques, razón por la cual Lz y ~ no son constantes pero sı́ la energı́a Lz han de conservarse. Las otras componentes de L total: 1 1 I1 (θ̇2 + φ̇2 sen2 θ) + I3 (ψ̇ + φ̇ cos θ)2 + mgl cos θ 2 2 E= (8.269) Las ecuaciones (8.268) y (8.269) constituyen un conjunto de tres ecuaciones diferenciales simultáneas para θ, φ, ψ; por lo tanto son equivalentes a las ecuaciones de Lagrange para estas cantidades. En efecto, φ̇ y ψ̇ pueden expresarse en función de θ solamente: φ̇ = b − a cos θ sen2 θ ψ̇ = I1 a b − a cos θ − cos θ I3 sen2 θ (8.270) Como E depende sólo de ψ̇, θ̇, φ̇ y θ, puede expresarse en términos de θ̇ y θ dando una ecuación diferencial para θ: 1 1 (b − a cos θ)2 1 I3 ωz2 + I1 θ̇2 + I1 sen2 θ + mgl cos θ 2 2 2 sen4 θ (8.271) 1 1 1 (b − a cos θ)2 E ′ = E − I3 ωz2 = I1 θ̇2 + I1 + mgl cos θ 2 2 2 sen2 θ (8.272) E= o sea que: Vemos que la variación de θ es la misma que se presentarı́a en un sistema dinámico con un grado de libertad para el cual las energı́as cinética y potencial son respectivamente: 1 2 I1 θ̇ ; 2 1 (b − a cos θ)2 I1 + mgl cos θ 2 sen2 θ (8.273) Llamando u = cos θ la ecuación (8.272) toma la forma: u̇2 = (α − βu)(1 − u2 ) − (b − au)2 = f (u) (8.274) donde se definen a α y β como: α= 2E ′ ; I1 β= 2mgl I1 (8.275) Dinámica del cuerpo rı́gido / 297 La energı́a potencial efectiva. Está dada por la segunda expresión en (8.273), que en términos de u toma la forma: 1 (b − au)2 Vef (u) = I1 + βu (8.276) 2 1 − u2 Podemos entonces escribir a f (u) como: f (u) = 2 [E ′ − Vef (u)] (1 − u2 ) I1 (8.277) Las figuras 8.9 y 8.10 muestran las funciones Vef (θ), Vef (u) y f (u). Vef (u) f (u) E′ E′0 u –1 u1 u0 0 u2 +1 u3 Figura 8.9 Funciones Vef (u) y f (u) Vemos que para un valor dado de E ′ habrá dos valores de u, u1 y u2 para los cuales E = Vef (u), o sea para los cuales u̇ = 0 (θ̇ = 0). Éstos son los puntos de retorno de la coordenada θ. Vemos que en general θ oscilará entre θ1 y θ2 esto es, habrá nutación. Cuando E ′ = E0′ entonces u1 = u2 = u0 y no habrá nutación; este caso corresponde a la precesión estable o regular. u1 y u2 corresponden a los ceros de la función f (u) en el intervalo entre u = −1 y u = 1. La función f (u) es un polimonio cúbico en u que tiene el siguiente comportamiento. En u = ±1 la función f es negativa, puesto que f (±1) = −(b ∓ a)2 . Para algunos valores de u entre −1 y +1, f (u) debe de ser positiva porque el lado izquierdo en (8.274) es positivo. Cuando u → ∞, f (u) es positiva y cuando u → −∞, f (u) es negativa. La figura 8.9 muestra el comportamiento de f (u), la cual tiene por lo tanto dos raı́ces reales u1 y u2 que se sitúan entre −1 y +1, y la tercera raı́z u3 es también real y mayor que +1 (que corresponde a un valor de θ imaginario puro). Llamemos a esas raı́ces cos θ1 , cos θ2 , cosh θ3 , donde hemos convenido en designar con θ3 al módulo del ángulo correspondiente a u3 y donde cos θ2 > cos θ1 , con lo cual θ1 > θ2 . E0′ es el valor de E ′ para el cual θ1 y θ2 son iguales, o sea, el valor de E ′ en el cual Vef tiene un mı́nimo. Este caso es análogo al de las órbitas circulares en el problema de ′ 298 / Mecánica clásica Vef (θ) E′ E′0 0 θ2 θ0 θ1 π θ Figura 8.10 Energı́a ptencial efectiva Vef (θ) y Vef (u) las fuerzas centrales entre dos partı́culas. Integración de la ecuación diferencial para θ. Realicemos la siguiente transformación (Whittaker, Op. cit., p. 157): u= α + a2 4 z+ β 3β (8.278) Al sustituir esta expresión en (8.274) obtenemos: ż 2 = 4z 3 − g2 z − g3 = 4s(z) (8.279) Si u1 , u2 y u3 son las raı́ces del polinomio cúbico f (u) entonces las raı́ces del polinomio cúbico s(z) son: zi = β α + a2 ui − = ei ; 4 12 i = 1, 2, 3 (8.280) Los coeficientes g2 y g3 pueden expresarse en función de los ei mediante las fórmulas 18.1 del texto de Abramowitz y Stegun: g2 = 2(e21 + e22 + e23 ) g3 = 4e1 e2 e3 (8.281) La conexión entre z y t está dada en consecuencia por medio de una función elı́ptica Dinámica del cuerpo rı́gido / 299 de Weierstrass, de acuerdo con la fórmula 18.1.6 del libro de Abramowitz:8 zi = P(t + ǫ) (8.282) donde ǫ es una constante de integración. En consecuencia: cos θ = u(t) = 2I1 2E ′ + I1 a2 P(t + ǫ) + mgl 6mgl (8.283) La función elı́ptica de Weierstrass puede expresarse en términos de la función elı́ptica sn de Jacobi, según la fórmula 18.9.11 de dicho manual, para el caso en que e1 , e2 , e3 , son reales y tomando e3 > e2 > e1 : e3 − e1 (8.284) P(x) = e1 + 2 √ sn (x e3 − e1 ) donde el parámetro de la función sn es: e2 − e1 m= e3 − e1 (8.285) Conociendo las raı́ces ei podemos calcular el perı́odo de la función sn y en consecuencia el perı́odo del ángulo θ, llamado el perı́odo nutacional. Integración de las ecuaciones diferenciales para φ y ψ. φ̇ y ψ̇ están dados por las ecuaciones (8.270). Notamos que θ no depende del valor de I3 , puesto que a no es más que una constante de integración. En consecuencia la expresión para ψ̇ difiere de la correspondiente expresión para un trompo esférico sólo por una constante (I1 a/I3 − a). En el cálculo de la parte no trivial de ψ podemos asumir que el trompo es esférico (I1 = I2 = I3 ), para el cual se cumple: φ̇ = b − a cos θ ; sen2 θ ψ̇ = a − b cos θ sen2 θ (8.286) Podemos expresar a φ̇ y ψ̇ en la forma: φ̇ = a−b a+b + 2(cos θ + 1) 2(cos θ − 1) ψ̇ = a+b b−a + 2(cos θ + 1) 2(cos θ − 1) (8.287) Podemos ahora sustituir la expresión para cos θ en función del tiempo, ecuación (8.283). De (8.283) y (8.284) se sigue que el argumento de P debe ser complejo cuando cos θ = 1 y cos θ = −1. Para θ = 0 y θ = π, según (8.283) P vale respectivamente: P(iγ) = mgl 2E ′ + I1 a2 − 2I1 12I1 P(iδ) = mgl 2E ′ + I1 a2 − − 2I1 12I1 (8.288) 8 Véase también el texto de E. T. Whittaker y G. N. Watson, A course of modern analysis, capı́tulo XX, Cambridge University Press, 1965; A treatise on analytical dynamics de E. T. Whittaker, capı́tulo VI, Cambridge University Press, 1960. 300 / Mecánica clásica donde γ y δ son reales. Reemplazando a (8.288) y a (8.283) en las fórmulas (8.287) obtenemos: φ̇ = mgl(a + b) 1 4I1 P(t + ǫ) − P(iδ) − mgl(a + b) 1 ψ̇ = 4I1 P(t + ǫ) − P(iδ) + 1 mgl(b − a) 4I1 P(t + ǫ) − P(iγ) (8.289) 1 mgl(b − a) 4I1 P(t + ǫ) − P(iγ) Cuando θ = 0 y θ = π la ecuación (8.274) nos dice que u̇2 vale: u̇2 θ=0 = −(b − a)2 ; u̇2 θ=π = −(b + a)2 (8.290) En consecuencia Ṗ(iγ) y Ṗ(iδ) valen, usando (8.278): Ṗ(iγ) = i β(b − a) ; 4 Ṗ(iδ) = i β(b + a) 4 (8.291) Este resultado nos permite escribir a (8.290) en la forma: 2iφ̇ = Ṗ(iγ) Ṗ(iδ) − P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ) 2iψ̇ = Ṗ(iγ) Ṗ(iδ) + P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ) (8.292) De acuerdo con (8.284), la función P tiene un polo doble en el origen, o sea que la función: Ṗ(iδ) P(x) − P(iδ) (8.293) tiene ceros en x = 0, tiene polos en x = iδ y x = −iδ, y en todos los puntos congruentes a estos, es decir, que se obtengan por translaciones en múltiplos enteros de los perı́odos de la función elı́ptica P(x), que son ciertos ω1 y ω2 , análogos a 2K y 2iK ′ en las funciones elı́pticas de Jacobi. Los residuos de la función (8.293) en ésos polos son +1 y −1. En la teorı́a de las funciones elı́pticas de Weierstrass existe una función, de la familia de las funciones θ, que tiene una estructura analı́tica idéntica a la de la función (8.293). En efecto, la función σ(x + iδ) tiene ceros en x = −iδ y en los puntos congruentes a éste, y la función σ ′ (x + iδ)/σ(x − iδ) tiene polos en los puntos congruentes a x = −iδ y residuo igual a −1, en tanto que σ ′ (x − iδ)/σ(x − iδ) tiene polos en x = iδ y residuo igual a +1. En consecuencia la función (8.293) puede escribirse en la forma: σ̇(x − iδ) σ̇(x + iδ) σ̇(iδ) Ṗ(iδ) = − +2 P(x) − P(iδ) σ(x − iδ) σ(x + iδ) σ(iδ) (8.294) Dinámica del cuerpo rı́gido / 301 Llamando ς(iδ) = σ̇(iδ)/σ(iδ) y usando el resultado (8.294), las ecuaciones (8.292) pueden ser integradas inmediatamente para dar a φ y ψ en función de logaritmos de la función σ. Finalmente, φ y ψ pueden escribirse en la forma: e2i(φ−φ0 ) = e2[ς(iδ)−ς(iσ)]t σ(t + ǫ − iδ) σ(t + ǫ + iδ) σ(t + ǫ + iδ)σ(t + ǫ − iδ) e2i(ψ−ψ0 ) = e2[ς(iδ)+ς(iσ)]t σ(t + ǫ − iδ) σ(t + ǫ − iδ) σ(t + ǫ + iδ)σ(t + ǫ + iδ) (8.295) donde φ0 y ψ0 son constantes de integración. Expresión para los parámetros de Cayley-Klein de un trompo esférico en función del tiempo. Los parámetros de Cayley-Klein especifican la posición del cuerpo rı́gido y están expresados en función de los ángulos de Euler mediante las fórmulas (7.175) de la sección 7.8: α′ = cos θ i(φ+ψ)/2 e ; 2 θ β ′ = i sen ei(ψ−φ)/2 2 (8.296) θ −i(φ+ψ)/2 θ −i(φ−ψ)/2 ′ ; δ = cos e γ = i sen e 2 2 Para expresar a cos(θ/2) en función de t, notemos que 2 cos2 (θ/2) = 1 + cos θ. Ahora, usando (8.283) y (8.288) llegamos fácilmente al resultado siguiente usando la fórmula 18.4.4 del citado manual: 2I1 θ [P(t + ǫ) − P(iδ)] 2 cos2 = 2 mgl (8.297) 2I1 σ(t + ǫ + iδ)σ(t + ǫ − iδ) = − mgl σ 2 (iδ) σ 2 (t + ǫ) ′ Para 2 sen2 (θ/2) hallamos una expresión similar reemplazando δ por γ. Combinando (8.297) con (8.295), obtenemos: r I1 ei(φ0 +ψ0 )/2 σ(t + ǫ − iδ) tς(iδ) ′ α = i e mgl σ(iδ) σ(t + ǫ) β′ = i γ′ = i ′ δ = i r r r I1 ei(ψ0 −φ0 )/2 σ(t + ǫ − iγ) tς(iγ) e mgl σ(iγ) σ(t + ǫ) (8.298) I1 ei(φ0 −ψ0 )/2 σ(t + ǫ + iγ) tς(iγ) e mgl σ(iγ) σ(t + ǫ) I1 e−i(φ0 +ψ0 )/2 σ(t + ǫ + iδ) −tς(iδ) e mgl σ(iδ) σ(t + ǫ) Para un trompo no esférico las fórmulas correspondientes a (8.295) y (8.298) se obtienen simplemente por reemplazar la función ς por ς + i(I3 − I1 )a/(2I3 ). 302 / Mecánica clásica La precesión estable o regular. Es el movimiento que se presenta cuando no hay nutación, o sea cuando θ es constante. En este caso θ̇ y θ̈ son permanentemente cero. Se sigue de las ecuaciones (8.270) que φ̇ y ψ̇ también son constantes. El valor de u0 = cos θ0 se obtiene resolviendo la ecuación algebraica dVef /dt = 0. De acuerdo con (8.276) esto nos da: 2(a − ub)(b − au) − β(1 − u2 )2 = 0 (8.299) De aquı́ obtenemos el valor de u0 , y en consecuencia el valor que debe tomar la constante E ′ para que se produzca la precesión sin nutación. La ecuación (8.299) es la condición para que la “fuerza” en θ sea nula, o sea que es la condición para que θ̈ sea cero, que junto con θ̇ = 0 caracteriza la precesión regular. Esta ecuación debe ser compatible con la ecuación (8.270). Si sustituimos en (8.299) a b − au0 por su valor φ̇0 (1 − u20 ) y a b por φ̇(1 − u20 ) + au0 , obtenemos: φ̇20 u0 − aφ̇0 + β =0 2 (8.300) Esta ecuación nos da para φ̇ los valores: ! s 4mglI1 a 1± 1− u0 φ̇0 = 2u0 p2ψ (8.301) Como φ̇0 debe ser real, debe cumplirse que: −∞ < 4mglI1 u0 2βu0 ≤1 ≤ 1 → −∞ < p2ψ a2 (8.302) Esta expresión limita drásticamente los posibles valores de la velocidad angular del trompo ωz alrededor de su eje de simetrı́a z: 4mglI1 u0 ≤ ωz2 I32 (8.303) φ̇0 es la velocidad angular de precesión alrededor del eje espacial z. La ecuación (8.301) nos dice que hay dos posibles valores de la velocidad angular de precesión que (+) (−) llamaremos φ̇0 (precesión rápida) y φ̇0 (precesión lenta). El trompo rápido. Si ωz es tan grande que 2βu0 /a2 es mucho menor que la unidad tenemos el caso del trompo rápido. De (8.303) vemos que la condición de trompo rápido puede escribirse en la forma: I3 1 mgl ≪ (8.304) I3 ωz2 I1 2 Expandiendo al primer orden la raı́z cuadrada en (8.301) obtenemos para las frecuencias de precesión de un trompo rápido: (+) φ̇0 = I3 ωz ; I1 u0 (−) φ̇0 = mgl I3 ωz (8.305) Dinámica del cuerpo rı́gido / 303 Para el caso en que θ0 > π/2 (u0 negativo), la condición de precesión estable (8.302) se cumple para todos los valores de ωz . Este es el caso en que el trompo “cuelga” (+) (−) del punto fijo O. Según (8.305), cuando u0 < 1, φ̇0 y φ̇0 tienen signos opuestos. Precesión con nutación. Ocurre cuando E > E ′ ; en este caso θ oscila entre θ1 y θ2 . La frecuencia angular de precesión está dada por (8.270): φ̇ = b − a cos θ b/a − cos θ =a sen2 θ sen2 θ (8.306) Se pueden presentar varios casos en cuanto al signo de φ̇: (a) φ̇ tiene el mismo signo para todos los valores de θ. Ocurre que es positivo para todos los valores de θ si: b > cos θ (8.307) a El trompo precesa siempre en la misma dirección alrededor del eje z en tanto que el eje z oscila entre θ1 y θ2 . La precesión es monotónica con φ̇ siempre positivo. Si se toma una esfera fija en el espacio, con centro en O, la “marca” que dejarı́a el eje z sobre la esfera se representa en la figura 8.11. z Z θ2 θ1 θ2 θ1 θ2 θ1 φ a b c Figura 8.11 “Marcas” que dejarı́a el eje z sobre la esfera: a. para b/a > cos θ, b. para cos θ1 < b/a < cos θ2 y c. para cos θ2 = b/a (b) φ̇ cambia de signo cuando el eje va de θ2 a θ1 . Si ocurre que: cos θ1 < b < cos θ2 a (8.308) entonces cuando θ = θ1 , φ̇ es positivo y cuando θ = θ2 , φ̇ es negativo. Por lo tanto la precesión no es monotónica, sino que se da un avance neto en forma de rizo como en la figura 8.11b. Es claro que en este movimiento φ̇ no se anula en la media. (c) Puede ocurrir que: cos θ2 = b a (8.309) 304 / Mecánica clásica Esto implica que φ̇ es positivo para todo θ mayor que θ2 y se anula para θ = θ2 . Entonces, como θ = θ2 es un punto de retorno, allı́ θ̇ es igual a cero. En θ = θ2 el eje z se encontrará simultáneamente sin precesión y sin nutación, o sea que se encuentra instantáneamente en reposo. El movimiento se representa en la figura 8.11c. Esta situación corresponde al método más simple de dejar girando un trompo. Primero se hace girar alrededor del eje z y luego se suelta haciendo un ángulo θ2 con la vertical. Las condiciones para t = 0 son entonces θ = θ2 y θ̇ = φ̇ = 0. Las ecuaciones (8.272) y (8.309) nos dicen entonces que la constante E ′ vale: E ′ = mgl cos θ2 (8.310) Como en (8.272) los términos que contienen a I1 son positivos, para tiempos mayores que cero la energı́a potencial debe disminuir o sea θ debe aumentar hasta alcanzar el valor θ1 y según (8.306) entonces φ̇ aumenta a partir de cero hasta alcanzar el valor máximo positivo dado por: φ̇1 = cos θ2 − cos θ1 a sen2 θ1 (8.311) O sea que el trompo al dejarse caer desde θ = θ2 con θ̇ = φ̇ = 0 en t = 0, en un tiempo mayor adquiere precesión y nutación. Ocurre cuando el trompo es rápido y hay rozamiento en el punto O que la nutación se amortigua rápidamente, dando la impresión de que las condiciones iniciales señaladas no dan lugar a precesión con nutación sino a una precesión regular. Los comportamientos descritos en (a), (b) y (c) están contenidos en la expresión analı́tica (8.295). El producto que contiene las funciones σ es puramente periódico, de modo que el exponencial del lado derecho da el movimiento medio de φ, esto es el movimiento precesional neto. La ecuación (8.295) nos dice que ψ tiene un comportamiento análogo al de φ o sea una rotación neta acompañada de fluctuaciones periódicas. La precesión seudoregular. Es el comportamiento usual de un trompo rápido, que de acuerdo con (8.304) se presenta cuando el efecto de la gravedad es pequeño y puede asimilarse a una pequeña perturbación. En la aproximación cero se presentará la precesión regular propia de un cuerpo rı́gido simétrico libre, ecuación (8.179). El efecto de la gravedad es perturbar ligeramente ese movimiento dando lugar a una pequeña nutación. Los valores de las constantes de movimiento para la precesión con nutación en el caso (c), correspondientes a las condiciones iniciales θ(0) = θ2 , θ̇(0) = φ̇(0) = 0, según las ecuaciones (8.268) son: I3 ψ̇(0) cos θ2 = I1 b I3 ψ̇(0) = I1 a E′ = (8.312) mgl cos θ2 que pueden expresarse en términos de la energı́a de rotación, inicialmente dada por: R= 1 1 I3 ωz2 = I3 ψ̇ 2 (0) 2 2 (8.313) Dinámica del cuerpo rı́gido / 305 Entonces: √ 2RI3 I3 a= = ωz ; I1 I1 b = a cos θ2 (8.314) I1 β E = mgl cos θ2 = cos θ2 2 Entonces podemos escribir a f (u) en la forma: ′ f (u) = β(1 − u2 )(u2 − u) − a2 (u2 − u)2 Las raı́ces de f (u) son: s " # a2 4β β u3,1 = 1± 1+ 2 − u2 2β a a2 (8.315) (8.316) a2 /β está dado por: I3 R a2 = β I1 mgl (8.317) O sea que cuando el trompo es rápido podemos escribir a (8.316) en la forma aproximada: 2β 2β 2 a2 2 1 ± 1 − 2 u2 + 4 (1 − u2 ) (8.318) u3,1 = 2β a a lo cual nos da inmediatamente: u3 ≈ a2 ; β u1 ≈ u2 − β (1 − u22 ) a2 (8.319) La magnitud de la nutación está dada por: β sen2 θ2 (8.320) a2 O sea que cuando θ2 = 0, el eje z permanece vertical (trompo “dormido”). Además, la magnitud de la nutación varı́a como R−1 ; cuanto más rápido gire el trompo menor será la nutación. Calculemos ahora la frecuencia de la nutación para un trompo rápido. Llamemos cos θ al promedio de cos θ, o sea a: cos θ2 − cos θ1 ≈ cos θ1 + cos θ2 β (8.321) = cos θ2 − 2 sen2 θ2 2 2a Podemos especificar la magnitud del desplazamiento del eje z en un tiempo t por: cos θ = x = cos θ − cos θ = u − u (8.322) Usando las raı́ces de la función f (u) podemos escribir la ecuación diferencial para u en la forma aproximada: β a2 u̇2 = β(u − u2 ) u − u2 + 2 (1 − u22 ) u − (8.323) a β 306 / Mecánica clásica Como para un trompo rápido se cumple que a2 /β ≫ u, podemos aproximar aún más a (8.323). Luego expresamos a u en términos de x para obtener: β2 2 2 2 (8.324) ẋ = − 4 sen θ2 − x 4a Derivando (8.324) respecto a t llegamos a: ẍ + a2 x = 0 (8.325) La solución que satisface la condición θ(0) = θ2 es, en consecuencia: x= β sen2 θ2 cos at ; 2a2 cos θ = cos θ2 − β at sen2 θ2 sen2 a2 2 (8.326) La frecuencia angular de la nutación es: 1 I3 ωz a= 2 2I1 (8.327) O sea que la frecuencia de las nutaciones es mayor a medida que ωz es mayor. (8.306) nos da la frecuencia angular de precesión. Como según (8.326) x es del orden de β/(2a2 ), podemos escribir aproximadamente a φ̇ como: φ̇ = u2 − u u2 − u β at a≈ a = sen2 2 2 1−u 1 − u2 a 2 (8.328) β/(2a2 ) = mgl/(I3 ωz ), según (8.305), coincide con la velocidad angular de precesión lenta del trompo rápido, lo cual nos permite escribir a φ̇ como: (−) φ̇ = 2φ̇0 sen2 at 2 (8.329) La frecuencia angular de precesión media durante un ciclo de la nutación es: (−) φ̇ = φ̇0 (8.330) Vemos que mientras mayor sea ωz , menor será la velocidad angular de precesión. Para un trompo rápido el movimiento es una nutación pequeña y una precesión pequeña que coincide con la velocidad angular de precesión lenta de un trompo rápido. Esta precesión se llama precesión seudoregular, pues aunque las condiciones iniciales no son las de la precesión regular, en la práctica se comporta como ésta porque la fricción amortigua rápidamente la nutación y aparentemente el eje z del trompo empieza instantáneamente a precesar, con movimiento normal a la gravedad. Ésta es la paradoja de Klein-Sommerfeld quienes explicaron que esta precesión no implica aceleraciones infinitas sino que se trata de una precesión con una imperceptible nutación. El trompo “dormido”. Es el caso cuando el eje z permanece vertical, sin precesión ni nutación, o sea cuando: θ(t) = 0 ; θ̇(t) = 0 (8.331) Dinámica del cuerpo rı́gido / 307 f (u) u1 = u2 = 1 –1 0 u3 u +1 Figura 8.12 Comportamiento de f (u) para u1 = u2 = 1 f (u) 0 –1 u1 +1 u2 = u 3 = 1 u Figura 8.13 Comportamiento de f (u) para u2 = u3 = 1 Esta situación es un caso lı́mite de la precesión estable cuando el mı́nimo de Vef (u) está en u0 = 1. Como cuando E ′ = E0′ , los dos puntos de retorno coinciden, la función f (u) tiene el comportamiento mostrado en las figuras 8.12 y 8.13. Para este caso los valores de las constantes de movimiento son: I1 a = I3 (ψ̇ + φ̇) ; b = a; E ′ = mgl (8.332) Se sigue de (8.275) y (8.332) que: α=β (8.333) 308 / Mecánica clásica La ecuación (8.274) tiene entonces la forma: u̇2 = (1 − u)2 α(1 + u) − a2 (8.334) Las raı́ces de f (u) son en consecuencia: 1, 1, a2 −1 α (8.335) Veamos qué condiciones se requieren en cada uno de los casos mostrados en las figuras 8.12 y 8.13. Para ello examinemos la curvatura de f (u) en la raı́z doble: 2 a ′′ f (1) = 2α 1 − −1 (8.336) α Claramente en el caso de la figura 8.12, donde (a2 /α) − 1 es mayor que 1, la curvatura es negativa y en la figura 8.13 la curvatura es positiva. Los resultados de la precesión estable en general se aplican en este caso en que u0 = 1. La condición (8.303) en este caso es: a2 ≥1 2α (8.337) que señala la velocidad angular crı́tica ωc debajo de la cual cesa la precesión regular, o sea: ωc2 = 4mglI1 I32 (8.338) Vemos pues que el caso de la figura 8.12 es en rigor el de precesión regular en tanto que el caso de la figura 8.13 es inestable y mediante una pequeña perturbación degenera en el de precesión con nutación; para este caso ωz < ωc y para el caso de la figura 8.12, ωz > ωc . Cuando ωz sea igual a ωc entonces a2 /α = 2 y según (8.335) las tres raı́ces de f (u) coinciden y el movimiento aún es estable. Ejemplo 8.5.1 A partir de la solución analı́tica hallar los valores de la frecuencia angular de nutación y de la velocidad angular de precesión media para la precesión con nutación de un trompo pesado bajo las condiciones iniciales (8.312), caso (c). De acuerdo con las fórmulas (8.283) y (8.284), el perı́odo de la nutación coincide con el perı́odo de la función elı́ptica ns2 que es 2K. O sea que: √ T e3 − e1 = 2K (8.339) El parámetro de la función, según (8.285) y (8.280) es: √ u2 − u1 λu2 − 1 + 1 + λ2 − 2λu2 2β √ m= = ; λ= 2 u3 − u1 a 2 1 + λ2 − 2λu2 (8.340) donde hemos usado (8.316). Para precisar, asumamos que: u2 = 1 ; 2 λ=1 (8.341) Dinámica del cuerpo rı́gido / 309 Entonces los valores de m y de √ a e3 − e1 = m = 0, 25 ; 2 √ e3 − e1 son: (8.342) De la tabla 17.1 del manual de Abramowitz y Stegun obtenemos: K(0, 25) = 1, 685 (8.343) con lo cual el valor exacto del perı́odo T es: T = 4K 6, 74 = a a (8.344) y el valor exacto de la frecuencia de nutación es: Ωnut = 0, 932 a (8.345) Promediando sobre un perı́odo de las funciones P obtenemos que el término de φ̇ que en (8.292) da lugar a precesión neta es: 2iφ̇ = 2 σ̇(iγ) σ̇(iδ) −2 σ(iδ) σ(iγ) (8.346) Según (8.288) y (8.314) se cumple para este caso que: P(iγ) = βu2 + a2 5λ − 4 2 1 2 β − = a = a 4 12 48 48 P(iδ) = βu2 + a2 7λ + 4 2 11 β =− a = − a2 − − 4 12 48 48 (8.347) Según la expansión en serie para P(x) el término dominante es x−2 de modo que: P(iγ) ≈ − 1 ; γ2 P(iδ) ≈ − 1 δ2 Entonces hallamos que: r √ 48 48 1 ; iγ ≈ −i iγ ≈ a 11 a (8.348) (8.349) Por otra parte, el término dominante en la expansión en serie para ς(x) es x−1 lo cual nos dice que: r 11 1 1 1 ς(iδ) ≈ ≈i a ; ς(iγ) ≈ ≈√ a (8.350) iδ 48 iγ 48 Entonces resulta que φ̇ vale: φ̇ ≈ 0, 48a + 0, 14ai (8.351) El resultado nos indica que para las condiciones iniciales (8.341) no hay precesión neta estable; que el movimiento en φ dura menos de un perı́odo de P, en tanto que 310 / Mecánica clásica (8.346) supone que existe movimiento en φ durante más de un perı́odo. En efecto, para λ mayor que 0,8 domina el efecto de la gravedad y el trompo cae. La fórmula (8.340) resulta aplicable para λ < 0,8. El movimiento descrito por la figura 8.11c existe si: I1 2mgl < 0, 8 I3 R (8.352) Si tomamos λ = 0, 1 y u2 = 0, 5, mediante idénticos procedimientos llegamos a los siguientes resultados: e1 = −0, 079659a2 ; e2 = −0, 079166a2 ; e3 = 0, 1188257a2 (8.353) En consecuencia: m = 0, 6659781 ; K(m) = 2, 025 (8.354) Entonces un valor para la frecuencia de nutación más exacto que el resultado (8.327) es: Ωnut = 0, 691a (8.355) Sin embargo en el cálculo de la velocidad angular de precesión entran en juego las aproximaciones hechas para evaluar las ς. Para iδ y iγ obtenemos: i iγ ≈ −3, 7032803 ; a iδ ≈ −3, 1957416 i a (8.356) lo cual nos conduce a: φ̇ = 0, 04 a (8.357) que esta vez no tiene la contribución imaginaria. Según (8.330) que es aplicable en este caso pues λ ≪ 1, φ̇ debe valer: φ̇ ≈ 8.6. β = 0, 0025 a 2a (8.358) Movimiento en un sistema de referencia no inercial Ya a lo largo del texto hemos considerado varios casos de sistemas de referencia no inerciales. En el ejemplo 4.1.5, sección 4.1, encontramos las ecuaciones de movimiento para una partı́cula en un sistema de referencia que rota uniformemente con velocidad angular ~ ω . Encontramos que la rotación añade a la energı́a un término que depende sólo de las coordenadas de la partı́cula y es proporcional al cuadrado de la velocidad angular. Este término adicional, −m(~ω × ~r)2 /2 se llama energı́a potencial centrı́fuga. En la ecuación de movimiento aparecen dos términos adicionales de tipo inercial. La fuerza 2m~r˙ × ~ ω se llama fuerza de Coriolis; es una fuerza no disipativa que depende de la velocidad de la partı́cula, pero no da contribución a la energı́a. La fuerza m~ω × (~ω × ~r) se llama fuerza centrı́fuga; está en el plano formado por ~r y ~ω , siendo perpendicular al Dinámica del cuerpo rı́gido / 311 eje de rotación y alejándose de él; el módulo de esta fuerza es mρω 2 siendo ρ la distancia de la partı́cula al eje de rotación. Al final de la sección 7.9 encontramos expresiones más exactas para las ecuaciones de movimiento, en función de la matriz de rotación. Encontramos en la ecuación (7.282) un término adicional, la fuerza m~r × ~ω˙ debida a la no uniformidad de la rotación. Consideremos ahora el sistema de referencia no inercial más general. Consiste en un sistema de referencia que rota no uniformemente y cuyo origen se translada con aceleración no ~ del origen de coordenadas y la velocidad anuniforme. Se supone que la aceleración A(t) gular de rotación ω ~ (t) son funciones del tiempo conocidas a priori. Entonces la ecuación de movimiento más general para una partı́cula que se mueve en un sistema de referencia no inercial es: ∂V ~ + m~r × ~ω˙ + 2m~r˙ × ~ω + m~ω × (~r × ~ω) − mA (8.359) m~¨r = − ∂~r Ya hemos considerado el movimiento de un cuerpo rı́gido en un sistema de referencia que rota uniformemente. En el ejemplo 8.3.1 hallamos la forma que toman las ecuaciones de Euler en tal sistema de referencia, ecuaciones (8.128) y (8.129). Ejemplo 8.6.1 Resolver el problema del péndulo de Foucault considerándolo como un cuerpo rı́gido y usando las ecuaciones de Euler en un sistema de referencia rotante. En este problema intervienen tres sistemas de ejes. Los ejes inerciales, los ejes rotantes fijos a la Tierra y los ejes fijos al cuerpo rı́gido. Llamaremos x′ , y ′ , z ′ , a los ejes fijos a la Tierra y x, y, z, a los ejes fijos al cuerpo rı́gido. El vector de velocidad angular de la Tierra, que asumiremos constante respecto a los ejes inerciales, vale: ω ~ 0 = ω0~k (8.360) donde ~k está en la dirección de la lı́nea sur-norte que asumiremos fija en el espacio (ver la figura 8.14). El péndulo está suspendido de un punto O fijo respecto a la Tierra. En ese punto tomaremos el origen común de los ejes fijos a la Tierra y al cuerpo rı́gido. Este es un cuerpo rı́gido trivial que consiste en una partı́cula mantenida a distancia fija de O por medio de un hilo sin masa y longitud l. El eje z lo tomamos a lo largo del hilo, de modo que la posición de la partı́cula respecto a los ejes fijos al cuerpo rı́gido está en (0, 0, l). Los momentos principales de inercia de este cuerpo rı́gido son: I1 = ml2 ; I2 = ml2 ; I3 = 0 (8.361) Los ejes x y y son perpendiculares a z pero pueden tomarse arbitrariamente, pues este cuerpo rı́gido no permite especificarlos. Podemos, sin perder generalidad, tomar el eje y perpendicular al plano de oscilación del péndulo y el eje x en el plano de oscilación del péndulo y cuando aparezca la velocidad de rotación alrededor del eje z, ψ̇, asumir que es cero, lo mismo que ψ. Las componentes del vector de velocidad angular de la Tierra respecto a los ejes primados son: ω0 ′ = ~ = ω0 [(~k · ~i ′ )~i ′ + (~k · ~j ′ )~j ′ + (~k · ~k ′ )~k ′ ] ω0 (cos λ, 0, −senλ) (8.362) 312 / Mecánica clásica N i 0 φ j′ j j′ i′ i′ k k′ 0 k k′ θ ω0 l φ λ m S b a Figura 8.14 Péndulo de Foucault considerado como un cuerpo rı́gido: a. Sistema de ejes y b. Componentes del vector de velocidad angular de la tierra respecto a los ejes primados. La energı́a potencial vale V = −mgz ′ = −mgl cos θ. Entonces los torques alrededor de los ejes z ′ y z, y de la lı́nea de nodos, son respectivamente: Kφ = 0 ; Kψ = 0 ; Kθ = −mgl senθ (8.363) Las ecuaciones de Euler en un sistema de referencia rotante fueron halladas en los ejemplos 8.3.1 y 8.3.3, en la sección 8.3. Las ecuaciones requeridas para este problema deben incluir los torques, o sea que a las ecuaciones (8.155) debemos adicionar en el lado derecho: 3 X Kr βrt ; t = 1, 2, 3 (8.364) r=1 donde las Kr están dadas por (8.363) y βrt es la matriz (8.134). Los torques (8.364), que llamaremos K1 , K2 , K3 , son en consecuencia: K1 = −mgl senθ cos ψ ; K2 = mgl senθ senψ ; K3 = 0 (8.365) para escribir las ecuaciones (8.155) se requiere además conocer las componentes del vector ~ ω0′ respecto a los ejes fijos al cuerpo rı́gido. Para ello debemos evaluar: ~ 0 = Ã~ ω ω0′ (8.366) donde Ã es la matriz de rotación entre los ejes con primas y los ejes con barras, dada por la ecuación (7.122) sección 7.6. Las ecuaciones (8.128) y (8.129) con torques, con los Dinámica del cuerpo rı́gido / 313 momentos de inercia (8.361) nos dan: (ω̇z + ω̇0z ) · 0 = 0 (ω̇y + ω̇0y ) = g −(ωx + ω0x )(ωz + ω0z ) + senθ senψ l (ω̇x + ω̇0x ) = g (ωy + ω0y )(ωz + ω0z ) − senθ cos ψ l (8.367) Debido a que I3 = 0 y I1 = I2 , la ecuación (8.367) da un valor indeterminado para ω̇z + ω̇0z y en consecuencia para ωz + ω0z , la indeterminación proviene del hecho ya señalado al definir las coordenadas x, y, z. En efecto, como la masa m es puntual, carece de sentido hablar de rotación alrededor de z, por ello el lagrangiano (8.123) no contiene ni a ψ ni a ψ̇. Entonces, como se señaló, podemos tomar ceros los valores de ψ y ψ̇. De la ecuación (7.122), junto con las ecuaciones (8.366) y (8.131) podemos escribir ~ , cuando ψ = 0 y ψ̇ = 0: para el vector ~ω 0 y ω   θ̇ + ω0 cos φ cos λ     ~ + ~ω0 =  senθ φ̇ − ω0 cos θ senφ cos λ − ω0 senθ senλ  (8.368) ω     cos θ φ̇ + ω0 senθ senφ cos λ − ω0 cos θ senλ Las derivadas de este vector respecto al tiempo son:  θ̈−ω0 senφ cos λ φ̇  ~ 0 =φ̈ senθ+ θ̇ φ̇ cos θ+ω0 θ̇(senφ senθ ~ω + ω     cos λ−cos θ senλ)−ω0 φ̇ cos θ cos φ cos λ (8.369) φ̈ cos θ− θ̇ φ̇ senθ+ω0 θ̇(senφ cos θ cos λ+senθ senλ)+ω0 φ̇ senθ cos φ cos λ Ciertamente las ecuaciones (8.367) son consistentes cuando ωz + ω0z valga cero. En efecto, las dos últimas igualdades de (8.367) se convierten en: θ̈ − ω0 φ̇ senφ cos λ + g senθ = 0 l (8.370) senθ φ̇ − ω0 cos θ senφ cos λ − ω0 senθ senλ = constante Si tomamos cero el valor de la constante en (8.370), esta ecuación será consistente con la ecuación ωz + ω0z = 0, cos θ φ̇ + ω0 senθ senφ cos λ − ω0 cos θ senλ = 0 (8.371) solamente si se cumple que: φ̇ = ω0 senλ ; φ=0 (8.372) Esto quiere decir que tomar simultáneamente ceros los valores de ωy + ω0y y ωz + ω0z da lugar a la solución cuando los ejes x′ −y ′ y x−y coinciden instantáneamente. La ecuación 314 / Mecánica clásica (8.372) muestra una rotación uniforme del plano de oscilación del péndulo alrededor del eje z, en sentido positivo. En efecto, si el péndulo oscilara en el polo norte, donde senλ = 1, un observador en la Tierra verı́a rotar el plano del péndulo uniformemente en sentido contrario al de la rotación de la Tierra y con una velocidad angular igual a ω0 ; esto se ve claramente al notar que el plano de oscilación del péndulo en un sistema de referencia inercial no cambia, o sea que los ejes x − y no cambian en un sistema de referencia inercial y respecto a ellos los ejes x′ − y ′ rotan uniformemente. Para un péndulo de 100 m, g/l vale aproximadamente 10−1 s−2 en tanto que ω0 ≈ −8 −1 10 s , de modo que las ecuaciones (8.367) pueden resolverse fácilmente, sin hacer las suposiciones: ωz + ω0z = ωy + ω0y = 0, despreciando los términos que contengan a ω02 y ω0 φ̇. El resultado es que el plano de oscilación del péndulo rota uniformemente con una velocidad angular ω0 senλ, aun en donde los ejes x′ − y ′ y x − y no coinciden, y en que la rotación de la Tierra no tiene efecto sobre la coordenada θ sino con un término centrı́fugo, que es del orden de ω02 . Ejemplo 8.6.2 Un giróscopo es un cuerpo rı́gido simétrico montado sobre anillos de suspensión de cardán de modo que el cuerpo rı́gido se puede mover libremente con el centro de gravedad fijo, por lo cual no hay torque gravitacional. La brújula giroscópica es un giróscopo al cual se le impone la ligadura que consiste en impedir que el eje de simetrı́a se mueva fuera del plano horizontal. Demuéstrese usando las ecuaciones de Euler que cuando la velocidad angular del giróscopo es grande comparada con la de la Tierra, este giróscopo oscilará alrededor de un meridiano, pudiendo utilizarse como brújula (brújula giroscópica de Foucault). Los ejes principales del giróscopo x, y, z, los definimos de modo que el eje de simetrı́a es el eje z, que permanecerá en el plano horizontal. La figura 8.15a muestra los ejes fijos a la Tierra x′ , y ′ , z ′ , y la figura 8.15b los ejes x, y, z. Línea de nodos (φ = 0) N x′ 0 z ψ j′ k′ x Vertical z′ Norte θ i′ k′ y′ 0 ω0 λ Este Línea del meridiano S y a b Figura 8.15 Ejes principales del giróscopo: a. Ejes x′ , y ′ y z ′ fijos a la Tierra, b. Ejes principales x, y y z del giróscopo. Dinámica del cuerpo rı́gido / 315 La condición de ligadura impuesta a la suspensión de Cardán es: φ=0 (8.373) Ésta implica que φ̇ = 0, o sea que la ligadura impuesta a las velocidades angulares ωx , ωy , ωz , de acuerdo con las ecuaciones (8.132) es: senψ ωx + cos ψ ωy = 0 (8.374) Usando la notación de la sección 2.8, escribimos la ligadura en la forma a1 ωx + a2 ωy + a3 ωx donde a1 = tan ψ, a2 = 1, a3 = 0. Entonces los componentes de la fuerza de ligadura son: Rx = λ tan ψ ; Ry = λ ; Rz = 0 (8.375) donde λ es un multiplicador indeterminado de Lagrange. Las ecuaciones de movimiento son las ecuaciones de movimiento de Euler en un sistema de referencia rotante, ecuaciones (8.128) y (8.129), donde de acuerdo con los resultados de la sección 2.8, debemos incluir los términos de torque debidos a la ligadura, (8.375). Por lo anterior, tales ecuaciones son: (ω̇z + ω̇0z )I3 = 0 (ω̇y + ω̇0y )I1 = (ωx + ω0x )(ωz + ω0z )(I3 − I1 ) + λ (8.376) (ω̇x + ω̇0x )I1 = (ωy + ω0y )(ωz + ω0z )(I1 − I3 ) + λ tan ψ Las componentes de la velocidad angular de la Tierra en los ejes primados son: ω ~ 0′ = ω0 (senλ, 0, cos λ) (8.377) ~ 0 debemos usar la matriz de rotación Ã, ecuación (7.122) de la Para hallar a ω sección 7.6, tomando φ = 0:   senλ cos ψ + cos λ senψ senθ      ~ ω 0 = ω0  −senλ senψ + cos λ cos ψ senθ  (8.378)    cos λ cos θ ~ según (8.131) es: En tanto que ω, ~ = (cos ψ θ̇, −senψ θ̇, ψ̇) ω (8.379) ~ω˙ + ~ω˙ 0 está dada por:   θ̈cψ− θ̇sψ(e−ω0 cλ cθ)+ω0 (−sλ sψ+cλ cψ sθ)(e − ω0 cλ cθ)+ω0 θ̇ cλ sψ cθ   ~˙ 0 =−θ̈sψ− θ̇cψ(e−ω0 cλ cθ)+ω0 (−sλ cψ−cλ sψ sθ)(e − ω0 cλ cθ)+ω0 θ̇ cλ cψ cθ ~˙ ω ω+   −θ̇ω0 cλ sθ (8.380) 316 / Mecánica clásica donde usamos s y c en vez de sen y cos, y e es el valor de la constante que se obtiene de (8.376) o sea un espı́n axial neto que incluye una componente de la rotación de la Tierra: e = ωz + ω0z (8.381) Reemplazando las ecuaciones (8.378) a (8.381) en las ecuaciones (8.376) obtenemos: θ̈ cψ + θ̇ sψ(−e + 2ω0 cλ cθ + A) +ω0 sψ(−e sλ + ω0 sλ cλ cθ + sλ A) (8.382) +ω0 cψ(e cλ sθ − ω0 c2 λ sθ cθ − A cλ sθ) = Λ tan ψ −θ̈ sψ + θ̇ cψ(−e + 2ω0 cλ cθ + A) +ω0 cψ(−e sλ + ω0 sλ cλ cθ + sλ A) (8.383) +ω0 sψ(−e cλ sθ + ω0 c2 λ sθ cθ + A cλ sθ) = Λ donde Λ es igual a λ/I1 y A está defnida por: A= I1 − I3 e I1 (8.384) Multiplicando (8.382) por cos ψ y (8.383) por senψ y restando las ecuaciones resultantes, obtenemos: θ̈ + ω0 I3 e cos λ senθ − ω02 cos2 λ senθ cos θ = 0 I1 (8.385) Para un lugar que no esté en los polos, cos λ 6= 0, y para una alta velocidad de rotación del giróscopo, e ≫ ω0 , la ecuación (8.385) se puede aproximar a: θ̈ + I3 eω0 cos λ senθ = 0 I1 (8.386) Ésta es una ecuación similar a la de un péndulo simple. Indica que el eje del giróscopo oscila alrededor de la lı́nea del meridiano, siendo el perı́odo de pequeñas oscilaciones: r I1 (8.387) T = 2π I3 eω0 cos λ es decir, el mecanismo indica el norte, por lo tanto sirve de brújula que indica el norte verdadero, a diferencia de una brújula magnética que indica el norte magnético. Para una discusión más detallada que incluye el caso en que el giróscopo está montado sobre un barco, véase el texto de Atkin, Dinámica clásica, John Willey, 1959, o referencias especializadas sobre el giróscopo. La ecuación de ligadura (8.374) permite obtener a ψ(t) al reemplazar el resultado de integrar a (8.386), y la ecuación (8.376) permite entonces hallar a λ, y en consecuencia la fuerza de ligadura. Como la solución de (8.386) es una función elı́ptica, sn, las ecuaciones (8.374), (8.376) y (8.386) permiten expresar a θ, ψ y λ en términos de funciones elı́pticas. Dinámica del cuerpo rı́gido / 317 Ejercicio 8.6.1 Integrar las ecuaciones (8.374), (8.376) y (8.386) para hallar explı́citamente a θ, ψ y λ en función del tiempo. Analizar los resultados. 318 / Mecánica clásica avanzada 9 Las transformaciones canónicas 9.1. La acción en función de las variables de estado Según el principio de Hamilton, entre todas las trayectorias en el espacio de configuración que parten de un punto (q1 ) en t = t1 y terminan en un punto (q2 ) en t = t2 , el sistema sigue efectivamente a través de la trayectoria que extremaliza la integral de acción o, equivalentemente, por aquella que satisface las ecuaciones de Lagrange. Para expresar la acción en función de las coordenadas, debemos considerar todas las posibles trayectorias reales y circuitosas en el espacio de configuración y no solamente aquellas que pasan por dos puntos dados. Entre un par de puntos dados, (q1 ) en t = t1 y (q2 ) en t = t2 , sólo pasa una trayectoria recta (o real). O sea que a una familia de parejas de puntos [(q1 ) en t = t1 , (q2 ) en t = t2 ], definida de acuerdo con cierta regla, le corresponde una familia de trayectorias en “lı́nea recta” (o reales). Ası́ por ejemplo, para un sistema de dos grados de libertad las trayectorias estarán situadas en un plano. Para precisar, asumamos que se trata de partı́culas en presencia del campo gravitacional, el cual actúa a lo largo de la dirección y. La figura 9.1 muestra la familia de puntos extremos (x1 , y1 en t1 ; x2 , y2 en t2 ), definida de la siguiente manera: r π 2a senθ ; 0 ≤ θ ≤ x1 = a cos θ ; y1 = a senθ ; t1 = g 2 x2 = b ; 1 y2 = a senθ + g 2 b − a cos θ t2 = + vx r b − a cos θ vx 2 (9.1) 2a senθ g Este ejemplo muestra que para a, b, dados se puede definir una familia de trayectorias por hacer variar a θ entre 0 y π/2, con lo cual se varı́an además los tiempos t1 y t2 . Los correspondientes puntos inicial y final están sobre un arco de circunferencia y sobre un segmento de lı́nea recta respectivamente. Obviamente para un par de puntos 319 320 / Mecánica clásica avanzada b 0 θ′ θ a x P1 (x1, y1, t1) P1′ (x1′, y1′, t1′) P2 (x2, y2, t2) P2′ (x2′, y2′, t2′) y Figura 9.1 Familia de trayectorias dependiente de θ entre 0 y π/2 inicial y final dados, P1 , P2 , o sea para un valor dado de θ, se puede encontrar una familia de trayectorias circuitosas que pasan por esos dos puntos en t = t1 y t = t2 . Haciendo variar la tripleta de parámetros (a, b, θ) sobre todo el rango de sus valores posibles podrı́amos obtener todas las posibles trayectorias “rectas” en el plano x − y; para definir las trayectorias circuitosas requerirı́amos de parámetros adicionales. En general, sea (α) un conjunto completo de parámetros que define una familia de trayectorias rectas en el espacio de configuración. A esa familia de trayectorias le corresponde una familia de puntos iniciales y finales P1 , P2 y de tiempos t1 y t2 , dada por: t1 = t1 (α) ; qν1 = qν1 (α) t2 = t2 (α) ; qν2 = qν2 (α) (9.2) ν = 1, 2, ...l Debemos definir desplazamientos virtuales entre una trayectoria real y las correspondientes trayectorias circuitosas y entre trayectorias reales. Esto se logra considerando: (a) Cambios virtuales en las qν , como antes y (b) Cambios virtuales en el tiempo, con lo cual los tiempos de los puntos inicial y final son distintos para cada trayectoria. Queremos evaluar el cambio en la integral de acción: Z t2 L dt (9.3) S= t1 cuando se pasa de una trayectoria real a otra de la familia. La diferencia de las coordenadas de las dos trayectorias la denotaremos ∆qν = qν (α + ∆α) − qν (α). Tal cambio consta de dos partes, uno virtual producido con t fijo y otro debido al cambio virtual en el tiempo: ∆qν = δqν + q̇ν δt ; ν = 1, 2, ...l (9.4) ∆t = t(α + ∆α) − t(α) Las transformaciones canónicas / 321 La figura 9.2 muestra dos trayectorias reales en el espacio de configuración que difieren por cantidades pequeñas. C1 y C2 son dos curvas que describen la familia de puntos extremos, o sea definidas por las ecuaciones (9.2). C2 P2 t C1 P1 t1 + ∆t1 t1 t1 + ∆t1 (∆q) t2 (α) t2 + ∆t2 (∆q) q∆t t + ∆t t (q + δq) (q + ∆q) P2′ t2 (α + ∆α) P1′ Figura 9.2 Trayectorias reales en el espacio de configuración A cada una de las dos trayectorias reales le corresponde un valor de la integral de acción (9.3). La diferencia de los valores de S es: S′ − S ∆S = Z = t2 +∆t2 t1 +∆t1 dt L(q + δq, q̇ + δ q̇, t) − Z (9.5) t2 dt L(q, q̇, t) t1 Para ∆t1 y ∆t2 lo suficientemente pequeños se cumple: Z t2 Z t2 +∆t2 L dt + L(t2 ) ∆t2 − L(t1 ) ∆t1 Ldt ≈ (9.6) t1 t1 +∆t1 t t1 t1 + ∆t1 t2 t2 + ∆t2 Figura 9.3 Cambio en el tiempo ∆t al variar (α) Entonces (9.5) se puede escribir como: ∆S = Z t2 t2 L(q + δq, q̇ + δ q̇, t)dt + L(q + δq, q̇ + δ q̇, t)∆t t1 − Z t1 t2 t1 L(q, q̇, t)dt (9.7) 322 / Mecánica clásica avanzada Por otra parte sabemos que: L(q + δq, q̇ + δ q̇, t) − L(q, q̇, t) = l X ∂L ν=1 d δqν + (pν δqν ) − ṗν δqν ∂qν dt (9.8) al primer orden en (δq). Entonces: ∆S = Z t2 t1 l X ∂L ν=1 ∂qν − ṗν δqν + l X t2 t2 pν ∆qν ν=1 (9.9) + L ∆t t1 t1 donde despreciamos todos los términos de orden superior al primero en (δq) y (q̇ ∆t). Como los (p) corresponden a la trayectoria real P1 P2 , de acuerdo con las ecuaciones de Lagrange la integral en (9.9) es cero, luego: ∆S = l X pν δqν + L ∆t ν=1 ! t2 (9.10) t1 Debido a que δqν = δqν − q̇ν ∆t, obtenemos: ! t2 l X ∆S = pν ∆qν − H ∆t ν=1 (9.11) t1 Esta expresión nos dice que: pν = ∂S ∂S ∂S ∂S , H=− , H= en t = t2 ; pν = − en t = t1 ∂qν ∂t ∂qν ∂t (9.12) Es claro que ∆S es la diferencia de dos términos infinitesimales, evaluados en t1 y t2 . Ahora, si llamamos t a t2 y escogemos a C1 de modo que se reduzca a un punto, es decir, tomamos fijo el punto p1 : δqν (t1 ) = 0, ∆t1 = 0; ν = 1, 2, ...l (9.13) Obtenemos: ∆S = l X ν=1 pν ∆qν − H ∆t (9.14) Esta expresión nos da la diferencial total de cierta función S de las coordenadas y del tiempo sobre la curva C2 . De P1 sale un haz de trayectorias reales que cortan la curva C2 . La ecuación (9.14) nos da la diferencia en la acción para dos trayectorias reales diferentes cuando cortan la curva C2 . Es claro entonces que: pν = ∂S ; ∂qν ν = 1, 2, ...l; H = − ∂S ∂t (9.15) Las transformaciones canónicas / 323 Siendo S = S(q, t) la acción en función de las coordenadas y del tiempo: Z t2 L dt S(q, t) = (9.16) t1 Si se impone la condición de que las variaciones en el lı́mite superior se anulen, obviamente lo que se obtiene es ∆S = 0, y de ahı́ las ecuaciones de movimiento. A la función S[q(t), t] se le denomina la acción en función de las coordenadas: es el número que se asocia a la trayectoria que comienza en P1 y termina en q(t), t, o sea sobre la lı́nea C2 . Como q y t dependen de (α), S es una función de (α). 9.2. La integral invariante de Poincaré-Cartán En lugar del espacio de configuración l-dimensional, consideramos el espacio de fases 2l-dimensional, en el cual cada punto en el tiempo t se especifica por (q, p). En este espacio definamos dos curvas cerradas, C1 y C2 , cuyos puntos sean el comienzo y el final de una familia de trayectorias rectas en el espacio de fases; es decir, tales que si el sistema inicialmente estaba descrito por un punto de C1 evolucionará de acuerdo con las ecuaciones canónicas hasta llegar a cierto punto final sobre C2 . Las ecuaciones que definen las curvas cerradas C1 , C2 , son análogas a (9.2): t1 = t1 (α); qν1 = qν1 (α) ; p1ν = p1ν (α) t2 = t2 (α) ; qν2 = qν2 (α) ; p2ν = p2ν (α) ; (9.17) α = 1, 2, ...l donde ahora los parámetros (α) son tales que varı́an entre (αi ) y (αf ) de modo que las funciones de (α) definidas por (9.17) son periódicas, es decir toman el mismo valor cuando (α) = (αi ) que cuando (α) = (αf ). Por ejemplo, para el oscilador tridimensional ligado a moverse sobre un cilindro, la familia de trayectorias correspondiente a (9.17) es mostrada en la figura 9.4. (Véase el ejemplo 4.3.1 en la sección 4.3). Es claro que C1 y C2 deben estar sobre la hipersuperficie Ez constante. En general, la familia de trayectorias tiene la apariencia de un “tubo”1 donde C1 y C2 son las curvas que describen la forma de las “puntas”. Por la causalidad, es claro que las trayectorias no se intersectan. A cada valor de las (α) le corresponde uno y sólo un punto sobre C1 , un punto sobre C2 y una trayectoria y sólo una. Cada trayectoria tiene un valor dado de la acción: Z t2 (α) S̃ = L̃ [q(α, t), q̇(α, t), p(α, t), ṗ(α, t), t] (9.18) t1 (α) donde L̃ es definido en (3.77), según: L̃ (q, p, q̇, ṗ, t) = l X ν=1 1 Llamado pν q̇ν − H(q, p, t) también “tubo de lı́neas caracterı́sticas”. (9.19) 324 / Mecánica clásica avanzada Pz C1 θ z C2 Figura 9.4 Familia de trayectorias para el oscilador tridimensional ligado a moverse sobre un cilindro Por un procedimiento análogo al que conduce a (9.9), hallamos para la diferencia de la acción entre dos trayectorias vecinas: ∆S̃ = ( l Z X ν=1 dt " ∂H q̇ν − ∂pν ! δpν # ) d ∂H δqν + (pν ∆qν ) + L ∆t − ṗν + ∂qν dt t2 (9.20) t1 Teniendo en cuenta que las trayectorias en el espacio de fases son “rectas”, definidas por las ecuaciones de Hamilton, se sigue: ∆S̃ = " l X ν=1 pν δqν + L ∆t # t2 (9.21) t1 Ahora, usando (9.4) en (9.21) obtenemos que ∆S̃ = ∆S, ecuación (9.11): ∆S̃ = " l X ν=1 pν ∆qν − H ∆t # t2 (9.22) t1 ∆S̃ es el cambio en la acción al cambiar infinitesimalmente de una trayectoria de fases real a otra, o sea al variar infinitesimalmente las (α). Podemos integrar cada término en (9.22) respecto a (α), desde (α) = (αi ) hasta (α) = (αf ), o sea sobre todas Las transformaciones canónicas / 325 las trayectorias que comienzan y terminan en las curvas cerradas C1 y C2 : # t2 Z (αf ) "X l pν ∆qν − H ∆t S(αf ) − S(αi ) = (αi ) = Z ν=1 l X (αf ) p2ν ν=1 (αi ) − = Z (αf ) (αi ) I C2 − I C1 l X ν=1 ∆qν2 p1ν 2 − H ∆t2 ∆qν1 ν=1 l X ν=1 l X 1 C1 l X ν=1 ! ! pν ∆qν − H ∆t Hemos demostrado que la integral de lı́nea, ! I X l pν ∆qν − H ∆t I= (9.23) ! pν ∆qν − H ∆t ν=1 ! − H ∆t1 pν ∆qν − H ∆t Como S(αi ) = S(αf ) obtenemos: ! I I l X pν ∆qν − H ∆t − C2 t1 ! =0 (9.24) (9.25) ν=1 no cambia su valor tomada sobre un contorno arbitrario del espacio fásico, a través del cual pasan trayectorias reales que lo deforman al desplazarse sobre la “manguera” de trayectorias reales. I es una integral invariante, llamada la integral invariante de Poincaré-Cartán (véase el texto de Gantmacher, Lectures in analytical mechanics, sección 18). Teorema de Poincaré-Cartán. I es una integral invariante a lo largo de un haz de trayectorias arbitrario en el espacio de fase si y sólo si esas trayectorias son solución a las ecuaciones canónicas de Hamilton. Hemos demostrado que si las trayectorias son solución a las ecuaciones de Hamilton, I es una integral invariante. Restarı́a por mostrar que si I es una integral invariante entonces las trayectorias son solución a las ecuaciones de Hamilton. La demostración está en el texto de Gantmacher indicado anteriormente. Como en este teorema se muestra que las ecuaciones de Hamilton son consecuencia de la invariancia de I, ésta puede plantearse como un principio general de la mecánica, que fue hallado por Poincaré en el año 1890. Las ecuaciones de Whittaker. En la integral de Poincaré-Cartán (9.25), podemos ver que hay analogı́a entre las pν y −H, y entre las qν y t. Podemos pensar en un 326 / Mecánica clásica avanzada formalismo en el cual se intercambien los papeles de (−H, t) y una pareja de variables canónicamente conjugadas, digamos (p1 , q1 ),2 en un espacio de fases ampliado 2l + 1dimensional, donde t no es simplemente un parámetro. Sean (S = −H, t) las cantidades que cambiaremos por (p1 , q1 ): s = −H(q, p, t) (9.26) La ecuación (9.26) nos permite expresar a p1 en términos de (q), p2 , ...pl , s, t: p1 = −K(q1 , q2 , ...ql , p2 , p3 , ...pl , s, t) Entonces podemos escribir la integral invariante I como: I I = (s∆t + p2 ∆q2 + pl ∆ql − K ∆q1 ) (9.27) (9.28) En estas variables, K hace las veces de H y q1 las veces de t. Hemos probado, pues, que el movimiento del sistema con las nuevas variables obedece las ecuaciones: dt = dq1 ∂K ; ∂s ∂K ∂s =− dq1 ∂t dqν = dq1 ∂K ; ∂pν dpν ∂K =− ; dq1 ∂qν (9.29) ν = 1, 2, ...l donde ahora q1 es la variable independiente o “tiempo”. Sea ahora un sistema generalizado conservativo (o sea un sistema arbitrario para el cual H no depende del tiempo). En este caso: H(q, p) = h = constante (9.30) que sabemos, en general no coincide con E = T + V . Ahora, en la integral invariante I tomemos sólo aquellos estados para los cuales la constante h toma un mismo valor, h0 . Todas las trayectorias tendrán la misma energı́a. Entonces: I I H ∆t = h0 ∆t = 0 (9.31) La integral invariante será:3 I= I X l pν ∆qν (9.32) ν=1 Si ahora en (9.30) despejamos p1 obtenemos: p1 = −K(q1 , q2 , ...ql ; p2 , p3 , ...pl , h0 ) (9.33) 2 Véase el texto de Whittaker, A treatise on the analytical dynamics of particles and rigid bodies, capı́tulo XII, numeral 141. 3 La invariancia de I es análoga a un teorema de hidrodinámica que establece que la circulación en cualquier curva cerrada que se mueve con un fluido no cambia con el tiempo. Las transformaciones canónicas / 327 con lo cual (9.32) se puede escribir en la forma: ! I X l pν ∆qν − K∆q1 I= (9.34) ν=2 Esta integral toma la forma de la integral invariante de Poincaré-Cartán, tomando como variables de estado a q2 , p2 , q3 , p3 , ...ql , pl , a q1 como el tiempo, y a K en lugar de H. En virtud del teorema mencionado, se cumple que el movimiento de este sistema obedece las ecuaciones de Hamilton siguientes (2l − 2 en total): dqν ∂K = ; dq1 ∂pν dpν ∂K =− ; dq1 ∂qν ν = 2, 3, ...l (9.35) Las ecuaciones (9.35) son las ecuaciones de Whittaker. O sea que para un sistema generalizado conservativo (para el cual H es constante) se requieren sólo 2l − 2 ecuaciones para definir la trayectoria del sistema. El sistema de ecuaciones hamiltonianas de Whittaker puede ser expresado en forma lagrangiana: ∂M d ∂M = 0; − dq1 ∂qν′ ∂qν ν = 2, 3, ...l (9.36) donde qν′ = dqν /dq1 y M (la función análoga de la lagrangiana) es el generador de la transformación de Legendre de las variables (qν , qν′ ) a las variables (qν , pν ). M y K tienen una relación análoga a L y H, véase (3.16). M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) = l X ν=2 pν qν′ − K(q1 , q2 , q3 , ...ql , p2 , p3 , ...h0 ) (9.37) La integración de las ecuaciones de Whittaker nos conduce a qν , pν , en función de q1 , es decir, a las ecuaciones de la trayectoria en el espacio de fases. La solución de (9.35) contendrá 2l − 2 constantes de integración y dependerá además de la constante h0 : qν = qν (q1 , h0 , C1 , C2 , ...C2l−2 ) (9.38) pν = pν (q1 , h0 , C1 , C2 , ...C2l−2 ) ; ν = 2, , 3, ...l Reemplazando (9.38) en (9.33) llegamos a: p1 = p1 (q1 , h0 , C1 , C2 , ...C2l−2 ) (9.39) Las expresiones (9.38) y (9.39) constituyen las ecuaciones de las trayectorias en el espacio de fases. La dependencia temporal de las coordenadas se recobra de la ecuación q̇1 = ∂H/∂p1 : Z dq1 t= + C2l−1 (9.40) ∂H/∂p1 donde ∂H/∂p1 se puede expresar en términos de q1 por medio de las ecuaciones (9.38) y (9.39). Para sistemas que poseen la constante de movimiento h, se puede resolver el problema mecánico con sólo 2l − 2 ecuaciones del tipo hamiltoniano o con l − 1 ecuaciones del tipo lagrangiano, (9.35) y (9.36) respectivamente. 328 / Mecánica clásica avanzada 9.3. El principio de mı́nima acción y expresiones equivalentes El principio de mı́nima acción de Maupertuis-Euler-Lagrange. Como las ecuaciones (9.36) son de tipo lagrangiano, pueden ser obtenidas de un principio variacional, ∆Σ = 0, donde: Σ= Z q22 q11 M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) dq1 (9.41) La variable Σ es llamada la acción de Lagrange, en tanto que S se llama la acción de Hamilton. ∆Σ = 0 caracteriza las trayectorias que pasan por los puntos definidos por q1 = q11 y q1 = q12 , o sea las soluciones de (9.36) tales que ∆qν (q11 ) = ∆qν (q12 ) para ν = 2, 3, ...l. ∆ representa “desplazamientos virtuales” respecto a q1 , es decir, desplazamientos realizados con q1 fijo y que no cambian los extremos de la trayectoria; en cuanto al tiempo la situación es diferente, pues t1 y t2 pueden variar cuando se pasa de una trayectoria real a una circuitosa. Esto es esquematizado en la figura 9.5, donde B representa una trayectoria real y A una circuitosa, ambas con el mismo valor de la energı́a.4 t2 + ∆t2 (q + ∆q) t + ∆t t P1 1 q1 P2 2 t2 A t1 + ∆t1 q1 (∆q) (q) B t t1 Figura 9.5 Paso de una trayectoria real B a una circuitosa A La función M se puede expresar en términos de L. En efecto, se sigue de (9.27) y (9.37) que: M= l X ν=2 4 Las l pν qν′ + p1 = 1X 1 1 pν q̇ν = (L + H) = (2T2 + T1 ) q̇ ν=1 q̇ 1 q̇ 1 (9.42) trayectorias A y B que se cortan en P1 y P2 en el espacio de configuración, son las proyecciones de dos trayectorias en el espacio de fases ampliado, sobre H = h0 , que no se cortan. Las transformaciones canónicas / 329 En la igualdad (9.42) se ha usado la ecuación (3.127). La integral (9.41) se puede escribir como: Z t2 (L + H)dt = S + h(t2 − t1 ) (9.43) Σ= t1 se ve que ∆Σ = ∆S + h(∆t2 − ∆t1 ), cuando tomamos sólo trayectorias circuitosas con el mismo valor de la energı́a. La expresión ∆Σ = 0 define la ecuación de la trayectoria entre todas las que satisfacen la conservación de la energı́a, con ∆qν = 0 en P1 y P2 . Además, se sigue de (9.41) y (9.43): Z t2 X l Σ= pν q̇ν dt (9.44) t1 ν=1 Para un sistema conservativo ordinario (tal que T + V es constante), T1 = 0 y T = T2 , con lo cual (9.42) nos dice que M = 2T /q1 . Entonces: Z t2 N Z ri2 X mi ṙi dri (9.45) 2T dt = Σ= t1 i=1 ri1 Esto nos dice: “dada la configuración inicial y final de un sistema descrito por un hamiltoniano constante, e igual a la energı́a total, con un valor dado de la energı́a, la trayectoria del sistema en el espacio de configuración es aquella para la cual la integral de la energı́a cinética es estacionaria, cuando se compara con las trayectorias vecinas que satisfacen dichas condiciones”. Este principio es aplicable sólo a sistemas conservativos. Los tiempos requeridos para moverse sobre las diferentes trayectorias pueden cambiar pero la energı́a es la misma sobre cada curva. En el principio de Hamilton aplicado a sistemas conservativos, se consideran sólo aquellas trayectorias para las cuales el tiempo de movimiento a lo largo de ellas es el mismo, aunque las energı́as asociadas a ellas pueden diferir. Las trayectorias variadas en el principio de Hamilton no corresponden necesariamente con trayectorias posibles del movimiento del sistema, H puede no conservarse sobre ellas. En el principio de mı́nima acción se consideran trayectorias variadas donde el tiempo puede variar pero H sı́ se conserva. En estos dos principios se halla la trayectoria verdadera “escogiendo” entre las trayectorias de dos conjuntos de trayectorias definidas de manera diferente. Otra forma de obtener que ∆Σ = 0 es la siguiente: Z t2 X Z t2 l (L + H) dt = S + h(t1 − t2 ) (9.46) Σ= pν q̇ν dt = t1 t1 ν=1 Tomando variaciones en (9.46) y usando la expresión (9.11) para ∆S: t2 " l # t2 X ∆Σ = ∆S + h(∆t1 − ∆t2 ) = pν ∆qν − h∆t + h∆t ν=1 = l X ν=1 t1 t1 t2 pν ∆qν (9.47) t1 330 / Mecánica clásica avanzada Tomando a ∆qν = 0 en t1 y t2 y ν = 1, 2, ...l, se sigue que ∆Σ = 0. A la función S se le llama acción principal ( o de Hamilton) y a la función Σ se le llama acción reducida (o de Lagrange). Resumen Histórico. Fermat, matemático francés (1601-1665), formuló el principio del mı́nimo tiempo en la óptica de rayos: un rayo de luz se propaga sobre aquella trayectoria para la cual el tiempo de tránsito es mı́nimo. En lenguaje variacional (moderno): Z B Z B dl ∆ dt = 0 ⇒ ∆ =0 (9.48) A A v Maupertuis, especulando con las concepciones filosóficas de Leibnitz, expresó en 1744 la conjetura de que la evolución de una partı́cula material se da de tal manera que el producto m.v.l es mı́nimo, dio ejemplos en los cuales las trayectorias son rectilı́neas y por tanto v es constante. El matemático suizo Euler (1703-1793) enunció en 1744 el principio de mı́nima acción, esta vez como un teorema, basado en sus trabajos sobreRel cálculo de variaciones. Tal enunciado es de la forma: la diferencia entre la integral vdl para una partı́cula, tomada a lo largo de una trayectoria real, y la misma integral sobre una trayectoria vecina (es decir sobre una trayectoria sobre la cual se mueve la partı́cula sin obedecer las leyes de Newton), que pasan por dos puntos dados, es una cantidad infinitesimal de segundo orden; se supone que la partı́cula viaja sobre la trayectoria variada con una velocidad para la cual la energı́a total tiene un valor dado: Z B ∆E=C v dl = 0 (9.49) A donde C es una constante. En 1760 Lagrange (1736-1813) extendió el principio de Euler a sistemas de partı́culas: ∆E=C Z N BX A i=1 m~vi · d~ri = 0 (9.50) Lagrange mostró además que (9.50) se cumple si y sólo si vale la segunda ley de Newton, mi~¨r i = −∂V /∂~ri , i = 1, 2, ...N . Además, Lagrange fue el primero que introdujo las coordenadas generalizadas, con las cuales (9.50) es: ∆E=C Z N BX A pν dqν = 0 (9.51) i=1 Cuando en (9.51) se asume que T es función cuadrática de las velocidades generalizadas se tiene: Z B ∆E=C 2T dt = 0 (9.52) A Lagrange llamó a (9.52) el principio de la más pequeña o más grande fuerza viva. Las transformaciones canónicas / 331 Hamilton, escocés que vivió entre 1805 y 1865, aportó en 1835 la formulación general del principio de mı́nima acción y las ecuaciones de Hamilton. Extiende la formulación al considerar trayectorias circuitosas en que la energı́a no se conserva: Z B Z B ∆ L dt = ∆ (2T − H)dt = 0 (9.53) A A El conjunto de trayectorias es tal que pasa simultáneamente por los mismos puntos inicial y final. Es claro ya por qué a Σ se llama la acción de Lagrange y a S la acción de Hamilton. Los principios de Hamilton y de mı́nima acción son aplicables equivalentemente para sistemas conservativos, sin embargo, el primero es más general pues se aplica además a sistemas holónomos generales, con una generalización a sistemas holónomos con fuerzas no derivables de un potencial, ecuación (3.12). Las ecuaciones de Jacobi. Para el caso de un sistema conservativo ordinario T puede escribirse como: T = T2 = l X aµν q̇µ q̇ν = q12 G(q1 , q2 , ...ql , q2′ , q3′ , ...ql ) (9.54) µ,ν=1 donde: G= l X aµν qµ′ qν′ (q1′ = 1) (9.55) µ,ν=1 Como H = h = T + V , (9.54) conduce a: r h−V q̇1 = G (9.56) Para M , (9.56) nos da: M= p 2T = 2 G(h − V ) q̇1 (9.57) Las ecuaciones diferenciales lagrangianas de Whittaker, (9.36) con M dado por (9.57), que son aplicables a sistemas conservativos ordinarios, se llaman las ecuaciones de Jacobi (1886). Otras formas del principio de acción estacionaria de Maupertuis-EulerLagrange. Definimos en el espacio de configuración los vectores l-dimensionales ρ~ = {q1, q2, ...ql }. Entonces el vector ρ ~ determina la posición del sistema en el espacio de configuración. La energı́a cinética está relacionada con la velocidad del punto representativo del sistema en el espacio de configuración, ρ ~˙ . Para un sistema esclerónomo la energı́a cinética es función cuadrática de las velocidades generalizadas, de acuerdo con (9.54): T = l l 1 X 1 X 2aµν q̇µ q̇ν = mµν dqµ dqν 2 µ,ν=1 2dt2 µ,ν=1 (9.58) 332 / Mecánica clásica avanzada Si definimos en el espacio de configuración la métrica no cartesiana mµν = 2aµν , donde aµν está dada por (3.105), el producto escalar de dos vectores, ρ ~ y ~n, estará dado por: (~ ρ, ~η ) = l X mµν ρµ ην (9.59) µ,ν=1 O sea que es posible asociar al espacio de configuración de un sistema mecánico un espacio riemanniano, dado por la métrica (tensor métrico) mµν (véase el texto de Lichnerowicz, Cálculo tensorial, capı́tulo VI). De las expresiones (9.58) y (9.59), tenemos que: T = 1 ˙2 dρ ρ ~ ⇒ dt = √ 2 2T (9.60) Se sigue que la energı́a cinética de un sistema dinámico siempre coincide con la energı́a cinética del punto representativo en el espacio de configuración, si a ese punto se le asigna una masa m = 1. El principio de acción estacionaria tomará la forma: Z (q2 ) √ Z t2 2T dρ = 0 (9.61) 2T dt = ∆ ∆Σ = ∆ t1 (q1 ) Para sistemas conservativos, tales que h = T + V : Z (q2 ) √ ∆ h − V dρ = 0 (9.62) (q1 ) La ecuación (9.62) se llama la forma de Jacobi del principio de acción estacionaria. Para un movimiento libre, V = 0: Z (q2 ) dρ = 0 (9.63) ∆ (q1 ) La ecuación (9.63) indica √ que la trayectoria es la √ más corta, la lı́nea recta; donde la longitud recorrida es ρ = 2h, donde ρ = (t1 − t2 ) 2h. Para V = 0, el punto representativo del sistema en el espacio de configuración se √ mueve uniformemente con velocidad 2h sobre una trayectoria recta. En general, para V 6= 0, de la forma de Jacobi del principio de acción estacionaria se deduce que la trayectoria del sistema en el espacio de configuración (trayectoria real) es la geodésica. Esta trayectoria también es la “más recta” o sea la de mı́nima curvatura (principio variacional de Hertz de la mı́nima curvatura). 9.4. El teorema de Li Hua Chung Sea la integral invariante de Poincaré-Cartán, I, definida en (9.25). Según (9.24), I tiene el mismo valor sobre cualquier contorno cerrado que envuelva el mismo haz de trayectorias reales en el espacio de fases. Particularicemos para el caso en que los puntos Las transformaciones canónicas / 333 sobre C1 y C2 tienen los mismos tiempos. Es decir, sea C1 un conjunto de puntos del espacio de fases que forma una lı́nea cerrada y que corresponde a estados simultáneos de un sistema de acuerdo con (9.17), las ecuaciones paramétricas de C1 son: qν1 = qν1 (α) ; t1 (α) = constante ; p1ν = p1ν (α) ; ν = 1, 2, ...l (9.64) C2 está definida similarmente. A lo largo de estos contornos se cumple que ∆t = 0, reduciéndose la ecuación (9.24) a: I l X pν ∆qν = C2 ν=1 I l X pν ∆qν = I1 (9.65) C1 ν=1 La integral I1 fue introducida por Poincaré pero fue Cartán quien la extendió a contornos formados por estados no simultáneos con la introducción del término adicional −Ht.5 Sea C un contorno arbitrario en el espacio de fases (véase figura 9.6). Es claro que las proyecciones de C sobre cada uno de los planos de fase (qν , pν ), ν = 1, 2, ...l, constituye una curva cerrada bidimensional, que llamaremos Cν , ν = 1, 2, ...l. Pν Cν Aν qν Figura 9.6 C es un contorno arbitrario en el espacio de fases con proyecciones Cν Se sigue entonces que: I (p1 ∆q1 + p2 ∆q2 + ...pl ∆ql ) = C I I I p2 ∆q2 + ... p1 ∆q1 + pl ∆ql (9.66) El área encerrada por el contorno Cν es Aν , donde: I pν ∆qν = ±Aν (9.67) C1 C2 Cl Cν 5 La mecánica de Hamilton puede desarrollarse postulando un espacio de dimensión par dotado de una estructura definida por la invariancia de I1 . 334 / Mecánica clásica avanzada Se toma el signo más si se evalúa H la integral Hen el sentido de las agujas del reloj y menos en el sentido contrario. Como C pν ∆qν = cν pν ∆qν , el sentido del contorno Cν dependerá del sentido de C. Entonces: I X l l X ±Aν (9.68) pν ∆qν = I1 = C ν=1 ν=1 donde C consta de estados simultáneos. Los contornos C y Cν varı́an durante el movimiento del sistema y las áreas Aν también varı́an, pero la suma algebraica de esas áreas, (9.68), permanece constante. La anterior es pues la interpretación geométrica de la invariancia de la integral de Poincaré I1 . Como H no aparece en I1 , hallamos que la invariancia de I1 no depende del sistema mecánico particular, es decir, I1 es invariante para cualquier sistema hamiltoniano. Por esto se llama a I1 la integral universal invariante. Es válido entonces enunciar el siguiente teorema: si q̇ν = ∂H/∂pν ; ṗν = −∂H/∂qν , ν = 1, 2, ...l, entonces I1 es invariante. Si I1 es invariante para algún sistema de ecuaciones diferenciales q̇ν = Qν = Qν (q, p, t), ṗν = Pν (q, p, t), ν = 1, 2, ...l, entonces ese sistema debe ser hamiltoniano. Para demostrar la segunda parte, sea: I X l dpν dI1 d∆qν = ∆qν + pν dt dt dt ν=1 = I X l (ṗν ∆qν + pν ∆q̇ν ) I X l (ṗν ∆qν + ∆(pν q̇ν ) − ∆pν q̇ν ) I X l (ṗν ∆qν − q̇ν ∆pν ) I X l (Pν ∆qν − Qν ∆pν ) ν=1 = ν=1 = ν=1 = ν=1 (9.69) Como I1 = 0, se sigue que (9.69) debe ser igual a la integral de una diferencial ∆ exacta de alguna función de (q, p, t) que llamaremos −H: I X l (Pν ∆qν − Qν ∆pν ) = ν=1 I −∆H = − Z X l ∂H ν=1 ∂H ∆qν + ∆pν ∂qν ∂pν (9.70) entonces, Pν = −∂H/∂qν ; Qν = ∂H/∂pν ; ν = 1, 2, ...l, con lo cual se concluye la prueba. Las transformaciones canónicas / 335 Teoremas de Stockes. En la teorı́a de campos vectoriales se muestra que la integral de lı́nea a lo largo de una curva rectificable es igual a la integral de superficie sobre la región encerrada por esa lı́nea del rotacional del vector: I Z Z ~ · dS ~ V~ · d~r = rotV (9.71) C S En términos de las componentes: Z Z X I X 3 3 ∂Vj Vi dxi = dSk ǫijk ∂xi C i=1 (9.72) S i,j,k=1 ~ que determina un donde ǫijk es el tensor de Levi-Civita. dSk es la componente de dS plano perpendicular a la dirección ~ek ; por tanto dSk = dxi dxj con i 6= j 6= k, o sea que: Z Z X I X 3 3 ∂Vj ∂Vi Vi dxi = dxi dxj (9.73) − ∂xi ∂xj C i=1 i<j=1 S En geometrı́a diferencial se llama a una integral sobre un contorno cerrado “integral relativa” y a una integral sobre una región que no es cerrada “integral absoluta”; una integral de lı́nea se llama de “primer orden” y una de superficie se llama “de segundo orden” porque aparecen uno y dos diferenciales respectivamente. En el espacio de fases, el teorema de Stockes toma la forma: Z Z X I X 2l 2l ∂Vj ∂Vi Vi ∆xi = ∆xi ∆xj (9.74) − ∂xi ∂xj C i=1 i<j=1 S donde x1 = q1 , ...xl = ql ; xl+1 = p1 , ...x2l = pl . Ası́, para l = 1, (9.74) es: Z Z I ∂A ∂B ∆q ∆p − (A∆q + B∆p) = ∂q ∂p C (9.75) S En particular, para A = p y B = 0, como es de esperarse: Z Z Z p ∆q = ∆p ∆q C (9.76) S La ecuación (9.74) puede escribirse como: I X l (Aν ∆qν + Bν ∆pν ) = C ν=1 Z Z " X l ∂Aν ∂Aµ ∆qµ ∆qν + − ∂qµ ∂qν µ<ν=1 S l X ∂Aµ ∂Bν ∆qµ ∆pν + − ∂qµ ∂qν µ,ν=1 # l X ∂Bν ∂Aµ ∆pµ ∆pν − ∂pµ ∂pν µ<ν=1 (9.77) 336 / Mecánica clásica avanzada Para Aν = pν y Bν = 0, se cumple: I X Z Z X l l pν ∆qν = ∆pν ∆qν C ν=1 (9.78) S ν=1 En general, una integral relativa de orden 2ν − 1, de orden impar, puede escribirse como una integral absoluta de orden par 2ν, para ν = 1, 2, ...l. Ası́ por ejemplo, se cumple que: Z Z X I X l l pν ∆qν = J2 = ∆qν ∆pν (9.79) I1 = S ν=1 ν=1 I3 = = Z Z Z l X pν ∆qν ∆pµ ∆qµ = J4 µ,ν=1 Z Z Z Z X l ∆qν ∆pν ∆qµ ∆pµ (9.80) µ,ν=1 I2l−1 = = Z Z Z Z Z ... Z ··· Z l X pν1 ∆qν1 ∆pν2 ∆qν2 ... ∆pνl ∆qνl = J2l ν1 , ν2 , ...νl =1 l X (9.81) ∆q1 ∆p1 ... ∆ql ∆pl ν1 , ν2 , ...νl =1 Se puede mostrar que I1 , I3 , ...I2l−1 son integrales universales invariantes. O sea que una integral universal invariante relativa de orden impar I2ν−1 puede representarse como una integral invariante absoluta de orden par J2ν . En 1947 Li Hua Chung probó que cualquier integral universal invariante difiere por un factor constante de una de las integrales (9.79), (9.80) o (9.81). Gantmacher presenta la demostración de que cualquier integral universal invariante relativa de primer orden es un múltiplo de I1 , para l = 1. Teorema de Li Hua Chung. Este teorema dice que si: ZZ Z h l X ··· Aµ1 ∆qµ1 ∆pµ2 ∆qµ2 ... I (ν) = Vν µ1 , µ2 , ...µl =1 ∆pµν ∆qµν + Bµ1 ∆pµ1 ∆pµ2 ∆qµ2 ... ∆pµν ∆qµν es una integral universal invariante relativa, entonces: I (ν) = CIν (9.82) i (9.83) donde C es una constante, e Iν es una de las l integrales universales invariantes de Poincaré. Vν es una variedad cerrada de ν dimensiones en el espacio de fases, donde Las transformaciones canónicas / 337 ν = 1, 3, ..,2l − 1. Notación vectorial en el espacio de fases. V~ denotará una matriz columna de l dimensiones con componentes Vν , ν = 1, 2, ...l. M̃ es una matriz cuadrada, l × l, con componentes Mµν . El gradiente de una función F respecto a las coordenadas y a los momentos, se denota respectivamente por: ∂F ∂F , ∂~q ∂~ p (9.84) y es un vector, o sea una matriz columna con componentes ∂F/∂qν y ∂F/∂pν respectivamente; ν = 1, 2, ...l. El gradiente de un vector es una matriz l × l, ası́: ! ! ~ ~ ∂Vµ ∂Vµ ∂V ∂V = = ; ; µ, ν = 1, 2, ...l (9.85) ∂~q ∂qν ∂~ p ∂pν µν µν El producto escalar de dos vectores es: ~ ·V ~ = U l X Uν Vν (9.86) ν=1 ~ , es un vector. y el producto de una matriz por un vector, M̃ V Prueba del teorema de Li Hua Chung para ν = 1. Usando la notación vectorial, se cumple que: I X l h i I ~ · ∆~q + B ~ · ∆~ p) Aν (~ q , p~, t)∆qν + Bν (~q, ~p, t)∆pν = (A I = ′ (9.87) C ν=1 Las ecuaciones de movimiento en el espacio de fases son: ∂H ∂H ˙ ; p~ = − q~˙ = ∂~ p ∂~q (9.88) La solución de las ecuaciones (9.88) es de la forma: q=~ ~ q (~ q0 , ~ p0 , t); p~ = p~(~ q0 , p~0 , t) (9.89) donde ~q0 y p~0 son los valores de ~ q y ~q para t = t0 . En el tiempo t = t0 definimos la curva cerrada C0 , constituida por un conjunto de estados simultáneos, caracterizada por un conjunto de parámetros (α): q0 = ~ ~ q (α); p~0 = ~ p0 (α); (αi ) ≤ (α) ≤ (αf ) (9.90) Los puntos que en t = t0 estaban sobre el contorno C0 , formarán un contorno C en algún otro instante de tiempo t. Los puntos del contorno C se obtienen reemplazando (9.90) en (9.89): q=~ ~ q (α, t); ~ p = p~(α, t); (αi ) ≤ (α) ≤ (αf ) (9.91) 338 / Mecánica clásica avanzada Poniendo (9.91) en (9.87) se obtiene a I ′ en función de t. De la invariancia de I ′ se sigue que dI ′ /dt = 0. Derivando a (9.87): I ′ ~˙ · ∆~q + A ~ · ∆~q˙ + B ~˙ · ∆~ ~ · ∆p~˙ = 0 ˙ A p+B (9.92) I = donde se usó la propiedad d(∆~q)/dt = ∆~q˙ . La ecuación (9.92) también se puede escribir como: I h i ~˙ · ∆~q + ∆(A ~ · ~q˙ ) − ∆A ~ · ~q˙ + B ~˙ · ∆~ ~ · p~˙ ) − ∆B ~ · p~˙ A p + ∆(B (9.93) I˙′ = Se cumple que: I C ~ ·~ ~ · ~q˙ ∆(A q˙ ) = A (αi ) =0 (9.94) (αf ) debido a que ~ q (αi , t) = ~q(αf , t); ~p(αi , t) = p~(αf , t), por ser C un contorno cerrado. Por otra parte: ~ ~ ~ ~˙ = ∂ A · ~q˙ + ∂ A · ṗ + ∂ A A ∂~q ∂~p ∂t (9.95) ~ ~ ∂A ∂A · ∆~q + · ∆~ p ∂~q ∂~p (9.96) ~= ∆A Usando (9.95) y (9.96), obtenemos: ! I " ~ ~ ~ ∂A ∂A ∂A ′ ˙ ˙ I = · ∆~q − · ~q + · ṗ + ∂~q ∂~p ∂t + ~ ~ ~ ∂B ∂B ∂B · ~q˙ + · ṗ + ∂~q ∂~p ∂t ! · ∆~ p− ! ~ ~ ∂A ∂A · ∆~q + · ∆~ p · ~q˙ ∂~q ∂~p ! # ~ ~ ∂B ∂B · ∆~q + · ∆~ p · ~p˙ ∂~q ∂~p (9.97) Reagrupando términos y expresando a ~q˙ y ~p˙ por medio de (9.88) obtenemos: ! ! # I " ~ ~ ∂H ∂H ∂A ∂B ′ ˙ −Z̃ · ∆~q + −Z̃ · ∆~ p (9.98) I = + + ∂~q ∂t ∂~p ∂t donde la matriz Z̃ se define como: Z̃ = ~ ~ ∂A ∂B − ∂~ p ∂~q (9.99) Como I˙′ = 0, el integrando en (9.98) debe ser el diferencial de alguna función F : ∆F = ∂F ∂F · ∆~q + · ∆~ p ∂~q ∂~p (9.100) Las transformaciones canónicas / 339 comparando (9.98) y (9.100) vemos que: ~ ∂F ∂H ∂A = −Z̃ + ; ∂~q ∂~q ∂t ~ ∂F ∂H ∂B = −Z̃ + ∂~p ∂~p ∂t (9.101) En términos de componentes (9.101) toma la forma: l l λ=1 λ=1 X X ∂F ∂H ∂H ∂Aν ∂Bν ∂F =− Zνλ + =− Zνλ + ; ∂qν ∂qλ ∂t ∂pν ∂pλ ∂t (9.102) Como F ha de ser una función continua de ~q y p~ se debe cumplir: ∂2F ∂2F ∂2F ∂2F ∂2F ∂2F = ; = ; = ∂qµ ∂qν ∂qν ∂qµ ∂pµ ∂pν ∂pν ∂pµ ∂pµ ∂qν ∂qν ∂pµ (9.103) De (9.102) y (9.103) se sigue que: − X ∂Zνλ ∂H X ∂ 2 Aν ∂2H − + = Zνλ ∂qµ ∂qλ ∂qµ ∂qλ ∂qµ ∂t − X ∂Zµλ ∂H X ∂ 2 Aµ ∂2H − + Zµλ ∂qν ∂qλ ∂qν ∂qλ ∂qν ∂t − X ∂Zνλ ∂H X ∂ 2 Bν ∂2H − + = Zνλ ∂pµ ∂pλ ∂pµ ∂pλ ∂pµ ∂t λ λ λ λ λ λ X ∂Zµλ ∂H X ∂ 2 Bµ ∂2H − − + Zµλ ∂pν ∂pλ ∂pν ∂pλ ∂pν ∂t λ λ − X ∂Zνλ ∂H X ∂ 2 Aν ∂2H − + = Zνλ ∂pµ ∂qλ ∂pµ ∂qλ ∂pµ ∂t − X ∂Zµλ ∂H X ∂2H ∂ 2 Bµ − + Zµλ ∂qν ∂pλ ∂qν ∂pλ ∂qν ∂t λ λ (9.104) λ λ En (9.104) consideremos los casos µ = ν y µ 6= ν. Para µ = ν se tiene sólo una relación no trivial, la tercera: X ∂Zνλ ∂H ∂2H ∂2H Zνλ ∂H − − + Zνλ − Zνλ ∂pν ∂qλ ∂qν ∂pλ ∂pν ∂qλ ∂qν ∂pλ λ 2 2 ∂ ∂ Aν ∂ Bν + =0 (9.105) − ∂t ∂pν ∂qν Como H es arbitrario, (9.105) se cumple sólo si: Zνλ = Zνν δνλ ; ∂Zνν ∂Zνν ∂Zνν = 0; = 0; =0 ∂pν ∂qν ∂t (9.106) 340 / Mecánica clásica avanzada Para µ 6= ν y usando (9.106), las relaciones (9.104) quedan: − ∂Zνν ∂H ∂2H ∂ 2 Aν − Zνν + = ∂qµ ∂qν ∂qµ ∂qν ∂qµ ∂t − ∂2H ∂ 2 Aµ ∂Zµµ ∂H − Zµµ + ∂qν ∂qµ ∂qν ∂qµ ∂qν ∂t − ∂2H ∂ 2 Bν ∂Zνν ∂H − Zνν + = ∂pµ ∂pν ∂pµ ∂pν ∂pµ ∂t (9.107) ∂2H ∂ 2 Bµ ∂Zµµ ∂H − Zµµ + − ∂pν ∂pµ ∂pν ∂pν ∂pν ∂t − ∂2H ∂ 2 Aν ∂Zνν ∂H − Zνν + = ∂pµ ∂qν ∂pµ ∂qν ∂pµ ∂t − ∂2H ∂ 2 Bµ ∂Zµµ ∂H − Zµµ + ∂qν ∂pµ ∂qν ∂pµ ∂qν ∂t Las ecuaciones (9.107) pueden escribirse ası́: − ∂Zνν ∂H ∂Zµµ ∂H ∂2H + + (Zµµ − Zνν ) ∂qµ ∂qν ∂qν ∂qµ ∂qµ ∂qν + ∂ ∂t − ∂Zµµ ∂H ∂2H ∂Zνν ∂H + + (Zµµ − Zνν ) ∂pµ ∂pν ∂pν ∂pµ ∂pµ ∂pν ∂ + ∂t ∂Aν ∂Aµ − ∂qµ ∂qν ∂Bν ∂Bµ − ∂pµ ∂pν =0 (9.108) =0 − ∂Zµµ ∂H ∂ 2H ∂Zνν ∂H + + (Zµµ − Zνν ) ∂pµ ∂qν ∂qν ∂pµ ∂pµ ∂qν + ∂ ∂t ∂Aν ∂Bµ − ∂pµ ∂qν =0 Las transformaciones canónicas / 341 Como H es arbitrario, de (9.108) se sigue que: ∂Zνν ∂Zµµ = 0; = 0 ; Zµµ = Zνν ∂qµ ∂pµ ∂ ∂t ∂ ∂t ∂Aν ∂Aµ − ∂qµ ∂qν ∂Aν ∂Bµ − ∂pµ ∂qν = 0; ∂ ∂t ∂Bν ∂Bµ − ∂pµ ∂pν =0 (9.109) =0 Las relaciones (9.106) y (9.109) nos dan que para todos µ, ν, se cumple: Zνλ = Z δνλ ; ∂Z ∂Z = 0; =0 ∂qν ∂pν ∂Z = 0 ⇒ Z = constante ∂t ∂ ∂Bν ∂Aµ ∂Bµ ∂ ∂Aν = 0; =0 − − ∂t ∂qµ ∂qν ∂t ∂pµ ∂pν ∂ ∂t ∂Aν ∂Bµ − ∂pµ ∂qν (9.110) =0 donde Z = Zνν . Para µ = ν cumple Zµν = 0, o sea: ∂Bµ ∂Aµ = ; ∂pν ∂qν µ=ν reemplazando (9.111) en la última igualdad (9.110) se obtiene: ∂ ∂Aν ∂Aµ =0 − ∂t ∂pµ ∂pν (9.111) (9.112) La ecuación (9.112) y la primera igualdad (9.110) nos dan: ∂ ∂Aν ∂ ∂Aµ ∂ ∂Aν ∂ ∂Aµ = ; = ∂pµ ∂t ∂pν ∂t ∂qµ ∂t ∂qν ∂t (9.113) Las expresiones (9.113) se cumplen si Aν (q, p, t) son de la forma: Aν = ∂f (q, t) ∂g(p, t) + ∂qν ∂pν (9.114) donde f y q son funciones continuas. Bν satisfacen, por los mismos argumentos, relaciones similares a (9.113), por tanto: Bν = ∂f ′ (q, t) ∂g ′ (p, t) + ∂qν ∂pν (9.115) 342 / Mecánica clásica avanzada ~ y B ~ para Las ecuaciones (9.114) y (9.115) son las condiciones que deben satisfacer A que (9.87) sea una integral universal invariante. Se cumple entonces que, para µ 6= ν: ∂Aν ∂Aµ ∂2f ∂2f − = − =0 ∂qµ ∂qν ∂qµ ∂qν ∂qν ∂qµ ∂Bµ ∂ 2g′ ∂ 2g′ ∂Bν − = − =0 ∂pµ ∂pν ∂pµ ∂pν ∂pν ∂pµ (9.116) ∂Bµ ∂Aν ∂Aµ ∂2g ∂2g ∂Aν − = − = − =0 ∂pµ ∂qν ∂pµ ∂pν ∂pµ ∂pν ∂pν ∂pµ Para µ = ν las dos primeras igualdades en (9.116) siguen siendo válidas, en tanto que la tercera se reemplaza por: ∂Aν ∂Bν − = Zνν = C ∂pν ∂qν (9.117) Por tanto, (9.116) y (9.117) nos dan para todos µ, ν: ∂Aν ∂Aµ = ; ∂qµ ∂qν ∂Bν ∂Bµ = ; ∂pµ ∂pν ∂Aν ∂Bµ − = Cδµν ∂pµ ∂qν (9.118) También podemos escribir a (9.118) ası́: ∂Aν ∂Aµ = ; ∂qµ ∂qν ∂Bν ∂Bµ = ; ∂pµ ∂pν ∂ ∂Bµ (Aν − Cpν ) = ∂pµ ∂qν (9.119) Las expresiones (9.119) nos dicen que debe existir cierta función Φ(~q, ~p, t) tal que: ∆Φ = ∂Φ ∂Φ ~ − C~ ~ · ∆~ · ∆~q + · ∆~ p = (A p) · ∆~q + B p ∂~q ∂~p (9.120) puesto que: ∂Φ ∂Φ = Aν − C pν ; = Bν ∂qν ∂pν (9.121) Lo anterior implica que se cumplan las relaciones (9.119) a fin de que Φ sea continua. Se tiene entonces que: I I I ~ ~ (A · ∆~ q + B · ∆~ p) = C~ p · ∆~q + ∆Φ (9.122) La integral universal invariante (9.87) es entonces igual a: I I ′ ~ ~ I = (A · ∆~ q + B · ∆~ p) = C p~ · ·∆~q = CI1 (9.123) lo cual constituye la prueba del teorema de Li Hua Chung para I ′ . De paso hemos hallado ~ yB ~ deben tener la forma (9.114) y (9.115) respectivamente a fin de que I ′ sea que A una integral universal invariante. Esta prueba es una generalización para l grados de libertad de la presentada en Gantmacher para l = 1. Las transformaciones canónicas / 343 9.5. Las transformaciones canónicas En la sección 4.5 se dio la definición de una transformación canónica como una transformación de coordenadas en el espacio de fases 2l-dimensional, que en general puede depender del tiempo y que no cambia la forma de las ecuaciones de Hamilton. Allı́ derivamos las fórmulas de la transformación a partir de la segunda forma del principio de Hamilton. Aquı́ usaremos la invariancia de la integral de Poincaré-Cartán y el teorema de Li Hua Chung. La función generatriz de una transformación canónica. Sean dos espacios de fase 2l dimensionales (q, p), (q, p). La transformación canónica establece una correspondencia biunı́voca entre los puntos de estos dos espacios en cada instante t: q ν = q ν (q, p, t) ; J pν = pν (q, p, t) ; q 1 , q 2 , ...q l , p1 , p2 , ... pl q1 , q2 , ...ql , p1 , p2 , ... pl ν = 1, 2, ...l 6= 0 (9.124) (9.125) Un conjunto de trayectorias rectas en el espacio (q, p) está definido por el sistema de ecuaciones diferenciales: ∂H(q, p, t) dpν ∂H(q, p, t) dqν ; ; = =− dt ∂pν dt ∂qν ν = 1, 2, ...l (9.126) A cada una de las trayectorias definidas por (9.126) la transformación canónica le hace corresponder una trayectoria recta en el espacio (q, p), definida por el sistema de ecuaciones diferenciales: dq ν ∂H(q, p, t) dpν ∂H(q, p, t) = ; =− ; ν = 1, 2, ...l dt ∂pν dt ∂q ν (9.127) Sea un “tubo” de trayectorias en el espacio de fases y sea C un contorno arbitrario que rodea ese tubo de trayectorias en el espacio (q, p). En el espacio (q, p) en virtud de la transformación habrá otro tubo de trayectorias rectas y C es un contorno que corresponde a C. C0 y C 0 son los contornos definidos por un conjunto de estados simultáneos, t = constante, y que se corresponden mediante la transformación. C0 y C 0 están dadas por ecuaciones paramétricas del tipo de (9.64), y C y C por ecuaciones como (9.17). Es decir, C 0 y C0 obedecen a: C : t= t(α) ; qν = qν (α) ; pν = pν (α) (9.128) C0 : t = t(α) = constante ; qν = qν (α) ; pν = pν (α) ; ν = 1, 2, ...l y análogamente para C 0 y C. Como las trayectorias son hamiltonianas en (q, p) y en (q, p), se sigue de la invariancia de la integral de Poincaré-Cartán, (9.25), que: ! I I l l X X pν ∆qν (9.129) pν ∆qν − H ∆t = C ν=1 C0 ν=1 344 / Mecánica clásica avanzada I C l X ν=1 pν ∆q ν − H ∆t ! = I l X C 0 ν=1 pν ∆q ν (9.130) Como t es invariante bajo una transformación canónica, se sigue que el lado derecho de (9.129) está evaluado en el mismo tiempo que el lado derecho de (9.130). Si en la H Pl integral universal invariante ν=1 pν ∆q ν pasamos a las variables (q, p) por medio de la transformación canónica (9.124), obtenemos: I l X C 0 ν=1 pν ∆q ν = I l X C0 ν=1 " l X µ=1 ∂qµ pµ ∂qν ! l X ∆qν + µ=1 ∂q µ pµ ∂pν ! ∆pν # (9.131) La ecuación (9.131) es de la forma de (9.87): es una cierta integral universal invariante de primer orden en el espacio (p, q). Por el teorema de Li Hua Chung, el invariante obtenido puede diferir de I1 sólo por un factor constante C, ecuación (9.123): I l X C 0 ν=1 pν ∆q ν = C I X l pν ∆qν (9.132) C ν=1 de las ecuaciones (9.129), (9.130) y (9.132) se sigue entonces que: ! ! I I l l X X pν ∆qν − H ∆t pν ∆q ν − H ∆t = C C C ν=1 (9.133) ν=1 Si en la primera integral expresamos a (q, p) en función de las (q, p), la trayectoria de integración C será reemplazada por C, por lo cual podemos escribir a (9.133) como: ! !# I " X l l X pν ∆q ν − H ∆t − C pν ∆qν − H ∆t =0 (9.134) C ν=1 ν=1 C es un contorno arbitrario en el espacio (q, p), o sea que el integrando en (9.134) debe ser la diferencial exacta ∆ de alguna función de (q, p, t), que llamaremos −F (q, p, t). Por tanto podemos escribir: ! ! l l X X pν ∆q ν − H ∆t (9.135) ∆F = C pν ∆qν − H ∆t − ν=1 ν=1 donde además se tiene que: ∆F = l X ∂F ν=1 ∂F ∆qν + ∆pν ∂qν ∂pν + ∂F ∆t ∂t (9.136) Pl Como ν=1 pν ∆q ν − H ∆t no es un diferencial exacto, o sea no es igual a −∆F , se sigue que C nunca es cero. La función F se llama la función generatriz y la constante C Las transformaciones canónicas / 345 la valencia de la transformación canónica (9.124). La transformación canónica se llama univalente, o simplemente transformación canónica cuando C = 1. Algunos autores llaman las transformaciones canónicas con C 6= 1 transformaciones canónicas extendidas. En conclusión, una condición necesaria y suficiente para que la transformación (9.124) sea canónica es la existencia de una función generatriz F y alguna constante C para las cuales la ecuación (9.135) se satisfaga idénticamente en virtud de la transformación (9.124). Es de notarse que la ecuación (9.135) vale para toda transformación canónica independientemente de cuál sea la función H: vale para todo sistema hamiltoniano, o sea F no depende de H. Esto se prueba fácilmente para un hamiltoniano arbitrario H1 definiendo a H 1 de modo que H 1 − H = C(H1 − H), con lo cual se llega a que (9.135) vale también para H 1 y H1 . Formas alternas de definir la función generatriz de una transformación canónica. El principio de Hamilton modificado también puede expresarse como: ! Z t2 l X − qν ṗν − H dt = 0 (9.137) δ t1 ν=1 puesto que las ecuaciones de Euler-Lagrange correspondientes al principio variacional (9.137) son las ecuaciones de Hamilton o ecuaciones de movimiento en el espacio de fases. En lugar de (9.22) podemos escribir: ∆S̃ = − l X ν=1 qν ∆pν − H∆t ! t2 (9.138) t1 Consecuentemente se obtiene la siguiente forma para la integral invariante de Poincaré-Cartán, (9.25): I= I − l X ν=1 qν ∆pν − H∆t ! (9.139) Es fácil ver que (9.139) se puede derivar directamente de (9.25) mediante la transformación canónica ~ q → −~ p, p~ → q~. Se sigue entonces que además de (9.129) son posibles las siguientes relaciones: ! I I l l X X − qν ∆pν − qν ∆pν − H∆t = C I C C0 ν=1 − l X q ν ∆pν − H∆t ν=1 ! = I ν=1 (9.140) C0 − l X q ν ∆pν ν=1 P Por el teorema de Li Hua Chung se sigue que lν=1 qν ∆pν , que es una integral universal invariante, es proporcional a I1 . Usando (9.129) y (9.140) conjuntamente con el teorema de Li Hua Chung, podemos obtener además de (9.132) las siguientes tres 346 / Mecánica clásica avanzada relaciones, que nos darán otras tres expresiones para la función generatriz completamente equivalentes (9.135): I I I C0 C0 l X pν ∆q ν = C l X q ν ∆pν = C C 0 ν=1 − − ν=1 l X q ν ∆pν = C ν=1 I I I C0 − l X qν ∆pν ν=1 l X (9.141) pν ∆qν C0 ν=1 C0 − l X qν ∆pν ν=1 Es claro que las “C” que aparecen en (9.132) y en (9.141) no tienen por qué ser la misma. De cada una de las expresiones (9.141) se obtiene una forma diferente para la función generatriz de la transformación canónica por un procedimiento igual al que conduce a la forma (9.135). En primer lugar, y en virtud de (9.129) y (9.140), las ecuaciones (9.141) son equivalentes a: ! ! I I l l X X qν ∆pν − H∆t (9.142) − pν ∆q ν − H∆t = C C I C I C C ν=1 − l X − l X ν=1 ν=1 q ν ∆pν − H∆t ! q ν ∆pν − H∆t ! =C ν=1 I l X C =C ν=1 I − C pν ∆qν − H∆t l X ν=1 ! qν ∆pν − H∆t (9.143) ! (9.144) de (9.144) se sigue que: ∆F = C ∆F = C − l X ν=1 l X ν=1 ∆F = C − qν ∆pν − H∆t ! − qν ∆pν − H∆t ! pν ∆qν − H∆t l X ν=1 ! − l X ν=1 − − l X ν=1 − pν ∆q ν − H∆t ! (9.145) q ν ∆pν − H∆t ! (9.146) l X ν=1 q ν ∆pν − H∆t ! (9.147) Las transformaciones canónicas libres. En el conjunto de todas las transformaciones canónicas hay una clase que se puede caracterizar por la siguiente propiedad: su función generatriz puede expresarse como una función de un conjunto de (2l) variables independientes que pueden ser (q q), (q p), (p q) o (p p). A estas transformaciones las llamaremos transformaciones canónicas libres de la primera, segunda, tercera y cuarta Las transformaciones canónicas / 347 clase respectivamente. Es posible que una transformación canónica dada sea a la vez canónica libre de más de una clase. En (3.20) encontramos transformaciones canónicas libres de la primera clase. Ejemplo 9.5.1 Demostrar que la transformación canónica (4.134), para l = 1, es libre de primera clase: 1 p p2 2 p = mω q + ; q = −tan−1 (9.148) 2 mω 2 mωq Las fórmulas de transformación pueden escribirse en la forma: p = mωq tan q ; p= 1 mωq 2 sec2 q 2 o sea que es libre de la primera clase. También se puede escribir como: s r mωq 2 2p −1 q = cos ; p = −mω − q2 2p mω (9.149) (9.150) o sea que también es libre de la segunda clase. Es fácil ver que también es libre de tercera y cuarta clase. Ejemplo 9.5.2 Demostrar que la transformación identidad es canónica de segunda y tercera clase pero no es de primera ni de cuarta clase. La transformación identidad es: q ν = qν ; pν = pν ; ν = 1, 2, ...l (9.151) Esta transformación puede escribirse en cualquiera de las formas siguientes: qν = qν ; pν = pν qν = q ν ; pν = pν ; (9.152) ν = 1, 2, ...l o sea que sólo es posible tomar independientes a (q, p) o a (q, p). Esta transformación es canónica de segunda y tercera clase pero no es de primera ni de cuarta clase. Ejemplo 9.5.3 Mostrar que la transformación que intercambia coordenadas y momentos y cambia de escala, es libre de primera y cuarta clase pero no de segunda ni de tercera clase: qν = pν = 1 p β ν αpν ; qν = βqν ; 1 pν = q ν ; α (9.153) ν = 1, 2, ...l Ejemplo 9.5.4 Mostrar que la transformación canónica q = −αp/q, p = q 2 /2α, con l = 1, es una transformación canónica libre de primera y de cuarta clase pero no de segunda ni de tercera clase: 348 / Mecánica clásica avanzada q= αp ; −√ 2αp p= q2 ; 2α q= p 2αp (9.154) qq p=− α Las transformaciones canónicas libres de primera clase se caracterizan porque (p, p) se pueden expresar en función de (q, q). Esto dice que las (p) dependen de (q), o sea que: q 1 , q 2 , ...q l 6= 0 (9.155) J p1 , p2 , ...pl En este caso la función generatriz F (q, p, t) puede representarse mediante una función de (q, q) que llamaremos F1 : F (q, p, t) = F1 (q, q, t) (9.156) De (9.135) y (9.156) se sigue que: ∆F1 (q, q, t) = C l X ν=1 pν ∆qν − H∆t ! − l X ν=1 pν ∆q ν − H∆t ! (9.157) Como para estas transformaciones ∆qν y ∆q ν son todos independientes se sigue entonces que: ∂F1 = Cpν ; ∂qν ∂F1 = −pν ; ∂qν ν = 1, 2, ...l ∂F1 = H − CH ∂t (9.158) (9.159) Las ecuaciones (9.158) definen la transformación canónica bajo consideración, esto es, ellas pueden reducirse a la forma (9.124). Con ello probaremos que toda transformación canónica libre de primera clase define una función F1 (q, q, t) y que a cada función F1 (q, q, t) le corresponde una transformación canónica libre de primera clase. Debemos mostrar que es posible resolver las ecuaciones (9.158) para expresar a (q, p) en función de (q, p). Empecemos por mostrar que todas las derivadas parciales ∂F1 /∂qν son independientes. Supongamos que no lo fueran, es decir, que pudiéramos encontrar una expresión para una de ellas en función de las demás. Ello requerirı́a que exista una función Ω diferente de cero tal que: ∂F1 ∂F1 ∂F1 (9.160) , , ... , q1 , q2 , ...ql = 0 Ω ∂q1 ∂q2 ∂ql donde en (9.160) los (q) son tomados como parámetros. De (9.158) se sigue: Ω(Cp1 , Cp2 , ...Cpl , q1 , q2 , ...ql ) = 0 (9.161) como (q, p) son cantidades independientes, se sigue de (9.161) que Ω ≡ 0 y en consecuencia las ∂F1 /∂qν son independientes, consideradas como funciones de las variables Las transformaciones canónicas / 349 q 1 , q 2 , ...q l . Que las l cantidades independientes ∂F1 /∂qν sean funciones de las l cantidades independientes q ν se expresa diciendo que el jacobiano de esas funciones no es idénticamente cero: 2 ∂ F1 ∂F1 /∂~q 6= 0 (9.162) = det J q ~ ∂~q ∂~q De la desigualdad (9.162) se sigue que las primeras l ecuaciones (9.158) pueden resolverse para las q ν , con lo cual todas las nuevas variables de fases q ν , pν (ν = 1, 2, ...l) pueden expresarse en función de las viejas variables qν , pν (ν = 1, 2, ...l). La ecuación (9.162) también permite que en (9.158) las l últimas ecuaciones sean resueltas para qν en función de las q ν , pν . En conclusión, las ecuaciones (9.158) definen una transformación canónica libre de primera clase con función generatriz y valencia dadas, F1 y C 6= 0, en tanto que la fórmula (9.159) permite relacionar las funciones hamiltonianas H y H, que serán proporcionales sólo en el caso en que la transformación canónica no dependa explı́citamente del tiempo. Podemos decir que la clase de las transformaciones canónicas libres de primera clase se puede obtener hallando todas las funciones generatrices F1 que satisfacen la condición (9.162) y las diferentes valencias C 6= 0, y usando las fórmulas (9.158). Para las transformaciones canónicas libres de primera clase univalentes (C = 1), (9.158) y (9.159) toman la forma más simple: ∂F1 ∂F1 ∂F1 = pν ; = −pν ; ν = 1, 2, ...l ; H = H + ∂qν ∂qν ∂t (9.163) La última ecuación (9.163), dice que H − H no depende del sistema hamiltoniano especı́fico que se tenga sino simplemente de cuál es la transformación canónica, que puede ser definida sin hacer referencia a la forma del hamiltoniano. La discusión de los otros tipos de transformaciones canónicas libres es completamente análoga a la de las transformaciones canónicas libres de primera clase. Las fórmulas son las siguientes, que se obtienen usando las formas (9.145), (9.146) y (9.147) para la función generatriz. En las Transformaciones Canónicas (T.C.) libres de segunda clase (q, p) son independientes, luego: ! ~p J 6= 0 (9.164) p~ Como (q, p) son independientes, (9.146) permite escribir: ∂F2 ∂F2 = Cpν ; = q ν ; ν = 1, 2, ...l ∂qν ∂pν (9.165) ∂F2 = H − CH ∂t (9.166) donde F2 es función de (q, p, t) y satisface la condición: 2 ∂ F2 6= 0 det ∂~q ∂~p (9.167) 350 / Mecánica clásica avanzada En las T.C. libres de tercera clase (p, q) son independientes, luego: ! ~q 6= 0 J q ~ (9.168) como (p, q) son independientes, (9.145) permite escribir: ∂F3 ∂F3 = −Cqν ; = −pν ; ν = 1, 2, ...l ∂pν ∂qν (9.169) ∂F3 = H − CH ∂t (9.170) donde F3 es función de (p, q, t) y satisface la condición: 2 ∂ F3 6= 0 det ∂~ p ∂~q En las T.C. libres de cuarta clase (p, p) son independientes, luego: ! ~p J 6= 0 q ~ (9.171) (9.172) Como (p, p) son independientes, (9.147) permite escribir: ∂F4 = −Cqν ; ∂pν ∂F4 = qν ; ∂pν ν = 1, 2, ...l ∂F4 = H − CH ∂t donde F4 es función de (p, p, t) y satisface la condición: 2 ∂ F4 6= 0 det ∂~ p ∂~p (9.173) (9.174) (9.175) Se tienen, pues, 4l cantidades no independientes (q, p, q, p) de las cuales, además de (q, p) y (q, p), se pueden extraer conjuntos de variables independientes (q, q), (q, p), (p, q), (p, p). En cada uno de estos cuatro casos decimos que la transformación canónica es libre. Una transformación canónica arbitraria es no libre y obedece fórmulas de transformación en términos de una función generatriz que veremos más adelante y de las cuales (9.158) y (9.164) a (9.175) no son más que casos particulares. Ejemplo 9.5.5 Hallar la función generatriz del tipo F2 para la transformación canónica (9.148). Usando (9.146) y (9.150) obtenemos: ∆F2 = C(p ∆q − H ∆t) − (−q ∆p − H ∆t) = Cp ∆q + q ∆p (9.176) Las transformaciones canónicas / 351 La última igualdad en (9.176) se sigue de que la transformación no depende del tiempo. También: s r 2p mωq 2 −1 ∆F2 = C(−mω)∆q − q 2 + ∆p cos (9.177) mω 2p Como ∆F2 es exacto se sigue que ∂ 2 F2 /∂p ∂q = ∂ 2 F2 /∂q ∂p lo cual implica que la transformación es univalente, o sea C = 1. La función generatriz es: s r mωq 2 2p 1 −1 F2 (q, p) = p cos − mωq − q2 (9.178) 2p 2 mω Para esta misma transformación se cumple que: q=− p p2 cot q ; p = csc2 q mω 2mω (9.179) Entonces para una función generatriz del tipo F3 se cumple: p p2 ∂F3 ∂F3 = cot q ; =− csc2 q ∂p mω ∂q 2mω (9.180) donde hemos usado (9.169) con C = 1. Es claro que: ∆F3 = = 1 (2p cot q ∆p − p2 csc2 q ∆q) 2mω 1 2 ∆ p cotq 2mω (9.181) con lo cual: F3 = p2 cot q 2mω (9.182) similarmente hallamos para F4 : F4 = p2 p p 2mωp − p2 + p sen−1 √ 2mω 2mωp (9.183) En sı́ntesis, las funciones generatrices de la transformación canónica (3.107) son: 1 F1 = − mωq 2 tan q 2 s r mωq 2 2p 1 2 −1 − mωq −1 F2 = p cos 2p 2 mωq 2 p2 cot q F3 = 2mω r s p2 2mωp p2 −1 − 1 + F4 = p sen 2mω p2 2mωp (9.184) 352 / Mecánica clásica avanzada Ejemplo 9.5.6 Hallar las funciones generatrices del tipo F2 y F3 para la transformación canónica identidad. Sabemos que no existen funciones del tipo F1 o F4 . La transformación no depende del tiempo, luego, de (9.146) y (9.152): ∆F2 = C l X pν ∆qν + ν=1 l X q ν ∆pν = C ν=1 l X pν ∆qν + ν=1 l X qν ∆pν (9.185) ν=1 de la condición ∂ 2 F2 /∂qν ∂pµ = ∂ 2 F2 /∂pµ ∂qν se sigue que la transformación debe ser univalente, en consecuencia: ∆F2 = l X (pν ∆qν + qν ∆pν ) = ∆ ν=1 l X q ν qν (9.186) ν=1 Por tanto: F2 = l X pν qν (9.187) ν=1 Similarmente: F3 = − l X q ν pν (9.188) ν=1 Ejemplo 9.5.7 Hallar las funciones generatrices del tipo F1 y F4 para la transformación canónica de cambio de escala e intercambio de coordenadas y momentos (9.153). Sabemos que F2 y F3 no existen para esa transformación. El resultado es: C = −α β ; C = −α β ; F1 = −β F4 = α l X q ν qν (9.189) ν=1 l X pν pν (9.190) ν=1 Ejemplo 9.5.8 Hallar las funciones generatrices de la transformación de cambio de escala: q ν = αqν ; pν = βpν C = α β ; F2 = α l X pν qν (9.191) ν=1 C = α β ; F3 = −β l X ν=1 q ν pν (9.192) Las transformaciones canónicas / 353 Ejemplo 9.5.9 Sea una transformación canónica libre de primera clase (q, p) → (q, p) con generatriz F1 (q, q, t). Mostrar que la transformación inversa (q, p) → (q, p) también es canónica, y hallar la correspondiente función generatriz. La transformación original satisface: ! l X ∆F1 = C pν ∆qν − H ∆t − ν=1 l X ν=1 pν ∆q ν − H ∆t ! ∂F1 ∂F1 ∂F1 = Cpν ; = −pν ; ν = 1, 2, ...l ; = H − CH ∂qν ∂qν ∂t (9.193) (9.194) La desigualdad (9.162) garantiza que las dos últimas ecuaciones (9.194) se pueden resolver para (q) en función de (p), tomando (q) como parámetros, con lo cual se pueden expresar (p, q) en función de (q, p), o sea que las ecuaciones (9.124) se pueden invertir. Esto prueba que la transformación inversa existe, la cual además es canónica. Para la transformación inversa: ! ! l l X X i i pν ∆q ν − H ∆t − pν ∆qν − H ∆t (9.195) ∆F1 = C ν=1 ν=1 ∂F1i ∂F1i = C i pν ; = −pν ; ∂q ν ∂qν ν = 1, 2, ...l ; ∂F1i = H − CiH ∂t (9.196) comparando (9.194) y (9.196) vemos que: − ∂F1i 1 ∂F1 = ; ∂qν C ∂qν − ∂F1 1 ∂F1i = i ∂qν C ∂qν Ci ∂F1 ∂F1i + ∂t ∂t = (−CC i + 1)H C ∂F1i ∂F1 + ∂t ∂t = (−CC i + 1)H (9.197) De (9.197) se sigue que: F1 = −CF1i ; F1i = −C i F1 ; Ci = 1 C (9.198) 1 F1 (q, q, t) ; C Ci = 1 C (9.199) o más explı́citamente: F1i (q, q, t) = − Para una transformación canónica libre univalente de primera clase se cumple simplemente: F1i (q, q, t) = −F1 (q, q, t) (9.200) 354 / Mecánica clásica avanzada o sea que la función generatriz de la transformación canónica inversa es el negativo de la función generatriz de la T.C. original. Para una transformación canónica arbitraria, se cumplen las expresiones siguientes para las funciones generatrices F y F i , aunque no se cumplen las fórmulas (9.194) y (9.196): ! ! l l X X ∆F (q, p, t) = C pν ∆q ν − H ∆t (9.201) pν ∆qν − H ∆t − ν=1 i ∆F (q, p, t) = C i l X ν=1 ν=1 pν ∆q ν − H ∆t ! l X − ν=1 pν ∆qν − H ∆t La ecuación (9.202) también se puede escribir como: ! l 1 X 1 i − i ∆F (q, p, t) = pν ∆qν − H ∆t − C C i ν=1 l X ν=1 ! (9.202) ! pν ∆q ν − H ∆t(9.203) de donde se llega al resultado general: F i (q, p, t) = − 1 1 F (q, p, t) ; C i = C C (9.204) Ejemplo 9.5.10 Mostrar que el resultado de dos transformaciones canónicas sucesivas es una transformación canónica. El generador de la transformación resultante es la suma de los generadores de las transformaciones separadas. Si las transformaciones son libres de primera clase: (a+b) F1 (a) (b) (q, q, t) = F1 (q, q, t) + F1 (q, p, t) (9.205) donde a es la transformación (q, p) → (q, p) y b es la transformación (q, p) → (q, p); a + b representa la transformación combinada (q, p) → (q, p). Ejemplo 9.5.11 Mostrar que la realización de tres transformaciones canónicas sucesivas es asociativa. Para transformaciones libres de primera clase esto se expresa ası́: (a+b)+c a+(b+c) q, q, t q, q, t = F1 F1 lo que se sigue de la propiedad (9.205): a+(b+c) (a) (b+c) q, q, t = F1 (q, q, t) + F1 F1 q, q, t = (a) F1 (q, q, t) + donde c es la transformación (q, p) → (q, p). (b) F1 q, q, t + (c) F1 q, q, t (9.206) (9.207) Las transformaciones canónicas / 355 Las ecuaciones (9.205), (9.206) y (9.207) valen también para transformaciones canónicas arbitrarias. Significado de la valencia de una transformación canónica. Sea la transformación de cambio de escala (9.191) y una transformación canónica univalente arbitraria. Si esas dos transformaciones se realizan en sucesión, las respectivas funciones generatrices se pueden escribir como: ∆Fc.e. = αβ l X ν=1 ∆Fµ.v. = l X ν=1 pν ∆qν − H ∆t pν ∆q ν − H ∆t ! ! − − l X ν=1 l X ν=1 pν ∆q ν − H ∆t pν ∆q ν − H ∆t ! ! (9.208) (9.209) Entonces la propiedad (9.205), permite escribir para la función generatriz de la transformación completa: ∆Fµ.v. = αβ l X ν=1 pν ∆qν − H ∆t ! − l X ν=1 pν ∆q ν − H ∆t ! (9.210) O sea que cualquier transformación canónica no univalente puede suponerse compuesta de una transformación de cambio de escala donde c = αβ seguida de una transformación univalente. Lo anterior permite que en la práctica se usen sólo las transformaciones canónicas univalentes. El grupo de las transformaciones canónicas. El conjunto de todas las transformaciones canónicas de un sistema de l grados de libertad es un conjunto infinito no contable. Este conjunto posee la estructura algebraica de grupo: (i) Hay una ley de composición interna, mediante la cual a dos transformaciones canónicas se les puede asociar una tercera; es decir, está definida la suma de dos transformaciones canónicas para dar una transformación canónica, ecuación (9.205). (ii) Existe la transformación canónica identidad, ecuación (9.189). (iii) La transformación inversa de una transformación canónica dada existe y es canónica, (9.204). (iv) La realización de transformaciones canónicas sucesivas es asociativa, (9.206). Por todo lo anterior podemos decir que la forma de las ecuaciones canónicas es invariante con respecto al grupo de las transformaciones canónicas. La integral de Poincaré-Cartán, las integrales invariantes de Poincaré, los corchetes de Poisson y otras cantidades también poseen esta propiedad de invariancia bajo el grupo de las transformaciones canónicas. Relación entre las diferentes funciones generatrices de transformaciones canónicas libres. Interpretación en términos de transformaciones de Legendre. En la sección (4.1) se definió la transformación de Legendre. Sea una transformación 356 / Mecánica clásica avanzada canónica libre de primera clase, univalente, las fórmulas de transformación se obtienen de: pν = ∂F1 ∂F1 ; −pν = ; ν = 1, 2, ...l ∂qν ∂qν (9.211) Usando la notación de la sección 4.1, sea (x) = (q); (α) = (q, t); (y) = (p) y X = F1 . Entonces (9.211) se pueden escribir como: yν = ∂X ∂X ∂X(x, α) ; −pν = ; H −H = ∂xν ∂q ν ∂t (9.212) Podemos interpretar, pues, a F1 , como el generador de la transformación de Legendre (q) → (p). El generador de la transformación de Legendre inversa, (y) → (x) es Y (y, α), tal que: Yν = l X ν=1 xν yν − X ; xν = ∂Y ∂yν (9.213) donde además se satisface: ∂Y ∂X ∂Y ∂X =− → =− ; ∂αi ∂αi ∂q ν ∂qν ∂X ∂Y =− ∂t ∂t (9.214) ∂Y ∂t (9.215) se cumple, pues, que: qν = ∂Y ; ∂pν −pν = − ∂Y ; ∂qν H −H =− Si llamamos Y = −F 3(p, q, t), las ecuaciones (9.215) quedan ası́: qν = − ∂F3 ; ∂pν pν = − ∂F3 ; ∂qν H −H =− ∂F3 ∂t (9.216) que coinciden con las fórmulas (9.168) a (9.171). En conclusión, F1 y F3 están relacionadas mediante una transformación de Legendre: F3 = F1 − l X pν qν (9.217) ν=1 Con argumentos completamente análogos llegamos a: F2 = F1 + l X q ν pν l X q ν pν − (9.218) ν=1 F4 = F1 + ν=1 l X qν pν (9.219) ν=1 Ejercicio 9.5.1 Usar las relaciones (9.217), (9.218) y (9.219) para obtener a F2 , F3 y F4 a partir de F1 para un oscilador armónico lineal. Comparar con las fórmulas (9.184). Las transformaciones canónicas / 357 Ejemplo 9.5.12 Verificar las expresiones (9.187) y (9.188) usando la transformación de legendre: F3 = F2 − l X ν=1 q ν pν − l X pν qν (9.220) ν=1 Usando (9.187) obtenemos: F3 l X = ν=1 l X = ν=1 (pν qν − q ν pν − pν qν ) (pν q ν − q ν pν − pν q ν ) = l X ν=1 −q ν pν (9.221) en efecto, (9.221) coincide con (9.188). Notación de las funciones generatrices. Corben-Stehle usan la siguiente notación para las funciones generatrices de las T.C. libres F1, 2, 3, 4 de Goldstein: F1 = φ(q, q, t) F2 = ψ ′ (q, p, t) (9.222) F3 = ψ(q, p, t) F4 = φ′ (q, p, t) Landau usa F1 = F y F2 = Φ. Las transformaciones puntuales. Una transformación de coordenadas llamada transformación puntual, puede escribirse como una transformación canónica. Las nuevas coordenadas son funciones de las viejas coordenadas pero no de los viejos momentos. Entonces en una transformación puntual pueden tomarse como independientes (p, q) o (p, q), o sea que una transformación puntual es libre de segunda y de tercera clase. Puede expresarse en las siguientes formas: q ν = fν (q, t) ; pν = ∂F2 ; ∂qν qν = − ∂F3 ; ∂pν pν = gν (q, p, t) qν = ∂F2 ∂pν pν = − ∂F3 ∂q ν (9.223) (9.224) (9.225) Se requiere entonces que F2 y F3 sean de la forma: F2 = l X ν=1 fν (q, t)pν (9.226) 358 / Mecánica clásica avanzada F3 = − l X fν−1 (q, t)pν (9.227) ν=1 donde fν−1 son las funciones inversas a fν , o sea, qν = fν−1 (q, t). Entonces se tiene para pν y pν : pν = l X ∂fµ (q, t) pν ∂qν µ=1 pν = l X ∂fµ−1 (q, t) pµ ∂q ν µ=1 (9.228) (9.229) Según lo anterior es claro que (p) y (p) estarán conectados por una transformación lineal que depende de las coordenadas que llamaremos T̃ de modo que en forma de matrices y vectores l-dimensionales (9.228) y (9.229) toman la forma: p = T̃ (q, t)~p ; ~p = T̃ −1 (q, t)~ ~ p Tµν = −1 ∂fµν ∂fν −1 ; Tµν = ∂qµ ∂qµ (9.230) (9.231) Por poderse expresar en términos de funciones generatrices, la transformación puntual es canónica. Entonces, tanto las ecuaciones de Hamilton como las de Lagrange son covariantes bajo transformaciones puntuales. Las ecuaciones (9.223) y (9.228) pueden tomarse como las fórmulas de una transformación canónica puntual. Ejemplo 9.5.13 Sea un sistema de tres grados de libertad y la transformación de coordenadas cartesianas a coordenadas esféricas. Expresar esta transformación como transformación canónica. La transformación es: p r = x2 + y 2 + z 2 = fr (q) z θ = cos−1 p = fθ (q) 2 x + y2 + z 2 φ = tan−1 (9.232) y = fθ (q) x x = r senθ cos φ = fx (q) y = r senθ senφ = fy (q) z = r cos θ = fz (q) (9.233) Las transformaciones canónicas / 359 donde tomamos a (q) = (x, y, z) y (q) = (r, θ, φ). Además usamos la notación (fν−1 ) = (fx , fy , fz ). La función generatriz F2 , de acuerdo con (9.226) y (9.232) es: F2 (q, p) = = pr f r + pθ f θ + pφ f φ p z x2 + y 2 + z 2 + p2θ cos−1 p 2 x + y2 + z 2 −1 y +pφ tan x pr (9.234) Similarmente para F3 (q, p) tenemos: F3 (q, p) = = −px fx − py fy − pz fz (9.235) −px r senθ cos φ − py rsenθ senφ − pz r cos θ Usando (9.228) junto con (9.234) y (9.235) obtenemos las siguientes fórmulas para la transformación de los momentos: y xz x pr − 2 pθ p +p px = p 2 φ 2 2 2 2 2 x + y x +y +z x + y (x2 + y 2 + z 2 ) x y yz pr + 2 pθ py = p pφ + p 2 x +y x2 + y 2 + z 2 x2 + y 2 (x2 + y 2 + z 2 ) (9.236) p x2 + y 2 pr − 2 px = p pθ 2 2 2 x + y2 + z 2 x +y +z z y similarmente: pr = px senθ cos φ + py senθ senφ + pz cos θ pθ = px r cos θ cos φ + py r cos θ senφ − pz r senθ pr = −px r senθ senφ + py rsenθ cos φ (9.237) Notemos que: p~2 = p2x + p2y + p2z = p2r + p2φ p2θ + r2 sen2 θ r2 Expresadas en términos de r, θ, φ, las matrices T̃ y T̃ −1 son:   senφ 1 cos θ cos φ − senθ cos φ  r r senθ        cos φ 1   senθ senφ cos θ senφ T̃ (q) =  r r senθ        1   0 cos θ − senθ   r (9.238) (9.239) 360 / Mecánica clásica avanzada T̃ −1  senθ cos φ   (q) =   r cos θ cos φ  −r senθ senφ cos θ senφ r cos θ senφ r senθ cos φ cos θ    −r senθ    0 (9.240) ˜ Sin embargo T̃ −1 6= T̃ T , o sea que Se ve, como debe ser, que T̃ T̃ −1 = T̃ −1 T̃ = I. la transformación de los momentos no es ortogonal. Transformación puntual lineal. En este caso se tiene: qν = l X Sνµ qµ + bν = fν (q, t) (9.241) ν=1 donde asumimos que Sνµ y bν pueden depender explı́citamente del tiempo, aunque obviamente no dependen de (q) ni de (p). La transformación inversa es: qν = l X ν=1 −1 Sνµ q µ − bµ = fν−1 (q, t) (9.242) −1 donde Sνµ es la matriz inversa de Sνµ . Las funciones generatrices F2 (q, p, t) de la transformación, y −F2 (q, p, t) = F3 (q, p, t) de la transformación inversa son: F2 (q, p, t) = l X Sµν pµ qν + µ,ν=1 F2 (q, p, t) = − l X l X b ν pν (9.243) ν=1 µ,ν=1 −1 Sµν q µ − b µ pν (9.244) La relación entre los momentos también será lineal: pν = l X Sµν pµ ; pν = l X −1 Sµν pµ (9.245) µ=1 µ=1 La “representación” de las coordenadas y la “representación” de los momentos. La transformación (q, p) → (p, −q) es canónica. De acuerdo con (9.189) puede ser generada por las funciones generatrices. F1 (q, q) = l X ν=1 q µ qν ; F4 (p, p) = l X pµ pν (9.246) ν=1 Como la transformación no depende del tiempo, H = H: H(q, p, t) = H(q, p, t) = H(−p, q, t) (9.247) Las transformaciones canónicas / 361 Ası́ por ejemplo, para un oscilador armónico lineal: H(q, p, t) = 1 2 k 2 q + p 2m 2 (9.248) Ciertamente en el formalismo hamiltoniano las ecuaciones de movimiento son covariantes. El contenido de esta transformación es el siguiente: en el espacio de configuración el estado del sistema se puede representar mediante dos puntos, o equivalentemente, mediante las coordenadas y velocidades generalizadas; la transformación nos dice que en el espacio de momentos también está toda la información requerida para describir el estado; en el espacio de momentos el estado se puede representar entonces mediante los momentos generalizados y sus derivadas temporales. Hallemos las ecuaciones de lagrange en el espacio de los momentos. Partimos de P l L = ν=1 pν q̇ν − H y usamos la transformación canónica generada por (9.246): ! l l l l X X X X pν q̇ν + pν q̇ ν − H − pν q̇ ν (9.249) L= pν q̇ν − H = ν=1 ν=1 ν=1 ν=1 El nuevo lagrangiano L estará entonces relacionado con L por: L= l X ν=1 pν q̇ ν − H = L − l X ν=1 l d X pν qν pν q̇ν − pν q˙ν = L − dt ν=1 (9.250) Como L y L difieren por una derivada total respecto al tiempo, el principio de Hamilton nos dice que las ecuaciones de movimiento son: d ∂L(p, ṗ, t) ∂L(p, ṗ, t) − = 0 ; ν = 1, 2, ...l ∂pν dt ∂ ṗν (9.251) lo cual coincide con el resultado (4.48) que se obtuvo con base en consideraciones sobre las transformaciones de Legendre. El paso del formalismo lagrangiano al hamiltoniano, sección 3.1, se realiza mediante la transformación pν = ∂L(q, q̇, t)/∂ q̇ν , que se expresa en términos de transformaciones de Legendre. Esta transformación tiene la forma de cierta transformación (p, q) → (p = q̇, q) en el espacio de fases. Podrı́amos investigar si es una transformación canónica donde los nuevos momentos sean las (q̇). También la transformación puede escribirse en una forma tal que q ν = q̇ν ; que es más útil en el contexto de las transformaciones canónicas pues permite interpretar a L(q, q̇, t) = L(q, q, t) como la función generatriz del tipo F1 de cierta transformación canónica. Es decir, L genera la transformación: pν = ∂L(q, q, t) ∂L(q, q, t) ∂L(q, q, t) ; pν = − ; H −H = ∂qν ∂q ν ∂t (9.252) que equivale a la transformación (q, ṗ) ↔ (−p, q̇). H es el hamiltoniano en las variables canónicas (q, ṗ) y H en las variables (−p, q̇). Si quisiéramos expresar esta transformación mediante una función generatriz del tipo F4 (p, p, t), dada de acuerdo con (9.219) por Pl Pl L(q, q, t)+ ν=1 (q ν pν −qν pν ) = L(q, q̇)− ν=1 (pν q̇ν +qν ṗν ), notamos que ese generador, de acuerdo con (9.250), serı́a precisamente la función que llamamos L(p, ṗ, t). 362 / Mecánica clásica avanzada Ejercicio 9.5.2 Hallar los hamiltonianos y las ecuaciones de movimiento que corresponden a los conjuntos de variables canónicas (q, ṗ) y (−p, q̇). Ejercicio 9.5.3 Analizar la transformación (q, p) ↔ (q, q̇) como una transformación en el espacio de fases, e investigar si es canónica. De serlo hallar la correspondiente función generatriz. La función generatriz de una transformación canónica arbitraria. En general, una transformación canónica es no libre, o sea que no se puede describir mediante funciones generatrices del tipo F1, 2, 3, 4 . Ası́ por ejemplo para un sistema de dos grados de libertad la transformación: q 1 = q1 , p1 = p1 , q 2 = p2 , p2 = −q2 (9.253) es canónica pero no se puede describir mediante una función generatriz de una transformación canónica libre, pues involucra una mezcla de los cuatro tipos. El tratamiento de estas transformaciones se basa en el lema de Carathéodory, cuya demostración está dada en el texto de Gantmacher, Lectures in analytical mechanics, sección 29. El enunciado del lema es el siguiente. Lema. Si hay 2l funciones independientes q 1 , q 2 , ...q l , p1 , p2 , ...pl de las 2l cantidades independientes q1 , q2 , ...ql , p1 , p2 , ...pl , entonces del conjunto de 4l cantidades qν , pν , q ν , pν (ν = 1, 2, ...l) siempre es posible escoger 2l cantidades independientes de tal manera que no hay ni un sólo par de cantidades conjugadas (qν , pν ) o (q ν , pν ) entre ellas. Tenemos entonces que de las 4l cantidades qν , pν , q ν , pν (ν = 1, 2, ...l) que están conectadas mediante la transformación canónica: ~q , ~p ) 6= 0 (9.254) q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l ; J( q, p es posible tomar las siguientes 2l cantidades independientes: q1 , q2 , ...qr , pr+1 , pr+2 , ...pl , q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl (9.255) 0 ≤ r ≤ l, 0 ≤ s ≤ l donde, de acuerdo con el lema de Carathéodory no hay ni un par de variables canónicamente conjugadas. Como la transformación es canónica existe cierta función F (q, p, t) tal que: ! ! l l X X ∆F = C pν ∆q ν − H ∆t (9.256) pν ∆qν − H ∆t − ν=1 ν=1 de acuerdo con (9.136). Es claro que igualmente podrı́amos haber usado cualquiera de las expresiones (9.145), (9.146) o (9.147), obteniéndose cuatro expresiones para F que sólo difieren por una transformación de Legendre. La expresión (9.256) usando (9.255) se puede separar ası́: ∆F = C r X ν=1 pν ∆qν +C l X ν=r+1 pν ∆qν − s X ν=1 pν ∆q ν − s X ν=s+1 pν ∆q ν + H − H ∆t (9.257) Las transformaciones canónicas / 363 Usando las siguientes expresiones: l X l X pν ∆qν = ∆ pν qν ν=r+1 ν=r+1 l X l X pν ∆q ν = ∆ ν=s+1 ! pν q ν ν=s+1 ! − ∆ F+ ν=s+1 C r X q ν pν − C pν ∆qν − ν=1 l X − qν pν ν=r+1 l X qν ∆pν ν=r+1 ν=s+1 l X q ν ∆pν (9.258) ν=s+1 ! = ! l l X X + − pν ∆q ν + q ν ∆pν ν=1 qν ∆pν ν=r+1 podemos escribir a (9.257) como: l X l X ! + H − CH ∆t (9.259) según (9.255), ∆qν (ν = 1, 2, ...r), ∆pν (ν = r + 1, r + 2, ...r), ∆q ν (ν = 1, 2, ...s), ∆pν (ν = s + 1, s + 2, ...l) son independientes y por tanto: C pν = −C qν = qν = −pν = H − CH = ∂U ; ∂qν ∂U ; ∂pν ∂U ; ∂pν ∂U ; ∂qν ν = 1, 2, ...r ν = r + 1, r + 2, ...l ν = s + 1, s + 2, ...l ν = 1, 2, ...s ∂U ∂t (9.260) donde U es función de las cantidades (9.255) y está definida por: U =F+ l X ν=s+1 q ν pν − C l X pν qν (9.261) ν=r+1 Las fórmulas (9.260) son equivalentes a las fórmulas (9.254) y determinan la transformación canónica por medio de la valencia C y la función generatriz U de las variables independientes (9.255). Las fórmulas (9.260) relacionan el conjunto de variables independientes (9.255) con el siguiente conjunto de variables independientes complementarias: p1 , p2 , ...pr , qr+1 , qr+2 , ...ql , p1 , p2 , ...ps , q s+1 ; q s+2 , ...q l (9.262) 0 ≤ r ≤ l, 0 ≤ s ≤ l 364 / Mecánica clásica avanzada El jacobiano de las variables p1 , p2 , ...ps , q s+1 , q s+2 , ...q l respecto a las variables q1 , q2 , ...qr , pr+1 , pr+2 , ...pl es diferente de cero. Ese jacobiano puede escribirse como:   ∂~ps ∂~ps !  ∂~qr ∂~pl−r  ~ps , ~q l−s     = det  J  qr , p~l−r ~  ∂~q l−s ∂~q l−s  ∂~qr ∂~pl−r   2 ∂2U ∂ U − −  ∂~qr ∂~q ∂~pl−r ∂~q s  s    (9.263) = det      ∂2U ∂2U ∂~qr ∂~pl−s ∂~pl−r ∂~pl−s donde ~ps es el vector p1 , p2 , ...ps . p~l−r es el vector pr+1 , pr+2 , ...pl , con significado análogo para los otros vectores que aparecen en (9.263). En vista de (9.263), las ecuaciones (9.260) de la primera lı́nea pueden resolverse para expresar a q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl en función de p1 , p2 , ...pr , qr+1 , qr+2 , ...ql . Después se reemplazan las expresiones obtenidas en las l ecuaciones de la segunda lı́nea de (9.260) para obtener las ecuaciones de la transformación canónica (9.254). Las fórmulas de la transformación canónica inversa pueden obtenerse de manera análoga mediante una función generatriz que depende de las variables (9.262) en vez de las variables complementarias igual a (9.255), −C −1 U y una valencia igual a C −1 . Queda claro que las transformaciones canónicas libres resultan como casos particulares de la transformación canónica arbitraria, al definir apropiadamente los valores de r y s. 9.6. La ecuación de Hamilton-Jacobi En la sección 3.4 hemos discutido la especificación del estado del sistema mediante las constantes de movimiento. Por simplicidad estamos considerando que el sistema es integrable y posse por lo tanto un conjunto de 2l constantes de movimiento uniformes. El objetivo de la descripción clásica es encontrar a las variables de estado en función del tiempo para cada valor de las constantes de movimiento, considerados como un conjunto completo de variables dinámicas independientes. Si se quiere pueden tomarse como constantes de movimiento los 2l valores iniciales de las variables de estado. La solución estará dada por: q = ~q(~ ~ q0 , p~0 , t) ; p~ = ~p(~q0 , p~0 , t) (9.264) La ecuación (9.264) puede interpretarse como una transformación canónica de las variables ~ q0 , p~0 a las variables ~q, p~. En la sección 4.7 vimos que para un sistema conservativo la acción coincide con el negativo de la función generatriz de la transformación canónica de evolución temporal (9.264). Veamos que este resultado vale en general. En la sección 9.1 vimos que la diferencia de acción entre dos trayectorias rectas infinitesimalmente Las transformaciones canónicas / 365 próximas, ∆S, cuyos puntos iniciales y finales están sobre ciertas curvas C1 y C2 respectivamente, del espacio de configuración, está dada por la ecuación (9.11), ! ! l l X X ∆S = pν ∆qν − H ∆t − pν ∆qν − H ∆t (9.265) ν=1 C2 ν=1 C1 Describiendo la transformación canónica (9.264) mediante la función generatriz (9.135) con C = 1 y tomando a (q, p) como las nuevas variables y a q0 , p0 , como las viejas variables, obtenemos: ! ! l l X X −∆F = pν ∆qν − H ∆t − (9.266) pν0 ∆qν0 − H0 ∆t ν=1 ν=1 Si en (9.265) definimos la curva C1 como el conjunto de puntos iniciales simultáneos, t1 (α) = constante = t0 y dejamos a C2 arbitraria, entonces (9.265) tomará la forma: ∆S = l X ν=1 pν ∆qν − H ∆t − l X pν0 ∆qν0 (9.267) ν=1 Las expresiones (9.266) y (9.267) coincidirán si la transformación canónica generada por F , (9.264), satisface: −∆F − H0 ∆t = ∆S (9.268) Tomando H0 = 0 obtenemos F = −S. Además como ∂F/∂t = H − H0 se sigue que: F = −S ; → ∂S +H =0 ∂t (9.269) El resultado (9.269) fue obtenido por Hamilton (1805-1865) en 1835, quien además supuso que la transformación canónica (9.264), es libre de primera clase, con lo cual (9.267) conduce a: pν = ∂S ∂S ; pν0 = ; ∂qν ∂qν0 ν = 1, 2, ...l (9.270) Las fórmulas (9.270) conducen a la transformación canónica (9.264). 6 S se llama la función principal de Hamilton (o simplemente acción de Hamilton). Que F = −S, sin emRt bargo, no da un método para encontrar a F , puesto que para evaluar a S = t0 L(q, q̇, t) dt se requiere conocer a q(t), q̇(t), o sea haber resuelto el problema, es decir conocer la “transformación” (9.264). El resultado de Hamilton fue un cı́rculo vicioso: para escribir a partir de (9.270) las ecuaciones (9.264) se requiere conocer la función principal de Hamilton, y para evaluar esta función se requiere conocer la solución (9.264). La contribución de Jacobi (1804-1851), en 1837, fue romper este cı́rculo vicioso; mostró que al resolver la ecuación diferencial que resulta de (9.269), llamada la ecuación de HamiltonJacobi, para obtener una función S mediante las fórmulas (9.270), se obtiene la solución 6 Es una transformación canónica a unas variables donde el sistema está completamente en equilibrio; su trayectoria de fases se reduce a un punto. 366 / Mecánica clásica avanzada buscada (9.264). La ecuación de Hamilton-Jacobi para la función principal de Hamilton. Tratemos de hallar la transformación canónica libre univalente de primera clase que transforma las ecuaciones de Hamilton: q̇ν = ∂H ; ∂pν ṗν = − ∂H ; ∂qν ν = 1, 2, ...l (9.271) ν = 1, 2, ...l (9.272) en las ecuaciones de Hamilton: q̇ ν = ∂H ; ∂pν ṗν = − ∂H ; ∂qν donde H sea idénticamente cero: H ≡0 (9.273) Las ecuaciones (9.272) y (9.273) conducen a la solución inmediata: q ν = βν ; pν = αν ; ν = 1, 2, ...l (9.274) donde αν y βν son 2l constantes arbitrarias. En virtud de (9.158), las fórmulas de transformación estarán dadas por: ∂S(q, β, t) ∂S(q, β, t) = pν ; = −αν ; ν = 1, 2, ...l ∂qν ∂βν (9.275) En tanto que por (9.159) y (9.273) S necesariamente satisface: ∂S +H =0 ∂t (9.276) La ecuación (9.276) junto con (9.275) nos da la siguiente ecuación diferencial en derivadas parciales para S: ! ~ t) ~ t) ∂S(~q, β, ∂S(~ q, β, (9.277) + H ~q, ∂t ∂~q ~ t) La ecuación (9.277) se llama la ecuación de Hamilton-Jacobi.7 La solución S(~q, β, de la ecuación de Hamilton-Jacobi con l constantes arbitrarias β1 , β2 , ...βl se llama la integral completa de la ecuación de Hamilton-Jacobi si se cumple la condición: det ∂2S 6= 0 ~ ∂~q ∂ β (9.278) La expresión (9.278) es equivalente a la (9.162) que es la condición necesaria para que las ecuaciones (9.275) puedan resolverse para expresar a ~q, p~, en la forma ~ t); ~ ~ t). Lo anterior constituye el teorema de Jacobi cuyo enunciado q = ~q(~ ~ α, β, p = p~(~ α, β, 7 Ya óptica. en 1824 el mismo Hamilton halló una ecuación diferencial de esta forma en conexión con la Las transformaciones canónicas / 367 ~ t) es alguna integral completa de la ecuación de Hamiltones el siguiente: “si S(~ α, β, Jacobi (9.277), entonces la solución para las variables de estado ~q y p~ del sistema puede escribirse en la forma (9.275) para cualquier hamiltoniano H”.8 Según esto, en vez de integrar directamente las ecuaciones de movimiento (9.271), que nos darán a ~q, p~, con 2l constantes de integración arbitrarias, el teorema de Jacobi nos permite hacerlo encontrando la integral completa de la ecuación de Hamilton-Jacobi. Una integral completa de la ecuación de Hamilton-Jacobi no es una solución más general de esta ecuación. Pero en este contexto sólo es importante saber que existe una solución completa. Hasta aquı́ no hemos impuesto ninguna restricción sobre las constantes αν , βν . Si las escogemos de tal manera que coincidan con los valores iniciales de pν y qν obtendremos una solución completa que coincide con la acción principal de Hamilton –es la función generatriz de la transformación inversa de (9.264)–. En este caso S coincide con el generador de la transformación canónica de evolución hacia atrás en el tiempo, pero para otra elección de las constantes αν , βν , la solución completa S de la ecuación de Hamilton-Jacobi no admite esta interpretación. En esto se basa el aporte de Jacobi, quien no sólo rompió el cı́rculo vicioso que mencionamos antes sino que además ~ t) mostró que cualquier solución completa de la ecuación (9.277) permite escribir a ~q(~ α, β, ~ t) en la forma (9.275) donde las βν son las constantes de integración de la ecuay ~q(~ α, β, ción de Hamilton-Jacobi. Hay en efecto, un número infinito de integrales completas de la ecuación de Hamilton-Jacobi. Ejemplo 9.6.1 Formar la función principal de Hamilton para el movimiento de una partı́cula en caı́da libre en presencia de la gravedad. En este caso (tomando t0 = 0): x = 0, S= y = 0, Z t 0 1 z = z0 + ż0 t − gt2 2 1 mż 2 − mgz 2 dt = 1 1 m ż02 t − ż0 gt2 + g 2 t3 2 3 1 2 1 3 −mg z0 t + ż0 t − gt 2 6 (9.279) (9.280) teniendo en cuenta que E = 1/2 mż02 + mgz0 : 1 S = −Et + mż02 t − mż0 gt2 + mgt3 2 y como: ż0 t= g 1− s 2g 1 + 2 (z0 − z) ż0 ! podemos escribir a S en la forma: 3/2 mż03 2g S = −Et − 1 + 2 (z0 − z) 3g ż 8 Este (9.281) (9.282) (9.283) enunciado constituye la contribución de Jacobi a este problema y fue publicado en el año 1837. 368 / Mecánica clásica avanzada donde omitimos una constante. La expresión (9.283) también se puede escribir en términos de E como: 3/2 m 2 S(z, E, t) = −Et − (E − mgz)3/2 (9.284) 3g m que coincide con la ecuación (4.190), que fue obtenida integrando la ecuación de HamiltonJacobi. Otras formas de la ecuación de Hamilton-Jacobi. Si queremos hallar una transformación canónica libre univalente de segunda, tercera o cuarta clase que haga a H idénticamente igual a cero, podemos emplear un procedimiento análogo al que nos condujo a la ecuación (9.277) y también buscar una integral completa de la misma. Una forma equivalente de hallar esas transformaciones es por medio de las fórmulas (9.217), (9.218) y (9.219). Además son útiles: F2 = F1 + l X q ν pν l X q ν pν ν=1 F4 = F3 + (9.285) ν=1 La ecuación de Hamilton-Jacobi para las diferentes funciones generatrices de las transformaciones canónicas libres que hacen a H idénticamente cero son: ! ~ t) ~ t) ∂F1 (~q, β, ∂F1 (~ q , β, + H ~q, ,t = 0 ∂t ∂~q ∂F2 (~q, α ~ , t) ∂F2 (~ q, α ~ , t) + H ~q, ,t = 0 ∂t ∂~q ~ t) ∂F3 (~ q , β, +H ∂t ~ t) ∂F3 (~ p, β, − , p~, t ∂~p ! (9.286) =0 ∂F4 (~ q, α ~ , t) ∂F4 (~q, α ~ , t) +H − , p~, t = 0 ∂t ∂~p Vemos que F1 y F2 satisfacen la misma ecuación diferencial, lo cual es consistente con (9.285), esto es, F1 y F2 difieren por una constante aditiva. Similarmente F3 y F4 satisfacen la misma ecuación. F3 y F4 en la práctica son de poco interés en el método de Hamilton-Jacobi puesto que las qν entran en la energı́a potencial que es una función complicada y se hace por ello más difı́cil la separación de variables. Es posible hallar la ecuación de Hamilton-Jacobi asociado a la transformación canónica (9.260), lo cual se deja como ejercicio. Ejemplo 9.6.2 El oscilador armónico lineal. Resolver la ecuación de Hamilton-Jacobi y con ella hallar la solución a las ecuaciones de movimiento. Las transformaciones canónicas / 369 El hamiltoniano es: H= p2 kq 2 + 2m 2 La ecuación de Hamilton-Jacobi (9.277) es: 2 ∂S(q, β, t) kq 2 ∂S(q, β, t) + + =0 ∂t ∂q 2 (9.287) (9.288) Aquı́ podemos buscar una solución separando las variables q y t en la forma:9 S(q, β, t) = −ht + Σ(q, β) (9.289) donde h es la constante de Jacobi que en este caso coincide con la energı́a total E. Como el sistema tiene sólo un grado de libertad hay sólo una constante de integración, por tanto, podemos hacer h = E = β. Σ(q, E) será solución a la ecuación: 2 kq 2 1 d Σ(q, E) + =E (9.290) 2m dq 2 La ecuación (9.290) puede resolverse directamente: r √ Z q 2E Σ(q, E) = mk − q 2 dq k q0 (9.291) No evaluaremos a (9.291) por cuanto el objetivo no es hallar a S sino, mediante las fórmulas (9.275) encontrar a q y p en función del tiempo: Z qr √ 2E S(q, E, t) = Σ(q, E, t) = −Et + mk − q 2 dq (9.292) k q0 reemplazando a (9.292) en (9.275) obtenemos: r √ 2E ∂S p= = mk − q2 ∂q k Z q √ 2/k ∂S r = −t + mk −α = ∂E 2E q0 2 − q2 k (9.293) (9.294) La ecuación (9.294) se puede integrar directamente, incorporando la constante que depende de q0 en α para obtener: ! √ q −1 (9.295) −α = −t + mk sen p 2E/k 9 En la sección 4.4 encontramos una segunda solución de esta ecuación en la cual las variables no están separadas. Tal solución está dada por la ecuación (4.143). 370 / Mecánica clásica avanzada La ecuación (9.295) nos da a q en función del tiempo y reemplazándolo en (9.293) obtenemos a p en función del tiempo: r 2E sen ω(t − α) q(E, α, t) = k (9.296) √ p(E, α, t) = 2mE cos ω(t − α) Vemos que, como β y α son cantidades canónicamente conjugadas, la energı́a E y el tiempo α son un par de cantidades canónicamente conjugadas. E y α no coinciden con las condiciones iniciales, aunque están relacionadas con ellas: r r √ 2E k q0 = − sen ωα ; p0 = 2mE cos ωα ; ω = (9.297) k m Ejemplo 9.6.3 Comparar a S con la acción para el oscilador armónico: Z t L dt = t0 E Z t t0 Z t t0 kq 2 p2 − 2m 2 dt = [cos2 ω(t − α) − sen2 ω(t − α)] dt = E E sen 2ω(t − α) − sen 2ω(t0 − α) 2ω 2ω Omitiendo la constante aditiva podemos escribir: Z t E 1 L dt → sen ω(t − α) cos ω(t − α) = mω 2 q 2 cot ω(t − α) ω 2 t0 Evaluando a S en (9.292): √ S = −Et + mk× # " r 2E q 2E 1 −1 2 q −q + sen p + constante 2 k k 2E/k (9.298) (9.299) (9.300) (9.301) reemplazando a (9.296) en (9.301) y omitiendo una constante aditiva: S = −Et + 1√ 2mEq cos ω(t − α) + E(t − α) 2 1 ⇒ S → mωq 2 cot ω(t − α) 2 (9.302) Comparamos (9.300) y la parte final de (9.302) para encontrar el resultado que se espera: la solución a la ecuación de Hamilton-Jacobi coincide con la integral de acción. La ecuación de Hamilton-Jacobi independiente del tiempo. Si el sistema es conservativo generalizado (puede ser esclerónomo, aunque no hay fuerzas disipativas Las transformaciones canónicas / 371 y H no depende del tiempo explı́citamente) posee una constante de movimiento que es la constante de Jacobi h, que coincide con la energı́a total cuando además el sistema es esclerónomo –véase la ecuación (3.99)–. Entonces la ecuación de Hamilton-Jacobi (9.277) tiene la forma: ! ~ t) ~ t) ∂S(~ q , β, ∂S(~ q , β, =0 (9.303) +H ~ q, ∂t ∂~q Una solución completa puede escribirse en la forma:10 S(~ q , β1 , β2 , ...βl−1 , h, t) = −ht + Σ(~q, β1 , β2 , ...βl−1 , h) (9.304) donde β1 , β2 , ...βl−1 son constantes con valores arbitrarios. Reemplazando a (9.304) en (9.303) y llamando β~l−1 a β1 , β2 , ...βl−1 obtenemos: ! ~l−1 , h) ∂Σ(~ q, β H ~ q, =h (9.305) ∂~q La integral completa de (9.305) satisface (9.278) es decir: 2 ∂ Σ det 6= 0 (βl = h) ~ ∂~q ∂ β (9.306) Conocida la solución de la ecuación de Hamilton-Jacobi independiente del tiempo (9.305), la condición (9.306) permite obtener a qν y pν en función del tiempo (ν = 1, 2, ...l) a partir de las ecuaciones que corresponden a (9.275): ~l−1 , h ∂Σ ~ q, β = pν ; ν = 1, 2, ...l ∂qν (9.307) ~ ∂Σ ~ q , βl−1 , h = −αν ; ν = 1, 2, ...l − 1 ∂βν ∂Σ(~ q , β~l−1 , h) = t − αl ∂h (9.308) donde αν , βν , h, son constantes arbitrarias. Usando las segundas l − 1 ecuaciones (9.307) podemos expresar a l − 1 coordenadas en términos de la restante l-ésima coordenada y de las 2l − 1 constantes arbitrarias ~l−1 , h, α1 , α2 , ...αl−1 , como en la ecuación (9.38). Éstas son las ecuaciones de las β trayectorias en el espacio de configuración. La ecuación (9.308) conecta las coordenadas con la variable temporal t, y equivale a la ecuación (9.40). Ası́ como la acción principal de Hamilton coincide con una de las integrales completas de la ecuación de Hamilton-Jacobi dependiente del tiempo, la acción de Lagrange 10 El ejemplo 4.4.2, sección 4.4, ilustra la propiedad general de la ecuación de Hamilton-Jacobi de poseer soluciones en las cuales las variables t y ~ q no están separadas. 372 / Mecánica clásica avanzada Σ coincide con una de las integrales completas de la ecuación de Hamilton-Jacobi independiente del tiempo (Véase sección 9.3). La conexión entre la acción principal de Hamilton S, y la acción reducida, Σ, está dada por la ecuación (9.46). Si tomamos allı́ a t2 = t y a t1 arbitrario, y omitimos una constante aditiva, vemos que la ecuación (9.46) coincide con la ecuación (9.304). Como se señalaba en la sección 9.3, la acción reducida Σ permite determinar las trayectorias en el espacio de configuración, consistentemente con el principio de mı́nima acción. S es la función generatriz de la transformación canónica que lleva a unas cantidades canónicas que son constantes. Σ es la función generatriz de cierta transformación canónica que no depende del tiempo, que no coincide con la transformación generada por S pero que tiene alguna relación con ella, según veremos. Σ considerada como la función generatriz de una transformación canónica. Sea una transformación canónica independiente del tiempo que al ser aplicada a un sistema conservativo generalizado (∂H/∂t = 0) nos lleva a unas nuevas variables canónicas q ν , pν , donde todas las pν sean cı́clicas. Por tanto todos los q ν serán constantes de movimiento. Llamemos βν a esas constantes. Esta transformación satisface: ∂F1 =0⇒H =H; ∂t ∂F1 = pν ; ∂qν H = H(q) = constante = h ∂F1 = pν ; ∂qν ν = 1, 2, ...l (9.309) (9.310) F1 , según (9.309) y (9.310), debe ser solución a la ecuación diferencial: H ∂F1 (~ q , ~q) q, ~ ∂~q ! =h (9.311) Si llamamos βl = h, (9.309) y (9.310) se pueden escribir como: H ∂F1 (~ q , β~l−1 , h) q, ~ ∂~q ! =h (9.312) ~l−1 , h) ∂F1 (~ q, β = p~ ∂~q ~l−1 , h) ∂F1 (~ q, β = −~pl−1 ~l−1 ∂β ~l−1 , h) ∂F1 (~ q, β = −~ pl ∂h (9.313) Las transformaciones canónicas / 373 Las ecuaciones de Hamilton y sus soluciones para las variables pν y qν son: ~ ~ ~q˙ = ∂H(q) = 0 ⇒ ~q = constante = β ∂~p ~ ~p˙ = − ∂H(q ) = − ∂βl ~ ~ ∂p ∂β ⇒ ~pl−1 = constante = α ~ l−1 ; (9.314) pl = −t + αl Las ecuaciones (9.312) y (9.313) junto con las (9.314) quedan ası́: ~l−1 , h) ∂F1 (~ q, β = pν ; ν = 1, 2, ...l ∂~qν ~l−1 , h) ∂F1 (~ q, β = −αν ; α = 1, 2, ...l − 1 ∂βν (9.315) ~l−1 , h) ∂F1 (~ q, β = t − αl ∂h Comparando (9.312) con (9.305) y a (9.315) con (9.307), vemos que la función generatriz de la transformación buscada, F1 (q, q), coincide con la función Σ. Σ puede considerarse como la función generatriz de una transformación canónica libre univalente de primera clase que al ser aplicada a un sistema conservativo generalizado nos conduce a unas variables canónicas (q, p) donde todas las q ν son constantes, lo mismo que l − 1 pν . Una de las constantes q ν coincide con h y el l-ésimo pν es una función lineal del tiempo, pl = −t + αl . Si esta transformación se aplica a un sistema para el cual ∂H/∂t 6= 0, es claro que las nuevas variables canónicas ya no tendrán las caracterı́sticas señaladas. ~ lo cual No es drástica la exigencia βl = h. Podrı́amos haber dejado a h = H(β), nos conducirı́a a que todos los q ν son constantes y todos los pν son funciones lineales del tiempo. Tratamiento cuando H(q, p) tiene coordenadas cı́clicas. Si el sistema es conservativo generalizado y además hay l − r coordenadas cı́clicas, entonces H = H(q1 , q2 , ...qr , p1 , p2 , ...pl ). Los momentos pr+1 , pr+2 , ...pl , conjugados a las coordenadas cı́clicas serán constantes de movimiento. La solución completa de la ecuación de Hamilton-Jacobi puede escribirse como: S = −ht + l X βν qν + Σ0 (q1 , q2 , ...qr , β1 , β2 , ...βl , h) (9.316) ν=r+1 donde la función Σ0 es solución a la ecuación diferencial: ∂Σ0 ∂Σ0 ∂Σ0 , , ... , βr+1 , βr+2 , ...βl = h H q1 , q2 , ...qr , ∂q1 ∂q2 ∂qr (9.317) en la cual hemos tomado los momentos constantes coincidiendo con l − r constantes βν . 374 / Mecánica clásica avanzada 9.7. Las transformaciones canónicas infinitesimales Ecuaciones de transformación. Las transformaciones canónicas infinitesimales (T.C.I.) son las transformaciones canónicas en las que (p, q) difieren infinitesimalmente de (p, q): q ν = qν + δqν ; pν = pν + δpν ; ν = 1, 2, ...l (9.318) aquı́ δ no denota desplazamientos virtuales sino simplemente los cambios infinitesimales en las coordenadas y momentos en la T.C.I. La T.C.I. (9.318) difiere infinitesimalmente de la transformación identidad. Si la transformación infinitesimal sólo depende de un parámetro ε, podemos decir que la función generatriz de la T.C.I. serı́a igual a la función generatriz de la transformación identidad más un término del orden de ε. La transformación identidad es univalente libre de tercera y de segunda clase, según las ecuaciones (9.184) a (9.188). La función generatriz de la T.C.I. (9.318) será pues: F2 (q, pν , t) = l X pν qν + ε G(q, p, t) (9.319) ν=1 Si la T.C.I. posee m parámetros infinitesimales, F2 será: F2 = l X pν qν + ν=1 m X εj Gj (9.320) j=1 Es decir, las T.C.I. son las que se obtienen a partir de la identidad variando de manera continua uno o varios parámetros. Los Gj se llaman los generadores infinitesimales de la T.C.I., en términos de los cuales se pueden expresar las fórmulas (9.135). Una transformación canónica del tipo F2 satisface: pν = ∂F2 ∂F2 ∂F2 ; qν = ; ν = 1, 2, ...l ; H − H = ∂qν ∂pν ∂t (9.321) Entonces para la T.C.I. con función generatriz (9.319) tenemos: δpν = −ε ∂G ∂G ; δqν = ε ; ν = 1, 2, ...l ∂qν ∂pν (9.322) ∂G H =H +ε ∂t donde en (9.322) hemos notado que ε f (q, p, t) = εf (q, p, t) al primer orden en ε. La T.C.I. de evolución temporal. Sabemos que la evolución temporal puede considerarse como una transformación canónica. Queremos hallar el generador de la T.C.I. de evolución temporal. La transformación es: qν (t); pν (t) → q ν (t) = qν (t + τ )pν (t) = pν (t + τ ) ; ν = 1, 2, ...l (9.323) Las transformaciones canónicas / 375 donde tomamos a τ infinitesimal. De acuerdo con (9.269), la función generatriz de la transformación canónica de evolución temporal entre t0 y t es −S, Z t e.t. L dt (9.324) F1 = − t0 O sea que para la transformación (9.323) con τ infinitesimal, la función generatriz es: F1e.t. = = − − Z l X t+τ L dt ≈ −Lτ = − t l X ν=1 pν q̇ν − H ! τ pν q̇ν τ + Hτ (9.325) ν=1 Por otra parte, q̇ν = (q ν − qν )/τ → q̇ν τ = q ν − qν , o sea que: F1e.t. ≈ − l X (pν qν − pν q ν ) + Hτ (9.326) ν=1 De acuerdo con (9.217), (9.218), (9.187) y (9.188) vemos que: F1id. = F2id. + l X (pν qν + pν q ν ) = l X (−q ν pν + pν qν + pν q ν ) (9.327) ν=1 ν=1 donde F2id. es la función generatriz de la T.C. identidad y F1e.t. se refiere a la evolución temporal. Comparando (9.326) y (9.327) obtenemos: F1e.t. = F2id. − l X pν q ν + Hτ (9.328) ν=1 Comparando (9.328) con (9.218) obtenemos: F1e.t. = F2id. + Hτ = l X pν qν + Hτ (9.329) ν=1 Si comparamos a (9.329) con (9.319) vemos que en este caso τ hace el papel del parámetro infinitesimal ε y H es el generador infinitesimal de la T.C.I. de evolución temporal. Al mismo resultado llegamos de la siguiente manera, notemos que: q ν = qν + τ q̇ν ⇒ δqν = τ q̇ν = dqν (9.330) pν = pν + τ ṗν ⇒ δpν = τ ṗν = dpν ; H = H + ∂H τ ∂t (9.331) Comparando a (9.322) con (9.330) obtenemos: ε ∂G = τ q̇ν ; ∂pν −ε ∂G = τ ṗν ; ∂qν ε ∂G ∂H =τ ∂t ∂t (9.332) 376 / Mecánica clásica avanzada De las ecuaciones de Hamilton obtenemos para (9.332): ε ∂G ∂H =τ ; ∂pν ∂pν −ε ∂ (εG − τ H) = 0 ; ∂qν ∂G ∂H ∂ = −τ ⇒ (εG − τ H) = 0 ∂qν ∂qν ∂pν ν = 1, 2, ...l ; (9.333) ∂ (εG − τ H) = 0 ∂t Las ecuaciones (9.333) nos dicen que εG = τ H. En efecto, podemos tomar τ como ε y a H como el generador de la T.C.I. El movimiento finito del sistema puede considerarse como una sucesión de T.C.I. Si H es constante, el generador de la T.C.I. de evolución temporal es el mismo para cada una de las transformaciones en tal sucesión. Si H depende de t, H es G para la evolución de t a t + τ y H + (∂H/∂t)τ es G para la evolución de t + τ a t + 2τ , etc. En el lı́mite τ → 0, la evolución finita es el desarrollo continuo de una T.C. En este caso el generador de la T.C.I. es H. En general, el generador de cualquier T.C.I. es una variable dinámica del sistema. La T.C.I. de translación espacial. Esta transformación involucra tres parámetros infinitesimales. Supongamos que el sistema es libre, de modo que las coordenadas cartesianas son a la vez coordenadas generalizadas independientes. La transformación es: xi = xi + εx ; y i = yi + εy ; z i = zi + εz ; i = 1, 2, ...N (9.334) Además, como para este sistema p~i = mi~r˙ i , se tiene que: ~pi = p~i ; i = 1, 2, ...N (9.335) En este caso δxi = εx , δyi = εy , δzi = εz , δ~ pi = 0; i = 1, 2, ...N . Entonces las ecuaciones (9.322) toman la forma: ∂ ~ = ~ε ; (~ε · G) ∂~ pi ∂ ~ = 0; (~ε · G) ∂~ri i = 1, 2, ...N (9.336) donde nos basamos en (9.320) con m = 3 y formamos los εj con el vector ~ε y con los Gj ~ De (9.336) se sigue que G ~ tiene la expresión: el vector G. ~ = G n X pi = P~ ~ (9.337) i=1 Vemos que el momento total del sistema P~ es el generador infinitesimal de la transformación canónica de translación espacial. Más exactamente, en la translación por una cantidad ε a lo largo del vector unitario ~n, entonces ~ε = ε~n y el generador infinitesimal ~ = Pn . El generador infinitesimal de translaciones a lo largo de la dirección será ~n · G ~n es la componente del momento total en esa dirección, Pn . El hecho de que se emplee (9.335) no implica que P~ o Pn sea constante en el tiempo. Veremos que P~ es constante sólo si H no depende de la coordenada de posición del centro de masa. Las transformaciones canónicas / 377 y ri ε r θi x Figura 9.7 Rotación de las partı́culas alrededor del eje z La T.C.I. de rotación espacial. Suponemos también qué sistema es libre. Por simplicidad consideremos una rotación de todas las partı́culas alrededor del eje z (véase figura 9.7). La transformación es: xi = ri cos(θi + ε) yi = ri sen(θi + ε) zi = zi ; i = 1, 2, ...N (9.338) y similarmente para las componentes de P~i . Al primer orden en ε, las ecuaciones (9.338) y sus similares para p~i nos dan: xi = xi − εyi ; yi = yi + εxi ; z i = zi pxi = pxi − εpyi ; pyi = pyi + εpxi ; pzi = pzi ; (9.339) i = 1, 2, ...N Comparando (9.339) con (9.322) hallamos: −εyi = δxi = ε ∂G ∂G ; εxi = δyi = ε ; ∂pxi ∂pyi −εpyi = δpxi = −ε εpxi = δpyi = −ε 0 = δzi = ε ∂G ∂pxi ∂G ∂pzi (9.340) ∂G ∂G ; 0 = δpzi = −ε ∂yi ∂zi vemos que G no depende de zi ni de pzi . (9.340) se satisfacen si: G= N X i=1 (xi pyi − yi pxi ) = Lz (9.341) 378 / Mecánica clásica avanzada O sea que Lz es el generador infinitesimal de una rotación del sistema alrededor del eje z, donde Lz es la componente z del momento angular total del sistema. Vemos que: Lz = N X i=1 (xi pyi − y i pxi ) = N X (xi pyi − yi pxi ) + 0 (ε2 ) (9.342) i=1 O sea que, como debe ser, Lz = Lz . Veremos que Lz será constante en el tiempo sólo si H no depende de la coordenada φ del vector de posición del centro de masa. 9.8. Los corchetes de Poisson En el numeral anterior vimos que los generadores infinitesimales H, Pn y Lz corresponden a cantidades con claro significado fı́sico. Aquı́ consideraremos algunas propiedades de las funciones del estado del sistema que hemos definido como variables dinámicas (véase sección 3.4). Las variables dinámicas. Definimos una variable dinámica como una función del estado del sistema y del tiempo que no cambia su valor en una transformación canónica. Ası́ que bajo una transformación canónica (q, p) → (q, p), f será una variable dinámica si se cumple: f (q, p, t) = f [q(q, p, t), p(q, p, t)] = f (q, p, t) (9.343) De acuerdo con esta definición, como en una transformación canónica: H(q, p, t) = H(q, p, t) + ∂F ∂t (9.344) se sigue que el hamiltoniano no es una variable dinámica cuando se consideran transformaciones canónicas que dependen del tiempo. Ası́ por ejemplo, para un sistema conservativo H = E, igual a la energı́a total, en tanto que por medio de una transformación canónica dependiente del tiempo podemos hacer H = 0. Tenemos en general que el ~ o p~. Ası́ también, la energı́a generador de una T.C.I. es una variable dinámica, como L cinética es una variable dinámica. En esta definición de variables dinámicas está implı́cita la idea de las transformaciones canónicas desde un punto de vista pasivo. Formas “activa” y “pasiva” de una transformación canónica. En la sección 7.7 vimos que las rotaciones de un cuerpo rı́gido admiten las interpretaciones “activa” y “pasiva”. Análogamente esas consideraciones se pueden hacer a las transformaciones en el espacio de fases. En la interpretación “pasiva”, una transformación canónica es una regla de correspondencia que asocia a cada punto del espacio de fases (q, p) un punto del espacio de fases (q, p), tal que las ecuaciones de movimiento toman la misma forma en los dos espacios. Es una aplicación de un espacio en otro espacio. Una variable dinámica es una función del estado del sistema, considerado como algo intrı́nseco o sea independiente del espacio de fases que se use para describirlo. Ası́, si el estado del sistema en un tiempo Las transformaciones canónicas / 379 dado se describe por el punto A(q, p) en un espacio de fases y por el punto A(q, p) en otro espacio de fases, una variable dinámica tiene el mismo valor en A que en A. Por otra parte, hay transformaciones canónicas que admiten una interpretación activa. Son aquellas transformaciones canónicas del espacio de fases en sı́ mismo; o sea aquellas en que se tiene una aplicación del espacio de fases sobre sı́ mismo. Ası́, la transformación canónica de evolución temporal asocia al estado del sistema en el tiempo t0 , (q0 , p0 ) el estado en el tiempo t, (q, p); la transformación canónica de translación espacial asocia a la posición del sistema (~r1 , ~r2 , ...~rN ) una posición en la cual todas las partı́culas se han desplazado una distancia ~ ε: (~r1 + ~ε, ~r2 + ~ε, ...~rN + ~ε); la transformación canónica de rotación espacial es la misma estudiada en el capı́tulo 7. Son susceptibles de una interpretación “activa” todas aquellas transformaciones canónicas que se pueden obtener a partir de la transformación identidad por medio de la variación continua de uno o varios parámetros. Ası́ por ejemplo, la inversión de las coordenadas, o la transformación canónica que intercambia coordenadas y momentos, no son susceptibles de una interpretación activa. Tampoco mediante una variación continua de parámetros podemos llegar de las coordenadas cartesianas a las coordenadas esféricas, por ejemplo. Toda T.C.I. es pues susceptible de ser tratada en las formas pasiva (el sistema descrito desde diferentes espacios de fases) o activa (el sistema es cambiado de un estado a otro). En (9.318) es entonces válido tomar desplazamientos del tipo ∆. Cambio de una variable dinámica en una T.C.I. En la interpretación “pasiva” no tiene sentido preguntarse por el “cambio de una variable dinámica f bajo una transformación canónica”, pues de acuerdo con (9.343) no hay tal cambio. En la interpretación “activa”, si tiene sentido preguntarse cómo cambia el valor de f al pasar el sistema de un estado A(q, p) a un estado B(q, p). Usaremos el sı́mbolo ∂ para denotar tal cambio: ∂f (q, p, t) = f (q, p, t) − f (q, p, t) (9.345) Para ser más precisos, en la interpretación “pasiva” podemos preguntarnos por el cambio en la forma funcional de la variable dinámica al ser descrita desde dos espacios de fases diferentes, lo cual es mucho más difı́cil de visualizar. Este cambio de forma funcional está definido por: f (q, p, t) − f (q, p, t) (9.346) de acuerdo con la notación (9.343). Usando (9.343) podemos escribir a (9.346) como: f (q, p, t) − f (q, p, t) = −∂f (9.347) comparando (9.345) y (9.347) vemos que: ∂f = −∂f (9.348) Los dos cambios (9.345) y (9.346) son iguales, o sea que ∂f puede significar el cambio del valor de f al pasar el sistema del estado (q, p, t) al estado (q, p, t) o el cambio funcional de la función f en el mismo estado, en la interpretación “pasiva”. La T.C.I. es 380 / Mecánica clásica avanzada (9.318) y expresada en términos de generadores es (9.322). Con la interpretación “activa” ∂f es: ∂f = = = f (q + δq, p + δp, t) − f (q, p, t) l X ∂f (q, p, t) ∂f (q, p, t) δqν + δpν ∂qν ∂pν ν=1 l m X X ∂f (q, p, t) ∂Gj (q, p, t) ∂f (q, p, t) ∂Gj (q, p, t) εj − εj ∂qν ∂pν ∂pν ∂qν j=1 ν=1 = m X εj [f (q, p, t), Gj (q, p, t)] (9.349) j=1 donde hemos definido el corchete de Poisson de dos variables dinámicas g(q, p, t) y h(q, p, t) como: l X ∂g ∂h ∂g ∂h − [g, h] = ∂qν ∂pν ∂pν ∂qν ν=1 (9.350) Vemos que el corchete de Poisson de dos variables dinámicas a su vez es una variable dinámica. En sı́ntesis: f (q, p, t) − f (q, p, t) = f (q, p, t) − f (q, p, t)   m X εj Gj (q, p, t) = f (q, p, t), (9.351) j=1 Si la T.C.I. es la evolución temporal, tenemos que ε = τ y G = H. En este caso: l ∂f X f˙ = + ∂t ν=1 l = ∂f X + ∂t ν=1 ∂f ∂f q̇ν + ṗν ∂qν ∂pν ∂f ∂H ∂f ∂H − ∂qν ∂pν ∂pν ∂qν (9.352) ∂f + [f, H] ⇒ f˙ = ∂t Si la variable dinámica f no depende explı́citamente del tiempo, su rata de cambio es igual a su corchete de Poisson con H. Si f es una constante de movimiento, el corchete de Poisson de f con H es igual al negativo de su derivada parcial respecto al tiempo; si f no depende explı́citamente del tiempo será una constante de movimiento si su corchete de Poisson con H es cero. Simetrı́a y leyes de conservación. Sabemos que la simetrı́a dinámica de un sistema se expresa mediante las simetrı́as de las funciones L o H. Las transformaciones canónicas / 381 Sea una T.C.I. y sea G el generador de la misma; G es una variable dinámica. Entonces es correcto expresar el siguiente teorema: G es una constante de movimiento si H es invariante bajo la transformación generada por G. Recordemos que H no es en general una variable dinámica. Por esta razón al realizar la T.C.I. generada por G el cambio en H no está dado por (9.349). H es simplemente una función que en un espacio de fases dado define las ecuaciones canónicas de movimiento. Por esta razón, cuando la transformación canónica depende del tiempo, no se cumple que H(q, p, t) = H(q, p, t). Denotemos por ∂H a la siguiente diferencia. Ver ecuación (9.346): ∂H = H(q, p, t) − H(q, p, t) (9.353) H(q, p, t) y H(q, p, t), de acuerdo con (9.344) y (9.319) están relacionadas por: H(q, p, t) − H(q, p, t) = ε ∂G ∂t (9.354) reemplazando a (9.354) en (9.353) tenemos: ∂H = H(q, p, t) − H(q, p, t) + ε ∂G ∂t (9.355) Ahora sı́ podemos usar la ecuación (9.351) para H: H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)] (9.356) La diferencia entre H y H es del orden de ε, luego, al primer orden en ε (9.356) toma la forma: H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)] Ahora, reemplazamos a (9.357) en (9.355) para obtener: ∂G ∂G ∂H = −ε [H, G] + ε =ε + [G, H] ∂t ∂t (9.357) (9.358) De (9.352) vemos entonces que: ∂H = ε Ġ (9.359) La ecuación (9.359) nos permite inmediatamente obtener el enunciado del teorema: G es una constante de movimiento si y sólo si es el generador de una transformación canónica infinitesimal que no cambia la forma funcional del hamiltoniano. Ası́ pues, si H no cambia al desplazar el sistema a lo largo de una dirección ~n, P~ .~n es una constante de movimiento y si H no cambia al rotar el sistema alrededor del eje ~ n es una constante de movimiento. P~ es el momento lineal total y L ~ es el ~n entonces L.~ momento angular. Este resultado ya lo habı́amos obtenido en unos casos particulares en la sección 3.4. Como según este teorema las constantes de movimiento han de ser los generadores de T.C.I. que dejan invariante a H, se sigue que hallando todas las transformaciones de simetrı́a de H podemos encontrar todas las constantes de movimiento. 382 / Mecánica clásica avanzada Por otra parte si se conocen 2l constantes de movimiento del sistema se tendrá resuelto el problema mecánico, si esas 2l constantes son independientes. En efecto, el método de Hamilton-Jacobi permite mediante una transformación canónica expresar las coordenadas y momentos del sistema en términos de las constantes de movimiento y del tiempo. En el capı́tulo 11 se muestra que el resultado falla si el sistema es no integrable. La conservación del momento que vimos en el capı́tulo 3 se sigue de este teorema. Si qν0 es cı́clica, H no depende de ella y por tanto es invariante en una T.C.I. que implique el cambio de qν0 , y el generador infinitesimal de esta transformación habrá de ser una constante de movimiento. Las ecuaciones de tal transformación canónica serán: δqν = ε δνν0 ; δpν = 0 ; ν = 1, 2, ...l (9.360) por otra parte se tiene que: δqν = ε ∂G ; ∂pν δpν = −ε ∂G ; ∂qν ν = 1, 2, ...l (9.361) Se sigue de (9.360) y (9.361) que: (9.362) G = pν0 O sea que el generador es precisamente el momento canónico conjugado de la coordenada cı́clica qν0 . En general, un cambio en cualquier variable canónica del sistema, qν o pν , es generado por su variable canónicamente conjugada, pν o −qν , respectivamente. Las ecuaciones de movimiento en términos de los corchetes de Poisson. Si en la ecuación (9.352) reemplazamos a f por qν y por pν obtenemos: q̇ν = [qν , H] ; ṗν = [qν , H] ; ν = 1, 2, ...l (9.363) o también, usando las ecuaciones de Hamilton: ∂H ∂H = [qν , H] ; = −[pν , H] ; ν = 1, 2, ...l ∂pν ∂pν (9.364) Las expresiones (9.363) son las ecuaciones de movimiento de Poisson, totalmente equivalentes a las ecuaciones de movimiento de Hamilton. Las ecuaciones (9.364) no son más que el resultado de aplicar el párrafo que sigue a la ecuación (9.362), conjuntamente con (9.351). Ejemplo 9.8.1 Hallar las ecuaciones de movimiento de Poisson para una partı́cula cargada en presencia de un campo electromagnético externo. Usamos la ecuación (3.117) para h conjuntamente con la ecuación (4.1) para ~r˙ en función del momento canónico p~: H= e ~ 2 1 p~ − A + eφ 2m c (9.365) Las transformaciones canónicas / 383 ~ y φ son los potenciales vectorial y escalar del campo externo. Evaluemos los donde A corchetes de Poisson de ~r con H y de p~ con H para mostrar la consistencia con las fórmulas (9.363): ∂rn ∂H ∂rn ∂H · − · ∂~r ∂~ p ∂~p ∂~r e~ p~ − A ∂H c ; ~n = ~i, ~j, ~k = ~n · = ~n · ∂~ p m [rn , H] = (9.366) Por otra parte: [pn , H] = = ∂pn ∂H ∂pn ∂H ∂H ∂H · − · = −~n · =− ∂~r ∂~ p ∂~p ∂~r ∂~r ∂rn ~ e ~ ∂A ∂φ e p~ − A · −e mc c ∂rn ∂rn (9.367) La ecuación (9.367) también puede escribirse ası́: [pn , H] = ~ ∂φ e ∂ ˙ ~ ∂An e ˙ ∂A + −e = (~r · A) − Ȧn + ~r · c ∂rn ∂rn c ∂rn ∂t e e ∂An ∂φ Ȧn − −e c c ∂t ∂rn (9.368) ~ y E se pueden expresar en términos de A ~ y φ ası́: Notamos que B ~ ~ = − ∂φ − 1 ∂ A ; E ∂~r c ∂t ~ = ∂ ×A ~ B ∂~r (9.369) Notemos que: ∂ ∂Aµ ~ ~r˙ × ×A = ǫnms ǫstµ ṙm ∂~r ∂rt n = (δnt δmµ − δnµ δmt ) ṙm ∂Aµ ∂rt (9.370) ~ ∂A ∂Aµ = ~r˙ · − ~r˙ · ∂rn ∂~r y, Ȧn = ∂An ˙ ∂An + ~r · ∂t ∂~r (9.371) con lo cual: ~ ∂ ~ + ∂An − Ȧn ~ = ~r˙ · ∂ A + ∂An − Ȧn = ∂ (~r˙ · A) ×A ~r˙ × ∂~r ∂rn ∂t ∂rn ∂t (9.372) 384 / Mecánica clásica avanzada remplazando (9.372) en (9.369) obtenemos: e ˙ 1 ∂An ∂ ∂φ e ~ [pn , H] = + ~r × ×A + Ȧn − e c ∂~r c ∂rn c ∂t n e ˙ ~ e = (~r × B)n + eEn Ȧn + Ȧn c c pero, según la expresión para la fuerza de Lorentz: e ~ n + eEn mr̈n = (~r˙ × B) c Usando (9.374), (9.373) queda como: e e d [pn , H] = mr̈n + Ȧn = mṙn + An = ṗn c dt c en concordancia con (9.363). También de (9.366) se sigue que: [rn , H] = ṙn de donde: (9.374) (9.375) (9.376) El corchete de Poisson de dos componentes del momento cinemático es: ∂pci ∂pcj ∂pci ∂pcj · − · [pci , pcj ] = ∂~r ∂~p ∂~p ∂~r ~ pero p~c = p~ − (e/c) A, por tanto: e ∂Aj e ∂Ai · ~nj − ~ni · [pci , pcj ] = − c ∂~r c ∂~r = (9.373) e c ∂Aj ∂Ai − ∂ri ∂rj e = ǫijk c ∂ ~ ×A ∂~r k e [pci , pcj ] = ǫijk Bk c Esto último también puede escribirse como: e [ṙi , ṙj ] = 2 ǫijk Bk m c O sea que el corchete de Poisson de ẋ con ẏ es cero sólo si Bz se anula. (9.377) (9.378) (9.379) (9.380) Algunas propiedades de los corchetes de Poisson. Para cualesquiera tres funciones f (q, p, t), g(q, p, t) y h(q, p, t), se cumple: (i) [f, g] = −[g, f ] (ii) [cf, g] = [f, cg] = c[f, g] ; c : constante (iii) [f + g, h] = [f, h] + [g, h] (iv) [f g, h] = f [g, f ] + g[f, h] (v) ∂g ∂f ∂ [f, h] = , g + f, ∂t ∂t ∂t (9.381) Las transformaciones canónicas / 385 Estas propiedades se siguen directamente de la definición de los corchetes de Poisson, ecuación (9.350). La identidad de Jacobi. Para cualesquiera tres funciones f , g y h se cumple: [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 0 (9.382) esta relación se llama la identidad de Jacobi. Para demostrarla es útil la siguiente interpretación del corchete de Poisson: l X ∂g ∂ ∂g ∂ [g, φ] = − φ = D̂g φ (9.383) ∂qν ∂pν ∂pν ∂qν ν=1 donde D̂g es un operador diferencial lineal en el espacio de fases. Con esta notación podemos escribir el siguiente conmutador: D̂g D̂h − D̂h D̂g f = [g, [h, f ]] − [h, [g, f ]] = (9.384) [g, [h, f ]] + [h, [f, g]] La expresión (9.384) sólo contiene derivadas primeras respecto a pν y qν de la función f . En efecto: D̂g = 2l X i=1 gi ∂ ; xν = qν ; xν+l = pν ; ν = 1, 2, ...l ∂xi (9.385) por tanto, tenemos que: D̂g D̂h − D̂h D̂g f 2l 2l X X ∂ ∂ ∂ ∂ = gi hj − hi gj f ∂xi ∂xj ∂xi ∂xj i=1 j=1 " 2l X 2l X ∂2 ∂hj ∂ ∂2 g i hj = + gi − hi g j ∂xi ∂xj ∂xi ∂xj ∂xi ∂xj i=1 j=1 # ∂gj ∂ f − hi ∂xi ∂xj = 2l X 2l X ∂hj ∂gj ∂f gi − hi ∂xi ∂xi ∂xj i=1 j=1 (9.386) Por otra parte tenemos que: [f, [g, h]] = [[h, g], f ] = [D̂h g, f ] = 2l X i=1 = ∂g ,f hi ∂xi 2l X l X ∂ ∂g ∂g ∂ ∂f ∂f hi hi − ∂qν ∂xi ∂pν ∂pν ∂xi ∂qν i=1 ν=1 (9.387) 386 / Mecánica clásica avanzada La ecuación (9.386) se puede escribir como: D̂g D̂h − D̂h D̂g " 2l X l X ∂hν ∂gν ∂f gi f= − hi ∂xi ∂xi ∂qν i=1 ν=1 # ∂hl+ν ∂gl+ν ∂f + gi − hi ∂xi ∂xi ∂pν (9.388) Sumando (9.387) y (9.388) obtenemos: [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 2l X l X ∂g ∂gν ∂ ∂f ∂hν hi − hi − gi ∂x ∂x ∂p ∂x ∂q i i ν i ν i=1 ν=1 + (9.389) 2l X l X ∂g ∂gl+ν ∂ ∂f ∂hl+ν hi − hi + gi ∂xi ∂xi ∂qν ∂xi ∂pν i=1 ν=1 De (9.383) y (9.385) se sigue que: gν = − ∂g ; ∂pν gl+ν = ∂g ; ∂qν ν = 1, 2, ...l (9.390) Por tanto: ∂gν ∂ ∂hν − hµ − gµ ∂qµ ∂qµ ∂pν = ∂g hµ ∂qµ ∂h ∂ 2 g ∂g ∂ 2 h − ∂pµ ∂qµ ∂pν ∂pµ ∂qµ ∂pν (9.391) ∂ 2 h ∂g ∂h ∂ 2 g + + ∂pν ∂pµ ∂qµ ∂pµ ∂pν ∂qµ = ∂g ∂ 2 h ∂g ∂ 2 h + ∂pµ ∂qµ ∂pν ∂qµ ∂pµ ∂qν Las transformaciones canónicas / 387 Similarmente hallamos que: gl+µ ∂gν ∂ ∂hν − hl+µ − ∂qµ ∂pµ ∂pν − ∂g hl+µ = ∂pµ ∂g ∂ 2 h ∂g ∂ 2 h − ∂qµ ∂pµ ∂pν ∂pµ ∂pν ∂qµ ∂hl+ν ∂gl+ν ∂ gµ − hµ + ∂qµ ∂qµ ∂qν ∂g hµ = ∂qµ (9.392) ∂g ∂ 2 h ∂g ∂ 2 h − − ∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ ∂hl+ν ∂gl+ν ∂ gl+µ − hl+µ + ∂pµ ∂pµ ∂qν ∂g hl+µ = ∂pµ ∂g ∂ 2 h ∂g ∂ 2 h + ∂qµ ∂pµ ∂qν ∂pµ ∂qν ∂qµ Reemplazando (9.391)y (9.392) en (9.389) obtenemos: [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = l X µ,ν=1 ∂g ∂ 2 h ∂g ∂ 2 h + ∂pν ∂qµ ∂pν ∂qµ ∂pµ ∂pν ∂g ∂ 2 h ∂g ∂ 2 h − − ∂qµ ∂pµ ∂pν ∂pµ ∂pµ ∂qν + l X µ,ν=1 − ∂g ∂ 2 h ∂g ∂ 2 h − ∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ ∂g ∂ 2 h ∂g ∂ 2 h + + ∂qµ ∂pµ ∂qν ∂pν ∂qν ∂qµ ! ! ∂f ∂qν (9.393) ∂f ∂pν La ecuación (9.393) es idénticamente cero, lo cual prueba la identidad de Jacobi. Invariancia de los corchetes de Poisson bajo T.C.I. Se trata de mostrar que: [f (q, p, t), g(q, p, t)] = [f (q, p, t), g(q, p, t)] (9.394) De la definición (9.343) se sigue que: l X ∂f ∂qµ ∂f ∂f ∂pµ ∂f = = + ∂q ∂q ν ∂qµ ∂qν ∂pµ ∂q ν µ=1 (9.395) 388 / Mecánica clásica avanzada De (9.318) y (9.322) se sigue: ∂qµ ∂2G ; = δµν − ǫ ∂q ν ∂qν ∂pµ ∂pµ ∂2G =ǫ ∂q ν ∂qν ∂qµ (9.396) Por tanto, se cumple: ∂f ∂f ∂ ∂f ∂f ∂G +ǫ ,f = +ǫ [G, f ] − ǫ G, = ∂qν ∂qν ∂qν ∂qν ∂qν ∂qν (9.397) donde la última igualdad se sigue de (9.381-v). De (9.318) y (9.322) se sigue: ∂2G ∂pµ ; = δµν + ǫ ∂pν ∂pν ∂qµ ∂qµ ∂2G = −ǫ ∂pν ∂pν ∂pµ (9.398) y análogamente se llega a: ∂f ∂ ∂f ∂f +ǫ [G, f ] − ǫ G, = ∂pν ∂pν ∂pν ∂pν (9.399) Reemplazando (9.397) y (9.399) y expresiones análogas para g, en (9.394): f, g (q,p) = " l X ∂[G, f ] ∂f ∂f +ǫ − ǫ G, · ∂qν ∂pν ∂qν ν=1 ∂[G, g] ∂g ∂g + +ǫ − ǫ G, ∂pν ∂pν ∂pν ∂[G, f ] ∂f ∂f · +ǫ − ǫ G, ∂pν ∂pν ∂pν # ∂[G, g] ∂g ∂g +ǫ − ǫ G, ∂qν ∂qν ∂qν (9.400) Las transformaciones canónicas / 389 Al primer orden en ε podemos escribir: f, g (q,p) l X ∂[G, f ] ∂g = [f, g](q,p) + ε ∂qν ∂pν ν=1 ∂f − G, ∂qν ∂f ∂[G, g] ∂g + ∂pν ∂qν ∂pν ∂g ∂[G, g] ∂f ∂g ∂f ∂f G, − + G, − ∂qν ∂pν ∂qν ∂pν ∂qν ∂pν − ∂f ∂g ∂g ∂[G, f ] G, + ∂qν ∂pν ∂qν ∂pν (9.401) = [f, g](q,p) + ǫ ([[G, f ], g] + [f, [G, g]]) +ǫ l X ∂g ∂f ∂g ∂f ,G − ,G ∂pν ∂qν ∂qν ∂pν ν=1 En la última igualdad se ha hecho uso de la propiedad (9.381-iv). Ahora los últimos términos en (9.401) dan [[f, g], G], con lo cual el término del orden de ε es cero con base en la identidad de Jacobi, por tanto: [f , g](q,p) = [f, g]q,p (9.402) Llegamos a la conclusión de que el corchete de Poisson de dos variables dinámicas es una variable dinámica que es invariante bajo transformaciones canónicas infinitesimales. En otras palabras, el corchete de Poisson de dos variables dinámicas es una variable dinámica con un valor independiente de las variables usadas para describir el estado del sistema: los corchetes de Poisson son invariantes canónicos. Veremos que esta invariancia se cumple aun bajo transformaciones canónicas que no se pueden obtener de manera continua a partir de la transformación identidad, o sea como sucesión de T.C.I. El teorema de Jacobi-Poisson. Si f y g son dos constantes de movimiento, entonces [f, g] también es una constante de movimiento.11 De (9.352) se sigue que si f y g son constantes de movimiento se cumple: ∂g ∂f + [f, H] = 0 y + [g, H] = 0 ∂t ∂t (9.403) Debemos probar que esto implica que: ∂[f, g] + [[f, g], H] = 0 ∂t 11 Este teorema fue enunciado por Poisson en 1809. (9.404) 390 / Mecánica clásica avanzada En efecto: ∂ ∂g ∂f = − [[f, H] , g] − [f, [g, h]] [f, g] = , g + f, ∂t ∂t ∂t (9.405) [[H, f ] , g] + [g, [H, f ]] = − [[f, g] , H] La última igualdad en (9.405) se sigue de la identidad de Jacobi, lo cual demuestra el teorema. El corchete de Poisson de dos variables dinámicas que se conservan es una variable dinámica que se conserva. Esto permite, por ejemplo, construir a partir de un conjunto de s constantes de movimiento independientes C1 , C2 , ...Cs (s < 2l) las 2l − s constantes independientes restantes Cs+1 , Cs+2 , ...C2l por formar los corchetes de Poisson entre todos los posibles pares de estas S variables dinámicas. En total hay s(s − 1)/2 corchetes de Poisson, de los cuales algunos pueden ser cero o funciones de constantes de movimiento conocidas antes, pero es de esperarse que haya 2l − s que sean independientes. Es claro que puede haber un número mı́nimo s de constantes de movimiento independiente tal que a partir de ellas se pueda obtener el conjunto completo de 2l constantes de movimiento independientes. Ejemplo 9.8.2 Sea una partı́cula en una dimensión, sometida a una fuerza constante. Hallar dos constantes de movimiento independientes y mostrar que el corchete de Poisson de ellas no da lugar a una tercera constante de movimiento. La solución al problema es: 1 x = v(t + t0 ) + g(t + t0 )2 ; p = mv + mg(t + t0 ) 2 (9.406) donde t0 y v son constantes. Dos constantes de movimiento son t0 y la energı́a total E. x puede escribirse en la forma: x= 1 p (t + t0 ) − g(t + t0 )2 m 2 Entonces las expresiones para t0 y E en función de p y x son: s 2x p p2 p2 − t0 = −t + − ; E = − mgx mg m2 g 2 g 2m (9.407) (9.408) El corchete de Poisson de t0 y E es: [t0 (p, x, t), E(p, x, t)] = ∂t0 ∂E ∂t0 ∂E − ∂x ∂p ∂p ∂x (9.409) Haciendo el cálculo indicado en (9.408), usando (9.409), obtenemos: [t0 , E] = 1 (9.410) La ecuación (9.408) puede interpretarse como una transformación canónica que permite expresar las nuevas variables canónicas t0 y E en función de las viejas x y p. Tal transformación depende del tiempo. Esto ilustra un resultado más general: [qν , pν ] = [q ν , q ν ] = 1, para todo ν, que veremos más adelante. Las transformaciones canónicas / 391 Ejemplo 9.8.3 Sea una partı́cula para la cual lz y py son constantes de movimiento. Hallar una tercera constante de movimiento. Por el teorema de Poisson, [lz , py ] es constante. [lz , py ] = [xpy , py ] − [ypx , py ] (9.411) = x[py , py ] + py [x, py ] − y[px , py ] − px [y, py ] Es fácil, de la definición, verificar que: [x, py ] = 0 ; [px , py ] = 0 ; [y, py ] = 1 son. (9.412) Por tanto, [lz , py ] = −px . O sea que px es constante de movimiento si lz y py lo Ejemplo 9.8.4 Demostrar que si dos componentes del momento angular son constantes de movimiento, la tercera también lo es. Si li y lj son dos componentes de ~l constantes, por el teorema de Poisson [li , lj ] también es una constante. Recordando que: li = ǫikl xk pl (9.413) Vemos que: [li , lj ] = ǫikl ǫjmn [xk pl , xm pn ] (9.414) Usando la propiedad (9.381-iv) vemos que: [xk pl , xm pn ] = xk [pl , xm pn ] + pl [xk , xm pn ] = −xk [xm pm , pl ] − pl [xm pn , xk ] = −xk (xm [pn , pl ] + pn [xm , pl ]) (9.415) −pl (xm [pn , xk ] + pn [xm , xk ]) Es fácil ver que: [pn , pl ] = 0 ; [xm , pl ] = δml ; [xm , xk ] = 0 (9.416) con lo cual (9.415) queda: [xk pl , xm pn ] = −xk pn δml + pl xm δnk (9.417) reemplazando (9.417) en (9.414) obtenemos: [li , lj ] = −ǫikl ǫjln xk pn + ǫikl ǫjnk pl xn (9.418) Usando la propiedad: ǫikl ǫjnl = δij δkn − δin δjk (9.419) 392 / Mecánica clásica avanzada obtenemos: [li , lj ] = (δij δkn − δin δkj )xk pn − (δij δkn − δin δkj )pk xn (9.420) Finalmente encontramos que: [li , lj ] = δij ~r · ~p − rj pi − δij ~r · ~p + pj ri = ri pj − pi rj (9.421) no es otra cosa que: [li , lj ] = ǫijk lk (9.422) Ası́, vemos que [lx , ly ] = xpy − ypx = lz , o sea que si lx y ly son constantes de movimiento, lz también lo es. Los corchetes de Poisson fundamentales. Son los corchetes de Poisson para las coordenadas y los momentos del sistema. Se sigue de la definición de corchete de Poisson que: [qν , qµ ] = 0 ; [pν , pµ ] = 0 ; [qν , pµ ] = δµν ; µ, ν = 1, 2, ...l (9.423) De acuerdo con la invariancia de los corchetes de Poisson bajo transformaciones canónicas se tiene que las relaciones (9.423) se cumplen independientemente de las variables canónicas usadas para describir el estado del sistema; veremos que esta propiedad proporciona un criterio para saber si una transformación en el espacio de fases es o no canónica. Algunos corchetes de Poisson de interés. En principio el corchete de Poisson de un par de variables dinámicas se obtiene a partir de los corchetes de Poisson fundamentales. Algunos corchetes de Poisson que se calculan directamente son: [qν , f ] = ∂f ; ∂pν [pν , f ] = − ∂f ; ∂qν µ, ν = 1, 2, ...l (9.424) siempre t0 es una de las constantes de movimiento y tiene una forma similar a (9.408), ver también la ecuación (3.91): t0 (q, p, t) = −t + θ(q, p) (9.425) de acuerdo con (9.411) se cumple que: [t0 , H] = − ∂t0 = 1 ⇒ [t0 , H] = 1 ∂t (9.426) La ecuación (9.423) nos dice que el corchete de Poisson de un par de variables canónicamente conjugadas es igual a +1; [qν , pν ] = 1 ; ν = 1, 2, ...l (9.426) nos dice entonces que t0 y H son un par de variables dinámicas canónicamente conjugadas. Muchos autores señalan que t y H son canónicamente conjugadas, pero esto es erróneo, pues realmente t no es una variable dinámica, como sı́ lo es t0 . Enfaticemos que f es una variable dinámica si satisface f (q, p, t) = f (q, p, t). Las transformaciones canónicas / 393 Vimos que el método de Hamilton-Jacobi permite mediante una transformación canónica describir el estado por medio de constantes de movimiento. Los corchetes fundamentales de Poisson, (9.423), permiten a priori saber si dos constantes de movimiento dadas pueden tomarse como dos “coordenadas” o dos “momentos” o una “coordenada” y su “momento” canónicamente conjugado. La ecuación (9.426) nos dice categóricamente que t0 y H pueden tomarse como un par de variables canónicamente conjugadas pero no es posible que ambos sean “coordenadas” o “momentos”. Algo análogo se concluye de las siguientes relaciones entre componentes de los momentos angular y lineal: [li , lj ] = ǫijk lk ; [pi , lj ] = ǫijk pk ; [xi , lj ] = ǫijk xk [ li , ~l2 ] = 0 ; [~ p, ~l2 ] = 2~l × ~p ; i, j, k = 1, 2, 3 (9.427) Se sigue que dos componentes de ~l no pueden tomarse como variables canónicas de estado, como tampoco una componente de p~ y ~l2 . Sin embargo, por ejemplo, [px , lx ] = 0 y [lz , lx ] = 0, permiten que px y lx sean momentos canónicos respectivamente, lo mismo que la componente de p~ paralela a ~l y ~l2 . Como ejemplo, para una partı́cula en un campo de fuerzas centrales se cumple que [ ~l2 , H] = 0 y [lz , H] = 0. Para este sistema se cumple: [~l, H] = 0 ; [lz , H] = 0 ; [~l2 , lz ] = 0 (9.428) O sea que H, ~l2 y lz pueden tomarse como tres “momentos” constantes, que junto con sus tres “coordenadas” canónicamente conjugadas, que son funciones lineales del tiempo según se vio al final del capı́tulo 2, constituyen un conjunto de seis variables canónicas que describen exhaustivamente el sistema. Por ser independientes, li y lj podrı́an servir de variables de estado pero en un formalismo no canónico (no hamiltoniano). Funciones escalares y vectoriales del estado de una partı́cula. Una función escalar por definición, es aquella que no cambia al efectuar una rotación del sistema de coordenadas (punto de vista “pasivo”). Al efectuar la rotación los vectores de estado ~r y p~ cambian en ~r y ~p, ver sección 7.7: ~r = Ã~r ; ~p = Ã~ p (9.429) donde Ã es la matriz de rotación. Entonces φ(~r, p~) es escalar si: φ(~r, p~) = φ(~r , ~p) (9.430) Una función vectorial del estado de la partı́cula es una función F que se transforma de acuerdo con (9.428), es decir, F~ tiene tres componentes que se transforman por rotaciones como las componentes de ~r: ~ (~r, ~p) F~ (~r, ~p) = ÃF~ (~r, p~) = F (9.431) Para rotaciones infinitesimales Ã está dada por: Ã = I˜ + Ci G̃i δφ (9.432) 394 / Mecánica clásica avanzada donde los G̃i están dados en la ecuación (7.221), los Ci son los cosenos directores del eje de rotación y δφ es el ángulo de rotación. De acuerdo con (9.318) y (9.432): ~r = ~r + Ci G̃i ~r δφ ; ~p = p~ + Ci G̃i p~ δφ (9.433) De acuerdo con (9.318), (9.322) y (9.433) tenemos que: ∂ ǫ G(~r, ~p) ∂~p δ~r = Ci G̃i~r δφ = δ~ p= ∂ ~ δφ = Ci G̃i p ǫ G(~r, ~p) ∂~r (9.434) donde G es el generador infinitesimal de la rotación, que de acuerdo con (9.340) es la componente de ~l a lo largo del eje de rotación: G(~r, p~) = ~n · ~r × ~p = Ci li (9.435) Vemos entonces que δφ = ǫ y que: Ci G̃i ~r = ∂ ∂ Ci li = (~n · ~r × ~p) = ~n × ~r ∂~ p ∂~p Ci G̃i p~ = ∂ ∂ − Ci li = − (~n · ~r × p~) = ~n × p~ ∂~p ∂~r (9.436) Tomando componentes en (9.432) a (9.436): = ǫkil xl = ǫkil Ci xl ⇒ G̃i Ci G̃i kl kl (9.437) El lector puede verificar fácilmente que este resultado es consistente con las ecuaciones (7.222), teniendo en cuenta que allı́ se tenı́an rotaciones “activas”. De (9.436) vemos que se puede escribir: G(~r, ~ p) = ~l · ~n = Ci p~ · G̃i~r = −Ci~r · G̃i p~ (9.438) ⇒ li = p~ · G̃i~r = −~r · G̃i ~p ; i = 1, 2, 3 consistente con la antisimetrı́a de G̃i , (9.437). Evaluemos el corchete de Poisson de dos componentes de ~l: [li , lj ] = = ∂li ∂li ∂li ∂lj · − · = (−G̃i p~) · (G̃j ~r) − (G̃i ~r) · (−G̃j p~) ∂~r ∂~ p ∂~p ∂~r G̃i~r · G̃j p ~ − G̃j ~r · G̃i ~p (9.439) p = ~rT G̃Ti G̃j ~p − ~rT G̃Tj G̃i p~ = ~rT (G̃Ti G̃j − G̃Tj G̃i )~ Como los G̃i son antisimétricos, G̃Ti = −G̃i , p [li , lj ] = ~rT (G̃j G̃i − G̃i G̃j )~ (9.440) Las transformaciones canónicas / 395 De acuerdo con la ecuación (7.224) que define el álgebra de Lie de las rotaciones: G̃j G̃i − G̃i G̃j [li , lj ] = = ǫjik G̃k ǫjik ~rT G̃k p~ (9.441) = −ǫijk ~r · G̃k p~ = ǫijk lk lo cual concuerda con el resultado obtenido en (9.422). Decimos que li y G̃i tienen la misma álgebra de Lie, definida por corchetes de Poisson de variables dinámicas y de conmutadores de matrices respectivamente. Volvamos al problema de las funciones escalares y vectoriales. Para rotaciones infinitesimales una función escalar cumple: φ(~r, p~) = φ(~r + δ~r, p~ + δ~ p) = φ(~r, ~p) + δ~r · ∂φ ∂φ + δ~ p· ∂~r ∂~p (9.442) o sea que se cumple: ∂φ ∂φ + δ~ p· =ǫ δ~r · ∂~r ∂~ p ∂G ∂φ ∂G ∂φ · − · ∂~ p ∂~r ∂~r ∂~p = −ǫ [G, φ] = 0 lo cual es consistente con (9.351). La ecuación (9.443) también implica que: ∂φ ∂φ ∂φ ∂φ ~n × ~r · =0 + ~n × p~ · = 0 ⇒ ~n · ~r × + p~ × ∂~r ∂~ p ∂~r ∂~p (9.443) (9.444) Como ~n es arbitrario, a fin de que φ sea escalar debe cumplirse: ~r × ∂φ ∂φ + p~ × =0 ∂~r ∂~ p (9.445) se cumple si ∂φ/∂~r = a~r + b~ p y ∂φ/∂~p = c~r + d~ p puesto que: ~r × ∂φ ∂φ + p~ × = b~r × p~ + c~ p × ~r = 0 si b = c ∂~r ∂~ p (9.446) es decir, φ es de la forma: φ= 1 2 1 2 a~r + c~r · p~ + d ~ p = A~r2 + B~ p2 + c~r · ~p 2 2 (9.447) donde A, B y C no dependen de ~r ni de ~p. Ası́ pues: [~r2 , li ] = 0 ; [~ p2 , li ] = 0 ; [~r · p~, li ] = 0 implican : [φ, li ] = 0 (9.448) Una función vectorial F~ (~r, p~) puede escribirse en la forma: F~ = f1 ~r + f2 ~ p + f3 ~l donde f1 , f2 y f3 son funciones escalares, o sea de la forma (9.447). (9.449) 396 / Mecánica clásica avanzada Usando las fórmulas (9.427) vemos que: [Fi , lj ] = ǫijk Fk → [F~ , li ] = ~ei × F~ (9.450) De (9.428) se sigue que F~ se transforma bajo rotación como (9.431). Los vectores de la forma (9.449) dependen del estado del sistema, en tanto que los vectores unitarios de base ~ei son independientes de él como también los vectores ~n, que definen las rotaciones. Si ~n mismo estuviera determinado por los vectores ~r y p~, entonces una rotación cambiarı́a no sólo los componentes de la función F~ sino la naturaleza misma de la función (algo análogo a lo que sucede con el hamiltoniano cuando las transformaciones canónicas dependen del tiempo). En una rotación el cambio en F~ es: ∂ F~ = δφ [F~ , ~l.~n] (9.451) donde los vectores unitarios no son rotados por ~l · ~n. Éste no serı́a el caso si F~ fuera un vector externo como un campo magnético, que no depende del estado de la partı́cula. La expresión (9.451) vale pues sólo para funciones vectoriales de la forma (9.449). La ecuación (9.450) también puede escribirse usando la notación diádica en términos del ~1 = ~e1~e1 + ~e2~e2 + ~e3~e3 : diádico unidad ~ ~ [F~ , ~l] = −~1 × F~ (9.452) ~ Es fácil mostrar que: Sean dos vectores de estado del sistema, F~ , G. ~ ~l · ~n] = 0 [F~ · G, (9.453) ~ es una función escalar, que no cambia por rotaciones. En efecto, F~ · G Por contraste, F~ · ~n′ donde ~n′ es un vector independiente del estado, no es una función escalar y satisface que: [F~ · ~n′ , ~l · ~n] = (~n′ × ~n) · F~ (9.454) que en general no es cero. Ejemplo 9.8.5 Mostrar que (9.450) no se cumple cuando F~ no depende exclusivamente ~ = (~r × B)/2 ~ del estado de la partı́cula, por ejemplo cuando es el potencial vectorial A ~ es un vector fijo y constante en el espacio; digamos B ~ = B~l3 , o sea un campo donde B magnético homogéneo en la dirección z. [Ai , li ] = 1 1 B[(~r × ~e3 )i , lj ] = Bǫik3 [xk , li ] 2 2 (9.455) usando (9.427) obtenemos: [Ai , lj ] = = 1 1 Bǫik3 ǫkjl xl = − B(δij δ3l − δil δ3j ) xl 2 2 1 − B(δij x3 − δ3j xi ) 2 (9.456) Las transformaciones canónicas / 397 Por otra parte, el lado derecho en (9.450) es: 1 ǫijk Ak = Bǫijk ǫkl3 xl 2 (9.457) 1 1 = B(δil δj3 − δi3 δjl ) xl = B(δj3 xi − δi3 xj ) 2 2 Comparando (9.456) con (9.457) vemos que no son iguales. En conclusión, no hay una fórmula general para evaluar el corchete de Poisson de un vector que depende del estado solamente y un vector espacial. Correspondencia del formalismo de Poisson con el cuadro de Heisenberg de la mecánica cuántica.12 Hay una correspondencia entre el conjunto de las variables dinámicas en la descripción clásica y el conjunto de los operadores hermı́ticos en la descripción cuántica de un sistema de l grados de libertad. En esos dos conjuntos se puede definir un álgebra de Lie, de la siguiente manera: (i) En esos conjuntos se puede definir una ley de composición interna mediante la cual se hace corresponder a cada par de elementos del conjunto un tercer elemento del mismo conjunto: C = [a, b]. Tal ley de composición satisface: (ii) La propiedad reflexiva: [a, a] = 0, para todo elemento del conjunto, siendo 0 elemento del mismo. (iii) La propiedad antisimétrica: [a, b] = −[b, a]. (iv) La propiedad de linealidad: [αa + βb, c] = α[a, c] + β[b, c] siendo α y β números cualesquiera. (v) La identidad de Jacobi: para cualesquiera tres elementos a, b, c, del conjunto se cumple [a, [b, c]] + [b, [c, a]] + [c, [a, b]] = 0. Esta álgebra es en general no conmutativativa, además de ser no asociativa: [a, [b, c]] 6= [[a, b], c]. En el conjunto de las variables dinámicas clásicas el álgebra de Lie está dada por los corchetes de Poisson, que satisfacen todas las propiedades (i) a (v). En el conjunto de los operadores hemı́ticos cuánticos se satisfacen las propiedades (i) a (v) definiendo la ley de composición interna por medio de conmutadores: [â, b̂] = âb̂ − b̂â. La correspondencia entre el formalismo de Poisson y el de Heisenberg se establece de la siguiente manera: a cada variable canónica de estado pν o qν , ν = 1, 2, 3, ...l, le corresponde un operador hermı́tico, p̂ν o q̂ν , ν = 1, 2, ...l. En consecuencia a cada variable dinámica f (q, p, t) le corresponde un operador hermı́tico construido a partir de los operadores p̂ν o q̂ν : fˆ(q̂, p̂, t). A cada corchete de Poisson fundamental le corresponde un conmutador fundamental. La correspondencia entre el corchete de Poisson y conmutadores es: 1 1 (9.458) [f, g] → [fˆ, ĝ] = (fˆĝ − ĝfˆ) ih̄ ih̄ En particular a los corchetes fundamentales de Poisson, (9.423), les corresponde: q̂µ q̂ν − q̂ν q̂µ = 0 ; p̂µ p̂ν − p̂ν p̂µ = 0 q̂µ p̂ν − p̂ν q̂µ = ih̄δµν ; µ, ν = 1, 2, ...l 12 Véase el capı́tulo 12. (9.459) 398 / Mecánica clásica avanzada A la relación (9.426) le corresponde: t̂0 Ĥ − Ĥ t̂0 = ih̄ (9.460) similarmente, li = ih̄ǫijk l̂k lj − ˆ lj ˆ l̂i ˆ Las ecuaciones de movimiento de Heisenberg son: ˆq̇ ν = 1 q̂ν Ĥ − Ĥ q̂ν ; ˆṗν = 1 p̂ν Ĥ − Ĥ p̂ν ; ν = 1, 2, ...l ih̄ ih̄ (9.461) (9.462) Si G̃i (q, p, t) son los generadores infinitesimales de un grupo de simetrı́as, que satisface las relaciones de álgebra de Lie clásicas, i h (9.463) G̃i , G̃j = Cijk G̃k donde G̃i (q, p, t) son llamadas las constantes estructurales, las correspondientes relaciones de álgebra de Lie cuánticas son: Ĝi Ĝj − Ĝj Ĝi = iCijk h̄Ĝk (9.464) en particular para el grupo de rotaciones tridimensional, Cijk = ǫijk , que caracterizan al grupo SO(3). Toda la mecánica cuántica puede hacerse corresponder con la mecánica clásica a partir de las relaciones que hemos mencionado; con la mecánica cuántica en el formalismo de Heisenberg y con la mecánica clásica en el formalismo de Poisson. La analogı́a llega hasta el punto de formularse un principio de Hamilton cuántico (principio de acción de Schwinger) y construirse una integral de Poincaré-Cartán. Ejemplo 9.8.6 Sea una variable dinámica B independiente del tiempo, la cual satisface la última igualdad de la ecuación (9.352). Mostrar que la solución de dicha ecuación coincide formalmente con la fórmula de Hausdorff-Baker-Campbell (H.B.C.) de la mecánica cuántica. En mecánica cuántica se obtiene un operador en el tiempo t a partir del operador en el tiempo cero por la relación: B̂(t) = eiĤt/h̄ B̂(0)e−iĤt/h̄ (9.465) donde Ĥ es el operador hamiltoniano. Se puede mostrar que esta ecuación equivale a la fórmula de H.B.C: 2 1 it it [Ĥ, [Ĥ, B̂o ]] B̂(t) = B̂0 + [Ĥ, B̂0 ] + h̄ 2! h̄ n (9.466) 1 it +... [Ĥ, [Ĥ, ...[Ĥ, B̂0 ]...]] + ... {z } | n! h̄ n corchetes Las transformaciones canónicas / 399 (véase el texto de Messiah, Mécanique quantique, tomo 1, capı́tulo 8). Clásicamente la ecuación de movimiento para la variable dinámica B es (9.352): Ḃ = [B, H] (9.467) Formalmente B puede expandirse en serie de Tayor alrededor de t = 0: B = B0 + tḂ + 0 t2 B̈ 2! + ... 0 tn (n) B n! + ... (9.468) 0 Notando que: B̈ = [Ḃ, H] = [[B, H], H], ... (9.469) obtenemos: B = B0 − t[H, B]|0 + t2 [H, [H, B]] 2! 0 (9.470) 1 + ... (−t)n [H, [H ...[H, B] ...]] + ... {z } | n! n corchetes 0 Es clara la correspondencia entre (9.466) y (9.470) con sólo reemplazar el corchete de Poisson por i/h̄ veces el conmutador. La expresión (9.466) puede también obtenerse a partir de las fórmulas cuánticas que corresponden a (9.467) y (9.468): ˆ = i [Ĥ, B̂] (9.471) Ḃ h̄ Como ilustración, sea una partı́cula en un campo homogéneo gravitacional −mg. El hamiltoniano cuántico será: p̂2 − mg x̂ (9.472) Ĥ = 2m Sea B̂ = Ĥ y B̂0 = x̂0 . Hallemos a x̂ usando la fórmula (9.466). Es necesario evaluar los siguientes conmutadores: 1 2 −1 [Ĥ, x̂0 ] = p̂0 , x̂0 = x̂0 , p̂20 2m 2m (9.473) −1 ih̄ = ([x̂0 , p̂0 ] p̂0 + p̂0 [x̂0 , p̂0 ]) = − p̂0 2m m ih̄ [Ĥ, [Ĥ, x0 ]] = −mg x̂0 , − p̂0 = −gh̄2 (9.474) m Como el conmutador (9.474) es constante, todos los conmutadores de orden superior se anulan. Reemplazando (9.473) y (9.474) en (9.466): 1 p̂0 t + gt2 (9.475) m 2 La ecuación (9.475) es formalmente igual a la expresión clásica que se obtendrı́a a partir de (9.470). x̂ = x̂0 + 400 / Mecánica clásica avanzada 9.9. Pruebas del carácter canónico de una transformación La prueba más directa consiste en usar la transformación junto con las ecuaciones de Hamilton en las variables originales para obtener las ecuaciones de movimiento en las nuevas variables; la transformación será canónica si las nuevas ecuaciones de movimiento lo son para un hamiltoniano cualquiera; esto se usó en los ejemplos de las ecuaciones (3.92) y (3.93). Otra prueba consiste en mostrar que existe una función generatriz U para la transformación, tal que las fórmulas de la transformación se puedan llevar a la forma (9.260). A continuación veremos otros métodos de prueba como son los corchetes de Lagrange y Poisson y la llamada condición simplicial. Veamos que en la prueba del carácter canónico de una transformación es suficiente demostrar que la transformación para un tiempo dado es canónica. Sea la transformación: q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l (9.476) Si la transformación es canónica se debe cumplir: l X ν=1 pν ∆q ν − H ∆t = C l X ν=1 pν ∆qν − H ∆t ! − ∆F (q, p, t) (9.477) Si en (9.477) tomamos un tiempo fijo y arbitrario t = t′ obtenemos: l X ν=1 pν δq ν = C l X ν=1 pν δqν − δF (q, p, t) (9.478) Ahora (9.478) es la identidad que define una transformación canónica que no depende del tiempo, q ν = q ν (q, p, t′ ) ; pν = pν (q, p, t′ ) ; ν = 1, 2, ...l (9.479) Entonces, las ecuaciones (9.479) definen una transformación canónica con valencia C y función generatriz F (q, p, t′ ) que no depende del valor escogido para t = t′ . Veamos ahora cómo la identidad que define el carácter canónico de la transformación dependiente del tiempo, ecuación (9.477), puede obtenerse de la identidad correspondiente para la transformación independiente del tiempo, ecuación (9.478). La ecuación (9.4) relaciona las variaciones δ con las variaciones ∆: ∆q ν = δq ν + q̇ ν ∆t ; ν = 1, 2, ...l (9.480) Con expresiones análogas para ∆pν , ∆qν , ∆pν . Entonces la relación entre ∆F y δF será: # " l X ∂F ∂F ∂F ∆t (9.481) q̇ν + ṗν + ∆F = δF + ∂qν ∂pν ∂t ν=1 Las transformaciones canónicas / 401 Usando las fórmulas (9.480) y (9.481), la ecuación (9.478) se transforma en: l X ν=1 p ∆q ν − q̇ ν ∆t = C l X ν=1 + " pν (∆qν − q̇ν ∆t) − ∆F l X ∂F ν=1 ∂F q̇ν + ṗν ∂qν ∂pν ∂F + ∂t # ∆t (9.482) La ecuación (9.482) coincidirá con (9.477) si se define la función H por la ecuación: l X ∂F ∂F ∂F H = CH + pν q̇ ν − Cpν q̇ν + q̇ν + ṗν + (9.483) ∂qν ∂pν ∂t ν=1 El paréntésis en (9.483) se puede escribir también en la forma siguiente si asumimos que la transformación es libre de primera clase, de modo que F es función de (q, q, t): l X ∂F1 ∂F1 pν q̇ ν − Cpν q̇ν + (9.484) q̇ν + ṗν ∂qν ∂pν ν=1 Esta expresión es cero, de acuerdo con las fórmulas de la transformación (9.158). Se sigue entonces que: ∂F1 (9.485) ∂t Se llega al resultado correspondiente a (9.485) si la transformación tiene una estrutura arbitraria, es decir, regida por las fórmulas (9.260). Concluimos que a fin de que la transformación (9.476) sea canónica es necesario y suficiente que todas las transformaciones independientes del tiempo obtenidas de la transformación (9.476) por reemplazar a t por un valor árbitrario t′ , sean canónicas, es decir, que satisfagan la ecuación (9.478), con una y la misma valencia C y una y la misma función generatriz F . Por esta razón, al formular las pruebas para el carácter canónico de una transformación, basta restringirse a la consideración de las transformaciones que no contienen la variable temporal t explı́citamente: ! ~q, ~p q ν = q ν (q, p) ; pν = pν (q, p) ; ν = 1, 2, ...l ; J 6= 0 (9.486) ~q, p~ H = CH + Los corchetes de Lagrange. Para la transformación canónica (9.486), la identidad (9.477) toma la forma: l X ν=1 pν ∆ q ν = C l X ν=1 pν ∆qν − ∆K(q, p) (9.487) Si en (9.487) expresamos a ∆q ν en función de ∆qν y ∆pν usando las fórmulas (9.486) obtenemos: # " ! ! l l l X X X ∂q ν ∂qν (9.488) Cpν − ∆qν − ∆pν ∆K = pν pµ ∂qν ∂pν ν=1 µ=1 ν=1 402 / Mecánica clásica avanzada ∆K será un diferencial exacto si se cumplen las condiciones: ! ! l l X X ∂q µ ∂q µ ∂ ∂ Cpλ − = Cpν − pµ pµ ∂qν ∂qλ ∂qλ ∂qν µ=1 µ=1 ∂ ∂pν ∂ ∂pν l X ∂q µ − pµ ∂pλ µ=1 l X ∂q µ Cpλ − pµ ∂qλ µ=1 ! ! = ∂ ∂pλ = ∂ ∂qλ l X ∂qµ − pµ ∂pν µ=1 l X ∂q µ − pµ ∂pν µ=1 ! (9.489) ! Si efectuamos las operaciones, las ecuaciones (9.489) se transforman en: l X ∂pµ ∂q µ ∂pµ ∂q µ = 0 − ∂qν ∂qλ ∂qλ ∂qν µ=1 l X ∂pµ ∂q µ ∂pµ ∂qµ = 0 − ∂pν ∂pλ ∂pλ ∂pν µ=1 (9.490) l X ∂pµ ∂q µ ∂pµ ∂q µ = Cδνλ − − ∂pν ∂qλ ∂qλ ∂pν µ=1 Se define el corchete de Lagrange de dos variables dinámicas f y g como: l X ∂qν ∂pν ∂qν ∂pν {f (q, p, t), g(q, p, t)} ≡ − ∂f ∂g ∂g ∂f ν=1 (9.491) Con esta notación, las fórmulas (9.490) toman la forma: {qν (q, p, t), qλ (q, p, t)} = 0 ; {qν (q, p, t), pλ (q, p, t)} = {pν (q, p, t), pλ (q, p, t)} = 0 Cδνλ ; (9.492) ν, λ = 1, 2, ...l En las fórmulas (9.492) hemos colocado la variable t, teniendo en cuenta el resultado anterior, según el cual el carácter de la transformación dependiente del tiempo es el mismo que el de la transformación realizada en un tiempo fijo t = t′ . Las ecuaciones (9.492) expresan las condiciones suficientes y necesarias para que la transformación (9.476) sea canónica. Esta es una de las mencionadas pruebas del carácter canónico de una transformación. Las fórmulas (9.492) se llaman los corchetes de Lagrange fundamentales: con las ecuaciones (9.492) se pueden formar las siguientes igualdades entre matrices l × l: {~ q, ~ q )} = 0̃l ; {~ p, p~)} = 0̃l ; {~q, ~p)} = C I˜l (9.493) Las transformaciones canónicas / 403 donde el elemento ν, λ, de la matriz {~q, ~q}, es {qν , qλ }, ..., y 0̃l y I˜ son las matrices cero e identidad de orden l × l respectivamente. A su vez las fórmulas (9.493) se pueden condensar en la siguiente expresión con matrices 2l × 2l:   {~ q, ~ q )} {~ q, p~)} −{~ q, ~ p)} {~ p, p~)}   = 0̃l −I˜l I˜l 0̃l   ≡ Ẽ (9.494) Ẽ es una matriz 2l × 2l antisimétrica, ortogonal, de cuadrado igual al negativo de la matriz identidad, y de determinante +1: Ẽ T = −Ẽ Ẽ T = Ẽ −1 Ẽ 2 = −I˜ det Ẽ = +1 (9.495) Vectores y matrices simpliciales. Se trata de una notación vectorial en el espacio de fases con vectores de 2l elementos y matrices de dimensión 2l × 2l. Con esta notación se “entremezclan” las coordenadas y momentos generalizados, y de ahı́ el nombre de “simplicial” que recibe esta notación. El término matriz simplicial se reserva para una cierta clase de matrices 2l × 2l, las matrices M̃ que satisfacen la relación: M̃ T Ẽ M̃ = Ẽ (9.496) el conjunto de todas las matrices simpliciales de dimensión 2l × 2l forma un grupo, llamado el grupo simplicial. En efecto: (i) El producto de dos matrices simpliciales es una matriz simplicial. (ii) Las matrices simpliciales son no singulares, o sea que para toda matriz simplicial existe la matriz inversa. La matriz inversa de una matriz simplicial es simplicial. (iii) La matriz identidad 2l × 2l es simplicial. (iv) El producto de matrices simpliciales es asociativo. Los vectores de 2l elementos en el espacio de fases se pueden escribir en la forma [~u, ~v ], donde ~u y ~v son vectores columna de l elementos. Una forma bilineal de dimensión 2l es: f= l X (−uν vν′ + vν u′ν ) = ~v · ~u ′ − ~u · ~v ′ (9.497) ν=1 que puede escribirse en la forma:  ′  ~u  f = (~u, ~v ) Ẽ  ′ ~v (9.498) 404 / Mecánica clásica avanzada Si ahora se someten los vectores [~u, ~v ] y [~u ′ , ~v ′ ] a una transformación mediante una matriz simplicial M̃ :     ′    ′  ~u ~u ~u ~u   = M̃   = M̃   ;  (9.499) ′ ′ ~v ~v ~v ~v Entonces se cumple que:  ′   ′  ~u ~u  = (~u, ~v ) M̃ T Ẽ M̃   f = ~u, ~v Ẽ  ′ ~v ′ ~v  ′  ~u =f = (~u, ~v ) Ẽ  ′ ~v (9.500) Es decir, la forma bilineal f es invariante bajo transformaciones de los vectores [~u, ~v ] realizados por matrices simpliciales; en otras palabras, f es invariante bajo las transformaciones del grupo simplicial. La matriz jacobiana de una transformación biana de una transformación canónica:  ∂q 1 ∂q1 ∂q 1 ∂q1 ∂q1 ∂q 1 ... ...  ∂q1 ∂q2 ∂ql ∂p1 ∂p2 ∂pl    ∂q ∂q 2 ∂q 2 ∂q2 ∂q 2 ∂q2  2 ... ...  ∂q ∂q ∂q ∂p ∂p ∂pl  1 2 l 1 2    ... ... ... ... ... ... ... ...     ∂ql ∂q l ∂ql ∂q l ∂q l ∂ql  ... ...  ∂q ∂q2 ∂ql ∂p1 ∂p2 ∂pl 1  J˜ =    ∂p1 ∂p1 ∂p1 ∂p1 ∂p1 ∂p1   ∂q1 ∂q2 . . . ∂ql ∂p1 ∂p2 . . . ∂pl    ∂p2 ∂p2 ∂p2 ∂p2  ∂p2 ∂p2  ... ...  ∂q1 ∂q2 ∂q ∂p ∂p ∂pl l 1 2    ... ... ... ... ... ... ...  ...    ∂p ∂pl ∂pl ∂pl ∂pl ∂pl l ... ... ∂q1 ∂q2 ∂ql ∂p1 ∂p2 ∂pl canónica. Sea la matriz jaco                     =                    ∂~q ∂~q ∂~p ∂~q  ∂~q ∂~p     ~ ∂p  ∂~p (9.501) donde ∂~p/∂~q, etc., son matrices jacobianas de orden l. Mostremos que J˜ satisface la relación: J˜T Ẽ J˜ = C Ẽ (9.502) Las transformaciones canónicas / 405 donde C es la valencia de  T ∂~q   ∂~q  J˜T Ẽ J˜ =    ∂~q T ∂~ p la transformación canónica. En   T ∂~p ∂~q   ˜  0̃l −Il ∂~q   ∂~q     T   ∂~p I˜l 0̃l ∂~p  ∂~q ∂~ p efecto:  ∂~q ∂~p     ~ ∂p  ∂~p (9.503) efectuando el producto de matrices indicado en (9.503), teniendo en cuenta que cuando las matrices constan de bloques se siguen las mismas reglas de la multiplicación ordinaria de matrices, obtenemos:   T T T T ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p ∂~p ∂~q   − −  ∂~q ∂~q ∂~q ∂~q ∂~q ∂~p ∂~q ∂~p    T (9.504) J˜ Ẽ J˜ =     T T T T  ∂~p ∂~q ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p  − − ∂~ p ∂~q ∂~ p ∂~q ∂~p ∂~p ∂~p ∂~p ∂~p/∂~qT indica la matriz traspuesta de ∂~p/∂~q. Notemos que los corchetes de Langrange fundamentales, (9.490) y (9.492), se pueden escribir en forma de matrices. En efecto, las ecuaciones (9.490) son los siguientes elementos de matriz:  ! ! ! !  l X ~p T ~q ~q T ~p ∂ ∂ ∂ ∂   =0 − ∂~ q ∂~ q ∂~ q ∂~ q µ=1 νµ  !  ! ~T  ∂p ∂~ p µ=1 l X ~T  ∂q ∂~ p µ=1 l X νµ νµ µλ ∂~q ∂~ p ! ∂~p ∂~q ! µλ µλ νµ − T ∂~q ∂~p ! − T ∂~q ∂~p ! νµ νµ µλ ∂~p ∂~p ! ∂~q ∂~q ! µλ µλ Comparando a (9.504) con (9.505) obtenemos que:   0̃l −C I˜l  = C Ẽ J˜T Ẽ J˜ =  C I˜l 0̃   =0 (9.505)   = Cδνλ (9.506) Con lo cual queda demostrada la relación (9.502). Si la transformación canónica es univalente, C = 1, entonces J˜ es una matriz simplicial. En general, para C 6= 1, se dice que J˜ es una matriz simplicial generalizada, con valencia C. El conjunto de todas las matrices simpliciales generalizadas (todas con la misma C) forma un grupo. Si M̃ es una matriz simplicial generalizada, se cumple que det M̃ = ±C l . En efecto, tomando el determinante de (9.506) y teniendo en cuenta que el determinante de un producto de matrices es igual al producto de los determinantes y que det Ẽ = +1, det J˜T detẼ detJ˜ = C 2l det Ẽ (9.507) 406 / Mecánica clásica avanzada Como det J˜T = det J˜ se sigue que: ˜ 2 = C 2l ⇒ detJ˜ = ±C l (det J) (9.508) O sea que para una matriz simplicial se cumple que det M̃ = ±1, o sea que las matrices simpliciales son no singulares. Sabemos que las igualdades (9.492), o sea (9.505), son las condiciones suficientes y necesarias para que la transformación sea canónica. Por tanto la igualdad (9.506) se cumple solamente si la transformación es canónica. Llegamos pues, a otra prueba del carácter canónico de una transformación: Para que la transformación q ν = q ν (q, p, t), pν = pν (q, p, t), ν = 1, 2, ...l sea canónica, es necesario y suficiente que la matriz jacobiana J˜ correspondiente a esta transformación sea una matriz simplicial generalizada con valencia constante C. Si la transformación es univalente, entonces J˜ es una matriz simplicial ordinaria. Entonces, ˜ ecuación (9.502), debe cumplirse idénticala condición de la naturaleza simplicial de J, mente para todos las variables (q, p, t). El teorema de Liouville. En la sección 9.6, ecuación (9.269), se halló que el movimiento de un sistema hamiltoniano puede considerarse como una transformación canónica libre de primera clase univalente. En consecuencia, su matriz jacobiana es simplicial y su determinante vale ±1. Se sigue entonces que el volumen de una región arbitraria del espacio de fases es constante en el tiempo. Tal volumen es: Z Z Z Γ= ... dq 1 dq 2 ...dq l dp1 dp2 ...dpl (9.509) que puede expresarse también en la forma: ! Z Z Z ~q, ~p dq1 dq2 ...dql dp1 dp2 ...dpl J Γ= ... ~q, p~ (9.510) ˜ Si la transformación es canónica, donde J es el determinante de la matriz jacobiana J. l ˜ J = det J = ±C , o se a que: Γ = Γ|C|l (9.511) En particular, Γ es invariante bajo la transformación canónica de evolución temporal, o sea que: dΓ =0 dt (9.512) La ecuación (9.512) puede considerarse como una prueba del teorema de Liouville, véase ecuación (3.137). Γ es una de las integrales invariantes de Poincaré, ecuación (9.81). Invariancia de los corchetes de Poisson bajo transformaciones canónicas. Hemos ya mostrado esta invariancia bajo transformaciones canónicas infinitesimales, ecuación (9.394) y siguientes. Veremos ahora que esta invariancia vale para cualquier tipo de tranformación canónica univalente; no solamente para aquellas que pueden obtenerse a partir de la transformación continua de parámetros. Las transformaciones canónicas / 407 Empecemos por mostrar que la condición de canonicidad (9.502) puede expresarse en la forma: J˜Ẽ J˜T = C Ẽ (9.513) ˜T −1 ˜−1 en efecto, multiplicando por (J ) a (9.502) por la izquierda y por J por la derecha, obtenemos: 1 (J˜T )−1 Ẽ J˜−1 = Ẽ (9.514) C En (9.514) ahora tomamos las matrices inversas de ambos lados y usamos las propiedades de las ecuaciones (9.495): −1 i−1 h 1 Ẽ = J˜Ẽ −1 J˜T = −J˜Ẽ J˜T ; (J˜T )−1 Ẽ J˜−1 = −C Ẽ (9.515) C O sea que la siguiente es otra expresión de la condición de canonicidad: J˜Ẽ J˜T = C Ẽ (9.516) La ecuación (9.516) puede obtenerse a partir de (9.502) intercambiando los papeles de J˜ y J˜T . Comparando con (9.503) vemos que J˜Ẽ J˜T se puede obtener de (9.504) intercambiando a ∂~q/∂~q y ∂~p/∂~ p por sus respectivas traspuestas y a ∂~p/∂~q por (∂~q/∂~p)T . Es decir:   T T T T ∂~q ∂~q ∂~q ∂~q ∂~q ∂~p ∂~q ∂~p   − −  ∂~ ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p   p ∂~q  T ˜ ˜ J Ẽ J =  (9.517)   T T T T   ∂~p ∂~q  ~ ~ ~ ~ ~ ~ ∂p ∂q ∂p ∂p ∂p ∂p − − , ∂~ p ∂~q ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p Los corchetes de Poisson fundamentales pueden escribirse en forma de matriz. En efecto:  ! !  ! ! l X ~q ~q ~p T ~p T ∂ ∂ ∂ ∂   [q ν , pλ ] = − ∂~q ∂~p ∂~p ∂~q µ=1 µλ µλ νµ νµ (9.518) ! T T ∂~q ∂~p ∂~q ∂~p = − ∂~q ∂~ p ∂~p ∂~q νλ y similarmente: [q ν , q λ ] = T T ∂~q ∂~q ∂~q ∂~q − ∂~q ∂~ p ∂~ p ∂~q ! µλ ; [pν , pλ ] = T T ∂~p ∂~p ∂~p ∂~p − ∂~q ∂~p ∂~p ∂~q Se sigue entonces que (9.516) se puede escribir como:     ~ ~ − q, q − ~q, ~p 0̃l −I˜l C  = C Ẽ =   J˜Ẽ J˜T =  T ˜ ~ ~ ~q , ~p Il C 0̃l − p, p ! (9.519) µλ (9.520) 408 / Mecánica clásica avanzada O sea que las condiciones de canonicidad de la transformación también se pueden expresar por medio de los corchetes de Poisson, según (9.520): [~q , ~q ] = 0̃l ; [~p, ~p] = 0̃l ; [~q, ~p] = C I˜l , o en términos de los elementos de matriz. [q ν , q λ ] = 0 ; [pν , pλ ] = 0 ; [q ν , pλ ] = Cδνλ ; ν, λ = 1, 2, ...l (9.521) Las ecuaciones (9.521) coinciden con (9.423) cuando la transformación canónica es univalente. Sean ahora dos variables dinámicas f (q, p, t) y g(q, p, t). Al expresar a las qν , pν ; ν = 1, 2, ...l, en términos de las variables (q, p, t) por medio de la transformación canónica, obtenemos las variables dinámicas f (q, p, t) y g(q, p, t). O sea que los corchetes de Poisson de f con g pueden evaluarse bien respecto a las variables (q, p) o respecto a las variables (q, p). Mostremos qué vale la identidad: [f, g](q,p) = C[f, g](q,p) (9.522) notemos que: [f, g](q,p) = = [f, g](q,p) = = l X ∂f ∂g ∂f ∂g − ∂qν ∂pν ∂pν ∂qν ν=1 ∂f ∂g ∂f ∂g − ∂~q ∂~p ∂~p ∂~q (9.523) l X ∂f ∂g ∂f ∂g − ∂q ν ∂pν ∂pν ∂q ν ν=1 ∂f ∂g ∂f ∂g − ∂~q ∂~p ∂~p ∂~q Las ecuaciones (9.523) se pueden expresar de la siguiente manera con la notación de (9.498): [f, g](q,p) = ∂g ∂g , ∂~q ∂~p  ∂f  ∂~q    Ẽ    ∂f  ∂~p  (9.524) y similarmente [f, g](q,p) . Veamos cómo se transforman las derivadas respecto a qν y respecto a pν en función de las derivadas respecto a q ν y respecto a pν : l X ∂f ∂qµ ∂f ∂pµ ∂f = = + ∂qν ∂q ν ∂qν ∂pµ ∂qν µ=1 T T ∂~q ∂f ∂~p ∂f − ∂~q ∂~q ∂~q ∂~p ! (9.525) ν Las transformaciones canónicas / 409 y similarmente para ∂f /∂pν . Vemos entonces que:   T T   ∂~p ∂f ∂~q ∂f ∂f +   ∂~q ∂~p   ∂~q   ∂~q ∂~q      =  =    ∂f  T T  ∂~q ∂f ~ ∂ p ∂f  + ∂~ p ∂~ p ∂~q ∂~p ∂~p    T T ∂f ∂~p ∂~q    ∂~q ∂~q  ∂~q           T T   ∂f   ∂~q ∂~p  ∂~p ∂~ p ∂~p (9.526) Comparando a (9.526) con (9.501) vemos que: [∂f /∂~q, ∂f /∂~p] = J˜T ∂f /∂~q, ∂f /∂~p Es decir:   ∂f  ∂~q   ∂g ∂g ˜ ˜T   (9.527) J Ẽ J  [f, g](q,p) = ,   ~ ∂~ q ∂p  ∂f  ∂~p De acuerdo con (9.516) obtenemos entonces:   ∂f  ∂~q    ∂g ∂g  = C [f, g] C Ẽ  [f, g](q,p) = , (q,p)   ∂~ q ∂~p  ∂f  ∂~p (9.528) Hemos mostrado que si la transformación (q, p) → (q, p) es canónica entonces se cumple la igualdad (9.522). El inverso también vale: si para cualquier par de variables dinámicas f y g vale la identidad (9.522) para una y la misma constante C 6= 0, entonces la transformación de las 2l variables qν y pν a las 2l variables q ν y pν es canónica con valencia C. Este es pues otro test del carácter canónico de una transformación. Para una transformación canónica univalente, C = 1, se cumple: [f, g](q,p) = [f, g](q,p) (9.529) En otras palabras, los corchetes de Poisson son invariantes bajo transformaciones canónicas univalentes, lo cual es el mismo resultado (9.402). En resumen, para estas transformaciones es innecesario especificar respecto a cuales variables se evalúan los corchetes de Poisson. Otras propiedades de los corchetes de Lagrange. Sea el siguiente conjunto de 2l variables dinámicas: u1 , u2 , ...ul , v1 , v2 , ...vl . Usando notación vectorial, dicho 410 / Mecánica clásica avanzada conjunto se puede escribir como (~u, ~v ). Podemos formar con estas variables los siguientes corchetes de Lagrange y Poisson: [~u, ~u]; [~u, ~v ]; [~v , ~v ]; {~u, ~u}; {~u, ~v }; {~v , ~v } A su vez con estos corchetes podemos formar las siguientes matrices de orden 2l:     [~u, ~u] [~u, ~v ] {~u, ~u} {~u, ~v }  ; L̃ =   P̃ =  (9.530) [~v , ~u] [~v , ~v ] {~v , ~u} {~v , ~v } Mostremos que se cumple lo siguiente: L̃P̃ = I, donde I˜ es la identidad de orden 2l. Los corchetes de Langrange se pueden expresar en forma similar a (9.524):  ∂~q  ∂f  ∂~q ∂~p   {f, g} = Ẽ  ,   ∂~p  ∂g ∂g ∂f  (9.531) Un elemento tı́pico de la matriz L̃P̃ es de la forma siguiente: 2l X i=1 {xn , xi } [xi , xm ] = 2l X i=1 ∂~z T ∂~z Ẽ ∂xi ∂xn ! ∂xm T ∂xi Ẽ ∂~z ∂~z ! (9.532) donde xi es una componente del vector [~u, ~v ] y zi representa una componente del vector [~ q , p~].13 Notando que: 2l X ∂zr ∂xi ∂zr = = δrs ; ∂x ∂z ∂zs i s i=1 Ẽ 2 = −I˜ (9.533) y que: Eµr Ert ∂zt ∂xm = −δnm ∂xn ∂zµ (9.534) obtenemos entonces que: 2l X i=1 {xn , xi } [xi , xm ] = −δnm ⇒ L̃P̃ = −I˜ (9.535) O sea que el corchete de Lagrange es, excepto por el signo, el recı́proco del corchete de Poisson. La invariancia del uno implica la invariancia del otro. Vimos que los corchetes de Poisson son invariantes bajo transformaciones canónicas univalentes, por tanto se 13 Véase las fómulas (9.385). Las transformaciones canónicas / 411 sigue la invariancia de los corchetes de Lagrange bajo estas fransformaciones.14 Otras propiedades de los corchetes de Lagrange son las siguientes:     q ~q   ~   ,   = Ẽ   p~ p ~ {~ q, f } = ∂~p ∂~q ; {~ p, f } = − ∂f ∂f (9.536) {g, f } = −{f, g} {cf, g} = {f, cg} = 1 {f, g} c No se cumplen las propiedades de linealidad ni la identidad de Jacobi, o sea que los corchetes de Lagrange no permiten definir un álgebra. Ejemplo 9.9.1 Analizar la siguiente transformación compleja, y si es canónica, hallar la función generatriz y la valencia. 1 1 q = √ (q + ip) ; p = √ (q − ip) 2 2 La transformación puede escribirse en la forma: √ √ p = i(q − 2q) ; p = 2q − q (9.537) (9.538) La transformación será canónica libre de primera clase con valencia C, si, de acuerdo con (9.158), puede generarse por una función tal que: Cp = ∂F ∂F ; p=− ∂q ∂q (9.539) Es simple mostrar que la transformación (9.537) será canónica si F y C están dadas por: F = 1 2 1 2 √ q + q − 2qq ; C = −i 2 2 (9.540) De acuerdo con (9.159), el nuevo hamiltoniano será: H = iH (9.541) Es simple mostrar de (9.492) que {q, p} = −i. Ejemplo 9.9.2 En la transformación canónica del ejemplo 9.9.1 hallar el corchete de Poisson de q, y de p. Resolver el problema del oscilador armónico lineal usando dicha transformación canónica. 14 El corchete de Lagrange de dos constantes de movimiento es una constante de movimiento. Sin embargo, a diferencia de los de Poisson, los corchetes de Lagrange no sirven para hallar nuevas constantes de movimiento porque para evaluarlos hay que conocer todas esas constantes. 412 / Mecánica clásica avanzada Como la transformación (9.537) es canónica con valencia C = −i, se sigue de la fórmula general para los corchetes de Poisson que: [q, p] = −i (9.542) resultado que también puede obtenerse directamente de las fórmulas de la transformación. Nótese que toda transformación lineal con coeficientes constantes en el espacio de fases bidimensional será canónica con valencia igual al determinante de la matriz de la transformación: q = aq + bp ; p = eq + f p ⇒ c = af − be (9.543) El hamiltoniano del oscilador armónico lineal es: H= 1 p2x + kx2 2m 2 (9.544) y puede escribirse en la forma siguiente: H= 1 I(q 2 + p2 ) 2 mediante la transformación: r √ I q ; px = Imω p x= mω (9.545) (9.546) donde k = mω 2 e I es una constante que puede tomar cualquier valor. En la transformación (9.546) procedemos por analogı́a con una correspondiente transformación cuántica. Si ahora realizamos la transformación canónica: 1 i q = √ (q + p) ; q = √ (p − q) 2 2 (9.547) obtenemos para H: H = Iωqp (9.548) entonces el hamiltoniano CH será: −iH = −iIωN (9.549) donde llamamos N a: N = qp podemos ver que E = IN y que: N , q = −q ; N , p = p (9.550) (9.551) Vemos que q, p y N son análogos a los operadores de destrucción, de creación y de número, â, â+ , N̂ , de la mecánica cuántica. Las transformaciones canónicas / 413 La transformación (9.543) es de cambio de escala, o sea que según las fórmulas (9.191) y (9.192) es libre de segunda clase, con valencia igual al producto de los factores de escala: r mω 1 1 C= ·√ (9.552) = I I Imω de modo que el hamiltoniano correspondiente a las variables canónicas q y p será ωqp. Entonces, el hamiltoniano correspondiente a q y p es: H = −iωq p (9.553) Las fórmulas (9.551) nos permiten escribir directamente las ecuaciones de movimiento de Poisson, ecuaciones (9.363): q̇ = q, H ; ṗ = p, H (9.554) con lo cual de (9.553) y (9.551) obtenemos: q̇ = −iωq ; ṗ = iωp (9.555) Que podemos integrar fácilmente: q = q 0 e−iωt ; p = q ⋆0 eiωt (9.556) donde hemos notado que q y p son complejo conjugadas entre sı́. Utilizando las fórmulas (9.547) obtenemos a q y p en función del tiempo: √ √ q = 2Re (q 0 e−iωt ) ; p = 2Im(q 0 e−iωt ) (9.557) Es claro que q 0 puede determinarse de las condiciones iniciales sobre q y p: √ √ (9.558) q0 = 2Re q 0 ; p0 = 2Imq0 Entonces obtenemos para q(t) y p(t) en términos de sus valores iniciales: q = q0 cos ωt + p0 sen ωt (9.559) p = p0 cos ωt + q0 sen ωt y para las variables originales x y px , obtenemos: x = x0 cos ωt + px0 sen ωt mω (9.560) px = px0 cos ωt − mωx0 sen ωt Ejemplo 9.9.3 Analizar las dispersiones de x y de px para un ensamble de osciladores armónicos lineales que tengan la misma energı́a. El ensamble está ilustrado en el ejemplo 4.8.1, sección 4.8. 414 / Mecánica clásica avanzada Los distintos sistemas del ensamble difieren sólo por la fase. La dispersión en x se caracteriza por su varianza (∆x)2 , definida por: (∆x)2 = h(x − hxi)2 i = hx2 i − hxi2 (9.561) x = Ax sen(ωt + δ) (9.562) donde h...i denota el promedio sobre el ensamble. Como x(t) puede escribirse en la forma: Si promediamos sobre todos los posibles valores de δ, 0 ≤ δ ≤ 2π, obtenemos los promedios de ensamble microcanónicos: A2x ; hxi = 0 (9.563) 2 px se comporta análogamente. Obtenemos entonces que: 1 1 (∆x)2 = A2x ; (∆p)2 = A2p (9.564) 2 2 El producto ∆x ∆px será entonces: 1 (9.565) (∆x) (∆px ) = Ax Ap 2 Notamos según el ejemplo 9.9.2 que los máximos valores de x y px , que se obtienen de las fórmulas (9.560), son: px A2x = x20 + 2 0 2 ; A2p = p2x0 + m2 ω 2 x20 (9.566) m ω que pueden expresarse en función de q0 y p0 mediante (9.546): I A2x = (q 2 + p20 ) ; A2p = Iωm(q02 + p20 ) (9.567) mω 0 Reemplazando (9.548) en (9.546) obtenemos: hx2 i = (∆x) (∆px ) = I(q02 + p20 ) (9.568) Notando que según (9.550): N = (Re q 0 )2 + (Im q 0 )2 (9.569) Entonces obtenemos al usar (9.549): E (9.570) ω Este valor no depende del tiempo, en concordancia con el teorema de Liouville, ejemplo 4.8.4, sección 4.8. El resultado (9.569) es una propiedad del ensamble o sea que para un valor dado de E, queda determinado de manera única el valor del producto ∆x ∆px . Solamente disminuyendo el valor de E es posible disminuir el valor de este producto; o sea que una disminución de ∆x implica un aumento en ∆px y viceversa. Según la desigualdad de Heisenberg para osciladores mecánico-cuánticos: h̄ ∆x ∆px ≥ (9.571) 2 se sigue entonces de (9.551) que E ≥ h̄ω/2. Si tomamos I igual a la constante de Planck, se sigue también de (9.551) que E = nh̄ω. Estos resultados recuerdan a análogos resultados mecánico-cuánticos. ∆x ∆px = IN = 10 La ecuación de Hamilton-Jacobi con variables de acción-ángulo Aquı́ estudiaremos más en detalle el significado fı́sico de las soluciones de la ecuación de Hamilton-Jacobi con énfasis en los sistemas que presentan movimientos multiperiódicos. Se desarrollará la teorı́a hasta el punto en el cual se perciban claramente las diferencias y similitudes con la mecánica cúantica, cuando se trate con sistemas atómicos. Las soluciones y los métodos de solución de la ecuación de Hamilton-Jacobi han merecido numerosos estudios. El método de separación de variables permite en principio resolver cualquier problema integrable introduciendo las coordenadas adecuadas. Los modelos no integrables, como el famoso problema de los tres cuerpos, son objeto de muchas investigaciones en la actualidad. Un estudio matemático de los principales casos en que se resuelve la ecuación de Hamilton-Jacobi está en la sección 27 del texto de (Gantmacher Op. cit.). 10.1. Los invariantes adiabáticos Desde cuando el fı́sico aleman Max Planck en 1899 descubrió que la absorción y la emisión de energı́a radiante por la materia no se producen en cantidades arbitrarias sino de una manera cuantizada, los fı́sicos han tratado de introducir las ideas cúanticas en la mecánica clásica. En 1913 Niels Bohr explicó el espectro del hidrógeno con la mecánica clásica más dos suposiciones de tipo cúantico: que los electrones sólo tienen ciertos movimientos periódicos (órbitas) estables y no un continuo de tales movimientos, y que pueden pasar entre dos órbitas adyacentes por emitir o absorber un cuanto de luz. Los movimientos ligados de los sistemas cuánticos aislados que son estables o estacionarios forman un conjunto discreto. Los demás estados son inestables, aunque ligados, y forman un conjunto continuo; son estados no estacionarios. Desde entonces hasta la actualidad (y pasará algún tiempo hasta que la cuestión sea definitivamente resuelta), los fı́sicos téoricos investigan los movimientos estables que presentan los sistemas atómicos; con ello se busca determinar la causa de que ciertos estados sean estables y los demás sean inestables. A comienzos del siglo la cuestión de interés no era tanto las causas de 415 416 / Mecánica clásica avanzada la cuantización de los sistemas atómicos (lo cual se tomó como un dato experimental) sino determinar cuales son las cantidades susceptibles de ser cuantizadas. Se halló que las cantidades a ser cuantizadas deben satisfacer los siguientes dos requisitos: pueden cambiar sólo por múltiplos enteros de la constante de Planck h̄ y deben permanecer absolutamente inalteradas cuando se someta el sistema a una influencia externa que no sea capaz de causar una alteración de magnitud h̄ en esa cantidad. Tales cantidades se llaman invariantes adiabáticos y fueron extensivamente estudiados por P. Ehrenfest en los años 1914-1923.1 Los invariantes adiabáticos de la vieja teorı́a cúantica coinciden con las llamadas variables de acción. Un invariante adiabático para un sistema de un grado de libertad. Sea un sistema de un grado de libertad en un estado arbitrario de movimiento acotado con lo cual el movimiento además será periódico. Sea λ un parámetro caracterı́stico de los efectos externos sobre el sistema; si λ cambia, cambian los efectos externos sobre el sistema con lo cual se realizará un trabajo y posiblemente cambie también la frecuencia de la oscilación además de la energı́a total. Ciertamente la energı́a total dependerá del valor de λ siendo constante para cada valor que tenga λ: E = E(q, p, λ). Las expresiones para la energı́a total y el perı́odo del movimiento son de la forma: 1 (10.1) E = a(q, λ) q̇ 2 + U (q, λ) 2 Z q2 √ 2a dq √ T = (10.2) E −U q1 donde q1 y q2 son las raı́ces de la ecuación E = U (q, λ) para valores dados de E y λ. Puesto que E depende de λ, T depende de E y de λ. Si λ cambia con el tiempo, E dependerá del tiempo a través de λ: Ė = ∂E λ̇ ∂λ (10.3) Se dice que el parámetro λ varı́a adiabáticamente si: λ̇ ≪ λ T (10.4) es decir, si λ varı́a muy poco en el curso de un perı́odo del movimiento del sistema. Un invariante adiabático es una cantidad que no cambia cuando el sistema se somete a una variación adiabática de λ. Sabemos que, en virtud de las ecuaciones de Hamilton: Ḣ = ∂H ∂t (10.5) O sea que para un sistema conservativo como el que consideramos aquı́: Ė = 1 El ∂H ∂H λ̇ = ∂t ∂λ (10.6) tema continúa estudiándose en la actualidad. Véase por ejemplo: K.P. Marzlin, B.C. Sanders, Physics review letters 93, 160408(2004). También http://xxx.lanl.gov/abs/quant-ph/0405059. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 417 Como λ varı́a muy poco en un perı́odo del movimiento, podemos considerar que λ̇ también es constante. Entonces al promediar la ecuación (10.6) sobre un perı́odo obtenemos: Z 1 T ∂H Ė = λ̇ dt (10.7) T 0 ∂λ De acuerdo con una de las ecuaciones de Hamilton se cumple: dt = dq ∂H/∂p (10.8) La ecuación (10.7) se puede entonces escribir como: I ∂H/∂λ dq ∂H/∂p (10.9) Ė = λ̇ I 1 dq ∂H/∂p H donde denota la integral de lı́nea sobre la trayectoria de fases del sistema en un perı́odo de movimiento. En un perı́odo, por hipótesis, λ cambia muy poco, por tanto E es constante, según (10.6). Como una trayectoria de fases se caracteriza por la relación: p = p(q; E, λ) (10.10) donde E y λ son fijos, entonces p (o q) solo, es suficiente para especificar el estado. Sobre una trayectoria de fases dada C se cumple entonces que H(q, p, λ) = HC (p, λ), luego: dHc ∂Hc ∂Hc ∂p = + dλ ∂λ ∂p ∂λ (10.11) Como durante un perı́odo E no cambia apreciablemente y HC = E se cumple aproximadamente que: ∂Hc ∂Hc /∂λ =− ∂p ∂p/∂λ (10.12) como por otra parte ∂HC /∂E = (∂HC /∂p)(∂p/∂E) = 1, cumple: 1 ∂Hc = ∂p ∂p/∂E Reemplazando a (10.12) y (10.13) en (10.9) obtenemos: I ∂p dq − ∂λ Ė = λ̇ I ∂p dq ∂E La ecuación (10.14) se puede escribir en la forma: I ∂p ∂p Ė + λ̇ dq = 0 ∂E ∂λ (10.13) (10.14) (10.15) 418 / Mecánica clásica avanzada Dado que durante un perı́odo E y λ permanecen prácticamente constantes, de (10.10) se sigue que: ∂p ∂p ∂p Ė + λ̇ = ∂t ∂E ∂λ (10.16) y podemos sin mayor error reemplazar a Ė por Ė, con lo cual en vez de (10.15) podemos escribir: I I d ∂p dq = 0 (λ̇2 ) ⇒ p dq = 0 + 0(λ̇2 ) (10.17) ∂t dt Se define la variable de acción J como: I J = p dq (10.18) Entonces (10.17) nos dice que J˙ = 0, o sea que J es un invariante adiabático (una cantidad que no cambia cuando λ varı́a adiabáticamente). Concluimos que J depende de la energı́a del sistema pero varı́a muy poco con λ. Esto permite calcular a partir de J la frecuencia del movimiento: I I I ∂p 1 ∂J = dq = dq = dt = T (10.19) ∂E ∂E ∂HC /∂p o sea que: ν= 1 ∂J/∂E (10.20) La ecuación (10.18) tiene la siguiente interpretación geométrica: J es el valor del área encerrada por la curva de fases que describe el sistema en un perı́odo. La invariancia adiabática de J permite concluir que una perturbación al sistema que varı́a lentamente con el tiempo puede producir una deformación de la trayectoria de fases pero de tal manera que no se cambia el valor del área encerrada por esa curva. J también se puede escribir como una integral de superficie: Z J = dq dp (10.21) Ejemplo 10.1.1 Evaluar la variable de acción J para un oscilador armónico unidimensional. En este caso el hamiltoniano constante es: H= p2 1 + mω 2 q 2 = E 2m 2 (10.22) que puede escribirse en la forma: q2 p2 + =1 2mE 2E/(mω 2 ) (10.23) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 419 p La ecuación (10.23) define una elipse en el plano de fases cuyos semiejes son y 2E/(mω 2 ). El valor de J es igual al área encerrada por la elipse, esto es: p √ E J = π ( 2mE) ( 2E/(mω 2 )) = 2π ω √ 2mE (10.24) La invariancia adiabática de J significa en este caso que al variar lentamente los parámetros del oscilador (m y ω), la energı́a varı́a de manera proporcional a la frecuencia ω. Ejemplo 10.1.2 Mostrar explı́citamente la invariancia adiabática de J para un péndulo simple sometido a un acortamiento o alargamiento adiabático de la cuerda, para pequeñas oscilaciones. En este caso el hamiltoniano, constante, es: H= 1 2 2 ml ϕ̇ + mgl(1 − cos ϕ) = E 2 (10.25) para pequeñas oscilaciones: ϕ̇2 ϕ2 1 2 2 1 ml ϕ̇ + mgl ϕ2 = E ⇒ + =1 2 2 2 2E/(ml ) 2E/(mgl) (10.26) que es la ecuación de una elipse en el plano ϕ − ϕ̇, el área encerrada es: p 2πE E 1 √ = 2π 2E/(mgl) = ω ml2 ml gl H Es claro que J = p dq está dada también por la expresión (10.24): π p 2E/(ml2 ) (10.27) E ω (10.28) J = 2π para probar la invariancia adiabática de J, calculemos el trabajo realizado al variar la longitud del hilo del péndulo en una cantidad dl. Este trabajo es: dA = −mlϕ̇2 − mg cos ϕ dl (10.29) en (10.29) el primer término representa el trabajo de la fuerza de la ligadura y el segundo el trabajo de la fuerza de gravedad. Para pequeñas oscilaciones (10.29) se puede escribir como: 1 (10.30) dA = −mg dl + mg ϕ2 − mlϕ̇2 dl 2 El primer término en (10.30), −mg dl, representa el trabajo hecho para subir la posición de equilibrio de la masa del péndulo; y el otro término representa la energı́a comunicada a la oscilación, que llamaremos dE: 1 (10.31) mg ϕ2 − mlϕ̇2 dl dE = 2 420 / Mecánica clásica avanzada Sabemos que para un valor dado de l los valores medios de las energı́as cinética y potencial son iguales, e iguales a la mitad de la energı́a total E (teorema del virial): 1 2 2 1 1 ml ϕ̇ = mgl ϕ2 = E 2 2 2 (10.32) Comparando (10.32) y (10.31), al tomar el promedio temporal de dE, obtenemos que: E dl 2l (10.33) dω 1 dl =− ω 2 l (10.34) dE = − p Como la frecuencia angular es ω = g/l, vemos que el cambio fraccional de ω es proporcional al cambio fraccional de l cuando la longitud del péndulo se altera en dl: Comparando a (10.33) y (10.34) obtenemos que: dω dE = E ω (10.35) Se sigue por integración de (10.35) que: J E = = Constante 2π ω (10.36) Argumentos similares se pueden usar cuando ω se varı́a lentamente a causa de alguna otra influencia externa. Se usó el carácter adiabático de la variación en l, dl, al tomar en (10.31) el promedio temporal: se asumió que dl es prácticamente constante durante un perı́odo de la oscilación. Como el oscilador armónico del ejemplo de (10.22) equivale matemáticamente a un péndulo con una amplitud de oscilación pequeña, se sigue que E/ω es constante en tal caso. Sin embargo, se puede mostrar que para otros sistemas de un grado de libertad, E/ω no es un invariante adiabático, aunque para tales sistemas habrá otros invariantes adiabáticos. 10.2. Los toroides invariantes En la sección 9.6 analizamos en detalle la solución de las ecuaciones de movimiento de un sistema conservativo generalizado por el método de Hamilton-Jacobi. Esto nos condujo a la ecuación de Hamilton-Jacobi independiente del tiempo, ecuaciones (9.305) y siguientes del capı́tulo anterior. El resultado es que para tales sistemas es posible hallar una transformación canónica generada por Σ, que permite expresar a (~q, p~) en función de (~q, ~p), dados por pν = αν (ν = 1, 2, ...l − 1), pl = −t + αl , q ν = βν (ν = 1, 2, ...l) donde αν y βν son 2l constantes y se exige que Bl = h. Si no se toma a h coincidiendo con una ~ se obtendrá la solución en términos de de las βν sino que se deja en general h = H(β) ~ ~q = ~γ t + α ~ ~ ~p = β, ~ donde α ~ y β son las constantes de integración y ~γ son funciones de β. El formalismo de las variables acción-ángulo se caracteriza por: La ecuación de Hamilton-Jacobi con variables acción-ángulo / 421 (a) Es aplicable a sistemas conservativos generalizados. (b) Se define para sistemas ligados. (c) Se identifican las l constantes pν con l invariantes adiabáticos del sistema. (d) Si existen las l constantes de movimiento se dice que el sistema es integrable. Los sistemas integrables se caracterizan por poseer un número de constantes de movimiento uniformes igual al número de grados de libertad:2 en un sistema no integrable el número de constantes de movimiento uniformes es menor que l, y la trayectoria fásica cubrirá (total o parcialmente) regiones de más de l dimensiones en el espacio fásico. Veremos que si el sistema posee más constantes de movimiento uniformes que el número de grados de libertad, entonces la trayectoria fásica cubre regiones de dimensión menor que l y además la separación de variables es posible en más de un sistema de coordenadas. Las ecuaciones de movimiento de un sistema hamiltoniano de l grados de libertad son de la forma: ẋi = fi (x1 , x2 , ...x2l , t) ; i = 1, 2, ..,2l (10.37) Una integral primera del sistema (10.37) es una función constante que se obtiene a partir del mismo: d Φ(x1 , x2 , ...x2l , t) = 0 (10.38) dt La integral primera Φ = C es una superficie 2l dimensional en el espacio de 2l + 1 dimensiones, de coordenadas x1 , x2 , ...x2l , t, que posee la propiedad de que cada curva integral que tiene un punto común con esta superficie está enteramente contenida en ella. Si se han hallado k integrales primeras: Φi (x1 , x2 , ...x2l , t) = Ci ; i = 1, 2, ...k (10.39) Y si todas estas integrales son independientes, o sea, si al menos un determinante: Φ1 , Φ2 , ...Φk 6= 0 (10.40) J xj1 , xj2 , ...xjk donde xj1 , xj2 , ...xjk son k funciones cualesquiera de las x1 , x2 , ...x2l , entonces a partir de las ecuaciones (10.39) se pueden expresar k funciones de t desconocidas xj1 , xj2 , ...xjk en función de las demás y sustituyéndolas en (10.37), reducir el problema a la integración de un sistema de ecuaciones con menos incógnitas que 2l. Si k = 2l y todas las integrales son independientes, entonces (10.39) es un sistema de 2l ecuaciones algebraicas con las 2l incógnitas xi , que puede resolverse en el caso en que todas las funciones Φi sean uniformes. Sucede a veces que entre las Φi hay algunas que son funciones multiformes del estado del sistema y entonces las funciones Φ1 , Φ2 , ...Φ2l no determinan unı́vocamente el estado cuando toman los valores constantes C1 , C2 , ...C2l . Para que un sistema de ecuaciones diferenciales (10.37) sea integrable es suficiente, pues, que existan l integrales primeras uniformes. Cuando el sistema permite la separación de variables en la forma: Z Fi (xi ) dxi = t; i = 1, 2, ..,2l (10.41) 2 Es posible que un sistema sea integrable mas no separable, es decir, que no se puede desacoplar las ecuaciones de movimiento. 422 / Mecánica clásica avanzada se dice que el sistema se integra por cuadraturas. Teorema de Liouville sobre los sistemas integrables. Recordemos que una función Φ es una integral primera de un sistema de hamiltoniano H si su corchete de Poisson con H es nulo: [H, Φ] = 0 (10.42) Estamos excluyendo la constante t0 , conjugada canónica de H, y funciones de t0 . Dos funciones F1 y F2 del estado de un sistema hamiltoniano están en involución si su corchete de Poisson es nulo. Liouville demostró que si en un sistema de l grados de libertad se conocen l integrales primeras independientes y uniformes en involución entonces ese sistema se integra por cuadraturas. El enunciado exacto del teorema es: sean l funciones en involución: Φ1 , Φ2 , ...Φl ; [Φµ , Φν ] = 0 ; µ, ν = 1, 2, ...l (10.43) en un espacio fásico de dimensión 2l. Consideremos los subespacios (hipersuperficies 2l − 1 dimensionales): Sν = {(q, p) : Φν (q, p) = Cν } ; ν = 1, 2, ...l (10.44) y el producto directo de los mismos: Mc = {(q, p) : Φν = Cν ; ν = 1, 2, ...l} (10.45) Suponemos que sobre Mc las l funciones Φν son independientes (esto es, que los l gradientes de las hipersuperficies Sν son linealmente independientes en cada punto de Mc ). Entonces, recordando el teorema sobre simetrı́as y leyes de conservación de la sección 9.8, como los Φν son generadores infinitesimales de las transformaciones canónicas que dejan invariante a H, se cumple que: (i) Mc es un subespacio invariante bajo cada una de las transformaciones canónicas infinitesimales generadas por Φ1 = H, Φ2 , ...Φl . (ii) Si las funciones Φν son continuas y uniformes y tales que (q) y (p) siempre toman valores finitos, entonces el subespacio Mc corresponde con un toroide de dimensión l: T l = {ϕ1 , ϕ2 , ...ϕl } mod 2π (10.46) donde ϕ1 , ϕ2 , ...ϕl son coordenadas angulares sobre el toroide invariante T l . (iii) El hamiltoniano H genera sobre Mc un movimiento que se denomina cuasiperiódico, definido en términos de las coordenadas angulares ϕ ~ = (ϕ1 , ϕ2 , ...ϕl ) sobre el toroide invariante T l : d ϕ ~=~ ω; dt ~ ω ~ =ω ~ (C) (10.47) (iv) Las ecuaciones canónicas de Hamilton se integran por cuadraturas.3 3 Una demostración rigurosa del teorema puede verse en el libro de V. Arnold, Les méthodes matématiques de la mecánique classique, Mir, Moscú, 1976. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 423 Ejemplo 10.2.1 Aplicar el teorema de Liouville al estudio del oscilador bidimansional. Según el teorema de Liouville sobre sistemas integrables, si en un sistema canónico de dos grados de libertad se conoce una integral primera F que no depende de H, entonces el sistema se integra por cuadraturas; el subespacio definido por H = h y F = f siendo f y h dos constantes, es un toro invariante sobre el cual el movimiento es cuasiperiódico. Para precisar, consideremos un oscilador bidimensional descrito por el hamiltoniano: H= p2y 1 p2x + + m(ωx2 x2 + ωy2 y 2 ) 2m 2m 2 (10.48) El sistema de ecuaciones diferenciales (10.37) para este caso es: ẋ = px ; m ẏ = ṗx = −mωx2 x ; py m (10.49) ṗy = −mωy2 y Es fácil ver que: px py p˙x + mωx2 x ẋ = ṗy + mωy2 y ẏ = 0 m m (10.50) Con lo cual se obtiene que las siguientes son integrales primeras: 1 p2x + mωx2 x = E1 ; 2m 2 p2y 1 + mωy2 y 2 = E2 2m 2 (10.51) La hipersuperficie bidimensional ME1 E2 tiene intersecciones con los planos de fase (x, px ) y (y, py ) dadas por las elipses (10.51). Si se quiere, pueden tomarse como integrales primeras a H y una de las dos (10.51); dado que H = E1 + E2 . La hipersuperficie H = h es una esfera (o mejor elipsoide) en el espacio fásico; tal hipersuperficie es de dimensión 3, en tanto que H1 = E1 es unidimensional siendo la hipersuperficie MEE1 bidimensional. El producto directo de las elipses definidas por (10.51) es un toroide de dimensión 2, en tanto que los puntos del producto directo de las regiones H = h y H1 = E1 constituyen una superficie bidimensional, que se puede hacer corresponder topológicamente con un toroide bidimensional (véase figura 10.1). El movimiento cuasiperiódico generado por H sobre ME1 E2 se define en términos de las coordenadas angulares ϕ ~ = (ϕ1 , ϕ2 ) de los puntos de la superficie de un toro que se mueven uniformemente sobre las circunferencias ϕ1 = Constante y ϕ2 = Constante, con frecuencias angulares constantes que dependen de los valores de E1 y E2 : d~ ϕ =~ ω(E1 , E2 ) dt (10.52) Si ω1 y ω2 son inconmensurables, entonces la trayectoria de fases llena totalmente el toro cuando t → ∞, en tanto que cuando ω1 y ω2 son conmensurables la trayectoria de fases es cerrada y por lo tanto ocupa una región de dimensión menor a la del toro, es 424 / Mecánica clásica avanzada ϕ2 ϕ1 Figura 10.1 Toroide generado por H. decir, unidimensional. Para que esto ocurra es necesario que exista una nueva constante de movimiento además de E1 y E2 . Por ejemplo, cuando ωx = ωy , existe otra constante de movimiento relacionada con la degeneración, que es el momento angular: A = xpy − ypx (10.53) Cuando ωy = 2ωx la constante es: A = (m2 ωx2 x2 − p2x ) y + xpx py (10.54) y cuando ωx = 2ωy , es constante: A = (m2 ωy2 y 2 − p2y ) x + ypx py (10.55) Para el caso ωx = ωy es fácil ver que hay otra constante dada por: B = px py + m2 ω 2 xy (10.56) y que se cumple: [E2 , B] = −mω 2 A ; [E2 , A] = B m (10.57) o sea que E2 con B1 y E2 con A no están en involución. Tampoco A y B están en involución puesto que su corchete de Poisson vale E2 − E1 . Pero aún es posible formar una combinación lineal de A y B que esté en involución con E1 y con E2 : C = B + mω tan(ϕ10 − ϕ20 ) A (10.58) donde ϕ10 − ϕ20 es la diferencia de fase de los dos movimientos oscilatorios. Resultados análogos se esperan cuando las frecuencias satisfacen la relación nωx = mωy donde n y m son números enteros. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 425 Vectores tangentes a Mc . Como las l funciones Φν son independientes, también serán linealmente independientes los l vectores gradientes 2l-dimensionales, perpendicu~ν . lares a las superficies Φν = Cν , que llamaremos V ∂Φν ∂Φν ∂Φν V~ν = (10.59) , , ... ∂q1 ∂q2 ∂pl ~ν no tiene componentes a lo largo de un vector Ẽ V ~µ , donde la matriz Un vector V simplicial Ẽ fue definida en la sección 9.9. En efecto:   ∂Φµ  ∂~q  ∂Φν ∂Φν   (10.60) V~ν · Ẽ V~µ = Ẽ  ,  = [Φµ , Φν ] = 0 ∂~q ∂~ p  ∂Φµ  ∂~p Entonces concluimos que sobre el subespacio l-dimensional Mc existen l vectores linealmente independientes, tangentes a Mc en cada punto. En efecto, los V~ν son linealmente independientes, y como los autovalores de Ẽ son todos diferentes se concluye que los Ẽ V~ν son linealmente independientes. Se sigue entonces que en cada punto de Mc un vector tangente (por ejemplo la dirección de la trayectoria de fases en ese punto) puede expresarse como combinación ~ν (ν = 1, 2, ...l). lineal de los l vectores Ẽ V Si se realiza en un punto de Mc la transformación canónica infinitesimal generada por Φν , de acuerdo con la fórmula (9.349), el cambio experimentado por una variable dinámica f está dado por: ∂f ∂f ~ν ∂ν f = ǫ [f, Φν ] = −ǫ · Ẽ V (10.61) , ∂~q ∂~p Se sigue entonces que el cambio  1 0 0    0 1 0    ~q   ∂ν   = −ǫ  . . .  .. .. .. p ~     0 0 0 experimentado por el vector de estado (~q, ~p) es:  . . . 0   . . . 0     ~ ~ (10.62) .. .. .. ..  Ẽ V ν = −ǫẼ Vν . . . .     . . . 1  O sea que los desplazamientos producidos por cada una de las transformaciones canónicas infinitesimales generadas por Φ1 , Φ2 , ...Φl están contenidos totalmente dentro del subespacio Mc . Con esto queda demostrada la proposición (i) del teorema de Liouville. En particular, para cuando Φ1 = H se tiene que:     q ~ −∂H/∂~p ∂H  ⇒ ~q˙ = ∂H ; ∂   = −ǫ  ~p˙ = − (10.63) ∂~p ∂~q p~ ∂H/∂~q 426 / Mecánica clásica avanzada como debe ser. Hemos mostrado que cualquier desplazamiento sobre Mc se puede obtener por medio de las l transformaciones canónicas asociadas a las integrales primeras Φν en involución. Como en cada punto de Mc cada uno de los vectores tiene una dirección bien definida, concluimos que a cada integral primera Φν se le puede asociar una familia de trayectorias “paralelas” sobre la superficie de Mc y que en consecuencia a las l integrales primeras en involución Φν se les puede asociar un sistema de coordenadas curvilı́neas sobre Mc . En efecto, los l desplazamientos finitos asociados a los l grupos de transformaciones correspondientes a las Φν se pueden describir mediante l parámetros reales. Si fijamos sobre Mc un punto (~q, p~) ≡ x0 , entonces cualquier punto de Mc se puede obtener de éste por acción de los l grupos de transformaciones asociados a Φ1 , Φ2 , ...Φl : g(~r)x0 ≡ g1 (r1 ) g2 (r2 ) ...gl (rl )x0 = xr1 , r2 , ...rl ∈ Mc (10.64) donde gν (rν ) es la transformación finita asociada a Φν siendo rν el parámetro. Entonces los vectores ~r ≡ (r1 , r2 , ...rl ) definen unı́vocamente los puntos de Mc . Correspondencia entre Mc y un toroide de dimensión l. Por hipótesis la región Mc es acotada, ya que estamos tratando con sistemas ligados. Como consecuencia de esto, los vectores ~r = (r1 , r2 , ...rl ) que sirven para caracterizar los puntos de Mc tienen componentes acotadas. Para precisar, llamemos Rl al espacio euclı́deo l-dimensional en el cual están definidos los vectores ~r; en consecuencia, la región del espacio fásico Mc está asociada a un subespacio l-dimensional acotado de Rl mediante la fórmula (10.64). Como la región Mc es acotada, ciertamente existen transformaciones g(~r) que retornan un punto arbitrario x0 de Mc en sı́ mismo: g(~r)x0 = x0 (10.65) Podemos, por ejemplo, definir l transformaciones independientes que retornen a x0 en sı́ mismo de la siguiente manera: g1 (1)x0 = x0 ; g2 (1)x0 = x0 ; ...gl (1)x0 = x0 (10.66) Es decir, asociar el intervalo (0, 1) a cada una de las lı́neas cerradas que se obtienen por desplazar el punto x0 mediante las transformaciones gν (rν ). Es claro entonces que gν (mν )x0 = x0 donde mν es un número entero. Por tanto podemos caracterizar el conjunto de todas las transformaciones de la forma (10.65) mediante los vectores enteros: ~r = (m1 , m2 , ...ml ) ; mν = ... − 2, −1, 0, 1, ... (10.67) A su vez el intervalo (0, 1) corresponde con el intervalo (0, 2π), de modo que podemos hacer corresponder a la región Mc un toroide de dimensión l, T l , definido como el producto cartesiano de l cı́rculos, siendo definidos los puntos de los l cı́rculos mediante coordenadas angulares ϕν mod 2π: T l = {(ϕ1 , ϕ2 , ...ϕl )} ; ϕ ~ mod 2π (10.68) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 427 Existe una completa correspondencia entre T l y la región de Rl que representa los puntos de Mc . Por tanto es posible asociar a los puntos de Mc un toroide de dimensión l. Toda la argumentación depende de la existencia de transformaciones sobre Mc de la forma (10.65) para cualquier punto de Mc . Existencia en Mc de movimientos cuasiperiódicos. La transformación canónica generada por H tiene por parámetro a t. Entonces la correspondencia entre Mc y T l permite asociar a cada valor de t un punto (ϕ1 , ϕ2 , ...ϕl ) mod 2π sobre T l . El movimiento generado por H en Mc se presenta uniforme sobre T l debido a que una variación ∆t en el parámetro t se traduce en variaciones ∆ϕ1 , ∆ϕ2 , ...∆ϕl en las coordenadas sobre T l . Como ciertamente la variación del parámetro t es uniforme, de igual manera serán uniformes las variaciones en las coordenadas angulares sobre T l . En consecuencia: ϕ̇ν = ων ; ων = ων (~c) ; ϕ ~ (t) = ϕ ~ (0) + ~ω t (10.69) Hemos justificado las tres primeras proposiciones del teorema de Liouville. Las superficies de sección de Poincaré. Asumamos que el espacio de fases es 4-dimensional (sistema autónomo de dos grados de libertad). Escojamos una superficie bidimensional, que puede o no coincidir con uno de los planos de fase; para precisar tomemos el plano x − px en un valor de y determinado. Cada vez que la trayectoria de fases cruza el plano x − px en una dirección dada, un punto en el valor de x y px es marcado sobre la superficie. Después de muchos ciclos de la trayectoria, en el plano quedará formada una figura de puntos. Si tomamos como referencia el oscilador armónico bidimensional (ejemplo 10.2.1), la figura tendrá forma elı́ptica (véase figuras 10.2 y 10.3). Cada elipse corresponde a una trayectoria. Un comportamiento similar ocurre en las intersecciones con el plano x = 0. Los planos x − px y y − py son ejemplos de superficies de sección y las figuras de puntos formados permiten obtener conclusiones acerca de las frecuencias del movimiento. Si las frecuencias son conmensurables, las intersecciones de la trayectoria con las superficies de sección se repiten debido a que la trayectoria es cerrada, en caso contrario, las intersecciones cuando t → ∞ forman una curva continua sobre la superficie de sección, que no es otra cosa que la intersección del toroide invariante con la superficie de sección. Que las intersecciones de la trayectoria con una superficie de sección están localizadas sobre una curva única es una consecuencia de la existencia de una constante de movimiento además de la energı́a. En efecto la conservación de la energı́a, H(x, y, px , py ) = E (10.70) permite expresar una variable en términos de las otras tres, py = py (x, y, px ). Entonces es suficiente considerar la proyección de la trayectoria sobre el volumen tridimensional (x, y, px ). Si hay una constante de movimiento además de H, I(x, y, px , py ) = C (10.71) entonces (10.70) y (10.71) se pueden combinar para darnos: px = px (x, y) (10.72) 428 / Mecánica clásica avanzada px 0 0 x Figura 10.2 Superficies de sección de Poincaré en el plano x − px py 0 0 y Figura 10.3 Superficies de sección de Poincaré en el plano y − py O sea que las intersecciones sucesivas de la trayectoria con la superficie de sección y = 0 deben estar sobre la curva única px = px (x, 0). Consideremos ahora el toroide asociado a las constantes de movimiento E y C, MEC . Las coordenadas angulares sobre MEC son ϕ1 y ϕ2 siendo ω1 y ω2 las frecuencias correspondientes. Ciertamente la relación de frecuencias es función de E y C: α(E, C) = ω1 (E, C) ω2 (E, C) (10.73) Para α = r/S, con r y S enteros, la trayectoria sobre el toro es periódica, cerrándose al completarse r revoluciones en ϕ1 y S revoluciones en ϕ2 . En la superficie de sección ϕ2 = Constante habrán S puntos fijos sobre una circunferencia de radio R que depende solamente de E y C. Las sucesivas intersecciones están separadas por un tiempo La ecuación de Hamilton-Jacobi con variables acción-ángulo / 429 ∆t = 2π/ω2 . Durante este intervalo, ϕ1 avanza por ω1 ∆t = 2πα. La aplicación “twist” de Moser. Las ecuaciones que describen el movimiento de la N -ésima a la (N +1)-ésima intersección de la trayectoria con la superficie de sección son: RN +1 = RN ; ϕN +1 = ϕN + 2πα (10.74) La ecuación (10.74) constituye una aplicación (o mapeo discreto) de los puntos de la superficie de sección en ella misma. 10.3. Las variables acción-ángulo ~ ϕ Mostremos que es posible definir una transformación canónica (~q, p~) → (I, ~ ) de ~ que son los manera tal que hay l integrales primeras Φν dependientes únicamente de I, momentos canónicamente conjugados de las coordenadas angulares sobre el toroide T l correspondiente a Mc . ~ son coordenadas de los puntos de Mc en el espacio fásico 2lCiertamente (~ ϕ, Φ) dimensional y satisfacen las ecuaciones direrenciales ordinarias siguientes: ~ dΦ d~ ϕ ~ = 0; =ω ~ (Φ) dt dt que se integran inmediatamente para darnos: ~ ~ ~ t Φ(t) = Φ(0) ; ϕ ~ (t) = ϕ ~ (0) + ~ω Φ(0) (10.75) (10.76) ~ no son necesariamente canónicas, es posible construir l Aunque las variables (~ ϕ, Φ) ~ tales que (I, ~ ϕ funciones de las Φν , que llamaremos Iν = Iν (Φ), ~ ) sean variables canónicas. Las Iν , son llamadas las variables de acción y junto con las variables angulares ϕν forman en la vecindad de Mc un sistema de variables canónicas acción-ángulo. Las cantidades Iν son integrales primeras del sistema de hamiltoniano H = Φ1 puesto que son funciones de integrales primeras. A su vez, las Φν pueden expresarse en función de las Iν . Entonces en las variables acción-ángulo las ecuaciones canónicas con hamiltoniano que sólo depende de los “momentos” canónicos, son: ∂H dI~ =− = 0; dt ∂ϕ ~ d~ ϕ ∂H ~ = ~ω (I) (10.77) = dt ∂ I~ Las funciones ων están restringidas por la condición que resulta de la continuidad ~ de la función H(I): ∂2H ∂2H ∂ων ∂ωµ = ⇒ = ∂Iν ∂Iµ ∂Iµ ∂Iν ∂Iµ ∂Iν (10.78) Variables acción ángulo para l = 1. Debemos encontrar una transformación canónica (q, p) → (I, ϕ) que satisfaga las dos condiciones siguientes: I dϕ = 2π (10.79) I = I(h) y Mh 430 / Mecánica clásica avanzada En este caso el “toro” es una lı́nea cerrada. Es claro que la función generatriz del tipo F2 para esta transformación es Σ(I, q), que satisface: p= H ∂Σ ; ∂q ∂Σ ,q ∂q ϕ= ∂Σ ∂I = h(I) (10.80) (10.81) siendo H(p, q) = h(I) el hamiltoniano del sistema. Como la relación h(I) es biunı́voca se sigue que cada curva Mh está definida por un valor de I. Sobre una curva definida h por un valor de I, se sigue de (10.80) que: dΣ|I=Constante = p dq En la vecindad de un punto q0 la acción vale:4 Z q p dq = Area Σ(I, q) = (10.82) (10.83) q0 La segunda condición en (10.79) depende del comportamiento global de Σ(I, q). La función Σ no es uniforme pues al dar un ciclo completo sobre la curva Mh cambia su valor por una constante igual al área encerrada por la curva. Esto no afecta el valor de ∂Σ/∂q pero sı́ el de ϕ = ∂Σ/∂I puesto que el área depende de I. Si llamamos ∆Σ(I) al área, I p dq (10.84) ∆Σ(I) = Mh Entonces (10.80) define a ϕ con la indeterminación de un múltiplo entero de d∆Σ/dI. Para que se satisfaga la segunda condición de (10.79) es necesario entonces que: d∆Σ(I) ∆Σ A = 2π ⇒ I = = dI 2π 2π o sea que I debe valer: I 1 I= p dq 2π Mh (10.85) (10.86) Si el área A depende de h, entonces existe la función h(I) inversa de I(h). El perı́odo del movimiento sobre la curva cerrada Mh en el plano de fases (q, p) está dado por: T = dA(h) dh (10.87) Hemos demostrado además que la variable de acción es un invariante adiabático, de acuerdo con la definición dada por (10.18). 4 Esta integral de lı́nea ciertamente está sobre la trayectoria del sistema, pero no está evaluada siguiendo el movimiento del sistema: es una propiedad intrı́nseca de los puntos q y q0 del “toro”. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 431 Ejemplo 10.3.1 Resolver las ecuaciones de movimiento para el oscilador armónico unidimensional del ejemplo 10.1.1 usando las variables acción-ángulo. ω0 ≡ De acuerdo con el ejemplo 10.1.1, para un oscilador armónico de constante k, con p k/m el área encerrada por la elipse definida por H = E es: A= E 2πE ⇒ I= ω0 ω0 (10.88) La frecuencia del movimiento es entonces: ω= ∂E = ω0 ∂I (10.89) que en este caso particular resulta independiente del valor de I. Las fórmulas (10.80) permiten resolver las ecuaciones de movimiento usando el formalismo de las variables acción-ángulo. En efecto: Z qq Z q 2mE − m2 ω02 q 2 dq p dq = Σ(I, q) = (10.90) q0 q0 entonces: ϕ= ∂Σ = ∂I Z q q0 r dq = sen−1 2I − q2 mω0 r mω0 q 2I lo cual nos dice que: r r 2I 2I q= sen ϕ = sen (ϕ0 + ω0 t) mω0 mω0 (10.91) (10.92) donde hemos absorbido en ϕ la constante de integración de (10.91). Resulta que la variable angular ϕ es la fase de las oscilaciones. Ejemplo 10.3.2 Aplicar el formalismo de las variables acción-ángulo para hallar la solución a las ecuaciones de movimiento del péndulo plano y realizar un estudio del espacio fásico correspondiente. Las ecuaciones de movimiento son: ṗ = −F sen θ ; θ̇ = Gp (10.93) donde F = mgL, G = 1/(mL2 ) siendo mg la fuerza gravitacional, L la longitud del péndulo, θ el ángulo respecto a la vertical y p el momento angular conjugado a θ. El hamiltoniano es: H= 1 2 Gp − F cos θ = E 2 (10.94) El problema es completamente separable, como ocurre siempre cuando hay un grado de libertad. Una descripción cualitativa del movimiento se obtiene a partir de un diagrama de energı́a y otro de las trayectorias de fase (véase figura 10.4). F es el mayor 432 / Mecánica clásica avanzada valor de la energı́a potencial. Si E > F , entonces p es siempre diferente de cero y el movimiento es no acotado en θ (rotación). Para E < F , el movimiento es acotado (libración). Para E = F , tenemos el movimiento separatriz, en el cual el perı́odo de oscilación se hace infinito. Hay dos puntos singulares en p = 0: el origen en θ = 0, que es estable o punto singular elı́ptico; y la intersección de las dos ramas de la separatriz en θ = ±π, que es inestable o punto singular hiperbólico. Una trayectoria de fases cerca a un punto singular elı́ptico permanece en su vencindad, en tanto que una trayectoria cerca a un punto hiperbólico diverge de él. El perı́odo está dado por: r I dθ 1 √ T = (10.95) 2G E + F cos θ Sobre la separatriz vemos de (10.93) que la fuerza restauradora y la velocidad son cero en θ = π, de modo que T es infinito. p Punto elíptico Rot. Sep. Lib. E>F E=F E<F –2π –π 0 π 2π θ Punto hiperbólico Figura 10.4 Curvas de fase para el péndulo Transformemos ahora el hamiltoniano a variables acción ángulo, usando la definición (10.86): r Z 2 θmax 2 (E + F cos θ) dθ (10.96) I(E) = π 0 G y las expresiones (10.80) y (10.83): Z 1 dE θ ∂Σ dα r = φ(θ, E) = ∂I G dI 0 2 (E + F cos α) G (10.97) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 433 donde θmax = π/2 para rotación (E > F ) y cos θmáx = −H/F para libración (E < F ). El nuevo hamiltoniano se obtiene notando que H = H = E, con lo cual (10.96) permite en principio expresar a E en función de I. En (10.79) se supone que Mc representa una lı́nea cerrada. Sin embargo la definición es posible ampliarla para incluir no sólo libración sino rotación. Si en (10.96) y (10.97) efectuamos el cambio de variable siguiente: s 1 E θ 1+ sen η = sen (10.98) 2 F 2 obtenemos: I= y, 8 π r  E(k) − (1 − k 2 )K(k) , k < 1   F G  1 kE(k −1 ) , k>1 2  F (η, k) /K(k) , k<1 π  ϕ= 2  2F (η/2, k −1) /K(k −1 ) , k > 1 (10.99) (10.100) siendo F (η, k) y E(η, k) las integrales elı́pticas incompletas de primera y segunda especie respectivamente, en tanto que K(k) = F (π/2, k) y E(k) = E(π/2, k) son las integrales elı́pticas completas de primera y segunda especie (véase sección 8.4). Z η dξ p = sen−1 (sen η) F (η, k) = 2 2 1 − k sen ξ 0 (10.101) Z ηp E(η, k) = 1 − k 2 sen2 ξ dξ 0 k está dada por: E (10.102) F y es una medida de la energı́a normalizada del oscilador. k = 1 cuando E = 1 (la energı́a de la separatriz) y k < 1 para libración y k > 1 para rotación. De (10.95) obtenemos para la frecuencia normalizada:  1/K(k) , k<1 ω(k) π  = (10.103) ω0 2  2k/K(k −1 ) , k > 1 √ donde ω0 = F G es la frecuencia angular para el movimiento linealizado alrededor del punto singular elı́ptico. El valor asintótico de K cerca a k = 1 nos da una frecuencia normalizada cerca a la separatriz:  (π/2)/ln 4(1 − k 2 )−1/2 , k < 1  ω = (10.104) lı́m  k→1 ω0 π/2 ln 4(k 2 − 1)−1/2 , k>1 2k 2 = 1 + que tiende a cero cuando k tiende a 1. 434 / Mecánica clásica avanzada Ejercicio 10.3.1 Mostrar que para la trayectoria separatriz se cumple: p=± 2ω0 θ cos ; G 2 θ = 4tan−1 (eω0 t ) − π (10.105) Variables acción ángulo para l grados de libertad. En el caso unidimensional, donde el toroide invariante se reduce a una lı́nea, la integral de lı́nea en (10.86) coincide con la trayectoria. En el caso l-dimensional esta coincidencia no es necesaria. Sean γ1 , γ2 , ...γl , l lı́neas cerradas sobre el toroide Mc , topológicamente equivalentes a circunferencias. Sobre cada lı́nea especificamos un punto mediante una coordenada ϕν que en un circuito cerrado se aumenta por el valor 2π. Los γν no coinciden necesariamente con trayectorias, que según veremos en general no son cerradas; es decir, en el caso general ninguna de las lı́neas γν coincide con la proyección de la trayectoria de fases del sistema sobre el plano qν − pν . Entonces definimos la Iν por: 1 Iν = 2π Z l Z 1 X p~ · d~q = pν dqµ 2π µ=1 γµ γν (10.106) Consideramos sobre Mc un “tubo de caracterı́sticas” que pasan por los puntos de γν en un tiempo dado (véase figura 10.5). En un tiempo posterior t′ los puntos del tubo de caracterı́sticas que en t estaban sobre γν pasarán a formar un contorno cerrado diferente γν′ . En la sección 9.4 se demostró que la integral de Poincaré I1 no cambia de valor al ser evaluada sobre contornos que envuelven el mismo tubo de caracterı́sticas y tales que los puntos de dichos contornos representen estados simultáneos. γν γ′ν Figura 10.5 Tubo de caracterı́sticas sobre el toroide Se sigue entonces en virtud de la invariancia de la integral de Poincaré que: Z Z p~ · d~q = ~p · d~q (10.107) γν γν′ Se sigue de (10.106) que el valor de la variable de acción Iν no varı́a al deformar la curva cerrada γν . De la topologı́a de un toroide se sigue que no es posible por deformación hacer coincidir una curva γµ con otra γν independiente, o sea que la topologı́a del toroide determina de manera única los l números I1 , I2 , ...Il definidos por (10.106). La ecuación de Hamilton-Jacobi con variables acción-ángulo / 435 ~ ϕ Como (Φ, ~ ) son las coordenadas de los puntos de la vecindad de Mc , entonces si las Iν son independientes, o sea si I1 , I2 , ...Il J 6= 0 (10.108) C1 , C2 , ...Cl entonces en la vecindad del toroide se pueden tomar como coordenadas las variables ~ ϕ). (I, De acuerdo con el método de Hamilton-Jacobi, la siguiente es la función generatriz ~ ϕ de la transformación canónica (~ q, p ~) → (I, ~) 5 ~ ~ Σ(I, q) = Z q ~ q ~0 ~ ~ p~(I, q ) · d~q (10.109) de acuerdo con las fórmulas: p~ = ∂Σ ; ∂~q ϕ ~= ∂Σ ∂ I~ (10.110) ~ ~q), la cual en principio Como sabemos, (10.109) no permite evaluar la función Σ(I, se obtiene resolviendo la ecuación de Hamilton-Jacobi independiente del tiempo: ∂Σ ~ ,~ q = h(I) (10.111) H ∂~q Queda claro que el sistema es integrable si es posible encontrar l contornos cerrados independientes tales que existen las l cantidades I1 , I2 , ...Il , lo cual es posible independientemente de poder resolver la ecuación (10.111) por separación de variables. La función Σ es multivaluada sobre Mc . El cambio experimentado al realizarse un circuito sobre una lı́nea γν es igual a: I dΣ = 2πIν (10.112) ∆ν Σ = γν Sin embargo en la vecindad de un punto ~q0 siempre es posible definir una función unı́voca que especifica la transformación canónica. Como en el caso unidimensional, la no uniformidad de Σ se traduce en la no uniformidad de las variables angulares. En efecto el cambio en la variable angular ϕν al realizarse un circuito sobre la lı́nea γµ está dado por: ∆µ ϕν = ∆µ ∂Σ ∂ = ∆µ Σ = 2πδµν ∂Iν ∂Iν (10.113) Por otra parte, las variables de acción están indeterminadas por una constante que no depende de las Iν , como se puede ver en (10.85), pero es una constante que no trae problemas como los provenientes de la no uniformidad de Σ. 5 La integral (10.109) es una integral de lı́nea que no depende de la trayectoria seguida para llegar de ~ q0 a q~. 436 / Mecánica clásica avanzada Sistemas separables. Hay casos en los cuales mediante una adecuada elección de las coordenadas resulta que la función Σ puede escribirse en la forma: ~ ~ Σ(I, q) = l X ~ qν ) Σν (I, (10.114) ν=1 se dice entonces que el sistema es completamente separable. Para un sistema de este tipo las ecuaciones (10.110) toman la forma: pν = ∂ ~ qν ) ; Σν (I, ∂qν ϕν = l X ∂ ~ qµ ) Σµ (I, ∂I ν µ=1 (10.115) ν = 1, 2, ...l En este sistema es posible escoger los ciclos de base γ1 , γ2 , ...γl en los planos de fase (q1 , p1 ), (q2 , p2 ), ...(ql , pl ) de modo que las variables de acción pueden definirse por las integrales: I 1 1 Iν = ∆ν Σν = pν dqν (10.116) 2π 2π donde cada integral es tomada sobre un ciclo de la coordenada qν . Ver la sección 9.4. Sistemas multiplemente periódicos degenerados. Cuando el sistema es separable, las variables angulares describen la proyección del punto representativo del sistema sobre el plano de fases correspondiente (pν , qν ) y ων es la frecuencia angular correspondiente al movimiento de tal proyección sobre la trayectoria cerrada. Entonces tanto qν como pν son funciones periódicas del tiempo. Puede ocurrir que todas las frecuencias sean conmensurables entre sı́; entonces existen nuḿeros enteros m1 , m2 , ...ml tales que, si T1 , T2 , ...Tl son los perı́odos sobre las proyecciones en los planos de fases se cumple: m1 T1 = m2 T2 = ... ml Tl = T (10.117) en este caso la trayectoria de fases es cerrada y el sistema como un todo es periódico. Se dice entonces que el sistema es completamente degenerado. Si el sistema es no degenerado o parcialmente degenerado, entonces (10.117) no se cumple y nunca retorna a su estado inicial, pero cuando T es suficientemente grande entonces pasa arbitrariamente cerca al estado inicial y se dice que el movimiento es cuasiperiódico sobre el toroide invariante. En este caso la trayectoria, independientemente de las condiciones iniciales, es uniformemente distribuida sobre el toroide. Este enunciado constituye el teorema ergódico. Podemos decir que si el sistema es no degenerado es ergódico. Si hay degeneración esto no se cumple. En las coordenadas en que el sistema es separable, qν y pν son funciones periódicas del tiempo con frecuencia angular ων . Entonces cualquier función uniforme F (~q, p~ ) del La ecuación de Hamilton-Jacobi con variables acción-ángulo / 437 estado del sistema es periódica respecto a las variables angulares y su perı́odo respecto a cada una de ellas es 2π. Su expansión de Fourier es de la forma: F (~ q , p~) = ∞ X ∞ X ... n1 =−∞ n2 =−∞ ∂E ∂E ∂E n1 + n2 + ... nl t An1 , n2 , ...nl exp i ∂I1 ∂I2 ∂Il n =−∞ ∞ X (10.118) l Cada término de esta suma es periódico respecto al tiempo con frecuencia angular: ∂E ∂E ∂E n1 + n2 + ... nl ∂I1 ∂I2 ∂Il (10.119) pero como estas frecuencias no son conmensurables en general, la suma no es periódica. En particular, no serán periódicas las coordenadas y momentos (~q, p~) en las cuales el sistema no sea separable. En algunos casos particulares, dos o más de las frecuencias ων = ∂E/∂Iν son conmensurables para todos los valores de las Iµ . La existencia de degeneración conlleva una reducción del nuḿero de variables de acción independientes de las cuales depende de la energı́a. En efecto si ω1 y ω2 son tales que: n1 ∂E ∂E = n2 ∂I1 ∂I2 (10.120) donde n1 y n2 son enteros, se deduce entonces que E depende de I1 y I2 sólo en la combinación n2 I1 + n1 I2 : E(I~ ) = E(n2 I1 + n1 I2 , I3 , ...Il ) (10.121) Cuando hay degeneración, el número de integrales de movimiento uniformes es mayor que l. En efecto, la siguiente cantidad es constante de movimiento: A = n1 ϕ1 − n2 ϕ2 (10.122) la constancia de la cual es evidente de (10.120). Además está constante de movimiento no depende de las Iν , que son las variables canónicamente conjugadas de las ϕν . Al realizarse un circuito sobre la lı́nea γν , el cambio en A está dado, en virtud de (10.113), por: ∆ν A = (n1 δ1ν − n2 δ2ν ) 2π (10.123) o sea que A no es uniforme, pero su no uniformidad consiste en la adición de un múltiplo entero de 2π. Por tanto, tomando una función trigonométrica arbitraria de A se obtiene una nueva integral de movimiento uniforme. Ejemplo 10.3.3 Mostrar que las constantes (10.53) y (10.54) en el caso del oscilador armónico bidimensiohal son funciones respectivamente de ϕ1 − ϕ2 y de 2ϕ1 − ϕ2 . 438 / Mecánica clásica avanzada Es simple mostrar que A(I1 , I2 , ϕ1 , ϕ2 ) en (10.53) vale: 2p A= I1 I2 sen(ϕ1 − ϕ2 ) m y en (10.54) vale: p A = 2I1 mI2 ω1 sen(2ϕ1 − ϕ2 ) (10.124) (10.125) De (10.123) se sigue que estas constantes de movimiento son uniformes. En el cálculo hemos usado la fórmula (10.92) para cada uno de los grados libertad, en coordenadas cartesianas. Ejemplo 10.3.4 En la sección 5.2 mostramos que el oscilador armónico bidimensional cuando ω1 = ω2 es separable en coordenadas cartesianas y en coordenadas polares. Resolver este problema en coordenadas polares usando las variables acción ángulo. La ecuación de Hamilton-Jacobi para el problema es: " 2 2 # 1 ∂Σ 1 ∂Σ 1 + mω02 r2 = E + 2 2m ∂r r ∂ϕ 2 (10.126) Resolviendo a (10.126) por separación de variables obtendremos las dos ecuaciones diferenciales ordinarias siguientes: 2 l2 dΣr dΣϕ + 2 + m2 ω02 r2 = 2mE (10.127) = l; dϕ dr r donde l2 es la constante de separación. Salvo constantes de integración, las soluciones son: Z r l2 Σϕ = lϕ ; Σr = (10.128) 2mE − 2 − m2 ω02 r2 dr r Entonces las cuatro ecuaciones (10.115) toman la forma: r l2 pϕ = l ; pr = 2mE − 2 − m2 ω02 r2 r ϕr = ϕ ϕϕ = ϕ ∂l + ∂Ir Z ∂l + ∂Iϕ Z 1 ∂l2 ∂E − 2 ∂Ir r ∂Ir r dr 2 l 2 2 2 2 2mE − 2 − m ω0 r r (10.129) 2m 2m r 1 ∂l2 ∂E − 2 ∂Iϕ r ∂Iϕ l2 2 2mE − 2 − m2 ω02 r2 r dr (10.130) (10.131) La variable de acción Iϕ vale: Iϕ = l (10.132) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 439 y la variable de acción Ir vale: Z rmax r 1 l2 Ir = ·2 2mE − 2 − m2 ω02 r2 dr 2π r rmı́n (10.133) donde rmı́n y rmax están dados por la fórmula (5.76). Mediante la sustitución x = r2 , (10.133) toma la forma: I q 1 1 Ir = −m2 ω02 x2 + 2mEx − l2 dx (10.134) 2π x La integral se hace fácilmente usando la técnica de los residuos teniendo en cuenta que en el plano complejo el integrando es una función biforme (positivo en el intervalo (xmı́n , xmax ) y negativo entre (xmax , xmı́n )), presentándose entonces una lı́nea de ramificación entre xmı́n y xmax . Por otra parte el integrando tiene singularidades en x = 0 y x = ∞, presentándose polos en dichos puntos. El residuo en x = 0 vale −l/(2π) y el residuo en x = ∞ (que se obtiene con la sustitución y = 1/x) vale E/(2πω0 ). En consecuencia, usando (10.132): E = ω0 (Ir + Iϕ ) (10.135) La técnica para evaluar este tipo de integrales puede verse en el apéndice II del libro de Born, The mechanics of the atom o en la sección 9-7 del libro de Goldstein. Esto nos permite escribir entonces (10.130) y (10.131) como: Z dr r (10.136) ϕr = mω0 l2 2 2 2 2mE − 2 − m ω0 r r Z mω0 − l/r2 r ϕϕ = ϕ + dr (10.137) l2 2 2 2 2mE − 2 − m ω0 r r Estas integrales coinciden con las evaluadas en el capı́tulo 5, que aparecieron en las fórmulas (5.67) y (5.75): El resultado para r en función de ϕr se obtiene directamente de (5.81): ! r ω02 l2 E 2 (10.138) 1 + 1 − 2 sen 2ϕr = r02 (1 + e sen 2ϕr ) r = mω02 E La ecuación de la órbita r(ϕ) depende de la diferencia ϕϕ − ϕr y de una constante de integración que se puede absorber por ϕϕ . Como según (10.135) el movimiento es degenerado (ωr = ωϕ = ω0 ), resulta que ϕϕ − ϕr es una constante. La integral en (10.131) es idéntica a (5.67). El resultado para ϕ en términos de las variables acción ángulo es: e + sen 2ϕr 1 (10.139) ϕ = ϕϕ − ϕr + sen−1 2 e sen 2ϕr + 1 440 / Mecánica clásica avanzada La constante (10.122) que aparece cuando hay frecuencias degeneradas es: A = ϕr − ϕϕ (10.140) Los cambios en A al realizarse circuitos sobre las lı́neas γr y γϕ respectivamente son ∆r A = 2π y ∆ϕ A = −2π. O sea que ϕ no es una función uniforme, lo cual introduce dificultades para tomar a (r, ϕ, pr , pϕ ) como variables de estado. Cuando Iϕ = 0, ϕ = π/4 − A y cuando Iϕ = Ir + Iϕ , ϕ = ϕϕ = ϕr − A. Sólo una función que contenga funciones trigonométricas de A es uniforme. El toroide invariante en coordenadas polares está definido por las ecuaciones H = E y pϕ = l. En este caso degenerado queda reducido a una curva cerrada: p2r + l2 + m2 ω02 r2 = 2mE ; r2 pϕ = l (10.141) El potencial efectivo presenta dos puntos de retorno en r, en tanto que en ϕ no hay puntos de retorno. Las figuras 10.6 y 10.7 muestran las envolventes de las trayectorias en el plano de la órbita y algunas órbitas, para l = 0 y para l 6= 0. Las ecuaciones paramétricas de la curva en el plano r − Pr son: r2 = r02 (1 + e sen 2ϕr ) ; p2r = m2 ω02 r02 e2 cos2 2ϕr 1 + esen 2ϕr (10.142) l≠0 Figura 10.6 Envolventes de las trayectorias en el plano de la órbita para l 6= 0 La figura 10.8 muestra las curvas de fases representadas por (10.142) para diferentes valores de e. Cuando e → 1, las trayectorias cerca a rmı́n son muy “planas”, de modo que cuando e = 1, los puntos con pmax y pmı́n están unidos por una lı́nea recta vertical levantada en rmı́n = 0. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 441 l=0 Figura 10.7 Envolventes de las trayectorias en el plano de la órbita para l = 0 1 pr (mω0r0) e=1 e = 0,8 e = 0,6 0,5 e = 0,4 e = 0,2 e=0 0 0,5 1 r/r 0 1,5 –0,5 –1 Figura 10.8 Curvas de fases para diferentes valores de e Como r es positivo, la trayectoria para e = 1 es un arco de elipse con los extremos unidos por una lı́nea recta vertical, o sea que en r = 0, pr cambia abruptamente de signo. e = 1 corresponde a un movimiento pendular. En este caso el “toroide” se convierte 442 / Mecánica clásica avanzada en un segmento de lı́nea, pues en cualquier movimiento real los puntos de la lı́nea recta vertical son recorridos a velocidad infinita. En coordenadas polares son constantes de movimiento E y l. Como consecuencia de la degeneración hay otra constante que es una función trigonométrica de A. Tal constante coincide con E1 o con E2 . En efecto, podemos tomarla como E1 . px puede expresarse en función de pr y pϕ mediante la fórmula: 1 px = pr cos ϕ − pϕ sen ϕ r (10.143) pϕ es una constante igual a l, cuyo valor tiene la siguiente expresión en función de e: p l = mω0 r02 1 − e2 (10.144) remplazando pr de (10.142) en (10.143) obtenemos: p mω0 r0 e cos ϕ cos 2ϕr − 1 − e2 sen ϕ px = √ 1 + e sen 2ϕr (10.145) con lo cual E1 puede llevarse a la forma: E1 = mω02 r02 1 [e (1 + cos 2ϕ)(e + sen 2ϕr ) 2 1 + e sen 2ϕr √ +1 − e2 − e 1 − e2 sen 2ϕ sen 2ϕr ] De (10.139) obtenemos las siguientes expresiones para cos 2ϕ y sen 2ϕ: √ (e + sen 2ϕr ) sen 2A + 1 − e2 cos 2ϕr cos 2A cos 2ϕ = 1 + e sen 2ϕr √ (e + sen 2ϕr ) cos 2A − 1 − e2 cos 2ϕr sen 2A sen 2ϕ = 1 + e sen 2ϕr (10.146) (10.147) La sustitución de (10.147) en (10.146) nos conduce finalmente a: E1 = 1 mω02 r02 (1 + e sen 2A) 2 (10.148) y en consecuencia: E2 = 1 mω02 r02 (1 − e sen 2A) 2 (10.149) Sistemas no separables. Como una consecuencia del teorema de Liouville sobre los sistemas integrables, todo sistema de l grados de libertad que posea l constantes de movimiento uniformes admite un sistema de variables acción ángulo, siendo las variables de acción l constantes de movimiento uniformes y las variables agulares l funciones lineales del tiempo de la forma ϕν = ων t+ϕν0 siendo las ϕν0 l constantes de movimiento no uniformes. En un sistema no integrable, el número de constantes de movimiento uniformes es menor que l y por tanto la trayectoria de fases cubrirá regiones de más de l dimensiones. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 443 Cuando hay un número de constantes de movimiento uniformes superior a l, se tiene un sistema integrable degenerado. Sistemas separables degenerados. En este caso es posible construir más de l constantes de movimiento uniformes en involución. Entonces hay diferentes maneras de escoger el conjunto de l variables de acción y por tanto hay diferentes transformaciones canónicas a variables acción ángulo. Sean (q, p) → (I, ϕ) y (q, p), (I ′ , ϕ′ ) dos de tales transformaciones, entonces las variables (q, p) en los dos casos deben ser diferentes. Llegamos a otra propiedad fundamental de los sistemas degenerados consistente en que las ecuaciones de movimiento son separables en diferentes sistemas de coordenadas. Ejemplo 10.3.5 Mostrar que en un oscilador armónico bidimensional cuando ωx = 2ωy (o ωy = 2ωx ) es posible la separación de variables en coordenadas parabólicas. En el ejemplo 10.2.1 hallamos que cuando ωy = 2ωx existen tres constantes de movimiento uniformes independientes, E1 , E2 y A (10.54), cuando la separación de variables se hace en coordenadas cartesianas. En términos de las coordenadas parabólicas ξ y η las coordenadas cartesianas x, y están dadas por: p (10.150) x = ξ−η; y = ±2 ξη ; 0 ≤ (ξ, η) < ∞ En este sistema de coordenadas curvilı́neas, las curvas de ξ constante son parábolas confocales con ejes a lo largo de x y abiertas hacia la izquierda. Las curvas de η constante son parábolas confocales con ejes a lo largo del eje x pero abiertas hacia la derecha y ortogonales a la familia ξ = constante. En ambos casos el foco está en el origen. Las ecuaciones cartesianas de esas familias de curvas son: y 2 − 4ηx = 4η 2 (η = Constante) y y 2 + 4ξx = 4ξ 2 (ξ = Constante) (10.151) La sustitución de (10.150) en (10.151) hace triviales a estas últimas identidades, como debe ser. El lagrangiano en coordenadas cartesianas es: m m 2 L= ẋ + ẏ 2 − ωy2 (4x2 + y 2 ) (10.152) 2 2 cuando ωx = 2ωy . En coordenadas parabólicas es: ! 1 η̇ 2 ξ˙2 L = m(ξ + η) − 2mωy2 (ξ 2 + η 2 − ξη) (10.153) + 2 ξ η Por tanto el hamiltoniano en coordenadas parabólicas es: H= 1 ξp2ξ + ηp2η + 2mωy2 (ξ 2 + η 2 − ξη) 2m ξ + η La ecuación de Hamilton-Jacobi es: " 2 2 # 1 1 ∂Σ ∂Σ ξ + 2mωy2 (ξ 2 + η 2 − ξη) = E +η 2m ξ + η ∂ξ ∂η (10.154) (10.155) 444 / Mecánica clásica avanzada Haciendo Σ = Σξ (ξ) + Ση (η) (10.156) obtenemos las ecuaciones: 2 dΣξ 2ξ + 8mωy2 ξ 3 − 4mEξ = β dξ 2η dΣη dη 2 (10.157) + 2mωy2 η 3 − 4mEη = −β (10.158) donde β es la constante de separación. Integrando estas ecuaciones hallamos: Z s Z s β β 2 2 2 Σ= − 4m ωy ξ dξ + − 4m2 ωy2 η 2 dη (10.159) 2mE + 2mE − 2ξ 2η La constante β tiene la siguiente expresión en términos de las variables de estado: β = 2ξη p2ξ − p2η + 8m2 ωy2 ξη(ξ − η) ξ+η (10.160) y cumple un papel análogo al de la constante l cuando ωx = ωy . En efecto, cuando β 6= 0 los potenciales efectivos en los movimientos unidimensionales equivalentes tienen las siguientes expresiones: ξ Vef (ξ) = β 1 4mωy2 ξ 2 − ; 2 4mξ η Vef (η) = 1 β 4mωy2 η 2 + 2 4mη (10.161) De las gráficas de energı́a potencial efectiva se deducen los valores de retorno en ξ y η y por tanto las parábolas que envuelven las trayectorias en el plano x − y. Tales curvas envolventes se denominan “cáusticas”. La figura 10.9 muestra las cáusticas para diferentes signos de β y algunas de las trayectorias. La solución analı́tica en variables acción ángulo requiere evaluar las variables de acción y por medio de las ecuaciones (10.115) hallar las ecuaciones de la trayectoria. Al conocer la función E(Iξ , Iη ) se hallan las frecuencias ωξ , ωη que contendrán alguna relación racional de la forma (10.120) y luego se puede obtener una constante de movimiento adicional, de la forma (10.122). Es interesante notar que al separar el movimiento en coordenadas cartesianas hay una constante ligada a la degeneración que es (10.55). Tal constante es precisamente β. Para mostrar esto, notemos que las fórmulas de la transformación inversa a (10.150) son: p p x + x2 + y 2 −x + x2 + y 2 ξ= ; η= (10.162) 2 2 dado que los momentos están conectados por las fórmulas:      pξ ∂x/∂ξ ∂y/∂ξ px  =   pη py ∂x/∂η ∂y/∂η (10.163) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 445 y y η2 η1 ξ1 ξ2 ξ2 y η2 x x x ξ2 η2 β>0 β=0 β<0 Figura 10.9 Curvas envolventes o “cáusticas” para distintos valores de β se sigue que: pξ = pη = px + s −px + p −x + x2 + y 2 p py x + x2 + y 2 s p x + x2 + y 2 p py −x + x2 + y 2 (10.164) Reemplazando a (10.164) y (10.162) en (10.160) se sigue que: β = 2[ypx py + x(m2 ωy2 y 2 − p2y )] (10.165) Similarmente, la constante ligada a la degeneración en coordenadas parabólicas puede tomarse como E1 : ! ξp2ξ − ηp2η 1 E1 = + 2mωy2 (ξ − η)2 (10.166) 2m ξ+η 10.4. Problema de Kepler (coordenadas esféricas) El hamiltoniano para una partı́cula de masa m sometida al efecto de un centro de fuerzas inmóvil que crea un potencial −k/r es: ! p2ϕ 1 p2θ k 2 H(r, θ, pr , pθ , pϕ ) = pr + 2 + 2 − (10.167) 2m r r sen2 θ r Este problema admite la separación completa de variables en la ecuación de HamiltonJacobi, en la forma: Σ(r, θ, ϕ) = Σϕ (ϕ) + Σθ (θ) + Σr (r) (10.168) 446 / Mecánica clásica avanzada obteniéndose las siguientes ecuaciones diferenciales: 2 dΣϕ = lz2 dϕ r 2 dΣr dr dΣθ dθ 2 2 + (10.169) − 2mkr − 2mEr2 = −l2 (10.170) lz2 = l2 sen2 θ (10.171) donde l y lz son las constantes de separación. Los puntos de retorno en θ y r, donde pθ = 0 y pr = 0, están dados por: ! r k 2El2 rmax, min = − 1± 1+ ; 2E mk 2 sen θmax, min = ± (10.172) lz l La variable de acción Iθ está dada por: Z θmax r I r lz2 l2 2 2πIθ = 2 dθ = l − l2 − z2 dθ 2 sen θ sen θ θmı́n (10.173) donde se ha notado que pθ es positivo cuando θ se incrementa de θmı́n = sen−1 (lz /l) a θmax = π − θmı́n y es negativo cuando θ decrece de θmax a θmı́n , y que el integrando es una función par de θ. Con la sustitución η = sen2 θ, Iθ toma la forma: s Z l 1 l2 η − lz2 2πIθ = 2 dη (10.174) 1−η lz /l2 η y con la sustitución r −lz2 + l2 u x= 1−u (10.175) llegamos a: 2πIθ = 4 l2 − lz2 Z ∞ 0 (x2 x2 dx + lz2 )(x2 + l2 ) Descomponemos el integrando en fracciones parciales: Z ∞ Z ∞ dx dx 2 2 − lz 2πIθ = 4 l x2 + l2 x2 + lz2 0 0 (10.176) (10.177) para llegar finalmente a: Iθ = l − lz (10.178) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 447 Por otra parte, de (10.169) se sigue directamente: Iϕ = lz (10.179) Obteniendo las siguientes expresiones para las constantes l y lz en términos de las variables de acción: l = Iθ + Iϕ ; Ir está dado por: Z 2πIr = lz = lϕ rmax rmı́n pr dr − (10.180) Z rmı́n pr dr = 2 Z rmax pr dr (10.181) rmı́n rmax Llamando a y b a: a=− k ; 2E l b= √ −2mE (10.182) Podemos escribir a p2r como: " 2 2 # b a a 2 pr = −2mE −1 + 2 − r a r (10.183) De tablas de integrales estándar como la de Schaum’s hallamos: Z √ 2 √ Ar + Br + C Ar2 + Br + C dr = r B −2Ar − B + √ sen−1 √ 2 −A B 2 − 4AC (10.184) √ Br + 2C − −Csen−1 √ r B 2 − 4AC Por tanto: Z √ √ r−a pr dr = −2mE −r2 + 2ar − b2 + a sen−1 √ a2 − b 2 ar − b2 −1 √ −b sen r a2 − b 2 y teniendo en cuenta que: p rmin, max = a ± a2 − b2 llegamos a: Z rmax rmı́n pr dr = √ −2mE (a − b)π (10.185) (10.186) (10.187) 448 / Mecánica clásica avanzada De donde se tiene la siguiente expresión para E en función de Ir , Iθ , Iϕ : E=− mk 2 2(Ir + Iθ + Iϕ )2 (10.188) Entonces a y b en términos de las variables de acción toman la forma: a= (Ir + Iθ + Iϕ )2 ; mk b= (Iθ + Iϕ )(Iθ + Iϕ + Ir ) mk Σr y Σθ pueden escribirse como: Z p 1 1 Σr = (Ir + Iθ + Iϕ ) −r2 + 2ar − b2 dr a r Z s Iϕ2 1 1− dθ Σθ = (Iθ + Iϕ ) 2 (Iθ + Iϕ ) sen2 θ (10.189) (10.190) (10.191) Solución para el movimiento radial. Según la ecuación (10.115), la variable angular ϕr es: ϕr = ∂Σr ∂Σ = ∂Ir ∂Ir (10.192) Al derivar la integral (10.190) usamos las expresiones auxiliares: 2a ∂a = ; I = Ir + Iθ + Iϕ ∂I I " 2 # 2(1 − ǫ2 )a2 Iθ + Iϕ ∂ a2 = ∂I I I ǫ2 = 1 − ∂ ∂I Iθ + Iϕ I 1 I =− a a Por tanto: ϕr = 2 (10.193) (10.194) (10.195) Z p 1 1 −r2 + 2ar − (1 − ǫ2 )a2 dr a r Z dr +2 p 2 −r + 2ar − (1 − ǫ2 )a2 − 2 −(1 − ǫ )a Z r p −r2 (10.196) dr + 2ar − (1 − ǫ2 ) a2 Cada una de estas integrales es elemental y puede hallarse en el manual citado. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 449 El resultado, luego de simplificaciones, es: ϕr = − 1p 2 r−a −r + 2ar − (1 − ǫ2 )a2 + sen−1 a ǫa (10.197) A este resultado se puede llegar derivando respecto a I la expresión integrada Σr que se obtiene de (10.185). Definamos ahora una cantidad auxiliar y ası́: y= 1 − r/a ⇒ r = a(1 − ǫy) ǫ Con lo cual: p ϕr = −ǫ 1 − y 2 − sen−1 y (10.198) (10.199) Como Σ es indeterminada bajo la adición de una constante arbitraria, ϕr estará igualmente indeterminada bajo la adición de una constante, que llamaremos a. Introduciendo una nueva variable ψ, definida como: y = cos ψ y usando la circunstancia mencionada, obtenemos: π ϕr = −ǫ sen ψ − −ψ +α 2 (10.200) (10.201) Podemos escoger a α igual a π/2 con lo cual: ϕr = ψ − ǫ sen ψ (10.202) r = a(1 − ǫ cos ψ) (10.203) La ecuación (10.202) es la ecuación de Kepler, hallada en el capı́tulo 5. Vemos además que la variable angular ϕr coincide con la anomalı́a media M , en tanto que ψ es la anomalı́a excéntrica que, como sabemos, sirve para especificar la posición de la partı́cula en el plano de la órbita. En el ejemplo 5.3.1 se halló la solución analı́tica de la ecuación de Kepler en serie de Fourier. ϕr puede escribirse, de acuerdo con (10.77) en la forma: ϕr = ωr (t − t0 ) (10.204) Vemos que cuando ϕr = 0, ψ = 0 y r = rmı́n ; cuando ϕr = π, ψ = π y r = rmax ; cuando ϕr = 2π, ψ = 2π y r = rmı́n y ası́ sucesivamente. ωr es la frecuencia angular del movimiento radial que es periódico. Ejemplo 10.4.1 Expresar a r, x, y en términos de ϕr por medio de series de Fourier, donde x, y son unos ejes cartesianos en el plano de la órbita, con x a lo largo del eje mayor de la órbita y el origen es el centro de fuerzas. De la figura 5.14 se sigue que: x = r cos ϕv y y = r sen ϕv donde ϕv es la anomalı́a verdadera (ángulo entre r y x). 450 / Mecánica clásica avanzada Por otra parte, la ecuación de la órbita en el plano de la misma cuando se toma a x en la dirección del perihelio es: r= a(1 − ǫ2 ) 1 + ǫ cos ϕv (10.205) Por tanto, combinando (10.205) y (10.203): a(1 − ǫ2 ) − r = a(cos ψ − ǫ) ǫ p p y = r2 − x2 = a 1 − ǫ2 sen ψ x= (10.206) (10.207) Vemos que x y r son funciones pares de ψ en tanto que y es una función impar. Entonces podemos escribir: ∞ X 1 r = B0 + Bn cos(nϕr ) a 2 n=1 ∞ X 1 x Cn cos(nϕr ) = C0 + a 2 n=1 ∞ X y p = 1 − ǫ2 Dn sen (nϕr ) a n=1 Los coeficientes de Fourier son: Z Z r −2 π 2 πr cos(nϕr ) dϕr = sen (nϕr ) d Bn = π 0 a nπ 0 a Z Z −2 π x 2 πx cos(nϕr ) dϕr = sen (nϕr ) d Cn = π 0 a nπ 0 a Z π 2 y √ Dn = sen (nϕr ) dϕr π 0 a 1 − ǫ2 Z π 2 y √ = cos nϕr d nπ 0 a 1 − ǫ2 (10.208) (10.209) (10.210) (10.211) (10.212) (10.213) donde se han realizado integraciones por partes. Usando (10.206), (10.207) y (10.203) llegamos a las siguientes expresiones con integrales sobre ψ. Z 2ǫ π sen [n(ψ − ǫ sen ψ)] sen ψ dψ (10.214) Bn = − nπ 0 Z π 2 Cn = sen [n(ψ − ǫ sen ψ)] sen ψ dψ (10.215) nπ 0 La ecuación de Hamilton-Jacobi con variables acción-ángulo / 451 Dn = 2 nπ Z π 0 cos[n(ψ − ǫ sen ψ)] cos ψ dψ (10.216) Procediendo como en el ejemplo 5.3.1, usando la definición integral de las funciones de Bessel enteras, llegamos a: Bn = ǫ 2ǫ [Jn+1 (ǫn) − Jn−1 (ǫn)] = − Jn′ (ǫn) n n (10.217) Cn = 1 2 [Jn−1 (ǫn) − Jn+1 (ǫn)] = Jn′ (ǫn) n n (10.218) Dn = 2 Jn (ǫn) ǫn (10.219) B0 y C0 deben calcularse por separado. El resultado es: B0 = 2 + ǫ 2 ; C0 = −3ǫ (10.220) Entonces, finalmente: ∞ X 1 ǫ2 r =1+ +ǫ [Jn+1 (ǫn) − Jn−1 (ǫn)] cos(nϕr ) a 2 n n=1 ∞ X 1 3 x =− ǫ+ [Jn−1 (ǫn) − Jn+1 (ǫn)] cos(nϕr ) a 2 n n=1 ∞ X 2p y 1 1 − ǫ2 = Jn (ǫn) sen (nϕr ) a ǫ n n=1 (10.221) (10.222) (10.223) Es interesante notar que el sistema formado por dos partı́culas cargadas, ligado, emite radiación electromagnética. El momento de dipolo del sistema, d~ = Z1 e~r1 + Z2 e~r2 , donde Z1 y Z2 tienen signos opuestos, se puede escribir, usando las fórmulas (5.1), como: Z1 Z2 ~ d = µe ~r (10.224) − m1 m2 donde µ es la masa reducida. Las ecuaciones (10.221) a (10.223) muestran que el momento de dipolo se puede expandir en serie de Fourier y la intensidad radiada de frecuencia nω0 , donde ω0 = ϕ̇r está dada por la fórmula: In = ω04 n4 ~ dn 3c3 2 (10.225) Como d~n es un vector en el plano de la órbita, se han de considerar las contribuciones de x y y a la radiacion de frecuencia nω0 . El resultado es: 2 1 − ǫ2 2 Z2 Z1 64n2 E 4 Jn′2 (ǫn) + − J (ǫn) (10.226) In = 3 2 2 n 3c Z1 Z2 m1 m2 ǫ2 452 / Mecánica clásica avanzada ver Landau, Teorı́a de campos, sección 70. Solución para el movimiento en θ. La variable angular ϕθ es: ϕθ = ∂Σ ∂Σr ∂Σθ = + ∂Iθ ∂Iθ ∂Iθ (10.227) Notando que: p 2a2 p ∂ 1 − ǫ2 1 + 1 − ǫ2 [(1 − ǫ2 ) a2 ] = ∂Iθ I (10.228) r − (1 − ǫ2 )a ∂Σr = ϕr − sen−1 ∂Iθ ǫr (10.229) y mediante un cálculo similar al que conduce a (10.196) obtenemos: Por otra parte, de (10.191) se sigue: Z ∂Σθ sen θ dθ s = 2 ∂Iθ Iϕ 2 sen θ − Iθ + Iϕ (10.230) y con el cambio de variable u = sen2 θ: Z ∂Σθ 1 du q = ∂Iθ 2 2 [u − Iϕ /(Iθ + Iϕ )2 ] (1 − u) (10.231) La fórmula (14.120) del manual citado nos conduce finalmente a: ∂Σθ cos θ = sen−1 q ∂Iθ 1 − Iϕ2 /(Iθ + Iϕ )2 si llamamos γ a: s γ= 1− (10.232) Iϕ2 (Iθ + Iϕ )2 (10.233) obtenemos de (10.231), (10.229) y (10.227): " r [r − (1 − ǫ2 ) a ]2 cos θ 1− ϕθ − ϕr = sen−1 γ ǫ2 r 2 2 − r − (1 − ǫ ) a ǫr s 1− 2  (10.234) cos θ  γ2 Donde hemos usado la fórmula: p p sen−1 A − sen−1 B = sen−1 A 1 − B 2 − B 1 − A2 (10.235) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 453 Definamos las cantidades auxiliares siguientes: L= r − (1 − ǫ2 ) a ; ǫr M= L ; γ S = sen (ϕθ − ϕr ) (10.236) Entonces (10.234) toma la forma: r p 1 S = cos θ − M 2 − M γ 2 − cos2 θ 2 γ (10.237) y despejando a cos θ obtenemos: p p cos θ = γS 1 − M 2 γ 2 ± γ 2 M 1 − S 2 (10.238) Para hallar la dependencia de cos θ, notamos que L tiene la siguiente expresión en términos de ψ: L= ǫ − cos ψ 1 − ǫ cos ψ (10.239) Entonces: √ sen (ϕθ − ϕr ) 1 − ǫ2 sen ψ − cos(ϕθ − ϕr )(ǫ − cos ψ) cos θ = γ (1 − ǫ cos ψ) (10.240) donde hemos tomado el signo negativo en (10.238) para hacer la expresión compatible con el caso en que la órbita está colocada completamente en el plano x − z. Despejando a M en términos de cos θ obtenemos: M =− p Sp 2 1 cos θ γ − cos θ ± 1 − S2 γ2 γ2 (10.241) y usando las definiciones (10.236), llegamos a la siguiente expresión para la ecuación de la órbita en términos de las variables acción-ángulo: r (Iθ + Iϕ )2 ( 1− 1 1 I2 I2 1+ s = 2 r (Iθ + Iϕ ) a Iϕ2 1− (Iθ + Iϕ )2 (10.242) " × sen (ϕθ − ϕr ) s sen2 θ Iϕ2 − ± cos(ϕθ − ϕr ) cos θ (Iθ + Iϕ )2 #) Si la partı́cula se mueve sobre un plano que contiene al eje z, no tendrá componente del momento angular en ese eje, o sea Iϕ = 0. En ese caso, según (10.172), θmı́n = 0 y θmax = π, y según (10.233), γ = 1. Entonces (10.242) toma la forma: ( ) r Iθ2 I2 1 1 1 ± 1 − 2 cos[θ ∓ (ϕθ − ϕr )] (10.243) = 2 r Iθ a I 454 / Mecánica clásica avanzada Si tomamos el signo positivo y definimos a θ0 como: θ0 = ϕθ − ϕr (10.244) llegamos a la fórmula conocida: 1 1 + ǫ cos(θ − θ0 ) = r a(1 − ǫ2 ) (10.245) Entonces θ0 es la dirección del vector absidal del perihelio respecto al eje z, o sea la orientación de la elipse. Las frecuencias asociadas a los movimientos en r, ϕ y θ son iguales, pues (10.188) conduce a: mK 2 ∂E (10.246) = ∂I I3 Según (10.120) y (10.122), habrán dos constantes de movimiento asociadas a la degeneración: ωr = ωθ = ωϕ = ϕr − ϕθ y ϕϕ − ϕθ (10.247) Cuando Iϕ = 0, la órbita está colocada en el plano z − x′ , donde x′ hace un ángulo cualquiera con el eje x. θ0 es el ángulo entre los ejes x y z, como se muestra en la figura 10.10. x- z y- θ0 x′ θ Figura 10.10 Órbita en el plano z − x′ Cuando Iϕ = 0 y θ0 = 0, la ecuación (10.240) da la siguiente relación entre θ y ψ: r 1−ǫ ψ θ cot (10.248) cot = 2 1+ǫ 2 En general, para una órbita con orientación arbitraria y con el plano de la órbita fuera del plano zx′ tenemos: θ0 = ϕθ − ϕr ; cos θmin = γ ; cos θmax = π − θmin (10.249) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 455 En términos de estos ángulos la ecuación general de la órbita es: 1 ǫ 1 1+ = r (1 − ǫ2 ) a cos θmı́n √ cos θ0 cos θ + sen θ0 sen2 θ − sen2 θmı́n (10.250) Solución para el movimiento en ϕ. ϕϕ está dada por: ϕϕ = ∂Σ ∂Σr ∂Σθ ∂Σϕ = + + ∂Iϕ ∂Iϕ ∂Iϕ ∂Iϕ (10.251) De (10.229) vemos que: r − (1 − ǫ2 ) a ∂Σr = ϕr − sen−1 ∂Iϕ ǫr (10.252) De (10.191) se sigue: ∂Σθ = ∂Iϕ Z s 1− Iϕ 1 Iθ + Iϕ sen2 θ Iϕ2 1 1− (Iθ + Iϕ )2 sen2 θ dθ (10.253) El cambio de variable: s cos2 θ v= 2 sen θ − (1 − γ 2 ) nos lleva a: Z dθ p sen4 θ − (1 − γ 2 ) sen2 θ (10.254) =− Z dv 1 + v 2 (1 − γ 2 ) p 1 −1 1 − γ2] tan [v =− 1 − γ2 (10.255) Entonces (10.252), (10.253), (10.255) junto con (10.230) nos conducen a: p (10.256) ϕϕ = ϕθ + tan−1 [v 1 − γ 2 ] + ϕ Resolviendo para v hallamos: 1 v=p tan(ϕϕ − ϕθ − ϕ) 1 − γ2 (10.257) que equivale a la siguiente ecuación cuadrática en cos θ: (1 − γ 2 ) cos2 θ + tan2 (ϕϕ − ϕθ − ϕ) cos2 θ −γ 2 tan2 (ϕϕ − ϕθ − ϕ) = 0 (10.258) 456 / Mecánica clásica avanzada por tanto: cos θmı́n tan(ϕϕ − ϕθ − ϕ) cos θ = p sen2 θmı́n + tan2 (ϕϕ − ϕθ − ϕ) (10.259) o si se quiere: sen θmı́n cos θ tan(ϕϕ − ϕθ − ϕ) = √ 2 cos θmı́n − cos2 θ (10.260) Usando (10.238) obtenemos esta expresión para la dependencia temporal de ϕ: tan(ϕϕ − ϕθ − ϕ) = sen θmı́n √ − cos θ0 (ǫ − cos ψ) + sen θ0 1 − ǫ2 sen ψ √ sen θ0 (ǫ − cos ψ) + cos θ0 1 − ǫ2 sen ψ (10.261) Cuando la órbita está en el plano x − y, Iθ = 0, o sea γ = 0. Entonces θmı́n = θmax = π/2 = θ. En consecuencia, si tomamos θ0 = 0, −ǫ + cos ψ tan(ϕϕ − ϕθ − ϕ) = √ 1 − ǫ2 sen ψ (10.262) de donde: √ 1 − ǫ2 sen ψ cos(ϕϕ − ϕθ − ϕ) = = 1 − ǫ cos ψ r 1 − ǫ2 p 2 2 a ǫ − (a − r)2 ǫr (10.263) que nos conduce a una ecuación similar a la (10.245), pero esta vez para la órbita en el plano x − y. Entonces el ángulo que hace el vector absidal del perihelio respecto al eje x, cuando θ0 = 0, es: ϕ0 + π 2 donde ϕ0 = ϕϕ − ϕθ (10.264) Cuando la órbita está en el plano z − x′ , Iϕ = 0 y sen θmı́n = 0 entonces tan(ϕϕ − ϕθ − ϕ) = 0. Por tanto en este caso el ángulo ϕ es constante y vale ϕ0 , que es el ángulo que hace la lı́nea de intersección entre el plano vertical de la órbita y el plano x − y. En general, para Iϕ y Iθ arbitrarios, el plano de la órbita y el plano x − y se cortan en la lı́nea Ox′ , llamada lı́nea de nodos. La curva cruza el plano xy cuando θ = π/2 y cuando θ = 3π/2. En esos puntos, según (10.260), ϕ vale ϕ0 . En conclusión, ϕ0 es el ángulo de la lı́nea de nodos respecto al eje x. ϕ0 es el acimut de la partı́cula cuando θ = π/2 y π + ϕ0 es el acimut cuando θ = 3π/2. Como ϕ es una variable cı́clica, pϕ es constante de movimiento, cuyo valor es igual al de Iϕ cuya variable canónica conjugada es ϕϕ . Por medio de una transformación canónica es posible hacer que las variables acción-ángulo sean (Ir + Iθ + Iϕ , ϕr ), (Iθ + Iϕ , ϕθ − ϕr ) y (Iϕ , ϕϕ − ϕθ ), con lo cual vemos que l y θ0 son variables canónicas conjugadas, lo mismo que lz y ϕ0 . Como sabemos, θ0 y ϕ0 en tanto que variables angulares son no uniformes pues al completar un ciclo sobre las lı́neas γθ0 y γϕ0 del toroide no regresan a su valor original La ecuación de Hamilton-Jacobi con variables acción-ángulo / 457 sino que aumentan en 2π, pero esto no tiene efecto sobre las fórmulas ya que aparecen en funciones trigonométricas. Los ejes x, y, z fijos a la órbita, se pueden ubicar respecto a los ejes x, y, z mediante los ángulos de Euler que denotaremos ϕ′ , θ′ , ψ ′ definidos en la sección 7.6. ϕ′ es el ángulo entre x′ y x, θ′ el ángulo entre z y z y el ψ ′ ángulo entre x y x′ , donde el eje x′ coincide con la lı́nea de nodos. (Véase figura 10.11). ϕ′ , θ′ , ψ ′ están relacionados con θ0 , ϕ0 mediante: ϕ′ = ϕ0 ; θ′ = π − θmı́n ; 2 ψ′ = π − θ0 2 (10.265) z z θ′ θmin y′ y α θ0 x ψ′ y ϕ′ x′ Figura 10.11 Los ejes x, y y z están fijos a la órbita y ubicados respecto a x, y y z mediante los ángulos de Euler. x, y están sobre el plano de la órbita. El ángulo entre el vector absidal del perihelio, eje x, y el eje z, es α, cuyo coseno es el elemento 1 − 3 de la matriz que conecta los ejes x, y, z con los ejes x, y, z: cos α = sen ψ ′ sen θ′ = cos θmin cos θ0 (10.266) ~ = ǫ~ex , por tanto Puede mostrarse que el vector de Runge-Lenz tiene la expresión A Az = ǫ cos α. I determina la longitud del semieje mayor de la órbita a, en tanto que I y Iθ + Iϕ determinan la excentricidad. Concluimos que las variables acción-ángulo determinan la forma y tamaño de la órbita, lo mismo que su orientación en el espacio. I además determina la frecuencia y ϕr determina la posición de la partı́cula sobre la órbita. ϕ0 , θ0 , ϕr , Iϕ , Iθ + Iϕ , I son conocidas como los elementos de Delaunay de la órbita en astronomı́a. Ejemplo 10.4.2 Hallar las expansiones de Fourier para z y x ± iy. 458 / Mecánica clásica avanzada De la matriz de rotación en términos de los ángulos de Euler se sigue: z = sen θ′ sen ψ ′ x + sen θ′ cos ψ ′ y (10.267) Entonces, usando (10.265): z = cos θmı́n (cos θ0 x + sen θ0 y) (10.268) x y y están dados por (10.222) y (10.223). En consecuencia: ( ∞ −iϕr X e 3 Jn′ (nǫ) cos nϕr z = aγ − ǫ−iϕr + 4 n n=1 √ ) 1 − ǫ2 eiϕθ −i Jn (nǫ) sen nϕr ǫ +aγ ( ∞ iϕr X e 3 − ǫeiϕr + 4 n n=1 (10.269) Jn′ (nǫ) cos nϕr √ ) 1 − ǫ2 e−iϕθ +i Jn (nǫ) sen nϕr ǫ Igualmente de la matriz de rotación obtenemos: x + iy = [(cos ψ ′ cos ϕ′ − cos θ′ sen ϕ′ sen ψ ′ ) +i(cos ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ sen ψ ′ )] x (10.270) + [(−sen ψ ′ cos ϕ′ − cos θ′ sen ϕ′ cos ψ ′ ) +i(−sen ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ cos ψ ′ )] y Usando nuevamente (10.265), (10.206) y (10.209) llegamos a: h p x + iy = a sen θ0 + i 1 − γ 2 cos θ0 (cos ψ − ǫ) √ i p 1 − ǫ2 sen ψ ǫiϕ0 + − cos θ0 + i 1 − γ 2 sen θ0 Finalmente, usando (10.222) y (10.223) llegamos a: ! " ∞ −iϕr X p e 3ǫ Jn′ (nǫ) cos nϕr − e−iϕr + x + iy = i −1 + 1 − γ 2 4 n n=1 # ∞ −iϕr √1 − ǫ2 X p e 2 Jn (nǫ) sen nϕr eiϕϕ − −1 − i 1 − γ ǫ n n=1 " ! ∞ −iϕr X p 3ǫ e + i 1 + 1 − γ2 − e−iϕr + Jn′ (nǫ) cos nϕr 4 n n=1 (10.271) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 459 p − 1 + i 1 − γ2 ! ∞ # √ 1 − ǫ2 X e−iϕr Jn (nǫ) sen nϕr ei(ϕϕ −2ϕθ ) ǫ n n=1 (10.272) Vemos que se anulan todos los coeficientes de Fourier para los cuales nϕ y nθ son diferentes de: nϕ = 0, 1, −1 ; nθ = 0, ±2 En cuanto a n no hay ninguna restricción. Según la fórmula (10.225), para este caso se tiene: h i ω4 4 2 2 In, nθ , nϕ = 03 τn, An, nθ , nϕ + Bn, nθ , nϕ nθ , nϕ 3c (10.273) (10.274) donde τn, nθ , nϕ es un número que describe el orden del armónico de ω0 radiado, y A y B son los coeficientes de Fourier de z y de x + iy respectivamente. Vemos que solamente es posible la radiación asociada a los nθ y nϕ dados por (10.273). Las fórmulas (10.269) y (10.272) pudieron también obtenerse directamente de (10.240) y de (10.256). Ejemplo 10.4.3 Mostrar que el vector de Runge-Lenz (o de Laplace) es una constante de movimiento asociada a la degeneración del movimiento en el problema de Kepler. ~ es constante: Es simple mostrar que el vector A ~ = p~ × ~l − mk ~r A r (10.275) ~ · ~l = 0, se sigue que A ~ es un vector fijo en el plano de la órbita. Tomando Como A ~ con ~r obtenemos: el producto escalar de A Ar cos ϕv = l2 − mkr (10.276) Comparando con la ecuación de la órbita vemos que la magnitud de A es esencialmente ǫ: A = mkǫ (10.277) ~ es independiente de las Se sigue entonces que sólo una de las componentes de A ~ ~ está en la dirección constantes de movimiento E y l. De (10.276) se sigue también que A del perihelio, de donde se concluye que salvo el factor mk: ~ = ǫ~ex ; A Az = ǫ cos α (10.278) Como cos α tiene la expresión (10.266), se sigue que Az depende esencialmente de la constante θ0 = ϕθ − ϕr , que sabemos es constante debido a la degeneración del movimiento y además es independiente de ~l y E. También sabemos que la existencia de este tipo de constantes está asociada a la posibilidad de separar las variables en otro sistema de coordenadas. En efecto, según veremos, A es precisamente la constante que aparece al separar variables en coordenadas parabólicas. 460 / Mecánica clásica avanzada Ejemplo 10.4.4 Mostrar que las constantes de movimiento lx , ly están asociadas a la degeneración del movimiento angular en un problema de fuerzas centrales. De las fórmulas (5.23) en la sección 5.1 sabemos que: lx = −pθ sen ϕ − pϕ cot θ cos ϕ ; (10.279) ly = pθ cos ϕ − pϕ cot θ sen ϕ Que pθ y pϕ tienen las siguientes expresiones es válido en cualquier problema de fuerzas centrales: r l2 pθ = l2 − z2 ; pϕ = lz (10.280) sen θ donde l y lz son las constantes de separación en coordenadas esféricas. Para precisar, adoptemos los resultados en el movimiento kepleriano. Según (10.258) se cumple: p 1 − γ2 sen θ = p 2 1 − γ cos2 (ϕ − ϕ0 ) (10.281) −r sen (ϕ − ϕ0 ) cos θ = p 1 − γ 2 cos2 (ϕ − ϕ0 ) lx puede escribirse en la forma siguiente usando (10.260): p sen ϕ − lz cot θ cos ϕ lx = −l γ 2 − cos2 θ sen θ ! p l 1 − γ 2 sen ϕ = − lz cos ϕ cot θ tan (ϕ − ϕ0 ) (10.282) Entonces, usando (10.281) llegamos a: lx = l cos θmı́n sen ϕ0 (10.283) similarmente, ly = −l cos θmı́n cos ϕ0 (10.284) Estos resultados son válidos para fuerzas centrales en general y no sólo en el caso kepleriano, ya que independientemente de la forma del potencial la energı́a depende de Iθ y Iϕ en la combinación Iθ + Iϕ , lo cual da lugar a que: ωθ = ωϕ (10.285) en cualquier problema de fuerzas centrales y por tanto ϕ0 = ϕϕ − ϕθ es una constante de movimiento, lo que a su vez implica que lx y ly sean constantes. l, lz y lx2 + ly2 = l2 cos2 θmin = l2 −lz2 son constantes de movimiento especiales de las coordenadas esféricas y por lo tanto sólo dependen de las variables de acción. lx y ly son constantes que La ecuación de Hamilton-Jacobi con variables acción-ángulo / 461 dependen de las variables angulares 6 ϕθ y ϕϕ a través de ϕ0 y están asociadas a la posibilidad de separar el movimiento angular del radial en coordenadas esféricas donde el eje polar es reemplazado por x o por y. Que lx y ly dependan de las variables angulares es resultado de la propiedad general del vector momento angular consistente en que no existe una transformación canónica en que lx , ly , lz sean simultáneamente momentos generalizados. En efecto, en el ejemplo 9.8.4 se muestra que las componentes de ~l no están en involución entre sı́: [li , lj ] = ǫijk lk ; i, j, k = x, y, z (10.286) Notemos que (10.286) es una propiedad de los li que sabemos son los generadores infinitesimales del grupo de rotaciones. Se dice que ~l tiene un álgebra de Lie cuyas constantes de estructura son ǫijk . Ejemplo 10.4.5 Mostrar la invariancia bajo el grupo O(4). ~ y ~l podemos formar los vectores J~ y K ~ definidos como: Con los vectores A 1 1 ~ ~ ; ~ = 1 ~l − √ 1 l+ √ J~ = A K (10.287) ~ 2 2 −2mE −2mE A Estos vectores están en involución entre sı́, mas no sus componentes: [Ji , Jj ] = ǫijk Jk , [Ki , Kj ] = ǫijk Kk , [Ji , Kj ] = 0 (10.288) ~ tienen cada uno un álgebra de Lie como la del grupo de rotaPor tanto J~ y K ciones. Concluimos que el hamiltoniano de una partı́cula ligada en un potencial −k/r es invariante bajo dos grupos de rotaciones independientes. Estos grupos son subgrupos de un grupo más general, el de las rotaciones ortogonales O(6). La representación O(6) es reducible siendo una de sus representaciones irreducibles O(4). Como, según vimos en la sección 7.8, existe un homomorfismo entre O(3) y SU (2), entonces podemos ver que hay un homomorfismo entre las representaciones O(4) y SU (2) ⊗ SU (2). Vemos que la degeneración del sistema que consideramos resulta del hecho de ser invariante el hamiltoniano bajo un grupo de simetrı́a más amplio que el grupo de rotaciones. ~ K ~ y H sólo existen 5 constantes inEntre las siete constantes de movimiento J, 2 2 dependientes, que podemos tomar como J , K , Jz , Kz , H pues existen dos relaciones entre ellas, provenientes de: ~ · ~l = 0 ; J~ − K 2 ~ J~ − K = mkaǫ2 (10.289) De (10.288) puede verse que estas cinco constantes no están en involución. Por tanto si se halla un sistema de coordenadas en que J 2 y K 2 sean constantes de separación, necesariamente Jz y Kz dependerán de variables angulares. 6 Puede verse que los “buenos números cuánticos” están asociados precisamente con las variables dinámicas que no dependen de variables angulares. 462 / Mecánica clásica avanzada 10.5. Problema de Kepler (coordenadas parabólicas) Las coordenadas parabólicas en tres dimensiones son una generalización de las definidas en el ejemplo 10.3.5. p p x = 2 ξn cos ϕ ; y = 2 ξn sen ϕ ; z =ξ−n (10.290) donde ϕ es el ángulo acimutal. Las fórmuIas inversas son: ξ= 1 θ (z + r) = r cos2 2 2 η= θ 1 (−z + r) = r sen2 2 2 (10.291) y x Con un procedimiento análogo al del ejemplo 10.3.5 llegamos a: s Z p2ϕ 2mK1 2mE + − 2 dξ Σ(ξ, η, ϕ; E, K, pϕ ) = ξ 4ξ ϕ = tan−1 + Z s 2mE + 2mK2 − η p2ϕ 4η 2 dη + ϕpϕ (10.292) (10.293) Las constantes de separación K1 y K2 satisfacen: K1 + K2 = K ; 0 ≤ K1 ≤ K Las variables de acción son definidas por: s I p2ϕ 2mK1 dξ 2πIξ = 2mE − 2 + 4ξ ξ s I p2ϕ 2mK2 2πIη = 2mE − 2 + dη 4η η 2πIϕ = 2πpϕ (10.294) (10.295) (10.296) (10.297) De la siguiente ecuación, dada en Goldstein, que se deduce similarmente a la integral de (10.134) en el ejemplo 10.3.4, I r √ C 2B B (10.298) − 2 dr = 2πi A+ −C + √ r r A obtenemos: Iξ , η = i pϕ mK1,2 i +√ 2 2mE (10.299) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 463 que junto con (10.297) nos conduce a la siguiente expresión para la energı́a en términos de las variables de acción parabólicas: E=− mk 2 2(Iξ + Iη + Iϕ )2 (10.300) Si definimos a I como: I = Iξ + Iη + Iϕ (10.301) llegamos a la siguiente expresión para las constantes K1 y K2 en términos de las variables de acción: K1,2 = K 2Iξ,η + Iϕ 2I (10.302) Es conveniente definir una sola constante, pues K1 y K2 están relacionadas por (10.294): β= K1 − K2 Iξ − Iη = ; K I −1 ≤ β ≤ 1 (10.303) Veremos que β coincide con la componente z del vector de Runge-Lenz (véase en Mecánica cuántica de Laudau, sección 37). Entonces K1 y K2 tienen la siguiente expresión en términos de β: K1 = 1+β K; 2 K2 = 1−β K 2 (10.304) Ejercicio 10.5.1 Expresar a K1 y K2 en coordenadas parabólicas. Luego, usando las fórmulas de transformación expresar a β en coordenadas cartesianas y mostrar que coincide con la componente z del vector de Laplace. Variables angulares ϕξ y ϕη . De (10.293) se sigue que: ϕξ = Z m s ∂E m ∂K1 + ∂Iξ ξ ∂Iξ p2ϕ 2mK1 − 2 2mE + ξ 4ξ dξ (10.305) + Z s ∂E m ∂K2 m + ∂Iξ η ∂Iξ p2ϕ 2mK2 − 2 2mE + η 4η dη De (10.300) y (10.302) se siguen: ωξ = ωη = ωϕ = 2E mk 2 ∂E = 3 =− ∂I I I (10.306) 464 / Mecánica clásica avanzada y, ∂K1,2 K2 =± ; ∂Iξ I K1 ∂K1,2 =∓ ; ∂Iη I K1 − K2 ∂K1,2 =∓ ∂Iϕ I (10.307) Por tanto: ϕξ = + Z Z − s 2mE mK1 + I ξI p2ϕ 2mK1 2mE + − 2 ξ 4ξ s dξ (10.308) 2mE mK 2 − − I ηI p2ϕ 2mK2 2mE + − 2 η 4η dη ϕη tiene una expresión análoga, colocando η, en lugar de ξ y K1 en lugar de K2 . Definimos a y γ ası́: a= I2 ; mk γ= Iϕ I (10.309) los puntos de retorno en ξ y ϕ están dados por: s ! 1+β γ2 1± 1− ; ξmax,min = a 2 (1 + β)2 ηmax,min = a 1−β 2 1± s 1− 2 γ (1 − β)2 ! (10.310) Las fórmulas 14.281 y 14.280 del Manual de fórmulas y tablas matemáticas de Spiegel nos dan para ϕξ : s 2 ξ ξ γ2 ϕξ = − − + (1 + β) − a a 4 r η 2 η γ2 − − + (1 − β) − + a a 4 −sen−1 2 ξ 1− 1+β a s γ2 1− (1 + β)2 ϕη tiene una expresión análoga intercambiando ξ con η y 1 + β con 1 − β. (10.311) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 465 Si definimos a θ1 , Lξ y Lη ası́: 7 2ξ 1− (1 + β) a θ1 = ϕξ − ϕn ; Lξ = s ; γ2 1− (1 + β)2 2η 1− (1 − β) a Lη = s γ2 1− (1 + β)2 (10.312) obtenemos: 2ξ 2η , = a a 1− s γ2 1− Lξ , η (1 ± β)2 ! (1 ± β) (10.313) y, θ1 = −sen−1 Lξ + sen−1 Lη (10.314) Además, q 1p (1 + β)2 − γ 2 1 − L2ξ 2 q 1p − (1 − β)2 − γ 2 1 − L2η − sen2 Lξ,η 2 ϕξ,η = − (10.315) Ahora definamos dos nuevas variables (anomalı́as excéntricas): Lη = sen αη ; Lξ = sen αξ (10.316) Entonces (10.314) y (10.315) se convierten en: θ1 = −αξ + αη ϕξ = − 1p (1 + β)2 − γ 2 cos αξ 2 (10.318) 1p (1 + β)2 − γ 2 cos(αη − θ1 ) 2 (10.319) 1p − (1 + β)2 − γ 2 cos(θ1 + αξ ) − αξ 2 ϕη = − 7 Como (10.317) 1p − (1 + β)2 − γ 2 cos αη − αη 2 se cumple (10.306), se sigue que θ1 es una constante de movimiento asociada a la degeneración. 466 / Mecánica clásica avanzada Las fórmulas (10.318) y (10.319) son ecuaciones trascendentales que permiten en principio expresar a αξ y αη en función de las variables angulares y en consecuencia de (10.313) expresar a ξ y η en función del tiempo, en efecto: ξ= η= p 1 a 1 + β − (1 + β)2 − γ 2 sen αξ 2 (10.320) p 1 a 1 − β − (1 − β)2 − γ 2 sen αη 2 (10.321) De (10.314) se obtiene una ecuación que relaciona a ξ con η y que constituye la ecuación de la órbita en coordenadas parabólicas. El resultado es: s ( 2η a (1 + β)2 − γ 2 1+β− cos θ1 1 − β − ξ= 2 (1 − β)2 − γ 2 a (10.322) #) r 2 4η 4η + −γ 2 + (1 − β) − 2 sen θ1 a a Relación con la solución en coordenadas esféricas. Empecemos por expresar a ǫ en términos de γ, β y θ1 . Para ello basta hallar una expresión para r = ξ + η usando (10.320) y (10.321): r 1 + β2 − γ2 1p r (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1 =1− + a 2 2 (10.323) (1) × cos(αξ − αξ ) Donde: (1) tan αξ p p (1 + β)2 + γ 2 + (1 − β)2 + γ 2 cos θ1 p = (1 − β)2 − γ 2 sen θ1 Comparando (10.323) con (10.203) cuando r = rmax , obtenemos: r 1 + β2 − γ2 1p (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1 ǫ= + 2 2 (10.324) 8 (10.325) Por otra parte, z, en coordenadas parabólicas y en esféricas es: 8 Esta 1p z 1p (1 + β 2 ) − γ 2 sen αξ + (1 − β)2 − γ 2 sen αη =β− a 2 2 r i z 1 − ǫ2 − γ 2 h p 2 sen ψ sen θ − (ǫ − cos ψ) cos θ − = 1 − ǫ 0 0 a 1 − ǫ2 (10.326) (10.327) fórmula nos muestra que los valores de β y γ no son arbitrarios: si β > 0, 0 ≤ |γ| ≤ 1 − β y si β < 0, 0 ≤ |γ| ≤ 1 + β. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 467 Estas expresiones equivalen a: # " r 1+β 2 −γ 2 1 p (2) 2 2 2 2 4 z = a β+ (1−β ) −2γ (1+β )+γ cos θ1 cos(αξ −αξ ) (10.328) − 2 2 z=a r (2) i p 1 − ǫ2 − γ 2 h 2 sen2 θ cos(ψ − ψ (1) ) 1 − ǫ −ǫ cos θ − 0 0 1 − ǫ2 y ψ (1) se definen ası́: p p − (1 + β)2 − γ 2 + (1 − β)2 − γ 2 cos θ1 (2) p tan αξ = (1 − β)2 − γ 2 sen θ1 √ 1 − ǫ2 sen θ0 tan ψ (1) = cos θ0 (10.329) donde αξ De (10.328) se sigue que: máx 2 zmı́n 2 = 1 + β 2 − γ 2 − ǫ2 = β 2 + (1 − ǫ2 ) cos2 θmı́n −β a En tanto que de (10.329): p máx zmı́n = a cos θmı́n −ǫ cos θ0 ± 1 − ǫ2 sen2 θ0 máx De (10.332) y (10.333) obtenemos para β en términos de zmı́n : 2 mı́n zmáx /a + (ǫ2 − 1) cos2 θmı́n β= mı́n /a 2zmáx = (10.330) (10.331) (10.332) (10.333) (10.334) −ǫ cos θ0 cos θmı́n Esto nos muestra que β es esencialmente la componente z del vector de Runge-Lenz: en coordenadas parabólicas depende sólo de variables de acción, pero en coordenadas esféricas depende además de variables angulares. Por otra parte, de (10.325) y (10.334) se tiene la siguiente expresión para cos θ1 en términos de γ, ǫ y cos θ0 , donde se ha llamado C a cos2 θmin : −C + ǫ2 (1 + C sen2 θ0 ) p C 2 − 2ǫ2 C(1 − 2 sen2 θ0 + C sen2 θ0 ) + ǫ4 (1 − C sen2 θ0 )2 (10.335) Cuando la órbita toca el eje z, sen θmı́n = 0. Entonces: cos θ1 = −1 + 2ǫ2 − ǫ2 cos2 θ0 1 − ǫ2 cos2 θ0 (10.336) esto nos permite llegar de (10.322), cuando γ = 0, al expresar a β, θ1 , ξ, η en función de las cantidades esféricas, a la fórmula (10.245). (10.322) es, pues, la ecuación de una elipse en el espacio expresada en coordenadas parabólicas (véase figura 10.12). 468 / Mecánica clásica avanzada También de (10.334) y (10.325) se llega a una expresión para cos θ0 en términos de γ, β y cos θ1 . Las coordenadas ξ y η oscilan entre los lı́mites señalados por la ecuación (10.310). Cuando γ = 0, ξmı́n = ηmı́n = 0. Cuando β = 0, ξmáx = ηmáx y ξmı́n = ηmı́n . Cuando β = γ − 1, ξmı́n = ξmáx y cuando β = 1 − γ, ηmı́n = ηmáx . En general, la trayectoria está confinada a una región en forma de anillo, definida por las paraboloides ξ = ξmı́n , ξ = ξmáx , η = ηmı́n , η = ηmáx . z η = ηmín η = ηmáx ξ = ξmáx ξ = ξmín Figura 10.12 Lı́mites del movimiento en coordenadas parabólicas En el caso β = 0, γ = 1, resulta que ηmı́n = ηmax = ξmı́n = ξmax = a/2 y por tanto el anillo queda reducido a una circunferencia de radio a colocada en el plano x − y. En este caso según (10.325) ǫ = 0, como debe ser. Cuando β = γ − 1 o β = −γ + 1, el movimiento sólo es posible a lo largo de curvas colocadas sobre la superficie de un casquete lateral. Las órbitas compatibles con valores dados de E, β, γ se caracterizan por tener un vector de Runge-Lenz con componente z definida, por tener un momento angular con componente z definida y por tener un semieje mayor de longitud definida. El ensamble de órbitas con valores de E, β, γ definidos no tienen una excentricidad definida, aunque la ecuación (10.325) fija el rango de excentricidades posibles. Puede mostrarse que Iβ /2 y θ1 son variables canónicamente conjugadas, en tanto que [Iϕ , θ1 ] = 0. Como de (10.287) se puede hallar que: 1 1 (Iϕ − Iβ ) = I(γ − β) (10.337) 2 2 se sigue que esencialmente Jz y θ1 son variables canónicamente conjugadas y que Jz es el generador infinitesimal de z, las rotaciones que dejan invariante la proyección del vector Jz = La ecuación de Hamilton-Jacobi con variables acción-ángulo / 469 de Laplace en el eje z. En una de estas rotaciones el valor de θ1 cambia y por ende el valor de ǫ. Por tanto las rotaciones generadas por Jz en el espacio de representación de O(4), no dejan rı́gida la órbita; θ1 no es un ángulo que especifique una orientación de una órbita rı́gida, pues al variarse cambia necesariamente, o sea cambia el valor de l. Para precisar, asumamos que γ = 0. Entonces de (10.310) se sigue que ξmı́n = ηmin = 0, o sea que el anillo se convierte en una región llena, limitada por los paraboloides ξmax = a(1 + β) y ηmax = a(1 − β). Según la ecuación de la órbita (10.322) cuando η = ηmı́n , ξ vale: 1 ξ = (1 + β)(1 − cos θ1 ) (10.338) 2 cuando ξ = ξmı́n , η vale: 1 (10.339) η = (1 − β)(1 − cos θ1 ) 2 El punto de la órbita (0, ξ) es x = 0, y = 0, r = z = ξ. El punto de la órbita (η, 0) es x = 0; y = 0, r = −z = η. En coordenadas esféricas estos puntos corresponden a las intersecciones de la órbita vertical con el eje z, para los cuales: a(1 − ǫ2 ) (10.340) 1 ± ǫ cos θ0 expresión que se puede obtener de (10.338) y (10.339). ǫ y θ0 están dados por: r 1 + β 2 + (1 − β 2 ) cos θ1 ǫ= (10.341) 2 s 2 (10.342) cos θ0 = −β 2 1 + β + (1 − β 2 ) cos θ1 r= Cuando θ1 = 0, ǫ = 1 y cos θ0 = −β. Cuando β = 1, ǫ = 1 y cos θ0 = −1. Son dos casos de trayectoria rectilı́nea en un plano que pasa por el eje z. De (10.328) y (10.329) junto con (10.334) y (10.335) se siguen las relaciones entre las variables angulares y las anomalı́as excéntricas: (2) αξ = αξ + ψ − ψ (1) − π (1) ϕr = −ϕξ − αξ (2) (10.343) (10.344) (1) αξ = αξ + ψ (1) + π (10.345) La variable angular ϕϕ , está dada por: ϕϕ = ∂Σ = ϕ+ ∂Iϕ Z ∂E m ∂K1 pϕ ∂pϕ m + − 2 ∂Iϕ ξ ∂Iϕ 4ξ ∂Iϕ q dξ 2 2 2mE − pϕ /(4ξ ) + 2mK1 /ξ ∂E m ∂K2 pϕ ∂pϕ Z m + − 2 ∂Iϕ η ∂Iϕ 4η ∂Iϕ + q dη 2 2 2mE − pϕ /(4η ) + 2mK2 /η (10.346) 470 / Mecánica clásica avanzada usando (10.305), (10.306) y (10.307) obtenemos: ϕϕ = 1 ϕ + (ϕξ + ϕη ) 2 Z dξ 1 q − pϕ 4 ξ 2mEξ 2 + 2mK1 ξ − p2ϕ /4 1 − pϕ 4 Z (10.347) dη q 2 η 2mEη + 2mK2 η − p2ϕ /4 calculando las integrales con la fórmula 14.283 del manual de Spiegel y expresando todas las constantes de movimiento en función de a, β y γ, hallamos: ϕϕ = 1 1 ϕ + (ϕξ + ϕη ) − sen−1 2 2 2ξ γ2 − a 1+β s 2ξ γ2 1− a (1 + β)2 (10.348) 1 − sen−1 2 γ2 2η − a 1−β s 2η γ2 1− a (1 − β)2 debido a la degeneración se cumple que: 1 (ϕξ + ϕη ) = ωt + Constante 2 (10.349) Por tanto podemos definir una nueva constante de movimiento que depende de las variables angulares y que debe su carácter de constante a la degeneración: 1 ϕ1 = ϕϕ − (ϕξ + ϕη ) 2 (10.350) Cuando γ = 0, el plano de la órbita se corta perpendicularmente con el plano x − y en la lı́nea de nodos. En este caso ϕ vale ϕ1 ; luego ϕ1 es el ángulo que hace la lı́nea de intersección del plano de la órbita con el plano ecuatorial 9 . Cuando z = 0, ξ = η, y además ξ = ξmax , se cumple que ϕ = ϕ1 . Entonces ϕ1 es el ángulo de la lı́nea de nodos de aquella elipse que pasa por ξmax en el plano ecuatorial, para otros valores de ξ esto no se cumple. Ejemplo 10.5.1 Hallar la expansión de Fourier para z y x + iy, en coordenadas parabólicas. Véase en Max Born The mechanics of the atom, sección 36. 9 Nótese que (10.347) y (10.348) no son idénticas, pues las integrales indefinidas contienen constantes que se han omitido en (10.348) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 471 De (10.326) y (10.317) se sigue que z depende de las variables angulares ϕξ y ϕη . De (10.317) vemos que αξ no es función par ni impar de ϕξ y que αη no es función par ni impar de ϕη . Por tanto la expansión de fourier de z contiene la forma sen nξ ϕξ y cos nξ ϕξ y similarmente para la dependencia respecto a ϕη . Por esto es más conveniente la siguiente expansión: z= ∞ X ∞ X Anξ nη ei(nξ ϕξ +nη ϕη ) (10.351) nξ =−∞ nη =−∞ como z = ξ − η, los coeficientes de Fourier son: Z 2π Z 2π 1 Anξ nη = (ξ − η)e−i(nξ ϕξ +nη ϕη ) dϕξ dϕη 4π 2 0 0 (10.352) De (10.318), (10.319) se sigue que: p 1h 2 − (1 + β)2 − γ 2 sen αξ 2 i p − (1 − β)2 − γ 2 sen αη dαξ dαη dϕξ dϕη = (10.353) Reemplazando a (10.326) en (10.352), obtenemos: 1 4π 2 A00 = Z 2π 0 Z 2π 0 h 1p (1 + β)2 − γ 2 sen αξ a β− 2 i 1p (1 − β)2 − γ 2 sen αη 2 p 1h × 2 − (1 + β)2 − γ 2 sen αξ 2 i p 3 − (1 − β)2 − γ 2 sen αη dαξ dαη = βa 2 + (10.354) En los coeficientes donde nξ y nη no son ambos cero, el término constante β en z se puede omitir, pues desaparece al efectuar la integral, según se ve en (10.352) directamente. Entonces, usando una notación obvia y una propiedad de los lı́mites de integración en (10.352): Anξ nη = a 4π 2 Z 3π/2 −π/2 Z 3π/2 (−S sen αξ + R sen αη ) −π/2 (1 − S sen αξ − R sen αη ) (10.355) ×einξ (αξ +S cos αξ +R cos αη ) e+inη (αη +S cos αξ +R cos αη ) dαξ dαη 472 / Mecánica clásica avanzada si llamamos n = nξ +nη , y expresamos las funciones sen αξ y sen αη en forma exponencial, obtenemos: −a 16π 2 Anξ nη = Z 3π/2 −π/2 Z 3π/2 −π/2 (2R2 − 2S 2 − 2iSeiαξ + 2iSe−iαξ +2iReiαη − 2iRe−iαη + S 2 ei2αξ (10.356) −R2 ei2αη + S 2 e−i2αξ − R2 e−i2αη ) ×einξ αξ +inS cos αξ +inη αη +inR cos αη dαξ dαη Al sustituir αξ → 3π/2 − αξ y αη → 3π/2 − αη , cada una de las integrales resulta proporcional a una integral de la forma: 1 2π Z 3π/2 eikα+ix cos α dα = −π/2 = ei3k/2 2π Z 2π e−ikα−ix sen α dα 0 eikπ/2 Jk (x) (10.357) donde Jk (x) es la función de Bessel entera de orden k. Expresando a (10.356) en términos de Jk y haciendo uso de las siguientes propiedades de las funciones Bessel: Jk−1 (x) + Jk+1 (x) = 2k Jk (x) x Jk−1 (x) − Jk+1 (x) = 2Jk′ (x) (10.358) (10.359) obtenemos: Anξ nη = ei nπ/2 i ah RJnξ (nR)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS) n (10.360) Por tanto, la expansión de Fouurier para z es: z= 3 βa 2 +a nξ ×e ∞ i i nπ/2 h X ′ e RJnξ (nS)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS) n =−∞ n =−∞ ∞ X η (nξ ϕξ +nη ϕη ) (10.361) donde la prima en la sumatoria indica que se excluye el término nξ = nη = 0. Cuando nξ + nη = 0 no hay inconveniente porque Anξ nξ se anula. Para hacer la expansión de x + iy, notemos que según (10.290): p x + iy = 2 ξηeiϕ (10.362) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 473 Reemplazando a (10.320) y (10.321) en (10.348) obtenemos: 1 ϕϕ = ϕ + (ϕξ + ϕη ) 2 p (1 + β 2 ) − γ 2 − (1 + β) sen αξ 1 p − sen−1 2 1 + β − (1 + β)2 − γ 2 sen αξ p (1 − β)2 − γ 2 − (1 − β) sen αη 1 −1 p − sen 2 1 − β − (1 − β)2 − γ 2 sen αη (10.363) √ Luego usamos la fórmula sen−1 x = i ln(−ix + 1 − x2 ) y notamos que en el numerador del argumento se puede formar un cuadrado perfecto para llegar a: 1 ϕϕ = ϕ + (ϕξ + ϕη ) 2 h αξ p α i2 2 ) − γ 2 + iγ cos ξ (1 + β) sen − (1 + β 1 2 2 − i ln p 2 C 1 + β − (1 + β)2 − γ 2 sen αξ h αη i2 αη p − (1 − β)2 − γ 2 + iγ cos (1 − β) sen 2 2 × p 1 − β − (1 − β)2 − γ 2 sen αη C es una constante que depende de β y γ. Notemos que: p p (x + iy)ei(ϕη −ϕϕ ) = 2 ξη ei(ϕ+ϕη −ϕϕ ) = 2 ξηei(ϕη −ϕϕ )/2 h αξ i αξ p (1 + β 2 ) − γ 2 + iγ cos × (1 + β) sen − 2 2 h αη i αη p (1 − β)2 − γ 2 + iγ cos × (1 − β) sen − 2 2 (10.364) (10.365) y según (10.364), a (x + iy)ei(ϕη −ϕϕ ) = √ ei(ϕη −ϕξ )/2 C h αξ i αξ p (1 + β)2 − γ 2 + iγ cos × (1 + β) sen − 2 2 h αη i αη p 2 2 (1 − β) − γ + iγ cos × (1 − β) sen − 2 2 (10.366) Cuando αξ = αη = 0 entonces r = ξ + η = a. Por tanto, salvo un factor de fase constante, el valor de C es 1 − β 2 . Born presenta en lugar de (10.366) una expresión que se origina en sus fórmulas (17) de la sección 36. 10 Esto da lugar a una expansión de Fourier con valores erróneos para los coeficientes. 10 Comparar dichas fórmulas con las fórmulas 15.45 y 14.360 del manual de Spiegel. 474 / Mecánica clásica avanzada La expansión de Fourier de (10.366) la escribimos como: (x + iy)ei(ϕη −ϕϕ ) = ∞ X ∞ X Bnξ nη einξ ϕξ +(nη +1)ϕη (10.367) nξ =−∞ nη =−∞ El coeficiente Bnξ nη está dado por: Bnξ nη = a p 4π 2 1 − β 2 Z 3π/2 Z 3π/2 −π/2 −π/2 (1 − S sen αξ − R sen αη ) h αξ i αξ − (2S + iγ) cos × (1 + β) sen 2 2 h αη i αη − (2R + iγ) cos (1 − β) sen 2 2 ×ei(nξ +1/2)αξ +i(nη +1/2)αη +inS cos αξ +inR cos αη (10.368) dαξ dαη donde n = nξ + nη + 1. Al expresar las funciones trigonométricas en forma exponencial, las integrales que aparecen son del tipo de (10.357). En las simplificaciones debe usarse (10.358). El resultado para n 6= 0 es: Bnξ nη = AJnξ +1 (nS) Jnη +1 (nR) + BJnξ (nS) Jnη (nR) × ei(n+1)π/2 n (10.369) donde A y B están dados por: a A= p (1 + β + γ − 2iS)(1 − β + γ − 2iR) 4 1 − β2 a B= p (−1 − β + γ − 2iS)(−1 + β + γ − 2iR) 4 1 − β2 (10.370) (10.371) Para n = 0, las integrales en (10.368) son de tipo exponencial y son diferentes de cero solamente cuando nξ = −1 y nη = 0 o nξ = 0 y nη = −1 ai (2ixy ′ − Syy ′ + Rxx′ ) B−1,0 = p 8 1 − β2 donde: ai (2iyx′ − Ryy ′ + Sxx′ ) B0,−1 = p 8 1 − β2 x = 1 + β + γ − 2iS ; y = −1 + β + γ − 2iS y x′ y y ′ se obtienen de éstas reemplazando a β por −β. (10.372) (10.373) (10.374) La ecuación de Hamilton-Jacobi con variables acción-ángulo / 475 En definitiva: x + iy = B−1,0 e−iϕξ +iϕϕ + B0,−1 e−iϕη +iϕϕ + ∞ X ∞ X ′ Bnξ nη einξ ϕξ +inη ϕη +iϕϕ (10.375) nξ =−∞nη =−∞ donde la prima en la sumatoria indica que n no es cero. Este cálculo fue usado en el contexto de la vieja mecánica cuántica para hallar las intensidades de las lı́neas espectrales del hidrógeno en presencia de un campo eléctrico (efecto Stark). En presencia de un campo eléctrico el problema del átomo de hidrógeno clásico es soluble en coordenadas parabólicas, y cuando el campo eléctrico es muy débil la solución que hemos hallado en este numeral constituye la aproximación cero a este sistema. Para hallar las intensidades se aplica la fórmula (10.225), del ejemplo 10.4.1. Notamos que habrán dos contribuciones diferentes; una proveniente de z 2 , fórmula (10.361) y otra proveniente de x2 +y 2 , fórmula (10.375). Para las componentes de Fourier de z, nϕ = 0 y nξ + nη = n. Las amplitudes de las componentes z corresponden a la radiación polarizada paralelamente al campo eléctrico homogéneo. Para las componentes de Fourier de x ± iy, nϕ = ±1 y nξ + nη + 1 = n. Las amplitudes de las componentes x + iy corresponden a la radiación polarizada perpendicularmente al campo eléctrico homogéneo. Born presenta el análisis que hace Kramers del desdoblamiento de Stark de la lı́nea Hα del hidrógeno, o sea de las transiciones entre los niveles de números cuánticos principales 2 y 3. Ejemplo 10.5.2 Analizar las reglas de selección que se deducen de las expansiones de Fourier (10.269), (10.272), (10.359) y (10.368). En la vieja teorı́a cuántica y en el lı́mite clásico de la moderna teorı́a cuántica las variables de acción están cuantizadas. Ası́, para el átomo de hidrógeno tenemos: 11 1 1 h̄ ; Iθ = l − m + h̄ ; Iϕ = mh̄ Ir = nr + 2 2 |m| − m 1 Iξ = n1 + (10.376) + h̄ ; 2 2 Iη = |m| − m 1 h̄ ; I = mh̄ + n2 + 2 2 El número cuántico principal está asociado a I = Ir + Iθ + Iϕ = Iξ + Iη + Iϕ y vale nr + l + 1 = n1 + n2 + |m| + 1. Ası́ por ejemplo, los estados esféricos y parabólicos para cuando el número cuántico principal vale 2 son: n, l, m = 2, 0, 0; 2, 1, −1; 2, 1, 0; 2, 1, 1 n1 , n2 , m = 0, 0, 1; 0, 1, 0; 1, 0, 0; 0, 0, −1 11 Esta versión de las reglas de cuantización es consistente con la moderna teorı́a cuántica. (10.377) 476 / Mecánica clásica avanzada Los números enteros que aparecen en las expansiones de Fourier (10.361) y (10.375) del problema anterior corresponden a las transiciones entre estados (véase Mecánica cuántica de Laudau, sección 48). Ası́, en (10.361), nϕ = ∆m = 0 y en (10.375), nϕ = ∆m = 1 y en la compleja conjugada de (10.375), nϕ = ∆m = −1. En esta forma el desarrollo de Fourier del momento de dipolo eléctrico da las reglas de selección clásicas: respecto a n1 y n2 la regla de selección es ∆n1 + ∆n2 + 1 = nξ + nη + 1 6= 0, (∆n1 = 0, ∆n2 = −1), o (∆n1 = −1, ∆n2 = 0). Respecto a l y m, de (10.269) y (10.271) se sigue que nθ + nϕ = ±1. Por otra parte, de (10.351) se sigue: ∆l − ∆m = nθ (10.378) Entonces vemos que cuando nϕ = ∆m = ±1, nθ = ∆l ∓ 1 y cuando nϕ = ∆m = 0, nθ = ∆l. Cuando, de acuerdo con (10.273), nθ = ∓2 y nϕ = ±1, nθ + nϕ = ∓1. Se sigue entonces que ∆l = ±1 cuando nθ = ±2, nϕ = ∓1, y ∆l = 0 cuando nθ = 0, nϕ = 0, o cuando nθ = ∓1, nϕ = ±1. En conclusión, del desarrollo de Fourier de ~r en coordenadas esféricas se sigue que: ∆l = 0, ±1 y ∆m = 0, ±1 (10.379) lo cual es consistente con la mecánica cuántica. En todas las expansiones de Fourier que hemos hallado, ejemplos 10.4.1, 10.4.2 y 10.5.1, se cumple que los coeficientes de Fourier se corresponden con elementos de matriz cuánticos en el lı́mite clásico (véase, Landau, Mecánica cuántica, sección 48). Para detalles acerca de las reglas de cuantización semiclásicas véase el artı́culo de I.C. Percival y las referencias allı́ contenidas.12 , y la sección 13.4 del capı́tulo 13 del presente texto. El toroide invariante. En coordenadas esféricas es tridimensional y consiste en el lugar geométrico de los puntos del espacio fásico tales que Ir , Iθ , Iϕ tienen valores bien definidos. A partir de la figura 10.11 podemos hallar fácilmente algunas proyecciones del toroide invariante sobre planos del espacio de configuración. La proyección del toroide sobre el plano de la órbita a lo largo de la lı́nea ϕ0 = Constante y θ0 = Constante es una elipse. ϕ0 = Constante define sobre el toroide una superficie bidimensional, cuya proyección sobre el plano de la órbita es una región circular que se obtiene rotando la elipse alrededor del eje z. θ0 = Constante define sobre el toroide una superficie bidimensional cuya proyección sobre el plano ecuatorial es una región circular que se obtiene rotando la proyección de la elipse sobre el plano x − y alrededor del eje z; esta proyección es un cı́rculo de radio rmax . La proyección del toroide sobre el espacio tridimensional es el volumen obtenido al rotar el cı́rculo del plano x − y, de radio rmax , alrededor del eje z, y es un elipsoide de revolución con ejes de longitudes rmax y rmax cos θmı́n es claro que ambas dimensiones de este elipsoide dependen de las constantes de movimiento E, l, lz . En coordenadas parabólicas el toroide invariante es completamente diferente (véase figura 10.13). La excentricidad de la órbita depende de las variables angulares a través de θ1 . 12 Semiclassical theory of Bound States. I.C. Percival. Adv. Chem. Phys. Vol. 36, 1977. La ecuación de Hamilton-Jacobi con variables acción-ángulo / 477 Según (10.325), en el toroide en coordenadas parabólicas son posibles elipses de excentricidades diferentes dentro de un rango definido, que para γ = 0 varı́an entre β y 1. También para γ = 0, cos θ0 varı́a entre −1 y −β. Entonces, para θ1 = 0 la trayectoria es rectilı́nea que hace un ángulo cos−1 (β) con respecto al eje z y para θ1 = π es una elipse de excentricidad β cuyo perihelio está en π. Al barrer θ1 entre 0 y π genera un ensamble de órbitas elı́pticas con perihelio en el tercer cuadrante y envueltas por las parábolas ξmax y ηmax . La rotación de esta región alrededor de z genera la proyección del toroide invariante sobre el espacio tridimensional, que es diferente de la proyección en coordenadas esféricas. z η = (1 – β) a θ1 = π θ1 = 0 ξ = (1 – β) a x Figura 10.13 Toroide invariante en coordenadas parabólicas 478 / Mecánica clásica avanzada 11 Teorı́a de perturbaciones Son muy pocos los problemas mecánicos que poseen soluciones analı́ticas exactas. Por eso son necesarios diferentes métodos de aproximación para afrontar la mayor parte de los problemas realistas. En astronomı́a, donde se consideran sistemas de muchos cuerpos interactuando gravitacionalmente, son indispensables los métodos numéricos y los aproximados, para obtener los cambios en los parámetros de una órbita kepleriana o en los perı́odos, causados por pequeños efectos debidos a la presencia de los otros planetas. En el siglo XIX hubo gran interés en el problema de la estabilidad del sistema solar, que llevó al estudio del movimiento de muchos cuerpos interactuando entre sı́ mediante fuerzas gravitacionales, siendo el más simple el famoso problema de los tres cuerpos, tema que aún es objeto de investigaciones. Los avances han sido notables, en parte como consecuencia de los trabajos matemáticos de Kolmogorov, Arnold y Moser, quienes han obtenido las condiciones de estabilidad de un sistema múltiplemente periódico. Antes del surgimiento de la moderna teorı́a cuántica, la teorı́a clásica de perturbaciones fue muy aplicada a sistemas atómicos, especialmente para el cálculo de efectos debidos a la interacción con campos electromagnéticos. Es notable el trabajo de Max Born (noviembre de 1924).1 Esos esfuerzos no fueron estériles ni inútiles, pues dieron lugar a la teorı́a de perturbaciones de la mecánica cuántica. Hoy esos estudios se aplican con pocas variaciones a cálculos sobre la estructura vibracional en sistemas moleculares, y al análisis de los átomos en estados altamente excitados. La teorı́a clásica de perturbaciones con sus modernos desarrollos se aplica en campos tan disı́miles como la fı́sica de las altas energı́as (estabilidad de haces en un ciclotrón, estabilidad del plasma en una máquina Tokamak, etc.), y la óptica (estabilidad de una cavidad láser, propagación de la radiación láser en una fibra óptica, comportamientos multiestables y caóticos en óptica cuántica, etc.), por ejemplo. 1 Véase el texto The mechanics of the atom de Max Born. 479 480 / Mecánica clásica avanzada 11.1. Teorı́a de perturbaciones dependiente del tiempo En los problemas perturbativos el punto de partida es un sistema para el cual es conocida la solución analı́tica exacta, que se denomina no perturbado, descrito por un hamiltoniano H0 (p, q). El sistema de interés difiere del no perturbado por una pequeña perturbación. Puede asumirse que la magnitud de la perturbación está determinada por cierto parámetro que cuando vale cero hace que el hamiltoniano sea igual a H0 . Entonces el hamiltoniano exacto admite la siguiente expansión en serie de potencias de λ: H(q, p, t; λ) = H0 (q, p, t) + λH1 (q, p, t) + λ2 H2 (q, p, t) + ... (11.1) Por simplicidad denotaremos todos los términos de perturbación con H ′ , H = H0 + H ′ . La teorı́a dependiente del tiempo se caracteriza por encontrar mediante aproximaciones la función generatriz de la transformación canónica de evolución temporal que satisface la ecuación de Hamilton-Jacobi dependiente del tiempo. La transformación se realiza en dos pasos: F (q, q0 , t) = F0 (q, q ′ , t) + F ′ (q ′ , q0 , t) (11.2) donde F0 conecta las variables (q, p) con las (q ′ , p′ ) y es una solución completa de la ecuación de Hamilton-Jacobi dependiente del tiempo del problema no perturbado, o sea que en ausencia de perturbación las (q ′ , p′ ) son constantes. Al aplicar la perturbación, las (q ′ , p′ ) no serán constantes sino funciones que varı́an lentamente con el tiempo, si λ es pequeña. F ′ conecta las variables (q ′ , p′ ) con las constantes (q0 , p0 ) del problema perturbado. Al realizar la transformación (q, p) → (q ′ , p′ ), el hamiltoniano será H + ∂F0 /∂t = H0 + H ′ + ∂F0 /∂t = H ′ , pues por hipótesis H0 + ∂F0 /∂t = 0, y las ecuaciones de movimiento serán: q̇ν′ = ∂H ′ ; ∂p′ν ṗ′ν = − ∂H ′ ∂qν′ (11.3) Estas ecuaciones son rigurosas pues aún no se ha hecho ninguna aproximación, pero usando la pequeñez de H ′ podemos adoptar un esquema de aproximaciones sucesivas. Cuando λ = 0, (q ′ , p′ ) son ciertas constantes que llamaremos (q0′ , p′0 ). Entonces al reemplazar (q ′ , p′ ) en (11.3) al lado derecho por sus valores no perturbados obtenemos: q̇ν′ 1 = ∂H ′ (q0′ , p′0 ) ; ∂p′ν0 ṗ′ν1 = − ∂H ′ (q0′ , p′0 ) ∂qν′ 0 (11.4) donde (q1′ , p′1 ) son las soluciones de (11.3) al primer orden en λ. Las ecuaciones (11.4) pueden ahora integrarse explı́citamente para darnos a (q1′ , p′1 ) en función del tiempo, al primer orden en la perturbación. La corrección de segundo orden se halla usando la solución de primer orden en el lado derecho de (11.3), y ası́ sucesivamente. Podemos encontrar sistemáticamente las correcciones a cualquier orden de aproximación escribiendo en vez de (11.2) una expansión de F en potencias de λ: F (q, q, t) = F (0) (q, q, t) + λF (1) (q, q, t) + λ2 F (2) (q, q, t) + ... (11.5) Teorı́a de perturbaciones / 481 Las funciones F (n) no pueden considerarse como funciones generatrices de una serie de transformaciones canónicas, como F0 y F ′ , por la disposición de los argumentos. Se cumple que H(q, p, t) = H(q, p, t) + ∂F/∂t. Entonces: H(q, −∂F/∂q, t) = H(q, ∂F/∂q, t) + ∂F/∂t (11.6) Ahora expandimos los dos lados de (11.6) en potencias de λ usando (11.5) y, H = H0 + λH1 + λ2 H2 + ... (11.7) La expansión de H0 es: ∂F ∂F (0) ∂H0 ∂F (1) H0 q, , t = H0 q, ,t + λ · ∂q ∂q ∂~p ∂~q (1) (2) 2 1 ∂F ∂ H0 ∂F (1) ∂H0 ∂F 2 + ... · + · · +λ ∂~ p ∂~q 2 ∂~q ∂~p∂~q ∂~q La expansión de H1 es: ∂F (0) ∂F ∂H1 ∂F (1) , t = λH1 q, , t + λ2 · + ... λH1 q, ∂q ∂q ∂~p ∂~q (11.8) (11.9) Esto nos conduce a: H = H0 + +λ2 h i ∂F (1) ∂F (0) + λ F (1) , H0 + H1 + ∂t ∂t F (2) , H0 + F (1) , H1 ii h 1h ∂F (2) + F (1) , F (1) , H0 + H2 + 2 ∂t (11.10) ! + ... Si H = 0, entonces F es la solución de la ecuación de Hamilton-Jacobi del problema exacto. Podemos hallar las aproximaciones sucesivas igualando a cero los coeficientes de cada λn : H0 + h h ∂F (0) =0 ∂t i ∂F (1) = −H1 F (1) , H0 + ∂t i ∂F (2) ii i 1h h h F (2) , H0 + F (1) , F (1) , H0 − H2 = − F (1) , H1 − ∂t 2 (11.11) (11.12) (11.13) Las ecuaciones (11.11) y (11.12) forman un conjunto de ecuaciones diferenciales para las F (n) , que se caracteriza porque en cada ecuación el lado derecho depende sólo de cantidades que se han evaluado en una aproximación anterior. 482 / Mecánica clásica avanzada 11.2. Teorı́a de perturbaciones independiente del tiempo Esta teorı́a se aplica fundamentalmente a sistemas conservativos y ligados que poseen soluciones múltiplemente periódicas. El punto de partida es la descripción del sistema no perturbado en términos de las variables acción-ángulo. Luego se adopta un esquema de aproximaciones sucesivas a las variables acción-ángulo del sistema perturbado. Está implı́cita la suposición de convergencia del procedimiento, o sea la existencia de toroides invariantes del sistema perturbado; en general lo anterior no es cierto. El método se basa en hallar una expansión en potencias de λ para la función generatriz de la transformación canónica que lleva a las variables acción-ángulo del sistema perturbado. Se supone conocida la solución para el sistema no perturbado y que éste es no degenerado. Es decir, que no existen números enteros n1 , n2 , ...nl tales que: n1 ω10 + n2 ω20 + ...nl ωl0 = 0 (11.14) donde las ων0 son las frecuencias del sistema no perturbado, y que esta condición se cumple para cualquier conjunto de valores de las variables acción-ángulo no perturbadas. Las variables canónicas (I 0 , ϕ0 ) son variables acción-ángulo sólo para el sistema no perturbado; al aplicar la perturbación siguen siendo canónicas pero dejan de ser variables acción-ángulo. Esto se sigue de las ecuaciones de movimiento: ∂H I˙ν0 = − 0 ; ∂ϕν ϕ̇0ν = ∂H ∂Iν0 (11.15) Las Iν0 dependen del tiempo y las ϕ0ν no son funciones lineales del tiempo. Para λ = 0, H = H0 y en ese caso se cumple que H0 sólo es función de las Iν0 . H, sin embargo, tiene la expresión: H(I 0 , ϕ0 , t) = H0 (I 0 ) + λH1 (I 0 , ϕ0 , t) + λ2 H2 (I 0 , ϕ0 , t) + ... (11.16) Mediante una transformación canónica es posible, si el sistema perturbado es integrable, pasar a unas variables canónicas (I, ϕ) tales que H sea función sólo de las Iν .2 Llamaremos F (ϕ0 , I) a la función generatriz de esa transformación, del tipo F2 . Las siguientes son las fórmulas de transformación: Iν0 = ∂F ; ∂ϕ0ν ϕν = ∂F ∂Iν (11.17) Las nuevas variables deben satisfacer las siguientes condiciones: (a) Las coordenadas del sistema (q, p) deben ser funciones periódicas de las ϕν con perı́odo 2π. (b) H debe transformarse en una función que depende sólo de las Iν . (c) Las variables (ϕ0 , I 0 ) han de ser funciones periódicas de las ϕν con perı́odo 2π. Las coordenadas (q, p) son funciones periódicas tanto de las ϕ0ν como de las ϕν . Esto implica que una celdilla fundamental en el espacio ϕ0ν se transforma en otra del espacio ϕν . Entonces debe cumplirse que ϕν es igual a ϕ0ν más una función periódica de las ϕ0ν con perı́odo 2π. 2 Esta teorı́a fue desarrollada por H. Poincaré (1892) y H. von Zeipel (1916). Teorı́a de perturbaciones / 483 La función F (ϕ0 , I) puede expandirse en una serie de potencias de λ. Cuando λ = 0, F se convierte en la función generatriz de la transformación canónica identidad, de ahı́ que deba ser del tipo F2 : F (ϕ0 , I) = l X ϕ0ν Iν + λF (1) (ϕ0 , I) + λ2 F (2) (ϕ0 , I) + ... (11.18) ν=1 Entonces (11.16) y (11.18) nos conducen a: Iν0 = Iν + λ (2) ∂F (1) 2 ∂F + λ + ... ∂ϕ0ν ∂ϕ0ν ϕν = ϕ0ν + λ (11.19) ∂F (1) ∂F (2) + λ2 + ... ∂Iν ∂Iν (11.20) F (1) , F (2) , ... deben ser funciones periódicas de las ϕ0ν con perı́odo 2π. La ecuación de Hamilton-Jacobi del problema perturbado es: ∂F 0 ∂F 0 ∂F 2 + λH1 ϕ , + λ H2 ϕ , + ... = H(I) H0 ∂ϕ0 ∂ϕ0 ∂ϕ0 (11.21) Ahora reemplazamos (11.19) en (11.21) y expandimos cada término de (11.21) en potencias de λ. Llamamos λn H (n) (I) al n-ésimo término de la expansión de H(I). En seguida igualamos los coeficientes de cada λn y obtenemos una secuencia de ecuaciones diferenciales, ası́: H0 (I) = H (0) (I) (11.22) X ∂H0 (11.23) ν ∂Iν · ∂F (1) + H1 (ϕ0 , I) = H (1) (I) ∂ϕ0ν 1 X X ∂ 2 H0 ∂F (1) ∂F (1) X ∂H0 ∂F (2) · · · + 2 µ ν ∂Iν ∂Iµ ∂ϕ0ν ∂ϕ0µ ∂Iν ∂ϕ0ν ν + X ∂H1 ∂F (1) · + H2 (ϕ0 , I) = H (2) (I) 0 ∂I ∂ϕ ν ν ν (11.24) .................................... n−1 X n−s X l X X s=0 k=1 ν1 ,ν2 ,...νk =1 i1 +i2 +...ik (i2 ) · 1 ∂ k Hs ∂F (i1 ) · k! ∂Iν1 ∂Iν2 ...∂Iνk ∂ϕ0ν1 =s (ik ) ∂F ∂F ... + Hn (ϕ0 , I) = H (n) (I) ; ∂ϕ0ν2 ∂ϕ0νk n = 0, 1, 2, ... (11.25) 484 / Mecánica clásica avanzada Todas estas ecuaciones son de la forma: l X ∂H0 ∂F (n) · + Φn (ϕ0 , I) = H (n) (I) 0 ∂I ∂ϕ ν ν ν=1 (11.26) donde Φn es una función que depende sólo de F (1) , F (2) , ...F (n−1) . La ecuación (11.23) permite determinar a la vez a H (1) (I) y a F (1) . Como F (1) es función periódica de las ϕ0ν , el valor medio de (11.23) sobre una celdilla fundamental en el espacio de las ϕ0ν , o sea sobre el toroide invariante del movimiento no perturbado, es cero. Por tanto: H (1) (I) = hH1 (ϕ0 , I)i donde h(...)i denota: 1 (2π)l h(...)i = Z 2π 0 dϕ01 (11.27) Z 0 2π dϕ02 ... Z 0 2π dϕ0l (...) (11.28) La energı́a del movimiento perturbado es, en la primera aproximación, igual a la energı́a del movimiento no perturbado más una corrección dada por el promedio de la función de perturbación sobre el toroide invariante del movimiento no perturbado. Este promedio, cuando se cumpla la hipótesis ergódica, también es igual al promedio temporal de H1 sobre el movimiento no perturbado. Para calcular a F (1) , es necesario resolver la ecuación diferencial: l X ∂H0 ∂F (1) . = − H1 (ϕ0 , I) 0 ∂I ∂ϕ ν ν ν=1 (11.29) donde el signo {H1 } denota la parte oscilante de H1 , o sea la diferencia H1 − hH1 i, que puede representarse por una serie de Fourier de la forma: XX X 0 0 0 ′ An1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl ) (11.30) ... {H} = n1 n2 nl donde la tilde en la sumatoria denota la omisión del término con n1 = n2 = ...nl = 0. F (1) tiene una expansión similar: XX X 0 0 0 ′ F (1) = ... Bn1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl ) (11.31) n1 n2 nl Los coeficientes de Fourier de F (1) se obtienen directamente de los de {H1 } al reemplazar a (11.30) y (11.31) en (11.29): B~n (I) = −A~n (I) i~n · ~ ω 0 (I) (11.32) En la aproximación de primer orden se sigue de (11.20): ϕν = ϕ0ν + λ ∂F (1) (ϕ0 , I) ∂Iν (11.33) Teorı́a de perturbaciones / 485 lo cual nos dice que las variables angulares perturbadas presentan pequeñas oscilaciones con amplitud del orden de λ. El cambio en las frecuencias se obtiene de: ων0 (I) = ∂H(I) ∂H (1) (I) = ων0 (I) + λ ∂Iν ∂Iν (11.34) y resulta ser pequeño. De (11.19) se obtiene para las Iν0 : Iν = Iν + λ ∂F (1) (ϕ0 , I) ∂ϕ0ν (11.35) lo cual muestra que las Iν0 que en el movimiento no perturbado son constantes, ahora están sometidas a oscilaciones de amplitud del orden de λ. Que no haya degeneración es una exigencia necesaria para que (11.32) tenga sentido. Ası́ no haya degeneración pueden presentarse los llamados pequeños divisores, o sea valores de n1 , n2 , ...nl tales que ~n · ~ω 0 toma valores pequeños. De (11.24) se sigue que la parte oscilante en el lado izquierdo debe anularse, lo cual nos da una ecuación diferencial para F (2) : ∂F (1) ∂F (1) 1 X X ∂ 2 H0 · · 2 µ ν ∂Iν ∂Iµ ∂ϕ0ν ∂ϕµ (11.36) X ∂H0 ∂F (2) X ∂H1 ∂F (1) + H2 (ϕ0 , I) = 0 + · + 0 0 ∂I ∂ϕ ∂I ∂ϕ ν ν ν ν ν ν En tanto que la corrección de segundo orden a la energı́a viene dada por: X ∂H1 ∂F (1) 0 H2 (I) = hH2 (ϕ , I)i + · ∂Iν ∂ϕ0ν ν 1 X X ∂ 2 H0 + 2 µ ν ∂Iµ ∂Iν ∂F (1) ∂F (1) · ∂ϕ0µ ∂ϕ0ν (11.37) Podemos ahora usar (11.31) y (11.32) en (11.37) para obtener: H (2) = hH2 i − l X X n nν A−~ n ′ ∂A~ 0 ∂I ~ n · ω ~ ν ν=1 ~ n + l l 1 X X ∂ωµ0 X ′ A~n A−~n nν nµ 2 µ=1 ν=1 ∂Iν (~n · ~ω 0 )2 (11.38) ~ n donde se ha usado la fórmula: ~ hei(~n+m) · ϕi = δ~n,−m ~ (11.39) 486 / Mecánica clásica avanzada H (2) puede también escribirse en la forma: H (2) = hH2 i − l |A~n |2 ∂ 1 X′ X nν 2 ∂Iν ~n · ω ~0 ν=1 (11.40) ~ n que equivale también a: H (2) = hH2 i − l X X ~ n·~ ω 0 >0 ∂ nν ∂Iν ν=1 |A~n |2 ~n · ~ω 0 (11.41) Para la corrección de orden n, se sigue de (11.26) que: H (n) (I) = hΦn (ϕ0 , I)i (11.42) en tanto que F (n) es solución de la ecuación: l X ων0 ν=1 ∂F (n) = − {Φn } ∂ϕ0ν Podemos expresar a {Φn } como una serie de Fourier: X (n) ′ im· ~ ϕ ~0 {Φn } = Am ~ (I) e (11.43) (11.44) m ~ de donde se sigue que los coeficientes de Fourier de F (n) son: (n) Bm ~ (n) = −Am ~ im ~ ·ω ~0 (11.45) Esto nos dice que a cada orden es necesaria la condición de no degeneración del movimiento no perturbado. Poincaré mostró que las series de Fourier para las F (n) son convergentes en sentido asintótico. Por esto pueden truncarse a partir de valores razonables de los nν y obtenerse resultados precisos, independientemente de la presencia de los “pequeños divisores” que necesariamente aparecen para nν grandes al tomar la serie completa. Ejemplo 11.2.1 Encontrar las correcciones de primero y segundo orden para un oscilador armónico con perturbación anarmónica. El oscilador anarmónico con correcciones cúbicas y cuárticas es soluble exactamente por cuadraturas. Pero es ilustrativa la manera de aplicar la teorı́a de perturbaciones para obtener las variables acción-ángulo del problema perturbado. El hamiltoniano no perturbado es: H0 = 1 p2 + m(ω 0 )2 q 2 2m 2 (11.46) y la perturbación: H1 = aq 3 ; H2 = bq 4 (11.47) Teorı́a de perturbaciones / 487 De acuerdo con el ejemplo 9.5.5, las variables acción-ángulo del problema no perturbado se hallan mediante la transformación canónica con función generatriz F1 , dada por: F (q, ϕ0 ) = 1 mω02 cot ϕ0 2 (11.48) que da lugar a la transformación: 0 1/2 2I sen ϕ0 ; p = (2mI 0 ω 0 )1/2 cos ϕ0 q= mω 0 (11.49) Expresando a H0 , H1 y H2 en términos de I 0 y ϕ0 , obtenemos: H0 = I 0 ω 0 (11.50) H1 = a 2I 0 mω 0 3/2 H2 = b 2I 0 mω 0 2 sen3 ϕ0 (11.51) sen4 ϕ0 (11.52) De (11.27) obtenemos directamente: H (1) = hH1 i = 0 (11.53) Como ∂H0 /∂I 0 = ω 0 , se sigue de (11.29) que F (1) obedece la ecuación: ∂F (1) a =− 0 ∂ϕ0 ω 2I mω 0 3/2 sen3 ϕ0 (11.54) Es decir, el término cúbico en la perturbación no da lugar a cambio en la energı́a del oscilador. Pero como F (1) es diferente de cero, las expresiones (11.49) para p y q sı́ resultan modificadas al primer orden. Al introducir la perturbación, I 0 deja de ser constante, pues de (11.35) y (11.54) se sigue que presenta oscilaciones de frecuencias w0 y 3w0 . Ahora, usemos (11.24) para hallar a H (2) : ∂H1 ∂F (1) (2) 0 (11.55) · H (I) = hH2 (ϕ , I)i + ∂I ∂ϕ0 El cálculo nos da: H (2) = − 15a2 I2 I2 3b + 3 0 4 2 4 m (ω ) 2 m (ω 0 )2 (11.56) De (11.54) se sigue la siguiente expresión para F (1) : F (1) = a 3ω 0 2I mω 0 3/2 sen2 ϕ0 cos ϕ0 + 2 cos ϕ0 (11.57) 488 / Mecánica clásica avanzada 0por tanto: ∂F λa ϕ= = ϕ0 + ∂I 2Iω 0 2I mω 0 3/2 sen2 ϕ0 cos ϕ0 + 2 cos ϕ0 (11.58) Ahora resolvemos esta ecuación para ϕ0 en términos de ϕ, al primer orden en λ: 3/2 λa 2I 0 ϕ =ϕ− sen2 ϕ cos ϕ + 2 cos ϕ (11.59) 2Iω 0 mω 0 A este mismo orden, I 0 en función de (I, ϕ) es: 3/2 λa 2I 0 I =I− 0 sen3 ϕ ω mω 0 (11.60) Al reemplazar (11.59) y (11.60) en la expresión (11.49) para q, que sigue siendo válida en el sistema perturbado, obtenemos: 1/2 λaI 2I sen ϕ − 2 0 3 (3 + cos 4ϕ) (11.61) q= mω 0 m (ω ) Ejercicio 11.2.1 Aplicar la teorı́a de perturbaciones al péndulo simple, tomando como parámetro pequeño la relación entre la energı́a de libración y la energı́a de la separatriz (pequeñas oscilaciones). Mostrar que: H(I) = ω 0 I − F (1) λGI 16 2 (11.62) GI 2 =− (8 sen ϕ − sen 4ϕ) 192ω 0 ver el ejemplo 10.3.2. 11.3. Multiplicidad de conjuntos de variables acciónángulo en los sistemas degenerados Los ejemplos 10.3.5 y 10.4.4 ilustran la propiedad general de los sistemas degenerados consistente en que la separación de variables de la ecuación de Hamilton-Jacobi es posible en diferentes sistemas de coordenadas, lo que a su vez conlleva a la posibilidad de definir diferentes conjuntos de variables acción-ángulo. Entonces un sistema múltiplemente periódico con degeneración se caracteriza por poseer diferentes conjuntos de perı́odos, correspondientes a los diferentes conjuntos de variables acción-ángulo. Si f denota alguna coordenada o momento generalizado, cuando el sistema es degenerado existen varios conjuntos de variables acción-ángulo (I,ϕ), (I ′ ,ϕ′ ), ..., con lo cual f posee la propiedad: f (I1 , I2 , ...Il ; ϕ1 + 2π, ϕ2 + 2π, ...ϕl + 2π) = (11.63) f (I1 , I2 , ...Il ; ϕ1 , ϕ2 , ...ϕl ) Teorı́a de perturbaciones / 489 f (I1′ , I2′ , ...Il′ ; ϕ′1 + 2π, ϕ′2 + π, ...ϕ′l + 2π) = (11.64) f (I1′ , I2′ , ...Il′ ; ϕ′1 , ϕ′2 , ...ϕ′l , ), etc. Es decir, las diferentes expresiones de f en variables acción-ángulo poseen propiedades de periodicidad similares. Como ilustración, ver las fórmulas (10.269) ejemplo 10.4.2, y (10.361) ejemplo 10.5.1, mediante las cuales se expresa a z en términos de las variables acción-ángulo esféricas y parabólicas en el caso de una partı́cula en un potencial 1/r. Se ve que la relación entre los diferentes conjuntos de variables no es trivial y que las variables de acción esféricas dependen no sólo de las variables de acción parabólicas sino también de las variables angulares parabólicas. La ecuación (10.344) nos da la relación entre ϕr y las variables acción-ángulo parabólicas: −1 A + B cos(αη − αξ ) ϕr = −ϕξ − tan (11.65) B sen (αη − αξ ) que nos muestra que ϕr es igual a una función lineal de las variables angulares parabólicas más una función periódica de esas variables. Teorema 11.3.1 Todos los sistemas de variables angulares en que una función f (I, ϕ) tiene perı́odo fundamental 2π, están conectados entre sı́ por las fórmulas: ϕν = l X nνµ ϕ′µ + ψν (ϕ′1 , ϕ′2 , ...ϕ′l , I1′ , I2′ , ...Il′ ) (11.66) µ=1 ν = 1, 2, ...l donde las nνµ forman una matriz de elementos enteros y determinante ±1 y las ψν son funciones periódicas de las ϕ′ν con perı́odo 2π. Según el teorema, buscamos una transformación: ϕν = fν (ϕ′ , I ′ ) (11.67) para la cual es preservada la periodicidad de cualquier variable dinámica F (como la z citada anteriormente): F (ϕ, I) = F ′ (ϕ′ , I ′ ) (11.68) Ahora llamemos ϕν a: ϕν = fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) (11.69) Entonces: F (I; ϕ1 , ϕ2 , ...ϕl ) = F ′ (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) = (11.70) F ′ (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) = F (I; ϕ1 , ϕ2 , ...ϕl ) 490 / Mecánica clásica avanzada Lo cual significa que ϕν y ϕν difieren por un múltiplo de 2π entero que llamaremos 2πnν1 : fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) = fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnν1 (11.71) De manera similar se cumple: fν I ′ ; ϕ′1 , ϕ′2 , ...ϕ′µ + 2π, ...ϕ′l = fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnνµ ; ν, µ = 1, 2, ...l (11.72) esto sólo es posible si fν es de la forma: fν (I ′ , ϕ′ ) = l X nνµ ϕ′µ + ψν (ϕ′ , I ′ ) (11.73) µ=1 donde ψν es función periódica de las ϕ′µ con perı́odo 2π. Claramente vemos que (11.65) es una realización de la fórmula (11.66). Evidentemente la expresión para ϕ′ν en términos de (ϕ) es de la forma (11.66). Esto requiere que la matriz inversa de (nνµ ) tenga igualmente elementos enteros. La condición necesaria para esto es que det (nνµ ) = ±1. Función generatriz de la transformación (ϕ, I)→ (ϕ′ , I ′ ). La transformación (11.66) se puede escribir como: ϕν = l X nνµ ϕ′µ + ψν (ϕ′ , I) ; ν = 1, 2, ...l (11.74) µ=1 Lo cual indica que la transformación canónica se puede obtener mediante una función generatriz de la forma G(ϕ′ , I), del tipo F3 : ϕν = − ∂G ; ∂Iν Iν′ = − ∂G ; ∂ϕ′ν ν = 1, 2, ...l (11.75) Con lo cual G es de la forma: G(ϕ′ , I) = − l X nνµ Iν ϕ′µ + ψ (ϕ′ , I) (11.76) ν,µ=1 lo cual implica que las ψν deben ser derivadas parciales de ψ y por tanto se debe cumplir: ∂ψµ ∂ψν = ∂Iµ ∂Iν (11.77) Las fórmulas de transformación para las Iν′ son: Iν′ = l X µ=1 nνµ Iν − ∂ψ ∂ϕ′ν La función ψ debe ser periódica en las ϕν y en las ϕ′ν . Por tanto: X ψ= C~n (I)ei~n·ϕ~ ~ n (11.78) (11.79) Teorı́a de perturbaciones / 491 Entonces (11.74) y (11.78) toman la forma: ϕν = l X nνµ ϕ′µ − X ∂C~n (I) nνµ Iν − i X µ=1 Iν′ = l X µ=1 ∂Iν ~ n ei~n·ϕ~ ′ C~n (I)nν ei~n·ϕ~ (11.80) ′ (11.81) ~ n Como tanto las (I, ϕ) como las (I ′ , ϕ′ ) son variables acción-ángulo, las (I, I ′ ) deben ser constantes y las (ϕ, ϕ′ ) deben ser funciones lineales del tiempo. Esto implica una de las dos condiciones siguientes: C~n (I) = 0 para ~n 6= 0 (11.82) o que en el exponente de la serie de Fourier sólo aparecen combinaciones de las ϕ′ν tales que: n1 ϕ′1 + n2 ϕ′2 + ...nl ϕ′l = (n1 ω1′ + n2 ω2′ + ...nl ωl′ ) t (11.83) +n1 δ1′ + n2 δ2′ + ... + nl δl′ = constante Claramente la condición (11.83) requiere que el sistema sea degenerado, ~n · ω ~ ′ = 0. En conclusión, para un sistema no degenerado, hay varios conjuntos de variables acción-ángulo, conectados entre sı́ mediante las fórmulas: ϕν = l X µ=1 nνµ ϕ′µ − ∂ψ ; ∂Iν Iν′ = l X nνµ Iν (11.84) µ=1 con función generatriz: G(ϕ′ , I) = − l X l X nνµ Iν ϕ′µ + ψ(I) (11.85) ν=1 µ=1 donde nνµ es una matriz de elementos enteros y determinante ±1. En el caso degenerado, asumimos que entre las ων′′ existen l − s relaciones de conmensurabilidad: l X nν ων′′ = 0 (11.86) ν=1 Es posible realizar una transformación canónica auxiliar a nuevas variables acciónángulo (I ′ , ϕ′ ) tal que l − s de las frecuencias ων′ sean idénticamente cero y las s restantes sean no nulas e independientes entre sı́: ωα′ ; α = 1, 2, ...s (Inconmensurables) (11.87) ωρ′ = 0 ; ρ = s + 1, s + 2, ...l 492 / Mecánica clásica avanzada La función generatriz de tal transformación es de la forma: F =− l X Cνµ Iν′′ ϕ′µ (11.88) ν,µ=1 De donde: ϕ′′ν = l X Cνµ ϕ′µ ; Iν′ = l X Cνµ Iµ′′ (11.89) µ=1 µ=1 donde las ων′′ satisfacen las relaciones (11.86). Claramente: ϕ′ν = l X Cνµ ϕ′′µ (11.90) µ=1 lo cual implica que para satisfacerse (11.87) es necesario: l X Cµρ ϕ′′µ = 0 para ρ = s + 1, s + 2, ...l (11.91) µ=1 Es decir, las Cµρ se obtienen de los nµ que aparecen en las l − s relaciones de conmensurabilidad (11.86). Ejemplo 11.3.1 Considerar el movimiento de una partı́cula en un potencial 1/r. Este problema es degenerado. Realizar una transformación a variables acción-ángulo tales que las frecuencias satisfagan las condiciones (11.87). En coordenadas esféricas las dos condiciones de degeneración pueden escribirse como: ωr − ωθ = 0 ; ωϕ − ωθ = 0 (11.92) De la función generatriz F = (ϕϕ − ϕθ )I1 + (ϕr − ϕθ )I2 + ϕr I3 se sigue que las variables acción-ángulo buscadas son: ϕ1 = ϕϕ − ϕθ ; ϕ2 = ϕr − ϕθ ; ϕ3 = ϕr (11.93) y, I1 = Iϕ ; I2 = Iθ + Iϕ ; I3 = Ir + Iθ + Iϕ (11.94) mk 2 I33 (11.95) Las nuevas frecuencias son: ω1 = 0 ; ω2 = 0 ; ω3 = En coordenadas parabólicas la transformación buscada puede obtenerse con la función generatriz: ϕξ + ϕη − ϕ I1 + (ϕξ − ϕη )I2 − ϕξ I3 (11.96) F = 2 Teorı́a de perturbaciones / 493 que da lugar a la transformación: I1 = Iϕ ; I2 = Iη + ϕ1 = ϕϕ − ϕξ + ϕη ; 2 Iϕ ; 2 I3 = Iξ + Iη + Iϕ ϕ2 = ϕη − ϕξ ; ϕ3 = ϕξ (11.97) (11.98) En tanto que ω1 , ω2 y ω3 están dadas por las fórmulas (11.95). Con esta transformación, los resultados del capı́tulo 10 referentes a las constantes de movimiento que resultan de la degeneración se expresan como: θ1 = −ϕ2 ; φ1 = ϕ1 (11.99) La clasificación dada en (11.87) nos permite llamar a las ϕ′α y Iα′ variables acciónángulo propias, y a las ϕ′ρ , Iρ′ , variables impropias o degeneradas; las ϕ′ρ permanecen constantes en el curso del movimiento. El número s de frecuencias ωα′ no nulas e independientes se llama el grado de periodicidad del sistema y el número l − s se llama el grado de degeneración. Consideraremos ahora las fórmulas de transformación (11.80) y (11.81) en el caso degenerado. Con el fin de que la división entre variables degeneradas y no degeneradas persista, requerimos que las ϕρ no dependan de las ϕ′α y que las ϕ′ρ no dependan de las ϕα . Esto implica que los elementos nρα se anulen. Las fórmulas de transformación que toman en cuenta lo anterior y además que las ϕα y las ϕ′α son funciones lineales del tiempo, y que las ϕρ , ϕ′ρ , Iν , Iν′ , son constantes, son: ϕα = l X nαµ ϕ′µ + ψα (ϕ′σ , I) (11.100) µ=1 ϕρ = l X nρσ ϕ′σ + ψρ (ϕ′σ , I) (11.101) σ=s+1 Iα′ = s X nβα Iβ l X nνρ Iρ − i (11.102) β=1 Iρ′ = ν=1 X C~nσ (I)nρ ei~nσ ·ϕ~ σ (11.103) ~ nσ donde el subı́ndice σ se coloca a los vectores para indicar que solamente tienen componentes degeneradas. Como los nνµ son enteros y los nρα son nulos, entonces se cumple que: det nνµ = ±1 y det nαβ = ±1 (11.104) En conclusión, las variables de acción no degeneradas están determinadas unı́vocamente, aparte de una transformación lineal entera homogénea de determinante ±1. Por 494 / Mecánica clásica avanzada su parte, las variables de acción degeneradas no necesitan transformarse integralmente y pueden depender de variables angulares degeneradas; los nνρ no necesitan ser enteros. Esto podemos ilustrarlo con el ejemplo 11.3.1 y las fórmulas de la sección 10.5, referentes al problema de Kepler. Las variables angulares no degeneradas son ϕ′3 = ϕξ y ϕ3 = ϕr , las variables angulares degeneradas son ϕ′2 = ϕη − ϕξ , ϕ′1 = ϕϕ − (ϕξ + ϕη )/2, ϕ2 = ϕr − ϕθ y ϕ1 = ϕϕ − ϕθ . Vemos la correspondencia entre las fórmulas (11.65) y (11.100). Por otra parte, I3′ = Iξ + Iη + Iϕ y I3 = Ir + Iθ + Iϕ , o sea que I3′ = I3 , que corresponde a (11.102). Una fórmula del tipo (11.103) es la que expresa a I2 = Iθ + Iϕ en términos de I3′ , I2′ , I1′ , ϕ′2 , que se obtiene fácilmente de la fórmula (10.325), sección 10.5. h i p I22 = 12 I3′2 1 − β 2 + γ 2 − (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos ϕ′2 (11.105) 11.4. Teorı́a de perturbaciones de sistemas degenerados En la sección 11.2 obtuvimos las fórmulas para las correcciones a la energı́a y a la función generatriz cuando un sistema no degenerado se somete a una perturbación. Ya en la fórmula (11.45) encontramos un resultado que no se puede aplicar cuando hay degeneraciones. En la fórmula (11.42), para las correcciones a la energı́a, aparece un promedio sobre todas las variables angulares, pero hemos visto que en un sistema degenerado hay l − s nuevas constantes de movimiento, las l − s variables angulares que permanecen constantes, con valores dependientes sólo de las condiciones iniciales. Por esto la trayectoria de fases no ocupa una región l-dimensional sino una de sólo s dimensiones. Un promedio sobre las variables angulares degeneradas es más bien un promedio sobre todos los movimientos que resultan de cambiar las condiciones iniciales, o sea un promedio sobre un ensamble, lo cual es inadmisible cuando se considera un solo sistema. En conclusión, en (11.42) no tiene sentido promediar sobre las ϕ0ρ , quedando H (n) dependiente de las variables angulares ϕ0ρ : (11.106) H (n) Iα ; ϕ0ρ , Iρ Esto tiene una razón fı́sica más profunda: las variables (ϕ0 , I 0 ) que se obtienen de las variables del problema perturbado (ϕ, I) al hacer λ = 0 no están determinadas por el movimiento no perturbado sino por la perturbación. Es decir, no podemos partir de cualquier conjunto de variables acción-ángulo del sistema no perturbado sino que antes debemos encontrar un conjunto de variables acción-ángulo “exactas en la aproximación cero”. Este comportamiento se refleja en la teorı́a cuántica de perturbaciones de sistemas degenerados, donde se deben formar combinaciones lineales de las funciones de onda degeneradas para obtener las funciones de onda exactas en la aproximación cero, que son las funciones que se obtienen de las perturbadas al hacer λ = 0. Esto en mecánica cuántica equivale a buscar una combinación lineal de las funciones degeneradas que diagonalice la perturbación, en teorı́a de perturbaciones degeneradas de primer orden.3 3 Véase la sección 12.5, capı́tulo 12. Teorı́a de perturbaciones / 495 Debido a su carácter degenerado, otras variables de acción degeneradas, conectadas con las Iρ0 por relaciones de la forma (11.103), deben introducirse en lugar de las Iρ0 mediante una adecuada elección de las coordenadas. Tal elección, obviamente, está determinada por la perturbación (o más exactamente, por las simetrı́as que tenga la perturbación). Debemos realizar una transformación canónica preliminar, escogida de tal manera que, al primer orden, H1 dependa sólo de variables de acción. La transformación es (I 0 , ϕ0 ) → (I 0 ′ , ϕ0 ′ ), con función generatriz: G(ϕ0 , I 0 ′ ) = l X Iν0 ′ ϕ0ν + V (ϕ0ρ , I 0 ′ ) (11.107) ν=1 La fórmulas de transformación son: Iα0 = ∂G = Iα0 ′ ; ∂ϕ0α ϕ′α = ∂G ∂V = ϕ0α + 0 ′ ; ∂Iα0 ′ ∂Iα Iρ0 = ∂G ∂V = Iρ0 ′ + ∂ϕ0ρ ∂ϕ0ρ ′ ϕ0ρ ′ = ∂G ∂V = ϕ0ρ + 0 ′ ∂Iρ0 ′ ∂Iρ (11.108) (11.109) G en (11.107) tiene una parte que depende solamente de las variables ϕ0ρ e Iρ0 ′ , la cual se halla resolviendo la ecuación de Hamilton-Jacobi siguiente: 0 0 ∂G = H (1) (I 0 ′ ) (11.110) H1 Iα , ϕρ , ∂ϕ0ρ En este punto está garantizando que la perturbación no dependerá de variables angulares al promediar sobre las variables angulares no degeneradas y que se cumple siempre la condición m ~ ·~ ω 0 6= 0. Ahora expresamos a H en términos de (I ′ , ϕ′ ): H = H0 (Iα′ ) + λH1 (ϕ0 ′ , I 0 ′ ) + λ2 H2 (ϕ0 ′ , I 0 ′ ) + ... (11.111) y, como en la sección 11.2, buscamos una transformación canónica (I ′ , ϕ′ ) → (I, ϕ), lo cual dará lugar nuevamente a las fórmulas (11.22), ... (11.25), escribiendo (ϕ0 , I 0 ) en lugar de (ϕ0 ′ , I 0 ′ ). Como H no depende de Iρ′ , ahora en lugar de (11.26) se tiene: s X ∂H0 ∂F (n) · = H (n) (I) − Φn (ϕ0 , I) 0 ∂I ∂ϕ α α α=1 (11.112) Al primer orden, en vez de (11.29) tenemos: s X ∂H0 ∂F (1) · = − H1 (ϕ0 , I) 0 ∂Iα ∂ϕα α=1 (11.113) donde {H1 } = H1 − hH1 i y h...i denota un promedio sobre las variables angulares ϕ0α .4 Es claro que la ecuación (11.113) no permite determinar completamente a F (1) , pues 4 La solución de la forma (11.32) aún existe, siendo bien definida salvo posibles divergencias debidas 0 ≈ 0. a la presencia de pequeños denominadores en los armónicos altos, ~ nα · ~ ωα 496 / Mecánica clásica avanzada cualquier solución de (11.113) está indeterminada por la adición de una función de Iν y ϕ0ρ . Llamaremos G(1) a la parte de F (1) determinada por (11.113), de modo que: F (1) = G(1) + R(1) (11.114) donde R(1) deberá quedar determinada en la siguiente aproximación. Ahora, la ecuación (11.24) puede escribirse como: s s 1 X X ∂ 2 H0 ∂G(1) ∂G(1) · 2 α=1 ∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β β=1 + l X ∂H 0 α=1 ∂Iα (2) · l X ∂H1 (11.115) (1) ∂F ∂F + · + H2 (ϕ0 , I) = H (2) (I) 0 ∂ϕ0α ∂I ∂ϕ ν ν ν=1 De esta ecuación podemos determinar a H (2) (I), a R(1) y a una parte G(2) de F (2) . Indicaremos con h...i los promedios sobre las ϕ0α y los promedios sobre las ϕ0ν completas por hh...ii. Entonces: H (2) (I) = hhΦ2 ii (11.116) donde Φ2 es completamente conocida: s Φ2 = s 1 X X ∂ 2 H0 ∂G(1) ∂G(1) · · 2 α=1 ∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β β=1 + s X ∂H1 α=1 ∂Iα (11.117) ∂G(1) · + H2 (ϕ0 , I) ∂ϕ0α R(1) es solución a la ecuación: l X ∂H1 ∂R(1) . = −{hΦ2 i} ∂Iρ ∂ϕ0ρ ρ=s+1 (11.118) donde: {hΦ2 i} = hΦ2 i − hhΦ2 ii (11.119) F (2) es solución a: s X ∂H0 ∂F (2) · = −{Φ2 } ∂Iα ∂ϕ0α α=1 (11.120) pero (11.120) determina sólo una parte G(2) , quedando por determinar una función R(2) que depende de ϕ0ρ y Iν , en la aproximación siguiente. La ecuación secular. Consideremos primero el cambio en los coeficientes de Fourier de una variable dinámica al pasar de un sistema de variables acción-ángulo a otro, (I, ϕ) → (I, ϕ). Asumamos que la transformación canónica es del tipo G(I, ϕ), Teorı́a de perturbaciones / 497 de modo que (I, ϕ) pueden tomarse independientes, y con funciones de (I, ϕ). Sean las expansiones de Fourier de f (I, ϕ) = f (I, ϕ): X X im· ~ ϕ ~ f (I, ϕ) = f~n (I)ei~n·ϕ~ = f (I, ϕ) = fm (11.121) ~ (I)e ~ n m ~ Entonces, claramente f m n (I), ası́: ~ (I) pueden expresarse en función de f~ I I I X 1 ~ f~n (I)ei~n·ϕ~ e−i~n·ϕ~ dl ϕ ... fm (11.122) ~ (I) = (2π)l ~ n Llamaremos i~ α ·~ a e ϕ: ′ gα~⋆ α~ ′ (I) a los coeficientes de la expansión de Fourier de ei~α·ϕ~ respecto ~′ ~ ei~αϕ~ = gα~⋆ α~ ′ (I) eiα ·ϕ (11.123) donde se supone que ϕ puede expresarse en términos de (I, ϕ). Ahora en (11.122) sea ~n = α ~ −α ~′ y m ~ = β~ − β~ ′ . Entonces (11.122) y (11.123) nos conducen fácilmente a: XX f β− gα~⋆ β~ (I) fα~ −~α′ (I) gα~ ′ β~′ (I) ~ β ~ ′ (I) = α ~ = α ~ XX α ~ α ~′ (11.124) g+ ~ −~ α′ (I) gα ~ ′ (I) ~ (I) fα ~ ′β β~ α ⋆ donde g + ~ . Si formamos matrices con los coeficientes de Fourier, entonces (11.124) ~ α = gα ~β β~ nos dice que f~n y fm ~ están conectados por medio de una transformación unitaria. Ahora examinemos las expansiones de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las variables canónicas (Iρ0 , ϕ0ρ ) y (Iρ0 ′ , ϕ0ρ ′ ) conectadas por las fórmulas (11.108) y (11.109). La transformación canónica buscada, por definición, conduce a una expresión que no depende de las ϕ′ρ . Si llamamos f (Iρ0 , ϕ0ρ ) a hH1 (Iρ0 , ϕ0ρ , Iα )i y f ′ a la correspondiente expresión en términos de (Iρ0 ′ , ϕ0ρ ′ ), podemos hacer corresponder la ecuación de Hamilton-Jacobi (11.110) con la (11.124). La transformación canónica buscada debe dar lugar a coeficientes de Fourier de la forma: ′ 0′ (1) 0 ′ fβ− (I )δβ, ~β ~′ ~ β ~ ′ (I ) = H Por tanto (11.124) para este caso puede escribirse ası́: i h XX 0 0 (1) 0 g+ (I )δα~ α~ ′ gα~ ′ β~ ′ (I 0 ) = 0 ~ −~ α′ (I ) − H ~ (I ) fα β~ α α ~ (11.125) (11.126) α ~′ donde hemos usado la fórmula X + gβ~ ~ ′ = δβ, ~β ~′ ~ α gα ~β (11.127) α ~ En otras palabras, la transformación canónica es tal que diagonaliza la matriz fα~ −~α′ (I 0 ) formada con los coeficientes de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las variables angulares degeneradas. H (1) (I 0 ′ ) se obtienen resolviendo la ecuación secular: i h (11.128) det fα~ −~α′ (I 0 ) − H (1) (I 0 ′ )δα~ α~ ′ = 0 498 / Mecánica clásica avanzada en tanto que la transformación canónica se obtiene a partir de los vectores propios de la matriz fα~ −~α′ (I 0 ), suministrando la conexión entre las variables angulares ϕ0ρ y ϕ0ρ ′ . Debe notarse que las matrices que aparecen en este desarrollo son de dimensión infinita; por tanto (11.128) debe entenderse como el paso al lı́mite de una secuencia de determinantes. Vemos que encontrar las variables acción-ángulo exactas en la aproximación cero equivale a diagonalizar la matriz formada con los coeficientes de Fourier de la perturbación. También encontramos que resolver la ecuación de Hamilton-Jacobi independiente del tiempo, equivale, siempre, a diagonalizar la matriz de los coeficientes de Fourier del respectivo hamiltoniano. Ejemplo 11.4.1 Encontrar las variables de acción perturbadas en el efecto Stark del átomo de hidrógeno clásico, en coordenadas esféricas. El hamiltoniano para este problema es de la forma H = H0 + λH1 , donde: H0 = − m(Ze2 )2 2(I30 )2 (11.129) es la energı́a del movimiento kepleriano en ausencia del campo y: λH1 = eEz (11.130) es la perturbación. z está dada por la fórmula (10.268), " 0 2 #1/2 I1 z = 1− (x0 cos ϕ02 − y 0 sen ϕ02 ) I20 (11.131) x0 y y0 son las coordenadas cartesianas del electrón en el plano de la órbita, y el eje menor es x. La única variable angular no degenerada es ϕ03 , de la cual dependen x0 y y 0 , según las fórmulas (10.222) y (10.223). Por tanto: 3 hx0 i = − ǫ0 a0 ; 2 hy 0 i = 0 (11.132) En consecuencia, tomando a E como λ: hH1 (I30 , ϕ02 , I10 , I20 )i = " 0 2 #1/2 " 0 2 #1/2 I1 I2 3 0 . 1− cos ϕ02 − ea 1 − 0 2 I2 I30 (11.133) a0 es igual a: a0 = (I30 )2 mZe2 (11.134) En esta expresión no aparecen ni ϕ01 ni ϕ03 . Por tanto I10 y I30 son constantes durante el movimiento perturbado y aparecen como parámetros. Las únicas variables son entonces ϕ02 y I20 , indicando que en el movimiento perturbado la órbita no permanece Teorı́a de perturbaciones / 499 rı́gida sino que presenta oscilaciones de la excentricidad y del perihelio en el plano de la órbita, el cual a su vez gira uniformemente alrededor del eje z y oscila alrededor de la lı́nea de nodos (Véase la figura 10.11). La ecuación de Hamilton-Jacobi (11.110) que nos determina la variable de acción I20 exacta en la aproximación cero para este caso es: " 0 2 0 2 0 2 #1/2 0 3ea E I2 I1 I1 − cos ϕ02 1− = H (1) (I 0 ′ ) (11.135) − + 2 I30 I20 I30 la cual nos da explı́citamente a I20 = ∂G/∂ϕ02 y entonces a G. Las integrales resultan bastante difı́ciles. Si sólo queremos hallar a H (1) (I 0 ′ ), notemos que (11.108) al ser integrada sobre un perı́odo de ϕ02 , nos da: I I ∂V1 1 1 0′ 0 0′ dϕ02 (11.136) I2 dϕ2 − I2 = 2π 2π ∂ϕ02 y que según (11.109) V1 es una función periódica de ϕ02 , con lo cual: I 1 I20 ′ dϕ02 I20 ′ = 2π (11.137) lo cual nos suministra la expresión para H (1) que buscamos. Llamemos (I30 )2 = A, (I10 )2 = B, [2H (1) /(3ea0 E)]2 = C y (I20 )2 = x. Por tanto 0 2I2 dI20 = dx, o sea: √ 2 x dI20 = dx (11.138) lo cual nos permite escribir: I I √ dϕ02 1 1 ∂ϕ0 x I20 ′ = dx I20 02 dI20 = 2π dI2 2π dx (11.139) De (11.135) se sigue que: cos2 ϕ02 = C x B B 1− − + A x A Por tanto: d(sec 2 ϕ02 ) 1 = C 1 B − + 2 dx A x (11.140) (11.141) En consecuencia: √ dϕ02 (x2 − AB) AC = √ dx 2 x(A − x)(x − B)[(A − x)(x − B) − ACx]1/2 Entonces (11.139) nos da: √ I (x2 − AB) dx AC I20 ′ = 4π (A − x)(x − B)[(A − x)(x − B) − ACx]1/2 (11.142) (11.143) 500 / Mecánica clásica avanzada La integral se hace usando el método de los residuos, teniendo en cuenta que en el plano complejo el integrando es una función biforme (positivo entre xmı́n y xmáx y negativo entre xmáx y xmı́n ), presentando una lı́nea de ramificación. Por otra parte el integrando posee singularidades en x = A, x = B y x = ∞, con polos en esos puntos. El residuo en x = A vale −2π/C 1/2 , el residuo en x = B vale 2π[B/(AC)]1/2 y el residuo en x = ∞ vale 2π (el cual se obtiene con la sustitución y = 1/x). En consecuencia: √ √ 1 √ I20 ′ = A − B − CA (11.144) 2 que es lo mismo que: " # (1) 1 0′ 0′ 0′ 0 ′ 22 H I2 = I − I3 − (I2 ) (11.145) 2 2 3ea0 Por tanto H (1) vale: H (1) (I 0 ′ ) = ± 3eEa0 ′ 0 ′ (I1 − I30 ′ − 2I20 ′ ) 2I10 ′ (11.146) Este ejemplo ilustra el método de las perturbaciones seculares, que hacen que las variables angulares degeneradas, que en el problema no perturbado son constantes, pasen a ser funciones lineales del tiempo dando lugar a oscilaciones en los parámetros de la órbita que aumentan con la intensidad de la perturbación. En efecto, las frecuencias perturbadas son: ω30 ′ = ω30 + λ ω20 ′ = λ ∂hH1 i ∂I30 ′ ∂hH1 i ; ∂I20 ′ (11.147) ω10 ′ = λ ∂hH1 i ∂I10 ′ (11.148) Las frecuencias que en el movimiento no perturbado son nulas, en el perturbado pasan a ser “frecuencias lentas”, en tanto que las frecuencias no degeneradas son “frecuencias rápidas”. Ejemplo 11.4.2 Calcular las correcciones de segundo orden en el átomo de Hidrógeno clásico en un campo eléctrico uniforme (efecto Stark cuadrático). Si trabajamos con coordenadas parabólicas, H (0) y las frecuencias están dadas por (10.300) y (10.306). Entonces la ecuación (11.37) para la corrección de segundo orden de la energı́a toma la forma: H (2) (I) = 1 ∂ 2 H0 2 ∂I32 * ∂F (1) ∂ϕ03 2 + + ∂ω ∂F (1) . ∂I2 ∂ϕ02 + ∂ω ∂F (1) . ∂I3 ∂ϕ03 (11.149) y F (1) es solución a la ecuación: ω0 ∂F (1) + W (I, ϕ0 ) = 0 ∂ϕ03 (11.150) Teorı́a de perturbaciones / 501 siendo W igual a: 3 W = H1 − hH1 i = eEz − eEaβ (11.151) 2 Podrı́amos partir de la expresión para W en coordenadas parabólicas para calcular a F (1) y luego a H (2) . Sin embargo usaremos el siguiente procedimiento equivalente: como en coordenadas parabólicas el promedio de eEz sobre las variables angulares es igual al promedio temporal, debido a que heEzit no contendrá variables angulares, podemos realizar inicialmeste los promedios temporales en coordenadas esféricas. Luego, antes de promediar sobre la otra variable angular pasamos de coordenadas esféricas a coordenadas parabólicas usando las ecuaciones (10.326) y (10.327). El resultado será el mismo que si se calculan los promedios temporales en coordenadas parabólicas. Finalmente, promediando sobre θ1 obtenemos a H (2) en coordenadas parabólicas. heEzit y eEz están dados por: heEzit = 3 eEaǫ cos θmı́n cos θ0 2 (11.152) eEz = eF a cos θmı́n −(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ Por tanto W en coordenadas esféricas es: W = eF a cos θmı́n 1 × −(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ 2 (11.153) La ecuación (11.150) toma la forma: ∂F (1) eF a = cos θmı́n 0 ∂ϕ3 2ω 0 h i × 2(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 + 2 cos θ0 cos ψ (11.154) Usando la ecuación de Kepler se cumple: ∂F (1) ∂ψ ∂F (1) 2π ∂F (1) = = · · 0 0 ∂ϕ3 ∂ψ ∂ϕ3 ∂ψ 1 − ǫ cos ψ (11.155) por tanto tenemos que: ∂F (1) = ∂ψ h eF a cos θ 2(1 − ǫ2 )1/2 sen θ0 sen ψ mı́n 4πω 0 +ǫ cos θ0 + 2 cos θ0 cos ψ −2ǫ(1 − ǫ2 )1/2 sen θ0 sen ψ cos ψ −ǫ2 cos θ0 cos ψ − 2ǫ cos θ0 cos2 ψ (11.156) i 502 / Mecánica clásica avanzada Integrando respecto a ψ hallamos la siguiente expresión para F (1) , luego de omitir una constante de integración que no contribuirá a H (2) ya que W tiene media cero: F (1) = h eF a − 2(1 − ǫ2 )1/2 sen θ0 cos ψ cos θ mı́n 4πω 0 + cos θ0 sen ψ − ǫ(1 − ǫ2 )1/2 sen θ0 sen2 ψ −ǫ2 cos θ0 sen ψ − ǫ cos θ0 sen ψ cos ψ (11.157) i Esta función satisface el requisito de la teorı́a canónica de perturbaciones de ser una función periódica de θ1 y ϕξ , como puede verse fácilmente usando (10.328), (10.329), (10.341) a (10.345). Si quisiéramos aplicar la fórmula (11.149) directamente en coordenadas esféricas, deberı́amos haber tomado hH1 i = 0 lo cual darı́a lugar a la aparición en F (1) y ∂F (1) /∂ϕ02 de un término proporcional a ψ, que se incrementa linealmente con el tiempo (llamado secular); esto evidencia que la fórmula (11.36) sólo puede aplicarse en coordenadas en las cuales la perturbación sea “diagonal”, es decir, que no contenga variables angulares. Usando la propiedad: ∂F (1) ∂F (1) = − ∂ϕ02 ∂θ0 (11.158) Llegamos a la siguiente expresión para ∂F (1) /∂20 : ∂F (1) = ∂ϕ02 h eF a cos θmı́n 2(1 − ǫ2 )1/2 cos θ0 cos ψ 0 2ω +(2 − ǫ2 )sen θ0 sen ψ 2 1/2 +ǫ(1 − ǫ ) (11.159) 2 cos θ0 sen ψ −ǫ sen θ0 sen ψ cos ψ i Por otra parte, usando las siguientes relaciones: ∂ cos θmı́n = ∂I2 γ2 I3 (1 − ǫ2 )3/2 cos θmı́n ∂ǫ = ∂I2 −(1 − ǫ2 − γ 2 ) I3 (1 − ǫ2 )1/2 ǫ cos2 θmı́n ∂ψ = ∂I2 − I2 sen ψ I32 ǫ (1 − ǫ cos ψ) (11.160) Teorı́a de perturbaciones / 503 donde γ = I1 /I3 , obtenemos al hacer todos los cálculos: n h ∂W −eEa γ 2 ǫ cos θ0 = 2 3/2 ∂I2 2I3 (1 − ǫ ) cos θmı́n +2(1 − ǫ2 )1/2 sen θ0 sen ψ + 2 cos θ0 cos ψ i h +(1 − ǫ2 )(1 − ǫ2 − γ 2 ) − ǫ−1 cos θ0 + 2(1 − ǫ2 )−1/2 ×sen θ0 sen ψ − + (11.161) 2(1 − ǫ2 )1/2 ǫ−1 sen θ0 cos ψ sen ψ 1 − ǫ cos ψ 2ǫ−1 cos θ0 sen2 ψ io 1 − ǫ cos ψ Usando la siguiente relación: Z 2π 1 ∂W ∂F (1) ∂W ∂F (1) · · (1 − ǫ cos ψ) dψ = 0 ∂I2 ∂ϕ2 t 2π 0 ∂I2 ∂ϕ02 (11.162) obtenemos usando (11.159), (11.161) y (11.162) después de un cálculo largo pero directo: h (eEa)2 ∂W ∂F (1) (9 − 13ǫ2 − γ 2 + 4ǫ4 + ǫ2 γ 2 ) . = − ∂I2 ∂ϕ02 t 16ω 0 I3 (1 − ǫ2 ) (11.163) i +(−4 + 3ǫ2 + 4γ 2 + ǫ4 + ǫ2 γ 2 ) cos2 θ0 Por otra parte podemos escribir los otros dos términos de la ecuación (11.149) ası́: * 2 + 1 ∂ 2 H0 ∂W ∂F (1) ∂F (1) · 2 ∂I32 ∂ϕ03 ∂I3 ∂ϕ03 t t 3ω 0 =− 2I3 =− 1 2ω 0 * W ω0 2 + 3 ∂ + I3 ∂I3 + t ∂W · ∂I3 −W ω0 (11.164) t hW 2 it De (10.268) se sigue que: 1 hW 2 it = (eE)2 a cos2 θmı́n (1 − ǫ2 + 5ǫ2 cos2 θ0 ) 2 (11.165) Con este resultado (11.164) puede escribirse como: − (eEa)2 [20(1 − ǫ2 ) + (4 + 10ǫ2 ) cos2 θ0 ] (1 − ǫ2 − γ 2 ) · 16I3 ω 0 1 − ǫ2 (11.166) 504 / Mecánica clásica avanzada Resumiendo los resultados dados por las ecuaciones (11.163) y (11.166) llegamos a: ∂W ∂F (1) · ∂I2 ∂ϕ02 t + ∂W ∂F (1) · ∂I3 ∂ϕ03 1 ∂ 2 H0 + 2 ∂I32 t * ∂F (1) ∂ϕ03 2 + t (11.167) 2 =− (eEa) [(29 − 24ǫ2 − 21γ 2 ) + 9ǫ2 cos2 θmı́n cos2 θ0 ] 16I3 ω 0 Si ahora pasamos a coordenadas parabólicas mediante las ecuaciones (10.325), (10.341) a (10.345), llegamos a la siguiente expresión para el lado derecho de (11.167): (eEa)2 h − · 17 − 3β 2 − 9γ 2 16I3 ω 0 i p − 12 [(1 + β 2 ) − γ 2 ][(1 − β 2 ) − γ 2 ] cos θ1 (11.168) El promedio sobre la variable angular ϕ2 (θ1 = −ϕ2 ) nos conduce a la expresión final para H (2) : H (2) (I) = − (eEa)2 (17 − 3β 2 − 9γ 2 ) 16I3 ω 0 (11.169) que expresada en términos de las Iν es: H (2) (I) = − (eE)2 I 4 [17I 2 − 3(Iξ − Iη )2 − 9Iϕ2 )] 16m3 (Ze2 )4 (11.170) Este es el mismo resultado de Epstein en (1916) usando un método de aproximaciones sucesivas, expuesto por Born (Op. cit., p. 591). El método de aproximaciones descrito en la sección 11.2 puede también fallar cuando el sistema no perturbado no posee degeneración intrı́nseca pero ocurre que las frecuencias se tornan conmensurables para ciertas condiciones iniciales. Cuando esto ocurre se habla de degeneración accidental. En este sentido es incorrecta la distinción que algunos textos de mecánica cuántica hacen al referirse a la degeneración presente en los niveles de energı́a del átomo de hidrógeno respecto al número cuántico orbital l como “accidental”. En astronomı́a se presenta este tipo de degeneración, como en el caso del movimiento de algunos planetas menores (Aquiles, Patroclo, Héctor y Néstor) que tienen casi el mismo perı́odo de revolución que Júpiter. En la mayorı́a de los sistemas la degeneración accidental es más frecuente que la degeneración intrı́nseca. 11.5. Perturbaciones adiabáticas Perturbaciones pequeñas y perturbaciones lentas. Veamos la diferencia en una expansión de perturbaciones para perturbaciones pequeñas y para perturbaciones adiabáticas. En el primer caso hay un parámetro pequeño en el sistema determinado por la intensidad de la perturbación. El parámetro pequeño de una perturbación lenta está dado por la relación entre la frecuencia de la perturbación y las frecuencias Teorı́a de perturbaciones / 505 rápidas del sistema. Cuando el parámetro toma el valor cero, el sistema posee solamente oscilaciones rápidas, y a medida que aumenta el valor del parámetro, aparecen las contribuciones de las frecuencias lentas. Asumamos que el sistema posee sólo una frecuencia rápida y que el hamiltoniano se puede separar en la forma: H = H0 (I, λ~y , λt) + λH1 (I, ϕ, λ~y , λt) (11.171) donde I y ϕ son las variables acción-ángulo del movimiento no perturbado (λ = 0) del grado de libertad rápido, y ~ y = (q, p) son las variables canónicas de los restantes grados de libertad, no necesariamente expresadas en variables acción-ángulo. Debido a que cuando λ = 0 el sistema es de un grado de libertad, entonces es integrable. Construcción de invariantes adiabáticos canónicos. Para calcular el efecto de la perturbación buscamos una transformación canónica de (I, ϕ, ~y ) a (I, ϕ, ~y) tal que el nuevo hamiltoniano no dependa de la variable angular rápida ϕ. La función generatriz es de la forma: F = Iϕ + ~p~q + λF (1) I, ϕ, ~p, ~q, t + ... (11.172) y las fórmulas de transformación de primer orden son: I =I +λ ∂F (1) ; ∂ϕ (1) ∂F p~ = ~p + λ ; ∂~q ϕ=ϕ−λ ∂F (1) ∂I (11.173) (1) ∂F ~q = ~q − λ ∂~p (11.174) Ahora reemplazamos a (11.173) y (11.174) en (11.171) y expandimos al primer orden en λ para obtener: ∂F (1) H0 (I, λ~y , λt) = H0 I, λ~y, λt + λω ∂ϕ siendo ω = ∂H0 /∂I la frecuencia rápida. Con la transformación canónica el nuevo hamiltoniano total será: ∂F (1) I, ϕ, λ~y, λt H I, ϕ, λ~y, λt = H(I, ϕ, λ~y , λt) + λ ∂(λt) (11.175) (11.176) En esta expresión ahora retenemos sólo los términos de primer orden en λ: ∂F (1) H I, ϕ, λ~y , λt = H0 (I, λ~y , λt) + λω + λH1 I, ϕ, λ~y , λt ∂ϕ Al orden cero (11.177) nos da: H 0 I, λ~y , λt = H0 (I, λ~y , λt) (11.177) (11.178) y al primer orden: ∂F (1) + H1 I, ϕ, λ~y , λt H 1 I, ϕ, λ~y , λt = ω ∂ϕ (11.179) 506 / Mecánica clásica avanzada Como por definición la transformación canónica elimina en H la dependencia de ϕ, se debe cumplir que F (1) satisfaga la ecuación diferencial: ω ∂F (1) = −{H1 } ∂ϕ (11.180) En tanto que la energı́a al primer orden satisface la expresión: H I, λ~y, λt = H0 I, λ~y, λt + λhH1 i (11.181) donde {...} y h...i denotan aquı́ la parte oscilante y el promedio respectivamente, respecto a la variable angular ϕ. En (11.180) vemos que no hay complicaciones, como en (11.29) y (11.32), debidas a posibles resonancias entre ω y armónicos superiores de las frecuencias lentas. La ecuación (11.173) nos da los invariantes adiabáticos a orden cero en λ e I, y a primer orden en λ e I: I (I, ϕ, λ~y , λt) = I − λ ∂F (1) ∂ϕ (11.182) o equivalentemente: I =I+ λ {H1 } ω (11.183) Realmente cualquier función de I puede escogerse como un invariante adiabático. Mediante la construcción de un invariante adiabático, si existe, se reduce el sistema de l grados de libertad a l − 1 grados de libertad. Esto se logra al encontrar la transformación canónica que elimina en H la dependencia respecto a ϕ, con lo cual I queda como un parámetro constante. Si uno de los restantes l − 1 grados de libertad sufre una oscilación rápida en comparación a los demás grados de libertad, podemos introducir un segundo parámetro pequeño, transformar a variables acción-ángulo el grado de libertad rápido y hallar un segundo invariante adiabático. El proceso puede continuarse para obtener una secuencia de invariantes adiabáticos, hasta que el sistema es reducido a un grado de libertad, que puede integrarse para obtener el invariante final. Esto significa que todo sistema posee l invariantes adiabáticos aproximados obtenidos mediante promedios, ası́ no sea integrable (es decir que no posea l constantes de movimiento en involución). Ejemplo 11.5.1 Este ejemplo se refiere a un sistema hamiltoniano no autónomo de un grado de libertad, que por tanto posee un comportamiento análogo al de un sistema de dos grados de libertad. Se trata de un oscilador lineal sometido a una variación adiabática de sus parámetros: Ho.l. = 1 1 G(λt) p2 + F (λt) q 2 2 2 (11.184) Podemos hallar las variables acción ángulo mediante la función generatriz: 1/2 1 F q 2 tan ϕ (11.185) F1 = − 2 G Teorı́a de perturbaciones / 507 Entonces el hamiltoniano transformado toma la forma siguiente: H = ω0 I − λR′ I sen 2ϕ 2R (11.186) p √ donde R(λt) = F/G, ω0 (λt) = F G y la prima denota derivada respecto a λt. La ecuación (11.186) tiene ahora la forma (11.171) y podemos aplicar los resultados de la teorı́a de los adiabáticos canónicos. Al orden cero el invariante adiabático es: I= H0 = constante ω0 (11.187) La ecuación (11.183) nos da el invariante de primer orden: I = I (1 + λP sen 2ϕ) (11.188) donde P (λt) = −R′ /(2ω0 R). O sea que al primer orden I tiene una pequeña componente que oscila con una frecuencia el doble de la frecuencia rápida ω0 . De (11.188) se sigue: I˙ = λṖ I sen 2ϕ + 0(λ2 ) (11.189) Como Ṗ = λP ′ , vemos que efectivamente I˙ es del orden de λ2 , siendo I un invariante al primer orden. Veamos las posibles resonancias entre ω0 y los armónicos de las frecuencias asociadas a los cambios adiabáticos de los parámetros. Para ello expandamos a Ṗ en una serie de Fourier: X ′ Ṗ = λ an einω1 λt (11.190) n siendo ω1 λ la frecuencia de la oscilación lenta y ω1 /ω2 del orden de la unidad. Entonces, según (11.189) y (11.190), I˙ tendrá la siguiente expansión de Fourier: i I X′ h i(nω1 λt+2ϕ) I˙ = λ2 an e − ei(nω1 λt−2ϕ) 2i n (11.191) Ahora, integremos a I˙ sobre un perı́odo de la oscilación lenta. Esto nos dará: " λ2 X′ ∆I e2i(2πω0 /(λω1 )+ϕ0 ) − e2iϕ0 = an 2i n i(nω1 λ + 2ω0 ) I # e−2i(2πω0 /(λω1 )+ϕ0 ) − e−2iϕ0 (11.192) − i(nω1 λ − 2ω0 ) Vemos que ∆I/I será del orden de λ2 , a no ser que haya una conmensurabilidad entre las oscilaciones en t y en ϕ: s ω0 = (11.193) λω1 2 508 / Mecánica clásica avanzada donde s es un entero del orden de 1/λ. En este caso los términos con n = ±s en (11.192) serán constantes en t, y ∆I/I será del orden de λ: 2π ∆I ≈ λ|as | I ω1 (11.194) O sea que si la resonancia es mantenida por tiempos del orden de un perı́odo de la oscilación lenta, 2π/(λω1 ), el invariante de primer orden es destruido. 11.6. Sistema de osciladores lineales con acoplamiento no lineal Consideremos l osciladores lineales con frecuencias propias ω10 , ω20 , ...ωl0 acoplados anarmónicamente. El hamiltoniano es de la forma H = H0 + λH1 + λ2 H2 + ..., donde: X p2 1 ν (11.195) + m(ων0 )2 qν2 H0 = 2m 2 ν H1 = X aν qν3 + ν H2 = XX µ X bν qν4 + ν + ′ XXX µ XX µ ν aµν qµ2 qν + ν XXX µ ′ ′ ν ′ aµνλ qµ qν qλ (11.196) λ (bµν qµ2 qν2 + b′µν qµ3 qν ) ν bµνλ qµ2 qν qλ + XXXX µ λ ν λ (11.197) ′ bµνλρ qµ qν qλ qρ ρ donde µ, ν, λ y ρ varı́an entre 1 y l. Los coeficientes a y b presentan en sus ı́ndices las mismas propiedades de simetrı́a que los productos de los qν que multiplican. La prima en la sumatoria significa que se omiten los términos con ı́ndices iguales. Caso no degenerado. Cuando las ων0 son inconmensurables se dice que son no degeneradas. En las variables acción-ángulo (ϕ0 , I 0 ), H0 es: H0 = l X ων0 Iν0 (11.198) ν=1 H1 y H2 en función de (ω 0 , I 0 ) se obtienen sustituyendo: qν = Qν sen ϕν ; Qν = 2Iν0 mων0 1/2 ; ϕν = ϕ0ν (11.199) Como en H1 sólo entran productos de sen ϕν un número impar de veces, se sigue que: H (1) = hH1 i = 0 (11.200) Teorı́a de perturbaciones / 509 Para hallar a H (2) aplicamos la fórmula (11.40), lo cual requiere hallar los coeficientes de Fourier A~n de H1 . Para escribir a H1 como una serie de Fourier usamos la identidad trigonométrica: 4 sen α sen β sen γ = −sen (α + β + γ) + sen (−α + β + γ) (11.201) +sen (α − β + γ) + sen (α + β − γ) la cual nos da: 1X aν Q3ν [−sen (3ϕν ) + 3sen ϕν ] 4 ν H1 = + 1X aµν Q2µ Qν [−sen (2ϕµ + ϕν ) 4 µν +2 sen ϕν + sen (2ϕµ − ϕν )] + (11.202) 1X aµνλ Qµ Qν Qλ [−sen (ϕµ + ϕν + ϕλ ) 4 µνλ +3 sen (ϕµ + ϕν − ϕλ )] La ecuación (11.202) tiene la forma de una serie de Fourier seno: X H1 = B~n sen (~n · ϕ ~) (11.203) ~ n donde todos los coeficientes de Fourier B (ν) (nν ) son cero excepto: 1X 3 aµν Q2µ Qν B1ν = aν Q3ν + 4 2 µ (11.204) 1 B3ν = − aν Q3ν 4 (11.205) 1 νµ B21 = − aνµ Q2ν Qµ 4 (11.206) µν B2−1 = 1 aνµ Q2ν Qµ 4 3 νµλ B111 = − aνµλ Qν Qµ Qλ 2 νµλ B11−1 = 3 aνµλ Qν Qµ Qλ 2 (11.207) (11.208) (11.209) En (11.40) aparecen |A~n |2 = A~n A−~n , donde A~n están relacionadas con los B~n por: A~n = B~n − B−~n 2i (11.210) 510 / Mecánica clásica avanzada entonces: |A~n |2 = 1 (B~n − B−~n )2 4 (11.211) con lo cual los |A~n |2 diferentes de cero son: 1 |Aν1 |2 = Cν = 64 3aν Q3ν + 2 X aµν Q2µ Qν µ ! (11.212) 1 2 6 a Q 64 ν ν |Aν3 |2 = Cν′ = 2 |Aνµ 21 | = Cνµ = (11.213) 1 2 4 2 a Q Q 64 νµ ν µ (11.214) 9 2 a Q2 Q2 Q2 16 νµλ ν µ λ 2 |Aνµλ 111 | = Cνµλ = (11.215) luego (11.40) toma la forma: 1XX 3X bν Q4ν + bνµ Q2ν Q2µ 8 ν 4 ν µ H (2) = − X 1 ∂ (Cν + Cν′ ) 0 ∂I ω ν ν ν − − XX ν µ 2 0 ∂Cνµ 0 ∂Cνµ − ω 4ω µ ν 4(ων0 )2 − (ωµ0 )2 ∂Iν ∂Iµ XXX ν µ λ (11.216) ∂Cνµλ 1 ων0 + ωµ0 + ωλ0 ∂Iν 1 + 0 ων + ωµ0 − ωλ0 ∂Cνµλ ∂Cνµλ ∂Cνµλ + − ∂Iµ ∂Iµ ∂Iλ Según (11.199) y (11.212) a (11.215) las cantidades C son de tercer grado en las Iν , de modo que todos los términos de H (2) son cuadráticos en las Iν . La energı́a total tiene entonces la siguiente dependencia de las variables de acción: X 1 XX 0 ω Iν Iµ (11.217) H(I) = ων0 Iν + 2 ν µ νµ ν Es claro que la condición de inconmensurabilidad de las frecuencias queda reducida a excluir los casos: 2ων0 = ωµ0 ; ων0 + ωµ0 = ωλ0 para todos los valores de ν, µ, λ. (11.218) Teorı́a de perturbaciones / 511 Ejemplo 11.6.1 Aplicar la teorı́a de perturbaciones de estados degenerados al sistema construido por dos osciladores lineales con frecuencias conmensurables, sometidos a una perturbación anarmónica del tipo (11.196). Las trayectorias en el espacio de configuración para el movimiento no perturbado son las figuras de Lissajous. H0 es: H0 = 1 2 px + p2y + m(ωx0 )2 x2 + m(ωy0 )2 y 2 2m (11.219) donde rωx0 = sωy0 , siendo r y s enteros. La perturbación es de la forma: H1 = ax x3 + ay y 3 + axy x2 y + ayx y 2 x (11.220) La solución al movimiento no perturbado en variables acción-ángulo está dada por (11.198) y (11.199). Para tratar la degeneración es conveniente separar la frecuencia no degenerada mediante una transformación canónica de la forma (11.89), que para este caso es: ϕ01 = ϕ′x ; ϕ02 = −rϕ′x + sϕ′y Ix′ = I10 − rI20 ; Iy′ = sI20 (11.221) (11.222) donde las primas denotan las variables de acción originales. H0 en términos de las I 0 es: H0 (I 0 ) = ω10 I10 (11.223) donde las frecuencias están dadas por: ω10 = ωx0 ; ω20 = 0 (11.224) La solución al movimiento no perturbado es: x= 2(I10 − rI20 ) mω10 y= 2s2 I20 rmω10 1/2 1/2 sen ϕ01 (11.225) (rϕ01 + ϕ02 ) sen s El promedio de H1 sobre un ciclo de la variable angular ϕ01 es: 1/2 s I10 − rI20 2I20 ϕ0 = − axy sen 2 δr,2s 0 0 2 mω1 rmω1 s 1/2 2s2 I20 I10 − rI20 ϕ0 sen 2 2 δs,2r 0 0 rmω1 mω1 s hH1 (I10 , I20 , ϕ02 )i 1 + ayx 2 (11.226) 512 / Mecánica clásica avanzada Si r 6= 2s o s 6= 2r el procedimiento falla porque hH1 i = 0, pero el resultado (11.218) es válido en ese caso, mostrando que sólo hay correcciones de orden superior al primero. Para precisar asumamos que 2ωx0 = ωy0 . Entonces: q 0 −axy 0 0 I2 sen ϕ02 hH1 (I10 , I20 , ϕ02 )i = I − 2I (11.227) 1 2 2(mω10 )3/2 La ecuación de Hamilton-Jacobi para este problema es: q A x C=− x3 − I10 + C = 0 ; x = I20 ; 2 sen ϕ02 Las raı́ces dependen del signo del discriminante: 0 3 0 3 2 I1 I A2 C =− 1 D= − + + 6 2 6 4 sen2 ϕ02 (11.228) (11.229) que depende esencialmente de la magnitud de H (1) , o sea de la energı́a. Si D > 0, una raı́z es real y dos son complejo conjugadas. Si D = 0, todas las raı́ces son reales, siendo dos de ellas iguales entre sı́; esto ocurre para valores de H (1) (I) y ϕ02 bien determinados. Si D < 0, todas las raı́ces son reales y diferentes entre sı́. Para D > 0, la raı́z real es: 3/2 2/3 I10 C √ C √ 0 + (11.230) I2 = + − + D + D 3 2 2 Cuando D = 0 las raı́ces son: I10 I10 I0 ; I20 = 2 1 ; 3 6 6 Cuando D < 0 las raı́ces son: I10 2θ I10 2θ 2π 0 I2 = 1 + cos ; 1 + cos + 3 3 3 3 3 I10 2θ 4π 1 + cos + 3 3 3 (11.231) (11.232) donde cos θ = (6/I10 )3/2 C/2. La figura 11.1 muestra el comportamiento de las raı́ces reales en función de C −1 . CT es el valor de C para el cual D = 0, que ocurre cuando: 0 3/2 0 3/2 I (1) ′ (mω1 ) =2 1 (11.233) −C = H (I ) axy sen ϕ02 6 √ Para A muy grande tenemos que D ≈ C/2. En ese caso se cumple que: I20 ≈ C 2/3 = A2/3 (sen ϕ02 )−2/3 ; A2 ≫ (I10 )3 (11.234) De (11.108) vemos que I20 ′ es igual al valor medio de I20 sobre un perı́odo de ϕ02 . Entonces: H (1) (I ′ ) = axy (I20 ′ )3/2 0 3/2 (mω1 ) h(sen ϕ02 )−2/3 i3/2 (11.235) Teorı́a de perturbaciones / 513 I 20/ 3 2 I 10 / 3 I 10/ 3 1/CT 1/C Figura 11.1 Raı́ces reales en función de C −1 11.7. Movimiento cerca de una resonancia aislada Para precisar, sea un sistema de dos grados de libertad sometido a una perturbación pequeña. Si se presenta una resonancia entre las frecuencias no perturbadas: r ω2 = ω1 s (11.236) entonces debemos usar la teorı́a de perturbaciones de sistemas degenerados. Primero realizamos una transformación canónica del tipo (11.88) para aislar una de las frecuencias. Una función generatriz adecuada es: F2 = (rϕ1 − sϕ2 )I 1 + ϕ2 I 2 (11.237) que da lugar a las fórmulas de transformación: I1 = rI 1 ; I2 = I 2 − sI 1 ϕ1 = rϕ1 − sϕ2 ; ϕ2 = ϕ2 (11.238) (11.239) Cuando se aplica la perturbación, como vimos en el efecto Stark lineal, ϕ̇1 pasa a ser una frecuencia lenta y ϕ̇2 es una frecuencia rápida. Si en la expansión de Fourier de H1 en las variables acción-ángulo iniciales, (I, ϕ), efectuamos la transformación (11.238) y (11.239), obtenemos: H1 = XX l m Hl,m (I)ei[lϕ1 +(ls+mr)ϕ2 ]/r (11.240) 514 / Mecánica clásica avanzada Ahora, en vez de “diagonalizar” a H1 como en la sección 11.4, podemos usar la teorı́a de las perturbaciones adiabáticas teniendo en cuenta que en resonancia, ϕ̇2 ≫ ϕ̇1 . La fórmula (11.181) nos da para este caso: H = H 0 (I) + λhH 1 i (11.241) donde hH 1 i es el promedio sobre ϕ2 . Como el promedio da lugar al factor δm,−sp : X (11.242) hH 1 i = H−pr,ps (I)e−ipϕ1 p Como H no depende de ϕ2 , se cumple que I 2 = constante = I 20 . Notemos que I 2 = I2 + (s/r)I1 ; por tanto la resonancia modifica sustancialmente las constantes de movimiento. Si s ≫ r, I 2 es simplemente un múltiplo de I1 , o sea que la modificación más importante ocurre para las resonancias con s pequeños. Con I 2 constante, el movimiento en el plano I 1 − ϕ1 es el de un sistema de un grado de libertad, que es integrable. Chirikov5 ha mostrado que para cualquier sistema ese movimiento es aproximadamente como el de un péndulo o como el de un oscilador armónico, según la degeneración sea accidental o intrı́nseca. Como el movimiento no perturbado es degenerado, en la superficie de sección I 1 −ϕ1 , con ϕ2 = constante, habrán s puntos formando una circunferencia de radio I 1 (ver sección 10.2). Para λ 6= 0 la perturbación altera el toroide y las intersecciones de la trayectoria con la superficie de sección modificando por tanto las soluciones periódicas. Si existen, los puntos fijos sobre la superficie de sección, que llamaremos P0 (I 10 , ϕ10 ), son solución al sistema de ecuaciones: ∂H ∂I 1 = 0; P0 ∂H ∂ϕ1 =0 (11.243) P0 que representan las soluciones periódicas para el hamiltoniano perturbado. Cuando λ = 0, todas las soluciones son periódicas, pero para λ 6= 0 sólo quedan las soluciones periódicas dadas por (11.243). Las amplitudes de Fourier en (11.242) generalmente decaen cuando p aumenta. Entonces podemos describir el movimiento en las variables integrables (I 1 − ϕ1 ) usando solamente los términos con p = 0, ±1: H = H 0 (I) + λH00 (I) + 2λHr,−s (I) cos ϕ1 (11.244) notando que los coeficientes con p = 1 y p = −1 sólo difieren en la fase, de modo que puede hacerse H−r,s = Hr,−s con la simple adición a ϕ1 de una constante. Las fórmulas (11.243) y (11.244) nos dan las siguientes ecuaciones para la localización de los puntos fijos: ∂H00 (I) Hr,−s (I) ∂H 0 (I) +λ + 2λ cos ϕ10 = 0 ∂I 10 ∂I 10 ∂I 10 2λHr,−s (I) sen ϕ10 = 0 5 Chirikov, B.V., 1979, en Physics Reports, pp. 265-379. (11.245) Teorı́a de perturbaciones / 515 Entonces los puntos fijos están localizados en ϕ10 = 0, nπ. Como ∂I1 /∂I 1 = r y ∂I2 /∂I 1 = −s, vemos que ∂H 0 /∂I 1 = sω1 − rω2 = 0. Por tanto I 10 está determinado por: Hr,−s ∂H00 ±2 =0 ∂I 10 ∂I 10 (11.246) Para puntos de la superficie de sección diferentes a los puntos fijos, se cumple que: I˙ 1 = −2λHr,−s sen ϕ1 ϕ̇1 = (11.247) ∂H00 ∂Hr,−s ∂H 0 +λ + 2λ cos ϕ1 ∂I 1 ∂I 1 ∂I 1 (11.248) O sea que los desplazamientos de I 1 respecto a un punto fijo son del orden de λ. En cuanto a ϕ1 , el comportamiento es diferente según la degeneración sea accidental o intrı́nseca. Si la degeneración es accidental, entonces H 0 = H 0 (I 1 , I 2 ) y por esto la amplitud de las oscilaciones de ϕ1 es del orden de la unidad. Si la degeneración es intrı́nseca, entonces H 0 (I 1 , I 2 ) = H0 (sI1 + rI2 ) = H 0 (I 2 ) y, entonces, ∂H 0 /∂I 1 = 0 y las oscilaciones de ϕ1 son del orden de λ. Degeneración accidental. En este caso I 1 permanece en las cercanı́as del punto fijo, pero ϕ1 puede alejarse del mismo. Entonces podemos escribir: I 1 = I 10 + ∆I 1 (11.249) Esto nos permite expandir a H(I) en las cercanı́as de I 10 . Para ello usamos en (11.244) las expresiones: H 0 (I) = H 0 (I 0 ) + ∂H 0 1 ∂2H 0 ∆I 1 + (∆I 1 )2 + ... 2 ∂I 2 ∂I 10 10 (11.250) H00 (I) = H00 (I 0 ) + ∂H00 1 ∂ 2 H00 ∆I 1 + (∆I 1 )2 + ... 2 ∂I 2 ∂I 10 10 (11.251) Hrs (I) = Hrs (I 0 ) + ∂Hrs 1 ∂ 2 Hrs (∆I 1 )2 + ... ∆I 1 + 2 ∂I 2 ∂I 10 10 (11.252) Reteniendo los términos de orden más bajo en λ y ∆I 1 obtenemos: ∆H = H − H 0 (I 0 ) − λH00 (I 0 ) = 1 ∂2H 0 (∆I 1 )2 + 2λHr,−s cos ϕ1 2 ∂I 2 10 (11.253) ∆H describe el movimiento en las cercanı́as de la resonancia, y puede escribirse como: ∆H = 1 G(∆I 1 )2 − F cos ϕ1 2 (11.254) 516 / Mecánica clásica avanzada donde: G(I 0 ) = ∂ 2H 0 2 ∂I 10 ; F (I 0 ) = −2λHr,−s (I 0 ) (11.255) Este resultado nos muestra que el movimiento cerca a cualquier resonancia, para cualquier sistema, es aproximadamente similar al de un péndulo (el diagrama de fases presenta rotación, separatriz y vibración, ver ejemplo 10.3.2). Si GF > 0, el punto fijo estable está en ϕ1 = 0 y el punto fijo inestable en ϕ1 = ±π. La frecuencia del movimiento en I 1 − ϕ1 para la libración cerca al punto estable es baja: !1/2 2 √ ∂ H 0 ω1 = F G = λ1/2 −2Hr,−s · (11.256) 2 ∂I 10 y, según la fórmula (10.104), se hace cero en la separatriz. El máximo desplazamiento en ∆I 1 está dado en la mitad de la separatriz y vale: 1/2  r   −2H F  r,−s  (11.257) = λ1/2  2 máx ∆I 1 = 2  G  ∂ H0  2 ∂I 10 Degeneración intrı́nseca. En este caso, de (11.247) y (11.248), se sigue que tanto I 1 como ϕ1 permanecen cerca del punto fijo porque ∂H 0 /∂I 1 = 0. En las proximidades del punto elı́ptico ϕ10 escribimos ϕ1 = ∆ϕ1 , y por tanto: 1 cos ϕ1 = 1 − (∆ϕ1 )2 + ... ; ϕ1 ≈ 0 (11.258) 2 En las proximidades del punto hiperbólico ϕ10 = π (o ϕ10 = −π) escribimos ϕ1 = ±π + ∆ϕ1 y por lo tanto: 1 cos ϕ1 = −1 + (∆ϕ1 )2 + ... ; 2 ϕ1 ≈ ±π (11.259) En este caso ∆H en vez de (11.254) toma la forma: ∆H = 1 1 G(∆I 1 )2 + F (∆ϕ1 )2 2 2 (11.260) donde: G= ∂2H 0 2 ∂I 10 +λ ∂ 2 H00 2 ∂I 10 +λ ∂ 2 Hr,−s (11.261) 2 ∂I 10 F = ∓2λHr,−s (11.262) 2 Como para degeneración intrı́nseca ∂ 2 H 0 /∂I 10 = 0, se sigue que F y G son del orden de λ. Cerca del punto fijo elı́ptico la frecuencia de oscilación es: " !#1/2 √ ∂ 2 H00 ∂ 2 Hr,−s ω1 = F G = λ −2Hr,−s (11.263) + 2 2 ∂I 10 ∂I 10 Teorı́a de perturbaciones / 517 y la relación de semiejes de la elipse es: ∆I = ∆ϕ1 r 1/2    F −2Hr,−s   = 2  G  ∂ (H00 + Hr,−s )  (11.264) 2 ∂I 10 Cerca del punto fijo hiperbólico no hay oscilaciones. Las órbitas no son elı́pticas sino hiperbólicas, siendo el ángulo entre las ası́ntotas: r F (11.265) tan χ = G Vemos que no hay gran diferencia cualitativa entre las trayectorias de fase en los casos con degeneración intrı́nseca y accidental, sólo que en el segundo caso las oscilaciones en ∆I 1 tienen amplitud muy pequeña en comparación con las de ϕ1 . Lo anterior suponiendo que G 6= 0. Ejemplo 11.7.1 Analizar el movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento no lineal del ejemplo 11.6.1. En este caso la degeneración es intrı́nseca, con r = 2, s = 1. H1 está dado por (11.227), de modo que, reemplazando sen ϕ02 por cos ϕ02 y haciendo λ = axy : hH1 i = −1 (I 0 − 2I20 )(I20 )1/2 cos ϕ02 2(mω10 )3/2 1 (11.266) Entonces: 2H2,−1 = −1 (I 0 − 2I20 )(I20 )1/2 2(mω10 )3/2 1 (11.267) en tanto que H0 (I0 ) = ω10 I10 . Por tanto: 2 ∂ 2 H2,−1 2 ∂I 20 = i h 1 −3/2 −1/2 I (I ) + 6(I ) 10 20 20 2(mω10 )3/2 (11.268) En cercanı́as del punto elı́ptico F y G serán: F = λ (I 10 − 2I 20 )(I 20 )1/2 (mω10 )3/2 (11.269) G= h i λ −3/2 −1/2 I (I ) + 6(I ) 10 20 20 4(mω10 )3/2 (11.270) ω1 será: ω1 = 1/2 λ (I 10 − 2I 20 )(I 10 + 6I 20 ) 2(mω10 )3/2 I 20 (11.271) 518 / Mecánica clásica avanzada Libración Rotación Resonancia: Separatriz I20 = I20 ϕ02 = ϕ20 I20 ϕ20 λ=0 Punto hiperbólico a Punto elíptico b Figura 11.2 Movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento no lineal. Superficie de sección I20 − ϕ02 . La relación entre las oscilaciones máximas en I20 y ϕ02 está dada por: 1/2 ∆I20 = 2I 20 (I 10 − 2I 20 )(I 10 + 6I 20 ) 0 ∆ϕ2 (11.272) La figura 11.2 muestra la superficie de sección I20 − ϕ02 , en coordenadas polares, con y sin perturbación. Resonancias de orden superior. Si λ no es demasiado pequeña, el hamiltoniano (11.240) puede dar lugar a contribuciones seculares que modifiquen o destruyan el invariante adiabático I 2 . Tales resonancias son entre armónicos de la oscilación pendular I 1 − ϕ1 , de frecuencia ω1 , y la frecuencia fundamental ω2 . En el lı́mite adiabático esas resonancias dan lugar a cadenas de “islas”, o sea, a movimientos pendulares alrededor de los puntos fijos en el plano J1 − χ1 de las variables acción-ángulo del movimiento pendular I 1 − ϕ1 [ver ecuaciones (10.99) y (10.100)]. Nuevamente se debe efectuar una transformación canónica que elimine la frecuencia degenerada, o sea, pasar a las variables angulares χ1 y χ2 dadas por χ1 = pχ1 − qϕ2 ; χ2 = ϕ2 , donde p y q son los números enteros de la resonancia de segundo orden. El paso siguiente consiste en encontrar los parámetros que describen el movimiento pendular alrededor de los puntos fijos de J1 − χ1 . El hamiltoniano que describe la resonancia primaria es de la forma (11.254) o (11.260), que en las cercanı́as del punto elı́ptico se comportan similarmente, y para pequeñas libraciones puede expandirse, de acuerdo con la ecuación (10.105), en la forma: 1 λGJ12 + ... (11.273) 16 donde J1 y χ1 son las variables acción-ángulo del movimiento pendular en el plano ∆I 1 − ϕ1 alrededor de un punto elı́ptico, dadas en el ejemplo 10.3.2. Si el movimiento K0 (J1 , J2 ) = H 0 (I 10 , J2 ) + ω1 J1 − Teorı́a de perturbaciones / 519 es “exactamente” pendular, J1 es constante. Cuando hay resonancias secundarias, el movimiento en el plano ∆I 1 − ϕ1 no es exactamente pendular, sino como el mostrado en la figura 11.3, que muestra la cadena de islas asociada a la resonancia cuando 5ω1 = ω2 , donde ω1 = χ̇1 . A la resonancia secundaria le corresponden cinco puntos fijos elı́pticos, en cada uno de los cuales es generado un movimiento pendular secundario. ∆I1 cos ϕ1 J1 sen χ1 ∆I1 cos ϕ1 a b Figura 11.3 Cadena de islas asociada a la resonancia: a. Aparecen las separatrices y las curvas de libración; b. Cadena de islas formadas en la resonancia secundaria. En la figura 11.3a, aparecen las separatrices y las curvas de libración. Las lı́neas punteadas corresponden a la resonancia primaria y las lı́neas continuas corresponden a las “islas” formadas en la resonancia secundaria. En la figura 11.3b, se han llevado las “islas” de la resonancia secundaria a variables acción-ángulo. En un paso siguiente, uno podrı́a transformar las variables (J, χ) a unas nuevas variables (J, χ) donde sea removida la resonancia 5ω1 = ω2 , dando lugar nuevamente a curvas de tipo pendular como las de la figura 11.2b. Para tener en cuenta la forma como una resonancia secundaria modifica la solución, ′ reintroducimos los términos de H 1 ignorados al promediar sobre ϕ2 , al ir de (11.240) a (11.242): ′ H 1 (I, ϕ) = H 1 (I, ϕ) − hH 1 (I, ϕ1 )i (11.274) que tiene la expansión de Fourier: ′ H 1 (I, ϕ) = XX l ′ H lm (I)eilϕ1 /r+i(ls+mr)ϕ2 /r (11.275) m donde la prima indica que se suprimen los términos d.c. en ϕ2 , ls + mr = 0. En las cercanı́as del punto elı́ptico ϕ10 = 0: ′ H1 = XX l m ′ H lm (I 10 + ∆I 1 , I 2 )eil∆ϕ1 /r+i(ls+mr)ϕ2 /r (11.276) 520 / Mecánica clásica avanzada Ahora transformemos esta expresión a variables acción-ángulo, mediante la fórmula: ∆ϕ1 = 2J1 R 1/2 sen χ1 ; R= F R 1/2 (11.277) Si estamos en las cercanı́as de punto elı́ptico, con movimiento de libración, ∆I 1 y ∆ϕ1 son pequeñas, por lo que J1 /R ha de ser pequeño. Entonces (11.276) al orden más bajo en ∆I 1 y ∆ϕ1 nos da para el nuevo hamiltoniano, tomando χ2 = ϕ2 y J2 = I 2 : √ XX i(l/r) 2J1 /R sen χ1 +i(ls/r+m)χ2 ′ K1 = (11.278) H lm (I 10 , J2 )e l m Usando la fórmula: eix sen θ = ∞ X Jn (x) einθ (11.279) n=−∞ donde Jn son las funciones Bessel enteras de orden n, podemos escribir a K1 como: XXX ′ (11.280) K1 = Γlmn (I 10 , J2 )einχ1 +i(ls/r+m)χ2 l donde: m n " 1/2 # l 2J1 Γlmn (I 10 , J2 ) = H lm (I 10 , J2 )Jn r R (11.281) En (11.280) resulta claro que pueden existir resonancias entre χ1 y χ2 cuando: ls χ̇2 r+m √ √ o sea, cuando ω 1 = χ̇1 = F G = 0( λ) y ω 2 = 0(1) son conmensurables, nχ̇1 = − p ω2 = ; ω1 q p, q : enteros (11.282) (11.283) Resulta ahora que la frecuencia χ̇1 = pχ̇1 − q χ̇2 es mucho menor que χ̇2 . Entonces χ̇2 puede ser eliminada con una transformación canónica mediante: F2 = (pχ1 − qχ2 )J 1 + χ2 J 2 lo cual nos da para para K 1 : XXX ′ K1 = Γlmn ei[nχ1 +p(nq+p(ls/r+m))χ2 ]/p l m (11.284) (11.285) n Ahora la variable angular χ2 puede ser eliminada mediante una transformación canónica adecuada, que equivale a promediar sobre χ2 . Introduciendo un nuevo parámetro pequeño λ1 , (11.273) y (11.285) nos conducen a: K = K 0 (J 1 , J 2 ) + λ1 K 1 (J 1 , J 2 , χ1 ) (11.286) Teorı́a de perturbaciones / 521 en K 1 sólo aparecen los términos con n dados por: ls +m =0 nq + p r (11.287) siendo nq, ls/r y mp enteros. Esto equivale a dejar en (11.280) sólo los términos con: nχ1 + ls + mr χ2 = −jpχ1 + (ks + jq − ks)χ2 = j(qχ2 − pχ1 ) r (11.288) o sea, con: l = k ; m = jq − ks ; j, k : enteros r Entonces la expansión (11.280) toma la forma: X K−jp,jq e−ijχ1 K1 = n = −jp ; (11.289) (11.290) j donde: K−jp,jq = X Γkr,jq−ks,−jp (11.291) k Ahora, como K no depende de χ2 , J 2 es constante: q J 2 = J2 + J1 = constante p (11.292) que es el invariante adiabático para las oscilaciones que dan lugar a las “islas”. El movimiento en J 1 − χ1 es integrable, siendo las oscilaciones de ∆J 1 y χ1 alrededor del punto fijo elı́ptico, como en (11.254), de forma pendular y por tanto aplicables los resultados para este tipo de movimiento. Como K 1 proviene de la parte oscilante de H 1 , el armónico más bajo en (11.290) se obtiene para j = ±1. Asumamos que q = 1, que corresponde a la resonancia con el fundamental de la oscilación χ2 = ϕ2 . Entonces el coeficiente de Fourier del término dominante en (11.290) es: ! r X l 2J1 H kr,±1−ks J−p (11.293) K−p,±1 = r R k p o sea, proporcional a Jp [(l/r) 2J1 /R]. De (11.256) se sigue que ω1 = 0(λ)1/2 y de (11.283) que ω2 = pω1 . Como ω2 = O(1), se cumple que p espun entero del orden de λ−1/2 . De (11.257) se sigue que máx ∆I 1 = 2R, por lo tanto 2J1 /R es del orden de la unidad. El desarrollo asintótico de Jn (x) para n grande es: x n (11.294) Jn (x) ≈ (2πn)1/2 en 2n como λ es pequeño, p es grande y podemos escribir: ! !p r r 2J1 l 2J1 l −1/2 p Jp ≈ (2πp) e r R 2rp R h √ √ i (11.295) = O (e λ)1/ λ 522 / Mecánica clásica avanzada lo cual nos muestra la pequeñez del término dominante en K 1 . F , el término de interacción en el movimiento pendular secundario es, de acuerdo con (11.255), proporcional a Kp,±1 , o sea a Jp . De (11.256) se sigue que las oscilaciones pendulares en las “islas” es muy baja, en tanto que de (11.257) se concluye que la amplitud de las oscilaciones √ 1/(2√λ) 1/(4√λ) √ J1 , que son muy pequeñas y además “islas” es proporcional a λ1 (e λ) decrecen rápidamente cuando J1 decrece. Para λ pequeño, las oscilaciones “islas” son despreciables, pero para λ relativamente grande, se sigue de (11.295) que pueden llegar a ser importantes, incluso comparables a las de la resonancia primaria. La rápida reducción del tamaño de las cadenas de “islas” de orden superior cerca a los puntos fijos nos indica que dichos puntos son relativamente estables cuando las perturbaciones no son muy grandes. Pero para perturbaciones grandes aparecerán muchos nuevos puntos fijos elı́pticos y cadenas de “islas” de orden superior de tamaño apreciable, ası́ como frecuencias de libración, que alteran drásticamente los invariantes adiabáticos o sea los toroides invariantes. 11.8. Movimientos regulares e irregulares Se denomina irregular, caótico o estocástico al movimiento de un sistema de varios grados de libertad en que por aumento de una perturbación desaparecen constantes de movimiento uniformes, alterando la topologı́a de los toroides invariantes. El teorema de Kolmogorov, Arnold y Moser establece que para perturbaciones suficientemente pequeñas existen aún toroides invariantes (movimientos regulares), si el sistema satisface ciertas condiciones. La existencia de toroides invariantes usualmente se cuantifica por medio de la medida de la región del espacio fásico ocupada por toroides invariantes. La estocasticidad global se presenta cuando la región ocupada por toroides invariantes tiene una medida suficientemente pequeña, o sea que el movimiento esencialmente es caótico, y se puede caracterizar por el valor del parámetro de perturbación. Aplicaciones de una superficie de sección en sı́ misma. Sobre el toroide invariante de un sistema de dos grados de libertad, el movimiento puede ser parametrizado por las variables angulares ϕ1 , ϕ2 , o por el tiempo, ası́: ϕ1 = ω1 t + ϕ10 ; ϕ2 = ω2 t + ϕ20 (11.296) Como ω1 y ω2 son funciones de las variables de acción I1 , I2 , que para un sistema integrable son constantes de movimiento uniformes, se sigue entonces que la razón entre ω1 y ω2 es igualmente una constante: ~ = α(I) ~ ω1 (I) ~ ω2 (I) (11.297) Para α = r/s, con r y s números enteros, ω1 y ω2 son conmensurables y el movimiento degenera en una curva bidimensional, que se repite después de r giros en ϕ1 y s giros en ϕ2 . Como r y s pueden ser grandes, y entre cualquier par de números racionales siempre hay muchos racionales, se sigue que las órbitas periódicas son arbitrariamente próximas entre sı́ en el espacio fásico. Teorı́a de perturbaciones / 523 El concepto de movimiento sobre un toro puede generalizarse a más de dos grados de libertad. Si se toma t = 0 cuando la trayectoria cruza la superficie de sección en el punto x0 , en t = 2π/ω2 cruzará en el punto x1 , en t = 4π/ω2 cruzará en x2 y ası́ sucesivamente. Entre dos intersecciones consecutivas ϕ1 avanza por ω1 ∆t = 2πα, donde α es el número r/s. Como la energı́a E es función de I1 e I2 , para E fija, α puede asumirse función de I1 solamente. Los puntos de las sucesivas intersecciones con la superficie de sección están relacionados entre sı́ mediante cierto mapeo o aplicación discreta, llamada aplicación canónica. Llamando x al conjunto (I, ϕ): xn+1 = C(xn ) (11.298) o explı́citamente: x1,n+1 = I1,n ; ϕ1,n+1 = ϕ1,n + 2πα(I1,n+1 ) (11.299) donde escribimos a α como una función de I1,n+1 . La anterior es la aplicación “twist”, que aplica cı́rculos en cı́rculos, pero con un número de rotación α que en general depende del radio. La figura 11.4 muestra la aplicación para α irracional (lı́neas continuas) y para α racional (lı́neas a trazos) con s = 6. Trayectoria de fases Puntos fijos con r entero y s = 6 I1 x0 x1 ϕ1 I2 x2 ϕ2 ϕ2 = constante a α irracional b Figura 11.4 Toroide invariante de un sistema de dos grados de libertad ϕ1 y ϕ2 . A la izquierda, curva bidimensional que se repite después de r giros en ϕ1 y s giros en ϕ2 . Al lado derecho, mapa de Poincaré formado por puntos xi donde la trayectoria cruza la superficie de sección. Directamente de (11.299) se sigue que: I1,n+1 , ϕ1,n+1 =1 J I1,n , ϕ1,n (11.300) o sea que la aplicación transforma una región arbitraria de la superficie de sección en otra conservando el área. 524 / Mecánica clásica avanzada Lo anterior es válido para sistemas integrables. Si este sistema es perturbado ligeramente, el hamiltoniano será ahora función de los ángulos: ~ ϕ ~ + λH1 (I, ~ ϕ H(I, ~ ) = H0 (I) ~) (11.301) En la superficie de sección I1 − ϕ1 definida por ϕ2 = constante (módulo 2π), esperamos que la aplicación “twist” cambie en una aplicación “twist” perturbada: In+1 = In + λf (In+1 , ϕn ) (11.302) ϕn+1 = ϕn + 2πα(In+1 ) + λg(In+1 , ϕn ) donde se ha omitido el subı́ndice 1. f y g son funciones periódicas de ϕn . Como la transformación de n a n + 1 es generada por las ecuaciones de Hamilton, la aplicación (11.302) debe conservar el área. Esta aplicación puede tomarse como una transformación canónica con función generatriz: F2 (In+1 , ϕn ) = In+1 ϕn + 2πA(In+1 ) + λB(In+1 , ϕn ) (11.303) donde: α= ∂A ; ∂In+1 f =− ∂B ; ∂ϕn g= ∂B ∂In+1 (11.304) La condición de conservación del área (11.300) implica ahora que: ∂f ∂g + =0 ∂In+1 ∂ϕn (11.305) Cuando f no depende de I y g = 0, entonces de (11.302) se obtiene la aplicación “twist” radial perturbada: In+1 = In + λf (ϕn ) ϕn+1 = ϕn + 2πα(In+1 ) (11.306) Cuando f = sen ϕn esta aplicación se llama la aplicación estándar (o aplicación de Chirikov). Una involución C = i es una aplicación canónica tal que al repetirse dos veces reproduce las condiciones iniciales. Entonces: xn+2 = i(xn−1 ) = i2 (xn ) = xn (11.307) La aplicación “twist” radial es un producto de involuciones si f (−ϕ) = −f (ϕ). Las dos involuciones que dan lugar a la aplicación “twist” radial son: I = In + f (ϕ)n ; ϕ = −ϕn (11.308) ϕn+1 = −ϕ + 2πα(I) (11.309) y, In+1 = I ; La factorización en involuciones ayuda a determinar los puntos fijos, pues los puntos fijos de las involuciones son de perı́odo 1. Por ejemplo, (11.308) tiene los puntos fijos Teorı́a de perturbaciones / 525 dados por ϕ1 = 0, π para todo I1 , y (11.309) tiene puntos fijos dados por 2ϕ2 = 2πα(I2 )− 2πm con m entero. A partir de las ecuaciones de Hamilton podemos hallar la correspondiente aplicación sobre una superficie de sección. Las ecuaciones de Hamilton del hamiltoniano (11.301) son: dIi ∂H1 ; = −λ dt ∂ϕi dϕi ∂H1 ∂H0 +λ = dt ∂Ii ∂Ii (11.310) La ecuación para I1 sobre la superficie de sección ϕ2 = constante = ϕ20 , entre la n y la n + 1-ésima iteración, es: ∂H1 dI1 (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) = −λ dt ∂ϕ1 (11.311) donde I2 , ω1 y ω2 son funciones de In+1 . En la n-ésima iteración en (11.311) t = 0 y en la n + 1-ésima iteración t = T2 . Luego el salto en la acción I1 en una iteración es: Z T ∂H1 ∆I1 = −λ dt (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) (11.312) ∂ϕ1 0 Entonces de (11.302) se sigue que: λf (In+1 , ϕn ) = ∆I1 (In+1 , ϕn+1 ) (11.313) La función g que define el cambio en ϕn se obtiene de la condición de conservación del área, (11.305): Z ϕ ∂f g(I, ϕ) = − dϕ (11.314) ∂I El problema inverso consiste en hallar el hamiltoniano asociado a la aplicación canónica. Para la aplicación (11.306), podemos asumir que el ı́ndice n hace las veces del parámetro “tiempo”. La función delta periódica permite seleccionar los tiempos de cruce de la trayectoria con la superficie de sección: δ1 (n) = ∞ X m=−∞ δ(n − m) (11.315) Entonces (11.306) toma la forma: dI = λf (ϕ)δ1 (n) ; dn dϕ = 2πα(I) dn (11.316) donde In y ϕn son I(n − ǫ) y ϕ(n − ǫ). Estas ecuaciones son de forma hamiltoniana con: Z I Z θ H(I, ϕ, n) = 2π α(I ′ )dI ′ − λδ1 (n) f (ϕ′ )dϕ′ (11.317) que es un hamiltoniano no autónomo de un grado de libertad. 526 / Mecánica clásica avanzada Ejemplo 11.8.1 Construir un hamiltoniano para la aplicación estándar (11.306). Dicha aplicación es: In+1 = In + K sen ϕn ϕn+1 = ϕn + In+1 (11.318) Las ecuaciones de movimiento según (11.316) son: dI = K sen ϕ δ1 (n) ; dn dϕ =I dn (11.319) y el hamiltoniano según (11.317) es: H= 1 2 I + Kδ1 (n) cos ϕ 2 (11.320) Es conveniente usar la expansión de Fourier de la función delta periódica, (11.315): δ1 (n) = 1 + 2 ∞ X cos 2πqn (11.321) q=1 entonces: H= ∞ X 1 2 I + K cos ϕ ei2πnm 2 m=−∞ (11.322) donde el número de iteración n es una variable temporal, resultando H no autónomo. H puede también escribirse en la forma: H = H 0 + H1 (11.323) donde: H0 = 1 2 I + K cos ϕ 2 (11.324) y, H1 = 2K cos ϕ ∞ X cos 2πqm (11.325) q=1 Como se ve, H0 es el hamiltoniano de un péndulo y H1 es una perturbación consistente en una serie de impactos periódicos en el tiempo. Ejemplo 11.8.2 Construir la aplicación correspondiente al movimiento en las cercanı́as de la separatriz, en una superficie de sección, para un sistema de dos grados de libertad. Teorı́a de perturbaciones / 527 Por aplicar la teorı́a de las perturbaciones seculares a una resonancia dada en un sistema cuasi-integrable y promediando sobre las variables angulares rápidas, el hamiltoniano que describe el movimiento cerca a la resonancia toma la forma (11.254): 1 H = H0 (I) + Gp2 − λF cos q 2 (11.326) Como este hamiltoniano describe un movimiento cuasiperiódico, con una parte rápida: I = constante ; ϕ = ωϕ (I)t + ϕ0 (11.327) y una parte lenta correspondiente al movimiento integrable de un péndulo, la aplicación en cualquier superficie de sección, ϕ = constante o q = constante, es la aplicación canónica (11.299). Para hallar la aplicación perturbada, correspondiente a (11.302), debemos considerar los términos resonantes que fueron despreciados al promediar la resonancia ω2 /ω1 = r/s sobre la variable angular rápida ϕ como en (11.242). Entonces, de (11.240), el hamiltoniano completo, que contiene resonancias entre ϕ y el movimiento lento q, y movimiento caótico en cercanı́as de la separatriz, es: 1 H = H0 (I) + Gp2 2 − λF cos q + λ X l>1,m6=0 Hlm cos lϕ mq − + ∆lm r r (11.328) donde G, F , Hlm y ∆lm dependen sólo de I. Ahora podemos aplicar la fórmula (11.312) para hallar a f de la aplicación perturbada en una superficie de sección, que depende sólo de los términos reintroducidos en (11.328). La figura 11.5 muestra el movimiento en las superficies de sección p − q y I − ϕ, donde la parte rayada representa el movimiento en la separatriz junto con la componente estocástica. Ver más adelante. Por conveniencia, buscamos la aplicación sobre la superficie de sección I − ϕ con q ≈ ±π. Como los coeficientes de Fourier decaen al aumentar l y m, retendremos sólo el término dominante con l = m = 1. Entonces (11.328) y (11.312) nos dan: Z ∞ ϕ q i ∂ h f (In+1 , ϕn ) = − dt H11 cos (11.329) − + ∆11 ∂ϕ r r −∞ Según la ecuación (10.105), para la trayectoria separatriz se cumple: q = 4 tan−1 (eω0 t ) − π donde ω02 = λF G. f toma la forma: Z ωϕ (In+1 )t ϕn A(In+1 ) +∞ q dt − − f (In+1 , ϕn ) = sen r r r r −∞ (11.330) (11.331) donde A es H11 y ∆11 ha sido incluido en ϕn que mide a ϕ en el n-ésimo cruce por la superficie de sección colocada en la separatriz, q ≈ ±π. Teniendo en cuenta que 528 / Mecánica clásica avanzada p q ωq +π –π Superficie de sección ϕ = constante a Iy ϕ Ix ωϕ Superficie de sección q = constante b Figura 11.5 Movimiento en las superficies de sección para un sistema de dos grados de libertad: a. Sección p − q; b. Sección I − ϕ. q(−ω0 t) = −q(ω0 t), expandiendo la función seno y notando que sólo la parte simétrica contribuye a la integral, obtenemos: f (In+1 , ϕn ) = A −ϕn α2 (Q0 ) sen ω0 r r (11.332) donde: mq(s) αm (Q0 ) = cos − Q0 s ds 2r −∞ Z ∞ (11.333) es la integral de Arnold-Melnikov, y: Q0 = ωϕ rω0 (11.334) Teorı́a de perturbaciones / 529 La integral (11.333) es impropia pero consta de una parte oscilante que promedia a cero durante el movimiento sobre la separatriz y una parte constante que viene de la región con s ≤ 1/Q0 . Melnikov la evaluó, siendo para Q0 ≫ m:6 αm (Q0 ) = 4π (2Q0 )m−1 e−πQ0 /2 (m − 1)! (11.335) Como ω02 = λF G, entonces Q0 ≈ λ1/2 y vale la expansión asintótica (11.335). Entonces podemos escribir: f = f0 sen ϕn ; f0 = 8πA 2 −πQ0 /2 Q e ωϕ 0 (11.336) De acuerdo con el ejemplo 10.3.1, para las oscilaciones de un péndulo en las cercanı́as de la separatriz se cumple que el perı́odo vale:    T = ω0−1 ln  32  ωϕ I  1+ λF (11.337) El cambio en ϕ durante este tiempo es ωϕ T , lo cual conduce al número de rotación de la aplicación “twist”: 2πα = 32 ωϕ ln ω0 |W | (11.338) donde: W = −F − ωϕ I λF (11.339) Si escogemos a ωϕ independiente de I, con lo cual el problema no se altera esencialmente, resulta que f no depende de I, y según (11.314) podemos tomar g ≡ 0. Es conveniente cambiar de variables de I a W . En las variables W , ϕ, la aplicación separatriz es: Wn+1 = Wn − W0 sen ϕn ϕn+1 = ϕn + Q0 r ln 32 |Wn+1 | (11.340) donde: W0 = 8πA 2 −πQ0 /2 ωϕ I0 = Q0 e F F (11.341) No degeneración y no degeneración isoenergética. Tratemos de explorar las consecuencias debidas a la dependencia lineal de las frecuencias sobre los movimientos en una superficie de sección.7 6 Véase 7 Véase 1976. el apéndice A, en Chirikov, Op. cit. el texto de V. Arnold, Les méthodes mathématiques de la mécanique classique, Mir, Moscú, 530 / Mecánica clásica avanzada Asumamos que hay una relación entre las frecuencias, para dos grados de libertad, de la forma: f (ω1 , ω2 ) = 0 (11.342) Diferenciando hallamos de df = 0:   ∂ω1 ∂ω2 ∂f  ∂I1 ∂I1   ∂ω1   ω̃I f~ω =    ∂ω ∂ω2   ∂f 1 ∂I2 ∂I2 ∂ω2 Si f es de la forma: f = m1 ω 1 + m2 ω 2 = 0    =0  (11.343) (11.344) con m1 y m2 enteros, f~ω es un vector con componentes m1 y m2 . Entonces (11.343) se satisface solamente si se cumple la condición necesaria: det ω̃I = 0 (11.345) det ω˜I 6= 0 es la condición necesaria de no degeneración de las frecuencias (o de no dependencia lineal de las frecuencias). En el caso no degenerado los movimientos son cuasiperiódicos con un número de frecuencias igual al número de grados de libertad, con lo cual existen toroides invariantes l-dimensionales. Las curvas de fase son hélices sobre los toroides y las frecuencias de revolución cambian de un toroide a otro. En el caso general no sólo las dos frecuencias sino su relación α varı́a de un toroide a otro. Si la derivada de α respecto a la variable de acción que numera los toros es diferente de cero para un valor dado de la energı́a, diremos que el sistema es isoenergéticamente no degenerado. La condición de no degeneración isoenergética se escribe como:   ∂ω1 ∂ω2 ω1   ∂I1 ∂I1       ∂ω ∂ω2 1 6= 0 (11.346) det  ω2      ∂I2 ∂I2   ω1 ω2 0 la cual se deduce fácilmente de las expresiones dα(I1 , I2 ) 6= 0 y dE = ω1 dI1 +ω2 dI2 = 0. Las condiciones de no degeneración y de no degeneración isoenergética son independientes, es decir, la una no implica la otra. Consideremos la aplicación “twist” sobre el punto de intersección de una curva de fases con la superficie de sección. Esa aplicación deja invariantes los cı́rculos meridianos concéntricos de intersección de los toros invariantes con la superficie de sección. Cada cı́rculo gira un ángulo igual a 2πα. Si el sistema no es isoenergéticamente degenerado, el ángulo de rotación de los cı́rculos invariantes sobre la superficie de sección cambiará de un cı́rculo a otro, es decir, α necesariamente cambia al pasar de un cı́rculo a otro. Como α es una función continua de I1 , con E constante, al ir variando I1 , α tomará tanto Teorı́a de perturbaciones / 531 valores racionales como irracionales, de modo que en ciertos cı́rculos habrá puntos fijos discretos y en otros no. Una y otra clase de cı́rculos forman un conjunto denso, pero en casi todos los cı́rculos el ángulo de rotación no será un múltiplo racional de 2π. Si ahora la aplicación es perturbada, como en (11.306), la propiedad de un cı́rculo con α racional de tener puntos fijos debe desaparecer. La trayectoria sobre un toro resonante no perturbado es cerrada y no llega sino a muy pocos puntos del mismo, pero al aplicar una pequeña perturbación llenará todos los puntos del toro. En tanto que si el toro es no resonante, una perturbación pequeña no ocasiona un cambio grande en las trayectorias de fase y en la topologı́a misma del toro. En una resonancia particular, ω1 /ω2 = r/s, la condición de no degeneración isoenergética (11.346) se convierte en: r2 ∂ 2 H0 ∂ 2 H0 ∂ 2 H0 + s2 − 2rs 6= 0 2 2 ∂I1 ∂I2 ∂I1 ∂I2 (11.347) Esta condición a la vez es una condición de no linealidad del movimiento alrededor de un punto fijo. Al analizar el movimiento cerca a una resonancia aislada encontramos que es descrito por un hamiltoniano de la forma (11.253): ∆H = ∂2H 0 2 ∂I 1 (∆I 1 )2 + 2λHr,s cos ϕ1 (11.348) 2 tomando a Hrs real. Si ∂ 2 H 0 /∂I = 0, entonces la no linealidad aparece solamente al orden λ2 y el ancho de la separatriz no estará restringido a ser del orden de λ1/2 , según (11.256). Entonces la condición de no linealidad es, de (11.255): G= ∂2H 0 2 ∂I 1 6= 0 (11.349) 2 Esta condición separa los sistemas con degeneración accidental (∂ 2 H 0 /∂I 6= 0) o 2 fuertemente no lineales, de los sistemas con degeneración intrı́nseca (∂ 2 H 0 /∂I = 0) o débilmente no lineales. Para ver la equivalencia de (11.349) y (11.347), pasamos de las variables (I 1 , I 2 ) a las (I1 , I2 ) mediante la transformación canónica (11.238) y (11.239): ∂2H 0 ∂ ∂H0 ∂I1 ∂H0 ∂I2 = . . 6= 0 (11.350) + ∂I12 ∂I2 ∂I 1 ∂I 1 ∂I1 ∂I 1 y como según (11.238), ∂I1 /∂I 1 = r y ∂I2 /∂I 1 = s, obtenemos inmediatamente a (11.347). O sea que la condición de no degeneración isoenergética es a la vez una condición de no linealidad del movimiento en proximidades de una resonancia aislada. El teorema de K. A. M. Si un sistema integrable es perturbado, hemos visto en (11.45) que las resonancias entre los grados de libertad pueden destruir la convergencia de las expansiones en series de potencias alrededor del sistema no perturbado. Sin embargo el teorema de K. A. M. dice que “si un sistema hamiltoniano es no degenerado, entonces la mayor parte de los toroides invariantes no resonantes no desaparecen bajo una perturbación hamiltoniana lo suficientemente pequeña, sino que se deforman ligeramente de modo que en el espacio de fases del sistema perturbado existen igualmente 532 / Mecánica clásica avanzada toroides invariantes, o sea adherencias de las curvas de fase que son hélices cuasiperiódicas con un número de frecuencias igual al número de grados de libertad. Tales toroides son la mayorı́a en el sentido que la medida del complemento de su unión es del orden de λ”. Las condiciones a ser satisfechas son: (i) No linealidad suficiente. O sea que en cierto rango de valores de I~ las frecuencias son independientes: ~ 6= 0 m.~ ~ ω(I) (11.351) donde ω ~ = ∂H0 /∂ I~ y m ~ es un vector de componentes enteras. (ii) La perturbación es función de clase C M , o sea que posee derivadas continuas hasta de orden M . (iii) El estado del sistema es lo suficientemente alejado de una resonancia para satisfacer que: |m ~ ·~ ω| ≥ C|m| ~ −τ (11.352) para todo m, ~ donde τ depende de l y M , y C depende de λ, de la magnitud del hamiltoniano de perturbación H1 , y de la no linealidad G del hamiltoniano no perturbado H0 . Como (11.352) no puede satisfacerse para C muy grande y C se incrementa con λ, |H1 | y 1/G, hay una condición de “perturbación suficientemente pequeña” para que existan toros de K. A. M. (i) y (iii) también implican una condición de no linealidad moderada. Este teorema fue probado por Arnold (1961) para H1 analı́tica y por Moser (1962) para cuando H1 es de clase C M , basados en una conjetura de Kolmogorov (1954). La dificultad de la prueba del teorema radica en los pequeños denominadores que aparecen en todo el procedimiento de expansión en series de potencias. Las pruebas utilizan los métodos de convergencia rápida (superconvergentes), análogos al método de Newton para resolver numéricamente una ecuación algebraica, que permite neutralizar el efecto de los pequeños divisores que aparecen en cada aproximación. Para ilustrar esto, consideremos la aplicación “twist” perturbada con dos grados de libertad, (11.302), correspondiente a las intersecciones de la trayectoria con la superficie de sección: I1 (ϕ1 + 2πα) = I1 (ϕ1 ) + λf (ϕ1 ) Usemos expansiones de Fourier respecto a ϕ1 : X X bk eikϕ1 I1 (ϕ1 ) = ak eikϕ1 ; λf (ϕ1 ) = (11.353) (11.354) Entonces: I1 (ϕ1 + 2πα) − I1 (ϕ1 ) = X ak eik2πα − 1 eikϕ1 (11.355) con lo cual se obtiene la siguiente relación entre los coeficientes: ak = bk ik2πα e −1 (11.356) Teorı́a de perturbaciones / 533 Los módulos de estos coeficientes se relacionan por: |bk | (11.357) 2 sen πkα Vemos que ak no tiende a cero tan rápido como bk y que son indefinidos cuando α es racional. El anterior es el problema de los denominadores nulos que impide la convergencia de las series de perturbaciones. Pero como α es función de I1 , el valor de I1 puede escogerse de modo que el denominador nunca sea resonante. Básicamente el método de cálculo consiste en variar las condiciones iniciales en cada paso del procedimiento de expansión para asegurarse de estar lo suficientemente lejos de las resonancias y poder proseguir la expansión al paso siguiente. En una expansión superconvergente la aproximación n + 1-ésima se realiza alrededor de los valores de las variables obtenidos de la n-ésima aproximación y no alrededor de los valores no perturbados, como se hace en una expansión ordinaria. Como hemos visto, si hay una resonancia entre los dos grados de libertad del sistema no perturbado, la perturbación induce un cambio en las trayectorias del espacio de fases, lo mismo que en las frecuencias. Si la acción perturbada I1 es próxima a la no perturbada I0 , pueden existir curvas invariantes de K. A. M. “cercanas” a las curvas invariantes no perturbadas. El anterior es el significado de la condición de independencia lineal m ~ ·~ ω 6= 0, que garantiza que I1 → I0 cuando λ → 0. Para un valor fijo de λ, la no linealidad necesaria en G puede estimarse de la condición ∆I1 ≪ I0 , siendo I0 la acción no perturbada y ∆I1 el máximo valor de la diferencia I1 − I0 . De (11.238) se sigue que: |ak | = (11.358) ∆I1 = r∆I 1 Para un sistema con degeneración accidental, (11.257) nos dice que: 1/2 2λHrs ∆I 1 = 4 G (11.359) Por tanto ∆I1 ≪ I0 impone la condición: G≫ 32r2 λHrs I02 (11.360) La condición de suavidad de la perturbación, (ii), puede asociarse con la propiedad de las curvas de K. A. M. de existir solamente separadas de todas las “islas” de perturbaciones. Si las “islas” entre dos resonancias de orden bajo llenan todo el espacio de fases entre ellas, podemos razonablemente esperar que no haya una curva de K. A. M. ¿Cómo relacionar esto con la condición (ii) del teorema?. Asumamos que ω1 /ω2 = s y que H0 depende linealmente de I2 , de modo que ω2 es una constante independiente de I1 e I2 . En la siguiente resonancia, ω1 /ω2 = s + 1, de modo que la diferencia en ω1 entre dos resonancias sucesivas es δω1 = ω2 , como puede verse en la figura 11.6. Entre dos resonancias primarias hay una serie de resonancias secundarias en ω1 /ω2 = s+p/q (p, q enteros y p < q). El hamiltoniano tiene la expresión: X H = H0 + λ Hlm ei(lϕ1 −mϕ2 ) (11.361) l,m 534 / Mecánica clásica avanzada Tomemos en la sumatoria los valores de l que dan lugar a resonancias secundarias, l = q, 8 ω 1 /ω 2 = s ω 1 /ω 2 = s + 1 a 4 2λG′H 1m 4 2λG′H 1m 4 2λG′H 1m 0 1/4 1/3 1/2 2/3 3/4 b 1 G′∆I 1 ω2 Figura 11.6 Intervalos que muestran resonancias. m(p, q) = p + sq (11.362) y analicemos el movimiento en las cercanı́as de una resonancia secundaria. De (11.359) el ancho de la separatriz en cada resonancia es: ∆I 1 = 4 2λHqm G 1/2 (11.363) 8 Condiciones de validez del teorema de K. A. M.: (i) Las curvas perturbadas son cercanas a las curvas no perturbadas no resonantes. (ii) Las resonancias son lo suficientemente separadas, de acuerdo con la condición de suavidad de la perturbación. (iii) En la figura 11.6b los intervalos rayados muestran resonancias secundarias. La suavidad de la perturbación exige que las resonancias secundarias sean aisladas. Teorı́a de perturbaciones / 535 y de las expresiones ∆I1 = q∆I 1 y g = q 2 ∂ 2 H0 /∂I12 = q 2 G′ , obtenemos para la contribución de todas las resonancias secundarias sobre el valor de ∆I1 : 1/2 X X 2λ 1/2 Hqm (11.364) ∆I1 = 4 G′ p,q y para el ensanchamiento de las frecuencias: X X ∂ω1 X ∆I1 = G′ ∆I1 ∆ω1 = ∂I1 1/2 X 2λ 1/2 = 4 Hqm G′ p,q (11.365) La relación entre la suma de los anchos de las islas secundarias y la separación entre las resonancias primarias es: P X ∆ω1 1/2 = 4(2λG′ )1/2 ω2−1 Hqm (11.366) δω1 p,q Si H1 tiene M derivadas continuas respecto a ϕ1 y ϕ2 , las derivadas altas tienen la forma: X (11.367) Hqm (iq)k1 (−im)M−k1 ei(qϕ1 −mϕ2 ) p,q Las cuales serán continuas a condición de que Hqm sean lo suficientemente pequeñas para q y m grandes. Para que la serie converja, es necesario que para q y m grandes los términos se comporten como 1/q 2 por lo menos, ya que m es lineal en q de acuerdo con (11.362). Entonces las amplitudes de Fourier para q grandes han de comportarse como: Hqm ≈ A q M+2 (11.368) con el fin de que λH1 sea de clase C M . Según (11.362) y la desigualdad p < q, hay q coeficientes de Hqm con el mismo valor de q y diferentes valores de p. Estos coeficientes corresponden a resonancias y son todos grandes y de magnitud comparable. Por tanto: X 1/2 1/2 Hqm ≈ qHqm′ (11.369) donde m′ es un valor de m convenientemente escogido. De (11.366), (11.368) y (11.369) se sigue entonces que: √ P ∞ X ∆ω1 4 2ω1 σ ≈ 4(2λG′ A)1/2 ω2−1 (11.370) q −M/2 = δω1 ω2 q=1 donde: σ=ζ M 2 , ω1 = (λAG′ )1/2 (11.371) 536 / Mecánica clásica avanzada y ζ es la función zeta de Riemann. ζ(1) = ∞, ζ(2) = 1, 64493, ζ(3) = 1, 20205 y ζ(x) → 1 para x → ∞. Entonces (11.370) existe si M > 2. De modo que independientemente del valor del coeficiente de la sumatoria, obtenemos la importante condición para la existencia de una superficie de K. A. M.: que el número de derivadas continuas de la perturbación satisfaga que M >2 (11.372) Podemos comparar este resultado con la condición (iii) de K. A. M., (11.352), escrita para dos dimensiones como: ω1 r − > C ′ sτ −1 ω2 s (11.373) El lado izquierdo es el ancho de una resonancia secundaria aislada. Tomando el ancho total a ser examinado como la distancia entre dos resonancias de orden inferior, o sea el intervalo unidad, hay a lo sumo s valores de r en tal intervalo que deben ser excluidos según la condición (i) del teorema. La medida de Lebesgue M de las resonancias excluidas se obtiene multiplicando a (11.373) por s y sumando sobre s: M = C′ ∞ X s−τ = C ′ ζ(τ ) (11.374) s=1 Comparando a (11.374) con (11.370) vemos que: C′ ≈ ω1 ; ω2 ω1 = √ λAG′ ; τ= M 2 (11.375) Entonces τ > 1 es suficiente para que exista una superficie de K. A. M. Chirikov ha determinado la condición necesaria correspondiente a (11.372) para l grados de libertad: M ≥ 2l − 2 (11.376) y Moser la condición suficiente: M ≥ 2l + 2 (11.377) suponiendo que C tiende a cero con λ y es tomada suficientemente pequeña. Asumiendo que la suma en (11.370) converge a σ, vemos que las superficies de K. A. M. no existen si α = ω1 /ω2 cae dentro de una de las regiones rayadas en la figura 11.6b. Como el ancho de esas regiones es proporcional a (λG)1/2 y decrece con el incremento de q, α debe estar lo suficientemente lejos de un número racional p/q. Para λ pequeño es fácil cumplir esto, pero cuando λ se incrementa, solamente aquellos irracionales que son más difı́ciles de aproximar por racionales pueden dar lugar a √ superficies de K. A. M. El número “más irracional” en este sentido es la media dorada ( 5 − 1)/2. La condición sobre el valor de λ se obtiene de (11.370) haciendo el lado izquierdo igual a uno: λG′ ≤ ω22 32Aσ 2 (11.378) Teorı́a de perturbaciones / 537 Por otra parte (11.360) y (11.378) dan la condición de λ no linealidad moderada: ω22 32λA < G′ < 2 I0 32Aσ 2 λ (11.379) usando r2 Hrs /q 2 ≈ A. El teorema de Poincaré-Birkhoff. Cualquier punto del cı́rculo con α(I) = r/s es un punto fijo de la aplicación “twist” no perturbada (11.299) con perı́odo s. El teorema dice que para algún múltiplo par de s, 2ks con k = 1, 2, ..., permanecen 2ks puntos fijos al colocarse una perturbación, siendo ks de ellos elı́pticos y ks hiperbólicos. Asumamos que α(I) aumenta al aumentar I. Entonces hay una curva de K. A. M. por fuera de la curva racional, que se mueve en sentido contrario a las agujas del reloj (flechas externas), α > r/s, y una curva de K. A. M. dentro de la curva racional que se mueve en sentido de las agujas reloj, para s iteraciones de la aplicación “twist” perturbada (11.302). Por tanto entre estas dos debe haber una curva cuya coordenada angular ϕ no cambia después de s iteraciones de la aplicación (curva sólida, que no es una curva de K. A. M). Iy Curva estacionaria Circunferencia K.A.M. α > r/s Circunferencia α = r/s Ix Circunferencia K.A.M. α < r/s s = 3, k = 1 Figura 11.7 La figura muestra una curva de K. A. M. (por fuera de la curva racional) que se mueve en sentido contrario al del reloj, una curva racional que se mueve en sentido del reloj y una curva sólida que no es de K. A. M. Ahora mediante una aplicación que preserve el área llevamos los puntos de la curva sólida radialmente a alguna curva rayada como lo muestra la figura 11.7. Las curvas continua y rayada deben encerrar la misma área. Esto es posible sólo si las curvas se cruzan entre sı́ un número par de veces. Cada intersección cuando es iterada s veces retorna a 538 / Mecánica clásica avanzada su posición inicial, es un punto fijo. De modo que para un número par de intersecciones, debe haber 2ks de tales puntos, que son los puntos fijos de Poincaré-Birkhoff. El teorema no da el valor de k, que en la figura se ha tomado k = 1. Los puntos son alternativamente de naturaleza elı́ptica e hiperbólica. Los puntos con α 6= r/s cercanos a un punto elı́ptico tienden a girar alrededor de él, en tanto que los puntos cercanos a un punto hiperbólico mediante repetidas aplicaciones tienden a alejarse indefinidamente del punto fijo. En la sección 11.7 mediante transformación a un sistema de coordenadas fijo en un punto elı́ptico estudiamos el comportamiento de los puntos cercanos a él y encontramos que tienen un movimiento pendular. Luego encontramos que las resonancias de orden superior dan lugar a la aparición de nuevos puntos fijos en las cercanı́as del punto elı́ptico, alrededor de los cuales nuevamente se presentan oscilaciones pendulares de amplitud mucho más pequeña, según (11.295) proporcional a (1/s)s+1/2 . Hasta aquı́ vemos un cuadro lleno de curvas de K. A. M. de gran complejidad. Sin embargo, veremos que el comportamiento estocástico no resulta de las resonancias de orden superior, sino que puede ocurrir en resonancias de orden bajo como resultado de la bifurcación de las separatrices. Hablando a grosso modo podemos decir que los punto elı́pticos están asociados a la estructura de islas del espacio fásico y los puntos hiperbólicos al comportamiento estocástico de la región entre toroides de K. A. M. En el apéndice 9 del libro de Arnold hay una serie de proposiciones referentes a los puntos fijos de las aplicaciones canónicas.9 Bifurcación de las separatrices. Sabemos que un péndulo tiene una separatriz que une suavemente las órbitas hiperbólicas que pasan por los puntos de equilibrio inestable en π y −π. El teorema de Poincaré-Birkhoff nos dice que hay ks puntos hiperbólicos en un sistema integrable. Hay una separatriz suave que une un punto hiperbólico a sus vecinos próximos para tales sistemas. En un sistema cuasi-integrable con dos o más grados de libertad la situación es más compleja. Basta recordar que en los hamiltonianos usados para obtener la estructura de islas, (11.244) o (11.286), hay una serie de términos que han sido despreciados al construir los correspondientes invariantes. La estructura de islas corresponde pues a un sistema truncado. En cualquier singularidad hiperbólica convergen cuatro curvas, correspondientes a las dos trayectorias separatrices incidentes Γ+ y a las dos trayectorias separatrices salientes Γ− . Un punto x pertenece a Γ+ si la transformación repetida T n x cuando n → ∞ trae a x a la singularidad, y pertenece a Γ− si la transformación inversa T −n x cuando n → ∞ trae a x a la singularidad. Como el perı́odo sobre la separatriz del sistema truncado es infinito, lo mismo será sobre la separatriz del sistema verdadero, y el movimiento de x hacia la singularidad resulta más y más lento mientras x esté más cerca del punto fijo hiperbólico. Ahora consideremos la separatriz Γ− que sale del punto singular hiperbólico adyacente. En vez de llegar suavemente coincidiendo con Γ+ , como sucede con el péndulo o con cualquier separatriz de un sistema integrable, la curva Γ− que sale de un punto hiperbólico se cruza con la curva Γ− que sale de un punto hiperbólico vecino desplazado 2π/(ks). Esta intersección se llama un punto homoclı́nico. Las intersecciones entre trayectorias de resonancia vecinas diferentes se llaman puntos heteroclı́nicos. En esto consiste la bifurcación de las separatrices, en que una curva Γ+ no coincide con una curva Γ− . Esto establece una diferencia fundamental entre el comportamiento de 9 Véase V. Arnold, Op. cit. Teorı́a de perturbaciones / 539 Curva K.A.M. x′′′ x′′ x′ Curva K.A.M. Punto elíptico x Γ+ Γ– Γ– Γ+ Curva K.A.M. Curva K.A.M. Figura 11.8 Bifurcación de las separatrices Γ. Las lı́neas punteadas indican la separatriz del sistema truncado integrable. Las lı́neas continuas indican la separatriz del sistema completo no integrable. las trayectorias del sistema truncado y del sistema completo integrable. Si hay una intersección, entonces hay un número infinito de intersecciones, todas puntos homoclı́nicos. La intersección en el punto homoclı́nico x implica el cruce en x′ y luego en x′′ , con x′′ más próximo a x′ que x′ a x. Como las áreas encerradas por las intersecciones (áreas sombreadas en la figura 11.8) son aplicaciones unas de otras, son conservadas, de modo que Γ− oscila más y más, siendo las intersecciones sucesivas más próximas entre sı́ y las oscilaciones de amplitud mayor en virtud de la conservación de las áreas. En la figura 11.8 se muestran sólo las primeras intersecciones. Los puntos homoclı́nicos por sı́ solos no describen completamente el comportamiento de la región próxima a las separatrices. Como el número α(I) local en las cercanı́as de los puntos singulares elı́pticos tiende a infinito en la separatriz debido a que el perı́odo del movimiento sobre ésta es infinito, entonces en las cercanı́as de la separatriz hay un número infinito de resonancias secundarias correspondientes a valores grandes de α. Cada uno tiene su propio conjunto de puntos singulares hiperbólicos y elı́pticos que alternan, con la correspondiente bifurcación de separatrices y con múltiples puntos he- 540 / Mecánica clásica avanzada teroclı́nicos. Todas esas trayectorias llenan densamente el espacio accesible a ellas, para dos grados de libertad limitado por dos superficies de K. A. M. La intersección de las trayectorias en puntos homoclı́nicos demuestra que un toroide de K. A. M. no puede existir en tales puntos puesto que hay un drástico cambio de topologı́a. Cuando la perturbación aumenta, según el teorema de K. A. M., la medida de la región de toroides disminuye y aumenta la de la región estocástica. La magnitud de la bifurcación de las separatrices para λ pequeño es exponencialmente pequeña, razón por la cual pasa desapercibida en las diferentes formas de la teorı́a de perturbaciones. Su sola existencia genera las divergencias que ocurren en las series de perturbaciones. Si esas series fueran convergentes, el sistema no tendrı́a bifurcación de las separatrices ni estados de movimiento irregular. Aplicación completa sobre una superficie de sección para un sistema no integrable de dos grados de libertad. Asumamos que en la superficie de sección al aumentar I1 disminuye la frecuencia ω1 y que en I1 = 0 el número de rotación es irracional, por ejemplo α(0) = 1/π. Al aumentar I1 , ω1 decrece hasta alcanzar la primera resonancia de orden bajo en ω1 = ω2 /4, dando lugar como en la figura 11.3, a una cadena de islas; es decir hay cuatro puntos fijos que como resultado de la perturbación y según el teorema de Poincaré-Birkhoff pasan a ser ocho, alternándose los elı́pticos e hiperbólicos, con una isla alrededor de cada punto elı́ptico. Cerca de los cuatro puntos fijos hiperbólicos la presencia de puntos homoclı́nicos y heteroclı́nicos está asociada a una región de movimiento caótico limitada por dos superficies de K. A. M. “rotacionales”. Al aumentar I1 , la siguiente resonancia de orden bajo aparece en ω1 = ω2 /5, que da lugar a cinco puntos elı́pticos y a una cadena de cinco islas. Al aumentar I1 aparecen nuevas resonancias. Hay además infinidad de resonancias intermedias cuya amplitud es pequeña. Por ejemplo, entre ω1 = ω2 /4 y ω1 = ω2 /5 hay una resonancia en ω1 = 2ω2 /9. De acuerdo con (11.257) la amplitud de una resonancia es del orden de:  1/2  λH   r,−s  ∆I1 ≈  2   ∂ H0  (11.380) 2 ∂I 1 Según (11.293) el coeficiente de Fourier dominante en el hamiltoniano que describe el movimiento en las islas es aproximadamente: máx Hr,−s ≈ Js (π) (11.381) de modo que la relación de amplitudes en s = 5 y s = 9 es aproximadamente: J9 (π) ∆I1 (s/r = 9/2) ≈ 0, 1 (11.382) ≈ ∆I1 (s/r = 5) J5 (π) Además, en cada punto hiperbólico de las resonancias secundarias se genera una región de movimiento caótico. La figura 11.9 muestra esquemáticamente la apariencia de la superficie de sección. Las lı́neas sólidas son superficies de K. A. M. Las que rodean el origen, I1 = 0, son distorsión de los cı́rculos no perturbados y corresponden al nuevo invariante I1 = constante, Teorı́a de perturbaciones / 541 el cual es calculado aplicando el teorema de la media, descrito en la sección 11.5. Las lı́neas sólidas que rodean los puntos singulares elı́pticos no se pueden calcular con este método sino con el de las perturbaciones seculares (sección 11.7). Para las trayectorias cercanas a las separatrices no hay un invariante y las trayectorias llenan toda el área comprendida entre dos lı́neas de K. A. M. “rotacionales”. Figura 11.9 Superficie de sección de resonancias secundarias En cada una de las “islas” alrededor de un punto elı́ptico podemos transformar de las variables I 1 , ϕ1 a unas variables acción-ángulo J1 , χ1 . Esto transforma la cadena de islas en un conjunto de cı́rculos concéntricos como en la figura 11.3b. Las resonancias entre la frecuencia del movimiento alrededor del punto fijo y las frecuencias fundamentales crean cadenas de islas de segundo orden, similares a las de primer orden. Análisis de la estabilidad. En los sistemas hamiltonianos no integrables la estabilidad lineal parece ser una condición necesaria y suficiente para la estabilidad no lineal, en el sentido que la estabilidad lineal garantiza la existencia de superficies de K. A. M. cerca a un punto fijo. El análisis de la estabilidad de un estado de movimiento en un sistema hamiltoniano se reduce al análisis de la estabilidad de la correspondiente aplicación canónica en una superficie de sección de Poincaré. Un punto fijo x0 de una aplicación que preserve el área T se dice que es estable si para cada vecindad U de x0 existe una subvecindad V ⊆ U tal que para todo k siempre se cumple que T k (V ) ⊆ U . Poniendo el orı́gen de coordenadas en x0 y linealizando T alrededor de ese punto, hallamos que su parte lineal es una matriz 2 × 2 de coeficientes reales, Ã, que es simplicial. Debido a esto, si λ es un autovalor de Ã, entonces 1/λ también lo es, y por ser real, λ y λ⋆ son autovalores. De modo que los autovalores λ, λ⋆ , 1/λ, 1/λ⋆ , están determinados por la ecuación λ2 − λ tr Ã + 1 = 0 donde tr es la traza de Ã. Si los autovalores son complejo conjugados, λ1,2 = e±iσ , representan soluciones estables con tr Ã = 2 cos σ y |trÃ| < 2. Si son reales y recı́procos, por ejemplo λ1,2 = e±σ , con |tr Ã| = |2 cosh σ| > 2, se tienen soluciones creciente y decreciente. El caso inestable puede dividirse en dos posibilidades, tr Ã > 2 (λ1 > 1) y tr Ã < −2 (λ1 < −1). Las raı́ces pueden ser iguales con 542 / Mecánica clásica avanzada λ1 = λ2 = ±1, y corresponden a la transición exacta entre los casos estable e inestable. El movimiento linealizado presenta entonces tres clases de órbitas: elı́pticas, hiperbólicas y rectilı́neas. Un punto fijo hiperbólico es inestable y las órbitas cercanas a él se separan exponencialmente. Un punto fijo elı́ptico es estable y las órbitas cercanas a él se separan linealmente. Si en un punto elı́ptico hay resonancias de orden bajo, sabemos, el análisis de estabilidad lineal no es suficiente pues pueden presentarse nuevos puntos fijos hiperbólicos, de acuerdo con el teorema de Poincaré-Birkhoff. Ejemplo 11.8.3 Hacer el análisis de estabilidad de la aplicación separatriz (11.340): Wn+1 = Wn − W0 sen ϕn ϕn+1 = ϕn + Q0 r ln 32 |Wn+1 | (11.383) Los puntos fijos de perı́odo 1, o sea de una sola iteración, están en: Q0 r ln o sea: 32 = 2πm |W1 | (11.384) W1 = ±32e−2πm/(Q0r) , ϕ1 = 0, π m : entero (11.385) Si llamamos x1 = (W1 , ϕ1 ) y T la aplicación, estos puntos satisfacen x1 = T x1 . Linealizando alrededor de x1 obtenemos xn = x1 + ∆xn : ∆xn+1 = Ã ∆xn (11.386) siendo Ã la matriz jacobiana de la aplicación:  ∂W  ∂W n+1  ∂Wn  Ã =   ∂ϕn+1 ∂Wn n+1 ∂ϕn ∂ϕn+1 ∂ϕn     (11.387) Para evaluar la estabilidad se requiere la traza de Ã: tr Ã = 2 + W0 Q0 r cos ϕ W1 (11.388) Para estabilidad se requiere que tr Ã < 2, de modo que para W1 > 0 los puntos fijos con ϕ1 = 0 son todos inestables. Para ϕ1 = π hay estabilidad cuando: W1 > Ws = W0 Q0 r 4 (11.389) o sea: W1 > 2πrA 3 −πQ0 /2 Q0 e F (11.390) Teorı́a de perturbaciones / 543 Es de esperarse que el valor de Ws que marca el lı́mite entre los puntos con ϕ1 = π estables e inestables represente un importante parámetro indicativo de estocasticidad cuando W < Ws . La aplicación separatriz es de importancia para comprender el comportamiento caótico de los sistemas cuasi-integrables, pues las separatrices siempre rodean las resonancias de esos sistemas. La aplicación separatriz, que describe el comportamiento en las cercanı́as de la separatriz, claramente exhibe comportamiento caótico para W → 0. Ejercicio 11.8.1 Hallar los puntos fijos de perı́odo 1 y analizar la estabilidad de la aplicación de Fermi: Un+1 = |Un + sen ϕn | ϕn+1 = ϕn + 2πM Un+1 (177) (11.391) donde M es una constante. Ejercicio 11.8.2 Hallar los puntos fijos de perı́odo 1 y analizar la estabilidad de la aplicación estándar (11.318). Ejercicio 11.8.3 Mostrar que la aplicación estándar es una aproximación a la aplicación de Fermi y a la aplicación separatriz linealizadas. Irregularidad global. La existencia de regiones caóticas está asociada con las resonancias y se da aun para valores pequeños del parámetro λ. No hay una transición brusca entre los regı́menes regular e irregular en algún valor crı́tico de λ. Sin embargo es útil poder cuantificar el grado de “estocasticidad” y decir cuando el movimiento es dominantemente estocástico. Chirikov (1979) ha observado que al aumentar la perturbación ocurre en algún valor más o menos definido que las superficies de K. A. M. rotacionales que encierran una región estocástica de un sistema de dos grados de libertad se “rompen”, permitiendo que las trayectorias estocásticas ocupen una región más grande del espacio fásico. Con esta idea elaboró el concepto de sobreposición de las separatrices y definió un parámetro de estocasticidad. Hay muchos otros criterios pero este es de los más usados, al menos como un indicador del orden de magnitud de la perturbación para el cual el sistema se comporta de modo esencialmente irregular. Si (∆Imáx )1 y (∆Imáx )2 son los anchos de las separatrices vecinas separadas por una lı́nea de K. A. M. rotacional, y δI12 es la distancia entre las resonancias correspondientes, o sea entre los puntos fijos centrales de las “islas”, el criterio de estocasticidad global puede formularse como: (∆Imáx )1 + (∆Imáx )2 2 ≥ δI12 3 (11.392) Cuando existen las superficies de K. A. M. que limitan las regiones estocásticas se habla de estocasticidad local o aislada y cuando tales superficies desaparecen se habla de estocasticidad global o conectada. En el ejemplo 11.8.3 hallamos un parámetro crı́tico para el cual se pierde la estabilidad lineal de las principales resonancias en la aplicación separatriz; este parámetro también da una burda estimación de la estocasticidad, pero por no ser una condición necesaria para la estocasticidad conectada resulta ser un criterio 544 / Mecánica clásica avanzada demasiado fuerte. Greene (1979)10 halló que aunque la pérdida de estabilidad lineal de las islas de perı́odo 1 es una condición muy fuerte, tal criterio aplicado a islas de perı́odo alto cercanas a una superficie de K. A. M. puede dar una mejor descripción. Este es un criterio alterno al de Chirikov y más exacto en muchos casos. Ejemplo 11.8.4 Analizar diferentes criterios de irregularidad global para la aplicación estándar (11.318). (a) Pérdida de estabilidad de los puntos fijos elı́pticos de perı́odo 1. Tales puntos están en: I1 = 2πm , m : entero ; La matriz Ã es:   1 ±K  Ã =  1 1±K ϕ1 = 0, 1 (11.393) (11.394) donde el signo más corresponde a ϕ1 = 0 y el menos a ϕ1 = π. La condición de estabilidad: |2 ± K| < 2 (11.395) nos dice que el punto ϕ = 0 es siempre inestable. No hay puntos fijos elı́pticos de perı́odo 1 si: K>4 (11.396) (b) Sobreposición de separatrices de resonancias primarias. Es conveniente considerar el hamiltoniano de la aplicación, obtenido en el ejemplo 11.8.1. Si asumimos que ϕ varı́a lentamente con el tiempo, dϕ/dn ≪ 2π, entonces esperamos que en H1 , ecuación (11.325), contribuirá sólo el término de variación más lenta, de modo que: 1 2 I + K cos ϕ + 2K cos ϕ cos 2πn (11.397) 2 La parte correspondiente a H0 , ecuación (11.324), describe un movimiento pendular, siendo la frecuencia de libración alrededor del punto elı́ptico ϕ = π: √ ω0 = K (11.398) H= El máximo desplazamiento de I es hallado de H0 tomando cos ϕ = 1 en I = 0, o sea H0 = K. Entonces el valor máximo de I está en cos ϕ = −1: √ ∆Imáx = 2 K (11.399) De acuerdo con (11.393), la distancia entre las resonancias primarias δI es igual a 2π, y por tanto la relación entre el ancho total de la separatriz y la distancia entre dos resonancias consecutivas es: 2∆Imáx 4ω0 = (11.400) δI 2π 10 Véase el texto de Lichtenberg A. J. y M. A. Lieberman, Regular and stochastic motion, SpringerVerlag, Nueva York, 1983. Teorı́a de perturbaciones / 545 La frecuencia de H1 es 2π, de modo que el número de rotación local cerca al punto elı́ptico de libración α0 = ω0 /2π. Entonces: 2∆Imáx = 4α0 (11.401) δI La observación numérica dice que la transición a la estocasticidad global ocurre aproximadamente cuando aparecen las islas de sexto orden, con α ≈ 1/6, entonces (11.401) nos conduce a la “regla de los dos tercios”, 2∆Imáx /δI ≈ 2/3. Sin embargo, un estimado de K puede obtenerse directamente de (11.400) tomando simplemente 2∆Imáx /δI ≈ 1 como un indicativo de la sobreposición de las separatrices: √ 4 K = 2π , K ≈ 2, 47 (11.402) Con la regla de los dos tercios se obtiene: K ≈ 1, 46 (11.403) (c) Sobreposición del primero y del segundo armónicos. Definimos la condición de sobreposición del primero y del segundo armónicos como: ∆I1 máx + ∆I2 máx = δI12 = π (11.404) donde los subı́ndices indican resonancias de perı́odos 1 y 2 respectivamente. Para calcular el ancho ∆I2 necesitamos el segundo armónico de Fourier en la expansión de H en potencias de K ya que en (11.397) K cos ϕ contiene sólo el primer armónico. El hamiltoniano describe un sistema no autónomo de un grado de libertad, que equivale a uno de dos grados de libertad según la sección 9.2. Como la región del espacio fásico en que aparece el segundo armónico está alejada de las resonancias primarias, la teorı́a de perturbaciones ordinaria puede usarse para hacer la expansión de H hasta el segundo orden en K donde esperamos que aparezca el segundo armónico. El hamiltoniano (11.323) puede escribirse como: H= +∞ X 1 2 I + λK cos(ϕ − 2πmn) 2 m=−∞ (11.405) El término de orden cero I 2 /2, describe un movimiento en I − ϕ cuya solución es ϕ = In + ϕ0 , I = constante, siendo ϕ0 una constante. Según (11.393) los puntos fijos de la aplicación estándar están en I = 2pπ para las resonancias primarias. Entonces la perturbación dará lugar a puntos fijos de las resonancias secundarias en: I = (1p + 1)π ; p : entero (11.406) que se encuentran entre dos resonancias primarias. La frecuencia del movimiento de orden cero es (2p + 1)π y la frecuencia de la fuerza impulsora externa es 2πm, presentando resonancias de la forma r/s = (2p + 1)/m. Los punto fijos en 0 y π de (11.393) corresponden a m = 0, o sea al movimiento pendular, con lo cual las resonancias secundarias vienen de r = 2p + 1 y s = 1 y basta tomar a H como (11.397), escrito en la forma: 1 H = Iχ + Iϕ2 + K cos ϕ + 2K cos ϕ cos χ 2 (11.407) 546 / Mecánica clásica avanzada Realicemos una transformación canónica para obtener una variable angular rápida y una lenta: Iχ = rI χ ; Iϕ = I ϕ − sI χ ϕ = rχ − sϕ ; (11.408) χ=χ Entonces: 2 1 I ϕ − sI χ 2 rχ − ϕ rχ − ϕ + K cos + 2K cos cos χ s s H + = rI χ + (11.409) Ahora ϕ es una variable angular lenta y podemos aplicar la teorı́a de perturbaciones adiabáticas, sección 11.5, válida aquı́ por no haber divisores nulos. Para buscar una expansión en potencias de K, al orden cero aplicamos (11.178): H 0 = rI χ + 2 1 I ϕ − sI χ 2 (11.410) Al primer orden promediamos la perturbación sobre la variable angular rápida χ: H1 = 0 (11.411) Entonces, según (11.180): 2π ∂F (1) = − cos(rχ − ϕ) − 2 cos(rχ − ϕ) cos χ ∂χ (11.412) y por tanto: −2πF (1) = 1 1 sen (rχ − ϕ) + sen [(r − 1)χ − ϕ] r r−1 1 sen [(r + 1)χ − ϕ] + r+1 (11.413) y, 2π ∂F (1) = ∂χ 1 1 cos(rχ − ϕ) + cos[(r − 1)χ − ϕ] r r−1 (11.414) 1 + cos[(r + 1)χ − ϕ] r+1 Para hallar a H 2 , aplicamos la fórmula (11.37) con los promedios tomados sobre χ: H2 = (1) 2 2 ∂F ∂F (1) 1 X X ∂ 2 H0 2 µ=1 ν=1 ∂I ν ∂I µ ∂ϕν ∂ϕµ (11.415) Teorı́a de perturbaciones / 547 Con el resultado, al segundo orden: 2 K 1 2 cos 2ϕ H= I − 2 4 (11.416) donde se ha omitido una constante y regresado a la notación inicial. ϕ es la variable angular lenta, dada por (11.408): ϕ = −ϕ + (2p + 1)πn (11.417) y describe el movimiento alrededor de las islas de resonancias secundarias. Según la ecuación (11.416) la máxima oscilación de I es ∆I2 máx = K/2, con lo cual y con (11.399) y (11.404) toma la forma: √ K = π K ≈ 1, 46 (11.418) 2 K+ 2 que es el resultado obtenido por Chirikov, y que además justifica la regla de los “dos tercios”. Experimentalmente, o sea resolviendo numéricamente la aplicación (11.318), se obtiene que la transición a la estocasticidad global según Chirikov ocurre cuando K ≈ 0, 99. Chirikov mejoró el resultado (11.418) tomando el espesor de la capa estocástica en cercanı́as de la separatriz. Ejemplo 11.8.5 Calcular el efecto del espesor de la separatriz sobre el valor de K a partir del cual ocurre la transición a la estocasticidad global. El cálculo se basa en el ejemplo 11.8.2. La función W en (11.339) proviene de 1 − κ2 del ejemplo 10.3.2, que se puede escribir como: E − Es (11.419) 1 − κ2 = − 2Es notando que la energı́a de la separatriz es precisamente F . Entonces W es: W = E − Es Es (11.420) o sea la desviación de la energı́a respecto a la separatriz dividida por la energı́a de la separatriz. Según el ejemplo 11.8.1, la aplicación separatriz (11.340) linealizada toma la forma de la aplicación estándar si: In = − Q0 ∆Wn W1 y K= Q0 W0 W1 (11.421) siendo según (11.334) Q0 igual a: 2π Q0 = √ K (11.422) Hemos tomado r = 1 (resonancia de orden 1) y √ tomado las frecuencias impulsora y de la aplicación según (11.398) y (11.393) iguales a K y 2π respectivamente. 548 / Mecánica clásica avanzada Como en (11.341) A es H11 que para nuestro caso podemos tomar igual a F . De (11.421) y (11.341) podemos obtener el parámetro de estocasticidad K en función de Q0 y W1 : K= 8πQ30 −πQ0 /2 e W1 (11.423) donde K está asociado al ancho de las separatrices de las “islas” de segundo orden. Tal ancho, según (11.420), está descrito por W , o sea por W1 en (11.423), que según (11.422) puede expresarse en función de K: W1 = 4(2π)4 K −5/2 e−π 2 √ / K (11.424) √ De (11.399) se sigue que el valor de I en la separatriz es I0 = 2 K. La energı́a del lı́mite exterior de la capa estocástica cercana a la separatriz es igual a la energı́a de la separatriz, K, más el ancho de la capa, dado según (11.420) por ∆E = W F , o sea que: K + ∆E = K(1 + W1 ) (11.425) es la energı́a del lı́mite exterior de la capa estocástica. Como E = I 2 /2 + K cos ϕ para el péndulo, en ϕ = π es igual a I 2 /2 − K, encontramos que: 1 2 I − K = K(1 + W1 ) , 2 I 2 = 2K(2 + W1 ) (11.426) y como W ≪ 1: √ W1 I =2 K 1+ 4 (11.427) De modo que el ancho de la separatriz respecto a la acción es: ∆Is = I − I0 = √ 1 W1 K 2 (11.428) Si sumamos este ancho en (11.418) obtenemos un criterio de sobreposición mejorado: h √ i √ 2 K 1 + (2π)4 K −5/2 e−π / K 2 K + =π 2 (11.429) K ≈ 1, 2 (11.430) del cual se obtiene el valor: que coincide un poco más con el valor experimental K ≈ 0, 99. 12 Correspondencia con la mecánica cuántica de Heisenberg En este capı́tulo presentaremos la mecánica clásica con una notación similar a la usada en la mecánica cuántica de Heisenberg, conocida también como mecánica matricial. Las fórmulas no tendrán suposiciones cuánticas y serán válidas clásicamente. Con esto podremos hacer énfasis en las diferencias y correspondencias que existen entre los formalismos clásico y cuántico, y a la vez retomar las ideas originales de Werner Heisenberg expuestas en su trabajo famoso de julio de 1925.1 Veremos que la representación de las variables dinámicas por medio de matrices y la asignación de valores propios a las variables dinámicas son posibles dentro de un formalismo puramente clásico. Veremos también el punto exacto donde la mecánica clásica admite el reemplazo de los corchetes de Poisson por conmutadores y la no conmutatividad de las matrices. Finalmente señalaremos dónde están las verdaderas diferencias entre las mecánicas clásica y cuántica. Para ilustrar la correspondencia entre la mecánica cuántica y la mecánica clásica mostraremos cómo el procedimiento de diagonalización de la matriz hamiltoniana corresponde con el de resolver la ecuación de Hamilton-Jacobi, y presentaremos las fórmulas de la teorı́a clásica de perturbaciones con la notación matricial. Se corrobora ası́ la idea expresada por Dirac en su artı́culo de noviembre de 1925: “En un reciente artı́culo Heisenberg planteó una nueva teorı́a donde sugiere que no son erróneas las ecuaciones de la mecánica clásica, sino más bien que son las operaciones matemáticas mediante las cuales se extraen resultados fı́sicos a partir de ellas las que requieren modificación. Toda la información sumunistrada por la teorı́a clásica puede ser usada en la nueva teorı́a”.2 1 Traducido al inglés por B. L. van der Waerden en Sources of quantum mechanics, Dover, Nueva York, 1968. 2 Reproducido por van der Waerden, Op. cit. 549 550 / Mecánica clásica avanzada 12.1. Representación matricial de variables dinámicas Consideraremos un sistema acotado l-dimensional en un estado de movimiento regular, es decir, integrable y que por tanto se puede describir mediante variables acción-ángulo. Tal sistema es múltiplemente periódico y cualquier variable dinámica puede expresarse como una serie de Fourier. El formalismo podrı́a extenderse a estados no acotados mediante la sutitución de las series por integrales de Fourier. Representación de variables dinámicas por matrices hermı́ticas infinitas. Sea f una variable dinámica y (I, ϕ) un conjunto de variables acción-ángulo del sistema, entonces: X f (I, ϕ) = f~n (I) ei~n·ϕ~ (12.1) ~ n donde ~n son vectores l-dimensionales de componentes enteras. Es conveniente escribir a ~n como la diferencia entre dos vectores de componentes enteras, ~n = α ~ −α ~ ′ . El vector ~ α ~ puede escribirse de modo que I = α ~ ∆I, donde ∆I es un número lo suficientemente pequeño con las dimensiones de acción;3 por tanto las componentes de α ~ son números enteros muy grandes, si I~ es grande. Sumar en (12.1) sobre todos los valores de las I~ (que varı́an entre cero e infinito) equivale a sumar sobre α ~ , o sea: X XX ′ fα~ −~α′ (~ α ∆I)ei(~α−~α )·ϕ~ (12.2) f (~ α ∆I, ϕ ~) = α ~ α ~ α ~′ Por ser f real, se cumple que fα~⋆−~α′ (I) = fα~ ′ −~α (I). La suma sobre α ~ en (12.2) puede ser divergente, lo cual ha de tenerse en cuenta en los desarrollos que siguen. Esto corresponde con las dificultades de normalización de las ondas planas en la mecánica cuántica. Si formamos el producto de dos variables dinámicas, sus coeficientes de Fourier dependen de los coeficientes de Fourier de cada variable, ası́: X (f g)β− fβ−~ (12.3) ~ β ~ ′ (I) = ~ α (I)gα ~ ′ (I) ~ −β α ~ La convergencia de la expansión (12.1) exige que los coeficientes para ~n altos sean pequeños, por tanto sólo son de interés los ~n bajos. Por otra parte, si ∆I es pequeño, siempre los α ~ en I~ = α ~ ∆I serán grandes, es decir que |~n| es del orden de la unidad y: |~n| ≪ |~ α| (12.4) Entonces se cumple para toda función de I~ que: F (~ α ∆I) = F (~ α′ ∆I) + (~ α−α ~ ′) · 3 Puede ∂F ∆I ∂ I~ considerarse a ∆I como la resolución en las medidas de las Iν . (12.5) Corespondencia con la mecánica cuántica de Heisenberg / 551 Esto nos permite definir matrices clásicas aproximadamente hermı́ticas, ası́: fα~ ,~α′ ≡ fα~ −~α′ (~ α ∆I) (12.6) entonces es claro que: fα~⋆′ ,~α = fα~⋆′ −~α (~ α′ ∆I) = fα~ ,~α′ + (~ α′ − α ~) · ∂fα~ −~α′ ∆I ∂ I~ (12.7) es aproximadamente autoadjunta. Como α ~ y α ~ ′ pueden recorrer todos los vectores de ′ componentes enteras resulta que las fα~ ,~α son matrices infinitas. Correspondencia con las matrices cuánticas. En mecánica cuántica I~ y ϕ ~ son operadores cuyos vectores propios los denotaremos respectivamente por |~ αi y |~ ϕi. En el conjunto de estados |~ αi deben incluirse, si existen, los estados del continuo para tener un conjunto completo. La transformación de la representación I~ a la representación ϕ ~ es: X X ′ |~ ϕi = |~ α′ ih~ α′ |~ ϕi = |~ α′ i e−i~α ·ϕ~ (12.8) α ~′ α ~′ El valor esperado de una variable dinámica f en el estado |~ ϕi está dado por: XX ′ h~ ϕ|f |~ ϕi = h~ α|f |~ α′ i ei(~α−~α )·ϕ~ (12.9) α ~ α ~′ Comparando (12.2) con (12.9) resulta clara la correspondencia de los coeficientes de Fourier fα~ −~α′ y las matrices clásicas fα~ ,~α′ , con las matrices cuánticas h~ α|f |~ α′ i. e−i~α·ϕ~ son las funciones de onda de la representación ϕ ~ con valores definidos de α ~, ~ i∂/∂ ϕ o sea funciones propias del operador hermı́tico asociado a I, ~: − 1 ∂ −i~α·ϕ~ e =α ~ e−i~α·ϕ~ i ∂ϕ ~ (12.10) Ciertamente hay algunas dificultades en la definición de las variables acción-ángulo en mecánica cuántica, analizadas en el artı́culo de Augustı́n y Rabitz (1979).4 En la sección §48 del libro de mecánica cuántica de Landau-Lifshitz (ver bibliografı́a) está demostrada la correspondencia entre los elementos de matriz de un operador cuántico y los coeficientes de Fourier de la correspondiente variable dinámica clásica. No tenemos hasta ahora ninguna justificación para relacionar la matriz clásica fα~ ,~α′ con transiciones entre estados cuantizados descritos por α ~ yα ~ ′ . El ejemplo 10.5.2 sobre radiación dipolar da una evidencia de la asociación entre emisión de radiación y transiciones en mecánica clásica. Cambio de representación. Si por medio de una transformación canónica pasamos de un conjunto de variables acción-ángulo (I, ϕ) a otro (I, ϕ), por medio de una 4 Action-angle variables in quantum mechanics, Journal of Chemical Physics, 71 (12), 4956, (1979). 552 / Mecánica clásica avanzada función generatriz G3 (I, ~ϕ), las variables angulares y de acción se deben transformar ~ I~ = −∂G3 (I, ϕ)/∂ ϕ, ~ las funciones e−i~α·ϕ~ como: como ϕ ~ = −∂G3 (I, ϕ)/∂ I, X ′ ~ (12.11) gα~ ,~α′ (I)e−i~α ·ϕ e−i~α·ϕ~ = α ~′ y las amplitudes de Fourier de las variables dinámicas como: XX fβ− g+ ~ β ~ ′ (I) = ~ −~ α′ (I) gα ~ (I) ~ (I) fα ~ ′ ,β β,~ α α ~ (12.12) α ~′ ⋆ donde g + ~ (I). ~ α (I) = gα ~ ,β β,~ Podemos tomar los resultados de la sección 11.3, referentes a los cambios de sistemas de variables acción-ángulo. Para sistemas no degenerados, las fórmulas (11.84) y (11.85) de tal sección establecen que: l X ∂ ψ(I) ; ϕν = nνµ ϕµ − ∂I ν µ=1 Iν = l X nµν Iµ (12.13) µ=1 donde nνµ es una matriz ñ de elementos enteros y determinante ±1 y ψ depende sólo de las variables de acción. Entonces: ~ ~ e−i~α·ϕ~ = e−i~α·(ñϕ)−i~α·δ (12.14) siendo α ~ ·~δ una fase que sólo depende de I~ y de α ~ . Por tanto para sistemas no degenerados: ~ gα~ ·~α′ = e−i~α·δ δα~ ′ ,~αñ (12.15) Para sistemas degenerados rigen las fórmulas (11.100) a (11.103): ϕβ = l X nβν ϕν + ψβ (ϕσ , I) ; ν=1 ϕτ = l X Iβ = s X nγβ Iγ γ=1 nτ σ ϕσ + ψτ (ϕσ , I) (12.16) ν=s+1 Iτ = l X nντ Iτ − i ν=1 X σ σ C~nσ (I) nτ ei~n ·ϕ~ ~ nσ Las variables no degeneradas tienen subı́ndices β = 1, 2, ...s, y las degeneradas σ = s + 1, s + 2, ...l. El superı́ndice σ indica vectores de l − s componentes. Las variables angulares ϕστ son constantes y los números nτ σ no necesitan ser enteros. ψν (ϕσ , I) son funciones periódicas de las variables angulares degeneradas. Entonces, usando el convenio de la suma: α ~ ·ϕ ~ = αβ nβν ϕν + ατ nτ σ ϕσ + αν ψν (ϕσ , I) (12.17) Corespondencia con la mecánica cuántica de Heisenberg / 553 ei~α·ϕ~ puede escribirse en la forma: eα~ ·ϕ~ = eiαβ nβτ ϕτ h(ϕσ , I) (12.18) donde las ϕτ son no degeneradas y h es una función periódica de las gα~ ,~α′ = hα~ σ ,~ασ′ δα~ τ ′ ,~ατ ñτ ϕστ . En consecuencia: (12.19) siendo α ~ = (~ ασ , α ~ τ ). Notemos que: X g+ ~β ~ ′ = δβ, ~′ ~ gα ~ ,β (12.20) β,~ α α ~ y por tanto: X h+ ~σ α ~σ β ,~ ασ hα~ σ ,β~ ′ σ = δβ~σ ,β~ ′ σ (12.21) o sea que g y h son matrices unitarias de dimensión infinita. Las matrices unitarias de cambio de representación son no conmutativas. Si se realizan dos transformaciones sucesivas, descritas por las matrices g̃ y k̃, se cumple: ~ ~ ~ ~ gα~ ,~α′ kα~ ′ ,β~ = e−i~α·(δg +ñg δk ) δβ,~ ~ αñg ñk kα~ ,~α′ gα~ ′ ,β~ = e−i~α·(δk +ñk δg ) δβ,~ ~ αñk ñg (12.22) Como puede verse, las matrices unitarias que describen las transformaciones canónicas satisfacen una álgebra no conmutativa. Aquı́ estamos considerando solamente transformaciones canónicas entre diferentes conjuntos de variables acción-ángulo, que cambian expansiones de Fourier en expansiones de Fourier. Es claro que al pasar a variables canónicas que no sean de acción-ángulo una expansión de Fourier se cambia por una expansión en otro conjunto de funciones ortogonales igualmente válida; en la formulación de la mecánica cuántica este trabajo fue hecho por Born, Jordan y Heisenberg entre septiembre y noviembre de 1925. Valores propios y vectores propios de una variable dinámica. Dada una variable dinámica f , ¿existe algún conjunto de variables acción-ángulo para el cual la función dependa sólo de las variables de acción?. Si existe, en tales variables se debe cumplir: (12.23) f I(I, ϕ), ϕ(I, ϕ) = f (I) Esto significa que en la expansión de Fourier de f sólo aparece la componente constante o d.c.: f β− ~ β ~ ′ = f 0 (I) δβ, ~β ~′ (12.24) o en términos de las matrices clásicas (12.6): ~ f β, ~β ~ ′ = f 0 (β ∆I) δβ, ~β ~′ (12.25) 554 / Mecánica clásica avanzada Los números f 0 son los valores propios de la matriz f. De (12.12) y (12.20) se sigue que: XX + gβ,~ ~ ,~ α′ gα ~ ′ ,~ α =0 ~ ,~ α′ (I) − f 0 (I)δα ~ α fα α ~ (12.26) α ~′ Esta expansión se satisface sólo si f 0 (I) son las raı́ces de la ecuación secular: det fα~ ,~α′ − f 0 (~ α ∆I) δα~ ,~α′ = 0 (12.27) En conclusión, encontrar las variables acción-ángulo en las cuales una variable dinámica no dependa de las variables angulares equivale a diagonalizar la matriz clásica formada con los coeficientes de Fourier. Los vectores propios de la matriz son a su vez los elementos de la matriz de la transformación unitaria g que conecta las dos representaciones: X (12.28) fα~ ,~α′ gα~ ′ ,β~ (I) = f 0 (I) gα~ ,β~ (I) α ~′ De lo anterior resulta que si el hamiltoniano es diagonal, entonces toda constante de movimiento, cuando no hay degeneración, es igualmente diagonal. Por ser matemáticamente válida la correspondencia entre matrices infinitas y operadores lineales, concluimos que en mecánica clásica es posible hacer corresponder a cada variable dinámica un operador lineal. Ejemplo 12.1.1 Hallar las matrices clásicas para q, p y H de un oscilador armónico lineal. Las expresiones de q y p en variables acción-ángulo dadas en el ejemplo 10.3.1, permiten obtener fácilmente los coeficientes de Fourier: 1/2 I qα−β (I) = i (−δα,β+1 + δα,β−1 ) 2mω (12.29) 1/2 Imω (δα,β+1 + δα,β−1 ) pα−β (I) = 2 Usando la definición (12.6) se sigue que: 1/2 α ∆I qα,β = i (−δα,β+1 + δα,β−1 ) 2mω pα,β = α ∆Imω 2 1/2 (δα,β+1 + δα,β−1 ) Las matrices adjuntas correspondientes son: 1/2 1/2 (α + 1) ∆I (α − 1) ∆I ⋆ qβ,α = i δα,β−1 − i δα,β+1 2mω 2mω p⋆β,α 1/2 1/2 (α − 1) ∆Imω (α + 1) ∆Imω δα,β−1 + δα,β+1 = 2 2 (12.30) (12.31) Corespondencia con la mecánica cuántica de Heisenberg / 555 Vemos claramente que si α ≫ 1 las matrices de q y p son autoadjuntas. La matriz hamiltoniana es: Hα,β = α ∆I ωδα,β (12.32) Esta matriz es autoadjunta sin aproximaciones. Los valores propios son los diferentes valores de la energı́a del oscilador armónico. Por ser H positivo, resulta que: Hα,β = 0 para α<0 (12.33) Además por ser ∆I pequeño, los valores propios de H son muy próximos entre sı́, formando un continuo en el lı́mite ∆I → 0. 12.2. Corchetes de Poisson y conmutadores de matrices clásicas En contradicción con lo corrientemente aceptado, la mecánica clásica admite la representación de las variables dinámicas mediante matrices no conmutativas aproximadamente hermı́ticas. Esta representación permite asociar conmutadores de matrices clásicas con los corchetes de Poisson. Los resultados cuánticos se obtienen formalmente colocando ∆I = h̄. Conmutadores clásicos. El conmutador de las matrices de dos variables dinámicas f y g es: X (fβ,~ (12.34) ~ α gα ~ α fα ~ ′ − gβ,~ ~′ ) ~ ,β ~ ,β α ~ En términos de las amplitudes de Fourier de f y g, (12.34) toma la forma: i Xh ~ ~ ∆I) f ~ ′ (~ fβ−~ (~ α ∆I) − g ( β α ∆I) (12.35) ′ ~ α (β ∆I) gα ~ ~ ~ −β β−~ α α ~ −β α ~ Notemos que la siguiente expresión vale cero: i Xh ~ ~ ~ ~ fβ−~ ( β ∆I) g ( β ∆I) − g ( β ∆I) f ( β ∆I) =0 ~ α ~′ ~ α ~′ α ~ −β β−~ α ~ −β (12.36) α ~ En efecto, cada αν toma valores entre −∞ y +∞. Si cambiamos en los términos ~ ′ , entonces cada δν negativos de (12.36) a α ~ por ~δ mediante la fórmula β~ − α ~ = ~δ − β ′ ′ tomará valores entre βν + βν − ∞ y βν + βν + ∞, o sea entre −∞ y +∞. Entonces por cada término en (12.36) con signo + hay uno con signo −. Matrices de corchetes de Poisson. El corchete de Poisson de dos variables dinámicas es: [f, g] = ∂f ∂g ∂f ∂g · − · ∂ϕ ~ ∂ I~ ∂ I~ ∂ ϕ ~ (12.37) 556 / Mecánica clásica avanzada La serie de Fourier del corchete de Poisson es: X X ∂gm ∂fm ~ ~ ~ ϕ ~ [f, g] = i ~n · f~n ei(~n+m)· − g ~ ~ ~n ∂ I ∂ I m ~ ~ n (12.38) Las componentes de Fourier de [f, g] pueden escribirse en términos de las de f y g ası́: [f, g]~l = i X ~ n ∂g~l−~n ∂f~l−~n ~n · f~n − g~n ∂ I~ ∂ I~ ~−β ~ ′ y a ~n por β~ − α Cambiando a ~l por β ~ , se sigue: X ∂gα~ −β~ ′ ∂fα~ −β~ ′ ~ [f, g]β− = i( β − α ~ ) · f − g ~ β ~ α ~ α ~′ β−~ β−~ ∂ I~ ∂ I~ α ~ (12.39) (12.40) En esta expresión el corchete de Poisson depende de I~ = β~ ∆I; por tanto las ~ componentes de Fourier de f y g serán también funciones de β∆I. Si se realiza un ~ ∆I, se sigue que: cambio infinitesimal en I~ dado por (~ α − β) gα~ −β~ ′ ~ ∆I = g ~ ′ (~ ~ · (~ α − β) ~ ′ (β ∆I) α ~ −β α ∆I) − gα ~ −β ∂ I~ (12.41) ~ ≪ |~ ~ debido a que |~ α − β| α|, |β|. Entonces el corchete de Poisson puede escribirse en la forma: [f, g]β− ~ β ~′ = i −i X h ~ ~ fβ−~ α ∆I) − gβ−~ α ∆I) ~ α (β ∆I)gα ~ ′ (~ ~ α (β ∆I)fα ~ ′ (~ ~ − β ~ − β ∆I (12.42) α ~ aquı́ hemos usado la identidad (12.36). ~ ∆I, siendo por tanto [f, g] ~ ~ ′ Notemos que en el lado derecho de (12.42) I~ = β β−β ~ ∆I. Entonces la definición (12.6) nos permite identificar el lado izquierdo función de β de (12.42) con [f, g]β, ~β ~ ′ . Comparando a (12.35) con (12.42) obtenemos el resultado: [f, g]β, ~β ~′ = −i ˜ (f g̃ − g̃f˜)β− ~ β ~′ ∆I (12.43) Vemos que la matriz del corchete de Poisson de dos variables dinámicas puede expresarse como el conmutador de las correspondientes matrices clásicas, multiplicado por −i/∆I: gg] = [f, −i ˜ (f g̃ − g̃ f˜) ∆I (12.44) En conclusión, en la mecánica clásica es posible asociar a las variables dinámicas un álgebra no conmutativa que coincide con el álgebra de los corchetes de Poisson. Ejemplo 12.2.1 Evaluar directamente el conmutador de q y p, y el corchete de Poisson, para un oscilador armónico. Corespondencia con la mecánica cuántica de Heisenberg / 557 De (12.30) se sigue: X i ∆I p qβ,α pα,β ′ = β (12.45) 2 α i p h p p p β ′ + 1 − β ′ − 1 δβ,β ′ + β ′ − 1 δβ,β ′ −2 × − β ′ + 1 δβ,β ′ +2 + con una expresión análoga al permutar a p con q. El valor del conmutador es: X (qβ,α pα,β ′ − pβ,α qα,β ′ ) = α i ∆I p p p β β + 1 − β − 1 δβ,β ′ ≈ i ∆I δβ,β ′ (12.46) donde la segunda relación resulta de la suposición β ≫ 1. Según (12.43) y (12.46) la matriz de los corchetes de Poisson debe ser: (12.47) [q, p]β,β ′ = δβ,β ′ Si se aplica directamente (12.40) y se usa el siguiente resultado: 1/2 X X ∂pα−β ′ I i(β − α) qβα = i(β − α) i ∂I 2mω α α 1 mω 1/2 ×(−δβ,α+1 + δβ,α−1 ) (δα,β ′ +1 + δα,β ′ −1 ) (12.48) 2 2I y la expresión análoga con q y p intercambiados, se obtiene igualmente (12.47). Obviamente, la matriz de [q, p] = 1 tiene sólo unos en la diagonal siendo ceros los demás elementos. Ejemplo 12.2.2 Evaluar la matriz del corchete de Poisson de H con q para un oscilador armónico. y, La matriz hamiltoniana está dada por (12.32). En consecuencia: 1/2 X β ∆I ′ (−δβ,β ′ +1 + δβ,β ′ −1 ) Hβ,α qα,β = β ∆I ωi 2mω α X α qβ,α Hα,β ′ = i β ∆I 2mω 1/2 β ′ ∆I ω(−δβ,β ′ +1 + δβ,β ′ −1 ) El conmutador es entonces: 1/2 X βω ∆I (−δβ,β ′ +1 − δβ,β1′ ) (Hβ,α qα,β ′ − qβ,α Hα,β ′ ) = i ∆I 2m α Según (12.43) y (12.51), el corchete de Poisson es: 1/2 Iω [H, q]β−β ′ = − (δβ,β ′ +1 + δβ,β ′ −1 ) 2m que, como debe ser, coincide con la matriz de q̇. (12.49) (12.50) (12.51) (12.52) 558 / Mecánica clásica avanzada 12.3. Problemas mecánicos a la manera de Heisenberg En su trabajo de julio de 1925 Heisenberg señala que la dinámica de un problema en la vieja mecánica cuántica comprende dos aspectos: (i) La integración de las ecuaciones de movimiento, ÿ + f (y) = 0. (ii) La determinación H de las constantes de movimiento a través de la cuantización de la variable de acción, p dq = 2παh̄ = 2πI. La condición (ii) se puede expresar en la forma: I X mẋ dx = 2πm xn (I) x−n (I) n2 ω(I) = 2πI (12.53) n siendo xn los coeficientes de Fourier de x. Como x es real, x−n = x⋆n . Una forma más compacta de la condición (ii) es entonces: m X n n ∂ nω(I) |xn (I)|2 = 1 ∂I (12.54) llamada en la vieja mecánica cuántica regla de suma de Kuhn-Thomas. La generalización a varios grados de libertad es inmediata: X ∂ m (12.55) ~n · ~n · ~ω (I) |x~n (I)|2 = 1 ∂ I~ ~ n La matriz de la forma (12.6) asociada con x es: xα~ ,~α′ = xα~ −~α′ (~ α ∆I) (12.56) Entonces (12.55) se puede escribir como: i X ∂ h (~ α − α~′ ) · ω ~ (I) |xα~ ,~α′ (I)|2 = 1 (~ α−α ~ ′) · m ∂ I~ ′ (12.57) Usando una expresión análoga a (12.41) podemos escribir también: X 2m (~ α−α ~ ′ ).~ω (~ α ∆I) |xα~ ,~α′ |2 = ∆I (12.58) α ~ α ~′ Notemos que la regla de suma de Thomas-Kuhn no es otra cosa que el corchete de Poisson de x y p. De la relación general (12.43), y del hecho de ser x y p variables canónicamente conjugadas, se sigue que: X (xβ,~ (12.59) ~ α pα ~ ′ − pβ,~ ~ α xα ~ ′ ) = i ∆I δβ, ~β ~′ ~ ,β ~ ,β α ~ Teniendo en cuenta que: ~ ·ω pα~ β~ = mi(~ α − β) ~ α~ xα~ ,β~ ′ Las ecuaciones (12.59) y (12.60) nos dan, para β~ = β~ ′ , la relación (12.58). (12.60) Corespondencia con la mecánica cuántica de Heisenberg / 559 Entonces según Heisenberg, la ecuación de movimiento ÿ + f (y) = 0 y la condición sobre el conmutador de x y p dan lugar a un sistema de ecuaciones que determina unı́vocamente las componentes de la matriz de x y los valores de energı́a del sistema. Las fórmulas que hemos obtenido son idénticas a las de Heisenberg, reemplazando a ∆I por h̄. ¿En dónde están entonces las diferencias de fondo entre las mecánicas cuántica y clásica?: (i) En la identificación de las matrices fα~ ,β~ con transiciones entre los estados cuánticos ~ caracterizados por α ~ y β. (ii) En señalar que ∆I no puede ser arbitrariamente pequeño sino que toma el valor h̄, o sea que I~ está necesariamente cuantizada. (iii) En reemplazar a (~ α−α ~ ′) · ~ ω (~ α ∆I) ≈ (~ α−α ~ ′ ) · ~ω (~ α′ ∆I) por la frecuencia de Bohr ωα~ ,~α′ = (Eα~ − Eα~ ′ )/h̄ asociada a la transición entre los estados cuantizados caracterizados por α ~ yα ~ ′ . Esto equivaldrı́a a asociar al “estado clásico α ~ ” la energı́a Eα~ = ∆I α ~ ·ω ~ de modo que (Eα~ − Eα~ ′ )/∆I = (~ α−α ~ ′ ) · ~ω serı́a un armónico. Esta asociación es acorde con la regla de combinación de frecuencias de Bohr, pero no predice las energı́as correctas, pues, por ejemplo, para un oscilador armónico deberı́an ser Eα = ∆I (α + 1/2)ω; por esto Heisenberg propuso no asumir a priori una expresión para las ωα~ ,~α′ , sino más bien obtenerlas como un resultado. (iv) En señalar que debe existir un estado base del cual no puede salir el sistema emitiendo radiación; xα0 ,α0 −1 = 0 si α0 caracteriza el estado base. Con sólo estas cuatro condiciones el formalismo clásico desarrollado en este capı́tulo da lugar al formalismo de la mecánica cuántica según Heisenberg. Las reflexiones acerca del álgebra de operadores no conmutativos caben perfectamente dentro del esquema clásico. Ejemplo 12.3.1 Resolver el oscilador armónico lineal en la mecánica cuántica de Heisenberg.5 La ecuación de movimiento ẍ + ω02 x = 0 conduce a una solución para los elementos de la matriz de x de la forma: xα,β cos(ωα,β t) (12.61) donde los elementos de la matriz x̃ y las frecuencias ωα,β son cantidades a determinar. La condición adicional (12.58) nos da: X 2m (12.62) ωα,α′ |xα,α′ |2 = h̄ α′ La ecuación de movimiento nos da: 2 (ωα,β − ω02 ) xα,β = 0 (12.63) ωα,β están asociadas a las transiciones α → β: h̄ωα,β = Eα − Eβ 5 Véase, van der Waerden, Op. cit. (12.64) 560 / Mecánica clásica avanzada siendo Eα y Eβ las energı́as de los estados α y β. Esta ecuación nos dice que para cada α debe existir al menos un β ′ para el cual xα,β ′ 6=0 . Para este β ′ , (12.63) nos dice que necesariamente: (Eα − Eβ ′ )2 = h̄2 ω02 (12.65) Esta es una ecuación cuadrática en Eβ ′ , con las soluciones: Eβ ′ = Eα ± h̄ω0 (12.66) lo cual nos indica que hay dos β ′ para los cuales xα,β ′ 6= 0, que llamaremos β ′ y β ′′ . Para éstos dos β ′ las frecuencias satisfacen la relación: (12.67) ωα,β ′ = −ωα,β ′′ Entonces (12.62) nos dice que: 2mωα,β ′ |xα,β ′ |2 − |xα,β ′′ |2 = h̄ (12.68) Los elementos de la matriz energı́a son: Hα,β = = (p2 )α,β mω02 (x2 )α,β + 2m 2 X pα,β ′ pβ,β ′ ω02 mxα,β ′ xβ ′ ,β + 2m 2 ′ (12.69) β De (12.60) se sigue que: X xα,β ′ xβ ′ ,β Hα,β = m ω02 − ωα,β ′ ωβ ′ ,β 2 ′ (12.70) En particular para α = β tenemos: Hα,α = mω02 |xα,β ′ |2 + |xα,β ′′ |2 (12.71) β Hay dos posibilidades, que β ′′ exista o que no exista. Si β ′′ no existe y ωβ ′ ,α = ω0 , de (12.68) se sigue que: 2mω0 |xα,β ′ |2 = h̄ (12.72) y de (12.71) se sigue que: Eα = Hα,α = mω02 |xα,β ′ |2 = h̄ω0 2 (12.73) Como Eα 6= Eβ si α 6= β, se sigue que hay a lo sumo un ı́ndice α = α0 para el cual se cumple (12.73). Si tal α0 existe, podemos formar la secuencia de números α0 , α1 , α2 , ...αk , αk+1 , ... tales que α′k = αk+1 y α′′k = αk−1 . Estos números describen los estados para los cuales Ek+1 > Ek . Claramente, α′0 = α1 y α′′0 no existe. De (12.30) podemos adelantar que αk+1 = αk + 1. Para k > 0, (12.71) y (12.68) nos dan: (12.74) Hαk ,αk = mω02 |xαk ,αk+1 |2 + |xαk ,αk−1 |2 Corespondencia con la mecánica cuántica de Heisenberg / 561 h̄ = 2mω0 |xαk ,αk+1 |2 − |xαk ,αk−1 |2 (12.75) La ecuación (12.75) es una fórmula de recurrencia que permite a partir de |xα0 ,α1 |2 obtener cualquier |xαk ,αk+1 |2 . Ası́ que, al usar |xα0 ,α1 |2 = h̄/(2mω0 ) y |xα0 ,α−1 |2 = 0: |xαk ,αk+1 |2 = h̄(k + 1) 2mω0 (12.76) También esto nos permite identificar la secuencia α0 , α1 , α2 , ... con los números enteros 0, 1, 2, ... Entonces la relación de recurrencia nos dice que: |xk,k+1 |2 = h̄(k + 1) ; 2mω0 |xk,k−1 |2 = h̄k 2mω0 Por tanto (12.74) nos da, en vez del resultado clásico (12.32): 1 Ek = h̄ω0 k + 2 (12.77) (12.78) Como puede verse, lo especı́fico del tratamiento cuántico de este problema estriba en: (i) Tomar a ∆I como h̄. (ii) Tomar en vez de (α − α′ )ω0 a ωα,α′ = (Eα − Eα′ )/h̄. (iii) Suponer la existencia de un estado base. 12.4. Ecuación de Hamilton-Jacobi y diagonalización de la matriz hamiltoniana Para un sistema múltiplemente periódico la matriz hamiltoniana clásica puede obtenerse de los coeficientes de Fourier de la función hamiltoniana H(q, p). La ecuación de Hamilton-Jacobi (sección 9.6), se caracteriza por definir la función de Hamilton caracterı́stica mediante la cual se realiza la transformación canónica que lleva a unas nuevas veriables, donde todas las coordenadas son cı́clicas, esto es: α ∆I) δα~ ,β~ H(q, p) = H(I) ⇒ H α~ ,β~ = H(~ (12.79) como en la ecuación (12.32). Entonces la transformación canónica buscada diagonaliza la matriz hamiltoniana, cuyos elementos son Hα~ −β~ (~ α ∆I) = Hα~ ,β~ . Las cantidades H(~ α ∆I), donde α ~ recorre todos los vectores l-dimensionales de componentes enteras, son los valores propios de la matriz infinita Hα~ ,β~ , que se obtiene resolviendo la ecuación secular (12.27). Los vectores propios de la matriz hamiltoniana son las cantidades gα~ ,~α′ , que según (12.11) realizan la transformación de las variables angulares ϕν a las ϕν . O sea que las gα~ ,~α′ definen la función de Hamilton caracterı́stica de la transformación canónica, para el tipo F3 , dada por: ϕ ~ =− ∂ Σ(I, ϕ) ; ∂ I~ Como gα~ ,~α′ (I) es: gα~ ,~α′ (I) = 1 (2π)l I ~I = − ∂ Σ(I, ϕ) ∂ ~ϕ ′ ~ ~ α ·ϕ l ~ dϕ e−i~α.ϕ+i~ (12.80) (12.81) 562 / Mecánica clásica avanzada de (12.80) se sigue que: gα~ ,~α′ (I) = 1 (2π)l I ∂ ′ ~ ei~α· ∂ I~ Σ(I,ϕ)+i~α ·ϕ dl ~ϕ Además, la fórmula inversa es: # " X ∂Σ ϕ −i~ α′ ·~ i~ α· = ln gα~ ,~α′ e ∂ I~ α ~′ (12.82) (12.83) Estas fórmulas muestran la conexión entre las transformaciones canónicas y las matrices unitarias que realizan los cambios de representación de las matrices clásicas, con clara correspondencia con la mecánica cuántica. Ejemplo 12.4.1 Estudiar la diagonalización de la matriz hamiltoniana de un oscilador armónico sometido a una fuerza constante. Fı́sicamente el problema es muy simple porque el único efecto de la fuerza constante es cambiar la posición de equilibrio y desplazar el valor de la energı́a sin alterar la frecuencia de las oscilaciones. Sin embargo es ilustrativo de la conexión entre la solución de la ecuación de Hamilton-Jacobi y la diagonalización de la matriz hamiltoniana. Si H0 es el hamiltoniano del oscilador no perturbado, el hamiltoniano de este problema será: H = H0 + λx y en las variables acción-ángulo de H0 toma la forma: 1/2 2I sen ϕ H = Iω + λ mω (12.84) (12.85) Queremos pasar a las variables acción-ángulo I − ϕ del hamiltoniano H mediante una transformación canónica. La ecuación de Hamilton-Jacobi del problema es, según las fórmulas (9.286): 1/2 2I ∂Σ Iω − λ −E (12.86) sen mω ∂I Entonces: ϕ=− mω 1/2 −1 ∂Σ λ (E − Iω) = sen−1 ∂I 2I Si llamamos A = λ21/2 /(mω)1/2 , y notamos que: 2 2 A ∂Σ A E(I) = Iω − = −ω − 2ω ∂ϕ 2ω entonces la ecuación de Hamilton-Jacobi para Σ es: 2 ωI 1/2 ∂Σ A ∂Σ = I −1/2 + ωI −1/2 + sen ∂I A ∂ϕ 2ω (12.87) (12.88) (12.89) Corespondencia con la mecánica cuántica de Heisenberg / 563 Esta ecuación resulta complicada, razón por la cual desistiremos de la función generatriz del tipo F3 . Notemos que la función generatriz del tipo F3 para la transformación inversa se obtiene cambiando en −F3 las variables I, ϕ por I, ϕ (ver sección 9.5). Entonces las fórmulas para la transformación inversa son: ϕ= ∂F3 (I, ϕ) ; ∂I I= ∂F3 ∂ϕ (12.90) que coinciden con las fórmulas de la transformación original mediante una función generatriz del tipo F2 . F2 es solución a la ecuación: 1/2 ∂F2 ∂F2 ω sen ϕ − E(I) = 0 (12.91) +A ∂ϕ ∂ϕ o sea: 1/2 2 ∂F2 Eω E A2 A 2 2 I= sen ϕ sen ϕ + 4 sen ϕ + (12.92) = − ∂ϕ 2ω 2 ω ω A2 Notemos que: sen ϕ 1 1 ∂ ∂Σ · = − ∂ϕ ∂E ω ω (1 + 2mEω 2 λ−2 − cos2 ϕ)1/2 (12.93) y en consecuencia: " −1/2 # 2mEω 2 ϕ 1 ∂Σ2 −1 cos ϕ 1 + = + sen ∂E ω ω λ2 H De la expresión para I, 2πI = I dϕ se deduce que: E = Iω − λ2 2mω 2 (12.94) (12.95) de donde ω −1 dE/dI = 1, y, según (12.82) y (12.94), la matriz asociada a esta transformación, que es la inversa de gα,β , es: I ′ −1 1 ei(α−α )ϕ−iα sen (cos ϕ/C) dϕ (12.96) Γα,α′ = 2π donde C = (1 + 2mEω 2 /λ2 )1/2 . Notemos que: e−iα sen −1 x = e−iαπ/2 [−iUα (x) + Tα (x)] (12.97) donde T y U son polinomios de Chevishev de primera y segunda clase respectivamente. En consecuencia: I cos ϕ ′ 1 Γα,α′ = ei(α −α) ϕ−i απ/2 Tα dϕ 2π C (12.98) I cos ϕ ′ 1 dϕ ei(α −α) ϕ−i(α+1)π/2 Uα + 2π C 564 / Mecánica clásica avanzada No es simple hallar una expresión general para la transformada de Fourier de Tα (cos ϕ/C) y de Uα (cos ϕ/C). Aun conociendo la forma analı́tica de Γα,β , resulta difı́cil obtener una expresión cerrada para las sumatorias infinitas en (12.12). Por esto lo más cómodo es realizar los cálculos en forma numérica. En este caso es necesario truncar las matrices para hacerlas finitas y proceder a realizar las integraciones mediante un algoritmo como el de Gauss. Una vez obtenida la matriz Γ el proceso de diagonalización es simple. Como puede verse, el método para obtener la matriz gα~ ,β~ a partir de la ecuación de Hamilton-Jacobi puede ser útil en problemas cuánticos realistas en que sea especialmente difı́cil diagonalizar directamente la matriz hamiltoniana. 12.5. Teorı́a de perturbaciones con matrices clásicas Veremos que las fórmulas de la teorı́a clásica de perturbaciones, de primero y segundo orden, pueden escribirse en forma análoga a las correspondientes fórmulas de la mecánica cuántica para las correcciones a la energı́a. Perturbaciones de primer orden. Para el caso no degenerado la corrección de primer orden a la energı́a está dada por la fórmula (11.27): H (1) (I) = hH1 (ϕ0 , I)i (12.99) Si la función H1 se expresa como una serie de Fourier, la corrección de primer orden está determinada por los elementos diagonales de la matriz correspondiente: H (1) (~ α ∆I) = H1 α~ ,~α (12.100) que corresponde en mecánica cuántica con h~ α|H1 |~ αi. Para el caso degenerado, antes de hallar la corrección de primer orden, es necesario encontrar las variables acción-ángulo “correctas” o “estabilizadas” en la aproximación cero. Para ello es necesario buscar entre los posibles conjuntos de variables acción-ángulo degeneradas Iσ0 − ϕ0σ de orden cero, aquel con el cual la perturbación no depende de las variables angulares. A su vez esto se consigue resolviendo la ecuación de HamiltonJacobi (11.110). En términos de matrices esto se logra diagonalizando la matriz formada con los coeficientes de Fourier de la perturbación respecto a las variables degeneradas. Simultáneamente se hallan los valores propios perturbados al primer orden y la transformación canónica que lleva a las variables “correctas” de orden cero, mediante la fórmula: h i (1) det H1 ~σ,σ~′ − H~σ δ~σ ,~σ′ = 0 (12.101) donde ~σ y ~σ ′ son vectores de l − s componentes enteras, y: XX (1) g~σ+,~σ′ H~σ′ ,~σ′′ g~σ′′ ,~τ = H~σ δ~σ ,~τ ~ σ′ (12.102) ~ σ′′ En mecánica cuántica, la matriz que diagonaliza la perturbación proporciona los coeficientes con los cuales se forman las funciones de onda exactas de la aproximación cero como combinaciones lineales de las funciones de onda degeneradas. Ver la sección Corespondencia con la mecánica cuántica de Heisenberg / 565 §39 del libro de mecánica cuántica de Landau-Lifshitz, Op. cit. Perturbaciones de segundo orden. Según la fórmula (11.40), la corrección de segundo orden a la energı́a está dada por: H (2) (~ α ∆I) = − |Aα~ ,β~ |2 1X ~ · ∂ (~ α − β) ~ · ~ω 2 ∂ I~ (~ α − β) ~ (12.103) β6=α ~ donde Aα~ ,β~ está dada por el coeficiente de Fourier de la expansión de H1 en las variables acción-ángulo no perturbadas. Tanto ω ~ como A ~ tienen como argumento a I~ = α ~ ∆I. α ~ ,β Como en (12.41), podemos escribir: |Aα~ ,β~ |2 ∆I ~ · ∂ (~ α − β) = ~ ·ω 2 ∂ I~ (~ α − β) ~ |Aα~ ,β~ |2 ~ · ~ω (~ α − β) α ~ ∆I − |Aα~ ,β~ |2 ~ · ~ω (~ α − β) (12.104) ~ ∆I/2 (~ α+β) ~−α El primer término de (12.104) cambia de signo al cambiar a α ~ − β~ por β ~ . Por tanto en la sumatoria (12.103) las contribuciones provenientes del primer término de (12.104) se cancelan. En el denominador del segundo término de (12.104), ~ω está evaluada ~ ∆I/2. Si reemplazamos al denominador de la siguiente manera: en (~ α + β) " # ~ ∆I (~ α + β) ~ ·~ ~ · ~ω (β ~ ∆I) (~ α − β) ω →α ~ · ~ω(~ α ∆I) − β (12.105) 2 ~ ∆I|2 en la expresión para H (2) , con lo cual cometemos un error del orden de |(~ α − β) llegamos a la fórmula: H (2) (~ α ∆I) = X ~ =α β6 ~ |Aα~ ,β~ |2 ~ ∆I) ∆I α ~ ·ω ~ (~ α ∆I) − ∆I β~ · ~ω(β (12.106) Si llamamos: α ~ ∆I · ~ ω (~ α ∆I) = Eα~ ′ (12.107) ~ ∆I|2 como: La ecuación (12.103) puede escribirse con un error del orden de |(~ α − β) H (2) (~ α ∆I) = X |Aα~ ,β~ |2 ′ ~ β Eα~ − Eβ~ (12.108) que coincide formalmente con la fórmula cuántica de la teorı́a de perturbaciones de segundo orden. 566 / Mecánica clásica avanzada 13 Correspondencia con la mecánica cuántica de Schrödinger Este capı́tulo trata de mostrar la conexión de los trabajos de Hamilton y Jacobi con la formulación de Schrödinger de la mecánica cuántica. Se hará énfasis en la relación existente entre la acción principal de Hamilton y la fase de la función de onda, y entre las soluciones de la ecuación de Liouville y la amplitud de la función de onda. Al pasar de la mecánica clásica a la formulación de Schrödinger son necesarios cambios conceptuales más drásticos respecto a la formulación de Heisenberg, pues se requiere postular la existencia de comportamientos ondulatorios. También presentaremos algunos desarrollos modernos de las ideas de Einstein, Bohr y Sommerfeld acerca de la cuantización de un sistema clásico, debidos a Brillouin, Maslov y Keller. Finalmente obtendremos las fórmulas de la aproximación de W.K.B. 13.1. Ideas de Hamilton acerca de las transformaciones canónicas Hamilton presentó en 1824 un trabajo a la Academia Irlandesa de Ciencias acerca de la conexión entre la dinámica y la óptica. Desde el punto de vista moderno, tal formalismo presenta una conexión entre la dinámica y el lı́mite clásico de la mecánica ondulatoria, y no es aplicable a la óptica por las dificultades resultantes de ser cero la masa del fotón. Según el principio de Fermat las ecuaciones paramétricas de la trayectoria de un rayo de luz, x(l), y(l), z(l), son tales que la siguiente integral es una extremal: Z n(~r(l)) dl (13.1) siendo n el ı́ndice de refracción del medio en el punto ~r. El principio de mı́nima acción aplicado a una partı́cula sometida a un potencial V , ecuación (9.49), expresa que: Z [E − V (~r)]1/2 dl (13.2) 567 568 / Mecánica clásica avanzada tiene un valor estacionario para la trayectoria real. En los dos casos se deben tomar variaciones “∆”. La trayectoria de una partı́cula y la de un rayo de luz coinciden haciendo: n(~r) = A [E − V (~r)]1/2 (13.3) En un medio inhomogéneo y anisotrópico n depende no sólo de la posición sino de la dirección de los rayos, esto es, de ~r y ~r˙ . Lo anterior permitirı́a asociar propiedades corpusculares a la luz. Hamilton se propuso elaborar esta conexión dentro de un modelo ondulatorio de la luz teniendo en cuenta que la relación (13.3) es válida independientemente del modelo usado. Es natural partir del concepto de “frente de ondas”, introducido por Huygens en 1690. Cada punto ~r de un frente de ondas en el tiempo t genera una onda secundaria que alcanzará otro punto ~r ′ del frente de ondas en un tiempo posterior t′ . El tiempo empleado por la luz en ir de ~r a ~r ′ dependerá solamente de ~r y ~r ′ . El lugar geométrico de los puntos alcanzados por la luz en el tiempo t′ es una superficie de ondas secundarias, definida por una función Σ(~r, ~r ′ ), donde ~r hace de parámetro, mediante la fórmula: Σ(~r, ~r ′ ) = t − t′ (13.4) Σ describe el camino óptico entre ~r y ~r ′ y fue llamada por Hamilton función caracterı́stica del medio. Según el principio de Huygens, la envolvente de las ondas secundarias en el tiempo t′ es el frente S ′ que se ha propagado en el espacio, como se ilustra en la figura 13.1. α′′ α′ α r′ N r″ T Σ′ r Σ S″ S′ S Figura 13.1 Propagación en el espacio de la envolvente S Denotemos por α ~ = (α1 , α2 , α3 ) a los cosenos directores de la normal a S en el punto ~r y por α ~ ′ a los cosenos directores de la normal a S ′ en el punto ~r ′ . Decimos que ~r ′ corresponde con ~r si la onda secundaria que emerge de ~r toca a la envolvente S ′ en ~r ′ . La lı́nea descrita por los vectores α ~, α ~ ′, α ~ ′′ , ..., que llamamos N , es ortogonal a los Corespondencia con la mecánica cuántica de Schrödinger / 569 frentes de onda. Como S ′ es la envolvente de las superficies Σ correspondientes a los puntos de S, las superficies Σ también son ortogonales a la lı́nea N en los puntos ~r, ~r ′ , ~r ′′ , ... Si denotamos por d~r ′ a un vector tangente a la superficie S ′ en ~r ′ , se cumple que: ∂Σ(~r, ~r ′ ) · d~r ′ = 0 ∂~r ′ (13.5) Como α ~ ′ son los cosenos directores de N en el punto ~r ′ , también serán ortogonales a d~r . Se sigue entonces que: ∂Σ(~r, ~r ′ ) ′ ′ · d~r ′ = 0 (13.6) − λ α ~ ∂~r ′ ′ donde λ′ es cierta función de ~r ′ . La ecuación (13.6) implica que: 1 ∂Σ 1 ∂Σ 1 ∂Σ = ′ = ′ α′1 ∂x′ α2 ∂y ′ α3 ∂z ′ (13.7) Similarmente, en el punto ~r se debe cumplir: 1 ∂Σ 1 ∂Σ 1 ∂Σ = = α1 ∂x α2 ∂y α3 ∂z (13.8) Además: α′1 2 + α′2 2 + α′3 2 = 1 (13.9) Las ecuaciones (13.4) y (13.7) a (13.9) permiten expresar las seis cantidades (x′ , y , z , α′1 , α′2 , α′3 ) en términos de (x, y, z, α1 , α2 , α3 ). Entonces, dada una función caracterı́stica del medio Σ, las seis ecuaciones (13.4) y (13.7) a (13.9) describen unı́vocamente la lı́nea de las normales N en el medio óptico anisotrópico. Es necesario aclarar que la lı́nea N no necesariamente coincide con la lı́nea T de un rayo luminoso que pasa por ~r; esta coincidencia ocurre solamente en un medio óptico isotrópico, en el cual los vectores ~r˙ , ~r˙ ′ , ~r˙ ′′ , ... son respectivamente paralelos a los vectores α ~, α ~ ′, α ~ ′′ , ... La función Σ determina una transformación en el espacio que cambia cualquier superficie S en una nueva S ′ . Si dos superficies Σ y S ′ se tocan en un punto ~r ′ , entonces las correspondientes superficies transformadas Σ′ y S ′′ se tocan en un punto ~r ′′ correspondiente a ~r ′ . Sophus Lie por esta razón llama a las transformaciones (~r, α ~ ) → (~r ′ , α ~ ′) 1 transformaciones de contacto. Entonces cada función Σ define una transformación de contacto, que transforma un frente de ondas S en el frente de ondas S ′ envolvente de todas las ondas secundarias emergentes de S, en el intervalo de tiempo t′ − t. De (13.7) y (13.8) se sigue que: ′ ′ ∂Σ(~r, ~r ′ ) = λ~ α; ∂~r 1 En ∂Σ(~r, ~r ′ ) = λ′ α ~′ ∂~r ′ (13.10) dinámica hamiltoniana se usa el nombre de transformaciones canónicas para designar a estas transformaciones. 570 / Mecánica clásica avanzada Entonces bajo desplazamientos arbitrarios d~r y d~r ′ , Σ cambia de valor en: dΣ = λ~ α · d~r + λ′ α ~ ′ · d~r ′ (13.11) De acuerdo con (13.4), dΣ = dt′ − dt. Si tomamos el punto ~r fijo y consideramos dos frentes de onda próximos, en los puntos ~r ′ y ~r ′ + d~r ′ , entonces dt′ será la diferencia de tiempo entre esos frentes de onda, dada por: dt′ = dl′ ′ n c (13.12) donde c es la velocidad de la luz en el vacı́o, dl′ la distancia normal entre los dos frentes de onda finales y n′ es el ı́ndice de refracción del medio en el punto ~r ′ en la dirección α′ normal a S ′ . De (13.11) y (13.12) se sigue entonces: dl′ ′ n = λ′ α ~ ′ · d~r ′ c (13.13) Como para el desplazamiento de ~r ′ que consideramos se cumple que d~r ′ = α ~ ′ dl′ , ′ ′ ′ podemos escribir dl = α ~ .d~r . Obtenemos entonces el resultado: λ′ = n′ ; c λ=− n c (13.14) donde la segunda expresión se sigue de argumentos similares, tomando a ~r ′ fijo y variando el punto inicial ~r. En conclusión: dΣ = n n′ ′ α ~ · d~r ′ − α ~ · d~r c c (13.15) donde n′ y n son funciones respectivamente de (~r ′ , α ~ ′ ) y (~r, α ~ ), o equivalentemente de (~r ′ , ~r˙ ′ ) y (~r, ~r˙ ), porque debe existir una relación definida entre α ~ y ~r˙ , y α ~ ′ y ~r˙ ′ . También dΣ puede escribirse como: dΣ = ~ p ′ · d~r ′ − p~ · d~r (13.16) los vectores ~ p y p~ ′ tienen dimensiones de T L−1 y su magnitud es menor en los puntos donde la velocidad de la luz es mayor y viceversa. Si tomamos ahora los tiempos t y t′ infinitesimalmente próximos, también lo serán los puntos ~r y ~r ′ , lo mismo que α ~ yα ~ ′ , y n y n′ . Decimos en este caso que la transformación de contacto es infinitesimal: ~r ′ = ~r + ~r˙ ∆t ; ~ ′ = p~ + ~p˙ ∆t p (13.17) Como Σ(~r, ~r) = 0, también se cumple que, al orden más bajo en ∆t: Σ(~r, ~r ′ ) = ∂Σ(~r, ~r ′ ) ∂~r ′ ~ r ′ =~ r · ~r˙ ∆t (13.18) Definimos la función M (~r, ~r ′ ) como: M (~r, ~r˙ ) = ∂Σ(~r, ~r ′ ) ˙ · ~r ∂~r ′ ~ r ′ =~ r = ~p · ~r˙ (13.19) Corespondencia con la mecánica cuántica de Schrödinger / 571 Entonces se sigue que: ∂M (~r, ~r˙ ) ∂Σ(~r, ~r ′ ) = ∂~r ′ ∂~r˙ = ~p (13.20) ~ r ′ =~ r Según (13.18) y (13.19), cuando ~r y ~r ′ son infinitesimalmente cercanos: Σ(~r, ~r ′ ) = M (~r, ~r˙ ) ∆t (13.21) Por tanto, para una separación finita entre ~r y ~r ′ se cumple: Z ~r ′ Z t′ ′ ˙ ~p · d~r M (~r, ~r) dt = Σ(~r, ~r ) = (13.22) ~ r t La longitud del camino óptico entre ~r y ~r ′ también puede escribirse, usando (13.15) y (13.16), como: Z ~r ′ Z ′ n 1 ~r ′ Σ(~r, ~r ) = α ~ · d~r = n dl (13.23) c c ~r ~ r Entonces, el principio de Fermat, (13.1), equivale a la condición de que Σ sea una extremal. La condición ∆Σ = 0 determina la forma de la lı́nea de los rayos T de la figura 13.1. Comparando a (13.23) con (13.2) vemos que M es proporcional a la energı́a cinética del problema mecánico equivalente. La transformación de contacto (13.10), cuya función generatriz es Σ, puede expresarse como una transformación canónica libre de primera clase: p~ = − ∂Σ(~r, ~r ′ ) ; ∂~r ~′ = p ∂Σ(~r, ~r ′ ) ∂~r ′ (13.24) donde (~r ′ , p~ ′ ) son las “viejas” variables canónicas y (~r, p~) las “nuevas”. Comparando con los resultados de la sección 9.3, fórmula (9.44), encontramos que Σ coincide formalmente con la acción de Lagrange y M con ~p · ~q. Sin embargo hay una discrepancia dimensional a través de un factor constante B con dimensiones de energı́a. O sea que BΣ es la acción de Lagrange y B~ p es el momento mecánico. La acción de Lagrange BΣ obedece la ecuación de Hamilton-Jacobi independiente del tiempo, que para una partı́cula de masa m en un potencial V es: 2 ∂Σ V E 1 + 2 = 2 (13.25) 2m ∂~r B B Usando la conexión dada por (13.3), podemos escribir a (13.25) como: 2 ∂Σ 2m 1 = 2 2 n2 = 2 n2 ∂~r A B c (13.26) donde c es una constante con dimensiones de velocidad: c= AB (2m)1/2 (13.27) 572 / Mecánica clásica avanzada Formalmente (13.26) es la ecuación de la eiconal de la óptica,2 que permite encontrar a Σ si se conocen las propiedades ópticas del medio expresadas a través de n. Nótese que la relación (13.27) aparentemente no permite el concepto de fotón entendido como una partı́cula de masa cero. Sin embargo el formalismo resulta perfectamente adaptado a la descripción de propiedades ondulatorias de partı́culas de masa diferente de cero. Podemos concluir que a la acción de Lagrange de un sistema mecánico se le puede asociar la onda secundaria emergente de un punto en cierto movimiento de propagación de ondas. Este resultado sirvió a Schrödinger para hallar la conexión entre la mecánica y la óptica clásicas por una parte, y la mecánica ondulatoria (mecánica cuántica) por otra. Sin embargo, la ecuación de la eiconal (13.26) no coincide con la ecuación de ondas más que en el lı́mite asintótico de pequeñas longitudes de onda, en el cual la óptica ondulatoria coincide con la óptica geométrica. Frecuencia y vector de propagación. Para una onda plana monocromática la amplitud tiene la forma: ~ C = aei(k·~r−ωt+α) (13.28) y para una onda arbitraria: C = aeiϕ (13.29) donde ϕ es la eiconal que obedece la ecuación (13.26) sólo en el lı́mite de ondas cortas. Desarrollando a ϕ en potencias de ~r y t, para ~r y t pequeños se obtiene: ϕ=α+t ∂ϕ ∂ϕ + ~r · ∂t ∂~r (13.30) Como es de esperarse, el frente de ondas emergente de un punto es en las cercanı́as del mismo casi plano, con: ~k = ∂ϕ ; ∂~r ω=− ∂ϕ ∂t (13.31) Por otra parte, expandiendo a S cerca a ~r = 0 obtenemos: S = −Et + BΣ ≈ −Et + B~r · ∂Σ = −Et + B~r · p~ ∂~r (13.32) Si admitimos que S = Dϕ, donde D es otra constante, encontramos que p~ es proporcional a ~k y E proporcional a ω: E = Dω ; p ~= D~ k B (13.33) La función M , según (13.19) puede escribirse como: n(~r, α ~) M (~r, ~r˙ ) = α ~ · ~r˙ c 2 Eiconal viene del griego, icono = imagen. La función eiconal permite localizar imágenes. (13.34) Corespondencia con la mecánica cuántica de Schrödinger / 573 y se denomina la indicatriz del medio óptico en el punto ~r. La velocidad del frente de ondas en el punto ~r en la dirección α ~ tiene magnitud v(~r, α ~ ) = c/n(~r, α ~ ). Por tanto: α ~ · ~r˙ M (~r, ~r˙ ) = ; v(~r, α ~) p~ = α ~ ~v (~r, α ~) = v(~r, α ~) v(~r, α ~ )2 (13.35) Por esto el vector p~, que es proporcional a ~k cuando la onda es plana monocromática, se llama el vector de lentitud normal del frente de ondas en el punto ~r en la dirección α ~. ~ en un punto Los vectores ~r˙ y ~p. Exploremos la relación entre los vectores ~r y α dado ~r. Para ello usamos la noción matemática de homotecia, o sea la transformación de cambio de escala. Si realizamos a la superficie M (~r, ~r˙ ) una transformación de homotecia con parámetro ǫ respecto a ~r˙ , en un punto ~r, obtenemos: M (~r, ǫ~r˙ ) = ǫ~ p · ~r˙ (13.36) al notar que p~ depende de la dirección de ~r pero no de su magnitud. Por otra parte, consideremos el desplazamiento del frente de ondas S durante un tiempo infinitesimal ǫ (véase figura 13.2). La onda secundaria que emerge del punto ~r, en el tiempo ǫ, será, según (13.18): Σ(~r, ~r ′ ) = p~ · ~r˙ ǫ (13.37) Comparando a (13.36) y (13.37) se sigue que Σ y M son iguales al orden de ǫ2 . Cuando el tiempo entre S(t) y S(t + ǫ) es infinitesimal, la onda secundaria emergente de ~r que toca a S(t + ǫ) y la indicatriz del medio óptico en ~r son homotéticas. Si ahora hacemos tender ǫ a cero, obtenemos que en cada punto ~r los vectores α ~ y ~r tienen una relación bien definida. La dirección del plano tangente a la indicatriz en ~r˙ se llama conjugada de la dirección de ~r˙ . O sea que ~r˙ y ~ p son dos vectores conjugados en cada punto ~r. En general ~r˙ no es perpendicular al plano tangente a la indicatriz en ~r˙ . Si el medio es isotrópico, en cada punto ~r la indicatriz será una superficie esférica; en el caso contrario n dependerá de ~r y ~r˙ , con lo cual Σ y p~ dependerán igualmente de ~r˙ , dando lugar a que M no sea esférica (véase figura 13.2). 13.2. Función de distribución de probabilidades Para una partı́cula, la contraparte cuántica de la proyección de un toroide invariante sobre el espacio tridimensional es |ψ|2 , siendo ψ una función propia de tres operadores que conmutan (para un problema de fuerzas centrales, por ejemplo, tales operadores pueden ser H, l2 y lz ). La densidad que describe el ensamble de trayectorias sobre el toroide invariante es ρ, que satisface la ecuación de Liouville (sección 4.8): ∂ρ + [ρ, H] = 0 ∂t (13.38) 574 / Mecánica clásica avanzada T Punto de tangencia r r p Plano tangente a la indicatriz en r Σ(r, r ′) M(r, r ′) S(t) S(t + ε) Figura 13.2 Desplazamiento del frente de ondas S durante un tiempo infinitesimal ǫ. Como H no depende de las variables angulares, esta ecuación toma la forma, ∂ρ ∂ρ ∂ρ ∂ρ + ω2 + ω3 =0 + ω1 ∂t ∂ϕ1 ∂ϕ2 ∂ϕ3 (13.39) Como las ων son las “velocidades” sobre el toroide, esta ecuación tiene la forma de una ecuación de continuidad para la densidad ρ: 3 ∂ρ X ∂ (ων ρ) = 0 + ∂t ν=1 ∂ϕν (13.40) Cuando el sistema es estacionario, t no aparece en ρ explı́citamente y por tanto: 3 X ∂ (ων ρ) = 0 ∂ϕ ν ν=1 (13.41) Según esta expresión, el flujo de probabilidad sobre el toroide no tiene divergencia. Por tanto, al aplicar el teorema de Gauss a un tubo de trayectorias: Z (~ ω ρ) · d~σ = 0 (13.42) Como consecuencia, conociendo a ρ en un punto se puede calcular a ρ en cualquier otro punto de la misma trayectoria: ρω = ρ0 ω dσ0 dσ (13.43) donde ω = |~ ω |, y dσ0 es el área de cruce normal al tubo de caracterı́sticas en el punto (~ p0 , ~r0 ). Realmente (13.43) vale en el lı́mite cuando dσ0 tiende a cero, en cuyo caso Corespondencia con la mecánica cuántica de Schrödinger / 575 dσ/dσ0 denota el jacobiano de la aplicación de los puntos de una sección de cruce en otra por medio de las trayectorias: p~0 , ~r0 ρ(~ p, ~r) = ρ(~ p0 , ~r0 ) J (13.44) p~, ~r Una posible solución de (13.41) es una función arbitraria de las variables de acción. Sin embargo no es la más interesante. Función de distribución en el espacio de configuración. Si por algún procedimiento se obtiene una ρ particular, entonces la densidad en el espacio de configuración x − y − z será: Z Q(~r) = ρ(~ p, ~r) d3 p~ (13.45) En el espacio de configuración hay igualmente un flujo de probabilidad, descrito por la ecuación de continuidad para Q: ∂ ∂Q + · (~r˙ Q) = 0 ∂t ∂~r (13.46) donde ~r˙ = ∂H/∂~ p. Cuando Q no depende explı́citamente del tiempo, obedece ecuaciones análogas a (13.41) y (13.42). La ecuación análoga a (13.43) es: Qv = Q0 v0 dA0 dA (13.47) siendo dA un elemento de área en el espacio ordinario, y v = |~r˙ |. Si se conoce a Q sobre una superficie dA0 que corta un tubo de trayectorias caracterı́sticas en el espacio de configuración, (13.47) permite hallar a Q en cualquier otra superficie que corte el mismo tubo de trayectorias. El formalismo de las variables acción-ángulo permite encontrar la densidad de probabilidad Q(~r), en una forma alterna a (13.47) que hace más transparente la conexión con Σ y con la proyección del ensamble de trayectorias en el espacio de fases sobre el espacio de configuración. ~ ϕ Como en ~r(I, ~ ) las I~ son constantes, se sigue que las posibles posiciones de la partı́cula en el espacio de configuración, ~r, están determinadas por las ϕ ~. Entonces el promedio de una función de ~r sobre el toroide invariante puede expresarse como un promedio sobre el espacio de configuración. En efecto: I 1 ~ ϕ f (~r(I, ~ )) d3 ϕ ~ (13.48) hf (~r)i = (2π)3 ~ ϕ La función ~r(I, ~ ), con I~ = constante, puede interpretarse como un cambio de coordenadas de ϕ ~ a ~r. Por tanto (13.48) puede escribirse como: Z ϕ ~ 1 d3~r (13.49) f (~ r ) J hf (~r)i = 3 (2π) ~r 576 / Mecánica clásica avanzada En términos de Q este mismo promedio es: Z hf (~r)i = Q(~r) f (~r) d3~r (13.50) de donde concluimos que Q es esencialmente el jacobiano de la transformación de ϕ ~ a ~r con I~ fijo: −1 ϕ ~ ~r 3 (2π) Q(~r) = J (13.51) =J ~r ϕ ~ Podemos igualmente hallar la función de distribución en el espacio de los momentos: ϕ ~ (13.52) (2π)3 Qp (~ p) = J p~ El lugar geométrico de los puntos para los cuales Q = ∞ se denomina “superficie cáustica”. Para esos puntos, o bien v = 0, o bien las trayectorias se cruzan haciendo que dA = 0. Si la sección de cruce se convierte un una lı́nea, diremos que m1 = 1 y si se convierte en un punto, que m1 = 2. El número de veces que un momento canónico cambie de signo en alguna cáustica lo notaremos m2 . El número m = m1 +m2 determina la fase de la función de onda semiclásica construida con Q y Σ. La fórmula (13.51) permite también interpretar las cáusticas como el lugar geométrico de las singularidades de la aplicación del espacio de fases sobre el espacio de configuración ϕ ~ → ~r. Tales singularidades se denominan lagrangianas. Ejemplo 13.2.1 Hallar la función Q para el problema de Kepler en coordenadas esféricas. En este caso Ir , Iθ e Iϕ son constantes. De las fórmulas que expresan a r, θ y ϕ en términos de las variables angulares ϕr , ϕθ y ϕϕ , dadas en la sección 10.4, se sigue que: (2π)3 Q(~r) = ∂ϕr ∂ϕθ ∂ϕϕ 1 r2 sen θ ∂r ∂θ ∂ϕ (13.53) De la ecuación (10.192) se sigue: ∂ϕr I 1 = 2 ∂r a pr (13.54) La separación de variables en la ecuación de Hamilton-Jacobi para el problema conduce a: ~ r, θ, ϕ) = Σr (Ir , Iθ , Iϕ , r) + Σθ (Iθ , Iϕ , θ) + Σϕ (Iϕ , ϕ) Σ(I, (13.55) de donde se sigue: ∂pθ ∂ϕθ ; = ∂θ ∂Iθ ∂ϕϕ ∂pϕ = ∂ϕ ∂Iϕ (13.56) Como pθ y pϕ están dados por: p2θ = l2 − lz2 ; sen2 θ pϕ = lz (13.57) Corespondencia con la mecánica cuántica de Schrödinger / 577 obtenemos: l ∂ϕθ ; = ∂θ pθ ∂ϕϕ =1 ∂ϕ (13.58) De donde obtenemos finalmente: Q(~r) = mk 1 (1 − ǫ2 )1/2 2 (2π)3 a r sen θ pr pθ (13.59) Esta es la densidad de probabilidad para un ensamble de sistemas con los mismos valores de E, l, lz , donde cada sistema posee un valor distinto de las ϕν . La región descrita por Q(~r) se obtiene también a partir de una órbita individual mediante estas tres operaciones: primero, dejando la órbita fija se toma el conjunto de todas las posiciones de la partı́cula sobre la misma; segundo, dejando fijo el plano de la órbita, se toma el conjunto de puntos del plano obtenido al rotar el anterior conjunto alrededor del foco, obteniéndose ası́ una corona sobre el plano de la órbita; finalmente, se toma el conjunto de puntos del espacio obtenido al rotar la corona alrededor del eje z. La región ası́ obtenida resulta ser un elipsoide de revolución con ejes de longitudes rmáx y rmáx cos θmı́n , colocado con el eje menor sobre el eje z, y que además posee en el centro un agujero elipsoidal con ejes de longitudes rmı́n y rmı́n cos θmı́n . Q(~r) vale cero fuera del elipsoide y dentro del agujero, es infinita sobre las superficies de los elipsoides, y en los demás puntos está dada por (13.59). Nótese que los elipsoides interior y exterior son las superficies cáusticas. La región que hemos descrito es, para el caso del átomo de hidrógeno, el lı́mite clásico de la densidad de probabilidad cuántica |ψnlm |2 . Vemos que no presenta los nodos angulares 2 caracterı́sticos de |Ylm |2 , ni los nodos de la densidad de probabilidad radial Rnl (r). Además, la densidad de probabilidad cuántica no es cero para r mayor que rmáx ni para r menor que rmı́n , aunque decae exponencialmente en estas regiones, y tampoco presenta superficies cáusticas. Ejemplo 13.2.2 Estudiar la función de distribución en el caso lz = l = 0. Comparar con la correspondiente densidad cuántica para el átomo de hidrógeno. En este caso rmı́n = 0, las órbitas son rectilı́neas y la intersección del toroide invariante con el espacio de configuración es una esfera. Q(r) es cero para r > 2a, infinito en r = 0 y r = 2a, y en los demás puntos está dada por: Q(r) = 1 (2π)2 ar(2ar − r2 )1/2 (13.60) Esta expresión no se obtiene directamente de (13.59) porque para l = 0, pθ no está definido. En (13.53), ∂ϕθ /∂θ es indeterminada pero hemos asumido que es una constante que se halla por normalización. Q(r) es isotrópica y corresponde a los estados s de la mecánica cuántica. Q(r) diverge en r = 0 y r = 2a, que son los puntos de retorno, y tiene un mı́nimo en r = 3a/2. El valor medio de r calculado con esta Q es 3a/2 y coincide exactamente con el valor medio cuántico. Si bien en este caso no se cumplen las condiciones de validez de la aproximación clásica,3 el problema ilustra la correspondencia entre las dos descripciones. 3 Véase la sección 49 del libro de Mecánica cuántica de Landau-Lifshitz, Op. cit. 578 / Mecánica clásica avanzada 2 2πϕ21s 1 2πQr 1 2 2 Figura 13.3 Función de distribución 2πQ(r) en el caso lz = l = 0 y densidad cuántica 2πψ1s para el átomo de hidrógeno En la figura 13.3, la curva discontinua corresponde a la distribución en mecánica cuántica para el estado 1s del átomo de hidrógeno, que es exponencial. Las unidades son atómicas. Como puede verse, la mayor discrepancia se presenta cerca al punto de retorno r = 0 y a la superficie cáustica r = 2, donde la partı́cula tiene energı́a cinética muy pequeña, estando por tanto allı́ más expuesta a los efectos de tipo cuántico. La distribución clásica tiene la forma de una esfera con densidad que varı́a radialmente, de radio 2a, en tanto que la distribución en mecánica cuántica decae exponencialmente y existe para r entre 0 y 2a, ası́ como entre 2a e ∞. La densidad en el espacio de momentos se halla fácilmente de la relación Qr r2 dr = Qp p2 dp. En unidades atómicas el resultado es: Qp (p) = 1 1 2π 2 p2 (1 + p2 )2 (13.61) El resultado cuántico es:4 ϕ21s (p) = 8 1 π 2 (1 + p2 )4 (13.62) Ejemplo 13.2.3 Demostrar que la función de distribución Q(r) definida por (13.51) satisface la ecuación de continuidad (13.46). En este caso Q no depende explı́citamente del tiempo. El jacobiano está dado por: ∂ϕλ ∂ϕσ ∂ϕρ ϕ ~ = ǫλσρ (13.63) J ~r ∂x ∂y ∂z 4 Véase la sección 36 del libro de Landau-Lifshitz, Op. cit. Corespondencia con la mecánica cuántica de Schrödinger / 579 donde ǫλσρ es el tensor de Levi-Civita. Por otra parte la velocidad tiene la expresión: ~r˙ = X ∂~r ωµ ∂ϕµ µ (13.64) Entonces (convenio de suma): ∂ ∂ϕλ ∂ϕµ ∂ϕρ ∂ ∂xi (ẋi J) = ωµ ǫλσρ ∂xi ∂xi ∂ϕµ ∂x ∂y ∂z (13.65) ésta expresión es nula porque: ∂ ∂xi ∂ 2 xi = =0 ∂xi ∂ϕµ ∂ϕµ ∂xi (13.66) ∂xi ∂ 2 ϕρ ∂ ∂ϕρ ∂ = = δµρ = 0 ∂ϕµ ∂xi ∂xi ∂ϕµ ∂xj ∂xi (13.67) y, Ejemplo 13.2.4 Expresar la función de distribución Q(~r) en términos de la acción de Lagrange Σ. Recordando que: ϕν = ~ ~r) ∂Σ(I, ∂Iν (13.68) se sigue de (13.63) que: (2π)3 Q(~r) = ǫλσρ ∂2Σ ∂2Σ ∂2Σ ∂x∂Iλ ∂y∂Iσ ∂z∂Iρ (13.69) ~ ~r), Se sigue entonces que a cada solución de la ecuación de Hamilton-Jacobi, Σ(I, le corresponde una función de distribución. No es necesario resolver por separado la ecuación de continuidad en el espacio de configuración. En otras palabras, los campos ~ ~r) y Q(I, ~ ~r) no son independientes. En mecánica cuántica esto implicarı́a que la Σ(I, función de onda compleja queda determinada simplemente por una función real. Relación con la teorı́a ergódica y con el teorema K.A.M. Si el sistema es no degenerado y asumimos que los efectos cuánticos son una perturbación pequeña, sabemos que los toroides invariantes han de resultar ligeramente distorsionados. Entonces el problema cuántico no difiere esencialmente del clásico. Como las frecuencias son inconmensurables la trayectoria clásica, cuando t → ∞, llena completamente el toroide y se cumple que el promedio temporal de una variable dinámica coincide con el promedio tomado sobre las coordenadas del toroide: Z I 1 T 1 lı́m f (q, p)dt = f (q, p) dl ϕ ~ (13.70) T →∞ T 0 (2π)l Si el sistema es degenerado, las frecuencias son conmensurables. Entonces las trayectorias son periódicas y cubren una región de dimensión menor a la del toroide. El 580 / Mecánica clásica avanzada teorema K.A.M. dice que en este caso, aun si la perturbación es muy pequeña, los toroides invariantes pueden cambiar drásticamente en su topologı́a; para la mayor parte de las condiciones iniciales las trayectorias son estocásticas o sea que no están colocadas sobre regiones de geometrı́a definida en el espacio fásico. Para el problema de fuerzas centrales en coordenadas esféricas, además de Ir , Iθ e Iϕ hay una constante de movimiento adicional ϕθ − ϕϕ (y en el problema de Kepler además ϕr − ϕθ es constante). Cuando se aplica una perturbación las constantes que dependen sólo de variables angulares pasan a ser veriables angulares de frecuencia lenta dando lugar a que la trayectoria no sea cerrada sino que ocupe toda la región definida por las variables de acción constantes. Entonces es de esperarse que a causa de los efectos cuánticos, en un sistema degenerado se cumpla también la igualdad (13.70). 13.3. La mecánica ondulatoria Es posible, en la óptica geométrica, describir la propagación de los rayos por medio del principio de Fermat, ∆Σ = 0, y la propagación de los frentes de ondas por medio de la ecuación de la eiconal. En óptica fı́sica la luz es una onda electromagnética, y la óptica geométrica es una primera aproximación que describe correctamente la propagación cuando la longitud de onda es pequeña en comparación con las dimensiones caracterı́sticas de la geometrı́a del problema. Schrödinger encontró que para un sistema mecánico hay un comportamiento similar. La trayectoria de las partı́culas está determinada por el principio de mı́nima acción y las soluciones de la ecuación de Hamilton-Jacobi describen el movimiento de unas superficies de acción constante. La mecánica clásica resulta ser la aproximación de ondas cortas de una teorı́a más general, llamada mecánica ondulatoria. Las ondas de materia están determinadas por dos campos en el espacio ordinario, la ~ ~r), que distribución de probabilidades Q(~r) y las superficies de acción constante Σ(I, 5 corresponden a la amplitud y la fase de la onda. Según el ejemplo 13.2.4, Σ determina a Q. Schrödinger encontró la ecuación diferencial que obedecen las ondas de materia. Propagación de las superficies de acción constante. Las funciones de Hamilton S y Σ están relacionadas por: ~ t) = Σ(~r, C) ~ − Et S(~r, C, (13.71) ~ es un conjunto de constantes de movimiento. Las superficies Σ = constante perdonde C manecen fijas en el espacio de configuración, en tanto que las superficies S = constante se mueven. Si en t = 0, S = Σ = σ, entonces en un tiempo posterior dt, la superficie S = σ ya no coincidirá con la superficie Σ = σ sino con la superficie Σ = σ + E dt. La velocidad del movimiento de un punto fijo sobre S la llamaremos u: u= dl dt (13.72) 5 Esta correspondencia tiene implicaciones en las teorı́as gauge de la fı́sica de partı́culas elementales. Véase L.A. Sánchez, J. Mahecha, Rev. Mex. Fis. 49(2003)364. También http://xxx.lanl.gov/abs/hep-th/0308160 Corespondencia con la mecánica cuántica de Schrödinger / 581 donde dl es el desplazamiento del punto durante el tiempo dt. La condición S(0) = S(dt) = σ nos determina el valor de u. En efecto: S(dt) − S(0) = ∂S ~ ∂S · dl + dt = 0 ∂~r ∂t (13.73) Como por su definición d~l está en la dirección normal a S, se sigue que: u= E ∂Σ ∂~r (13.74) Σ obedece la ecuación de Hamilton-Jacobi independiente del tiempo, de donde: ∂Σ = [2m(E − V )]1/2 = (2mT )1/2 ∂~r (13.75) Por tanto la velocidad de los puntos del frente S para una partı́cula es: u= E E = 1/2 p (2mT ) (13.76) La relación E = pu, donde p es el momento lineal de la partı́cula y u la velocidad del frente S, es análoga a E = pc en el caso de los fotones. u = E/mv es pequeña cuando v es grande y viceversa, y resulta ser proporcional a la magnitud del vector de lentitud normal análogo al de la óptica geométrica. u es llamada la velocidad de fase y v = p/m es la velocidad de la partı́cula (llamada en mecánica ondulatoria la velocidad de grupo). Cuando la velocidad de las partı́culas es pequeña, las superficies S se mueven rápidamente y cuando las partı́culas se mueven rápidamente, la velocidad de los frentes ~ t) puede considerarse como un campo o fluido, definido en toda es pequeña. S(~r, C, la región del espacio de configuración accesible a la partı́cula. Cuando el potencial no depende de la velocidad, las curvas caracterı́sticas en el espacio de configuración son ortogonales a las superficies S. Al moverse las partı́culas el campo S se propaga con velocidad u(~r) en cada punto. A su vez las partı́culas mismas caracterizan otro campo, ~ con un flujo de velocidad en cada punto dado por ~r˙ . el de las densidades Q(~r, C), Ejemplo 13.3.1 Hallar las velocidades u y v para un oscilador armónico lineal y analizar los campos Q y S. Las velocidades de los frentes S y de las partı́culas son respectivamente: u=± 1 2 ωA 1 ωA = 1/2 2 cos(ωt) x2 1− 2 A 1/2 x2 v = ±Aω 1 − 2 = ωA cos(ωt) A (13.77) (13.78) Vemos que v varı́a entre −Aω y +Aω, en tanto que u varı́a entre −∞ y −ωA/2 y entre ωA/2 e ∞. 582 / Mecánica clásica avanzada y µ ωA 1 ωA 2 t 0 T/4 T/2 3T/4 T Figura 13.4 Velocidades u y v para un oscilador armónico lineal Vemos que en los puntos de retorno x = ±A los frentes S “rebotan” con velocidad muy grande; además la densidad de los frentes S es mayor donde u es baja y es cero donde u es infinita. O sea, los frentes son densos donde la densidad de las partı́culas es pequeña y viceversa (véase figura 13.4). Para este problema, de (13.51) se sigue que Q vale: Q= 1 1 ω = 2 1/2 2πA 2π|v| x 1− 2 A O sea que Q tiene un comportamiento similar a |u|. La expresión para Σ es: 1/2 " # 2 1/2 1 mE x x Σ= A sen−1 + x 1 − 2 2 2 A A Notemos que Σ determina a Q. En efecto: " # 2 1/2 ∂ ∂Σ ∂ 2x 1/2 2πQ = 1 − mω (2mIω) = ∂I ∂x ∂I 2I (13.79) (13.80) (13.81) Cuando x = 0, Σ es cero y Q = 1/(2πA) y cuando x = A, Σ = πA(mE/2)1/2 en tanto que Q es infinita. Es interesante notar que Σ no es una función univaluada de x, pues para x = 0, Σ = 0 si t = 0 y Σ = 2πI si t = T . Igualmente ∂Σ/∂x = ±(2mE − m2ω 2 x2 )1/2 posee dos ramas, una para los tiempos anteriores a la llegada a los puntos de retorno y otra para Corespondencia con la mecánica cuántica de Schrödinger / 583 los tiempos posteriores. En consecuencia, si no se toma valor absoluto, Q es también en sentido estricto una función multivaluada. Finalmente, como: ∂Σ x = sen−1 ∂I A se sigue que: I Q dx = 1 (13.82) (13.83) como debe ser. Ondas materiales. Las partı́culas microscópicas tienen un comportamiento ondulatorio evidenciado por: (i) La densidad en un haz de partı́culas tiene oscilaciones o variaciones espaciales definidas, es decir, las trayectorias no se pueden distribuir arbitrariamente. (ii) La región accesible a un sistema ligado de partı́culas va más allá de los puntos de retorno clásicos, aunque la probabilidad de encontrar las partı́culas fuera de la región clásica decrece exponencialmente. (iii) Hay fenómenos de interferencia y difracción. Para hablar de frentes de acción constante no son necesarias las nociones de “ondas” o “longitud” de onda. Al evaluar la distribución Q se encuentra que no presenta ninguna oscilación sino variaciones suaves con la posición. Esto es consecuente con la concepción de la mecánica clásica como el comportamiento lı́mite de un movimiento ondulatorio cuando la longitud de onda es pequeña. Vimos cómo de la formulación de la mecánica clásica con matrices conmutativas emerge de manera natural la mecánica cuántica de Heisenberg al introducir algunas hipótesis motivadas en la espectroscopı́a atómica. Desafortunadamente no hay una manera suave de obtener la mecánica cuántica de Schrödinger a partir de la ecuación de Hamilton-Jacobi y la función de distribución clásica, pues estos elementos clásicos son ajenos a conceptos tales como “función de onda”, “ecuación de onda”, “principio de superposición”. Es necesario un drástico cambio conceptual para introducir en la mecánica las nociones ondulatorias. La ecuación de Schrödinger. Schrödinger admitió la descripción de sistemas microscópicos mediante una amplitud de ondas análoga a la que describe otros fenómenos ondulatorios: ψ(~r, t) = A(~r)eiϕ(~r,t) (13.84) Quien inició este tipo de teorı́as fue Louis de Broglie, cuando en 1923 estudió la posible conexión entre las propiedades ondulatorias y corpusculares de la materia. Partió de la idea siguiente. Si tratándose de partı́culas se está describiendo el mismo fenóneno mediante los principios de Fermat y de mı́nima acción, en el lı́mite de ondas cortas se cumple la siguiente implicación: Z 2 Z 2 dl = 0 (v = constante) y ∆ p(~r, E) dl = 0 ∆ r , v) 1 1 u(~ (13.85) 1 (E = constante) → p ∝ u 584 / Mecánica clásica avanzada que es el mismo resultado (13.76). Para la velocidad de fase de una partı́cula se cumple: c u(~r, ν) = = λ(~r, ν) ν n(~r, ν) (13.86) siendo n el ı́ndice de refracción, c una constante y ν la frecuencia de las ondas. Entonces de (13.76) o (13.85) se sigue que: p= E E h = = u λ(~r, ν)ν λ(~r, ν) (13.87) siendo h = E/ν una constante. Como en (13.32) y (13.33), puede decirse que la fase de la onda, ϕ, es proporcional a la acción S: ϕ(~r, t) = 2π Σ(~r, E) Et S(~r, t) = − h h̄ h̄ (13.88) Entonces: ψ(~r, t) = A(~r)eiΣ(~r,E)/h̄−iEt/h̄ (13.89) ha de ser la forma de la función de onda en el lı́mite de ondas cortas. Schrödinger asumió que en general ϕ satisface una ecuación de ondas ordinaria donde la velocidad de la onda es la velocidad de fase u, y además exigió que debe ser consistente con los resultados ya conocidos referentes al lı́mite asintótico de ondas cortas caracterizado por la ecuación (13.89). Esto es: ∇2 ψ − 1 ∂2ψ =0 u2 ∂t2 (13.90) Como para el lı́mite de ondas cortas u está dada por (13.76), para ese caso (13.90) toma la forma: 2m(E − V ) ∂ 2 ψ = ∇2 ψ E2 ∂t2 (13.91) La función de onda de un fenómeno estacionario es de la forma: Ψ(~r, t) = ψ(~r)e−iEt/h̄ (13.92) por lo cual ψ debe obedecer la ecuación: − h̄2 2 ∇ ψ(~r) + V (~r)ψ(~r) = Eψ(~r) 2m (13.93) que es la ecuación de Schrödinger independiente del tiempo. El comportamiento ondulatorio aparece sólo al hacer la identificación (13.88), o sea que está ligado directamente al hecho de no ser cero la constante de Planck (ϕ no es infinita ni λ es cero). Esto de alguna manera ha de estar relacionado con el hecho de no poderse medir las variables de acción I con precisión ∆I = 0, del cual surge la mecánica cuántica de Heisenberg. Si en (13.93) reemplazamos a ψ por: ψ(~r) = eiΣ(~r,E)/h̄ A(~r) (13.94) Corespondencia con la mecánica cuántica de Schrödinger / 585 obtenemos una ecuación diferencial para Σ que en el lı́mite h̄ → 0 es precisamente la ecuación de Hamilton-Jacobi. Además Schrödinger postuló que |ψ|2 es la densidad de probabilidad en el espacio de configuración. Para un estado estacionario se debe cumplir: Q(~r) = |ψ(~r)|2 (13.95) Resulta de (13.94) y (13.95) que para el lı́mite asintótico de ondas cortas: Q(~r) = A(~r)2 (13.96) Por tanto el lı́mite clásico de la función de onda puede expresarse en términos de las funciones clásicas Q(~r), (13.69), y Σ: ψ(~r, t) = [Q(~r)]1/2 eiΣ(~r,E)/h̄−iEt/h̄ o, en términos de Σ: 1/2 ∂2Σ ∂2Σ ∂2Σ ψ(r, t) = ǫλσρ eiΣ(~r,E)/h̄−iEt/h̄ ∂x∂Iλ ∂y∂Iσ ∂z∂Iρ (13.97) (13.98) J.H. van Vleck (1928) mostró que: hq|ψi = C det ∂ 2S ∂q∂p 1/2 eiS/h̄ (13.99) obedece a la ecuación de Schrödinger si h̄ → 0. Nótese la similitud entre (13.98) y la ecuación de van Vleck.6 13.4. La función de onda semiclásica según Keller y Maslov Para un sistema acotado los valores de las variables de acción, y por tanto de la energı́a y otras constantes de movimiento, están cuantizados. En la sección 12.1, se señaló que las variables de acción satisfacen las condiciones Iν = αν h̄, donde las αν son enteras. Al imponer ciertas condiciones sobre las frecuencias vimos en el ejemplo 12.3.1 que para un oscilador armónico la acción está cuantizada según I = (k + 1/2)h̄, siendo k un entero. Veremos ahora cómo tales reglas de cuantización se pueden obtener a partir de la función de onda semiclásica. Bohr y Sommerfeld postularon las reglas de cuantización para un sistema separable en la forma Iν = αν h̄. Einstein en 1917 las generalizó para sistemas no separables pero integrables, para los cuales existe un conjunto de variables de acción definidas por los contornos cerrados independientes que haya sobre un toroide invariante, en la forma: I 1 Iν = p~ · d~q = αν h̄ (13.100) 2π γν 6 M.C. Gutzwiller, Chaos in classical and quantum mechanics, Springer, New York, 1990 deduce la fórmula de van Vleck a partir de una aproximación de fase estacionaria al propagador de Feynman. 586 / Mecánica clásica avanzada donde los γν son los diferentes contornos. Brillouin en 1926 esbozó una teorı́a de las funciones de onda semiclásicas que conduce a reglas de cuantización como la del oscilador armónico, I = (k + 1/2)h̄, basada en consideraciones sobre los puntos de retorno del movimiento clásico. Keller en 1958 y Maslov en 1972 elaboraron una teorı́a completa acerca de las funciones de onda semiclásicas y las reglas de cuantización que generaliza los trabajos de Bohr, Sommerfeld, Einstein y Brillouin. En la actualidad muchos problemas especı́ficos en fı́sica atómica y molecular son adecuadamente estudiados mediante estas teorı́as semiclásicas, denominadas genéricamente “la aproximación W.K.B”. Acción de Lagrange con dos puntos de retorno. Consideremos una partı́cula en movimiento unidimensional acotado con dos puntos de retorno. La trayectoria de fases es cerrada y el toroide invariante es una circunferencia. La figura 13.5 muestra una trayectoria tı́pica. La solución a la ecuación de HamiltonJacobi para este problema es: Z Σ(x) = ± [2m(E − V )]1/2 dx (13.101) p p2 x x1 x2 p1 Figura 13.5 Trayectoria de fases cerrada En la trayectoria hay dos puntos en los cuales p se anula y cambia de signo que son x1 y x2 . Tanto p como Σ son funciones bivaluadas de x. Los dos valores de p o Σ para cada valor de x están sobre diferentes “hojas”, análogas a las hojas de Riemann de la teorı́a de las funciones de variable compleja, definidas por la lı́nea de ramificación x1 x2 . Para p las dos hojas son x1 p2 x2 y x1 p1 x2 . En x1 y x2 , p es singular por ser dp/dx infinita. Similarmente, en la representación de momentos p1 p2 definen una lı́nea de ramificación que separa el plano xp en las hojas p1 x1 p2 y p1 x2 p2 . La correspondiente acción reducida es Σ(p), conectada con Σ(x) mediante la fórmula (9.217): Σ(p) = Σ(x) − xp (13.102) Corespondencia con la mecánica cuántica de Schrödinger / 587 Para un valor dado de E, Σ(x) define parte de la trayectoria de fases, formada por los puntos (x, dΣ/dx). Pero Σ puede usarse sólo para la trayectoria sobre una hoja, ya que la ecuación de Hamilton-Jacobi no determina a Σ en x1 y x2 . Para pasar a la otra hoja es necesario continuar la función. En efecto, Σ(p) está bien definida en los puntos x1 y x2 sobre dos hojas, p1 x1 p2 y p1 x2 p2 . Esto permite la extensión analı́tica de Σ(x) de una hoja a la otra usando la ecuación (13.102). La continuación a lo largo de la trayectoria puede lograrse, pues, por transformaciones sucesivas entre las representaciones x y p. Podemos definir las funciones multivaluadas Σ y Σ en términos de funciones univaluadas ası́:   Σ1 (x) en x1 p2 x2 Σ(x) =  Σ2 (x) en x1 p1 x2 (13.103)   Σ1 (p) en p1 x1 p2 Σ(p) =  Σ2 (p) en p1 x2 p2 La variable de acción es un número cuya magnitud es igual al cambio experimentado por Σ al completar un circuito, dividido por 2π (sección 10.3): I= 1 [Σ2 (x2 ) − Σ1 (x2 )] 2π (13.104) Efecto de la multiformidad de Σ sobre la función de onda semiclásica. Podemos concluir de (13.69) que Q no es univaluada por no serlo Σ. Entonces se deduce de (13.97) que la función de onda semiclásica resulta ser multivaluada a no ser que se imponga una condición adicional. Escribamos a ψ en la forma: Σ Et 1 ψ = exp i − − i ln Q (13.105) h̄ h̄ 2 Al hacer un circuito completo sobre la trayectoria de fases la función de onda debe tomar el mismo valor. Esto se consigue solamente haciendo que el cambio del argumento del exponencial en (13.105) al completar un circuito sea un múltiplo entero de 2πi, o sea: i ∆Σ − ∆ ln Q = 2πn h̄ 2 (13.106) donde n es un número entero. Esto da lugar a la siguiente expresión para la cuantización de I = ∆Σ/2π: i I = h̄ n + ∆ ln Q (13.107) 4π Para el caso descrito por (13.101), sobre las dos ramas Q difiere sólo en el signo [véase por ejemplo la expresión (13.81)]. 588 / Mecánica clásica avanzada Las funciones univaluadas Σ1 y Σ2 , definidas en (13.103), permiten encontrar las funciones univaluadas correspondientes Q1 y Q2 . En efecto: m 1/2 1 2πQ1,2 = ±ω (13.108) 2 [E − V (x)]1/2 implica que: ln Q2 (x2 ) − ln Q1 (x2 ) = ln Q2 (x1 ) − ln Q1 (x1 ) = −πi (13.109) El cambio completo en ln Q, partiendo de un punto sobre la rama superior próximo a x2 y regresando al mismo punto luego de pasar por dos discontinuidades es: ∆ ln Q = −2πi (13.110) En consecuencia, (13.109) es: 1 I = h̄ n + 2 (13.111) En conclusión, las condiciones de cuantización correctas se obtienen al definir la función de onda semiclásica en términos de la función Q no tomada como intrı́nsecamente positiva. La función ı́ndice de Maslov. La función “signo” aplicada a la derivada dp/dx es útil para contabilizar el número de singularidades de las funciones Σ(x) y Σ(p) al pasar de una hoja a la otra. Se define como:  dp  +1 si >0    dx dp = SGN (13.112)  dx  dp   −1 si <0 dx para todos los valores de dp/dx 6= 0. Maslov define la función “ı́ndice” para asociar un número entero a todos los puntos colocados sobre la misma hoja, ası́: σ(x) = Número entero sobre cada hoja x1 p2 x2 − x1 p1 x2 σ(p) = Número entero sobre cada hoja p1 x1 p2 − p1 x2 p2 (13.113) σ(p) y σ(x) están conectados en cada punto que no sea de retorno en p o en x por la relación: dp (13.114) σ(p) = σ(x) + SGN dx Si se toma en un punto x0 a Σ(x0 ) = 0, entonces se define el valor inicial de σ(x) por la condición σ(x0 ) = 0. Sea x0 = x2 + ǫ, entonces σ(x) = 0 para toda la hoja x1 p2 x2 . Para un punto entre p2 y x1 , SGN(dp/dx) = +1; entonces por (13.114), σ(p) = +1 en toda la hoja p1 x1 p2 . Ahora tomemos un punto entre x1 y p1 ; entonces Corespondencia con la mecánica cuántica de Schrödinger / 589 SGN(dp/dx) = +1, y por (13.114), σ(x) = 2 en la hoja x1 p1 x2 . Para un punto entre p1 y x2 , SGN(dp/dx) = +1; entonces por (13.114), σ(p) = 3 para toda la hoja p1 x1 p2 . Finalmente, sea el punto de partida x0 , donde SGN(dp/dx) = +1; entonces por (13.114) se cumple que σ(x) = 4. Concluimos que σ(x) es una función multivaluada entera que se incrementa en 4 al completar un circuito. Denotemos por la letra m el cambio en σ(x) al completar un circuito dividido por dos: m= ∆σ 2 (13.115) Para el caso que estamos considerando, m = 2 que coincide con el número de singularidades en Σ al completar un circuito. Ver el comentario que sigue a la ecuación (13.52). Maslov generaliza el resultado (13.110) en la forma: ∆ ln Q = −imπ (13.116) para un sistema con un número cualquiera de puntos de retorno en x y en p. La función ı́ndice permite incluir en la fase de la función de onda semiclásica los efectos provenientes de la no uniformidad de Q, en la forma: ψ(~r) = |Q(~r)|1/2 eiΣ(~r,E)/h̄−iπσ(~r)/4 (13.117) con esto se está diciendo que la fase es fija sobre cada hoja. Las condiciones de cuantización resultan de exigir que ψ sea univaluada. Ası́, para el caso ilustrado en la figura 13.5, ψ1 (x2 ) = ψ2 (x2 ) (13.118) Esto exige que, al completar un circuito: ∆Σ π ∆σ − = 2πn h̄ 4 Por tanto: m I = n+ h̄ 4 (13.119) (13.120) Para el movimiento de un electrón en el átomo de hidrógeno, las coordenadas esféricas r, θ y las parabólicas ξ, η son del tipo considerado en la figura 13.5, siendo entonces m = 2. Esto justifica las fórmulas de cuantización semiclásica dadas en el ejemplo 10.5.2. La coordenada ϕ se comporta de manera diferente por estar asociada a una rotación, o sea que la trayectoria de fases no tiene puntos de retorno ni en ϕ ni en pϕ (la proyección de la trayectoria de fases sobre el plano pϕ − ϕ es una lı́nea recta). En consecuencia ∆σ = 0 para el grado de libertad ϕ. Fórmulas de conexión de W.K.B. Para una dimensión la función de onda de W.K.B., según se sigue de (13.117) y (13.108) es: 1/2 mω eiΣ(~r,E)/h̄−iEt/h̄−iπσ(~r)/4 (13.121) ψ(~r, t) = π|p| 590 / Mecánica clásica avanzada A pesar de ser construida a partir de las cantidades clásicas Q, Σ y σ, esta función es válida para valores de x entre x = −∞ y x = +∞ diferentes a los puntos de retorno. Fuera de los puntos de retorno Σ es imaginaria, lo cual nos permite afirmar que en general: |ψ(r, t)|2 = mω −2ImΣ(~r,E)/h̄ e π|p| (13.122) y la probabilidad resulta exponencialmente amortiguada en las regiones donde ImΣ > 0 y tiende a cero cuando h̄ → 0, en correspondencia con el hecho de ser tales regiones clásicamente prohibidas. La cola exponencial que exhibe ψ corresponde al efecto “túnel” de la mecánica cuántica. Las fórmulas de conexión permiten pasar a través de los puntos de retorno, para obtener una función definida entre x = −∞ y x = +∞ (excluyendo a x = x1 y x = x2 y los alrededores de los mismos donde los efectos cuánticos no permiten la aproximación semiclásica). En la región clásicamente inaccesible p y Σ son imaginarios puros, con signos +i o −i dependiendo de la hoja. Cuando el signo es −i resulta que |ψ|2 no se amortigua sino que crece exponencialmente en la región clásicamente prohibida, lo cual no es aceptable. Por tanto a la región clásicamente prohibida sólo puede pasarse desde la hoja con p > 0. Llamemos 3 a la región −∞ < x < x1 y 4 a la región x2 < x < +∞. Para llegar a la región 4 la partı́cula necesariamente provino de la región 1 (p > 0), o sea que no realizó cambio de hoja; entonces, estando en la misma hoja, σ4 = σ1 = 0. Para llegar a la región 3, la partı́cula necesariamente provino de la región 2 (p < 0), o sea que debió cambiar de hoja a fin de que ImΣ > 0. Como en cada cambio de hoja σ cambia en 2, se sigue que σ2 = 2 y σ3 = 0. En resumen, σ1 = 0, σ2 = 2, σ3 = 0, σ4 = 0. Por tanto: mω 2π|p| 1/2 Z exp i mω ψ2 (x) = 2π|p| 1/2 exp −i mω 2π|p| 1/2 Z exp − mω ψ4 (x) = 2π|p| 1/2 Z exp − ψ1 (x) = ψ3 (x) = x0 [2m(E − V )]1/2 dx h̄ x2 Z x0 x2 x1 x x x2 [2m(E − V )]1/2 dx π −i h̄ 2 [2m(V − E)]1/2 dx h̄ [2m(V − E)]1/2 dx h̄ (13.123) (13.124) (13.125) (13.126) √ Se han introducido los factores 1/ 2 pues al ampliar el rango de x desde −∞ hasta +∞ se cambia la normalización. Cuando la función de onda en un intervalo dado es multiforme, debe tomarse la suma aritmética de las funciones de onda asociadas a las diferentes hojas. En el presente caso, la región x1 < x < x2 tiene dos hojas y la función correcta es ψ1 + ψ2 . Si Corespondencia con la mecánica cuántica de Schrödinger / 591 multiplicamos las cuatro funciones (13.123) a (13.126) por eiπ/4 , las fases relativas no cambian. Entonces:  1/2 Z x mω [2m(E −V )]1/2 dx π    ; x1 < x < x2 cos +   π|p| h̄ 4  x2      1/2 Z x1  mω [2m(V −E)]1/2 dx iπ (13.127) ψ(x) = ; −∞ < x < x1 exp − +  2π|p| h̄ 4  x      1/2 Z x   [2m(V −E)]1/2 dx iπ mω    ; x2 < x < ∞ exp − + 2π|p| h̄ 4 x2 este es el resultado usual de la aproximación W.K.B. 592 / Mecánica clásica avanzada Bibliografı́a Textos generales de mecánica clásica 1. Arnold V. I. Méthodes mathématiques de la mécanique classique. Editions Mir, Moscou, 1976. 2. Corben H. C. y Stehle P. Classical mechanics. 2nd ed. J. Wiley, New York, 1960. 3. Gantmacher F. Lectures in analytical mechanics. Mir publishers, Moscow, 1970. 4. Goldstein H. Mecánica clásica. Aguilar, Madrid, 1963. 5. Goldstein H. Classical mechanics. 2nd ed. Addison Wesley, Reading, 1980. 6. Hauser W. Introducción a los principios de la mecánica. Uthea, México, 1969. 7. Landau L. y Lifshitz E. M. Mecánica. Reverté, Barcelona, 1965. 8. Marion J. Classical dynamics of particles and systems. Academic Press, New York, 1970. 9. Pars, L.A. A treatise on analytical dynamics. John Wiley, New York, 1968. 10. Scheck F. Mechanics: from Newton’s laws to deterministics chaos. Springer, Berlin, 1995. 11. Ter Haar D. Elements of hamiltonian mechanics. North-Holland, Amsterdam, 1965. 12. Whittaker E. T. A treatise on the analytical dynamics of particles and rigid bodies. 4th ed. Cambridge University. Press, Cambridge, 1960. 593 594 / Mecánica clásica avanzada Colecciones de problemas 13. Kotkin G. L. y Serbo V. G. Problemas de mecánica clásica. Editorial Mir, Moscú, 1980. 14. Spiegel M. R. Teorı́a y problemas de mecánica teórica. McGraw-Hill, México, 1976. Textos especializados de mecánica clásica 15. Abraham R. y Marsden J. E. Foundations of mechanics. Benjamin, New York, 1967. 16. Born M. The mechanics of the atom. 2nd printing. Ungar, New York, 1967. 17. Lichtenberg A. J. y Lieberman M. A. Regular and stochastic motion. Springer-Verlag, New York, 1983. 18. Percival I. and Richards D. Introduction to dynamics. Cambridge University Press, Cambridge, 1982. 19. Thirring W. Classical dynamical systems. Springer-Verlag, New York, 1978. 20. Yourgrau W. y Mandelstam S. Variational principles in dynamics and quantum theory. 3d ed. Saunders, Philadelphia, 1968. Textos de matemáticas 21. Abramowitz M. y Stegun I. A. Handbook of mathematical functions. Dover, New York, 1965. 22. Ahlfors L. V. Análisis de variable compleja. Aguilar, Madrid, 1966. 23. Arnold V. I. Equazioni differenziali ordinarie. Edizioni Mir, Mosca, 1979. 24. Arnold V. I. Geometrical methods in the theory of ordinary differential equations. Springer-Verlag, New York, 1983. 25. Elsgoltz L. Ecuaciones diferenciales y cálculo variacional. Editorial Mir, Moscú, Bibliografı́a / 595 1969. 26. Korn G. A. y Korn T. M. Mathematical handbook for scientists and engineers. McGraw-Hill, New York, 1961. 27. Spiegel M. R. Manual de fórmulas y tablas matemáticas. McGraw-Hill, México, 1970. 28. Whittaker E. T. y Watson G. N. A course of modern analysis. 4th ed. Cambridge University Press, Cambridge, 1927. Textos de otras áreas 29. Galindo A. y Pascual P. Mecánica cuántica. Alhambra, Madrid, 1978. 30. Gutzwiller M.C. Chaos in classical and quantum mechanics. Springer, New York, 1990. 31. Landau L. D. y Lifshitz E. Théorie du champ. Editions Mir, Moscou, 1966. 32. Landau L. D. y Lifshitz E. Mécanique cuantique: théorie non relativiste. Editions Mir, Moscou, 1967. 33. Van der Waerden B. L. (ed). Sources of quantum mechanics. Dover, New York, 1968. Monografı́as especializadas 34. Augustin S. D. y Rabitz H. “Action-angle variables in quantum mechanics”. Journal of chemical physics, vol. 71, No 12, p 4956, 1979. 35. Chirikov B. V. “A universal instability of many-dimensional oscillator systems”. Physics reports, vol. 52, No 5, p 263, 1979. 36. Keller J. B. “Corrected Bohr-Sommerfeld quantum conditions for nonseparable systems”. Annals of physics, vol. 4, p 180, 1958. 37. Percival I. C. “Semiclassical theory of bound states”. Advances in chemical physics. vol. 36, p 61, 1977. 596 / Mecánica clásica avanzada 597 Índice alfabético Fermi, de, 543 Moser, de, 429 Poincaré, de, 427 separatriz, 526, 542 Aproximación clásica, 475, 583, 590 WKB, de, 589, 591 Areolar, velocidad, 130 Arnold, V., 422, 529, 538 integral de, 528 teorema de, 522, 531 Astronomı́a, 149 Augustı́n, S.D., 551 Autónomo, hamiltoniano, 525 Autoadjunta, matriz, 551 Abramowitz, 282, 294, 298 Absidales, distancias, 132, 140 Acción(es) adiabáticos, invariantes, 415 discontinuidad en la,, 430, 588 Hamilton, de,, 328 Lagrange, de, 328 perturbaciones adiabáticas , 505 principal, 330 reducida, 330 variables de, 429 Adiabáticas, perturbaciones,, 504 Adiabáticos, invariantes,, 415, 430 Ahlfors, L. V., 241 Álgebra de Lie grupo de rotaciones, del, 244, 395, 461 y corchetes de Poisson, 397 Angulares, variables degeneradas, 488 lentas, 500, 505, 513 oscilador armónico, en el, 438 problema de Kepler, en el, 445, 462 rápidas, 500, 504, 513 y de acción, 429 Ángulo(s) órbita Kepleriana, en una, 457 como coordenadas generalizadas, 222 condiciones sobre los, 226 dispersión, de, 159, 162 Euler, de, 222 rotación, de, 227, 245 Antisimétrica matriz, 249 Aplicación “twist”, 429, 523, 524 estándar, 544 Barrera centrı́fuga, 131, 135 Bernoulli, regla de oro, 19, 35 Bifurcación de las superficies, 538 Bohr, átomo de, 144, 155 Born, M., 153, 470, 473, 479 Boyle, ley de, 81 Brillouin aproximación de, 589, 591 reglas de cuantización, 586 Brújula de Foucault, 314 Cálculo de variaciones, 59 Cambio de la forma funcional, 379 Campo electromagnético, 65 Canónicas, transformaciones, 104, 107, 319, 343, 400 dependientes del tiempo, 105 ejemplos de, 110, 347, 358 grupo de, 355 infinitesimales, 374 libres, 109, 346 598 Índice alfabético / 599 oscilador armónico, del, 104 Caóticos, movimientos regulares, 522 Caratheodory, lema de, 362 Cascarón esférico, 21 Cáusticas, superficies, 444, 576 Cayley-Klein, parámetros de, 236 para el trompo, 301 Centrı́fuga, aceleración, 94 Centrı́fugo, potencial, 131 Centro fuerzas, de, 125 masas, de, 125, 161 Chirikov, B. V., 529, 543, 547 criterio de, 543 Clase integral elı́ptica de primera, 284 transformación canónica libre de primera, 109, 348 Completidad, relación de, 215 Condiciones ligadura, de, 9 ortogonalidad, de, 174, 180, 208 Cónicas, secciones, 140 Conjunto coordenadas generalizadas, de, 13 variables de acción-ángulo, de, 434 Conmutador, 397, 555 Conservación, teoremas de, 68, 380 Constante(s) e integrabilidad de las ecuaciones de movimiento, 421 generadores de transformaciones canónicas como, 381 integración, de, 70 movimiento, de, 70, 421, 437 Planck, de, 123, 414, 584 propiedades de simetrı́a, y, 381 Construcción de Pionsot, 277 Contacto, transformación de, 569 Coordenadas cı́clicas, 76 esféricas, 129, 445 generalizadas, 12 independientes, 46 parabólicas, 443, 462 Corben, H., 201, 273 Corchetes Lagrange, de, 402, 409 Poisson, de, 378, 380, 555 Coriolis, fuerza de, 94, 252 Cosenos directores, 210, 568 Covarianza de las ecuaciones de Hamilton, 103 de las ecuaciones de Lagrange, 42 Cuerda masas discretas, con, 195 oscilaciones de la, 202 uniforme, 202 Cuerpo rı́gido, 205 asimétrico, 287 dinámica del, 253 libre, 277 momento angular del, 256 simétrico con un punto fijo, 295 sistema de coordenadas del, 206 Curvas de fase, 100, 121, 323, 423 D’Alambert, principio de, 35 Degeneración accidental, 504, 515 figura de Lissajous, en una, 443 frecuencias, en las, 181 intrı́nseca, 516 para el problema de Kepler, 492 isoenergética, 530 movimiento bajo fuerzas centrales, en el, 445 oscilador isotrópico, en el, 442 Delaunay, elementos de, 457 Densidad función de, 573, 576, 585 probabilidad, de, 573, 576, 585 Derivada parcial, 41, 94 total respecto al tiempo, 67, 73, 95 Desplazamiento virtual, 16, 18 Determinante jacobiano, 350, 404, 523 matriz de rotación, de la, 216, 220 secular, 171, 186 Diádicos Pauli, de, 232 600 / Mecánica clásica avanzada traza cero, de, 232 Diada, 212 Diagonalización frecuencias propias y modos con el método de, 191 matrices de masa y de constantes de resorte, de las, 191 matriz de rotación, de la, 225 matriz de una perturbación, de la, 497 tensor de inercia, del, 260 Dinámica hamiltoniana, 88 ecuación general de la, 35, 55 lagrangiana, 42 variable, 69, 378 Dipolar radiación, 451, 459 reglas de selección para radiación, 475 Dispersión bajo fuerzas centrales, 156 Ecuación(es) Hamilton-Jacobi, de, 107, 112, 364, 368, 371, 435, 445 canónicas, 88 continuidad, de, 573 dinámica en coordenadas generalizadas, de la, 40 estática en coordenadas generalizadas, de la, 28 estado de un gas real, de, 82 Euler en un sistema de referencia rotante, de, 271 Euler, de, 270, 281, 287 Euler-Lagrange, de, 97 general de la dinámica, 35 general de la estática, 19 Kepler, de, 148, 449 ligadura, de, 9 movimiento, de, 6, 38, 42, 88 Newton, de, 5 onda, de, 204, 584 secular, 171, 186, 262, 496 transformación canónica, de una, 363 valores propios, de, 179 Whitaker, de, 325 Efecto Stark cuadrático, 500 lineal, 498 Einstein, reglas de cuantización, 585 Eje(s) instantáneo de rotación, 279 principales, 261 rotación, de, 244 simetrı́a, de, 79 Elementos de matriz, 223 Elipsoide de inercia, 264, 277 Energı́a cinética, 42, 72, 255 conservación de la, 70, 89 función de Jacobi, 71, 74 potencial, 42, 296 total, 73 Ensamble, 18 Equilibrio estático, 19 estable, 30 Espacio configuración, de, 14 fases, de, 98, 104 momentos, de, 98 no euclidiano, 29, 179 Estática coordenadas generalizadas, con, 29 ecuación general de la, 19 Estabilidad de los puntos fijos, 541 Estado

Mecanica Clasica Avanzada

Documentos relacionados

Productos

Apoyo

Mecanica Clasica Avanzada

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib