Subido por Jorge Bernal Meza

Mecanica Clasica Avanzada

Anuncio
Jorge Mahecha Gómez
Mecánica clásica avanzada
Mahecha Gómez, Jorge
Mecánica clásica avanzada / Jorge Mahecha Gómez. –
Medellı́n : Editorial Universidad de Antioquia, 2006.
xiv, 608 p. : il., diagrs. ; 24 cm.
Incluye bibliografı́a e ı́ndice.
ISBN: 958-655-847-9
1. Mecánica 2. Estática 3. Cinemática 4. Dinámica
I. Tı́t.
531 cd 19 ed.
A1072576
CEP-Banco de la República-Biblioteca Luis-Ángel Arango
Mecánica clásica avanzada
Jorge Mahecha Gómez
Ciencia y Tecnologı́a
Editorial Universidad de Antioquia
Colección Ciencia y Tecnologı́a
c Jorge Mahecha Gómez
c Editorial Universidad de Antioquia
ISBN: 958-655-847-9
Primera edición: enero de 2006
Diseño de cubierta: Erledy Arana Grajales, Imprenta Universidad de Antioquia
Diagramación: Patricia Arredondo
Corrección de textos: Arley Cárdenas
Coordinación editorial: Gonzalo Montoya Velásquez
Impresión y terminación: Imprenta Universidad de Antioquia
Impreso y hecho en Colombia / Printed and made in Colombia
Prohibida la reproducción total o parcial, por cualquier medio o con cualquier
propósito, sin autorización escrita de la Editorial Universidad de Antioquia
Editorial Universidad de Antioquia
Teléfono: (574) 210 50 10. Telefax: (574) 263 82 82
E-mail: [email protected]
Página web: www.editorialudea.com
Apartado 1226. Medellı́n. Colombia
Imprenta Universidad de Antioquia
Teléfono: (574) 210 53 30. Telefax: (574) 210 53 32
E-mail: [email protected]
Índice general
1. Fundamentos de la mecánica newtoniana
1.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Sistema de referencia. Estado de un sistema mecánico. Ligaduras. Ecuaciones de movimiento para un sistema de partı́culas. Variables dinámicas.
Problemas separables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2. Ecuaciones generales de la estática y la dinámica
2.1. Las ligaduras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2. Las coordenadas generalizadas . . . . . . . . . . . . . . . . . . . . . . .
2.3. Los desplazamientos virtuales . . . . . . . . . . . . . . . . . . . . . . .
2.4. La ecuación general de la estática . . . . . . . . . . . . . . . . . . . . . .
2.5. Las ecuaciones de la estática en coordenadas generalizadas . . . . . . . .
2.6. La ecuación general de la dinámica . . . . . . . . . . . . . . . . . . . . .
2.7. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas
holónomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.8. Las ecuaciones de la dinámica en coordenadas generalizadas para sistemas
no holónomos. Uso de coordenadas no independientes . . . . . . . . . .
3. El principio de Hamilton y las ecuaciones de Lagrange
3.1. Forma integral de la ecuación general de la dinámica para un sistema
holónomo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2. El principio de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3. Algunas propiedades de la función lagrangiana . . . . . . . . . . . . . .
3.4. Simetrı́as de la lagrangiana y teoremas de conservación . . . . . . . . .
3.5. El teorema del virial . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4. La formulación hamiltoniana
4.1. Las variables hamiltonianas de estado . . . . . . . . . .
4.2. Simetrı́as y el teorema de conservación . . . . . . . . . .
4.3. La segunda forma del principio de Hamilton . . . . . .
4.4. Las transformaciones puntuales. Las transformaciones en
4.5. Las transformaciones canónicas
o de contacto . . . . . . . . . . . . . . . . . . . . . . . .
v
.
.
.
.
.
.
1
1
3
7
7
12
15
19
28
35
. 40
. 46
55
.
.
.
.
.
55
58
67
68
80
85
. . . . . . . . . . 85
. . . . . . . . . . 94
. . . . . . . . . . 97
el espacio de fases101
. . . . . . . . . . 107
vi
4.6. La función generatriz
de una transformación canónica . . . . . . . . . . . . . . . . . . . . . . . . 108
4.7. La evolución temporal de un sistema
considerada como una transformación
canónica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.8. El teorema de Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
5. Movimiento de dos partı́culas
que interactúan por medio de una fuerza central
5.1. Coordenadas de centro de masa
y coordenadas relativas . . . . . . . . . . . . . . .
5.2. El oscilador armónico tridimensional . . . . . . . .
5.3. El potencial 1/r . . . . . . . . . . . . . . . . . . . .
5.4. El problema de la dispersión bajo fuerzas centrales
125
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
125
136
140
156
6. Pequeñas oscilaciones de sistemas
de varios grados de libertad
167
6.1. Modos normales de oscilación. Caso
no degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.2. Modos normales de oscilación. Caso
degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
6.3. Un campo mecánico unidimensional:
la cuerda uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
7. Cinemática del cuerpo rı́gido
7.1. Definición de cuerpo rı́gido . . . . . . . . . . . . . . . . . . . .
7.2. Sistemas de coordenadas espacial
y del cuerpo rı́gido . . . . . . . . . . . . . . . . . . . . . . . . .
7.3. Los cosenos directores . . . . . . . . . . . . . . . . . . . . . . .
7.4. El teorema de Euler acerca del movimiento de un cuerpo rı́gido
7.5. El rotador rı́gido . . . . . . . . . . . . . . . . . . . . . . . . . .
7.6. Los ángulos de Euler . . . . . . . . . . . . . . . . . . . . . . .
7.7. Descripción de las rotaciones en términos de n̂ y Φ. Parámetros
7.8. Representación del grupo de rotaciones
por medio de matrices 2 × 2. Los parámetros
de Cayley-Klein . . . . . . . . . . . . . . . . . . . . . . . . . .
7.9. Las rotaciones infinitesimales. Cinemática de las rotaciones . .
205
. . . . . . 205
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
de Euler
.
.
.
.
.
.
206
210
217
221
222
226
. . . . . . 230
. . . . . . 241
8. Dinámica del cuerpo rı́gido
253
8.1. El tensor de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
8.2. Diagonalización del tensor de inercia . . . . . . . . . . . . . . . . . . . . . 260
8.3. Las ecuaciones de movimiento de Euler . . . . . . . . . . . . . . . . . . . 268
8.4. El movimiento de un cuerpo rı́gido libre . . . . . . . . . . . . . . . . . . . 277
8.5. El trompo con el punto inferior fijo en un campo gravitacional homogéneo 295
8.6. Movimiento en un sistema de referencia no inercial . . . . . . . . . . . . . 310
vii
9. Las
9.1.
9.2.
9.3.
9.4.
9.5.
9.6.
9.7.
9.8.
9.9.
transformaciones canónicas
La acción en función de las variables de estado . . . . .
La integral invariante de Poincaré-Cartán . . . . . . . .
El principio de mı́nima acción y expresiones equivalentes
El teorema de Li Hua Chung . . . . . . . . . . . . . . .
Las transformaciones canónicas . . . . . . . . . . . . . .
La ecuación de Hamilton-Jacobi . . . . . . . . . . . . . .
Las transformaciones canónicas infinitesimales . . . . . .
Los corchetes de Poisson . . . . . . . . . . . . . . . . . .
Pruebas del carácter canónico de una transformación . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
319
319
323
328
332
343
364
374
378
400
10.La ecuación de Hamilton-Jacobi con variables de acción-ángulo
10.1. Los invariantes adiabáticos . . . . . . . . . . . . . . . . . . . . . .
10.2. Los toroides invariantes . . . . . . . . . . . . . . . . . . . . . . . .
10.3. Las variables acción-ángulo . . . . . . . . . . . . . . . . . . . . . .
10.4. Problema de Kepler (coordenadas esféricas) . . . . . . . . . . . . .
10.5. Problema de Kepler (coordenadas parabólicas) . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
415
415
420
429
445
462
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11.Teorı́a de perturbaciones
11.1. Teorı́a de perturbaciones dependiente del tiempo . . . . . . . . . . . . .
11.2. Teorı́a de perturbaciones independiente del tiempo . . . . . . . . . . . .
11.3. Multiplicidad de conjuntos de variables acción-ángulo en los sistemas degenerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11.4. Teorı́a de perturbaciones de sistemas degenerados . . . . . . . . . . . .
11.5. Perturbaciones adiabáticas . . . . . . . . . . . . . . . . . . . . . . . . . .
11.6. Sistema de osciladores lineales con acoplamiento no lineal . . . . . . . .
11.7. Movimiento cerca de una resonancia aislada . . . . . . . . . . . . . . .
11.8. Movimientos regulares e irregulares . . . . . . . . . . . . . . . . . . . . .
479
. 480
. 482
.
.
.
.
.
.
488
494
504
508
513
522
12.Correspondencia con la mecánica cuántica de Heisenberg
549
12.1. Representación matricial de variables dinámicas . . . . . . . . . . . . . . . 550
12.2. Corchetes de Poisson y conmutadores de matrices clásicas . . . . . . . . . 555
12.3. Problemas mecánicos a la manera de Heisenberg . . . . . . . . . . . . . . 558
12.4. Ecuación de Hamilton-Jacobi y diagonalización de la matriz hamiltoniana 561
12.5. Teorı́a de perturbaciones con matrices clásicas . . . . . . . . . . . . . . . 564
13.Correspondencia con la mecánica cuántica de Schrödinger
13.1. Ideas de Hamilton acerca de las transformaciones canónicas .
13.2. Función de distribución de probabilidades . . . . . . . . . . .
13.3. La mecánica ondulatoria . . . . . . . . . . . . . . . . . . . . .
13.4. La función de onda semiclásica según Keller y Maslov . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
567
567
573
580
585
A Isabel.
A Clara.
A Eduardo y Andrés.
Prefacio
No trataré de exponer razones para la aparición de un nuevo texto de mecánica
clásica. La acogida que reciba mi trabajo en la comunidad universitaria indicará si en
su concepción y realización satisface una necesidad existente en este campo.
Hay bellas canciones tradicionales, pero ello no impide que aparezcan nuevas composiciones. Tampoco se pide a un compositor que diga las necesidades del público que
pretende complacer. Tal vez en toda obra que se realice sin interés de lucro, la principal
motivación esté en el placer experimentado por el autor al superar paulatinamente el
reto que voluntariamente se ha impuesto. Considero que estas reflexiones son válidas
respecto al presente trabajo.
Aunque la redacción del manuscrito y el trabajo mecanográfico se realizaron fuera de
la Universidad, es justo reconocer que el origen y la finalidad del texto, ası́ como su
reprodución, están dentro de ella. He dictado el curso de Mecánica Clásica Avanzada
en varias ocasiones y el presente trabajo tiene como núcleo los manuscritos de las clases
distribuidos a los alumnos. Con sus discusiones muchos estudiantes colaboraron positivamente. Algunos colegas me contribuyeron con sugerencias y discusiones útiles, como
los señores Fernando Medina, Alberto Sánchez, Augusto Montes, Román Castañeda y
Roberto Martı́nez. Debo reconocer que la idea de escribir un libro de mecánica clásica
la recibı́ del profesor Fabio Machado.
He tratado de hacer una presentación de los temas en forma muy clara, lo cual desafortunadamente ha resultado en contra de la concisión. Especialmente en los ejemplos,
no aconsejo una lectura sino un desarrollo de los problemas por parte del lector. Por
tratarse de un texto de estudio y no de una obra divulgativa, no he considerado necesario esforzarme por suprimir algunas fórmulas y frases redundantes. He tratado más
bien de evitar los errores en el contenido. De antemano pido excusas a los lectores por
las deficiencias estilı́sticas de mi trabajo, y especialmente por los errores que puedan
encontrar.
El plan de la obra consiste en desarrolar los temas tradicionales (formulaciones dalambertiana, lagrangiana y hamiltoniana, fuerzas centrales, cuerpo rı́gido, pequeãs oscilaciones,
transformaciones canónicas, el método de Hamilton-Jacobi y la teorı́a clásica de perturbaciones), con la elaboración de ciertos puntos en los que no se profundiza en los textos
usuales, y especialmente en buscar ilustraciones concretas. He tratado también algunos
problemas de la mecánica clásica que son objeto de investigación en la actualidad. El
lector encontrará una presentación más completa que en los textos tradicionales de muchas cuestiones como: el tratamiento de sistemas holónomos, el uso de las coordenadas
generalizadas, las transformaciones canónicas, el oscilador isotrópico, el método variacional, la cuerda uniforme, los parámetros de Euler y los parámetros de Cayley-Klein,
las funciones elı́pticas de Jacobi, las ecuaciones de Euler en sistemas de referencia rotantes, la brújula de Foucault, la formulación de la mecánica según Poincaré, el teorema
de Liouville sobre los sistemas integrables, un tratamiento exhaustivo del problema de
Kepler con variables acción-ángulo, la teorı́a canónica de perturbaciones, el teorema
de K.A.M, los movimientos caóticos en sistemas hamiltonianos, una formulación de la
mecánica clásica con matrices, dos presentaciones de los fundamentos de la mecánica
x
cuántica, y muchos otros temas que yo no soy el llamado a valorar.
El tratamiento de la mecánica basado en la teorı́a matemática de las variedades diferenciales y en el cálculo diferencial e integral de Cartan ha sido excluido por obvias
razones. Esto no implica que le reste valor al uso de las matemáticas contemporáneas.
El matemático A. N. Kolmogorov decı́a que es mucho más importante obtener resultados correctos que rigurosos. Para un fı́sico lo anterior es profundamente válido: no hay
nada menos riguroso desde el punto de vista teórico que un resultado experimental, pero
tampoco nada que sea más cierto ni bello.
La aplicación de la teorı́a de grupos a las vibraciones moleculares, los campos mecánicos, los sistemas con vı́nculos, los fractales y el caos en sistemas disipativos, son algunos
temas importantes de la mecánica clásica contemporánea que no han sido incluidos. Tal
vez si es posible una segunda edición?
Mis obras de consulta son excelentes textos (ver bibliografı́a) como los de Whittaker,
Landau-Lifshitz, Arnold, Gantmacher, Goldstein, Born, Corben-Stehle, Marion, Lanczos, etc., ası́ como numerosas monografı́as y artı́culos especializados. Mi trabajo se
alimenta en gran parte de estas obras aunque me he esforzado por evitar el plagio. Dejo
a los lectores la determinación del grado de originalidad del libro que tienen en sus manos.
Esta es una obra de referencia para profesores y estudiantes de cursos de pregrado y
posgrado en fı́sica, y puede servir como texto guı́a mediante una adecuada selección de
los temas, complementado con ejercicios. Con los capı́tulos I, II, III, IV, V y VI, y un
resumen del VII, puede cubrirse el curso de pregrado. Con un resumen de unas quince
horas del curso de pregrado, los capı́tulos VIII y IX, y una selección de temas de los
capı́tulos X, XI, XII y XIII puede cubrirse el curso de postgrado. La comprensión de
este material facilita la solución de problemas de investigación y escuchar sin grandes
dificultades conferencias en el campo de la dinámica clásica.
JORGE MAHECHA GÓMEZ
Medellı́n, Junio de 1987.
1
Fundamentos de la mecánica newtoniana
1.1.
Conceptos preliminares
Mecánica. Es la ciencia que estudia el comportamiento de la materia a partir
del movimiento de las partı́culas constituyentes. En la mecánica la máxima información
acerca de un sistema de partı́culas consiste en obtener las posiciones y velocidades de
cada una de ellas en cada instante de tiempo, respecto a un sistema de referencia dado.
Para la solución de cualquier problema mecánico es necesario: definir un sistema de referencia, hallar las coordenadas más adecuadas para describir el sistema y plantear las
ecuaciones de movimiento de cuya solución se obtendrán las coordenadas y velocidades
en función del tiempo.
Importancia. El mundo percibido por el hombre directamente a través de sus sentidos se denomina macroscópico. La mecánica clásica brinda la formulación más completa
del comportamiento de la mayorı́a de fenómenos macroscópicos, por ello es el instrumento teórico por excelencia en ramas como: arquitectura e ingenierı́a de construcciones,
ingenierı́a mecánica que está en la base de la moderna industria de la maquinaria, la aeronáutica y la astronáutica, la geofı́sica, etc. Podemos decir que la ciencia de la mecánica
ha sido estimulada por el desarrollo de la gran industria y a la vez le ha contribuido a
ésta de manera importante.
La mecánica clásica no es una ciencia acabada. En primer lugar, hay muchos problemas fundamentales que son estudiados en la actualidad (Arnold, Abraham, Maslov,
etc. son nombres asociados a desarrollos contemporáneos de la mecánica). En segundo
lugar, hay problemas fundamentales de la fı́sica (entendida como la ciencia o conjunto de
ciencias que estudian las propiedades elementales de la materia) que utilizan la mecánica
clásica como teorı́a básica en el grado de validez de la misma (metrologı́a, fı́sica de los
plasmas, estado sólido, astrofı́sica, sistemas atómicos, sistemas nucleares y de partı́culas elementales en estados altamente excitados, etc.). Una revisión de los temas en que
trabaja una inmensa mayorı́a de los fı́sicos contemporáneos nos muestra que sus objetos
de investigación no son las teorı́as fundamentales sino problemas especı́ficos referentes a
las propiedades de sistemas fı́sicos reales (núcleos, sólidos, átomos, gases, lı́quidos, luz,
1
2 / Mecánica clásica avanzada
etc.). Una visión histórica nos muestra que los virajes en el desarrollo de la fı́sica se
han producido a partir de las investigaciones en problemas especı́ficos que se salen del
rango de validez de las teorı́as existentes. O sea que las modernas teorı́as fı́sicas no han
invalidado la mecánica clásica sino que simplemente han restringido su rango de validez.
Por último, en la mecánica clásica está el germen de las teorı́as más completas como
la mecánica cuántica o la relatividad general. Tales teorı́as utilizan los conceptos de la
mecánica clásica y los introducen en sus formalismos cambiándoles el contenido. Las nociones de energı́a, momentum, velocidad, posición, etc., tienen su origen en la mecánica
clásica, pero mantienen una importancia relevante dentro de las nuevas teorı́as. Podemos
concluir que un conocimiento riguroso de la mecánica clásica es indispensable para el
estudio cabal de la mecánica cuántica y demás teorı́as contemporáneas.
Rango de validez. La mecánica clásica no relativı́stica es aplicable cuando las
velocidades involucradas son mucho menores que la velocidad de la luz.1 La aplicabilidad
de la mecánica cuántica a sistemas microscópicos como átomos y moléculas está restringida a los estados en los cuales el producto del momento lineal de las partı́culas por la
dimensión caracterı́stica de la región que ocupan sea del orden Hde la constante de Planck
(o más exactamente, la mecánica clásica es aplicable cuando pdq ≫ h). No es exacto
afirmar que la mecánica clásica es aplicable sólo en el mundo macroscópico. Hay problemas de microfı́sica como: átomos en estados excitados, la dispersión de electrones por
una radiación LASER, el movimiento de electrones en algunas moléculas, el movimiento
de electrones en campos eléctricos y magnéticos, etc., en los cuales se puede utilizar la
mecánica clásica. En fin, sólo un análisis del problema especı́fico que se tenga permite
decidir si la mecánica clásica es aplicable, si se puede usar como una aproximación o si
es completamente inadecuada.
Modelos fundamentales en la mecánica. En las teorı́as mecánicas los cuerpos
reales son representados por medio de nociones abstractas como las de ”punto material”(partı́cula), ”sólido rı́gido”, etc. Un punto material es un cuerpo cuyas dimensiones,
forma y estructura interna carecen de importancia para la resolución de un determinado
problema; esto ocurre cuando las dimensiones que aparecen en el problema son mucho
más grandes que las de los cuerpos involucrados y cuando la estructura interna dé lugar
a efectos secundarios en el contexto en que se trabaja. Un sólido rı́gido es un cuerpo
que se considera formado por gran cantidad de partı́culas, de tal modo que la distancia
entre dos cualesquiera es constante y que la forma y dimensiones del cuerpo no cambian
cuando éste se mueve. Usualmente un sólido rı́gido se considera formado de un número muy grande de partı́culas, que con muy buena aproximación se pueden considerar
formando una distribución continua de masa. En la interacción de dos cuerpos rı́gidos
por contacto se asumen dos modelos: el contacto perfectamente liso y el perfectamente
rugoso. Lo anterior es importante en el análisis de las fuerzas internas llamadas de ligadura. Otro modelo es el de cuerpo deformable, básico en las teorı́as de campos mecánicos.
Partes de la mecánica. Tradicionalmente se divide en estática, cinemática y
1 Estamos
adoptando el punto de vista que consiste en considerar como clásica a toda teorı́a fı́sica
que no dé cuenta de los efectos indeterministas de tipo cuántico y permite una descripción causal en
sentido clásico. En particular, consideramos clásicas las teorı́as especial y general de la relatividad.
Fundamentos de mecánica newtoniana / 3
dinámica. En el curso se tratan dos clases de temas:
1) Generales. Leyes generales de la estática y la dinámica (formalismos lagrangiano,
hamiltoniano, poissoniano y de Hamilton-Jacobi), cinemática y dinámica del movimiento
de rotación.
2) Espaciales. Problema de los dos cuerpos, movimiento del sólido rı́gido y vibraciones mecánicas.
Las teorı́as, incluyendo la mecánica clásica, adquieren su verdadera relevancia cuando se las aplica a situaciones reales. Las teorı́as tratan de las leyes generales pero el desarrollo de la fı́sica se halla impulsado por el estudio de problemas especı́ficos. Por esto,
hacemos especial énfasis en los ejemplos y en la presentación de cálculos detallados.
1.2.
Sistema de referencia. Estado de un sistema mecánico. Ligaduras. Ecuaciones de movimiento para un sistema de partı́culas. Variables dinámicas.
Problemas separables.
Sistema de referencia. Se entiende por tal a un cuerpo rı́gido real o ficticio que
sirve de referencia para estudiar el movimiento del sistema mecánico considerado. Se
supone que tal sistema de referencia está rı́gidamente unido con un sistema de coordenadas; esto permite ubicar la posición de cada partı́cula del sistema mecánico respecto
del sistema de referencia.
Además en el sistema de referencia hay un “cronómetro” que permite determinar
los instantes en que cada partı́cula del sistema ocupa una posición dada del espacio. El
sistema de referencia no tiene ninguna propiedad que pueda afectar al sistema mecánico,
aunque sı́ es de esperarse que la descripción obtenida dependa del estado del movimiento
del sistema de referencia.
Ası́ como para especificar la longitud de un objeto se requiere un patrón de longitud con una unidad de medida asociada, la descripción del movimiento de un sistema
mecánico requiere de un “patrón”mecánico que no es más que el sistema de referencia.
La unidad de medida es análoga al sistema de coordenadas. La elección del sistema de
coordenadas en un sistema de referencia es cuestión de comodidad. Hay un número infinito de sistemas de coordenadas posible. Con una elección de sistema de coordenadas
se busca que las ecuaciones de movimiento sean fácilmente solubles y que la solución
sea lo más simple posible. En cualquier sistema de coordenadas es posible escribir las
ecuaciones de movimiento, pero puede ocurrir que no sean solubles. Encontrar el adecuado sistema de coordenadas que permita resolver las ecuaciones de movimiento es un
importante problema matemático que llega a involucrar la teorı́a de grupos, la geometrı́a
diferencial y otras ramas de las matemáticas.
Estado de un sistema mecánico. Es necesario distinguir los conceptos de estado
y de descripción de estado. La noción de estado es intuitiva (análoga a las nociones de
longitud, duración, etc.), involucra sólo aspectos cualitativos, de carácter objetivo. La
descripción del estado implica nociones geométricas a través del sistema de referencia
4 / Mecánica clásica avanzada
y el sistema de coordenadas que es necesario elegir (hay analogı́a con las nociones de
distancia, intervalo de tiempo, etc., que implican aspectos cuantitativos). Clásicamente para la especificación o descripción completa del estado de un sistema mecánico se
requiere, por ejemplo, conocer la posición y velocidad de cada una de las partı́culas en
un tiempo dado. Es imposible obtener la descripción del estado sin tener un sistema
de referencia y un sistema de coordenadas. En cualquier rama de la fı́sica, y en general
cualquier ciencia cuantitativa, se requiere de la noción de estado. El tipo de descripción
depende del sistema que se trate: el estado de un sistema de partı́culas en mecánica
clásica se describe mediante posiciones y velocidades; en mecánica cuántica se describe mediante la función de onda del sistema. El estado termodinámico de un sistema
macroscópico se describe mediante un conjunto de variables termodinámicas como P ,
V , T , etc. En economı́a, el estado finanaciero de una empresa, por ejemplo, se describe
mediante una serie de parámetros que evolucionan con el tiempo; qué parámetros son
relevantes, depende del modelo, ası́ como de la ecuación de evolución.
El sistema de referencia se denomina a veces espacio fı́sico de representación. El
sistema de coordenadas permite representar cada estado del sistema por un punto. La
representación de los estados ya forma parte de la teorı́a fı́sica, pero siempre existe el
supuesto de que hay una correspondencia que permite asociar a cada estado de movimiento del sistema un punto del espacio de representación, o, para ser más exactos, una
trayectoria en dicho espacio. A un sistema de N partı́culas se le asocian 3N coordenadas
y 3N velocidades. Los estados del sistema se pueden representar por puntos del espacio
de representación, llamado espacio de configuración, y sus vectores tangente y velocidades. También los estados se pueden representar por puntos del espacio de fases 6N
dimensional. Una descripción puede ser por medio de las 6N cantidades:
{ x1 (t), y1 (t), z1 (t); x2 (t), y2 (t), z2 (t); ...xN (t), yN (t), zN (t);
(1.1)
ẋ1 (t), ẏ1 (t), ż1 (t); ẋ2 (t), ẏ2 (t), ż2 (t); ...ẋN (t), ẏN (t), żN (t) }
También es posible una descripción en términos de las coordenadas en dos tiempos
diferentes, t y t′ . No basta, pues, conocer los valores iniciales de las coordenadas ya
que además se requiere información acerca de cómo cambian con el tiempo para poder
predecir cuál será la configuración del sistema en otro tiempo. Para lo anterior desde el
punto de vista meramente matemático, se requerirı́a conocer todas las derivadas temporales de las coordenadas y velocidades que en un tiempo determinan los valores de las
mismas en cualquier otro instante. En conclusión, el espacio de representación para un
sistema de N partı́culas tiene 6N dimensiones. Los distintos formalismos de la mecánica
se caracterizan, entre otras cosas, por el tipo de espacio de representación que emplean.
La formulación newtoniana utiliza las posiciones y velocidades de las partı́culas. La formulación lagrangiana, las coordenadas y velocidades generalizadas. Las formulaciones
de Hamilton y Poisson, las coordenadas y momentos generalizados. La formulación de
Hamilton-Jacobi utiliza constantes de movimiento. La mecánica cuántica utiliza otro
tipo de descrición del estado: los vectores de estado del espacio de Hilbert del sistema.
Ligaduras. Si con sólo cambiar las fuerzas y las condiciones iniciales las partı́culas del sistema pueden ocupar cualquier posición en el espacio o cualquier velocidad,
Fundamentos de mecánica newtoniana / 5
se dice que el sistema es libre. Si lo anterior no es posible, es porque hay restricciones, llamadas ligaduras mecánicas. Las ligaduras disminuyen el número de cantidades
independientes necesarias para especificar completamente el estado del sistema. Si hay
k condiciones de ligadura independientes, el número de cantidades independientes necesarias para especificar la configuración del sistema (llamado el número de grados de
libertad) será 3N − k = 1. En lo que sigue supondremos conocidos los conceptos referentes a: trayectoria, primera ley de Newton, sistemas de referencia inerciales, segunda
y tercera ley de Newton, trabajo y energı́a, y teoremas de conservación del momento
lineal, la energı́a y el momento angular.
Ecuaciones de movimiento para un sistema de partı́culas. Supondremos
que las fuerzas que actúan sobre una partı́cula son función de las coordenadas y velocidades de todas las partı́culas del sistema, y que se pueden descomponer a una parte
debida a efectos exteriores al sistema y a otra debida a las demás partı́culas del sistema.
La fuerza neta sobre la partı́cula i (i = 1, 2, ...N ) será:
F~i (~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t) =
F~ei ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t
+
N
X
′~
Fij
j=1
(1.2)
~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t
Se supone que las partı́culas del sistema sólo interactúan entre pares; la prima
en la sumatoria indica que excluye j = i. En el caso más general F~ei y F~ij dependen
de las coordenadas y de las velocidades de todo el sistema. Usualmente se cumple lo
siguiente: (a) Las fuerzas entre las partı́culas i y j dependen sólo de las coordenadas y
de las velocidades de éstas; (b) La fuerza externa sobre la partı́cula i sólo depende de
sus coordenadas y velocidades:
F~i ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t =
F~ei (~ri , ~r˙ i ; t) +
N
X
′~
Fij (~ri ,
~rj , ~r˙ i , ~r˙ j )
(1.3)
j=1
Las ecuaciones de movimiento serán:
N
X
j=1
′~
Fij
~ri , ~rj , ~r˙ i , ~r˙ j + F~ei ~ri , ~r˙ i ; t = mi~¨r i
i = 1, 2, ...N
(1.4)
Este último es un sistema de N ecuaciones diferenciales, en general no lineales, de
segundo orden, acopladas, con N incógnitas (~r1 , ~r2 , ...~rN ), o si se quiere, de 3N ecuaciones diferenciales escalares con 3N incógnitas. La solución de estas ecuaciones contiene
6N constantes de integración, que pueden tomarse como las 3N coordenadas y las 3N
velocidades en el tiempo t = t0 , y proporciona directamente la especificación completa
del estado del sistema.
6 / Mecánica clásica avanzada
Variables dinámicas. Cualquier función del estado del sistema y del tiempo se
denomina una variable dinámica. Las coordenadas o las velocidades mismas son variables dinámicas. También lo son el momento angular, la energı́a, el momento lineal, las
coordenadas del centro de masa, etc. Un conjunto de 6N funciones (independientes entre
sı́) de las coordenadas y las velocidades constituye un conjunto completo de variables
dinámicas y sirve para especificar completamente el estado del sistema. Una clase especial de variables dinámicas es constituida por las constantes de movimiento. Un conjunto
máximo de constantes de movimiento, 6N , permite describir completamente el estado
del sistema. En mecánica cuántica pueden haber a lo sumo 3N constantes de movimiento
independientes, exactamente definidas; entonces las otras 3N constantes serán completamente indefinidas. La mecánica newtoniana en su forma original es adecuada para el
estudio de sistemas libres. Para sistemas con ligaduras es más conveniente el formalismo lagrangiano. Desde el punto de vista teórico es deseable un formalismo en el cual
las ecuaciones del movimiento sean covariantes y en el cual la mecánica se deduzca de
principios más generales (variacionales); en este sentido también es más útil la mecánica
lagrangiana.
Problemas separables. Son aquellos en los cuales el sistema de ecuaciones de
movimiento acopladas, es posible mediante algún cambio de variables reducirlo a un
sistema de 3N ecuaciones diferenciales desacopladas, o sea, 3N ecuaciones donde en
cada ecuación hay sólo una incógnita. En principio algunos problemas mecánicos son
separables, pero en la mayorı́a de los casos esto es un problema muy difı́cil (o imposible)
de resolver matemáticamente.
Algunos problemas que han sido resueltos matemáticamente son: el de N partı́culas
en un campo externo pero no interactuantes entre sı́; N partı́culas en un campo externo
interactuando entre sı́ con fuerzas restauradoras lineales (cadena de osciladores acoplados, molécula lineal poliatómica, etc.); dos partı́culas interactuando entre sı́ a través de
un potencial central (problema de dos cuerpos, por ejemplo); sólido rı́gido con un punto
fijo en un campo gravitacional homogéneo. Pero la mayor parte de los problemas mecánicos no se han podido resolver analı́ticamente, por ejemplo, el problema de tres partı́culas
interactuando entre sı́ a traves de un potencial central de tipo gravitacional (problema
de los tres cuerpos), o el problema de una partı́cula cargada en presencia del campo
electrostático de una carga fija y un campo magnético homogéneo. Los problemas solubles clásicamente lo son también cuánticamente; en cuanto a la búsqueda de soluciones
analı́ticas exactas, la mecánica cuántica no aporta mucho en relación con la mecánica
clásica, sin embargo, la mecánica cuántica ha alcanzado una mayor flexibilidad en la
búsqueda de soluciones aproximadas al problema de muchas partı́culas interactuantes
entre sı́.
2
Ecuaciones generales de la estática y la
dinámica
2.1.
Las ligaduras
Esta noción aparece en fı́sica macroscópica con frecuencia y raras veces en fı́sica
microscópica. Es de interés en las aplicaciones técnicas, como el diseño de maquinaria.
Por ejemplo, en la definición de sólido rı́gido aparece el concepto de ligadura. Este sistema
se define por la condición que la distancia entre cualquier par de partı́culas permanece
fija. Para N = 2, el cuerpo rı́gido consiste de dos partı́culas a una distancia fija entre sı́;
la condición de ligadura es:
(x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 = constante
(2.1)
El sistema posee seis coordenadas, pero la ligadura permite expresar una de ellas
en términos de las otras, quedando sólo 6 − 1 = 5 coordenadas independientes. Por tales
coordenadas pueden tomarse las tres del centro de masa y dos ángulos que especifican
la orientación respecto al centro de masa.
Para N = 3 hay nueve coordenadas y tres condiciones de ligadura que pueden
expresarse en forma vectorial como:
|r~1 − r~2 | = a
|r~2 − r~3 | = b
(2.2)
|r~3 − r~1 | = c
Hay sólo 9 − 3 = 6 coordenadas independientes que pueden tomarse ası́: tres para
especificar la posición del centro de masa del sistema total y tres ángulos que especifican
la orientación del plano de las partı́culas con el centro de masa fijo.
Para un sólido rı́gido en general se requieren 3N coordenadas pero habrá cierto número
de condiciones de ligadura independientes. El número total de coordenadas independientes requeridas para especificar la posición de un sólido rı́gido son seis, que pueden
7
8 / Mecánica clásica avanzada
tomarse ası́: las tres coordenadas del centro de masa y tres ángulos que especifican la
orientación del cuerpo con el centro de masa fijo.
Se dice que un sólido rı́gido de N partı́culas tiene seis grados de libertad y 3N − 6
condiciones de ligadura. Otros tipos de ligaduras son las siguientes:
(a) Hay alguna condición que obliga a las partı́culas a moverse sobre una superficie o
en una lı́nea. En una superficie cada partı́cula posee sólo dos coordenadas independientes,
o sea que el sistema tendrá N condiciones de ligadura y 2N grados de libertad. Para un
sistema de partı́culas sobre un plano las condiciones de ligadura son las siguientes, si se
toma en el plano x − y:
zi = 0 ;
i = 1, 2, ... N
(2.3)
Para una esfera de radio a y tomando el centro de la esfera como origen de coordenadas las ligaduras son:
x2i + yi2 + zi2 − a2 = 0 ;
i = 1, 2, ... N
(2.4)
(b) Si hay cuerpos rı́gidos en contacto que ruedan sin deslizarse sobre un plano.
Sea un cilindro de radio a que rueda sin deslizar sobre el plano z = 0. El cilindro requiere
de seis coordenadas para especificar su posición, pero hay dos condiciones de ligadura.
zCM = a
(2.5)
2
ẋ2CM + ẏCM
= a2 φ̇2
~ CM y R
~˙ CM son la posición y velocidad del centro de masa y φ̇ es la velocidad
donde R
angular de rotación alrededor del eje del cilindro. Si se escoge el sistema de coordenadas
de modo que el eje del cilindro sea paralelo al eje x, la ecuación (2.5) puede integrarse
para dar:
yCM = aφ
(2.6)
La ecuación (2.5) puede también integrarse directamente para obtener una relación
entre el ángulo de giro del cilindro y el desplazamiento del centro de masa. En (2.6) se
ha escogido a φ de modo que yCM = 0 cuando φ = 0.
Las ligaduras de “rodar” relacionan las velocidades entre sı́ y con las coordenadas,
y en general son no holónomas, o sea no integrables. Son los casos de un disco o una
esfera rodando sobre un plano.
Para un disco rodando sobre un plano se requieren dos coordenadas para especificar
la posición del centro de masa, una para especificar el giro alrededor del eje y dos para
especificar la posición del plano del disco. Hay dos ligaduras de “rodar” que relacionan
las componentes de la velocidad del centro de masa con la velocidad angular de rotación
al rededor del eje (véase la figura 2.1).
Una de las coordenadas necesarias para especificar el plano del disco puede tomarse
como el ángulo que hace el eje del disco con la dirección x. La otra coordenada la
especificamos exigiendo que el plano del disco sea siempre perpendicular al plano x − y.
Una condición de ligadura es zCM = a. Las otras dos coordenadas del centro de masa
Ecuaciones generales de la estática y la dinámica / 9
z
y
a
ϕ
v
α
x
Figura 2.1 Disco rodando sobre un plano
son las mismas del punto de contacto del disco con el plano. Las condiciones de ligadura
de rodar son: que la magnitud de la velocidad del centro de masa sea proporcional a φ̇,
v = aφ̇
(2.7)
y que la dirección de la velocidad del centro de masa siempre esté en el plano de rotación
del disco,
ẋ = v senα
ẏ = −v cos α
(2.8)
De estas tres condiciones de ligadura sólo hay dos independientes:
dx − a senα dφ
=0
dy + a cos α dφ
=0
(2.9)
Las ecuaciones (2.9) no se pueden integrar para obtener relaciones que involucren
sólo cantidades finitas. Para poder hacer esto serı́a necesario hallar ciertas funciones
f (x, α; φ) y g(y, α; φ) tales que al multiplicar por ellas las ecuaciones (2.9) se obtengan
diferenciales exactos. Lo anterior no es posible, o sea que las relaciones (2.9) no pueden
usarse para expresar una coordenada en términos de las demás; esto implica que las
condiciones de ligadura deben considerarse simultáneamente con la solución del problema
mecánico, que contendrá sólo tres coordenadas independientes.
Los anteriores ejemplos nos muestran que un sistema de N partı́culas y k condiciones de ligadura tendrá 3N − k grados de libertad. Un cuerpo rı́gido tendrá 6 − k grados
10 / Mecánica clásica avanzada
de libertad. Las condiciones de ligadura para un sistema de partı́culas pueden siempre
expresarse en la forma:
fα (~r1 , ~r2 , ... ~rN ; ~r˙ 1 , ~r˙ 2 , ... ~r˙ N ; t) = 0;
α = 1, 2, ... k
(2.10)
Ligaduras holonómicas. También se llaman integrables, finitas o geométricas. Su
nombre se deriva de las raı́ces griegas nomos (ley) y holo (entero, todo). Estas ligaduras
sólo restringen las posiciones posibles del sistema, o sea que se pueden expresar por
medio de igualdades que no involucran las velocidades. Para un sistema de N partı́culas
son de la forma:
fα (~r1 , ~r2 , ... ~rN ; t) = 0
α = 1, 2, ... h
(2.11)
Para un cuerpo rı́gido son:
~ θ, φ, ψ; t) = 0
fα (R,
α = 1, 2, ... h
(2.12)
~ denota la posición del centro de masa, φ, θ, ψ son tres ángulos que especifican
donde R
la orientación del cuerpo con el centro de masa fijo y h es el número de condiciones de
ligadura holónomas. Un sistema se dice que es holónomo si no tiene ligaduras diferenciales no integrables.
Ligaduras no holonómicas. También se llaman no integrables, diferenciales o
cinemáticas. Son aquellas que no pueden integrarse. Para un cuerpo rı́gido son de la
forma:
~ R,
~˙ θ, φ, ψ, θ̇, φ̇, ψ̇; t) = 0 ;
fα (R,
α = 1, 2, ... n
(2.13)
donde n es el número de ligaduras no holónomas. En la mayorı́a de los casos (por ejemplo
el de la figura 2.1), se pueden expresar en la forma:
~lα · R
~˙ + mα θ̇ + nα φ̇ + σα ψ̇ + Pα = 0 ;
α = 1, 2, ... n
(2.14)
~ θ, φ, ψ, t. La generalización de (2.12),
donde ~lα , mα , nα , σα , Pα , son funciones de R,
(2.13) y (2.14) para sistemas de cuerpos rı́gidos es inmediata. Para un sistema de N
partı́culas usualmente son de la forma:
N
X
i=1
~lα · r~˙i + Dα = 0 ;
i
α = 1, 2, ... n
(2.15)
donde ~lαi y Dα son funciones de ~r1 , ~r2 , ... ~rN , t.
Ligaduras reonómicas. Del griego reo (flujo). Son las ligaduras, holonómicas o
no holonómicas, que dependen del tiempo. Serı́a el caso de dos partı́culas unidas entre
sı́ por una varilla cuya longitud varı́a con el tiempo de manera conocida:
|~r1 − ~r2 | = l(t)
(2.16)
Ligaduras escleronómicas. Del griego esclero (duro). Son las ligaduras rı́gidas
o que no cambian con el tiempo. Es el caso de dos partı́culas unidas entre sı́ por una
Ecuaciones generales de la estática y la dinámica / 11
varilla rı́gida. La noción de ligadura involucra dos aspectos. Por una parte, indica que el
número de variables independientes necesarias para especificar el estado del sistema es
menor. En segundo lugar aparecen las llamadas fuerzas de ligadura, que no se pueden
conocer a priori porque dependen del problema especı́fico, es decir de las fuerzas aplicadas y de las condiciones iniciales. Vemos que las ligaduras introducen nuevas incógnitas
en el problema.
Las ligaduras consideradas como fuerzas. La noción de ligadura es puramente
macroscópica. Viendo las cosas en detalle en los ejemplos, notamos que las ligaduras son
el resultado de interacciones. Ası́, en el caso de la partı́cula que se mueve sobre la esfera,
deben existir fuerzas que impiden que la partı́cula salga de la superficie, bien sea hacia
afuera o hacia adentro (por esto se dice que esta ligadura es bilateral. En el caso en que
la partı́cula pudiera ocupar sólo cualquier posición dentro de la esfera se dice que la
ligadura es unilateral). En el caso del disco que rueda sin deslizar, debe haber algún tipo
de interacción entre la superficie del disco y la del plano en la zona de contacto. En todos
estos casos sucede que es imposible conocer las fuerzas a priori, independientemente de
las fuerzas aplicadas y de las condiciones iniciales.
Por ejemplo, en el caso de las dos partı́culas unidas por una varilla, no sabemos
cuál es la fuerza que ejerce la varilla sobre ellas. Obviamos esta dificultad diciendo
simplemente que hay una “ligadura”:
|~r1 − ~r2 | = l
(2.17)
Pero podemos, si queremos, modelar dicha fuerza, digamos que considerándola
como un caso lı́mite de una interacción del tipo restauradora lineal. Ası́, las fuerzas de
la varilla sobre las partı́culas serı́an de la forma:
F~1′
= −k ′ (r − l)û
F~2′
= k ′ (r − l)û
(2.18)
donde k ′ serı́a la constante de resorte, l la separación de las partı́culas en la posición
de equilibrio y û un vector unitario en la dirección del vector ~r2 − ~r1 = ~r. En el caso
de dos partı́culas interactuando a través de una fuerza central es posible separar el
movimiento en dos partes: el movimiento del centro de masa, y el movimiento de una
partı́cula de masa reducida µ respecto al centro de masa bajo una interacción idéntica
a la interacción entre las dos partı́culas originales. Entonces, el movimiento relativo
descrito como el movimiento de la partı́cula ficticia de masa µ obedece la ecuación:
s
r
2E
k′
r−l =
sen
(t − t0 )
(2.19)
k′
µ
donde E es la energı́a del movimiento, que consideraremos tiene un valor finito dado.
Cuando k ′ → ∞, la frecuencia de las oscilaciones aumenta, en tanto que r − l tiende
a cero, obteniéndose la relación cinemática r = l. Por otra parte, como la energı́a E
depende de otras condiciones –fuerzas externas y condiciones de ligadura–, es realmente
indeterminada a priori. Sólo un modelo microscópico nos permitirı́a estimar el valor de
12 / Mecánica clásica avanzada
k ′ . Por lo tanto las fuerzas de ligadura F~ ′ 1 y F~ ′ 2 son indeterminadas; su valor depende
de la solución al problema mecánico completo. Es claro que la indeterminación en las
fuerzas de ligadura no proviene de la omisión de los detalles microscópicos, pues aun a
escala microscópica las interacciones dependerı́an del movimiento completo del sistema.
2.2.
Las coordenadas generalizadas
Grados de libertad. El número de grados de libertad de un sistema mecánico
es igual al número de coordenadas independientes necesarias para especificar completamente cada configuración del sistema. Entendemos por configuración la posición que
ocupa cada una de las partı́culas del sistema. Si hay h condiciones de ligadura holónomas
y n condiciones de ligadura no holónomas (o sea si hay k = n + h condiciones de ligadura
independientes), el número l de grados de libertad será:
l = 3N − h − n
(2.20)
Clasificación de los grados de libertad. Sea un sistema de partı́culas sin ligaduras, k = 0. Sus 3N coordenadas se pueden clasificar en traslacionales y rotacionales
(cuando describen el movimiento del centro de masa y las rotaciones del sistema respecto
al centro de masa), y en vibracionales (cuando describen los movimientos relativos de
las partı́culas que no trasladan el centro de masa y no rotan el sistema). Por ejemplo,
sea un sistema de dos partı́culas –molécula diatómica–, las seis coordenadas se pueden
clasificar en tres grados de libertad traslacionales, dos grados de libertad rotacionales y
un grado de libertad vibracional; en el caso de tratarse de una molécula de H2 , además
hay grados de libertad internos a las dos partı́culas: seis grados de libertad correspondientes a los dos electrones, un grado de libertad interno, el espı́n para cada núcleo y
para cada electrón. Las modernas teorı́as de las partı́culas elementales consideran que a
su vez el protón y el electrón poseen otros grados de libertad internos.
Gran parte de los modelos que se construyen en la fı́sica consisten en hallar cuáles
son los grados de libertad que tienen más relevancia para una situación dada. Ası́ por
ejemplo, en la mecánica se omiten los grados de libertad microscópicos.
Las coordenadas generalizadas. Sea un sistema de N partı́culas con h condiciones de ligadura holónomas, dadas por las ecuaciones (2.11). Estas ecuaciones permiten
expresar a h coordenadas en términos de 3N − h coordenadas, que sólo serán independientes en el caso en que no haya ligaduras no holónomas. Es conveniente realizar una
transformación de coordenadas de modo que se eliminen del problema las h coordenadas
superfluas; para ello basta exigir que la transformación anule idénticamente las funciones
fα en las ecuaciones (2.11) y (2.12). Es decir, si:
xi =
xi (q1 , q2 , ... q3N −h , t)
yi =
yi (q1 , q2 , ... q3N −h , t)
zi =
zi (q1 , q2 , ... q3N −h , t) ;
(2.21)
i = 1, 2, ... N
Ecuaciones generales de la estática y la dinámica / 13
donde q1 , q2 , ... q3N −h son las coordenadas generalizadas y la transformación dependerá del tiempo si las ligaduras holónomas son además reónomas. La transformación
además debe cumplir que se anulen idénticamente las funciones:
f~α (q1 , q2 , ... q3N −h , t) ≡
fα [~r1 (q1 , q2 , ... q3N −h , t), ~r2 (q1 , q2 , ... q3N −h , t), ... t]
(2.22)
para α = 1, 2, ... h
Usaremos la siguiente notación: los subı́ndices latinos se refieren a cantidades que
se pueden asociar a las partı́culas. Para nombrar las coordenadas generalizadas reservamos los subı́ndices griegos: qν (ν = 1, 2, ... 3N − h). Para nombrar el conjunto de todas
las coordenadas generalizadas usamos la notación (q). Más adelante usaremos también
la notación ~q.
Si k = h, o sea si n = 0, entonces q será un conjunto de coordenadas generalizadas
independientes. Por ejemplo, para una partı́cula que se puede mover sólo sobre una
esfera de radio a la condición de ligadura está dada por la ecuación (2.4); o sea que, por
ejemplo, si el radio de la esfera cambia con el tiempo de manera conocida,
f (x, y, z, t) ≡ x2 + y 2 + z 2 − a2 (t)
(2.23)
el sistema tiene una coordenada superflua que se puede eliminar introduciendo unas
coordenadas en la superficie de la esfera. Si tomamos como coordenadas generalizadas
los ángulos θ y φ definidos por:
x(θ, φ, t) = a(t) senθ cos φ
y(θ, φ, t) = a(t) senθ senφ
(2.24)
z(θ, φ, t) = a(t) cos θ
Vemos que f (θ, φ, t) se anula idénticamente, o sea que la condición de ligadura
(2.4), se reduce a 0 = 0. Veamos otro ejemplo, sea el sistema formado por dos bolas
pegadas entre sı́ por varillas rı́gidas sin masa y una de ellas unida por una varilla rı́gida
sin masa a un punto fijo. Este sistema se denomina péndulo doble (véase figura 2.2).
El sistema posee seis coordenadas que no son independientes. Supongamos que sólo hay
movimientos permitidos en un plano. Entonces las condiciones de ligadura serán,
z1 =
0
z2 =
0
x22 + y22 − l22 =
0
(x1 − x2 )2 + (y1 − y2 )2 + l12 =
0
(2.25)
donde tomamos el plano x − y como el plano de movimiento, y el origen de coordenadas
en el extremo fijo de la varilla l2 . El sistema tendrá dos grados de libertad que son las
14 / Mecánica clásica avanzada
0
θ2
l2
m2
θ1
l1
m1
Figura 2.2 Péndulo doble
coordenadas θ1 , θ2 definidas por:
x1 − x2 =
l1 cos θ1 ,
x2 =
l2 cos θ2 ,
z1 ≡ 0
y1 − y2 =
l1 sen θ1 ,
y2 =
l2 sen θ2 ,
z2 ≡ 0
(2.26)
son unas coordenadas generalizadas, ya que reducen las ecuaciones (2.25) a la identidad
0 = 0.
Las coordenadas generalizadas se refieren al sistema como un todo y no a las
partı́culas individuales. Además, no necesitan tener dimensiones de longitud. En general, cualquier conjunto de 3N − h variables dinámicas independientes del sistema puede
servir de sistema de coordenadas generalizadas.
Velocidades generalizadas. Son las derivadas totales de las coordenadas generalizadas respecto al tiempo:
(q̇) = (q˙1 , q˙2 , ... q̇3N −h )
(2.27)
En coordenadas cartesianas se cumple que el momento está relacionado con la velocidad mediante la relación ~p = m~v. En coordenadas generalizadas no existe una relación
de este tipo en general.
Espacio de configuración. Es un espacio definido por las l coordenadas independientes del sistema, donde l = 3N −k. Al describir un sistema con ligaduras por medio del
espacio 3N dimensional, estamos usando un espacio euclidiano (en ausencia de fuerzas,
una partı́cula se mueve en lı́nea recta); entonces las trayectorias no rectilı́neas inmediatamente se atribuyen a la presencia de fuerzas de ligadura. Al describir un sistema con
Ecuaciones generales de la estática y la dinámica / 15
ligaduras por medio del espacio de configuración l-dimensional, usamos un espacio no
euclidiano; entonces las trayectorias no rectilı́neas se atribuyen no a fuerzas, sino a la
curvatura del espacio, como en relatividad general.
2.3.
Los desplazamientos virtuales
Sea un sistema sujeto a k condiciones de ligadura, h holónomas, dadas por las
ecuaciones (2.11) y n no holónomas dadas por las ecuaciones (2.15), o por (2.12) y
(2.14) respectivamente si se trata de un cuerpo rı́gido, o sus generalizaciones para un
sistema de cuerpos rı́gidos.
Para una configuración dada del sistema en un tiempo t, sólo hay ciertas velocidades compatibles con las n condiciones de ligadura no holónomas. O sea que hay n
componentes de las velocidades que se pueden expresar en función de las 3N − n componentes restantes.
Velocidades posibles. Son las velocidades que para una configuración dada (~r1 ,
~r2 , ... ~rN ) del sistema en el tiempo t son compatibles con las k condiciones de ligadura.
Sólo hay entre las velocidades posibles un conjunto de velocidades (~r˙ 1 , ~r˙ 2 , ... ~r˙ N ) que
efectivamente toma el sistema. Las velocidades reales se hallan solamente al resolver el
problema mecánico completo.
Desplazamientos posibles. Son los ~r˙ i = ~r˙ i dt, i = 1, 2, ... N , cuando las ~r˙ i son
las velocidades posibles. Cuando las ~r˙ i son las velocidades reales para una configuración
dada, d~ri = ~r˙ i dt son los desplazamientos reales.
Tanto los desplazamientos reales como los posibles deben ser compatibles con las
h condiciones de ligadura holónomas; es decir, estas deben satisfacerse tanto en la configuración (~r1 , ~r2 , ... ~rN ) como en la configuración (~r1 + d~r1 , ~r2 + d~r2 , ... ~rN + d~rN ),
siendo los d~ri desplazamientos posibles.
Se sigue entonces que los desplazamientos posibles deben satisfacer simultáneamente las k = h + n condiciones,
N
X
i=1
~lα · d~ri + Dα dt = 0
i
N
X
∂fα
i=1
∂~ri
· d~ri +
α = 1, 2, ... n
∂fα
dt = 0 α = 1, 2, ... h
∂t
(2.28)
(2.29)
que se siguen de (2.11) y (2.15). ∂/∂~ri denota el gradiente respecto a las coordenadas
de la partı́cula i.
Desplazamientos virtuales. Son los desplazamientos posibles cuando se dejan
fijas las ligaduras durante el desplazamiento. Por ejemplo, si en la situación representada
por la figura 2.1 se permite que el plano x−y se mueva de manera conocida, las ligaduras
serán reónomas; supongamos que se trate sólo de un movimiento del plano en la dirección
z. En un desplazamiento virtual del disco se deja el plano x − y fijo mientras se efectúa
16 / Mecánica clásica avanzada
el desplazamiento. En un desplazamiento posible, el centro de masa del disco tiene
movimiento en la dirección z y en el plano x − y; en un desplazamiento virtual el centro
de masa sólo se mueve en el plano x − y.
Para hallar la condición para que los desplazamientos virtuales sean compatibles
con las ligaduras, consideremos dos conjuntos de desplazamientos posibles durante un
tiempo dt, d~ri = ~vi dt y d′~ri = ~vi′ dt, donde ~vi y ~vi′ son dos conjuntos de velocidades
posibles. Los d~ri satisfacen las ecuaciones (2.28) y (2.29) y d′~ri satisface,
N
X
i=1
~lα · d′~ri + Dα dt = 0 ;
i
N
X
∂fα
i=1
∂~ri
· d′~ri +
∂fα
dt = 0 ;
∂t
α = 1, 2, ... n
α = 1, 2, ... h
(2.30)
(2.31)
En las ecuaciones (2.30) y (2.31), ~lαi y Dα están evaluadas en ~r1 , ~r2 , ... ~rN , t y
análogamente ∂fα /∂~ri y ∂fα /∂t.
Definimos los desplazamientos virtuales δ~ri como:
δ~ri = d′~ri − d~ri
(2.32)
y las condiciones de su compatibilidad con las ligaduras son:
N
X
i=1
~lα · δ~ri = 0 ;
i
N
X
∂fα
i=1
∂~ri
· δ~ri = 0 ;
α = 1, 2, ... n
α = 1, 2, ... h
(2.33)
(2.34)
Ejemplo 2.3.1 Sea una partı́cula sometida a una fuerza externa F~ (x, y, t) y constreñida
a moverse solamente sobre una superficie descrita por la ecuación
Φ(x, y, z) = 0
(2.35)
Como la ligadura es holónoma, vemos que cualquier velocidad es posible si es
tangente a la superficie. La única condición sobre los desplazamientos virtuales es que
sean compatibles con la ligadura. En este caso es que satisfagan la ecuación (2.34), donde
Φ hace las veces de fα , es decir,
∂Φ
∂Φ
∂Φ
δx +
δy +
δz = 0
∂x
∂y
∂z
(2.36)
O sea que δx, δy, δz no pueden ser arbitrarios; sólo dos de ellos pueden serlo. En
otras palabras, hay dos grados de libertad. La ecuación de movimiento, F~ = m ~¨r, y la
ecuación de ligadura (2.35), deben ser compatibles. En efecto, (2.35) impone condiciones
a las velocidades posibles y a las aceleraciones posibles:
∂Φ ˙
· ~r = 0
∂~r
(2.37)
Ecuaciones generales de la estática y la dinámica / 17
d ∂Φ ¨ ∂Φ
~r˙ ·
+ ~r ·
=0
dt ∂~r
∂~r
(2.38)
la ecuación de movimiento será compatible con (2.38) sólo si:
d ∂Φ
F~ ∂Φ
~r˙ ·
+
·
=0
dt ∂~r
m ∂~r
(2.39)
Como F~ puede darse arbitrariamente, vemos que sólo por accidente se cumplirı́a
(2.39).
Por tanto concluimos que la superficie debe reaccionar sobre la partı́cula con una
~ que dependerá de las condiciones iniciales, de la fuerza aplicada
fuerza suplementaria R
~ se llama fuerza de reacción de la ligadura y ha de
y de la ecuación de la superficie. R
ser tal que:
~
m~¨r = F~ + R
(2.40)
Ahora tenemos seis incógnitas para el problema: x, y, z, Rx , Ry , Rz , en tanto hay
sólo las cuatro ecuaciones siguientes:
mẍ = Fx + Rx
mÿ = Fy + Ry
(2.41)
mz̈ = Fz + Rz
Φ(x, y, z) = 0
Faltan pues, dos ecuaciones adicionales. Para obtenerlas basta imponer la condición
~ no realiza trabajo al efectuarse un
de que la ligadura sea ideal. Esto quiere decir que R
desplazamiento virtual. Es claro que si la superficie no tiene rozamiento (idealmente
~ será siempre normal a la superficie y como δ~r debe estar sobre la superficie se
suave), R
~ y ~r son perpendiculares,
sigue que R
~ · δ~r = 0
R
(2.42)
o también,
Rx δx + Ry δy + Rz δz = 0
(2.43)
~ no realiza trabajo en desplazamientos virtuales. Según la ecuación
Es decir, R
(2.36), δx, δy y δz no son independientes. Podemos expresar a δz en términos de δx y
δy.
Entonces la ecuación (2.33) puede escribirse en la forma:
Rx − Rz
∂Φ/∂x
∂Φ/∂z
∂Φ/∂y
δx + Ry − Rz
δy = 0
∂Φ/∂z
(2.44)
18 / Mecánica clásica avanzada
~ ha de satisfacer
Como δx, δy son diferentes de cero y arbitrarios, se sigue que R
además las ecuaciones:
∂Φ/∂x
∂Φ/∂z
Rx =
Rz
Ry =
∂Φ/∂y
Rz
∂Φ/∂z
(2.45)
completándose ası́ las seis ecuaciones requeridas.
Las ligaduras ideales. Se dice que las condiciones de ligadura sobre un sistema
mecánico son ideales si se cumple que el trabajo realizado por las fuerzas de reacción de
las ligaduras al efectuar desplazamientos virtuales de todas las partı́culas es cero:
N
X
i=1
~ i · δ~ri = 0
R
(2.46)
Las fuerzas de fricción dependen del tipo de ligadura, sin embargo para este tipo de
fuerzas deben emplearse métodos que no impliquen la noción de “ligadura ideal”.
“Ensambles” y desplazamientos virtuales. Entenderemos por “ensamble” a
un conjunto de réplicas iguales de un sistema dinámico, donde la única diferencia entre
las réplicas es la configuración, que debe ser compatible con las condiciones de ligadura,
además, en estas réplicas las ligaduras están en idéntica condición; es decir, entre un
sistema y otro, para un tiempo dado, las ligaduras son idénticas. Podemos imaginar las
configuraciones de estos sistemas formando una red o matriz bidimensional: los elementos
de las “filas” constituyen un “ensamble” y las “columnas” dan los distintos estados de
un sistema cuando evoluciona el tiempo; cada fila está caracterizada por un valor del
tiempo y cada columna por una configuración. Al cambiar t a un valor vecino t + dt
los sistemas del ensamble experimentan desplazamientos reales (de una fila a otra). Al
realizarse un desplazamiento virtual, un sistema se convierte en otro vecino (de una
columna pasa a otra).
Ejemplo 2.3.2 Sean dos partı́culas de masas m1 y m2 que interactúan entre sı́ a través
de una varilla rı́gida sin masa. Están sometidas a una fuerza externa y en un estado de
movimiento arbitrario. Se trata de mostrar que la ligadura es ideal.
Todos los desplazamientos infinitesimales que no cambian la longitud de la varilla
son virtuales.
Las fuerzas ejercidas por la varilla sobre las partı́culas son de ligadura y dependerán
del estado de movimiento y de las fuerzas aplicadas sobre las partı́culas. Por ejemplo, si
rotan al rededor del centro de masa, las fuerzas de ligadura dependerán de la velocidad
angular de rotación.
~1 y R
~ 2 las fuerzas ejercidas por la varilla sobre las partı́culas, y G
~1 y G
~2
Sean R
las fuerzas ejercidas por las partı́culas sobre la varilla, por la tercera ley de Newton se
~ 1 = −R
~1 y G
~ 2 = −R
~ 2.
cumple que G
Ecuaciones generales de la estática y la dinámica / 19
~1 y G
~ 2 podrı́an producir aceleración del centro de masa de la varilla y aceleración
G
angular, pero como la masa de la varilla es cero, lo mismo que el momento de inercia,
~1 + G
~ 2 = 0, lo mismo que el torque. Por lo tanto también se cumple que
se sigue que G
~
~
R1 = −R2 y como no hay torques, estos vectores estarán a lo largo de la varilla. El
trabajo virtual de las fuerzas de ligadura será:
~ 1 · δ~r1 + R
~ 2 · δ~r2 = R
~ 2 · (δ~r2 − δ~r1 )
R
(2.47)
Si llamamos ~r = ~r2 − ~r1 , δ~r = δ~r2 − δ~r1 , entonces un desplazamiento virtual δ~r
puede descomponerse en uno perpendicular a la varilla y en uno paralelo a la misma,
δ~r = δ~r⊥ + δ~rk
(2.48)
Como la varilla es rı́gida, δ~rk → 0, luego:
~ 1 · δ~r1 + R
~ 2 · δ~r2 = R
~ 2 · δ~r = R
~ 2 · δ~r⊥
R
(2.49)
~ 2 está a lo largo de la varilla, luego R
~ 1 · δ~r2 = 0 concluyéndose por tanto que la
pero R
~ 1 · δ~r1 y R
~ 2 · δ~r2 no son cero por separado, pero sı́ su suma.
ligadura es ideal. R
2.4.
La ecuación general de la estática
Sea un sistema de N partı́culas. La fuerza sobre la partı́cula i se puede descomponer
(a)
~ i ). Si el
en una fuerza aplicada (F~i ) y en una fuerza de reacción de las ligaduras (R
sistema está en equilibrio se debe cumplir que:
(a)
~ i = ~0 ;
F~i = F~i + R
i = 1, 2, ...N
(2.50)
El trabajo virtual de las F~i también será cero,
N
X
i=1
F~i · δ~ri =
N
X
i=1
(a)
F~i · δ~ri +
N
X
i=1
~ i · δ~ri = 0
R
(2.51)
~ i no sean nulas, será nulo el
Si suponemos que las ligaduras son ideales, ası́ las R
(a)
trabajo virtual realizado por ellas, ecuación (2.46). Aun en el equilibrio las F~i no serán
nulas, pero de (2.46) y (2.51) se sigue que el trabajo virtual de las fuerzas aplicadas debe
ser cero:
N
X
i=1
(a)
F~i · δ~ri = 0
(2.52)
La ecuación (2.52) se llama la ecuación general de la estática o también el principio
de los trabajos virtuales. El contenido de la ecuación (2.52) es el siguiente: “para que
alguna configuración del sistema, compatible con las ligaduras, sea una posición de
equilibrio, es necesario y suficiente que en esa posición la suma de los trabajos virtuales
de las fuerzas efectivas sea cero”. Este enunciado se llama la “regla de oro de la mecánica”
y fue formulado por J. Bernoulli en 1717.
20 / Mecánica clásica avanzada
La compatibilidad de los desplazamientos virtuales con las ligaduras se expresa
a través de las ecuaciones (2.34). Por lo tanto los desplazamientos virtuales δ~ri en la
ecuación (2.52) no serán independientes, por lo que se pueden expresar k de ellos en
términos de los 3N − k restantes.
Las coordenadas generalizadas independientes permiten hallar una expresión a
partir de (2.52) que contenga los desplazamientos independientes e igualar a cero los
coeficientes. Este procedimiento hace posible hallar la configuración de equilibrio pero
no las fuerzas de ligadura.
Sistema de ecuaciones de la estática. La solución de un problema de estática
consiste en hallar la configuración de equilibrio (xi , zi , yi para i = 1, 2, ... N ), y las
fuerzas de reacción de las ligaduras (Rxi , Ryi , Rzi para i = 1, 2, ... N ). Son seis incógnitas
que se obtienen resolviendo simultáneamente las siguientes ecuaciones algebraicas:
(a)
~i = 0 ;
F~i + R
N
X
i=1
i = 1, 2, ... N
(2.53)
~ i · δ~ri = 0
R
(2.54)
fα (~r1 , ~r2 , ... ~rN ) = 0 ;
α = 1, 2, ... k
(2.55)
(a)
~ i en la posición
Como las F~i son funciones conocidas de las coordenadas, las R
de equilibrio se hallan con sólo conocer dicha posición, o sea que en (2.53) son 3N
~ i . Para hallar la configuración de equilibrio basta resolver
ecuaciones que determinan las R
las ecuaciones:
N
X
i=1
(a)
F~i · δ~ri = 0
y
fα (~r1 , ~r2 , ... ~rN ) = 0 ;
α = 1, 2, ... k
(2.56)
Como (2.55) debe cumplirse en las configuraciones ~r1 , ~r2 , ... ~rN y ~r1 + δ~r1 , ~r2 +
δ~r2 , ... ~rN + δ~rN , es cierto que:
N
X
∂fα
i=1
∂~ri
· δ~ri = 0 ;
α = 1, 2, ... k
(2.57)
Con lo cual es posible expresar k desplazamientos en términos de 3N − k. Escribamos el conjunto de 3N coordenadas x1 , y1 , z1 , x2 , y2 , z2 , ...xN , yN , zN , en la forma
u1 , u2 , ... u3N de modo que tomamos a u1 , u2 , ... uk como k coordenadas que se pueden expresar en términos de las coordenadas uk+1 , uk+2 , ... u3N que tomaremos como
(a)
3N − k coordenadas independientes. Llamaremos análogamente Fs a las componentes
(a)
Fus . Con estas modificaciones las ecuaciones de la estática pueden escribirse como:
3N
X
Fs(a) δus = 0
(2.58)
s=1
fα (u1 , u2 , ... u3N ) = 0 ;
3N
X
∂fα
s=1
∂us
δus = 0 ;
α = 1, 2, ... k
(2.59)
Ecuaciones generales de la estática y la dinámica / 21
Introducimos las k cantidades λ1 , λ2 , ... λk , llamadas multiplicadores indeterminados de Lagrange, de la siguiente manera: multiplicamos las ecuaciones (2.59) que
relacionan los δus por λα y sumamos sobre α para obtener:
3N X
k
X
∂fα
λα δus = 0
∂us
s=1 α=1
(2.60)
Ahora sumamos (2.58) y (2.60):
!
k
3N
X
X
∂f
α
δus = 0
Fs(a) +
λα
∂us
α=1
s=1
(2.61)
Tenemos k cantidades indeterminadas, λα , que podemos escoger de tal manera que
en (2.61) se anulen los coeficientes de los k desplazamientos dependientes δu1 , δu2 , ... δuk ,
es decir,
Fs(a) +
k
X
λα
α=1
∂fα
= 0;
∂us
s = 1, 2, ... k
(2.62)
Ahora, con (2.62), quedará (2.61) convertida en una combinación lineal igualada a
cero de las cantidades linealmente independientes δuk+1 , δuk+2 , ... δu3N . Lo anterior es
posible sólo si se anulan los coefientes, lo cual, junto con (2.62) conduce a:
Fs(a) +
k
X
λα
α=1
∂fα
= 0;
∂us
s = 1, 2, ... 3N
(2.63)
La ecuación general de la estática (2.58) queda convertida en las 3N ecuaciones
(2.63). Ahora hay k incógnitas adicionales, o sea 3N + k en total. Pero hay 3N + k
ecuaciones que son las (2.55) y las (2.63). La solución nos dará la posición de equilibrio
del sistema. Las fuerzas de ligadura se hallan de cualquiera de las expresiones:
Rs = −Fs(a) (u1 , u2 , ... u3N ) ;
Rs =
k
X
α=1
λα
s = 1, 2, ... 3N
∂
fα (u1 , u2 , ... u3N ) ;
∂us
(2.64)
s = 1, 2, ...k
(2.65)
Ejemplo 2.4.1 Sean dos partı́culas de masas m1 y m2 , unidas por una varilla rı́gida sin
masa y colocadas dentro de un cascarón esférico, en presencia de la gravedad (véase
figura la 2.3). Hallar la posición de equilibrio y las fuerzas de reacción de las ligaduras.
Las ecuaciones de ligadura, cuando se toma el origen de coordenadas en el centro
de la esfera, son:
(x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − l2 =
0
x21 + y12 + z12 − a2 =
0
x22 + y22 + z22 − a2 =
0
(2.66)
22 / Mecánica clásica avanzada
Donde a es el radio de la esfera y l ≤ 2a la longitud de la varilla. Tomando el eje
z en la dirección vertical, las fuerzas aplicadas son:
(a)
F~1 = −m1 g k̂ ;
(a)
F~2 = −m2 g k̂
(2.67)
Ecuación de equilibrio (2.58):
−m1 g δz1 − m2 g δz2 = 0
(2.68)
k
a
m
1
0
m
l
2
Figura 2.3 Masas m1 y m2 unidas por una varilla rı́gida sin masa y colocadas dentro de un
cascarón esférico
Compatibilidad de los desplazamientos virtuales con las ligaduras:
(x1 − x2 )δx1 + (x2 − x1 )δx2 + (y1 − y2 )δy1
+
(y2 − y1 )δy2 + (z1 − z2 )δz1 + (z2 − z1 )δz2 = 0
(2.69)
x1 δx1 + y1 δy1 + z1 δz1 = 0
x2 δx2 + y2 δy2 + z2 δz2 = 0
Las ecuaciones (2.69) indican que sólo tres desplazamientos virtuales pueden darse independientemente. Escogeremos independientes a δy1 , δy2 , δz2 y dependientes a
δx1 , δx2 , δz1 . Las seis ecuaciones correspondientes a las dadas por la expresión (2.63)
se obtienen usando la matriz de tres filas y seis columnas ∂fα /∂us donde α = 1, 2, 3 y
Ecuaciones generales de la estática y la dinámica / 23
s = 1, 2, ... 6. α = 1, 2, 3 corresponden a las ecuaciones (2.66) respectivamente y las us corresponden a x1 , x2 , z1 , y1 , y2 , z2 respectivamente. Los elementos de la matriz ∂fα /∂us
son:


a −a b c −c −b




∂fα

x
0
z
y
0
0
=
(2.70)
1
1
1


∂us


0 x2 0 0 y2 z2
donde a = x1 − x2 , b = z1 − z2 y c = y1 − y2 .
Las ecuaciones (2.63) serán:
0 + λ1 (x1 − x2 ) + λ2 x1 + 0 = 0
(2.71)
0 + λ1 (x2 − x1 ) + 0 + λ3 x2 = 0
(2.72)
−m1 g + λ1 (z1 − z2 ) + λ2 z1 + 0 = 0
(2.73)
0 + λ1 (y1 − y2 ) + λ2 y1 + 0 = 0
(2.74)
0 + λ1 (y2 − y1 ) + 0 + λ3 y2 = 0
(2.75)
−m2 g + λ1 (z2 − z1 ) + 0 + λ3 z2 = 0
(2.76)
De (2.71), (2.72) y (2.73) obtenemos para λ1 , λ2 , λ3 :
λ1 = m1 g
x1
;
x2 z1 − x1 z2
λ2 = m1 g
x2 − x1
x2 z1 − x1 z2
x1 x1 − x2
λ3 = m1 g
x2 x2 z1 − x1 z2
(2.77)
Reemplazando a (2.77) en (2.74), (2.75) y (2.76), obtenemos:
x2 y1 − x1 y2
= 0;
x2 z1 − x1 z2
x1 x2 y1 − x1 y2
=0
x2 x2 z1 − x1 z2
x1 x2 z1 − x1 z2
m2
+
=0
m1
x2 x2 z1 − x1 z2
(2.78)
Si se cumple que x2 z1 − x1 z2 = 0, las ecuaciones (2.78) se convierten en:
x2 y1 − x1 y2 = 0;
x2 z1 − x1 z2 = 0
(2.79)
La otra posibilidad es que x2 z1 − x1 z2 no sea cero. En este caso, de (2.78) salen
las dos relaciones diferentes:
x1
m2
x1 y2 = x2 y1 ;
=−
(2.80)
x2
m1
La solución (2.79) no tiene sentido pues implica:
~r1 × r~2 = (y1 z2 − z1 y2 )î − (x1 z2 − z1 x2 )ĵ + (x1 y2 − x2 y1 )k̂ = 0
(2.81)
24 / Mecánica clásica avanzada
O sea que los vectores de posición de las partı́culas son paralelos, independientemente de las masas y la longitud de la varilla. Esta solución podrı́a ser aceptable en los
casos lı́mites en que l = 0 o l = 2a. La solución (2.80) da:1
y1
m2
=−
;
y2
m1
x1
m2
=−
x2
m1
(2.82)
Las relaciones (2.82) implican que el centro de masa se encuentra siempre sobre el
eje z. Las ecuaciones de ligadura se pueden escribir como:
2a2 − 2x1 x2 − 2y1 y2 − 2z1 z2 − l2 = 0
(2.83)
x21 + y12 + z12 − a2 = 0
(2.84)
x22 + y22 + z22 − a2 = 0
(2.85)
De reemplazar (2.82) en (2.83) obtenemos:
2a2 + 2
m2 2
m2 2
x +2
y − 2z1 z2 − l2 = 0
m1 2
m1 2
Usando (2.84) y (2.85) podemos escribir a (2.86) como:
s
2
m
m2
2
2
2
2
2
a − z2 − 2z2 a −
(a2 − z22 ) − l2 = 0
2a + 2
m1
m1
Despejando en (2.87) a (a2 − z2 2 ) obtenemos luego para z22 :
2
m2
l2
2
1+
a −
m1
2
z22 = 2
m2 2
m2
l
a2 −
1+
m1
m1
z1 se obtiene de (2.74), (2.84) y (2.85):
2
m2
2
2
a − z1 =
a2 − z22
m1
Lo cual conduce a:
2
m2 l 2
m2
2
a −
1+
m1
m1 2
z22 = 2
m1
m1 2
l
1+
a2 −
m1
m1
(2.86)
(2.87)
(2.88)
(2.89)
(2.90)
Se ve fácilmente que al intercambiar las partı́culas, o sea en (2.88) al reemplazar
m2 por m1 y viceversa se obtiene (2.90).
1 En
(2.77) resulta entonces que las λ son infinitas, o sea que las fuerzas de ligadura son infinitas.
Ecuaciones generales de la estática y la dinámica / 25
Las ecuaciones (2.82) nos indican que:
y1
y2
=
x1
x2
(2.91)
Observando la proyección de las partı́culas sobre el plano xy, vemos que la varilla
debe cortar el eje z, lo cual está de acuerdo con el hecho de que el centro de masa
está sobre el eje z en la posición de equilibrio. Lo anterior nos dice que la proyección de
la varilla sobre el plano xy es una lı́nea recta que pasa por el origen.
Debido a que de las tres ecuaciones (2.78) sólo se obtienen dos relaciones independientes, vemos que habrá una indeterminación en los valores de x1 y y1 (y correspondientemente de x2 , y2 ), lo cual es debido a la simetrı́a del problema bajo rotaciones en
el eje z. Podemos determinar solamente a ax21 + y12 y ax22 + y22 :
y
m
1
ϕ2
ϕ1
x
m
2
Figura 2.4 Proyección de las partı́culas m1 y m2 sobre el plano xy
x22 + y22 =
x21
+
y12
=
l2
l 2 a2 −
4
2
m2
m2 2
a2 1 +
l
−
m1
m1
m2
m1
2
(2.92)
(x22 + y22 )
De (2.86) y (2.68) obtenemos la siguiente expresión que nos permite analizar los
signos de z1 y z2 :
2
m2
l4
m1
l2
1+
+
a2 a2 −
2
m1
m2
4
z1 z2 =
2
m2
m1
a2 1 +
− l2
m1
m2
(2.93)
26 / Mecánica clásica avanzada
Supongamos que l = 2a, con m1 6= m2 . Entonces,
z1 z2 = −a2
(2.94)
De tal forma que (2.88), (2.90) y (2.83) a (2.85) dan z12 = z22 = a2 . Hay para este
caso, pues, dos soluciones posibles: z1 = a, z2 = −a o z1 = −a, z2 = a, que corresponden
a la varilla vertical. Si además m1 = m2 , (2.88), (2.89) y (2.90) conducen a valores
indeterminados de z1 y z2 : cualquier posición es de equilibrio, lo cual está de acuerdo
con que el centro de masa está en O para todas las posiciones de la varilla. Para m1 = m2 ,
con l arbitrario, se obtiene de (2.88), (2.89) y (2.90):
z12 = z22 = a2 −
l2
4
(2.95)
y de (2.93) se obtiene:
z 1 z 2 = a2 −
l2
4
(2.96)
que indica que z1 y z2 deben tener el mismo signo. Las condiciones de ligadura no
contienen información acerca de si las partı́culas están dentro del cascarón o pegadas a él
(pudiendo moverse sin fricción); por esto (2.96) admite dos soluciones: z1 = z2 = a2 − l2 /4
o z1 = z2 = −(a2 − l2 /4). Es claro que la segunda solución es la única aceptable cuando
las partı́culas están colocadas simplemente dentro del cascarón. La posición del centro
de masa en un caso general es:
zCM =
m1 z 1 + m2 z 2
=
m1 + m2
m2
m2
m2 l 2
l2
2
2
±m1 1 +
± m2 1 +
a −
a −
m1
m 2
m1
2
s1
2
m2 2
m2
l
a2 −
1+
(m1 + m2 )
m1
m1
(2.97)
Es claro que cuando las partı́culas están dentro del cascarón debe excluirse la
solución en que z1 y z2 tienen ambas signos positivos. Las otras soluciones son:
Para z1 > 0 , z2 < 0:
m2
1−
a2
m1
zCM = s
(2.98)
2
m
m2
2
2
l
a2 −
1+
m1
m1
Para z1 < 0 , z2 > 0:
m2
− 1 a2
m1
zCM = s
2
m2
m2 2
1+
l
a2 −
m1
m1
(2.99)
Ecuaciones generales de la estática y la dinámica / 27
Para z1 < 0 , z2 > 0:
zCM
m1
=−
m1 + m2
s
m2
1+
m1
2
a2 −
m2 2
l
m1
(2.100)
Las ecuaciones (2.98), (2.99) y (2.100) serán la expresión correcta para zCM dependiendo del signo de z1 z2 en la ecuación (2.93). Estas ecuaciones pueden también
escribirse como:
zCM =
zCM =
m1 − m2
r
m1 + m2
a2 −
m2 − m1
r
m1 + m2
a2 −
zCM = −
r
a2 −
a2
(2.101)
1
m1 m2 2
l
m1 + m2 m1 + m2
a2
(2.102)
1
m1 m2 2
l
m1 + m2 m1 + m2
1
m1 m2 2
l
m1 + m2 m1 + m2
(2.103)
Cuando
p m1 = m2 sólo es válida (2.103). En ese caso, como es de esperarse zCM =
z1 = z2 = − a2 − l2 /4. En general (2.101) y (2.102) sólo serán válidas cuando se cumple
una de las desigualdades siguientes:
m1
m2
a2 o l 2 > 2 1 +
a2
(2.104)
l2 > 2 1 +
m1
m2
Para el cálculo de las fuerzas de reacción de las ligaduras se requiere evaluar los
λα . Los denominadores en las ecuaciones (2.77) se calculan usando las ecuaciones (2.80):
x2
m1
−z2 + z1
(2.105)
= −zCM 1 +
x1
m2
Con lo cual las ecuaciones (2.77) nos dan:
λ1 = −
m1 m2
g
;
m1 + m2 zCM
λ2 = m2
g
;
zCM
λ3 = m2
g
zCM
(2.106)
De acuerdo con (2.65), (2.71) a (2.76), se puede hallar la contribución de cada
ligadura a las fuerzas de reacción de las ligaduras. λ1 está asociada a la fuerza ejercida
por la varilla sobre las partı́culas, λ2 a la fuerza ejercida por el cascarón sobre la partı́cula
de masa m1 y λ3 a la fuerza ejercida por el cascarón sobre la partı́cula de masa m2 .
Estas fuerzas, en forma vectorial, son respectivamente:
λ1 (~r1 − ~r2 );
λ1 (~r2 − ~r1 );
λ2~r1 ;
λ3~r2
(2.107)
La fuerza total, de la varilla y el cascarón, sobre la partı́cula de masa m1 y sobre
la de masa m2 respectivamente es:
(λ1 + λ2 )~r1 − λ1~r;
(λ1 + λ3 )~r2 − λ1~r1
(2.108)
28 / Mecánica clásica avanzada
Utilizando las expresiones para los λα , las fuerzas ejercidas separadamente por la
varilla y el cascarón sobre las partı́culas de masas m1 y m2 respectivamente, son:
m1 m2 g ~r1 − ~r2
;
m1 + m2 zCM
m1 m2 g ~r1 − ~r2
;
m1 + m2 zCM
m1 g
~r1
;
zCM
m2 g
~r2
zCM
(2.109)
Por ejemplo, tomemos la solución de equilibrio estable cuando l = 2a y m1 > m2 :
x1 = x2 = y1 = y2 = 0, z1 = −a, z2 = a. En este caso r~1 = −ak̂, r~2 = ak̂, ~r1 − ~r2 = −2ak̂ y
zCM será:
m1 − m2
zCM = −
a
(2.110)
m1 + m2
Las fuerzas ejercidas sobre m1 por la varilla y el cascarón respectivamente son:
−2aλ1 k̂ = −
2m1 m2 g
k̂
m1 − m2
y
− aλ2 k̂ =
m1 (m1 + m2 )
g k̂
m1 − m2
(2.111)
Las fuerzas sobre la partı́cula de masa m2 son:
2aλ1 k̂ =
2m1 m2 g
k̂
m1 − m2
y
aλ3 k̂ =
m2 (m1 + m2 )
g k̂
m1 − m2
(2.112)
Las ecuaciones (2.111) y (2.112) nos dicen que la fuerza ejercida por el cascarón
sobre m2 no es cero y que la fuerza ejercida por el cascarón sobre m2 es diferente
de (m1 + m2 )g, lo cual contradice nuestra idea intuitiva de que las partı́culas están
“colocadas” dentro del cascarón (véase figura 2.3). El resultado que acabamos de obtener
nos dice que las partı́culas están “agarradas” del cascarón de alguna manera. Esto nos
ilustra una propiedad de las ecuaciones de ligadura del tipo (2.88), (2.89), (2.90), o sea
de las ligaduras holónomas bilaterales: las fuerzas de ligadura asociadas a las ligaduras
bilaterales se pueden ejercer en dos direcciones. Por esto en la parte más alta del cascarón,
ecuación (2.112), éste ejerce sobre la partı́cula de masa m2 una fuerza en la dirección
z negativa. La fuerza total sobre m1 y la fuerza total sobre m2 , usando las ecuaciones
(2.100) y (2.106), son respectivamente:
m1 g
~ CM
R
;
zCM
m2 g
~ CM
R
zCM
(2.113)
Cuando l = 2a, la fuerza neta ejercida por las ligaduras sobre m1 es m1 g k̂ y sobre m2
es m2 g k̂. Es decir, las ligaduras ejercen sobre cada partı́cula una fuerza que contrarresta
su peso, como debe ser cuando las partı́culas están “agarradas” al cascarón.
El estudio del caso en que las partı́culas están simplemente “colocadas” en el
cascarón requiere reemplazar (2.66) por dos condiciones de ligadura unilaterales: r1 ≤ a,
r2 ≤ a. La solución se obtiene fácilmente a partir de la hallada cuando las ligaduras son
bilaterales.
2.5.
Las ecuaciones de la estática en coordenadas generalizadas
Las ligaduras hacen que los desplazamientos virtuales de las partı́culas (δx1 , δy1 ,
δz1 ; ... δxn , δyn , δzn ) no sean todos independientes. Por esto en la ecuación general de
Ecuaciones generales de la estática y la dinámica / 29
la estática, ecuaciones (2.52) y (2.58), no se tienen combinaciones lineales de cantidades
linealmente independientes y los coeficientes de los desplazamientos no se anulan. Si
introducimos las coordenadas generalizadas independientes (q), para lo cual es necesario
que el sistema sea holónomo, mediante las ecuaciones de transformación (2.21), podemos
expresar los δ~ri en términos de los δqν :
δ~ri =
l
X
∂~ri
δqν
∂q
ν
ν=1
(2.114)
donde l es el número de grados de libertad; l = 3N − k, con k = h, puesto que en estática
no hay ligaduras no holónomas.
Entonces la ecuación (2.52) toma la forma:
!
l
N
N
l
X
X
X
X
∂~
r
∂~
r
i
i
(a)
(a)
F~i ·
F~i ·
δqν = 0
(2.115)
δqν =
∂qν
∂qν
ν=1
ν=1 i=1
i=1
En la ecuación (2.115) se tiene una combinación lineal de los desplazamientos
virtuales independientes δqν igualada a cero. Por esto se debe cumplir que:
Q(a)
ν
≡
(a)
N
X
ri
(a) ∂~
= 0;
F~i ·
∂q
ν
i=1
ν = 1, 2, ... l
(2.116)
Qν se denomina la fuerza generalizada asociada al grado de libertad qν . En coor(a)
denadas generalizadas las condiciones de equilibrio son Qν = 0 para ν = 1, 2, ... l, que
proporciona un sistema de l ecuaciones algebraicas simultáneas con las l incógnitas
q1 , q2 , ... ql que son las coordenadas generalizadas en la posición de equilibrio. En cuanto a las fuerzas de ligadura, de la ecuación (2.50) se sigue que la fuerza de reacción de
las ligaduras asociada al grado de libertad qν también es cero:
Eν =
N
X
N
X
∂~ri
~ i . ∂~ri = −
R
F~i (a) ·
∂qν
∂qν
i=1
i=1
ν = 1, 2, ... l
(2.117)
Se sigue de (2.117) que sólo serán diferentes de cero las fuerzas asociadas a las
3N − l = k coordenadas “superfluas”. Como en coordenadas generalizadas desaparecen
las ecuaciones de ligadura, se sigue que las fuerzas de ligadura también se anulan, de
acuerdo con la idea de que en el espacio de configuración no euclidiano, definido por
las coordenadas generalizadas, el efecto de las ligaduras es asociado con la propiedad
geométrica de “curvatura del espacio”.
Fuerzas derivables de un potencial. Si las fuerzas aplicadas se pueden obtener
a partir de una función V (~
rl , r~2 , ... ~rN , t) en la forma:
∂V
(a)
;
F~i = −
∂~ri
i = 1, 2, ... N
(2.118)
Las condiciones de equilibrio en coordenadas generalizadas son, para este caso:
Q(a)
ν
=−
N
X
∂V
i=1
∂~ri
·
∂~ri
∂V
=−
;
∂qν
∂qν
i = 1, 2, ... l
(2.119)
30 / Mecánica clásica avanzada
Las ecuaciones (2.119) dicen que la posición de equilibrio estática es aquella para
la cual la función de energı́a potencial tiene un mı́nimo o un máximo respecto a todas
las coordenadas generalizadas. Sin definir estrictamente la estabilidad de un sistema,
podemos decir que un mı́nimo en V corresponde a equilibrio estable, y un máximo a
equilibrio inestable; las condiciones rigurosas de estabilidad están dadas por el teorema
de Lagrange y los teoremas de Liapunov y Chetayev (véase el capı́tulo 5 del libro Lectures
in analytical mechanics de Gantmacher).
A manera de ilustración, consideraremos una partı́cula colocada sobre una esfera de
radio a que puede variar con el tiempo. Las coordenadas generalizadas pueden tomarse
como θ, φ, de acuerdo con la ecuación (2.24). A las fuerzas aplicadas se les pueden
asociar las fuerzas generalizadas Qθ , Qφ . La condición de equilibrio es Qθ = Qφ = 0, o sea
que no haya torques externos en las direcciones de θ y φ. En el equilibrio, la partı́cula se
moverá sobre la superficie de la esfera sin aceleración o permanecerá en reposo respecto
a la misma. Con coordenadas generalizadas no es posible obtener la fuerza de ligadura
en la dirección radial.
Ejemplo 2.5.1 Hallar la configuración de equilibrio para el problema del ejemplo 2.4.1
en coordenadas generalizadas.
La figura 2.5 muestra una configuración general del sistema. Se requiere hallar
tres parámetros independientes compatibles con las ligaduras y expresar en términos de
ellos las coordenadas de las partı́culas. Luego, hallar las fuerzas generalizadas asociadas
a esos parámetros. La configuración de equilibrio estará dada por los valores de los
parámetros que anulan las fuerzas generalizadas. Las coordenadas generalizadas serán
tres parámetros que ubican la posición del triángulo rı́gido: 012. Como el vector de
posición del centro de masa ~rCM es fijo respecto al triángulo 012, dos parámetros podrı́an
ser φCM , θCM y el tercer parámetro serı́a un ángulo de rotación del triángulo alrededor de
~rCM . Sin embargo, resultan más convenientes los tres ángulos de Euler que determinan
la ubicación de un sistema de coordenadas cartesianas x′ , y ′ , z ′ , fijo al triángulo, respecto
al sistema de coordenadas espacial x, y, z.
Los ángulos de Euler permiten mediante tres rotaciones sucesivas obtener los ejes
x′ , y ′ , z ′ a partir de los ejes x, y, z: primero se rota alrededor del eje z por un ángulo
φ, con lo cual el eje x pasa a ser cierto eje ξ; luego se rota alrededor del eje ξ por un
ángulo θ, con lo cual z pasará a ser cierto eje ξ ′ ; luego se rota alrededor del eje ξ ′ por
un ángulo ψ, con lo cual se obtendrá la posición final de los ejes x′ , y ′ , z ′ . La figura 2.6
muestra estas tres rotaciones.
La figura 2.7 muestra la ubicación del triángulo mediante los ángulos de Euler
φ, θ, ψ. Se escoge el eje z ′ a lo largo de la lı́nea que une a O con el centro de masa,
y ′ perpendicular a 0−CM en el plano del triángulo, y x′ perpendicular al plano del
triángulo.
Las coordenadas de las partı́culas respecto a los ejes x′ , y ′ , z ′ son:
x′1 =
0
y1′ =
−a sen
z1′ =
a cos
β
−α
2
β
−α
2
x′2 = 0
y2′ = a sen
z2′ = a cos
β
+α
2
β
+α
2
(2.120)
Ecuaciones generales de la estática y la dinámica / 31
z
2
l
1
θ2
θ1
r1
r2
y
ϕ2
ϕ1
x
Figura 2.5 Configuración de equilibrio del sistema de dos masas unidas por una varilla rı́gida
(del ejemplo 2.4.1)
ζ′
z,ζ
z
θ
z
zi ′
θ
yi′
η′
η
x
ϕ
x
ζ
y
y
y
x
ϕ
ϕ
ψ
xi′
ζ′
Figura 2.6 Los ángulos de Euler φ, θ y ψ
Llamando ~rm la posición del punto medio de la varilla, obtenemos la siguiente
expresión que relaciona a cos α con cos β:
~rCM · ~rm =
a2
(1 + cos β) = rCM rm cos α
2
(2.121)
32 / Mecánica clásica avanzada
z
zi ′
2
z i′
1
y i′
× CM
2
× CM
1
α
θ
a
y
β
0
a
xi′
ϕ
y i′
ψ
0
x
Figura 2.7 Ubicación del triángulo mediante los ángulos de Euler
De la definición de ~rCM y de la geometrı́a se sigue que:
s
l2
m1 m2
rCM = a 1 −
2
(m1 + m2 ) a2
rm = a
r
1−
l2
4a2
l2
cos β = 1 − 2 ;
2a
(2.122)
(2.123)
β
l
sen =
;
2
2a
β
cos =
2
r
1−
l2
4a2
(2.124)
Usando (2.122), (2.123) y (2.124) se obtienen de (2.121) las siguientes expresiones
para senα y cos α:
sen α =
l m1 − m2
s
2a m1 + m2
1−
v
u
u
u
cos α = u
u
t
1
m1 m2
l2
(m1 + m2 )2 a2
l2
1− 2
4a
m1 m2
l2
1−
2
(m1 + m2 ) a2
(2.125)
De (2.120), (2.124) y (2.125) se deducen las siguientes expresiones para las coordenadas de las partı́culas respecto a los ejes x′ , y ′ y z ′ :
x′1 = x′2 = 0
(2.126)
Ecuaciones generales de la estática y la dinámica / 33
v
u
u
m2 u
u
′
y1 = −l
u
m1 + m2 t
l2
4a2
m1 m2
l2
1−
2
(m1 + m2 ) a2
1−
l2
m2
1− 2
2a m1 + m2
′
z1 = a s
m1 m2
l2
1−
(m1 + m2 )2 a2
v
u
l2
u
u
1− 2
m
1
u
4a
y2′ = l
u
m1 + m2 t
m1 m2
l2
1−
2
(m1 + m2 ) a2
m1
l2
1− 2
4a m1 + m2
′
z2 = a s
l2
m1 m2
1−
(m1 + m2 )2 a2
(2.127)
(2.128)
(2.129)
(2.130)
Definamos las variables c = cos ψ, c′ = cosφ, c′′ = cos θ, s = senψ, s′ = senφ y
s = senθ. Las ecuaciones de transformación del sistema de coordenadas x′ , y ′ , z ′ al
sistema de coordenadas x, y, z son las siguientes [ver (2.118)]:


x




 y =




z
(2.131)

 ′ 
c c′ − s s′ c′′ −s c′ − c′′ s′ c s′′ s′
x






 c s′ + c′′ c′ s −s s′ + c′′ c′ c −s′′ c′   y ′ 






s′′ s
s′′ c
c′′
z′
′′
Como las componentes del vector de posición del centro de masa en los ejes x′ , y ′ ,
z son:
′
′
x′CM = yCM
= 0;
′
= rCM ,
zCM
(2.132)
se deduce de (2.131) que respecto a los ejes x, y, z las coordenadas del centro de masa
son:
xCM = rCM senθ senφ
yCM
= −rCM senθ cos φ
zCN
= rCM cos θ
(2.133)
34 / Mecánica clásica avanzada
Las fuerzas generalizadas se obtienen usando las ecuaciones (2.67) y (2.116):
Qν = −m1 g
∂z1
∂z2
∂zCM
− m2 g
= −g(m1 + m2 )
∂qν
∂qν
∂qν
(2.134)
donde en este caso tomanos q1 = φ, q2 = θ, q3 = ψ. De (2.133) y (2.134) se sigue
inmediatamente que:
Qφ
≡0
Qψ
≡0
Qθ
= (m1 + m2 )grCM senθ
(2.135)
Las condiciones de equilibrio son Qν = 0, lo cual da las siguientes ecuaciones:
0 = 0,
0 = 0,
senθ = 0
(2.136)
Se sigue de (2.136) que las configuraciones de equilibrio son aquellas para las cuales
θ = 0 o θ = π, donde φ y ψ pueden tomar cualquier valor. Como para θ = 0 y θ = π,
φ y ψ están en el mismo plano, realmente sólo hay un ángulo arbitrario: todas las
configuraciones que se obtienen por rotar alrededor del vector de posición del centro de
masa son de equilibrio, donde el centro de masa está sobre el eje z.
Las configuraciones de equilibrio respecto a los ejes x, y, z se obtienen de (2.131)
con ψ y φ arbitrarios:

 
 ′ 
x
cos(ψ ± φ) −sen(ψ ± φ) 0
x

 



 
 ′ 
 y  =  sen(φ ± ψ) cos(φ ± ψ)


0  y 
(2.137)

 


 


z
0
0
±1
z′
Donde el signo superior se refiere al caso en que θ = 0 y el inferior a φ = π.
Explı́citamente (2.137) da:
x
= x′ cos(ψ ± φ) − y ′ sen(ψ ± φ)
y
= x′ sen(φ ± ψ) + y ′ cos(φ ± ψ)
z
= ±z ′
(2.138)
en concordancia con lo dicho anteriormente. En la configuración de equilibrio estable,
θ = π, las coordenadas de las partı́culas, de acuerdo con (2.138) y (2.126) a (2.130), son:
m2
l2
1− 2
2a m1 + m2
;
z1 = −a s
m1 m2
l2
1−
(m1 + m2 )2 a2
m1
l2
1− 2
2a m1 + m2
z2 = −a s
m1 m2
l2
1−
(m1 + m2 )2 a2
(2.139)
de acuerdo con los resultados obtenidos anteriormente [ecuaciones (2.88) y (2.90)]. Los
resultados (2.80) también se obtienen directamente de (2.138).
Ecuaciones generales de la estática y la dinámica / 35
2.6.
La ecuación general de la dinámica
Si un sistema no está en equilibrio, la fuerza neta sobre cada una de las partı́culas
no es cero sino, de acuerdo con la segunda ley de Newton, es igual al producto de su
masa por su aceleración:
(a)
~ i = mi~¨ri ;
F~i = F~i + R
i = 1, 2, ...N
(2.140)
Debido a que consideramos ligaduras ideales, que no realizan trabajo sobre el
sistema como un todo al desplazar virtualmente todas las partı́culas, se sigue que:
n X
i=1
(a)
F~i − mi~¨r i · δ~ri = 0
(2.141)
(a)
La cantidad F~i − mi~¨r i ·δ~ri no es cero, pero su suma sı́ lo es. La fórmula (2.141)
se llama la ecuación general de la dinámica o también el principio de D’alembert. Esta
ecuación establece lo siguiente: “en todo instante en un sistema dinámico la suma de
(a)
las fuerzas efectivas F~i y de las fuerzas de inercia −mi~r¨i no realiza trabajo al efectuar
desplazamientos virtuales del sistema”, o más en general establece que: “la ecuación
general de la dinámica expresa una condición necesaria y suficiente para que un movimiento compatible con las ligaduras sea a la vez compatible con las fuerzas aplicadas”.
Esta ecuación es aplicable a cualquier sistema ideal, holónomo o no holónomo.
Como hay 3N − k desplazamientos virtuales independientes, la ecuación general
de la dinámica proporciona 3N − k ecuaciones, al igualar a cero los coeficientes de los
desplazamientos virtuales independientes, que junto con las k ecuaciones de ligadura
constituye un sistema de 3N ecuaciones con 3N incógnitas. Esta vez, a diferencia del
caso estático, las ecuaciones no serán algebraicas sino diferenciales.
(a)
(a+f )
= F~i − mi~r¨i la ecuación (2.141) queda ası́:
Si llamamos F~i
N
X
i=1
(a+f )
· δ~ri = 0
F~i
(2.142)
o sea que la ecuación general de la dinámica toma la misma forma de la ecuación general
de la estática. Esta ecuación puede interpretarse como una ecuación para caracterizar
en cada instante del tiempo la posición de equilibrio del sistema donde a las fuerzas
(a)
efectivas F~i se les adicionan las fuerzas ficticias o inerciales −mi~¨r i . Más precisamente,
el principio de D’alembert (1760) dice: “cualquier posición de un sistema dinámico puede
considerarse como una posición de equilibrio instantáneo si a las fuerzas aplicadas que
actúan sobre el sistema se agregan las fuerzas ficticias o de inercia”. La regla de oro de
J. Bernoulli queda aplicable también en la dinámica. A −mi~¨r i se llama fuerza inercial
de D’alembert. En el problema estático asociado, las fuerzas de reacción de las ligaduras
coinciden con las del problema original, dinámico.
Ejemplo 2.6.1 Sea un recipiente lleno de agua que se mueve con una aceleración ~a perpendicular a la fuerza de gravedad (véase figura 2.8). Hallar la forma y la posición de la
superficie del agua.
36 / Mecánica clásica avanzada
Cuando ~a = 0, la única fuerza aplicada sobre cada elemento de volumen es la de
gravedad; las fuerzas ejercidas por el resto del lı́quido pueden asumirse como de reacción.
La forma de la superficie en el caso estático es plana y horizontal, perpendicular a la
fuerza aplicada.
dm
–dma
a
ϕ
ϕ
F ( a) = –dmgk
Figura 2.8 Diagrama de fuerzas ejercidas sobre el elemento de masa dm
En el caso dinámico, a cada elemento de masa dm se le aplica adicionalmente una
fuerza ficticia −dm ~a. La superficie del agua será ahora un plano perpendicular a la
fuerza F~ (a+f ) . La inclinación de la superficie estará dada por:
tan φ =
a
g
(2.143)
Ejemplo 2.6.2 Sean dos partı́culas en un doble plano inclinado, unidas por una cuerda
inextensible sin masa (véase figura 2.9). Hallar la condición de equilibrio. Resolver el
problema dinámico.
Las ligaduras son:
z1 =
0 z2 = 0
y1 =
x1 tan α1
y2 =
−x2 tan α2
(2.144)
p
p
x21 + y12 + x22 + y22 =
l
Ecuaciones generales de la estática y la dinámica / 37
y
α2
z
α1
m
m1
2
α2
α1
Figura 2.9 Dos partı́culas en un doble plano inclinado, unidas por una cuerda inextensible
sin masa.
Hay sólo un grado de libertad. Los desplazamientos virtuales son a lo largo de
los planos, como los desplazamientos reales. El principio de los trabajos virtuales nos
conduce a:
−m1 g ĵ · δ~r1 − m2 g ĵ · δ~r2 = 0
(2.145)
−m1 tan α δx1 + m2 tan α2 δx2 = 0
(2.146)
es decir:
De la condición de ligadura impuesta por la cuerda se obtiene:
δx1 =
cos α1
δx2
cos α2
(2.147)
Con lo cual la ecuación de equilibrio queda ası́:
cos α1
−m1 tan α1
+ tan α2 δx2 = 0
cos α2
(2.148)
Como δx2 es arbitrario, se obtiene que:
m1 senα1 = m2 senα2
(2.149)
O sea que cuando los ángulos y las masas sean tales que se cumple la anterior
condición, el sistema estará en equilibrio en cualquier posición.
Para el caso dinámico, o sea cuando m1 senα1 6= m2 senα1 , aplicamos la ecuación
general de la dinámica:
(m1~g − m1~a1 ) · δ~r1 + (m2~g − m2~a2 ) · δ~r2 = 0
(2.150)
Las aceleraciones deben ser compatibles con las ligaduras, con lo cual se obtienen
las siguientes relaciones:
a1x = a2x
cos α1
;
cos α2
a1y = a1x tan α1 ;
a2y = −a2x tan α2
(2.151)
38 / Mecánica clásica avanzada
Además, entre los desplazamientos virtuales hay estas tres relaciones:
cos α2
senα2
δy1 = δx1 tan α1 ; δx2 = δx1
; δy2 = −δx1
cos α1
cos α1
(2.152)
Al expresar en la ecuación general de la dinámica todas las componentes de las
aceleraciones en términos de a1x y todos los desplazamientos virtuales en términos de
δx1 , obtenemos:
"
senα2
− m1 g tan α1 + m2 g
senα1
(2.153)
#
−(m1 sec2 α1 + m2 sec2 α1 ) a1 x δx1 = 0
Con lo cual se obtiene a a1x y por consiguiente a a1y . La magnitud de ~a1 será:
a1 =
|m1 g senα1 − m2 g senα2 |
m1 + m2
(2.154)
La aceleración a2 tiene igual magnitud. Las componentes x de las aceleraciones
son iguales y de signos contrarios.
Sistema de ecuaciones de la dinámica. Para sistemas holónomos, el principio
de D’alembert permite usar los resultados obtenidos en el caso estático. Las ecuaciones
(a)
(2.63) nos permiten obtener las ecuaciones de movimiento con sólo reemplazar a F~i
(a)
por F~i − mi~¨r i :
(a)
F~i − mi~¨r i +
N
X
λα
α=1
∂fα
=0
∂~ri
(2.155)
Para un sistema no holónomo, además de lo anterior, los desplazamientos virtuales
deben satisfacer las relaciones (2.33):
N
X
i=1
~lα · δ~ri = 0 ;
i
α = 1, 2, ... n
(2.156)
Debemos entonces introducir los multiplicadores de Lagrange adicionales µ1 , µ2 ,
...µn , que escogeremos de modo que se anulen los coeficientes de los n desplazamientos
dependientes adicionales. Para ello, multiplicamos (2.33) por µα y sumamos sobre α:
N X
n
X
i=1 α=1
µα ~lαi · δ~ri = 0
(2.157)
Claramente se ve que en este caso las ecuaciones de movimiento tomarán la siguiente expresión:
(a)
mi~r¨i = F~i +
h
X
α=1
n
λα
∂fα X ~
+
µα lαi ;
∂~ri
α=1
i = 1, 2, ... N
(2.158)
Ecuaciones generales de la estática y la dinámica / 39
Estas 3N ecuaciones contienen las 3N + n + h incógnitas ~r1 , ~r2 , ... ~rN , λ1 , λ2 ,
...λh , µ1 , µ2 , ...µn que junto con las n + h condiciones de ligadura (2.11) y (2.15) nos
dan 3N + n + h ecuaciones con 3N + n + h incógnitas. Esta vez las ecuaciones serán
diferenciales acopladas. Las fuerzas de ligadura estarán dadas por:
~i =
R
h
X
α=1
n
λα
∂fα X ~
+
µα lαi ;
∂~ri
α=1
i = 1, 2, ... N
(2.159)
Las ecuaciones (2.158) se llaman ecuaciones de Lagrange de la primera clase y
fueron dadas por Lagrange en el año de 1788. La ecuación (2.159) nos permite obtener la
contribución de cada ligadura a las fuerzas de reacción de las ligaduras. Este formalismo
es aplicable a cualquier sistema mecánico con ligaduras ideales, holónomo o no holónomo,
sometido a fuerzas conservativas o no conservativas.
Ejemplo 2.6.3 Sea un alambre largo, rı́gido, que gira uniformemente alrededor de un
eje perpendicular a él. Una bolita se desliza en el alambre sin fricción. No hay fuerzas
aplicadas (véase figura 2.10). Hallar la trayectoria de la partı́cula y las fuerzas de reacción
de la ligadura.
Elegimos las coordenadas de modo que el alambre permanece en el plano x − y. La
ecuación de ligadura es:
tan ωt x − y = 0
(2.160)
y
m
ωt
0
x
Figura 2.10 Alambre largo y rı́gido que gira uniformemente alrededor de un eje perpendicular
a él. La masa m se desliza sobre él sin fricción.
Las ecuaciones (2.158) y (2.159) para este caso son:
mẍ = λ tan ωt
(2.161)
mÿ = −λ
(2.162)
Rx = λ tan ωt ;
R − y = −λ
(2.163)
40 / Mecánica clásica avanzada
La ecuación de ligadura nos proporciona la siguiente ecuación diferencial, que junto
con (2.161) y (2.162) nos permite obtener a x, y, λ:
ÿ = ẍ tan ωt + 2ẋω sec2 ωt + 2ω 2 x sec2 ωt tan ωt
(2.164)
La ecuación diferencial para x es:
ẍ + 2ω ẋ tan ωt + 2ω 2 x tan2 ωt = 0
(2.165)
Haciendo la sustitución x = u cos ωt obtenemos la siguiente ecuación diferencial
para u:
ü − ω 2 u = 0
(2.166)
Con lo cual la solución para x, y, λ es:
x = A cosh ωt cos ωt
(2.167)
y = A cosh ωt senωt
(2.168)
λ = −2Amω 2 senhωt cos ωt
(2.169)
Las componentes de la fuerza de reacción de la ligadura son:
Rx = −2Amω 2 senhωt senωt ;
Ry = 2Amω 2 senhωt cos ωt
(2.170)
~ con el eje x está dado por:
El ángulo de R
Ry
= cot ωt
Rx
(2.171)
~ es siempre perpendicular al alambre y su magnitud es R = 2Amω 2 senhωt.
o sea que R
2.7.
Las ecuaciones de la dinámica en coordenadas
generalizadas para sistemas holónomos
Al introducir las coordenadas generalizadas independientes las ecuaciones de ligadura se satisfacen idénticamente. El paso a coordenadas generalizadas de la ecuación
general de la dinámica se puede realizar en forma análoga al caso de la estática en virtud del principio de D’alembert. De acuerdo con las ecuaciones (2.142) y (2.116) las
ecuaciones de movimiento en coordenadas generalizadas son:
)
Q(a+f
=
ν
N
X
ri
(a+f ) ∂~
= 0;
·
F~i
∂qν
i=1
ν = 1, 2, ... l
(2.172)
o, más explı́citamente,
N ∂~r
X
i
(a)
= 0;
F~i − mi~¨r i ·
∂q
ν
i=1
ν = 1, 2, ... l
(2.173)
Ecuaciones generales de la estática y la dinámica / 41
Definimos la fuerza generalizada aplicada asociada al grado de libertad ν por:
Q(a)
ν =
N
X
ri
(a) ∂~
F~i ·
∂qν
i=1
(2.174)
La fuerza generalizada asociada correspondiente a la fuerza de inercia se puede
relacionar con la energı́a cinética de la siguiente manera:
)
Q(f
ν
=
=
N
X
d~r˙i ∂~ri
·
dt ∂qν
i=1
N X
d ˙ ∂~ri
d ∂~ri
˙
−
mi
~ri ·
− mi~ri ·
dt
∂qν
dt ∂qν
−
mi
(2.175)
i=1
Podemos expresar en (2.175) a ∂~ri /∂qν y su derivada temporal en términos de
derivadas respecto a ~r˙ i . Para ello partimos de la siguiente expresión para ~r˙ i :
~r˙ i =
l
X
∂~ri
∂~ri
q̇µ +
∂q
∂t
µ
µ=1
(2.176)
mediante la cual obtenemos:
∂~ri
∂~r˙i
=
;
∂ q̇ν
∂qν
l
X
∂ 2~ri
d ∂~ri
∂ 2~ri
=
q̇µ +
dt ∂qν
∂qµ ∂qν
∂t∂qν
µ=1
(2.177)
Por otra parte tenemos que:
l
X
∂~r˙ i
∂ d~ri
∂ 2~ri
∂ 2~ri
=
q̇µ +
=
∂qν
∂qν dt
∂qν ∂qµ
∂qν ∂t
µ=1
(2.178)
De (2.177) y (2.178) se sigue entonces que:
∂~r˙i
∂~ri
=
;
∂ q̇ν
∂qν
d ∂~ri
∂~r˙i
=
dt ∂qν
∂qν
(2.179)
Mediante (2.179) el lado derecho de (2.175) se transforma en:
!
#
"
N
˙i
X
∂
~
r
d ˙ ∂~r˙ i
− mi~r˙ i ·
=
~ri ·
mi
−
dt
∂q
∂qν
ν
i=1
(2.180)
N
N
d X1
∂ ˙2 X 1 ∂ ˙2
−
mi
~ri +
~r
mi
dt i=1 2 ∂ q̇ν
2 ∂qν i
i=1
Las ecuaciones (2.174) y (2.180) nos permiten escribir a (2.173) en la forma:
Q(a)
ν −
∂T
d ∂T
+
= 0;
dt ∂ q̇ν
∂qν
ν = 1, 2, ... l
(2.181)
42 / Mecánica clásica avanzada
Igual que en el caso estático las fuerzas generalizadas de ligadura se anulan, según
una ecuación análoga a la (2.117).
Las ecuaciones (2.181) se denominan las ecuaciones de Lagrange de la segunda
clase. En esas ecuaciones T es la energı́a cinética del sistema. Una vez resueltas las ecuaciones (2.181) mediante las fórmulas de transformación (2.21) y (2.23) se hallan los ~ri (t)
(a)
con los cuales se pueden hallar F~i (t) y ~¨ri que permiten obtener de (2.140) las fuerzas
de reacción de las ligaduras.
Fuerzas derivables de un potencial. Si todas las fuerzas aplicadas se pueden obtener de una función V mediante las fórmulas (2.118), las fuerzas generalizadas
tomarán la forma:
Q(a)
ν =−
∂
V (q, t) ;
∂qν
ν = 1, 2, ... l
Como ∂V /∂ q̇ν = 0, (2.181) se pueden escribir:
∂
d ∂(T − V )
−
(T − V ) = 0 ν = 1, 2, ... l
dt
∂ q̇ν
∂qν
(2.182)
(2.183)
T en coordenadas generalizadas depende de (q), (q̇) y de t en el caso en que las ligaduras sean reónomas. Se define la función lagrangiana, o simplemente “el lagrangiano”
L ası́:
L(q, q̇, t) ≡ T (q, q̇, t) − V (q, t)
(2.184)
Entonces las ecuaciones de movimiento para un sistema holónomo con fuerzas
derivables de un potencial que no depende de las velocidades son:
d ∂L
∂L
−
= 0;
dt ∂ q̇ν
∂qν
ν = 1, 2, ... l
(2.185)
Las ecuaciones (2.185) se denominan usualmente “ecuaciones de Lagrange” y hay
una por cada grado de libertad del sistema.
Covariancia de las ecuaciones de Lagrange. Sean dos conjuntos diferentes de
coordenadas generalizadas (q) y (q) relacionadas mediante la transformación:
qν = qν (q, t) ;
q ν = q ν (q, t) ;
ν = 1, 2, ... l
(2.186)
Esta transformación que no mezcla coordenadas con velocidades se denomina puntual. Queremos hallar si en las coordenadas (q) las ecuaciones de Lagrange toman la
forma de (2.185) en las coordenadas (q). Mediante la transformación (2.186) tenemos
que:
l
l
X
X
∂L
∂L ∂ q̇α
∂L ∂qα
=
=
∂
q̇
∂
q̇α ∂qν
∂ q̇ν
α ∂ q̇ ν
α=1
α=1
(2.187)
Ecuaciones generales de la estática y la dinámica / 43
donde L es la función de (q), (q̇) y t, que se obtiene de L(q, q̇, t) al realizar la transformación: L(q, q,˙ t) ≡ L q(q, t), q̇(q, q̇, t), t . Por otra parte:
" l
X
d ∂L ∂qα
d ∂L
=
dt ∂ q̇ν
dt ∂ q̇α ∂qα
α=1
!#
l
∂L X ∂ 2 qα
∂ 2 qα
(2.188)
+
+
∂ q̇α µ=1 ∂qµ ∂q ν
∂t∂q ν
l X
∂L ∂qα
∂L ∂ q̇α
∂L
=
+
∂q µ
∂qα ∂q ν
∂ q̇α ∂qν
α=1
(2.189)
Entonces se sigue de (2.188), (2.189) y (2.185) que:
l X
d ∂L
d ∂L
∂L ∂ q̇α
∂L
−
=
=0
−
dt ∂ q̇ν
∂q ν
dt ∂ q̇α
∂qα ∂q ν
α=1
(2.190)
Es decir, la forma de las ecuaciones de Lagrange es la misma en cualquier sistema de coordenadas generalizadas. Es interesante la siguiente relación que se obtiene
directamente usando la transformación puntual (2.186):
l
l
X
X
∂L
∂L
q̇ ν
q̇ν =
∂
q̇
∂ q̇ν
ν
α=1
ν=1
(2.191)
Sistema sin ligaduras. Si no hay ligaduras las fórmulas (2.185) siguen siendo
válidas, donde l = 3N . Se sigue de (2.190) que cuando el sistema no tiene ligaduras las
ecuaciones de Lagrange (2.185) constituyen la forma de las ecuaciones de movimiento
en cualquier sistema de coordenadas, propiedad que no cumplen las ecuaciones de la
segunda ley de Newton, que son de naturaleza vectorial: las ecuaciones de Lagrange
contienen la misma información que la segunda ley de Newton con la ventaja adicional
de ser ecuaciones completamente covariantes.
En coordenadas cartesianas las fuerzas generalizadas son de la forma Qxi , Qyi ,
Qzi .
Qxj =
T =
N
X
N
X (a)
ri
(a)
(a) ∂~
F~i · µ̂x δij = Fix
=
F~i ·
∂x
j
i=1
i=1
N
X
1
i=1
2
mi ẋ2i + ẏi2 + żi2
(2.192)
(2.193)
Con lo cual las ecuaciones (2.181) nos dan:
(a)
mi ẍi = Fix
es decir, las ecuaciones de Lagrange conducen a la segunda ley de Newton.
(2.194)
44 / Mecánica clásica avanzada
Comparación de los formalismos newtoniano y lagrangiano. Llamaremos
newtoniano al formalismo basado en la ecuación general de la dinámica directamente.
Este formalismo tiene la ventaja de su generalidad. Sin embargo, para sistemas holónomos con fuerzas derivables de un potencial, el formalismo basado en las ecuaciones de
Lagrange presenta algunas ventajas: las ecuaciones de movimiento se obtienen a partir
de una sola función escalar, la lagrangiana L, en tanto que en el formalismo newtoniano
se trabaja con las fuerzas que actúan sobre las partı́culas. El uso de coordenadas generalizadas permite en el formalismo lagrangiano eliminar del problema las fuerzas de
ligadura y las coordenadas superfluas. En el formalismo lagrangiano se trabaja con l parametros independientes que no se refieren a las partı́culas sino al sistema como un todo,
en cambio en el formalismo newtoniano se trabaja necesariamente con coordenadas de
las partı́culas. Finalmente, la covariancia de las ecuaciones de Lagrange es claramente
una ventaja del formalismo lagrangiano.
Ejemplo 2.7.1 Sea un alambre largo y rı́gido que rota uniformemente alrededor de un
punto O como se muestra en la figura 2.11. Una partı́cula de masa m está sometida
a la ligadura de permanecer sobre el alambre. No hay fricción y actúa la fuerza de
gravedad en el plano de rotación del alambre. Resolver el problema usando coordenadas
generalizadas y las ecuaciones de Lagrange.
y
A
c
ωt
h
m
β
ωt
O
B
x
–mgj
Figura 2.11 Alambre largo y rı́gido que gira uniformemente alrededor de un punto O
Suponer que en t = 0 la partı́cula parte del punto C con velocidad cero a lo largo
del alambre. La ligadura es holónoma y reónoma, dada por la ecuación de la linea del
alambre:
y = x tan β + OA
(2.195)
Ecuaciones generales de la estática y la dinámica / 45
De la geometrı́a se sigue que sen ωt = h/OA y tan β = − cot α, con lo cual la ecuación
de ligadura toma la forma:
x cos ωt + y senωt − h = 0
(2.196)
Es una ligadura dependiente explı́citamente del tiempo. El sistema tiene sólo un
grado de libertad. Podemos tomar como coordenada generalizada el desplazamiento de
partı́cula sobre el alambre respecto el punto C. Las ecuaciones de transformación son:
x(q, t) =
q senωt + h cos ωt
y(q, t) =
−q cos ωt + h senωt
(2.197)
Al reemplazar (2.197) en (2.196) se obtiene la identidad 0 = 0. El lagrangiano del
problema es:
L=
1
m(ẋ2 + ẏ 2 ) − mgy
2
(2.198)
L expresado en términos de la coordenada generalizada q y la velocidad generalizada q̇ es:
L(q, q̇, t) = 21 m(q̇ 2 + q 2 ω 2 + h2 ω 2 − 2q̇hω)
(2.199)
−mg(h senωt − q cos ωt)
Para escribir la ecuación de Lagrange se requiere conocer:
∂L
= mqω 2 + mg cos α ;
∂q
∂L
= m(q̇ − hω)
∂ q̇
(2.200)
Con lo cual la ecuación de movimiento para la coordenada generalizada q (ecuación
de Lagrange) es:
q̈ − qω 2 = g cos ωt
(2.201)
Claramente la solución de (2.201) es de la forma:
q = Aeωt + Be−ωt + C cos ωt
(2.202)
que satisface las condiciones iniciales q(0) = 0, q̇(0) = 0 sólo si A = B = −(1/2)C. C se
determina reemplazando (2.202) en (2.201), obteniéndose finalmente para q(t):
q(t) =
g
(cosh ωt − cos ωt)
2ω 2
(2.203)
Las fuerzas de reacción de las ligaduras se determinan a partir de la ecuación
(2.140):
Rx =
mẍ
Ry =
mg + mÿ
(2.204)
46 / Mecánica clásica avanzada
Las ecuaciones (2.197) y (2.203) permiten calcular a ẍ y ÿ:
ẍ
= q̈ senωt + 2q̇ω cos ωt − qω 2 senωt − hω 2 cos ωt
ÿ
= −q cos ωt + 2q̇ω senωt + qω 2 cos ωt − hω 2 senωt
(2.205)
Con lo cual se obtiene para Rx y Ry:
Rx = mg(senhωt + 2senωt) cos ωt − mhω 2 cos ωt
Ry
(2.206)
= mg(senhωt + 2senωt)senωt − mhω 2 senωt
El vector ~l está dirigido a lo largo del alambre:
~l = îsenωt − ĵ cos ωt
(2.207)
~ es cero: ~l· R
~ = 0 o sea que R
~ es siempre perpendicular
El producto escalar de ~l con R
al alambre. Su magnitud es:
R = mg(senhωt + 2senωt) − mhω 2
2.8.
(2.208)
Las ecuaciones de la dinámica en coordenadas
generalizadas para sistemas no holónomos. Uso
de coordenadas no independientes
Con sistemas no holónomos no es posible, mediante la introducción de coordenadas generalizadas independientes, eliminar las condiciones de ligadura. Por alguna razón
serı́a deseable trabajar con un conjunto de 3N coordenadas no cartesianas q1 , q2 , ... q3N ,
que no serán independientes. Incluso serı́a posible trabajar con un conjunto de 3N − h
coordenadas generalizadas no independientes definido de tal manera que se eliminen
del problema las ligaduras holónomas. En cualquiera de estos dos casos debemos trabajar con coordenadas generalizadas no independientes. Se trata de hallar las ecuaciones
de movimiento usando estas coordenadas. Para ello basta partir de las ecuaciones de
Lagrange de la segunda clase, ecuaciones (2.181), considerando esta vez las Qν como
formadas de las fuerzas aplicadas y de las fuerzas de ligadura (2.159):
!
h
N
n
X
X
X
∂f
∂~ri
α
(a)
λα
F~i +
Qν =
+
µα~lαi ·
∂~
r
∂q
i
ν
α=1
α=1
i=1
ν = 1, 2, ... 3N
(2.209)
definimos las cantidades dα y aαν de la siguiente manera:
∂fα
;
dα =
∂t
aαν =
N
X
∂fα
i=1
∂~ri
·
∂~ri
∂fα
=
∂qν
∂qν
para α = 1, 2, ... h
(2.210)
Ecuaciones generales de la estática y la dinámica / 47
dα = Dα ;
aαν =
N
X
~lα · ∂~r1
∂qν
i=1
para α = h + 1, h + 2, ... h + n = k
(2.211)
Con lo cual podemos escribir a (2.209) como:
Qν = Q(a)
ν +
k
X
λα aαν
(2.212)
α=1
donde esta vez λα representan los k multiplicadores de Lagrange λ1 , λ2 , ... λh , µ1 , µ2 ,
... µn . Las ecuaciones de Lagrange de la segunda clase se pueden escribir entonces en la
forma:
k
X
∂T
d ∂T
−
= Qν(a) +
λα aαν ;
dt ∂ q̇ν
∂qν
α=1
ν = 1, 2, ... 3N
(2.213)
En resumen, con las coordenadas generalizadas q1 , q2 , ... q3N las ecuaciones de
ligadura se pueden escribir en la forma:
3N
X
aαν q̇α + dα = 0 ;
α = 1, 2, ... h, h + 1, h + 2, ... h + n = k
(2.214)
α=1
que junto con las 3N ecuaciones de Lagrange nos proporcionan 3N + k ecuaciones con
las 3N + k incógnitas siguientes: q1 , q2 , ... q3N , λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las fuerzas
de
Pkreacción de las ligaduras en estas coordenadas no independientes estarán dadas por
α=1 λα aαν , o más explı́citamente:
h
X
n
∂fα X
+
µα aαν
Rν =
λα
∂qα α=1
α=1
(2.215)
Ejemplo 2.8.1 Resolver el problema del ejemplo 2.7.1 usando multiplicadores de Lagrange y coordenadas no independientes.
Tomaremos a q y h como coordenadas generalizadas no independientes. En la
ecuación de ligadura escribiremos a la distancia OC como h0 :
f (x, y, t) = x cos ωt + y senωt − h0
(2.216)
Haciendo la transformación de las coordenadas x, y a las coordenadas q, h, ecuación
(2.197), obtenemos para ~r y f :
f (q, h, t) = h − h0
(2.217)
~r(q, h, t) = q(î senωt − ĵ cos ωt) + h(î cos ωt + ĵ senωt)
(2.218)
48 / Mecánica clásica avanzada
con lo cual se obtienen las siquientes expresiones para los coeficientes aq , ah , d, según
(2.210):
aq =
∂f
=0
∂q
ah =
∂f
=1
∂h
(2.219)
∂f
=0
∂t
Las fuerzas aplicadas generalizadas serán:
d=
Qν = −mg î ·
∂~r
∂qν
(2.220)
con lo cual:
Qh = −mg senωt ;
Qq = mg cos ωt
(2.221)
La energı́a cinética será:
T (q, q̇, h, ḣ, t) =
1
m(q̇ 2 + q 2 ω 2 + h2 ω 2 − 2q̇hω + 2q ḣω + ḣ2 )
2
(2.222)
Entonces las ecuaciones (2.213) serán:
m(q̈ − ḣω) − m(qω 2 + ḣω) = mg cos ωt
(2.223)
m(ḧ + q̇ω) − m(hω 2 − q̇ω) = −mg sen ωt + λ
La ecuación (2.214) será:
ḣ = 0 ⇒ h = h0
(2.224)
Reemplazando (2.224) en (2.223) obtenemos:
q̈ − qω 2 = g cos ωt
(2.225)
λ
= 2q̇ω − hω 2 + g senωt
m
La solución de las ecuaciones (2.225) de acuerdo con (2.224) será:
g
(cosh ωt − cos ωt)
q =
2ω 2
λ
= mg(senhωt + 2senωt) − mhω
(2.226)
2
Las fuerzas generalizadas de ligadura serán, de (2.226) y (2.215):
Rh = mg(senhωt + 2senωt) − mhω 2 ;
Rq = 0
en completo acuerdo con los resultados de (2.208).
(2.227)
Ecuaciones generales de la estática y la dinámica / 49
Ejemplo 2.8.2 Sea un disco de radio R que rueda sobre un plano inclinado con el plano
del disco perpendicular al plano inclinado (podrı́a ser una de las ruedas de un carro).
Hallar y resolver las ecuaciones de movimiento.
Tomaremos el plano xy en el plano inclinado, con lo cual se tendrá una configuración como en la figura 2.1. Las coordenadas del sistema serán: xCM , yCM , α, φ,
que tomamos como coordenadas genaralizadas no independientes. De las ecuaciones de
ligadura, no holónomas dadas por las ecuaciones (2.9):
ẋ − R senα φ̇ = 0
(2.228)
ẏ + R cos α φ̇ = 0
obtenemos las siquientes expresiones para los coeficientes aαν que aparecen en (2.214):
a1x = 1
a1y = 0
a1α = 0
a1φ = −R senα
a2x = 0
a2y = 1
a2α = 0
a2φ = R cos α
(2.229)
Los momentos de inercia de un disco alrededor de su eje y alrededor de un diámetro
son respectivamente:
1
1
mR2 ; Iα = mR2
(2.230)
2
4
La energı́a cinética contendrá una parte debida al movimiento del centro de masa
y otra debida al movimiento respecto al centro de masa:2
Iφ =
1
1
1
m(ẋ2 + ẏ 2 ) + mR2 φ̇2 + mR2 α̇2
(2.231)
2
4
8
Tomaremos los ejes xy de modo que el eje x esté horizontal y el eje y haciendo un
ángulo β con la horizontal. Las fuerzas generalizadas serán entonces:
T =
(a)
Q(a)
α = Qφ = 0 ;
Q(a)
x = 0;
Q(a)
y = mg senβ
(2.232)
Usando las ecuaciones (2.229), (2.231) y (2.232), las ecuaciones (2.213) se transforman en:
mẍ = µ1
mÿ = mg senβ + µ2
1 2
R mα̈ = 0
4
(2.233)
1 2
R mφ̈ = −µ1 R senα + µ2 R cos α
2
La tercera de las ecuaciones (2.233) nos da:
α = ωα t + α0
2 Para
una justificación rigurosa de (2.231) ver sección 8.3.
(2.234)
50 / Mecánica clásica avanzada
Las dos primeras ecuaciones (2.233) junto con las (2.228) nos dan las siguientes
expresiones para µ1 y µ2 en términos de φ:
µ1 = mRωα cos(ωα t + α0 ) φ̇ + mR cos(ωα t + α0 ) φ̈
(2.235)
µ2 = mRωα sen(ωα t + α0 ) φ̇ − mR cos(ωα t + α0 )φ̈ − mg sen β
Ahora, reemplazando a µ1 y µ2 en la última de las (2.233) obtenemos:
2 g
φ̈ = −
senβ cos(ωα t + α0 )
3 R
que al ser integrada nos da:
2g
senβ cos(ωα t + α0 ) + At + B
φ=
3Rωα2
Tomando la condición inicial φ(0) = 0 y φ̇(0) = 0, (2.237) será:
2g
senβ[cos(ωα t + α0 ) − cosα0 + ωt senα0 ]
φ=
3Rωα2
(2.236)
(2.237)
(2.238)
Tomando además a α0 = 0, lo que equivale a tomar en t=0 a α = 0, obtenemos:
α
= ωα t
φ
=−
µ1
µ2
2gsenβ
ωt
sen2
3Rωα2
2
2
= − mg senβsen2ωα t
3
2
= −mgβ 1 − cos 2ωα t
3
x
g senβ
=−
3ωα2
y
=
(2.239)
1
ωα t − sen2ωα t
2
gsenβ
sen2 ωα t
3ωα2
Donde hemos tomado que x = 0, y = 0, ẋ = 0, ẏ = 0 en t = 0.
Las fuerzas de reacción de las ligaduras serán, usando (2.215):
Rx = µ1
Ry = µ2
Rα = 0
Rφ = −µ1 R senωα t + µ2 R cos ωα t
1
= − mgR senβ cos ωα t
3
(2.240)
Ecuaciones generales de la estática y la dinámica / 51
Si se deja la rueda inicialmente alineada en el eje y, se tiene que ωα = 0, con lo
cual:
α=
0
φ=
−
x=
0
y=
1
gsenβ t2
3
g senβ 2
t
3R
Rx =
0
Ry =
1
− mg senβ
3
Rα =
0
(2.241)
1
− mgR senβ
3
R=
Si en vez de un disco se tuviera una masa que baja sin rozamiento a lo largo del eje
y, la fuerza a lo largo del plano serı́a mg senβ. En este caso se tiene que el plano ejerce
sobre la rueda una fuerza en y dada por (−1/3)mg senβ y que la hace rodar hacia abajo
en la dirección de y positiva. Rφ es el torque que produce la rotación. La aceleración del
centro de masa será (2/3)g senβ con lo cual y = (1/3) senβ t2 y φ = (1/3)g senβ t2 /R.
Ejemplo 2.8.3 Sean dos partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida
de longitud l, sin masa. El sistema de alguna manera está constreñido a moverse en un
plano vertical, de modo que la velocidad del centro de masa siempre está en la dirección
de la varilla (véase figura 2.12). Hallar y resolver las ecuaciones de movimiento.
x
r1
r
r2
1
·
α
g
2
y
Figura 2.12 Partı́culas de masas m1 = m2 = 1 unidas por una varilla rı́gida y constreñidas a
moverse en un plano vertical
52 / Mecánica clásica avanzada
La ligadura holónoma es:
|~r1 − ~r2 | = l
(2.242)
La ligadura no holónoma es:
ẋ
= tan α
ẏ
(2.243)
Escogemos como coordenadas generalizadas no independientes a x, y y α. Definimos el vector ~l como:
~l = ~r1 − ~r2
(2.244)
con magnitud l y dirección α. Las ecuaciones de transformación de coordenadas son:
~r1 = ~r +
~l
2
(2.245)
~l
~r2 = ~r −
2
La energı́a cinética se puede escribir como:
1
T = ẋ2 + ẏ 2 + l2 α̇2
4
(2.246)
Los coeficientes en la ecuación de ligadura no holónoma son:
ax = − tan α ;
ay = 1 ;
aα = 0
(2.247)
La fuerza aplicada generalizada es:
Qx = 0 ;
Qy = 2g ;
Qα = 0
(2.248)
Las ecuaciones de Lagrange, (2.213), serán:
2ẍ =
−µ tan α
2ÿ − 2g =
µ
1 2
l α̈ =
2
0
(2.249)
Para α se halla:
α = ωt + δ
(2.250)
x, y y µ se hallan de las ecuaciones:
2ẍ =
−µ tan(ωt + δ)
2ÿ =
2g + µ
ẏ − ẋ tan(ωt + δ) =
0
(2.251)
Ecuaciones generales de la estática y la dinámica / 53
ẋ obedece la ecuación diferencial:
2ẍ + 2ẋω tan α = g sen2α
(2.252)
Esta es una ecuación diferencial lineal de primer orden en ẋ cuya solución general
está dada por una fórmula estándar. La solución para ẋ es:
ẋ = −
g
(1 + cos 2α) + A cos α
2ω
(2.253)
Su integral nos da directamente:
x=−
A
g
(2ωt + sen2α) + senα + B
Aω 2
ω
(2.254)
donde A y B son constantes de integración. Para y y µ se halla:
y=
A
g
cos 2α −
cos α + C
2
4ω
ω
µ = −2g(1 + cos 2α) + 2Aω cos α
(2.255)
(2.256)
Las fuerzas de reacción de las ligaduras serán:
Rx =
2g sen2α − 2Aω senα
Ry =
−4g cos 2α + 2Aω cos α
Rα =
0
(2.257)
Se sigue que si al sistema se aplica una fuerza dada por (2.257), se moverá con
la condición de ligadura (2.243). ω, δ, A, B, y C son constantes de integración que
dependen de las condiciones iniciales.
54 / Mecánica clásica avanzada
3
El principio de Hamilton y las ecuaciones de
Lagrange
3.1.
Forma integral de la ecuación general de la dinámica para un sistema holónomo
Trayectorias variadas. La ecuación general de la dinámica, ecuación (2.141), es
válida en cada instante t, ya que por definición los δ~ri se realizan instantáneamente
alrededor de la posición real del sistema. La ecuación general de la dinámica es un
“principio diferencial” que expresa la anulación del trabajo virtual de las fuerzas de
ligadura en cada instante t, o equivalentemente en cada configuración del sistema.
Tomemos fijos t1 y t2 . Si en cada instante t, entre t1 y t2 , se realiza un desplazamiento virtual en las coordenadas de cada partı́cula, δ~ri (t), y se impone la condición
δ~ri (t1 ) = δ~ri (t2 ) = 0 se obtendrá que la secuencia de desplazamientos virtuales define
una trayectoria diferente entre t1 y t2 . A esta trayectoria se le denomina “trayectoria variada” y la trayectoria seguida por el sistema se denomina “trayectoria real” (véase figura
3.1 ). La función del tiempo ~ri (t) determina la trayectoria real y la función ~ri (t) + δ~ri (t)
determina la trayectoria variada. A la función δ~ri (t) se le denomina la “variación” de
la función ~ri (t). También se suele llamar “trayectoria recta” a la real y “trayectoria
circuitosa” a la variada (véase figura 3.1). ~ri (t) es una representación paramétrica de la
trayectoria con parámetro t. De acuerdo con los comentarios de la sección 2.3, el conjunto de desplazamientos virtuales en un tiempo t puede asociarse a un “ensamble” muy
grande de sistemas.
Las trayectorias se forman uniendo un elemento de una “fila”, t, a un elemento
de la “fila” t + dt, en forma de “zig-zag” en la matriz bidimensional mencionada en la
sección 2.3; una trayectoria será “recta”; todas las demás serán “circuitosas”.
Si el trabajo virtual de las fuerzas de ligadura es cero en cada instante t:
N
X
i=1
~ i (t) · δ~ri (t) = 0,
R
(3.1)
también será cero el promedio de los trabajos virtuales realizados por las fuerzas de
55
56 / Mecánica clásica avanzada
z
Trayectoria variada
2
δri
mi
1
Trayectoria real
ri
y
x
Figura 3.1 Representación de trayectorias en desplazamientos virtuales
ligadura entre t1 y t2 :
1
t2 − t1
Z
N
t2 X
t1
i=1
~ i (t) · δ~ri (t)dt = 0
R
(3.2)
Como consecuencia de lo anterior, la ecuación general de la dinámica toma la
forma:
Z
N h
t2 X
t1
i=1
i
(a)
F~i (t) − mi~¨r i (t) · δ~ri (t)dt = 0
(3.3)
Esta es una expresión integral, en términos ya no de desplazamientos virtuales sino
de variaciones globales de las trayectorias de las partı́culas. Transformando la ecuación
(3.3) llegaremos a una expresión completamente equivalente a la ecuación general de la
dinámica y por lo tanto a las ecuaciones de Lagrange de la primera y de la segunda
clase, para sistema holónomos.
Cada punto de la trayectoria variada se puede obtener de un punto de la trayectoria
real, para cada una de las partı́culas, por medio de un desplazamiento virtual. Como
consecuencia de esto, tanto la trayectoria real como la variada han de ser compatibles
con las condiciones de ligadura.
En cada instante t podemos escribir los δ~ri como:
δ~ri (t) = ~ri v (t) − ~ri r (t)
(3.4)
donde v denota “variada” y r “real”. Se impone la condición de que las variaciones se
anulen en t1 y en t2 para cada partı́cula. Es decir que ~riv (t) = ~rir (t) en t = t1 y t = t2
para i = 1, 2, ...N .
El principio de Hamilton y las ecuaciones de Lagrange / 57
La integral de acción. Es la integral (3.3) haciendo algunas transformaciones.
En la ecuación (3.3) hacemos la siguiente transformación:
d ˙
d
mi~¨r i · δ~ri =
mi~ri · δ~ri − mi~r˙ i · (δ~ri )
(3.5)
dt
dt
Notando que las operaciones δ y d/dt conmutan:
d
d
(δ~ri ) =
[~ri v (t) − ~ri r (t)] = ~r˙ i v − ~r˙ i r = δ~r˙ i
dt
dt
(3.6)
podemos escribir a (3.5) en la forma:
1
2
d ˙
mi~ri · δ~ri − mi δ~r˙ i
mi~¨r i · δ~ri =
dt
2
(3.7)
Con lo cual se tiene que:
N
X
N
X
d
mi~¨r i · δ~ri =
dt
i=1
i=1
mi~r˙ i · δ~ri
!
−δ
N
X
1
i=1
2
2
mi~r˙ i
Por tanto la ecuación (3.3) tomará la forma:
#
!
Z t2 "X
N
N
N
X
2
d X ˙
(a)
˙
~
mi~ri dt = 0
Fi · δ~ri −
mi~ri · δ~ri + δ
dt i=1
t1
i=1
i=1
(3.8)
(3.9)
Notamos que en (3.9) aparecen el trabajo virtual de las fuerzas aplicadas, δA, y la
energı́a cinética:1
δA =
N
X
i=1
N
(a)
F~i · δ~ri ;
T =
1 X ˙2
mi~ri
2 i=1
(3.10)
O sea que (3.9) se puede escribir como:
Z
t2
t1
(δA + δT )dt −
N
X
i=1
t2
mi~r˙ i · δ r~i
=0
(3.11)
t1
En virtud de la condición impuesta a los desplazamientos virtuales en t = t1 y
t = t2 , el término integrado se anula con lo cual (3.11) queda finalmente:
Z t2
(δA + δT )dt = 0
(3.12)
t1
Podrı́a pensarse que la presencia de condiciones de ligadura harı́a que δ~ri (t1 ) =
δ~ri (t2 ) = 0 no es posible imponerla para todas las coordenadas sino sólo para las independientes, quedando la posibilidad de que no se cumpla para las coordenadas dependientes.
1 Como para pasar de r a r +δ~
ri se requiere realizar un trabajo, la energı́a en cada trayectoria variada
i
i
es diferente. Esto caracteriza al principio de Hamilton, a diferencia de otros principios variacionales como
el de “mı́nima acción” (véase sección 9.3).
58 / Mecánica clásica avanzada
Sin embargo este no es el caso, pues de una transformación a coordenadas generalizadas
independientes q1 , q2 , ...ql se sigue que:
δ~ri =
l
X
∂~ri
δqν
∂qν
ν=1
(3.13)
Basta pues que se imponga la condición siguiente sobre los desplazamientos virtuales de las coordenadas generalizadas:
δqν (t1 ) = δqν (t2 ) = 0 ;
ν = 1, 2, ...l
(3.14)
para que se satisfaga la condición requerida para los desplazamientos virtuales δ~ri .
En el caso particular en que las fuerzas aplicadas se pueden obtener como el gradiente de una función de las coordenadas y del tiempo, V (~r, t) vemos que:
δV (~r, t) =
N
X
∂V
i=1
∂~ri
.δ~ri = −
N
X
i=1
(a)
F~i .δ~ri = −δA
(3.15)
Para este caso la ecuación (3.12) toma la forma:
Z t2
Z t2
Z t2
L dt = 0
δL dt = δ
δ(T − V )dt =
t1
t1
(3.16)
t1
donde el segundo signo igual en (3.16) está justificado por lo siguiente:
Z t2
Z t2
Z t2
Z t2
Z t2
r
v
v
r
L dt
L dt = δ
L dt −
(L − L )dt =
δL dt =
t1
t1
t1
t1
(3.17)
t1
Por medio de las transformaciones a coordenadas independientes se ve que T es
función de (q), (q̇), t, y V es función de (q) y t, con lo cual (3.16) se puede escribir como:
Z t2
L(q, q̇, t)dt = 0
(3.18)
δS = δ
t1
Esta ecuación es equivalente a la ecuación general de la dinámica y de ella se
pueden obtener también las ecuaciones de Lagrange usando el cálculo variacional. A la
integral S se la denomina integral de acción
3.2.
El principio de Hamilton
Es posible el desarrollo formal de la mecánica tomando la ecuación (3.12) como postulado fundamental en vez de partir del principio de D’Alembert, ecuación (2.141). En
este formalismo se denomina al contenido de la ecuación (3.18), el principio de Hamilton.
El principio de Hamilton para sistemas con fuerzas aplicadas derivables
de un potencial. El movimiento del sistema, descrito por las coordenadas generalizadas
qν (t), es tal que entre dos instantes t1 y t2 se satisface:
Z t2
L(q1 , q2 , ...ql ; q̇1 , q̇2 , ...q̇l ; t)dt = 0
(3.19)
δ
t1
El principio de Hamilton y las ecuaciones de Lagrange / 59
Este es un principio variacional, formulado por W. Hamilton en 1835. Matemáticamente
(3.19) es la condición para que la acción S sea una extremal. S es una funcional de la
trayectoria q(t).
En análisis de funciones, se tiene que si F (x1 , x2 , ...xn ) es una función de muchas
variables, F tendrá un valor extremal, máximo o mı́nimo, si al realizar un cambio infinitesimal en las variables F no cambia al primer orden en dichos cambios infinitesimales.
Es decir si:
F (x1 + δx1 , x2 + δx2 , ...xn + δxn ) − F (x1 , x2 , ...xn )
(3.20)
= δF (x1 , x2 , ...xn )
entonces:
δF (x1 , x2 , ...xn ) =
N
X
∂F
δxi + 0(δx2i ) = 0
∂x
i
i=1
(3.21)
Se sigue que F (x1 , x2 , ...xn ) será extremal para aquellos valores de x1 , x2 , ...xn que
hacen que se anulen todas las derivadas parciales de primer orden de F :
∂F
=0
∂xi
i = 1, 2, ...n
(3.22)
En el análisis de funciones F (x1 , x2 , ...xn ) es un número que se asocia al conjunto
de números x1 , x2 , ...xn . Al cambiar los números x1 , x2 , ...xn cambia el número F . Se
dice que F es extremal si no cambia al primer orden en δxi cuando los xi se cambian
por xi + δxi . 2
En el análisis funcional I [f1 (x), f2 (x), ...fn (x)] es un número que se asocia al conjunto
de funciones f1 (x), f2 (x), ...fn (x). Al cambiar las funciones f1 (x), f2 (x), ...fn (x) cambia
el número I. Se dice que I es extremal si no cambia al primer orden en δfi (x) cuando
las funciones fi (x) se cambian por las funciones fi (x) + δfi (x). A δfi (x) se le denomina
variación de la función fi (x). Toda función continua en un punto x0 puede expandirse
en serie de Taylor alrededor de x0 :
fi (x) =
∞
X
1 (k)
f (x0 )(x − x0 )k
k! i
(3.23)
k=0
(k)
donde fi (x0 ) denota el valor de la derivada k-ésima de la función fi (x) en x = x0 y
(n)
(0)
fi (x0 ) ≡ fi (x0 ). Variando los parámetros fi (x0 ) para k = 0, 1, 2, ...∞ se obtiene una
función diferente.
S es una funcional de qν (t), pues a cada posible solución q1 (t), q2 (t), ...ql (t) le
corresponde un valor definido a la integral de acción S. El principio de Hamilton dice
que al variar las funciones qν (t) se obtiene el conjunto de funciones verdaderas que
describen la evolución del sistema por hallar qué conjunto es el que hace que S sea una
extremal. Para la mayorı́a de las situaciones fı́sicas se encuentra que S es mı́nima para
2 El máximo o mı́nimo de una función se halla resolviendo el sistema de ecuaciones algebraicas (3.22),
como en la estática. Los extremales de una funcional se hallan resolviendo un sistema de ecuaciones
diferenciales, como en la dinámica.
60 / Mecánica clásica avanzada
la solución correcta. En otras palabras, S tiene un valor mı́nimo cuando las funciones
qν (t) describen las trayectorias reales.3 El número S asignado a cualquier trayectoria
variada es mayor que el número S asociado a la trayectoria real.
Ejemplo 3.2.1 Ilustrar el principio de Hamilton con el problema del tiro parabólico en
presencia del campo gravitacional (véase figura 3.2).
Sabemos que la trayectoria real está descrita por:
1 2
gt
2
Eliminando el parámetro t se obtiene que la trayectoria es parabólica:
g 2
x
y=
2Vx2
x(t) = Vx t ;
y(t) =
(3.24)
(3.25)
Esta trayectoria pasa por el punto (x = 0, y = 0) en t = 0 y por el punto (x2 , y2 =
gx22 /(2Vx2 )) en t = t2 (véase figura 3.2).
La siguiente trayectoria variada pasa por los mismos puntos que la trayectoria real
en t = t1 = 0 y t = t2 :
x = Vx t
y = y2
(3.26)
ex/x2 − 1
e−1
Se trata de mostrar que la integral de acción tiene menor valor para la trayectoria
real que para esta trayectoria variada.
El lagrangiano del problema es:
1
m(ẋ2 + ẏ 2 ) + mgy
2
Sobre la trayectoria real L es:
L=
1
m(Vx2 + g 2 t2 ) +
2
La integral de acción es:
Z t2
1
L dt = mVx2 t2 +
2
0
L=
(3.27)
1
1
mg 2 t2 = mVx2 + mg 2 t2
2
2
(3.28)
1
1
x2y2
mg 2 t32 = mVx x2 + 0, 666 mg
3
2
Vx
(3.29)
Sobre la trayectoria variada:
ẋ = Vx ;
ẏ
y2 Vx
eVx t/x
x2 (e − 1)
Con lo cual L es:
1
mgy2 Vx t/x2
y22 Vx2
2Vx t/x2
L = m Vx2 +
+
e
− 1)
(e
2
2
2
(e − 1) x2
e−1
3 De
(3.30)
(3.31)
acuerdo con el principio de D’Alembert esto equivale a decir que las posiciones verdaderas son
de “equilibrio” estable.
El principio de Hamilton y las ecuaciones de Lagrange / 61
P1
x
P2 (x2,y2)
g
y
Figura 3.2 Trayectoria parabólica en presencia de un campo gravitacional. Trayectoria variada.
La integral de acción es:
Z
t2
L dt =
0
1
81e − 60 mgx2 y2
mVx x2 +
2
72(e − 1)
Vx
(3.32)
mgx2 y2
1
= mVx x2 + 0,689
2
Vx
Vemos que la acción en la trayectoria real es menor que la acción en la trayectoria
variada.
Cuando no se conoce la trayectoria, es decir cuando no se ha resuelto el problema,
el principio de Hamilton directamente no proporciona un método práctico: se requiere
un método de ensayo y error; suponer una solución y evaluar S; obtener una “tabla”
de soluciones posibles en función de la acción. La solución correcta serı́a aquella para la
cual S es mı́nima.
Ejemplo 3.2.2 Resolver el problema del oscilador armónico lineal usando directamente
el principio de Hamilton, con las siguientes condiciones en t = 0 y t = t1 :
x(0) = 0 ,
x(t1 ) = x1 ,
ẋ(0) = v0
(3.33)
62 / Mecánica clásica avanzada
Las posibles funciones de t las asumiremos de la forma:
∞
X
x(t) =
a n tn
(3.34)
n=0
O sea que a cada conjunto de parámetros a0 , a1 , a2 , ...a∞ le corresponderá una
solución.4 El conjunto de parámetros que determina la solución real es aquel para el cual
δS = 0. De la condición x(0) = 0 se sigue que a0 = 0, con lo cual:
∞
X
a n tn
(3.35)
x(t) =
n=1
El lagrangiano para el oscilador armónico unidimensional es:
1
1
L = µẋ2 − kx2
2
2
Reemplazando (3.35) en (3.36) obtenemos:
∞ ∞
∞ ∞
1 XX
1 XX
L= µ
nman am tn+m−2 − k
an am tn+m
2 n=1 m=1
2 n=1 m=1
Con lo cual la integral de acción será:
Z t1
L dt =
S=
(3.36)
(3.37)
0
∞ ∞
nm
1
1XX
n+m−1
n+m+1
t
t
−k
an am µ
2 n=1 m=1
n+m−1 1
n+m+1 1
La condición δS = 0 nos da:
"∞
#
∞ X
X
nm
1
am µ
tn+m−1 − k
tn+m+1 δan = 0
n+m−1 1
n+m+1 1
n=1 m=1
(3.38)
(3.39)
En la ecuación (3.39) los δan son los cambios de los coeficientes an que darán lugar
a la variación δx(t). Los δan no son independientes, pues se debe además cumplir la
condición δx(t1 ) = 0:
n
X
δx(t1 ) =
δan tn1 = 0
(3.40)
n=1
En virtud de (3.40) un δan puede expresarse en términos de los demás. Vamos a
introducir un multiplicador indeterminado λ multiplicando la ecuación (3.40) por λ y el
resultado lo sumamos a la ecuación (3.39) para obtener:
" ∞ ∞
X
X
mn
µ
t1n+m−1
n
+
m
−
1
n=1 m=1
(3.41)
1
tn+m+1 am + λtn1 δan = 0
−k
n+m+1 1
4 La
ecuación (3.34) constituye una representación multiparamétrica de la trayectoria en el espacio
de configuración.
El principio de Hamilton y las ecuaciones de Lagrange / 63
Ahora escogemos a λ de modo que se anule el coeficiente de δa1 :
∞ X
1
m+2
µtm
−
k
am + λt1 = 0
t
1
m+2 1
m=1
(3.42)
En la ecuación (3.41) quedará una combinación lineal de los δa2 , δa3 , ...δa∞ , igualada a cero. Como estas cantidades son ahora independientes, se debe cumplir que sus
coeficientes se anulen. Igualando a cero los coeficientes de δa2 , δa3 , ...δa∞ y reemplazando el valor de λ que se obtiene de (3.42), llegamos a:
∞ X
m−1 m
1
m+2
µ
am = 0
(3.43)
t +k
t
m+n−1 1
(m + 2)(m + n + 1) 1
m=1
De (3.43) se obtiene la siguiente relación de recurrencia para coeficientes, por igualar a cero los coeficientes de las tm
1 :
am = −
k
1
am−2 ;
µ m(m − 1)
m = 2, 4, ...
(3.44)
Como a0 = 0, se sigue que:
a0 = a2 = a4 = ... = 0
(3.45)
Los coeficientes impares se pueden expresar en términos de a1 , que se determina
de la condición ẋ(0) = v0 :
a1 = v0
(3.46)
Con lo cual se obtiene que:
(m−1)/2
k
(m−1)/2 1
v0 ;
am = (−1)
m! µ
m = 1, 3, ...
(3.47)
o también en la forma:
a2n+1 = (−1)n
n
k
1
v0 ;
µ
(2n + 1)!
n = 0, 1, 2, ...
(3.48)
Con lo cual x(t) será:
x(t) = v0
r
∞
1
µX
(−1)n
k n=0
(2n + 1)!
Llamando ω =
x(t) =
s !2n+1
k
µ
p
k/m llegamos a:
v0
sen(ωt)
ω
Claramente el método es engorroso en problemas más complicados.
(3.49)
(3.50)
64 / Mecánica clásica avanzada
Deducción de las ecuaciones de Lagrange a partir del principio de Hamilton generalizado. La ecuación (3.12) se denomina el principio de Hamilton generalizado. Es aplicable a cualquier sistema holónomo independientemente de la naturaleza
de las fuerzas aplicadas. Como T es una función de (q), (q̇), t,
δT (q, q̇, t) =
l X
∂T
ν=1
∂T
δqν +
δ q̇ν
∂qν
∂ q̇
(3.51)
En tanto que δA puede escribirse en términos de las fuerzas generalizadas Qν :
δA =
N
X
i=1
(a)
F~i · δ~ri =
l
X
Qν δqν
(3.52)
ν=1
En δT podemos hacer la transformación siguiente:
∂T
d ∂T
∂T d
d ∂T
δqν
δ q̇ν =
δqν −
δqν =
∂ q̇ν
∂ q̇ dt
dt ∂ q̇ν
dt ∂ q̇ν
(3.53)
Reemplazando (3.51), (3.52) y (3.53) en la ecuación (3.12):
Z t2
(δA + δT )dt =
t1
l t1 X
Z
Qν δqν +
t1 ν=1
+
l
X
∂T
ν=1
∂ q̇ν
d
∂T
−
∂qν
dt
∂T
∂ q̇ν
δqν
dt
(3.54)
t2
δqν
=0
t1
La parte integrada en (3.54) es nula debido a que las δqν se anulan en t = tl y
t = t2 , con lo cual se llega a:
)
Z t1 (X
l ∂T
d ∂T
(3.55)
Qν +
δqν dt = 0
−
∂qν
dt ∂ q̇ν
t1
ν=1
Como las δqν son arbitrarias, el integrando es una función arbitraria del tiempo;
si la integral es cero, es necesario entonces que el integrando sea cero. Ahora queda una
combinación lineal de las cantidades independientes δqν igualada a cero,
l X
ν=1
∂T
d
Qν +
−
∂qν
dt
∂T
∂ q̇ν
δqν = 0
Como las δqν son independientes, se debe cumplir también que:
d ∂T
∂T
= 0 ; ν = 1, 2, ...l
−
Qν +
∂qν
dt ∂ q̇ν
(3.56)
(3.57)
El principio de Hamilton y las ecuaciones de Lagrange / 65
A estas ecuaciones no podrı́amos haber llegado cuando el sistema es no holónomo.
Estas ecuaciones son las correspondientes ecuaciones en cálculo funcional a las ecuaciones
(3.22) del cálculo de funciones, a las cuales se reducen en el caso estático cuando las
fuerzas son derivables de un potencial. Hemos llegado a las ecuaciones de Lagrange de
la segunda clase a partir del principio de Hamilton.
Supongamos que las fuerzas aplicadas se pueden descomponer en una parte derivable de un potencial monogénico y otra no derivable de tal potencial. Se entiende por
potencial monogénico o potencial generalizado a una función de las coordenadas, las velocidades y el tiempo, a partir de la cual se pueden derivar todas las fuerzas monogénicas
del sistema, mediante las fórmulas:
∂V
d ∂V
(a)
F~i = −
+
+ F~i′ ;
∂~ri
dt ∂~r˙ i
i = 1, 2, ...N
(3.58)
Las fuerzas generalizadas correspondientes serán:
Qν = −
d ∂V
∂V
+
+ fν ;
∂qν
dt ∂ q̇ν
ν = 1, 2, ...l
(3.59)
donde fν es la fuerza generalizada correspondiente a las fuerzas F~i′ . Es posible con este
tipo de fuerzas definir una función lagrangiana asociada a las fuerzas derivables del
potencial generalizado. fν contiene las fuerzas no incluidas en L.
Las ecuaciones de Lagrange toman la forma:
d ∂L
∂L
−
+ fν = 0 ;
∂qν
dt ∂ q̇ν
ν = 1, 2, ...l
(3.60)
donde L está definido como:
L(q, q̇, t) = T (q, q̇, t) − V (q, q̇, t)
(3.61)
El lagrangiano para N partı́culas en un campo electromagnético. Sea un
sistema de partı́culas cargadas en presencia de un campo electromagnético descrito por
~ r , t) y B(~
~ r , t). La fuerza de interacción con la partı́cula i es:
los campos E(~
~ ri , t) + qi ~ri × B(~
~ ri , t)
F~i ~ri , ~r˙ i , t = qi E(~
(3.62)
c
Los campos eléctrico y magnético se pueden derivar de los potenciales escalar y
~
vectorial φ, A:
~ r , t)
∂φ(~r, t) 1 ∂ A(~
−
∂~r
c ∂t
~ r , t) =
E(~
−
~ r , t) =
B(~
∂
~ r , t)
× A(~
∂~r
Entonces F~i se puede escribir como:
∂φ(~ri , t) 1 ∂A(ri~, t) 1
∂
~ ri , t)
F~i (~ri , ~r˙ i , t) = qi −
−
+ r~i ×
× A(~
∂~ri
c
∂t
c
∂~ri
(3.63)
(3.64)
66 / Mecánica clásica avanzada
Algunas manipulaciones con el rotacional nos llevan a:5
~
~
∂
~ ri , t) = ∂ ~r˙ i · A
~ i − dAi + ∂ Ai
~r˙ i ×
× A(~
∂~ri
∂~ri
dt
∂t
(3.65)
Con lo cual (3.63) se puede escribir como:
F~i ~ri , ~r˙ i , t =
(3.66)
Como φ no depende de ~r˙ i :
F~i ~ri , ~r˙ i , t =
(3.67)
∂
∂ ˙ ~
1
~ ri , t) − 1 d
qi −
~ri · A(~ri , t)
φ(~ri , t) − ~r˙ i · A(~
∂~ri
c
c dt ∂~r˙ i
qi
∂
−
∂~ri
1˙
1 d ∂
1˙ ~
φi − ~ri · Ai
φi − ~ri · Ai +
c
c dt ∂~r˙ i
c
Si se define la función V :
"
#
N
X
˙i
~
r
~ ri , t) ,
qi φ(~ri , t) − · A(~
V ~r1 , ~r2 , ...~rN , ~r˙ 1 , ~r˙ 2 , ...~r˙ N , t =
c
i=1
(3.68)
las fuerzas de interacción con el campo electromagnético se pueden derivar del
potencial monogenico V :
∂V
d ∂V
F~i = −
+
∂~ri
dt ∂~r˙ i
(3.69)
Entonces el lagrangiano de un sistema de partı́culas en un campo electromagnético
puede escribirse como:
"
!#
N
X
1 ˙2
~r˙ i ~
˙
˙
˙
L(~r1 , ~r2 , ...~rN , ~r1 , ~r2 , ...~rN , t) =
(3.70)
mi~ri − qi φi − · Ai
2
c
i=1
En este lagrangiano no están incluidas las fuerzas de interacción de las partı́culas
entre sı́.
Fuerzas viscosas. Son un tipo de fuerzas que no se pueden derivar de un potencial.
Para muchos casos de interés se pueden escribir en la forma:
F~i′ = −~k.~r˙ i
(3.71)
Se define la función de disipación de Rayleigh como:
N
5 Ver
1X
F=
kx ẋ2i + ky ẏi2 + kz żi2
2 i=1
el texto Mecánica clásica de Goldstein, 1a ed, sección 1.5.
¯
(3.72)
El principio de Hamilton y las ecuaciones de Lagrange / 67
Las fuerzas viscosas (3.71) se pueden obtener como el gradiente de velocidades de
F:
∂F
F~i = −
∂~r˙ i
(3.73)
La fuerza generalizada correspondiente será:
Fν =
N
X
i=1
Fi′ ·
N
X
∂~ri
∂F ∂~r˙ i
∂F
·
=−
=−
˙ i ∂ q̇ν
∂qν
∂
q̇ν
∂
~
r
i=1
(3.74)
Para el caso en que las fuerzas no potenciales sean todas viscosas, las ecuaciones
de Lagrange toman la forma:
∂L
∂F
d ∂L
−
+
= 0;
dt ∂ q̇ν
∂qν
∂ q̇ν
ν = 1, 2, ...l
(3.75)
de modo que deben darse dos funciones escalares, L y F , para obtener las ecuaciones de
movimiento. Estas serán las ecuaciones a aplicarse en el caso de un sistema de osciladores
amortiguados por ejemplo; L contiene las fuerzas de “resorte” y F las fuerzas disipativas.
3.3.
Algunas propiedades de la función lagrangiana
Aditividad de L. Si el sistema consta de dos partes, A y B, que no interactúan,
entonces el lagrangiano del sistema se descompone en dos partes: L = LA + LB . Donde
LA contiene sólo las coordenadas y velocidades de la parte A y similarmente LB . Es el
caso de dos partı́culas que se mueven en presencia de un campo externo sin interactuar
entre sı́. También en el caso de un sistema de partı́culas que interactúan entre sı́ pero
no con un campo externo, L se puede descomponer en una parte que contiene sólo las
coordenadas y velocidades del centro de masa y otra que sólo contiene las coordenadas
y velocidades de las partı́culas respecto al centro de masa: no hay interacción del movimiento del centro de masa con el movimiento respecto al centro de masa.
Adición a L de una derivada total respecto al tiempo de una función
arbitraria. Sean dos funciones lagrangianas, que dependen de las mismas coordenadas
y velocidades generalizadas, tales que difieren por una derivada total respecto al tiempo:
L′ (q, q̇, t) = L(q, q̇, t) +
d
f (g, t)
dt
(3.76)
Las integrales de acción de L y de L′ tienen valores extremales simultáneamente:
S ′ = S + f [q(t2 ), t2 ] − f [q(t1 ), t1 ]
(3.77)
Como δq(t2 ) = δq(t1 ) = 0 se sigue que δS ′ = δS = 0. Esto implica que L y L′
dan lugar a las mismas ecuaciones de movimiento; a este resultado se puede llegar de
manera más convincente transformando las ecuaciones de Lagrange mismas.6
que eiS/h̄ es el lı́mite clásico de la función de onda Ψ. Entonces la arbitrariedad de f
implica una arbitrariedad en la fase de Ψ.
6 Veremos
68 / Mecánica clásica avanzada
Ejemplo 3.3.1 Sea una partı́cula libre, descrita en un sistema de referencia inercial O
mediante el lagrangiano.
L=
1 ˙2
m~r
2
(3.78)
Si se realiza una transformación de Galileo, a un nuevo sistema de referencia inercial
O′ que se mueve respecto a O con velocidad constante V~ :
~
~υ = ~υ ′ + V
(3.79)
Entonces el lagrangiano en el nuevo sistema de referencia inercial será:
1 2 1 1
~ +V
~2
(3.80)
L′ = m~r˙ ′2 = m~r˙ + m −2~r · V
2
2
2
Los dos lagrangianos están relacionados ası́:
d m
~ 2t
L′ = L +
−2~r · V~ + V
(3.81)
dt 2
A la función:
m
~ +V
~ 2t
−2~r · V
(3.82)
f (r, t) =
2
por razones que se verán más adelante, se le denomina “función generadora de la transformación de Galileo”. Vemos que:
m
~ − 2~r2 · V
~ +V
~ 2 t2 − ~υ 2 t1
S′ = S +
(3.83)
2~r1 · V
2
y por tanto δS ′ = δS dado que δ~r = δ~r ′ = 0 en t = t1 y t = t2 .
3.4.
Simetrı́as de la lagrangiana y teoremas de conservación
Simetrı́a. Se dice que L posee una simetrı́a cuando no cambia bajo una transformación de las coordenadas y del tiempo. Por ejemplo, sea una partı́cula libre, cuyo
lagrangiano esté dado por (3.78). Se le realiza un desplazamiento de la partı́cula por una
cantidad arbitraria ~a,
~r → ~r + ~a
(3.84)
como ~a˙ = 0, se sique que L no cambia. Se dice que este lagrangiano es simétrico bajo
translaciones. Veremos que esta simetrı́a está asociada a la conservación del momento
lineal. Si se realiza una rotación arbitraria de la partı́cula, digamos alrededor del eje z
por un ángulo α,
x
→ x cos α + y senα
y
→ −x senα + y cos α
z
→ z
(3.85)
El principio de Hamilton y las ecuaciones de Lagrange / 69
y L no cambia, se dice que L es simétrico bajo rotaciones alrededor del eje z arbitrarias.
Veremos que esta simetrı́a está asociada con la conservación del momento angular. Si se
realiza una inversión de las coordenadas,
x, y, z → −x, −y, −z
(3.86)
y L no cambia, esto implica la conservación de la paridad: L es siempre par o impar en
el transcurso del movimiento.
Al aplicar un campo externo las simetrı́as de L dependerán de las simetrı́as del
campo. Si el campo tiene menor simetrı́a que el lagrangiano libre, el nuevo lagrangiano
tendrá la simetrı́a del campo. Supongamos que se coloca una fuerza constante y uniforme
en la dirección z. L ahora será:
L=
1 ˙2
m~r + Fz z
2
(3.87)
Las simetrı́as de L son alteradas. Bajo la transformación de translación espacial,
(3.84):
L → L + Fz az
(3.88)
L se altera a no ser que az sea cero. Ya no habrá simetrı́a de translación a lo largo del eje
z. Veremos que esto implica que sólo son constantes las componentes x y y del momento
lineal.
L no cambia bajo rotaciones alrededor del eje z (a lo largo del cual actúa la fuerza), pero obviamente no tendrá simetrı́a de rotación alrededor de ningún otro eje. Antes
de aplicar la fuerza, L tenı́a simetrı́a de rotación alrededor de cualquier eje (simetrı́a
esférica), ahora sólo tiene simetrı́a de rotación en el eje z (simetrı́a cilı́ndrica). Esta simetrı́a implica que sólo se conserva la componente z del momento angular, en tanto que
en ausencia del campo se conservan las tres componentes. En general, hay una relación
entre las simetrı́as de L y las variables dinámicas que se conservan.
Variables dinámicas. A cualquier función del estado del sistema y del tiempo
se le llama una variable dinámica. Para un sistema con l grados de libertad las variables dinámicas son de la forma Dα (q1 , q2 , ...ql , q̇1 , q̇2 , ...q̇l , t). Ejemplos de variables
dinámicas son:
~ri ;
P~ =
mi~r˙ i ;
N
X
i=1
mi~r˙ i ;
~li = mi~ri × ~r˙ i ;
~ =
L
N
X
i=1
mi~ri × ~r˙ i ;
(3.89)
T =
N
X
1
i=1
2
2
mi~r˙ i
(3.90)
Obviamente es posible definir un número infinito de variables dinámicas para un
sistema dado, pero sólo hay un número de variables dinámicas independientes igual al
doble del número de grados de libertad. En efecto, sólo es posible formar conjuntos de
2l funciones independientes de q1 , q2 , ... ql , q˙1 , q˙2 , ...q̇l , pero pueden definirse muchos
conjuntos diferentes. En general las 2l variables dinámicas independientes de un sistema
no son constantes de movimiento, aunque en principio siempre es posible encontrar un
70 / Mecánica clásica avanzada
conjunto de 2l constantes de movimiento, si el sistema es integrable.
Constantes de movimiento. Las ecuaciones de Lagrange dan lugar a un sistema
de l ecuaciones diferenciales acopladas de segundo orden con 2l incógnitas, q1 , q2 , ...ql ,
q̇1 , q̇2 , ...q̇l , independientes entre sı́. La solución a las ecuaciones de movimiento contendrá 2l constantes de integración arbitrarias que determinan los valores iniciales de
(q) y (q̇). En el capı́tulo 1 se definió la especificación del estado del sistema mecánico en
un tiempo t por medio de los valores de las coordenadas y velocidades en ese instante.
Ahora vemos que las constantes de integración determinan no sólo el estado en el tiempo inicial, sino además todos los estados subsiguientes. Con sólo dar valores a t, para
unos valores dados de las constantes de integración, se obtienen los valores correspondientes de las variables de estado. Las constantes de integración suministran una noción
global de estado: se dice que a cada conjunto de valores de las constantes de integración le corresponde un estado de movimiento del sistema. El tiempo inicial, o comienzo
del movimiento, siempre puede tomarse como una de las constantes de integración. La
integración de las ecuaciones de movimiento dará lugar a 2l funciones de la forma:
qν = qν (c1 , c2 , ...c2l−1 , t + t0 )
(3.91)
q̇ν = q̇ν (c1 , c2 , ...c2l−1 , t + t0 ) ;
ν = 1, 2, ...l
Podemos en principio invertir estas ecuaciones para expresar las 2l constantes de
integración en función de (q), (q̇), t:
t0 = −t + θ(q, q̇) ;
cα = cα (q, q̇) ;
α = 1, 2, ..,2l − 1
(3.92)
Por otra parte, con las 2l constantes de integración se puede obtener cualquier otro
conjunto de 2l constantes independientes. En conclusión, a cualquier sistema dinámico
integrable se le pueden asociar 2l funciones de (q), (q̇) y t cuya derivada total respecto a t
sea cero. Estas cantidades son variables dinámicas, o sea que para cada sistema mecánico
integrable siempre es posible hallar 2l constantes de movimiento independientes, o en
otras palabras 2l variables dinámicas que se conservan, si es integrable.
En mecánica cuántica se pueden encontrar a lo sumo l variables dinámicas que
pueden tomar simultáneamente valores constantes. Se dice que para un sistema cuántico
de l grados de libertad hay sólo l operadores hermı́ticos independientes que conmutan
entre sı́ y que tienen estados propios con valores definidos de las correspondientes variables dinámicas.
Conservación de la energı́a. Se trata de mostrar que para aquellos sistemas
en que L sea simétrica bajo el cambio del origen del tiempo hay una constante de
movimiento que es la energı́a.7 Sea un sistema que cumple estas tres condiciones: (a)
puede ser descrito completamente a partir de L, es decir, se puede definir una función V
de la cual se obtienen todas las fuerzas; (b) el potencial no depende de las (q̇) ni de t; (c)
el sistema es tal que L no dependerá explı́citamente de t al introducir las coordenadas
generalizadas y además es esclerónomo. Mediante la condición (c) se garantiza que las
7 Veremos
que si L no cambia al cambiar E, ∂L/∂E = 0, entonces t0 se conserva. Se dice que t0 y E
son dos cantidades canónicamente conjugadas.
El principio de Hamilton y las ecuaciones de Lagrange / 71
ligaduras no realizan trabajo sobre el sistema, entonces para tal sistema se cumple que
L es simétrica bajo el cambio de origen del tiempo:
∂L
∂L
=0 ⇒
=0
∂t0
∂t
(3.93)
La derivada total de L respecto al tiempo es:
l ∂L
∂L
dL X ∂L
q̇ν +
q̈ν +
=
dt
∂qν
∂ q̇ν
∂t
i=1
(3.94)
De las ecuaciones de Lagrange se tiene que:
∂L
d ∂L
=
− fν
∂qν
dt ∂ q̇ν
(3.95)
Con lo cual (3.94) toma la forma:
l ∂L
dL X d ∂L
q̇ν − fν q̇ν +
=
dt
dt ∂ q̇ν
∂t
ν=1
(3.96)
O sea que se cumple:
dL
dt
l
X
∂L
q̇ν − L
∂ q̇ν
ν=1
!
=
l
X
ν=1
fν q̇ν −
∂L
∂t
(3.97)
La cantidad entre paréntesis se llama la función energı́a, denotada h(q, q̇, t) con lo
cual:
ḣ(q, q̇, t) =
l
X
ν=1
fν q̇ν −
∂L
∂t
(3.98)
De las condiciones (a) y (c) y del hecho de que V no depende de t se sigue que
fν = 0 y ∂L/∂t = 0, con lo cual:
h(q, q̇, t) = constante
(3.99)
Esta constante se llama “energı́a” o “constante de Jacobi”. La función h es igual
al hamiltoniano H. La diferencia es que éste se define como una función de (q), (p), t y
aquella es función de (q), (q̇) y t. Veremos que si además se cumple que V no depende de las (q̇), h coincide con la energı́a total T +V . (a) implica que el sistema es holónomo.
Teorema de Euler acerca de las funciones homogéneas. Sea una función f
de n variables: f (x1 , x2 , ...xn ) tal que:
F (λx1 , λx2 , ...λxn ) = λr F (x1 , x2 , ...xn )
(3.100)
Se dice que F es una función homógenea de grado r. El teorema dice que:
N
X
i=1
xi
∂F
= rF
∂xi
(3.101)
72 / Mecánica clásica avanzada
La prueba es la siguiente: derivando ambos lados en (3.101) respecto a λ,
d
F (λx1 , λx2 , ...λxN ) = rλn−1 F (x1 , x2 , ...xn )
dλ
(3.102)
la derivada del lado izquierdo es:
n
X ∂F (λx1 , λx2 , ...λxN ) ∂(λxi )
d
F (λx1 , λx2 , ...λxN ) =
dλ
∂(λxi )
∂λ
i=1
(3.103)
Se sigue entonces que:
n
X
∂F (λx1 , λx2 , ...λxN )
∂(λxi )
i=1
xi = λn−1 rF (x1 , x2 , ...xn )
(3.104)
Haciendo ahora λ = 1 se obtiene la igualdad (3.101).
Teorema acerca de la energı́a cinética de un sistema esclerónomo. Si el
sistema es descrito mediante coordenadas generalizadas, en virtud de la ecuación (2.176)
la energı́a cinética puede escribirse como:
N
T =
1 X ˙2
mi~ri =
2 i=1
" l l
2 #
l
N
X X ∂~ri ∂~ri
X
∂~ri ∂~ri
∂~ri
1X
mi
·
q˙ν q˙µ + 2
·
q̇ν +
2 i=1
∂qν ∂qµ
∂qν ∂t
∂t
ν=1 µ=1
ν=1
(3.105)
Como ~ri es función (q) y t, se sigue que T en coordenadas generalizadas toma la
forma:
T (q, q̇, t) =
l X
l
X
Aνµ (q, t)q̇ν q̇µ +
ν=1 µ=1
l
X
Aν (q, t)q̇ν + A(q, t)
(3.106)
ν=1
O sea que T se puede escribir como la suma de tres funciones homogéneas de las
velocidades generalizadas de grados 2, 1 y 0:
T = T2 + T1 + T0
(3.107)
Se sigue que para un sistema esclerónomo (∂~ri /∂t = 0)
T (q, q̇, t) = T2 (q, q̇, t) =
l X
l
X
Aνµ (q, t)q̇ν q̇µ
(3.108)
ν=1 µ=1
Es decir, que la energı́a cinética es una función homogénea cuadrática en las velocidades. La función Aνµ (q, t) es simétrica:
Aνµ (q, t) = Aµν (q, t)
(3.109)
El principio de Hamilton y las ecuaciones de Lagrange / 73
En virtud del teorema de Euler acerca de las funciones homogéneas se sigue que
para un sistema esclerónomo:
l
X
∂T
q̇ν = 2T
∂ q̇ν
ν=1
(3.110)
Conservación de la energı́a total T + V. Si se cumple (b), como L = T − V
se sigue que:
∂L
∂T
=
∂ q̇ν
∂ q̇ν
(3.111)
Entonces h tomará la forma, en virtud de (3.110) y (3.111):
h(q, q̇, t) =
l
X
∂T
q̇ν − T + V = T + V
∂
q̇ν
ν=1
(3.112)
En este caso h coincide con la energı́a total.
Las fuerzas que son derivables de un potencial que no depende de las velocidades
ni del tiempo se llaman fuerzas conservativas. Si V depende de las (q̇) cumpliéndose las
otras condiciones, h es una constante de movimiento pero no es la energı́a total. Si se
cumple (c) y que V no dependa de las (q̇), será cierto que h = T + V , pero h no será una
constante de movimiento. En este caso:
l
X
dE
∂L
dh
=
=
fν q̇ν −
dt
dt
∂t
ν=1
(3.113)
donde la dependencia que tiene L de t puede provenir sólo de que V dependa del tiempo.
Si las fuerzas fν son viscosas y se pueden obtener de la función de disipación de Rayleigh,
que es una función homogénea cuadrática de las velocidades, en virtud de las ecuaciones
(3.72), (3.74) y (3.101), se sigue que:
l
X
ν=1
fν q̇ν = −
l
X
∂F
q̇ν = −2F
∂
q̇ν
ν=1
(3.114)
En este caso (3.113) será:
∂L
dh
= −2F −
dt
∂t
o
∂E
∂V
= −2F +
∂t
∂t
(3.115)
En (3.115) resulta claro que la rata de cambio de la energı́a total consta de la rata
de disipación de energı́a 2F y de la rata de suministro de energı́a debida a la variación
temporal de V .
Ejemplo 3.4.1 Hallar la constante de Jacobi y la rata de cambio de la energı́a total para
una partı́cula cargada en presencia de un campo electromagnético.
74 / Mecánica clásica avanzada
De acuerdo con la ecuación (3.70):
L=
1 ˙2
q
~
m~r − qφ + ~r˙ · A
2
c
(3.116)
La función energı́a será:
h=
∂L ˙
1 2
· ~r − L = m~r˙ + qφ
2
∂~r˙
(3.117)
Se ve que h no es la energı́a total E = T + V , lo cual es consecuencia de que V
dependa de la velocidad, h incluye sólo la energı́a potencial eléctrica. En virtud de (3.98)
h será:
ḣ = −
~
∂L
∂V
∂φ q ˙ ∂ A
=
=q
− ~r ·
∂t
∂t
∂t
c
∂t
(3.118)
O sea que en general h será constante de movimiento sólo si los campos no dependen
~ tengan una forma tal que h sea
del tiempo, además del caso particular en que φ y A
cero, como:
q
~
E = h − ~r˙ · A
c
Se sigue que para un campo electromagnético estático:
d q ˙ ~
− ~r · A
Ė =
dt
c
(3.119)
(3.120)
Es decir, E no se conserva porque el potencial magnético no es constante. Si se
~ sea uniforme, A
~ se puede
aplica el campo electromagnético constante de modo que B
escribir en la forma:
~ = 1B
~ × ~r
A
2
(3.121)
~ es uniforme. En este caso el potencial magnético será:
que satisface a (3.63) si B
q
~ · (~r × ~r˙ ) = − q B
~ · ~l
~ = − q ~r˙ · (B
~ × ~r) = − q B
− ~r˙ · A
c
2c
2c
2mc
(3.122)
donde ~l es el momento angular de la partı́cula. Entonces (3.120) y (3.122) nos dan:
Ė = −
qB ˙
q ~ ~˙
B·l = −
lB
2mc
2mc
(3.123)
~ lo
lB se conserva si L es simétrico bajo rotaciones alrededor del eje determinado por B,
cual en general no se cumplirá; para ello basta que φ tenga simetrı́a cilı́ndrica alrededor
~
de B.
Ejemplo 3.4.2 Una partı́cula está sometida al efecto de la gravedad y a la condición
de ligadura de moverse siempre sobre un alambre circular de radio a. El alambre rota
uniformemente con velocidad angular ω alrededor de un eje vertical en el plano del
alambre que pasa por el centro. Calcular h y Ė y analizar su significado.
El principio de Hamilton y las ecuaciones de Lagrange / 75
El problema tiene un grado de libertad. Tomemos el eje z en la dirección de la
fuerza de gravedad, coincidiendo con el eje de rotación. Definamos un sistema de ejes
que rotan solidariamente con el alambre ası́: el eje z ′ en la dirección de la fuerza de
gravedad, coincidiendo con el eje de rotación; el eje y ′ en el plano del alambre; y el eje x′
perpendicular al alambre en el centro. Las fórmulas que expresan a x, y y z en términos
de x′ , y ′ y z ′ son:
x = x′ cos ωt − y ′ senωt ;
y = x′ senωt + y ′ cos ωt ;
z = z′
(3.124)
Tomemos como coordenada generalizada el ángulo que hace el vector de posición
de la partı́cula con el eje z ′ y en términos del cual podemos expresar a x′ , y ′ y z ′ , puesto
que x′ = 0. Entonces, mediante (3.124) obtenemos:
x = −a senq senωt ;
y = a senq cos ωt ;
z = a cos q
(3.125)
El lagrangiano del problema es en consecuencia:
L(q, q̇, t) =
1
ma2 (q̇ 2 + ω 2 senq) + mga cos q
2
(3.126)
El lector puede verificar fácilmente que si ω 2 < g/a, la posición q = 0 es de
equilibrio estable con frecuencia de pequeñas oscilaciones dada por Ω = ω 2 − g/a. Si
ω 2 > g/a, la posición de equilibrio estable no es q = 0 sino algún valor de q entre 0
y π/2 con frecuencia de pequeñas oscilaciones dada por Ω2 = g/a − ω 2 . Finalmente,
si ω 2 ≫ g/a, la posición de equilibrio estable será q = π/2, siendo ω la frecuencia de
pequeñas oscilaciones.
Sabemos que si se cumplen las condiciones (a) y (b), pero no se cumple (c), es
decir, si las ligaduras son reónomas, lo cual es el caso para este problema, entonces h no
será la energı́a total.
De (3.107) y (3.112) se sigue, usando el teorema de Euler acerca de las funciones
homogéneas, que:
h = 2T2 + T1 − L = T + V − T1 − 2T0
(3.127)
De (3.98) se sigue que cuando fν = 0,
∂L
= Ė − Ṫ1 − 2Ṫ0
(3.128)
∂t
Por tanto, si como en este ejemplo las ligaduras reónomas no dan lugar a que
t aparezca en L, h será constante de movimiento pero E no lo será. En efecto, en
este caso las ligaduras realizan trabajo sobre el sistema ya que los desplazamientos
virtuales son tangentes al alambre (o sea que éste no realiza trabajo virtual), pero como
un desplazamiento real de la partı́cula no coincide con una virtual, la ligadura realiza
trabajo bajo desplazamientos reales. Para este problema, T2 = 12 ma2 q̇ 2 ; T1 = 0 ; T0 =
1
2 2
2 ma ω sen q y V = −mga cos q. De (3.127) se sigue entonces que:
ḣ = −
1
ma2 (q̇ 2 − ω 2 senq) − mga cos q
(3.129)
2
la cual es una constante de movimiento. Podemos reinterpretar a h diciendo que es
la energı́a total respecto al sistema de ejes rotantes x′ , y ′ y z ′ . La energı́a cinética
h = T2 − T0 + V =
76 / Mecánica clásica avanzada
es T ′ = (1/2)ma2 q̇ 2 y la energı́a potencial consta de dos partes, la energı́a potencial
gravitacional y la energı́a potencial centrı́fuga que resulta debido a que el sistema de
referencia x′ , y ′ y z ′ es no inercial, es decir:
T′ =
1
ma2 q̇ 2 ;
2
1
V ′ = − ma2 ω 2 senq − mga cos q
2
(3.130)
En efecto, V ′ puede escribirse como V ′ = −(1/2)maω 2y ′ − mgz ′ y de él se deriva
la fuerza siguiente:
1
∂V ′
F~ ′ = − ′ = maω 2 î′ + mg k̂ ′
∂~r
2
(3.131)
O sea que (1/2)maω 2 es la fuerza centrı́fuga; es como si existiera un campo gravitacional homogéneo en la dirección x′ .
La energı́a total respecto a los ejes x, y y z será E y constará de dos términos: h
y el trabajo realizado por el alambre. Como ḣ = 0, de (3.128) se sigue que:
Ė = Ṫ1 + 2Ṫ0 = ma2 ω 2 cos q q̇
(3.132)
Para pequeñas oscilaciones alrededor de q = 0, Ė es de la forma Ė= ma2 ω 3 q0 senΩt,
o sea que E = h − (ma2 ω 3 /Ω)q0 cos Ωt, lo cual nos muestra que la energı́a total
tendrá fluctuaciones periódicas.
Conservación del momento lineal. Sea un sistema que cumple las siguientes
condiciones: (a) se describe completamente a partir de un lagrangiano; (b) L no depende
de alguna de las coordenadas generalizadas. Entonces se cumple:
∂L
=0
∂qν0
(3.133)
donde la coordenada qν0 que no aparece en L se llama cı́clica o ignorable. La ecuación
de Lagrange para la coordenada qν0 implica que:
d
∂L
= f0
(3.134)
dt ∂ q̇ν0
O sea que si fν0 = 0 la siguiente cantidad se conserva:
Pν0 ≡
∂L
= constante
∂ q̇ν0
(3.135)
Se define el momento canónico conjugado a la coordenada qν ası́:8
Pν =
∂L
;
∂ q̇ν
ν = 1, 2, ...l
(3.136)
luego, el momento canónico conjugado a una coordenada cı́clica es una constante de
movimiento. Si L no depende de qν0 y fν0 = 0 se dice que el sistema es simétrico bajo
cualquier cambio en la coordenada qν0 .
8 La palabra “canónico” viene desde de época de Hamilton; significa “de acuerdo con el canon”. Se
usa ampliamente en fı́sica para designar diversos aspectos del formulismo hamiltoniano, que describe
los sistemas mecánicos mediante las variables (q, p).
El principio de Hamilton y las ecuaciones de Lagrange / 77
Sea un lagrangiano dado por (3.87). Como L no depende de x ni de y, se sigue que
px = mẋ y py = mẏ son constantes de movimiento. Como L depende de z, pz = mż no
se conserva. Si qν0 es una coordenada lineal, pν0 será un momento lineal.
Homogeneidad espacial. Sea un sistema aislado. Es de esperarse que L no cambie cuando se traslada el sistema como un todo. Esto equivale a desplazar todas las
partı́culas por la misma cantidad sin cambiarles su movimiento:
~r˙ i → ~r˙ i
~ri → ~ri + ~ǫ ;
(3.137)
Entonces el cambio experimentado por L será:
δL =
N
N
X
X
∂L
∂L
· δ~ri = ~ǫ ·
∂~
r
∂~
qi
i
i=1
i=1
(3.138)
Por hipótesis no hay ligaduras, con lo cual las ecuaciones de Lagrange nos dan:
δL = ~ǫ ·
N
N
X
d X
d ∂L
dP~
= ~ǫ ·
p~i = ~ǫ ·
,
dt ∂~r˙ i
dt i=1
dt
i=1
(3.139)
donde P~ es el momento total del sistema. Se sigue que si hay homogeneidad espacial,
δL = 0, entonces se sigue que la variable dinámica ~ǫ· P~ se conserva. Como E es arbitrario,
se sigue que P~ es una constante. Si sólo hay simetrı́a de translación en determinada
dirección ~ǫ se sigue que sólo se conserva la componente de P~ en la dirección de ~ǫ. Como
L = T − V y T sólo depende de las velocidades de las partı́culas,
∂V
∂L
=−
= F~i
∂~ri
∂~ri
(3.140)
Entonces en (3.138) se tiene:
δL = ~ǫ ·
N
X
F~i
(3.141)
i=1
δL será cero si el sistema no está sometido a una fuerza neta externa, es decir si el
sistema está aislado. O también: si el sistema es aislado, no debe haber fuerzas sobre el
centro de masa:
∂V
F~CM = −
=0
(3.142)
~ CM
∂R
luego V no depende de RCM y ésta será cı́clica. El momento canónico conjugado de
~ CM será el momento lineal total y será una constante de movimiento:
R
P~CM =
N
X
∂L
∂L
∂~r˙ i
=
·
~ CM
~˙ CM
r˙ i ∂ R
∂R
i=1 ∂ ~
(3.143)
~ CM está dado por
Como R
N
1X ˙
˙
~ CM
R
=
mi~ri
2 i=1
(3.144)
78 / Mecánica clásica avanzada
Se sigue que:
∂~r˙ i
~
= ~1
˙
~
∂ RCM
(3.145)
~1 es el diádico unidad, que se representa por una matriz unidad de dimensión
donde ~
3 × 3 (véase sección 7.4). Por tanto:
N
N
X
X ∂L
∂L
mi~r˙ i = P~CM
=
=
˙
˙~
∂
~
r
i
∂ RCM
i=1
i=1
(3.146)
Conservación del momento angular. Sea un sistema que se describe completamente a partir de un lagrangiano y además tal que no depende de alguna coordenada
angular qν0 , entonces su momento canónico conjugado será un momento angular que se
conserva. Por ejemplo, sea una partı́cula cuyo lagrangiano es:
1 ˙2
m~r − V (~r)
(3.147)
2
Sea n̂ un eje arbitrario y δφ una rotación alrededor de ese eje (véase figura 3.3).
L=
n
δϕ
δr
r
r + δr
θ
Figura 3.3 Rotación por ángulo δφ alrededor de n̂
Supongamos que φ es una de las coordenadas generalizadas del sistema. En una
rotación alrededor de n̂ bajo un ángulo δφ, ~r se cambia en ~r + δ~r donde δ~r es un vector
perpendicular a ~r y a n̂ y cuya magnitud es r senθ δφ. Por tanto se cumple que:
δ~r = n̂ × ~rδφ
(3.148)
El principio de Hamilton y las ecuaciones de Lagrange / 79
y que:
∂~r
= n̂ × ~r
∂φ
(3.149)
El momento canónico conjugado de φ será:
pφ =
∂~r˙
∂~r
= m~r˙ · (n̂ × ~r) = n̂ · m~r × ~r˙
= m~r˙ ·
= m~r˙ ·
∂φ
∂ φ̇
∂ φ̇
∂L
(3.150)
Se sigue que pφ es la componente del momento angular a lo largo de n̂. Si L no
depende de φ, pφ es una constante de movimiento.
Isotropı́a espacial. Sea un sistema tal que no cambia L cuando se rota como un
todo alrededor de un eje n̂. Esto es, si para cada partı́cula:
~ri → ~ri + n̂ × ~ri δφ ;
~r˙ i → ~r˙ i + n̂ × ~r˙ i δφ
el cambio en L será:
X
N N X
∂L ˙
∂L
p~˙ i · δ~ri + p~i · δ~r˙ i
· δ~ri =
· δ~ri +
δL =
∂~ri
∂~r˙ i
i=1
i=1
(3.151)
(3.152)
Usando (3.151) y usando la invariancia del triple producto escalar bajo permutación
cı́clica de los factores:
δL =
N
X
d
n̂ · ~ri × p~˙ i + p~i × ~r˙ i δφ = n̂δφ ·
~ri × p~i
dt
i=1
i=1
N
X
(3.153)
Con lo cual
~˙
δL = δφn̂ · L
(3.154)
~ es el momento angular total. Por otra parte, en virtud de las ecuaciones de
donde L
Lagrange:
δL =
N X
i=1
F~i · δ~ri + p~i · δ~ri =
(3.155)
N
N X
X
~ki = δφn̂ · K
~
~ri × F~i + ~r˙ i × p
~i = δφn̂ ·
δφn̂ ·
i=1
i=1
~ es el torque total, por tanto:
donde K
∂L
~˙ = n̂ · K
~
= n̂ · L
∂φ
(3.156)
Si no hay torque neto sobre el sistema entonces éste será isótropo y en consecuencia se conserva el momento angular total. Si simplemente se anula el torque en cierta
dirección, L será simétrico bajo rotaciones alrededor de esa dirección y se conservará la
80 / Mecánica clásica avanzada
~ en esa dirección.
componente de L
Integrales de movimiento aditivas. Para un sistema aislado la energı́a total
~ y el momento lineal P~ se conservan: hay siete constantes de
E, el momento angular L
movimiento. Quedan aún otras 6N − 7 constantes de movimiento. Estas siete constantes
de movimiento tienen la caracterı́stica de ser aditivas. Es decir, si el sistema consta de
varias partes que no interactúan, cada parte tendrá valores determinados de la energı́a,
el momento angular y el momento lineal totales. Las correspondientes cantidades del
sistema total se pueden obtener adicionando las respectivas constantes de movimiento
de las partes.
3.5.
El teorema del virial
Es un teorema de naturaleza estadı́stica porque se refiere a promedios temporales.
Sea un sistema que: (a) la energı́a potencial es función homogénea de las coordenadas;
(b) el movimiento es tal que en todo momento las coordenadas y las velocidades toman
valores finitos (el sistema es ligado). Se trata de calcular los valores medios de T y
V cuando el tiempo tiende a infinito. Del teorema de Euler acerca de las funciones
homogéneas se sigue:
N
X
∂T ˙
· ~ri = 2T
∂~r˙ i
(3.157)
i=1
Entonces se cumple, dado que V no depende de las velocidades:
N
N
X
d X
˙
~p˙ i · ~ri
p~i · ~ri −
pi · ~ri =
~
2T =
dt i=1
i=1
i=1
N
X
2T =
N
N
X
d X
F~i · ~ri
pi · ~ri −
~
dt i=1
i=1
(3.159)
si tomamos en (3.159) la media temporal a ambos lados, ası́:
Z
1 τ
lı́m
2T dt =
τ →∞ τ 0
1
lı́m
τ →∞ τ
N
X
i=1
p~i · ~ri
!
τ
0
1
− lı́m
τ →∞ τ
(3.158)
Z
0
N
τ X
i=1
(3.160)
F~i · ~ri dt
La condición (b) conduce a la anulación del primer miembro del lado derecho, con
lo cual llegamos a:
2T = −
N
X
i=1
F~i · ~ri ,
(3.161)
El principio de Hamilton y las ecuaciones de Lagrange / 81
donde la barra indica promedio temporal. La ecuación (3.161) se denomina el teorema
del virial. El lado derecho de (3.161) es el doble del llamado virial de Clausius.
Si V es función homogénea de las coordenadas, se cumple:
−
N
X
i=1
F~i · ~ri =
N
X
∂V
i=1
∂~ri
· ~ri = kV = 2T
(3.162)
donde k es el grado de homogeneidad de V . Como T + V = E es una constante, se sigue
que T + V = E. Por lo tanto se cumple que:
2T + 2V = 2E ;
kT + kV = kE
(3.163)
De (3.162) y (3.163) se sigue que:
V =
2
E;
2+k
T =
k
E;
2+k
T =
k
V
2
(3.164)
Para un potencial del tipo r−1 se cumple que 2T = −V = −2E. Para un potencial
del tipo r2 se cumple: T = V = (1/2)E. Se deduce que para un potencial del tipo r−1
hay movimientos acotados solamente si E < 0, dado que T es positiva, y que para un
potencial del tipo r2 sólo hay movimientos acotados para E > 0.
Ley de Boyle. Sea un sistema constituido por un gas de moléculas en un recipiente. En este caso N es muy grande. Si la energı́a cinética media por partı́cula es t,
entonces:
T = Nt
(3.165)
La energı́a por partı́cula está relacionada con la temperatura θ a través de la
relación:
3
t = kB θ
(3.166)
2
donde kB es la constante de Boltzmann. La ecuación (3.166) se obtiene del teorema de
la equipartición de la energı́a, según el cual por cada grado de libertad hay una energı́a
de (1/2)kθ.
La fuerza sobre la partı́cula i depende de la ligadura impuesta por el recipiente:
~i
F~i = F~ig + R
(3.167)
F~ig
donde
es la fuerza ejercida por todas las otras partı́culas del gas sobre la partı́cula i
~
y Ri es la fuerza ejercida por las paredes del recipiente sobre la partı́cula i. Si llamamos
I a:
I=
N
X
F~ig .~ri
(3.168)
i=1
El virial de Clausius se descompone en dos partes:
N
X
i=1
F~i .~ri = I +
N
X
i=1
~ i .~ri
R
(3.169)
82 / Mecánica clásica avanzada
~ i actúan sólo cuando la partı́cula i choca con las paredes del recipiente.
Las fuerzas R
Estas fuerzas representan la reacción del muro a la colisión ejercida por los átomos sobre
la pared. Esto es lo que se denomina la reacción a la presión P que ejerce el gas sobre el
recipiente.
PN ~
En un tiempo t dado, en i=1 R
ri sólo contribuyen los términos correspondientes
i ·~
a las partı́ulas que en ese instante chocan con las paredes del recipiente. Podemos dividir
el área de las paredes en elementos infinitesimales de área dA. Todas las dN partı́culas
que choquen sobre un dA dado tendrán aproximadamente el mismo radio vector ~ri que
llamaremos ~r. La contribución de las dN partı́culas a la sumatoria será aproximadamente
~ dN · ~r, donde R
~ es la fuerza que ejerce el elemento de área sobre cada una de las dN
R
~ dN = dR,
~ entonces tenemos que:
partı́culas que inciden sobre ella. Si llamamos R
N
X
i=1
~ i · ~ri =
R
Z
~
~r · dR
(3.170)
~ en términos de la
Si n̂ es un vector normal a la superficie, podemos escribir a dR
presión de la siguiente manera:
~ = −n̂P dA
dR
(3.171)
Como la presión es constante escribimos:
N
X
i=1
~ i · ~ri = −P
R
Z
n̂ · ~r dA
(3.172)
Ahora, en virtud del teorema de la divergencia, podemos pasar de la integral de
superficie a una integral de volumen:
Z
Z
~
∇ · ~rdV = 3V
(3.173)
~r · dS =
V
S
Entonces:
N
X
i=1
~ i · ~ri = −3P V
R
(3.174)
Como esta cantidad no depende del tiempo se sigue que:
N
X
i=1
F~i · ~ri = I − 3P V
(3.175)
En virtud del teorema del virial, que es válido en este caso porque el movimiento
es acotado, y usando (3.162) y (3.166) se sigue que:
3N KB θ = −I + 3P V
(3.176)
Llegándose a la ecuación de estado para un gas real:
1
P V = N KB θ + I
3
(3.177)
El principio de Hamilton y las ecuaciones de Lagrange / 83
El término (1/3)I es una medida de la separación de la ecuación de estado del
gas real respecto al ideal en el cual no se consideran los efectos de interacción entre las
moléculas dada por 3.168, en tanto que P V proviene de la ligadura impuesta por el
recipiente.
84 / Mecánica clásica avanzada
4
La formulación hamiltoniana
4.1.
Las variables hamiltonianas de estado
En el formalismo lagrangiano el estado de un sistema mecánico holónomo con l
grados de libertad se describe por medio de las qν y q̇ν . Por medio de la función L(q, q̇, t)
se hallan las ecuaciones de movimiento a partir de las ecuaciones de Lagrange. Las variables (q, q̇, t) se llaman variables lagrangianas. Hamilton (1805-1865) propuso describir
el sistema mediante las variables (q, p, t), donde los pν son los momentos generalizados
canónicamente conjugados a las coordenadas generalizadas qν definidos por:
pν =
∂L(q, q̇, t)
;
∂ q̇ν
ν = 1, 2, ...l
(4.1)
Las variables (q, p, t) se llaman variables hamiltonianas. Las ecuaciones (4.1) constituyen las fórmulas de transformación de las variables (q, q̇, t) a las variables (q, p, t).
En (4.1) hay l ecuaciones que relacionan las l cantidades pν con las l cantidades q̇ν . En
principio se pueden expresar las (q̇) en términos de las (p) por la transformación inversa:
q̇ν = Φν (q, p, t) ;
ν = 1, 2, ...l
(4.2)
Es claro que el estado del sistema puede ser descrito indistintamente por las variables lagrangianas o por las hamiltonianas. Decimos que L “genera” la transformación
(q, q̇, t) → (q, p, t). Según (3.106) y (3.107) T se puede escribir como:
T = T2 + T1 + T0
(4.3)
Si V no depende de las (q̇),
pν =
l
X
∂T
∂L
=
=
Aνµ q̇µ + Aν ;
∂ q̇ν
∂ q̇ν
µ=1
ν = 1, 2, ...l
(4.4)
Mediante este sistema de ecuaciones lineales podemos expresar a (q̇) en términos
de (p):
q̇ν =
l
X
bνµ pµ + bν ;
ν = 1, 2, ...l
µ=1
85
(4.5)
86 / Mecánica clásica avanzada
Si V depende de las (q), (q̇) en la forma:
V (q, q̇, t) =
l
X
Πν (q, t)q̇ν + Π(q, t)
(4.6)
ν=1
que serı́a por ejemplo la forma que tomarı́a el potencial electromagnético (3.68) al ser
expresado en coordenadas generalizadas, entonces pν será:
pν =
l
X
µ=1
Aνµ q̇µ + Aν − Πν ;
ν = 1, 2, ...l
(4.7)
Notación. Usaremos L para denotar a T −V , expresada en función de las variables
lagrangianas. Es claro que al expresarla en términos de las variables hamiltonianas la
función es diferente, aunque a veces, sin mucho rigor, se le escribe también como L. Lo
correcto es:
L(q, q̇, t) = L [q, q̇(q, p, t), t] = L(q, p, t)
(4.8)
Ejemplo 4.1.1 Sea el lagrangiano:
1 2
~ r , t) − Π(~r, t)
L(~r, ~r˙ , t) = m~r˙ − ~r˙ · Π(~
2
(4.9)
El momento canónico será:
p=
~
~
∂L
~ ⇒ ~r˙ = p~ + Π
= m~r˙ − Π
˙
m
∂~r
(4.10)
Con lo cual:
L(~r, p~, t) =
~2
~2 − Π
p
−Π
2m
(4.11)
La función hamiltoniana. Se definió en (3.97) la función energı́a como:
h(q, q̇, t) =
l
X
∂L(q, q̇, t)
q̇ν − L(q, q̇, t)
∂ q̇ν
ν=1
(4.12)
A la función energı́a expresada en términos de las variables hamiltonianas se le
llama la función hamiltoniana:
H(q, p, t) ≡ h(q, p, t) = h[q, q ′ (q, p, t), t] =
l
X
ν=1
pν q̇ ν − L(q, p, t)
(4.13)
Los generadores de la transformación de Legendre. Sea X(x1 , x2 , ...xn ; α1 ,
α2 , ... αm ) una función que “genera” la siguiente transformación de variables (x1 , x2 , ...xn )
→ (y1 , y2 , ...yn ):
yi =
∂X
;
∂xi
i = 1, 2, ...n
(4.14)
La formulación hamiltoniana / 87
entonces existe una transformación de las variables y1 , y2 , ...yn a las variables x1 , x2 ,
...xn , la transformación inversa, “generada” por cierta función Y (y1 , y2 , ...yn ; α1 , α2 ,
...αm ):
xi =
∂Y
;
∂yi
i = 1, 2, ...n
(4.15)
Demostremos que las funciones X y Y están relacionadas por la fórmula:
Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) =
n
X
i=1
(4.16)
xi yi − X(x1 , x2 , ...xn ; α1 , α2 , ...αm )
En efecto, es posible expresar las variables xi en términos de las yi :
xi = fi (x1 , x2 , ...xn ; α1 , α2 , ...αm ) ;
i = 1, 2, ...n
(4.17)
Con lo cual escribimos (4.16) como:
Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) =
n
X
k=1
(4.18)
yk fk − X(f1 , f2 , ...fn , α1 , α2 , ...αm )
Entonces:
n
X
∂Y
=
∂yi
k=1
∂fk
yk + fk δik
∂yi
n X
∂fk
k=1
∂fk
yk − yk
∂yi
∂yi
−
n
X
∂X ∂fk
=
∂fk ∂yi
k=1
(4.19)
+ fi = xi
Demostremos el siguiente teorema:
∂X
∂Y
=−
;
∂αi
∂αi
i = 1, 2, ...m
(4.20)
Para evaluar ∂y/∂αi usemos la ecuación (4.18):
n
n
k=1
k=1
X ∂fk
X ∂X ∂fk
∂X
∂Y
=
yk −
−
∂αi
∂αi
∂fk ∂αi
∂αi
(4.21)
En virtud de (4.14), los términos de la sumatoria se cancelan, con lo cual queda
demostrado el teorema. Una transformación de este tipo es llamada transfomación de
Legendre (1752-1833).
En sı́ntesis, las fórmulas caracterı́sticas de una transformación de Legendre son:
X = X(x1 , x2 , ...xn ; α1 , α2 , ...αm )
(4.22)
88 / Mecánica clásica avanzada
Y = Y (y1 , y2 , ...yn ; α1 , α2 , ...αm )
yi =
∂X
;
∂xi
Y =
X
k
xi =
∂Y
;
∂yi
xk yk − X ;
(4.23)
i = 1, 2, ...n
∂X
∂Y
=−
;
∂αi
∂αi
(4.24)
i = 1, 2, ...m
(4.25)
Las ecuaciones de movimiento hamiltonianas. La transformación de las
variables lagrangianas a las hamiltonianas es una transformación de Legendre generada
por la función L. Aquı́ las q̇ν hacen el papel de las xi , el conjunto (q), t, hace el papel
de las (α), y las pν hacen el papel de las yi ; L es X. Comparando (4.13) y (4.16) vemos
que H es Y :
H(q, p, t) =
l
X
ν=1
pν q̇ν − L(q, q̇, t)
(4.26)
Es decir, L genera la transformación (q̇) → (p) y H genera la transformación
inversa (p) → (q̇):
q̇ν =
∂H(q, p, t)
∂pν
(4.27)
De las ecuaciones (4.20) se sigue inmediatamente que:
∂H
∂L
=−
;
∂qν
∂qν
ν = 1, 2, ...l
(4.28)
∂H
∂L
=−
∂t
∂t
(4.29)
teniendo en cuenta que el conjunto (q), t, hace el papel de las (α). De las ecuaciones de
Lagrange se sigue que:
∂L
d ∂L
=
− fν = ṗ − fν ;
∂qν
dt ∂ q̇ν
ν = 1, 2, ...l
(4.30)
Las ecuaciones (4.27) a (4.30) nos dan:
q̇ν =
∂H
;
∂pν
p˙ν = −
∂H
+ fν ;
∂qν
ν = 1, 2, ...l
(4.31)
Las ecuaciones (4.31) se denominan las ecuaciones canónicas de Hamilton y constituyen las ecuaciones de movimiento en las variables hamiltonianas. Son 2l ecuaciones
diferenciales que involucran sólo primeras derivadas de (q) y (p), en tanto que las de
Lagrange son l ecuaciones deferenciales de segundo orden en las (q). En esencia sólo el
segundo conjunto de ecuaciones (4.31) constituye las ecuacionnes de movimiento, pues
el primer conjunto sólo proporciona la transformación inversa a pν = ∂L/∂ q̇ν .
La formulación hamiltoniana / 89
La función hamiltoniana. H no sólo permite escribir las ecuaciones de movimiento sino que tiene significado fı́sico directo. Veamos qué es Ḣ:
l X
∂H
∂H
∂H
Ḣ =
q̇ν +
ṗν +
∂q
∂p
∂t
ν
ν
ν=1
=
l
X
[(fν − ṗν ) q̇ν + q̇ν ṗν ] +
l
X
fν q̇ν +
ν=1
=
ν=1
∂H
∂t
(4.32)
∂H
∂t
Si las ligaduras reónomas no dan lugar a que t aparezca en H y el potencial no
depende del tiempo, ∂H/∂t = 0, y si además no hay fuerzas no derivables del potencial,
se sigue que Ḣ = 0, o sea que H es una constante de movimiento. Si además las fuerzas
son derivables de un potencial que no depende de las velocidades, sabemos de (3.112)
que H = T + V . O sea que bajo estas condiciones la energı́a total E = T + V se conserva,
de lo contrario se cumple que H es constante pero no es cierto que H = E. Si V no
depende de (q̇) ni de t y las ligaduras reónomas no dan lugar a que t aparezca en H se
cumple que ∂H/∂t = 0 y que H = T + V . En este caso:
l
d(T + V ) X
dE
=
=
fν q̇ν
dt
dt
ν=1
(4.33)
Luego, dE/dt es igual a la rata a la cual las fuerzas no conservativas realizan trabajo sobre el sistema. Si estas son nulas, la energı́a total se conserva.
Por otra parte, si las fν son cero, o bien V depende de t, o las ligaduras reónomas
dan lugar a que t aparezcan en H,
dH
∂H
=
dt
∂t
(4.34)
Ejemplo 4.1.2 Usando la transformación de Legendre inversa, derivar las ecuaciones de
movimiento lagrangianas a partir de las ecuaciones de movimiento hamiltonianas.
Supongamos que fν = 0. Las ecuaciones de movimiento serán:
q̇ν =
∂H
;
∂pν
ṗ = −
∂H
;
∂qν
ν = 1, 2, ...l
(4.35)
La transformación de Legendre inversa es (p) → (q̇) y está generada por H:
q̇ν =
∂H(q, p, t)
;
∂pν
ν = 1, 2, ...l
(4.36)
El generador de la transformación (q̇) → (p) es L:
L(q, q̇, t) =
l
X
ν=1
q̇ν pν − H(q, p, t)
(4.37)
90 / Mecánica clásica avanzada
En virtud del teorema dado por (4.20):
∂L
∂H
=−
;
∂qν
∂qν
ν = 1, 2, ...l ;
∂L
∂H
=−
∂t
∂t
(4.38)
O sea:
∂L
= ṗν ;
∂qν
ν = 1, 2, ...l
(4.39)
Como L genera la transformación (q̇) → (p)
pν =
∂L
;
∂ q̇ν
ν = 1, 2, ...l
(4.40)
Con lo cual llegamos a las ecuaciones de Lagrange:
d ∂L
∂L
=
;
∂qν
dt ∂ q̇ν
ν = 1, 2, ...l
(4.41)
Ejemplo 4.1.3 Hallar las ecuaciones de movimiento correspondientes a las variables (p),
(ṗ) y t obtenidas mediante una transformación de Legendre.
El generador de la transformación (q) → (−ṗ) es H:
−ṗν =
∂H
;
∂qν
ν = 1, 2, ...l
(4.42)
Entonces el generador de la transformación (−ṗ) → (q) será cierta función L′ (p, ṗ, t)
dada por:
L′ (p, ṗ, t) =
l
X
(−ṗν )qν − H(q, p, t)
(4.43)
ν=1
En virtud del teorema (4.20):
∂L′
∂H
=−
;
∂pν
∂pν
ν = 1, 2, ...l;
∂L′
∂H
=−
∂t
∂t
(4.44)
Como en virtud de las ecuaciones de Hamilton:
∂H
= q̇ν ;
∂pν
ν = 1, 2, ...l
(4.45)
y debido a que L′ genera la transformación (−ṗ) → (q)
−qν =
∂L′
;
∂ ṗν
ν = 1, 2, ...l
(4.46)
Se sigue de (4.44), (4.45) y (4.46) que:
d ∂L′
∂L′
= −q̇ν =
;
∂pν
dt ∂ ṗν
ν = 1, 2, ...l
(4.47)
La formulación hamiltoniana / 91
Entonces las ecuaciones de movimiento lagrangianas para las variables (p) y (ṗ)
son:
∂L′ (p, ṗ, t)
d ∂L′ (p, ṗ, t)
−
= 0;
∂pν
dt
∂ ṗν
ν = 1, 2, ...l
(4.48)
Esta es la representación de momentos, que nos dice que mediante las variables
(p), (ṗ) es posible describir completamente el sistema.
Ejemplo 4.1.4 Hallar las ecuaciones de movimiento lagrangianas y hamiltonianas para
una partı́cula de masa m en el potencial V = −k/r (r distancia del origen a la partı́cula).
L=T −V =
1 2 k
mṙ +
2
r
(4.49)
L es esféricamente simétrico, luego se conserva el momento angular ~l = m~r × ~r˙ :
~l es constante en magnitud y dirección. Entonces ~r y ~r˙ son perpendiculares a ~l y en
consecuencia el movimiento es en un plano. Elegimos un sistema de coordenadas polares
en el plano del movimiento, con lo cual:
L=
k
1
m(ṙ2 + r2 φ̇2 ) +
2
r
(4.50)
El sistema, para ~l dado, tiene en esencia dos grados de libertad, luego hay dos
ecuaciones de Lagrange:
mr̈ − mrφ̇ +
k
=0 y
r2
mr2 φ̇ = constante
(4.51)
Como ~l vale:
~l = m~r × ~r˙ = mr2 φ̇k̂
(4.52)
donde k̂ es un vector unitario normal al plano del movimiento, se sigue de (4.51) y (4.52)
que:
mr̈ −
k
l2
+ 2 =0
mr3
r
(4.53)
La anterior es una ecuación que permite hallar a r(t) para l dado. Una vez conocido
r(t), tenemos que φ(t) se determina al integrar:
φ̇ =
l
mr2
(4.54)
Para pasar al formalismo hamiltoniano partimos de las fórmulas de transformación:
pr =
∂L
= mṙ ;
∂ ṙ
pφ =
∂L
= mr2 φ̇ = l = constante
∂ φ̇
(4.55)
92 / Mecánica clásica avanzada
El hamiltoniano será:
H(r, φ, pr , pφ ) = pr ṙ + pφ φ̇ − L =
p2φ
p2r
1
+ 2 − m
m
r
2
p2φ
p2r
2
+
r
m2
m2 r 4
!
−
k
r
(4.56)
Con lo cual:
H=
p2φ
p2r
k
− =T +V
+
2m 2mr2
r
(4.57)
Las ecuaciones de Hamilton serán:
ṙ = −
φ̇ =
∂H
pr
=
;
∂pr
m
pφ
∂H
=
;
∂pφ
mr2
ṗr = −
p2φ
k
∂H
=− 3 + 2
∂r
mr
r
(4.58)
∂H
ṗφ = −
=0
∂φ
Las ecuaciones (4.58) de la izquierda no son más que las ecuaciones de la transformación inversa a (4.55). Al reemplazar éstas en las ecuaciones (4.58) de la derecha,
se obtienen las ecuaciones (4.51), como es de esperarse. Es decir, el formalismo hamiltoniano no aporta nada nuevo en cuanto a las ecuaciones de movimiento se refiere.
Notamos que φ es cı́clica tanto en L como en H. En consecuencia pφ se conserva.
H presenta las mismas simetrı́as que L y por tanto tiene los mismos teoremas de conservación.
Ejemplo 4.1.5 Hallar el hamiltoniano y las ecuaciones de movimiento para una partı́cula
en un sistema de coordenadas que rota uniformemente con velocidad angular ~ω .
En el sistema de ejes espaciales:
1
L ~r, ~r˙ = m~r˙2 − V (~r)
2
(4.59)
Si instantáneamente coinciden los ejes espaciales y los ejes rotantes, se cumple que:
~r = ~r
~r˙ = ~r˙ + ~
ω × ~r
(4.60)
donde ~r es el vector de posición de la partı́cula respecto a los ejes rotantes y ~r˙ su velocidad
en esos ejes. Entonces usando la transformación (4.60), (4.59) tomará la forma:
1 2
2
˙
˙
˙
~
~
~
~
~
~
− V ~r
L r, r = m r + 2r · ~ω × r + ~ω × r
(4.61)
2
Las componentes del momento canónico son:
px =
∂L
...
∂ ẋ
(4.62)
La formulación hamiltoniana / 93
O vectorialmente:
~p = ∂L = m ~r˙ + ~
ω × ~r
∂~r˙
(4.63)
La velocidad expresada en términos del momento es:
~
~r˙ = p − ~
ω × ~r
m
(4.64)
El lagrangiano (4.61) en términos de las variables hamiltonianas es:
1 p2
L ~r, ~p =
− V ~r
2m
(4.65)
El hamiltoniano será:
H ~r, ~p =
X
ν
pν q̇ ν − L = ~p ·
~p
− ~ω × ~r
m
Con lo cual:
H=
1 p2 ~
ω × ~r + V ~r
−p· ~
2m
!
−
1 p2
+ V ~r
2m
(4.66)
(4.67)
˙ H es:
En términos de ~r y ~r,
h=
2
1 ~˙ 2 1
mr − m ~
ω × ~r + V ~r
2
2
(4.68)
Nótese que el hamiltoniano correspondiente a L(~r, ~r˙ ) difiere de h por el término
m(~ω × ~r)2 /2. Comparando las ecuaciones (4.61) y (4.68) vemos que h no es T + V . De
acuerdo con (3.124), h es T + V sólo si T es función cuadrática de las velocidades, en
tanto que en este caso hay en T términos de las formas T1 y T0 .
T2 =
1 2
mṙ
2
T1 = m~r˙ · (~
ω × ~r )
T0 =
(4.69)
1
m(~
ω × ~r)2
2
h es una constante de movimiento porque L no depende del tiempo y no hay fuerzas
disipativas, pero E = T + V no es constante de movimiento. De acuerdo con (3.126):
Ė = Ṫ1 + 2Ṫ0
(4.70)
Vemos que T1 + 2T0 actúan como un trabajo sobre el sistema que hace que E no
sea constante. Esto es debido a la rotación del sistema de coordenadas. Sucede que en
este caso la transformación ~r → ~r depende del tiempo debido a la rotación, con lo cual
la transformación es de tipo reónomo. T1 + 2T0 es un potencial “ficticio” inercial. T1
94 / Mecánica clásica avanzada
está asociada con la fuerza de Coriolis y T0 con la fuerza centrı́fuga. H puede escribirse
como:
H=
p2
−~
ω · ~r × ~p + V ~r
2m
(4.71)
en términos de ~l = ~r × ~p se escribe como:
H=
p2
−~
ω · ~l + V ~r
2m
(4.72)
como ~r depende explı́citamente del tiempo, es de esperarse que ~l no se conserve.
Las ecuaciones de movimiento son:
∂H ~
∂V
= p × ~ω −
∂~r
∂~r
~p˙ =
−
~r˙ =
~p
∂H
=
− ~ω × ~r
m
∂~p
(4.73)
Como suponemos a ~ω constante,
~p × ~ω
~˙
1 ∂V
~¨r = p − ~
− ~ω × ~r
ω × ~r˙ =
−
m
m
m ∂~r
(4.74)
Expresando en (4.74) a ~p en términos de ~r˙ obtenemos:
1 ∂V
~¨r + 2~
ω × ~r˙ + ~
ω × ~ω × ~r = −
m ∂~r
(4.75)
Vemos que la fuerza en el sistema rotante no es masa por aceleración, sino que tiene
dos términos adicionales, el centrı́fugo y el de Coriolis, que caracterizan el movimiento
de una partı́cula descrito desde un sistema de referencia no inercial.
4.2.
Simetrı́as y el teorema de conservación
Una coordenada cı́clica en L también es cı́clica en H. En efecto, de las ecuaciones
de Lagrange y de las ecuaciones de Hamilton se sigue respectivamente que:
∂L
∂qν
ṗν =
fν +
ṗν =
∂H
;
fν −
∂qν
(4.76)
ν = 1, 2, ...l
Con lo cual siempre se cumple:
∂L
∂H
=−
;
∂qν
∂qν
ν = 1, 2, ...l
(4.77)
La formulación hamiltoniana / 95
que en realidad es una propiedad general de la transformación de Legendre (q̇) → (p)
según (4.28). Se sigue que todos los resultados obtenidos para L en cuanto a la relación
entre simetrı́as y teoremas de conservación se aplican directamente en el formalismo
hamiltoniano.
De (4.32) se sigue que si no hay fuerzas disipativas y H no contiene el tiempo
explı́citamente (o, de (4.29), cuando L no contiene el tiempo explı́citamente):
dH
∂H
=−
=0
dt
∂t
(4.78)
Además, si la transformación a coordenadas generalizadas no contiene el tiempo
explı́citamente y V no depende de las velocidades, H = T + V = E, o sea que la energı́a
se conserva. Si H no depende de t pero hay fuerzas disipativas:
l
X
dA
dH
=
fν q̇ν =
dt
dt
ν=1
(4.79)
Si además H = T + V = E, se sigue:
dA
dE
=
dt
dt
(4.80)
Si la transformación de coordenadas depende del tiempo explı́citamente, V no
depende de (q̇) y fν = 0,
T = T0 + T1 + T2
(4.81)
entonces se sigue que:
pν = 2
l
X
Aµν q̇µ + Aν ;
ν = 1, 2, ...l
(4.82)
µ=1
con lo cual
H = T2 − T0 + V = E − T1 − 2T0
(4.83)
la H anterior en general no se conserva.
Simetrı́as de cambio de escala. Supongamos que el sistema es conservativo,
de modo que E = T + V . Por simplicidad supondremos que no hay ligaduras, de modo
que las coordenadas cartesianas pueden tomarse como coordenadas generalizadas independientes. La simetrı́a de cambio de escala se da en una clase restringida de sistemas:
aquellos en los cuales la energı́a potencial V es una función homogénea de grado k:
V (λ~r1 , λ~r2 , ...λ~rN ) = λk V (~r1 , ~r2 , ...~rN )
(4.84)
En coordenadas cartesianas T no depende de las coordenadas y es una función
homogénea cuadrática de las velocidades:
˙ ) = λ2 T (~r˙ 1 , ~r˙ 2 , ...~r˙ N )
T (λ~r˙1 , λ~r˙2 , ...λ~rN
(4.85)
96 / Mecánica clásica avanzada
Supongamos la siguiente transformación de cambio de escala en las longitudes y
tiempos:
~ri
t
→ α~ri ;
i = 1, 2, ...N
(4.86)
→ βt
Entonces:
V → αk V ; T →
2
α
T
β
(4.87)
El cambio en H será:
2
α
T + αk V
H→
β
(4.88)
H será función homogénea de grado k bajo la transformación (4.86) si:
α2
= αk ;
β2
H → αk H
(4.89)
Esta transformación no cambia la forma de las ecuaciones de Hamilton:
α2
1 β 2 ∂H
α
1 ∂H
→ ~r˙ i =
;
~r˙ i =
m ∂~r˙ i
β
m α ∂~r˙ i
β
i = 1, 2, ...N
α2
α
∂H
β 2 ∂H
→ m 2 ~¨r i =
m~¨ri = −
∂~ri
β
α ∂~ri
(4.90)
(4.91)
Esta transformación pertenece a la clase de las transformaciones canónicas, o sea
a las transformaciones que no cambian la forma de las ecuaciones canónicas.
La ecuación (4.86) dice que si las longitudes l se cambian por l′ = αl y los tiempos
t por t′ = βt, el sistema tendrá simetrı́a de cambio de escala si α y β son tales que se
cumple (4.89), β = α1−k/2 , o sea si la transformación en longitudes y tiempos cumple:
′ 1−k/2
t′
l
(4.92)
=
t
l
La ecuación (4.92) permite obtener algunas simples relaciones entre los perı́odos
de oscilación de sistemas periódicos que sólo difieren entre sı́ por sus dimensiones caracterı́sticas y para los cuales V sea función homogénea.
Para el péndulo simple, donde el potencial mgz es función homogénea de grado 1:
r
t′
l′
=
,
(4.93)
t
l
como se ve, es general; vale no sólo para pequeñas oscilaciones.
La formulación hamiltoniana / 97
Para el oscilador armónico simple V es función homogénea de grado k = 2. En este
caso:
t′
=1
t
(4.94)
Nos dice que el perı́odo del movimiento no depende de la amplitud.
Para el potencial gravitacional, V = −Gm1 m2 /r, k = −1. Entonces:
t′
=
t
′ 3/2
l
l
(4.95)
En este caso la longitud caracterı́stica es la distancia media al sol. La ecuación
(4.95) expresa la tercera ley de Kepler, que vale para un potencial del tipo 1/r solamente.
Una transformación canónica se refiere sólo a transformaciones de las coordenadas y momentos, pero no del tiempo. Sin embargo, la transformación (4.86), cuando
las coordenadas cartesianas son a la vez generalizadas, es equivalente a la transformación canónica ~ri → α~ri ; ~
pi → (α/β)~
pi , i = 1, 2, ...N . En rigor (4.86) debe llamarse
transfomación de semejanza mecánica.
4.3.
La segunda forma del principio de Hamilton
La segunda forma del principio de Hamilton es simplemente el principio variacional
del cual puede obtenerse la trayectoria del sistema en el espacio de fases. En otras
palabras, se busca hallar qué principio variacional conduce a las ecuaciones de Hamilton
como ecuaciones de Euler-Lagrange, en el espacio de fases:
Z x2
∂f
d ∂f
−
=0
(4.96)
f (y, y ′ , x)dx = 0 implica que
δ
′
dx
∂y
∂y
x1
Sea la función:
L̃(q, p, q̇, ṗ, t) =
l
X
ν=1
pν q̇ν − H(p, q, t)
(4.97)
L̃ es función de las variables señaladas tomadas independientemente. En particular
(p) y (q̇) toman todos los valores compatibles con las ligaduras, independientemente de
que se puedan relacionar mediante una transfomación de Legendre. Sea ahora el siguiente
principio variacional en el espacio de fases:
δ
Z
t2
L̃(q, p, q̇, ṗ, t) dt = 0
(4.98)
t1
Con las condiciones en los extremos:
δpν = 0 ,
δqν = 0
en
t = t1
y
t = t2 ;
ν = 1, 2, ...l
(4.99)
98 / Mecánica clásica avanzada
Las ecuaciones correspondientes de Euler-Lagrange son:
d ∂ L̃
∂ L̃
−
= 0;
dt ∂ q̇ν
∂qν
ν = 1, 2, ...l
d ∂ L̃
∂ L̃
−
= 0;
dt ∂ ṗν
∂pν
ν = 1, 2, ...l
(4.100)
Las ecuaciones (4.97) y (4.100) conducen a las ecuaciones canónicas de Hamilton.
L̃ y L coinciden solamente sobre las trayectorias verdaderas, para las cuales se debe
cumplir que:
pν =
∂L
∂ q̇ν
ν = 1, 2, ...l
(4.101)
El espacio de fases. La formulación lagrangiana está definida en el espacio de
configuración l-dimensional constituido por las coordenadas generalizadas q1 , q2 , ...ql .
Matemáticamente, el espacio de configuración puede considerarse como una variedad
diferenciable de l dimensiones. El espacio de los momentos generalizados también es l
dimensional y está constituido por los p1 , p2 , ...pl y se llama espacio de los momentos,
que también es una variedad diferenciable de l dimensiones.
Como sabemos, el estado del sistema puede describirse igualmente por (q, q̇) o por
(p, ṗ), o por dos puntos del espacio de configuración o el de momentos respectivamente.
q1 , q2 , ...ql ; p1 , p2 , ...pl forman el espacio de fases que es una variedad diferenciable
2l-dimensional. Cada punto del espacio de fases representa un estado del sistema y cada trayectoria de fases representa un estado de movimiento del sistema. En efecto, las
variables hamiltonianas (q, p) especifican exhaustivamente el estado del sistema.
Ejemplo 4.3.1 Sea una partı́cula de masa m sometida a la condición de ligadura de
moverse sobre la superficie de un cilindro, y sometida a una fuerza restauradora lineal
dirigida hacia el centro del cilindro, F~ = −k~r, donde se toma el origen de coordenadas
en el centro del cilindro. Hacer un estudio de la trayectoria en el espacio de fases.
Tomando el eje z a lo largo del eje del cilindro, la condición de ligadura se puede
expresar por:
x2 + y 2 = R2
(4.102)
Las coordenadas generalizadas pueden tomarse θ, z, donde θ es un ángulo en el
plano perpendicular al eje del cilindro. Entonces L(θ, θ̇, z, ż) será:
1
1
m(R2 θ̇2 + ż 2 ) − k(R2 + z 2 )
2
2
Los momentos canónicos son:
L=T −V =
pθ = mR2 θ̇ ;
pz = mż
(4.103)
(4.104)
El hamiltoniano será:
H =T +V =
1
p2θ
p2z
+ kz 2
+
2
2m 2mR
2
(4.105)
La formulación hamiltoniana / 99
donde hemos suprimido una constante aditiva. Planteando las ecuaciones de Hamilton
e integrándolas se llega a la solución:
θ = θ0 + at
z = z0 sen
(4.106)
r
k
t+δ
m
!
(4.107)
donde θ0 , a, z0 y δ son constantes de integración. Las ecuaciones (4.106) y (4.107)
permiten hallar la ecuación de la trayectoria en el espacio de configuración:
!
r
1 k
θ+φ ,
(4.108)
z = z0 sen
a m
p
gráficamente tomamos θ0 = 0, δ = 0, de modo que φ = 0. Llamando ω =
k/m
obtenemos:
ω
(4.109)
θ = at ;
z = z0 sen ωt ; z = z0 sen θ
a
x
R
–R
m
z
–z0
z0
R
y
–R
w=a
Figura 4.1 Partı́cula constreñida a moverse sobre la superficie de un cilindro
La figura 4.1 representa el caso en que ω = a. La trayectoria en el espacio de
configuración siempre será cerrada cuando ω/a sea un número racional. La proyección
del movimiento sobre el eje z es armónica simple y sobre el plano x − y es circular
uniforme.
Como l = 2, el espacio de fases es 4-dimensional, constituido por θ, pθ , z, pz .
Como pθ es constante, pθ = mR2 a, basta representar la proyección del espacio
4-dimensional sobre el subespacio 3-dimensional θ, z, pz . La proyección de la trayectoria
de fases sobre pθ es un punto.
El movimiento en z es armónico simple. El diagrama de fases ż, z, es una elipse.
Igualmente la proyección de la trayectoria de fases sobre el plano z, pz será una elipse. El
100 / Mecánica clásica avanzada
diagrama de fases θ̇, θ, es una lı́nea recta, como también la proyección de la trayectoria
de fases sobre el plano θ, pθ .
La proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz , es
una hélice elı́ptica. Esto es representado en la figura 4.2.
pz
Ez = cte
pθ
pθ = cte
θ
z
pθ = mR2a
pz2 1
Ez =
+
kz 2
zm i2
pθ
pz
pθ = cte
θ
z
Superficie Ez = cte
Figura 4.2 Arriba: diagramas de fases sobre los planos z-pz y θ-pθ respectivamente. Abajo:
Proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz .
Para este ejemplo, el principio de Hamilton dice que la trayectoria correcta en el
espacio de configuración es aquella para la cual la integral de acción es extremal:
#
Z t2 "X
Z t2
l
∂L
L(q, q̇, t) dt = δ
δ
q̇ν − h(q, q̇, t) dt = 0
∂ q̇ν
t1
t1
ν=1
(4.110)
{δqν (t1 ) = δqν (t2 ) = 0}
En tanto que el principio de Hamilton en el espacio de fases (segunda forma del
principio de Hamilton) dice que la trayectoria correcta en el espacio de fases es aquella
para la cual es extremal la integral sobre dt de L̃ (véase figura 4.2):
δ
Z
t2
L̃(q, q̇, p, ṗ, t) dt =
δ
Z
l
t2 X
t1 ν=1
t1
[pν q̇ν − H(q, p, t)] dt = 0
δqν (t1 ) =
δqν (t2 ) = 0
δpν (t1 ) =
δpν (t2 ) = 0
(4.111)
La formulación hamiltoniana / 101
4.4.
Las transformaciones puntuales. Las transformaciones en el espacio de fases
Puntuales son las transformaciones de un sistema de coordenadas generalizadas a
otro:
qν → q ν = q ν (q, t) ;
ν = 1, 2, ...l
(4.112)
Las velocidades generalizadas se transforman como:
q̇ µ =
l
X
∂q ν
∂q
q̇µ + ν = q̇ ν (q, q̇, t) ;
∂qµ
∂t
ν=1
ν = 1, 2, ...l
(4.113)
Bajo estas transformaciones, tanto las ecuaciones de Lagrange como las de Hamilton son covariantes.
Transformaciones en el espacio de fases. Son transformaciones más generales
que las puntuales. Si para definir el estado del sistema se requiere todo el espacio de
fases, podemos pensar que cualquier conjunto de variables (2l) sirve equivalentemente
para describir el estado. Un cambio de variables en el espacio de fases involucra no sólo
las coordenadas generalizadas sino también los momentos:
qν , pν → q ν = q ν (q, p, t) ;
pν = pν (q, p, t) ;
ν = 1, 2, ...l
(4.114)
Ejemplo 4.4.1 Un oscilador armónico unidimensional. El espacio de fases es bidimensional, definido por las “coordenadas cartesianas” x − px . Definir en el espacio de fases
una transformación a “coordenadas polares”; hallar a H y las ecuaciones de Hamilton
en esas variables (véase figura 4.3). Nota: es irrelevante reemplazar a px por px /mω.
La transformación a coordenadas polares está dada por:
p2x
= r2
m2 ω 2
px
tan φ =
mωx
x+
(4.115)
(4.116)
Entonces H se transforma ası́:
H=
p2x
1
p2
1
1
+ mω 2 x2 = mω 2 x2 + 2x 2 = mω 2 r2
2m 2
2
m ω
2
(4.117)
Es decir, el nuevo hamiltoniano es:
1
mω 2 r2
2
Las ecuaciones de Hamilton se transforman ası́:
∂H ∂r
∂H ∂φ
∂H
=
+
ẋ =
∂px
∂r ∂px
∂φ ∂px
H=
∂H px
1
∂H
=
+
∂r m2 ω 2 r
∂φ mωx sec2 φ
(4.118)
(4.119)
102 / Mecánica clásica avanzada
px / mω
r
ϕ
x
Figura 4.3 Espacio de fases para el oscilador armónico unidimensional
ṗx = −
∂H
∂x
=−
=−
∂H ∂φ
∂H ∂r
+
∂r ∂x
∂φ ∂x
−px
∂H x ∂H
+
∂r r
∂φ mωx2 sec2 φ
(4.120)
Se obtiene entonces para ∂H/∂px y ∂H/∂x:
∂H
∂H senφ ∂H cos φ
=
+
∂px
∂r mω
∂φ mωr
(4.121)
∂H
∂H
∂H sen φ
=
cos φ −
∂x
∂r
∂φ r
Por otra parte se tiene para ẋ y ṗx :
ẋ =
∂x
∂x
φ̇ = cos φ ṙ − r senφ φ̇
ṙ +
∂r
∂φ
(4.122)
ṗx =
∂px
∂px
φ̇ = mω senφ ṙ + mωr cos φ φ̇
ṙ +
∂r
∂φ
o sea que las ecuaciones de Hamilton se transforman en:
cos φ ṙ − r senφ φ̇ =
∂H senφ ∂H cos φ
+
∂r mω
∂φ mωr
(4.123)
La formulación hamiltoniana / 103
mω senφ ṙ + mωr cos φ φ̇ = −
∂H
∂H senφ
cos φ +
∂r
∂φ r
(4.124)
Podemos resolver simultáneamente a (4.123) y (4.124) para ṙ y φ̇. El resultado se
obtiene fácilmente con notación matricial:



ṙ
cos φ −senφ


=
senφ cos φ
rφ̇

∂H
senφ
cos φ

∂r
1 


 1 ∂H
mω
− cos φ senφ
r ∂φ



(4.125)




Esto se puede escribir también como:




ṙ
cos φ senφ
cos φ −senφ



=
−senφ cos φ
senφ cos φ
rφ̇

∂H
cos φ +senφ
senφ
cos φ

∂r
1 



mω
 1 ∂H
−senφ cos φ
− cos φ senφ
r ∂φ



De donde:

∂H
ṙ
0 1

∂r

= 1 


mω
 1 ∂H
−1 0
rφ̇
r ∂φ






(4.126)






1 ∂H


1 

 r ∂φ 
=


 mω  ∂H 
−
∂r
(4.127)
Con lo cual las ecuaciones de movimiento en las nuevas variables son:
r=
1 ∂H
;
mωr ∂φ
φ̇ = −
1 ∂H
mωr ∂r
(4.128)
Vemos que en las variables (r, φ) las ecuaciones de movimiento no toman la misma
forma que las ecuaciones canónicas (no son r = ∂H/∂φ; φ̇ = −∂H/∂r, por ejemplo).
En general, una transformación de variables en el espacio fásico cambia la forma de las
ecuaciones de movimiento. En general, las ecuaciones de Hamilton no son covariantes
bajo transformaciones arbitrarias en el espacio de fases. Notemos sin embargo, que hay
una transformación canónica en términos de (r, φ). Hagamos ahora el nuevo cambio de
variables:
(r, φ) → (r2 , φ)
(4.129)
104 / Mecánica clásica avanzada
Si llamamos ρ = r2 , tenemos que:
∂H
∂H
=
2r ;
∂r
∂ρ
ρ̇ = 2r ṙ
(4.130)
O sea que las ecuaciones de Hamilton para las variables (ρ, φ), que obtenemos de
(4.128) y (4.130), son:
mω
∂H
ρ̇ =
;
2
∂φ
φ̇ = −
2 ∂H
mω ∂ρ
Notemos finalmente que si llamamos q, p, a:
mω
q = −φ ; p =
ρ
2
(4.131)
(4.132)
las ecuaciones (4.131) se convierten en:
ṗ = −
∂H
;
∂q
q̇ =
∂H
∂p
(4.133)
O sea que la transformación en el espacio fásico bidimensional definida por:
r
√
2p
cos q ;
x=
px = − 2ωp senq
mω
(4.134)
2
mω
p
p
x
p=
x2 + 2x 2 ; q = −tan−1
2
m ω
mωx
deja covariantes las ecuaciones de Hamilton, donde el nuevo hamiltoniano se obtiene del
anterior simplemente expresando a x y px en función de q y p mediante las fórmulas
(4.134):
H = (q, p) = H [x(q, p), px (q, p)]
(4.135)
Se dice entonces que la transformación (4.134) es canónica. La referencia hecha en
el enunciado al oscilador armónico no es importante, pues la covariancia de las ecuaciones de Hamilton bajo la transformación (4.134) no depende de la forma de H, siendo
aplicable a cualquier sistema de un grado de libertad.
En general, a la pregunta acerca de la covariancia de las ecuaciones de Hamilton
bajo una transformación arbitraria en el espacio de fases, (q, p) → (q, p), se responde
que no necesariamente son covariantes. Pero existe una clase de transformaciones para
las cuales esto se cumple; tales transformaciones se llaman canónicas o de contacto.
La transformación empleada en las ecuaciones (4.90), (4.91) y (4.134), son ejemplos de
transformaciones canónicas.
Ejemplo 4.4.2 Efectuar una rotación con velocidad angular constante a en el espacio
de fases bidimensional. Mostrar que tal transformación es canónica sólo si al nuevo
hamiltoniano se le adiciona un término. Mostrar que las fórmulas de transformación y
el nuevo hamiltoniano se pueden obtener a partir de las primeras derivadas de cierta
función F (q, q, t). Mostrar que F satisface una ecuación diferencial parcial si se anula el
nuevo hamiltoniano, lo cual es posible para un oscilador armónico.
La formulación hamiltoniana / 105
Las fórmulas de la transformación y su inversa son:
p
q = q cos at + sen at ; p = −cq sen at + p cos at
c
q
q = q cos at − sen at ; p = cq sen at + p cos at
c
donde a y c son parámetros de la transformación que permanecen constantes.
Es simple probar que:

 
  q̇ 
q̇
cos at −sen at


 



=

ṗ
ṗ
sen at cos at
c
c

 q 
−sen at − cos at


+a 
 p 
cos at −sen at
c
y que:




∂H
∂H


cos at −sen at




∂p
∂p

 



=


 1 ∂H 
 1 ∂H 
sen at cos at
−
−
c ∂q
c ∂q
Igualando los lados derechos de (4.137) y (4.138) obtenemos:
 ∂H 



 q 
q̇
0
−1


∂p



 


=
 + a
 p 
 1 ∂H 
q̇
1 0
−
c
c
c ∂q
(4.136)
(4.137)
(4.138)
(4.139)
Las ecuaciones de movimiento para las variables q y p son:
a
∂H
= q̇ − p ;
∂q
c
∂H
= −ṗ − acq
∂q
(4.140)
Estas ecuaciones serán de forma canónica solamente si se cambia el nuevo hamiltoniano:1
2
p
1
(4.141)
H(q, p) = H [q(q, p), p(q, p)] + a
+ cq 2
2
c
Notemos que las ecuaciones (4.136) permiten expresar a p/c y p/c en términos de
q, q:
q − q cos at
p
=
;
c
sen at
1 En
p
−q + q cos at
=
c
sen at
(4.142)
general una transformación dependiente del tiempo es canónica si H es igual a H más ciertos
términos adicionales.
106 / Mecánica clásica avanzada
Si F es la función de q, q y t siguiente:
F (q, q, t) = c
2qq − (q 2 + q 2 ) cos at
2 sen at
(4.143)
Comparando a (4.142) y (4.143) vemos que:
p=
∂F (q, q, t)
;
∂q
p=−
∂F (q, q, t)
∂q
(4.144)
Como las ecuaciones (4.144) son completamente equivalentes a las ecuaciones de
transformación (4.136), se dice que F es la función generatriz de la transformación, que
será canónica solamente si el nuevo hamiltoniano es:
H =H+
∂F
∂t
(4.145)
puesto que,
∂F (q, q, t)
−2qq cos at + q 2 + q 2
ca
= ca
=
2
∂t
2 sen at
2
p2
2
q + 2
c
(4.146)
Los anteriores resultados valen para cualquier sistema de un grado de libertad.
Para un oscilador armónico encontramos que:
k 2 1 c2
p2
H[q(q, p), p(q, p)] =
+ q +
− k q 2 sen2 at
2m 2
2 m
(4.147)
p2 k
c
1
k
q p sen at cos at +
sen2 at
+
−
−
m
c
2 c2
m
Si escogemos el valor de c tal que:
c2 = km
(4.148)
Obtenemos que:
H(q, p) =
k
q2
a p2
+ q 2 + ( + cq 2 )
2m 2
2 c
(4.149)
H será cero solamente si a y c cumplen:
1
a
+ = 0;
m
c
k + ac = 0
(4.150)
Es decir, si a =√
−c/m = −k/c, valor que es compatible con el valor de c dado por
(4.148). Como c = ± km, a debe valer:
r
k
(4.151)
a=±
m
Tomamos negativo
el valor de c para que a sea positiva y coincida con la frecuencia
p
del oscilador ω = k/m. Notamos que H = 0 implica que q y p son constantes, o sea
que las fórmulas (4.136) nos dan directamente la solución en términos de q y p que se
La formulación hamiltoniana / 107
determinan por las condiciones iniciales de q y p.2 Es simple verificar que F satisface la
ecuación diferencial llamada de Hamilton-Jacobi para el oscilador armónico:
2
∂F
1
∂F
1
+ kq 2 +
=0
(4.152)
2m ∂q
2
∂t
F es una solución de (4.152) que no posee la propiedad de ser la suma de una
función de t y una función de q. Posteriormente veremos que (4.152) posee otra solución
por el método de separación de variables (llamada solución completa) que genera otra
trasformación canónica que anula el hamiltoniano para un oscilador armónico.
4.5.
Las transformaciones canónicas
o de contacto
Estas transformaciones en el espacio de fases son importantes, entre otras cosas,
porque conservan el formalismo canónico y permiten reemplazar el hamiltoniano H por
una H que tenga una forma mucho más simple. Ası́ por ejemplo, es posible mediante
una transformación canónica hacer que todas las coordenadas sean cı́clicas; con ello la
solución de un problema mecánico se reduce a un problema de geometrı́a en el espacio
de fases: hallar la transformación canónica adecuada.
Ejemplo 4.5.1 Mostrar que la transformación de cambio de escala es canónica independientemente de las propiedades de homogeneidad del potencial. Tal transformación es:
q ν = αqν ;
pν = βpν ;
α 6= 0 ,
β 6= 0 ;
ν = 1, 2, ...l
(4.153)
Mediante esta transformación se tiene:
∂H
∂H
=α
;
∂qν
∂q ν
1
q̇ν = q˙ν ;
α
∂H
∂H
=β
∂pν
∂pν
1
ṗν = ṗν ;
β
(4.154)
ν = 1, 2, ...l
con lo cual las ecuaciones de Hamilton se convierten en:
q̇ ν = αβ
∂H
;
∂pν
ṗν = −αβ
∂H
;
∂q ν
ν = 1, 2, ...l
(4.155)
En las nuevas variables (q, p) las ecuaciones de movimiento serán de la forma
canónica solamente si se cambia el hamiltoniano.
H(q, p, t) = αβH(q, p, t)
(4.156)
2 También H = 0 si tomamos C = mω, a = −ω. Como el punto representativo del estado del oscilador
en el espacio fásico (véase figura 4.3), rota en el sentido de las agujas del reloj con velocidad angular ω,
con las coordenadas q y q se verá el punto estacionario. H describe pues, un problema de equilibrio.
108 / Mecánica clásica avanzada
Este ejemplo, al igual que los dos anteriores, ilustra el hecho de que el carácter
canónico de una transformación es algo inherente a la transformación misma, independientemente de la forma del hamiltoniano, en particular, independientemente de sus
propiedades de simetrı́a. Por esto cualquier sistema de l grados de libertad posee ecuaciones de movimiento covariantes bajo la transformación (4.153), aunque solamente si el
potencial es función homogénea de las coordenadas el sistema posee simetrı́a de semejanza mecánica, ecuación (4.92). Ası́ mismo las transformaciones (4.115) y (4.116), no
canónicas, y (4.134), canónica, pueden hacerse sin referencia alguna a la forma del hamiltoniano. Sin embargo, para un hamiltoniano dado, sólo cierta transformación canónica
permite obtener un nuevo hamiltoniano de forma simple. Ası́, para un oscilador armónico
lineal la transformación canónica (4.134) conduce a que H = ωp, o sea a que φ sea cı́clica
en H. Sin embargo (4.134) es aplicable a cualquier sistema de un grado de libertad. De
forma similar (4.136) conduce a H = 0 para el oscilador.
Ejemplo 4.5.2 Mostrar que es canónica la transformación:
q ν = αpν ;
pν = βqν ;
α 6= 0 ,
β 6= 0 ;
ν = 1, 2, ...l
(4.157)
En este caso:
H = −αβH
(4.158)
En particular, la transformación con α = 1, β = −1:
q ν = pν ;
pν = −qν ;
ν = 1, 2, ...l,
(4.159)
es canónica con H = H.
Este ejemplo muestra que las nociones de “coordenada” y “momento” pierden su
sentido inicial, pues mediante una transformación canónica (T.C.) es posible hacer que
los momentos pasen a hacer el papel de coordenadas y viceversa.
Como en general q ν = q ν (q, p, t) y pν = pν (q, p, t), con las fórmulas inversas
qν = qν (q, p, t); pν = pν (q, p, t), se ve que se requieren tanto (q) como (p) para poder especificar la posición del sistema en el espacio de configuración. (q) y (p) no son
pues “coordenadas” y “momentos” generalizados, sino simplemente pares de cantidades
canónicamente conjugadas. En conclusión, en el espacio de fases el estado del sistema
se especifica mediante un conjunto completo (de 2l) de cantidades canónicamente conjugadas.
4.6.
La función generatriz
de una transformación canónica
Las ecuaciones canónicas pueden deducirse de un principio variacional en el espacio
de fases (segunda forma del principio de Hamilton) y viceversa:
!
Z t2 X
l
∂H
δ
pν q̇ν − H dt = 0 ↔ q̇ν =
∂pν
t1
ν=1
(4.160)
∂H
;
ν = 1, 2, ...l
ṗν = −
∂qν
La formulación hamiltoniana / 109
que:
Si la transformación (q, p) ↔ (q, p) es canónica, entonces debe también cumplirse
δ
Z
l
X
t2
t1
!
pν q̇ ν − H
ν=1
ṗν = −
∂H
;
∂qν
dt = 0 ↔ q̇ ν =
∂H
;
∂pν
(4.161)
ν = 1, 2, ...l
Las ecuaciones (4.160) y (4.161) indican que hay dos expresiones variacionales de las
cuales pueden deducirse las ecuaciones de Hamilton. De acuerdo con la propiedad enunciada en (3.76), se sigue que los integrandos en las variacionales deben diferir a lo sumo
por la derivada total respecto al tiempo de una función arbitraria de las “coordenadas”
de que depende dicho integrando y del tiempo, o sea de (q, p, t), o de (q, p, t):
l
X
ν=1
pν q̇ν − H =
l
X
ν=1
pν q̇ ν − H +
d
F (q, p, t)
dt
(4.162)
Debido a que (q, p) y (q, p) están relacionadas mediante la transformación canónica,
F (q, p, t) puede expresarse en función de cualquier subconjunto de 2l cantidades independientes extraidos del conjunto de 4l cantidades (q, p, q, p) dependientes. La ecuación
(4.162) puede escribirse como:
dF =
l
X
ν=1
pν dqν −
l
X
ν=1
pν dq ν + H − H dt
(4.163)
En el caso en que las 2l cantidades (q, q) sean independientes, podemos expresar a
F en función de (q, q, t). En ese caso la T.C. se llama “transformación canónica libre de la
primera clase”. Matemáticamente, la independencia de las 2l cantidades (q, q) se expresa
mediante la condición de que el jacobiano de las (q) respecto a las (p) sea diferente de
cero, lo cual garantiza que las (p) se puedan expresar en términos de las (q):
∂qµ
q 1 , q 2 , ...q l
J
≡ det
6= 0
(4.164)
p1 , p2 , ...pl
∂pν
Si se cumple (4.164) entonces es posible expresar los pν en función de (q, q, t) y por
lo tanto representar cualquier función de (q, p, t) en términos de (q, q, t). En este caso es
posible escribir:
F (q, p, t) = F1 (q, q, t)
(4.165)
Esto permite escribir:
dF = dF1 =
l
l
X
X
∂F1
∂F1
∂F1
dqν +
dq ν +
dt
∂qν
∂qν
∂t
ν=1
ν=1
(4.166)
Como las 2l + 1 cantidades (dq, dq, dt) son independientes, vemos que para una
transfomación canónica libre de la primera clase, de (4.163) y (4.166) se sigue que:
pν =
∂F1 (q, q, t)
;
∂qν
pν = −
∂F1 (q, q, t)
;
∂qν
ν = 1, 2, ...l
(4.167)
110 / Mecánica clásica avanzada
Además se sigue que:
∂F1 (q, q, t)
(4.168)
dt
La ecuación (4.167) dice que a cada transformación canónica libre de la primera clase le corresponde una función F1 y viceversa. F1 se llama la función generatriz de la
transformación canónica.3
H(q, p, t) − H(q, p, t) =
Ejemplo 4.6.1 Hallar la transformación canónica generada por la función:
F1 (q, q, t) = −
l
X
qν q ν
(4.169)
ν=1
En (4.169) está implı́cito que (q) y (q) son independientes. Por lo tanto las fórmulas
de la transformación canónica serán:
∂F1
(4.170)
pν =
= −q ν ⇒ q ν = −pν ; ν = 1, 2, ...l
∂qν
pν = −
∂F1
= qν ⇒ pν = qν ;
∂qν
ν = 1, 2, ...l
(4.171)
Es esencialmente la misma transformación (4.159), que intercambia coordenadas y
momentos. Este ejemplo muestra que cada función de (q, q, t) define una transformación
canónica
Ejemplo 4.6.2 Probar que la transformación canónica (4.134) es libre de la primera clase.
Hallar la correspondiente función F1 .
Sea q = x y p = px . Las fórmulas de transformación serán entonces:
r
p
2p
q=
cos q ; p = − 2mωp sen q
mω
p2
1
p
p = mω x2 + 2 2 ;
q = −tan−1
2
m ω
mωq
El jacobiano (4.164) es trivial y diferente de cero:
∂q
q
J
6= 0
=
p
∂p
(4.172)
(4.173)
(4.174)
O sea que la transformación es libre de la primera clase y puede ser generada por
cierta función de las variables independientes q y q. La transformación no depende del
tiempo, pues suponemos a m y a ω constantes. Notamos de (4.174) que toda transformación canónica no puntual es libre de primera clase para sistemas de un grado de libertad.
F1 (q, q, t) ha de ser tal que, de acuerdo con (4.163):
p2
1
dF1 = p dq − pdq = p dq − mω q 2 + 2 2 dq
(4.175)
2
m ω
3 La
función del ejemplo 4.4.2, (4.143), es la función generatriz de la transformación canónica (4.136).
La formulación hamiltoniana / 111
Debemos expresar a p en términos de q y q lo cual se obtiene directamente de
(4.173):
p = −mωq tan q
(4.176)
Reemplazando a (4.176) en (4.175) obtenemos:
1
= −mωq tan q dq − mωq 2 sec2 q dq
2
1 2
q tan q
= −mωd
2
dF1
(4.177)
Se sigue entonces que, salvo una constante aditiva:
1
F1 (q, q) = − mωq 2 tan q
2
(4.178)
Podemos probar directamente, usando las fórmulas (4.167), que F1 dada por (4.178)
efectivamente genera la transformación dada por (4.172) y (4.173):
∂F1
= −mωq tan q ;
∂q
∂F1
1
= − mωq 2 sec2 q
∂q
2
(4.179)
O sea que:
p = −mωq tan q ;
p=
1
mωq 2 sec2 q
2
(4.180)
Al despejar en (4.180) a p y q obtenemos a (4.170), y al despejar a p y q obtenemos
a (4.173). Notemos que −Et − mωq 2 tan q/2 es una solución a la ecuación de HamiltonJacobi (4.152).
Ejemplo 4.6.3 Sea una partı́cula descrita por el hamiltoniano:
H=
p2
− aq
2m
(4.181)
donde m y a son constantes. Hallar la T.C. que lleva al hamiltoniano:
H=0
(4.182)
En las nuevas variables las ecuaciones de Hamilton con H = 0 conducen a la
solución trivial:
p = constante ;
q = constante
(4.183)
La transformación ha de ser tal que se cumpla para F1 , según (4.167) y (4.168):
∂F1
= p;
∂q
∂F1
= −p ;
∂q
−H =
∂F1
∂t
(4.184)
112 / Mecánica clásica avanzada
Se sigue de (4.181) y (4.184) que F1 debe ser solución a la ecuación diferencial de
Hamilton-Jacobi:
2
1
∂
∂
F1 (q, q, t) − aq = − F (q, q, t)
(4.185)
2m ∂q
∂t
La ecuación diferencial es de primer orden e involucra derivadas respecto a q y
respecto a t. La solución debe contener constantes de integración arbitrarias; una de
ellas puede ser aditiva. Podemos tomar a q como la constante no aditiva de integración.
La ecuación (4.185) tiene una solución de la forma:
F1 (q, q, t) = −qt + f (q, q)
(4.186)
La ecuación (4.186) equivale a tomar la constante q igual a la energı́a, puesto que
H en (4.181) es constante, H = E:
q=E
(4.187)
Con esta solución, (4.184) se reduce a:
2
1 df (q, q)
− aq = q
2m
dq
Integrando (4.188) obtenemos:
√
2 2m
(q + aq)3/2 + constante
f (q, q) = ±
3 a
Con lo cual, omitiendo la constante aditiva:
√
2 2m
F1 (q, q, t) = −qt ±
(q + aq)3/2
3 a
(4.188)
(4.189)
(4.190)
La ecuación (4.190) genera la siguiente transformación canónica, de acuerdo con las
fórmulas (4.167):
√
p
2m p
−p = −t ±
q + aq
(4.191)
p = ± 2m(q + aq) ;
a
Explı́citamente la transformación es:
a
q
(t − p)2
q(q, p, t) = − +
a 2m
p(q, p, t) = (t − p)a ;
p(q, p, t) = t −
p
;
a
q(q, p, t) =
p2
− aq
2m
(4.192)
(4.193)
Como q y p son constantes, (4.192) proporciona la solución al problema del movimiento descrito por (4.181). En particular describe el problema del movimiento de una
partı́cula en presencia de la gravedad (a = −mg , q = z , p = mż).
z=
1
E
− g(t − p) ;
mg 2
mż − mg(t − p)
(4.194)
La formulación hamiltoniana / 113
Las constantes E y p tienen las siguientes expresiones en función de los valores de
z y ż en t = 0:
E=
1
mv 2 + mgz0 ;
2 0
p=
v0
g
(4.195)
Entonces para z(t) y ż(t) obtenemos:
1
z = z0 + v0 t − gt2 ; ż = v0 − gt
(4.196)
2
de acuerdo con el resultado obtenido usando métodos elementales.
Es claro que la transformación dada por (4.192) y (4.193) es canónica independientemente de la forma de H y aplicable a cualquier sistema de un grado de libertad;
sin embargo, sólo para H dado por (4.181) mediante (4.192) se consigue H = 0 y por
tanto que q y p sean constantes. Este problema ilustra el método de resolver un problema mecánico mediante una transformación canónica sin integrar las ecuaciones de
Hamilton.
4.7.
La evolución temporal de un sistema
considerada como una transformación
canónica
Sean qν0 y p0ν los valores de qν y pν en t = t0 (ν = l, 2, ...l). Estos valores determinarán todos los valores sucesivos de las (q, p), de modo que en un tiempo t podemos
escribir:
qν (t) = qν (q 0 , p0 , t − t0 ) ;
ν = 1, 2, ...l
(4.197)
pν (t) = pν (q 0 , p0 , t − t0 )
La ecuación (4.197) puede considerarse como una cierta transformación en el espacio de fases, donde (q 0 , p0 ) son las viejas variables y (q, p) las nuevas. Esta transformación es canónica pues tanto (q 0 , p0 ) como (q, p) satisfacen las ecuaciones de Hamilton.
La función generatriz de esta transformación satisface:
dF =
l
X
ν=1
p0ν dqν0 −
l
X
ν=1
pν dqν + (H 0 − H) dt
(4.198)
Si no hay fuerzas disipativas y las ecuaciones que definen las coordenadas generalizadas no dependen del tiempo, H se conserva, H = H 0 , luego:
dF =
l
X
ν=1
p0ν
dqν0
−
l
X
ν=1
pν dqν = −
l
X
ν=1
t
pν dqν
(4.199)
t0
Por otra parte, escribamos la integral de acción entre t0 y t:
Z t
L dt
S=
t0
(4.200)
114 / Mecánica clásica avanzada
Una variación de las (q) nos conduce a:
Z tX
l ∂L
∂L
δS =
δqν +
δ q̇ν dt
∂ q̇ν
t0 ν=1 ∂qν
Z tX
l d ∂L
d ∂L
∂L
δqν dt
δqν +
δqν −
=
dt ∂ q̇ν
dt ∂ q̇ν
t0 ν=1 ∂qν
=
Xl
ν=1
∂L
δqν
∂ q̇ν
t
t0
(4.201)
#
Z t "X
l
∂L
d ∂L
δqν dt
+
−
dt ∂ q˙ν
t0 ν=1 ∂qν
Si asumimos que la trayectoria es real, se cumplen sobre ella las ecuaciones de
Lagrange, luego:
l
X
∂L
δqν
δS =
∂ q̇ν
ν=1
t
=
t0
l
X
ν=1
t
(4.202)
pν δqν
t0
Comparando a (4.199) y (4.202) vemos que:
F = −S
(4.203)
En conclusión, la acción es la función generatriz de la transformación canónica
de evolución temporal del sistema. Ésta es una transformación del espacio de fases en
sı́ mismo: cambia el punto del espacio de fases (q 0 , p0 ) por el punto del espacio de fases
(q, p). En el ejemplo del oscilador armónico lineal, la figura 4.3 es una circunferencia.
La evolución temporal consiste simplemente en una rotación del vector de posición del
punto del espacio fásico que representa al sistema, lo cual también puede verse en las
fórmulas (4.172), y más claramente aún mediante el ejemplo 4.4.2.
4.8.
El teorema de Liouville
El teorema de Liouville es un teorema básico para la mecánica estadı́stica, o sea la
mecánica de sistemas tales que:
(a) El número de grados de libertad es muy grande.
(b) No se pueden determinar las 2l condiciones iniciales, y por lo tanto tampoco el
estado del sistema en sentido clásico. Solamente se conoce el hamiltoniano del sistema,
las condiciones de ligadura, y a lo sumo siete de las 2l constantes de movimiento (las
~ P~ ).
aditivas: H, L,
(c) Respecto a las condiciones iniciales, o sea a las posibles trayectorias del espacio
de fases, sólo se pueden hacer suposiciones estadı́sticas.
En particular se puede asumir que todas las trayectorias de fase compatibles con las
ligaduras y con los valores de las siete constantes de movimiento aditivas son igualmente
probables (distribución uniforme). En general, habrá una región del espacio de fases que
es accesible al sistema y se puede postular alguna distribución de probabilidades de las
distintas trayectorias de fase dentro de la región accesible (las trayectorias externas a la
región accesible tienen probabilidad cero).
La formulación hamiltoniana / 115
Ejemplo 4.8.1 Analizar un oscilador armónico lineal cuando sólo se conoce exactamente
su energı́a.
Mediante la transformación canónica (4.172), la dinámica del oscilador está descrita
por:
q=
r
2p
cos q ;
mω
p=−
p
2mωp senq ;
H = ωp = E
(4.204)
Las ecuaciones canónicas en las variables (q, p) tienen la solución:
E
= constante
(4.205)
ω
donde δ es una constante arbitraria. La otra constante arbitraria es E. O sea que dados
E y δ queda determinado completamente el estado de movimiento:
r
2E
cos (ωt + δ)
q(E, δ, t) =
mω 2
(4.206)
√
p(E, δ, T ) = − 2mE sen(ωt + δ)
q = ωt + δ ;
p=
p / mω
r
t>0
δ
q
(2E / mω 2 ) 1/2
t=0
Figura 4.4 Espacio de fases del oscilador armónico lineal para E conocida
E define el radio de la trayectoria y δ el tiempo inicial de la misma (véase figura 4.4).
p La región accesible la constituyen todos los puntos de una circunferencia de radio
2E/(mω 2 ). Las diferentes trayectorias están definidas por los valores de δ.
Ejemplo 4.8.2 Analizar el oscilador tridimensional sometido a la ligadura de moverse
únicamente sobre la superficie de un cilindro, cuando sólo se conoce exactamente la
energı́a y el momento angular en la dirección z (ver ejemplo 4.3.1).
116 / Mecánica clásica avanzada
La figura 4.2 muestra que cada valor de Ez determina un “cilindro” en el espacio
de fases. La energı́a total es, de acuerdo con la ecuación (4.105):
L2z
(4.207)
2mR2
Parte de la energı́a está asociada al movimiento en z y parte a la rotación, siendo
ambas constantes por separado.
Para Lz arbitrario, la región accesible del espacio fásico está definida por el “cilindro” E = constante. Todos los puntos interiores a este cilindro son accesibles.
Para Lz y Ez dados, habrá un conjunto infinito de trayectorias de fase en “espiral”,
caracterizada cada una por los valores de θ0 y δ [ecuaciones (4.106) y (4.107)], que pueden
estar entre 0 y 2π. En el caso en que se conozcan Lz y Ez , la distribución uniforme para
este sistema es aquella en la cual todos los valores de θ0 y δ tienen igual probabilidad.
En general cuando sólo se conocen exactamente la energı́a total, el momento lineal
total y el momento angular total del sistema, además de las ligaduras, la región del
espacio de fases accesible al sistema está definida por las ecuaciones:
E = Ez +
E(q, p) = E0 ;
~ p) = L
~0 ;
L(q,
P~ (q, p) = P~0
(4.208)
que definen una variedad de 2l − 7 dimensiones en el espacio de fases.4
Las 2l − 7 constantes de movimiento adicionales no son determinadas; la distribución microcanónica asigna a cada uno de los estados caracterizados por (4.208) y los
valores de las 2l − 7 constantes restantes igual probabilidad.
Conjunto estadı́stico. Es una noción útil en los casos donde hay 2l−7 constantes
de movimiento no determinadas. Consiste en un conjunto de sistemas iguales (el mismo
número de grados de libertad, la misma clase de partı́culas y de interacciones, las mismas
ligaduras y los mismos valores de las constantes de movimiento aditivas).
Es decir, dos sistemas de un conjunto estadı́stico sólo pueden diferir por los valores
de las 2l − 7 constantes no aditivas. Se considera que el número de sistemas es muy
grande, de modo que es una muestra estadı́sticamente representativa de la distribución
de los valores de las 2l − 7 constantes indeterminadas. En cada instante del tiempo, el
estado de cada sistema del conjunto será representado por un punto del espacio fásico,
y su estado de movimiento por una trayectoria de fases. El conjunto estadı́stico de sistemas de l grados de libertad estará representado en cada instante por un “enjambre” de
puntos del espacio fásico. Como los sistemas del conjunto estadı́stico no interactúan, cada punto se mueve independientemente de los demás en el espacio fásico 2l-dimensional.5
Teorema de Liouville. En cada elemento de volumen del espacio fásico la densidad de puntos representativos del conjunto estadı́stico permanece constante en el tiempo.
Sea dΓ = dq1 dq2 , ...dql dp1 , dp2 , ...dpl = dΓq dΓp un elemento de volumen infinitesimal del espacio de fases. Sea:
dN = ρ(p, q, t)dΓq dΓp
(4.209)
4 Estas constantes tienen la propiedad de ser aditivas. La variedad puede reducirse si tomamos en
cuenta que asociadas a la posición del centro de masa de un sistema libre hay tres constantes; quedarı́an
en ese caso 6N − 10 constantes no determinadas.
5 Un conjunto estadı́stico tiene analogı́a con los “ensambles” que mencionamos en la sección 2.3.
La formulación hamiltoniana / 117
el número de sistemas dentro de dΓ. A ρ(q, p, t) se le llama la función de distribución
estadı́stica y hace el papel de función de densidad de probabilidad en el espacio de fases.
ρ satisface la condición de normalización:
Z
ρdΓq dΓp = 1
(4.210)
donde la integral abarca todo el espacio de fases. Matemáticamente el teorema dice que:
l
ρ̇ = 0
o
dρ X
=
dt
ν=1
∂ρ
∂ρ
q̇ν +
ṗν
∂qν
∂ ṗν
+
∂ρ
=0
∂t
(4.211)
Una forma cualitativa de visualizarlo se da a continuación. Sea un volumen arbitrario del espacio de fases en t = t0 . Como el número de sistemas es muy grande, en la
frontera de tal volumen habrá un gran número de puntos representativos de sistemas del
conjunto, de modo que aproximadamente podemos decir que la frontera del elemento
de volumen está definida por un conjunto de puntos representativos del conjunto estadı́stico. Cuando transcurre el tiempo, el volumen se mueve al moverse los puntos de
la frontera. El tamaño del volumen podrá cambiar, pero no el número de puntos que
lo constituyen. En efecto, sea (q, p) un punto arbitrario de la frontera. Todo punto que
entre o salga del elemento de volumen deberá pasar por la frontera, pero al llegar a
la frontera tendrá los mismos (q, p) de un punto de la misma. Ambos puntos tendrán
las mismas condiciones iniciales para el movimiento posterior, en consecuencia deberán
seguir moviéndose juntos. En conclusión, el número de puntos en cualquier región del
espacio fásico es constante. Se puede demostar que:
Z
Z
(4.212)
dΓq dΓp = dΓq dΓp
donde la transformación (q, p) → (q, p) es canónica. Como la evolución temporal es una
T.C., se sigue que:
Z
Z
dΓq0 dΓp0 = dΓq dΓp
(4.213)
Como no cambian con el tiempo ni el volumen ni el número de puntos dentro de
él, la densidad será constante.
Demostración del teorema de Liouville. Sea un conjunto estadı́stico de sistemas de un grado de libertad, entonces el espacio fásico es bidimensional y dΓ = dq dp.
Además, dN = ρ dq dp es el número de sistemas en dΓ. Consideremos que cada uno de
los sistemas del conjunto tiene energı́a entre E y E + ∆E.
La figura 4.5 muestra la región accesible, definida por las lı́neas E = constante y
E + ∆E =p
constante (depser osciladores armónicos, tal región serı́a una corona circular
de radios 2E/mω 2 y 2(E + ∆E)/mω 2 ). Cuando el tiempo transcurre, los puntos
representativos del conjunto se mueven dentro de esta región. Entre t y t + dt entran al
elemento de volumen dΓ todos los puntos que se mueven hacia el frente a las caras de
la izquierda e inferior. El número de los puntos que entran a dΓ durante el tiempo dt
118 / Mecánica clásica avanzada
p
E + dE
t
t + dt
dp
E
pdt
(q,p)
dq
q
qdt
Figura 4.5 Espacio fásico. Región accesible definida por las lı́neas E = constante y E +∆E =
constante.
será igual a:
ρq̇ dt dp + ρṗ dt dq
(4.214)
O sea que el número de puntos que entran a dΓ por unidad de tiempo es:
ρq̇ dp + ρṗ dq = ρ(q̇ dp + ṗ dq)
(4.215)
Para hallar los puntos que salen, debemos considerar los que se mueven dentro de
dΓ hacia las caras derecha y superior y que las alcanzarán en el tiempo dt. Esto se puede
obtener de (4.215) mediante una expansión de Taylor alrededor de (q, p), para hallar
(4.215) en (q + dq, p + dp):
(ρq̇)|q+dq dp + (ρṗ)|p+dp dq̇ =
∂
∂
(ρq̇) dq dp + ρṗ +
(ρṗ) dp dq
ρq̇ +
∂q
∂p
(4.216)
La variación del número de puntos dentro de dΓ es igual a lo que entra menos lo
que sale por unidad de tiempo, o sea a (4.215) menos (4.216):
∂
∂
−
(ρq̇) +
(ρṗ) dq dp
(4.217)
∂q
∂p
Dentro de dΓ la rata de incremento temporal de la densidad será ∂ρ/∂t y el cambio
del número de puntos en dΓ por unidad de tiempo es (∂ρ/∂t).dq dp y debe ser igual a
(4.217):
∂
∂
∂ρ
dq dp = −
(ρq̇) +
(ρṗ) dq dp
(4.218)
∂t
∂q
∂ρ
La formulación hamiltoniana / 119
Se sigue entonces que:
∂ρ
∂ q̇ ∂ρ
∂ ṗ ∂ρ
+ρ
+
q̇ + ρ
+
ṗ = 0
∂t
∂q
∂q
∂p ∂p
(4.219)
Usando las ecuaciones de Halmilton se tiene:
∂ ṗ
∂2H
∂2H
∂ q̇
+
=
−
=0
∂q
∂p
∂q∂p ∂p∂q
(4.220)
Con lo cual (4.219) nos da el resultado:
∂ρ ∂ρ
∂ρ
dρ
+
q̇ +
ṗ =
=0
∂t
∂q
∂p
dt
(4.221)
La generalización a sistemas de varios grados de libertad es análoga. En ese caso
debemos reemplazar el plano p − q por el plano pν − qν correspondiente al grado de
libertad ν. dΓ → dqν dpν es la proyección del elemento de volumen dΓq dΓp sobre el
plano ν.
Las lı́neas E y E + dE son el corte del plano ν con las hipersuperficies en el espacio
de fases E = constante, E + dE = constante. dΓ será:
dΓ = dΓp dΓq = dq1 dq2 ...dqν−1 dqν+1 ...dql dp1 dp2
(4.222)
...dpν−1 dpν+1 ...dpl dqν dpν = dΓν dqν dpν ;
ν = 1, 2, ...l
Debemos reemplazar las ecuaciones (4.215) y (4.216) por:
ρ dΓν (q̇ dpν + ṗν dqν ) y,
∂
ν
ν
ρ dΓ q̇ν +
(ρ dΓ q̇ν ) dqν dpν
∂qν
∂
ν
ν
+ ρ dΓ ṗν +
(ρ dΓ ṗν ) dpν dqν
∂pν
(4.223)
(4.224)
Por tanto la variación del número de puntos en el área dqν dpν será igual a (4.223)(4.224):
∂
∂
ν
ν
(ρ dΓ q̇ν ) +
(ρ dΓ ṗν ) dqν dpν =
−
∂qν
∂pν
(4.225)
∂
∂
(ρq̇ν ) +
(ρṗν ) dΓ
−
∂qν
∂pν
La variación del número de puntos en todo el volumen dΓ es igual a la suma de las
variaciones de los números de puntos sobre sus proyecciones q1 − p1 , q2 − p2 , ...ql − pl .
Ésta será:
l X
∂
∂
(ρq̇ν ) +
(ρṗν ) dΓ
(4.226)
−
∂qν
∂pν
ν=1
Usando el resultado (4.220) para cada grado de libertad e igualando (4.226) a
∂ρ/∂t dΓ obtenemos el teorema de Liouville, ecuación (4.211).
120 / Mecánica clásica avanzada
Ejemplo 4.8.3 Sea un conjunto de cuatro partı́culas iguales que se lanzan hacia arriba
en un campo gravitacional uniforme, con las siguientes condiciones iniciales:
z10 = z0 ,
z20 = z0 + ∆z0
z30 = z0 ,
z40 = z0 + ∆z0
pz10 = p0 ,
pz20 = p0
(4.227)
pz30 = p0 + ∆p0 , pz40 = p0 + ∆p0
(a) Hallar la región que inicialmente ocupa el conjunto en el espacio de fases.
(b) Hallar las trayectorias de fase de las partı́culas.
(c) Considerar cómo cambia la región ocupada por el conjunto para t > 0.
El espacio fásico de cada sistema es 6-dimensional, pero sólo hay variaciones en
la proyección bidimensional z − pz . x, px , y y py permanecen constantes, ya que por
definición las partı́culas no interactúan entre sı́. La energı́a de cada partı́cula es constante.
Entonces:
Hi =
p2zi
+ mgzi = Ei = constante ;
2m
i = 1, 2, 3, 4
(4.228)
La ecuación de la trayectoria de cada partı́cula en el espacio de fases será parabólica:
p
(4.229)
pzi = ± 2m(Ei − mgzi )
De acuerdo con (a) y (b) las Ei serán:
p20
+ mg(z0 + ∆z0 )
2m
E1 =
p20
+ mgz0 ;
2m
E3 =
(p0 + ∆p0 )2
+ mgz0
2m
E4 =
(p0 + ∆p0 )2
+ mg(z0 + ∆z0 )
2m
E2 =
(4.230)
Asumiendo positivos a ∆p0 y ∆z0 , vemos que:
E4 > E3 ;
E4 > E2 ;
E3 > E1 ;
E2 > E1
(4.231)
Además, para precisar, asumamos que ∆p0 y ∆z0 son tales que E3 > E2 , de modo
que:
E4 > E3 > E2 > E1
(4.232)
La solución a este problema es:
pzi = pzi0 − mgt ;
zi = zi0 +
pzi0
1
t − gt2 ;
m
2
i = 1, 2, 3, 4
(4.233)
La formulación hamiltoniana / 121
De modo que:
pz 1 =
z1 =
pz 3 =
pz2 = p0 − mgt
p0 − mgt ;
z0 +
p0
1
t − gt2 ;
m
2
p0 + ∆p0 − mgt ;
z2 = z0 + ∆z0 +
p0
1
t − gt2
m
2
pz4 = p0 + ∆p0 − mgt
(4.234)
1
p0 + ∆p0
t − gt2
m
2
z3 =
z0 +
z4 =
z0 + ∆z0 +
1
p0 + ∆p0
t − gt2
m
2
Las ecuaciones (4.234) nos dicen que:
Pz1 = pz2 = p < p0 ; z3 = z1 +
z2 = z1 + ∆z0 ;
∆p0
t
m
Pz3 = pz4 = p + ∆p0
(4.235)
∆p0
t;
z4 = z2 +
m
z4 = z3 + ∆Z0
z1 = z
La figura 4.6 muestra la región ocupada por el conjunto en el espacio de fases, en
t = 0 y en t > 0. Vemos que el área (volumen) del espacio fásico ocupada por el conjunto
de sistemas permanece constante en el tiempo y es igual a:
∆z0 ∆p0
(4.236)
Dicha región se mueve distorsionándose pero sin cambiar el valor del área. El
resultado es el mismo en el caso en que dentro del área en mención haya un número
arbitrario de puntos: el área de la región limitada por las lı́neas 1 − 2, 2 − 4, 3 − 4 y 1 − 3
permanecerı́a constante y todos los puntos quedarı́an dentro. La densidad de puntos en
el espacio de fases también es una constante; en este caso.
4
= constante
∆z0 ∆p0
(4.237)
De haber inicialmente en el centro del rectángulo una quinta partı́cula, esta permanecerı́a en el centro del cuadrilátero en t > 0.
La figura 4.7 muestra las trayectorias de fase.
Ejemplo 4.8.4 Sea una partı́cula que se lanza hacia arriba en presencia de un campo
gravitacional uniforme. Sus condiciones iniciales se conocen con cierta indeterminación:
122 / Mecánica clásica avanzada
pz
p0 + ∆p0
3
4
1
2
∆p0t / m
p0
3
p + ∆p0
4
p
1
z0 + ∆z0
z0
2
z + ∆z0
z
z
Figura 4.6 Región ocupada por el conjunto de sistemas en el espacio de fases
pz
p0 + ∆p0
p0
3
4
1
2
z
z0
z0 + ∆z0
2
1
3
1
2
4
3
4
Figura 4.7 Trayectorias de fase. Caso en que dentro del área hay un número arbitrario de
puntos
z(0) = z0 ±
∆z0
;
2
pz (0) = p0 ±
∆p0
2
(4.238)
Es decir, se sabe que en t = 0 la partı́cula está en un rectángulo de área ∆z0 ∆p0
en el espacio de fases. Analizar la evolución de la partı́cula.
Basta considerar el movimiento de la partı́cula en los valores extremos de las condiciones iniciales (z0 − ∆z0 /2 , p0 − ∆p0 /2 ; z0 − ∆z0 /2 , p0 + ∆p0 /2 ; z0 + ∆z0 /2 , p0 −
La formulación hamiltoniana / 123
∆p0 /2 ; z0 + ∆z0 /2 , p0 + ∆p0 /2), que coinciden con las condiciones iniciales (4.227)
del ejemplo anterior, cambiando z0 por z0 + ∆z0 /2 y p0 por p0 + ∆p0 /2. Se concluye
inmediatamente que para una partı́cula se cumple:
∆z(t) ∆pz (t) = ∆z(0) ∆pz (0) = constante = ∆z0 ∆p0
(4.239)
Para un valor dado de esta constante, si se reduce la indeterminación en z, se
aumenta la indeterminación en ∆pz y viceversa. Clásicamente no hay lı́mite al valor más
pequeño que puede tomar la constante ∆p0 ∆z0 . Cuánticamente no puede ser menor que
h̄/2, donde h̄ es la constante de Planck, luego:
∆z ∆pz ≥
h̄
2
(4.240)
La ecuación (4.240) se denomina la desigualdad de Heisenberg.
El resultado (4.239) es válido en general, de acuerdo con el teorema de Liouville.
La proyección del volumen del espacio fásico dentro del cual inicialmente se encuentra la partı́cula, ∆Γ0 = ∆p10 ∆q10 ∆p20 ∆q20 ...∆pl0 ∆ql0 , sobre el plano qν − pν ,
tiene un área ∆pν0 ∆qν0 . Se tiene entonces que:
∆pν (t) ∆qν (t) = ∆pν0 ∆qν0 = constante
(4.241)
O sea que, cuánticamente se cumple que para cualquier par de variables canónicamente conjugadas:
∆pν ∆qν ≥
h̄
2
(4.242)
Clásicamente, para un valor dado de la constante ∆pν0 ∆qν0 , al aumentar la indeterminación de pν , se disminuye la indeterminación de qν y viceversa. Lo especı́fico de la
desigualdad de Heisenberg (el “efecto cuántico”) es que la constante no puede ser cero
sino que tiene un mı́nimo valor.
124 / Mecánica clásica avanzada
5
Movimiento de dos partı́culas
que interactúan por medio de una fuerza
central
Éste es un problema que en principio es soluble de manera exacta para cualquier
fuerza central. Pertenece a los pocos problemas de la mecánica clásica en que es posible
la separación de las variables. Como se sabe, no existen soluciones analı́ticas exactas para
el problema general de más de dos partı́culas interactuando mutuamente por fuerzas de
dos partı́culas.
5.1.
Coordenadas de centro de masa
y coordenadas relativas
En general las coordenadas de las partı́culas individuales, por ejemplo X1 , Y1 ,
Z1 , X2 , Y2 y Z2 , no permiten desacoplar las ecuaciones de movimiento. Sólo cuando
las fuerzas son lineales ha sido diseñado un formulismo que desacopla las ecuaciones
de movimiento mediante la transformación a coordenadas normales. Afortunadamente,
el problema de dos partı́culas que interactúan a través de una fuerza central admite
la separación de variables mediante la transformación a las coordenadas relativas y de
centro de masa.
~ = m1~r1 + m2~r2 , ~r = ~r2 − ~r1 ,
R
m1 + m2
(5.1)
m
m
2
1
~−
~+
~r1 = R
~r , ~r2 = R
~r
M
M
Un potencial central es aquel que depende sólo de la distancia entre las partı́culas:
V (~r1 , ~r2 ) = V (|~r2 − ~r1 |) = V (r)
(5.2)
Las fórmulas (5.1) permiten escribir la energı́a cinética ası́:
T =
2
2
1
1 ~˙ 2 1 ˙ 2
1
m1~r˙ 1 + m2~r˙ 2 = M R
+ µ~r
2
2
2
2
125
(5.3)
126 / Mecánica clásica avanzada
donde M es la masa total y µ la masa reducida:
m1 m2
m1 + m2
Entonces en vez de L ~r1 , ~r2 , ~r˙ 1 , ~r˙ 2 podemos escribir:
M = m1 + m2 ;
µ=
2
~˙ + 1 µ~r˙ 2 − V (r)
~ ~r˙ , R
~˙ = 1 M R
L ~r, R;
2
2
(5.4)
(5.5)
~ es cı́clica y por lo tanto el momento lineal del centro de masa es una constante de
R
movimiento. L consta de términos desacoplados, es decir, describe un sistema equivalente
de dos partı́culas, una libre de masa M colocada en el centro de masa y otra de masa µ
colocada por ejemplo en la posición de la partı́cula 2, y sometida al efecto de un centro
de fuerzas inmóvil colocado en la posición de la partı́cula 1, y exactamente sometida a
la misma energı́a potencial de interacción de las dos partı́culas originales:
LCM =
1 ~˙ 2
MR ;
2
Lrel =
1 ˙2
µ~r − V (r)
2
(5.6)
Lrel es esféricamente simétrico pues depende sólo de la magnitud de los vectores ~r
y ~r˙ . En consecuencia, el momento angular de la partı́cula de masa reducida µ, ~l = ~r × µ~r˙ ,
es una constante de movimiento.
Para pasar al formalismo hamiltoniano, evaluemos los momentos canónicos conju~
gados de ~r y R:
p=
~
∂L
= µ~r˙ ;
∂~r˙
∂L
~˙
= MR
P~ =
˙
~
∂R
(5.7)
Entonces el hamiltoniano del sistema será:
H=
P~2
p~2
+
+ V (r)
2M
2µ
(5.8)
H es una constante de movimiento, ası́ como por separado lo son la energı́a del
centro de masa y la de la partı́cula de masa reducida.
Sistema de coordenadas de centro de masa. Es un sistema de coordenadas
con origen colocado en el centro de masa. Las fórmulas de transformación son (véase la
figura 5.1):
~r1c =
~r2c
m2
m2
~r
(~r1 − ~r2 ) = −
M
m1
m1
m1
=
(~r2 − ~r1 ) =
~r
M
M
(5.9)
Además se cumple que:
m1~r1c + m2~r2c = 0 ;
~r2c − ~r1c = ~r
No existen fórmulas que expresen a ~r1 , ~r2 en función de ~r1c y ~r2c .
(5.10)
Movimiento de dos partı́culas que interactúan ... / 127
La energı́a total de las dos partı́culas en el sistema de referencia del centro de masa
es:
Ec =
2
2
1
1
1 2
m1~r˙ 1c + m2~r˙ 2c + V (r) = µ~r˙ + V (r)
2
2
2
(5.11)
y el momento angular respecto al centro de masa:
~ c = ~r1c × m1~r˙ 1c + ~r2c × m2~r˙ 2c = µ~r × ~r˙
L
(5.12)
1
r1c
r2c
r1
2
R
r2
O
Figura 5.1 Sistema de coordenadas de centro de masa para dos partı́culas
Se ve que la energı́a total en el sistema del centro de masa coincide con la energı́a total
de la partı́cula de masa reducida, y el movimiento angular total coincide con el momento
angular de la partı́cula de masa reducida.
El momento angular total en el sistema de referencia del laboratorio es:
~ ×R
~˙ + µ~r × ~r˙
~ = ~r1 × m1~r˙ 1 + ~r2 × (m2~r˙ 2 ) = M R
(5.13)
L
vemos que es igual al momento angular del centro de masa más el momento angular
respecto al sistema de referencia del centro de masa. Finalmente podemos afirmar que
los aspectos no triviales del problema están en el movimiento de la partı́cula de masa
reducida.
Ecuaciones de Lagrange para las coordenadas relativas. Tomemos un sistema de coordenadas esféricas para ubicar la partı́cula de masa reducida µ (véase figura
128 / Mecánica clásica avanzada
z
êϕ
êΦ
êr
r
Θ
y
ϕ
êΦ
x
Figura 5.2 Posición ~r de la partı́cula µ en coordenadas esféricas
5.2). No hay ninguna razón fı́sica para suponer dónde está el origen de ese sistema de
coordenadas. Si queremos podemos colocarlo en el centro de masa o, como se propuso
antes, en la posición de la partı́cula 1. Las componentes de ~r y ~r˙ es conveniente expresarlas en coordenadas esféricas; esto es simple mediante las fórmulas de transformación
entre vectores unitarios:
êr =
senθ cos φ î + senθ senφ ĵ + cos θ k̂
êθ =
−senφ î + cos φ ĵ
êφ =
senθ k̂ − cos θ (cos φ î + senφ ĵ)
(5.14)
y las fórmulas inversas:
î =
senθ cos φ êr − senφ êθ − cos θ cos φ êφ
ĵ =
senθ senφ êr + cos φ êθ − cos θ senφ êθ
k̂ =
cos θ êr + senθ êφ
(5.15)
éstos son dos conjuntos ortonormales de vectores de base (véase figura 5.2). Entonces ~r
y ~r˙ tienen las siguientes expresiones:
~r = rêr ; ~r˙ = ṙêr − rθ̇êφ + r senθ φ̇êθ
(5.16)
Movimiento de dos partı́culas que interactúan ... / 129
El lagrangiano en coordenadas esféricas es:
1 L = µ r2 + r2 θ̇2 + r2 sen2 θ φ̇2 − V (r)
(5.17)
2
donde hemos suprimido la parte correspondiente al centro de masa. La coordenada φ es
cı́clica y por ello su momento canónico conjugado pφ es una constante de movimiento:
pφ =
∂L
∂ φ̇
= µr2 sen2 θ φ̇ = constante
(5.18)
Debido a la simetrı́a de rotación del lagrangiano, todas las componentes del momento angular son constantes de movimiento. Las componentes esféricas, o sea, a lo
largo de los vectores unitarios êr , êθ , êφ , son:
lr = 0 ,
lφ = µr2 senθ φ̇
lθ = µr2 θ̇ ,
(5.19)
en tanto que las componentes cartesianas son:
lx = −µr2 (θ̇senφ + φ̇ senθ cos θ cos φ)
ly = µr2 (θ̇ cos φ − φ̇ senθ cos θ senφ)
(5.20)
lz = µr2 sen2 θ φ̇
Los otros momentos canónicos conjugados son:
pr =
∂L
= µṙ ;
∂ ṙ
pθ =
∂L
∂ θ̇
= µr2 θ̇
(5.21)
pr y pθ no son constantes de movimiento. Podemos expresar las componentes de ~l,
(5.19) y (5.20), en función de los momentos canónicos:
lθ = pθ ;
lφ =
pφ
;
senθ
l2 = p2θ +
p2φ
sen2 θ
(5.22)
lx = −pθ senφ − pφ cot θ cos φ
ly = −pθ cos φ − pφ cot θ senφ
(5.23)
lz = pφ
Nótese la similitud de (5.23) con las correspondientes expresiones cuántico-mecánicas, y aun con las componentes l± = lx ± ily :
l+ = (ipθ − pφ cot θ)eiφ ;
l− = (−ipθ − pφ cot θ)e−iφ
(5.24)
En coordenadas esféricas la constante de movimiento pφ , el momento canónico
conjugado a φ, coincide con la componente Z del momento angular. lθ y lφ no son
constantes de movimiento, pero sı́ lx , ly y lz , como también:
lr = 0 ;
lz = pφ ;
l2 = p2θ +
p2φ
= µ2 r4 (θ̇2 + sen2 θφ̇2 )
sen2 θ
(5.25)
130 / Mecánica clásica avanzada
de lo anterior se sigue que existe un valor mı́nimo de θ dado por:
pφ
senθmin =
;
θmax = π − θmin
l
(5.26)
Como ~l es constante, tenemos que los vectores ~r y ~r˙ siempre permanecerán en un
plano perpendicular a ~l, o sea que cuando las fuerzas son centrales la partı́cula de masa
reducida permanece siempre sobre un plano; las órbitas son planas. θmin y θmax son
los ángulos de máximo y mı́nimo acercamiento de la partı́cula al eje Z respectivamente,
donde θ̇ cambia de signo.
Comparando la expresión (5.25) para ~l 2 , con (5.17), obtenemos:
L=
l2
1
− V (r)
µṙ +
2
2µr2
(5.27)
En esta forma se nota la completa simetrı́a esférica del lagrangiano, ya que sólo
depende de r pues ~l es una constante. El hamiltoniano es:
H=
p2r
l2
+ V (r)
+
2µ 2µr2
(5.28)
En esta expresión para H podemos tomar ventaja del hecho de depender sólo de
la parte radial: H describe el movimiento unidimensional equivalente de una partı́cula
de masa µ en un potencial efectivo:
Vef (r) =
l2
+ V (r)
2µr2
(5.29)
La segunda ley de Kepler. Podemos definir las coordenadas de manera que
desaparezca del problema uno de los ángulos. Si tomamos el eje Z de modo que coincida
con la dirección de ~l, que es constante, entonces el movimiento permanecerá siempre
sobre el plano X − Y : θ = π/2 = constante; θ̇ = 0, con lo cual la magnitud del momento
toma la forma:
l = pφ = µr2 φ̇ = constante
(5.30)
En el plano de la órbita, el área barrida por el radio vector en un tiempo dt es
dA = (1/2)r2 dφ, siendo dφ el ángulo que gira el radio vector en el tiempo dt. Entonces,
Ȧ =
1 2
l
r φ̇ =
= constante
2
2µ
(5.31)
Nos dice que la velocidad areolar es constante para cualquier movimiento bajo
fuerzas centrales (segunda ley de Kepler, descubierta empı́ricamente en 1609 en observaciones planetarias. La primera y la tercera leyes de Kepler valen sólo para potenciales
de la forma 1/r).
El problema unidimensional equivalente. Del lagrangiano (5.27) se sigue la
ecuación de movimiento:
l2
d
d
V +
= − Vef = fc + f
(5.32)
µr̈ = −
dr
2µr2
dr
Movimiento de dos partı́culas que interactúan ... / 131
donde f es la fuerza derivable de V y fc es la llamada fuerza centrı́fuga, derivada
del potencial centrı́fugo l2 /(µr2 ). La ecuación radial (5.32) supone un observador fijo
respecto a la dirección del radio; como el radio vector gira, para este observador aparece
una fuerza inercial que es precisamente fc . Como el hamiltoniano (5.28) es una constante
de movimiento, la energı́a total en el centro de masa, que llamaremos E, proporciona
una ecuación diferencial para r que puede integrarse por cuadratura:
Z r
dr
t − t0 =
(5.33)
1/2
r0
2
l2
(E − V ) − 2 2
µ
µ r
de (5.33) en principio puede obtenerse a r en función del tiempo, para cada conjunto de
valores de t0 , r0 , µ, E y l. Es de interés encontrar a r en función de φ, o sea, hallar la
ecuación de la órbita en coordenadas polares en el plano de la misma. De (5.30) podemos
notar que:
ṙ =
l dr
µr2 dφ
de donde:
φ − φ0 =
Z
(5.34)
r
r0
l
r2 dr
1/2
l2
2µ E − V −
2µr2
(5.35)
De manera similar puede hallarse a φ(t) si se conoce a r(t):
Z r
l dt
φ − φ0 =
2
r0 µ r (t)
(5.36)
Las fórmulas (5.34) y (5.35), recordemos, valen si se eligen las coordenadas de modo
que el eje z coincide con la dirección de ~l. Para una elección general de las coordenadas,
las expresiones para hallar la ecuación de la órbita y la dependencia temporal de θ
y φ resultan más complicadas: estas fórmulas las consideramos más adelante usando
el formalismo de Hamilton-Jacobi. La fórmula (5.33) no depende de la elección de las
coordenadas.
Hallemos ahora la llamada ecuación diferencial de la órbita. Es una ecuación diferencial para r en función de φ. Se halla a partir de (5.34) y de:
ṙ = −
l dυ
;
µ dφ
r̈ = −
l2 2 d2 υ
υ
;
µ2 dφ2
donde υ =
1
r
(5.37)
Con la ayuda de (5.37), la ecuación (5.32) se transforma en la ecuación diferencial
de la órbita:
µ F (υ)
d2 υ
=− 2 2 ,
dφ2
l υ
(5.38)
donde F (υ) = f (1/υ). Esta ecuación permite, dada f (r) hallar a r(φ), y dada r(φ) hallar
a f (r).
132 / Mecánica clásica avanzada
Coordenadas de retorno. Son los valores de las coordenadas en que la respectiva
velocidad se anula, o sea, que cambia de signo. Los puntos de retorno en r son aquellos
para los cuales ṙ = 0, o sea, los que satisfacen la ecuación algebraica:
l2
+ V (r) − E = 0
2µr2
(5.39)
En estos puntos la velocidad no es cero pues θ̇ y φ̇ no se anulan necesariamente. Si
ocurre que ṙ se anula solo cuando r es finito y que el movimiento es acotado o ligado,
habrá un punto de máximo acercamiento y uno de máximo alejamiento de la partı́cula al
centro de fuerza. Si ṙ = 0 en un punto r → ∞, el movimiento es no ligado; éste es el caso
de los procesos de colisiones o de dispersión. Los puntos de retorno en θ son aquellos en
que θ̇ = 0, o sea pθ = 0; en esos puntos θ vale θmax o θmin , ecuación (5.26). La ecuación
(5.26) nos dice que no existen valores de φ en los cuales φ̇ = 0; no hay puntos de retorno
en φ.
Si r tiene dos lı́mites, rmin y rmax , el movimiento es ligado y la órbita está contenida
dentro de una corona limitada por las circunferencias r = rmin y r = rmax . La órbita
puede o no ser cerrada; en general no lo será. Para los potenciales de la forma 1/r o r2
las órbitas son cerradas y pueden ser no circulares (son elı́pticas1 ).
Para precisar, consideremos un oscilador bidimensional armónico en el plano de
la órbita; este se obtiene tomando fuerzas restauradoras lineales perpendiculares de la
forma fx = −kX x y fy = −kY y donde kX y kY son las “constantes de resorte”.2 La
dependencia temporal de x y y es:
x(t) = Ax sen(ωX t + φX ) ;
y(t) = Ay sen(ωY t + φY )
(5.40)
Eliminando t obtenemos la ecuación de la órbita en coordenadas cartesianas.
Cuando ωX es un múltiplo racional de ωY la órbita es una figura de Lissajous.
Si ωX = ωY , la figura es una elipse; si ωX y ωY difieren ligeramente, la elipse
aparece como si estuviera sometida a un movimiento de precesión (véase figura 5.3).
∆α es el ángulo que se desplaza el semieje mayor cuando la variación temporal de r
ha completado un perı́odo completo. La trayectoria será cerrada si después de cierto
número de ciclos completos de variación r la trayectoria se repite; o sea si al transcurrir
n perı́odos de variación de r, el radio a partir del cual la órbita se repite ha dado un
número m de vueltas completas, es decir, si:
n∆α = m2π
(5.41)
Si la condición (5.41) no se cumple, entonces la trayectoria no es cerrada y cuando
t → ∞ llena toda la corona. Otra forma de obtener este resultado es la siguiente. El
movimiento en r tiene una frecuencia νr y el movimiento angular tiene una frecuencia
να . La órbita será cerrada sólo si νr y να son conmensurables.
~rmax y ~rmin se llaman vectores absidales. La órbita siempre es simétrica por reflexión en los vectores absidales, o sea que con sólo conocer la porción de órbita comprendida entre dos ~rmax y ~rmin consecutivos es posible por reflexión construir toda la órbita.
Esto se puede obtener fácilmente analizando la ecuación diferencial de la órbita.
1 Para otros potenciales pueden haber órbitas cerradas no circulares pero sólo accidentalmente, es
decir, para valores muy bien determinados de l y E.
2 Cuando k
X 6= kY la fuerza es no central. Esto no es esencial, pues aun con fuerzas centrales puede
presentarse la precesión de las órbitas.
Movimiento de dos partı́culas que interactúan ... / 133
∆α
rmáx
rmín
Figura 5.3 Órbitas de un oscilador armónico bidimensional
Ejemplo 5.1.1 Hallar la velocidad angular de precesión de la órbita de una partı́cula
sometida a fuerzas restauradoras lineales con kX ≈ kY .
Se cumple que ωX ≈ ωY . En (5.40) tomamos φX = φY = 0 y llamamos ∆ω a
ωY − ωX . Para hallar la ecuación de la órbita notemos que, al primer orden en ∆ω t:
y = AY cos ωY t = AY (cos ωX t − ∆ωt senωX t)
(5.42)
de este modo la ecuación de la órbita es, al primer orden en ∆ω t:
y2
xy
x2
+ 2 +2
∆ω t = 1
2
Ax
Ay
Ax Ay
(5.43)
que es la ecuación de una elipse con el eje mayor rotado. La ecuación (5.43) puede
escribirse como una forma cuadrática no diagonal:



A2y
Ax Ay ∆ω t
x

 = A2x A2y
(x, y) 
(5.44)
2
y
Ax Ay ∆ω t
Ax
Para llevar (5.43) a la forma estándar de la ecuación de la elipse, realicemos una
rotación de los ejes coordenados por cierto ángulo δ:

 
 ′ 
x
cos δ −senδ
x

=


(5.45)
′
y
senδ cos δ
y
134 / Mecánica clásica avanzada
Luego, la matriz de la forma cuadrática será diagonal si:
tan 2δ =
2Ax Ay
∆ω t
A2x − A2y
(5.46)
Si t es el tiempo que tarda r en completar un perı́odo en este problema de fuerza
no central, entonces, al primer orden en ∆ωt, la velocidad angular de precesión de la
órbita es:
δ̇ ≈
Ax Ay
(ωy − ωx )
A2x − A2y
(5.47)
si AX no es del orden de AY (órbitas muy excéntricas).
Ejemplo 5.1.2 Hallar para qué valores del momento angular es posible que sea acotado
el movimiento en presencia del potencial:
A
l2
V (r) = − e−αr
r
2µr2
(5.48)
La energı́a potencial efectiva es:
l2
A
Vef (r) = − e−αr +
r
2µr2
(5.49)
Vemos que Vef → +0 para r → ∞, y Vef → +∞ para r → 0. La figura 5.4 muestra
la forma de Vef . Hay posibilidad de movimiento acotado sólo si Vef tiene un mı́nimo, o
′
sea si la ecuación Vef
= 0 tiene solución, esto es:
l2
Aα −αr Ae−αr
−
=0
e
+
r
r2
µr3
(5.50)
Si llamamos x = αr, entonces (5.50) se puede llevar a la forma:
(x2 + x)e−x =
αl2
µA
(5.51)
Hay solución solamente si la curva f (x) = (x2 + x)e−x corta a la recta αl2 /(µA)
(véase figura 5.5), esto es, si:
f (x0 ) >
αl2
µA
(5.52)
donde x0 es la posición en la cual f (x) tiene un máximo. f ′ (x) = 0 si:
x2 − x − 1 = 0
La única solución aceptable de (5.53) es:
√
1+ 5
≈ 1,618
x0 =
2
(5.53)
(5.54)
Movimiento de dos partı́culas que interactúan ... / 135
Vef
l2
2µr2
E
1/α
r
–Ae–αr/r
Figura 5.4 Energı́a potencial efectiva Vef componente de los potenciales centrı́fugo y de
Yukawa
Entonces:
√ 1+√5
f (x0 ) = 2 + 5 e− 2 ≈ 0,84
(5.55)
′
Hay solución a Vef
(r) = 0 sólo si:
0, 84 >
αl2
µA
(5.56)
Si (5.48) se usa para describir la interacción nuclear, por ejemplo entre un neutrón
y un protón, habrá resonancias, o sea estados ligados de energı́a positiva, si se cumple la
condición (5.56). El momento angular l = 0 presenta estados ligados pero no resonancias.
Puede haber resonancias sólo si:
0, 84
µA
> h̄2
α
(5.57)
La barrera que se forma en Vef se llama “barrera centrı́fuga”. Se entiende por
resonancia (“de forma”) el efecto túnel que se produce cuando la partı́cula viene desde
r → ∞ y atraviesa la barrera quedando atrapada por el pozo de potencial durante cierto
tiempo. Este proceso no es clásicamente posible.
136 / Mecánica clásica avanzada
αl 2
µA
f(x)
x0
Figura 5.5 Solución f (x) al potencial efectivo
5.2.
El oscilador armónico tridimensional
Es el problema del movimiento de la partı́cula de masa reducida en presencia de
la interacción central:
f~(r) = −kr êr
(5.58)
Solución en coordenadas cartesianas. Tomando coordenadas cartesianas en el
plano de la órbita, la solución al oscilador armónico bidimensional es (5.40). La ecuación
de la órbita es:
x2
y2
2xy
cos δ = sen2 δ ;
+
−
A2x
A2y
Ax Ay
δ = φy − φx
(5.59)
La ecuación (5.59) es la forma cuadrática bidimensional de la forma ~r · M̃~r = sen2 δ,
donde M̃ es la matriz:


a
− cos δ
−1 
 ; a = Ay
(5.60)
M̃ = A−1
x Ay
Ax
−cosδ
a−1
Realizando una rotación de coordenadas es posible diagonalizar a M̃ . Sea la rotación ~r = R̃~r ′ , entonces:
~r ′ · R̃T M̃ R̃~r ′ = sen2 δ
(5.61)
Movimiento de dos partı́culas que interactúan ... / 137
La matriz R̃ es ortogonal, R̃R̃T = I˜ y diagonaliza a M̃ si es de la forma:


cos α −senα
2 cos δ
;
R̃ = 
tan 2α = −1
a
−a
senα cos α
(5.62)
R̃T es la transpuesta de R̃.
Por simplicidad tomaremos Ay = Ax (a = 1). Entonces α y M̃ diagonalizada son:

1 − cos δ
1 
M̃ = 2
A
0
π
α = (cos δ > 0) ;
4
0
1 + cos δ


(5.63)
La ecuación de la órbita (5.60) se torna la estándar de la elipse, con semiejes mayor
a y menor b, y excentricidad ǫ:
r
r
δ
2 cos δ
b2
δ
a = A cos ;
ǫ= 1− 2 =
(5.64)
b = A sen ;
2
2
a
1 + cos δ
δ está relacionado con el momento angular y A con la energı́a total:
l=−
E
senδ ;
ω
E = µA2 ω 2
(5.65)
Entonces la excentricidad y el semieje mayor tienen la siguiente expresión en términos de E y l:
s
kl2


s
2 1−
2
2
µE
kl 
1E 
s
1+ 1−
(5.66)
E2 =
;
a2 =
2
2
k
µE
2
kl
1+
µE
Solución en coordenadas polares. En vez de hacer la transformación de coordenadas, usaremos las fórmulas halladas en el numeral anterior, cuando se toma el eje
Z perpendicular al plano de la órbita. De la ecuación (5.35) se sigue:
l
φ − φ0 = √
2µ
Z
r
r0
r2
dr
s
l2
1
E − kr2 −
2
2µr2
(5.67)
Haciendo la sustitución ρ = r2 , (5.67) toma la forma:
l
φ − φ0 = √
2 µk
Z
r2
r02
ρ
s
dρ
2E
l2
−ρ2 +
ρ−
k
µk
(5.68)
138 / Mecánica clásica avanzada
La integral se halla en tablas de integrales. El resultado es:

 r2
2
2Eρ 2l 

−
 1
l
k
µk 
−1


√
s
φ − φ0 =
sen


2 µk  l
2
2
4E
4l
√
ρ
−
µk
k2
µk
2
(5.69)
r0
Entonces llegamos a:
r2 =
B2
1 − e sen2(φ − φ0 + β0 )
(5.70)
donde B, e y β0 son:
B=
s
l2
µE
;
e=
s
1−
kl2
µE 2
;
2β0 = arcsen
l2
µk
r02 e
r02 −
(5.71)
La ecuación de la elipse centrada y no rotada en coordenadas polares es:
r2 =
b2
1 − cos2 φ
(5.72)
ǫ2
Si se rota 45◦ toma la forma:
b2
r2 =
1 − ǫ2 cos2 (φ −
φ
)
4
=
b2 /(1 − ǫ2 /2)
ǫ2
1−
sen2φ
2 − ǫ2
(5.73)
Las ecuaciones (5.70) y (5.73) coinciden si:
β0 = φ0 ;
B2 =
b2
2
ǫ
1−
2
;
e=
ǫ2
2 − ǫ2
(5.74)
Las ecuaciones (5.71) y (5.74) conducen a los valores hallados en (5.66) para los parámetros de la elipse en función de las constantes de movimiento. La órbita es una elipse y
el centro de la misma coincide con el centro de fuerza.
Cálculo de la variación temporal del radio. Para hacer este cálculo usamos
la ecuación (5.33):
Z r
dr
s (5.75)
t − t0 =
r0
1 2
l2
2
E − kr − 2 2
µ
2
µ r
Los puntos de retorno se hallan resolviendo la ecuación (5.39):
s
!
2
kl
E
E
2
1± 1−
= (1 ± e)
rmax,
min =
k
µE 2
k
(5.76)
Movimiento de dos partı́culas que interactúan ... / 139
Vemos que:
l
rmax = a = p
;
µE(1 − e)
l
rmin = b = p
µE(1 + e)
(5.77)
Esto nos permite escribir la expresión bajo el signo de raı́z cuadrada en (5.75)
como:
r Z r
µ
rdr
p
t − t0 =
(5.78)
2
k r0 (a − r2 )(r2 − b2 )
Haciendo el cambio de variable p = r−2 , llegamos a:
1
t − t0 =
2
r
µ
k
Z
r −2
r0−2
dρ
p
2
ρ (a ρ − 1)(1 − b2 ρ)
(5.79)
La solución a esta integral se encuentra en tablas. El resultado es:
1
t = t0 =
2
r
(a2 + b2 )ρ − 2
µ
arcsen
k
ρ(a2 − b2 )
r0−2
(5.80)
r −2
Incluyendo en t0 la parte que depende de r0 llegamos a:
r2 =
a2 + b 2
a2 − b 2
E
+
sen2ω(t − t0 ) = [1 + e sen2ω(t − t0 )]
2
2
k
(5.81)
l no puede ser arbitrario, está restringido al rango:
0≤l≤
E
ω
(5.82)
La ecuación (5.82) corresponde al comportamiento cuántico, haciendo la correspondencia con los números cuánticos l → lh̄ y E = nh̄ω, donde los valores permitidos
del número cuántico orbital l son: 0 ≤ l ≤ n; o sea l = 0, 1, 2, ...n.
Cuando l = E/ω, e =p
0 y ǫ = 0, la órbita es circular pues según (5.81) el radio de
la órbita es constante: r = E/k.
Cuando l = 0, e = 1 y ǫ = 1, la órbita es rectilı́nea. Según (5.81) la variación
temporal del radio será de forma pendular, con frecuencia ω y no 2ω como cuando
e 6= 1:
r=
r
π
2E
cos ω(t − t0 −
)
k
4ω
(5.83)
Para hallar a r(t) a partir de (5.81) se requiere realizar una expansión en serie infinita. Para l 6= 0 y diferente de un máximo valor, r(t) contiene la frecuencia fundamental
2ω y todos sus armónicos.
140 / Mecánica clásica avanzada
5.3.
El potencial 1/r
Se trata de estudiar el movimiento de la partı́cula de masa reducida bajo la fuerza:
k
f~(r) = − 2 êr
r
(5.84)
Este problema es separable en coordenadas esféricas, en coordenadas parabólicas
y tal vez en otras coordenadas. La solución en coordenadas parabólicas la hallaremos
posteriormente con el formalismo de Hamilton-Jacobi. Aquı́ resolveremos el problema
en coordenadas esféricas.
La ecuación de la órbita. Es cómodo usar la ecuación diferencial de la órbita
(5.38). La solución es simple; el resultado es:
l2 /µk
= 1 + ǫ cos(φ − φ0 )
r
(5.85)
donde ǫ y φ0 son las dos constantes de integración. Vemos que rmin ocurre cuando
φ = φ0 si k es positiva, o sea que en ese caso φ0 determina la dirección del vector rmin .
La órbita será simétrica respecto a la lı́nea φ = φ0 . Relacionemos a ǫ con las constantes
de movimiento E y l. Los puntos de retorno rmin y rmax ocurren cuando ṙ = 0 en:
E=
1 2
k
l2
−
µṙ +
2
2µr2
r
(5.86)
O sea que:
rmin, max
k
=−
2E
1±
s
2El2
1+
µk 2
!
(5.87)
Cuál de los signos corresponde a rmin o rmax depende del signo de k y del signo
de E.3 Si rmax es finito, el movimiento será ligado.
Por otra parte, de (5.85) vemos que:
rmin, max =
l2 /µk
1±ǫ
Comparando a (5.88) con (5.87) hallamos que:
s
2El2
ǫ= 1+
µk 2
(5.88)
(5.89)
El signo de ǫ lo hemos tomado positivo. La ecuación (5.85) representa una sección
cónica.
Las secciones cónicas. Son las curvas que definen la intersección de un cono con
un plano. Sobre el plano una curva cónica es el lugar geométrico de los puntos cuya
3 En
estos puntos cambia el signo de la velocidad radial. Además, para E ≥ 0, según veremos, sólo
existe un punto de retorno.
Movimiento de dos partı́culas que interactúan ... / 141
distancia a un punto dado llamado foco es proporcional a la distancia a una lı́nea dada,
la directriz. Si tomamos el origen del sistema de coordenadas polares en el foco y S es
la distancia del foco a la directriz (véase figura 5.6), se sigue de la definición, llamando
ǫ a la constante de proporcionalidad:
r = ǫ [S − r cos (φ − φ0 )]
(5.90)
y
•
Directriz
r
S
φ
φ0
x
Foco
Figura 5.6 Elementos de las secciones cónicas
ǫ debe ser positivo por ser la relación entre dos distancias. Se sigue de (5.90):
ǫS
= 1 + ǫ cos (φ − φ0 ) ,
ǫ>0
(5.91)
r
La curva es simétrica respecto a la lı́nea φ = φ0 . La longitud ǫS se llama parámetro
de la sección cónica y ǫ se llama excentricidad. Hay distintos tipos de secciones cónicas
dependiendo del valor de ǫ.
Si ǫ = 1, se obtiene la parábola, es decir, el lugar geométrico de los puntos equidistantes del foco y de la directriz. El punto de máximo acercamiento al foco se llama
vértice y está situado a una distancia S/2, en tanto que la máxima distancia es infinita:
1
S;
rmax = ∞; ǫ = 1
(5.92)
2
Si ǫ < 1, se obtiene una elipse: curva con dos directrices y dos focos. Hay en este
caso dos distancias absidales finitas:
ǫS
ǫS
; rmax =
; ǫ<1
(5.93)
rmin =
1+ǫ
1−ǫ
El promedio entre rmax y rmin lo llamaremos a, de modo que:
rmin =
S=a
1 − ǫ2
;
ǫ
ǫS = a(1 − ǫ2 )
(5.94)
142 / Mecánica clásica avanzada
La ecuación de una elipse en coordenadas polares con foco en el origen es:
r=
a(1 − ǫ2 )
1 + ǫ cos (φ − φ0 )
(5.95)
La ecuación de una elipse en coordenadas polares con centro en el origen es (5.72).
Las directrices
están a distancias a/ǫ del centro (véase figura 5.8). Los semiejes son a y
√
b = a 1 − ǫ2 .
D
ε=1
S/2
)φ0
S
F
Figura 5.7 Sección cónica: la parábola
D2
S
ε<1
εS
D1
εa
F2
•
) φ0
S
F1
a /ε
Figura 5.8 Sección cónica: la elipse
Si ǫ > 1, la cónica es una hipérbola: curva de dos ramas con sus correspondientes
focos, directrices y ası́ntotas. De la definición (5.90) se sigue la siguiente ecuación para
la rama 2, respecto al origen de coordenadas mostrado, la cual es consistente con (5.85)
Movimiento de dos partı́culas que interactúan ... / 143
ε<1
2
D2
εS
)φ0
D1
F2
S
a
aε
1
a/ε
F1
Figura 5.9 Sección cónica: la hipérbola
cuando k > 0 y φ0 se sustituye por φ0 + π:
ǫ
= −1 − ǫ cos (φ − φ0 ) ;
rama 1 (k < 0)
r
(5.96)
ǫ
= 1 − ǫ cos (φ − φ0 ) ; rama 2 (k > 0)
r
Cuando φ − φ0 = π, r toma el valor rmin :
(1)
rmin =
ǫS
;
ǫ−1
(2)
rmin =
ǫS
;
1+ǫ
(2)
(1)
rmin = rmin − 2a
(2)
(5.97)
(1)
cuando cos(φ − φ0 ) = 1/ǫ, r = rmax = ∞ y cuando cos(φ − φ0 ) = −1/ǫ, r = rmax = ∞.
Si llamamos la distancia entre los vértices 2a, también se cumple que rmin = a(ǫ − 1).
Las directrices están a distancias a/ǫ del centro. El parámetro S en función de a vale:
S=
ǫ2 − 1
a
ǫ
(5.98)
r → ∞ cuando 1 − ǫ cos (φ − φ0 ) = 0, sobre la rama 2. Entonces el ángulo entre las dos
ası́ntotas vale:
2 cos−1 ǫ−1 ;
cos−1 ǫ−1 ≤ φ − φ0 ≤ π − cos−1 ǫ−1
(5.99)
Relación entre el signo de k y E, y el tipo de cónica. La excentricidad y el
parámetro están relacionados con la energı́a y el momento angular:
s
l2
2El2
(5.100)
;
ǫ= 1+
ǫS =
µ|k|
µk 2
Si el potencial es repulsivo, k es negativo. En este caso, sólo es posible que la
energı́a sea positiva, pues de lo contrario rmin serı́a negativo. Entonces ǫ es mayor que
144 / Mecánica clásica avanzada
la unidad y la trayectoria de la partı́cula es hiperbólica, o sea que el movimiento es
no ligado. Esto es consistente con el análisis de la curva de energı́a potencial efectiva
cuando k es negativo: la energı́a potencial no tiene un mı́nimo y el movimiento resulta
no acotado, con sólo un punto de retorno. Es el caso cuando la partı́cula llega desde el
infinito y “rebota” en la barrera de potencial. Este comportamiento incluye también el
caso lı́mite en que la energı́a es cero.
Si el potencial es atractivo, k es positiva. En este caso se presentan tres posibilidades. Si E > 0, entonces ǫ > 1 y el movimiento es hiperbólico. No hay lı́mite al valor
máximo que puede tomar l:
0≤l<∞
si
E>0
(5.101)
A este caso, y al caso en que k es negativo, corresponden las dos ramas de la
hipérbola: si k es negativo, la partı́cula se mueve sobre la hipérbola correspondiente a
D1 ; si k es positivo y E > 0, se mueve sobre la hipérbola correspondiente a D2 . Si E = 0
entonces ǫ = 1. l se conserva pero no es cero porque el parámetro de impacto es infinito
y en r → ∞ la velocidad es cero:
0≤l<∞
si
E=0
(5.102)
El movimiento es no ligado y r → ∞ para dos valores de φ: φ = φ0 ± π.
La trayectoria es parabólica y no tiene ası́ntotas (serı́an las rectas y = ±∞). De
(5.92) se sigue que:
rmin =
1
l2
S=
⇒ l 6= 0
2
2µk
(5.103)
Este caso se presenta cuando la partı́cula parte del reposo desde el infinito.
Si E < 0, entonces ǫ < 1. En este caso:
s
2|E|l2
<1
ǫ= 1−
µk 2
Es claro que el rango de valores posibles de l es finito:
r
µ
0≤l≤
k
2|E|
(5.104)
(5.105)
Esto es análogo al comportamiento del número cuántico orbital en el átomo de
hidrógeno: l = 0, 1, ...n − 1.
ǫ cos (φ − φ0 ) nunca vale uno y por eso r nunca es infinito: el movimiento es ligado.
En este caso:
rmin, max =
k
(1 ∓ ǫ) ;
2|E|
a=
k
2|E|
(5.106)
Si ǫ = 0 siendo E < 0 entonces la trayectoria es circular con radio:
r=
l2
k
=
=a
µk
2|E|
(5.107)
Movimiento de dos partı́culas que interactúan ... / 145
Como r es constante, se sigue de (5.31) que φ̇ también es constante.
Si ǫ = 1, entonces l = 0 y la trayectoria es la lı́nea recta φ = φ0 . En este caso:
rmin = 0 ;
rmax = a
(5.108)
Para ǫ < 1 la trayectoria es una elipse rotada en un ángulo φ0 y con semiejes mayor
y menor dados por:
a=
k
;
2|E|
b=a
p
l
1 − ǫ2 = p
2µ|E|
(5.109)
respectivamente. Vemos que b está comprendido, dependiendo de l, entre:
0≤b≤a
(5.110)
El hecho de que las trayectorias sean elı́pticas es consecuencia de la primera ley de
Kepler (cuando k = GM m).
Las figuras desde 5.10 hasta 5.13 muestran las curvas de energı́a potencial efectiva para
cada uno de los casos. Del análisis de las mismas se obtiene cualitativamente el comportamiento descrito.
Vef
E
r mín
k<0
r
Figura 5.10 Energı́a potencial efectiva. Trayectoria hiperbólica.
La tercera ley de Kepler. El área de la elipse es:
s
p
l
2
kl
2
= πa2
A = πab = πa 1 − ǫ2 = π
4|E| µ|E|
lmax
(5.111)
Recordando la ecuación (5.31) para la velocidad areolar, obtenemos que:
r
πk p
µ 3/2
A
−2µE = 2π
a
(5.112)
=
τ=
2
2E
k
Ȧ
146 / Mecánica clásica avanzada
Vef
E
r mín
r
k > 0, E > 0
Figura 5.11 Energı́a potencial efectiva. Trayectoria hiperbólica.
Vef
·
E
r
rmín
k > 0, E = 0
Figura 5.12 Energı́a potencial. Trayectoria parabólica.
Vemos que el perı́odo del movimiento no depende del valor de l.
Para la interacción gravitacional entre un planeta (masa m) y el Sol (masa M ),
(5.112) toma la forma:
s
1
a3/2
(5.113)
τ = 2π
G(m + M )
Como para los planetas del sistema solar m ≪ M , se sigue que τ ∝ a3/2 , que es el
contenido de la tercera ley de Kepler, la cual como se ve, es un resultado aproximado.
Movimiento de dos partı́culas que interactúan ... / 147
Vef
l = l máx
l
l=0
·
r
r mín
r máx
k > 0, E < 0
E
Figura 5.13 Energı́a potencial efectiva. Trayectoria elı́ptica.
La ecuación de Kepler. Encontrar a r(t) es interesante en muchos casos, por
ejemplo para predecir el movimiento de un satélite. Para hallar a r(t) debemos usar
la ecuación (5.33). Por simplicidad, consideraremos sólo el caso k > 0, E < 0. Es
conveniente expresar a E y l en términos de a y ǫ:
p
p
k
(5.114)
E=− ;
l = µka 1 − ǫ2
2a
Entonces (5.33) toma la forma:
r
Z
µa r
rdr
p
t − t0 =
2
k r0 −r + 2ar − (1 − ǫ2 )a2
Usando la expresión para τ , ecuación (5.112), obtenemos:
Z r
r dr
τ
p
t − t0 =
2πa r0 −r2 + 2ar − (1 − ǫ2 )a2
La solución a esta integral se encuentra en tablas. El resultado es:
r−a
1p 2
2πa
−r + 2ar − (1 − ǫ2 )a2 + arcsen
(t + δ) = −
τ
a
ǫa
donde δ es una constante arbitraria.
Definamos las siguientes variables:
(5.115)
(5.116)
(5.117)
2π
a−r
(t + δ) ;
ψ = cos−1
(5.118)
τ
ǫa
Las cantidades M , ψ y φ reciben los siguientes nombres en astronomı́a: M , anomalı́a media; ψ, anomalı́a excéntrica y φ, anomalı́a verdadera (véase figura 5.14).
De simples argumentos geométricos se sigue a partir de las fórmulas de la elipse
que ψ y M tienen la siguiente interpretación geométrica:
M=
148 / Mecánica clásica avanzada
y
R
Q
P
M
ψ
r
φ
x
Figura 5.14 Variables de la ecuación de Kepler.
ψ es el ángulo del vector de posición del punto Q, tomando como origen el centro
de la elipse. R es un punto que gira uniformemente sobre una circunferencia de radio a,
con velocidad angular 2π/τ . φ y M sirven para describir la posición del punto p (véase el
texto de Marion, Classical dynamics of particles and systems, segunda edición, sección
8,8). Expresando a (5.117) en función de (5.118) obtenemos:
r = (1 − ǫ cos ψ)a ;
M = ψ − ǫsenψ
(5.119)
En (5.119) hemos adicionado a M la constante π/2. La ecuación que relaciona a
ψ con M se denomina la ecuación de Kepler, y permite expresar a r en función del
tiempo. ψ es una función trascendental de M . Bessel halló en 1830 la solución exacta de
la ecuación de Kepler en forma de serie de Fourier. El resultado es:
ψ =M +2
∞
X
Jn (nǫ)
n=1
sen(nM )
n
(5.120)
donde Jn son las funciones de Bessel de orden entero. Entonces la expresión para r(t)
es:
(
"
r(t) = a 1 − ǫ cos 2πν(t + δ)+
∞
X
sen{2πnν(t + δ)}
2
Jn (nǫ)
n
n=1
#)
Ejemplo 5.3.1 Demostrar la solución (5.120) de la ecuación de Kepler.
(5.121)
Movimiento de dos partı́culas que interactúan ... / 149
ψ es una función impar de M , luego su expansión de Fourier contendrá sólo funciones
seno y además contiene una componente no oscilante que será M misma. Entonces
busquemos soluciones de la forma:
ψ=M+
∞
X
Cn sen(nM )
(5.122)
n=1
La expansión de Fourier de la función ǫ senψ = f (M ) tiene coeficientes dados por:
Z
2 π
Cn =
f (M ) sen(nM ) dM
(5.123)
π 0
Utilizando la ecuación de Kepler, el integrando en (5.123) será:
Z
2ǫ π
senψ sen[n(ψ − ǫ senψ)](1 − ǫ cos ψ)dψ
Cn =
π 0
(5.124)
Efectuando los productos y expresando los productos de funciones seno como suma
de funciones coseno llegamos a:
Z
ǫ πn
cos[(n − 1)ψ − nǫsenψ] dψ − cos[(n + 1)ψ
Cn =
π 0
1
(5.125)
−nǫsenψ] dψ − ǫ cos[(n − 2)ψ
2
o
1
−nǫ senψ]dψ + ǫ cos[(n + 2)ψ − nǫsenψ] dψ
2
La función de Bessel entera tiene la siguiente representación integral:
Z
1 π
Jκ (x) =
cos (κθ − xsenθ)dθ ;
κ : entero
π 0
Con lo cual Cn toma la forma:
h
Cn = ǫ Jn−1 (nǫ) − Jn+1 (nǫ)
i
ǫ
ǫ
− Jn−2 (nǫ) + Jn+2 (nǫ)
2
2
(5.126)
(5.127)
Las funciones Jκ tienen la siguiente relación de recurrencia:
Jκ+1 (x) =
2κ
Jκ (x) − Jκ−1 (x)
x
(5.128)
El uso de (5.128) nos permite llegar finalmente a:
Cn =
2
Jn (nǫ)
n
(5.129)
Con lo cual queda demostrada la expresión (5.120).
Precesión de las órbitas elı́pticas. Vimos que, bajo fuerzas centrales, las órbitas
son simétricas respecto a cualquier ábside, por lo tanto el ángulo entre cualquier par de
lı́neas absidales consecutivas es el mismo. En el problema de Kepler (k > 0, E < 0),
150 / Mecánica clásica avanzada
las órbitas son cerradas, o sea que el ángulo de precesión de los ábsides es cero. En
el movimiento planetario, por ejemplo, hay efectos “perturbadores”, que hacen que el
potencial no sea exactamente de la forma −k/r, aunque lo sea aproximadamente.
Para el movimiento de la luna alrededor de la tierra, además de la interacción
gravitacional entre estos dos cuerpos tomados como masas puntuales, hay efectos adicionales como una fuerza externa no central debida al campo gravitacional homogéneo
producido por el sol sobre la órbita de la luna; esto se traduce en pequeñas oscilaciones
del plano de la órbita. La tierra y la luna no son masas puntuales y por ello la interacción
del tipo −k/r es sólo el primer término en una expansión multipolar, que dependerá de
la distribución de masa de los cuerpos; la parte central de esta interacción dará lugar
a la precesión de la órbita, o sea al giro del semieje mayor de la elipse, y la parte no
central da lugar a movimientos giroscópicos de la tierra y la luna.
En el caso de Mercurio hay efectos de precesión de su órbita debidos al efecto
combinado de todos los demás cuerpos del sistema solar y efectos residuales que sólo son
explicados por la teorı́a general de la relatividad.
Ejemplo 5.3.2 Analizar la precesión de la órbita de una partı́cula que se mueve en presencia del potencial:
V =−
C
k
+ 2;
r
2r
C
≪1
ka
(5.130)
γ =2
Figura 5.15 Trayectoria para γ = 2
Tenemos que la fuerza sobre la partı́cula es central, ası́ que ~l es constante. La
ecuación diferencial de la órbita es:
µ
d2 υ
+ υ = − 2 2 (−kυ 2 + Cυ 3 ) ;
dφ2
l υ
υ=
1
r
(5.131)
Movimiento de dos partı́culas que interactúan ... / 151
γ =3
Figura 5.16 Trayectoria para γ = 3
La solución de (5.131) es:
α
= 1 + ǫ cos γ(φ − φ0 ) ;
r
γ 2 l2
α=
;
µk
γ=
r
1+
µC
l2
(5.132)
donde ǫ y φ0 son constantes de integración. φ0 es la dirección del vector absidal rmin y
ǫ se puede expresar en términos de las constantes de movimiento comparando las dos
expresiones para las distancias de retorno.
s
!
k
α
2El2 2
rmax, min = −
=
1± 1+
γ
(5.133)
2E
µk 2
1±ǫ
Se sigue entonces que:
rmax − rmin
E=
=
rmax + rmin
s
1+
2El2 2
γ ;
µk 2
a=−
k
2E
(5.134)
El efecto del término adicional es variar ligeramente la excentricidad de la órbita e
introducir el factor de γ a φ − φ0 .
Cuando r = rmin , φ = φ0 y cuando r = rmax , φ = φ0 + φ/γ. Entonces el ángulo
entre los vectores absidades γmin y rmax es:
φmax − φmin =
π
γ
(5.135)
152 / Mecánica clásica avanzada
γ=5
Figura 5.17 Trayectoria para γ = 5
y no π como cuando C = 0. De esta forma, al cumplir un perı́odo, el vector rmin sufre
un desplazamiento angular dado por:
1
(5.136)
∆φ = 2π 1 −
γ
Si la partı́cula tarda un tiempo Tr en ir de un valor de rmin al consecutivo, tardará un tiempo mayor en φ dar una vuelta completa. La trayectoria será cerrada solamente si ∆φ es un submúltiplo racional de 2π, o sea, si γ es un número racional, lo cual
ocurrirá sólo accidentalmente. Si r ≥ 1 la órbita es esencialmente una elipse que precesa;
el semieje menor rmin rota 2π(1 − γ −1) por cada ciclo de variación de r. Ver figuras 5.15
a 5.18.
Un ejemplo de aplicación del método variacional. Muchas veces no es posible resolver exactamente un problema mecánico, pero es deseable obtener información
aproximada sobre el mismo. Supongamos que hay un sistema cuya solución conocemos
exactamente y que tiene aspectos similares al sistema original para el cual no conocemos
la solución; la solución para el sistema aproximado contendrá una serie de parámetros.
El principio variacional de Rayleigh expresa que la energı́a del sistema es menor que el
valor medio del hamiltoniano tomado sobre la trayectoria del sistema aproximado, de
modo que del sistema aproximado se puede obtener una aproximación óptima al problema original buscando cuáles son los valores de los parámetros que minimizan al valor
medio del hamiltoniano. En otras palabras: el sistema original posee un hamiltoniano
Movimiento de dos partı́culas que interactúan ... / 153
γ = 1,33
Figura 5.18 Trayectoria para γ ≈ 1
que es función de las variables de estado, H(q, p); para cada estado de movimiento (q, p),
H tendrá un valor definido. Si se toman q(t) y p(t) no de la solución exacta sino de una
aproximada, el valor de H siempre será en promedio mayor que el que tendrı́a tomando
para q(t), p(t), sus valores exactos. Este método está relacionado con el método variacional usado en mecánica cuántica para hallar la energı́a del estado base de un sistema
usando funciones de onda de ensayo.
Veamos cómo trabaja por medio de un ejemplo.
Consideremos un átomo de litio y tratemos de hallar las energı́as del electrón externo usando la vieja mecánica cuántica. De acuerdo con el modelo de capas del átomo,
el Li consta de dos electrones internos y uno externo. E. Schrödinger en 1921 propuso el
siguiente modelo.4 El resto del átomo –los electrones internos– es reemplazado por una
capa esférica de distribución uniforme de carga negativa, externa a la cual hay entonces
un campo de fuerza coulombiano, correspondiente a una carga positiva +e del núcleo
“apantallado” por dos electrones, y en el interior hay un campo coulombiano, correspondiente a una carga positiva +3e, la del núcleo. Llamemos ρ al radio del cascarón.
Entonces la energı́a potencial en este modelo será:

2e2
3e2

 −
+
r<ρ
r
ρ
(5.137)
V =
2

 −e
r>ρ
r
4 Véase
el texto The mechanics of the atom de Max Born, sección 28.
154 / Mecánica clásica avanzada
donde la constante 2e2 /ρ asegura la continuidad de V en r = ρ. Para el caso en que la
energı́a sea lo suficientemente alta, la órbita permanecerá a distancias del núcleo mayores que ρ, con lo cual la solución será, para el electrón externo, una trayectoria elı́ptica
como en la figura 5.13. Pero cuando el perihelio de la órbita resulta menor que ρ, la
órbita penetra al interior y no será más de forma elı́ptica pues será la correspondiente al
potencial (5.137) que no es coulombiano. Si el electrón externo sólo permanece dentro
de la esfera de radio ρ una fracción pequeña de tiempo es de esperarse que la órbita sea
una elipse que precesa, como en la figura 5.18. Durante un perı́odo la órbita exacta correspondiente al potencial (5.137) diferirá poco de la órbita correspondiente al potencial
coulombiano. Tomaremos entonces como soluciones de ensayo las órbitas elı́pticas en un
potencial:
V =−
ze2
r
(5.138)
donde z será un parámetro variacional que se determina por la condición de que hHi
sea un mı́nimo.
Por simplicidad supondremos que el electrón externo está en un estado s, o sea
que tiene l = 0. Para este caso, según (5.104) la excentricidad será ǫ = 1. Como V es
central, el hamiltoniano es de la forma (5.28), o sea que interviene sólo la coordenada
radial. Usando (5.119) y (5.118) obtenemos, tomando δ = 0:
r = (1 − cos ψ)a ;
2πνt = ψ − senψ
(5.139)
La ecuación (5.139) permite escribir a r y ṙ en la forma:
r = 2a sen2
ψ
;
2
ṙ = 2πνa cot
ψ
2
(5.140)
La ecuación (5.140) permite ahora expresar a H en términos de la solución de
ensayo ası́:
H=

3e2
2e2
2 ψ

2 ψ
2
2 2

−
csc
+
2π
mν
a
cot


2
2a
2
ρ

2


 2π 2 mν 2 a2 cot2 ψ − e csc2 ψ
2
2a
2
r<ρ
(5.141)
r>ρ
El valor medio de H en un perı́odo será, usando la ecuación de Kepler:
hHi = 2ν
Z
1/(2ν)
0
2
Hdt =
π
Z
π
0
ψ
Hsen2 dψ
2
(5.142)
Llamando ψ1 al valor de ψ cuando r = ρ obtenemos de (5.140):
ψ1
=
sen
2
r
ρ
2a
(5.143)
Movimiento de dos partı́culas que interactúan ... / 155
Podemos separar la integral (5.142) en dos, de 0 a ψ1 y de ψ a π, con lo cual
obtenemos después de manipulaciones simples:
Z 2 ψ1
3e2 2e2
2
2 2
2 ψ
2ψ
hHi =
2π mν a cos
dψ
−
+
sen
π 0
2
2a
ρ
2
(5.144)
Z 2
e
ψ
2 π
dψ
2π 2 mν 2 a2 cos2 −
+
π ψ1
2
2a
Efectuando las integraciones llegamos a:
2
2
e
e2
e2
e2
hHi =
− ψ1 + ψ1 − senψ1 + π 3 mν 2 a2 − π
π
a
ρ
ρ
2a
(5.145)
Es conveniente expresar a e2 /a en términos del número cuántico principal n, la
energı́a de Rydberg y el parámetro z, ası́:
z
z
e2
= e 2 = 2R
a
n a0
n
(5.146)
donde a0 es el radio de Bohr y R = e2 /a0 . Como a = n2 a0 /z, notamos por analogı́a
que ρ será el radio de la órbita de los electrones internos, que se mueven en presencia
del núcleo que tiene carga 3e, y están en la primera órbita que tiene n = 1; entonces
ρ = a0 /3. De esta forma (5.143) es:
r
1 z
ψ1
=
(5.147)
sen
2
n 6
Usando (5.112) con k = ze2 obtenemos:
π 2 mν 2 a2 =
π z2
R
4 n2
de modo que (5.145) tomará la forma:
"
r 2z
1 z
2R
6 − 2 arcsen
hHi =
π
n
n 6
r
#
1
z2
π z2
−
6z − 2 +
−z
n
n
2n 2
(5.148)
(5.149)
z es un parámetro que se determina por la condición de que minimice a hHi, es decir,
por la condición:
∂hHi
=0
∂z
(5.150)
Efectuando las manipulaciones algebraicas llegamos a que z satisface la siguiente
ecuación trascendental:
r
π
1 z
= sen (z − 1)
(5.151)
n 6
4
156 / Mecánica clásica avanzada
de (5.151) se sigue que z debe ser positiva. Una vez hallada z de (5.151) se reemplaza
en (5.149) para obtener la energı́a:
"
R
n
E=
2z(z − 1) 1 −
2
2n
2
#
r
4n
z2
+zn(1 − 6n) + 6n +
6z − 2
(5.152)
π
n
De acuerdo con el principio variacional, la aproximación óptima por medio de órbitas de Kepler al movimiento bajo el potencial (5.137) se halla por medio del potencial
coulombiano −ze2/r, donde z es el número que se obtiene de (5.151) para cada n. Los
resultados que se obtienen al resolver numéricamente a (5.151) son aproximados, dando
errores grandes para n = 2 y errores que van disminuyendo a medida que n aumenta;
las energı́as variacionales siempre serán mayores que las experimentales. Ası́, por ejemplo, algunos resultados son: (n, Evar , Eexp )= (2; −0, 29; −0, 58); (8; −0, 06; -0, 12); (15;
−0, 03; −0, 06); (40; -0, 01; −0, 03).
Los resultados no son muy buenos pero ilustran el método variacional que es usado extensivamente en muchas ramas de la fı́sica; las discrepancias se deben en parte al
modelo –suponer que el potencial es central y dado por (5.137)–, en parte al método
variacional en sı́, y en parte al uso de la aproximación clásica.
5.4.
El problema de la dispersión bajo fuerzas centrales
Esta sección trata con las soluciones que describen estados no ligados; tales son
los casos k < 0, k > 0 y E > 0 en el movimiento bajo el potencial −k/r. Cuando el
problema es causal, es decir se conocen exactamente las constantes de movimiento y
φ0 , las ecuaciones de la órbita nos dan la evolución de la partı́cula; este problema es
estrictamente mecánico. En fı́sica microscópica, cuando se trabaja con átomos, moléculas o electrones, entre otros, una descripción mecánica es muy difı́cil; entonces se acude
a conceptos estadı́sticos. En esta sección en gran parte trabajaremos con los conceptos
estadı́sticos de la sección eficaz, aptos para sistemas microfı́sicos, aunque también se
aplican por ejemplo en cosmologı́a.
La sección eficaz de dispersión. Un experimento tı́pico de dispersión consiste
en estudiar el efecto de un centro dirpersor sobre un haz de partı́culas. Se entiende por
dispersión el proceso de colisión en el cual la dirección del movimiento de las partı́culas
incidentes cambia al azar, como resultado de la interacción con el centro dispersor.
En el estudio estadı́stico se hacen las siguientes suposiciones: todas las partı́culas
del haz incidente son de la misma naturaleza y tienen la misma energı́a y dirección de
la velocidad inicialmente. La interacción es de corto rango, de modo que a partir de
distancias mayores que cierta cantidad α es esencialmente cero. El haz de partı́culas
Movimiento de dos partı́culas que interactúan ... / 157
incidentes tiene una sección transversal A que es mucho mayor que el área efectiva de
interacción σ = πα2 , las partı́culas se distribuyen al azar sobre el área de la sección
transversal del haz. El haz tiene un número muy grande de partı́culas para permitir
un tratamiento estadı́stico, pero no tan grande como para que una partı́cula del haz
interfiera con otra. Toda partı́cula que se acerque al centro dispersor a una distancia
menor que α es dispersada; la probabilidad a priori de una partı́cula ser dispersada es:
p=
σ
;
A
σ = πα2
(5.153)
donde σ se llama sección eficaz total de dispersión y es una medida de la dispersión en
cualquier ángulo. Llamaremos θ al ángulo entre la dirección del haz incidente y la del
movimiento final de una partı́cula dispersada.
Las partı́culas que incidan sobre el blanco con un parámetro de impacto s serán
dispersadas en un ángulo θ; las que incidan con un parámetro de impacto s + ds serán
dispersadas en un ángulo θ + dθ donde dθ es negativo. Todas las partı́culas que incidan
sobre una corona circular de radios s y s + ds serán dispersadas dentro del rango angular
θ y θ + dθ. Todas las partı́culas que incidan sobre el área dσ (área rayada en la figura
5.19) se dispersarán con ángulos entre θ y θ + dθ y φ + dφ. Como suponemos que r ≫ α,
rd θ
A
dσ
r
dϕ
θ
θ + dθ
dϕ
ds
Figura 5.19 Sección eficaz de dispersión
entonces hemos notado que no hay diferencia esencial en suponer que las partı́culas
emergen del centro dispersor en vez del centro del área rayada dσ. Estas partı́culas
serán dispersadas dentro de un ángulo sólido dΩ dado por:
dΩ = senθ dθ dφ
(5.154)
La probabilidad de dispersión dentro del ángulo dΩ se expresa en función de la
llamada sección eficaz dσ.
dp =
dσ
s ds dφ
=
A
A
(5.155)
Supongamos que la intensidad del haz incidente es I:
I=
∆N
A ∆t
(5.156)
158 / Mecánica clásica avanzada
donde ∆N es el número de partı́culas incidentes que pasan por el área A durante el
tiempo ∆t. De las ∆N que en ∆t pasan a través de A, solamente dN (θ) incidirán sobre
el área dσ y serán dispersadas dentro de dΩ en el tiempo ∆t.
Entonces la probabilidad de dispersión dentro de dΩ durante el tiempo ∆t será:
dp =
dN (θ)
dσ
=
∆N
A
(5.157)
Se sigue entonces de (5.156) y (5.157) que:
dN (θ)
= Idσ
∆t
(5.158)
Definimos la sección eficaz diferencial σ(θ), como:
σ(θ) =
dσ
dΩ
(5.159)
Se sigue entonces que:
σ(θ) =
1 dN (θ)
I(θ)
=
I
I ∆t dΩ
(5.160)
Es decir, σ(θ) es igual al número total de las partı́culas dispersadas dentro de dΩ
por unidad de tiempo y unidad de ángulo sólido, dividido por el número de partı́culas incidentes por unidad de área por unidad de tiempo. Como esta definición de σ(θ)
incluye sólo conceptos macroscópicos, o sea conceptos de cantidades observables experimentalmente, entonces es válido también en mecánica cuántica. La siguiente expresión
mecánica que resulta de (5.159) al reemplazar a dσ y dΩ en función de θ, φ y s sólo es
válida en mecánica clásica,
σ(θ) =
dσ
−s ds
=
dΩ
senθ dθ
(5.161)
La ecuación (5.161) está expresada en función de s, que en microfı́sica no es accesible directamente al experimento.
La relación entre las tres definiciones de sección eficaz (sección eficaz, sección eficaz
total y sección eficaz diferencial) es:
Z
Z
σ = dσ = σ(θ) dΩ
(5.162)
Ejemplo 5.4.1 Sea una esfera dura de radio a y masa infinita. Sobre ella incide un haz de
partı́culas de masa m y radio b también duras, que se dispersan elásticamente al chocar.
Hallar la sección eficaz diferencial (véase figura 5.20).
El parámetro de impacto está dado por:
s = (a + b) senα = (a + b) cos
θ
2
(5.163)
Movimiento de dos partı́culas que interactúan ... / 159
a
z
S
b
α
α
θ
Figura 5.20 El haz partı́culas de masa m y radio b incide sobre una esfera de masa infinita
y radio a
Entonces:
σ(θ) =
1
(a + b)2 ;
2
σ = π(a + b)2
(5.164)
σ(θ) no depende de θ ni de la energı́a. Cuánticamente se halla que σ es cuatro veces
mayor debido a efectos de difracción.
Sección eficaz diferencial de Rutherford. Es la sección eficaz diferencial de
dispersión coulombiana, cuando inciden partı́culas cargadas sobre un blanco de masa
infinita y cargado eléctricamente. Asumamos que las cargas son positivas, ze y z ′ e, de
modo que k es negativo, igual a −zz ′e2 . La figura 5.21 muestra la trayectoria de una
de las partı́culas, que es hiperbólica. Tomamos por simplicidad a φ0 = 0 con lo cual
obtenemos de acuerdo con la figura 5.9, la figura 5.21.
De acuerdo con la definición de sección cónica, la ecuación de la hipérbola (rama
1 en la figura 5.9) es:
QF2 = ǫQD2
(5.165)
donde Q es el punto cuyo vector de posición es ~r, F2 es el foco de la derecha y D2 la
directriz de la derecha. Entonces la ecuación de la trayectoria es:
ǫs
ǫs
l2 /mk
= −1 − ǫ cos φ ⇒ φ = π → rmin =
=
r
ǫ−1
1−ǫ
(5.166)
Que también se obtiene directamente de (5.85) cuando k < 0 y φ0 se sustituye por
φ0 + π. r → ∞ cuando −1 − ǫ cos φ = 0, o sea cuando φ toma el valor:
1
(5.167)
φmin = cos−1 −
ǫ
φmin está relacionado con el ángulo de dispersión θ:
φ
π θ
+ θ = φmin ; θ + φ = π ⇒ φmin = +
2
2
2
(5.168)
160 / Mecánica clásica avanzada
y
•
z′e
Q

θ / 2 


r
Θ
O
ϕ
•ze
x
v∞
•u
S
Figura 5.21 Dispersión de Rutherford. La trayectoria de las partı́culas es hiperbólica.
Entonces:
1
θ
θ
cos φmin = −sen = − ⇒ ǫ = csc
2
ǫ
2
(5.169)
Por otra parte ǫ está relacionado con E y l, o sea con υ∞ y con s:
l = mυ∞ s ; E =
1
mυ∞ 2
2
(5.170)
Como, según (5.89), ǫ2 = 1 + 2El2 /(mk 2 ), vemos que:
s2 =
k2 2
(ǫ − 1)
4E 2
(5.171)
De (5.169) y (5.171) se sigue que:
s=
k
θ
cot
2E
2
Reemplazando a (5.172) en (5.161) obtenemos para σ(θ):
2
θ
k
csc4
σ(θ) =
4E
2
(5.172)
(5.173)
que es la fórmula de Rutherford.5 Como el resultado no depende del signo de k, la
fórmula también es válida cuando el potencial es atractivo.
5 Hallada
en 1911. En el tomo I del Berkeley physics course, al final del capı́tulo 15, puede verse el
trabajo original de Rutherford.
Movimiento de dos partı́culas que interactúan ... / 161
La fórmula (5.173) coincide exactamente con la formula cuántica no relativı́stica;
es uno de los varios resultados en que para potenciales del tipo 1/r hay una identidad
con los resultados cuánticos.
La sección eficaz total que se calcula de (5.173) resulta infinita. Como σ es una
medida de la dispersión, el área efectiva para la dispersión de Coulomb es infinita por
ser un potencial de rango largo α = ∞. No importa a que distancia pase el proyectil del
blanco siempre habrá dispersión en alguna dirección.
Sistemas de referencia de centro de masa y de laboratorio. Hasta aquı́ las
consideraciones de las órbitas se han hecho suponiendo que el centro de fuerzas es
inmóvil, lo que equivale a decir que trabajamos en un sistema de referencia donde se
mueve una partı́cula de masa reducida µ, que puede asumirse que está colocada en vez de
la partı́cula 2, en tanto que el centro de fuerzas, inmóvil, está donde estaba la partı́cula
1. El radio vector ~r describe el movimiento de la partı́cula µ, ası́ como el movimiento
relativo de las dos partı́culas originales [ecuaciones (5.9) a (5.13)]. Aquı́ analizaremos
más en detalle la transformación de coordenadas, de manera adecuada a los procesos de
dispersión bajo fuerzas centrales.
Experimentalmente los procesos de dispersión se trabajan en el sistema de referencia de laboratorio. Los cálculos teóricos se hacen en el sistema de centro de masa, donde
la dinámica de los problemas consiste en el movimiento de la partı́cula de masa µ. Es
necesario encontrar la conexión entre los resultados teóricos y los experimentales.
Todas las fórmulas anteriores de (5.153) a (5.173) han sido obtenidas suponiendo
que el centro dispersor es fijo (véase figura 5.22). En el laboratorio usualmente una de las
dos partı́culas, que llamaremos el blanco, está inicialmente en reposo y sobre ella incide
el proyectil con cierta velocidad. La velocidad inicial del proyectil, cuando la separación
de las dos partı́culas es mucho mayor que el rango de la interacción α, es ~υ y la del blanco
~ = 0. En el centro de masa estas dos velocidades son ~υc y V
~c respectivamente. La
es V
m
-v
v
m
m
c.m.
Laboratorio: inicial
M1
vc
x
x
c.m.
v=0
vc
Laboratorio: final
Figura 5.22 Sistemas de referencia de centro de masa y de laboratorio
velocidad del centro de masa respecto al laboratorio es constante, la llamaremos ~υ .
m
~υ =
~υ
(5.174)
m+M
Los momentos lineales de las partı́culas inicialmente, cuando su separación es muy
grande de modo que no interactúan, son en el laboratorio:
p~P L = m~υ ;
pBL = 0
y en el centro de masa son:
p~P C = m(~υ − ~υ) = µ~υ ;
(5.175)
~pBC = M (0 − ~υ) = −µ~υ
(5.176)
162 / Mecánica clásica avanzada
Las energı́as cinéticas totales de acuerdo con lo hallado en (5.11) a (5.13) son:
TL =
1
mυ 2 ;
2
TC =
1 2
µυ
2
(5.177)
La energı́a cinética del centro de masa, que es constante, es:
TC.M =
1
(M + m)υ 2
2
(5.178)
De modo que si p
~ es el momento lineal relativo, las energı́as cinéticas están conectadas por:
TL =
p~2
P~ 2
+
= TC.M + Tc
2(M + m) 2µ
(5.179)
o sea que en la región asintótica (r → ∞):
TL = EL ;
EC.M = TC.M =
µ
EL ;
M
EL =
m
EC
µ
(5.180)
El momento lineal total anterior a la colisión (r → ∞), es igual al momento lineal
total después de la colisión (r → ∞). Usaremos primas para denotar las cantidades en
la región asintótica después de la colisión. En el centro de masa el momento lineal total
es cero, de modo que:
~C = 0 ;
m~υC + M V
′
~′ =0
m~υC
+ MV
C
(5.181)
La ecuación de la conservación de la energı́a total en el centro de masa es:
1
1 ~2
1
1 ~ ′2
2
′2
m~υC
+ MV
υC
+ MV
C = m~
C
2
2
2
2
La fórmula (5.182) se puede escribir, usando (5.181), en la forma:
m ′
m ′
′
· ~υC
+
~υC = ~υC
~υ
~υC · ~υC +
M
M C
(5.182)
(5.183)
Se sigue entonces que:
2
′2
υC
= υC
;
VC2 = VC′2 ;
′
mυC = mυC
= M VC = M VC′
(5.184)
es decir, las magnitudes de los cuatro momentos lineales, incidentes y emergentes, son
iguales, de modo que en el centro de masa cada partı́cula queda después de la colisión
con la misma energı́a inicial.6 En el proceso de colisión no interviene el ángulo φ, porque
con fuerzas centrales el movimiento ocurre en un plano (véase figura 5.23). Analicemos
ahora la relación entre los ángulos de dispersión θL y θC . La relación de las velocidades
de centro de masa y laboratorio es:
′
′
~υL
= ~υC
+ ~υ ;
6 Se
V~L′ = V~C′ + ~υ
(5.185)
ve que la partı́cula µ no coincide con m cuando se toma el origen de ~
r en el centro de masa.
Como sólo interesa θC , es irrelevante saber dónde está el origen de ~
r.
Movimiento de dos partı́culas que interactúan ... / 163
v2′
m
Vc′
m
r
Θc
Θ2
v
vc
v
r
C.M.
Centro de mesa
M
C.M.
vc
v=0
Laboratorio
v2′
vc′
Figura 5.23 Sistemas laboratorio y centro de masa
Sabemos que:
υC =
~
M~
~BC
p
=
υ;
m
m
~C ′ = p~BC = −~υ
V
M
(5.186)
′
Como υC
= υC y VC′ = VC , la ecuación (5.186) nos dice que:
′
υC
=
M
υ;
m
VC′ = −υ
(5.187)
′
′
O sea que si M > m entonces υC
> υ = VC′ y si M < m, entonces υC
< υ = VC′ .
Podemos distinguir dos casos, M > m y M < m. Si m > M , de acuerdo con las figuras
5.24 y 5.25, θL es máximo cuando ~υC ′ es perpendicular a ~υL ′ , luego:
senθLmax =
′
M
υC
=
υ
m
(5.188)
o sea que hay una región angular en el laboratorio que está prohibida cuando m > M .
Si m < M , todos los valores de θL son posibles. La relación entre θC y θL es común para
los casos m > M y m < M . Dicha relación se obtiene a partir de:
υL senθL = υC senθC ;
υL cos θL = υ + υC cos θC
(5.189)
Se sigue entonces que:
tan θL =
senθC
;
cos θC + γ
γ=
m
M
(5.190)
Vemos que si m ≪ M , entonces θL ≃ θC . Si m ≃ M y γ ≃ 1, entonces θL ≃
(1/2)θC .
Hallemos ahora la relación entre las secciones eficaces diferenciales σL (θL ) y σc (θc ).
La sección eficaz dσ es invariante por ser perpendicular a la dirección del movimiento
del proyectil en los dos sistemas de referencia:
dσC = dσL
(5.191)
164 / Mecánica clásica avanzada
v ′L
vi′C
ΘL
ΘC
v
γ>1
Figura 5.24 Relación entre los ángulos de dispersión θC y θL con γ > 1
v ′L
ΘL
vi′C
ΘC
v
γ<1
Figura 5.25 Relación entre los ángulos de dispersión θC y θL con γ < 1
de (5.159) se sigue entonces que:
σC (θC )dΩC = σL (θC )dΩL ;
σL (θL ) = σC (θC )
d(cos θC )
d(cos θL )
(5.192)
Movimiento de dos partı́culas que interactúan ... / 165
Para hallar el factor en (5.192), notemos que de (5.190) se sigue:
tan θC =
senθL
cos θL −
γ
1+γ
(5.193)
Entonces usamos:
d(cos θC )
d(cos θC )
d(tan θC )
=
=
d(cos θL )
d(tan θC )
d(cos θL )
Para obtener finalmente:7
2
p
2 sen2 θ + γ cos θ
1
−
γ
L
L
d(cos θC )
p
= fγ (θL ) =
d(cos θL )
1 − γ 2 sen2 θL
(5.194)
(5.195)
La fórmula σL (θL ) = fγ (θL )σC (θC ) da la conexión entre los cálculos teóricos,
centro de masa, y las medidas experimentales, laboratorio. Si γ = 1, vemos que f1 (θL ) =
4 cos θL , y si γ = 0, f0 (θL ) = 1.
Ejemplo 5.4.2 Hallar la sección eficaz diferencial de dispersión en el laboratorio para la
colisión de dos esferas duras de masas m y M , y radios b y a respectivamente.
En el centro de masa la dispersión es como en la figura 5.20, de modo que:
σC (θC ) =
1
(a + b)2
4
(5.196)
El resultado se obtiene usando la siguiente consideración: el problema es como si
reemplazáramos la esfera de masa m por una de masa µ, y la esfera de masa M por una
de masa infinita. Como la interacción es la misma, entonces el radio de la esfera de masa
µ debe ser b y el de la esfera de masa infinita debe ser a.
Como la ecuación (5.164) no depende del valor de la masa, se sigue el resultado
(5.196). En el sistema de referencia de laboratorio la sección eficaz diferencial es:
σL (θL ) =
1
(a + b)2 fγ (θL )
4
(5.197)
La sección eficaz diferencial en el centro de masa es isotrópica, en tanto que en
el laboratorio sı́ habrá una dependencia angular. En virtud del resultado (5.188), la
función fγ (θL ) debe definirse idénticamente igual a cero para ángulos θL mayores que
θL máximo, cuando γ > 1.
Ejemplo 5.4.3 Hallar la sección eficaz diferencial de Rutherford en el laboratorio cuando
la masa de la carga ze es finita.
7 Ver
la demostración en el texto Classical dynamics of particles and systems de Marion, 2a ed.,
¯
sección 9.4.
166 / Mecánica clásica avanzada
En el centro de masa σC (θC ) está dada por (5.173):
2
k
θC
σC (θC ) =
csc4
;
k = −zz ′ e2
4E
2
En el laboratorio será:

σL (θL ) =
k
4E
2 

1 +

cos θL −
γ
1+γ
sen2 θL
2 −2




fγ (θL )
(5.198)
(5.199)
o sea que la dependencia angular en el laboratorio es mucho más complicada que en el
centro de masa. Cuando γ = 1 sin embargo, los resultados son simples debido a que
θC = 2θL y f1 (θL ) = 4 cos θL :
2
cos θL
k
;
γ=1
(5.200)
σL (θL ) =
2E
sen4 θL
6
Pequeñas oscilaciones de sistemas
de varios grados de libertad
En vez de exponer el formalismo general, resolveremos en detalle algunos problemas
que ilustran los aspectos principales del mismo. Veremos que las fórmulas que se obtienen
en forma de matrices se generalizan fácilmente. Al respecto, el lector puede ver los
correspondientes capı́tulos en los textos de Goldstein, Hauser, Marion, Gantmacher,
entre otros, donde además se explica en qué consiste la “pequeñez” de las oscilaciones.
6.1.
Modos normales de oscilación. Caso
no degenerado
La molécula triatómica lineal. Oscilaciones longitudinales. La molécula
triatómica lineal consta de dos átomos de masa m y uno de masa M , ligados entre
sı́ por fuerzas interatómicas de modo que en la configuración de equilibrio la molécula
es lineal, y al oscilar se conserva la forma lineal (véase figura 6.1). Supondremos que las
interacciones más importantes se presentan entre los átomos 1 y 2, y 2 y 3; más adelante
incluiremos una interacción un poco más general. La energı́a potencial de interacción
entre dos átomos puede variar como un pozo de potencial, a grandes distancias es atractiva y a pequeñas distancias es repulsiva, con un mı́nimo en una distancia dada. Nos
interesaremos en los movimientos que consisten en pequeñas oscilaciones alrededor de la
posición en que la energı́a potencial tiene un mı́nimo, que es una posición de equilibrio
estable.
m
M
m
x1
x2
x3
Figura 6.1 Molécula triatómica lineal
167
168 / Mecánica clásica avanzada
Para estos movimientos se cumple: (a) La energı́a potencial es del tipo de un “resorte” con pequeñas elongaciones; (b) La energı́a cinética no depende de la posición, o
sea, es función cuadrática homogénea de las velocidades, con coeficientes que no dependen de la posición. Ver la discusión detallada de lo anterior, por ejemplo en Gantmacher,
numeral 40.
El número de grados de libertad necesarios para especificar las oscilaciones longitudinales es 3 − 1 = 2 descontando la traslación del centro de masa. La longitud del “resorte”
que une los átomos 1 y 2 es x2 − x1 . Supondremos que en la posición de equilibrio la
longitud de este “resorte” es b, o sea que x20 − x10 = b, siendo xi0 la coordenada de la
partı́cula i en la configuración de equilibrio. La elongación del resorte 1−2 será entonces:
(x2 − x1 ) − b = (x2 − x20 ) − (x1 − x10 )
(6.1)
ηi = xi − xi0
(6.2)
Si llamamos a η1 , η2 y η3 la cantidad en que se separa cada átomo de su posición
de equilibrio:
podemos escribir las elongaciones de los resortes 1 − 2 y 2 − 3 como:
η2 − η1
y
η3 − η2
(6.3)
de modo que la energı́a potencial para pequeñas oscilaciones será:
1
1
k(η2 − η1 )2 + (η3 − η2 )2
V =
2
2
(6.4)
1
2
2
2
k(η1 + 2η2 + η3 − 2η1 η2 − 2η2 η3 )
2
donde k es la “constante de resorte”, cuyo valor depende de factores que no entraremos a
considerar aquı́, pero que supondremos conocido. En (6.4) no se incluye interacción entre
los átomos 1 y 3. Las coordenadas η1 , η2 , η3 , no son todas vibracionales pues sabemos
que las vibraciones longitudinales requieren sólo dos coordenadas. V puede escribirse en
la forma:
3
1 X
kij ηi ηj
(6.5)
V =
2 i,j=1
donde kij son los elementos de la matriz 3 × 3, k̃:


1 −1 0





−1
2
−1
k̃ = k 




0 −1 1
(6.6)
k̃ es una matriz simétrica, kij = kji . La energı́a cinética es:
1
1
1
mẋ21 + M ẋ22 + mẋ23
T =
2
2
2
=
3
1 X
mij η̇i η̇j
2 i,j=1
(6.7)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 169
donde mij son los elementos de la matriz 3 × 3, m̃, que es diagonal y por lo tanto
simétrica:


m 0 0





m̃ =  0 M 0 
(6.8)



0 0 m
El lagrangiano del problema es:
L=
3
1 X
(mij η̇i η̇j − kij ηi ηj )
2 i,j=1
(6.9)
Para hallar las ecuaciones de Lagrange se requiere conocer las derivadas parciales
de L respecto a ηi y η̇i . Para ello evaluemos a dL:
dL =
3
1 X
(mij dη̇i η̇j + mij η̇i dη̇j − kij dηi ηj + kij ηi dηj )
2 i,j=1
(6.10)
usando la simetrı́a de k̃ y m̃, un cambio adecuado de los ı́ndices mudos de la suma
permite escribir,





3
3
3
X
X
X

mij η̇j  dη̇i − 
kij ηj  dηi 
(6.11)
dL =
i=1
j=1
j=1
con lo cual obtenemos:
3
3
X
X
∂L
∂L
kij ηj ;
mij η̇j ; i = 1, 2, 3
=−
=
∂ηi
∂ η̇i
j=1
j=1
(6.12)
Teniendo en cuenta que las mij son constantes, las ecuaciones de Lagrange son:
3
X
(mij η̈j + kij nj ) = 0; i = 1, 2, 3
(6.13)
j=1
Si definimos los vectores en el espacio de configuración del sistema,


 


0
η̈1
η1


 




 


¨ 


~  
η=
~
 η2  ; ~η =  η̈2  ; 0 =  0 


 


0
η̈3
η3
(6.14)
las ecuaciones de Lagrange (6.13) toman la forma condensada:
m̃~
η¨ + k̃~η = ~0
(6.15)
170 / Mecánica clásica avanzada
Veremos que (6.15) es la forma de la ecuación de movimiento para cualquier sistema
de muchos grados de libertad con pequeñas oscilaciones. El sistema que consideramos
tiene sólo oscilaciones en una dimensión; sin embargo, por tener tres grados de libertad
para los movimientos longitudinales, el espacio de configuración de tales movimientos es
tridimensional. El problema que sigue es buscar las soluciones de (6.15) que describirán
el movimiento del punto del espacio de configuración.
La ecuación para el vector ~η , (6.15), es lineal, luego la solución general puede
expresarse como una combinación lineal de las soluciones linealmente independientes.
Como el vector ~
η es tridimensional, existirán tres soluciones linealmente independientes,
en términos de las cuales puede expandirse a ~η ; tales soluciones las llamaremos ~ηα con
α = 1, 2, 3, de modo que la solución general de (6.15) será de la forma:
~η = C1 ~
η1 + C2 ~η2 + C3 ~η3
(6.16)
Como la ecuación de movimiento es de segundo orden, la solución contendrá dos
constantes de integración arbitrarias por cada grado de libertad. En total hay seis constantes de integración que son C1 , C2 , C3 , φ1 , φ2 , φ3 . Busquemos soluciones de la forma:
~ηα = ~
µα sen(ωα t + φα ); α = 1, 2, 3
(6.17)
~ α es un vector tridimensional constante y φα es una constante de integración. Las
µ
componentes de ~
µα son µα1 , µα2 , µα3 . En términos de las componentes, (6.17) será:
ηαi = µαi sen(ωα t + φα ) ;
i, α = 1, 2, 3
(6.18)
En (6.18) el ı́ndice i se refiere a los grados de libertad, en tanto que α numera
las soluciones diferentes. ωα es una constante que no debe depender de las constantes
de integración. Debido a que sen(ωα t + φα ) y sen(ωβ t + φβ ) son linealmente independientes cuando ωα 6= ωβ , las ~ηα serán linealmente independientes cuando ωα 6= ωβ . Las
soluciones de la forma (6.17) y (6.18) representan los movimientos en los cuales todas
las partı́culas oscilan con la misma frecuencia y tienen una definida relación entre sus
amplitudes de oscilación.
La pregunta que sigue es: ¿cuánto valen las ωα y cuáles son las relaciones que deben
existir entre las µαi ?. Para responderla, reemplacemos a (6.18) en (6.15):
(−ωα2 m̃ + k̃)~
µα = ~0 ,
3
X
(ωα2 mij + kij )µαj = 0;
i, α = 1, 2 , 3
(6.19)
j=1
La ecuación (6.19) es un sistema de tres ecuaciones lineales algebraicas homogéneo,
con las tres incógnitas µα1 , µα2 , µα3 , que tendrá solución para ciertos valores de ωα .
Hallar a ~
µα equivale a realizar la siguiente operación con matrices:
µα = (−ωα2 m̃ + k̃)−1~0
~
(6.20)
Vemos que ~
µα será no trivial, es decir, diferente del vector ~0 solamente si la matriz
k) es singular, o sea si su determinante es cero. Esto introduce una condición
que permite determinar las ωα :
(−ωα2 m +
det(ωα2 m̃ − k̃) = 0
(6.21)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 171
La ecuación (6.21) se llama ecuación secular o determinante secular. El término
secular proviene del latin seculum, o sea, referente a los siglos; se usa a partir de una
ecuación análoga en astronomı́a que aparece al realizar cálculos perturbativos que predicen efectos sobre las órbitas apreciables sólo en tiempos muy largos. De acuerdo con
las ecuaciones (6.6) y (6.8) se tiene que:
ωα2 m̃

mωα2 − k


− k̃ = 


k
0
k
M ωα2
k
0
k
− 2k
mωα2 − k






(6.22)
El determinante de la matriz (6.22) es:
det ωα2 m̃ − k̃ = mωα2 − k (M ωα2 − 2k)(mωα2 − k) − k 2
−k
k(mωα2
− k)
(6.23)
Por tanto la ecuación (6.21) es una ecuación algebraica de tercer grado en ωα2 , que
tendrá tres raı́ces que serán ω12 , ω22 y ω32 :
M + 2m
k
(ω 2 − 0) ω 2 − k
det ωα2 m̃ − k̃ = m2 M ω 2 −
m
Mm
(6.24)
= m2 M (ω 2 − ω22 )(ω 2 − ω12 )(ω 2 − ω32 )
En conclusión, las frecuencias con las cuales puede ocurrir la oscilación simultánea
de las tres coordenadas son:
ω12 = 0; ω22 =
k
m
k 1+2
; ω32 =
m
m
M
(6.25)
Si m ≪ M entonces ω2 ≈ ω3 presentándose una cuasidegeneración. Hay una matriz
172 / Mecánica clásica avanzada
de la forma (6.22) por cada una de las frecuencias (6.25):
ω12 m̃ − k̃ =
ω22 m̃
− k̃ =

−k
k


 k


0




 k


k
k
ω32 m̃ − k̃ =








2
0
k
m
k
M
k
k
0




k 


M − 2m
k
m
0



k 


−k
−2k
0

0
(6.26)
0
k
0
M
m
k
k
2
m
k
M









Entonces las ecuaciones (6.19), que nos dan las relaciones entre las componentes
de los vectores ~
µ1 , µ
~ 2 y ~µ3 , son:

−k


 k


0

0



 k










2
0
µ11



k 
  µ12

µ13
−k
−2k
k
0
k
k
k
0
M
m
k
k
2

µ21

µ31



µ22
k 



µ23
0
M − 2m
k
m
m
k
M
k
0
k
0

k

m
k
M





  µ32



µ33



=





=





=



0

 
 
 0 
 
 
 
 0 

0

 
 
 0 
 
 
 
 0 

0

 
 
 0 
 
 
 
 0 
(6.27)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 173
Siendo más explı́citos, respectivamente estas ecuaciones toman la forma:
µ11 = µ12 ; µ11 − 2µ12 + µ13 = 0; µ12 = µ13
µ22 = 0; µ21 + µ23 = 0; µ22 = 0
2
(6.28)
m
M
2m
µ31 + µ32 = 0; µ31 +
µ32 + µ33 = 0; µ32 +
µ33 = 0
M
m
M
Las relaciones buscadas entre los componentes de los vectores ~µα para los movimientos en que las tres partı́culas oscilan con la misma frecuencia son:
ω1 : µ11 = µ12 = µ13
ω2 : µ21 = −µ23 ; µ22 = 0
ω3 : µ31 = µ33 ; µ32 = −
(6.29)
2m
µ31
M
Cada vector µα resulta indeterminado por una constante arbitraria, aunque las
relaciones entre sus componentes están bien definidas:1


 


1
1
1


 




 


 2m 




(6.30)
µ1 = µ11  1  ; ~
~
µ2 = µ21  0  ; ~µ3 = µ31  −


M 
 




1
−1
1
Notamos que ~
µ1 , ~
µ2 y ~
µ3 no son ortogonales, puesto que: ~µ1 · ~µ2 = 0; ~µ1 · ~µ3 =
2µ11 µ31 (1 − m/M ); ~
µ2 · ~
µ3 = 0. Es deseable, sin embargo, trabajar con vectores ortogonales. Los vectores siguientes son ortogonales:
 √ 

 √
m
m




 √



1/2
1/2



m̃ ~
µ1 = µ11  M  ; m̃ ~µ2 = µ21  0 





√
√
− m
m
 √
m

 −2m

m̃1/2 µ
~ 3 = µ31  √

M

√
m

(6.31)






1 Las trayectorias descritas en el espacio de configuración son rectilı́neas. ~
η1 corresponde a una lı́nea
infinita, describe una translación no acotada a lo largo del vector ~
µ1 . ~
η2 y ~
η3 describen oscilaciones
sobre segmentos rectos finitos a lo largo de los vectores ~
µ2 y ~
µ3 respectivamente.
174 / Mecánica clásica avanzada
En vez de trabajar con estos vectores, es cómodo quedarse con los vectores (6.30),
pero cambiando la definición del producto escalar. Definiremos el producto escalar de
dos vectores ~
µ y ~ν ası́:
(~
µ, ~ν ) = (m̃1/2 ~µ).(m̃1/2 ~ν ) = ~µ.(m̃~ν ) =
3
X
mij µi νj
(6.32)
i,j=1
Podemos ahora escoger las constantes arbitrarias µ11 , µ21 y µ31 de modo que los
vectores ~
µα formen una trı́ada ortonormal bajo el producto escalar (6.32), es decir,
normalizar los vectores a la unidad: (~µα , ~να ) = 1; α = 1, 2, 3. Este procedimiento nos
conduce inmediatamente a:


 
1
1


 

 
1
1 



0 
1 ;
µ1 = √
~
~µ2 = √



2m + M  
2m 

−1
1

1





 −2m 
µ3 = r
~


m  M 

2m(1 + 2 ) 
M
1
1
(6.33)
La definición (6.32) se hace por comodidad matemática, pero nos aleja un poco
del sentido fı́sico original. La exigencia de ortonormalidad nos conduce a vectores que
no tienen dimensiones de desplazamiento y a soluciones que no dependen de las condiciones iniciales: contienen información sobre la relación de amplitudes pero no de su
valor absoluto. Por esto se les llama “modos normales de oscilación”. Se dice que los
movimientos longitudinales de la molécula triatómica lineal son no degenerados porque
las frecuencias de los tres modos normales son diferentes; en otras palabras, no hay dos
modos normales diferentes con la misma frecuencia.
La frecuencia w1 , que es nula, no corresponde a una oscilación. Esto es consistente
con la forma del vector propio correspondiente: las tres partı́culas se desplazan la misma
cantidad en todo momento, o sea que la molécula se traslada. En sentido estricto sólo
µ2,3 son modos normales de oscilación, de acuerdo con lo dicho anteriormente acerca de
~
que sólo hay dos coordenadas vibracionales longitudinales. En el modo ~µ2 la partı́cula 2
se queda quieta y las partı́culas 1 y 3 oscilan en contrafase. En el modo ~µ3 las partı́culas
1 y 3 oscilan en fase, pero la partı́cula 2 se desplaza respecto a 1 − 3 una cantidad que
depende de las masas y es en sentido opuesto. En el modo ~µ2 cada “resorte” actúa
p independientemente sobre una masa m; por esto la frecuencia correspondiente vale k/m.
Si se quiere indicar la magnitud de las oscilaciones es conveniente definir otras soluciones, llamadas “coordenadas normales”, que, veremos, representan otro conjunto de
coordenadas generalizadas independientes para describir el estado del sistema y contienen información sobre las condiciones iniciales.
Pequeñas oscilaciones de sistemas de varios grados de libertad / 175
Coordenadas normales para la molécula triatómica lineal. Las ecuaciones
de movimiento (6.13) son tres ecuaciones diferenciales de segundo orden acopladas. La
solución (6.18) fue obtenida por “tanteo”. Un método directo de solución consiste en
realizar una transformación de coordenadas donde las nuevas ecuaciones de movimiento
resulten desacopladas.
El lagrangiano (6.9) puede escribirse en forma compacta usando la notación matricial. Si ~η es un vector columna, ~η T es un vector fila:
L=
1 ˙T ˙ 1 T
η
η m̃~
~
η − ~η k̃~
2
2
(6.34)
L es una forma cuadrática no diagonal en η̇i y en ηi pues la matriz k̃ es no diagonal.
Esto conduce a que las ecuaciones de movimiento sean acopladas. Si se realiza una transformación lineal de coordenadas que diagonalice a L, las correspondientes ecuaciones de
movimiento serán no acopladas, pues en ese caso L consta de una suma de términos
que dependen de sólo una de las coordenadas. Llamemos ~θ a las nuevas coordenadas
generalizadas y ÃT la matriz de la transformación:
η = ÃT ~
~
θ
(6.35)
donde ÃT es la matriz transpuesta de Ã. En las nuevas variables L toma la forma:
L=
1 ~˙ T
˙
θ Ãm̃ÃT θ~ −
2
1 ~T
θ Ãk̃ ÃT ~θ
2
(6.36)
Ahora exigimos que à sea tal que m̃′ = Ãk̃ÃT y k̃ ′ = Ãm̃ÃT sean ambas diagona′
les, es decir, tales que m′ij = m′i δij y kij
= ki′ δij para i, j = 1, 2, 3 de modo que (6.36)
queda ası́:
3
1X ′ 2
(m θ̇ − kα′ θα2 )
L=
2 α=1 α α
(6.37)
La ecuación de movimiento (6.37), será ahora:
m′α θ̇α2 − kα′ θα2 = 0
(6.38)
Las soluciones para las nuevas coordenadas, en función de las constantes de integración Cα y φα , serán:
s
!
kα′
(6.39)
t + φα kα′ θα2 = 0; α = 1, 2, 3
θα = Cα sen
m′α
De (6.35) y (6.39) se sigue que:
s
!
3
X
kα′
ηi =
Aαi Cα sen
t + φα ; i = 1, 2, 3
m′α
α=1
(6.40)
Las coordenadas θα con α = 1, 2, 3, se llaman las coordenadas normales del sistema. El problema matemático ahora consiste en hallar las nueve componentes de la
176 / Mecánica clásica avanzada
matriz Ã, que se obtienen resolviendo para las Aαi las ecuaciones que resultan de las
condiciones:
(Ãm̃ÃT )ij = m′i δij ; (Ãk̃ ÃT )ij = ki′ δij
(6.41)
A partir de (6.16) y (6.17) vemos que ~ηi toma la forma:
ηi =
3
X
Cα µαi sen(ωα + φα )
(6.42)
α=1
Las expresiones (6.40) y (6.42) coinciden si se cumple que:
kα′
; i, α = 1, 2, 3
(6.43)
m′α
Llegamos a la conclusión de que los vectores propios, o modos normales de oscilacion ~
µα , son las filas de la matriz Ã, o sea las columnas de la matriz ÃT que realiza la
transformación de ~η a θ~ según (6.35). Como los vectores ~µα son ortogonales y ortonormales según el producto escalar (6.32):
Aαi = µαi
y
ωα2 =
(µα , µβ ) = δαβ ;
α, β = 1, 2, 3
(6.44)
Podemos escribir (6.44) también en la forma:
~ Tα m̃~µβ = δαβ ;
µ
α, β = 1, 2, 3
(6.45)
Explı́citamente (6.45) es:
3
X
mij µαi µβj = δαβ ;
α, β = 1, 2, 3
(6.46)
i,j=1
Notamos la identidad entre las filas de à y los vectores ~µTα , y por lo tanto podemos
escribir a (6.46) como:
Ãm̃ÃT = I˜
(6.47)
donde I˜ es la matriz unidad 3 × 3, o sea que m′i = 1 para i = 1, 2, 3. Entonces las
condiciones que nos definen las frecuencias ωα2 y la matriz à son de (6.41), (6.43) y
(6.47):
(Ãm̃ÃT )ij = δij ; (Ãk̃ ÃT )ij = ωi2 δij ; i, j = 1, 2, 3
T
ωα2
(6.48)
Las columnas de à son los vectores ~µα y las
son los elementos diagonales de la
matriz k̃ ′ = Ãk̃ÃT . La ecuación (6.47) es la condición de que la matriz à sea ortogonal,
o sea que preserve el producto escalar (6.32) en una transformación de coordenadas
generalizadas. Explı́citamente la matriz ÃT es:

 −1/2
−1/2
M
2m
1
1+

 1 + 2m
M




 −1/2
−1/2 


1 

M
2m
2m
(6.49)
ÃT = √

 1+
1+
0 −

2m 
2m
M
2M





 −1/2
−1/2


2m
M
−1
1+
1+
2m
M
Pequeñas oscilaciones de sistemas de varios grados de libertad / 177
y la matriz k̃ ′ es:

0



 0
′
k̃ = 



0
0
0





0



k
2m 
1+
m
M
k
m
0
(6.50)
No es exacto que la coordenada normal correspondiente a ω1 = 0 sea de la forma
(6.39). En efecto, para esta frecuencia la ecuación de movimiento es:
θ̈1 = 0
(6.51)
cuya solución es:
θ1 = At + B
(6.52)
donde A y B son constantes de integración, aunque podrı́a llegarse a (6.52) de (6.39)
mediante una expansión en serie de Maclaurin alrededor de ω1 = 0. Las otras dos
coordenadas normales son:
θα = Cα sen(ωα t + φα ) ; α = 2, 3
(6.53)
donde Cα y φα se determinan de las condiciones iniciales. Las ecuaciones (6.52) y (6.53)
nos permiten expresar los desplazamientos generales de las partı́culas, usando (6.35) y
(6.49):


η2 =
t + φ3 ) 
1 

 rAt + B + C2 sen(ω2 t + φ2 ) + C3 sen(ω
√
r 3


2m
2m
M
1+
1+
M
2m


η3 =

η1 =
t + φ3 ) 
1 
 rAt + B − 2m C3 sen(ω

√
r 3


M
2m
2m
M
1+
1+
M
2m

(6.54)
1 
t + φ3 ) 
 rAt + B − C2 sen(ω2 t + φ2 ) + C3 sen(ω

√
r 3


2m
2m
M
1+
1+
M
2m
Esto nos dice que el movimiento más general de las partı́culas consiste en una
traslación uniforme y en una superposición de oscilaciones de frecuencias ω2 y ω3 . La
oscilación de la partı́cula 2 es de frecuencia ω2 en tanto que las oscilaciones de las
178 / Mecánica clásica avanzada
partı́culas 1 y 3 se caracterizan por una diferencia de fase de π en la componente de
frecuencia ω2 .2
Las constantes A, B, C2 , C3 , φ2 y φ3 se pueden expresar en términos de los valores
en t = 0 de η1 , η2 , η3 , η̇1 , η̇2 y η̇3 a través de las fórmulas:
˙
~
θ = (AT )−1 ~
η ; θ~ = Ãm̃~η ; ~θ = Ãm̃~η˙
(6.55)
La matriz Ãm̃ explı́citamente es:
 −1/2
−1/2
M
m −1/2
M
M 1+
m 1+
 m 1+

2m
2m
2M


1 
m
0
−m
Ãm̃ = √

2m 

 −1/2
−1/2
−1/2

2m
2m
2m
m 1+
−2m 1+
m 1+
M
M
M
˙
En tanto que θ~ y θ~ en t = 0 son:



B
A




 ˙ 
 ~ 
θ~ = 
 C2 senφ2  θ =  ω2 C2 cos φ2



C3 senφ3
ω3 C3 cos φ3

















(6.56)
(6.57)
Los modos normales de oscilación no son entonces más que casos particulares de
la solución general (6.54) en que sólo contribuye una de las componentes normales.
Ası́ por ejemplo, el “modo 1” se obtiene haciendo C1 = C3 = 0. La transformación
a coordenadas normales puede interpretarse como la correspondencia con un sistema
equivalente que consiste en un conjunto de osciladores armónicos lineales no acoplados.
La descomposición en modos normales es muy útil en otras ramas de la fı́sica como
la teorı́a de campos, la cual tendremos ocasión de estudiar con un campo mecánico
unidimensional. Los modos normales para la molécula triatómica lineal en oscilaciones
longitudinales los podemos representar gráficamente (véase figura 6.2).
Generalización del formalismo anterior. Si se tiene un conjunto de osciladores
acoplados con pequeñas oscilaciones, de l grados de libertad oscilatorios, con frecuencias
no degeneradas, podemos fácilmente generalizar el anterior formalismo. No es difı́cil ver
que en general la matriz m̃ es simétrica, aunque no necesariamente diagonal. k̃ también
es simétrica. De esto se deducen importantes propiedades de los vectores propios y
frecuencias propias. Las matrices m̃ y k̃ son de dimensión l × l y los vectores del espacio
de configuración son de l componentes. La ecuación (6.19) puede escribirse en cualquiera
de las formas siguientes:
µα = ωα2 ~µα
(m̃−1 k̃)~
~ α ) = ωα2 (m̃1/2 ~µα )
ó (m̃1/2 k̃m̃−1/2 )(m̃1/2 µ
(6.58)
2 El vector η
~ con componentes (6.54) describe el movimiento de un punto del espacio de configuración.
En el plano formado por µ
~2 y ~
µ3 , la proyección del movimiento da una figura de Lissajous. O sea que
la trayectoria de configuración se obtiene al desplazar dicha proyección a lo largo de ~
µ1 . Por ejemplo, si
m ≪ M , la trayectoria será una hélice elı́ptica alrededor de µ1 .
Pequeñas oscilaciones de sistemas de varios grados de libertad / 179
1
2
3
ω1 = 0
x
Traslación: η1 = η2 = η3
ω2 =
ω3 =
m
√m ( 1 + M (
k
ns
√k
x
Vibración simétrica: η1= –η3 , η2 = 0
2m
x
Vibración asimétrica: η1 = η3 , η2 = –2m/M η1
Figura 6.2 Modos normales para la molécula triatómica lineal en oscilaciones longitudinales
Con la primera forma podemos definir el producto escalar en términos del “tensor
métrico” de cierto espacio Riemanniano, mij :
~ ~η ) =
(ζ,
l
X
mij ζi ηj
(6.59)
i,j=1
La ecuación (6.58) tiene la forma de una ecuación de valores propios y vectores
propios de una matriz simétrica. En efecto, m̃−1 k̃ es el producto de matrices simétricas
que, según es fácil mostrar, da una matriz simétrica. Entonces se cumplen los siguientes teoremas del algebra lineal: (a) los valores propios, ωα2 , de m̃−1 k̃ son reales y (b)
los vectores propios, ~
µα , correspondientes a valores propios diferentes son ortogonales y
linealmente independientes. La ecuación correspondiente a la (6.16) representa la expansión de un estado arbitrario de oscilación en un conjunto completo de vectores propios
de la matriz m̃−1 k̃. La prueba de la ortogonalidad de los vectores propios es simple.
Escribamos las ecuaciones de valores propios para ωα2 y ωβ2 :
µα = ωα2 ~
µα ;
(m̃−1 k̃)~
(m̃−1 k̃)~µβ = ωβ2 ~µβ
(6.60)
Tomemos el producto escalar de la primera por ~µβ y de la segunda por µ
~ α:
(~
µβ , m−1 k̃~
µα ) = ωα2 (~
µβ , ~µα )
(6.61)
µβ , ~µα )
µβ , ~
µα ) = ωβ2 (~
(m−1 k̃~
180 / Mecánica clásica avanzada
Como m̃−1 k̃ es simétrica, los lados izquierdos en (6.61) son iguales. En efecto:
l
l
X
X
µα ) =
(~
µβ , m̃−1 k̃~
µβi mij krs µαs (m̃)−1
jr
i,j=1 r,s=1
l
X
=
µβr krs µαs =
r,s=1
krs µβr µαs
r,s=1
l
l
X
X
(m̃−1 k̃~
µβ , ~
µα ) =
l
X
(6.62)
(m̃)−1
ir krs µβs mij µαj
i,j=r r,s=1
l
X
=
krs µβs µαr =
r,s=1
l
X
ksr µβr µαs
r,s=1
Entonces se sigue que:
(ωα2 − ωβ2 )(~
µβ , ~µα ) = 0
(6.63)
Si ωα2 6= ωβ2 entonces ~µα y ~µβ son ortogonales. Si α = β, (~µα , ~µα ) tiene algún valor
que tomamos igual a 1, entonces,
(~
µα , ~
µβ ) = δα,β
α , β = 1, 2, l
(6.64)
Ahora, si definimos con las componentes de las µα una matriz à de dimensión l × l:
Aαi = µαi ; α, i = 1, 2, ...l
(6.65)
Entonces la ecuación (6.64) no es más que la condición de ortogonalidad de à en
el espacio riemanniano de configuración:
Ãm̃ÃT = I˜
(6.66)
La ortogonalidad ordinaria de una matriz es ÃÃT o Ã−1 = ÃT . La ecuación de
valores propios k̃~
µα = ωα2 m̃~
µα puede escribirse en términos de la matriz diagonal ω̃, con
2
elementos ωα , ωαβ = ωα2 δαβ de la siguiente forma:
Ãk̃ = ω̃Ãm̃
(6.67)
Si multiplicamos por ÃT y usamos la ortogonalidad de Ã, (6.67) toma la forma:
Ãk̃ ÃT = ω̃
(6.68)
vemos que la matriz à realiza sobre k̃ una transformación que la diagonaliza, siendo las
frecuencias propias los elementos diagonales. Las expresiones (6.66) y (6.68) nos dicen
que à diagonaliza simultáneamente a m̃ y a k̃. m̃ es el tensor métrico en el espacio de
configuración. Podemos entonces interpretar a à como la matriz de una transformación
lineal en el espacio de configuración que nos hace pasar de unos ejes oblicuos, ηi , (con m̃
Pequeñas oscilaciones de sistemas de varios grados de libertad / 181
no diagonal; el producto escalar, en particular el lagrangiano, contiene productos cruza˜
dos de las componentes de los vectores) a unos ejes cartesianos ortogonales, θα (m̃ = I,
de ahı́ que el lagrangiano en coordenadas normales tenga términos independientes entre
sı́). Estos nuevos ejes son los ejes principales de k̃ porque mediante Ã, k̃ se transforma
en ω̃ que es diagonal.
Las coordenadas normales son un sistema de “ejes principales” en el espacio de
configuración donde m̃ y k̃ son ambas diagonales.3 Esto tiene como consecuencia que las
ecuaciones de movimiento de las coordenadas normales sean desacopladas: θ̈α +ωα2 θα = 0;
α = 1, 2, ...l.
6.2.
Modos normales de oscilación. Caso
degenerado
Las oscilaciones transversales de la molécula del tipo “CO2 ” no se pueden considerar con un modelo de “resortes”, pues con tal modelo estas oscilaciones son intrı́nsecamente no lineales. La demostración de esto se propone como ejercicio. Como el potencial
tiene un mı́nimo en la posición de equilibrio aun para desplazamientos transversales, es
válida una aproximación por un potencial parabólico, aunque la constante k no será la
misma que en las oscilaciones longitudinales. Otro aspecto de las oscilaciones transversales es la degeneración de los modos normales que a continuación analizamos cualitativamente.
Para especificar completamente la molécula, constituida a partir de tres partı́culas
puntuales, se requieren nueve coordenadas. Hay un grado de libertad correspondiente a
traslaciones a lo largo de la molécula (el modo ~µ1 analizado anteriormente) y dos grados
de libertad traslacionales en direcciones perpendiculares al eje de la molécula. Además,
para una posición dada del centro de masa, hay dos rotaciones alrededor de él, pues
no tiene sentido una rotación alrededor del eje de la molécula. En total, pues, hay tres
grados de libertad traslacionales y dos rotacionales, quedando cuatro grados de libertad
vibracionales (dos longitudinales y dos transversales).
La simetrı́a de rotación alrededor de la molécula implica que la constante k es la
misma para cualquier desplazamiento transversal y como hay dos modos de oscilación
transversales, éstos tendrán la misma frecuencia, es decir, la frecuencia de las oscilaciones
transversales es degenerada. Los dos modos los podemos llamar modo “z” y modo “y”,
como se representan en la figura 6.3.
y
y
x
z
Modo y
x
z
Modo z
Figura 6.3 Modos de oscilación transversales.
3 En
efecto, las filas de à determinan los vectores unitarios de los “ejes principales”, o sea los ~
µα .
182 / Mecánica clásica avanzada
Un movimiento transversal arbitrario será una combinación de los modos “y” y
“z”. Si las dos oscilaciones están en fase, el movimiento será lineal; si no, el movimiento
será elı́ptico. Si la diferencia de fase es de 900 las partı́culas se moverán en trayectorias
circulares, como se ve en la figura 6.4.
Al aplicar el formalismo general al problema completo de la molécula del tipo
“CO2 ”, se encuentra una ecuación secular de grado nueve en ω 2 pero a priori esperamos que los cinco grados de libertad no vibracionales den lugar a modos normales con
frecuencia ω 2 = 0, que los dos grados de libertad oscilatorios longitudinales tengan dos
frecuencias diferentes, y que los dos grados de libertad oscilatorios transversales den
lugar a modos normales con frecuencia doble. Es decir, el problema completo tedrá una
frecuencia quı́ntuple nula, dos frecuencias simples y una frecuencia doble; en total cuatro
raı́ces diferentes.
y
En fase: oscilaciones lineales
y
En desfase: rotaciones
x
z
x
z
Figura 6.4 Modos normales de oscilación: dos frecuencias simples y una frecuancia doble.
La molécula triatómica lineal. Oscilaciones longitudinales y transversales. Consideraremos sólo el problema de hallar los modos normales de oscilación, ya que
los modos traslacionales y rotacionales permiten un tratamiento trivial. Las coordenadas vibracionales se llaman coordenadas internas. Si imponemos la condición de que el
centro de masa esté fijo y no haya rotaciones netas de la molécula, quedarán solamente
las coordenadas internas. El cálculo lo realizaremos en tres dimensiones. ~ri es el vector
de posición de la partı́cula i = 1, 2, 3 y ~ri0 el de la posición de equilibrio. La separación
de la posición de equilibrio es para la partı́cula i es:
d~i = ~ri − ~ri0 ; i = 1, 2, 3
(6.69)
~ 0 = m~r10 + M~r20 + m~r30
~ = m~r1 + M~r2 + m~r3 = R
R
2m + M
2m + M
(6.70)
d~i y ~ri son vectores ordinarios tridimensionales; no son vectores del espacio de configu~ y la consideraremos fija, es decir:
ración. La coordenada del centro de masa es R
Se sigue entonces que las componentes de los d~i no son independientes sino que
están sometidos a las condiciones:
md~1 + M d~2 + md~3 = 0
(6.71)
La condición sobre la no rotación de la molécula alrededor del centro de masa es
que el momento angular total sea cero:
~ = m~r1 × ~r˙ 1 + M~r2 × ~r˙ 2 + m~r3 × ~r˙ 3
L
˙
˙
˙
= m(~r10 + d~1 ) × d~1 + M (~r20 + d~2 ) × d~2 + m(~r30 + d~3 ) × d~3 = 0
(6.72)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 183
Las coordenadas de la posición de equilibrio son, tomando el origen de coordenadas
en la posición de la partı́cula 2: ~r10 = −bî; ~r20 = 0; ~r30 = bî. Por lo tanto la ecuación
(6.72) es:
~ = mbî × (d~˙ 3 − d~˙ 1 ) + m(d~1 × d~˙ 1 + d~3 × d~˙ 3 ) + M d~2 × d~˙ 2 = 0
L
(6.73)
para pequeñas oscilaciones se cumple que di ≪ b, lo cual nos permite escribir en vez de
(6.73):
˙
˙
î × (d~3 − d~1 ) = 0
(6.74)
o más explı́citamente:
d˙3y = d˙1y ; d˙3z = d˙1z
(6.75)
Integrando (6.75) obtenemos: d3y = d1y + Constante; d3z = d1z + Constante; las
constantes deben anularse porque estas ecuaciones se deben cumplir aun en la posición
de equilibrio:
d3y = d1y ; d3z = d1z
(6.76)
La condición (6.71) vale también para las velocidades, de donde:
m
m ˙
˙
˙
d~2 = − (d~1 + d~3 ) ; d~2 = − (d~1 + d~3 )
M
M
(6.77)
En conclusión, existen las siguientes cinco relaciones entre los nueve desplazamientos, lo cual nos deja con 9 − 5 = 4 grados de libertad internos:
d1y = d3y ;
d2y = −
2m
d1y ;
M
d2x = −
m
(d1x + d3x )
M
d1z = d3z
d2z = −
2m
d1z
M
(6.78)
Existen además cinco relaciones similares a (6.78) para las velocidades de los desplazamientos. Tomaremos como coordenadas generalizadas independientes vibracionales
a d1x , d3x , d1y , d1z , y las llamaremos η1 , η2 , η3 y η4 :
η1 = d1x , η2 = d3x , η3 = d1y , η4 = d1z
(6.79)
Los otros cinco desplazamientos pueden expresarse en términos de los desplazamientos internos por medio de las relaciones (6.78).
El espacio de configuración del sistema completo es 9-dimensional. El subespacio correspondiente a las oscilaciones puras es 4-dimensional. El vector del espacio de
configuración que describe los movimientos de la molécula en que el centro de masa
permanece fijo y no hay rotación de la misma es ~η . También:
η~T = (η1 , η2 , η3 , η4 )
(6.80)
184 / Mecánica clásica avanzada
Ahora debemos expresar el lagrangiano en función de ~η y ~η˙ . La energı́a cinética es:
2
1
1 ˙2
˙2
˙
~
~
T =
m d1 + d3 + M d~2
2
2
(6.81)
m2 2
1 ˙2
˙ ~˙
˙2
˙
2
2
2
~
~
~
˙
˙
d1 + d3 + 2d1 · d3
m d1x + d3x + 2ḋ1y + 2d1z +
=
2
2M
Si usamos (6.78) y (6.79) para expresar todos los d~i en función de los η̇ν , ν =
1, 2, 3, 4 obtenemos para T (~η˙ ):
m2
1 2m
m 2
T = m 1+
η̇1 + η̇22 + m 1 +
η̇32 + η̇42 +
η̇1 η̇2
(6.82)
2
M
M
M
puede escribirse ası́ con notación matricial:
1 ˙T ˙
η m̃~
~
η
2
o usando la notación de producto escalar:
T =
1 ˙ ˙
(~
η , ~η )
2
donde m̃ es la matriz simétrica no diagonal siguiente:

m
m2
m
1
+
0
0

M
M



m
m2

0
0
m 1+


M
M

m̃ = 

2m

0
0
2m 1 +
0

M




2m
0
0
0
2m 1 +
M
(6.83)
(6.84)
T =

















(6.85)
En el cálculo de la energı́a potencial vamos a considerar un modelo más realista.
Llamaremos k la constante de fuerza para los desplazamientos longitudinales relativos a la partı́cula 2; k ′ la constante de fuerza para los desplazamientos longitudinales
de la partı́cula 1 relativos a la partı́cula 3, y a K a la constante de fuerza para los desplazamientos transversales. La constante K no se puede expresar en función de k y k ′
mediante un modelo de resortes. La energı́a potencial de interacción entre las partı́culas
para pequeñas oscilaciones es:
1
1 V =
k (d1x − d2x )2 + (d3x − d2x )2 + k ′ (d1x − d3x )2
2
2
1 + K (d1y − d2y )2 + (d3y − d2y )2
2
+(d1z − d2z )2 + (d3z − d2z )2
(6.86)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 185
Si usamos a (6.78) y (6.79) para expresar todos los d~i en función de los ην , ν =
1, 2, 3, 4 obtenemos para V (~
η ):
1
2m2
2m
′
V =
k 1+
+ k (η12 + η22 )
+
2
M2
M
i
1h m m
4k
1+
− 2k ′ η1 η2
2
M
M
"
2 #
2m
1
(η32 + η42 )
+ 2K 1 +
2
M
+
(6.87)
En notación matricial V puede escribirse ası́:
V =
1 T
η k̃~η
~
2
(6.88)
o usando la notación de producto escalar:
V =
1
(~
η , m̃−1 k̃~η )
2
donde k̃ es la siguiente matriz simétrica no diagonal 4 × 4:

2m 2m2
m
m
′
2k (1+ )−k ′
0
0
 k(1+ M + M 2 )+k
M
M



m
2m 2m2
m

 2k (1+ )−k ′ k(1+
0
0
+ 2 )+k ′

M
M
M
M

k̃ = 

2m 2

0
0
2K(1+
)
0

M



2m 2
0
0
0
2K(1+
)
M
El lagrangiano será:
L=
1
1 ˙ ˙
η)
(~
η , ~η ) − (~
η , m̃−1 k̃~
2
2
(6.89)








 (6.90)







(6.91)
La ecuación de movimiento para ~η es:
m̃~
η¨ + k̃~η¨ = 0
(6.92)
Buscamos soluciones propias de la forma:
ηα = ~
~
µα sen(ωα t + φα ); α = 1, 2, 3, 4
(6.93)
Al reemplazar (6.93) en (6.92) obtenemos:
(m̃ωα2 − k̃)~
µα = ~0
(6.94)
186 / Mecánica clásica avanzada
La ecuación (6.94) admite soluciones no triviales para los ~µα sólo si las ωα son
tales que satisfacen la ecuación secular:
det(m̃ωα2 − k̃) = 0 ;
α = 1, 2, 3, 4
(6.95)
Si usamos la siguiente notación (Classical mechanics, Corben-Stehle, capı́tulo 8):
2
2m
m
α = 2K 1 +
;
α′ = 2m 1 +
M
M
(6.96)
m
m2
2m
β′ =
+ 2 2;
β=
M
M
M
Podemos escribir:
m̃ω 2 − k̃ =










m(1+β ′ )ω 2 −k(1+β)−k ′
′
2
mβ ω −kβ +k
′
mβ ′ ω 2 −kβ +k ′
′
2
m(1 +β )ω −k(1+β)−k
′
0
0
0
0
0
0
α′ ω 2 − α
0
0
0
0
α′ ω 2 −α
Usando la regla para el cálculo del determinante de una matriz M̃ :
detM̃ =
n
X










Mij Cij
(6.97)
(6.98)
i=1
donde Cij es el determinante de la matriz de los cofactores del elemento Mij :
Cij = (−1)i+j Dij
(6.99)
donde Dij es el determinante menor complementario del elemento, entonces la ecuación
secular es:
n
2 o
2
m(1 + β ′ )ω 2 − k(1 + β) − k ′ − mβ ′ ω 2 − kβ + k ′
(α′ ω 2 − α)2 = 0
(6.100)
Entonces el determinante consta de tres factores, dos de ellos lineales en ω 2 y uno
cuadrático en ω 2 . Hay dos raı́ces dobles que son:
α
2m
K
ω32 = ω42 = ′ =
1+
(6.101)
α
m
M
Las otras dos raı́ces son:
ω12 =
k + 2k ′
k
; ω22 =
m
m
2m
1+
M
(6.102)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 187
ω1 y ω2 coinciden con las halladas cuando consideramos las oscilaciones longitudinales por separado, cuando k ′ = 0. La ecuación de valores propios (6.94) es de la
forma:
  


0
Aα Bα 0
0
µα1
  


  


  
 Bα Aα 0

0 

  µα2   0 
= 


(6.103)
  


 0
  µα3   0 
0
C
0
α
  


  


0
µα4
0
0
0 Cα
Los valores de las Aα , Bα y Cα son:
2m ′
m
m
A1 =
1+
k −k
; A2 = − k ′ − k
M
M
M
A3 =
m
2m
2m 2m2
K 1+
1+
−k 1+
− k′
+
M
M
M
M2
C1 =
2m
2m
′
k + 2k − K 1 +
2 1+
M
M
C2 =
2
2m
2 1+
(k − K) ; C3 = 0
M
B1 =
m
m
2m ′
k −k
; B2 = −k ′ − k
1+
M
M
M
B3 =
K
m
M
(6.104)
2m
m
m
1+
− 2k
1+
+ k′
M
M
M
La ecuación (6.103) da lugar a los cuatro siguientes sistemas de ecuaciones algebraicas:
Aα µα1 + Bα µα2 = 0 ; Bα µα1 + Aα µα2 = 0
(6.105)
Cα µα3 = 0 ; Cα µα4 = 0 ; α = 1, 2, 3, 4
Las primeras ecuaciones (6.105), dado que Aα y Bα no son cero, son:
Aα
µα2
µα1
=−
=−
⇒ µα1 = ±µα2
Bα
µα1
µα2
(6.106)
Como se cumple que:
A1 = B1 ; A2 = −B2 y A3 6= ±B3
(6.107)
Entonces µα2 y µα1 deben necesariamente tener las relaciones:
µ11 = −µ12 ; µ21 = µ22 ; µ31 = µ41 = µ32 = µ42 = 0
(6.108)
188 / Mecánica clásica avanzada
Como C1 y C2 no son cero, en tanto que C3 es cero, se cumple:
µ13 = µ23 = µ14 = µ24 = 0
(6.109)
µ33 , µ43 , µ34 , µ44 : Arbitrarias
Tenemos en este problema seis cantidades indeterminadas. O sea que aquı́ no hay
simplemente una indeterminación por un factor arbitrario en los vectores ~µ3 y ~µ4 . Los
vectores propios para este problema son de la forma siguiente:




1
1
 1 
 −1 



µ1 = µ11 
~
 0  ; ~µ2 = µ21  0 
0
0



µ3 = µ33 
~



0
0
1
µ34
µ33




~ 4 = µ43 
; µ


0
0
1
µ44
µ43

(6.110)




Como en las ecuaciones (6.30), µ11 , µ21 , µ33 y µ43 pueden definirse por la condición
de normalización, sin embargo µ43 y µ44 quedan aún indeterminadas. Hay un número
infinito de vectores propios normalizados correspondientes a la frecuencia propia degenerada ω3 = ω4 . La condición de normalización es:
~ Tα m̃~µα = 1 ; α = 1, 2, 3, 4
µ
(6.111)
donde m̃ es la matriz (6.85). Esto nos conduce a los siguientes valores para µ11 , µ21 , µ33
y µ43 :
1
;
µ11 = √
2m
µα3
v
u
=u
u
t
1
2m
2m 1 +
M
µ21 = s
1
− µ2α4 ;
2m
2m 1 +
M
(6.112)
α = 3, 4
Debido a que µ34 y µ44 son arbitrarios, µ
~ 3 y ~µ4 son linealmente independientes.
~3 y µ
µ
~ 4 generan entonces un espacio de dimensión dos, siendo cualquier vector de este
espacio un vector propio correspondiente al valor propio ω3 = ω4 . Podemos decir que a la
frecuencia propia doblemente degenerada, ω3 = ω4 , le corresponde un conjunto infinito
de vectores propios normalizados en un espacio bidimensional. Cualquier par de vectores
linealmente independientes genera el espacio; por esto podemos sin perder generalidad
escoger los vectores ~
µ3 y ~µ4 de modo que sean ortogonales entre sı́, bajo el producto
escalar (6.59):
µ33 µ43 + µ34 µ44 = 0
(6.113)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 189
Como definimos a µ33 y µ43 positivos en (6.113), entonces µ34 y µ44 deben tener
signos opuestos; (6.112) y (6.113) conducen a:
µ234 + µ244 =
1
2m
2m 1 +
M
(6.114)
Todavı́a los vectores no están bien definidos pues aún hay infinitos pares de vectores
ortonormales en el mencionado espacio bidimensional. ~µT3 y ~µT4 pueden escribirse en la
forma:
µ
~ T3
=
µ
~ T4
=
r
1
(0, 0, cos δ, senδ)
2m
2m(1 +
)
M
1
r
(0, 0, senδ, − cos δ)
2m
2m(1 +
)
M
(6.115)
donde δ está comprendido entre 0 y π/2 de acuerdo con la elección del signo de µ33 y
µ43 .
Los vectores ~
µ3 y µ
~ 4 generan todas las posibles oscilaciones transversales con la
frecuencia degenerada ω3 = ω4 . Los modos normales de oscilación transversales son:
η~3T = µ
~ T3 sen(ω3 t + φ3 ) → (0, 0, d1y , d1z )
(6.116)
η~4T = η~4T sen(ω3 t + φ4 )
Vemos que δ es esencialmente el ángulo de los vectores de desplazamientos en el
plano y − z donde las oscilaciones normales tienen diferencia de fase arbitraria.
z
d1
(Modo µ3)
δ
y
δ
d1 (Modo µ4)
Figura 6.5 Modos de oscilación transversales en el espacio de configuración
190 / Mecánica clásica avanzada
Podemos tomar δ = 0, con lo cual ~µ3 corresponde a las oscilaciones en “y” y ~µ4 a
las oscilaciones en “z”. Una oscilación transversal general será de la forma:
~η = C3 ~
η3 + C4 ~η4
(6.117)
Sin perder generalidad η~T puede escribirse en la forma:
~η T = C [0, 0, senγ sen(ω3 t + φ3 ), cos γ sen(ω3 t + φ4 )]
(6.118)
φ3 y φ4 son arbitrarias. Si tomamos φ3 = φ4 obtenemos oscilaciones longitudinales en
una dirección que hace un ángulo γ con el eje z. Si tomamos φ3 = 0 y φ4 = π/2, el
movimiento será una circunferencia y en general será una elipse, donde γ será la dirección
del eje mayor de la elipse.
Recordando las fórmulas (6.78),
d2y = −
2m
2m
d1y ; d2z = −
d1z
M
M
(6.119)
d3y = d1y ; d3z = d1z
Vemos que el desplazamiento del átomo central es siempre contrario al de los
laterales. En general, el átomo central gira en sentido contrario a los laterales, en una
trayectoria elı́ptica, con una amplitud tal que el momento angular es cero. El movimiento
transversal general es pues una rotación de cada átomo. Véase figuras 6.3 y 6.4. Si
quisiéramos describir las nueve coordenadas del sistema, deberı́amos usar vectores 9dimensionales y matrices 9 × 9. Ası́ por ejemplo, en vez de ~µ3 y µ
~ 4 tendrı́amos, usando
las fórmulas (6.78):
~eT3 =
~eT4
=
2m
1
(0, 1, 0; 0, − M , 0; 0, 1, 0)
2m
2m 1 +
M
s
1
2m
s
(0, 0, 1; 0, 0, − M ; 0, 0, 1)
2m
2m 1 +
M
(6.120)
En el tratamiento completo aparecerán además los cinco vectores propios de frecuencia cero correspondientes a las tres traslaciones y las dos rotaciones. La degeneración
puede ser removida por ejemplo introduciendo algún efecto que rompe la simetrı́a de rotación de la interacción alrededor del eje de la molécula (de la cual se derivó que K no
depende de la dirección del desplazamiento). Si existiera algún efecto direccional (como
una interacción entre espines), ya no habrı́a la simetrı́a rotacional en la interacción y
desaparecerı́a la degeneración.
Este tema es susceptible de un estudio más completo usando la teorı́a de grupos
de simetrı́as. Los vectores propios constituyen representaciones del grupo de simetrı́as.
El subespacio generado por ~µ3 y µ
~ 4 es una representación irreductible bidimensional del
grupo de simetrı́as (rotaciones alrededor del eje de la molécula). En otros sistemas de
osciladores acoplados las ligaduras pueden dar lugar a cambio de frecuencia y a supresión
Pequeñas oscilaciones de sistemas de varios grados de libertad / 191
de la degeneración.
Tratamiento usando el método de diagonalización. Buscaremos una matriz
que diagonalice simultáneamente a m̃ y a k̃, de acuerdo con las fórmulas (6.66) y (6.68).
Tanto m̃ como k̃ son diagonales en bloques de matrices 2 × 2; es razonable suponer que
à sea de la misma forma:


D E 0 0




 F G 0 0 



à = 
(6.121)


 0 0 H K 




0 0 L J
Llamaremos A, B y C a los elementos de la matriz m̃ o de la matriz k̃. Se requiere
entonces que mediante el siguiente producto se obtenga una matriz diagonal, con unos
en la diagonal si A, B y C son los elementos de m̃, y con las ω 2 si son los elementos de
k̃:




D F 0 0
A B 0 0
D E 0 0








 F G 0 0  B A 0 0  E G 0 0 












 0 0 H K  0 0 C 0  0 0 H L 








0 0 K J
0 0 0 C
0 0 L J
(6.122)


d e 0 0




 f g 0 0 



=


 0 0 h l 




0 0 k j
donde hemos llamado las variables d = A(E 2 +D2 )+2BDE, e = A(AD+EG)+B(DG+
EF ), f = A(F D + EG) + B(EF + GD), g = A(F 2 + G2 ) + 2BF G, h = C(H 2 + K 2 ),
l = C(HL + JK), k = C(HL + JK) y j = C(J 2 + L2 ).
Asumimos que los elementos de à no dependen de las constantes k, k ′ y K entonces, como los elementos de la matriz k̃ son combinaciones de las constantes, Ãk̃ÃT
será diagonal sólo si:
DF + EG = 0 ; DG + EF = 0 ; HL + JK = 0
(6.123)
Esto implica las relaciones siguientes entre los elementos de A:
G = F , D = −E
o
G = −F , D = E
(6.124)
192 / Mecánica clásica avanzada
˜ Por
Cuando A, B y C son los elementos de m̃, entonces (6.122) debe ser igual a I.
tanto se cumple, usando las relaciones de la izquierda en (6.124), que:
2D2 A − 2BD2 = 1 ; 2F 2 A + 2F 2 B = 1
(6.125)
C(H 2 + K 2 ) = C(J 2 + L2 ) = 1
Recordando la expresión para A y B en m̃, ecuación (6.85), obtenemos para D y
F:
D=√
1
1
= −E ; F = s
=G
2m
2m
2m 1 +
M
(6.126)
En (6.126) por convención tomamos las raı́ces cuadradas positivas. Por otra parte,
para H, K, L, J, obtenemos las relaciones:
K = L , H = −J o K = −L , H = J
(6.127)
Como hay sólo tres ecuaciones para determinar las cuatro incógnitas H, K, J, L,
podemos asignar el valor a una de ellas arbitrariamente. Sea que:
cos δ
π
; ≤δ≤ 2
2m
2m 1 +
M
H=s
(6.128)
Con ello obtenemos las siguientes expresiones para J, K, L:
sen δ
=L
2m
2m 1 +
M
J = −H ; K = s
Entonces la matriz à tiene la siguente expresión explı́cita:
 r
r
2m
2m
1+
0
0
 1+ M
M




1
1
1
0
0

à = r
2m 

)
2m(1 +
0
0
cos δ senδ
M 

0
0
senδ cosδ
(6.129)












(6.130)
Vemos que las filas de à coinciden con los vectores propios ~µα hallados anteriormente. Cuando tomamos como A, B y C los elementos de k̃ de la ecuación (6.96),
encontramos:
A(E 2 + D) + 2BDE = ω12 ; A(F 2 + G2 ) + 2BF G = ω22
(6.131)
C(H 2 + K 2 ) = C(J 2 + L2 ) = ω32
Pequeñas oscilaciones de sistemas de varios grados de libertad / 193
donde ω12 , ω22 y ω32 están dados en las ecuaciones (6.101) y (6.102). En este problema
el procedimiento de diagonalización se simplificó debido a la forma de m̃ y k̃ que nos
permitió partir de la forma (6.121) para la matriz Ã. Para sistemas más complicados no es
tan simple la elección de la forma de Ã. A pesar de esto, muchas veces la ecuación secular
resulta mucho más complicada, por requerir primero la evaluación de un determinante y
luego el cálculo de las raı́ces de una ecuación algebraica de grado l. En estos casos, donde
l es grande y m̃ y k̃ complicadas, es más conveniente el método de la diagonalización,
que se realiza usualmente en forma numérica, por ejemplo mediante el método numérico
de diagonalización de Jacobi.
Ejemplo 6.2.1 Una partı́cula se mueve en presencia de un potencial central de la forma:
V (r) = −
A
(6.132)
rn−1
suponiendo que la órbita es circular, hallar los valores de n para los cuales hay pequeñas
oscilaciones estables.
Este es un ejemplo de pequeñas oscilaciones alrededor de un movimiento estable.
Se entiende por estabilidad el hecho de tender al estado de equilibrio al ser sometido el
sistema a una distorsión. En fuerzas centrales la órbita es plana, con lo cual podemos
describir la partı́cula con las coordenadas polares r, θ. El lagrangiano es:
L=
1
A
m(ṙ2 + r2 θ̇) + n−1
2
r
(6.133)
Las ecuaciones de movimiento de Lagrange son:
mr̈ − mrθ̇2 + (n − 1)Ar−n =
0
mr2 θ̈ + 2mrṙ θ̇ =
0
(6.134)
El movimiento de “equilibrio” es circular uniforme, o sea que son constantes:
r = r0
y
θ̇ = ω0
(6.135)
Si se hacen pequeñas alteraciones a este movimiento estable, ρ al radio y φ̇ a la
velocidad angular, habrá oscilaciones si el movimiento es estable,
r = r0 + ρ
y
θ̇ = ω0 + φ̇
(6.136)
En el movimiento de equilibrio se cumple que:
mr0 ω02 = (n − 1)Ar0−n
(6.137)
Entonces las ecuaciones de movimiento para los pequeños desplazamientos ρ y φ̇,
al primer orden en los mismos, son:
mρ̈ − mω02 ρ − 2mr0 ω0 φ̇ − n(n − 1)Ar0−n−1 ρ = 0
mr02 φ̈ + 2mr0 ω0 ρ̇ = 0
(6.138)
194 / Mecánica clásica avanzada
estas son ecuaciones lineales acopladas para ρ y φ̇. Buscamos ahora los “modos normales
de oscilación” de ρ y φ̇:
ρ = ρ0 sen(ωt + α) ;
φ̇ = φ̇0 sen(ωt + α)
(6.139)
donde ω es la frecuencia propia del modo normal (esperamos que haya dos frecuencias),
y α la fase, como en la ecuación (6.93). ρ0 y φ̇0 son las componentes de los vectores
propios ~
µ, que satisfacen las ecuaciones algebraicas:


−m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 −2mω0 ωr0


2mω0 ωr0
mr02 ω

  
ρ0
0
= 
×
(6.140)
0
φ̇0
El sistema (6.140) tiene soluciones no triviales sólo si:
mωr02 [−m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 + 4mω02 ω] = 0
(6.141)
Las raı́ces de (6.141) son:
ω2 = 0
y
ω 2 = (3 − n)ω02
(6.142)
La segunda raı́z si n < 3 conduce a una ω real, y si n > 3 es imaginaria. Si n=3
el movimiento es degenerado con dos raı́ces ω = 0. El movimiento será, pues, estable
solamente si n < 3. Para una órbita de Kepler, por ejemplo n = 2. Entonces:
ω02 = ω 2
(6.143)
ω0 es la frecuencia de rotación de la partı́cula. ω es la frecuencia de las oscilaciones en
el radio de la órbita y en la velocidad angular que coinciden con ω0 .
Para un potencial central armónico, V = Ar2 , n = −1, entonces:
ω = 2ω0
(6.144)
La frecuencia ω 2 = 0 corresponde a un desplazamiento de una órbita circular a
otra, o sea, a otro movimiento estable; no hay oscilaciones sino simplemente un cambio
constante en el radio de la órbita y en la velocidad angular. Hay una forma simple de
calcular directamente la frecuencia de las pequeñas oscilaciones.
La partı́cula se mueve radialmente dentro un “pozo” que consta del potencial
centrı́fugo y el potencial externo:
Vef (r) = −
A
rn−1
1
A
l2
+ mr2 θ̇2 = − n−1 +
2
r
2mr2
(6.145)
En el movimiento estable el potencial tiene un mı́nimo. Para pequeños desplazamientos del movimiento estable, el “pozo” de potencial puede aproximarse a un pozo
Pequeñas oscilaciones de sistemas de varios grados de libertad / 195
parábolico. El problema consiste en determinar para qué valores de n es posible la formación del potencial parábolico. Vef (r) puede expandirse alrededor de r0 para pequeños
desplazamientos:
Vef (r) ≈
Vef (r0 ) +
dVef (r)
dr
ρ+
r=r0
1 d2 Vef (r)
2 dr2
ρ2 =
r=r0
(6.146)
1
Vef (r0 ) + kρ2
2
donde el término lineal en ρ se anula en el equilibrio y k es la “constante de resorte”:
k=
d2 Vef (r)
dr2
(6.147)
r=r0
La frecuencia de las pequeñas oscilaciones en r será:
ω2 =
1 d2 Vef (r)
m dr2
(6.148)
r=r0
Efectuando las operaciones indicadas en (6.148), usando la relación (6.137) que se
cumple en la posición de equilibrio, y notando que la magnitud del momento angular es
l = mω0 r02 , llegamos finalmente al resultado ω 2 = (3 − n)ω02 , que nos da directamente
la frecuencia de las pequeñas oscilaciones alrededor de la órbita circular estable.
6.3.
Un campo mecánico unidimensional:
la cuerda uniforme
Primero estudiaremos el sistema de n partı́culas de masa m unidas entre sı́ por
cuerdas elásticas sin masa. La cuerda uniforme se obtendrá del problema anterior como un caso lı́mite en que las masas se distribuyen uniformemente formando un continuo.
La cuerda estirada sin masa con un conjunto discreto de masas. Sea
una cuerda de longitud L a la cual se adhieren n masas iguales equidistantemente. La
cuerda está estirada y fija en sus extremos. Estudiaremos las oscilaciones transversales.
La longitud de cada segmento de cuerda en la posición de equilibrio es d = xi − xi−1 ;
i = 1, 2, ...n + 1. Entonces L = (n + 1)d.
Para los desplazamientos longitudinales, la energı́a potencial resulta de la elasticidad de la cuerda k. Para los desplazamientos transversales, la contribución de la
elasticidad de la cuerda es de cuarto orden en la elongación, la demostración se propone
como un ejercicio; ası́ que la contribución cuadrática viene directamente de la tensión
de la cuerda τ . La tensión es independiente de los desplazamientos transversales si estos
son infinitesimales. El trabajo realizado para estirar un segmento es igual a la tensión
(constante) por la elongación. De modo que la energı́a potencial del segmento i cuando
la partı́cula i − 1 se desplaza transversalmente ηi−1 , y la partı́cula i en ηi , es:
i
hp
d2 + (ηi − ηi−1 )2 − d
(6.149)
Vi = τ
196 / Mecánica clásica avanzada
η1
η2
x1
x0 = 0
ηi – 1
x2
ηi
xi – 1
ηi + 1
ηi + 1
xi + 1
xi
xi + 2
d
ηn – 1
xn – 1
ηn
xn
x
xn – 1
= L
Figura 6.6 Cuerda estirada sin masa con un conjunto discreto de masas
de modo que para pequeños desplazamientos la energı́a potencial total es:
V =
n+1
1τ X
(ηi − ηi−1 )2
2d
(6.150)
i=1
El espacio de configuración es n-dimensional y las matrices m̃ y k̃ son de dimensión
n × n. En notación matricial:
1
V = ~η T k~η
(6.151)
2
donde η~T = (η1 , η2 , ...ηn ) y

2 −1


 −1 2



 0 −1


τ 

0
k̃ =  0
d

 ..
..
 .
.



 0
0


0
0
la matriz k̃ es:
0
0
···
0
0
−1
0
···
0
0
−1 · · ·
0
0
2
−1
2
···
0
0
..
.
..
.
..
.
..
.
..
.
0
0
···
2
−1
0
0
· · · −1
La energı́a potencial es:
2























T
T = ~η˙ m̃~η˙
(6.152)
(6.153)
donde la matriz m̃ es un múltiplo de la matriz unidad:
m̃ = mI˜
(6.154)
La ecuación de valores propios es:
(−ωα2 m̃ + k̃)~
µα = ~0; α = 1, 2, ...n
(6.155)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 197
Explı́citamente las ecuaciones de valores propios son:
τ
τ
τ
− µαi−1 + 2 − mωα2 µαi − µαi+1 = 0; i = 1, 2, ...n
d
d
d
(6.156)
En (6.156) se debe cumplir µα0 = µα n+1 = 0. La matriz n × n en (6.155) es:










τ

2
−m̃ωα + k̃ = 
d









λ
−1
0
0
···
−1
λ
−1
0
···
0
−1
λ
0
0
−1
λ
···
..
.
..
.
..
.
..
.
..
.
0
0
0
0
···
0
0
0
0
···
−1 · · ·
donde λ depende de ωα :
λ = 2 − mωα2
0
0



0 



0
0 



τ
0
0 
 = D̃

d

..
.. 
.
. 



λ −1 


−1 λ
0
d
τ
(6.157)
(6.158)
Llamemos Dn al determinante de la matriz D̃, que es un polinomio de grado n
en λ. Haciendo tomar a n los valores 1, 2, 3, ..., obtenemos la siguiente secuencia de
polinomios:
D1 =
λ
D2 =
λ2 − 1
D3 =
λ3 − 2λ = λD2 − D1
D4 =
λ4 − 3λ2 + 1 = λD3 − D2
D5 =
λ5 − 4λ3 + 3λ = λD4 − D3
D6 =
..
.
λ6 − 5λ4 + 6λ2 − 1 = λD5 − D4
..
.
(6.159)
Notamos la siguiente relación de recurrencia entre los polinomios:
Dk = λDk−1 − Dk−2 ;
k = 1, 2, ...n
(6.160)
198 / Mecánica clásica avanzada
Los coeficientes de las potencias de λ pueden escribirse en términos de los números
combinatorios. Ası́ por ejemplo:
9
8
7
D9 =
λ9 −
λ7 +
λ5
9
7
5
−
D10 =
−
6
3
10
10
7
4
λ3 +
10
λ
4
−
λ +
5
1
9
8
6
2
λ
8
λ +
2
λ −
8
6
5
0
(6.161)
6
λ
De (6.161) se puede obtener fácilmente una generalización. Las fórmulas resultantes
se demuestran fácilmente por el método matemático de inducción,

 n
n/2
+k
X

 2
k+1 2k
Dn =
 (−1) λ si n es par

k=0
2k
(6.162)


n
+
1
(n−1)/2
+k
X 

2
k 2k+1
Dn =
si n es impar

 (−1) λ
k=0
2k + 1
Es conveniente el siguiente cambio de variable:
λ = 2 cos β
(6.163)
En términos de β obtenemos la secuencia siguiente de los Dk :
D1 =
2 cos β
D2 =
2 cos 2β + 1
D3 =
2(cos 3β + cos β)
D4 =
2(cos 4β + cos 2β) + 1
D5 =
2(cos β + cos 3β + cos 5β)
D6 =
2(cos 6β + cos 4β + cos 2β) + 1
(6.164)
Se pasa de (6.159) a (6.164) usando identidades trigonométricas (fórmulas 5.53 a
5.67 del manual de fórmulas matemáticas de Spiegel). La generalización de (6.164) es
Pequeñas oscilaciones de sistemas de varios grados de libertad / 199
simple; el resultado es:
Dn =
2
n/2
X
cos 2kβ + 1 ;
si n es par
k=1
(6.165)
(n−1)/2
Dn =
2
X
cos(2k + 1)β ;
si n es impar
k=0
Las fórmulas (6.165) se pueden simplificar usando
cos 2kβ =
(ei2β )k + (e−i2β )k
2
(6.166)
y similarmente para (2n + 1)β. Notamos luego que se obtienen series geométricas de
potencias. La expresión para la suma cerrada de una serie geométrica es conocida. En
este caso la razón de la serie es e±2β :
1 + ei2β + (ei2β )2 + ...(ei2β )r =
1 − (ei2β )r+1
1 − ei2β
(6.167)
que vale si ei2β 6= 1. Ası́, si n es par:
Dn = 2Re
1 − (ei2β )(n/2+1)
−1
1 − ei2β
(6.168)
El resto es un cálculo trigonométrico. Para n impar el procedimiento es similar.
El resultado final es que, para todo n:
Dn =
sen(n + 1)β
;
senβ
n par o impar
(6.169)
Se sigue entonces que la ecuación secular correspondiente a (6.156) es:
sen(n + 1)βα = 0; α = 1, 2, ...n
(6.170)
Esta ecuación tiene n raı́ces, (n + 1)βα = απ, o sea:
βα = α
π
; α = 1, 2, ...n
n+1
(6.171)
Entonces los λ serán, usando (6.163):
λα = 2 cos
απ
; α = 1, 2, ...n
n+1
(6.172)
Recordando la relación entre las λα y las ωα , ecuación (6.158), obtenemos para las
frecuencias propias:
r
απ
τ
ωα = 2
sen
; α = 1, 2, ...n
(6.173)
md
2(n + 1)
200 / Mecánica clásica avanzada
Para hallar los

λα −1
 −1 λα

 0 −1

 0
0

 ..
..
 .
.

 0
0
0
0
vectores propios, reemplazamos a (6.157) en (6.155):

  
0
0 ··· 0
0
µα1
0
 µα2   0 
−1 0 · · · 0
0 

  

  
λα −1 · · · 0
0 
  µα3   0 

  
−1 λα · · · 0
0 

= 
  .. 
..
..
..
..  
..
..


  . 
.
.
.
.
. 
.
  


0
0 · · · λα −1
µαn−1   0 
0
0 · · · −1 λα
µαn
0
(6.174)
La ecuación (6.174) representa el siguiente sistema de ecuaciones lineales:
µα2
µα3
µα4
µα5
=
=
=
=
..
.
µαk =
λα µα1
(λ2α − 1)µα1
(λ3α − 2λα )µα1
(λ4α − 3λ2α + 1)µα1
(6.175)
Dk−1 (λα )µα1
..
.
senkβα
µα1
=
senβα
α, k = 1, 2, ...n
La última lı́nea de (6.175) también puede obtenerse comparando a (6.160) con la
relación de recurrencia para los µαk , (6.156):
µα,k+1 = λα µα,k − µα,k−1 ; α, k = 1, 2, ...n
(6.176)
Entonces los vectores propios son:
~ Tα =
µ
µα1
(senβα , sen2βα , ...sennβα ); α = 1, 2, ...n
senβα
(6.177)
µα1 es una constante que se determina por normalización:
(~
µα , ~
µα ) = m~µTα · ~µα = m
n
µ2α1 X
sen2 kβα = 1
sen2 βα
(6.178)
k=1
La sumatoria en (6.178) se puede tratar como una serie geométrica:
n
X
n
sen2 kβα =
1X
(1 − cos 2kβα )
2
k=0
k=1
n
=
n + 1 1 X i2βα k
)
− Re (e
2
2
k=1
=
n + 1 sen(n + 1) βα cos 2nβα
−
2
2senβα
(6.179)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 201
como, según (6.170), sen(n + 1)βα = 0, se sigue que:
µ2α1 =
2 sen2 βα
(n + 1)m
(6.180)
llamando M a la masa total, M = nm, (6.180) y (6.175) nos dan:
r
2
αk π
µαk =
sen
= µkα ; α, k = 1, 2, ...n
M +m
n+1
(6.181)
Como debe ser, las ~
µα son ortogonales pues todas las frecuencias propias ωα son
no degeneradas:
n
(~
µα , ~
µα ) = m~µα · µ
~β =
2 X
senkβα senkββ = δαβ
n+1
(6.182)
k=1
Las coordenadas normales para este problema son:
r
τ
απ
θα = Cα sen 2
sen
t + φα ; α = 1, 2, ...n
md
2(n + 1)
p La matriz à que realiza la transformación
2/(M + m) sen[αβπ/(n + 1)]:

2π
π
 sen n + 1 sen n + 1



4π
 sen 2π
sen
r

n+1
n+1

2

à =

M +m 
..
..

.
.




nπ
2nπ
sen
sen
n+1
n+1
(6.183)
de ~η a ~θ, η~ = Ãθ~ es simétrica, Aαβ =

nπ
n+1 


2nπ 

· · · sen

n+1 



..
..

.
.



2
n π 
· · · sen
n+1
· · · sen
(6.184)
Una oscilación arbitraria del sistema está descrita por una superposición de las
oscilaciones propias:
r
τ
αiπ
απ
ηi (t) =
Cα sen
sen 2t
sen
+ φα
n+1
md
2(n + 1)
α=1
n
X
(6.185)
En los modos normales de oscilación todas las partı́culas están sobre una curva sinusoidal cuya longitud de onda depende del orden del modo, o sea de la frecuencia ωα . Es
una solución del tipo “onda estacionaria”, determinada por las condiciones de frontera
µα0 = µαn+1 . Corben y Stehle obtienen a partir de esta solución la solución para una onda viajera, imponiendo las condiciones de frontera periódicas, µα0 = µαn y µα1 = µαn+1 .
202 / Mecánica clásica avanzada
La cuerda uniforme. Lagrange demostró que mediante un procedimiento de paso
al lı́mite las oscilaciones de la cuerda uniforme pueden obtenerse a partir de las de la
cuerda cargada. La densidad lineal de masa ρ es:
M
nm
n m
ρ=
=
=
(6.186)
L
L
n+1 d
en (6.173) puede obtenerse en el lı́mite en que n → ∞, m → 0, d → 0 manteniendo m/d
constante:
m
(6.187)
lı́m ρ =
n→∞
d
Entonces el lı́mite de ωα cuando n → ∞ es:
r
απ
τ (n + 1)n
sen
ωα = 2
ρ
L2
2(n + 1)
(6.188)
r
r
2 τ απ
π τ
→
=α
; α = 1, 2, ...∞
L ρ 2
L ρ
p
Esto expresa la Ley de Mersenne. ω1 = (π/L) τ /ρ es la frecuencia del tono
fundamental de una cuerda y ωα es el armónico de orden α. Cuando n → ∞, el número
de modos normales de oscilación es infinito aunque es contable. En cambio el ı́ndice que
numera las partı́culas se convierte en una variable continua:
x → kd ;
k = 0, 1, 2, ...∞ ;
d→0
(6.189)
x es una variable que define la posición de la partı́cula k. Entonces la fórmula
(6.181) se convierte en:
r
πx 2
µα,k → µα (x) =
; α = 1, 2, ...∞
(6.190)
sen α
M
L
Una oscilación general de la cuerda estará dada por:
r
∞
X
απx
απ τ
η(x, t) =
Cα sen
(6.191)
sen
t + φα
L
L
ρ
α=1
donde Cα y φα es un conjunto contable infinito de constantes arbitrarias. Ã ya no
será una matriz, pues si bien las filas siguen siendo contables, las columnas forman un
continuo. Las fórmulas de transformación entre las coordenadas ~η y las coordenadas ~θ
son:
∞
X
η(x, t) =
µα (x)θα (t)
(6.192)
α=1
En vez de la matriz m̃ con elementos mij = mδij debemos tener una función delta
de Dirac, de modo que Ãm̃ÃT = I˜ se convierte en:
Z L Z L
Z L
ρ
dx
dy µα (x)δ(x − y)µβ (y) =
ρµα (x)µβ (x)dx =
0
0
0
2
L
Z
o
L
βπx
απx
sen
= δαβ
dx sen
L
L
(6.193)
Pequeñas oscilaciones de sistemas de varios grados de libertad / 203
En vez de los elementos de m̃ y k̃, debemos tener:
m(x, x′ ) =
k(x, x′ ) =
=
ρδ(x − x′ )
τ
[2δ(x − x′ ) − δ(x − x′ − d) − δ(x − x′ + d)]
d2
d2
−τ 2 δ(x − x′ )
dx
(6.194)
Ãk̃ ÃT = ω̃ se convierte en:
Z L Z L
τ
dx
dx′ µα (x) 2δ(x − x′ ) − δ(x − x′ + d)−
2
d 0
0
δ(x − x′ − d) µβ (x)
τ
= 2
d
(
τ
d2
(
=
2 τ
=
ρ d2
1
2 δαβ −
ρ
Z
)
L
µα (x) [µβ (x − d) + µβ (x + d)] dx
0
2
2
δαβ −
ρ
M
Z
0
L
sen
(6.195)
)
βπx
βπd
απx
2sen
cos
dx
L
L
L
4τ
πβd
βπd
δαβ = 2 sen2
1 − cos
δαβ
L
ρd
2L
Entonces, los elementos diagonales de Ãk̃ ÃT son, tomando d → 0:
ωβ2 = β 2
π2 τ
L2 ρ
(6.196)
como debe ser. En vez de las ecuaciones algebraicas (6.156) tendremos ahora una ecuación diferencial. En efecto, (6.156) se convierte en:
τ
τ
2τ
− µα (x − d) +
− ρdωα2 µα (x) − µα (x + d) = 0
(6.197)
d
d
d
Podemos escribir a (6.197) en la forma:
τ
τ
[µα (x) − µα (x − d)] − [µα (x + d) − µα (x)] = ρdωα2 µα (x)
d
d
(6.198)
En el lı́mite cuando d → 0, en el lado izquierdo obtenemos:
−τ [µ′α (x) − µ′α (x + d)] = ρ dωα2 µα (x)
(6.199)
Tomando una vez más el lı́mite cuando d tiende a cero obtenemos:
d2 µα (x) ρ 2
+ ωα µα (x) = 0; α = 1, 2, ...∞
dx2
τ
(6.200)
204 / Mecánica clásica avanzada
Reemplazando a (6.196) en (6.200) vemos que efectivamente (6.190) es la solución
de (6.200). De (6.188) podemos obtener la ecuación diferencial que obedece la amplitud
dependiente del tiempo. En efecto:
r
∞
απ 2
X
∂2η
απx
απ τ
sen
= −
Cα
sen
t + φα
∂x2
L
L
L
ρ
α=1
(6.201)
r
∞
απ 2 τ
X
∂2η
απx
απ τ
= −
C
sen
sen
t + φα
∂t2
L
ρ
L
L
ρ
α=1
De donde:
ρ ∂2η
∂2η
−
=0
2
∂x
τ ∂t2
(6.202)
Esta ecuación se obtiene también directamente de (6.15) y (6.195). Es la ecuación de onda en una dimensión. Hemos llegado a la teorı́a de las ondas mecánicas. No
seguiremos con el tema, que nos aleja del propósito del presente capı́tulo.
7
Cinemática del cuerpo rı́gido
7.1.
Definición de cuerpo rı́gido
Es un sistema de partı́culas sometidas a las siguientes ligaduras holónomas:
|~ri − ~rj | = lij = Constante; i, j = 1, 2, ...N
(7.1)
El número de relaciones de este tipo es:
N
2
=
1
N (N − 1)
2
(7.2)
Para N > 7 el número de ligaduras excede el número de coordenadas 3N . En
realidad, para N ≥ 4 el número de ligaduras independientes es menor que el número dado
por (7.2). Sea un cuerpo rı́gido formado por más de tres partı́culas no colineales. Dados
tres puntos no colineales del cuerpo rı́gido, las ligaduras fijan las posiciones de todos los
demás puntos, pues para ubicar un punto en el espacio bastan sólo las distancias a tres
puntos no colineales (véase figura 7.1). Luego, para especificar los grados de libertad de
un cuerpo rı́gido, basta determinar el número de coordenadas independientes necesarias
para ubicar la posición de tres puntos del cuerpo rı́gido. Como entre los tres puntos
dados, no colineales, hay tres condiciones de ligadura, r12 = l12 , r23 = l23 , r13 = l13 ,
se necesitan 9 − 3 = 6 coordenadas independientes para especificar la posición de tres
puntos no colineales del cuerpo rı́gido. En consecuencia el número de grados de libertad
de un cuerpo rı́gido es seis.
Otra manera de hallar lo anterior es la siguiente. Para especificar la posición del
punto 1 se requieren tres coordenadas. Para especificar la posición del punto 2, dado
el punto 1 y la distancia r12 se requieren dos coordenadas. Para especificar la posición del punto 3, dados los puntos 1 y 2 y las distancias r23 y r13 , se requiere sólo una
coordenada. O sea que en total se requieren seis coordenadas para ubicar los tres puntos.
205
206 / Mecánica clásica avanzada
i
2
l12
1
l23
l13
3
Figura 7.1 Posición de un punto respecto de tres puntos no colineales del cuerpo rı́gido
7.2.
Sistemas de coordenadas espacial
y del cuerpo rı́gido
Para especificar la posición de un cuerpo rı́gido es suficiente: (a) Especificar la
posición en el espacio de un punto cualquiera del cuerpo, para ello se requieren tres
coordenadas; (b) Especificar la orientación del cuerpo respecto a unas coordenadas fijas
en el punto mencionado, para ello se requieren tres coordenadas dado que seis es el
número total de grados de libertad.
El sistema de coordenadas η, ξ, ζ, está fijado al cuerpo rı́gido (véase figura 7.2).
El sistema de coordenadas x′ , y ′ , z ′ , se obtiene del sistema x, y, z, sólo por translación
al origen de coordenadas fijado al cuerpo rı́gido.
z′
ζ
z
r′
r
y′
a
η
y
x′
ξ
x
Figura 7.2 Sistemas de coordenadas espacial y del cuerpo rı́gido
Cinemática del cuerpo rı́gido / 207
Para una partı́cula del cuerpo rı́gido se tiene:
~r = ~r′ + ~a
(7.3)
En el sistema de coordenadas del cuerpo rı́gido la partı́cula tiene coordenadas
η, ξ, ζ y en el sistema de coordenadas trasladado tiene coordenadas x′ , y ′ , z ′ . Estas
coordenadas difieren por una rotación, o sea que están relacionadas entre sı́ mediante
una transformación lineal:

 ′ 

x
η








 ξ  = Ã  y ′ 
(7.4)








z′
ζ
donde à es la matriz de la transformación. Llamemos las coordenadas ası́:
x1 = x x′1 = x′ x1 = η a1 = ax
x2 = y
x′2 = y ′
x2 = ξ
a2 = ay
x3 = z
x′3 = z ′
x3 = ζ
a3 = az
(7.5)
Con lo cual podemos describir:
xi =
x′i
+ ai ;
xi =
3
X
aij x′j ;
i = 1, 2, 3
(7.6)
j=1
donde aij son los elementos de la matriz Ã. La transformación de las coordenadas espaciales (x) a las coordenadas del cuerpo rı́gido (x) son:
xi =
3
X
a−1
ij xj + ai
i = 1, 2, 3
(7.7)
j=1
−1
−1
donde a−1
. Obviamente aij
no es l/aij ·. a−1
ij son los elementos de la matriz inversa ã
ij
son un conjunto de nueve números que especifican la dirección de los ejes de coordenadas
fijos al cuerpo respecto a los ejes de coordenadas situados en el mismo punto de los
anteriores pero no rotados respecto a los espaciales.
Como la descripción del movimiento translacional del cuerpo rı́gido es posible usando los métodos de la cinemática de partı́culas, podemos sin perder generalidad hacer
coincidir los sistemas de coordenadas (x) y (x′ ).
Nos interesaremos pues, en la relación entre las coordenadas (x) y (x). La longitud
del vector ~r es la misma en los dos sistemas de coordenadas con origen común: r2 = r 2 .
Por tanto:


!
3
3
3
3
X
X
X
X
−1 
−1
2

aij xj
a xk
xi xi =
r =
ik
i=1
i=1
j=1
3
X
3 X
3
X
k=1
(7.8)
r2 =
i=1
xi xi =
j=1 k=1
δjk xj xk
208 / Mecánica clásica avanzada
Igualando las ecuaciones (7.8) obtenemos:
!
3 X
3
3 X
3
3
X
X
X
−1 −1
δjk xj xk =
aij aik xj xk
j=1 k=1
j=1 k=1
(7.9)
i=1
Como las x son independientes por definición, se sigue que:
3
X
−1
a−1
ij aik = δjk
(7.10)
i=1
En términos de los elementos (Ã−1 T )lm de la matriz traspuesta de la matriz Ã−1 , que
se obtiene por intercambio de filas y columnas, podemos escribir (7.10) como:
3
X
˜ jk
(Ã−1 T )ij (Ã−1 )ik = (I)
(7.11)
i=1
donde I˜ es la matriz identidad 3 × 3. En forma de matriz (7.11) es:
Ã−1 T Ã−1 = I˜ ⇒ Ã−1 = ÃT
(7.12)
donde hemos usado el hecho de que: Ã−1 Ã = I˜ y (Ã−1 T )T = Ã−1 .
Llegamos a la conclusión que: Ã−1 = ÃT . Una matriz para la cual su inversa
coincide con su transpuesta se llama ortogonal.
La matriz de rotación à contiene nueve parámetros, pero entre ellos hay las relaciones:
3
X
i=1
aji aTik = δjk ⇒
3
X
aji aki = δjk
(7.13)
i=1
Tres relaciones se obtienen cuando j = k:
3
X
(aji )2 = 1;
j = 1, 2, 3
(7.14)
i=1
Hay seis relaciones cuando j 6= k:
3
X
i=1
aji aki = 0 j 6= k;
j, k = 1, 2, 3
(7.15)
Pero de (7.15) también se sigue que:
3
X
i=1
aki aji = 0 j 6= k;
j, k = 1, 2, 3
(7.16)
O sea que sólo hay tres relaciones independientes para j 6= k. En total hay seis
relaciones entre los elementos de la matriz Ã. Como era de esperarse, Ã contiene sólo
tres parámetros independientes.
Cinemática del cuerpo rı́gido / 209
x2
x2
r,r
x1
θ
θ
φ
x1
Figura 7.3 Rotación de los ejes (x) alrededor del eje x3 = x3 .
Ejemplo 7.2.1 Supongamos que los ejes (x) y (x) difieren simplemente por una rotación
por un ángulo φ alrededor del eje x3 = x3 (véase figura 7.3). Encontrar las fórmulas de
transformación.
Las fórmulas de transformación se obtienen fácilmente de la figura 7.3, que representa el plano x1 − x2 :
x=
r cos θ
x=
r senθ
(7.17)
donde hemos usado que r = r. Como θ = θ − φ podemos escribir:
cos θ =
cos θ cos φ + senθ senφ
(7.18)
senθ =
senθ cos φ − cos θ senφ
Teniendo en cuenta que:
x1 = r cos θ ; x2 = r senθ
(7.19)
Se sigue inmediatamente que las fórmulas de transformación son:
x1 = x1 cos φ + x2 senφ
x2 = −x1 senφ + x2 cos φ
x3 = x3
(7.20)
210 / Mecánica clásica avanzada
O en forma de matriz:

 
cos θ senφ
x1

 

 
 x2  =  −senφ cos φ

 

 
x3
0
0
0

x1







0   x2 



x3
1
(7.21)
Esta matriz satisface idénticamente las relaciones de ortogonalidad (7.13). Para
j = k:
j=
primera fila ,
cos2 φ + sen2 φ + 02 =
1
j=
segunda fila , sen2 φ + cos2 φ + 02 =
1
j=
tercera fila ,
02 + 02 + 12 =
1
(7.22)
satisface también las relaciones para j 6= k (ortogonalidad de las filas entre sı́ o de las
columnas entre sı́):
j = 1, k = 2 ( 1a y 2a filas) : − cos φ senφ + senφ cosφ + 0 = 0
j = 1, k = 3 ( 1a y 3a filas) :
0
+0
+0 =0
j = 1, k = 2 ( 2a y 3a filas) :
0
+0
+0 =0
(7.23)
y similarmente para la ortogonalidad entre columnas.
En general, las relaciones (7.13) pueden expresarse en la siguiente manera. Para
una matriz ortogonal à se cumple que el producto escalar de una fila por sı́ misma, o
de una columna por sı́ misma, es igual a la unidad. Dos filas diferentes o dos columnas
diferentes son ortogonales entre sı́. No es cierto sin embargo que una fila sea ortogonal
a una columna. Es claro en el ejemplo anterior que Ã−1 = ÃT .
7.3.
Los cosenos directores
Sean dos sistemas de ejes cartesianos con origen común (x) y (x). Los ejes (x) están
rotados respecto a los ejes (x). Sean ~e1 , ~e2 y ~e3 tres vectores unitarios a lo largo de los
ejes x1 , x2 y x3 respectivamente. Sean ~e′1 , ~e′2 y ~e′3 los tres vectores unitarios a lo largo
de los ejes x1 , x2 y x3 respectivamente. Se definen los cosenos directores de los ejes (x)
respecto a los ejes (x) como los cosenos de los ángulos que hacen cada uno de los ejes
(x) con cada uno de los ejes (x). Los denotaremos αij . De su definición se sigue que:
αij = ~e′i · ~ej ;
i, j = 1, 2, 3
(7.24)
Es claro que αij es el coseno del ángulo entre el eje xi y el eje xj . En total hay
nueve cosenos directores, que no son independientes. Es claro que la transformación de
los vectores ~ei a los vectores ~e′i es:
~e′i =
3
X
j=1
αij ~ej =
3
X
j=1
(~e′i · ~ej )~ej
(7.25)
Cinemática del cuerpo rı́gido / 211
en efecto:
~e′i · ~ek =
3
X
j=1
(~e′i · ~ej )(~ej · ~ek ) =
3
X
j=1
(~e′i · ~ej )δjk = ~e′i · ~ek
(7.26)
Un vector cualquiera V~ puede expresarse de dos maneras equivalentes:
3
X
V~ =
Vi~ei =
3
X
Vi′~e′i
(7.27)
i=1
i=1
Multiplicando escalarmente (7.27) a ambos lados por ~e′k :
3
X
i=1
3
X
Vi~ek · ~ei =
i=1
Vi′~e′k · ~e′i = Vk′
(7.28)
~ se transforman de la siguiente manera:
Por tanto se tiene que las componentes de V
Vk′ =
3
X
αkj Vj
(7.29)
j=1
En tanto que:
~e′k
=
3
X
αkj ~ej
(7.30)
j=1
Es decir, las componentes de los vectores se transforman de la misma manera que
los vectores unitarios. Notamos que las componentes Vi y Vi′ de V~ se pueden escribir
como:
Vi = ~ei · V~ ;
Vi′ = ~e′i · V~
(7.31)
De acuerdo con (7.29):
~ =
Vi′ = ~e′i · V
3
X
j=1
(~e′i · ~ej )(~ej · V~ )
(7.32)
~ como ~e′ , según (7.32):
Tomando V
i
1=
3
X
j=1
(~e′i · ~ej ) →
3
X
α2kj = 1 ;
i = 1, 2, 3
(7.33)
j=1
~ como ~e′ con k 6= i, según (7.32):
Tomando V
k
0=
3
X
j=1
(~ei · ~ej )(~ej · ~e′k ) →
3
X
j=1
αij αkj = 0 ;
i, k = 1, 2, 3
(7.34)
212 / Mecánica clásica avanzada
Vemos que la fórmula de transformación de los vectores ~e′i a los vectores ~ei es:
~ei =
3
X
αij ~e′j =
j=1
puesto que:
~ei · ~e′k =
3
X
j=1
3
X
j=1
(~e′j · ~ei )~e′j
(~e′j · ~ei )δjk = (~e′k · ~ei )
(7.35)
(7.36)
Esto nos dice que la matriz traspuesta de (αij ) produce la rotación de los ejes (x)
a los ejes (x). Las componentes de un vector se transforman según:
Vk =
3
X
αjk Vj′ =
3
X
αTkj Vj′
(7.37)
j=1
j=1
Las relaciones (7.33) y (7.34) entre los cosenos directores pueden escribirse como:
3
X
αij αkj =
j=1
3
X
αij αTjk = δik
(7.38)
j=1
En sı́ntesis, vemos que la matriz de los (αij ) es ortogonal y cumple todas las propiedades de la matriz de rotación Ã. Los cosenos directores son los elementos de la matriz Ã.
Dı́adas y diádicos. Se define un diádico como una entidad algebraica que se
representa por una matriz 3 × 3, de la misma manera que un vector es una entidad
algebraica que se representa por una matriz columna 3 × 1.
De acuerdo con (7.27) un vector unitario se puede expresar como:
~e1 =
1 · ~e1 + 0 · ~e2 + 0 · ~e3
~e2 =
0 · ~e1 + 1 · ~e2 + 0 · ~e3
~e3 =
0 · ~e1 + 0 · ~e2 + 1 · ~e3
(7.39)
Entonces los vectores unitarios se pueden representar por las tres matrices columna
siguientes:
 
 
 
0
0
1
 
 
 
 
 
 
 

 
(7.40)
~e1 → 
 0  ; ~e2 →  1  ; ~e3 →  0 
 
 
 
1
0
0
~ se puede representar mediante una matriz columna:
Un vector arbitrario V
   
 


0
0
1
V1
   
 


   
 


~ →  V2  = V1  0  + V2  1  V3  0 
(7.41)
V
   
 


   
 


1
0
V3
0
Cinemática del cuerpo rı́gido / 213
Análogamente podemos suponer que una matriz 3 × 3 es la representación de cierta
entidad que llamaremos diádico. Una dı́ada unitaria es el análogo de un vector unitario
y un diádico es el análogo de un vector cualquiera. Definimos la dı́ada unitaria como
una entidad algebraica ~ei~ej que se puede representar por una matriz 3 × 3 que tiene un
1 en la fila i columna j, y cero en todos los otros lugares. Podemos formar nueve dı́adas
unitarias. Ası́ por ejemplo:




1 0 0
0 0 0











~e1~e1 →  0 0 0  ~e2~e3 →  0 0 1 
(7.42)





0 0 0
0 0 0
Notamos que ~ei~ej se puede representar por el producto de una matriz columna por
una matriz fila:


 
1 0 0
1


 


 
 (1 0 0) =  0 0 0 
0
~e1~e1 → 


 


 
0 0 0
0
(7.43)
 


0
0 0 0
 


 


 (0 0 1) =  0 0 1 
1
~e2~e3 → 
 


 


0
0 0 0
~B
~ como un poliEs de notarse que en general ~ei~ej 6= ~ej ~ei . Definimos una dı́ada A
nomio de dı́adas unitarias ası́:
3 X
3
X
~B
~ =
Ai Bj ~ei~ej
A
i=1 j=1
(7.44)
~A
~=
B
3 X
3
X
Bi Aj ~ei~ej
i=1 j=1
Un diádico en general es un polinomio de dı́adas unitarias, pero no necesariamente
~ B:
~
de la forma A
3
3 X
X
~~
Dij ~ei~ej
(7.45)
D
=
i=1 j=1
~~
Es claro que la representación de D
es:


D11 D12 D13




~~

D →  D21 D22 D23 



D31 D32 D33
(7.46)
214 / Mecánica clásica avanzada
Ası́ como el producto de un vector fila por una matriz da un vector fila y el
producto de una matriz por un vector columna da un vector columna, definimos por
analogı́a el producto de un vector por un diádico y de un diádico por un vector para
obtener vectores. Definimos los productos entre dı́adas unitarias y vectores ası́:
~ = ~ei (~ej · V
~ ) = ~ei Vj
~ei~ej · V
V~ · ~ei~ej =
(7.47)
~ · ~ei )~ej = ~ej Vi
(V
y el producto entre diádicos y vectores ası́:
~~ ~
D
·V =
3 X
3
X
~~
V~ · D
=
3
3 X
X
i=1 j=1
i=1 j=1


3
3
X
X
~ =
 Dij Vj  ~ei
Dij ~ei ~ej · V
i=1
j=1
!
3
3
X
X
~ · ~ei ~ej =
Dij Vi ~ej
Dij V
j=1
i=1
Se define el diádico unidad como:
~
~1 = ~e ~e + ~e ~e + ~e ~e
1 1
2 2
(7.48)
3 3
(7.49)
~
~1 claramente tiene las propiedades:
~
~=
~1 · A
3
3
X
X
~
~=
~ei Ai = A
~ei~ei · A
i=1
i=1
~ ·~
~1 =
A
3
X
3
X
i=1
~ · ~ei~ei =
A
(7.50)
~
Ai~ei = A
i=1
La dı́ada ~ei~ej tiene la propiedad de proyección. Al multiplicarla por un vector se
obtiene la componente del vector en la dirección ~ei :
~=A
~ · ~ei~ei =
~ei~ei · A
3
X
j=1
Aj (~ei · ~ej )~ei = Ai~ei
(7.51)
Se define el producto escalar de dos matrices ası́:
à : B̃ =
3 X
3
X
Aij Bij
(7.52)
i=1 j=1
que corresponde al producto escalar de dos diádicos:
~~ ~~
A
: B = Ã : B̃
(7.53)
Para el diádico (7.44) y uno similar tenemos:
~B
~ :C
~D
~ =
A
3
X
i=1
~ · C)(
~ B
~ · D)
~
Ai Bj Ci Dj = (A
(7.54)
Cinemática del cuerpo rı́gido / 215
Vemos que esto es lo mismo que:
~ ·A
~B
~ ·D
~ =
C
=
3
3 X
X
~ · ~ei )(~ej · D)
~
Ai Bj (C
3 X
3
X
~ · A)(
~ B
~ D)
~
Aj Bj Ci Dj = (C
i=1 j=1
i=1 j=1
(7.55)
Por tanto:
~B
~ :C
~D
~ =C
~ ·A
~B
~ ·D
~
A
(7.56)
Veremos que existe completa correspondencia entre los diádicos y los tensores.
Un tensor es una entidad algebraica, con componentes Tij tales que bajo rotaciones se
transforma ası́:
Tij′ =
3 X
3
X
αik αjl Tkl
(7.57)
k=1 l=1
donde (αij ) son los elementos de la matriz de rotación. En efecto, Tij son los elementos
~
de la matriz que representa a cierto diádico T~ :
~
~
Tij′ = T~ · ~e′i~e′j = ~e′i · T~ · ~e′j
(7.58)
~
T~ se puede expresar bien en términos de ~ei~ej o de ~e′i~e′j :
3
3
3
3
XX
XX
~
Tij′ ~e′i~e′j
Tij ~ei~ej =
T~ =
(7.59)
i=1 j=1
i=1 j=1
Por tanto (7.57) se puede escribir como:
Tij′ =
3 X
3
X
k=1 l=1
Tlk ~ei · ~ek ~el · ~ej =
3 X
3
X
αik αjl Tkl
(7.60)
k=1 l=1
Se denomina relación de completidad de la base ~ei a:
X
~
~ei~ei = I~
(7.61)
i=1
y relación de ortonormalidad de la base ~ei a:
~ei · ~ej = δij ;
i, j = 1, 2, 3
(7.62)
En mecánica cuántica la notación de Dirac es la notación diádica en el espacio de
Hilbert.
Dos forma. Se define el diádico antisimétrico:
~ei ∧ ~ej = ~ei~ej − ~ej ~ei
(7.63)
216 / Mecánica clásica avanzada
se cumple que ~ei ∧ ~ei = 0 y además:
~e1 ∧ ~e2 =
~e2 ∧ ~e3 =

0
1


 −1 0


0 0

0


 0


0
0
0



0 
 , ~e1 ∧ ~e3 =

0
0


0
0


 0 0


−1 0
1



0 
,

0
(7.64)


0 1 


−1 0
Una 2-forma entre dos vectores es:
~∧B
~ =
A
3 X
3
X
i=1 j=1
Ai Bj ~ei ∧ ~ej =
3 X
3
X
i=1 j=1
(Ai Bj − Aj Bi )~ei~ej
(7.65)
Se cumplen las propiedades:
~ ·A
~∧B
~ ·D
~ = (C
~ · A)(
~ B
~ · D)
~ − (C
~ · B)(
~ A
~ · D)
~
C
(7.66)
~∧B
~ :C
~ ∧D
~ = 2(D
~ · B)(
~ A
~ · C)
~ − 2(C
~ · B)(
~ A
~ · D)
~
A
El deteminante de la matriz de rotación. Sabemos que la matriz de los
cosenos directores de un sistema de ejes (x) rotado respecto a otro sistema de ejes (x)
es ortogonal:
ÃT Ã = I˜
(7.67)
Tomando el determinante a cada lado de (7.67) y teniendo en cuenta el teorema
matemático que dice que el determinante de un producto de matrices es igual al producto
de los determinantes, tenemos que:
det(ÃT Ã) = det ÃT · det à = det I˜
(7.68)
otro teorema matemático dice que los determinantes de una matriz y de su traspuesta
son iguales, entonces:
det(Ã)2 = 1 ⇒ det à = ±1
(7.69)
Es fácil ver que det à = −1 ocurre cuando la matriz à contiene una inversión del
sistema de coordenadas. Entonces los desplazamientos de un sólido rı́gido con un punto
fijo sólo pueden ser descritos mediante una matriz de determinante +1.
Cinemática del cuerpo rı́gido / 217
7.4.
El teorema de Euler acerca del movimiento de
un cuerpo rı́gido
El teorema dice: el desplazamiento general de un cuerpo rı́gido con un punto fijo es
un giro alrededor de cierto eje. En otras palabras: es suficiente un solo giro para pasar de
los ejes (x) fijos al cuerpo, a los ejes espaciales (x). El teorema se demuestra teniendo estas dos propiedades de una rotación alrededor de un eje: (a) El eje de rotación permanece
inalterado; (b) La rotación no cambia la longitud de los vectores. El teorema de Euler
queda demostrado si para una rotación arbitraria, descrita por la matriz Ã, podemos
hallar siempre un vector que no cambie, es decir, que tenga las mismas componentes en
los dos sistemas:
~ =V
~
V~ ′ = ÃV
(7.70)
Esta ecuación es un caso particular de:
~ = λV
~
V~ ′ = ÃV
(7.71)
Como à es unitaria (ortogonal) pero no hermı́tica (no simétrica), sus valores propios no tienen por qué ser reales. Esto nos permite enunciar el teorema de Euler de otra
manera: “la matriz real y ortogonal que determina el movimiento fı́sico de un cuerpo
rı́gido con un punto fijo siempre tiene el valor propio +1”. La ecuación de valores propios
(7.71) puede escribirse:
˜V
~ = ~0
(Ã − λI)
(7.72)
Es un sistema homogéneo de tres ecuaciones lineales, donde las incógnitas son las
componentes de V~ :
(a11 − λ)V1 + a12 V2 + a13 V3 =
0
a21 V1 + (a22 − λ)V2 + a23 V3 =
0
a31 V1 + a32 V2 + (a33 − λ)V3 =
0
(7.73)
Como es conocido, habrá solución no trivial sólo si el determinante de la matriz
˜ es igual a cero. Esto hace que exista solución solamente para ciertos valores de
(Ã − λI)
λ:


a11 − λ
a12
a13





a22 − λ
a23 
(7.74)
det  a21
=0


a31
a32
a33 − λ
La ecuación (7.74) es de tercer grado en λ con coeficientes reales:
λ3 + bλ2 + cλ + d = 0
(7.75)
218 / Mecánica clásica avanzada
donde:
b = −a11 − a22 − a23
c = a22 a11 + a33 a11 + a21 a33 − a23 a32 − a12 a21 − a13 a31
(7.76)
d = a23 a32 a11 + a12 a21 a33 + a13 a31 a22
−a22 a33 a11 − a12 a23 a31 − a13 a21 a32
cuyas principales propiedades son:
~ podrı́a ser
(a) λ puede ser complejo pero con módulo 1. Si λ es complejo, V
2
~
~
~
~
complejo. En este caso escribimos el módulo de V como |V | = V · V donde V~ † es la
~ y tomando el complejo conjugado: V
~ † = (V
~ T )⋆ .
matriz fila que se obtiene trasponiendo V
′
~ es la misma de V~ :
La longitud de V
~ ′ |2 = V
~ ′† · V
~ ′ = (ÃV
~ )† · (ÃV~ ) = V
~ † ÃT ÃV~
|V
(7.77)
~ ′ |2 = | V
~ |2 . Por otra parte, V
~ ′ = λV
~ , por
Como à es ortogonal, se sigue que |V
tanto:
~ ′ |2 = V
~ ′† · V
~ ′ = (λV
~ )† · (λV
~ ) = λ⋆ λV
~†·V
~ = |λ|2 |V
~ |2
|V
(7.78)
En conclusión:
|λ|2 = 1
(7.79)
(b) La ecuación secular (7.75) tiene al menos una raı́z real. Grafiquemos
la ecuación real:
f (x) = x3 + bx2 + cx + d
(7.80)
asumiremos x real. De la ecuación (7.76) sabemos que b, c y d son reales.
Claramente:
f (x) → ∞
para x → ∞
f (x) → −∞
para x → −∞
(7.81)
Como f (x) es continua debe en alguna parte cruzar el eje x. Llamemos x = λ el
punto donde corta el eje, o sea el cero de f (x):
λ3 + bλ2 + cλ + d = 0
(7.82)
Como por (a) sabemos que |λ| = 1, se sigue que el valor propio real debe ser λ = −1
o λ = +1 (véase figura 7.4).
(c) Si λ es un valor propio compleio, λ⋆ también es un valor propio. Como
a, b, c y d son reales, si λ es complejo y satisface (7.75) entonces λ⋆ también la satisface:
de (a), (b) y (c) se sigue que la matriz à tendrá tres valores propios λ, λ⋆ , +1 o −1.
Para cada valor propio habrá un vector propio:
~α = λα V~α ;
ÃV
α = 1, 2, 3
con λα = λ, λ⋆ , 1 o − 1
(7.83)
Cinemática del cuerpo rı́gido / 219
y
λ
x
Figura 7.4 Gráfico de la función real f (x) = x3 + bx2 + cx + d
En términos de las componentes podemos escribir a (7.83) como:
3
X
aij Vαj = λα Vαj =
j=1
3
X
λβ Vβi δαβ
(7.84)
β=1
Definimos las siguientes matrices formadas con las componentes de los vectores
propios y con los valores propios:
Ṽ = (Vαi ) ,
λ̃ = (λβ δαβ )
(7.85)
Entonces (7.84) puede reinterpretarse como productos de matrices:
~ )αi = (Ṽ T λ̃T )iα = (Ṽ T λ̃)iα
(ÃṼ T )iα = (λ̃V
(7.86)
O también:
ÃṼ T = Ṽ T λ̃ ⇒ (Ṽ T )−1 ÃṼ T = λ̃
(7.87)
Es decir, los vectores propios forman una matriz que diagonaliza a à siendo los
elementos de la diagonal los valores propios.
(d) El producto de las raı́ces de la ecuación secular es ±1. Tomando determinantes a ambos lados de (7.87) y teniendo en cuenta que el determinante de una
matriz es igual al inverso del determinante de la matriz, obtenemos:
1
det à det Ṽ = det λ̃ ⇒ det à = det λ̃
det Ṽ
(7.88)
De (7.69) se sigue que:
det λ̃ = ±1
(7.89)
220 / Mecánica clásica avanzada
Hemos dicho que para rotaciones se debe cumplir que det à = +1 y para inversiones det à = −1. Entonces, cuando à representa rotaciones:
det λ̃ = λ1 λ2 λ3 = |λ|2 λ3 = +1
(7.90)
Como |λ|2 = +1 se sigue que siempre el valor propio real debe ser igual a +1. Esto
es lo que afirma el teorema de Euler: existe un vector que no cambia al realizar una
transformación cualquiera à (corresponde al valor propio +1).
~:
Los vectores propios. El vector invariante bajo rotaciones es V
~ =V
~
ÃV
(7.91)
~α formamos la matriz Ṽ que diagonaliza a Ã:
Con las componentes de V
Ṽ ÃṼ T = λ̃
(7.92)
La traza de λ̃ es:
tr λ = λ1 + λ2 + λ3 = λ + λ⋆ + 1
Como |λ| = 1, podemos escribir:
λ = eiΦ
(7.93)
(7.94)
De donde:
tr λ̃ = 2 cos Φ + 1
(7.95)
Como, según un teorema matemático, la traza es invariante bajo transformaciones
de semejanza (Ṽ ÃṼ T es una transformación de semejanza sobre Ã):
tr à = tr λ̃ = 1 + 2 cos Φ
(7.96)
Es decir,
a11 + a22 + a33 = 1 + cos Φ
(7.97)
Podemos mediante una transformación de semejanza rotar los ejes de modo que
~ , de modo que la matriz de rotación tendrá la forma dada por
x3 esté a lo largo de V
(7.21):


cos φ senφ 0





−senφ
cos
φ
0
à = 
(7.98)




0
0
1
Vemos entonces de (7.97) y (7.98) que cos φ = cos Φ, luego Φ puede identificarse
~ . La ecuación de valores
como el ángulo de rotación alrededor del eje determinado por V
propios para la matriz à es:

 


V1
V1
cos Φ senΦ 0

 



 


 −senΦ cos Φ 0   V2  =  V2 
(7.99)

 



 


V3
V3
0
0
1
Cinemática del cuerpo rı́gido / 221
Con lo cual obtenemos:
V1 cos Φ + V2 senΦ = V1
−V1 senΦ + V2 cos Φ = V2
(7.100)
V3 = V3
Esto nos da, multiplicando la primera por V2 y la segunda por V1 y restando:
(V12 + V22 ) senΦ = 0
(7.101)
Como Φ es arbitrario, los vectores propios deben cumplir V1 = V2 = 0, quedando
~ = V3~e3 . Para una elección general de los ejes, seguirá siendo
V3 indeterminado, luego V
~ , pero no quedará determinado comválido que Φ representa la rotación alrededor de V
~ sino sólo su dirección: su magnitud quedará indeterminada. En
pletamente el vector V
cualquier caso la traza de à nos determina el ángulo de rotación.
Teorema de Chasles. El desplazamiento más general de un cuerpo rı́gido consiste
en una translación más una rotación. Este teorema se demuestra en el texto Dynamics
of a rigid body, de Routh.
7.5.
El rotador rı́gido
Es un sólido rı́gido que se mueve sometido a la condición de ligadura que un punto
permanezca fijo. Los movimientos de un rotador rı́gido quedarán especificados por medio
de las tres componentes de la matriz à que relaciona las componentes de los vectores en
el sistema de ejes espacial con el sistema de ejes unido al sólido rı́gido:
~r = Ã~r
o xi =
3
X
aij xj
(7.102)
j=1
En efecto, es suficiente especificar las tres coordenadas de un punto arbitrario del
sólido rı́gido respecto al sistema de ejes espacial para conocer completamente la ubicación
de todos los demás puntos del sólido rı́gido. Es decir, los tres parámetros independientes
de la matriz à sirven para especificar las posiciones de un rotador rı́gido. Es claro que
estos tres parámetros serán funciones del tiempo.
El grupo de rotaciones. El conjunto de todas las infinitas rotaciones de un
cuerpo rı́gido con un punto fijo constituye un grupo. Cada rotación à está especificada
por tres parámetros independientes q1 , q2 y q3 . Un grupo es la siguiente estructura
algebraica:
(i) Existe un conjunto de elementos g = {Ã(q), ∀q1 , q2 , q3 }.
(ii) Si Ã1 y Ã2 ∈ g entonces Ã1 Ã2 ∈ g.
˜
(iii) Si à ∈ g, ∃Ã−1 ∈ g tal que ÃÃ−1 = I.
˜
˜
(iv) ∃I ∈ g tal que I Ã = Ã, ∀Ã ∈ g.
(v) ∀ Ã, B̃, C̃ ∈ g se cumple Ã(B̃ C̃) = (ÃB̃)C̃.
222 / Mecánica clásica avanzada
Estas propiedades se siguen del hecho de que las matrices de rotación son ortogonales. Es sencillo demostrar a partir de lo anterior que:
(a) El producto de dos matrices ortogonales es ortogonal.
(b) Como para toda matriz de rotación det à = 1, se sigue que toda matriz de
rotación tiene inverso.
(c) I˜ es ortogonal.
(d) El producto de matrices obedece la ley asociativa.
Las rotaciones consideradas en abstracto como simples transformaciones geométricas forman un grupo. El conjunto de matrices ortogonales 3 × 3 constituye una representación del grupo de rotaciones.
7.6.
Los ángulos de Euler
Los nueve cosenos directores no son independientes, sólo tres lo son. Podemos
pensar que todos los cosenos directores sean expresados en términos de tres parámetros
independientes φ, θ, ψ:
αij = αij (φ, θ, ψ) ;
i, j = 1, 2, 3
(7.103)
La elección de estos tres parámetros independientes no es única. Una conveniente
elección de φ, θ y ψ, es la siguiente (véase figura 7.5). Se puede efectuar la transformación
de (x) a la posición del cuerpo rı́gido dada por (x) por medio de las siguientes rotaciones:
una rotación por un ángulo φ alrededor del eje x3 , con lo cual los ejes cambian de (x)
a (µ). Una rotación por un ángulo θ alrededor de µ1 , con lo cual los ejes se cambian de
(µ) a (µ′ ). Finalmente una rotación por un ángulo ψ, alrededor del eje µ′3 , con lo cual
los ejes se cambian de (µ′ ) a (x).1 Para expresar la matriz de rotación S̃ en términos
de los ángulos φ, θ y ψ (ángulos de Euler) debemos calcular los cosenos directores en
términos de estos ángulos.
x3, µ 3
x3
µ3′
µ2′
µ2
ϕ
x1
ϕ
µ1
χ3, µ3′
θ
x2
x2
x3
θ
x2
x1
ϕ
µ1, µi
x2
x1
ϕ
ψ
x1
Línea de nodos
Figura 7.5 Angulos de Euler
1 (θ,
φ − π/2) son los ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 , y (θ, π/2 − ψ) son los
ángulos esféricos de x3 respecto a los ejes x1 , x2 , x3 .
Cinemática del cuerpo rı́gido / 223
Para hallar α11 = ~e′1 · ~e1 tomemos los planos que se cortan en la lı́nea de nodos y
que contienen los ejes x1 − x2 y x1 − x2 como en la figura 7.6. Vemos que:
x3
x3
π- θ
α
a
φ
ψ
x2
x2
b
l
x1 θ
x1
Figura 7.6 Planos que se cortan en la lı́nea de nodos
a cos φ = b cos ψ
(7.104)
l2 = a2 + b2 − 2ab cos α
(7.105)
l2 = (a senφ)2 + (b senψ)2 − 2(a senφ)(b senψ) cos (π − θ)
(7.106)
Igualando (7.105) y (7.106) llegamos a:
−b cos α = −a cos2 φ + b senφ senψ cos θ
(7.107)
Ahora, reemplazando (7.104) en (7.107) obtenemos finalmente:
α11 = cos α = cos ψ cos φ − senφ senψ cos θ
(7.108)
α12 = ~e′1 · ~e2 se obtiene de α11 reemplazando a φ por φ + 3π/2:
α12 = cos ψ senφ + cos φ senψ cos θ
(7.109)
α21 = ~e′2 · ~e1 se obtiene de α11 reemplazando a ψ por ψ + π/2:
α21 = −senψ cos φ − senφ cos ψ cos θ
(7.110)
α22 = ~e′2 · ~e2 se obtiene de α21 reemplazando a φ por φ + 3π/2:
α22 = −senψ cos φ + cos φ cos ψ cos θ
(7.111)
224 / Mecánica clásica avanzada
α33 = ~e′3 · ~e3 se obtiene directamente:
α33 = ~e′3 · ~e3 = cos θ
(7.112)
α13 y α23 se obtienen de las relaciones de ortogonalidad siguientes, ecuación (7.38):
α2j1 + α2j2 + α2j3 = 1
(7.113)
Con lo cual se obtiene para α13 :
α213 = 1 − (α211 + α212 ) = 1 − (1 − sen2 ψ sen2 θ)
(7.114)
⇒ α13 = senψ senθ
Similarmente, α221 + α222 = sen2 ψ + cos2 ψ cos2 θ, con lo cual:
α23 = cos ψ senθ
(7.115)
Para calcular a α32 y a α31 usamos la ecuación (7.38) ası́:
α31 α21 + α32 α22 + α33 α23 = 0
(7.116)
α31 α11 + α32 α12 + α33 α13 = 0
(7.117)
Multiplicando a (7.116) por α11 y a (7.117) por α21 y restando:
α32 =
α13 α21 − α23 α11
α33
α22 α11 − α12 α21
(7.118)
Con lo cual se obtiene:
α32 = −senθ cos φ
(7.119)
Por otra parte la relación (7.38) para la fila tres:
α231 + α232 + α233 = 1
(7.120)
nos permite escribir:
α31 = senθ senφ
(7.121)
con lo cual la matriz de rotación es, en definitiva:
à =

cos φ cos ψ − senφ cos θ senψ
senφ cos ψ + cos φ cos θ senψ
senθ senψ

 (7.122)



− cos φ senψ − senφ cos θ cos ψ −senφ senψ + cos φ cos θ cos ψ senθ cos ψ 




senφ senθ
− cos φ senθ
cos θ
Por la forma como fue obtenida, a partir de los cosenos directores, se tiene que Ã
es una matriz ortogonal. Es decir, que Ã−1 se obtiene simplemente trasponiendo a Ã.
Cinemática del cuerpo rı́gido / 225
Del teorema de Euler se sigue que de alguna manera à representa una rotación
única alrededor de cierto eje n̂ = c1~e1 + c2~e2 + c3~e3 bajo un ángulo Φ. El eje de rotación
se halla resolviendo la ecuación de valores propios (7.91), con λ = 1:
3
X
j=1
(aij − δij )Cj = 0 ;
i = 1, 2, 3
(7.123)
El resultado para los cosenos directores del eje n̂ es:
C1 =
senθ(cos ψ − cos φ)
2 senΦ
C2 =
senθ(senφ − senψ)
2senΦ
(7.124)
sen(Φ + ψ) (1 + cos θ)
2senΦ
Donde Φ es el ángulo de rotación alrededor de n̂ que se halla a partir de la traza
de Ã, ecuación (7.97):
C3 =
cos φ =
1 − tr Ã
2
(7.125)
Calculando la traza de à se llega finalmente a:
θ
ψ+φ
Φ
(7.126)
cos = cos cos
2
2
2
Como C12 + C22 + C32 = 1, vemos que dos cosenos directores de n̂ y Φ especifican la
rotación.2
Se puede ver que à se puede obtener también a partir de la definición de los ángulos
de Euler, de acuerdo con la figura 7.5:


 

x1
cos φ senφ 0
µ1


 



 

 µ2  =  −senφ cos φ 0   x2  o ~µ = Ãφ ~x
(7.127)


 



 

x3
µ3
0
0
1


 ′  
1
0
0
µ1
µ1

 




 ′  
 µ2  =  0 cos θ senθ   µ2  o µ~′ = Ãθ ~µ
(7.128)

 



 


µ3
0 −senθ cos θ
µ′3

 ′ 
 
µ1
cos ψ senψ 0
x1



 



 
 x2  =  −senψ cos ψ 0   µ′2  o ~x = Ãψ µ
~′
(7.129)



 



 
µ′3
0
0
1
x3
2 Las
ecuaciones (7.124) y (7.126) se obtienen al comparar los elementos de (7.122) y (7.138).
226 / Mecánica clásica avanzada
De modo que ~x puede obtenerse de ~x a través de:
~x = Ãψ Ãθ Ãφ ~x = Ã~x
(7.130)
Ası́ que:
à = Ãψ Ãθ Ãφ
(7.131)
Al hacer el producto de matrices se llega al resultado para la matriz à dado por
(7.122).
Definiciones alternas de los ángulos de Euler. La convención usada en
mecánica cuántica en los textos de teorı́a de grupos de Wigner, y de momentos angulares de Rose, es diferente a la presentada anteriormente. Allı́ la segunda rotación es
tomada no alrededor del eje intermedio µ1 sino alrededor de µ2 . Es la llamada “convención y” que obviamente dará lugar a expresiones diferentes para la matriz Ã. Es
fácilmente demostrable que para obtener la matriz à en la convención “y” a partir de
la matriz à en la convención “x” bastan las sustituciones:
π
φ →φ+
2
(7.132)
π
ψ →ψ−
2
donde se entenderá a φ como el ángulo de la primera rotación y a ψ como el ángulo de
la tercera rotación, con lo cual:
senφ → cos φ
cos φ → −senφ
senψ → − cos ψ
(7.133)
cos ψ → senψ
Se propone como ejercicio probar estas afirmaciones.
Otra convención es la llamada convención “xyz”, usada en aeronáutica: la primera
rotación es por ángulo φ alrededor de x3 , la segunda por ángulo θ alrededor de x2 y
la tercera por ángulo ψ alrededor de x1 . Es la llamada secuencia 3 2 1. Por ejemplo,
tomando los ejes de coordenadas fijos a un avión de la siguiente manera: x3 perpendicular
al avión en el centro de masa, x2 paralelo a las alas y x1 a lo largo del eje principal del
avión, una posición arbitraria de la nave se puede obtener a partir de la posición en que
los ejes (x) coinciden con los ejes (x) por medio de la siguiente secuencia de rotaciones:
una alrededor de x3 por ángulo φ, otra alrededor de x2 por ángulo θ y la tercera alrededor
de x1 por un ángulo ψ.
7.7.
Descripción de las rotaciones en términos de n̂ y
Φ. Parámetros de Euler
Hemos mostrado que los desplazamientos de un cuerpo rı́gido con un punto fijo
se pueden expresar por medio de rotaciones. Cada rotación puede especificarse por tres
Cinemática del cuerpo rı́gido / 227
parámetros independientes que pueden ser por ejemplo tres cosenos directores independientes, tres ángulos de Euler, o un eje de rotación y un ángulo. Vimos que las rotaciones
constituyen un grupo matemático que tiene una representación obvia en términos de matrices 3 × 3 ortogonales (hay un homomorfismo entre las rotaciones fı́sicas y las matrices
ortogonales 3 × 3).
Queremos buscar una representación de la transformación de coordenadas en términos
de los parámetros de una rotación: dos cosenos directores del eje de rotación y el ángulo
de rotación.
Formas “activa” y “pasiva” de una rotación. Hasta ahora hemos considerado
que la matriz à rota los ejes coordenados, de modo que la ecuación ~r = Ã~r simplemente
expresa cómo están relacionadas las componentes de un vector vistas respecto a dos
diferentes sistemas de coordenadas: Ã actúa sobre el sistema de coordenadas dejando
los vectores inalterados. Hay además la siguiente interpretación: Ã puede pensarse como
un operador que actúa sobre los vectores ~r para cambiarlos por vectores diferentes ~r′
con respecto al mismo sistema de coordenadas. Por ejemplo, en dos dimensiones, en vez
de rotar en el sentido contrario a las agujas del reloj al sistema de coordenadas por un
ángulo φ, se puede rotar al vector ~r en el sentido del reloj por un ángulo φ para obtener
el vector ~r′ (véase figura 7.7). Las componentes del nuevo vector, ~r′ , estarán entonces
x2
x2
Pasiva:
r = Ar
r
x1
r
x2
Activa
r ′ = Ar
i
r′
r
i
φ
φ
x1
x1
Figura 7.7 Formas activa y pasiva de una rotación
relacionadas con las del viejo vector ~r, por medio de la ecuación ~r′ = Ã~r. En general Ã
corresponde a una rotación en sentido contrario a las agujas del reloj por un ángulo φ
cuando sea aplicada al sistema de coordenadas, y como una rotación en sentido de las
agujas del reloj por un ángulo φ cuando sea aplicada a los vectores.
Rotaciones finitas. Usaremos el punto de vista activo, según el cual en un sistema
de coordenadas dado realizamos una rotación de un vector por un ángulo Φ alrededor
de un eje n̂. Se trata de encontrar la matriz à que relaciona las componentes del viejo
y del nuevo vector.
De las figuras 7.8 y 7.9 se ve que:
~ + N~V + N~Q
~r′ = ON
(7.134)
donde los vectores tienen las siguientes expresiones en términos de ~r, n̂ y Φ, teniendo en
228 / Mecánica clásica avanzada
N
P
V
Φ
Q
r′
i
r
n
O
Figura 7.8 Rotación de un vector alrededor de un eje n̂. Vista lateral.
N
V
Φ
P
r ×n
Q
Figura 7.9 Rotación de un vector alrededor de un eje n̂. Vista en dirección ~n.
Cinemática del cuerpo rı́gido / 229
cuenta que N V = N Q cos Φ y V Q = N Q senΦ:
~ =
ON
(n̂ · ~r)n̂
N~Q =
~ ) cos Φ
(~r − ON
(7.135)
V~Q = ~r × n̂ senΦ
Con lo cual obtenemos:
~r′ = ~r cos Φ + n̂(n̂ · ~r)(1 − cos Φ) + ~r × n̂ senΦ
(7.136)
Esta fórmula es válida para cualquier rotación finita de un vector. Para Φ infinitesimal, dicha expresión toma la forma:
~r′ = ~r + ~r × n̂Φ
(7.137)
en concordancia con la fórmula (3.148). Escrita en forma de matriz, la ecuación (7.136)
es:
 ′
x1
 
 ′
x2  =
 
 
x′3
(7.138)

 
x1
C1 C2 c + C3 senΦ C1 C3 c−C2 senΦ
cos Φ+C12 c

 

 
2
C1 C2 c−C3 senΦ
x2 
c
C
C
c+C
senΦ
cos
Φ+C
2 3
1
2

 

 
x3
C1 C3 c+C2 senΦ C2 C3 c−C1 senΦ
cos Φ+C32 c
donde hemos llamado c = (1 − cos Φ).
En (7.138) la matriz à depende de los cuatro parámetros no independientes C1 ,
C2 , C3 y Φ. Suele expresarse esta matriz en términos de los llamados parámetros de
Euler, no independientes, e0 , e1 , e2 , e3 , definidos ası́:
e0 =
cos
Φ
2
(7.139)
Φ
ei = Ci sen ; i = 1, 2, 3
2
En términos de estos parámetros (7.136) toma la forma:
~r′ = ~r(e20 − e21 − e22 − e23 ) + 2~e(~e · ~r) + 2(~r × ~e)e0
y la matriz à entonces será:
 2
e0 + e21 − e22 − e23
2(e1 e2 + e0 e3 )


e20 − e21 + e22 − e23
à = 
 2(e1 e2 − e0 e3 )

2(e1 e3 + e0 e3 )
2(e2 e3 − e0 e1 )
2(e1 e3 − e0 e2 )
2(e2 e3 + e0 e1 )
e20 − e21 − e22 + e23
(7.140)






(7.141)
230 / Mecánica clásica avanzada
Usando las ecuaciones (7.124), (7.126) y (7.139) se obtienen las siguientes relaciones
entre los parámetros de Euler y los ángulos de Euler:
e0 =
cos
θ
φ+ψ
cos
2
2
e1 =
sen
φ−ψ
θ
cos
2
2
e2 =
θ
φ−ψ
sen sen
2
2
e3 =
cos
(7.142)
φ+ψ
θ
sen
2
2
Los parámetros y los ángulos de Euler fueron hallados por Euler en 1776, quien
llamó ei a los parámetros simétricos.
7.8.
Representación del grupo de rotaciones
por medio de matrices 2 × 2. Los parámetros
de Cayley-Klein
Representación de un grupo. En el numeral 7.5 hemos mencionado que el conjunto de todos los desplazamientos de un cuerpo rı́gido con un punto fijo satisface los
axiomas de un grupo matemático: (i) Dos desplazamientos sucesivos cualesquiera del
cuerpo equivalen a un desplazamiento; (ii) Existe el desplazamiento identidad que consiste en no desplazar el cuerpo; (iii) Para todo desplazamiento existe el desplazamiento
inverso o sea aquel que retorne el cuerpo a su posición original; (iv) Los desplazamientos
sucesivos del cuerpo rı́gido satisfacen la propiedad asociativa.
El conjunto de todas las matrices ortogonales 3 × 3 constituyen una representación
del grupo de los desplazamientos de un rotador rı́gido en el sentido de que a cada desplazamiento del rotador se le puede asociar una matriz ortogonal 3 × 3 y sólo una. Se dice
entonces que hay un homomorfismo entre el grupo de los desplazamientos del rotador
rı́gido y el grupo de las matrices ortogonales 3×3. El grupo de matrices ortogonales 3×3
es llamado el grupo O(3). El grupo de las matrices ortogonales 3 × 3 con determinante
+1, que en rigor es el que corresponde a los desplazamientos de un rotador rı́gido, se
llama el grupo SO(3).
Vectores y diádicos en un espacio bidimensional. En un espacio bidimensional, un vector arbitrario V~ puede expresarse en términos de los vectores unitarios ~e1 , e~2 :
~ = V1~e1 + V2~e2 . V
~ y ~ei pueden representarse por matrices 2 × 1:
V

V~ → 
V1
V2


 ~e1 → 
1
0


 ~e2 → 
0
1


(7.143)
Cinemática del cuerpo rı́gido / 231
Podemos definir las dı́adas unitarias ~e1~e1 , ~e1~e2 , ~e2~e1 y ~e2~e2 , que pueden representarse por matrices 2 × 2:




1 0
0 1
 ~e1~e2 → 

~e1~e1 → 
0 0
0 0
(7.144)




0 0
0 0
 ~e2~e2 → 

~e2~e1 → 
1 0
0 1
En una dı́ada unitaria el primer vector se representa por una matriz columna y el
segundo por una matriz fila. Por ejemplo:
 


1
0 1

~e1~e2 →   (0 1) = 
(7.145)
0
0 0
Nótese que:

0
~e1 ∧ ~e2 = ~e1~e2 − ~e2~e1 = 

1

−1 0
~~
Un diádico D
puede expresarse en términos de las dı́adas unitarias:
~~
D
= D11~e1~e1 + D12~e1~e2 + D21~e2~e1 + D22~e2~e2
y puede representarse por medio de una matriz 2 × 2:


D11 D12
~~

D →
D21 D22
~1, es:
El diádico unidad, ~

~
~1 = ~e1~e1 + ~e2~e2 → 
1 0
0 1
Se definen los diádicos ~
~σ x , ~
~σ y y

0
~
~σ x = ~e1~e2 + ~e2~e1 → 
1

~
~σ y = −i~e1~e2 + i~e2~e1 → 

~
~σ z = ~e1~e1 − ~e2~e2 → 
1


(7.146)
(7.147)
(7.148)
(7.149)
~~σ z de la siguiente manera:

1
 = σ̃x
0
0
−i
i
0
0
0 −1

 = σ̃y

 = σ̃z
(7.150)
232 / Mecánica clásica avanzada
Las dı́adas unitarias pueden expresarse en términos de ~~σ i y ~~1:
~e1~e1 =
1 ~
(~1 + ~~σ z ) ;
2
~e1~e2 =
1
~e2~e1 = (~
~σ x − i~~σ y ) ;
2
1 ~
(~σ x + i~~σ y )
2
1 ~
~e2~e2 = (~1 − i~~σ z )
2
(7.151)
~
Un diádico arbitrario puede igualmente expresarse en términos de ~1 y ~~σ i :
1
~~
~1 + 1 (V11 − V22 )~~σ z + 1 (V12 + V21 )~~σ x + i (V12 − V21 )~~σ y
D
= (V11 + V22 )~
2
2
2
2
(7.152)
O sea que cualquier diádico de traza cero puede expresarse en términos de ~~σ x , ~~σ y ,
~
~
~ a cualquier diádico de traza cero:
~σ z . Llamaremos V
~
~~σ y
~~σ z
~σ x
~
~ = Vx √
V
+ Vy √ + Vz √
2
2
2
(7.153)
Existe un isomorfismo entre los diádicos bidimensionales de traza cero y los vectores
~ . En efecto, el conjunto de todos los diádicos bidimensionales de traza cero
ordinarios V
satisface las mismas propiedades que el conjunto de todos los vectores ordinarios: (i) La
suma de dos diádicos de traza cero es un diádico de traza cero, la suma es conmutativa;
(ii) El producto de un número por un diádico de traza cero es un diádico de traza cero;
(iii) La suma de diádicos es asociativa; (iv) Existe el diádico cero. Además, si se define
el producto escalar de dos diádicos como:
~
~
~ = V ⋆ W11 + V ⋆ W12 + V ⋆ W21 + V ⋆ W22
~ : W
V
11
12
21
22
(7.154)
Vemos que este producto escalar satisface las mismas propiedades del producto
escalar de vectores. Para ello es suficiente mostrar que:
~
~σ i : ~
~σ j = 2δij ;
i, j = x, y, z
(7.155)
lo cual es evidente de las ecuaciones (7.150) y (7.154). En resumen, a cada diádico de
traza cero de la forma (7.153) se le puede hacer corresponder el vector ordinario:
~ = Vx~e1 + Vy ~e2 + Vz ~e3
V
(7.156)
Homomorfismo entre las rotaciones en el espacio bidimensional y las
~ es rotado para convertirse en V
~ ′:
rotaciones en el espacio ordinario. Si el vector V
~ ′ = ÃV
~
V
(7.157)
donde à es la matriz de rotación 3 × 3, el diádico correspondiente en el espacio bidimensional deberá presentar una transformación correspondiente en virtud del mencionado
homomorfismo. Como:
Vi′ =
3
X
j=1
aij Vj
(7.158)
Cinemática del cuerpo rı́gido / 233
~′
entonces V~ será:
3
3
1
~ ′ XX
~σ i
aij Vj √ ~
V~ =
2
i=1 j=1
(7.159)
Por otra parte, una transformación de un diádico es de la forma:
~ ′ ~~ ~
~~ †
~ ·Q
V~ = Q
·V
(7.160)
~~ †
~~
donde Q
es el adjunto de Q:
†
~~
Q
= Q⋆11 ê1 ê1 + Q⋆21 ê1 ê2 + Q⋆12 ê2 ê1 + Q⋆22 ê2 ê2
′
~
~ es:
Explı́citamente V
 


2
2
X
X
~′ = 
Qij êi êj  · 
V
Vkl êk êl  ·
i,j=1
2
X
k,l=1
2
X
Q⋆mn ên êm
m,n=1
(7.161)
!
(7.162)
(Q̃Ṽ Q̃† )im êi êm
i,m=1
~′
Por otra parte V~ está dado por (7.159). Por tanto, según (7.152) y (7.153):
3
i
1 h
Q̃Ṽ Q̃†
+ Q̃Ṽ Q̃†
2
12
21
3
i
i h
Q̃Ṽ Q̃†
− Q̃Ṽ Q̃†
2
12
21
1 X
√
a1j Vj =
2 j=1
1 X
√
a2j Vj =
2 j=1
3
1 X
√
a3j Vj =
2 j=1
(7.163)
i
1 h
− Q̃Ṽ Q̃†
Q̃Ṽ Q̃†
2
22
11
~~
Estas ecuaciones nos permiten relacionar à con Q̃. El diádico Q
en (7.160) debe
ser unitario:
~~ † ~~
~~ ~~ †
Q
·Q=1=Q
·Q
(7.164)
~~
Si llamamos α, β, γ y δ las componentes de Q:
~~
Q
= αê1 ê1 + βê1 ê2 + γê2 ê1 + δê2 ê2
(7.165)
234 / Mecánica clásica avanzada
~~ † ~~
Q
.Q =
(α⋆ ê1 ê1 + γ ⋆ ê1 ê2 + β ⋆ ê2 ê1 + δ ⋆ ê2 ê2 )·
(αê1 ê1 + βê1 ê2 + γê2 ê1 + δê2 ê2 )
(|α|2 + |γ|2 )ê1 ê1 + (α⋆ β + γ ⋆ δ)ê1 ê2
=
(7.166)
+(β ⋆ α + δ ⋆ γ)ê2 ê1 + (|β|2 + |δ|2 )ê2 ê2
ê1 ê1 + ê2 ê2 + ê3 ê3 = ~~1
=
Con lo cual obtenemos:
|α|2 + |γ|2 = 1
α⋆ β + γ ⋆ δ = 0
(7.167)
|β|2 + |δ|2 = 1
Las ecuaciones (7.167) representan cuatro condiciones sobre los elementos α, β, γ y
δ, que por ser complejos contienen ocho parámetros. Las relaciones (7.167) dejan 8−4 = 4
parámetros independientes. Si además se impone la condición de que el determinante de
Q̃ sea +1, obtenemos:
αδ − βγ = 1 ⇒ β = −γ ⋆ ; δ = α⋆ ; αα⋆ + ββ ⋆ = 1
(7.168)
Con lo cual quedan sólo tres parámetros independientes de los ocho que contiene
Q̃. Entenderemos pues, que en (7.165) α, β, γ y δ satisfacen las condiciones de unitaridad
(7.167) y de unimodularidad (7.168).
En (7.163) se requiere conocer la matriz Q̃Ṽ Q̃† . Esto es:

Q̃Ṽ Q̃† = 
=
α
β
γ
δ


V11
V12
V21
V22


α⋆
γ⋆
β⋆
δ⋆


|α|2 V11 +|β|2 V22 +α⋆ βV21 +αβ ⋆ V12
γ ⋆ αV11 +γ ⋆ βV21 +δ⋆ αV12 +βδ⋆ V22
α⋆ γV11 +α⋆ δV21 +β ⋆ γV12 +β ⋆ δV22
|γ|2 V11 +|δ|2 V22 +γ ⋆ δV21 +δ⋆ γV12
!
(7.169)
Cinemática del cuerpo rı́gido / 235
De (7.163) y (7.169) obtenemos las siguientes relaciones:
3
√ X
a1j Vj = (γ ⋆ α + α⋆ γ)V11 + (γ ⋆ β + α⋆ δ)V21
2
j=1
+(δ ⋆ α + β ⋆ γ)V12 + (βδ ⋆ + β ⋆ δ)V22
3
√ X
a2j Vj = i(γ ⋆ α − α⋆ γ)V11 + i(γ ⋆ β − α⋆ δ)V21
2
j=1
(7.170)
+i(δ ⋆ α − β ⋆ γ)V12 + i(βδ ⋆ − β ⋆ δ)V22
3
√ X
a3j Vj = (|α|2 − |γ|2 )V11 + (|β|2 − |δ|2 )V22
2
j=1
+(α⋆ β − γ ⋆ δ)V21 + (αβ ⋆ − δ ⋆ γ)V12
Como por otra parte:
V1 =
1
√ (V12 + V21 )
2
V1 =
i
√ (V12 − V21 )
2
V1 =
1
√ (V11 + V22 )
2
(7.171)
Obtenemos usando (7.170) y (7.171) las siguentes relaciones entre las componentes
de à y las de Q̃, igualando coeficientes de los Vij :
a13 =
γ ⋆ α + α⋆ γ
(a11 + ia13 ) =
δ⋆α + β ⋆γ
a23 =
i(γ ⋆ α − α⋆ γ)
(a21 + ia22 ) =
i(δ ⋆ α − β ⋆ γ)
a33 =
|α|2 − |γ|2
(a31 + ia32 ) =
αβ ⋆ − δ ⋆ γ
(7.172)
236 / Mecánica clásica avanzada
Con lo cual la matriz à toma la forma:
 1
i 2
(α2 − γ 2 + δ 2 − β 2 )
(γ − α2 + δ 2 − β 2 )
γδ − αβ
 2
2


1 2
i
à = 
 (α2 + γ 2 − β 2 − δ 2 )
(α + γ 2 + β 2 + δ 2 ) −i(αβ + γδ)
 2
2

βδ − αγ
i(αγ + βδ)
αδ + βγ








(7.173)
donde hemos usado además las relaciones α⋆ = δ, γ ⋆ = −β de la ecuación (7.168). Ã
es una matriz que está expresada en términos de α, β, γ, δ, o sea que los parámetros
α, β, γ, δ, sirven para especificar las rotaciones de un cuerpo rı́gido. Son llamados los
parámetros de Cayley-Klein, estudiados por estos autores en los años 1875-1879.
En resumen, hemos mostrado que si al efectuar una rotación un vector V~ ′ se cambia
~ ′ = ÃV
~ , entonces el diádico V~~ en el espacio bidimensional que corresponde
en el vector V
~ ′ ~~ ~~ ~~ †
V ·Q . Por tanto, a cada rotación del cuerpo rı́gido
a V~ se transforma en el diádico V~ = Q·
˜ y
le corresponde una matriz à y una matriz Q̃ 2 × 2. La matriz Q̃ es unitaria, Q̃Q̃† = I,
unimodular, det Q̃ = 1. El conjunto de todas las matrices unitarias y unimodulares 2 × 2
es llamado el grupo SU (2). Hay pues un homomorfismo entre los grupos SO(3) y SU (2).
Si en (7.173) se hacen las siguientes sustituciones de los parámetros de Cayley-Klein en
términos de e0 , e1 , e2 y e3 :
α = e0 + ie3 ; γ = −β ⋆
β = e2 + ie1 ;
(7.174)
δ = α⋆
Se obtiene exactamente la matriz (7.141), o sea que en efecto e0 y ei son los
parámetros de Euler definidos en (7.142). Usando (7.174) y las expresiones para e0 y ei
en términos de los ángulos de Euler, ecuación (7.142), obtenemos para α, β, γ y δ en
términos de los ángulos de Euler:
α = ei(φ+ψ)/2 cos
θ
;
2
β = iei(ψ−φ)/2 sen
θ
2
(7.175)
θ
θ
γ = ie−(ψ−φ)/2 sen ; δ = e−i(φ+ψ)/2 cos
2
2
~~
El diádico Q
definido en (7.166) puede escribirse en términos de los diádicos de
~
Pauli y el diádico unidad, ~~σ i , ~1, reemplazando (7.151) en (7.165):
1
i
1
~~
~ 1
Q
= (α + δ)~1 + (α − δ)~~σ z + (β + γ)~~σ x + (β − γ)~~σ y
2
2
2
2
(7.176)
que usando (7.174) toma la forma:3
~~
~1 + ie1~~σ x + ie2~~σ y + ie3~~σ z
Q
= e0~
3 Los
e0 , ei , forman un sistema de cuaterniones.
(7.177)
Cinemática del cuerpo rı́gido / 237
Para una rotación alrededor del eje x1 , de acuerdo con (7.142) se tiene que e1 =
senθ/2, e2 = e3 = 0. Por tanto:
θ~
~~
~1 + i sen θ ~
~σ x
Q
θ = cos
2
2
(7.178)
donde θ es el ángulo de rotación. Para una rotación por φ alrededor del eje x3 :
φ~
~~
~1 + i sen φ ~
Q
~σ z
φ = cos
2
2
(7.179)
Cada diádico de Pauli ~
~σ i está asociado con una rotación alrededor de un eje particular y puede considerarse como el “rotador unitario” para dicho eje.
Ejemplo 7.8.1 Mostrar que los diádicos de Pauli anticonmutan mutuamente, esto es,
que:
~
~σ i · ~
~σ j = −~
~σ j · ~
~σ i
(7.180)
Hagamos los nueve productos ~~σ i · ~~σ j , usando las definiciones (7.150):
~
~
~σ x · ~
~σ x = ê1 ê1 + ê2 ê2 = ~1 ;
~~σ x · ~~σ y = iê1 ê1 − iê2 ê2 = i~~σ z
~
~σ x · ~
~σ z = −ê1 ê2 + ê2 ê1 = −i~~σy ; ~~σ y · ~~σ x = −iê1 ê1 + iê2 ê2 = −i~~σ z
~
~1 ;
~σ y · ~
~σ y = ê1 ê1 + ê2 ê2 = ~
~~σ y · ~~σ z = iê1 ê2 + iê2 ê1 = i~~σ x
~
~σ z · ~
~σ x = ê1 ê2 − ê2 ê1 = i~
~σ y ;
~~σ z · ~~σ y = −iê1 ê2 − iê2 ê1 = −i~~σx
(7.181)
~
~1
~σ z · ~
~σ z = ê1 ê1 + ê2 ê2 = ~
Las ecuaciones (7.181) se pueden escribir en forma compacta ası́:
~
~1δij + i
~σ i · ~
~σ j = ~
3
X
ǫijk ~
~σ k
(7.182)
k=1
donde ǫij es el tensor de Levi-Civita completamente antisimétrico. Se puede ver directamente que las ~
~σ i obedecen las relaciones de conmutación siguientes:
~
~σ i · ~
~σ j − ~
~σ j · ~
~σ i = 2i
3
X
ǫijk ~~σ k
(7.183)
k=1
y de anticonmutación:
~
~1δij
~σ i = 2~
~σ j · ~
~σ j + ~
~σ i · ~
~~
Ejemplo 7.8.2 Mostrar que Q
θ puede escribirse simbólicamente como:
(7.184)
238 / Mecánica clásica avanzada
~~
i~
~
σx (θ/2)
Q
θ = e
(7.185)
2
donde el exponencial denota una serie infinita de términos. Como según (7.181) ~~σ x ≡
2n
2n+1
~
~
~
~σ x · ~
~σ x = ~1, se sigue que ~~σ = ~1 y que ~~σ
= ~~σ x para n = 0, 1, 2, ... Por lo tanto:
x
x
θ
≡
cos ~
~σ x
2
2n
1
θ
~~σ x θ
(−1)n
= ~~1 cos
(2n)!
2
2
n=0
θ
~
sen ~σ x
≡
2
2n+1
1
θ
θ
n
~
(−1)
= ~~σ x sen
~σ x
(2n
+
1)!
2
2
n=0
∞
X
∞
X
(7.186)
~~
Con lo cual Q
θ puede expresarse en la forma:
θ
θ
θ
θ
~
~~
~
~
+ +i~~σ x sen = cos(~~σ x ) + i sen(~~σ x ) = ei~σ x (θ/2)
Q
θ = 1 cos
2
2
2
2
(7.187)
†
Como ~
~σ i son hermı́ticos, ~~σ i = ~~σ i , se sigue que:
~~ †
−i~
~
σx (θ/2)
Q
θ = e
(7.188)
Ejemplo 7.8.3 Hallar la forma de la matriz de rotación para una rotación arbitraria,
definida por los ángulos de Euler.
~~
Q
puede escribirse como el producto de tres rotaciones sucesivas, en virtud del
homomorfismo con el grupo de rotaciones:
~
~
~
~~ †
Q
= ei~σz (ψ/2) ei~σ µ1 (θ/2) ei~σ z (φ/2)
(7.189)
~~
Las tres rotaciones que aparecen en Q
son alrededor de los ejes z, µ1 y z. Es
deseable expresarlas en términos de rotaciones alrededor de ejes del mismo sistema de
coordenadas. Para ello hay que notar que cada uno de los diádicos que aparece en el
operador de rotación está asociado con el respectivo eje de rotación.
Como el eje x conduce al eje µ1 por medio de la rotación Aφ , correspondientemente
~
~σ µ1 será, de acuerdo con la ecuación (7.160):
~
~
~
~σ µ1 = ei~σ z (θ/2)~~σ x · e−i~σz (θ/2)
(7.190)
Como por otra parte:
~1 cos
ei~σµ1 (θ/2) = ~
~
θ
θ
+ i~~σ µ1 sen
2
2
(7.191)
~~
Se sigue, usando la ecuación (7.190) y la unitariedad Q
φ:
~
~
~
~
ei~σµ1 (θ/2) = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (φ/2)
(7.192)
Cinemática del cuerpo rı́gido / 239
~~
Por tanto Q
toma la foma:
~
~
~
~~
Q
= ei~σz (ψ/2) ei~σ z (φ/2) ei~σ x (θ/2)
(7.193)
Por otra parte, el eje z se obtiene del eje µ′3 por medio de la rotación Aψ , y µ′1 se
obtiene de µ3 = z por medio de Ãθ . Por lo tanto ~~σ z puede escribirse en términos de ~~σ z
como:
~
~
~
~
~
~σ z = ei~σ z (ψ/2) ei~σ µ1 (θ/2)~
~σ z e−i~σµ1 (θ/2) e−i~σz (ψ/2)
(7.194)
Usando (7.192):
~
~
~
~
~
~
~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · e−i~σz (φ/2) · σz .ei~σ z (φ/2) ·
e
−i~
~
σ x (θ/2)
·e
−i~
~
σ z (φ/2)
·e
(7.195)
−i~
~
σ z (ψ/2)
~~
~~
Notando que ~
~σ z y Q
φ conmutan y que Qφ es unitario:
~
~
~
~
~
~
~
~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σx (θ/2) · σz · e−i~σ x (θ/2) · e−i~σz (φ/2) · e−i~σ z (ψ/2)
(7.196)
Se sigue entonces que:
~
~
ei~σ z (ψ/2) =
~
~
~
~
ei~σz (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σ z (ψ/2) · e−i~σ x (θ/2) ·
~
(7.197)
~
e−i~σz (φ/2) · e−i~σz (ψ/2)
O sea:
~
~
~
~
~
~
ei~σ z (ψ/2) = ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σz (ψ/2) · e−i~σx (θ/2) · e−i~σz (φ/2)
(7.198)
~~
Reemplazando (7.198) en (7.193) obtenemos para Q:
~
~
~
~
~
~
~
~~
Q
= ei~σz (φ/2) ·ei~σ x (θ/2) ·ei~σ z (ψ/2) ·e−i~σ x (θ/2) ·e−i~σ z (φ/2) ·ei~σ z (φ/2) ·ei~σ x (θ/2)
(7.199)
~~
Con lo cual, usando la unitaridad de los operadores, se obtiene finalmente para Q:
~
~
~
~~
Q
= ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2)
(7.200)
~~
Hemos conseguido expresar a Q
en términos de rotaciones alrededor de los ejes
~~
del sistema de coordenadas espacial. Es posible, de manera análoga, expresar a Q
en
~~
términos de rotaciones respecto a los ejes fijos al cuerpo rı́gido Q de donde toma la
forma:
~
~
~
~~
Q
= ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2)
(7.201)
Ejercicio 7.8.1 Demostrar que si (e0 , ei ) y (e′0 , e′i ) son los parámetros de Euler que describen dos rotaciones A y A′ , entonces los parámetros de la rotación A” = A′ A están
expresados en términos de los parámetros de las rotaciones A, A′ , por:
240 / Mecánica clásica avanzada
e′1 ′ = e1 e′0 + e2 e′3 − e3 e′2 + e0 e′1
e′2 ′ = −e1 e′3 + e2 e′0 + e3 e′1 + e0 e′2
(7.202)
e′3 ′ = e1 e′2 − e2 e′1 + e3 e′0 + e0 e′3
e′0 ′ = e0 e′0 − e1 e′1 − e2 e′2 − e3 e′3
Ejercicio 7.8.2 Demostrar que si (α, β, γ, δ) y (α′ , β ′ , γ ′ , δ ′ ) son los parámetros de CayleyKlein que describen dos rotaciones A y A′ , entonces los parámetros (α′′ , β ′′ , γ ′′ , δ ′′ ) de
la rotación A′′ = A′ A están expresados en términos de los parámetros de A, A′ , por:
α′′ = αα′ + γ ′ β
β” = αβ ′ + βδ ′
γ ′′ = γα′ + δ ′ γ
δ” = γβ ′ + δδ ′
(7.203)
Ejercicio 7.8.3 Interpretación geométrica del homomorfismo entre SO(3) y SU (2). Sea
una esfera y una figura geométrica F en ella (véase figura 7.10). Se coloca la esfera sobre
un plano. La normal al plano en el punto de contacto corta a la esfera en el punto T .
La proyección estereográfica de F en el plano es P . Al punto T se le llama vértice de la
proyección.
T
n
F
P
Figura 7.10 Figura geométrica F dentro de una esfera
Al rotar la esfera alrededor de n̂, en la figura, F se cambia en F ′ y su proyección
estereográfica P se cambia en P ′ . Entonces a cada rotación de la esfera le corresponde
cierta transformación en el plano, llamada transformación homográfica.
Estas transformaciones cambian cı́rculos en el plano por cı́rculos en el plano. Sea
z = x + iy un punto del plano y z ′ = x′ + iy ′ el punto del plano que se obtiene de z
mediante la transformación homográfica. (a) Mostrar que:
z′ =
az + b
cz + d
(7.204)
Cinemática del cuerpo rı́gido / 241
donde a, b, c y d son constantes reales o complejas.
(b) Mostrar que el resultado de dos homografı́as sucesivas:
z′ =
α′ z + β ′
γ ′z + δ′
y
z ′′ =
α′′ z ′ + β ′′
γ ′′ z ′ + δ ′′
(7.205)
Es una homografı́a:
z ′′′ =
α′′′ Z + β ′′′
γ ′′′ Z + δ ′′′
(7.206)
donde la relación entre (α′′′ , β ′′′ , γ ′′′ , δ ′′′ ) con (α′ , β ′ , γ ′ , δ ′ ) y (α′′ , β ′′ , γ ′′ , δ ′′ )
está dada por expresiones análogas a (7.203). Argumentar que lo anterior muestra cone~~
xión entre las rotaciones y las transformaciones homográficas, y que por tanto las Q
del
grupo SU (2) corresponden a transformaciones homográficas, donde los parámetros de
Cayley-Klein son los parámetros que caracterizan la transformación homográfica correspondiente a una rotación de un sólido rı́gido (véase el texto de L.V. Ahlfors, Análisis de
variable compleja, Aguilar, 1966).
7.9.
Las rotaciones infinitesimales. Cinemática de las
rotaciones
Las coordenadas rı́gidamente unidas al cuerpo rı́gido permiten representar cualquier punto del mismo ~r = (x1 , x2 , x3 ). La rigidez del cuerpo se puede expresar diciendo
que ningún punto se puede desplazar con relación al origen.
Es decir:
~r˙ = 0
(7.207)
Los desplazamientos del cuerpo son detectables en el sistema de coordenadas espacial relacionado con el del cuerpo rı́gido por medio de la matriz de rotación ÃT ,
~r = ÃT ~r. Como el cuerpo rı́gido se desplaza respecto al sistema de coordenadas espacial, ÃT habrá de ser función del tiempo, con lo cual:
~r(t) = ÃT (t)~r
(7.208)
Es posible escoger los sistemas de coordenadas de modo que ~r(0) = ~r, lo cual
implica que:
ÃT (0) = I˜
(7.209)
Podemos decir que el cuerpo rı́gido en el tiempo t estará descrito por la transformación ÃT (t) que evoluciona de manera continua a partir de la transformación identidad.
Además es posible suponer que para un tiempo infinitesimal, ÃT (∆t) difiere de la identidad I˜ por términos del orden de ∆t.
242 / Mecánica clásica avanzada
Rotaciones infinitesimales. Al cabo de un tiempo infinitesimal ∆t, un punto del
cuerpo se habrá desplazado una cantidad infinitesimal ∆~r = ~r(∆t) − ~r(0) = ~r(∆t) − ~r0 ,
respecto a los ejes espaciales. Por lo tanto:
~r(∆t) = ~r0 + ∆~r
(7.210)
Existe alguna matriz, con componentes infinitesimales, ǫ̃(∆t), tal que:
∆~r = ǫ̃(∆t)~r0
(7.211)
Por lo cual:
~r(∆t) = (I˜ + ǫ̃)~r0 = (I˜ + ǫ̃)~r(0)
(7.212)
La matriz I˜ + ǫ̃ describe cómo están relacionadas las componentes del vector de
posición de un punto del cuerpo rı́gido en los sistemas de coordenadas espacial y del
cuerpo rı́gido, según la interpretación pasiva de la matriz de rotación cuando los ejes
fijos al cuerpo rı́gido han rotado alrededor de un eje n̂ un ángulo δΦ en el sentido de la
mano derecha. Desde el punto de vista activo, I˜ + ǫ̃ describe cómo cambia el vector de
posición de un punto del cuerpo rı́gido, en el sistema de coordenadas espacial, cuando
se rota el cuerpo rı́gido alrededor del eje n̂ por un ángulo δΦ según la regla de la mano
izquierda. De acuerdo con esta última interpretación, para Φ infinitesimal, Ã = I˜ + ǫ̃
estará dada por la ecuación (7.138):


1
C3 δΦ −C2 δΦ





−C
δΦ
1
C
δΦ
I˜ + ǫ̃ = 
(7.213)
3
1




C2 δΦ −C1 δΦ
1
donde C1 , C2 y C3 son los cosenos directores del eje de rotación. De acuerdo con (7.210),
(7.137) y (7.211), podemos escribir:
∆~r = ǫ̃~r0 = (~r0 × n̂)δΦ = −(n̂δΦ) × ~r0
(7.214)
Usando el tensor de Levi-Civita para expresar el producto vectorial:
3
X
ǫij x0j =
3 X
3
X
ǫijk x0j Ck δΦ
(7.215)
j=1 k=1
j=1
Como ~r0 es arbitrario, se debe cumplir:
ǫij =
3
X
ǫijk Ck δΦ
(7.216)
k=1
Es decir, la matriz ǫ̃ es completamente antisimétrica: ǫ̃T = −ǫ̃ y proporcional a δΦ.
Las rotaciones infinitesimales próximas a la identidad tienen la propiedad conmutativa:
(I˜ + ǫ̃a )(I˜ + ǫ̃b ) =
I˜ + ǫ̃a + ǫ̃b + ǫ̃a ǫ̃b
(I˜ + ǫ̃b )(I˜ + ǫ̃a ) =
I˜ + ǫ̃b + ǫ̃a + ǫ̃b ǫ̃a
(7.217)
Cinemática del cuerpo rı́gido / 243
Vemos que al primer orden en la cantidad infinitesimal δΦ las rotaciones conmutan.
En general dos rotaciones finitas no conmutan. Tampoco conmuta una rotación finita
con una infinitesimal:
Ã(I˜ + ǫ̃) =
à + Ãǫ̃
(I˜ + ǫ̃)Ã =
à + ǫ̃Ã
(7.218)
La rotación inversa a I˜ + ǫ̃ es I˜ − ǫ̃, al primer orden en δΦ:
(I˜ + ǫ̃)(I˜ − ǫ̃) = I˜ − ǫ̃2
(7.219)
O sea que:
~r0 = (I˜ − ǫ̃)~r
(7.220)
Por tanto al primer orden en δΦ, ǫ̃~r = ǫ̃~r0 = ∆~r.
Generadores infinitesimales del grupo de rotaciones. La matriz ǫ̃ puede
escribirse en la forma siguiente, según (7.213):




0 0 −1
0 0 0








 δΦ + C2  0 0 0  δΦ
0
0
1
ǫ̃ = C1 








1 0 0
0 −1 0
(7.221)


0 1 0




 δΦ
−1
0
0
+C3 




0 0 0
o también:
ǫ̃ =
3
X
i=1
Ci G̃i δΦ = (C1 ê2 ∧ ê3 + C2 ê3 ∧ ê1 + C3 ê1 ∧ ê2 )δΦ
(7.222)
Las matrices G̃i se llaman los generadores infinitesimales del grupo de rotaciones.
Satisfacen:
1
~~
G
i = ǫijk êj ∧ êk
2
(7.223)
El conmutador de dos generadores obedece la siguiente propiedad:
G̃i G̃j − G̃j G̃i =
3
X
k=1
ǫijk G̃k
(7.224)
244 / Mecánica clásica avanzada
Las ecuaciones (7.224) definen el álgebra de Lie del grupo de rotaciones. Con esta
notación podemos escribir a (7.214) como:
3
X
d~r
Ci G̃i ~r
=
dΦ
i=1
(7.225)
Estas fórmulas, como hemos dicho, están dentro de la interpretación activa de las
rotaciones.
Velocidad angular. Se define el vector velocidad angular como:
d~r
dΦ
⇒
= −~ω × ~r
(7.226)
dt
dt
El vector ~
ω está situado en el eje de la rotación. Esta dirección se conoce como eje
instantáneo de rotación: el eje n̂ no cambia al realizar la rotación infinitesimal por un
ángulo dΦ. Sin embargo el desplazamiento del cuerpo rı́gido puede involucrar el cambio
del eje n̂. Por esta razón ~ω no es en general la derivada temporal de algún vector; en
otras palabras, Ci dΦ no es el diferencial de alguna cantidad, a no ser que los Ci no
cambien con el tiempo.
ω = n̂
~
Cálculo de d~r/dt cuando n̂ también cambia con el tiempo. En este caso
partimos directamente de la expresión:
~r(t) = Ã(t)~r0
(7.227)
donde de la matriz à convierte al vector ~r0 en el vector ~r. El vector ~r˙ estará dado por:
˙ r = Ã
˙ ÃT ~r
~r˙ = Ã~
0
(7.228)
Por otra parte, ~r0 = ÃT ~r nos da:
˙ T ~r = −ÃÃ
˙ T ~r
˙ T ~r + ÃT ~r˙ ⇒ ~r˙ = −(ÃT )−1 Ã
0 = Ã
(7.229)
Definimos la matriz Ω̃ ası́:
˙ T = Ã
˙ ÃT
Ω̃ = −ÃÃ
(7.230)
De (7.228) y (7.229) vemos que ~r = Ω̃~r0 . Además:
˙ T = −(Ã
˙ ÃT )T = −Ω̃
Ω̃ = −ÃÃ
(7.231)
Por tanto Ω̃ es una matriz antisimétrica. Sus elementos son entonces de la forma:
Ωij =
3
X
ǫijk ωk
(7.232)
k=1
Entonces (7.228) se puede escribir como:
ẋi = (Ω~r)i =
3 X
3
X
j=1 k=1
ǫijk ωk xj = (~r × ~ω)i = −(~ω × ~r)i
(7.233)
Cinemática del cuerpo rı́gido / 245
Por tanto:
~r˙ = −~
ω × ~r
(7.234)
Podemos expresar a ωi en términos de las Ωij . Para ello multiplicamos (7.232) por
ǫijl y sumamos sobre i, j:
3
3 X
X
ǫijl Ωij =
3 X
3
X
ǫijl ǫijk ωk
(7.235)
i=1 k=1
i=1 j=1
Ahora usamos la siguiente propiedad de la densidad de Levi-Civita:
3
3 X
X
ǫijl ǫijk = 2δlk
(7.236)
i=1 j=1
con lo cual llegamos a:
3
ωl =
3
1 XX
ǫijl Ωij
2 i=1 j=1
(7.237)
Usando la definición de Ω̃, (7.230), obtenemos:
3
ωl =
3
3
1 XXX
Ȧik Ajk ǫijl
2 i=1 j=1
(7.238)
k=1
donde ~
ω es la velocidad angular de rotación del cuerpo rı́gido en el sistema de coordenadas espacial, de acuerdo con la interpretación activa de las rotaciones que estamos
utilizando. La ecuación (7.238) permite hallar las componentes de ω en términos de la
representación que se tenga de la matriz Ã.
En términos de los parámetros Ci y Φ, usamos la expresión (7.138) para Ã. Notamos
que los elementos de à son de la forma:
Aij = δij cos Φ + Cj Ck (1 − cos Φ) +
3
X
ǫjkl Cl senΦ
(7.239)
l=1
Con lo cual Ȧik es:
Ȧik = −δik senΦ Φ̇ +
3
X
d
d
[Ci Ck (1 − cos Φ)] +
ǫjkm (Cm senΦ)
dt
dt
m=1
(7.240)
246 / Mecánica clásica avanzada
Como ATkj = Ajk , podemos escribir:
3
X
k=1
Ȧik Ajk = −δik senΦ cos Φ Φ̇ + cos Φ
3
X
ǫijm cos Φ
m=1
Cj
d
[Ci Cj (1 − cos Φ)]+
dt
d
(Cm senΦ) − Ci Cj (1 − cos Φ)senΦ Φ̇+
dt
d
[Ci n̂(1 − cos Φ)] · n̂(1 − cos Φ)+
dt
3
X
d
ǫikm (Cm senΦ)Cj Ck (1 − cos Φ)−
dt
m=1
3
X
ǫjil Cl sen2 Φ Φ̇ +
l=1
3
X
3
X
l=1
ǫjkl
d
[Ci Ck (1 − cos Φ)]Cl senΦ+
dt
(δji δlm − δjm δli )Cl senΦ
l,m=1
(7.241)
d
(Cm senΦ)
dt
P3
donde hemos usado la conocida propiedad del tensor de Levi-Civita, l=1 ǫkij ǫklm =
δil δjm − δim δjl . Las ecuaciones (7.241) se simplifican notando que n̂.n̂˙ = 0 y n̂ × n̂ = 0 y
P3
~ ~
k=1 ǫijk Ai Bj = (A × B)k . Luego, al multiplicar por ǫikl y sumar sobre i y sobre j, notando además que ǫijk se anula cuando tiene subı́ndices repetidos, obtenemos finalmente
para ~
ω:
ω = n̂Φ̇ + n̂˙ × n̂(1 − cos Φ) + n̂˙ senΦ
~
(7.242)
En términos de los parámetros de Euler, definidos en (7.139):
ω = 2e0~e˙ − 2ė0~e + 2~e˙ × ~e
~
(7.243)
Con la interpretación activa de las rotaciones, la velocidad angular que hemos obtenido nos permite hallar, por medio de (7.234), la forma en que cambia con el tiempo
el vector de posición de un punto arbitrario del cuerpo rı́gido.
La velocidad angular en la interpretación pasiva de las rotaciones. En
esta interpretación, ~r(t) es el vector de posición de un punto en el sistema de coordenadas
espacial, y ~r en el sistema de coordenadas del cuerpo rı́gido. En este caso:
~r(t) = ÃT (t)~r
(7.244)
y ~r˙ estará dado por:
~r˙ = Ω̃~r = −~
ω × ~r
(7.245)
Cinemática del cuerpo rı́gido / 247
ahora ~
ω es la velocidad angular de los ejes unidos al cuerpo rı́gido en el sistema de
coordenadas espacial. El tratamiento es igual al anterior, con sólo reemplazar a à por
ÃT :
˙ = Ã
˙ T Ã
Ω̃ = −ÃT Ã
(7.246)
donde ÃT se obtiene de (7.138) con sólo reemplazar a Φ por −Φ. ~ω estará dada en
términos de à por:
3
ωl =
3
3
1 XXX T
Ȧik Akj ǫijl
2 i=1 j=1
(7.247)
k=1
Se obtiene entonces que:
ω
~ = −n̂Φ̇ + n̂˙ × n̂(1 − cos Φ) − n̂˙ senΦ
(7.248)
y en términos de los parámetros de Euler:
ω
~ = −2ė0~e + 2e0~e˙ + 2~e˙ × ~e
(7.249)
ahora n̂ es el eje alrededor del cual giran los ejes coordenados unidos al cuerpo rı́gido,
y Φ es el ángulo de rotación en el sentido de la regla de la mano derecha (contrario a
las agujas del reloj). ~
ω puede también ser evaluada en términos de los ángulos de Euler.
Para ello hay varias posibilidades de cálculo.
(a) Considerar que ~
ω tiene componentes a lo largo de los ejes de las rotaciones
sucesivas que definen los ángulos de Euler:
ω
~ = φ̇êz + θ̇êµ1 + ψ̇êz
(7.250)
Obviamente (7.250) permite hallar a ω
~ respecto a los ejes espaciales (x, y, z) o
respecto a los ejes rotantes (x, y, z). Para hallar a ~ω respecto a los ejes espaciales, basta
expresar a ~eµ1 y êz en términos de (~ex , ~ey , ~ez ). Usando las expresiones (7.30), podemos
escribir:
êµ1 = (êµ1 · êx )êx + (êµ1 · êy )êy + (êµ1 · êz )êz
= cos φ êx + senφ êy
(7.251)
êz = (êz · êx )êx + (êz · êy )êy + (êz · êz )êz
= senθ senφ êx + senθ cos φêy + cos θêz
donde en (7.251) hemos usado la ecuación (7.122). Las ecuaciones (7.251) permiten
escribir a (7.250) en la forma:
ω = (φ̇ + cos ψ̇)êz + (θ̇senθ − ψ̇ senψ cos φ)êy +
~
(θ̇ cos φ + ψ̇ senθ senφ)êx
(7.252)
248 / Mecánica clásica avanzada
De manera similar se obtiene para ~ω respecto a los ejes fijos al cuerpo rı́gido:
~ω = (ψ̇ + φ̇ cos θ)êz + (φ̇ senθ cos ψ − θ̇ senψ)êy
(7.253)
+(φ̇ senθ senψ + θ̇ cos ψ)êx
(b) La otra posibilidad de cálculo consiste en usar la ecuación que define a Ω̃,
(7.246). Ã se puede expresar como producto de tres rotaciones según (7.131). Por tanto:
˙
˙
˙ Ã Ã + Ã Ã
Ω̃ = ÃTφ ÃTθ ÃTψ (Ã
ψ θ Ãφ + Ãψ Ãθ Ãφ )
ψ θ φ
(7.254)
Usando la ortogonalidad de las matrices Ã:
˙
˙ + ÃT ÃT Ã
˙ Ã + ÃT ÃT ÃT Ã
Ω̃ = ÃTφ Ã
φ
θ φ
θ
ψ ψ Ãθ Ãφ
φ
θ
φ
(7.255)
˙ , ...
Si llamamos Ω̃φ = ÃTφ Ã
φ
Ω̃ = Ω̃φ + ÃTφ Ω̃θ Ãφ + ÃTφ ÃTθ Ω̃φ Ãθ Ãφ
Usando las definiciones (7.127) se llega fácilmente a:




0 0 0
0 1 0











Ω̃φ = φ̇  −1 0 0  Ω̃θ = θ̇  0 0 1 





0 −1 0
0 0 0

0
1


Ω̃ψ = ψ̇ 
 −1 0

0 0
0

(7.256)
(7.257)


0 


0
con lo cual (7.256) conduce al resultado (7.252).
(c) Otra vı́a es expresar a ~ω en términos de los ángulos de Euler usando (7.249) y
(7.142), lo cual se deja como ejercicio al lector.
Las ecuaciones (7.252) y (7.253) muestran que no hay una relación simple entre las
componentes de ~
ω expresadas respecto a los ejes fijos al sólido rı́gido y respecto a los ejes
espaciales. La ecuación (7.247) da las componentes de ω
~ respecto a los ejes espaciales.
Llamaremos ~ω a la velocidad angular respecto a los ejes fijos al sólido rı́gido. Para hallar
~ empecemos por notar que ~r˙ = Ω̃~r, de (7.245). Como ~r = ÃT ~r, tenemos que:
ω
~r˙ = Ω̃ÃT ~r
(7.258)
De transformar ~r˙ a las coordenadas del sólido rı́gido obtenemos:
Ã~r˙ = ÃΩ̃ÃT ~r
(7.259)
Cinemática del cuerpo rı́gido / 249
Claramente Ã~r˙ no es ~r˙ , puesto que esta última es cero. Usando (7.246) y la or˙ T , matriz que llamaremos Ω̃ que es Ω̃
togonalidad de à obtenemos que à Ω̃ à = ÃÃ
transformada a las coordenadas fijas al sólido rı́gido. La matriz Ω̃ es antisimétrica:
T
˙ ÃT = −ÃΩ̃ÃT = −Ω̃
˙ ÃT = Ã(ÃT Ã)
Ω̃ = Ã
(7.260)
por tanto puede expresarse como:
Ωij =
3
X
ǫijk ω k
(7.261)
k=1
Esto conduce a:
~ × ~r
Ã~r˙ = Ω̃~r = −ω
(7.262)
Entonces se sigue que:
3
3
3
1 XXX
ωl =
ǫijk Aik ȦTkj
2 i=1 j=1
(7.263)
k=1
~ y ~ω en el punto de vista activo de
Comparando a (7.238) y (7.263) vemos que ω
las rotaciones son antiparalelas, como es de esperarse, o sea que, de acuerdo con (7.243):
~ = −2e0~e˙ + 2~eė0 − 2~e˙ × ~e
ω
(7.264)
Usando (7.264) y (7.142) se obtiene el resultado (7.253).
No existen en general, funciones λi (φ, θ, ψ) tales que:
ωi =
d
λi (φ, θ, ψ)
dλ
(7.265)
Por ejemplo, si ω1 = λ̇1 se deberı́a cumplir que:
dλ1
dλ1
dλ1
φ̇ +
θ̇ +
ψ̇ = θ̇ cos θ + ψ̇ senθ senφ
dφ
dθ
dψ
(7.266)
y por tanto:
dλ1
dλ1
=0;
= cos φ ;
dφ
dθ
dλ1
= senθ senφ
dψ
(7.267)
λ1 no existe puesto que:
∂ 2 λ1
∂ 2 λ1
= 0 ; en tanto que
= −senφ
∂θ ∂φ
∂φ∂θ
∂ 2 λ1
∂ 2 λ1
= 0 ; en tanto que
= cos θ senφ
∂ψ ∂θ
∂θ∂ψ
∂ 2 λ1
∂ 2 λ1
= 0 ; en tanto que
= sen θ cos φ
∂ψ ∂φ
∂φ∂ψ
(7.268)
250 / Mecánica clásica avanzada
La ecuación (7.265) se cumple solamente cuando φ = θ = 0 o sea cuando ω1 = 0.
Las componentes de ω
~ son combinaciones no integrables de φ̇, θ̇, ψ̇ (o de las derivadas
temporales de los parámetros usados para describir la rotación), llamadas las derivadas
de cuasicoordenadas, o seudocoordenadas. Las ecuaciones de Appell son las ecuaciones
de movimiento cuando se usan seudocoordenadas para describir el sistema (véase el texto
de Gantmacher, Lectures in analytical mechanics, sección 10).
El cálculo de ωi implica considerar desplazamientos infinitesimales alrededor de
una posición dada del sólido rı́gido. Pero hay maneras diferentes de realizar esos desplazamientos. Como una rotación finita no conmuta con una infinitesimal, depende del
orden en que se efectúen las transformaciones. Es de esperarse que ωi sea una derivada
total respecto al tiempo sólo en el caso en que el desplazamiento infinitesimal sea alrededor del mismo eje de rotación en que se hizo la rotación finita. Por ejemplo, si à = Ãφ
y ǫ̃ = ǫ̃φ con θ = φ = 0, entonces ω1 = 0; ω2 = 0; ω3 = φ̇.
Tasa de cambios temporales de un vector. Seguimos con el punto de vista
~ cambia con el tiempo en el sistema de
pasivo de las rotaciones. Un vector arbitrario G
~ respecto a los ejes espaciales proviene
coordenadas fijo al cuerpo rı́gido. El cambio de G
de dos efectos: de la rotación del sistema de ejes del sólido rı́gido y de la rotación
~ Es decir:
intrı́nseca de G.
~
~˙
dG
=
G
dt
cuerpo
~
dG
rotacional
cuerpo
=
~
−~ω × G
(7.269)
espacio
dt
En (7.269) ~
ω está dada por (7.248), que es el negativo de la velocidad angular que
usan algunos
autores
para describir
las
rotaciones desde el punto de vista pasivo y para
~
~
los cuales dG
= −~ω × G
dt.
rotacional
espacio
~ visto en los ejes espaciales es:
Entonces el cambio en G
~
dG
espacio
~
= dG
cuerpo
~
− ~ω × Gdt
(7.270)
o también:
~
dG
dt
!
~
dG
dt
=
espacio
!
cuerpo
~
− ~ω × G
(7.271)
~ es:
La segunda derivada temporal de G
~
d2 G
2
dt
!
espacio
=
~
d2 G
2
dt
!
cuerpo
− 2~ω ×
~ −ω
~
+~ω × (~ω × G)
~˙ × G
~
dG
dt
!
espacio
(7.272)
Cinemática del cuerpo rı́gido / 251
La ecuación (7.270), y por tanto también (7.271) y (7.272), es válida sólo cuando
los ejes espaciales y del cuerpo rı́gido coinciden instantáneamente. Para una posición
arbitraria del cuerpo rı́gido se cumple:
~ =
G
~
ÃG
~˙ =
G
˙G
~ + ÃG
~˙
Ã
~¨ =
G
¨
¨G
˙G
~ + 2Ã
~˙ + ÃG
~
Ã
(7.273)
~˙ y G
~¨ se pueden
Las (7.273) pueden expresarse en función de ~ω . Los vectores G
escribir respecto a los ejes espaciales ası́:
˙G
~˙ = G
~ y
~˙ + ÃT Ã
ÃT G
¨~
¨G
˙G
~¨ = G
~
~˙ + ÃT Ã
ÃT G
+ 2ÃT Ã
(7.274)
˙ obtenemos:
Usando la definición Ω̃ = −ÃT Ã,
Ω̃˙ =
2
Ω̃ =
˙ T Ã
˙ − ÃT Ã
¨
−Ã
˙ T Ã −ÃT Ã
˙ = −Ã
˙ T Ã
˙ ⇒ Ω̃˙ = Ω̃2 − ÃT Ã
¨
Ã
(7.275)
De (7.275) se sigue que:
~˙ = G
~˙ − Ω̃G
~
ÃT G
(7.276)
¨~
˙ G
~¨ = G
~˙ + (Ω̃2 − Ω̃)
~
− 2Ω̃G
ÃT G
Usando (7.245) obtenemos:
~ = −~
~
Ω̃G
ω×G
(7.277)
˙ T = d(Ω̃T )/dt = −Ω̃
˙ se sigue también que:
Como Ω̃
~ = −~
~
Ω̃˙ G
ω˙ × G
Además se cumple que:
~ = Ω̃ −~
~ = −~
~
Ω̃2 G
ω×G
ω × −~ω × G
(7.278)
(7.279)
De (7.277) y (7.278) se obtiene para (7.276):
~˙ = G
~˙ + ~
~
ω×G
ÃT G
¨~
~¨ = G
~˙ + ω
~ + ~ω˙ × G
~
+ 2~
ω×G
~ × (~ω × G)
à G
T
(7.280)
252 / Mecánica clásica avanzada
Explı́citamente las ecuaciones (7.280) se pueden escribir ası́:
!
!
i
h dG
~
~
d2 G
~
+
ω
~
×
G
=
Ã
dt2
dt
espacio
cuerpo
~
d2 G
2
dt
!
cuerpo
h d2 G
~
= Ã
2
dt
!
espacio
+ 2~ω ×
~
dG
dt
!
(7.281)
espacio
i
~ + ~ω˙ × G
~
+~ω × (~ω × G)
˜ esto es, cuando
Vemos que (7.271) y (7.272) coinciden con (7.281) cuando à = I,
escogemos los ejes de modo que coincidan instantáneamente.
En particular, para el vector de posición de una partı́cula moviéndose en el sistema
de coordenadas fijo a la Tierra, siendo ~ω la velocidad angular de la Tierra respecto al
˜
sistema de ejes espacial, (7.281) nos da para à = I:
~¨r = ~¨r + 2~
ω × (~r˙ − ~ω × ~r ) + ~ω × (~ω × ~r ) + ~ω˙ × ~r
(7.282)
= ~¨r + 2~
ω × ~r˙ − ~ω × (~ω × ~r) + ~ω˙ × ~r
Como para la Tierra ~ω = −n̂Φ̇ podemos escribir:
~¨r = ~¨r − 2Φ̇n̂ × ~r˙ − Φ̇2 n̂ × (n̂ × ~r)
(7.283)
~ = m~¨r y F~ = m~¨r se sigue que:
Como F
~ = F~ − 2mΦ̇n̂ × ~r˙ − mΦ2 n̂ × (n̂ × ~r)
F
(7.284)
En el sistema de coordenadas rotante, fijo a la Tierra, la fuerza efectiva no es
F~ = m~g sino que hay otros dos términos de naturaleza inercial. El segundo es la fuerza
de Coriolis y el tercero es la fuerza centrı́fuga. La discusión completa de estos efectos
puede verse en el texto Classical mechanics de Goldstein, sección 4-9, o en el texto Fı́sica,
vol. I de Alonso-Finn, sección 6.5.
8
Dinámica del cuerpo rı́gido
El fin de la dinámica del cuerpo rı́gido es describir la evolución del cuerpo rı́gido, o
sea, hallar las coordenadas generalizadas de rotación en función del tiempo cuando son
conocidas: (i) La distribución de masa del cuerpo rı́gido en reposo y (ii) Las fuerzas y
ligaduras que actúan sobre él. Cuando no hay ligaduras, los ángulos de Euler constituyen
un conjunto adecuado de coordenadas generalizadas independientes.
Hay distintas formas de llegar a las ecuaciones de movimiento para los ángulos de
Euler: a partir del lagrangiano, por medio de tres constantes de movimiento o por medio
de las ecuaciones de movimiento de Euler. Cuál forma se utiliza es algo que depende del
problema particular.
8.1.
El tensor de inercia
Un cuerpo rı́gido puede considerarse como un sistema de partı́culas sometido a las
ligaduras de que cualquier par de partı́culas permanece siempre a la misma distancia una
de la otra. En muchos casos es útil considerar una distribución continua de materia, de
acuerdo con cierta función de densidad de masa ρ(~r). La masa total, para distribuciones
discreta y continua respectivamente, es:
M=
N
X
mi ;
M=
i=1
Z
ρ(~r)d3~r
(8.1)
Las correspondientes expresiones para la energı́a cinética y el momento angular
son:
T =
N
X
1
i=1
~ =
L
N
X
i=1
2
2
mi~r˙ i ;
mi~ri × ~r˙ i ;
T =
Z
~ =
L
1
ρ(~r)~r˙ 2 d3~r
2
(8.2)
Z
(8.3)
ρ(~r)~r × ~r˙ d3~r
253
254 / Mecánica clásica
Similarmente el torque total es:
~ =
K
N
X
i=1
~ri × F~i ;
~ =
K
Z
~r × F~ (~r) d3~r
(8.4)
donde F~ (~r) es la fuerza por unidad de volumen en el punto ~r. Las ecuaciones (8.2),
(8.3) y (8.4) son cantidades evaluadas en el sistema de coordenadas espacial; es deseable
expresarlas en función de las coordenadas del cuerpo rı́gido.
~ la
Supondremos que el cuerpo rı́gido se translada a la vez que rota, siendo V
velocidad de translación del origen de coordenadas fijo al cuerpo y ω
~ la velocidad angular
de rotación. Las fórmulas de transformación para la posición y la velocidad de un punto
arbitrario son, según las fórmulas (7.5), (7.244) y (7.245):
~ + AT ~r˙ − ~ω × ~r ′
~r˙ = V
~r = V~ t + AT ~r ;
(8.5)
~ constante. El vector ~ω está dado por (7.248).
Por simplicidad hemos tomado a V
Si el punto en consideración es del cuerpo rı́gido entonces se cumple que ~r˙ = 0.
Constancia de ω respecto a diferentes sistemas de coordenadas fijos al
cuerpo rı́gido. Sean O1 y O2 dos puntos del cuerpo rı́gido en los cuales se toma el
~1 y R
~ 2 son los vectores de
origen de dos sistemas de coordenadas fijos al cuerpo rı́gido. R
~
~2 −R
~ 1 es el vector
posición de O1 y O2 respecto a los ejes espaciales, de modo que R = R
de posición de O2 respecto a O1 . Sea ~ω1 la velocidad angular de los ejes del cuerpo rı́gido
~2 = R
~ +R
~1 y R
~1 = R
~2 − R
~ se
con origen en O1 y ~
ω2 respecto a O2 . De las fórmulas R
sigue que:
~2
dR
dt
=
esp
~1
dR
dt
=
esp
~1
dR
dt
~2
dR
dt
+
esp
esp
−
~
dR
dt
~
dR
dt
=
esp
=
esp
~1
dR
dt
~2
dR
dt
+
esp
esp
−
~
dR
dt
~
dR
dt
1
2
~
−ω
~1 × R
(8.6)
~
+ω
~2 × R
(8.7)
en donde usamos los resultados de (7.269) y siguientes.
Por tratarse de un cuerpo rı́gido se sigue que:
~
dR
dt
=
1
~
dR
dt
=0
(8.8)
2
Entonces obtenemos de (8.6) y (8.7):
~1
dR
dt
=
esp
~1
dR
dt
esp
~ + ~ω2 × R
~
−ω
~1 × R
(8.9)
Por tanto:
~ =0
(~
ω2 − ω~1 ) × R
(8.10)
Dinámica del cuerpo rı́gido / 255
~ siendo λ arbitraria. Como esta expresión debe cumplirse
Entonces ~
ω2 − ω~1 = λR,
en el caso lı́mite en que el cuerpo rı́gido esté en reposo, λ debe anularse, por lo que se
llega al resultado importante de que el vector ~ω es independiente del punto del cuerpo
rı́gido que se tome como origen del sistema de coordenadas fijo al cuerpo rı́gido.
Energı́a cinética. La energı́a cinética respecto a los ejes espaciales, ecuación (8.2),
puede descomponerse usando (8.5):
h
i
1X
~ 2 − 2V
~ · (~
ω × ~ri ) + (~ω × ~ri ′ )2
mi V
2 i=1
N
T =
(8.11)
Si escogemos el origen de coordenadas del sistema de coordenadas del cuerpo rı́gido
(que coincide con el origen de las coordenadas ~r ′ , según la figura 7.2) en el centro de
masa, se cumple que:
N
X
′
~ CM
mi~ri ′ = M R
=0
(8.12)
i=1
Entonces se sigue que:
N
T =
1 ~2 1X
mi (~
ω × ~ri ′ )2
MV +
2
2 i=r
(8.13)
Cuando los ejes del cuerpo rı́gido coinciden instantáneamente con los espaciales,
~r = ~ri ′ , en vez de (8.13) podemos escribir:
N
T =
2
1 ~2 1X
ω × ~r i
mi ~
MV +
2
2 i=r
(8.14)
La energı́a cinética, pues, consta de dos partes independientes: la energı́a cinética
del centro de masa y la energı́a cinética de rotación respecto al centro de masa. Como
~ω depende de la orientación del cuerpo rı́gido, según (7.252), se sigue que la energı́a
cinética de rotación depende de los ángulos de Euler y sus derivadas temporales:
T = Ttraslacional + Trotacional (φ, θ, ψ, φ̇, θ̇, ψ̇)
(8.15)
Es conveniente escribir a Trotacional de la siguiente manera. Usamos la expresión
para el producto cruz en términos del tensor de Levi-Civita:
2
ω × ~ri = ǫmnp ωn rip ǫmst ωs r it
~
(8.16)
donde los ı́ndices mudos m, n, p, s, t, toman los valores 1, 2, 3, que representan a x, y,
z, y usamos la convención de Einstein. El tensor de Levi-Civita tiene la propiedad:
ǫmnp ǫmst = δns δpt − δnt δps
de la cual se sigue que:
2
2
~ · ~r i
ω × ~ri = ω 2 r 2i − ω
~
(8.17)
(8.18)
256 / Mecánica clásica
La ecuación (8.18) permite escribir a Trotacional como:
Trotacional =
N
X
1
mi r2i δst − ris r it
ωs ωt
2
i=1
(8.19)
Definimos el tensor de inercia ası́:
Ist =
N
X
i=1
mi (r 2i δst − r is r it )
(8.20)
o usando la notación diádica, ecuación (7.45),
N
~~ X
mi r 2i ~~1 − ~r i r~i
I=
(8.21)
i=1
~
donde ~1 es el diádico unidad; vemos entonces que:
1 ~~
1
~ω · I · ~ω = ωs Ist ωt
(8.22)
2
2
~
~
En la definición de I~ tomamos los ejes del cuerpo rı́gido; I~ es el tensor de inercia
respecto a los ejes del cuerpo rı́gido con origen en el centro de masa. Sin embargo, cuando
~ = 0, T = Trotacional y la fórmula (8.22) resulta aplicable también en el caso en que el
V
origen de coordenadas no esté en el centro de masa.
Trotacional =
Momento angular. El momento angular en el sistema de coordenadas espacial,
ecuación (8.3), puede descomponerse en una parte del centro de masa y una parte respecto al centro de masa. Cuando los ejes ~r ′ y ~r coinciden instantáneamente, el momento
angular de rotación alrededor del centro de masa es:
~ rotacional =
L
N
X
i=1
N
h 2
X
i
mi~r i × ω
mi ~ω~ri − r i ω
~ × ~ri =
~ .~r i
(8.23)
i=1
Desarrollando el triple producto vectorial llegamos a una expresión que contiene el
tensor de inercia:
~ rotacional = ~I~ · ~ω
L
(8.24)
~ rotacional son, usando los resultados de la sección 7.3:
o sea que las componentes de L
~
(Lrotacional )s = ~es · I~ · ~ω ;
s = 1, 2, 3
(8.25)
~
donde I~ es el tensor de inercia respecto a los ejes del cuerpo rı́gido con origen en el
centro de masa.
Momentos de inercia y productos de inercia. Los elementos diagonales del
tensor de inercia reciben el nombre de momentos de inercia:
N
2
X
~~
mi ~r i − r 2is ; s = 1, 2, 3
Iss = ~es · I · ~es =
(8.26)
i=1
Dinámica del cuerpo rı́gido / 257
~
Los elementos no diagonales de I~ reciben el nombre de productos de inercia (y a
veces el de momentos centrı́fugos respecto a los planos coordenados):
Ist = −
N
X
mi r is rit ;
s 6= t = 1, 2, 3
i=1
(8.27)
~~
I es un tensor simétrico, por lo tanto puede ser diagonalizado mediante una transformación de semejanza realizada por una matriz ortogonal, sus valores propios son
reales y sus vectores propios son ortogonales, de acuerdo con conocidos teoremas del
álgebra de matrices.1
Momento de inercia respecto al eje de rotación. Por simplicidad tomaremos
el caso en que el eje de rotación instantáneamente está fijo, de modo que ~ω está dada por
la fórmula (7.226), ω
~ = ωn̂. Entonces de acuerdo con (8.22), Trotacional puede escribirse
como:
T =
1 2
Iω
2
(8.28)
donde el número I está definido ası́:
I = n̂ · I · n̂ = I n̂n̂ =
N
X
i=1
h
2 i
mi r 2i − ~ri · n̂
(8.29)
I se denomina el momento de inercia respecto al eje de rotación. De manera similar
puede calcularse el momento de inercia respecto a un eje arbitrario, que por supuesto
será diferente del I dado en (8.29). La componente de Lrotacional en la dirección de n̂ es:
~ · n̂ = n̂ · ~I~ · n̂
Ln̂ = L
ω = Iω
(8.30)
~ rotacional al cuadrado es:
La magnitud de L
~ ~
L2 = ~
ω · I~ · I~ · ω
~ 6= I 2 ω 2
(8.31)
~ será distinto de Ln̂ ; en otras palabras, en general L
~ y ~ω no son
o sea que en general L
paralelos.
De acuerdo con la definición elemental, el momento de inercia del cuerpo rı́gido
respecto al eje n̂ depende de las distancias Ai de las partı́culas al eje:
In =
N
X
A2i mi
(8.32)
i=1
De acuerdo con su definición:
A2i = (~r i × n̂)2 = ~r i · n̂ × ~ri × n̂
1 Véase
(8.33)
por ejemplo el texto de V. I. Smirnov, A course of higher mathematics, vol. III, numeral 40,
Pergamon Press, 1964.
258 / Mecánica clásica
Utilizando un desarrollo similar al de las ecuaciones (8.16), (8.17) y (8.18):
n̂ × ~r i × n̂ = ~ri − n̂ n̂ · ~r i
(8.34)
Reemplazando (8.34) en (8.32) llegamos a:
In =
N
X
i=1
h 2
2 i
mi ~r i − ~r i .n̂
(8.35)
~
Si n̂ es el eje de rotación vemos que In coincide con I = n̂ · I~ · n̂.
Teorema de Steiner. Es un teorema que permite relacionar los momentos de
inercia respecto a ejes diferentes. Se llama también el teorema de los momentos de
inercia respecto a ejes paralelos. Si ~r es el vector de posición de la partı́cula i respecto
a los ejes del cuerpo rı́gido con origen en el centro de masa y ~ri ′ respecto a los ejes
~ respecto al centro de masa,
del cuerpo rı́gido con un origen diferente O′ , colocado en R
entonces:
~ + ~r i ′
~r i = R
(8.36)
Manipulaciones simples nos conducen a la relación:
I ′ = I + M a2
(8.37)
donde a2 es:
~ × n̂)2
a2 = (R
(8.38)
y I ′ es el momento de inercia respecto a un eje paralelo a n̂ que se separa de él una
cantidad a. El teorema de Steiner para el tensor de inercia mismo es:
~~ ′ ~~
~R
~
I = I + M R2~~1 − R
(8.39)
~
~
donde I~ es el tensor de inercia respecto al centro de masa y I~ ′ es el tensor de inercia
~
respecto a unos ejes del cuerpo rı́gido con origen en R respecto al centro de masa.
~
~~
Ejemplo 8.1.1 Expresar a I~ en términos de R
i definida ası́:


0
z i −y i




~~
 o sea : R
0
x
−z
R̃i = 
i
i 
i = ǫmnl xil êm ên



y i −xi
0
(8.40)
Utilizando la propiedad del tensor de Levi-Civita dada en (8.17), llegamos a la
~~ ~~
siguiente expresión par R
i · Ri :
~~ ~~
~
r i~r i − r 2i ~1
R
i · Ri = ~
(8.41)
Dinámica del cuerpo rı́gido / 259
~~
Se sigue entonces la siguiente expresión para I:
N
X ~ ~
~~
mi R i · R i
I =−
(8.42)
i=1
Ejemplo 8.1.2 Hallar el lagrangiano para una placa uniforme rectangular rı́gida horizontal que está colocada sobre cuatro resortes iguales, para el caso en el cual el centro de
la placa sólo puede tener movimientos perpendiculares a la placa. La placa sólo puede
desplazarse verticalmente y girar de modo que el centro permanezca fijo.
Entonces las correspondientes energı́as cinéticas son:
1
1 ~~
M Ż 2 ; Trotacional = ~ω · I.~
ω
(8.43)
2
2
Para una placa rectangular homogénea rı́gida usamos la fórmula correspondiente
a (8.21) para una distribución uniforme de masa:
Z ~~ M
2~
~
I=
r I − ~r~r d2~r
(8.44)
A
Ttraslacional =
donde A es el área de la placa y d2~r el elemento diferencial de área. Tomando el plano
x − y sobre la placa, con origen en el centro de la misma, y llamando 2a la longitud de
la placa (dirección x) y 2b la anchura (dirección y), (8.44) toma la forma:
Z Z
M
~
~~
(r2 I~ − ~r~r) dx dy
(8.45)
I=
4ab
Con la elección de coordenadas que hemos hecho, los productos de inercia se anulan
~~
(I es diagonal). Los momentos de inercia son:
1
1
1
M b2 ; Iyy = M a2 ;
Izz = M (a2 + b2 )
(8.46)
3
3
3
En vez de tomar como coordenadas generalizadas de rotación a los ángulos de
Euler ordinarios, con lo cual la velocidad angular estarı́a dada por las fórmulas (7.252)
o (7.253), tomaremos los ángulos de rotación alrededor de los tres ejes perpendiculares
fijos a la placa. Esta es la llamada convención “xyz” de los ángulos de Euler; ver el final
de la sección 7.6. Las componentes de ~ω a lo largo de los ejes de las rotaciones sucesivas
que definen los ángulos de Euler en la convención “xyz” son:
Ixx =
ω
~ = φ̇ êz + θ̇ êµ2 + ψ̇ êµ′1
(8.47)
Con lo cual se obtiene para las componentes de la velocidad angular respecto a los
ejes del cuerpo rı́gido:2
~ω = (ψ̇ − φ̇ senθ)êx̄ + (θ̇ cos ψ + φ̇ cos θ senψ)êy
(8.48)
+(−φ̇ senψ + φ̇ cos θ cos ψ)êz̄
2 Las
componentes respecto a los ejes espaciales son (ψ̇ cos θ cos φ − θ̇ senφ, φ̇ cos θ senφ + θ̇ cos φ, φ̇ −
ψ̇ senθ). Véase apéndice B del texto de Goldstein, Classical mechanics, 2a ed., Addison Wesley, 1980.
¯
260 / Mecánica clásica
En las fórmulas dinámicas hemos supuesto que los ejes espacial y de cuerpo rı́gido
coinciden instantáneamente. Por esto debemos tomar nulos los valores de los ángulos de
~ coinciden instantáneamente:
Euler, con lo cual ω
~ yω
ω = φ̇ êz + θ̇ êy + ψ̇ êx
~
(8.49)
Entonces Trotacional será:
Trotacional =
1
1
1 2
ψ̇ Ixx + θ̇2 Iyy + φ̇2 Izz
2
2
2
(8.50)
Con la convención ordinaria para los ángulos de Euler aparecerán términos en φ̇ψ̇.
La energı́a potencial en función de z y de los ángulos de Euler es:
V =
1
1
1
1
(4k)z 2 + (4k)(aθ)2 + (4k)(bψ)2 + (4k ′ )(a2 + b2 )φ2
2
2
2
2
(8.51)
En (8.51), k es la constante de estiramiento de los resortes, en tanto que k ′ es la
constante asociada a los desplazamientos horizontales, en que no se estiran los resortes
y por lo tanto k ′ no se puede expresar en función de k. El lagrangiano buscado es:
L=
M 2 2
1
|b ψ̇ + a2 φ̇2 + (a2 + b2 )φ̇2 | + M ż 2 − 2kz 2
6
2
2 2
2
2
′
2
2
(8.52)
2
−2ka θ − 2kb ψ − 2k (a + b )φ
Vemos que z, φ, θ, ψ, son coordenadas normales.
8.2.
Diagonalización del tensor de inercia
El tensor de inercia es simétrico, Ist = Its , con lo cual sus valores propios son reales
y los vectores propios correspondientes a valores propios diferentes son ortogonales. En
~ depende
general los productos de inercia no son nulos, o sea que cada componente de L
de todas las componentes de ω
~:
Ls = Is1 ω1 + Is2 ω2 + Is3 ω3 ;
s = 1, 2, 3
(8.53)
~ será proporcional a la
si se anulan los productos de inercia, cada componente de L
respectiva velocidad angular y T será una forma cuadrática en las componentes de ~ω sin
términos cruzados.
~
Como I~ es simétrico, siempre es posible hallar un sistema de coordenadas fijo
al cuerpo rı́gido en que sea diagonal. Esto se logra resolviendo el problema de valores
~~
propios y vectores propios para I:
~~ ~
~α ;
I · Xα = Iα X
α = 1, 2, 3
(8.54)
o en términos de las componentes:
3
X
t=1
Irt Xαt = Iα Xαr ;
r, α = 1, 2, 3
(8.55)
Dinámica del cuerpo rı́gido / 261
Vamos a admitir que los valores propios Iα puedan ser complejos. Entonces Iβ⋆
satisface:
3
X
⋆
⋆
⋆
Xβr
= Iβ⋆ Xβt
;
t, β = 1, 2, 3
(8.56)
Itr
r=1
⋆
Multiplicando a (8.55) por Xβr
y a (8.56) por Xαt , sumando sobre r y t y restando
los resultados obtenemos:
3 X
3
3 X
3
3
X
X
X
⋆
⋆
⋆
⋆ ⋆
Irt Xαt Xβr
−
Itr
Xβr
Xαt = Iα
Xαr Xβr
Iβ
r=1 t=1
t=1 t=1
r=1
(8.57)
−
3
X
⋆
Xαt
Xβt
t=1
como Irt es real y simétrica, el lado izquierdo de (8.57) es nulo. El lado derecho puede
escribirse como un producto escalar ordinario, quedando:
~α · X
~ ⋆ = 0 ; α, β = 1, 2, 3
(8.58)
(Iα − Iβ⋆ )X
β
~α ·X
~ ⋆ es real y positivo, que I ⋆ = Iα ,
Para α = β se sigue de (8.58), debido a que X
α
α
~α y X
~ β corresponden a valores propios
o sea que los valores propios son reales. Cuando X
~ α normalizados
diferentes, se sigue que son ortogonales. Escogiendo los vectores propios X
~
~ β puede no ser
a la unidad y notando que cuando ocurra que Iα = Iβ entonces Xα · X
~ 1, X
~2 y X
~ 3 , forman
cero, pero que puede escogerse cero, obtenemos de esta manera que X
una trı́ada ortonormal de vectores unitarios:
~α · X
~ β = δαβ ;
X
α, β = 1, 2, 3
(8.59)
Analicemos más en detalle el caso en que ocurran valores propios degenerados,
Iα = Iβ con α 6= β. De (8.58) se sigue que se debe cumplir, en el caso en que I1 6= I2 = I3 ,
~1 · X
~2 = X
~1 · X
~ 3 = 0, pero no necesariamente se debe cumplir que X
~2 · X
~ 3 = 0.
que X
~
Todos los vectores perpendiculares a X1 son vectores propios correspondientes al mismo
valor propio I2 , formando un espacio bidimensional, o sea que sólo hay dos vectores
propios de I2 linealmente independientes, con lo cual podemos escoger cualquier par
de vectores ortogonales, lo cual nos está a su vez indicando que el sólido rı́gido posee
~ 1.
simetrı́a de rotación alrededor del eje X
~α
Los ejes principales y la transformación principal. Los vectores propios X
constituyen un sistema de tres ejes cartesianos fijos al cuerpo rı́gido, respecto a los cuales
el tensor de inercia es diagonal. Estos ejes se llaman ejes principales de inercia. Los valores
propios Iα se llaman momentos principales de inercia. En cualquier caso es posible
hallar una transformación de coordenadas que nos permita pasar a los ejes principales.
Tal transformación se llama transformación principal y consiste en una rotación. De
acuerdo con las fórmulas (7.30) y (7.60), las fórmulas de transformación para los vectores
unitarios y para el tensor de inercia serán:
~r =
X
3
X
s=1
αrs ês ;
′
Irs
3
X
t,u
αrt αsu Itu ;
r, s = 1, 2, 3
(8.60)
262 / Mecánica clásica
donde αrs son los cosenos directores de la transformación. Vemos que las componentes
de los nuevos vectores unitarios coinciden con los cosenos directores:
Xrs = αrs ;
r, s = 1, 2, 3
(8.61)
Es decir, con los elementos de los vectores propios formamos una matriz que coincide con la matriz de la transformación principal siendo las filas de tal matriz formadas
con las componentes de los vectores propios. Esta matriz es ortogonal.
~ r · ês y las
Los cosenos directores también pueden escribirse en la forma αrs = X
~~ ~
~
′
~
componentes del tensor de inercia en las formas Irs = Xr · I · Xs y Itu = êt · I~ · êu , con
lo cual las ecuaciones (8.60) de la derecha quedan en la forma de la identidad siguiente:
3
X
~ s)
~ r · ~I~ · X
~s =
~ r · êt ) êt · ~I~ · êu (êu · X
(8.62)
X
(X
t,u=1
Como
′
Irs
es diagonal, podemos escribir:
′
~ r · ~I~ · X
~ s = Is δrs ;
=X
Irs
r, s = 1, 2, 3
(8.63)
~ 3 = ~~1, obtenemos
~2 + X
~ 3X
~1 + X
~ 2X
~ r, X
~ 1X
Usando la completidad de los vectores X
~ r y sumando sobre r la ecuación de valores propios para ~I.
~
al multiplicar a (8.63) por X
En términos de componentes la ecuación de valores propios es (8.55):
3
X
t=1
(Irt − Iα δrt )Xαt = 0 ;
r, α = 1, 2, 3
(8.64)
El anterior es un sistema de tres ecuaciones homogéneas en las incógnitas Xαt ,
que admite soluciones no triviales solamente si los Iα tienen un valor tal que se anule el
determinante de la matriz de los coeficientes:
~~
~
~
det I − Iα 1 = 0
(8.65)
que en forma explı́cita es:

Ixx − Iα
Ixy


Ixy
Iyy − Iα
det 


Ixz
Iyz
Ixz
Iyz
Izz − Iα



=0


(8.66)
La ecuación (8.66) es cúbica en Iα , que tendrá tres raı́ces reales según hemos
visto; esta ecuación se llama ecuación secular. Un cuerpo rı́gido cuyos tres momentos
principales de inercia son diferentes es asimétrico. Si por ejemplo I1 = I2 6= I3 , el
~ 3 . Por simetrı́a de rotación
cuerpo tiene simetrı́a de rotación alrededor del eje principal X
entendemos una rotación que deja inalterado el tensor de inercia; tal rotación puede
~~
representarse mediante cierto diádico ortogonal R.
~~ ~~ ~~ −1 ~~
R
·I ·R = I
(8.67)
Dinámica del cuerpo rı́gido / 263
Mediante (8.67) la ecuación de valores propios para I1 puede escribirse como:
~~ ~~ ~~ −1 ~
~~ ~
~
~1 = R
· I · R · X1 = I1 X
I · X1 = I1 X
(8.68)
~~
o por la ortogonalidad de R:
~~ −1 ~
~~ ~~ −1 ~
· X1 )
I · R X1 = I · (R
(8.69)
~~ ~
~1 y R
Las ecuaciones (8.68) y (8.69) nos dicen que los vectores X
X1 son vectores
~~
propios de I con el mismo valor propio I1 ; estos dos vectores no necesariamente son
ortogonales pero sı́ son linealmente independientes y permiten escribir cualquier vector
~ 3 . Si I1 = I2 = I3 se dice que el cuerpo
en el plano perpendicular al eje de simetrı́a X
~~
rı́gido es esférico; en este caso I será diagonal respecto a cualquier sistema de ejes del
cuerpo rı́gido con origen en el centro de masa.
Ejemplo 8.2.1 Sea un cuerpo rı́gido formado por once masas discretas iguales distribuidas como se muestra en la figura 8.1. Las ocho masas del plano están sobre una
circunferencia de radio a, con un ángulo entre sı́ de 45o . Las masas del eje están a una
distancia a del centro de la circunferencia. Al rotar el cuerpo alrededor del eje un ángulo
2π/8, coincide consigo mismo; se dice que posee un eje de simetrı́a de orden 8. Sobre
el plano hay también cuatro ejes de simetrı́a de orden 2. Calcular las componentes del
tensor de inercia para este cuerpo y mostrar que dos momentos principales de inercia
son iguales.
z
y
x
Figura 8.1 Cuerpo rı́gido formado por once masas discretas iguales.
Podemos elegir los ejes del cuerpo rı́gido de modo que coincidan con la posición de
algunas de las masas, digamos, tomando el plano x − y en el plano de la figura y el eje z
264 / Mecánica clásica
a lo largo del eje de simetrı́a. Con esta elección se anulan los productos de inercia o sea
que dichos ejes forman un conjunto de ejes principales y los momentos de inercia serán
también momentos principales de inercia. Los valores de los Iα son:
I1 = Ixx = 6ma2 ;
I2 = Iyy = 6ma2 ;
I3 = Izz = 8ma2
(8.70)
Vemos que ninguno de los tres momentos principales de inercia es mayor que la
suma de los otros dos y que los momentos principales respecto a los ejes del plano de
simetrı́a son iguales.
Se puede demostrar que si en vez de x − y se toma cualquier par de ejes en ese
plano, perpendiculares o no entre sı́, el tensor de inercia resulta diagonal, siempre que
un eje pueda obtenerse a partir del otro eje mediante una de las operaciones de simetrı́a
del cuerpo. Es decir, cualquier par de ejes no colineales que hagan entre sı́ un ángulo
que sea un múltiplo de 2π/8, forma parte del conjunto de ejes principales del cuerpo.
Usando el lenguaje de la teorı́a de grupos, decimos que el cuerpo rı́gido posee un grupo
de simetrı́as de orden 8, el grupo puntual D4 , que consta de cuatro rotaciones alrededor
del eje de simetrı́a de orden 8, y cuatro rotaciones de π alrededor de ejes horizontales.
Además posee un conjunto de simetrı́as de reflexión en planos horizontales y verticales.
El conjunto de los vectores propios correspondientes al valor propio degenerado I1 constituye una representación irreductible del grupo de simetrı́as D4 .3
El elipsoide de inercia. Sea n̂ el vector unitario que define una dirección cualquiera. El momento de inercia respecto al eje n̂ es:
3
X
~
I = n̂ · I~ · n̂ =
nr Irs ns
(8.71)
r,s=1
donde nx , ny , nz , son los cosenos directores del eje (véase figura 8.2). Si tomamos un
punto cualquiera sobre el eje, estará descrito respecto al centro de masa por el vector de
posición ~r = (x, y, z) = r(nx , ny , nz ); por lo tanto si multiplicamos por r2 ambos lados
en (8.71) obtenemos:
In r2 = Ixx x2 + Iyy y 2 + Izz z 2 + 2Ixy xy + 2Ixz xz + Iyz yz
(8.72)
Ahora consideremos un conjunto de ejes que pasen por el centro de masa. Entonces
podemos hallar el lugar geométrico de los puntos ~r para los cuales In r2 toma el mismo
valor. Este lugar geométrico es una superficie elipsoidal llamada el elipsoide de inercia
o elipsoide de momentos de inercia. Es claro que eligiendo adecuadamente el sistema de
coordenadas fijo al cuerpo rı́gido4 se obtiene la ecuación estándar para un elipsoide:
x2
y2
z2
+ 2 + 2 =1
2
a
b
c
(8.73)
3 Véase el capı́tulo de teorı́a de la simetrı́a en el libro de Mecánica cuántica no relativı́stica de LandauLifshitz.
4 Que coincide instantáneamente con el sistema de coordenadas espacial.
Dinámica del cuerpo rı́gido / 265
La ecuación (8.73) se identificará con (8.72) si se satisfacen las relaciones:
a2 =
In r2
;
I1
I1 = Ixx ;
b2 =
In r2
;
I2
I2 = Iyy ;
c2 =
In r2
;
I3
I3 = Izz ;
(8.74)
Irs = 0
si r 6= s
Es claro que tal sistema de coordenadas coincide con el sistema de ejes principales
ortogonales del cuerpo rı́gido y que I1 , I2 , I3 , coinciden con los momentos principales
de inercia.
Cuerpo
rígido
r
n
Elipsoide
de inercia:
In r 2 = constante
Figura 8.2 Superficie elipsoidal
El elipsoide de inercia es una superficie de la forma:
F (x, y, z) = 0
(8.75)
La normal a F en un punto es el gradiente de F en ese punto.
En los ejes principales de un elipsoide el gradiente es paralelo al eje:
∂F
= K n̂
∂~r
En forma explı́cita (8.76) es:
(8.76)
∂F
= 2xIxx + 2yIxy + 2zIxz = Knx
∂x
∂F
= 2xIxy + 2yIyy + 2zIyz = Kny
∂y
(8.77)
∂F
= 2xIxz + 2yIyz + 2zIzz = Knz
∂z
Si estas ecuaciones las dividimos por 2r, luego multiplicamos la primera por nx y la
tercera por nz , el resultado que se obtiene al sumarlas coincide con (8.72) si la constante
266 / Mecánica clásica
K se identifica con K = 2rIn . Entonces (8.77) coincide con el siguiente sistema de
ecuaciones:
(Ixx − In )nx + Ixy ny + Ixz nz = 0
Ixy nx + (Iyy − In )ny + Iyz nz = 0
(8.78)
Ixz nx + Iyz ny + (Izz − In )nz = 0
O sea que las ecuaciones (8.76), (8.77) y (8.78) nos dan los ejes principales y los
momentos principales de inercia, ya que los ejes principales de inercia coinciden con los
ejes principales del elipsoide de inercia.
La construcción del elipsoide de inercia permite interesantes análisis cualitativos
del movimiento del cuerpo rı́gido. Es la base de la representación de Poinsot para el
estudio del movimiento de un cuerpo rı́gido no sometido a torques.
Ejemplo 8.2.2 ¿Cuál es la relación entre el diámetro y la altura de un cilindro circular
recto tal que el elipsoide de inercia en el centro del cilindro es una esfera?
Tomamos el origen en el centro de masa. En virtud de la simetrı́a de rotación,
cualquier par de ejes perpendiculares al eje y del cilindro forman un sistema de ejes
principales.
El momento de inercia Izz = I3 , siendo z el eje del cilindro, es:
Z Z Z
M
I3 =
(y 2 + x2 ) d3~r
(8.79)
V
donde M es la masa total y V el volumen. Tomando el elemento de volumen como un
anillo cilı́ndrico de radios ρ y ρ + dρ y altura dl:
d3~r = 2πρ dρ dl
(8.80)
Entonces una integración elemental nos lleva a:
I3 =
1
M R2
2
siendo R el radio de la circunferencia de la base del cilindro.
El momento de inercia Ixx = I1 es:
Z Z Z
M
I1 =
(z 2 + y 2 ) d3~r
V
(8.81)
(8.82)
En las dos integrales que aparecen en (8.79) y (8.82) es cómodo tomar respectivamente los siguientes elementos de volumen:
p
(8.83)
d3~r = πr2 dz y d3~r = 2lx dy = 2l R2 − y 2 dy
Entonces obtenemos para I1 , que además será igual a I2 :
2
1
l
I1 = M
+ R2
4
3
(8.84)
Dinámica del cuerpo rı́gido / 267
El elipsoide de inercia será una esfera si I1 = I2 = I3 , de acuerdo con las fórmulas
(8.74). De (8.81) y (8.84) se sigue entonces que:
l2 = 3R2
(8.85)
Ejemplo 8.2.3 Tres masas iguales están en los puntos (a, 0, 0), (0, a, 2a) y (0, 2a, a),
hallar los momentos principales de inercia y un conjunto de ejes principales respecto al
origen de coordenadas.
Los elementos del

5 0
~~ 
0 3
I=
0 −2
tensor de inercia para este problema son:

0
−2  2ma2
3
El valor del determinante secular, ecuación (8.66), es:
~~
~
~
det I − I 1 ⇒ (5 − i)[(3 − i)2 − 4] = 0
(8.86)
(8.87)
donde hemos llamado:
i=
I
2ma2
(8.88)
Las tres raı́ces de la ecuación secular son entonces i = 5, 5, 1, con lo cual los tres
momentos principales de inercia valen:
I1 = 2ma2 ;
I2 = 10ma2 ;
I3 = 10ma2
(8.89)
~ ~
~
Las ecuaciones de valores propios son ~i · X
α = iα Xα , que explı́citamente son:
(5 − iα )Xα1 = 0; (3 − iα )Xα2 − 2Xα3 = 0; −2Xα2 + (3 − iα )Xα3 = 0
~ 1:
X
(8.90)
Para i1 obtenemos las siguientes relaciones entre los componentes del vector propio
X11 = 0 ;
X12 = X13
(8.91)
~ 1 normalizado a la unidad es entonces:
El vector propio X
~ 1 = 0, √1 , √1
X
2
2
(8.92)
Para la raı́z doble i2 = i3 = 5 las relaciones entre los componentes de los vectores
~ 2, X
~ 3 , son:
propios X
0.Xα1 = 0 ;
Xα2 = −Xα3 ;
α = 2, 3
(8.93)
Vemos que los Xα1 pueden asignarse arbitrariamente, ya que la condición de normalización sólo nos permite expresar a Xα2 en función de Xα1 . Este comportamiento es
caracterı́stico de los problemas de valores propios cuando hay degeneración. Una pareja
268 / Mecánica clásica
posible de vectores propios normalizados y ortogonales correspondientes al valor propio
degenerado i2 = i3 = 5 es:
1
1
~ 3 = (1, 0, 0)
~
√
√
; X
(8.94)
X2 = 0, −
,
2
2
La matriz de la correspondiente transformación principal es:

1
1 
√
√
0

2
2 





1 
ÃT =  0 − √1
√ 



2
2 


1
0
(8.95)
0
~ 1 se puede construir
Es claro que con cualquier par de ejes perpendiculares a X
igualmente un sistema de ejes principales respecto al origen de coordenadas (véase figura
8.3). Otro problema serı́a hallar los momentos principales y los ejes principales respecto
al centro de masa que está localizado en el punto:
~ = a , a, a
R
(8.96)
3
z
m
m
x2
x1
x
m
y
x3
Figura 8.3 Ejes principales de sistema de masas puntuales
8.3.
Las ecuaciones de movimiento de Euler
Vamos a suponer que el cuerpo rı́gido no tiene ligaduras adicionales a la de poderse
mover sólo de modo que un punto permanezca fijo; entonces los ángulos de Euler son
coordenadas generalizadas para la descripción del movimiento del cuerpo rı́gido.
Dinámica del cuerpo rı́gido / 269
El lagrangiano del cuerpo rı́gido. La energı́a cinética es puramente rotacional
y está dada por la ecuación (8.22). La energı́a potencial dependerá de la orientación del
cuerpo, con lo cual la lagrangiana será:
L(φ, θ, ψ; φ̇; θ̇, ψ̇) =
1
(I1 ωx2 + I2 ωy2 + I3 ωz2 ) − V (φ, θ, ψ)
2
(8.97)
donde se supone que los ejes fijos al cuerpo rı́gido son ejes principales. Las fuerzas
generalizadas de este problema son:
Fφ = −
∂V
;
∂φ
Fθ = −
∂V
;
∂θ
Fψ = −
∂V
∂ψ
(8.98)
Fφ , Fθ y Fψ representan respectivamente el torque externo alrededor del eje espacial z,
el torque alrededor de la lı́nea de nodos y el torque alrededor del eje principal del cuerpo
rı́gido z.
Las ecuaciones de movimiento de Euler. Son las ecuaciones de movimiento.
La ecuación de Lagrange que contiene el torque alrededor de la coordenada z del cuerpo
rı́gido es:
∂T
∂V
d ∂T
−
=−
= Kz
dt ∂ ψ̇
∂ψ
∂ψ
(8.99)
~ obtenemos que:
Recordando las fórmulas (7.253) para las componentes de ω
∂T ∂ωx
∂T ∂ωy
∂T
=
+
= ωx ωy (I1 − I2 )
∂ψ
∂ωx ∂ψ
∂ωy ∂ψ
(8.100)
Por otra parte:
∂T
∂T ∂ωz
∂T
= I3 ωz
=
=
∂ω
∂ω
∂ ψ̇
z ∂ ψ̇
z
(8.101)
Entonces la ecuación de Lagrange (8.99) toma la forma:
I3 ω̇z − ωx ωy (I1 − I2 ) = Kz
(8.102)
La ecuación (8.102) no depende de las coordenadas generalizadas especı́ficas que
se usen para describir el movimiento; en particular no depende de la convención usada
para definir los ángulos de Euler, ya que esta sólo influye en las expresiones para las
ω. Si hubiéramos usado convenciones para los ángulos de Euler en que
componentes de ~
se intercambiaran los papeles de los ejes z y x, y z y y respectivamente, las ecuaciones
de movimiento serı́an en vez de (8.102), las siguientes:
I2 ω̇y − ωx ωz (I3 − I1 ) =
Ky
I1 ω̇x − ωy ωz (I2 − I3 ) =
Kx
(8.103)
Por tanto las ecuaciones (8.102) y (8.103) son tres ecuaciones diferenciales independientes que no dependen de la convención usada para definir los ángulos de Euler. En
la convención adoptada en el numeral 7.6, las ecuaciones (8.103) no son las ecuaciones
270 / Mecánica clásica
de lagrange para φ y θ, en tanto que (8.102) es la ecuación de Lagrange para ψ. No vale
tampoco que Fφ y Fθ correspondan a Ky y Kx pues como digimos representan el torque
alrededor de z, Kz , y el torque alrededor de la lı́nea de nodos, Kµ1 , respectivamente.
Una deducción más simple de las ecuaciones de Euler es la siguiente: el torque total
~ respecto a los ejes espaciales:
es igual a la rata de cambio temporal de L
~
~ = dL
K
dt
(8.104)
esp
~ respecto a los ejes rotantes se introduce mediante la fórmula:
La derivada de L
~
dL
dt
=
esp
~
dL
dt
rot
~
+ ~ω × L
(8.105)
donde hemos tomado los ejes coincidiendo instantáneamente. Las ecuaciones (8.104) y
(8.105) nos dan:
dLr
+ ǫr st ωs ωt Lt = Kr ;
dt
r = 1, 2, 3
(8.106)
Como escogemos los ejes rotantes coincidiendo con los ejes principales se cumple
que Lr = Ir ωr , de modo que obtenemos de (8.106) directamente las ecuaciones de Euler:
Ir ω˙r + ǫr st ωs ωt Is = Kr ;
r = 1, 2, 3
(8.107)
Principales casos en que las ecuaciones de Euler se pueden reducir a
cuadraturas. Las ecuaciones de Euler han sido reducidas a cuadraturas para valores
arbitrarios de las constantes de movimiento en los siguientes casos:
(a) El punto fijo es el centro de gravedad del cuerpo, de modo que no hay torques
externos. Los valores de los momentos de inercia son arbitrarios. Es el problema del
cuerpo rı́gido libre. Para el cuerpo rı́gido asimétrico (I1 6= I2 6= I3 ) el problema se
reduce a cuadraturas en términos de funciones elı́pticas y fue resuelto por Euler en 1758.
Para el cuerpo rı́gido simétrico (I1 = I2 6= I3 ) la solución está dada en términos de
funciones trigonométricas. Para el cuerpo libre esférico (I1 = I2 = I3 ) la solución es
trivial.
(b) El caso en que dos momentos principales de inercia alrededor de un punto del
cuerpo que no coincide con el centro de masa y fijo en el espacio son iguales (trompo
simétrico con un punto fijo). Tanto el punto fijo como el centro de masa están sobre el
eje de simetrı́a. No hay torques de fricción en el punto fijo y el único torque es producido
por un campo gravitatorio homogéneo. El problema se reduce a cuadraturas en términos
de funciones elı́pticas y fue resuelto por Lagrange en 1788.
(c) En 1887 la señora S.V. Kovalevski halló otro ejemplo soluble. Es el caso en
que dos momentos principales de inercia alrededor del punto fijo que no coincide con el
centro de masa son iguales entre sı́, y dos veces más grandes que el tercero (I1 = I2 =
2I3 ). Además, el centro de masa está sobre el plano formado por los ejes principales
correspondientes a los momentos principales iguales, y el único torque externo es el de
la gravedad. La solución está expresada en términos de las funciones hiper-elı́pticas.
Dinámica del cuerpo rı́gido / 271
Ejemplo 8.3.1 Sea un sistema de ejes primados que coinciden en el origen con un sistema
de ejes inercial pero que rota con respecto a los ejes inerciales con una velocidad angular
fija ω
~ 0 . Hallar las ecuaciones de movimiento de Euler para un cuerpo rı́gido que se mueve
respecto a este sistema de ejes rotantes en el caso en que no haya torques externos, V = 0.
El lagrangiano del sistema, considerado como un sistema de partı́culas, es:
N
L=
1 X ˙2
mi~ri
2 i=1
(8.108)
Transformemos primero el lagrangiano de los ejes espaciales a los ejes rotantes,
usando fórmulas de la sección 7.8. Llamemos à a la matriz de rotación de los ejes rotantes
respecto a los ejes espaciales, más adelante usaremos la notación Ã′ para denotar la
matriz de rotación de los ejes del cuerpo rı́gido respecto a los ejes rotantes. La velocidad
angular total es Ω̃′ + Ã′ Ω̃ Ω̃′T y por esto no podemos decir a priori que el vector velocidad
angular sea ω
~ +~
ω0 .
Si ~r ′ es el vector de posición en los ejes rotantes, sabemos que:
~r ′ = Ã~r ;
˙ T ~r˙ ′ + ÃT ~r˙ ′
~r˙ = Ã
(8.109)
de modo que:
2
˙ Ã
˙ T ~r ′
˙ ÃT ~r˙ ′ + ~r˙ ′T ÃÃ
˙ T ~r ′ + ~r ′T Ã
~r˙ = ~r˙ ′T ÃÃT ~r˙ ′ + ~r ′T Ã
(8.110)
Usando la siguiente definición de Ω̃′0 y las propiedades de Ã:
ÃÃT = I˜ ;
˙ ÃT + ÃÃ
˙ T = 0;
Ã
˙ ÃT ;
Ω̃′0 = Ã
˙ ˙T
Ω̃′2
0 = −ÃÃ
(8.111)
llegamos a:
2
r′
~r˙ = ~r˙ ′2 + 2~r ′T Ω̃′0 ~r˙ ′ − ~r ′T Ω̃′2
0 ~
(8.112)
Expresando ahora la matriz antisimétrica Ω̃′0 en términos del vector velocidad
angular respecto a los ejes rotantes:
Ω̃′0~r ′ = −~
ω0′ × ~r ′ ;
Ω̃20~r ′ = ω
~ 0′ × (ω0′ × ~r ′ )
(8.113)
Entonces podemos escribir a (8.112) como:
2
2
~r˙ = ~r˙ ′ − 2~
ω0′ · (~r˙ ′ × ~r ′ ) − ω
~ 0 · [(~ω0′ × ~r ′ ) × ~r ′ ]
La ecuación (8.114) puede llevarse a la forma:
2
2
~r˙ = ~r˙ ′ + 2~
ω0′ · (~r ′ × ~r˙ ′ ) + ω
~ 0′ · ~~1 × ~r ′2 − ~r ′~r ′ · ~ω0′
(8.114)
(8.115)
con lo cual llegamos a la siguiente expresión para L:
~
~′ + 1ω
~ ′ · I~ · ~ω0
L = T′ + ω
~ 0′ · L
2 0
(8.116)
272 / Mecánica clásica
~ ′ es el momento angular total respecto a los ejes rotantes e ~I~ es el momento de
donde L
inercia respecto a dichos ejes.
Si ahora el cuerpo rı́gido se mueve respecto a los ejes primados con velocidad
angular ~
ω , es claro que:
T′ =
1~ ~
ω · ~I · ~ω
2
(8.117)
~
donde ~I es el momento de inercia respecto a los ejes del cuerpo rı́gido, que podemos
tomarlos como ejes principales.
Ahora se cumple que:
~r ′ = Ã′T ~r ;
~r = Ã′~r ′ ;
˙ ′ Ã′T ;
˜ = Ã
Ω
˜ r = −~ω × ~r
Ω~
(8.118)
˜ la matriz Ω̃′ respecto a los ejes del cuerpo rı́gido:
Llamamos además Ω
0
0
˜ ′ Ã′T
˜ = Ã′ Ω
Ω
0
0
(8.119)
Entonces el segundo término de la derecha en (8.112) puede escribirse ası́:
T
˙ ′T ~r = 2(ω
˜ ′ Ã
~ 0 × ~r) · (~ω × ~r)
2~r ′T Ω̃′0~r˙ ′ = 2~r Ã′ Ω
0
El tercer término de (8.115) puede escribirse como:
~
~1(~r ′ · ~r ′ ) − ~r ′~r ′ = ~~1r 2 − Ã′T ~r ~rÃ′ = Ã′T ~~1r2 − ~r ~r Ã′
(8.120)
(8.121)
Con lo cual construimos el tensor de inercia respecto a los ejes del cuerpo rı́gido.
Finalmente, L toma la forma:
L=
N
X
~
~
1~ ~
~ × ~r i + 1 ω
~+
~0
~ 0 · ~I · ω
mi ~ω 0 × ~ri · ω
ω·I ·ω
2
2
i=1
(8.122)
que aún puede transformarse en el segundo miembro para dar:
L=
~
~
1~ ~
~ + ~ω · ~I · ω
~0 +
ω·I ·ω
2
1 ~ ~~ ~
ω0 · I · ω 0
2
(8.123)
Vamos a suponer que ω
~ 0′ está en la dirección del eje x′3 , de modo que las componentes de ~ω 0 serán:
~ 0 = (senθ senψ, senθ cos φ, cos θ)ω0
ω
(8.124)
Entonces los términos que contienen a ~ω0 en (8.123) son de la forma:
~
~
~ · ~I · ~ω 0 + 1 ~ω0 · ~I · ~ω0 = ωx ω0 senθ senψ I1
ω
2
+ωy ω0 senθ cos ψ I2 + ωz ω0 cos θ I3
1
+ (sen2 θ sen2 ψ I1 + sen2 θ cos2 ψ I2 + cos2 θI3 )ω02
2
(8.125)
Dinámica del cuerpo rı́gido / 273
La derivada parcial de (8.125) respecto a ψ es:
ω0 (ωy senθ senψ + ωx senθ cos ψ + ω0 sen2 θ senψ cos ψ)I1
+ω0 (−ωx senθ cos ψ − ωy senθ senψ − ω0 sen2 θ cos ψ senψ)I2
(8.126)
= ω0 ωy senθ senψ(I1 − I2 ) + ω0 ωx senθ cos ψ(I1 − I2 )
+ω02 sen2 θ senψ cos ψ(I1 − I2 )
La derivada de estos términos respecto a ψ̇ es I3 ω0 cos θ de modo que la ecuación
de Lagrange para ψ es:
(ωx ωy + ωy ω0 senθ senψ + ωx ω0 senθ cos ψ
(8.127)
+ω02 sen2 θ senψ cos ψ)(I1 − I2 ) − (ω˙z − θ̇ ω0 senθ)I3 = 0
Esta ecuación podemos expresarla en términos de las componentes de ~ω 0 :
(ωx + ω0x )(ωy + ω0y )(I1 − I2 ) − (ω̇z + ω̇0z )I3 = 0
(8.128)
Usando los mismos argumentos que en las ecuaciones (8.102) y (8.103), podemos
concluir que las otras dos ecuaciones de Euler son:
(ωx + ω0x )(ωz + ω0z )(I3 − I1 ) − (ω̇y + ω̇0y )I2 =
0
(ωy + ω0y )(ωz + ω0z )(I2 − I3 ) − (ω̇x + ω̇0x )I1 =
0
(8.129)
El resultado exhibe una dependencia “aditiva” con las velocidades angulares.
Ejemplo 8.3.2 Si en el lagrangiano de un cuerpo rı́gido se realiza el siguiente cambio de
variables:
(φ, θ, ψ; φ̇, θ̇, ψ̇) → (φ, θ, ψ; ω 1 , ω 2 , ω2 )
(8.130)
encontrar las ecuaciones de Lagrange correspondientes a las nuevas variables, o sea las
ecuaciones de Euler.5
De acuerdo con las fórmulas (7.253), las fórmulas de transformación son:
ω 1 = cos ψ θ̇ + senθ senψ φ̇ ;
(8.131)
ω 2 = −senψ θ̇ + senθ cos ψ φ̇ ;
ω 3 = ψ̇ + cos θ φ̇
y las inversas:
φ̇ =
ψ̇ =
5 Ver
senψ ω 1 + cos ψ ω2
;
senθ
θ̇ = cos ψ ω1 − senψ ω2
− cot θ(senψ ω 1 + cos ψ ω 2 ) + ω3
el texto de Corben y Stehle, Classical mechanics, sección 77, capı́tulo 13, 1960.
(8.132)
274 / Mecánica clásica
Si llamamos q̇1 = φ̇, q̇2 = θ̇, q̇3 = ψ̇, estas fórmulas pueden escribirse en forma de
matrices:
~ω = α̃~q˙ ;
~
q~˙ = β̃ ω
donde α̃ y β̃ son:

senθ senψ


α̃ = 
 senθ cos ψ

cos θ




β̃ = 


(8.133)
cos ψ
0
−senψ
0



0 


1
senψ
senθ
cos ψ
senθ
cos ψ
−senψ
−senψ cot θ
− cos ψ cot θ
0

(8.134)



0 


1
Si llamamos L̃(q, ω) a L[q, q̇(ω)] obtenemos que:
∂L
∂ L̃
∂ L̃ ∂αsu
=
+
q̇u
∂qr
∂qr
∂ωs ∂qr
(8.135)
d ∂ L̃
d ∂L
=
αsr
dt ∂ q̇r
dt ∂ωs
(8.136)
y que:
Multiplicando a (8.135) y (8.136) por βrt y sumando sobre r llegamos a la siguiente
expresión para las ecuaciones de Lagrange en L̃:
∂ L̃ ∂αsu
∂ L̃
βrt +
βrt βuυ ω υ =
∂qr
∂ωs ∂qr
βrt
d ∂ L̃
∂ L̃ ∂αsr
αsr +
βuυ ωυ βrt
dt ∂ω s
∂ωs ∂qu
(8.137)
Usando la propiedad α̃β̃ = I˜ obtenemos finalmente:
∂ L̃
d ∂ L̃
∂ L̃
βrt −
= γtυs
ωυ ;
∂qr
dt ∂ωt
∂ω s
donde:
γtυs =
∂αsr
∂αsu
−
∂qu
∂qr
t = 1, 2, 3
βrt βuυ
(8.138)
(8.139)
Para nuestro caso, el lagrangiano está dado por la ecuación (8.97):
L̃(q, ω) =
1 ~ ~~ ~
ω · I · ω − V (q)
2
(8.140)
Dinámica del cuerpo rı́gido / 275
y ası́:
∂ L̃
∂V
=−
= Kr ;
∂qr
∂qr
∂ L̃
= ωr Ir
∂ωr
(8.141)
Por tanto obtenemos de (8.138):
Kr βrt − ω̇ t It =
3
X
γtυs ωυ ω s Is ;
t = 1, 2, 3
(8.142)
υ,s=1
Notemos que γtυs puede escribirse como Astυ − Atsυ , donde:
Astυ =
∂αsm
βmt βnυ
∂qn
(8.143)
que también puede escribirse como:
∂ α̃
β̃
βnυ
Astυ =
∂qn
st
(8.144)
De la expresión explı́cita para α̃ obtenemos que:


cot θ sen2 ψ
cot θ senψ cos ψ 0




∂ α̃
∂ α̃
2

cot θ cos ψ
0
β̃ = 0̃ ;
β̃ =  cot θ senψ cos ψ

∂q1
∂q2


−senψ
− cos ψ
0
∂ α̃
β̃ =
∂q3

0


+ 
 −1

0
1 0
1


 −1 0


0 0
Se sigue entonces que:

cot θ sen2 ψ


Astυ = 
 cot θ senψ cos ψ

−senψ

0

0

(8.145)


0


0
cot θ senψ cos ψ
2
cot θ cos ψ
− cos ψ
0



0 
 (cos ψ, senψ, 0)υ

0 st
(8.146)


0 0 
 (−senψ cot θ, − cos ψ cot θ, 1)t

0 0 sυ
Es simple concluir a partir de (8.146) que:
γtυs = ǫtυs
(8.147)
276 / Mecánica clásica
Por tanto las ecuaciones (8.142) son:
ω̇t It +
3
X
ǫtυs ωυ ω s Is = Kr βrt ;
t = 1, 2, 3
(8.148)
υ,s=1
Kr son los torques alrededor de los ejes z, µ1 y z, en tanto que los lados derechos
de (8.148) son los torques alrededor de los ejes x, y, z.
Ejemplo 8.3.3 Otra variante de solución del ejemplo 8.3.1 puede obtenerse partiendo de
las ecuaciones de Lagrange (8.138).
Para este problema tenemos que:
∂ L̃
~ ∂ω0
ω + ~ω 0 ) · I~ ·
= (~
;
∂~q
∂~q
∂ L̃
~ + ~ω 0 ) · ~I~
= (ω
~
∂ω
(8.149)
En términos de componentes, las ecuaciones (8.138) son:
3
X
r,m=1
βrt
∂ω0m
(ω 0m + ωm )Im − ω̇ 0t + ω̇t It =
∂qr
3
X
ǫtυs (ω s + ω0s )Is ω υ
(8.150)
υ,s=1
O en otra forma:
(ω̇ 0t + ω̇t )It =
3
X
∂ω0m
βrt
− ǫt,m,r ω r (ω 0m + ω m )Im
∂qr
r,m=1
Para cualquier función F se cumple que:

senψ/senθ cos ψ −senψ cot θ


∂F
β̃ = 
 cos ψ/senθ −senψ cos ψ cot θ
∂~q

0
0
1

∂F/∂φ





  ∂F/∂θ 




∂F/∂ψ
~ 0 , hallamos que:
Usando la expresión (8.124) para ω


0
−ω03 ω 02




∂ ~ω0

ω
0
−ω
β̃ = 
03
01 

∂~q


0
−ω 02 ω 01
(8.151)
(8.152)
(8.153)
O en forma más explı́cita:
∂ ~ω0m
βrt = −ǫmrt ω0r
∂qr
(8.154)
Dinámica del cuerpo rı́gido / 277
Con lo cual concluimos que (8.151) toma la forma:
(ω̇ 0t + ω̇ t )It =
3
X
r,m=1
ǫtrm (−ω0r − ωr )(ω 0m + ω m )Im
(8.155)
que coinciden con las ecuaciones (8.128) y (8.129)
8.4.
El movimiento de un cuerpo rı́gido libre
En este caso en las ecuaciones (8.102) y (8.103) no aparecen torques, Kr = 0. Esto
se presenta, por ejemplo, cuando el centro de masa coincide con el punto fijo de modo
que la gravedad no produce torques.
El cuerpo rı́gido esférico. Se define por la condición I1 = I2 = I3 = I.
~ yω
Es el único caso en el cual los vectores L
~ son paralelos:
~ = I~
L
ω
(8.156)
~ como ~ω serán constantes en magnitud y dirección. Cada
Si no hay torques, tanto L
punto del cuerpo rı́gido se moverá sobre trayectoria circular. No hay precesión de ~ω .
La representación de Poinsot. Es una construcción geométrica que permite
analizar el movimiento de un cuerpo rı́gido libre, el cual puede ser asimétrico. Fue elaborada por Poinsot (Parı́s, 1834) y se basa en el elipsoide de inercia, descrito en la sección
8.2. La ecuación del elipsoide de inercia está dada en (8.73). La normal al elipsoide en
un punto cualquiera tiene la dirección del vector gradiente de F , siendo F la superficie
(8.75):
∂F
= (2xI1 , 2yI2 , 2zI3 ) = 2r(n1 I1 , n2 I2 , n3 I3 )
∂~r
(8.157)
donde hemos tomado un sistema de ejes principales. Si escogemos el punto (x, y, z)
sobre el eje de rotación, entonces:
ω
~ = ω(n1 , n2 , n3 )
(8.158)
De modo que (8.149) toma la forma:
∂F
2r
2r ~
= (ω1 I1 , ω2 I2 , ω3 I3 ) = L
∂~r
ω
ω
(8.159)
Hay dos puntos donde el eje de rotación corta la superficie del elipsoide de inercia.
De (8.159) podemos concluir que en esos dos puntos siempre se cumple que la normal
~ Cuando no hay torques se cumple que L
~ y por
a la superficie está en la dirección de L.
~ son constantes, independientemente de la forma que tenga el movimiento
lo tanto ∇F
del elipsoide de inercia, el cual se mueve solidariamente con el cuerpo rı́gido. La energı́a
cinética se puede escribir en la forma:
T =
1
~ = ω ~r · L
~
ω·L
~
2
2r
(8.160)
278 / Mecánica clásica
Cuerpo
rígido
Elipsoide
de inercia
b
a
0
c
r
P
L
∆
ω
F
Figura 8.4 Elipsoide de inercia
que se puede llevar a la forma:
~ ·L
~ =0
(~r − d)
(8.161)
donde d~ es un vector definido por la relación:
~ = 2r T
d~ · L
ω
(8.162)
~ entonces adquiere la forma:
si escogemos a d~ paralelo a L,
~
L
2r
T 2
d~ =
ω L
(8.163)
~ y es la normal al plano
La expresión (8.161) es la ecuación de un plano, donde L
y ~r es un punto del mismo.
Como ~r es un punto particular (el punto donde se cortan el eje de rotación y el
elipsoide de inercia) que puede estar cambiando con el tiempo, vemos entonces que el
elipsoide se mueve de tal manera que el punto donde se corta con el eje de rotación
siempre permanece sobre un plano (véase figura 8.4). d~ es un vector constante, pues
usando las relaciones:
Ir2 = constante y T =
1 2
Iω = constante
2
~
podemos escribir el vector d~ como una expresión que solo depende de T y L:
√
2Ir2 T ~
L
d~ =
L2
(8.164)
(8.165)
Dinámica del cuerpo rı́gido / 279
~ son constantes, el plano es constante y se llama plano invariable. d~
Como d~ y L
es la perpendicular trazada desde el centro del elipsoide al plano tangente, o sea que es
~ la lı́nea que contiene a d~ se llama lı́nea invariable.
igual a la proyección de ~r sobre L;
Línea invariable
Polodia
Plano invariable
0
r d
P
Herpolodia
r –d
ω
L
Figura 8.5 El elipsoide de inercia rueda sin deslizar sobre el plano invariable
Podemos concluir que el elipsoide de inercia toca al plano invariable en el punto
donde el eje de rotación corta al elipsoide. El radio vector de O a P, ~r, está sobre el
eje instantáneo de rotación; no hay movimiento relativo entre un punto del elipsoide y
un punto del plano; por lo tanto el elipsoide de inercia rueda sin deslizar sobre el plano
invariable; en efecto, P está sobre el eje de rotación y por ello es el único punto del
elipsoide de inercia que está en reposo instantáneamente (véase figura 8.5). Como ω
~ es
~ es proporcional a d:
~
proporcional a ~r, la proyección de ~ω sobre L
~
ω
~ ·L
~ = 2T L
~ =
L
2
L
L2
r
2T ~
d
Ir2
(8.166)
~ es constante; es decir, ω
~
o sea que la proyección de ~
ω sobre L
~ precesa alrededor de L,
pero sin mantenerse constante el ángulo entre estos dos vectores, cuyo coseno está dado
por:
~
ω
~ ·L
Ir2 ω
=
ωL
L r2
(8.167)
~ también puede
Como ω y r pueden cambiar, se sigue que el ángulo entre ~ω y L
cambiar, lo cual ocurre cuando el cuerpo es asimétrico.
La curva trazada por el punto de contacto sobre el elipsoide de inercia se llama
polodia (de odos, camino y polein, girar) y la curva correspondiente sobre el plano
invariable se llama herpolodia (de herpeton, reptil).
~ no es constante, ver ecuación (8.105). De
Respecto a los ejes del cuerpo rı́gido L
modo que (8.160) ya no representa un plano, sino un elipsoide que es precisamente
280 / Mecánica clásica
el elipsoide de inercia. Es fácil demostrar que respecto a los ejes del cuerpo rı́gido la
~ es una constante:
magnitud de L
d 2
~ =0
~ ·L
~˙ = −2L
~· ω
~ ×L
(8.168)
L = 2L
dt
Esto implica que respecto a los ejes del sólido rı́gido ~r está además sobre el elipsoide:
I12 x2 + I22 y 2 + I32 z 2 =
Ir2 L2
2T
(8.169)
La polodia es, en consecuencia, el lugar geométrico de los puntos del elipsoide de
inercia que satisfacen simultáneamente las ecuaciones (8.73) y (8.169); es decir, es el
lugar geométrico de la intersección de dos elipsoides cuyos semiejes están dados respectivamente por:
a2 :
Ir2 Ir2 L2
Ir2 Ir2 L2
Ir2 Ir2 L2
,
; b2 :
,
; c2 :
,
I1
I1 2T I1
I2
I2 2T I2
I3
I3 2T I3
(8.170)
La existencia de una intersección está asegurada por las desigualdades evidentes:
~
I = ~n · I~ · ~n ≥ I1 ;
I ≤ I3 ⇒ 2T I1 < L2 < 2T I3
(8.171)
siendo I1 el más pequeño de los tres momentos principales de inercia e I3 el mayor.
El cuerpo rı́gido simétrico libre en la representación de Poinsot. Cuando
I1 = I2 6= I3 , dos de los semiejes del elipsoide de inercia son iguales, siendo éste un
elipsoide de revolución. Las ecuaciones de la polodia son (8.169) y (8.73):
I1 (x2 + y 2 ) + I3 z 2 = Ir2 ;
I12 (x2 + y 2 ) + I32 z 2 =
De estas ecuaciones obtenemos las siguientes:
L2
(I1 I3 − I32 )z 2 = Ir2 I1 −
2T
2
2
I1 (I1 − I3 )(x + y ) = Ir
2
L2
− I3
2T
Ir2 L2
2T
(8.172)
(8.173)
Vemos que la polodia está situada a una distancia constante del origen, sobre el eje
de simetrı́a, y es una circunferencia. El elipsoide rueda sin deslizar sobre el plano siendo
la polodia una circunferencia, o sea que ~r es paralelo ~ω (el vector de posición del centro
de la polodia). El vector forma el mismo ángulo con ~ω, es decir que está a lo largo del
eje de simetrı́a, siempre tienen el mismo ángulo; es decir, el eje de simetrı́a y ~ω forman
un ángulo que permanece constante, lo cual significa que ω
~ efectúa un movimiento de
precesión alrededor del eje de simetrı́a.
La proyección de ~ω sobre el eje z es constante y las proyecciones sobre los ejes
x y y ejecutan movimientos armónicos simples con cierta frecuencia Ω. Respecto a los
~ (véase figura 8.6). El vector ~ω
ejes espaciales, como se dijo, ~ω precesa alrededor de L
precesa en los dos sistemas de ejes generando dos conos. En el sistema espacial ~ω precesa
Dinámica del cuerpo rı́gido / 281
Cono del cuerpo rígido
0
Cono fijo
ω
z
L
Figura 8.6 El cono del cuerpo rı́gido rueda sin deslizar sobre el cono fijo
~ y en el sistema del cuerpo rı́gido precesa alrededor del
alrededor del vector constante L
eje de simetrı́a. En conclusión, el movimiento del cuerpo rı́gido puede obtenerse a partir
del movimiento del cono del cuerpo rı́gido que rueda sin deslizar sobre el cono fijo.
Es claro que para un cuerpo no simétrico la polodia no será una circunferencia, ~ω
~ En el cuerpo rı́gido
no será constante, como tampoco el ángulo entre los vectores ~ω y L.
asimétrico se presentarán estos tres movimientos: rotación alrededor del eje instantáneo
~
de rotación; precesión del eje instantáneo de rotación alrededor del vector constante L
~
y nutación del eje instantáneo de rotación al cambiar el ángulo entre los vectores ~ω y L.
Es claro que la frecuencia de nutación es el doble de la frecuencia de rotación.
Solución de las ecuaciones de Euler para un cuerpo rı́gido simétrico
libre. Las ecuaciones de Euler para este problema toman la forma:
I1 ω̇x = ωy ωz (I1 − I3 )
(8.174)
I1 ω̇y = −ωx ωz (I1 − I3 )
(8.175)
I3 ω̇z = 0
(8.176)
De (8.174) y (8.175) obtenemos las siguientes dos ecuaciones:
I12 ω̈x + ωx ωz (I1 − I3 )2 = 0 ;
I1 ω̇y = −ωz ωx (I1 − I3 )
(8.177)
O sea que la solución a las ecuaciones de Euler puede escribirse como:
ωx = A sen(|Ω|t + δ) ;
ωy =
Ω
A cos(|Ω|t + δ)
|Ω|
(8.178)
ωz = constante, donde Ω está definida por:
Ω=
I1 − I3
ωz
I1
(8.179)
282 / Mecánica clásica
El resultado nos dice que el vector ~ω precesa alrededor de z a una rata constante
|Ω|. Como no hay nutación se dice que la precesión es regular. El resultado está de
acuerdo con las conclusiones obtenidas mediante la construcción de Poinsot.
Ejemplo 8.4.1 Analizar el movimiento rotacional de la Tierra con un modelo de cuerpo
rı́gido simétrico libre.
La Tierra puede suponerse aproximadamente como un elipsoide achatado y con una
distribución uniforme de materia. Entonces la masa total puede asumirse que está en el
centro de masa, de modo que con esta aproximación los demás cuerpos celestes no realizarán torques. Los momentos principales de inercia respecto al centro para un elipsoide
son:
1
1
1
I2 = M (a2 + c2 ) ;
I3 = M (a2 + b2 )
(8.180)
I1 = M (b2 + c2 ) ;
5
5
5
Con este modelo tenemos que para la Tierra se cumple:
I3 ≈ I1 = I2 ;
c≈a=b
(8.181)
La relación entre los diámetros polar y ecuatorial nos da:
c
= 0, 9672
(8.182)
a
Tomando el eje z a lo largo del eje polar y sabiendo que la rotación completa
alrededor de un eje es un dı́a, obtenemos:
2π
= 7, 272 × 10−5 rad/s
(8.183)
dı́a
La magnitud de la precesión, A, dependerá de la medida en que difieran ω y ωz ,
que es pequeña. La frecuencia de precesión está dada por:
I1 − I3
c
|Ω| =
(8.184)
ωz = 0, 00328ωz
ωz ≈ 1 −
I1
a
ωz ≈
El perı́odo de precesión será pues de unos 305 dı́as. Se ha observado que tal precesión se presenta siendo su amplitud pequeña. El “radio” de la polodia es aproximadamente de 5 a 8 metros. La polodia es una curva complicada que exhibe algo ası́ como una
nutación. El perı́odo observado es de unos 427 dı́as; es una precesión no atribuible a torques; las discrepancias se deben a la idealización del modelo. Esta precesión es diferente
a la precesión de los equinoccios, debida a los torques ejercidos por el Sol y la Luna,
pues en realidad el centro de masa de la Tierra no coincide con el centro geométrico, el
perı́odo de esta precesión es de 25.800 años. Esta precesión tampoco es la responsable
de las estaciones. Éstas se deben a que el plano de la elı́ptica hace un ángulo de 23◦ con
el plano ecuatorial de la Tierra.
Las funciones elı́pticas de Jacobi. Haremos un resumen de las principales
propiedades de estas funciones que, sabemos, aparecen en la solución general para un
cuerpo rı́gido libre asimétrico.6
6 Véase
el texto de Abramowitz y Stegun, Handbook of mathematical functions, capı́tulos 16 a 18,
1965; y las referencias dadas en él, especialmente el curso de análisis de Whittaker y Watson.
Dinámica del cuerpo rı́gido / 283
Si z es una variable compleja, en general una función elı́ptica Fpq (z) es una función
que posee un cero en el punto z = p y un polo en el punto z = q, donde p y q son los
puntos de una red rectangular infinita en el plano complejo. En la construcción de esta
red se parte de una celdilla elemental constituida por un rectángulo cuyos vértices están
en los puntos O, K, K + iK ′ , iK ′ , llamados respectivamente s, c, d, n. Los números
reales K y K ′ están definidos de la siguiente manera en función de un parámetro real
m, 0 ≤ m ≤ 1:
K=
Z
π/2
0
dθ
√
;
1 − msen2 θ
K′ =
Z
π/2
0
dθ
p
1 − (1 − m)sen2 θ
(8.185)
K se llama el cuartiperı́odo real e iK ′ el cuartiperı́odo complejo de la función
elı́ptica Fpq (z). Estas funciones se llaman funciones elı́pticas de Jacobi y usualmente se
denotan en la forma pqz. Hay doce de estas funciones que son sc z, sd z, sn z, cs z, cd z,
cn z, ds z, dn z, dc z, ns z, nc z, nd z.
La definición de las funciones elı́pticas de Jacobi es: (i) pq z tiene solamente singularidades aisladas; tiene un cero en p y un polo en q; (ii) Las funciones pq z son periódicas.
Entre p y q hay un semiperı́odo de la función pq z, siendo 2K, 2iK ′ , 2K + 2iK ′ los
perı́odos.
Ası́ por ejemplo, las funciones copolares con polo en iK ′ , sn, cn y dn tienen respectivamente los perı́odos 2iK ′ , 2K + 2iK ′ y 2K, o equivalentemente los perı́odos 4K,
4K y 2K.
Las funciones elı́pticas de Jacobi pueden definirse también con respecto a ciertas
integrales. Si:
z=
Z
φ
0
dθ
√
1 − m sen2 θ
(8.186)
el ángulo φ es llamado la amplitud y m el parámetro.
φ = am z
(8.187)
Entonces se definen las funciones ası́:
sn z = sen φ ;
cn z = cos φ ;
dn z =
p
1 − m sen2 φ
(8.188)
Todas las otras nueve funciones pueden expresarse en función del trio copolar sn,
cn, dn. Estas funciones aparecen al evaluar ciertas integrales, llamadas integrales elı́pticas, que son de la forma:
Z
R(x, y) dx
(8.189)
donde R(x, y) es una función racional de x, y, donde y 2 es igual a un polimonio en x de
grado 3 o de grado 4. Cuando R(x, y) sólo contiene potencias pares de y, o cuando el
polimonio y 2 tiene un factor repetido la integral (8.189) es elemental. En todos los demás
casos aparecerán las funciones elı́pticas. Cualquier integral elı́ptica puede expresarse
284 / Mecánica clásica
en términos de las integrales elı́pticas de primera, segunda y tercera clase, definidas
respectivamente por:
Z φp
Z φ
dθ
√
;
1 − m sen2 θ dθ ;
1 − m sen2 θ
0
0
(8.190)
Z φ
dθ
p
(1 − n sen2 θ)(1 − m sen2 θ)
0
Cuando φ = π/2, las integrales (8.190) se llaman integrales elı́pticas completas de
primera, segunda y tercera clase. Cuando el parámetro toma el valor cero las funciones
elı́pticas coinciden con funciones circulares. Cuando el parámetro es tan pequeño que
podemos despreciar términos de orden superior a m2 tenemos las aproximaciones:
sn z =
1
sen z − m(z − sen z cos z) cos z + ...
4
cn z =
1
cos z + m(z − sen z cos z) sen z + ...
4
dn z =
1
1 − m sen2 z + ...
2
(8.191)
1
z − m(z − sen z cos z) + ...
4
Cuando m tiende a la unidad, las funciones elı́pticas coinciden con funciones hiperbólicas; por ejemplo sn z → tanh z; cn z → 1/ cosh z; dn z → 1/ cosh z. A partir
de la ecuación diferencial que sirve para definir la función sn podemos obtener buena
información del comportamiento de las funciones elı́pticas, para z real.
La ecuación (8.186) equivale a la ecuación diferencial:
2
dφ
= 1 − msen2 φ
(8.192)
dx
an z =
Mediante la sustitución y = sen φ, (8.192) se transforma en:
2
dy
= (1 − y 2 )(1 − my 2 )
dx
(8.193)
2
Claramente y = sen x es la solución cuando m = 0 (véase figura 8.7). (dy/dx)
√
es igual a una función continua de y que se anula en y = ±1 y √
en y = ±1/ m; en
m la derivada vale
y = ±1 la derivada
de
esa
función
vale
±2(m
−
1)
y
en
y
=
±1/
√
∓2(m − 1)/ m.
De (8.193) podemos deducir las siguientes propiedades de la solución, y = s nx:
(i) Si y(x) es una solución, y(x + c) es una solución ya que ni y ni dy/dx cambian
en una translación en el eje x.
(ii) y(x) está siempre contenida
√ entre los valores y = −1 y y = +1 puesto que para
valores absolutos de y entre√1 y 1/ m, dy/dx es imaginaria, como también lo es para
valores de y mayores que 1/ m.
Dinámica del cuerpo rı́gido / 285
(iii) Como para todos los valores de y entre −1 y +1 la derivada dy/dx es no nula,
se sigue que en el intervalo (−1, +1) no hay otros puntos diferentes a y = ±1 donde la
pendiente se anule dentro del intervalo.
(iv) Sólo hay una curva y(x) que toca una de las lı́neas y = −1 o y = +1 en un
punto x0 dado. Para x < x0 y para x > x0 la pendiente de y en la vecindad de x0 tiene
valores opuestos. Por ejemplo, si (x = x0 , y = −1) es el punto en cuestión, se sigue
integrando (8.193):
Z y
dy
p
x − x0 = −
2
(1 − y )(1 − my 2 )
−1
(8.194)
Z y
dy
p
x − x0 =
(1 − y 2 )(1 − my 2 )
−1
según que dy/dx sea negativa o positiva respectivamente.
y
y=1
dn x
sn x
x0
x
2K
cn x
y = –1
Figura 8.7 Funciones circulares cuando se desprecian términos de orden superior a m2
Cuando (x, y) tiende a (x0 , −1), las ecuaciones (8.194) dan la única curva y(x) que
satisface la condición de tangencia.
(v) La curva y(x) es inalterada mediante una reflexión en el origen. Basta con
conocer la curva entre y = 0 y y = 1, o equivalentemente entre x = 0 y x = K para
construir la curva total.
(vi) La distancia en x entre dos sucesivos contactos de y(x) con las lı́neas y = −1
y y = +1 está dada por:
Z +1
dy
p
(8.195)
2K =
2
(1 − y )(1 − my 2 )
−1
286 / Mecánica clásica
(vii) De la simetrı́a de la curva respecto a la normal en el punto de contacto con
una de las lı́neas y = −1 o y = +1, se sigue que y(x) es periódica con perı́odo 4K.
Podemos entonces definir a sn x por las siguientes propiedades:
2
dsn x
= (1 − sn2 x)(1 − msn2 x) ; sn0 = 0
dx
(8.196)
dsn x
= 1 ; sn(x + 4K) = sn x
dx x=0
Podemos definir las funciones cn x y dn x por las ecuaciones:
cn2 x = 1 − sn2 x ;
dn2 x = 1 − msn2 x
(8.197)
con la condición de que las funciones y sus derivadas sean continuas. Como 0 ≤ m ≤ 1,
dnx siempre puede tomarse positiva. El perı́odo de cn x es 4K y el de dn x es 2K. Se
sigue de (8.196) que:
dsn x
= cn x dn x
dx
(8.198)
de (8.196) y (8.197) se sigue entonces que:
dcn x
= −sn x dn x ;
dx
ddn x
= −m sn x cn x
dx
(8.199)
La figura 8.7 muestra las funciones elı́pticas de Jacobi sn, cn y dn, para m = 1/2.
Con las funciones elı́pticas es posible hallar fórmulas análogas a las de la trigonometrı́a ordinaria. Por ejemplo, la fórmula de adición para la función sn es:
sn(u ± υ) =
sn u cn υ dn υ ± sn υ cn u dn u
1 − m sn2 u sn2 υ
(8.200)
Algunos valores notables de sn son:
sn 0 = 0 ;
sn K = 1 ;
1
sn(K + iK ′ ) = √ ;
m
sn iK ′ = ∞
sn
K
1
=p
√
2
1 + m1
(8.201)
Con estas fórmulas podemos hallar la siguiente relación últil:
1
±√
= ±sn(u ± iK ′ )
m sn u
(8.202)
dada por la fórmula 16.8.1 del libro de Abramowitz, Op. cit.
Relacionadas con las funciones elı́pticas están las funciones θ, denotadas por θ1 (z, q),
θ2 (z, q), θ3 (z, q), θ4 (z, q), cuyas definiciones están en la sección 16.27 del libro de Abramowitz. Otros autores usan la notación siguiente para las mismas funciones: θ11 , θ10 , θ00 ,
θ01 , como en el Tratado de mecánica analı́tica de Wittaker, o en el texto de mecánica de
Dinámica del cuerpo rı́gido / 287
Landau (ver bibliografı́a). Nos interesará la función θ4 que tiene la siguiente expresión
como un producto infinito (fórmula 16.37.4 del del libro de Abramowitz):
1/2 Y
∞
m
θ4 (v) = θ4 (0)
(1 − 2q 2n−1 cos 2v + q 4n−2 )
(8.203)
16qm21
n=1
donde m y m1 = 1 − m tienen la misma significación que en las funciones elı́pticas, y ϑ
y q están definidas por:
′
πu
;
q = e−πK /K
(8.204)
v=
2K
La siguiente expresión para θ4 (v) como un producto infinito es más útil:
θ4 (v) = constante
∞
Y
(1 − q 2n−1 e2iv )(1 − q 2n−1 e−2iv )
(8.205)
n=1
Tomando logaritmos en esta expresión y derivando respecto a v llegamos a la
siguiente fórmula para la derivada logarı́tmica de θ4 :
∞ θ4′ (v) X −2iq 2n−1 e2iv
2iq 2n−1 e−2iv
+
=
(8.206)
θ4 (v) n=1 1 − q 2n−1 e2iv
1 − q 2n−1 e−2iv
Esta expresión tiene polos simples donde θ4 tiene ceros simples, o sea cuando v es
tal que:
e±2iv = ei(2n−1)πiK
′
/K
(8.207)
es decir, cuando u = 2Kv/π, vale:
urm = (2r + 1)iK ′ + 2mK ;
r, n = 0, ±1, ±2. . . ± ∞
(8.208)
Con esta expresión para los polos de θ4′ /θ4 podemos formar la serie de Laurent
para esta función:
+∞
+∞
X
X
brm
θ4′ (v)
=
θ4 (v) r=−∞ m=−∞ v − vrm
(8.209)
donde brm son los residuos de la función que obtenemos de:
brm = lı́m (v − vrm )
v→vrm
θ4′ (v)
θ4 (v)
(8.210)
Evaluando esta expresión llegamos finalmente a:
+∞
+∞
X
X
1
θ4′ (v)
=
θ4 (v) r=−∞ m=−∞ v − vrm
(8.211)
Solución de las ecuaciones de Euler para un cuerpo rı́gido asimétrico
libre.7 Supondremos que I3 > I2 > I1 . De acuerdo con la representación de Poinsot,
7 Este
problema fue resuelto por Jacobi en 1849.
288 / Mecánica clásica
las ecuaciones de la polodia están dadas por la intersección del elipsoide de inercia con
el elipsoide del momento angular:
I1 ω21 + I2 ω 22 + I3 ω 23 = 2E
(8.212)
I12 ω21 + I22 ω 22 + I32 ω23 = L2
De estas ecuaciones podemos obtener las siguientes expresiones para ω21 y ω23 en
función de ω 22 :
ω21 =
1
[(2EI3 − L2 ) − I2 (I3 − I2 ) ω 22 ]
I1 (I3 − I1 )
(8.213)
ω23 =
1
[(L2 − 2EI3 ) − I2 (I2 − I1 ) ω 22 ]
I3 (I3 − I1 )
(8.214)
La ecuación de Euler para ω2 , (8.214), toma entonces la forma:
ω̇2 =
1
√
(2EI3 − L2 ) − I2 (I3 − I2 )ω 22 ·
I2 I1 I3
2
(L − 2EI1 ) − I2 (I2 − I1 )ω 22
1/2
(8.215)
Al separar variables e integrar obtenemos una expresión que se puede reducir a
una integral elı́ptica incompleta de primera clase en la forma normal, llamando:
b2 =
2EI3 − L2
;
I2 (I3 − I2 )
a2 =
L2 − 2EI1
I2 (I2 − I1 )
(8.216)
Si para precisar suponemos que 2EI3 > L2 > 2EI2 , encontramos entonces que a2
y b son positivas. Notamos que al expresar a L y a E en función del momento de inercia
alrededor del eje de rotación I, esta condición nos dice que I3 > I > I2 > I1 , con lo cual
obtenemos que a es mayor que b. Con estas sustituciones, y escogiendo t = 0 de modo
que ω 2 sea igual a cero, la integral de (8.215) es de la forma:
2
I1 I2 I3
t=
(I3 − I2 )(L2 − 2EI1 )
1/2 Z
0
ω2
a dω 2
p
2
(a − ω 22 )(b2 − ω 22 )
(8.217)
Mediante la fórmula 17.4.45 del Handbook of mathematical functions de Abramowitz
y Stegun, la integral en (8.217) puede llevarse a la forma de una integral elı́ptica de
primera clase con parámetro m dado por:
m=
I2 − I1 2EI3 − L2
b2
=
2
a
I3 − I2 L2 − 2EI1
(8.218)
Esta integral puede expresarse en términos de la función elı́ptica sn de acuerdo
con (8.188). En efecto, haciendo en (8.217) la sustitución señalada en la fórmula del
Handbook:
ω2 = b sn v
(8.219)
Dinámica del cuerpo rı́gido / 289
y teniendo en cuenta que, según (8.198):
dω 2 = b cn v dn v dv
(8.220)
obtenemos en el lugar de la integral de (8.217):
Z v
dn v dv
ω2
√
= v = sn−1
2
b
1 − msn v
0
(8.221)
Si llamamos:
1/2
(I3 − I2 )(L2 − 2EI1 )
c=
I1 I2 I3
(8.222)
entonces (8.217) se reduce, llamando b2 = b, a:
ω 2 = b2 sn ct
(8.223)
Reemplazando a ω2 (t) en (8.213) y (8.214) obtenemos para ω 1 y ω 3 :
ω1 =
b1 sn ct
ω3 =
b3 sn ct
(8.224)
donde b1 y b3 están dadas por:
b21 =
2EI3 − L2
;
I1 (I3 − I1 )
b23 =
L2 − 2EI1
I3 (I3 − I1 )
(8.225)
Al reemplazar la solución (8.224) en las ecuaciones de Euler, éstas resultan compatibles si el producto b1 b2 b3 es negativo.
ω1 y ω2 son periódicas con perı́odo 4K y ω3 es periódica con perı́odo 2K, donde
K es la integral elı́ptica completa de primera clase. El perı́odo que nos interesa es con
respecto al tiempo que está dado por:
T =
4K
c
(8.226)
~
De acuerdo con la construcción de Poinsot, al cabo de un tiempo T el vector ω
completa un ciclo de precesión alrededor del eje z, es decir, ω 1 y ω 2 coinciden consigo
mismas, en tanto que al cabo de un tiempo T /2, ω 3 coincide consigo misma.
El problema no termina hallando a ω r (t), pues interesa describir el movimiento
absoluto del cuerpo rı́gido en el espacio, o sea hallar los ángulos de Euler en función del
tiempo.
Reemplazando las expresiones (8.224) y (8.225) en (8.131), obtenemos tres ecuaciones diferenciales para θ, φ y ψ, cuya solución es complicada cuando los ejes espaciales
se toman arbitrariamente, pero se simplifica un poco tomando el eje z en la dirección de
~ Como el ángulo polar y el ángula lı́nea invariable definida por el vector constante L.
~
lo acimutal del vector L, que coincide con el eje z, son respectivamente θ y π/2 − ψ,
podemos sin más escribir:
L1 = L senθ senψ ;
L2 = L senθ cos ψ ;
L3 = L cos ψ
(8.227)
290 / Mecánica clásica
Como Lr = Ir ω r obtenemos que:
1/2
I3 (L2 − 2EI1 )
I3 ω 3
=
dn ct
cos θ =
L
L2 (I3 − I1 )
tan ψ =
I1 ω 1
I1 (I3 − I2 )
=
I2 ω 2
I2 (I3 − I1 )
1/2
(8.228)
cn ct
sn ct
θ y ψ al igual que las componentes de ~ω son funciones periódicas, con perı́odo igual
al de la función dn, o sea T /2. En efecto, dn z y cn z/sn z = cs z son coperiódicas con
perı́odo 2K. El ángulo φ se puede obtener de (8.132) y (8.228). El resultado para φ̇ en
función de las componentes de ~ω solamente es:
φ̇ =
I1 ω 21 + I2 ω 22
L
I12 ω 21 + I22 ω22
(8.229)
φ̇ es periódica con perı́odo T /2. En general, φ no se incrementará por un múltiplo de 2π
en un perı́odo y por ello el movimiento del cuerpo rı́gido como un todo no es periódico,
o sea que el cuerpo rı́gido en general no vuelve nunca a su posición inicial. En efecto,
reemplazando en (8.229) las expresiones (8.224) y (8.225) obtenemos:
φ̇ = L
(I3 − I2 ) + (I2 − I1 )sn2 ct
I1 (I3 − I2 ) + I3 (I2 − I1 )sn2 ct
(8.230)
Ahora, podemos definir una cantidad real β por medio de estas expresiones que
son mutuamente consistentes:
1/2
1/2
I(I3 − I1 )
I3 (I − I1 )
; cn iβ =
sn iβ = i
I1 (I3 − I)
I1 (I3 − I)
(8.231)
1/2
I2 (I3 − I1 )
dn iβ =
I1 (I3 − I2 )
I que no es el momento de inercia respecto al eje de rotación, está dado por:
L2
2E
de modo que la expresión para m toma la forma:
I=
m=
I3 − I I2 − I1
I − I1 I3 − I2
(8.232)
(8.233)
φ̇ toma la siguiente forma al reemplazar a (8.231) en (8.230):
φ̇ =
L I2 + (I1 dn2 iβ − I2 )sn2 ct
I1 I2
1 − m sn2 iβ sn2 ct
(8.234)
Esta expresión es de la forma (Ax + Bsn2 ct)/(Cx + Dsn2 ct) o sea es el cociente
de dos funciones lineales de x. Al efectuar el cociente llegamos a:
1
dn2 iβ sn2 ct
1
L
+L
−
(8.235)
φ̇ =
I1
I2
I1 1 − m sn2 iβ sn2 ct
Dinámica del cuerpo rı́gido / 291
Examinemos la estructura analı́tica del segundo término en (8.235). Tiene singularidades en los valores de ct tales que se anula el denominador:
±1
sn ct = √
= sn (±iβ + iK ′ )
m sn iβ
(8.236)
donde hemos usado la fórmula (8.202). Usando la propiedad de la función sn de ser
doblemente periódica, con perı́odos 2iK ′ , 4K y 4K + 4iK ′, podemos concluir de (8.236)
que snu = (−1)r sn (u + 2mK + 2riK ′ ) y por lo tanto:
(−1)r ct = ±iβ + (2r + 1)iK ′ + 2mK ;
r, m = 0, ±1, ±2, ...
(8.237)
Estos ceros del denominador son simples, o sea que la función puede expandirse en
series de Laurent de la forma (8.209):
"
X
+∞
+∞
X
1
1
arm
L
−
I2
I1 r=−∞ m=−∞ (−1)r ct + iβ − urm
(8.238)
#
brm
−
+ constante
(−1)r ct − iβ − urm
Para evaluar los residuos, expandimos el denominador en (8.235) en serie de Taylor
alrededor de los ceros, (8.237):
1 − m sn2 iβ sn2 ct = 1 − m sn2 iβ sn2 (±iβ + iK ′ )
+ [(−1)r ct − (±iβ + urm )] 2m sn2 iβ sn(±iβ + iK ′ )·
(8.239)
cn(±iβ + iK ′ ) dn(±iβ + iK ′ )
donde hemos usado la periodicidad de las funciones elı́pticas. Usando (8.236) y luego las
expresiones (8.231), llegamos a que arm y brm valen respectivamente:
±
1/2
dn iβ
1 I1 I2 (I3 − I2 )(I − I1 )
=±
2m sn iβ cn iβ
2i II3
(I2 − I1 )
(8.240)
Los residuos del segundo término de (8.235) son entonces:
±i
c
2
(8.241)
Por tanto el segundo término del lado derecho de (8.235) es:
"
+∞
+∞
1
c X X
i
r
2 r=−∞ m=−∞ (−1) ct + iβ − urm
−
#
1
+ constante
(−1)r ct − iβ − urm
(8.242)
292 / Mecánica clásica
Es fácil ver que u−r,−m = ur−1,m , con lo cual es posible hacer que los términos
con r impares tengan la misma forma de los términos con r pares. Entonces (8.242) es
igual a una expresión que no contiene el (−1)r . Usando la expresión (8.226) para c y
luego multiplicando numeradores y denominadores por π/(2K), obtenemos:
"
+∞
+∞
π X X
1
i
T r=−∞ m=−∞ π (ct + iβ) − vrm
2K
(8.243)
#
1
+ constante
− π
(ct − iβ) − vrm
2K
Comparando ahora a (8.243) con (8.236), obtenemos finalmente la siguiente expresión para φ̇ en términos de las funciones θ:
"
L
iπ θ4′ [(ct + iβ)π/(2K)]
φ̇ =
+
I1
T θ4 [(ct + iβ)π/(2K)]
#
θ4′ (iβπ/2K)
θ4′ [(ct − iβ)π/(2K)]
(8.244)
−2
−
θ4 [(ct − iβ)π/(2K)]
θ4 (iβπ/(2K)
La integración ahora es simple:
2π
t + iα
L
i
2πi θ4′ (iα)
T
φ(t) =
t + ln −
2π
I1
T θ4 (iα)
2
θ4
t − iα
T
θ4
(8.245)
donde definimos a α = πβ/(2K).
De acuerdo con la expresión (8.203), la función θ4 (v) tiene perı́odo π y además es
función par de v, de modo que al completarse un perı́odo de θ y ψ, o sea cuando t = T /2,
el término logarı́tmico de φ se anula. Entonces:
T
L T
θ′ (iα)
φ
=
− πi 4
(8.246)
2
I1 2
θ4 (iα)
Como θ4 tiene la expansión:
θ4 (v) = 1 − 2q cos v + 2q 4 cos4 v − ...
Entonces:
T
LT
q senh2α − 2 q 4 senh4α + ...
φ
=
+ 4π
2
2I1
1 − 2q cosh 2α + 2q 4 cosh 4α − ...
(8.247)
(8.248)
sólo en circunstancias muy especiales esta expresión será un múltiplo entero de 2π; por
esta razón el cuerpo rı́gido no vuelve nunca a su posición inicial.
Ejemplo 8.4.2 Estudiar la estabilidad de las rotaciones de un cuerpo rı́gido asimétrico
libre alrededor de cada uno de los ejes principales.
Dinámica del cuerpo rı́gido / 293
Asumamos que el cuerpo inicialmente gira alrededor del eje x1 y que además
I3 > I2 > I1 . Por efecto de alguna pequeña perturbación el cuerpo adquiere rotaciones
alrededor de los otros ejes; asumiremos que ω2 y ω3 son entonces cantidades pequeñas
en comparación con ω1 . La ecuación de Euler para ω1 contendrá el producto ω2 ω3 , o sea
que al primer orden en estas cantidades ω 1 es constante. Esto permite resolver fácilmente
las otras dos ecuaciones de Euler:
I3 − I1
I1 − I2
ω˙2 =
ω 1 ω 3 ; ω˙3 =
ω1 ω 2
(8.249)
I2
I3
De aquı́ obtenemos la siguiente ecuación diferencial para ω2 :
(I1 − I3 )(I1 − I2 ) 2 2
ω¨2 +
ω1 ω2 = 0
I2 I3
(8.250)
Esta ecuación tiene como solución:
ω 2 = A sen(Ω1 t + δ)
(8.251)
donde A es una cantidad pequeña y Ω1 satisface:
1/2
(I3 − I1 )(I2 − I1 )
ω1
Ω1 =
I2 I3
(8.252)
Como Ω1 es real, entonces ω 2 y ω 3 tendrán movimientos oscilatorios con frecuencia
Ω1 . La rotación alrededor de x1 es estable. De manera similar, cuando el cuerpo rota
inicialmente alrededor de x3 , el movimiento es estable con frecuencia:
1/2
(I3 − I2 )(I3 − I1 )
ω3
(8.253)
Ω3 =
I1 I2
Sin embargo, cuando el cuerpo rota inicialmente alrededor de x2 el movimiento
es inestable porque Ω2 resulta imaginario. O sea que para rotaciones alrededor del eje
de menor momento de inercia o del eje de mayor momento de inercia hay estabilidad,
siendo inestable la rotación alrededor del eje correspondiente al momento de inercia intermedio. Para un cuerpo rı́gido simétrico, digamos para el cual I1 = I2 , es fácil mostrar
que solamente es estable la rotación alrededor del eje x3 .
Ejemplo 8.4.3 Calcular los diferentes perı́odos asociados con el movimiento libre de un
elipsoide homogéneo asimétrico cuyos semiejes tienen las longitudes a = 0, 1m, b = 0, 2m,
c = 0, 3m y cuya masa es de 1 kg. Los valores iniciales de las componentes de la velocidad
angular alrededor de los ejes principales son ω1 = πs−1 , ω 2 = 10πs−1 , ω 3 = πs−1 ,
asumiendo que I1 < I2 < I3 .
De acuerdo con las fórmulas (8.180), los valores de los momentos principales de
inercia son:
I1 = 0, 010 kg m2 ;
I2 = 0, 020 kg m2 ;
I3 = 0, 026 kg m2
(8.254)
Los valores de las constantes de movimiento 2E y L son:
2E = 2, 036π 2J ;
L2 = 0, 040776π 2J2 s2
(8.255)
294 / Mecánica clásica
Reemplazando estos valores en (8.232) hallamos que I vale:
I = 0, 0200275 kg m2
(8.256)
Definiendo el ángulo modular γ como m = sen2 γ, y usando la fórmula (8.218) para
m hallamos que m y γ valen:
m = 0, 9926866 ;
γ = 85, 09◦
(8.257)
La tabla 17.2 del texto de Abramowitz y Stegun nos da los siguientes valores para
q, K y K ′ , usando interpolación lineal:
K = 3, 8516333 ;
K ′ = 1, 5736950 ;
q = 0, 2770075
(8.258)
La cantidad c, dada por (8.222), vale:
c = 4, 8535462 πs−1
(8.259)
El perı́odo de los ángulos θ y ψ es T = 4K/c, que tiene el valor 1,010 s. Para hallar
el perı́odo de φ debemos calcular el valor de β. La fórmula (8.231) nos da que:
dn iβ = 2, 3094003
(8.260)
La transformación imaginaria de Jacobi dice que dn iβ = dc1 β, donde el subı́ndice
indica que el módulo de la función elı́ptica es m1 . Notando que dc1 = dn1 /cn1 y luego
expresando a cn1 y dn en función de sn1 , obtenemos que:
sn21 β =
1 − dn2 iβ
= 0, 8136155
1 − m − dn2 iβ
(8.261)
Entonces sn1 β = 0, 9020063. β será igual al valor de la integral elı́ptica incompleta
de primera clase con ángulo modular γ1 = 90◦ − 85, 09◦ = 4, 91◦ y amplitud igual a
arcsen(0, 9020063) = 64, 45◦. De la tabla 17.5 del manual hallamos el valor mediante
interpolación:
β = 1, 1258087
(8.262)
Entonces α = πβ/(2K) = 0, 459134. Reemplazando este valor en (8.248) obtenemos:
T
φ
= 7, 303 × 2π
2
(8.263)
O sea que al movimiento en φ hay asociado otro perı́odo T ′ cuyo valor es T ′ = 0, 069
s, que es el perı́odo precesional alrededor de la lı́nea invariable, o sea el movimiento medio
de φ. Este problema pertenece al caso tercero del ejemplo 8.4.2, donde se señaló que Ω22
resulta negativa. En efecto:
Ω22 = ω22
(I2 − I1 )(I2 − I3 )
= −227, 759 s−2
I1 I3
a lo cual corresponde un tiempo caracterı́stico de 0, 0662 s.
(8.264)
Dinámica del cuerpo rı́gido / 295
8.5.
El trompo con el punto inferior fijo en un campo
gravitacional homogéneo
Whittaker en su tratado de dinámica analı́tica define un trompo como un cuerpo
rı́gido simétrico alrededor de un eje, que termina en una punta en un extremo del eje.
Aquı́ estudiaremos el movimiento del trompo bajo la acción de la gravedad cuando la
punta permanece fija. Este problema fue estudiado por Lagrange en 1788.
La figura 8.8 muestra el sistema de ejes empleados. Los ejes x, y, z, son un sistema
z
z
y
c.g.
l
θ
mg
y
0
ψ
x
φ
x
Figura 8.8 Trompo con el punto inferior fijo en un campo gravitacional. Sistema de ejes.
de ejes principales en el punto fijo O. Si los momentos principales respecto al centro de
gravedad son I1c , I2c , I3c , podemos usar el teorema de Steiner para evaluarlos respecto
al punto O:
I1 = ml2 + I1c ;
I2 = ml2 + I2c ;
I3 = I3c
(8.265)
como el cuerpo rı́gido es simétrico entonces I1 = I2 .
Las ecuaciones de movimiento. El lagrangiano respecto a los ejes x, y, z, es:
L=
1
1
I1 (ωx2 + ωy2 ) + I3 ωz2 − mgl cos θ
2
2
(8.266)
Usando las ecuaciones (8.131) que expresan las ωi en función de los ángulos de
Euler podemos expresar a L en términos de los ángulos de Euler:
L=
1
1
I1 (θ̇2 + φ̇2 sen2 θ) + I3 (ψ̇ + φ̇ cos θ)2 − mgl cos θ
2
2
(8.267)
296 / Mecánica clásica
φ y ψ son coordenadas cı́clicas y por lo tanto sus momentos canónicos conjugados
son constantes de movimiento:
pφ =
(I1 sen2 θ + I3 cos2 θ)φ̇ + I3 ψ̇ = Lz ≡ I1 b
pψ =
I3 (ψ̇ + φ̇ cos θ) = Lz = I3 ωz ≡ I1 a
(8.268)
a, b y ωz son constantes. El torque de la gravedad produce rotaciones sólo alrededor de
la lı́nea de nodos, en tanto que alrededor de z y z no hay torques, razón por la cual Lz y
~ no son constantes pero sı́ la energı́a
Lz han de conservarse. Las otras componentes de L
total:
1
1
I1 (θ̇2 + φ̇2 sen2 θ) + I3 (ψ̇ + φ̇ cos θ)2 + mgl cos θ
2
2
E=
(8.269)
Las ecuaciones (8.268) y (8.269) constituyen un conjunto de tres ecuaciones diferenciales simultáneas para θ, φ, ψ; por lo tanto son equivalentes a las ecuaciones de
Lagrange para estas cantidades. En efecto, φ̇ y ψ̇ pueden expresarse en función de θ
solamente:
φ̇ =
b − a cos θ
sen2 θ
ψ̇ =
I1 a
b − a cos θ
− cos θ
I3
sen2 θ
(8.270)
Como E depende sólo de ψ̇, θ̇, φ̇ y θ, puede expresarse en términos de θ̇ y θ dando
una ecuación diferencial para θ:
1
1
(b − a cos θ)2
1
I3 ωz2 + I1 θ̇2 + I1 sen2 θ
+ mgl cos θ
2
2
2
sen4 θ
(8.271)
1
1
1 (b − a cos θ)2
E ′ = E − I3 ωz2 = I1 θ̇2 + I1
+ mgl cos θ
2
2
2
sen2 θ
(8.272)
E=
o sea que:
Vemos que la variación de θ es la misma que se presentarı́a en un sistema dinámico
con un grado de libertad para el cual las energı́as cinética y potencial son respectivamente:
1 2
I1 θ̇ ;
2
1 (b − a cos θ)2
I1
+ mgl cos θ
2
sen2 θ
(8.273)
Llamando u = cos θ la ecuación (8.272) toma la forma:
u̇2 = (α − βu)(1 − u2 ) − (b − au)2 = f (u)
(8.274)
donde se definen a α y β como:
α=
2E ′
;
I1
β=
2mgl
I1
(8.275)
Dinámica del cuerpo rı́gido / 297
La energı́a potencial efectiva. Está dada por la segunda expresión en (8.273),
que en términos de u toma la forma:
1
(b − au)2
Vef (u) = I1
+
βu
(8.276)
2
1 − u2
Podemos entonces escribir a f (u) como:
f (u) =
2
[E ′ − Vef (u)] (1 − u2 )
I1
(8.277)
Las figuras 8.9 y 8.10 muestran las funciones Vef (θ), Vef (u) y f (u).
Vef (u)
f (u)
E′
E′0
u
–1
u1
u0
0
u2
+1
u3
Figura 8.9 Funciones Vef (u) y f (u)
Vemos que para un valor dado de E ′ habrá dos valores de u, u1 y u2 para los cuales
E = Vef (u), o sea para los cuales u̇ = 0 (θ̇ = 0). Éstos son los puntos de retorno de
la coordenada θ. Vemos que en general θ oscilará entre θ1 y θ2 esto es, habrá nutación.
Cuando E ′ = E0′ entonces u1 = u2 = u0 y no habrá nutación; este caso corresponde a
la precesión estable o regular. u1 y u2 corresponden a los ceros de la función f (u) en el
intervalo entre u = −1 y u = 1.
La función f (u) es un polimonio cúbico en u que tiene el siguiente comportamiento.
En u = ±1 la función f es negativa, puesto que f (±1) = −(b ∓ a)2 . Para algunos valores
de u entre −1 y +1, f (u) debe de ser positiva porque el lado izquierdo en (8.274) es
positivo. Cuando u → ∞, f (u) es positiva y cuando u → −∞, f (u) es negativa. La
figura 8.9 muestra el comportamiento de f (u), la cual tiene por lo tanto dos raı́ces reales
u1 y u2 que se sitúan entre −1 y +1, y la tercera raı́z u3 es también real y mayor que +1
(que corresponde a un valor de θ imaginario puro). Llamemos a esas raı́ces cos θ1 , cos θ2 ,
cosh θ3 , donde hemos convenido en designar con θ3 al módulo del ángulo correspondiente
a u3 y donde cos θ2 > cos θ1 , con lo cual θ1 > θ2 .
E0′ es el valor de E ′ para el cual θ1 y θ2 son iguales, o sea, el valor de E ′ en el cual
Vef tiene un mı́nimo. Este caso es análogo al de las órbitas circulares en el problema de
′
298 / Mecánica clásica
Vef (θ)
E′
E′0
0
θ2
θ0
θ1 π θ
Figura 8.10 Energı́a ptencial efectiva Vef (θ) y Vef (u)
las fuerzas centrales entre dos partı́culas.
Integración de la ecuación diferencial para θ. Realicemos la siguiente transformación (Whittaker, Op. cit., p. 157):
u=
α + a2
4
z+
β
3β
(8.278)
Al sustituir esta expresión en (8.274) obtenemos:
ż 2 = 4z 3 − g2 z − g3 = 4s(z)
(8.279)
Si u1 , u2 y u3 son las raı́ces del polinomio cúbico f (u) entonces las raı́ces del
polinomio cúbico s(z) son:
zi =
β
α + a2
ui −
= ei ;
4
12
i = 1, 2, 3
(8.280)
Los coeficientes g2 y g3 pueden expresarse en función de los ei mediante las fórmulas
18.1 del texto de Abramowitz y Stegun:
g2 =
2(e21 + e22 + e23 )
g3 =
4e1 e2 e3
(8.281)
La conexión entre z y t está dada en consecuencia por medio de una función elı́ptica
Dinámica del cuerpo rı́gido / 299
de Weierstrass, de acuerdo con la fórmula 18.1.6 del libro de Abramowitz:8
zi = P(t + ǫ)
(8.282)
donde ǫ es una constante de integración. En consecuencia:
cos θ = u(t) =
2I1
2E ′ + I1 a2
P(t + ǫ) +
mgl
6mgl
(8.283)
La función elı́ptica de Weierstrass puede expresarse en términos de la función
elı́ptica sn de Jacobi, según la fórmula 18.9.11 de dicho manual, para el caso en que e1 ,
e2 , e3 , son reales y tomando e3 > e2 > e1 :
e3 − e1
(8.284)
P(x) = e1 + 2 √
sn (x e3 − e1 )
donde el parámetro de la función sn es:
e2 − e1
m=
e3 − e1
(8.285)
Conociendo las raı́ces ei podemos calcular el perı́odo de la función sn y en consecuencia
el perı́odo del ángulo θ, llamado el perı́odo nutacional.
Integración de las ecuaciones diferenciales para φ y ψ. φ̇ y ψ̇ están dados
por las ecuaciones (8.270). Notamos que θ no depende del valor de I3 , puesto que a no es
más que una constante de integración. En consecuencia la expresión para ψ̇ difiere de la
correspondiente expresión para un trompo esférico sólo por una constante (I1 a/I3 − a).
En el cálculo de la parte no trivial de ψ podemos asumir que el trompo es esférico
(I1 = I2 = I3 ), para el cual se cumple:
φ̇ =
b − a cos θ
;
sen2 θ
ψ̇ =
a − b cos θ
sen2 θ
(8.286)
Podemos expresar a φ̇ y ψ̇ en la forma:
φ̇ =
a−b
a+b
+
2(cos θ + 1) 2(cos θ − 1)
ψ̇ =
a+b
b−a
+
2(cos θ + 1) 2(cos θ − 1)
(8.287)
Podemos ahora sustituir la expresión para cos θ en función del tiempo, ecuación
(8.283). De (8.283) y (8.284) se sigue que el argumento de P debe ser complejo cuando
cos θ = 1 y cos θ = −1. Para θ = 0 y θ = π, según (8.283) P vale respectivamente:
P(iγ) =
mgl 2E ′ + I1 a2
−
2I1
12I1
P(iδ) =
mgl 2E ′ + I1 a2
−
−
2I1
12I1
(8.288)
8 Véase también el texto de E. T. Whittaker y G. N. Watson, A course of modern analysis, capı́tulo
XX, Cambridge University Press, 1965; A treatise on analytical dynamics de E. T. Whittaker, capı́tulo
VI, Cambridge University Press, 1960.
300 / Mecánica clásica
donde γ y δ son reales. Reemplazando a (8.288) y a (8.283) en las fórmulas (8.287)
obtenemos:
φ̇ =
mgl(a + b)
1
4I1
P(t + ǫ) − P(iδ)
−
mgl(a + b)
1
ψ̇ =
4I1
P(t + ǫ) − P(iδ)
+
1
mgl(b − a)
4I1
P(t + ǫ) − P(iγ)
(8.289)
1
mgl(b − a)
4I1
P(t + ǫ) − P(iγ)
Cuando θ = 0 y θ = π la ecuación (8.274) nos dice que u̇2 vale:
u̇2
θ=0
= −(b − a)2 ;
u̇2
θ=π
= −(b + a)2
(8.290)
En consecuencia Ṗ(iγ) y Ṗ(iδ) valen, usando (8.278):
Ṗ(iγ) =
i
β(b − a) ;
4
Ṗ(iδ) =
i
β(b + a)
4
(8.291)
Este resultado nos permite escribir a (8.290) en la forma:
2iφ̇ =
Ṗ(iγ)
Ṗ(iδ)
−
P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ)
2iψ̇ =
Ṗ(iγ)
Ṗ(iδ)
+
P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ)
(8.292)
De acuerdo con (8.284), la función P tiene un polo doble en el origen, o sea que la
función:
Ṗ(iδ)
P(x) − P(iδ)
(8.293)
tiene ceros en x = 0, tiene polos en x = iδ y x = −iδ, y en todos los puntos congruentes a
estos, es decir, que se obtengan por translaciones en múltiplos enteros de los perı́odos de
la función elı́ptica P(x), que son ciertos ω1 y ω2 , análogos a 2K y 2iK ′ en las funciones
elı́pticas de Jacobi. Los residuos de la función (8.293) en ésos polos son +1 y −1. En la
teorı́a de las funciones elı́pticas de Weierstrass existe una función, de la familia de las
funciones θ, que tiene una estructura analı́tica idéntica a la de la función (8.293). En
efecto, la función σ(x + iδ) tiene ceros en x = −iδ y en los puntos congruentes a éste, y
la función σ ′ (x + iδ)/σ(x − iδ) tiene polos en los puntos congruentes a x = −iδ y residuo
igual a −1, en tanto que σ ′ (x − iδ)/σ(x − iδ) tiene polos en x = iδ y residuo igual a +1.
En consecuencia la función (8.293) puede escribirse en la forma:
σ̇(x − iδ) σ̇(x + iδ)
σ̇(iδ)
Ṗ(iδ)
=
−
+2
P(x) − P(iδ)
σ(x − iδ) σ(x + iδ)
σ(iδ)
(8.294)
Dinámica del cuerpo rı́gido / 301
Llamando ς(iδ) = σ̇(iδ)/σ(iδ) y usando el resultado (8.294), las ecuaciones (8.292)
pueden ser integradas inmediatamente para dar a φ y ψ en función de logaritmos de la
función σ. Finalmente, φ y ψ pueden escribirse en la forma:
e2i(φ−φ0 ) = e2[ς(iδ)−ς(iσ)]t
σ(t + ǫ − iδ) σ(t + ǫ + iδ)
σ(t + ǫ + iδ)σ(t + ǫ − iδ)
e2i(ψ−ψ0 ) = e2[ς(iδ)+ς(iσ)]t
σ(t + ǫ − iδ) σ(t + ǫ − iδ)
σ(t + ǫ + iδ)σ(t + ǫ + iδ)
(8.295)
donde φ0 y ψ0 son constantes de integración.
Expresión para los parámetros de Cayley-Klein de un trompo esférico
en función del tiempo. Los parámetros de Cayley-Klein especifican la posición del
cuerpo rı́gido y están expresados en función de los ángulos de Euler mediante las fórmulas
(7.175) de la sección 7.8:
α′ = cos
θ i(φ+ψ)/2
e
;
2
θ
β ′ = i sen ei(ψ−φ)/2
2
(8.296)
θ −i(φ+ψ)/2
θ −i(φ−ψ)/2
′
; δ = cos e
γ = i sen e
2
2
Para expresar a cos(θ/2) en función de t, notemos que 2 cos2 (θ/2) = 1 + cos θ.
Ahora, usando (8.283) y (8.288) llegamos fácilmente al resultado siguiente usando la
fórmula 18.4.4 del citado manual:
2I1
θ
[P(t + ǫ) − P(iδ)]
2 cos2 =
2
mgl
(8.297)
2I1 σ(t + ǫ + iδ)σ(t + ǫ − iδ)
= −
mgl
σ 2 (iδ) σ 2 (t + ǫ)
′
Para 2 sen2 (θ/2) hallamos una expresión similar reemplazando δ por γ. Combinando (8.297) con (8.295), obtenemos:
r
I1 ei(φ0 +ψ0 )/2 σ(t + ǫ − iδ) tς(iδ)
′
α = i
e
mgl σ(iδ)
σ(t + ǫ)
β′ = i
γ′ = i
′
δ = i
r
r
r
I1 ei(ψ0 −φ0 )/2 σ(t + ǫ − iγ) tς(iγ)
e
mgl
σ(iγ)
σ(t + ǫ)
(8.298)
I1 ei(φ0 −ψ0 )/2 σ(t + ǫ + iγ) tς(iγ)
e
mgl
σ(iγ)
σ(t + ǫ)
I1 e−i(φ0 +ψ0 )/2 σ(t + ǫ + iδ) −tς(iδ)
e
mgl
σ(iδ)
σ(t + ǫ)
Para un trompo no esférico las fórmulas correspondientes a (8.295) y (8.298) se
obtienen simplemente por reemplazar la función ς por ς + i(I3 − I1 )a/(2I3 ).
302 / Mecánica clásica
La precesión estable o regular. Es el movimiento que se presenta cuando no
hay nutación, o sea cuando θ es constante. En este caso θ̇ y θ̈ son permanentemente
cero. Se sigue de las ecuaciones (8.270) que φ̇ y ψ̇ también son constantes. El valor de
u0 = cos θ0 se obtiene resolviendo la ecuación algebraica dVef /dt = 0. De acuerdo con
(8.276) esto nos da:
2(a − ub)(b − au) − β(1 − u2 )2 = 0
(8.299)
De aquı́ obtenemos el valor de u0 , y en consecuencia el valor que debe tomar la
constante E ′ para que se produzca la precesión sin nutación. La ecuación (8.299) es la
condición para que la “fuerza” en θ sea nula, o sea que es la condición para que θ̈ sea cero,
que junto con θ̇ = 0 caracteriza la precesión regular. Esta ecuación debe ser compatible
con la ecuación (8.270). Si sustituimos en (8.299) a b − au0 por su valor φ̇0 (1 − u20 ) y a
b por φ̇(1 − u20 ) + au0 , obtenemos:
φ̇20 u0 − aφ̇0 +
β
=0
2
(8.300)
Esta ecuación nos da para φ̇ los valores:
!
s
4mglI1
a
1± 1−
u0
φ̇0 =
2u0
p2ψ
(8.301)
Como φ̇0 debe ser real, debe cumplirse que:
−∞ <
4mglI1 u0
2βu0
≤1
≤ 1 → −∞ <
p2ψ
a2
(8.302)
Esta expresión limita drásticamente los posibles valores de la velocidad angular del
trompo ωz alrededor de su eje de simetrı́a z:
4mglI1 u0
≤ ωz2
I32
(8.303)
φ̇0 es la velocidad angular de precesión alrededor del eje espacial z. La ecuación
(8.301) nos dice que hay dos posibles valores de la velocidad angular de precesión que
(+)
(−)
llamaremos φ̇0 (precesión rápida) y φ̇0 (precesión lenta).
El trompo rápido. Si ωz es tan grande que 2βu0 /a2 es mucho menor que la
unidad tenemos el caso del trompo rápido. De (8.303) vemos que la condición de trompo
rápido puede escribirse en la forma:
I3 1
mgl ≪
(8.304)
I3 ωz2
I1 2
Expandiendo al primer orden la raı́z cuadrada en (8.301) obtenemos para las frecuencias de precesión de un trompo rápido:
(+)
φ̇0
=
I3 ωz
;
I1 u0
(−)
φ̇0
=
mgl
I3 ωz
(8.305)
Dinámica del cuerpo rı́gido / 303
Para el caso en que θ0 > π/2 (u0 negativo), la condición de precesión estable
(8.302) se cumple para todos los valores de ωz . Este es el caso en que el trompo “cuelga”
(+)
(−)
del punto fijo O. Según (8.305), cuando u0 < 1, φ̇0 y φ̇0 tienen signos opuestos.
Precesión con nutación. Ocurre cuando E > E ′ ; en este caso θ oscila entre θ1
y θ2 . La frecuencia angular de precesión está dada por (8.270):
φ̇ =
b − a cos θ
b/a − cos θ
=a
sen2 θ
sen2 θ
(8.306)
Se pueden presentar varios casos en cuanto al signo de φ̇:
(a) φ̇ tiene el mismo signo para todos los valores de θ. Ocurre que es positivo para
todos los valores de θ si:
b
> cos θ
(8.307)
a
El trompo precesa siempre en la misma dirección alrededor del eje z en tanto que
el eje z oscila entre θ1 y θ2 . La precesión es monotónica con φ̇ siempre positivo. Si se
toma una esfera fija en el espacio, con centro en O, la “marca” que dejarı́a el eje z sobre
la esfera se representa en la figura 8.11.
z
Z
θ2
θ1
θ2
θ1
θ2
θ1
φ
a
b
c
Figura 8.11 “Marcas” que dejarı́a el eje z sobre la esfera: a. para b/a > cos θ, b. para
cos θ1 < b/a < cos θ2 y c. para cos θ2 = b/a
(b) φ̇ cambia de signo cuando el eje va de θ2 a θ1 . Si ocurre que:
cos θ1 <
b
< cos θ2
a
(8.308)
entonces cuando θ = θ1 , φ̇ es positivo y cuando θ = θ2 , φ̇ es negativo. Por lo tanto la
precesión no es monotónica, sino que se da un avance neto en forma de rizo como en la
figura 8.11b. Es claro que en este movimiento φ̇ no se anula en la media.
(c) Puede ocurrir que:
cos θ2 =
b
a
(8.309)
304 / Mecánica clásica
Esto implica que φ̇ es positivo para todo θ mayor que θ2 y se anula para θ =
θ2 . Entonces, como θ = θ2 es un punto de retorno, allı́ θ̇ es igual a cero. En θ =
θ2 el eje z se encontrará simultáneamente sin precesión y sin nutación, o sea que se
encuentra instantáneamente en reposo. El movimiento se representa en la figura 8.11c.
Esta situación corresponde al método más simple de dejar girando un trompo. Primero
se hace girar alrededor del eje z y luego se suelta haciendo un ángulo θ2 con la vertical.
Las condiciones para t = 0 son entonces θ = θ2 y θ̇ = φ̇ = 0. Las ecuaciones (8.272) y
(8.309) nos dicen entonces que la constante E ′ vale:
E ′ = mgl cos θ2
(8.310)
Como en (8.272) los términos que contienen a I1 son positivos, para tiempos mayores que cero la energı́a potencial debe disminuir o sea θ debe aumentar hasta alcanzar
el valor θ1 y según (8.306) entonces φ̇ aumenta a partir de cero hasta alcanzar el valor
máximo positivo dado por:
φ̇1 =
cos θ2 − cos θ1
a
sen2 θ1
(8.311)
O sea que el trompo al dejarse caer desde θ = θ2 con θ̇ = φ̇ = 0 en t = 0, en un
tiempo mayor adquiere precesión y nutación. Ocurre cuando el trompo es rápido y hay
rozamiento en el punto O que la nutación se amortigua rápidamente, dando la impresión
de que las condiciones iniciales señaladas no dan lugar a precesión con nutación sino a
una precesión regular.
Los comportamientos descritos en (a), (b) y (c) están contenidos en la expresión
analı́tica (8.295). El producto que contiene las funciones σ es puramente periódico, de
modo que el exponencial del lado derecho da el movimiento medio de φ, esto es el movimiento precesional neto. La ecuación (8.295) nos dice que ψ tiene un comportamiento
análogo al de φ o sea una rotación neta acompañada de fluctuaciones periódicas.
La precesión seudoregular. Es el comportamiento usual de un trompo rápido,
que de acuerdo con (8.304) se presenta cuando el efecto de la gravedad es pequeño y
puede asimilarse a una pequeña perturbación. En la aproximación cero se presentará la
precesión regular propia de un cuerpo rı́gido simétrico libre, ecuación (8.179). El efecto
de la gravedad es perturbar ligeramente ese movimiento dando lugar a una pequeña
nutación.
Los valores de las constantes de movimiento para la precesión con nutación en el
caso (c), correspondientes a las condiciones iniciales θ(0) = θ2 , θ̇(0) = φ̇(0) = 0, según
las ecuaciones (8.268) son:
I3 ψ̇(0) cos θ2 =
I1 b
I3 ψ̇(0) =
I1 a
E′ =
(8.312)
mgl cos θ2
que pueden expresarse en términos de la energı́a de rotación, inicialmente dada por:
R=
1
1
I3 ωz2 = I3 ψ̇ 2 (0)
2
2
(8.313)
Dinámica del cuerpo rı́gido / 305
Entonces:
√
2RI3
I3
a=
= ωz ;
I1
I1
b = a cos θ2
(8.314)
I1 β
E = mgl cos θ2 =
cos θ2
2
Entonces podemos escribir a f (u) en la forma:
′
f (u) = β(1 − u2 )(u2 − u) − a2 (u2 − u)2
Las raı́ces de f (u) son:
s
"
#
a2
4β β
u3,1 =
1± 1+ 2
− u2
2β
a
a2
(8.315)
(8.316)
a2 /β está dado por:
I3 R
a2
=
β
I1 mgl
(8.317)
O sea que cuando el trompo es rápido podemos escribir a (8.316) en la forma
aproximada:
2β
2β 2
a2
2
1 ± 1 − 2 u2 + 4 (1 − u2 )
(8.318)
u3,1 =
2β
a
a
lo cual nos da inmediatamente:
u3 ≈
a2
;
β
u1 ≈ u2 −
β
(1 − u22 )
a2
(8.319)
La magnitud de la nutación está dada por:
β
sen2 θ2
(8.320)
a2
O sea que cuando θ2 = 0, el eje z permanece vertical (trompo “dormido”). Además,
la magnitud de la nutación varı́a como R−1 ; cuanto más rápido gire el trompo menor
será la nutación.
Calculemos ahora la frecuencia de la nutación para un trompo rápido. Llamemos
cos θ al promedio de cos θ, o sea a:
cos θ2 − cos θ1 ≈
cos θ1 + cos θ2
β
(8.321)
= cos θ2 − 2 sen2 θ2
2
2a
Podemos especificar la magnitud del desplazamiento del eje z en un tiempo t por:
cos θ =
x = cos θ − cos θ = u − u
(8.322)
Usando las raı́ces de la función f (u) podemos escribir la ecuación diferencial para
u en la forma aproximada:
β
a2
u̇2 = β(u − u2 ) u − u2 + 2 (1 − u22 ) u −
(8.323)
a
β
306 / Mecánica clásica
Como para un trompo rápido se cumple que a2 /β ≫ u, podemos aproximar aún
más a (8.323). Luego expresamos a u en términos de x para obtener:
β2
2
2
2
(8.324)
ẋ = − 4 sen θ2 − x
4a
Derivando (8.324) respecto a t llegamos a:
ẍ + a2 x = 0
(8.325)
La solución que satisface la condición θ(0) = θ2 es, en consecuencia:
x=
β sen2 θ2
cos at ;
2a2
cos θ = cos θ2 −
β
at
sen2 θ2 sen2
a2
2
(8.326)
La frecuencia angular de la nutación es:
1
I3
ωz
a=
2
2I1
(8.327)
O sea que la frecuencia de las nutaciones es mayor a medida que ωz es mayor.
(8.306) nos da la frecuencia angular de precesión. Como según (8.326) x es del orden de
β/(2a2 ), podemos escribir aproximadamente a φ̇ como:
φ̇ =
u2 − u
u2 − u
β
at
a≈
a = sen2
2
2
1−u
1 − u2
a
2
(8.328)
β/(2a2 ) = mgl/(I3 ωz ), según (8.305), coincide con la velocidad angular de precesión lenta del trompo rápido, lo cual nos permite escribir a φ̇ como:
(−)
φ̇ = 2φ̇0
sen2
at
2
(8.329)
La frecuencia angular de precesión media durante un ciclo de la nutación es:
(−)
φ̇ = φ̇0
(8.330)
Vemos que mientras mayor sea ωz , menor será la velocidad angular de precesión.
Para un trompo rápido el movimiento es una nutación pequeña y una precesión pequeña que coincide con la velocidad angular de precesión lenta de un trompo rápido.
Esta precesión se llama precesión seudoregular, pues aunque las condiciones iniciales no
son las de la precesión regular, en la práctica se comporta como ésta porque la fricción
amortigua rápidamente la nutación y aparentemente el eje z del trompo empieza instantáneamente a precesar, con movimiento normal a la gravedad. Ésta es la paradoja de
Klein-Sommerfeld quienes explicaron que esta precesión no implica aceleraciones infinitas sino que se trata de una precesión con una imperceptible nutación.
El trompo “dormido”. Es el caso cuando el eje z permanece vertical, sin precesión ni nutación, o sea cuando:
θ(t) = 0 ;
θ̇(t) = 0
(8.331)
Dinámica del cuerpo rı́gido / 307
f (u)
u1 = u2 = 1
–1
0
u3
u
+1
Figura 8.12 Comportamiento de f (u) para u1 = u2 = 1
f (u)
0
–1 u1
+1
u2 = u 3 = 1
u
Figura 8.13 Comportamiento de f (u) para u2 = u3 = 1
Esta situación es un caso lı́mite de la precesión estable cuando el mı́nimo de Vef (u)
está en u0 = 1. Como cuando E ′ = E0′ , los dos puntos de retorno coinciden, la función
f (u) tiene el comportamiento mostrado en las figuras 8.12 y 8.13.
Para este caso los valores de las constantes de movimiento son:
I1 a = I3 (ψ̇ + φ̇) ;
b = a;
E ′ = mgl
(8.332)
Se sigue de (8.275) y (8.332) que:
α=β
(8.333)
308 / Mecánica clásica
La ecuación (8.274) tiene entonces la forma:
u̇2 = (1 − u)2 α(1 + u) − a2
(8.334)
Las raı́ces de f (u) son en consecuencia:
1,
1,
a2
−1
α
(8.335)
Veamos qué condiciones se requieren en cada uno de los casos mostrados en las
figuras 8.12 y 8.13. Para ello examinemos la curvatura de f (u) en la raı́z doble:
2
a
′′
f (1) = 2α 1 −
−1
(8.336)
α
Claramente en el caso de la figura 8.12, donde (a2 /α) − 1 es mayor que 1, la
curvatura es negativa y en la figura 8.13 la curvatura es positiva. Los resultados de la
precesión estable en general se aplican en este caso en que u0 = 1. La condición (8.303)
en este caso es:
a2
≥1
2α
(8.337)
que señala la velocidad angular crı́tica ωc debajo de la cual cesa la precesión regular, o
sea:
ωc2 =
4mglI1
I32
(8.338)
Vemos pues que el caso de la figura 8.12 es en rigor el de precesión regular en tanto
que el caso de la figura 8.13 es inestable y mediante una pequeña perturbación degenera
en el de precesión con nutación; para este caso ωz < ωc y para el caso de la figura 8.12,
ωz > ωc . Cuando ωz sea igual a ωc entonces a2 /α = 2 y según (8.335) las tres raı́ces de
f (u) coinciden y el movimiento aún es estable.
Ejemplo 8.5.1 A partir de la solución analı́tica hallar los valores de la frecuencia angular
de nutación y de la velocidad angular de precesión media para la precesión con nutación
de un trompo pesado bajo las condiciones iniciales (8.312), caso (c).
De acuerdo con las fórmulas (8.283) y (8.284), el perı́odo de la nutación coincide
con el perı́odo de la función elı́ptica ns2 que es 2K. O sea que:
√
T e3 − e1 = 2K
(8.339)
El parámetro de la función, según (8.285) y (8.280) es:
√
u2 − u1
λu2 − 1 + 1 + λ2 − 2λu2
2β
√
m=
=
;
λ= 2
u3 − u1
a
2 1 + λ2 − 2λu2
(8.340)
donde hemos usado (8.316). Para precisar, asumamos que:
u2 =
1
;
2
λ=1
(8.341)
Dinámica del cuerpo rı́gido / 309
Entonces los valores de m y de
√
a
e3 − e1 =
m = 0, 25 ;
2
√
e3 − e1 son:
(8.342)
De la tabla 17.1 del manual de Abramowitz y Stegun obtenemos:
K(0, 25) = 1, 685
(8.343)
con lo cual el valor exacto del perı́odo T es:
T =
4K
6, 74
=
a
a
(8.344)
y el valor exacto de la frecuencia de nutación es:
Ωnut = 0, 932 a
(8.345)
Promediando sobre un perı́odo de las funciones P obtenemos que el término de φ̇
que en (8.292) da lugar a precesión neta es:
2iφ̇ = 2
σ̇(iγ)
σ̇(iδ)
−2
σ(iδ)
σ(iγ)
(8.346)
Según (8.288) y (8.314) se cumple para este caso que:
P(iγ) =
βu2 + a2
5λ − 4 2
1 2
β
−
=
a =
a
4
12
48
48
P(iδ) =
βu2 + a2
7λ + 4 2
11
β
=−
a = − a2
− −
4
12
48
48
(8.347)
Según la expansión en serie para P(x) el término dominante es x−2 de modo que:
P(iγ) ≈ −
1
;
γ2
P(iδ) ≈ −
1
δ2
Entonces hallamos que:
r
√
48
48 1
;
iγ ≈ −i
iγ ≈
a
11 a
(8.348)
(8.349)
Por otra parte, el término dominante en la expansión en serie para ς(x) es x−1 lo
cual nos dice que:
r
11
1
1
1
ς(iδ) ≈
≈i
a ; ς(iγ) ≈
≈√ a
(8.350)
iδ
48
iγ
48
Entonces resulta que φ̇ vale:
φ̇ ≈ 0, 48a + 0, 14ai
(8.351)
El resultado nos indica que para las condiciones iniciales (8.341) no hay precesión
neta estable; que el movimiento en φ dura menos de un perı́odo de P, en tanto que
310 / Mecánica clásica
(8.346) supone que existe movimiento en φ durante más de un perı́odo. En efecto, para
λ mayor que 0,8 domina el efecto de la gravedad y el trompo cae. La fórmula (8.340)
resulta aplicable para λ < 0,8. El movimiento descrito por la figura 8.11c existe si:
I1 2mgl
< 0, 8
I3 R
(8.352)
Si tomamos λ = 0, 1 y u2 = 0, 5, mediante idénticos procedimientos llegamos a los
siguientes resultados:
e1 = −0, 079659a2 ;
e2 = −0, 079166a2 ;
e3 = 0, 1188257a2
(8.353)
En consecuencia:
m = 0, 6659781 ;
K(m) = 2, 025
(8.354)
Entonces un valor para la frecuencia de nutación más exacto que el resultado
(8.327) es:
Ωnut = 0, 691a
(8.355)
Sin embargo en el cálculo de la velocidad angular de precesión entran en juego las
aproximaciones hechas para evaluar las ς. Para iδ y iγ obtenemos:
i
iγ ≈ −3, 7032803 ;
a
iδ ≈ −3, 1957416
i
a
(8.356)
lo cual nos conduce a:
φ̇ = 0, 04 a
(8.357)
que esta vez no tiene la contribución imaginaria. Según (8.330) que es aplicable en este
caso pues λ ≪ 1, φ̇ debe valer:
φ̇ ≈
8.6.
β
= 0, 0025 a
2a
(8.358)
Movimiento en un sistema de referencia no inercial
Ya a lo largo del texto hemos considerado varios casos de sistemas de referencia no
inerciales. En el ejemplo 4.1.5, sección 4.1, encontramos las ecuaciones de movimiento
para una partı́cula en un sistema de referencia que rota uniformemente con velocidad
angular ~
ω . Encontramos que la rotación añade a la energı́a un término que depende
sólo de las coordenadas de la partı́cula y es proporcional al cuadrado de la velocidad
angular. Este término adicional, −m(~ω × ~r)2 /2 se llama energı́a potencial centrı́fuga.
En la ecuación de movimiento aparecen dos términos adicionales de tipo inercial. La
fuerza 2m~r˙ × ~
ω se llama fuerza de Coriolis; es una fuerza no disipativa que depende de la
velocidad de la partı́cula, pero no da contribución a la energı́a. La fuerza m~ω × (~ω × ~r)
se llama fuerza centrı́fuga; está en el plano formado por ~r y ~ω , siendo perpendicular al
Dinámica del cuerpo rı́gido / 311
eje de rotación y alejándose de él; el módulo de esta fuerza es mρω 2 siendo ρ la distancia
de la partı́cula al eje de rotación.
Al final de la sección 7.9 encontramos expresiones más exactas para las ecuaciones
de movimiento, en función de la matriz de rotación. Encontramos en la ecuación (7.282)
un término adicional, la fuerza m~r × ~ω˙ debida a la no uniformidad de la rotación. Consideremos ahora el sistema de referencia no inercial más general. Consiste en un sistema
de referencia que rota no uniformemente y cuyo origen se translada con aceleración no
~ del origen de coordenadas y la velocidad anuniforme. Se supone que la aceleración A(t)
gular de rotación ω
~ (t) son funciones del tiempo conocidas a priori. Entonces la ecuación
de movimiento más general para una partı́cula que se mueve en un sistema de referencia
no inercial es:
∂V
~ + m~r × ~ω˙ + 2m~r˙ × ~ω + m~ω × (~r × ~ω)
− mA
(8.359)
m~¨r = −
∂~r
Ya hemos considerado el movimiento de un cuerpo rı́gido en un sistema de referencia que rota uniformemente. En el ejemplo 8.3.1 hallamos la forma que toman las
ecuaciones de Euler en tal sistema de referencia, ecuaciones (8.128) y (8.129).
Ejemplo 8.6.1 Resolver el problema del péndulo de Foucault considerándolo como un
cuerpo rı́gido y usando las ecuaciones de Euler en un sistema de referencia rotante.
En este problema intervienen tres sistemas de ejes. Los ejes inerciales, los ejes
rotantes fijos a la Tierra y los ejes fijos al cuerpo rı́gido. Llamaremos x′ , y ′ , z ′ , a los ejes
fijos a la Tierra y x, y, z, a los ejes fijos al cuerpo rı́gido. El vector de velocidad angular
de la Tierra, que asumiremos constante respecto a los ejes inerciales, vale:
ω
~ 0 = ω0~k
(8.360)
donde ~k está en la dirección de la lı́nea sur-norte que asumiremos fija en el espacio (ver
la figura 8.14).
El péndulo está suspendido de un punto O fijo respecto a la Tierra. En ese punto
tomaremos el origen común de los ejes fijos a la Tierra y al cuerpo rı́gido. Este es un
cuerpo rı́gido trivial que consiste en una partı́cula mantenida a distancia fija de O por
medio de un hilo sin masa y longitud l. El eje z lo tomamos a lo largo del hilo, de modo
que la posición de la partı́cula respecto a los ejes fijos al cuerpo rı́gido está en (0, 0, l).
Los momentos principales de inercia de este cuerpo rı́gido son:
I1 = ml2 ;
I2 = ml2 ;
I3 = 0
(8.361)
Los ejes x y y son perpendiculares a z pero pueden tomarse arbitrariamente, pues
este cuerpo rı́gido no permite especificarlos. Podemos, sin perder generalidad, tomar el
eje y perpendicular al plano de oscilación del péndulo y el eje x en el plano de oscilación
del péndulo y cuando aparezca la velocidad de rotación alrededor del eje z, ψ̇, asumir
que es cero, lo mismo que ψ.
Las componentes del vector de velocidad angular de la Tierra respecto a los ejes
primados son:
ω0 ′ =
~
=
ω0 [(~k · ~i ′ )~i ′ + (~k · ~j ′ )~j ′ + (~k · ~k ′ )~k ′ ]
ω0 (cos λ, 0, −senλ)
(8.362)
312 / Mecánica clásica
N
i
0
φ
j′
j
j′
i′
i′
k
k′
0
k
k′
θ
ω0
l
φ
λ
m
S
b
a
Figura 8.14 Péndulo de Foucault considerado como un cuerpo rı́gido: a. Sistema de ejes y
b. Componentes del vector de velocidad angular de la tierra respecto a los ejes primados.
La energı́a potencial vale V = −mgz ′ = −mgl cos θ. Entonces los torques alrededor
de los ejes z ′ y z, y de la lı́nea de nodos, son respectivamente:
Kφ = 0 ;
Kψ = 0 ;
Kθ = −mgl senθ
(8.363)
Las ecuaciones de Euler en un sistema de referencia rotante fueron halladas en los
ejemplos 8.3.1 y 8.3.3, en la sección 8.3. Las ecuaciones requeridas para este problema
deben incluir los torques, o sea que a las ecuaciones (8.155) debemos adicionar en el lado
derecho:
3
X
Kr βrt ;
t = 1, 2, 3
(8.364)
r=1
donde las Kr están dadas por (8.363) y βrt es la matriz (8.134). Los torques (8.364),
que llamaremos K1 , K2 , K3 , son en consecuencia:
K1 = −mgl senθ cos ψ ;
K2 = mgl senθ senψ ;
K3 = 0
(8.365)
para escribir las ecuaciones (8.155) se requiere además conocer las componentes del
vector ~
ω0′ respecto a los ejes fijos al cuerpo rı́gido. Para ello debemos evaluar:
~ 0 = Ã~
ω
ω0′
(8.366)
donde à es la matriz de rotación entre los ejes con primas y los ejes con barras, dada
por la ecuación (7.122) sección 7.6. Las ecuaciones (8.128) y (8.129) con torques, con los
Dinámica del cuerpo rı́gido / 313
momentos de inercia (8.361) nos dan:
(ω̇z + ω̇0z ) · 0 =
0
(ω̇y + ω̇0y ) =
g
−(ωx + ω0x )(ωz + ω0z ) + senθ senψ
l
(ω̇x + ω̇0x ) =
g
(ωy + ω0y )(ωz + ω0z ) − senθ cos ψ
l
(8.367)
Debido a que I3 = 0 y I1 = I2 , la ecuación (8.367) da un valor indeterminado
para ω̇z + ω̇0z y en consecuencia para ωz + ω0z , la indeterminación proviene del hecho
ya señalado al definir las coordenadas x, y, z. En efecto, como la masa m es puntual,
carece de sentido hablar de rotación alrededor de z, por ello el lagrangiano (8.123) no
contiene ni a ψ ni a ψ̇. Entonces, como se señaló, podemos tomar ceros los valores de ψ
y ψ̇.
De la ecuación (7.122), junto con las ecuaciones (8.366) y (8.131) podemos escribir
~ , cuando ψ = 0 y ψ̇ = 0:
para el vector ~ω 0 y ω


θ̇ + ω0 cos φ cos λ




~ + ~ω0 =  senθ φ̇ − ω0 cos θ senφ cos λ − ω0 senθ senλ 
(8.368)
ω




cos θ φ̇ + ω0 senθ senφ cos λ − ω0 cos θ senλ
Las derivadas de este vector respecto al tiempo son:

θ̈−ω0 senφ cos λ φ̇

~ 0 =φ̈ senθ+ θ̇ φ̇ cos θ+ω0 θ̇(senφ senθ
~ω + ω




cos λ−cos θ senλ)−ω0 φ̇ cos θ cos φ cos λ
(8.369)
φ̈ cos θ− θ̇ φ̇ senθ+ω0 θ̇(senφ cos θ cos λ+senθ senλ)+ω0 φ̇ senθ cos φ cos λ
Ciertamente las ecuaciones (8.367) son consistentes cuando ωz + ω0z valga cero.
En efecto, las dos últimas igualdades de (8.367) se convierten en:
θ̈ − ω0 φ̇ senφ cos λ +
g
senθ = 0
l
(8.370)
senθ φ̇ − ω0 cos θ senφ cos λ − ω0 senθ senλ = constante
Si tomamos cero el valor de la constante en (8.370), esta ecuación será consistente
con la ecuación ωz + ω0z = 0,
cos θ φ̇ + ω0 senθ senφ cos λ − ω0 cos θ senλ = 0
(8.371)
solamente si se cumple que:
φ̇ = ω0 senλ ;
φ=0
(8.372)
Esto quiere decir que tomar simultáneamente ceros los valores de ωy + ω0y y ωz + ω0z da
lugar a la solución cuando los ejes x′ −y ′ y x−y coinciden instantáneamente. La ecuación
314 / Mecánica clásica
(8.372) muestra una rotación uniforme del plano de oscilación del péndulo alrededor del
eje z, en sentido positivo. En efecto, si el péndulo oscilara en el polo norte, donde
senλ = 1, un observador en la Tierra verı́a rotar el plano del péndulo uniformemente
en sentido contrario al de la rotación de la Tierra y con una velocidad angular igual a
ω0 ; esto se ve claramente al notar que el plano de oscilación del péndulo en un sistema
de referencia inercial no cambia, o sea que los ejes x − y no cambian en un sistema de
referencia inercial y respecto a ellos los ejes x′ − y ′ rotan uniformemente.
Para un péndulo de 100 m, g/l vale aproximadamente 10−1 s−2 en tanto que ω0 ≈
−8 −1
10 s , de modo que las ecuaciones (8.367) pueden resolverse fácilmente, sin hacer las
suposiciones: ωz + ω0z = ωy + ω0y = 0, despreciando los términos que contengan a ω02
y ω0 φ̇. El resultado es que el plano de oscilación del péndulo rota uniformemente con
una velocidad angular ω0 senλ, aun en donde los ejes x′ − y ′ y x − y no coinciden, y en
que la rotación de la Tierra no tiene efecto sobre la coordenada θ sino con un término
centrı́fugo, que es del orden de ω02 .
Ejemplo 8.6.2 Un giróscopo es un cuerpo rı́gido simétrico montado sobre anillos de
suspensión de cardán de modo que el cuerpo rı́gido se puede mover libremente con el
centro de gravedad fijo, por lo cual no hay torque gravitacional. La brújula giroscópica
es un giróscopo al cual se le impone la ligadura que consiste en impedir que el eje de
simetrı́a se mueva fuera del plano horizontal. Demuéstrese usando las ecuaciones de
Euler que cuando la velocidad angular del giróscopo es grande comparada con la de
la Tierra, este giróscopo oscilará alrededor de un meridiano, pudiendo utilizarse como
brújula (brújula giroscópica de Foucault).
Los ejes principales del giróscopo x, y, z, los definimos de modo que el eje de simetrı́a
es el eje z, que permanecerá en el plano horizontal. La figura 8.15a muestra los ejes fijos
a la Tierra x′ , y ′ , z ′ , y la figura 8.15b los ejes x, y, z.
Línea de nodos
(φ = 0)
N
x′
0
z
ψ
j′
k′
x
Vertical
z′
Norte
θ
i′
k′
y′
0
ω0
λ
Este
Línea
del meridiano
S
y
a
b
Figura 8.15 Ejes principales del giróscopo: a. Ejes x′ , y ′ y z ′ fijos a la Tierra,
b. Ejes principales x, y y z del giróscopo.
Dinámica del cuerpo rı́gido / 315
La condición de ligadura impuesta a la suspensión de Cardán es:
φ=0
(8.373)
Ésta implica que φ̇ = 0, o sea que la ligadura impuesta a las velocidades angulares
ωx , ωy , ωz , de acuerdo con las ecuaciones (8.132) es:
senψ ωx + cos ψ ωy = 0
(8.374)
Usando la notación de la sección 2.8, escribimos la ligadura en la forma a1 ωx +
a2 ωy + a3 ωx donde a1 = tan ψ, a2 = 1, a3 = 0. Entonces los componentes de la fuerza
de ligadura son:
Rx = λ tan ψ ;
Ry = λ ;
Rz = 0
(8.375)
donde λ es un multiplicador indeterminado de Lagrange.
Las ecuaciones de movimiento son las ecuaciones de movimiento de Euler en un
sistema de referencia rotante, ecuaciones (8.128) y (8.129), donde de acuerdo con los
resultados de la sección 2.8, debemos incluir los términos de torque debidos a la ligadura,
(8.375). Por lo anterior, tales ecuaciones son:
(ω̇z + ω̇0z )I3 = 0
(ω̇y + ω̇0y )I1 = (ωx + ω0x )(ωz + ω0z )(I3 − I1 ) + λ
(8.376)
(ω̇x + ω̇0x )I1 = (ωy + ω0y )(ωz + ω0z )(I1 − I3 ) + λ tan ψ
Las componentes de la velocidad angular de la Tierra en los ejes primados son:
ω
~ 0′ = ω0 (senλ, 0, cos λ)
(8.377)
~ 0 debemos usar la matriz de rotación Ã, ecuación (7.122) de la
Para hallar a ω
sección 7.6, tomando φ = 0:


senλ cos ψ + cos λ senψ senθ





~
ω 0 = ω0  −senλ senψ + cos λ cos ψ senθ 
(8.378)



cos λ cos θ
~ según (8.131) es:
En tanto que ω,
~ = (cos ψ θ̇, −senψ θ̇, ψ̇)
ω
(8.379)
~ω˙ + ~ω˙ 0 está dada por:


θ̈cψ− θ̇sψ(e−ω0 cλ cθ)+ω0 (−sλ sψ+cλ cψ sθ)(e − ω0 cλ cθ)+ω0 θ̇ cλ sψ cθ


~˙ 0 =−θ̈sψ− θ̇cψ(e−ω0 cλ cθ)+ω0 (−sλ cψ−cλ sψ sθ)(e − ω0 cλ cθ)+ω0 θ̇ cλ cψ cθ
~˙ ω
ω+


−θ̇ω0 cλ sθ
(8.380)
316 / Mecánica clásica
donde usamos s y c en vez de sen y cos, y e es el valor de la constante que se obtiene
de (8.376) o sea un espı́n axial neto que incluye una componente de la rotación de la
Tierra:
e = ωz + ω0z
(8.381)
Reemplazando las ecuaciones (8.378) a (8.381) en las ecuaciones (8.376) obtenemos:
θ̈ cψ + θ̇ sψ(−e + 2ω0 cλ cθ + A)
+ω0 sψ(−e sλ + ω0 sλ cλ cθ + sλ A)
(8.382)
+ω0 cψ(e cλ sθ − ω0 c2 λ sθ cθ − A cλ sθ) = Λ tan ψ
−θ̈ sψ + θ̇ cψ(−e + 2ω0 cλ cθ + A)
+ω0 cψ(−e sλ + ω0 sλ cλ cθ + sλ A)
(8.383)
+ω0 sψ(−e cλ sθ + ω0 c2 λ sθ cθ + A cλ sθ) = Λ
donde Λ es igual a λ/I1 y A está defnida por:
A=
I1 − I3
e
I1
(8.384)
Multiplicando (8.382) por cos ψ y (8.383) por senψ y restando las ecuaciones resultantes, obtenemos:
θ̈ + ω0
I3
e cos λ senθ − ω02 cos2 λ senθ cos θ = 0
I1
(8.385)
Para un lugar que no esté en los polos, cos λ 6= 0, y para una alta velocidad de
rotación del giróscopo, e ≫ ω0 , la ecuación (8.385) se puede aproximar a:
θ̈ +
I3 eω0 cos λ
senθ = 0
I1
(8.386)
Ésta es una ecuación similar a la de un péndulo simple. Indica que el eje del giróscopo oscila alrededor de la lı́nea del meridiano, siendo el perı́odo de pequeñas oscilaciones:
r
I1
(8.387)
T = 2π
I3 eω0 cos λ
es decir, el mecanismo indica el norte, por lo tanto sirve de brújula que indica el norte
verdadero, a diferencia de una brújula magnética que indica el norte magnético. Para
una discusión más detallada que incluye el caso en que el giróscopo está montado sobre
un barco, véase el texto de Atkin, Dinámica clásica, John Willey, 1959, o referencias
especializadas sobre el giróscopo. La ecuación de ligadura (8.374) permite obtener a ψ(t)
al reemplazar el resultado de integrar a (8.386), y la ecuación (8.376) permite entonces
hallar a λ, y en consecuencia la fuerza de ligadura. Como la solución de (8.386) es una
función elı́ptica, sn, las ecuaciones (8.374), (8.376) y (8.386) permiten expresar a θ, ψ y
λ en términos de funciones elı́pticas.
Dinámica del cuerpo rı́gido / 317
Ejercicio 8.6.1 Integrar las ecuaciones (8.374), (8.376) y (8.386) para hallar explı́citamente a θ, ψ y λ en función del tiempo. Analizar los resultados.
318 / Mecánica clásica avanzada
9
Las transformaciones canónicas
9.1.
La acción en función de las variables de estado
Según el principio de Hamilton, entre todas las trayectorias en el espacio de configuración que parten de un punto (q1 ) en t = t1 y terminan en un punto (q2 ) en t = t2 ,
el sistema sigue efectivamente a través de la trayectoria que extremaliza la integral de
acción o, equivalentemente, por aquella que satisface las ecuaciones de Lagrange. Para
expresar la acción en función de las coordenadas, debemos considerar todas las posibles
trayectorias reales y circuitosas en el espacio de configuración y no solamente aquellas
que pasan por dos puntos dados.
Entre un par de puntos dados, (q1 ) en t = t1 y (q2 ) en t = t2 , sólo pasa una
trayectoria recta (o real). O sea que a una familia de parejas de puntos [(q1 ) en t = t1 ,
(q2 ) en t = t2 ], definida de acuerdo con cierta regla, le corresponde una familia de
trayectorias en “lı́nea recta” (o reales). Ası́ por ejemplo, para un sistema de dos grados
de libertad las trayectorias estarán situadas en un plano. Para precisar, asumamos que
se trata de partı́culas en presencia del campo gravitacional, el cual actúa a lo largo de
la dirección y. La figura 9.1 muestra la familia de puntos extremos (x1 , y1 en t1 ; x2 , y2
en t2 ), definida de la siguiente manera:
r
π
2a
senθ ; 0 ≤ θ ≤
x1 = a cos θ ; y1 = a senθ ; t1 =
g
2
x2 = b ;
1
y2 = a senθ + g
2
b − a cos θ
t2 =
+
vx
r
b − a cos θ
vx
2
(9.1)
2a
senθ
g
Este ejemplo muestra que para a, b, dados se puede definir una familia de trayectorias por hacer variar a θ entre 0 y π/2, con lo cual se varı́an además los tiempos t1
y t2 . Los correspondientes puntos inicial y final están sobre un arco de circunferencia y
sobre un segmento de lı́nea recta respectivamente. Obviamente para un par de puntos
319
320 / Mecánica clásica avanzada
b
0
θ′ θ
a
x
P1 (x1, y1, t1)
P1′ (x1′, y1′, t1′)
P2 (x2, y2, t2)
P2′ (x2′, y2′, t2′)
y
Figura 9.1 Familia de trayectorias dependiente de θ entre 0 y π/2
inicial y final dados, P1 , P2 , o sea para un valor dado de θ, se puede encontrar una
familia de trayectorias circuitosas que pasan por esos dos puntos en t = t1 y t = t2 .
Haciendo variar la tripleta de parámetros (a, b, θ) sobre todo el rango de sus valores
posibles podrı́amos obtener todas las posibles trayectorias “rectas” en el plano x − y;
para definir las trayectorias circuitosas requerirı́amos de parámetros adicionales.
En general, sea (α) un conjunto completo de parámetros que define una familia
de trayectorias rectas en el espacio de configuración. A esa familia de trayectorias le
corresponde una familia de puntos iniciales y finales P1 , P2 y de tiempos t1 y t2 , dada
por:
t1 = t1 (α) ;
qν1 = qν1 (α)
t2 = t2 (α) ;
qν2 = qν2 (α)
(9.2)
ν = 1, 2, ...l
Debemos definir desplazamientos virtuales entre una trayectoria real y las correspondientes trayectorias circuitosas y entre trayectorias reales. Esto se logra considerando: (a) Cambios virtuales en las qν , como antes y (b) Cambios virtuales en el tiempo,
con lo cual los tiempos de los puntos inicial y final son distintos para cada trayectoria.
Queremos evaluar el cambio en la integral de acción:
Z t2
L dt
(9.3)
S=
t1
cuando se pasa de una trayectoria real a otra de la familia. La diferencia de las coordenadas de las dos trayectorias la denotaremos ∆qν = qν (α + ∆α) − qν (α).
Tal cambio consta de dos partes, uno virtual producido con t fijo y otro debido al
cambio virtual en el tiempo:
∆qν = δqν + q̇ν δt ;
ν = 1, 2, ...l
(9.4)
∆t = t(α + ∆α) − t(α)
Las transformaciones canónicas / 321
La figura 9.2 muestra dos trayectorias reales en el espacio de configuración que
difieren por cantidades pequeñas. C1 y C2 son dos curvas que describen la familia de
puntos extremos, o sea definidas por las ecuaciones (9.2).
C2
P2
t
C1
P1
t1 + ∆t1
t1
t1 + ∆t1
(∆q)
t2
(α)
t2 + ∆t2
(∆q)
q∆t
t + ∆t
t
(q + δq) (q + ∆q)
P2′
t2
(α + ∆α)
P1′
Figura 9.2 Trayectorias reales en el espacio de configuración
A cada una de las dos trayectorias reales le corresponde un valor de la integral de
acción (9.3). La diferencia de los valores de S es:
S′ − S
∆S =
Z
=
t2 +∆t2
t1 +∆t1
dt L(q + δq, q̇ + δ q̇, t) −
Z
(9.5)
t2
dt L(q, q̇, t)
t1
Para ∆t1 y ∆t2 lo suficientemente pequeños se cumple:
Z t2
Z t2 +∆t2
L dt + L(t2 ) ∆t2 − L(t1 ) ∆t1
Ldt ≈
(9.6)
t1
t1 +∆t1
t
t1
t1 + ∆t1
t2
t2 + ∆t2
Figura 9.3 Cambio en el tiempo ∆t al variar (α)
Entonces (9.5) se puede escribir como:
∆S =
Z
t2
t2
L(q + δq, q̇ + δ q̇, t)dt + L(q + δq, q̇ + δ q̇, t)∆t
t1
−
Z
t1
t2
t1
L(q, q̇, t)dt
(9.7)
322 / Mecánica clásica avanzada
Por otra parte sabemos que:
L(q + δq, q̇ + δ q̇, t) − L(q, q̇, t) =
l X
∂L
ν=1
d
δqν + (pν δqν ) − ṗν δqν
∂qν
dt
(9.8)
al primer orden en (δq). Entonces:
∆S =
Z
t2
t1
l X
∂L
ν=1
∂qν
− ṗν δqν +
l
X
t2
t2
pν ∆qν
ν=1
(9.9)
+ L ∆t
t1
t1
donde despreciamos todos los términos de orden superior al primero en (δq) y (q̇ ∆t).
Como los (p) corresponden a la trayectoria real P1 P2 , de acuerdo con las ecuaciones de
Lagrange la integral en (9.9) es cero, luego:
∆S =
l
X
pν δqν + L ∆t
ν=1
!
t2
(9.10)
t1
Debido a que δqν = δqν − q̇ν ∆t, obtenemos:
! t2
l
X
∆S =
pν ∆qν − H ∆t
ν=1
(9.11)
t1
Esta expresión nos dice que:
pν =
∂S
∂S
∂S
∂S
, H=−
, H=
en t = t2 ; pν = −
en t = t1
∂qν
∂t
∂qν
∂t
(9.12)
Es claro que ∆S es la diferencia de dos términos infinitesimales, evaluados en t1 y
t2 . Ahora, si llamamos t a t2 y escogemos a C1 de modo que se reduzca a un punto, es
decir, tomamos fijo el punto p1 :
δqν (t1 ) = 0, ∆t1 = 0; ν = 1, 2, ...l
(9.13)
Obtenemos:
∆S =
l
X
ν=1
pν ∆qν − H ∆t
(9.14)
Esta expresión nos da la diferencial total de cierta función S de las coordenadas
y del tiempo sobre la curva C2 . De P1 sale un haz de trayectorias reales que cortan la
curva C2 . La ecuación (9.14) nos da la diferencia en la acción para dos trayectorias reales
diferentes cuando cortan la curva C2 . Es claro entonces que:
pν =
∂S
;
∂qν
ν = 1, 2, ...l; H = −
∂S
∂t
(9.15)
Las transformaciones canónicas / 323
Siendo S = S(q, t) la acción en función de las coordenadas y del tiempo:
Z t2
L dt
S(q, t) =
(9.16)
t1
Si se impone la condición de que las variaciones en el lı́mite superior se anulen,
obviamente lo que se obtiene es ∆S = 0, y de ahı́ las ecuaciones de movimiento.
A la función S[q(t), t] se le denomina la acción en función de las coordenadas: es
el número que se asocia a la trayectoria que comienza en P1 y termina en q(t), t, o sea
sobre la lı́nea C2 . Como q y t dependen de (α), S es una función de (α).
9.2.
La integral invariante de Poincaré-Cartán
En lugar del espacio de configuración l-dimensional, consideramos el espacio de
fases 2l-dimensional, en el cual cada punto en el tiempo t se especifica por (q, p). En
este espacio definamos dos curvas cerradas, C1 y C2 , cuyos puntos sean el comienzo y
el final de una familia de trayectorias rectas en el espacio de fases; es decir, tales que si
el sistema inicialmente estaba descrito por un punto de C1 evolucionará de acuerdo con
las ecuaciones canónicas hasta llegar a cierto punto final sobre C2 . Las ecuaciones que
definen las curvas cerradas C1 , C2 , son análogas a (9.2):
t1 =
t1 (α);
qν1 = qν1 (α) ;
p1ν = p1ν (α)
t2 =
t2 (α) ;
qν2 = qν2 (α) ;
p2ν = p2ν (α) ;
(9.17)
α = 1, 2, ...l
donde ahora los parámetros (α) son tales que varı́an entre (αi ) y (αf ) de modo que
las funciones de (α) definidas por (9.17) son periódicas, es decir toman el mismo valor
cuando (α) = (αi ) que cuando (α) = (αf ). Por ejemplo, para el oscilador tridimensional
ligado a moverse sobre un cilindro, la familia de trayectorias correspondiente a (9.17) es
mostrada en la figura 9.4. (Véase el ejemplo 4.3.1 en la sección 4.3). Es claro que C1 y
C2 deben estar sobre la hipersuperficie Ez constante.
En general, la familia de trayectorias tiene la apariencia de un “tubo”1 donde C1
y C2 son las curvas que describen la forma de las “puntas”. Por la causalidad, es claro
que las trayectorias no se intersectan. A cada valor de las (α) le corresponde uno y sólo
un punto sobre C1 , un punto sobre C2 y una trayectoria y sólo una. Cada trayectoria
tiene un valor dado de la acción:
Z t2 (α)
S̃ =
L̃ [q(α, t), q̇(α, t), p(α, t), ṗ(α, t), t]
(9.18)
t1 (α)
donde L̃ es definido en (3.77), según:
L̃ (q, p, q̇, ṗ, t) =
l
X
ν=1
1 Llamado
pν q̇ν − H(q, p, t)
también “tubo de lı́neas caracterı́sticas”.
(9.19)
324 / Mecánica clásica avanzada
Pz
C1
θ
z
C2
Figura 9.4 Familia de trayectorias para el oscilador tridimensional ligado a moverse sobre un
cilindro
Por un procedimiento análogo al que conduce a (9.9), hallamos para la diferencia
de la acción entre dos trayectorias vecinas:
∆S̃ =
(
l Z
X
ν=1
dt
"
∂H
q̇ν −
∂pν
!
δpν
#
)
d
∂H
δqν + (pν ∆qν ) + L ∆t
− ṗν +
∂qν
dt
t2
(9.20)
t1
Teniendo en cuenta que las trayectorias en el espacio de fases son “rectas”, definidas
por las ecuaciones de Hamilton, se sigue:
∆S̃ =
"
l
X
ν=1
pν δqν + L ∆t
#
t2
(9.21)
t1
Ahora, usando (9.4) en (9.21) obtenemos que ∆S̃ = ∆S, ecuación (9.11):
∆S̃ =
"
l
X
ν=1
pν ∆qν − H ∆t
#
t2
(9.22)
t1
∆S̃ es el cambio en la acción al cambiar infinitesimalmente de una trayectoria
de fases real a otra, o sea al variar infinitesimalmente las (α). Podemos integrar cada
término en (9.22) respecto a (α), desde (α) = (αi ) hasta (α) = (αf ), o sea sobre todas
Las transformaciones canónicas / 325
las trayectorias que comienzan y terminan en las curvas cerradas C1 y C2 :
# t2
Z (αf ) "X
l
pν ∆qν − H ∆t
S(αf ) − S(αi ) =
(αi )
=
Z
ν=1
l
X
(αf )
p2ν
ν=1
(αi )
−
=
Z
(αf )
(αi )
I
C2
−
I
C1
l
X
ν=1
∆qν2
p1ν
2
− H ∆t2
∆qν1
ν=1
l
X
ν=1
l
X
1
C1
l
X
ν=1
!
!
pν ∆qν − H ∆t
Hemos demostrado que la integral de lı́nea,
!
I X
l
pν ∆qν − H ∆t
I=
(9.23)
!
pν ∆qν − H ∆t
ν=1
!
− H ∆t1
pν ∆qν − H ∆t
Como S(αi ) = S(αf ) obtenemos:
! I
I
l
X
pν ∆qν − H ∆t −
C2
t1
!
=0
(9.24)
(9.25)
ν=1
no cambia su valor tomada sobre un contorno arbitrario del espacio fásico, a través del
cual pasan trayectorias reales que lo deforman al desplazarse sobre la “manguera” de
trayectorias reales. I es una integral invariante, llamada la integral invariante de Poincaré-Cartán (véase el texto de Gantmacher, Lectures in analytical mechanics, sección 18).
Teorema de Poincaré-Cartán. I es una integral invariante a lo largo de un haz
de trayectorias arbitrario en el espacio de fase si y sólo si esas trayectorias son solución
a las ecuaciones canónicas de Hamilton. Hemos demostrado que si las trayectorias son
solución a las ecuaciones de Hamilton, I es una integral invariante. Restarı́a por mostrar
que si I es una integral invariante entonces las trayectorias son solución a las ecuaciones
de Hamilton. La demostración está en el texto de Gantmacher indicado anteriormente.
Como en este teorema se muestra que las ecuaciones de Hamilton son consecuencia
de la invariancia de I, ésta puede plantearse como un principio general de la mecánica,
que fue hallado por Poincaré en el año 1890.
Las ecuaciones de Whittaker. En la integral de Poincaré-Cartán (9.25), podemos ver que hay analogı́a entre las pν y −H, y entre las qν y t. Podemos pensar en un
326 / Mecánica clásica avanzada
formalismo en el cual se intercambien los papeles de (−H, t) y una pareja de variables
canónicamente conjugadas, digamos (p1 , q1 ),2 en un espacio de fases ampliado 2l + 1dimensional, donde t no es simplemente un parámetro.
Sean (S = −H, t) las cantidades que cambiaremos por (p1 , q1 ):
s = −H(q, p, t)
(9.26)
La ecuación (9.26) nos permite expresar a p1 en términos de (q), p2 , ...pl , s, t:
p1 = −K(q1 , q2 , ...ql , p2 , p3 , ...pl , s, t)
Entonces podemos escribir la integral invariante I como:
I
I = (s∆t + p2 ∆q2 + pl ∆ql − K ∆q1 )
(9.27)
(9.28)
En estas variables, K hace las veces de H y q1 las veces de t. Hemos probado, pues,
que el movimiento del sistema con las nuevas variables obedece las ecuaciones:
dt
=
dq1
∂K
;
∂s
∂K
∂s
=−
dq1
∂t
dqν
=
dq1
∂K
;
∂pν
dpν
∂K
=−
;
dq1
∂qν
(9.29)
ν = 1, 2, ...l
donde ahora q1 es la variable independiente o “tiempo”.
Sea ahora un sistema generalizado conservativo (o sea un sistema arbitrario para
el cual H no depende del tiempo). En este caso:
H(q, p) = h = constante
(9.30)
que sabemos, en general no coincide con E = T + V .
Ahora, en la integral invariante I tomemos sólo aquellos estados para los cuales la
constante h toma un mismo valor, h0 . Todas las trayectorias tendrán la misma energı́a.
Entonces:
I
I
H ∆t = h0 ∆t = 0
(9.31)
La integral invariante será:3
I=
I X
l
pν ∆qν
(9.32)
ν=1
Si ahora en (9.30) despejamos p1 obtenemos:
p1 = −K(q1 , q2 , ...ql ; p2 , p3 , ...pl , h0 )
(9.33)
2 Véase el texto de Whittaker, A treatise on the analytical dynamics of particles and rigid bodies,
capı́tulo XII, numeral 141.
3 La invariancia de I es análoga a un teorema de hidrodinámica que establece que la circulación en
cualquier curva cerrada que se mueve con un fluido no cambia con el tiempo.
Las transformaciones canónicas / 327
con lo cual (9.32) se puede escribir en la forma:
!
I X
l
pν ∆qν − K∆q1
I=
(9.34)
ν=2
Esta integral toma la forma de la integral invariante de Poincaré-Cartán, tomando
como variables de estado a q2 , p2 , q3 , p3 , ...ql , pl , a q1 como el tiempo, y a K en lugar
de H. En virtud del teorema mencionado, se cumple que el movimiento de este sistema
obedece las ecuaciones de Hamilton siguientes (2l − 2 en total):
dqν
∂K
=
;
dq1
∂pν
dpν
∂K
=−
;
dq1
∂qν
ν = 2, 3, ...l
(9.35)
Las ecuaciones (9.35) son las ecuaciones de Whittaker. O sea que para un sistema
generalizado conservativo (para el cual H es constante) se requieren sólo 2l − 2 ecuaciones para definir la trayectoria del sistema. El sistema de ecuaciones hamiltonianas de
Whittaker puede ser expresado en forma lagrangiana:
∂M
d ∂M
= 0;
−
dq1 ∂qν′
∂qν
ν = 2, 3, ...l
(9.36)
donde qν′ = dqν /dq1 y M (la función análoga de la lagrangiana) es el generador de
la transformación de Legendre de las variables (qν , qν′ ) a las variables (qν , pν ). M y K
tienen una relación análoga a L y H, véase (3.16).
M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) =
l
X
ν=2
pν qν′ − K(q1 , q2 , q3 , ...ql , p2 , p3 , ...h0 )
(9.37)
La integración de las ecuaciones de Whittaker nos conduce a qν , pν , en función de
q1 , es decir, a las ecuaciones de la trayectoria en el espacio de fases. La solución de (9.35)
contendrá 2l − 2 constantes de integración y dependerá además de la constante h0 :
qν = qν (q1 , h0 , C1 , C2 , ...C2l−2 )
(9.38)
pν = pν (q1 , h0 , C1 , C2 , ...C2l−2 ) ;
ν = 2, , 3, ...l
Reemplazando (9.38) en (9.33) llegamos a:
p1 = p1 (q1 , h0 , C1 , C2 , ...C2l−2 )
(9.39)
Las expresiones (9.38) y (9.39) constituyen las ecuaciones de las trayectorias en el
espacio de fases. La dependencia temporal de las coordenadas se recobra de la ecuación
q̇1 = ∂H/∂p1 :
Z
dq1
t=
+ C2l−1
(9.40)
∂H/∂p1
donde ∂H/∂p1 se puede expresar en términos de q1 por medio de las ecuaciones (9.38)
y (9.39).
Para sistemas que poseen la constante de movimiento h, se puede resolver el problema mecánico con sólo 2l − 2 ecuaciones del tipo hamiltoniano o con l − 1 ecuaciones
del tipo lagrangiano, (9.35) y (9.36) respectivamente.
328 / Mecánica clásica avanzada
9.3.
El principio de mı́nima acción y expresiones equivalentes
El principio de mı́nima acción de Maupertuis-Euler-Lagrange. Como las
ecuaciones (9.36) son de tipo lagrangiano, pueden ser obtenidas de un principio variacional, ∆Σ = 0, donde:
Σ=
Z
q22
q11
M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) dq1
(9.41)
La variable Σ es llamada la acción de Lagrange, en tanto que S se llama la acción
de Hamilton. ∆Σ = 0 caracteriza las trayectorias que pasan por los puntos definidos
por q1 = q11 y q1 = q12 , o sea las soluciones de (9.36) tales que ∆qν (q11 ) = ∆qν (q12 )
para ν = 2, 3, ...l. ∆ representa “desplazamientos virtuales” respecto a q1 , es decir,
desplazamientos realizados con q1 fijo y que no cambian los extremos de la trayectoria;
en cuanto al tiempo la situación es diferente, pues t1 y t2 pueden variar cuando se pasa
de una trayectoria real a una circuitosa. Esto es esquematizado en la figura 9.5, donde
B representa una trayectoria real y A una circuitosa, ambas con el mismo valor de la
energı́a.4
t2 + ∆t2
(q + ∆q)
t + ∆t
t
P1
1
q1
P2
2
t2
A
t1 + ∆t1
q1
(∆q)
(q)
B
t
t1
Figura 9.5 Paso de una trayectoria real B a una circuitosa A
La función M se puede expresar en términos de L. En efecto, se sigue de (9.27) y
(9.37) que:
M=
l
X
ν=2
4 Las
l
pν qν′ + p1 =
1X
1
1
pν q̇ν = (L + H) = (2T2 + T1 )
q̇ ν=1
q̇ 1
q̇ 1
(9.42)
trayectorias A y B que se cortan en P1 y P2 en el espacio de configuración, son las proyecciones
de dos trayectorias en el espacio de fases ampliado, sobre H = h0 , que no se cortan.
Las transformaciones canónicas / 329
En la igualdad (9.42) se ha usado la ecuación (3.127). La integral (9.41) se puede
escribir como:
Z t2
(L + H)dt = S + h(t2 − t1 )
(9.43)
Σ=
t1
se ve que ∆Σ = ∆S + h(∆t2 − ∆t1 ), cuando tomamos sólo trayectorias circuitosas con
el mismo valor de la energı́a. La expresión ∆Σ = 0 define la ecuación de la trayectoria
entre todas las que satisfacen la conservación de la energı́a, con ∆qν = 0 en P1 y P2 .
Además, se sigue de (9.41) y (9.43):
Z t2 X
l
Σ=
pν q̇ν dt
(9.44)
t1
ν=1
Para un sistema conservativo ordinario (tal que T + V es constante), T1 = 0 y
T = T2 , con lo cual (9.42) nos dice que M = 2T /q1 . Entonces:
Z t2
N Z ri2
X
mi ṙi dri
(9.45)
2T dt =
Σ=
t1
i=1
ri1
Esto nos dice: “dada la configuración inicial y final de un sistema descrito por un
hamiltoniano constante, e igual a la energı́a total, con un valor dado de la energı́a, la
trayectoria del sistema en el espacio de configuración es aquella para la cual la integral
de la energı́a cinética es estacionaria, cuando se compara con las trayectorias vecinas que
satisfacen dichas condiciones”. Este principio es aplicable sólo a sistemas conservativos.
Los tiempos requeridos para moverse sobre las diferentes trayectorias pueden cambiar
pero la energı́a es la misma sobre cada curva. En el principio de Hamilton aplicado a sistemas conservativos, se consideran sólo aquellas trayectorias para las cuales el tiempo de
movimiento a lo largo de ellas es el mismo, aunque las energı́as asociadas a ellas pueden
diferir. Las trayectorias variadas en el principio de Hamilton no corresponden necesariamente con trayectorias posibles del movimiento del sistema, H puede no conservarse
sobre ellas.
En el principio de mı́nima acción se consideran trayectorias variadas donde el
tiempo puede variar pero H sı́ se conserva. En estos dos principios se halla la trayectoria
verdadera “escogiendo” entre las trayectorias de dos conjuntos de trayectorias definidas
de manera diferente.
Otra forma de obtener que ∆Σ = 0 es la siguiente:
Z t2 X
Z t2
l
(L + H) dt = S + h(t1 − t2 )
(9.46)
Σ=
pν q̇ν dt =
t1
t1
ν=1
Tomando variaciones en (9.46) y usando la expresión (9.11) para ∆S:
t2
" l
# t2
X
∆Σ = ∆S + h(∆t1 − ∆t2 ) =
pν ∆qν − h∆t
+ h∆t
ν=1
=
l
X
ν=1
t1
t1
t2
pν ∆qν
(9.47)
t1
330 / Mecánica clásica avanzada
Tomando a ∆qν = 0 en t1 y t2 y ν = 1, 2, ...l, se sigue que ∆Σ = 0. A la función S
se le llama acción principal ( o de Hamilton) y a la función Σ se le llama acción reducida
(o de Lagrange).
Resumen Histórico. Fermat, matemático francés (1601-1665), formuló el principio del mı́nimo tiempo en la óptica de rayos: un rayo de luz se propaga sobre aquella
trayectoria para la cual el tiempo de tránsito es mı́nimo. En lenguaje variacional (moderno):
Z B
Z B
dl
∆
dt = 0 ⇒ ∆
=0
(9.48)
A
A v
Maupertuis, especulando con las concepciones filosóficas de Leibnitz, expresó en
1744 la conjetura de que la evolución de una partı́cula material se da de tal manera que
el producto m.v.l es mı́nimo, dio ejemplos en los cuales las trayectorias son rectilı́neas y
por tanto v es constante.
El matemático suizo Euler (1703-1793) enunció en 1744 el principio de mı́nima
acción, esta vez como un teorema, basado en sus trabajos sobreRel cálculo de variaciones.
Tal enunciado es de la forma: la diferencia entre la integral vdl para una partı́cula,
tomada a lo largo de una trayectoria real, y la misma integral sobre una trayectoria
vecina (es decir sobre una trayectoria sobre la cual se mueve la partı́cula sin obedecer
las leyes de Newton), que pasan por dos puntos dados, es una cantidad infinitesimal de
segundo orden; se supone que la partı́cula viaja sobre la trayectoria variada con una
velocidad para la cual la energı́a total tiene un valor dado:
Z B
∆E=C
v dl = 0
(9.49)
A
donde C es una constante. En 1760 Lagrange (1736-1813) extendió el principio de Euler
a sistemas de partı́culas:
∆E=C
Z
N
BX
A
i=1
m~vi · d~ri = 0
(9.50)
Lagrange mostró además que (9.50) se cumple si y sólo si vale la segunda ley de
Newton, mi~¨r i = −∂V /∂~ri , i = 1, 2, ...N . Además, Lagrange fue el primero que introdujo
las coordenadas generalizadas, con las cuales (9.50) es:
∆E=C
Z
N
BX
A
pν dqν = 0
(9.51)
i=1
Cuando en (9.51) se asume que T es función cuadrática de las velocidades generalizadas se tiene:
Z B
∆E=C
2T dt = 0
(9.52)
A
Lagrange llamó a (9.52) el principio de la más pequeña o más grande fuerza viva.
Las transformaciones canónicas / 331
Hamilton, escocés que vivió entre 1805 y 1865, aportó en 1835 la formulación general del principio de mı́nima acción y las ecuaciones de Hamilton. Extiende la formulación
al considerar trayectorias circuitosas en que la energı́a no se conserva:
Z B
Z B
∆
L dt = ∆
(2T − H)dt = 0
(9.53)
A
A
El conjunto de trayectorias es tal que pasa simultáneamente por los mismos puntos
inicial y final. Es claro ya por qué a Σ se llama la acción de Lagrange y a S la acción
de Hamilton. Los principios de Hamilton y de mı́nima acción son aplicables equivalentemente para sistemas conservativos, sin embargo, el primero es más general pues se aplica
además a sistemas holónomos generales, con una generalización a sistemas holónomos
con fuerzas no derivables de un potencial, ecuación (3.12).
Las ecuaciones de Jacobi. Para el caso de un sistema conservativo ordinario T
puede escribirse como:
T = T2 =
l
X
aµν q̇µ q̇ν = q12 G(q1 , q2 , ...ql , q2′ , q3′ , ...ql )
(9.54)
µ,ν=1
donde:
G=
l
X
aµν qµ′ qν′
(q1′ = 1)
(9.55)
µ,ν=1
Como H = h = T + V , (9.54) conduce a:
r
h−V
q̇1 =
G
(9.56)
Para M , (9.56) nos da:
M=
p
2T
= 2 G(h − V )
q̇1
(9.57)
Las ecuaciones diferenciales lagrangianas de Whittaker, (9.36) con M dado por
(9.57), que son aplicables a sistemas conservativos ordinarios, se llaman las ecuaciones
de Jacobi (1886).
Otras formas del principio de acción estacionaria de Maupertuis-EulerLagrange. Definimos en el espacio de configuración los vectores l-dimensionales ρ~ =
{q1, q2, ...ql }. Entonces el vector ρ
~ determina la posición del sistema en el espacio de
configuración. La energı́a cinética está relacionada con la velocidad del punto representativo del sistema en el espacio de configuración, ρ
~˙ . Para un sistema esclerónomo la
energı́a cinética es función cuadrática de las velocidades generalizadas, de acuerdo con
(9.54):
T =
l
l
1 X
1 X
2aµν q̇µ q̇ν =
mµν dqµ dqν
2 µ,ν=1
2dt2 µ,ν=1
(9.58)
332 / Mecánica clásica avanzada
Si definimos en el espacio de configuración la métrica no cartesiana mµν = 2aµν ,
donde aµν está dada por (3.105), el producto escalar de dos vectores, ρ
~ y ~n, estará dado
por:
(~
ρ, ~η ) =
l
X
mµν ρµ ην
(9.59)
µ,ν=1
O sea que es posible asociar al espacio de configuración de un sistema mecánico
un espacio riemanniano, dado por la métrica (tensor métrico) mµν (véase el texto de
Lichnerowicz, Cálculo tensorial, capı́tulo VI). De las expresiones (9.58) y (9.59), tenemos
que:
T =
1 ˙2
dρ
ρ
~ ⇒ dt = √
2
2T
(9.60)
Se sigue que la energı́a cinética de un sistema dinámico siempre coincide con la
energı́a cinética del punto representativo en el espacio de configuración, si a ese punto
se le asigna una masa m = 1.
El principio de acción estacionaria tomará la forma:
Z (q2 ) √
Z t2
2T dρ = 0
(9.61)
2T dt = ∆
∆Σ = ∆
t1
(q1 )
Para sistemas conservativos, tales que h = T + V :
Z (q2 )
√
∆
h − V dρ = 0
(9.62)
(q1 )
La ecuación (9.62) se llama la forma de Jacobi del principio de acción estacionaria.
Para un movimiento libre, V = 0:
Z (q2 )
dρ = 0
(9.63)
∆
(q1 )
La ecuación (9.63) indica
√ que la trayectoria es la
√ más corta, la lı́nea recta; donde
la longitud recorrida es ρ = 2h, donde ρ = (t1 − t2 ) 2h.
Para V = 0, el punto representativo
del sistema en el espacio de configuración se
√
mueve uniformemente con velocidad 2h sobre una trayectoria recta.
En general, para V 6= 0, de la forma de Jacobi del principio de acción estacionaria
se deduce que la trayectoria del sistema en el espacio de configuración (trayectoria real)
es la geodésica. Esta trayectoria también es la “más recta” o sea la de mı́nima curvatura
(principio variacional de Hertz de la mı́nima curvatura).
9.4.
El teorema de Li Hua Chung
Sea la integral invariante de Poincaré-Cartán, I, definida en (9.25). Según (9.24),
I tiene el mismo valor sobre cualquier contorno cerrado que envuelva el mismo haz de
trayectorias reales en el espacio de fases. Particularicemos para el caso en que los puntos
Las transformaciones canónicas / 333
sobre C1 y C2 tienen los mismos tiempos. Es decir, sea C1 un conjunto de puntos del
espacio de fases que forma una lı́nea cerrada y que corresponde a estados simultáneos
de un sistema de acuerdo con (9.17), las ecuaciones paramétricas de C1 son:
qν1 = qν1 (α) ;
t1 (α) = constante ;
p1ν = p1ν (α) ;
ν = 1, 2, ...l
(9.64)
C2 está definida similarmente. A lo largo de estos contornos se cumple que ∆t = 0,
reduciéndose la ecuación (9.24) a:
I
l
X
pν ∆qν =
C2 ν=1
I
l
X
pν ∆qν = I1
(9.65)
C1 ν=1
La integral I1 fue introducida por Poincaré pero fue Cartán quien la extendió a
contornos formados por estados no simultáneos con la introducción del término adicional
−Ht.5
Sea C un contorno arbitrario en el espacio de fases (véase figura 9.6). Es claro
que las proyecciones de C sobre cada uno de los planos de fase (qν , pν ), ν = 1, 2, ...l,
constituye una curva cerrada bidimensional, que llamaremos Cν , ν = 1, 2, ...l.
Pν
Cν
Aν
qν
Figura 9.6 C es un contorno arbitrario en el espacio de fases con proyecciones Cν
Se sigue entonces que:
I
(p1 ∆q1 + p2 ∆q2 + ...pl ∆ql ) =
C
I
I
I
p2 ∆q2 + ...
p1 ∆q1 +
pl ∆ql
(9.66)
El área encerrada por el contorno Cν es Aν , donde:
I
pν ∆qν = ±Aν
(9.67)
C1
C2
Cl
Cν
5 La
mecánica de Hamilton puede desarrollarse postulando un espacio de dimensión par dotado de
una estructura definida por la invariancia de I1 .
334 / Mecánica clásica avanzada
Se toma el signo más si se evalúa
H la integral Hen el sentido de las agujas del reloj y
menos en el sentido contrario. Como C pν ∆qν = cν pν ∆qν , el sentido del contorno Cν
dependerá del sentido de C. Entonces:
I X
l
l
X
±Aν
(9.68)
pν ∆qν =
I1 =
C ν=1
ν=1
donde C consta de estados simultáneos. Los contornos C y Cν varı́an durante el movimiento del sistema y las áreas Aν también varı́an, pero la suma algebraica de esas
áreas, (9.68), permanece constante. La anterior es pues la interpretación geométrica de
la invariancia de la integral de Poincaré I1 .
Como H no aparece en I1 , hallamos que la invariancia de I1 no depende del sistema
mecánico particular, es decir, I1 es invariante para cualquier sistema hamiltoniano. Por
esto se llama a I1 la integral universal invariante.
Es válido entonces enunciar el siguiente teorema: si q̇ν = ∂H/∂pν ; ṗν = −∂H/∂qν , ν =
1, 2, ...l, entonces I1 es invariante. Si I1 es invariante para algún sistema de ecuaciones
diferenciales q̇ν = Qν = Qν (q, p, t), ṗν = Pν (q, p, t), ν = 1, 2, ...l, entonces ese sistema
debe ser hamiltoniano. Para demostrar la segunda parte, sea:
I X
l dpν
dI1
d∆qν
=
∆qν + pν
dt
dt
dt
ν=1
=
I X
l
(ṗν ∆qν + pν ∆q̇ν )
I X
l
(ṗν ∆qν + ∆(pν q̇ν ) − ∆pν q̇ν )
I X
l
(ṗν ∆qν − q̇ν ∆pν )
I X
l
(Pν ∆qν − Qν ∆pν )
ν=1
=
ν=1
=
ν=1
=
ν=1
(9.69)
Como I1 = 0, se sigue que (9.69) debe ser igual a la integral de una diferencial ∆
exacta de alguna función de (q, p, t) que llamaremos −H:
I X
l
(Pν ∆qν − Qν ∆pν ) =
ν=1
I
−∆H = −
Z X
l ∂H
ν=1
∂H
∆qν +
∆pν
∂qν
∂pν
(9.70)
entonces, Pν = −∂H/∂qν ; Qν = ∂H/∂pν ; ν = 1, 2, ...l, con lo cual se concluye la prueba.
Las transformaciones canónicas / 335
Teoremas de Stockes. En la teorı́a de campos vectoriales se muestra que la
integral de lı́nea a lo largo de una curva rectificable es igual a la integral de superficie
sobre la región encerrada por esa lı́nea del rotacional del vector:
I
Z Z
~ · dS
~
V~ · d~r =
rotV
(9.71)
C
S
En términos de las componentes:
Z Z X
I X
3
3
∂Vj
Vi dxi =
dSk ǫijk
∂xi
C i=1
(9.72)
S i,j,k=1
~ que determina un
donde ǫijk es el tensor de Levi-Civita. dSk es la componente de dS
plano perpendicular a la dirección ~ek ; por tanto dSk = dxi dxj con i 6= j 6= k, o sea que:
Z Z X
I X
3
3
∂Vj
∂Vi
Vi dxi =
dxi dxj
(9.73)
−
∂xi
∂xj
C i=1
i<j=1
S
En geometrı́a diferencial se llama a una integral sobre un contorno cerrado “integral
relativa” y a una integral sobre una región que no es cerrada “integral absoluta”; una
integral de lı́nea se llama de “primer orden” y una de superficie se llama “de segundo
orden” porque aparecen uno y dos diferenciales respectivamente.
En el espacio de fases, el teorema de Stockes toma la forma:
Z Z X
I X
2l 2l
∂Vj
∂Vi
Vi ∆xi =
∆xi ∆xj
(9.74)
−
∂xi
∂xj
C i=1
i<j=1
S
donde x1 = q1 , ...xl = ql ; xl+1 = p1 , ...x2l = pl . Ası́, para l = 1, (9.74) es:
Z Z I
∂A
∂B
∆q ∆p
−
(A∆q + B∆p) =
∂q
∂p
C
(9.75)
S
En particular, para A = p y B = 0, como es de esperarse:
Z
Z Z
p ∆q =
∆p ∆q
C
(9.76)
S
La ecuación (9.74) puede escribirse como:
I X
l
(Aν ∆qν + Bν ∆pν ) =
C ν=1
Z Z " X
l
∂Aν
∂Aµ
∆qµ ∆qν +
−
∂qµ
∂qν
µ<ν=1
S
l
X
∂Aµ
∂Bν
∆qµ ∆pν +
−
∂qµ
∂qν
µ,ν=1
#
l
X
∂Bν
∂Aµ
∆pµ ∆pν
−
∂pµ
∂pν
µ<ν=1
(9.77)
336 / Mecánica clásica avanzada
Para Aν = pν y Bν = 0, se cumple:
I X
Z Z X
l
l
pν ∆qν =
∆pν ∆qν
C ν=1
(9.78)
S ν=1
En general, una integral relativa de orden 2ν − 1, de orden impar, puede escribirse
como una integral absoluta de orden par 2ν, para ν = 1, 2, ...l. Ası́ por ejemplo, se
cumple que:
Z Z X
I X
l
l
pν ∆qν = J2 =
∆qν ∆pν
(9.79)
I1 =
S ν=1
ν=1
I3
=
=
Z Z Z
l
X
pν ∆qν ∆pµ ∆qµ = J4
µ,ν=1
Z Z Z Z X
l
∆qν ∆pν ∆qµ ∆pµ
(9.80)
µ,ν=1
I2l−1 =
=
Z Z
Z Z Z
...
Z
···
Z
l
X
pν1 ∆qν1 ∆pν2 ∆qν2 ... ∆pνl ∆qνl = J2l
ν1 , ν2 , ...νl =1
l
X
(9.81)
∆q1 ∆p1 ... ∆ql ∆pl
ν1 , ν2 , ...νl =1
Se puede mostrar que I1 , I3 , ...I2l−1 son integrales universales invariantes. O sea
que una integral universal invariante relativa de orden impar I2ν−1 puede representarse
como una integral invariante absoluta de orden par J2ν .
En 1947 Li Hua Chung probó que cualquier integral universal invariante difiere por
un factor constante de una de las integrales (9.79), (9.80) o (9.81). Gantmacher presenta
la demostración de que cualquier integral universal invariante relativa de primer orden
es un múltiplo de I1 , para l = 1.
Teorema de Li Hua Chung. Este teorema dice que si:
ZZ Z h
l
X
···
Aµ1 ∆qµ1 ∆pµ2 ∆qµ2 ...
I (ν) =
Vν
µ1 , µ2 , ...µl =1
∆pµν ∆qµν + Bµ1 ∆pµ1 ∆pµ2 ∆qµ2 ... ∆pµν ∆qµν
es una integral universal invariante relativa, entonces:
I (ν) = CIν
(9.82)
i
(9.83)
donde C es una constante, e Iν es una de las l integrales universales invariantes de
Poincaré. Vν es una variedad cerrada de ν dimensiones en el espacio de fases, donde
Las transformaciones canónicas / 337
ν = 1, 3, ..,2l − 1.
Notación vectorial en el espacio de fases. V~ denotará una matriz columna
de l dimensiones con componentes Vν , ν = 1, 2, ...l. M̃ es una matriz cuadrada, l × l,
con componentes Mµν . El gradiente de una función F respecto a las coordenadas y a los
momentos, se denota respectivamente por:
∂F ∂F
,
∂~q ∂~
p
(9.84)
y es un vector, o sea una matriz columna con componentes ∂F/∂qν y ∂F/∂pν respectivamente; ν = 1, 2, ...l.
El gradiente de un vector es una matriz l × l, ası́:
!
!
~
~
∂Vµ
∂Vµ
∂V
∂V
=
=
;
; µ, ν = 1, 2, ...l
(9.85)
∂~q
∂qν
∂~
p
∂pν
µν
µν
El producto escalar de dos vectores es:
~ ·V
~ =
U
l
X
Uν Vν
(9.86)
ν=1
~ , es un vector.
y el producto de una matriz por un vector, M̃ V
Prueba del teorema de Li Hua Chung para ν = 1. Usando la notación vectorial, se cumple que:
I X
l h
i I
~ · ∆~q + B
~ · ∆~
p)
Aν (~
q , p~, t)∆qν + Bν (~q, ~p, t)∆pν = (A
I =
′
(9.87)
C ν=1
Las ecuaciones de movimiento en el espacio de fases son:
∂H
∂H ˙
; p~ = −
q~˙ =
∂~
p
∂~q
(9.88)
La solución de las ecuaciones (9.88) es de la forma:
q=~
~
q (~
q0 , ~
p0 , t); p~ = p~(~
q0 , p~0 , t)
(9.89)
donde ~q0 y p~0 son los valores de ~
q y ~q para t = t0 . En el tiempo t = t0 definimos la curva
cerrada C0 , constituida por un conjunto de estados simultáneos, caracterizada por un
conjunto de parámetros (α):
q0 = ~
~
q (α); p~0 = ~
p0 (α); (αi ) ≤ (α) ≤ (αf )
(9.90)
Los puntos que en t = t0 estaban sobre el contorno C0 , formarán un contorno C en
algún otro instante de tiempo t. Los puntos del contorno C se obtienen reemplazando
(9.90) en (9.89):
q=~
~
q (α, t); ~
p = p~(α, t); (αi ) ≤ (α) ≤ (αf )
(9.91)
338 / Mecánica clásica avanzada
Poniendo (9.91) en (9.87) se obtiene a I ′ en función de t. De la invariancia de I ′
se sigue que dI ′ /dt = 0. Derivando a (9.87):
I ′
~˙ · ∆~q + A
~ · ∆~q˙ + B
~˙ · ∆~
~ · ∆p~˙ = 0
˙
A
p+B
(9.92)
I =
donde se usó la propiedad d(∆~q)/dt = ∆~q˙ . La ecuación (9.92) también se puede escribir
como:
I h
i
~˙ · ∆~q + ∆(A
~ · ~q˙ ) − ∆A
~ · ~q˙ + B
~˙ · ∆~
~ · p~˙ ) − ∆B
~ · p~˙
A
p + ∆(B
(9.93)
I˙′ =
Se cumple que:
I
C
~ ·~
~ · ~q˙
∆(A
q˙ ) = A
(αi )
=0
(9.94)
(αf )
debido a que ~
q (αi , t) = ~q(αf , t); ~p(αi , t) = p~(αf , t), por ser C un contorno cerrado. Por
otra parte:
~
~
~
~˙ = ∂ A · ~q˙ + ∂ A · ṗ + ∂ A
A
∂~q
∂~p
∂t
(9.95)
~
~
∂A
∂A
· ∆~q +
· ∆~
p
∂~q
∂~p
(9.96)
~=
∆A
Usando (9.95) y (9.96), obtenemos:
!
I "
~
~
~
∂A
∂A
∂A
′
˙
˙
I =
· ∆~q −
· ~q +
· ṗ +
∂~q
∂~p
∂t
+
~
~
~
∂B
∂B
∂B
· ~q˙ +
· ṗ +
∂~q
∂~p
∂t
!
· ∆~
p−
!
~
~
∂A
∂A
· ∆~q +
· ∆~
p · ~q˙
∂~q
∂~p
! #
~
~
∂B
∂B
· ∆~q +
· ∆~
p · ~p˙
∂~q
∂~p
(9.97)
Reagrupando términos y expresando a ~q˙ y ~p˙ por medio de (9.88) obtenemos:
!
!
#
I "
~
~
∂H
∂H
∂A
∂B
′
˙
−Z̃
· ∆~q + −Z̃
· ∆~
p
(9.98)
I =
+
+
∂~q
∂t
∂~p
∂t
donde la matriz Z̃ se define como:
Z̃ =
~
~
∂A
∂B
−
∂~
p
∂~q
(9.99)
Como I˙′ = 0, el integrando en (9.98) debe ser el diferencial de alguna función F :
∆F =
∂F
∂F
· ∆~q +
· ∆~
p
∂~q
∂~p
(9.100)
Las transformaciones canónicas / 339
comparando (9.98) y (9.100) vemos que:
~
∂F
∂H
∂A
= −Z̃
+
;
∂~q
∂~q
∂t
~
∂F
∂H
∂B
= −Z̃
+
∂~p
∂~p
∂t
(9.101)
En términos de componentes (9.101) toma la forma:
l
l
λ=1
λ=1
X
X
∂F
∂H
∂H
∂Aν
∂Bν
∂F
=−
Zνλ
+
=−
Zνλ
+
;
∂qν
∂qλ
∂t
∂pν
∂pλ
∂t
(9.102)
Como F ha de ser una función continua de ~q y p~ se debe cumplir:
∂2F
∂2F
∂2F
∂2F
∂2F
∂2F
=
;
=
;
=
∂qµ ∂qν
∂qν ∂qµ ∂pµ ∂pν
∂pν ∂pµ ∂pµ ∂qν
∂qν ∂pµ
(9.103)
De (9.102) y (9.103) se sigue que:
−
X ∂Zνλ ∂H X
∂ 2 Aν
∂2H
−
+
=
Zνλ
∂qµ ∂qλ
∂qµ ∂qλ
∂qµ ∂t
−
X ∂Zµλ ∂H X
∂ 2 Aµ
∂2H
−
+
Zµλ
∂qν ∂qλ
∂qν ∂qλ
∂qν ∂t
−
X ∂Zνλ ∂H X
∂ 2 Bν
∂2H
−
+
=
Zνλ
∂pµ ∂pλ
∂pµ ∂pλ
∂pµ ∂t
λ
λ
λ
λ
λ
λ
X ∂Zµλ ∂H X
∂ 2 Bµ
∂2H
−
−
+
Zµλ
∂pν ∂pλ
∂pν ∂pλ
∂pν ∂t
λ
λ
−
X ∂Zνλ ∂H X
∂ 2 Aν
∂2H
−
+
=
Zνλ
∂pµ ∂qλ
∂pµ ∂qλ
∂pµ ∂t
−
X ∂Zµλ ∂H X
∂2H
∂ 2 Bµ
−
+
Zµλ
∂qν ∂pλ
∂qν ∂pλ
∂qν ∂t
λ
λ
(9.104)
λ
λ
En (9.104) consideremos los casos µ = ν y µ 6= ν. Para µ = ν se tiene sólo una
relación no trivial, la tercera:
X ∂Zνλ ∂H
∂2H
∂2H
Zνλ ∂H
−
−
+ Zνλ
− Zνλ
∂pν ∂qλ
∂qν ∂pλ
∂pν ∂qλ
∂qν ∂pλ
λ
2
2
∂ ∂ Aν
∂ Bν
+
=0
(9.105)
−
∂t ∂pν
∂qν
Como H es arbitrario, (9.105) se cumple sólo si:
Zνλ = Zνν δνλ ;
∂Zνν
∂Zνν
∂Zνν
= 0;
= 0;
=0
∂pν
∂qν
∂t
(9.106)
340 / Mecánica clásica avanzada
Para µ 6= ν y usando (9.106), las relaciones (9.104) quedan:
−
∂Zνν ∂H
∂2H
∂ 2 Aν
− Zνν
+
=
∂qµ ∂qν
∂qµ ∂qν
∂qµ ∂t
−
∂2H
∂ 2 Aµ
∂Zµµ ∂H
− Zµµ
+
∂qν ∂qµ
∂qν ∂qµ
∂qν ∂t
−
∂2H
∂ 2 Bν
∂Zνν ∂H
− Zνν
+
=
∂pµ ∂pν
∂pµ ∂pν
∂pµ ∂t
(9.107)
∂2H
∂ 2 Bµ
∂Zµµ ∂H
− Zµµ
+
−
∂pν ∂pµ
∂pν ∂pν
∂pν ∂t
−
∂2H
∂ 2 Aν
∂Zνν ∂H
− Zνν
+
=
∂pµ ∂qν
∂pµ ∂qν
∂pµ ∂t
−
∂2H
∂ 2 Bµ
∂Zµµ ∂H
− Zµµ
+
∂qν ∂pµ
∂qν ∂pµ
∂qν ∂t
Las ecuaciones (9.107) pueden escribirse ası́:
−
∂Zνν ∂H
∂Zµµ ∂H
∂2H
+
+ (Zµµ − Zνν )
∂qµ ∂qν
∂qν ∂qµ
∂qµ ∂qν
+
∂
∂t
−
∂Zµµ ∂H
∂2H
∂Zνν ∂H
+
+ (Zµµ − Zνν )
∂pµ ∂pν
∂pν ∂pµ
∂pµ ∂pν
∂
+
∂t
∂Aν
∂Aµ
−
∂qµ
∂qν
∂Bν
∂Bµ
−
∂pµ
∂pν
=0
(9.108)
=0
−
∂Zµµ ∂H
∂ 2H
∂Zνν ∂H
+
+ (Zµµ − Zνν )
∂pµ ∂qν
∂qν ∂pµ
∂pµ ∂qν
+
∂
∂t
∂Aν
∂Bµ
−
∂pµ
∂qν
=0
Las transformaciones canónicas / 341
Como H es arbitrario, de (9.108) se sigue que:
∂Zνν
∂Zµµ
= 0;
= 0 ; Zµµ = Zνν
∂qµ
∂pµ
∂
∂t
∂
∂t
∂Aν
∂Aµ
−
∂qµ
∂qν
∂Aν
∂Bµ
−
∂pµ
∂qν
= 0;
∂
∂t
∂Bν
∂Bµ
−
∂pµ
∂pν
=0
(9.109)
=0
Las relaciones (9.106) y (9.109) nos dan que para todos µ, ν, se cumple:
Zνλ = Z δνλ ;
∂Z
∂Z
= 0;
=0
∂qν
∂pν
∂Z
= 0 ⇒ Z = constante
∂t
∂ ∂Bν
∂Aµ
∂Bµ
∂ ∂Aν
= 0;
=0
−
−
∂t ∂qµ
∂qν
∂t ∂pµ
∂pν
∂
∂t
∂Aν
∂Bµ
−
∂pµ
∂qν
(9.110)
=0
donde Z = Zνν .
Para µ = ν cumple Zµν = 0, o sea:
∂Bµ
∂Aµ
=
;
∂pν
∂qν
µ=ν
reemplazando (9.111) en la última igualdad (9.110) se obtiene:
∂ ∂Aν
∂Aµ
=0
−
∂t ∂pµ
∂pν
(9.111)
(9.112)
La ecuación (9.112) y la primera igualdad (9.110) nos dan:
∂ ∂Aν
∂ ∂Aµ
∂ ∂Aν
∂ ∂Aµ
=
;
=
∂pµ ∂t
∂pν ∂t
∂qµ ∂t
∂qν ∂t
(9.113)
Las expresiones (9.113) se cumplen si Aν (q, p, t) son de la forma:
Aν =
∂f (q, t) ∂g(p, t)
+
∂qν
∂pν
(9.114)
donde f y q son funciones continuas. Bν satisfacen, por los mismos argumentos, relaciones similares a (9.113), por tanto:
Bν =
∂f ′ (q, t) ∂g ′ (p, t)
+
∂qν
∂pν
(9.115)
342 / Mecánica clásica avanzada
~ y B
~ para
Las ecuaciones (9.114) y (9.115) son las condiciones que deben satisfacer A
que (9.87) sea una integral universal invariante.
Se cumple entonces que, para µ 6= ν:
∂Aν
∂Aµ
∂2f
∂2f
−
=
−
=0
∂qµ
∂qν
∂qµ ∂qν
∂qν ∂qµ
∂Bµ
∂ 2g′
∂ 2g′
∂Bν
−
=
−
=0
∂pµ
∂pν
∂pµ ∂pν
∂pν ∂pµ
(9.116)
∂Bµ
∂Aν
∂Aµ
∂2g
∂2g
∂Aν
−
=
−
=
−
=0
∂pµ
∂qν
∂pµ
∂pν
∂pµ ∂pν
∂pν ∂pµ
Para µ = ν las dos primeras igualdades en (9.116) siguen siendo válidas, en tanto
que la tercera se reemplaza por:
∂Aν
∂Bν
−
= Zνν = C
∂pν
∂qν
(9.117)
Por tanto, (9.116) y (9.117) nos dan para todos µ, ν:
∂Aν
∂Aµ
=
;
∂qµ
∂qν
∂Bν
∂Bµ
=
;
∂pµ
∂pν
∂Aν
∂Bµ
−
= Cδµν
∂pµ
∂qν
(9.118)
También podemos escribir a (9.118) ası́:
∂Aν
∂Aµ
=
;
∂qµ
∂qν
∂Bν
∂Bµ
=
;
∂pµ
∂pν
∂
∂Bµ
(Aν − Cpν ) =
∂pµ
∂qν
(9.119)
Las expresiones (9.119) nos dicen que debe existir cierta función Φ(~q, ~p, t) tal que:
∆Φ =
∂Φ
∂Φ
~ − C~
~ · ∆~
· ∆~q +
· ∆~
p = (A
p) · ∆~q + B
p
∂~q
∂~p
(9.120)
puesto que:
∂Φ
∂Φ
= Aν − C pν ;
= Bν
∂qν
∂pν
(9.121)
Lo anterior implica que se cumplan las relaciones (9.119) a fin de que Φ sea continua. Se tiene entonces que:
I
I
I
~
~
(A · ∆~
q + B · ∆~
p) = C~
p · ∆~q + ∆Φ
(9.122)
La integral universal invariante (9.87) es entonces igual a:
I
I
′
~
~
I = (A · ∆~
q + B · ∆~
p) = C p~ · ·∆~q = CI1
(9.123)
lo cual constituye la prueba del teorema de Li Hua Chung para I ′ . De paso hemos hallado
~ yB
~ deben tener la forma (9.114) y (9.115) respectivamente a fin de que I ′ sea
que A
una integral universal invariante. Esta prueba es una generalización para l grados de
libertad de la presentada en Gantmacher para l = 1.
Las transformaciones canónicas / 343
9.5.
Las transformaciones canónicas
En la sección 4.5 se dio la definición de una transformación canónica como una
transformación de coordenadas en el espacio de fases 2l-dimensional, que en general
puede depender del tiempo y que no cambia la forma de las ecuaciones de Hamilton.
Allı́ derivamos las fórmulas de la transformación a partir de la segunda forma del principio de Hamilton. Aquı́ usaremos la invariancia de la integral de Poincaré-Cartán y el
teorema de Li Hua Chung.
La función generatriz de una transformación canónica. Sean dos espacios
de fase 2l dimensionales (q, p), (q, p). La transformación canónica establece una correspondencia biunı́voca entre los puntos de estos dos espacios en cada instante t:
q ν = q ν (q, p, t) ;
J
pν = pν (q, p, t) ;
q 1 , q 2 , ...q l , p1 , p2 , ... pl
q1 , q2 , ...ql , p1 , p2 , ... pl
ν = 1, 2, ...l
6= 0
(9.124)
(9.125)
Un conjunto de trayectorias rectas en el espacio (q, p) está definido por el sistema
de ecuaciones diferenciales:
∂H(q, p, t) dpν
∂H(q, p, t)
dqν
;
;
=
=−
dt
∂pν
dt
∂qν
ν = 1, 2, ...l
(9.126)
A cada una de las trayectorias definidas por (9.126) la transformación canónica le
hace corresponder una trayectoria recta en el espacio (q, p), definida por el sistema de
ecuaciones diferenciales:
dq ν
∂H(q, p, t) dpν
∂H(q, p, t)
=
;
=−
; ν = 1, 2, ...l
dt
∂pν
dt
∂q ν
(9.127)
Sea un “tubo” de trayectorias en el espacio de fases y sea C un contorno arbitrario
que rodea ese tubo de trayectorias en el espacio (q, p). En el espacio (q, p) en virtud de
la transformación habrá otro tubo de trayectorias rectas y C es un contorno que corresponde a C. C0 y C 0 son los contornos definidos por un conjunto de estados simultáneos,
t = constante, y que se corresponden mediante la transformación. C0 y C 0 están dadas
por ecuaciones paramétricas del tipo de (9.64), y C y C por ecuaciones como (9.17). Es
decir, C 0 y C0 obedecen a:
C : t=
t(α) ; qν = qν (α) ; pν = pν (α)
(9.128)
C0 : t =
t(α) = constante ; qν = qν (α) ; pν = pν (α) ; ν = 1, 2, ...l
y análogamente para C 0 y C. Como las trayectorias son hamiltonianas en (q, p) y en
(q, p), se sigue de la invariancia de la integral de Poincaré-Cartán, (9.25), que:
! I
I
l
l
X
X
pν ∆qν
(9.129)
pν ∆qν − H ∆t =
C
ν=1
C0 ν=1
344 / Mecánica clásica avanzada
I
C
l
X
ν=1
pν ∆q ν − H ∆t
!
=
I
l
X
C 0 ν=1
pν ∆q ν
(9.130)
Como t es invariante bajo una transformación canónica, se sigue que el lado derecho
de (9.129) está evaluado en el mismo tiempo que el lado derecho de (9.130). Si en la
H Pl
integral universal invariante
ν=1 pν ∆q ν pasamos a las variables (q, p) por medio de
la transformación canónica (9.124), obtenemos:
I
l
X
C 0 ν=1
pν ∆q ν =
I
l
X
C0 ν=1
"
l
X
µ=1
∂qµ
pµ
∂qν
!
l
X
∆qν +
µ=1
∂q µ
pµ
∂pν
!
∆pν
#
(9.131)
La ecuación (9.131) es de la forma de (9.87): es una cierta integral universal invariante de primer orden en el espacio (p, q). Por el teorema de Li Hua Chung, el invariante
obtenido puede diferir de I1 sólo por un factor constante C, ecuación (9.123):
I
l
X
C 0 ν=1
pν ∆q ν = C
I X
l
pν ∆qν
(9.132)
C ν=1
de las ecuaciones (9.129), (9.130) y (9.132) se sigue entonces que:
!
!
I
I
l
l
X
X
pν ∆qν − H ∆t
pν ∆q ν − H ∆t = C
C
C
ν=1
(9.133)
ν=1
Si en la primera integral expresamos a (q, p) en función de las (q, p), la trayectoria
de integración C será reemplazada por C, por lo cual podemos escribir a (9.133) como:
!
!#
I " X
l
l
X
pν ∆q ν − H ∆t − C
pν ∆qν − H ∆t
=0
(9.134)
C
ν=1
ν=1
C es un contorno arbitrario en el espacio (q, p), o sea que el integrando en (9.134)
debe ser la diferencial exacta ∆ de alguna función de (q, p, t), que llamaremos −F (q, p, t).
Por tanto podemos escribir:
!
!
l
l
X
X
pν ∆q ν − H ∆t
(9.135)
∆F = C
pν ∆qν − H ∆t −
ν=1
ν=1
donde además se tiene que:
∆F =
l X
∂F
ν=1
∂F
∆qν +
∆pν
∂qν
∂pν
+
∂F
∆t
∂t
(9.136)
Pl
Como ν=1 pν ∆q ν − H ∆t no es un diferencial exacto, o sea no es igual a −∆F , se
sigue que C nunca es cero. La función F se llama la función generatriz y la constante C
Las transformaciones canónicas / 345
la valencia de la transformación canónica (9.124). La transformación canónica se llama
univalente, o simplemente transformación canónica cuando C = 1. Algunos autores llaman las transformaciones canónicas con C 6= 1 transformaciones canónicas extendidas.
En conclusión, una condición necesaria y suficiente para que la transformación (9.124)
sea canónica es la existencia de una función generatriz F y alguna constante C para
las cuales la ecuación (9.135) se satisfaga idénticamente en virtud de la transformación
(9.124). Es de notarse que la ecuación (9.135) vale para toda transformación canónica
independientemente de cuál sea la función H: vale para todo sistema hamiltoniano, o
sea F no depende de H. Esto se prueba fácilmente para un hamiltoniano arbitrario H1
definiendo a H 1 de modo que H 1 − H = C(H1 − H), con lo cual se llega a que (9.135)
vale también para H 1 y H1 .
Formas alternas de definir la función generatriz de una transformación
canónica. El principio de Hamilton modificado también puede expresarse como:
!
Z t2
l
X
−
qν ṗν − H dt = 0
(9.137)
δ
t1
ν=1
puesto que las ecuaciones de Euler-Lagrange correspondientes al principio variacional
(9.137) son las ecuaciones de Hamilton o ecuaciones de movimiento en el espacio de
fases. En lugar de (9.22) podemos escribir:
∆S̃ =
−
l
X
ν=1
qν ∆pν − H∆t
!
t2
(9.138)
t1
Consecuentemente se obtiene la siguiente forma para la integral invariante de Poincaré-Cartán, (9.25):
I=
I
−
l
X
ν=1
qν ∆pν − H∆t
!
(9.139)
Es fácil ver que (9.139) se puede derivar directamente de (9.25) mediante la transformación canónica ~
q → −~
p, p~ → q~. Se sigue entonces que además de (9.129) son posibles
las siguientes relaciones:
!
I
I
l
l
X
X
−
qν ∆pν
− qν ∆pν − H∆t =
C
I
C
C0
ν=1
−
l
X
q ν ∆pν − H∆t
ν=1
!
=
I
ν=1
(9.140)
C0
−
l
X
q ν ∆pν
ν=1
P
Por el teorema de Li Hua Chung se sigue que lν=1 qν ∆pν , que es una integral
universal invariante, es proporcional a I1 . Usando (9.129) y (9.140) conjuntamente con
el teorema de Li Hua Chung, podemos obtener además de (9.132) las siguientes tres
346 / Mecánica clásica avanzada
relaciones, que nos darán otras tres expresiones para la función generatriz completamente
equivalentes (9.135):
I
I
I
C0
C0
l
X
pν ∆q ν = C
l
X
q ν ∆pν = C
C 0 ν=1
−
−
ν=1
l
X
q ν ∆pν = C
ν=1
I
I
I
C0
−
l
X
qν ∆pν
ν=1
l
X
(9.141)
pν ∆qν
C0 ν=1
C0
−
l
X
qν ∆pν
ν=1
Es claro que las “C” que aparecen en (9.132) y en (9.141) no tienen por qué ser
la misma. De cada una de las expresiones (9.141) se obtiene una forma diferente para la
función generatriz de la transformación canónica por un procedimiento igual al que conduce a la forma (9.135). En primer lugar, y en virtud de (9.129) y (9.140), las ecuaciones
(9.141) son equivalentes a:
!
!
I
I
l
l
X
X
qν ∆pν − H∆t
(9.142)
−
pν ∆q ν − H∆t = C
C
I
C
I
C
C
ν=1
−
l
X
−
l
X
ν=1
ν=1
q ν ∆pν − H∆t
!
q ν ∆pν − H∆t
!
=C
ν=1
I
l
X
C
=C
ν=1
I
−
C
pν ∆qν − H∆t
l
X
ν=1
!
qν ∆pν − H∆t
(9.143)
!
(9.144)
de (9.144) se sigue que:
∆F = C
∆F = C
−
l
X
ν=1
l
X
ν=1
∆F = C
−
qν ∆pν − H∆t
!
−
qν ∆pν − H∆t
!
pν ∆qν − H∆t
l
X
ν=1
!
−
l
X
ν=1
−
−
l
X
ν=1
−
pν ∆q ν − H∆t
!
(9.145)
q ν ∆pν − H∆t
!
(9.146)
l
X
ν=1
q ν ∆pν − H∆t
!
(9.147)
Las transformaciones canónicas libres. En el conjunto de todas las transformaciones canónicas hay una clase que se puede caracterizar por la siguiente propiedad:
su función generatriz puede expresarse como una función de un conjunto de (2l) variables independientes que pueden ser (q q), (q p), (p q) o (p p). A estas transformaciones las
llamaremos transformaciones canónicas libres de la primera, segunda, tercera y cuarta
Las transformaciones canónicas / 347
clase respectivamente. Es posible que una transformación canónica dada sea a la vez
canónica libre de más de una clase.
En (3.20) encontramos transformaciones canónicas libres de la primera clase.
Ejemplo 9.5.1 Demostrar que la transformación canónica (4.134), para l = 1, es libre
de primera clase:
1
p
p2
2
p = mω q +
; q = −tan−1
(9.148)
2
mω 2
mωq
Las fórmulas de transformación pueden escribirse en la forma:
p = mωq tan q ;
p=
1
mωq 2 sec2 q
2
o sea que es libre de la primera clase. También se puede escribir como:
s
r
mωq 2
2p
−1
q = cos
; p = −mω
− q2
2p
mω
(9.149)
(9.150)
o sea que también es libre de la segunda clase. Es fácil ver que también es libre de tercera
y cuarta clase.
Ejemplo 9.5.2 Demostrar que la transformación identidad es canónica de segunda y
tercera clase pero no es de primera ni de cuarta clase.
La transformación identidad es:
q ν = qν ;
pν = pν ;
ν = 1, 2, ...l
(9.151)
Esta transformación puede escribirse en cualquiera de las formas siguientes:
qν =
qν ; pν = pν
qν =
q ν ; pν = pν ;
(9.152)
ν = 1, 2, ...l
o sea que sólo es posible tomar independientes a (q, p) o a (q, p). Esta transformación es
canónica de segunda y tercera clase pero no es de primera ni de cuarta clase.
Ejemplo 9.5.3 Mostrar que la transformación que intercambia coordenadas y momentos
y cambia de escala, es libre de primera y cuarta clase pero no de segunda ni de tercera
clase:
qν =
pν =
1
p
β ν
αpν ;
qν =
βqν ;
1
pν = q ν ;
α
(9.153)
ν = 1, 2, ...l
Ejemplo 9.5.4 Mostrar que la transformación canónica q = −αp/q, p = q 2 /2α, con
l = 1, es una transformación canónica libre de primera y de cuarta clase pero no de
segunda ni de tercera clase:
348 / Mecánica clásica avanzada
q=
αp
;
−√
2αp
p=
q2
;
2α
q=
p
2αp
(9.154)
qq
p=−
α
Las transformaciones canónicas libres de primera clase se caracterizan porque (p, p)
se pueden expresar en función de (q, q). Esto dice que las (p) dependen de (q), o sea que:
q 1 , q 2 , ...q l
6= 0
(9.155)
J
p1 , p2 , ...pl
En este caso la función generatriz F (q, p, t) puede representarse mediante una función de (q, q) que llamaremos F1 :
F (q, p, t) = F1 (q, q, t)
(9.156)
De (9.135) y (9.156) se sigue que:
∆F1 (q, q, t) = C
l
X
ν=1
pν ∆qν − H∆t
!
−
l
X
ν=1
pν ∆q ν − H∆t
!
(9.157)
Como para estas transformaciones ∆qν y ∆q ν son todos independientes se sigue
entonces que:
∂F1
= Cpν ;
∂qν
∂F1
= −pν ;
∂qν
ν = 1, 2, ...l
∂F1
= H − CH
∂t
(9.158)
(9.159)
Las ecuaciones (9.158) definen la transformación canónica bajo consideración, esto
es, ellas pueden reducirse a la forma (9.124). Con ello probaremos que toda transformación canónica libre de primera clase define una función F1 (q, q, t) y que a cada función
F1 (q, q, t) le corresponde una transformación canónica libre de primera clase. Debemos
mostrar que es posible resolver las ecuaciones (9.158) para expresar a (q, p) en función
de (q, p).
Empecemos por mostrar que todas las derivadas parciales ∂F1 /∂qν son independientes. Supongamos que no lo fueran, es decir, que pudiéramos encontrar una expresión
para una de ellas en función de las demás. Ello requerirı́a que exista una función Ω
diferente de cero tal que:
∂F1
∂F1 ∂F1
(9.160)
,
, ...
, q1 , q2 , ...ql = 0
Ω
∂q1 ∂q2
∂ql
donde en (9.160) los (q) son tomados como parámetros. De (9.158) se sigue:
Ω(Cp1 , Cp2 , ...Cpl , q1 , q2 , ...ql ) = 0
(9.161)
como (q, p) son cantidades independientes, se sigue de (9.161) que Ω ≡ 0 y en consecuencia las ∂F1 /∂qν son independientes, consideradas como funciones de las variables
Las transformaciones canónicas / 349
q 1 , q 2 , ...q l . Que las l cantidades independientes ∂F1 /∂qν sean funciones de las l cantidades independientes q ν se expresa diciendo que el jacobiano de esas funciones no es
idénticamente cero:
2 ∂ F1
∂F1 /∂~q
6= 0
(9.162)
= det
J
q
~
∂~q ∂~q
De la desigualdad (9.162) se sigue que las primeras l ecuaciones (9.158) pueden
resolverse para las q ν , con lo cual todas las nuevas variables de fases q ν , pν (ν = 1, 2, ...l)
pueden expresarse en función de las viejas variables qν , pν (ν = 1, 2, ...l). La ecuación
(9.162) también permite que en (9.158) las l últimas ecuaciones sean resueltas para qν en
función de las q ν , pν . En conclusión, las ecuaciones (9.158) definen una transformación
canónica libre de primera clase con función generatriz y valencia dadas, F1 y C 6= 0,
en tanto que la fórmula (9.159) permite relacionar las funciones hamiltonianas H y H,
que serán proporcionales sólo en el caso en que la transformación canónica no dependa
explı́citamente del tiempo.
Podemos decir que la clase de las transformaciones canónicas libres de primera
clase se puede obtener hallando todas las funciones generatrices F1 que satisfacen la
condición (9.162) y las diferentes valencias C 6= 0, y usando las fórmulas (9.158).
Para las transformaciones canónicas libres de primera clase univalentes (C = 1),
(9.158) y (9.159) toman la forma más simple:
∂F1
∂F1
∂F1
= pν ;
= −pν ; ν = 1, 2, ...l ; H = H +
∂qν
∂qν
∂t
(9.163)
La última ecuación (9.163), dice que H − H no depende del sistema hamiltoniano
especı́fico que se tenga sino simplemente de cuál es la transformación canónica, que
puede ser definida sin hacer referencia a la forma del hamiltoniano.
La discusión de los otros tipos de transformaciones canónicas libres es completamente análoga a la de las transformaciones canónicas libres de primera clase. Las
fórmulas son las siguientes, que se obtienen usando las formas (9.145), (9.146) y (9.147)
para la función generatriz. En las Transformaciones Canónicas (T.C.) libres de segunda
clase (q, p) son independientes, luego:
!
~p
J
6= 0
(9.164)
p~
Como (q, p) son independientes, (9.146) permite escribir:
∂F2
∂F2
= Cpν ;
= q ν ; ν = 1, 2, ...l
∂qν
∂pν
(9.165)
∂F2
= H − CH
∂t
(9.166)
donde F2 es función de (q, p, t) y satisface la condición:
2 ∂ F2
6= 0
det
∂~q ∂~p
(9.167)
350 / Mecánica clásica avanzada
En las T.C. libres de tercera clase (p, q) son independientes, luego:
!
~q
6= 0
J
q
~
(9.168)
como (p, q) son independientes, (9.145) permite escribir:
∂F3
∂F3
= −Cqν ;
= −pν ; ν = 1, 2, ...l
∂pν
∂qν
(9.169)
∂F3
= H − CH
∂t
(9.170)
donde F3 es función de (p, q, t) y satisface la condición:
2 ∂ F3
6= 0
det
∂~
p ∂~q
En las T.C. libres de cuarta clase (p, p) son independientes, luego:
!
~p
J
6= 0
q
~
(9.171)
(9.172)
Como (p, p) son independientes, (9.147) permite escribir:
∂F4
= −Cqν ;
∂pν
∂F4
= qν ;
∂pν
ν = 1, 2, ...l
∂F4
= H − CH
∂t
donde F4 es función de (p, p, t) y satisface la condición:
2 ∂ F4
6= 0
det
∂~
p ∂~p
(9.173)
(9.174)
(9.175)
Se tienen, pues, 4l cantidades no independientes (q, p, q, p) de las cuales, además de
(q, p) y (q, p), se pueden extraer conjuntos de variables independientes (q, q), (q, p), (p, q),
(p, p). En cada uno de estos cuatro casos decimos que la transformación canónica es libre.
Una transformación canónica arbitraria es no libre y obedece fórmulas de transformación
en términos de una función generatriz que veremos más adelante y de las cuales (9.158)
y (9.164) a (9.175) no son más que casos particulares.
Ejemplo 9.5.5 Hallar la función generatriz del tipo F2 para la transformación canónica
(9.148).
Usando (9.146) y (9.150) obtenemos:
∆F2 = C(p ∆q − H ∆t) − (−q ∆p − H ∆t) = Cp ∆q + q ∆p
(9.176)
Las transformaciones canónicas / 351
La última igualdad en (9.176) se sigue de que la transformación no depende del
tiempo. También:
s
r
2p
mωq 2
−1
∆F2 = C(−mω)∆q
− q 2 + ∆p cos
(9.177)
mω
2p
Como ∆F2 es exacto se sigue que ∂ 2 F2 /∂p ∂q = ∂ 2 F2 /∂q ∂p lo cual implica que la
transformación es univalente, o sea C = 1. La función generatriz es:
s
r
mωq 2
2p
1
−1
F2 (q, p) = p cos
− mωq
− q2
(9.178)
2p
2
mω
Para esta misma transformación se cumple que:
q=−
p
p2
cot q ; p =
csc2 q
mω
2mω
(9.179)
Entonces para una función generatriz del tipo F3 se cumple:
p
p2
∂F3
∂F3
=
cot q ;
=−
csc2 q
∂p
mω
∂q
2mω
(9.180)
donde hemos usado (9.169) con C = 1. Es claro que:
∆F3
=
=
1
(2p cot q ∆p − p2 csc2 q ∆q)
2mω
1 2
∆
p cotq
2mω
(9.181)
con lo cual:
F3 =
p2
cot q
2mω
(9.182)
similarmente hallamos para F4 :
F4 =
p2 p
p
2mωp − p2 + p sen−1 √
2mω
2mωp
(9.183)
En sı́ntesis, las funciones generatrices de la transformación canónica (3.107) son:
1
F1 = − mωq 2 tan q
2
s
r
mωq 2
2p
1
2
−1
− mωq
−1
F2 = p cos
2p
2
mωq 2
p2
cot q
F3 =
2mω r
s
p2
2mωp
p2
−1
−
1
+
F4 =
p
sen
2mω
p2
2mωp
(9.184)
352 / Mecánica clásica avanzada
Ejemplo 9.5.6 Hallar las funciones generatrices del tipo F2 y F3 para la transformación
canónica identidad.
Sabemos que no existen funciones del tipo F1 o F4 . La transformación no depende
del tiempo, luego, de (9.146) y (9.152):
∆F2 = C
l
X
pν ∆qν +
ν=1
l
X
q ν ∆pν = C
ν=1
l
X
pν ∆qν +
ν=1
l
X
qν ∆pν
(9.185)
ν=1
de la condición ∂ 2 F2 /∂qν ∂pµ = ∂ 2 F2 /∂pµ ∂qν se sigue que la transformación debe ser
univalente, en consecuencia:
∆F2 =
l
X
(pν ∆qν + qν ∆pν ) = ∆
ν=1
l
X
q ν qν
(9.186)
ν=1
Por tanto:
F2 =
l
X
pν qν
(9.187)
ν=1
Similarmente:
F3 = −
l
X
q ν pν
(9.188)
ν=1
Ejemplo 9.5.7 Hallar las funciones generatrices del tipo F1 y F4 para la transformación
canónica de cambio de escala e intercambio de coordenadas y momentos (9.153).
Sabemos que F2 y F3 no existen para esa transformación. El resultado es:
C = −α β ;
C = −α β ;
F1 = −β
F4 = α
l
X
q ν qν
(9.189)
ν=1
l
X
pν pν
(9.190)
ν=1
Ejemplo 9.5.8 Hallar las funciones generatrices de la transformación de cambio de escala:
q ν = αqν ; pν = βpν
C = α β ; F2 = α
l
X
pν qν
(9.191)
ν=1
C = α β ; F3 = −β
l
X
ν=1
q ν pν
(9.192)
Las transformaciones canónicas / 353
Ejemplo 9.5.9 Sea una transformación canónica libre de primera clase (q, p) → (q, p)
con generatriz F1 (q, q, t). Mostrar que la transformación inversa (q, p) → (q, p) también
es canónica, y hallar la correspondiente función generatriz.
La transformación original satisface:
!
l
X
∆F1 = C
pν ∆qν − H ∆t −
ν=1
l
X
ν=1
pν ∆q ν − H ∆t
!
∂F1
∂F1
∂F1
= Cpν ;
= −pν ; ν = 1, 2, ...l ;
= H − CH
∂qν
∂qν
∂t
(9.193)
(9.194)
La desigualdad (9.162) garantiza que las dos últimas ecuaciones (9.194) se pueden
resolver para (q) en función de (p), tomando (q) como parámetros, con lo cual se pueden
expresar (p, q) en función de (q, p), o sea que las ecuaciones (9.124) se pueden invertir.
Esto prueba que la transformación inversa existe, la cual además es canónica. Para la
transformación inversa:
!
!
l
l
X
X
i
i
pν ∆q ν − H ∆t −
pν ∆qν − H ∆t
(9.195)
∆F1 = C
ν=1
ν=1
∂F1i
∂F1i
= C i pν ;
= −pν ;
∂q ν
∂qν
ν = 1, 2, ...l ;
∂F1i
= H − CiH
∂t
(9.196)
comparando (9.194) y (9.196) vemos que:
−
∂F1i
1 ∂F1
=
;
∂qν
C ∂qν
−
∂F1
1 ∂F1i
= i
∂qν
C ∂qν
Ci
∂F1
∂F1i
+
∂t
∂t
= (−CC i + 1)H
C
∂F1i ∂F1
+
∂t
∂t
= (−CC i + 1)H
(9.197)
De (9.197) se sigue que:
F1 = −CF1i ;
F1i = −C i F1 ;
Ci =
1
C
(9.198)
1
F1 (q, q, t) ;
C
Ci =
1
C
(9.199)
o más explı́citamente:
F1i (q, q, t) = −
Para una transformación canónica libre univalente de primera clase se cumple
simplemente:
F1i (q, q, t) = −F1 (q, q, t)
(9.200)
354 / Mecánica clásica avanzada
o sea que la función generatriz de la transformación canónica inversa es el negativo de
la función generatriz de la T.C. original. Para una transformación canónica arbitraria,
se cumplen las expresiones siguientes para las funciones generatrices F y F i , aunque no
se cumplen las fórmulas (9.194) y (9.196):
!
!
l
l
X
X
∆F (q, p, t) = C
pν ∆q ν − H ∆t
(9.201)
pν ∆qν − H ∆t −
ν=1
i
∆F (q, p, t) =
C
i
l
X
ν=1
ν=1
pν ∆q ν − H ∆t
!
l
X
−
ν=1
pν ∆qν − H ∆t
La ecuación (9.202) también se puede escribir como:
!
l
1 X
1
i
− i ∆F (q, p, t) =
pν ∆qν − H ∆t −
C
C i ν=1
l
X
ν=1
!
(9.202)
!
pν ∆q ν − H ∆t(9.203)
de donde se llega al resultado general:
F i (q, p, t) = −
1
1
F (q, p, t) ; C i =
C
C
(9.204)
Ejemplo 9.5.10 Mostrar que el resultado de dos transformaciones canónicas sucesivas es
una transformación canónica.
El generador de la transformación resultante es la suma de los generadores de las
transformaciones separadas. Si las transformaciones son libres de primera clase:
(a+b)
F1
(a)
(b)
(q, q, t) = F1 (q, q, t) + F1 (q, p, t)
(9.205)
donde a es la transformación (q, p) → (q, p) y b es la transformación (q, p) → (q, p); a + b
representa la transformación combinada (q, p) → (q, p).
Ejemplo 9.5.11 Mostrar que la realización de tres transformaciones canónicas sucesivas
es asociativa.
Para transformaciones libres de primera clase esto se expresa ası́:
(a+b)+c
a+(b+c)
q, q, t
q, q, t = F1
F1
lo que se sigue de la propiedad (9.205):
a+(b+c)
(a)
(b+c)
q, q, t = F1 (q, q, t) + F1
F1
q, q, t =
(a)
F1 (q,
q, t) +
donde c es la transformación (q, p) → (q, p).
(b)
F1
q, q, t +
(c)
F1
q, q, t
(9.206)
(9.207)
Las transformaciones canónicas / 355
Las ecuaciones (9.205), (9.206) y (9.207) valen también para transformaciones
canónicas arbitrarias.
Significado de la valencia de una transformación canónica. Sea la transformación de cambio de escala (9.191) y una transformación canónica univalente arbitraria.
Si esas dos transformaciones se realizan en sucesión, las respectivas funciones generatrices se pueden escribir como:
∆Fc.e. = αβ
l
X
ν=1
∆Fµ.v. =
l
X
ν=1
pν ∆qν − H ∆t
pν ∆q ν − H ∆t
!
!
−
−
l
X
ν=1
l
X
ν=1
pν ∆q ν − H ∆t
pν ∆q ν − H ∆t
!
!
(9.208)
(9.209)
Entonces la propiedad (9.205), permite escribir para la función generatriz de la
transformación completa:
∆Fµ.v. = αβ
l
X
ν=1
pν ∆qν − H ∆t
!
−
l
X
ν=1
pν ∆q ν − H ∆t
!
(9.210)
O sea que cualquier transformación canónica no univalente puede suponerse compuesta de una transformación de cambio de escala donde c = αβ seguida de una transformación univalente. Lo anterior permite que en la práctica se usen sólo las transformaciones canónicas univalentes.
El grupo de las transformaciones canónicas. El conjunto de todas las transformaciones canónicas de un sistema de l grados de libertad es un conjunto infinito no
contable. Este conjunto posee la estructura algebraica de grupo:
(i) Hay una ley de composición interna, mediante la cual a dos transformaciones canónicas se les puede asociar una tercera; es decir, está definida la suma de dos
transformaciones canónicas para dar una transformación canónica, ecuación (9.205).
(ii) Existe la transformación canónica identidad, ecuación (9.189).
(iii) La transformación inversa de una transformación canónica dada existe y es
canónica, (9.204).
(iv) La realización de transformaciones canónicas sucesivas es asociativa, (9.206).
Por todo lo anterior podemos decir que la forma de las ecuaciones canónicas es
invariante con respecto al grupo de las transformaciones canónicas. La integral de Poincaré-Cartán, las integrales invariantes de Poincaré, los corchetes de Poisson y otras
cantidades también poseen esta propiedad de invariancia bajo el grupo de las transformaciones canónicas.
Relación entre las diferentes funciones generatrices de transformaciones
canónicas libres. Interpretación en términos de transformaciones de Legendre. En la sección (4.1) se definió la transformación de Legendre. Sea una transformación
356 / Mecánica clásica avanzada
canónica libre de primera clase, univalente, las fórmulas de transformación se obtienen
de:
pν =
∂F1
∂F1
; −pν =
; ν = 1, 2, ...l
∂qν
∂qν
(9.211)
Usando la notación de la sección 4.1, sea (x) = (q); (α) = (q, t); (y) = (p) y
X = F1 . Entonces (9.211) se pueden escribir como:
yν =
∂X
∂X
∂X(x, α)
; −pν =
; H −H =
∂xν
∂q ν
∂t
(9.212)
Podemos interpretar, pues, a F1 , como el generador de la transformación de Legendre (q) → (p). El generador de la transformación de Legendre inversa, (y) → (x) es
Y (y, α), tal que:
Yν =
l
X
ν=1
xν yν − X ; xν =
∂Y
∂yν
(9.213)
donde además se satisface:
∂Y
∂X
∂Y
∂X
=−
→
=−
;
∂αi
∂αi
∂q ν
∂qν
∂X
∂Y
=−
∂t
∂t
(9.214)
∂Y
∂t
(9.215)
se cumple, pues, que:
qν =
∂Y
;
∂pν
−pν = −
∂Y
;
∂qν
H −H =−
Si llamamos Y = −F 3(p, q, t), las ecuaciones (9.215) quedan ası́:
qν = −
∂F3
;
∂pν
pν = −
∂F3
;
∂qν
H −H =−
∂F3
∂t
(9.216)
que coinciden con las fórmulas (9.168) a (9.171). En conclusión, F1 y F3 están relacionadas mediante una transformación de Legendre:
F3 = F1 −
l
X
pν qν
(9.217)
ν=1
Con argumentos completamente análogos llegamos a:
F2 = F1 +
l
X
q ν pν
l
X
q ν pν −
(9.218)
ν=1
F4 = F1 +
ν=1
l
X
qν pν
(9.219)
ν=1
Ejercicio 9.5.1 Usar las relaciones (9.217), (9.218) y (9.219) para obtener a F2 , F3 y F4
a partir de F1 para un oscilador armónico lineal. Comparar con las fórmulas (9.184).
Las transformaciones canónicas / 357
Ejemplo 9.5.12 Verificar las expresiones (9.187) y (9.188) usando la transformación de
legendre:
F3 = F2 −
l
X
ν=1
q ν pν −
l
X
pν qν
(9.220)
ν=1
Usando (9.187) obtenemos:
F3
l
X
=
ν=1
l
X
=
ν=1
(pν qν − q ν pν − pν qν )
(pν q ν − q ν pν − pν q ν ) =
l
X
ν=1
−q ν pν
(9.221)
en efecto, (9.221) coincide con (9.188).
Notación de las funciones generatrices. Corben-Stehle usan la siguiente notación para las funciones generatrices de las T.C. libres F1, 2, 3, 4 de Goldstein:
F1 = φ(q, q, t)
F2 = ψ ′ (q, p, t)
(9.222)
F3 = ψ(q, p, t)
F4 = φ′ (q, p, t)
Landau usa F1 = F y F2 = Φ.
Las transformaciones puntuales. Una transformación de coordenadas llamada
transformación puntual, puede escribirse como una transformación canónica.
Las nuevas coordenadas son funciones de las viejas coordenadas pero no de los viejos
momentos. Entonces en una transformación puntual pueden tomarse como independientes (p, q) o (p, q), o sea que una transformación puntual es libre de segunda y de tercera
clase. Puede expresarse en las siguientes formas:
q ν = fν (q, t) ;
pν =
∂F2
;
∂qν
qν = −
∂F3
;
∂pν
pν = gν (q, p, t)
qν =
∂F2
∂pν
pν = −
∂F3
∂q ν
(9.223)
(9.224)
(9.225)
Se requiere entonces que F2 y F3 sean de la forma:
F2 =
l
X
ν=1
fν (q, t)pν
(9.226)
358 / Mecánica clásica avanzada
F3 = −
l
X
fν−1 (q, t)pν
(9.227)
ν=1
donde fν−1 son las funciones inversas a fν , o sea, qν = fν−1 (q, t). Entonces se tiene para
pν y pν :
pν =
l
X
∂fµ (q, t)
pν
∂qν
µ=1
pν =
l
X
∂fµ−1 (q, t)
pµ
∂q ν
µ=1
(9.228)
(9.229)
Según lo anterior es claro que (p) y (p) estarán conectados por una transformación
lineal que depende de las coordenadas que llamaremos T̃ de modo que en forma de
matrices y vectores l-dimensionales (9.228) y (9.229) toman la forma:
p = T̃ (q, t)~p ; ~p = T̃ −1 (q, t)~
~
p
Tµν =
−1
∂fµν
∂fν
−1
; Tµν
=
∂qµ
∂qµ
(9.230)
(9.231)
Por poderse expresar en términos de funciones generatrices, la transformación puntual es canónica. Entonces, tanto las ecuaciones de Hamilton como las de Lagrange son
covariantes bajo transformaciones puntuales. Las ecuaciones (9.223) y (9.228) pueden
tomarse como las fórmulas de una transformación canónica puntual.
Ejemplo 9.5.13 Sea un sistema de tres grados de libertad y la transformación de coordenadas cartesianas a coordenadas esféricas. Expresar esta transformación como transformación canónica.
La transformación es:
p
r = x2 + y 2 + z 2 = fr (q)
z
θ = cos−1 p
= fθ (q)
2
x + y2 + z 2
φ = tan−1
(9.232)
y
= fθ (q)
x
x = r senθ cos φ = fx (q)
y = r senθ senφ = fy (q)
z = r cos θ = fz (q)
(9.233)
Las transformaciones canónicas / 359
donde tomamos a (q) = (x, y, z) y (q) = (r, θ, φ). Además usamos la notación (fν−1 ) =
(fx , fy , fz ). La función generatriz F2 , de acuerdo con (9.226) y (9.232) es:
F2 (q, p) =
=
pr f r + pθ f θ + pφ f φ
p
z
x2 + y 2 + z 2 + p2θ cos−1 p
2
x + y2 + z 2
−1 y
+pφ tan
x
pr
(9.234)
Similarmente para F3 (q, p) tenemos:
F3 (q, p) =
=
−px fx − py fy − pz fz
(9.235)
−px r senθ cos φ − py rsenθ senφ − pz r cos θ
Usando (9.228) junto con (9.234) y (9.235) obtenemos las siguientes fórmulas para
la transformación de los momentos:
y
xz
x
pr − 2
pθ
p +p
px = p
2 φ
2
2
2
2
2
x
+
y
x +y +z
x + y (x2 + y 2 + z 2 )
x
y
yz
pr + 2
pθ
py = p
pφ + p
2
x +y
x2 + y 2 + z 2
x2 + y 2 (x2 + y 2 + z 2 )
(9.236)
p
x2 + y 2
pr − 2
px = p
pθ
2
2
2
x + y2 + z 2
x +y +z
z
y similarmente:
pr =
px senθ cos φ + py senθ senφ + pz cos θ
pθ =
px r cos θ cos φ + py r cos θ senφ − pz r senθ
pr =
−px r senθ senφ + py rsenθ cos φ
(9.237)
Notemos que:
p~2 = p2x + p2y + p2z = p2r +
p2φ
p2θ
+
r2 sen2 θ
r2
Expresadas en términos de r, θ, φ, las matrices T̃ y T̃ −1 son:


senφ
1
cos
θ
cos
φ
−
senθ
cos
φ

r
r senθ 






cos
φ
1

 senθ senφ
cos θ senφ
T̃ (q) = 
r
r senθ 






1


0
cos θ
− senθ


r
(9.238)
(9.239)
360 / Mecánica clásica avanzada
T̃
−1

senθ cos φ


(q) = 
 r cos θ cos φ

−r senθ senφ
cos θ senφ
r cos θ senφ
r senθ cos φ
cos θ



−r senθ 


0
(9.240)
˜ Sin embargo T̃ −1 6= T̃ T , o sea que
Se ve, como debe ser, que T̃ T̃ −1 = T̃ −1 T̃ = I.
la transformación de los momentos no es ortogonal.
Transformación puntual lineal. En este caso se tiene:
qν =
l
X
Sνµ qµ + bν = fν (q, t)
(9.241)
ν=1
donde asumimos que Sνµ y bν pueden depender explı́citamente del tiempo, aunque
obviamente no dependen de (q) ni de (p).
La transformación inversa es:
qν =
l
X
ν=1
−1
Sνµ
q µ − bµ = fν−1 (q, t)
(9.242)
−1
donde Sνµ
es la matriz inversa de Sνµ . Las funciones generatrices F2 (q, p, t) de la transformación, y −F2 (q, p, t) = F3 (q, p, t) de la transformación inversa son:
F2 (q, p, t) =
l
X
Sµν pµ qν +
µ,ν=1
F2 (q, p, t) = −
l
X
l
X
b ν pν
(9.243)
ν=1
µ,ν=1
−1
Sµν
q µ − b µ pν
(9.244)
La relación entre los momentos también será lineal:
pν =
l
X
Sµν pµ ;
pν =
l
X
−1
Sµν
pµ
(9.245)
µ=1
µ=1
La “representación” de las coordenadas y la “representación” de los
momentos. La transformación (q, p) → (p, −q) es canónica. De acuerdo con (9.189)
puede ser generada por las funciones generatrices.
F1 (q, q) =
l
X
ν=1
q µ qν ; F4 (p, p) =
l
X
pµ pν
(9.246)
ν=1
Como la transformación no depende del tiempo, H = H:
H(q, p, t) = H(q, p, t) = H(−p, q, t)
(9.247)
Las transformaciones canónicas / 361
Ası́ por ejemplo, para un oscilador armónico lineal:
H(q, p, t) =
1 2 k 2
q + p
2m
2
(9.248)
Ciertamente en el formalismo hamiltoniano las ecuaciones de movimiento son covariantes. El contenido de esta transformación es el siguiente: en el espacio de configuración
el estado del sistema se puede representar mediante dos puntos, o equivalentemente, mediante las coordenadas y velocidades generalizadas; la transformación nos dice que en
el espacio de momentos también está toda la información requerida para describir el
estado; en el espacio de momentos el estado se puede representar entonces mediante los
momentos generalizados y sus derivadas temporales.
Hallemos las ecuaciones de lagrange en el espacio de los momentos. Partimos de
P
l
L = ν=1 pν q̇ν − H y usamos la transformación canónica generada por (9.246):
!
l
l
l
l
X
X
X
X
pν q̇ν +
pν q̇ ν − H −
pν q̇ ν
(9.249)
L=
pν q̇ν − H =
ν=1
ν=1
ν=1
ν=1
El nuevo lagrangiano L estará entonces relacionado con L por:
L=
l
X
ν=1
pν q̇ ν − H = L −
l
X
ν=1
l
d X
pν qν
pν q̇ν − pν q˙ν = L −
dt ν=1
(9.250)
Como L y L difieren por una derivada total respecto al tiempo, el principio de
Hamilton nos dice que las ecuaciones de movimiento son:
d ∂L(p, ṗ, t)
∂L(p, ṗ, t)
−
= 0 ; ν = 1, 2, ...l
∂pν
dt
∂ ṗν
(9.251)
lo cual coincide con el resultado (4.48) que se obtuvo con base en consideraciones sobre
las transformaciones de Legendre.
El paso del formalismo lagrangiano al hamiltoniano, sección 3.1, se realiza mediante
la transformación pν = ∂L(q, q̇, t)/∂ q̇ν , que se expresa en términos de transformaciones
de Legendre. Esta transformación tiene la forma de cierta transformación (p, q) → (p =
q̇, q) en el espacio de fases. Podrı́amos investigar si es una transformación canónica donde
los nuevos momentos sean las (q̇).
También la transformación puede escribirse en una forma tal que q ν = q̇ν ; que
es más útil en el contexto de las transformaciones canónicas pues permite interpretar
a L(q, q̇, t) = L(q, q, t) como la función generatriz del tipo F1 de cierta transformación
canónica. Es decir, L genera la transformación:
pν =
∂L(q, q, t)
∂L(q, q, t)
∂L(q, q, t)
; pν = −
; H −H =
∂qν
∂q ν
∂t
(9.252)
que equivale a la transformación (q, ṗ) ↔ (−p, q̇). H es el hamiltoniano en las variables
canónicas (q, ṗ) y H en las variables (−p, q̇). Si quisiéramos expresar esta transformación
mediante una función generatriz del tipo F4 (p, p, t), dada de acuerdo con (9.219) por
Pl
Pl
L(q, q, t)+ ν=1 (q ν pν −qν pν ) = L(q, q̇)− ν=1 (pν q̇ν +qν ṗν ), notamos que ese generador,
de acuerdo con (9.250), serı́a precisamente la función que llamamos L(p, ṗ, t).
362 / Mecánica clásica avanzada
Ejercicio 9.5.2 Hallar los hamiltonianos y las ecuaciones de movimiento que corresponden a los conjuntos de variables canónicas (q, ṗ) y (−p, q̇).
Ejercicio 9.5.3 Analizar la transformación (q, p) ↔ (q, q̇) como una transformación en
el espacio de fases, e investigar si es canónica. De serlo hallar la correspondiente función
generatriz.
La función generatriz de una transformación canónica arbitraria. En
general, una transformación canónica es no libre, o sea que no se puede describir mediante
funciones generatrices del tipo F1, 2, 3, 4 . Ası́ por ejemplo para un sistema de dos grados
de libertad la transformación:
q 1 = q1 , p1 = p1 , q 2 = p2 , p2 = −q2
(9.253)
es canónica pero no se puede describir mediante una función generatriz de una transformación canónica libre, pues involucra una mezcla de los cuatro tipos. El tratamiento de
estas transformaciones se basa en el lema de Carathéodory, cuya demostración está dada
en el texto de Gantmacher, Lectures in analytical mechanics, sección 29. El enunciado
del lema es el siguiente.
Lema. Si hay 2l funciones independientes q 1 , q 2 , ...q l , p1 , p2 , ...pl de las 2l cantidades independientes q1 , q2 , ...ql , p1 , p2 , ...pl , entonces del conjunto de 4l cantidades
qν , pν , q ν , pν (ν = 1, 2, ...l) siempre es posible escoger 2l cantidades independientes de
tal manera que no hay ni un sólo par de cantidades conjugadas (qν , pν ) o (q ν , pν ) entre
ellas. Tenemos entonces que de las 4l cantidades qν , pν , q ν , pν (ν = 1, 2, ...l) que están
conectadas mediante la transformación canónica:
~q , ~p
) 6= 0
(9.254)
q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l ; J(
q, p
es posible tomar las siguientes 2l cantidades independientes:
q1 , q2 , ...qr , pr+1 , pr+2 , ...pl , q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl
(9.255)
0 ≤ r ≤ l, 0 ≤ s ≤ l
donde, de acuerdo con el lema de Carathéodory no hay ni un par de variables canónicamente conjugadas. Como la transformación es canónica existe cierta función F (q, p, t)
tal que:
!
!
l
l
X
X
∆F = C
pν ∆q ν − H ∆t
(9.256)
pν ∆qν − H ∆t −
ν=1
ν=1
de acuerdo con (9.136). Es claro que igualmente podrı́amos haber usado cualquiera de
las expresiones (9.145), (9.146) o (9.147), obteniéndose cuatro expresiones para F que
sólo difieren por una transformación de Legendre. La expresión (9.256) usando (9.255)
se puede separar ası́:
∆F = C
r
X
ν=1
pν ∆qν +C
l
X
ν=r+1
pν ∆qν −
s
X
ν=1
pν ∆q ν −
s
X
ν=s+1
pν ∆q ν + H − H ∆t
(9.257)
Las transformaciones canónicas / 363
Usando las siguientes expresiones:
l
X
l
X
pν ∆qν = ∆
pν qν
ν=r+1
ν=r+1
l
X
l
X
pν ∆q ν = ∆
ν=s+1
!
pν q ν
ν=s+1
!
−
∆
F+
ν=s+1
C
r
X
q ν pν − C
pν ∆qν −
ν=1
l
X
−
qν pν
ν=r+1
l
X
qν ∆pν
ν=r+1
ν=s+1
l
X
q ν ∆pν
(9.258)
ν=s+1
!
=
!
l
l
X
X
+ − pν ∆q ν +
q ν ∆pν
ν=1
qν ∆pν
ν=r+1
podemos escribir a (9.257) como:
l
X
l
X
!
+ H − CH ∆t
(9.259)
según (9.255), ∆qν (ν = 1, 2, ...r), ∆pν (ν = r + 1, r + 2, ...r), ∆q ν (ν = 1, 2, ...s),
∆pν (ν = s + 1, s + 2, ...l) son independientes y por tanto:
C pν
=
−C qν
=
qν
=
−pν
=
H − CH =
∂U
;
∂qν
∂U
;
∂pν
∂U
;
∂pν
∂U
;
∂qν
ν = 1, 2, ...r
ν = r + 1, r + 2, ...l
ν = s + 1, s + 2, ...l
ν = 1, 2, ...s
∂U
∂t
(9.260)
donde U es función de las cantidades (9.255) y está definida por:
U =F+
l
X
ν=s+1
q ν pν − C
l
X
pν qν
(9.261)
ν=r+1
Las fórmulas (9.260) son equivalentes a las fórmulas (9.254) y determinan la transformación canónica por medio de la valencia C y la función generatriz U de las variables
independientes (9.255).
Las fórmulas (9.260) relacionan el conjunto de variables independientes (9.255) con
el siguiente conjunto de variables independientes complementarias:
p1 , p2 , ...pr , qr+1 , qr+2 , ...ql , p1 , p2 , ...ps , q s+1 ; q s+2 , ...q l
(9.262)
0 ≤ r ≤ l, 0 ≤ s ≤ l
364 / Mecánica clásica avanzada
El jacobiano de las variables p1 , p2 , ...ps , q s+1 , q s+2 , ...q l respecto a las variables
q1 , q2 , ...qr , pr+1 , pr+2 , ...pl es diferente de cero. Ese jacobiano puede escribirse como:


∂~ps
∂~ps
!
 ∂~qr
∂~pl−r 
~ps , ~q l−s




= det 
J

qr , p~l−r
~
 ∂~q l−s ∂~q l−s 
∂~qr
∂~pl−r


2
∂2U
∂ U
−
−
 ∂~qr ∂~q
∂~pl−r ∂~q s 
s



(9.263)
= det 




∂2U
∂2U
∂~qr ∂~pl−s ∂~pl−r ∂~pl−s
donde ~ps es el vector p1 , p2 , ...ps . p~l−r es el vector pr+1 , pr+2 , ...pl , con significado análogo para los otros vectores que aparecen en (9.263). En vista de (9.263), las ecuaciones
(9.260) de la primera lı́nea pueden resolverse para expresar a q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl
en función de p1 , p2 , ...pr , qr+1 , qr+2 , ...ql . Después se reemplazan las expresiones obtenidas en las l ecuaciones de la segunda lı́nea de (9.260) para obtener las ecuaciones de
la transformación canónica (9.254). Las fórmulas de la transformación canónica inversa
pueden obtenerse de manera análoga mediante una función generatriz que depende de
las variables (9.262) en vez de las variables complementarias igual a (9.255), −C −1 U y
una valencia igual a C −1 .
Queda claro que las transformaciones canónicas libres resultan como casos particulares de la transformación canónica arbitraria, al definir apropiadamente los valores
de r y s.
9.6.
La ecuación de Hamilton-Jacobi
En la sección 3.4 hemos discutido la especificación del estado del sistema mediante
las constantes de movimiento. Por simplicidad estamos considerando que el sistema es
integrable y posse por lo tanto un conjunto de 2l constantes de movimiento uniformes.
El objetivo de la descripción clásica es encontrar a las variables de estado en función
del tiempo para cada valor de las constantes de movimiento, considerados como un
conjunto completo de variables dinámicas independientes. Si se quiere pueden tomarse
como constantes de movimiento los 2l valores iniciales de las variables de estado. La
solución estará dada por:
q = ~q(~
~
q0 , p~0 , t) ; p~ = ~p(~q0 , p~0 , t)
(9.264)
La ecuación (9.264) puede interpretarse como una transformación canónica de las variables ~
q0 , p~0 a las variables ~q, p~. En la sección 4.7 vimos que para un sistema conservativo
la acción coincide con el negativo de la función generatriz de la transformación canónica
de evolución temporal (9.264). Veamos que este resultado vale en general. En la sección
9.1 vimos que la diferencia de acción entre dos trayectorias rectas infinitesimalmente
Las transformaciones canónicas / 365
próximas, ∆S, cuyos puntos iniciales y finales están sobre ciertas curvas C1 y C2 respectivamente, del espacio de configuración, está dada por la ecuación (9.11),
!
!
l
l
X
X
∆S =
pν ∆qν − H ∆t
−
pν ∆qν − H ∆t
(9.265)
ν=1
C2
ν=1
C1
Describiendo la transformación canónica (9.264) mediante la función generatriz
(9.135) con C = 1 y tomando a (q, p) como las nuevas variables y a q0 , p0 , como las
viejas variables, obtenemos:
!
!
l
l
X
X
−∆F =
pν ∆qν − H ∆t −
(9.266)
pν0 ∆qν0 − H0 ∆t
ν=1
ν=1
Si en (9.265) definimos la curva C1 como el conjunto de puntos iniciales simultáneos,
t1 (α) = constante = t0 y dejamos a C2 arbitraria, entonces (9.265) tomará la forma:
∆S =
l
X
ν=1
pν ∆qν − H ∆t −
l
X
pν0 ∆qν0
(9.267)
ν=1
Las expresiones (9.266) y (9.267) coincidirán si la transformación canónica generada por F , (9.264), satisface:
−∆F − H0 ∆t = ∆S
(9.268)
Tomando H0 = 0 obtenemos F = −S. Además como ∂F/∂t = H − H0 se sigue que:
F = −S ; →
∂S
+H =0
∂t
(9.269)
El resultado (9.269) fue obtenido por Hamilton (1805-1865) en 1835, quien además
supuso que la transformación canónica (9.264), es libre de primera clase, con lo cual
(9.267) conduce a:
pν =
∂S
∂S
; pν0 =
;
∂qν
∂qν0
ν = 1, 2, ...l
(9.270)
Las fórmulas (9.270) conducen a la transformación canónica (9.264). 6 S se llama la
función principal de Hamilton (o simplemente acción de Hamilton). Que F = −S, sin emRt
bargo, no da un método para encontrar a F , puesto que para evaluar a S = t0 L(q, q̇, t) dt
se requiere conocer a q(t), q̇(t), o sea haber resuelto el problema, es decir conocer la
“transformación” (9.264). El resultado de Hamilton fue un cı́rculo vicioso: para escribir
a partir de (9.270) las ecuaciones (9.264) se requiere conocer la función principal de
Hamilton, y para evaluar esta función se requiere conocer la solución (9.264). La contribución de Jacobi (1804-1851), en 1837, fue romper este cı́rculo vicioso; mostró que al
resolver la ecuación diferencial que resulta de (9.269), llamada la ecuación de HamiltonJacobi, para obtener una función S mediante las fórmulas (9.270), se obtiene la solución
6 Es
una transformación canónica a unas variables donde el sistema está completamente en equilibrio;
su trayectoria de fases se reduce a un punto.
366 / Mecánica clásica avanzada
buscada (9.264).
La ecuación de Hamilton-Jacobi para la función principal de Hamilton.
Tratemos de hallar la transformación canónica libre univalente de primera clase que
transforma las ecuaciones de Hamilton:
q̇ν =
∂H
;
∂pν
ṗν = −
∂H
;
∂qν
ν = 1, 2, ...l
(9.271)
ν = 1, 2, ...l
(9.272)
en las ecuaciones de Hamilton:
q̇ ν =
∂H
;
∂pν
ṗν = −
∂H
;
∂qν
donde H sea idénticamente cero:
H ≡0
(9.273)
Las ecuaciones (9.272) y (9.273) conducen a la solución inmediata:
q ν = βν ;
pν = αν ;
ν = 1, 2, ...l
(9.274)
donde αν y βν son 2l constantes arbitrarias. En virtud de (9.158), las fórmulas de
transformación estarán dadas por:
∂S(q, β, t)
∂S(q, β, t)
= pν ;
= −αν ; ν = 1, 2, ...l
∂qν
∂βν
(9.275)
En tanto que por (9.159) y (9.273) S necesariamente satisface:
∂S
+H =0
∂t
(9.276)
La ecuación (9.276) junto con (9.275) nos da la siguiente ecuación diferencial en
derivadas parciales para S:
!
~ t)
~ t)
∂S(~q, β,
∂S(~
q, β,
(9.277)
+ H ~q,
∂t
∂~q
~ t)
La ecuación (9.277) se llama la ecuación de Hamilton-Jacobi.7 La solución S(~q, β,
de la ecuación de Hamilton-Jacobi con l constantes arbitrarias β1 , β2 , ...βl se llama la
integral completa de la ecuación de Hamilton-Jacobi si se cumple la condición:
det
∂2S
6= 0
~
∂~q ∂ β
(9.278)
La expresión (9.278) es equivalente a la (9.162) que es la condición necesaria
para que las ecuaciones (9.275) puedan resolverse para expresar a ~q, p~, en la forma
~ t); ~
~ t). Lo anterior constituye el teorema de Jacobi cuyo enunciado
q = ~q(~
~
α, β,
p = p~(~
α, β,
7 Ya
óptica.
en 1824 el mismo Hamilton halló una ecuación diferencial de esta forma en conexión con la
Las transformaciones canónicas / 367
~ t) es alguna integral completa de la ecuación de Hamiltones el siguiente: “si S(~
α, β,
Jacobi (9.277), entonces la solución para las variables de estado ~q y p~ del sistema puede
escribirse en la forma (9.275) para cualquier hamiltoniano H”.8 Según esto, en vez de
integrar directamente las ecuaciones de movimiento (9.271), que nos darán a ~q, p~, con 2l
constantes de integración arbitrarias, el teorema de Jacobi nos permite hacerlo encontrando la integral completa de la ecuación de Hamilton-Jacobi. Una integral completa
de la ecuación de Hamilton-Jacobi no es una solución más general de esta ecuación. Pero
en este contexto sólo es importante saber que existe una solución completa.
Hasta aquı́ no hemos impuesto ninguna restricción sobre las constantes αν , βν .
Si las escogemos de tal manera que coincidan con los valores iniciales de pν y qν obtendremos una solución completa que coincide con la acción principal de Hamilton –es
la función generatriz de la transformación inversa de (9.264)–. En este caso S coincide
con el generador de la transformación canónica de evolución hacia atrás en el tiempo,
pero para otra elección de las constantes αν , βν , la solución completa S de la ecuación de Hamilton-Jacobi no admite esta interpretación. En esto se basa el aporte de
Jacobi, quien no sólo rompió el cı́rculo vicioso que mencionamos antes sino que además
~ t)
mostró que cualquier solución completa de la ecuación (9.277) permite escribir a ~q(~
α, β,
~ t) en la forma (9.275) donde las βν son las constantes de integración de la ecuay ~q(~
α, β,
ción de Hamilton-Jacobi. Hay en efecto, un número infinito de integrales completas de
la ecuación de Hamilton-Jacobi.
Ejemplo 9.6.1 Formar la función principal de Hamilton para el movimiento de una
partı́cula en caı́da libre en presencia de la gravedad.
En este caso (tomando t0 = 0):
x = 0,
S=
y = 0,
Z t
0
1
z = z0 + ż0 t − gt2
2
1
mż 2 − mgz
2
dt
=
1
1
m ż02 t − ż0 gt2 + g 2 t3
2
3
1 2 1 3
−mg z0 t + ż0 t − gt
2
6
(9.279)
(9.280)
teniendo en cuenta que E = 1/2 mż02 + mgz0 :
1
S = −Et + mż02 t − mż0 gt2 + mgt3
2
y como:
ż0
t=
g
1−
s
2g
1 + 2 (z0 − z)
ż0
!
podemos escribir a S en la forma:
3/2
mż03
2g
S = −Et −
1 + 2 (z0 − z)
3g
ż
8 Este
(9.281)
(9.282)
(9.283)
enunciado constituye la contribución de Jacobi a este problema y fue publicado en el año 1837.
368 / Mecánica clásica avanzada
donde omitimos una constante. La expresión (9.283) también se puede escribir en términos de E como:
3/2
m 2
S(z, E, t) = −Et −
(E − mgz)3/2
(9.284)
3g m
que coincide con la ecuación (4.190), que fue obtenida integrando la ecuación de HamiltonJacobi.
Otras formas de la ecuación de Hamilton-Jacobi. Si queremos hallar una
transformación canónica libre univalente de segunda, tercera o cuarta clase que haga a
H idénticamente igual a cero, podemos emplear un procedimiento análogo al que nos
condujo a la ecuación (9.277) y también buscar una integral completa de la misma. Una
forma equivalente de hallar esas transformaciones es por medio de las fórmulas (9.217),
(9.218) y (9.219). Además son útiles:
F2 =
F1 +
l
X
q ν pν
l
X
q ν pν
ν=1
F4 =
F3 +
(9.285)
ν=1
La ecuación de Hamilton-Jacobi para las diferentes funciones generatrices de las
transformaciones canónicas libres que hacen a H idénticamente cero son:
!
~ t)
~ t)
∂F1 (~q, β,
∂F1 (~
q , β,
+ H ~q,
,t = 0
∂t
∂~q
∂F2 (~q, α
~ , t)
∂F2 (~
q, α
~ , t)
+ H ~q,
,t = 0
∂t
∂~q
~ t)
∂F3 (~
q , β,
+H
∂t
~ t)
∂F3 (~
p, β,
−
, p~, t
∂~p
!
(9.286)
=0
∂F4 (~
q, α
~ , t)
∂F4 (~q, α
~ , t)
+H −
, p~, t = 0
∂t
∂~p
Vemos que F1 y F2 satisfacen la misma ecuación diferencial, lo cual es consistente
con (9.285), esto es, F1 y F2 difieren por una constante aditiva. Similarmente F3 y F4
satisfacen la misma ecuación. F3 y F4 en la práctica son de poco interés en el método
de Hamilton-Jacobi puesto que las qν entran en la energı́a potencial que es una función
complicada y se hace por ello más difı́cil la separación de variables.
Es posible hallar la ecuación de Hamilton-Jacobi asociado a la transformación
canónica (9.260), lo cual se deja como ejercicio.
Ejemplo 9.6.2 El oscilador armónico lineal. Resolver la ecuación de Hamilton-Jacobi
y con ella hallar la solución a las ecuaciones de movimiento.
Las transformaciones canónicas / 369
El hamiltoniano es:
H=
p2
kq 2
+
2m
2
La ecuación de Hamilton-Jacobi (9.277) es:
2
∂S(q, β, t)
kq 2
∂S(q, β, t)
+
+
=0
∂t
∂q
2
(9.287)
(9.288)
Aquı́ podemos buscar una solución separando las variables q y t en la forma:9
S(q, β, t) = −ht + Σ(q, β)
(9.289)
donde h es la constante de Jacobi que en este caso coincide con la energı́a total E. Como
el sistema tiene sólo un grado de libertad hay sólo una constante de integración, por
tanto, podemos hacer h = E = β. Σ(q, E) será solución a la ecuación:
2
kq 2
1 d Σ(q, E)
+
=E
(9.290)
2m
dq
2
La ecuación (9.290) puede resolverse directamente:
r
√ Z q
2E
Σ(q, E) = mk
− q 2 dq
k
q0
(9.291)
No evaluaremos a (9.291) por cuanto el objetivo no es hallar a S sino, mediante
las fórmulas (9.275) encontrar a q y p en función del tiempo:
Z qr
√
2E
S(q, E, t) = Σ(q, E, t) = −Et + mk
− q 2 dq
(9.292)
k
q0
reemplazando a (9.292) en (9.275) obtenemos:
r
√
2E
∂S
p=
= mk
− q2
∂q
k
Z q
√
2/k
∂S
r
= −t + mk
−α =
∂E
2E
q0
2
− q2
k
(9.293)
(9.294)
La ecuación (9.294) se puede integrar directamente, incorporando la constante que
depende de q0 en α para obtener:
!
√
q
−1
(9.295)
−α = −t + mk sen p
2E/k
9 En
la sección 4.4 encontramos una segunda solución de esta ecuación en la cual las variables no
están separadas. Tal solución está dada por la ecuación (4.143).
370 / Mecánica clásica avanzada
La ecuación (9.295) nos da a q en función del tiempo y reemplazándolo en (9.293)
obtenemos a p en función del tiempo:
r
2E
sen ω(t − α)
q(E, α, t) =
k
(9.296)
√
p(E, α, t) =
2mE cos ω(t − α)
Vemos que, como β y α son cantidades canónicamente conjugadas, la energı́a E y
el tiempo α son un par de cantidades canónicamente conjugadas. E y α no coinciden
con las condiciones iniciales, aunque están relacionadas con ellas:
r
r
√
2E
k
q0 = −
sen ωα ; p0 = 2mE cos ωα ; ω =
(9.297)
k
m
Ejemplo 9.6.3 Comparar a S con la acción para el oscilador armónico:
Z
t
L dt =
t0
E
Z
t
t0
Z
t
t0
kq 2
p2
−
2m
2
dt =
[cos2 ω(t − α) − sen2 ω(t − α)] dt =
E
E
sen 2ω(t − α) −
sen 2ω(t0 − α)
2ω
2ω
Omitiendo la constante aditiva podemos escribir:
Z t
E
1
L dt → sen ω(t − α) cos ω(t − α) = mω 2 q 2 cot ω(t − α)
ω
2
t0
Evaluando a S en (9.292):
√
S = −Et + mk×
#
" r
2E
q
2E
1
−1
2
q
−q +
sen p
+ constante
2
k
k
2E/k
(9.298)
(9.299)
(9.300)
(9.301)
reemplazando a (9.296) en (9.301) y omitiendo una constante aditiva:
S = −Et +
1√
2mEq cos ω(t − α) + E(t − α)
2
1
⇒ S → mωq 2 cot ω(t − α)
2
(9.302)
Comparamos (9.300) y la parte final de (9.302) para encontrar el resultado que se
espera: la solución a la ecuación de Hamilton-Jacobi coincide con la integral de acción.
La ecuación de Hamilton-Jacobi independiente del tiempo. Si el sistema
es conservativo generalizado (puede ser esclerónomo, aunque no hay fuerzas disipativas
Las transformaciones canónicas / 371
y H no depende del tiempo explı́citamente) posee una constante de movimiento que es
la constante de Jacobi h, que coincide con la energı́a total cuando además el sistema es
esclerónomo –véase la ecuación (3.99)–. Entonces la ecuación de Hamilton-Jacobi (9.277)
tiene la forma:
!
~ t)
~ t)
∂S(~
q , β,
∂S(~
q , β,
=0
(9.303)
+H ~
q,
∂t
∂~q
Una solución completa puede escribirse en la forma:10
S(~
q , β1 , β2 , ...βl−1 , h, t) = −ht + Σ(~q, β1 , β2 , ...βl−1 , h)
(9.304)
donde β1 , β2 , ...βl−1 son constantes con valores arbitrarios. Reemplazando a (9.304) en
(9.303) y llamando β~l−1 a β1 , β2 , ...βl−1 obtenemos:
!
~l−1 , h)
∂Σ(~
q, β
H ~
q,
=h
(9.305)
∂~q
La integral completa de (9.305) satisface (9.278) es decir:
2 ∂ Σ
det
6= 0 (βl = h)
~
∂~q ∂ β
(9.306)
Conocida la solución de la ecuación de Hamilton-Jacobi independiente del tiempo
(9.305), la condición (9.306) permite obtener a qν y pν en función del tiempo (ν =
1, 2, ...l) a partir de las ecuaciones que corresponden a (9.275):
~l−1 , h
∂Σ ~
q, β
= pν ; ν = 1, 2, ...l
∂qν
(9.307)
~
∂Σ ~
q , βl−1 , h
= −αν ; ν = 1, 2, ...l − 1
∂βν
∂Σ(~
q , β~l−1 , h)
= t − αl
∂h
(9.308)
donde αν , βν , h, son constantes arbitrarias.
Usando las segundas l − 1 ecuaciones (9.307) podemos expresar a l − 1 coordenadas
en términos de la restante l-ésima coordenada y de las 2l − 1 constantes arbitrarias
~l−1 , h, α1 , α2 , ...αl−1 , como en la ecuación (9.38). Éstas son las ecuaciones de las
β
trayectorias en el espacio de configuración. La ecuación (9.308) conecta las coordenadas
con la variable temporal t, y equivale a la ecuación (9.40).
Ası́ como la acción principal de Hamilton coincide con una de las integrales completas de la ecuación de Hamilton-Jacobi dependiente del tiempo, la acción de Lagrange
10 El
ejemplo 4.4.2, sección 4.4, ilustra la propiedad general de la ecuación de Hamilton-Jacobi de
poseer soluciones en las cuales las variables t y ~
q no están separadas.
372 / Mecánica clásica avanzada
Σ coincide con una de las integrales completas de la ecuación de Hamilton-Jacobi independiente del tiempo (Véase sección 9.3). La conexión entre la acción principal de
Hamilton S, y la acción reducida, Σ, está dada por la ecuación (9.46). Si tomamos allı́ a
t2 = t y a t1 arbitrario, y omitimos una constante aditiva, vemos que la ecuación (9.46)
coincide con la ecuación (9.304). Como se señalaba en la sección 9.3, la acción reducida
Σ permite determinar las trayectorias en el espacio de configuración, consistentemente
con el principio de mı́nima acción.
S es la función generatriz de la transformación canónica que lleva a unas cantidades canónicas que son constantes. Σ es la función generatriz de cierta transformación
canónica que no depende del tiempo, que no coincide con la transformación generada
por S pero que tiene alguna relación con ella, según veremos.
Σ considerada como la función generatriz de una transformación canónica. Sea una transformación canónica independiente del tiempo que al ser aplicada a un
sistema conservativo generalizado (∂H/∂t = 0) nos lleva a unas nuevas variables canónicas q ν , pν , donde todas las pν sean cı́clicas. Por tanto todos los q ν serán constantes de
movimiento. Llamemos βν a esas constantes. Esta transformación satisface:
∂F1
=0⇒H =H;
∂t
∂F1
= pν ;
∂qν
H = H(q) = constante = h
∂F1
= pν ;
∂qν
ν = 1, 2, ...l
(9.309)
(9.310)
F1 , según (9.309) y (9.310), debe ser solución a la ecuación diferencial:
H
∂F1 (~
q , ~q)
q,
~
∂~q
!
=h
(9.311)
Si llamamos βl = h, (9.309) y (9.310) se pueden escribir como:
H
∂F1 (~
q , β~l−1 , h)
q,
~
∂~q
!
=h
(9.312)
~l−1 , h)
∂F1 (~
q, β
= p~
∂~q
~l−1 , h)
∂F1 (~
q, β
= −~pl−1
~l−1
∂β
~l−1 , h)
∂F1 (~
q, β
= −~
pl
∂h
(9.313)
Las transformaciones canónicas / 373
Las ecuaciones de Hamilton y sus soluciones para las variables pν y qν son:
~
~
~q˙ = ∂H(q) = 0 ⇒ ~q = constante = β
∂~p
~
~p˙ = − ∂H(q ) = − ∂βl
~
~
∂p
∂β
⇒ ~pl−1 = constante = α
~ l−1 ;
(9.314)
pl = −t + αl
Las ecuaciones (9.312) y (9.313) junto con las (9.314) quedan ası́:
~l−1 , h)
∂F1 (~
q, β
= pν ; ν = 1, 2, ...l
∂~qν
~l−1 , h)
∂F1 (~
q, β
= −αν ; α = 1, 2, ...l − 1
∂βν
(9.315)
~l−1 , h)
∂F1 (~
q, β
= t − αl
∂h
Comparando (9.312) con (9.305) y a (9.315) con (9.307), vemos que la función
generatriz de la transformación buscada, F1 (q, q), coincide con la función Σ.
Σ puede considerarse como la función generatriz de una transformación canónica
libre univalente de primera clase que al ser aplicada a un sistema conservativo generalizado nos conduce a unas variables canónicas (q, p) donde todas las q ν son constantes,
lo mismo que l − 1 pν . Una de las constantes q ν coincide con h y el l-ésimo pν es una
función lineal del tiempo, pl = −t + αl . Si esta transformación se aplica a un sistema
para el cual ∂H/∂t 6= 0, es claro que las nuevas variables canónicas ya no tendrán las
caracterı́sticas señaladas.
~ lo cual
No es drástica la exigencia βl = h. Podrı́amos haber dejado a h = H(β),
nos conducirı́a a que todos los q ν son constantes y todos los pν son funciones lineales
del tiempo.
Tratamiento cuando H(q, p) tiene coordenadas cı́clicas. Si el sistema es conservativo generalizado y además hay l − r coordenadas cı́clicas, entonces H = H(q1 , q2 ,
...qr , p1 , p2 , ...pl ). Los momentos pr+1 , pr+2 , ...pl , conjugados a las coordenadas cı́clicas
serán constantes de movimiento. La solución completa de la ecuación de Hamilton-Jacobi
puede escribirse como:
S = −ht +
l
X
βν qν + Σ0 (q1 , q2 , ...qr , β1 , β2 , ...βl , h)
(9.316)
ν=r+1
donde la función Σ0 es solución a la ecuación diferencial:
∂Σ0
∂Σ0 ∂Σ0
,
, ...
, βr+1 , βr+2 , ...βl = h
H q1 , q2 , ...qr ,
∂q1 ∂q2
∂qr
(9.317)
en la cual hemos tomado los momentos constantes coincidiendo con l − r constantes βν .
374 / Mecánica clásica avanzada
9.7.
Las transformaciones canónicas infinitesimales
Ecuaciones de transformación. Las transformaciones canónicas infinitesimales
(T.C.I.) son las transformaciones canónicas en las que (p, q) difieren infinitesimalmente
de (p, q):
q ν = qν + δqν ;
pν = pν + δpν ;
ν = 1, 2, ...l
(9.318)
aquı́ δ no denota desplazamientos virtuales sino simplemente los cambios infinitesimales
en las coordenadas y momentos en la T.C.I. La T.C.I. (9.318) difiere infinitesimalmente de la transformación identidad. Si la transformación infinitesimal sólo depende de un
parámetro ε, podemos decir que la función generatriz de la T.C.I. serı́a igual a la función
generatriz de la transformación identidad más un término del orden de ε. La transformación identidad es univalente libre de tercera y de segunda clase, según las ecuaciones
(9.184) a (9.188). La función generatriz de la T.C.I. (9.318) será pues:
F2 (q, pν , t) =
l
X
pν qν + ε G(q, p, t)
(9.319)
ν=1
Si la T.C.I. posee m parámetros infinitesimales, F2 será:
F2 =
l
X
pν qν +
ν=1
m
X
εj Gj
(9.320)
j=1
Es decir, las T.C.I. son las que se obtienen a partir de la identidad variando de
manera continua uno o varios parámetros.
Los Gj se llaman los generadores infinitesimales de la T.C.I., en términos de los
cuales se pueden expresar las fórmulas (9.135). Una transformación canónica del tipo F2
satisface:
pν =
∂F2
∂F2
∂F2
; qν =
; ν = 1, 2, ...l ; H − H =
∂qν
∂pν
∂t
(9.321)
Entonces para la T.C.I. con función generatriz (9.319) tenemos:
δpν = −ε
∂G
∂G
; δqν = ε
; ν = 1, 2, ...l
∂qν
∂pν
(9.322)
∂G
H =H +ε
∂t
donde en (9.322) hemos notado que ε f (q, p, t) = εf (q, p, t) al primer orden en ε.
La T.C.I. de evolución temporal. Sabemos que la evolución temporal puede
considerarse como una transformación canónica. Queremos hallar el generador de la
T.C.I. de evolución temporal.
La transformación es:
qν (t); pν (t) → q ν (t) = qν (t + τ )pν (t) = pν (t + τ ) ; ν = 1, 2, ...l
(9.323)
Las transformaciones canónicas / 375
donde tomamos a τ infinitesimal. De acuerdo con (9.269), la función generatriz de la
transformación canónica de evolución temporal entre t0 y t es −S,
Z t
e.t.
L dt
(9.324)
F1 = −
t0
O sea que para la transformación (9.323) con τ infinitesimal, la función generatriz
es:
F1e.t.
=
=
−
−
Z
l
X
t+τ
L dt ≈ −Lτ = −
t
l
X
ν=1
pν q̇ν − H
!
τ
pν q̇ν τ + Hτ
(9.325)
ν=1
Por otra parte, q̇ν = (q ν − qν )/τ → q̇ν τ = q ν − qν , o sea que:
F1e.t. ≈ −
l
X
(pν qν − pν q ν ) + Hτ
(9.326)
ν=1
De acuerdo con (9.217), (9.218), (9.187) y (9.188) vemos que:
F1id. = F2id. +
l
X
(pν qν + pν q ν ) =
l
X
(−q ν pν + pν qν + pν q ν )
(9.327)
ν=1
ν=1
donde F2id. es la función generatriz de la T.C. identidad y F1e.t. se refiere a la evolución
temporal. Comparando (9.326) y (9.327) obtenemos:
F1e.t. = F2id. −
l
X
pν q ν + Hτ
(9.328)
ν=1
Comparando (9.328) con (9.218) obtenemos:
F1e.t. = F2id. + Hτ =
l
X
pν qν + Hτ
(9.329)
ν=1
Si comparamos a (9.329) con (9.319) vemos que en este caso τ hace el papel del
parámetro infinitesimal ε y H es el generador infinitesimal de la T.C.I. de evolución
temporal. Al mismo resultado llegamos de la siguiente manera, notemos que:
q ν = qν + τ q̇ν ⇒ δqν = τ q̇ν = dqν
(9.330)
pν = pν + τ ṗν ⇒ δpν = τ ṗν = dpν ; H = H +
∂H
τ
∂t
(9.331)
Comparando a (9.322) con (9.330) obtenemos:
ε
∂G
= τ q̇ν ;
∂pν
−ε
∂G
= τ ṗν ;
∂qν
ε
∂G
∂H
=τ
∂t
∂t
(9.332)
376 / Mecánica clásica avanzada
De las ecuaciones de Hamilton obtenemos para (9.332):
ε
∂G
∂H
=τ
;
∂pν
∂pν
−ε
∂
(εG − τ H) = 0 ;
∂qν
∂G
∂H
∂
= −τ
⇒
(εG − τ H) = 0
∂qν
∂qν
∂pν
ν = 1, 2, ...l ;
(9.333)
∂
(εG − τ H) = 0
∂t
Las ecuaciones (9.333) nos dicen que εG = τ H. En efecto, podemos tomar τ como
ε y a H como el generador de la T.C.I.
El movimiento finito del sistema puede considerarse como una sucesión de T.C.I.
Si H es constante, el generador de la T.C.I. de evolución temporal es el mismo para
cada una de las transformaciones en tal sucesión. Si H depende de t, H es G para la
evolución de t a t + τ y H + (∂H/∂t)τ es G para la evolución de t + τ a t + 2τ , etc. En
el lı́mite τ → 0, la evolución finita es el desarrollo continuo de una T.C. En este caso el
generador de la T.C.I. es H. En general, el generador de cualquier T.C.I. es una variable
dinámica del sistema.
La T.C.I. de translación espacial. Esta transformación involucra tres parámetros infinitesimales. Supongamos que el sistema es libre, de modo que las coordenadas
cartesianas son a la vez coordenadas generalizadas independientes. La transformación
es:
xi = xi + εx ; y i = yi + εy ; z i = zi + εz ; i = 1, 2, ...N
(9.334)
Además, como para este sistema p~i = mi~r˙ i , se tiene que:
~pi = p~i ; i = 1, 2, ...N
(9.335)
En este caso δxi = εx , δyi = εy , δzi = εz , δ~
pi = 0; i = 1, 2, ...N . Entonces las ecuaciones
(9.322) toman la forma:
∂
~ = ~ε ;
(~ε · G)
∂~
pi
∂
~ = 0;
(~ε · G)
∂~ri
i = 1, 2, ...N
(9.336)
donde nos basamos en (9.320) con m = 3 y formamos los εj con el vector ~ε y con los Gj
~ De (9.336) se sigue que G
~ tiene la expresión:
el vector G.
~ =
G
n
X
pi = P~
~
(9.337)
i=1
Vemos que el momento total del sistema P~ es el generador infinitesimal de la transformación canónica de translación espacial. Más exactamente, en la translación por una
cantidad ε a lo largo del vector unitario ~n, entonces ~ε = ε~n y el generador infinitesimal
~ = Pn . El generador infinitesimal de translaciones a lo largo de la dirección
será ~n · G
~n es la componente del momento total en esa dirección, Pn . El hecho de que se emplee
(9.335) no implica que P~ o Pn sea constante en el tiempo. Veremos que P~ es constante
sólo si H no depende de la coordenada de posición del centro de masa.
Las transformaciones canónicas / 377
y
ri
ε
r
θi
x
Figura 9.7 Rotación de las partı́culas alrededor del eje z
La T.C.I. de rotación espacial. Suponemos también qué sistema es libre. Por
simplicidad consideremos una rotación de todas las partı́culas alrededor del eje z (véase
figura 9.7).
La transformación es:
xi =
ri cos(θi + ε)
yi =
ri sen(θi + ε)
zi =
zi ; i = 1, 2, ...N
(9.338)
y similarmente para las componentes de P~i . Al primer orden en ε, las ecuaciones (9.338)
y sus similares para p~i nos dan:
xi = xi − εyi ; yi = yi + εxi ; z i = zi
pxi = pxi − εpyi ; pyi = pyi + εpxi ; pzi = pzi ;
(9.339)
i = 1, 2, ...N
Comparando (9.339) con (9.322) hallamos:
−εyi = δxi = ε
∂G
∂G
; εxi = δyi = ε
;
∂pxi
∂pyi
−εpyi = δpxi = −ε
εpxi = δpyi = −ε
0 = δzi = ε
∂G
∂pxi
∂G
∂pzi
(9.340)
∂G
∂G
; 0 = δpzi = −ε
∂yi
∂zi
vemos que G no depende de zi ni de pzi . (9.340) se satisfacen si:
G=
N
X
i=1
(xi pyi − yi pxi ) = Lz
(9.341)
378 / Mecánica clásica avanzada
O sea que Lz es el generador infinitesimal de una rotación del sistema alrededor
del eje z, donde Lz es la componente z del momento angular total del sistema.
Vemos que:
Lz =
N
X
i=1
(xi pyi − y i pxi ) =
N
X
(xi pyi − yi pxi ) + 0 (ε2 )
(9.342)
i=1
O sea que, como debe ser, Lz = Lz . Veremos que Lz será constante en el tiempo
sólo si H no depende de la coordenada φ del vector de posición del centro de masa.
9.8.
Los corchetes de Poisson
En el numeral anterior vimos que los generadores infinitesimales H, Pn y Lz corresponden a cantidades con claro significado fı́sico. Aquı́ consideraremos algunas propiedades de las funciones del estado del sistema que hemos definido como variables dinámicas
(véase sección 3.4).
Las variables dinámicas. Definimos una variable dinámica como una función del
estado del sistema y del tiempo que no cambia su valor en una transformación canónica.
Ası́ que bajo una transformación canónica (q, p) → (q, p), f será una variable dinámica
si se cumple:
f (q, p, t) = f [q(q, p, t), p(q, p, t)] = f (q, p, t)
(9.343)
De acuerdo con esta definición, como en una transformación canónica:
H(q, p, t) = H(q, p, t) +
∂F
∂t
(9.344)
se sigue que el hamiltoniano no es una variable dinámica cuando se consideran transformaciones canónicas que dependen del tiempo. Ası́ por ejemplo, para un sistema conservativo H = E, igual a la energı́a total, en tanto que por medio de una transformación
canónica dependiente del tiempo podemos hacer H = 0. Tenemos en general que el
~ o p~. Ası́ también, la energı́a
generador de una T.C.I. es una variable dinámica, como L
cinética es una variable dinámica. En esta definición de variables dinámicas está implı́cita la idea de las transformaciones canónicas desde un punto de vista pasivo.
Formas “activa” y “pasiva” de una transformación canónica. En la sección
7.7 vimos que las rotaciones de un cuerpo rı́gido admiten las interpretaciones “activa”
y “pasiva”. Análogamente esas consideraciones se pueden hacer a las transformaciones
en el espacio de fases.
En la interpretación “pasiva”, una transformación canónica es una regla de correspondencia que asocia a cada punto del espacio de fases (q, p) un punto del espacio
de fases (q, p), tal que las ecuaciones de movimiento toman la misma forma en los dos
espacios. Es una aplicación de un espacio en otro espacio. Una variable dinámica es una
función del estado del sistema, considerado como algo intrı́nseco o sea independiente del
espacio de fases que se use para describirlo. Ası́, si el estado del sistema en un tiempo
Las transformaciones canónicas / 379
dado se describe por el punto A(q, p) en un espacio de fases y por el punto A(q, p) en
otro espacio de fases, una variable dinámica tiene el mismo valor en A que en A.
Por otra parte, hay transformaciones canónicas que admiten una interpretación
activa. Son aquellas transformaciones canónicas del espacio de fases en sı́ mismo; o sea
aquellas en que se tiene una aplicación del espacio de fases sobre sı́ mismo. Ası́, la transformación canónica de evolución temporal asocia al estado del sistema en el tiempo t0 ,
(q0 , p0 ) el estado en el tiempo t, (q, p); la transformación canónica de translación espacial
asocia a la posición del sistema (~r1 , ~r2 , ...~rN ) una posición en la cual todas las partı́culas
se han desplazado una distancia ~
ε: (~r1 + ~ε, ~r2 + ~ε, ...~rN + ~ε); la transformación canónica
de rotación espacial es la misma estudiada en el capı́tulo 7. Son susceptibles de una interpretación “activa” todas aquellas transformaciones canónicas que se pueden obtener
a partir de la transformación identidad por medio de la variación continua de uno o
varios parámetros. Ası́ por ejemplo, la inversión de las coordenadas, o la transformación
canónica que intercambia coordenadas y momentos, no son susceptibles de una interpretación activa. Tampoco mediante una variación continua de parámetros podemos llegar
de las coordenadas cartesianas a las coordenadas esféricas, por ejemplo.
Toda T.C.I. es pues susceptible de ser tratada en las formas pasiva (el sistema
descrito desde diferentes espacios de fases) o activa (el sistema es cambiado de un estado
a otro). En (9.318) es entonces válido tomar desplazamientos del tipo ∆.
Cambio de una variable dinámica en una T.C.I. En la interpretación “pasiva” no tiene sentido preguntarse por el “cambio de una variable dinámica f bajo una
transformación canónica”, pues de acuerdo con (9.343) no hay tal cambio. En la interpretación “activa”, si tiene sentido preguntarse cómo cambia el valor de f al pasar el
sistema de un estado A(q, p) a un estado B(q, p). Usaremos el sı́mbolo ∂ para denotar
tal cambio:
∂f (q, p, t) = f (q, p, t) − f (q, p, t)
(9.345)
Para ser más precisos, en la interpretación “pasiva” podemos preguntarnos por el
cambio en la forma funcional de la variable dinámica al ser descrita desde dos espacios
de fases diferentes, lo cual es mucho más difı́cil de visualizar. Este cambio de forma
funcional está definido por:
f (q, p, t) − f (q, p, t)
(9.346)
de acuerdo con la notación (9.343). Usando (9.343) podemos escribir a (9.346) como:
f (q, p, t) − f (q, p, t) = −∂f
(9.347)
comparando (9.345) y (9.347) vemos que:
∂f = −∂f
(9.348)
Los dos cambios (9.345) y (9.346) son iguales, o sea que ∂f puede significar el
cambio del valor de f al pasar el sistema del estado (q, p, t) al estado (q, p, t) o el cambio
funcional de la función f en el mismo estado, en la interpretación “pasiva”. La T.C.I. es
380 / Mecánica clásica avanzada
(9.318) y expresada en términos de generadores es (9.322). Con la interpretación “activa”
∂f es:
∂f
=
=
=
f (q + δq, p + δp, t) − f (q, p, t)
l X
∂f (q, p, t)
∂f (q, p, t)
δqν +
δpν
∂qν
∂pν
ν=1
l m X
X
∂f (q, p, t) ∂Gj (q, p, t) ∂f (q, p, t) ∂Gj (q, p, t)
εj
−
εj
∂qν
∂pν
∂pν
∂qν
j=1 ν=1
=
m
X
εj [f (q, p, t), Gj (q, p, t)]
(9.349)
j=1
donde hemos definido el corchete de Poisson de dos variables dinámicas g(q, p, t) y
h(q, p, t) como:
l X
∂g ∂h
∂g ∂h
−
[g, h] =
∂qν ∂pν
∂pν ∂qν
ν=1
(9.350)
Vemos que el corchete de Poisson de dos variables dinámicas a su vez es una variable
dinámica. En sı́ntesis:
f (q, p, t) − f (q, p, t) = f (q, p, t) − f (q, p, t)


m
X
εj Gj (q, p, t)
= f (q, p, t),
(9.351)
j=1
Si la T.C.I. es la evolución temporal, tenemos que ε = τ y G = H. En este caso:
l
∂f X
f˙ =
+
∂t ν=1
l
=
∂f X
+
∂t ν=1
∂f
∂f
q̇ν +
ṗν
∂qν
∂pν
∂f ∂H
∂f ∂H
−
∂qν ∂pν
∂pν ∂qν
(9.352)
∂f
+ [f, H]
⇒ f˙ =
∂t
Si la variable dinámica f no depende explı́citamente del tiempo, su rata de cambio
es igual a su corchete de Poisson con H. Si f es una constante de movimiento, el corchete
de Poisson de f con H es igual al negativo de su derivada parcial respecto al tiempo; si f
no depende explı́citamente del tiempo será una constante de movimiento si su corchete
de Poisson con H es cero.
Simetrı́a y leyes de conservación. Sabemos que la simetrı́a dinámica de un
sistema se expresa mediante las simetrı́as de las funciones L o H.
Las transformaciones canónicas / 381
Sea una T.C.I. y sea G el generador de la misma; G es una variable dinámica.
Entonces es correcto expresar el siguiente teorema: G es una constante de movimiento
si H es invariante bajo la transformación generada por G.
Recordemos que H no es en general una variable dinámica. Por esta razón al realizar
la T.C.I. generada por G el cambio en H no está dado por (9.349). H es simplemente una
función que en un espacio de fases dado define las ecuaciones canónicas de movimiento.
Por esta razón, cuando la transformación canónica depende del tiempo, no se cumple
que H(q, p, t) = H(q, p, t). Denotemos por ∂H a la siguiente diferencia. Ver ecuación
(9.346):
∂H = H(q, p, t) − H(q, p, t)
(9.353)
H(q, p, t) y H(q, p, t), de acuerdo con (9.344) y (9.319) están relacionadas por:
H(q, p, t) − H(q, p, t) = ε
∂G
∂t
(9.354)
reemplazando a (9.354) en (9.353) tenemos:
∂H = H(q, p, t) − H(q, p, t) + ε
∂G
∂t
(9.355)
Ahora sı́ podemos usar la ecuación (9.351) para H:
H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)]
(9.356)
La diferencia entre H y H es del orden de ε, luego, al primer orden en ε (9.356)
toma la forma:
H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)]
Ahora, reemplazamos a (9.357) en (9.355) para obtener:
∂G
∂G
∂H = −ε [H, G] + ε
=ε
+ [G, H]
∂t
∂t
(9.357)
(9.358)
De (9.352) vemos entonces que:
∂H = ε Ġ
(9.359)
La ecuación (9.359) nos permite inmediatamente obtener el enunciado del teorema:
G es una constante de movimiento si y sólo si es el generador de una transformación
canónica infinitesimal que no cambia la forma funcional del hamiltoniano.
Ası́ pues, si H no cambia al desplazar el sistema a lo largo de una dirección ~n, P~ .~n
es una constante de movimiento y si H no cambia al rotar el sistema alrededor del eje
~ n es una constante de movimiento. P~ es el momento lineal total y L
~ es el
~n entonces L.~
momento angular. Este resultado ya lo habı́amos obtenido en unos casos particulares en
la sección 3.4.
Como según este teorema las constantes de movimiento han de ser los generadores
de T.C.I. que dejan invariante a H, se sigue que hallando todas las transformaciones de
simetrı́a de H podemos encontrar todas las constantes de movimiento.
382 / Mecánica clásica avanzada
Por otra parte si se conocen 2l constantes de movimiento del sistema se tendrá resuelto el problema mecánico, si esas 2l constantes son independientes. En efecto, el
método de Hamilton-Jacobi permite mediante una transformación canónica expresar las
coordenadas y momentos del sistema en términos de las constantes de movimiento y del
tiempo. En el capı́tulo 11 se muestra que el resultado falla si el sistema es no integrable.
La conservación del momento que vimos en el capı́tulo 3 se sigue de este teorema. Si
qν0 es cı́clica, H no depende de ella y por tanto es invariante en una T.C.I. que implique
el cambio de qν0 , y el generador infinitesimal de esta transformación habrá de ser una
constante de movimiento. Las ecuaciones de tal transformación canónica serán:
δqν = ε δνν0 ;
δpν = 0 ;
ν = 1, 2, ...l
(9.360)
por otra parte se tiene que:
δqν = ε
∂G
;
∂pν
δpν = −ε
∂G
;
∂qν
ν = 1, 2, ...l
(9.361)
Se sigue de (9.360) y (9.361) que:
(9.362)
G = pν0
O sea que el generador es precisamente el momento canónico conjugado de la coordenada cı́clica qν0 . En general, un cambio en cualquier variable canónica del sistema,
qν o pν , es generado por su variable canónicamente conjugada, pν o −qν , respectivamente.
Las ecuaciones de movimiento en términos de los corchetes de Poisson.
Si en la ecuación (9.352) reemplazamos a f por qν y por pν obtenemos:
q̇ν = [qν , H] ;
ṗν = [qν , H] ;
ν = 1, 2, ...l
(9.363)
o también, usando las ecuaciones de Hamilton:
∂H
∂H
= [qν , H] ;
= −[pν , H] ; ν = 1, 2, ...l
∂pν
∂pν
(9.364)
Las expresiones (9.363) son las ecuaciones de movimiento de Poisson, totalmente equivalentes a las ecuaciones de movimiento de Hamilton. Las ecuaciones (9.364) no son más
que el resultado de aplicar el párrafo que sigue a la ecuación (9.362), conjuntamente con
(9.351).
Ejemplo 9.8.1 Hallar las ecuaciones de movimiento de Poisson para una partı́cula cargada en presencia de un campo electromagnético externo.
Usamos la ecuación (3.117) para h conjuntamente con la ecuación (4.1) para ~r˙ en
función del momento canónico p~:
H=
e ~ 2
1 p~ − A
+ eφ
2m
c
(9.365)
Las transformaciones canónicas / 383
~ y φ son los potenciales vectorial y escalar del campo externo. Evaluemos los
donde A
corchetes de Poisson de ~r con H y de p~ con H para mostrar la consistencia con las
fórmulas (9.363):
∂rn ∂H
∂rn ∂H
·
−
·
∂~r ∂~
p
∂~p ∂~r
e~
p~ − A
∂H
c ; ~n = ~i, ~j, ~k
= ~n ·
= ~n ·
∂~
p
m
[rn , H] =
(9.366)
Por otra parte:
[pn , H] =
=
∂pn ∂H
∂pn ∂H
∂H
∂H
·
−
·
= −~n ·
=−
∂~r ∂~
p
∂~p ∂~r
∂~r
∂rn
~
e ~ ∂A
∂φ
e p~ − A
·
−e
mc
c
∂rn
∂rn
(9.367)
La ecuación (9.367) también puede escribirse ası́:
[pn , H] =
~
∂φ
e ∂ ˙ ~
∂An
e ˙ ∂A
+
−e
=
(~r · A) − Ȧn +
~r ·
c ∂rn
∂rn
c ∂rn
∂t
e
e ∂An
∂φ
Ȧn −
−e
c
c ∂t
∂rn
(9.368)
~ y E se pueden expresar en términos de A
~ y φ ası́:
Notamos que B
~
~ = − ∂φ − 1 ∂ A ;
E
∂~r
c ∂t
~ = ∂ ×A
~
B
∂~r
(9.369)
Notemos que:
∂
∂Aµ
~
~r˙ ×
×A
= ǫnms ǫstµ ṙm
∂~r
∂rt
n
= (δnt δmµ − δnµ δmt ) ṙm
∂Aµ
∂rt
(9.370)
~
∂A
∂Aµ
= ~r˙ ·
− ~r˙ ·
∂rn
∂~r
y,
Ȧn =
∂An ˙ ∂An
+ ~r ·
∂t
∂~r
(9.371)
con lo cual:
~
∂
~ + ∂An − Ȧn
~ = ~r˙ · ∂ A + ∂An − Ȧn = ∂ (~r˙ · A)
×A
~r˙ ×
∂~r
∂rn
∂t
∂rn
∂t
(9.372)
384 / Mecánica clásica avanzada
remplazando (9.372) en (9.369) obtenemos:
e ˙
1 ∂An
∂
∂φ
e
~
[pn , H] =
+
~r ×
×A
+ Ȧn − e
c
∂~r
c
∂rn
c ∂t
n
e ˙ ~
e
=
(~r × B)n + eEn Ȧn + Ȧn
c
c
pero, según la expresión para la fuerza de Lorentz:
e
~ n + eEn
mr̈n = (~r˙ × B)
c
Usando (9.374), (9.373) queda como:
e
e d [pn , H] = mr̈n + Ȧn =
mṙn + An = ṗn
c
dt
c
en concordancia con (9.363). También de (9.366) se sigue que:
[rn , H] = ṙn
de donde:
(9.374)
(9.375)
(9.376)
El corchete de Poisson de dos componentes del momento cinemático es:
∂pci ∂pcj
∂pci ∂pcj
·
−
·
[pci , pcj ] =
∂~r
∂~p
∂~p
∂~r
~
pero p~c = p~ − (e/c) A, por tanto:
e ∂Aj
e ∂Ai
· ~nj − ~ni ·
[pci , pcj ] = −
c ∂~r
c ∂~r
=
(9.373)
e
c
∂Aj
∂Ai
−
∂ri
∂rj
e
= ǫijk
c
∂
~
×A
∂~r
k
e
[pci , pcj ] = ǫijk Bk
c
Esto último también puede escribirse como:
e
[ṙi , ṙj ] = 2 ǫijk Bk
m c
O sea que el corchete de Poisson de ẋ con ẏ es cero sólo si Bz se anula.
(9.377)
(9.378)
(9.379)
(9.380)
Algunas propiedades de los corchetes de Poisson. Para cualesquiera tres
funciones f (q, p, t), g(q, p, t) y h(q, p, t), se cumple:
(i) [f, g] = −[g, f ]
(ii) [cf, g] = [f, cg] = c[f, g] ; c : constante
(iii) [f + g, h] = [f, h] + [g, h]
(iv) [f g, h] = f [g, f ] + g[f, h]
(v)
∂g
∂f
∂
[f, h] =
, g + f,
∂t
∂t
∂t
(9.381)
Las transformaciones canónicas / 385
Estas propiedades se siguen directamente de la definición de los corchetes de Poisson, ecuación (9.350).
La identidad de Jacobi. Para cualesquiera tres funciones f , g y h se cumple:
[f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 0
(9.382)
esta relación se llama la identidad de Jacobi. Para demostrarla es útil la siguiente interpretación del corchete de Poisson:
l X
∂g ∂
∂g ∂
[g, φ] =
−
φ = D̂g φ
(9.383)
∂qν ∂pν
∂pν ∂qν
ν=1
donde D̂g es un operador diferencial lineal en el espacio de fases.
Con esta notación podemos escribir el siguiente conmutador:
D̂g D̂h − D̂h D̂g f = [g, [h, f ]] − [h, [g, f ]]
=
(9.384)
[g, [h, f ]] + [h, [f, g]]
La expresión (9.384) sólo contiene derivadas primeras respecto a pν y qν de la
función f . En efecto:
D̂g =
2l
X
i=1
gi
∂
; xν = qν ; xν+l = pν ; ν = 1, 2, ...l
∂xi
(9.385)
por tanto, tenemos que:
D̂g D̂h − D̂h D̂g f
2l 2l X
X
∂
∂
∂
∂
=
gi
hj
− hi
gj
f
∂xi
∂xj
∂xi
∂xj
i=1 j=1
"
2l X
2l
X
∂2
∂hj ∂
∂2
g i hj
=
+ gi
− hi g j
∂xi ∂xj
∂xi ∂xj
∂xi ∂xj
i=1 j=1
#
∂gj ∂
f
− hi
∂xi ∂xj
=
2l X
2l X
∂hj
∂gj ∂f
gi
− hi
∂xi
∂xi ∂xj
i=1 j=1
(9.386)
Por otra parte tenemos que:
[f, [g, h]] =
[[h, g], f ] = [D̂h g, f ] =
2l X
i=1
=
∂g
,f
hi
∂xi
2l X
l X
∂
∂g
∂g
∂
∂f
∂f
hi
hi
−
∂qν
∂xi ∂pν
∂pν
∂xi ∂qν
i=1 ν=1
(9.387)
386 / Mecánica clásica avanzada
La ecuación (9.386) se puede escribir como:
D̂g D̂h − D̂h D̂g
"
2l X
l
X
∂hν
∂gν ∂f
gi
f=
− hi
∂xi
∂xi ∂qν
i=1 ν=1
#
∂hl+ν
∂gl+ν ∂f
+ gi
− hi
∂xi
∂xi
∂pν
(9.388)
Sumando (9.387) y (9.388) obtenemos:
[f, [g, h]] + [g, [h, f ]] + [h, [f, g]] =
2l X
l X
∂g
∂gν
∂
∂f
∂hν
hi
− hi
−
gi
∂x
∂x
∂p
∂x
∂q
i
i
ν
i
ν
i=1 ν=1
+
(9.389)
2l X
l X
∂g
∂gl+ν
∂
∂f
∂hl+ν
hi
− hi
+
gi
∂xi
∂xi
∂qν
∂xi
∂pν
i=1 ν=1
De (9.383) y (9.385) se sigue que:
gν = −
∂g
;
∂pν
gl+ν =
∂g
;
∂qν
ν = 1, 2, ...l
(9.390)
Por tanto:
∂gν
∂
∂hν
− hµ
−
gµ
∂qµ
∂qµ
∂pν
=
∂g
hµ
∂qµ
∂h ∂ 2 g
∂g ∂ 2 h
−
∂pµ ∂qµ ∂pν
∂pµ ∂qµ ∂pν
(9.391)
∂ 2 h ∂g
∂h ∂ 2 g
+
+
∂pν ∂pµ ∂qµ
∂pµ ∂pν ∂qµ
=
∂g ∂ 2 h
∂g ∂ 2 h
+
∂pµ ∂qµ ∂pν
∂qµ ∂pµ ∂qν
Las transformaciones canónicas / 387
Similarmente hallamos que:
gl+µ
∂gν
∂
∂hν
− hl+µ
−
∂qµ
∂pµ
∂pν
−
∂g
hl+µ
=
∂pµ
∂g ∂ 2 h
∂g ∂ 2 h
−
∂qµ ∂pµ ∂pν
∂pµ ∂pν ∂qµ
∂hl+ν
∂gl+ν
∂
gµ
− hµ
+
∂qµ
∂qµ
∂qν
∂g
hµ
=
∂qµ
(9.392)
∂g ∂ 2 h
∂g ∂ 2 h
−
−
∂pµ ∂qµ ∂qν
∂qµ ∂qν ∂pµ
∂hl+ν
∂gl+ν
∂
gl+µ
− hl+µ
+
∂pµ
∂pµ
∂qν
∂g
hl+µ
=
∂pµ
∂g ∂ 2 h
∂g ∂ 2 h
+
∂qµ ∂pµ ∂qν
∂pµ ∂qν ∂qµ
Reemplazando (9.391)y (9.392) en (9.389) obtenemos:
[f, [g, h]] + [g, [h, f ]] + [h, [f, g]] =
l
X
µ,ν=1
∂g ∂ 2 h
∂g ∂ 2 h
+
∂pν ∂qµ ∂pν
∂qµ ∂pµ ∂pν
∂g ∂ 2 h
∂g ∂ 2 h
−
−
∂qµ ∂pµ ∂pν
∂pµ ∂pµ ∂qν
+
l
X
µ,ν=1
−
∂g ∂ 2 h
∂g ∂ 2 h
−
∂pµ ∂qµ ∂qν
∂qµ ∂qν ∂pµ
∂g ∂ 2 h
∂g ∂ 2 h
+
+
∂qµ ∂pµ ∂qν
∂pν ∂qν ∂qµ
!
!
∂f
∂qν
(9.393)
∂f
∂pν
La ecuación (9.393) es idénticamente cero, lo cual prueba la identidad de Jacobi.
Invariancia de los corchetes de Poisson bajo T.C.I. Se trata de mostrar que:
[f (q, p, t), g(q, p, t)] = [f (q, p, t), g(q, p, t)]
(9.394)
De la definición (9.343) se sigue que:
l X
∂f ∂qµ
∂f
∂f ∂pµ
∂f
=
=
+
∂q
∂q ν
∂qµ ∂qν
∂pµ ∂q ν
µ=1
(9.395)
388 / Mecánica clásica avanzada
De (9.318) y (9.322) se sigue:
∂qµ
∂2G
;
= δµν − ǫ
∂q ν
∂qν ∂pµ
∂pµ
∂2G
=ǫ
∂q ν
∂qν ∂qµ
(9.396)
Por tanto, se cumple:
∂f
∂f
∂
∂f
∂f
∂G
+ǫ
,f =
+ǫ
[G, f ] − ǫ G,
=
∂qν
∂qν
∂qν
∂qν
∂qν
∂qν
(9.397)
donde la última igualdad se sigue de (9.381-v). De (9.318) y (9.322) se sigue:
∂2G
∂pµ
;
= δµν + ǫ
∂pν
∂pν ∂qµ
∂qµ
∂2G
= −ǫ
∂pν
∂pν ∂pµ
(9.398)
y análogamente se llega a:
∂f
∂
∂f
∂f
+ǫ
[G, f ] − ǫ G,
=
∂pν
∂pν
∂pν
∂pν
(9.399)
Reemplazando (9.397) y (9.399) y expresiones análogas para g, en (9.394):
f, g
(q,p)
=
"
l
X
∂[G, f ]
∂f
∂f
+ǫ
− ǫ G,
·
∂qν
∂pν
∂qν
ν=1
∂[G, g]
∂g
∂g
+
+ǫ
− ǫ G,
∂pν
∂pν
∂pν
∂[G, f ]
∂f
∂f
·
+ǫ
− ǫ G,
∂pν
∂pν
∂pν
#
∂[G, g]
∂g
∂g
+ǫ
− ǫ G,
∂qν
∂qν
∂qν
(9.400)
Las transformaciones canónicas / 389
Al primer orden en ε podemos escribir:
f, g
(q,p)
l X
∂[G, f ] ∂g
= [f, g](q,p) + ε
∂qν ∂pν
ν=1
∂f
− G,
∂qν
∂f ∂[G, g]
∂g
+
∂pν
∂qν ∂pν
∂g
∂[G, g] ∂f
∂g ∂f
∂f
G,
−
+ G,
−
∂qν
∂pν
∂qν ∂pν
∂qν ∂pν
−
∂f
∂g
∂g ∂[G, f ]
G,
+
∂qν ∂pν
∂qν
∂pν
(9.401)
=
[f, g](q,p) + ǫ ([[G, f ], g] + [f, [G, g]])
+ǫ
l X
∂g ∂f
∂g ∂f
,G −
,G
∂pν ∂qν
∂qν ∂pν
ν=1
En la última igualdad se ha hecho uso de la propiedad (9.381-iv). Ahora los últimos
términos en (9.401) dan [[f, g], G], con lo cual el término del orden de ε es cero con base
en la identidad de Jacobi, por tanto:
[f , g](q,p) = [f, g]q,p
(9.402)
Llegamos a la conclusión de que el corchete de Poisson de dos variables dinámicas es
una variable dinámica que es invariante bajo transformaciones canónicas infinitesimales.
En otras palabras, el corchete de Poisson de dos variables dinámicas es una variable
dinámica con un valor independiente de las variables usadas para describir el estado del
sistema: los corchetes de Poisson son invariantes canónicos.
Veremos que esta invariancia se cumple aun bajo transformaciones canónicas que
no se pueden obtener de manera continua a partir de la transformación identidad, o sea
como sucesión de T.C.I.
El teorema de Jacobi-Poisson. Si f y g son dos constantes de movimiento,
entonces [f, g] también es una constante de movimiento.11
De (9.352) se sigue que si f y g son constantes de movimiento se cumple:
∂g
∂f
+ [f, H] = 0 y
+ [g, H] = 0
∂t
∂t
(9.403)
Debemos probar que esto implica que:
∂[f, g]
+ [[f, g], H] = 0
∂t
11 Este
teorema fue enunciado por Poisson en 1809.
(9.404)
390 / Mecánica clásica avanzada
En efecto:
∂
∂g
∂f
= − [[f, H] , g] − [f, [g, h]]
[f, g] =
, g + f,
∂t
∂t
∂t
(9.405)
[[H, f ] , g] + [g, [H, f ]] = − [[f, g] , H]
La última igualdad en (9.405) se sigue de la identidad de Jacobi, lo cual demuestra
el teorema. El corchete de Poisson de dos variables dinámicas que se conservan es una
variable dinámica que se conserva. Esto permite, por ejemplo, construir a partir de
un conjunto de s constantes de movimiento independientes C1 , C2 , ...Cs (s < 2l) las
2l − s constantes independientes restantes Cs+1 , Cs+2 , ...C2l por formar los corchetes
de Poisson entre todos los posibles pares de estas S variables dinámicas. En total hay
s(s − 1)/2 corchetes de Poisson, de los cuales algunos pueden ser cero o funciones de
constantes de movimiento conocidas antes, pero es de esperarse que haya 2l − s que
sean independientes. Es claro que puede haber un número mı́nimo s de constantes de
movimiento independiente tal que a partir de ellas se pueda obtener el conjunto completo
de 2l constantes de movimiento independientes.
Ejemplo 9.8.2 Sea una partı́cula en una dimensión, sometida a una fuerza constante.
Hallar dos constantes de movimiento independientes y mostrar que el corchete de Poisson
de ellas no da lugar a una tercera constante de movimiento.
La solución al problema es:
1
x = v(t + t0 ) + g(t + t0 )2 ; p = mv + mg(t + t0 )
2
(9.406)
donde t0 y v son constantes. Dos constantes de movimiento son t0 y la energı́a total E.
x puede escribirse en la forma:
x=
1
p
(t + t0 ) − g(t + t0 )2
m
2
Entonces las expresiones para t0 y E en función de p y x son:
s
2x
p
p2
p2
−
t0 = −t +
−
;
E
=
− mgx
mg
m2 g 2
g
2m
(9.407)
(9.408)
El corchete de Poisson de t0 y E es:
[t0 (p, x, t), E(p, x, t)] =
∂t0 ∂E
∂t0 ∂E
−
∂x ∂p
∂p ∂x
(9.409)
Haciendo el cálculo indicado en (9.408), usando (9.409), obtenemos:
[t0 , E] = 1
(9.410)
La ecuación (9.408) puede interpretarse como una transformación canónica que
permite expresar las nuevas variables canónicas t0 y E en función de las viejas x y p.
Tal transformación depende del tiempo. Esto ilustra un resultado más general: [qν , pν ] =
[q ν , q ν ] = 1, para todo ν, que veremos más adelante.
Las transformaciones canónicas / 391
Ejemplo 9.8.3 Sea una partı́cula para la cual lz y py son constantes de movimiento.
Hallar una tercera constante de movimiento.
Por el teorema de Poisson, [lz , py ] es constante.
[lz , py ] = [xpy , py ] − [ypx , py ]
(9.411)
= x[py , py ] + py [x, py ] − y[px , py ] − px [y, py ]
Es fácil, de la definición, verificar que:
[x, py ] = 0 ; [px , py ] = 0 ; [y, py ] = 1
son.
(9.412)
Por tanto, [lz , py ] = −px . O sea que px es constante de movimiento si lz y py lo
Ejemplo 9.8.4 Demostrar que si dos componentes del momento angular son constantes
de movimiento, la tercera también lo es.
Si li y lj son dos componentes de ~l constantes, por el teorema de Poisson [li , lj ]
también es una constante.
Recordando que:
li = ǫikl xk pl
(9.413)
Vemos que:
[li , lj ] = ǫikl ǫjmn [xk pl , xm pn ]
(9.414)
Usando la propiedad (9.381-iv) vemos que:
[xk pl , xm pn ] =
xk [pl , xm pn ] + pl [xk , xm pn ]
=
−xk [xm pm , pl ] − pl [xm pn , xk ]
=
−xk (xm [pn , pl ] + pn [xm , pl ])
(9.415)
−pl (xm [pn , xk ] + pn [xm , xk ])
Es fácil ver que:
[pn , pl ] = 0 ; [xm , pl ] = δml ; [xm , xk ] = 0
(9.416)
con lo cual (9.415) queda:
[xk pl , xm pn ] = −xk pn δml + pl xm δnk
(9.417)
reemplazando (9.417) en (9.414) obtenemos:
[li , lj ] = −ǫikl ǫjln xk pn + ǫikl ǫjnk pl xn
(9.418)
Usando la propiedad:
ǫikl ǫjnl = δij δkn − δin δjk
(9.419)
392 / Mecánica clásica avanzada
obtenemos:
[li , lj ] = (δij δkn − δin δkj )xk pn − (δij δkn − δin δkj )pk xn
(9.420)
Finalmente encontramos que:
[li , lj ] = δij ~r · ~p − rj pi − δij ~r · ~p + pj ri = ri pj − pi rj
(9.421)
no es otra cosa que:
[li , lj ] = ǫijk lk
(9.422)
Ası́, vemos que [lx , ly ] = xpy − ypx = lz , o sea que si lx y ly son constantes de
movimiento, lz también lo es.
Los corchetes de Poisson fundamentales. Son los corchetes de Poisson para
las coordenadas y los momentos del sistema. Se sigue de la definición de corchete de
Poisson que:
[qν , qµ ] = 0 ; [pν , pµ ] = 0 ; [qν , pµ ] = δµν ; µ, ν = 1, 2, ...l
(9.423)
De acuerdo con la invariancia de los corchetes de Poisson bajo transformaciones
canónicas se tiene que las relaciones (9.423) se cumplen independientemente de las variables canónicas usadas para describir el estado del sistema; veremos que esta propiedad
proporciona un criterio para saber si una transformación en el espacio de fases es o no
canónica.
Algunos corchetes de Poisson de interés. En principio el corchete de Poisson de un par de variables dinámicas se obtiene a partir de los corchetes de Poisson
fundamentales. Algunos corchetes de Poisson que se calculan directamente son:
[qν , f ] =
∂f
;
∂pν
[pν , f ] = −
∂f
;
∂qν
µ, ν = 1, 2, ...l
(9.424)
siempre t0 es una de las constantes de movimiento y tiene una forma similar a (9.408),
ver también la ecuación (3.91):
t0 (q, p, t) = −t + θ(q, p)
(9.425)
de acuerdo con (9.411) se cumple que:
[t0 , H] = −
∂t0
= 1 ⇒ [t0 , H] = 1
∂t
(9.426)
La ecuación (9.423) nos dice que el corchete de Poisson de un par de variables canónicamente conjugadas es igual a +1; [qν , pν ] = 1 ; ν = 1, 2, ...l (9.426) nos dice entonces que
t0 y H son un par de variables dinámicas canónicamente conjugadas. Muchos autores
señalan que t y H son canónicamente conjugadas, pero esto es erróneo, pues realmente t
no es una variable dinámica, como sı́ lo es t0 . Enfaticemos que f es una variable dinámica
si satisface f (q, p, t) = f (q, p, t).
Las transformaciones canónicas / 393
Vimos que el método de Hamilton-Jacobi permite mediante una transformación
canónica describir el estado por medio de constantes de movimiento. Los corchetes fundamentales de Poisson, (9.423), permiten a priori saber si dos constantes de movimiento
dadas pueden tomarse como dos “coordenadas” o dos “momentos” o una “coordenada”
y su “momento” canónicamente conjugado. La ecuación (9.426) nos dice categóricamente que t0 y H pueden tomarse como un par de variables canónicamente conjugadas pero
no es posible que ambos sean “coordenadas” o “momentos”. Algo análogo se concluye
de las siguientes relaciones entre componentes de los momentos angular y lineal:
[li , lj ] = ǫijk lk ; [pi , lj ] = ǫijk pk ; [xi , lj ] = ǫijk xk
[ li , ~l2 ] = 0 ; [~
p, ~l2 ] = 2~l × ~p ; i, j, k = 1, 2, 3
(9.427)
Se sigue que dos componentes de ~l no pueden tomarse como variables canónicas de
estado, como tampoco una componente de p~ y ~l2 . Sin embargo, por ejemplo, [px , lx ] = 0
y [lz , lx ] = 0, permiten que px y lx sean momentos canónicos respectivamente, lo mismo
que la componente de p~ paralela a ~l y ~l2 .
Como ejemplo, para una partı́cula en un campo de fuerzas centrales se cumple que
[ ~l2 , H] = 0 y [lz , H] = 0. Para este sistema se cumple:
[~l, H] = 0 ; [lz , H] = 0 ; [~l2 , lz ] = 0
(9.428)
O sea que H, ~l2 y lz pueden tomarse como tres “momentos” constantes, que junto con sus tres “coordenadas” canónicamente conjugadas, que son funciones lineales
del tiempo según se vio al final del capı́tulo 2, constituyen un conjunto de seis variables canónicas que describen exhaustivamente el sistema. Por ser independientes, li y lj
podrı́an servir de variables de estado pero en un formalismo no canónico (no hamiltoniano).
Funciones escalares y vectoriales del estado de una partı́cula. Una función
escalar por definición, es aquella que no cambia al efectuar una rotación del sistema de
coordenadas (punto de vista “pasivo”). Al efectuar la rotación los vectores de estado ~r
y p~ cambian en ~r y ~p, ver sección 7.7:
~r = Ã~r ; ~p = Ã~
p
(9.429)
donde à es la matriz de rotación. Entonces φ(~r, p~) es escalar si:
φ(~r, p~) = φ(~r , ~p)
(9.430)
Una función vectorial del estado de la partı́cula es una función F que se transforma
de acuerdo con (9.428), es decir, F~ tiene tres componentes que se transforman por
rotaciones como las componentes de ~r:
~ (~r, ~p)
F~ (~r, ~p) = ÃF~ (~r, p~) = F
(9.431)
Para rotaciones infinitesimales à está dada por:
à = I˜ + Ci G̃i δφ
(9.432)
394 / Mecánica clásica avanzada
donde los G̃i están dados en la ecuación (7.221), los Ci son los cosenos directores del eje
de rotación y δφ es el ángulo de rotación. De acuerdo con (9.318) y (9.432):
~r = ~r + Ci G̃i ~r δφ ; ~p = p~ + Ci G̃i p~ δφ
(9.433)
De acuerdo con (9.318), (9.322) y (9.433) tenemos que:
∂
ǫ G(~r, ~p)
∂~p
δ~r =
Ci G̃i~r δφ =
δ~
p=
∂
~ δφ =
Ci G̃i p
ǫ G(~r, ~p)
∂~r
(9.434)
donde G es el generador infinitesimal de la rotación, que de acuerdo con (9.340) es la
componente de ~l a lo largo del eje de rotación:
G(~r, p~) = ~n · ~r × ~p = Ci li
(9.435)
Vemos entonces que δφ = ǫ y que:
Ci G̃i ~r =
∂
∂
Ci li =
(~n · ~r × ~p) = ~n × ~r
∂~
p
∂~p
Ci G̃i p~ =
∂
∂
− Ci li = − (~n · ~r × p~) = ~n × p~
∂~p
∂~r
(9.436)
Tomando componentes en (9.432) a (9.436):
= ǫkil
xl = ǫkil Ci xl ⇒ G̃i
Ci G̃i
kl
kl
(9.437)
El lector puede verificar fácilmente que este resultado es consistente con las ecuaciones (7.222), teniendo en cuenta que allı́ se tenı́an rotaciones “activas”. De (9.436)
vemos que se puede escribir:
G(~r, ~
p) = ~l · ~n = Ci p~ · G̃i~r = −Ci~r · G̃i p~
(9.438)
⇒ li = p~ · G̃i~r = −~r · G̃i ~p ; i = 1, 2, 3
consistente con la antisimetrı́a de G̃i , (9.437).
Evaluemos el corchete de Poisson de dos componentes de ~l:
[li , lj ] =
=
∂li ∂li ∂li ∂lj
·
−
·
= (−G̃i p~) · (G̃j ~r) − (G̃i ~r) · (−G̃j p~)
∂~r ∂~
p
∂~p ∂~r
G̃i~r · G̃j p
~ − G̃j ~r · G̃i ~p
(9.439)
p
= ~rT G̃Ti G̃j ~p − ~rT G̃Tj G̃i p~ = ~rT (G̃Ti G̃j − G̃Tj G̃i )~
Como los G̃i son antisimétricos, G̃Ti = −G̃i ,
p
[li , lj ] = ~rT (G̃j G̃i − G̃i G̃j )~
(9.440)
Las transformaciones canónicas / 395
De acuerdo con la ecuación (7.224) que define el álgebra de Lie de las rotaciones:
G̃j G̃i − G̃i G̃j
[li , lj ] =
= ǫjik G̃k
ǫjik ~rT G̃k p~
(9.441)
=
−ǫijk ~r · G̃k p~
=
ǫijk lk
lo cual concuerda con el resultado obtenido en (9.422).
Decimos que li y G̃i tienen la misma álgebra de Lie, definida por corchetes de
Poisson de variables dinámicas y de conmutadores de matrices respectivamente.
Volvamos al problema de las funciones escalares y vectoriales. Para rotaciones
infinitesimales una función escalar cumple:
φ(~r, p~) = φ(~r + δ~r, p~ + δ~
p) = φ(~r, ~p) + δ~r ·
∂φ
∂φ
+ δ~
p·
∂~r
∂~p
(9.442)
o sea que se cumple:
∂φ
∂φ
+ δ~
p·
=ǫ
δ~r ·
∂~r
∂~
p
∂G ∂φ ∂G ∂φ
·
−
·
∂~
p ∂~r
∂~r ∂~p
= −ǫ [G, φ] = 0
lo cual es consistente con (9.351). La ecuación (9.443) también implica que:
∂φ
∂φ
∂φ
∂φ
~n × ~r ·
=0
+ ~n × p~ ·
= 0 ⇒ ~n · ~r ×
+ p~ ×
∂~r
∂~
p
∂~r
∂~p
(9.443)
(9.444)
Como ~n es arbitrario, a fin de que φ sea escalar debe cumplirse:
~r ×
∂φ
∂φ
+ p~ ×
=0
∂~r
∂~
p
(9.445)
se cumple si ∂φ/∂~r = a~r + b~
p y ∂φ/∂~p = c~r + d~
p puesto que:
~r ×
∂φ
∂φ
+ p~ ×
= b~r × p~ + c~
p × ~r = 0 si b = c
∂~r
∂~
p
(9.446)
es decir, φ es de la forma:
φ=
1 2
1 2
a~r + c~r · p~ + d ~
p = A~r2 + B~
p2 + c~r · ~p
2
2
(9.447)
donde A, B y C no dependen de ~r ni de ~p. Ası́ pues:
[~r2 , li ] = 0 ; [~
p2 , li ] = 0 ; [~r · p~, li ] = 0 implican : [φ, li ] = 0
(9.448)
Una función vectorial F~ (~r, p~) puede escribirse en la forma:
F~ = f1 ~r + f2 ~
p + f3 ~l
donde f1 , f2 y f3 son funciones escalares, o sea de la forma (9.447).
(9.449)
396 / Mecánica clásica avanzada
Usando las fórmulas (9.427) vemos que:
[Fi , lj ] = ǫijk Fk → [F~ , li ] = ~ei × F~
(9.450)
De (9.428) se sigue que F~ se transforma bajo rotación como (9.431). Los vectores de
la forma (9.449) dependen del estado del sistema, en tanto que los vectores unitarios de
base ~ei son independientes de él como también los vectores ~n, que definen las rotaciones.
Si ~n mismo estuviera determinado por los vectores ~r y p~, entonces una rotación cambiarı́a
no sólo los componentes de la función F~ sino la naturaleza misma de la función (algo
análogo a lo que sucede con el hamiltoniano cuando las transformaciones canónicas
dependen del tiempo). En una rotación el cambio en F~ es:
∂ F~ = δφ [F~ , ~l.~n]
(9.451)
donde los vectores unitarios no son rotados por ~l · ~n. Éste no serı́a el caso si F~ fuera un
vector externo como un campo magnético, que no depende del estado de la partı́cula.
La expresión (9.451) vale pues sólo para funciones vectoriales de la forma (9.449). La
ecuación (9.450) también puede escribirse usando la notación diádica en términos del
~1 = ~e1~e1 + ~e2~e2 + ~e3~e3 :
diádico unidad ~
~
[F~ , ~l] = −~1 × F~
(9.452)
~ Es fácil mostrar que:
Sean dos vectores de estado del sistema, F~ , G.
~ ~l · ~n] = 0
[F~ · G,
(9.453)
~ es una función escalar, que no cambia por rotaciones.
En efecto, F~ · G
Por contraste, F~ · ~n′ donde ~n′ es un vector independiente del estado, no es una
función escalar y satisface que:
[F~ · ~n′ , ~l · ~n] = (~n′ × ~n) · F~
(9.454)
que en general no es cero.
Ejemplo 9.8.5 Mostrar que (9.450) no se cumple cuando F~ no depende exclusivamente
~ = (~r × B)/2
~
del estado de la partı́cula, por ejemplo cuando es el potencial vectorial A
~ es un vector fijo y constante en el espacio; digamos B
~ = B~l3 , o sea un campo
donde B
magnético homogéneo en la dirección z.
[Ai , li ] =
1
1
B[(~r × ~e3 )i , lj ] = Bǫik3 [xk , li ]
2
2
(9.455)
usando (9.427) obtenemos:
[Ai , lj ] =
=
1
1
Bǫik3 ǫkjl xl = − B(δij δ3l − δil δ3j ) xl
2
2
1
− B(δij x3 − δ3j xi )
2
(9.456)
Las transformaciones canónicas / 397
Por otra parte, el lado derecho en (9.450) es:
1
ǫijk Ak =
Bǫijk ǫkl3 xl
2
(9.457)
1
1
=
B(δil δj3 − δi3 δjl ) xl = B(δj3 xi − δi3 xj )
2
2
Comparando (9.456) con (9.457) vemos que no son iguales. En conclusión, no hay
una fórmula general para evaluar el corchete de Poisson de un vector que depende del
estado solamente y un vector espacial.
Correspondencia del formalismo de Poisson con el cuadro de Heisenberg
de la mecánica cuántica.12 Hay una correspondencia entre el conjunto de las variables
dinámicas en la descripción clásica y el conjunto de los operadores hermı́ticos en la
descripción cuántica de un sistema de l grados de libertad. En esos dos conjuntos se
puede definir un álgebra de Lie, de la siguiente manera:
(i) En esos conjuntos se puede definir una ley de composición interna mediante la
cual se hace corresponder a cada par de elementos del conjunto un tercer elemento del
mismo conjunto: C = [a, b]. Tal ley de composición satisface:
(ii) La propiedad reflexiva: [a, a] = 0, para todo elemento del conjunto, siendo 0
elemento del mismo.
(iii) La propiedad antisimétrica: [a, b] = −[b, a].
(iv) La propiedad de linealidad: [αa + βb, c] = α[a, c] + β[b, c] siendo α y β números
cualesquiera.
(v) La identidad de Jacobi: para cualesquiera tres elementos a, b, c, del conjunto
se cumple [a, [b, c]] + [b, [c, a]] + [c, [a, b]] = 0.
Esta álgebra es en general no conmutativativa, además de ser no asociativa: [a, [b, c]]
6= [[a, b], c].
En el conjunto de las variables dinámicas clásicas el álgebra de Lie está dada por
los corchetes de Poisson, que satisfacen todas las propiedades (i) a (v). En el conjunto
de los operadores hemı́ticos cuánticos se satisfacen las propiedades (i) a (v) definiendo
la ley de composición interna por medio de conmutadores: [â, b̂] = âb̂ − b̂â.
La correspondencia entre el formalismo de Poisson y el de Heisenberg se establece
de la siguiente manera: a cada variable canónica de estado pν o qν , ν = 1, 2, 3, ...l,
le corresponde un operador hermı́tico, p̂ν o q̂ν , ν = 1, 2, ...l. En consecuencia a cada
variable dinámica f (q, p, t) le corresponde un operador hermı́tico construido a partir
de los operadores p̂ν o q̂ν : fˆ(q̂, p̂, t). A cada corchete de Poisson fundamental le corresponde un conmutador fundamental. La correspondencia entre el corchete de Poisson y
conmutadores es:
1
1
(9.458)
[f, g] → [fˆ, ĝ] = (fˆĝ − ĝfˆ)
ih̄
ih̄
En particular a los corchetes fundamentales de Poisson, (9.423), les corresponde:
q̂µ q̂ν − q̂ν q̂µ = 0 ;
p̂µ p̂ν − p̂ν p̂µ = 0
q̂µ p̂ν − p̂ν q̂µ = ih̄δµν ; µ, ν = 1, 2, ...l
12 Véase
el capı́tulo 12.
(9.459)
398 / Mecánica clásica avanzada
A la relación (9.426) le corresponde:
t̂0 Ĥ − Ĥ t̂0 = ih̄
(9.460)
similarmente,
li = ih̄ǫijk l̂k
lj − ˆ
lj ˆ
l̂i ˆ
Las ecuaciones de movimiento de Heisenberg son:
ˆq̇ ν = 1 q̂ν Ĥ − Ĥ q̂ν ; ˆṗν = 1 p̂ν Ĥ − Ĥ p̂ν ; ν = 1, 2, ...l
ih̄
ih̄
(9.461)
(9.462)
Si G̃i (q, p, t) son los generadores infinitesimales de un grupo de simetrı́as, que
satisface las relaciones de álgebra de Lie clásicas,
i
h
(9.463)
G̃i , G̃j = Cijk G̃k
donde G̃i (q, p, t) son llamadas las constantes estructurales, las correspondientes relaciones de álgebra de Lie cuánticas son:
Ĝi Ĝj − Ĝj Ĝi = iCijk h̄Ĝk
(9.464)
en particular para el grupo de rotaciones tridimensional, Cijk = ǫijk , que caracterizan
al grupo SO(3).
Toda la mecánica cuántica puede hacerse corresponder con la mecánica clásica a
partir de las relaciones que hemos mencionado; con la mecánica cuántica en el formalismo
de Heisenberg y con la mecánica clásica en el formalismo de Poisson. La analogı́a llega
hasta el punto de formularse un principio de Hamilton cuántico (principio de acción de
Schwinger) y construirse una integral de Poincaré-Cartán.
Ejemplo 9.8.6 Sea una variable dinámica B independiente del tiempo, la cual satisface
la última igualdad de la ecuación (9.352). Mostrar que la solución de dicha ecuación coincide formalmente con la fórmula de Hausdorff-Baker-Campbell (H.B.C.) de la mecánica
cuántica.
En mecánica cuántica se obtiene un operador en el tiempo t a partir del operador
en el tiempo cero por la relación:
B̂(t) = eiĤt/h̄ B̂(0)e−iĤt/h̄
(9.465)
donde Ĥ es el operador hamiltoniano. Se puede mostrar que esta ecuación equivale a la
fórmula de H.B.C:
2
1 it
it
[Ĥ, [Ĥ, B̂o ]]
B̂(t) = B̂0 + [Ĥ, B̂0 ] +
h̄ 2! h̄
n
(9.466)
1 it
+...
[Ĥ, [Ĥ, ...[Ĥ, B̂0 ]...]] + ...
{z
}
|
n! h̄
n corchetes
Las transformaciones canónicas / 399
(véase el texto de Messiah, Mécanique quantique, tomo 1, capı́tulo 8). Clásicamente la
ecuación de movimiento para la variable dinámica B es (9.352):
Ḃ = [B, H]
(9.467)
Formalmente B puede expandirse en serie de Tayor alrededor de t = 0:
B = B0 + tḂ
+
0
t2
B̈
2!
+ ...
0
tn (n)
B
n!
+ ...
(9.468)
0
Notando que:
B̈ = [Ḃ, H] = [[B, H], H], ...
(9.469)
obtenemos:
B = B0 − t[H, B]|0 +
t2
[H, [H, B]]
2!
0
(9.470)
1
+ ... (−t)n [H, [H ...[H, B] ...]] + ...
{z
}
|
n!
n corchetes
0
Es clara la correspondencia entre (9.466) y (9.470) con sólo reemplazar el corchete
de Poisson por i/h̄ veces el conmutador.
La expresión (9.466) puede también obtenerse a partir de las fórmulas cuánticas
que corresponden a (9.467) y (9.468):
ˆ = i [Ĥ, B̂]
(9.471)
Ḃ
h̄
Como ilustración, sea una partı́cula en un campo homogéneo gravitacional −mg.
El hamiltoniano cuántico será:
p̂2
− mg x̂
(9.472)
Ĥ =
2m
Sea B̂ = Ĥ y B̂0 = x̂0 . Hallemos a x̂ usando la fórmula (9.466). Es necesario
evaluar los siguientes conmutadores:
1 2
−1 [Ĥ, x̂0 ] =
p̂0 , x̂0 =
x̂0 , p̂20
2m
2m
(9.473)
−1
ih̄
=
([x̂0 , p̂0 ] p̂0 + p̂0 [x̂0 , p̂0 ]) = − p̂0
2m
m
ih̄
[Ĥ, [Ĥ, x0 ]] = −mg x̂0 , − p̂0 = −gh̄2
(9.474)
m
Como el conmutador (9.474) es constante, todos los conmutadores de orden superior se anulan. Reemplazando (9.473) y (9.474) en (9.466):
1
p̂0
t + gt2
(9.475)
m
2
La ecuación (9.475) es formalmente igual a la expresión clásica que se obtendrı́a a
partir de (9.470).
x̂ = x̂0 +
400 / Mecánica clásica avanzada
9.9.
Pruebas del carácter canónico de una transformación
La prueba más directa consiste en usar la transformación junto con las ecuaciones
de Hamilton en las variables originales para obtener las ecuaciones de movimiento en las
nuevas variables; la transformación será canónica si las nuevas ecuaciones de movimiento
lo son para un hamiltoniano cualquiera; esto se usó en los ejemplos de las ecuaciones
(3.92) y (3.93). Otra prueba consiste en mostrar que existe una función generatriz U
para la transformación, tal que las fórmulas de la transformación se puedan llevar a la
forma (9.260). A continuación veremos otros métodos de prueba como son los corchetes
de Lagrange y Poisson y la llamada condición simplicial.
Veamos que en la prueba del carácter canónico de una transformación es suficiente
demostrar que la transformación para un tiempo dado es canónica. Sea la transformación:
q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l
(9.476)
Si la transformación es canónica se debe cumplir:
l
X
ν=1
pν ∆q ν − H ∆t = C
l
X
ν=1
pν ∆qν − H ∆t
!
− ∆F (q, p, t)
(9.477)
Si en (9.477) tomamos un tiempo fijo y arbitrario t = t′ obtenemos:
l
X
ν=1
pν δq ν = C
l
X
ν=1
pν δqν − δF (q, p, t)
(9.478)
Ahora (9.478) es la identidad que define una transformación canónica que no depende del tiempo,
q ν = q ν (q, p, t′ ) ; pν = pν (q, p, t′ ) ; ν = 1, 2, ...l
(9.479)
Entonces, las ecuaciones (9.479) definen una transformación canónica con valencia C
y función generatriz F (q, p, t′ ) que no depende del valor escogido para t = t′ . Veamos
ahora cómo la identidad que define el carácter canónico de la transformación dependiente
del tiempo, ecuación (9.477), puede obtenerse de la identidad correspondiente para la
transformación independiente del tiempo, ecuación (9.478). La ecuación (9.4) relaciona
las variaciones δ con las variaciones ∆:
∆q ν = δq ν + q̇ ν ∆t ;
ν = 1, 2, ...l
(9.480)
Con expresiones análogas para ∆pν , ∆qν , ∆pν . Entonces la relación entre ∆F y
δF será:
#
" l X ∂F
∂F
∂F
∆t
(9.481)
q̇ν +
ṗν +
∆F = δF +
∂qν
∂pν
∂t
ν=1
Las transformaciones canónicas / 401
Usando las fórmulas (9.480) y (9.481), la ecuación (9.478) se transforma en:
l
X
ν=1
p ∆q ν − q̇ ν ∆t
= C
l
X
ν=1
+
"
pν (∆qν − q̇ν ∆t) − ∆F
l X
∂F
ν=1
∂F
q̇ν +
ṗν
∂qν
∂pν
∂F
+
∂t
#
∆t
(9.482)
La ecuación (9.482) coincidirá con (9.477) si se define la función H por la ecuación:
l X
∂F
∂F
∂F
H = CH +
pν q̇ ν − Cpν q̇ν +
q̇ν +
ṗν +
(9.483)
∂qν
∂pν
∂t
ν=1
El paréntésis en (9.483) se puede escribir también en la forma siguiente si asumimos
que la transformación es libre de primera clase, de modo que F es función de (q, q, t):
l X
∂F1
∂F1
pν q̇ ν − Cpν q̇ν +
(9.484)
q̇ν +
ṗν
∂qν
∂pν
ν=1
Esta expresión es cero, de acuerdo con las fórmulas de la transformación (9.158).
Se sigue entonces que:
∂F1
(9.485)
∂t
Se llega al resultado correspondiente a (9.485) si la transformación tiene una estrutura arbitraria, es decir, regida por las fórmulas (9.260). Concluimos que a fin de que la
transformación (9.476) sea canónica es necesario y suficiente que todas las transformaciones independientes del tiempo obtenidas de la transformación (9.476) por reemplazar
a t por un valor árbitrario t′ , sean canónicas, es decir, que satisfagan la ecuación (9.478),
con una y la misma valencia C y una y la misma función generatriz F . Por esta razón,
al formular las pruebas para el carácter canónico de una transformación, basta restringirse a la consideración de las transformaciones que no contienen la variable temporal t
explı́citamente:
!
~q, ~p
q ν = q ν (q, p) ; pν = pν (q, p) ; ν = 1, 2, ...l ; J
6= 0
(9.486)
~q, p~
H = CH +
Los corchetes de Lagrange. Para la transformación canónica (9.486), la identidad (9.477) toma la forma:
l
X
ν=1
pν ∆ q ν = C
l
X
ν=1
pν ∆qν − ∆K(q, p)
(9.487)
Si en (9.487) expresamos a ∆q ν en función de ∆qν y ∆pν usando las fórmulas
(9.486) obtenemos:
#
"
!
!
l
l
l
X
X
X
∂q ν
∂qν
(9.488)
Cpν −
∆qν −
∆pν
∆K =
pν
pµ
∂qν
∂pν
ν=1
µ=1
ν=1
402 / Mecánica clásica avanzada
∆K será un diferencial exacto si se cumplen las condiciones:
!
!
l
l
X
X
∂q µ
∂q µ
∂
∂
Cpλ −
=
Cpν −
pµ
pµ
∂qν
∂qλ
∂qλ
∂qν
µ=1
µ=1
∂
∂pν
∂
∂pν
l
X
∂q µ
− pµ
∂pλ
µ=1
l
X
∂q µ
Cpλ −
pµ
∂qλ
µ=1
!
!
=
∂
∂pλ
=
∂
∂qλ
l
X
∂qµ
− pµ
∂pν
µ=1
l
X
∂q µ
− pµ
∂pν
µ=1
!
(9.489)
!
Si efectuamos las operaciones, las ecuaciones (9.489) se transforman en:
l X
∂pµ ∂q µ
∂pµ ∂q µ
= 0
−
∂qν ∂qλ
∂qλ ∂qν
µ=1
l X
∂pµ ∂q µ
∂pµ ∂qµ
= 0
−
∂pν ∂pλ
∂pλ ∂pν
µ=1
(9.490)
l X
∂pµ ∂q µ
∂pµ ∂q µ
= Cδνλ
−
−
∂pν ∂qλ
∂qλ ∂pν
µ=1
Se define el corchete de Lagrange de dos variables dinámicas f y g como:
l X
∂qν ∂pν
∂qν ∂pν
{f (q, p, t), g(q, p, t)} ≡
−
∂f ∂g
∂g ∂f
ν=1
(9.491)
Con esta notación, las fórmulas (9.490) toman la forma:
{qν (q, p, t), qλ (q, p, t)} = 0 ;
{qν (q, p, t), pλ (q, p, t)} =
{pν (q, p, t), pλ (q, p, t)} = 0
Cδνλ ;
(9.492)
ν, λ = 1, 2, ...l
En las fórmulas (9.492) hemos colocado la variable t, teniendo en cuenta el resultado anterior, según el cual el carácter de la transformación dependiente del tiempo es
el mismo que el de la transformación realizada en un tiempo fijo t = t′ . Las ecuaciones (9.492) expresan las condiciones suficientes y necesarias para que la transformación
(9.476) sea canónica. Esta es una de las mencionadas pruebas del carácter canónico de
una transformación.
Las fórmulas (9.492) se llaman los corchetes de Lagrange fundamentales: con las
ecuaciones (9.492) se pueden formar las siguientes igualdades entre matrices l × l:
{~
q, ~
q )} = 0̃l ; {~
p, p~)} = 0̃l ; {~q, ~p)} = C I˜l
(9.493)
Las transformaciones canónicas / 403
donde el elemento ν, λ, de la matriz {~q, ~q}, es {qν , qλ }, ..., y 0̃l y I˜ son las matrices
cero e identidad de orden l × l respectivamente. A su vez las fórmulas (9.493) se pueden
condensar en la siguiente expresión con matrices 2l × 2l:


{~
q, ~
q )}
{~
q, p~)}
−{~
q, ~
p)}
{~
p, p~)}


=
0̃l
−I˜l
I˜l
0̃l

 ≡ Ẽ
(9.494)
Ẽ es una matriz 2l × 2l antisimétrica, ortogonal, de cuadrado igual al negativo de
la matriz identidad, y de determinante +1:
Ẽ T =
−Ẽ
Ẽ T =
Ẽ −1
Ẽ 2 =
−I˜
det Ẽ =
+1
(9.495)
Vectores y matrices simpliciales. Se trata de una notación vectorial en el
espacio de fases con vectores de 2l elementos y matrices de dimensión 2l × 2l. Con
esta notación se “entremezclan” las coordenadas y momentos generalizados, y de ahı́ el
nombre de “simplicial” que recibe esta notación. El término matriz simplicial se reserva
para una cierta clase de matrices 2l × 2l, las matrices M̃ que satisfacen la relación:
M̃ T Ẽ M̃ = Ẽ
(9.496)
el conjunto de todas las matrices simpliciales de dimensión 2l × 2l forma un grupo,
llamado el grupo simplicial. En efecto:
(i) El producto de dos matrices simpliciales es una matriz simplicial.
(ii) Las matrices simpliciales son no singulares, o sea que para toda matriz simplicial
existe la matriz inversa. La matriz inversa de una matriz simplicial es simplicial.
(iii) La matriz identidad 2l × 2l es simplicial.
(iv) El producto de matrices simpliciales es asociativo.
Los vectores de 2l elementos en el espacio de fases se pueden escribir en la forma
[~u, ~v ], donde ~u y ~v son vectores columna de l elementos.
Una forma bilineal de dimensión 2l es:
f=
l
X
(−uν vν′ + vν u′ν ) = ~v · ~u ′ − ~u · ~v ′
(9.497)
ν=1
que puede escribirse en la forma:
 ′ 
~u

f = (~u, ~v ) Ẽ 
′
~v
(9.498)
404 / Mecánica clásica avanzada
Si ahora se someten los vectores [~u, ~v ] y [~u ′ , ~v ′ ] a una transformación mediante una
matriz simplicial M̃ :



 ′ 
  ′ 
~u
~u
~u
~u

 = M̃ 
 = M̃ 

; 
(9.499)
′
′
~v
~v
~v
~v
Entonces se cumple que:
 ′ 
 ′ 
~u
~u
 = (~u, ~v ) M̃ T Ẽ M̃ 

f = ~u, ~v Ẽ 
′
~v ′
~v
 ′ 
~u
=f
= (~u, ~v ) Ẽ 
′
~v
(9.500)
Es decir, la forma bilineal f es invariante bajo transformaciones de los vectores
[~u, ~v ] realizados por matrices simpliciales; en otras palabras, f es invariante bajo las
transformaciones del grupo simplicial.
La matriz jacobiana de una transformación
biana de una transformación canónica:

∂q 1 ∂q1 ∂q 1
∂q1
∂q1 ∂q 1
...
...
 ∂q1 ∂q2
∂ql ∂p1 ∂p2
∂pl


 ∂q
∂q 2
∂q 2 ∂q2 ∂q 2
∂q2

2
...
...

∂q
∂q
∂q
∂p
∂p
∂pl

1
2
l
1
2


 ...
... ... ...
...
... ... ...



 ∂ql ∂q l
∂ql ∂q l ∂q l
∂ql

...
...
 ∂q
∂q2
∂ql ∂p1 ∂p2
∂pl
1

J˜ = 

 ∂p1 ∂p1
∂p1 ∂p1 ∂p1
∂p1

 ∂q1 ∂q2 . . . ∂ql ∂p1 ∂p2 . . . ∂pl



∂p2 ∂p2 ∂p2
∂p2
 ∂p2 ∂p2

...
...
 ∂q1 ∂q2
∂q
∂p
∂p
∂pl
l
1
2



... ... ...
...
... ... ...
 ...


 ∂p
∂pl
∂pl ∂pl ∂pl
∂pl
l
...
...
∂q1 ∂q2
∂ql ∂p1 ∂p2
∂pl
canónica. Sea la matriz jaco












 


 
 
=
 
 















∂~q
∂~q
∂~p
∂~q

∂~q
∂~p 



~
∂p 
∂~p
(9.501)
donde ∂~p/∂~q, etc., son matrices jacobianas de orden l. Mostremos que J˜ satisface la
relación:
J˜T Ẽ J˜ = C Ẽ
(9.502)
Las transformaciones canónicas / 405
donde C es la valencia de

T
∂~q

 ∂~q

J˜T Ẽ J˜ = 

 ∂~q T
∂~
p
la transformación canónica. En


T
∂~p
∂~q


˜

0̃l −Il
∂~q 
 ∂~q




T 
 ∂~p
I˜l 0̃l
∂~p 
∂~q
∂~
p
efecto:

∂~q
∂~p 



~
∂p 
∂~p
(9.503)
efectuando el producto de matrices indicado en (9.503), teniendo en cuenta que cuando
las matrices constan de bloques se siguen las mismas reglas de la multiplicación ordinaria
de matrices, obtenemos:


T
T
T
T
∂~q ∂~p
∂~p ∂~q ∂~q ∂~p ∂~p ∂~q


−
−
 ∂~q ∂~q ∂~q ∂~q ∂~q ∂~p ∂~q ∂~p 


T
(9.504)
J˜ Ẽ J˜ = 



T
T
T
T
 ∂~p ∂~q
∂~q ∂~p ∂~p ∂~q
∂~q ∂~p 
−
−
∂~
p ∂~q ∂~
p ∂~q ∂~p ∂~p ∂~p ∂~p
∂~p/∂~qT indica la matriz traspuesta de ∂~p/∂~q. Notemos que los corchetes de Langrange
fundamentales, (9.490) y (9.492), se pueden escribir en forma de matrices. En efecto, las
ecuaciones (9.490) son los siguientes elementos de matriz:

!
!
!
! 
l
X
~p T
~q
~q T
~p
∂
∂
∂
∂

 =0
−
∂~
q
∂~
q
∂~
q
∂~
q
µ=1
νµ

!

!
~T
 ∂p
∂~
p
µ=1
l
X
~T
 ∂q
∂~
p
µ=1
l
X
νµ
νµ
µλ
∂~q
∂~
p
!
∂~p
∂~q
!
µλ
µλ
νµ
−
T
∂~q
∂~p
!
−
T
∂~q
∂~p
!
νµ
νµ
µλ
∂~p
∂~p
!
∂~q
∂~q
!
µλ
µλ
Comparando a (9.504) con (9.505) obtenemos que:


0̃l −C I˜l
 = C Ẽ
J˜T Ẽ J˜ = 
C I˜l
0̃

 =0
(9.505)

 = Cδνλ
(9.506)
Con lo cual queda demostrada la relación (9.502). Si la transformación canónica
es univalente, C = 1, entonces J˜ es una matriz simplicial. En general, para C 6= 1, se
dice que J˜ es una matriz simplicial generalizada, con valencia C. El conjunto de todas
las matrices simpliciales generalizadas (todas con la misma C) forma un grupo. Si M̃
es una matriz simplicial generalizada, se cumple que det M̃ = ±C l . En efecto, tomando
el determinante de (9.506) y teniendo en cuenta que el determinante de un producto de
matrices es igual al producto de los determinantes y que det Ẽ = +1,
det J˜T detẼ detJ˜ = C 2l det Ẽ
(9.507)
406 / Mecánica clásica avanzada
Como det J˜T = det J˜ se sigue que:
˜ 2 = C 2l ⇒ detJ˜ = ±C l
(det J)
(9.508)
O sea que para una matriz simplicial se cumple que det M̃ = ±1, o sea que las
matrices simpliciales son no singulares.
Sabemos que las igualdades (9.492), o sea (9.505), son las condiciones suficientes
y necesarias para que la transformación sea canónica. Por tanto la igualdad (9.506) se
cumple solamente si la transformación es canónica. Llegamos pues, a otra prueba del
carácter canónico de una transformación:
Para que la transformación q ν = q ν (q, p, t), pν = pν (q, p, t), ν = 1, 2, ...l sea
canónica, es necesario y suficiente que la matriz jacobiana J˜ correspondiente a esta
transformación sea una matriz simplicial generalizada con valencia constante C. Si la
transformación es univalente, entonces J˜ es una matriz simplicial ordinaria. Entonces,
˜ ecuación (9.502), debe cumplirse idénticala condición de la naturaleza simplicial de J,
mente para todos las variables (q, p, t).
El teorema de Liouville. En la sección 9.6, ecuación (9.269), se halló que el
movimiento de un sistema hamiltoniano puede considerarse como una transformación
canónica libre de primera clase univalente. En consecuencia, su matriz jacobiana es
simplicial y su determinante vale ±1. Se sigue entonces que el volumen de una región
arbitraria del espacio de fases es constante en el tiempo. Tal volumen es:
Z Z
Z
Γ=
... dq 1 dq 2 ...dq l dp1 dp2 ...dpl
(9.509)
que puede expresarse también en la forma:
!
Z Z
Z
~q, ~p
dq1 dq2 ...dql dp1 dp2 ...dpl
J
Γ=
...
~q, p~
(9.510)
˜ Si la transformación es canónica,
donde J es el determinante de la matriz jacobiana J.
l
˜
J = det J = ±C , o se a que:
Γ = Γ|C|l
(9.511)
En particular, Γ es invariante bajo la transformación canónica de evolución temporal, o sea que:
dΓ
=0
dt
(9.512)
La ecuación (9.512) puede considerarse como una prueba del teorema de Liouville,
véase ecuación (3.137). Γ es una de las integrales invariantes de Poincaré, ecuación (9.81).
Invariancia de los corchetes de Poisson bajo transformaciones canónicas.
Hemos ya mostrado esta invariancia bajo transformaciones canónicas infinitesimales,
ecuación (9.394) y siguientes. Veremos ahora que esta invariancia vale para cualquier tipo
de tranformación canónica univalente; no solamente para aquellas que pueden obtenerse
a partir de la transformación continua de parámetros.
Las transformaciones canónicas / 407
Empecemos por mostrar que la condición de canonicidad (9.502) puede expresarse
en la forma:
J˜Ẽ J˜T = C Ẽ
(9.513)
˜T −1
˜−1
en efecto, multiplicando por (J ) a (9.502) por la izquierda y por J por la derecha,
obtenemos:
1
(J˜T )−1 Ẽ J˜−1 = Ẽ
(9.514)
C
En (9.514) ahora tomamos las matrices inversas de ambos lados y usamos las
propiedades de las ecuaciones (9.495):
−1
i−1
h
1
Ẽ
= J˜Ẽ −1 J˜T = −J˜Ẽ J˜T ;
(J˜T )−1 Ẽ J˜−1
= −C Ẽ
(9.515)
C
O sea que la siguiente es otra expresión de la condición de canonicidad:
J˜Ẽ J˜T = C Ẽ
(9.516)
La ecuación (9.516) puede obtenerse a partir de (9.502) intercambiando los papeles
de J˜ y J˜T . Comparando con (9.503) vemos que J˜Ẽ J˜T se puede obtener de (9.504)
intercambiando a ∂~q/∂~q y ∂~p/∂~
p por sus respectivas traspuestas y a ∂~p/∂~q por (∂~q/∂~p)T .
Es decir:


T
T
T
T
∂~q ∂~q
∂~q ∂~q
∂~q ∂~p
∂~q ∂~p


−
−
 ∂~
∂~q ∂~p
∂~p ∂~q
∂~q ∂~p 
 p ∂~q

T
˜
˜
J Ẽ J = 
(9.517)


T
T
T
T 
 ∂~p ∂~q

~
~
~
~
~
~
∂p ∂q
∂p ∂p
∂p ∂p
−
−
,
∂~
p ∂~q
∂~q ∂~p
∂~p ∂~q
∂~q ∂~p
Los corchetes de Poisson fundamentales pueden escribirse en forma de matriz. En
efecto:

!
! 
!
!
l
X
~q
~q
~p T
~p T
∂
∂
∂
∂


[q ν , pλ ] =
−
∂~q
∂~p
∂~p
∂~q
µ=1
µλ
µλ
νµ
νµ
(9.518)
!
T
T
∂~q ∂~p
∂~q ∂~p
=
−
∂~q ∂~
p
∂~p ∂~q
νλ
y similarmente:
[q ν , q λ ] =
T
T
∂~q ∂~q
∂~q ∂~q
−
∂~q ∂~
p
∂~
p ∂~q
!
µλ
;
[pν , pλ ] =
T
T
∂~p ∂~p
∂~p ∂~p
−
∂~q ∂~p
∂~p ∂~q
Se sigue entonces que (9.516) se puede escribir como:



 ~ ~ − q, q − ~q, ~p
0̃l −I˜l C
 = C Ẽ = 

J˜Ẽ J˜T = 
T
˜
~
~
~q , ~p
Il C
0̃l
− p, p
!
(9.519)
µλ
(9.520)
408 / Mecánica clásica avanzada
O sea que las condiciones de canonicidad de la transformación también se pueden
expresar por medio de los corchetes de Poisson, según (9.520): [~q , ~q ] = 0̃l ; [~p, ~p] = 0̃l ;
[~q, ~p] = C I˜l , o en términos de los elementos de matriz.
[q ν , q λ ] = 0 ;
[pν , pλ ] = 0 ;
[q ν , pλ ] = Cδνλ ;
ν, λ = 1, 2, ...l
(9.521)
Las ecuaciones (9.521) coinciden con (9.423) cuando la transformación canónica es
univalente.
Sean ahora dos variables dinámicas f (q, p, t) y g(q, p, t). Al expresar a las qν , pν ; ν =
1, 2, ...l, en términos de las variables (q, p, t) por medio de la transformación canónica,
obtenemos las variables dinámicas f (q, p, t) y g(q, p, t). O sea que los corchetes de Poisson
de f con g pueden evaluarse bien respecto a las variables (q, p) o respecto a las variables
(q, p). Mostremos qué vale la identidad:
[f, g](q,p) = C[f, g](q,p)
(9.522)
notemos que:
[f, g](q,p) =
=
[f, g](q,p) =
=
l X
∂f ∂g
∂f ∂g
−
∂qν ∂pν
∂pν ∂qν
ν=1
∂f ∂g ∂f ∂g
−
∂~q ∂~p
∂~p ∂~q
(9.523)
l X
∂f ∂g
∂f ∂g
−
∂q ν ∂pν
∂pν ∂q ν
ν=1
∂f ∂g ∂f ∂g
−
∂~q ∂~p
∂~p ∂~q
Las ecuaciones (9.523) se pueden expresar de la siguiente manera con la notación
de (9.498):
[f, g](q,p) =
∂g ∂g
,
∂~q ∂~p

∂f
 ∂~q 


Ẽ 

 ∂f 
∂~p

(9.524)
y similarmente [f, g](q,p) . Veamos cómo se transforman las derivadas respecto a qν y
respecto a pν en función de las derivadas respecto a q ν y respecto a pν :
l X
∂f ∂qµ
∂f ∂pµ
∂f
=
=
+
∂qν
∂q ν ∂qν
∂pµ ∂qν
µ=1
T
T
∂~q ∂f
∂~p ∂f
−
∂~q ∂~q
∂~q ∂~p
!
(9.525)
ν
Las transformaciones canónicas / 409
y similarmente para ∂f /∂pν . Vemos entonces que:


T
T


∂~p ∂f
∂~q ∂f
∂f
+


∂~q ∂~p 
 ∂~q 
 ∂~q ∂~q





= 
=


 ∂f 
T
T
 ∂~q ∂f
~
∂ p ∂f 
+
∂~
p
∂~
p ∂~q
∂~p ∂~p



T
T
∂f
∂~p
∂~q


 ∂~q
∂~q 
∂~q 









T
T   ∂f 
 ∂~q
∂~p 
∂~p
∂~
p
∂~p
(9.526)
Comparando a (9.526) con (9.501) vemos que: [∂f /∂~q, ∂f /∂~p] = J˜T ∂f /∂~q, ∂f /∂~p
Es decir:


∂f
 ∂~q 

∂g ∂g ˜ ˜T 

(9.527)
J Ẽ J 
[f, g](q,p) =
,


~
∂~
q ∂p
 ∂f 
∂~p
De acuerdo con (9.516) obtenemos entonces:


∂f
 ∂~q 


∂g ∂g
 = C [f, g]
C Ẽ 
[f, g](q,p) =
,
(q,p)


∂~
q ∂~p
 ∂f 
∂~p
(9.528)
Hemos mostrado que si la transformación (q, p) → (q, p) es canónica entonces se
cumple la igualdad (9.522). El inverso también vale: si para cualquier par de variables
dinámicas f y g vale la identidad (9.522) para una y la misma constante C 6= 0, entonces
la transformación de las 2l variables qν y pν a las 2l variables q ν y pν es canónica con
valencia C.
Este es pues otro test del carácter canónico de una transformación. Para una
transformación canónica univalente, C = 1, se cumple:
[f, g](q,p) = [f, g](q,p)
(9.529)
En otras palabras, los corchetes de Poisson son invariantes bajo transformaciones
canónicas univalentes, lo cual es el mismo resultado (9.402). En resumen, para estas
transformaciones es innecesario especificar respecto a cuales variables se evalúan los corchetes de Poisson.
Otras propiedades de los corchetes de Lagrange. Sea el siguiente conjunto
de 2l variables dinámicas: u1 , u2 , ...ul , v1 , v2 , ...vl . Usando notación vectorial, dicho
410 / Mecánica clásica avanzada
conjunto se puede escribir como (~u, ~v ). Podemos formar con estas variables los siguientes
corchetes de Lagrange y Poisson:
[~u, ~u]; [~u, ~v ]; [~v , ~v ]; {~u, ~u}; {~u, ~v }; {~v , ~v }
A su vez con estos corchetes podemos formar las siguientes matrices de orden 2l:




[~u, ~u] [~u, ~v ]
{~u, ~u} {~u, ~v }
 ; L̃ = 

P̃ = 
(9.530)
[~v , ~u] [~v , ~v ]
{~v , ~u} {~v , ~v }
Mostremos que se cumple lo siguiente: L̃P̃ = I, donde I˜ es la identidad de orden
2l.
Los corchetes de Langrange se pueden expresar en forma similar a (9.524):

∂~q
 ∂f 
∂~q ∂~p


{f, g} =
Ẽ 
,

 ∂~p 
∂g ∂g
∂f

(9.531)
Un elemento tı́pico de la matriz L̃P̃ es de la forma siguiente:
2l
X
i=1
{xn , xi } [xi , xm ] =
2l
X
i=1
∂~z T
∂~z
Ẽ
∂xi
∂xn
!
∂xm T ∂xi
Ẽ
∂~z
∂~z
!
(9.532)
donde xi es una componente del vector [~u, ~v ] y zi representa una componente del vector
[~
q , p~].13 Notando que:
2l
X
∂zr ∂xi
∂zr
=
= δrs ;
∂x
∂z
∂zs
i
s
i=1
Ẽ 2 = −I˜
(9.533)
y que:
Eµr Ert
∂zt ∂xm
= −δnm
∂xn ∂zµ
(9.534)
obtenemos entonces que:
2l
X
i=1
{xn , xi } [xi , xm ] = −δnm ⇒ L̃P̃ = −I˜
(9.535)
O sea que el corchete de Lagrange es, excepto por el signo, el recı́proco del corchete
de Poisson. La invariancia del uno implica la invariancia del otro. Vimos que los corchetes
de Poisson son invariantes bajo transformaciones canónicas univalentes, por tanto se
13 Véase
las fómulas (9.385).
Las transformaciones canónicas / 411
sigue la invariancia de los corchetes de Lagrange bajo estas fransformaciones.14 Otras
propiedades de los corchetes de Lagrange son las siguientes:
   
q
~q 
 ~
  ,   = Ẽ


p~
p
~
{~
q, f } =
∂~p
∂~q
; {~
p, f } = −
∂f
∂f
(9.536)
{g, f } = −{f, g}
{cf, g} = {f, cg} =
1
{f, g}
c
No se cumplen las propiedades de linealidad ni la identidad de Jacobi, o sea que
los corchetes de Lagrange no permiten definir un álgebra.
Ejemplo 9.9.1 Analizar la siguiente transformación compleja, y si es canónica, hallar la
función generatriz y la valencia.
1
1
q = √ (q + ip) ; p = √ (q − ip)
2
2
La transformación puede escribirse en la forma:
√
√
p = i(q − 2q) ; p = 2q − q
(9.537)
(9.538)
La transformación será canónica libre de primera clase con valencia C, si, de acuerdo con (9.158), puede generarse por una función tal que:
Cp =
∂F
∂F
; p=−
∂q
∂q
(9.539)
Es simple mostrar que la transformación (9.537) será canónica si F y C están dadas
por:
F =
1 2 1 2 √
q + q − 2qq ; C = −i
2
2
(9.540)
De acuerdo con (9.159), el nuevo hamiltoniano será:
H = iH
(9.541)
Es simple mostrar de (9.492) que {q, p} = −i.
Ejemplo 9.9.2 En la transformación canónica del ejemplo 9.9.1 hallar el corchete de
Poisson de q, y de p. Resolver el problema del oscilador armónico lineal usando dicha
transformación canónica.
14 El corchete de Lagrange de dos constantes de movimiento es una constante de movimiento. Sin
embargo, a diferencia de los de Poisson, los corchetes de Lagrange no sirven para hallar nuevas constantes
de movimiento porque para evaluarlos hay que conocer todas esas constantes.
412 / Mecánica clásica avanzada
Como la transformación (9.537) es canónica con valencia C = −i, se sigue de la
fórmula general para los corchetes de Poisson que:
[q, p] = −i
(9.542)
resultado que también puede obtenerse directamente de las fórmulas de la transformación.
Nótese que toda transformación lineal con coeficientes constantes en el espacio de
fases bidimensional será canónica con valencia igual al determinante de la matriz de la
transformación:
q = aq + bp ;
p = eq + f p ⇒ c = af − be
(9.543)
El hamiltoniano del oscilador armónico lineal es:
H=
1
p2x
+ kx2
2m 2
(9.544)
y puede escribirse en la forma siguiente:
H=
1
I(q 2 + p2 )
2
mediante la transformación:
r
√
I
q ; px = Imω p
x=
mω
(9.545)
(9.546)
donde k = mω 2 e I es una constante que puede tomar cualquier valor. En la transformación (9.546) procedemos por analogı́a con una correspondiente transformación cuántica.
Si ahora realizamos la transformación canónica:
1
i
q = √ (q + p) ; q = √ (p − q)
2
2
(9.547)
obtenemos para H:
H = Iωqp
(9.548)
entonces el hamiltoniano CH será:
−iH = −iIωN
(9.549)
donde llamamos N a:
N = qp
podemos ver que E = IN y que:
N , q = −q ; N , p = p
(9.550)
(9.551)
Vemos que q, p y N son análogos a los operadores de destrucción, de creación y de
número, â, â+ , N̂ , de la mecánica cuántica.
Las transformaciones canónicas / 413
La transformación (9.543) es de cambio de escala, o sea que según las fórmulas
(9.191) y (9.192) es libre de segunda clase, con valencia igual al producto de los factores
de escala:
r
mω
1
1
C=
·√
(9.552)
=
I
I
Imω
de modo que el hamiltoniano correspondiente a las variables canónicas q y p será ωqp.
Entonces, el hamiltoniano correspondiente a q y p es:
H = −iωq p
(9.553)
Las fórmulas (9.551) nos permiten escribir directamente las ecuaciones de movimiento de Poisson, ecuaciones (9.363):
q̇ = q, H ; ṗ = p, H
(9.554)
con lo cual de (9.553) y (9.551) obtenemos:
q̇ = −iωq ; ṗ = iωp
(9.555)
Que podemos integrar fácilmente:
q = q 0 e−iωt ; p = q ⋆0 eiωt
(9.556)
donde hemos notado que q y p son complejo conjugadas entre sı́. Utilizando las fórmulas
(9.547) obtenemos a q y p en función del tiempo:
√
√
q = 2Re (q 0 e−iωt ) ; p = 2Im(q 0 e−iωt )
(9.557)
Es claro que q 0 puede determinarse de las condiciones iniciales sobre q y p:
√
√
(9.558)
q0 = 2Re q 0 ; p0 = 2Imq0
Entonces obtenemos para q(t) y p(t) en términos de sus valores iniciales:
q = q0 cos ωt + p0 sen ωt
(9.559)
p = p0 cos ωt + q0 sen ωt
y para las variables originales x y px , obtenemos:
x = x0 cos ωt +
px0
sen ωt
mω
(9.560)
px = px0 cos ωt − mωx0 sen ωt
Ejemplo 9.9.3 Analizar las dispersiones de x y de px para un ensamble de osciladores
armónicos lineales que tengan la misma energı́a. El ensamble está ilustrado en el ejemplo
4.8.1, sección 4.8.
414 / Mecánica clásica avanzada
Los distintos sistemas del ensamble difieren sólo por la fase. La dispersión en x se
caracteriza por su varianza (∆x)2 , definida por:
(∆x)2 = h(x − hxi)2 i = hx2 i − hxi2
(9.561)
x = Ax sen(ωt + δ)
(9.562)
donde h...i denota el promedio sobre el ensamble. Como x(t) puede escribirse en la forma:
Si promediamos sobre todos los posibles valores de δ, 0 ≤ δ ≤ 2π, obtenemos los
promedios de ensamble microcanónicos:
A2x
; hxi = 0
(9.563)
2
px se comporta análogamente. Obtenemos entonces que:
1
1
(∆x)2 = A2x ; (∆p)2 = A2p
(9.564)
2
2
El producto ∆x ∆px será entonces:
1
(9.565)
(∆x) (∆px ) = Ax Ap
2
Notamos según el ejemplo 9.9.2 que los máximos valores de x y px , que se obtienen
de las fórmulas (9.560), son:
px
A2x = x20 + 2 0 2 ; A2p = p2x0 + m2 ω 2 x20
(9.566)
m ω
que pueden expresarse en función de q0 y p0 mediante (9.546):
I
A2x =
(q 2 + p20 ) ; A2p = Iωm(q02 + p20 )
(9.567)
mω 0
Reemplazando (9.548) en (9.546) obtenemos:
hx2 i =
(∆x) (∆px ) = I(q02 + p20 )
(9.568)
Notando que según (9.550):
N = (Re q 0 )2 + (Im q 0 )2
(9.569)
Entonces obtenemos al usar (9.549):
E
(9.570)
ω
Este valor no depende del tiempo, en concordancia con el teorema de Liouville,
ejemplo 4.8.4, sección 4.8. El resultado (9.569) es una propiedad del ensamble o sea que
para un valor dado de E, queda determinado de manera única el valor del producto
∆x ∆px . Solamente disminuyendo el valor de E es posible disminuir el valor de este
producto; o sea que una disminución de ∆x implica un aumento en ∆px y viceversa.
Según la desigualdad de Heisenberg para osciladores mecánico-cuánticos:
h̄
∆x ∆px ≥
(9.571)
2
se sigue entonces de (9.551) que E ≥ h̄ω/2. Si tomamos I igual a la constante de
Planck, se sigue también de (9.551) que E = nh̄ω. Estos resultados recuerdan a análogos
resultados mecánico-cuánticos.
∆x ∆px = IN =
10
La ecuación de Hamilton-Jacobi con
variables de acción-ángulo
Aquı́ estudiaremos más en detalle el significado fı́sico de las soluciones de la ecuación de Hamilton-Jacobi con énfasis en los sistemas que presentan movimientos multiperiódicos. Se desarrollará la teorı́a hasta el punto en el cual se perciban claramente las
diferencias y similitudes con la mecánica cúantica, cuando se trate con sistemas atómicos.
Las soluciones y los métodos de solución de la ecuación de Hamilton-Jacobi han
merecido numerosos estudios. El método de separación de variables permite en principio
resolver cualquier problema integrable introduciendo las coordenadas adecuadas. Los
modelos no integrables, como el famoso problema de los tres cuerpos, son objeto de
muchas investigaciones en la actualidad. Un estudio matemático de los principales casos
en que se resuelve la ecuación de Hamilton-Jacobi está en la sección 27 del texto de
(Gantmacher Op. cit.).
10.1.
Los invariantes adiabáticos
Desde cuando el fı́sico aleman Max Planck en 1899 descubrió que la absorción y
la emisión de energı́a radiante por la materia no se producen en cantidades arbitrarias
sino de una manera cuantizada, los fı́sicos han tratado de introducir las ideas cúanticas en la mecánica clásica. En 1913 Niels Bohr explicó el espectro del hidrógeno con la
mecánica clásica más dos suposiciones de tipo cúantico: que los electrones sólo tienen
ciertos movimientos periódicos (órbitas) estables y no un continuo de tales movimientos,
y que pueden pasar entre dos órbitas adyacentes por emitir o absorber un cuanto de luz.
Los movimientos ligados de los sistemas cuánticos aislados que son estables o estacionarios forman un conjunto discreto. Los demás estados son inestables, aunque ligados, y
forman un conjunto continuo; son estados no estacionarios. Desde entonces hasta la actualidad (y pasará algún tiempo hasta que la cuestión sea definitivamente resuelta), los
fı́sicos téoricos investigan los movimientos estables que presentan los sistemas atómicos;
con ello se busca determinar la causa de que ciertos estados sean estables y los demás
sean inestables. A comienzos del siglo la cuestión de interés no era tanto las causas de
415
416 / Mecánica clásica avanzada
la cuantización de los sistemas atómicos (lo cual se tomó como un dato experimental)
sino determinar cuales son las cantidades susceptibles de ser cuantizadas. Se halló que
las cantidades a ser cuantizadas deben satisfacer los siguientes dos requisitos: pueden
cambiar sólo por múltiplos enteros de la constante de Planck h̄ y deben permanecer
absolutamente inalteradas cuando se someta el sistema a una influencia externa que no
sea capaz de causar una alteración de magnitud h̄ en esa cantidad. Tales cantidades se
llaman invariantes adiabáticos y fueron extensivamente estudiados por P. Ehrenfest en
los años 1914-1923.1 Los invariantes adiabáticos de la vieja teorı́a cúantica coinciden con
las llamadas variables de acción.
Un invariante adiabático para un sistema de un grado de libertad. Sea
un sistema de un grado de libertad en un estado arbitrario de movimiento acotado con
lo cual el movimiento además será periódico. Sea λ un parámetro caracterı́stico de los
efectos externos sobre el sistema; si λ cambia, cambian los efectos externos sobre el
sistema con lo cual se realizará un trabajo y posiblemente cambie también la frecuencia
de la oscilación además de la energı́a total.
Ciertamente la energı́a total dependerá del valor de λ siendo constante para cada
valor que tenga λ: E = E(q, p, λ). Las expresiones para la energı́a total y el perı́odo del
movimiento son de la forma:
1
(10.1)
E = a(q, λ) q̇ 2 + U (q, λ)
2
Z q2 √
2a dq
√
T =
(10.2)
E
−U
q1
donde q1 y q2 son las raı́ces de la ecuación E = U (q, λ) para valores dados de E y λ.
Puesto que E depende de λ, T depende de E y de λ. Si λ cambia con el tiempo, E
dependerá del tiempo a través de λ:
Ė =
∂E
λ̇
∂λ
(10.3)
Se dice que el parámetro λ varı́a adiabáticamente si:
λ̇ ≪
λ
T
(10.4)
es decir, si λ varı́a muy poco en el curso de un perı́odo del movimiento del sistema. Un
invariante adiabático es una cantidad que no cambia cuando el sistema se somete a una
variación adiabática de λ. Sabemos que, en virtud de las ecuaciones de Hamilton:
Ḣ =
∂H
∂t
(10.5)
O sea que para un sistema conservativo como el que consideramos aquı́:
Ė =
1 El
∂H
∂H
λ̇
=
∂t
∂λ
(10.6)
tema continúa estudiándose en la actualidad. Véase por ejemplo: K.P. Marzlin, B.C. Sanders,
Physics review letters 93, 160408(2004). También http://xxx.lanl.gov/abs/quant-ph/0405059.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 417
Como λ varı́a muy poco en un perı́odo del movimiento, podemos considerar que
λ̇ también es constante. Entonces al promediar la ecuación (10.6) sobre un perı́odo
obtenemos:
Z
1 T ∂H
Ė = λ̇
dt
(10.7)
T 0 ∂λ
De acuerdo con una de las ecuaciones de Hamilton se cumple:
dt =
dq
∂H/∂p
(10.8)
La ecuación (10.7) se puede entonces escribir como:
I
∂H/∂λ
dq
∂H/∂p
(10.9)
Ė = λ̇ I
1
dq
∂H/∂p
H
donde
denota la integral de lı́nea sobre la trayectoria de fases del sistema en un
perı́odo de movimiento. En un perı́odo, por hipótesis, λ cambia muy poco, por tanto E
es constante, según (10.6). Como una trayectoria de fases se caracteriza por la relación:
p = p(q; E, λ)
(10.10)
donde E y λ son fijos, entonces p (o q) solo, es suficiente para especificar el estado. Sobre
una trayectoria de fases dada C se cumple entonces que H(q, p, λ) = HC (p, λ), luego:
dHc
∂Hc
∂Hc ∂p
=
+
dλ
∂λ
∂p ∂λ
(10.11)
Como durante un perı́odo E no cambia apreciablemente y HC = E se cumple
aproximadamente que:
∂Hc
∂Hc /∂λ
=−
∂p
∂p/∂λ
(10.12)
como por otra parte ∂HC /∂E = (∂HC /∂p)(∂p/∂E) = 1, cumple:
1
∂Hc
=
∂p
∂p/∂E
Reemplazando a (10.12) y (10.13) en (10.9) obtenemos:
I
∂p
dq
−
∂λ
Ė = λ̇ I
∂p
dq
∂E
La ecuación (10.14) se puede escribir en la forma:
I ∂p
∂p
Ė +
λ̇ dq = 0
∂E
∂λ
(10.13)
(10.14)
(10.15)
418 / Mecánica clásica avanzada
Dado que durante un perı́odo E y λ permanecen prácticamente constantes, de
(10.10) se sigue que:
∂p
∂p
∂p
Ė +
λ̇
=
∂t
∂E
∂λ
(10.16)
y podemos sin mayor error reemplazar a Ė por Ė, con lo cual en vez de (10.15) podemos
escribir:
I
I
d
∂p
dq = 0 (λ̇2 ) ⇒
p dq = 0 + 0(λ̇2 )
(10.17)
∂t
dt
Se define la variable de acción J como:
I
J = p dq
(10.18)
Entonces (10.17) nos dice que J˙ = 0, o sea que J es un invariante adiabático (una
cantidad que no cambia cuando λ varı́a adiabáticamente). Concluimos que J depende
de la energı́a del sistema pero varı́a muy poco con λ. Esto permite calcular a partir de
J la frecuencia del movimiento:
I
I
I
∂p
1
∂J
=
dq =
dq = dt = T
(10.19)
∂E
∂E
∂HC /∂p
o sea que:
ν=
1
∂J/∂E
(10.20)
La ecuación (10.18) tiene la siguiente interpretación geométrica: J es el valor del
área encerrada por la curva de fases que describe el sistema en un perı́odo. La invariancia
adiabática de J permite concluir que una perturbación al sistema que varı́a lentamente
con el tiempo puede producir una deformación de la trayectoria de fases pero de tal
manera que no se cambia el valor del área encerrada por esa curva. J también se puede
escribir como una integral de superficie:
Z
J = dq dp
(10.21)
Ejemplo 10.1.1 Evaluar la variable de acción J para un oscilador armónico unidimensional.
En este caso el hamiltoniano constante es:
H=
p2
1
+ mω 2 q 2 = E
2m 2
(10.22)
que puede escribirse en la forma:
q2
p2
+
=1
2mE
2E/(mω 2 )
(10.23)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 419
p La ecuación (10.23) define una elipse en el plano de fases cuyos semiejes son
y 2E/(mω 2 ). El valor de J es igual al área encerrada por la elipse, esto es:
p
√
E
J = π ( 2mE) ( 2E/(mω 2 )) = 2π
ω
√
2mE
(10.24)
La invariancia adiabática de J significa en este caso que al variar lentamente los
parámetros del oscilador (m y ω), la energı́a varı́a de manera proporcional a la frecuencia
ω.
Ejemplo 10.1.2 Mostrar explı́citamente la invariancia adiabática de J para un péndulo
simple sometido a un acortamiento o alargamiento adiabático de la cuerda, para pequeñas oscilaciones.
En este caso el hamiltoniano, constante, es:
H=
1 2 2
ml ϕ̇ + mgl(1 − cos ϕ) = E
2
(10.25)
para pequeñas oscilaciones:
ϕ̇2
ϕ2
1 2 2 1
ml ϕ̇ + mgl ϕ2 = E ⇒
+
=1
2
2
2
2E/(ml ) 2E/(mgl)
(10.26)
que es la ecuación de una elipse en el plano ϕ − ϕ̇, el área encerrada es:
p
2πE
E 1
√ = 2π
2E/(mgl) =
ω ml2
ml gl
H
Es claro que J = p dq está dada también por la expresión (10.24):
π
p
2E/(ml2 )
(10.27)
E
ω
(10.28)
J = 2π
para probar la invariancia adiabática de J, calculemos el trabajo realizado al variar la
longitud del hilo del péndulo en una cantidad dl. Este trabajo es:
dA = −mlϕ̇2 − mg cos ϕ dl
(10.29)
en (10.29) el primer término representa el trabajo de la fuerza de la ligadura y el segundo
el trabajo de la fuerza de gravedad. Para pequeñas oscilaciones (10.29) se puede escribir
como:
1
(10.30)
dA = −mg dl +
mg ϕ2 − mlϕ̇2 dl
2
El primer término en (10.30), −mg dl, representa el trabajo hecho para subir la
posición de equilibrio de la masa del péndulo; y el otro término representa la energı́a
comunicada a la oscilación, que llamaremos dE:
1
(10.31)
mg ϕ2 − mlϕ̇2 dl
dE =
2
420 / Mecánica clásica avanzada
Sabemos que para un valor dado de l los valores medios de las energı́as cinética y
potencial son iguales, e iguales a la mitad de la energı́a total E (teorema del virial):
1 2 2
1
1
ml ϕ̇ = mgl ϕ2 = E
2
2
2
(10.32)
Comparando (10.32) y (10.31), al tomar el promedio temporal de dE, obtenemos
que:
E
dl
2l
(10.33)
dω
1 dl
=−
ω
2 l
(10.34)
dE = −
p
Como la frecuencia angular es ω = g/l, vemos que el cambio fraccional de ω es
proporcional al cambio fraccional de l cuando la longitud del péndulo se altera en dl:
Comparando a (10.33) y (10.34) obtenemos que:
dω
dE
=
E
ω
(10.35)
Se sigue por integración de (10.35) que:
J
E
=
= Constante
2π
ω
(10.36)
Argumentos similares se pueden usar cuando ω se varı́a lentamente a causa de
alguna otra influencia externa. Se usó el carácter adiabático de la variación en l, dl, al
tomar en (10.31) el promedio temporal: se asumió que dl es prácticamente constante
durante un perı́odo de la oscilación.
Como el oscilador armónico del ejemplo de (10.22) equivale matemáticamente a un
péndulo con una amplitud de oscilación pequeña, se sigue que E/ω es constante en tal
caso. Sin embargo, se puede mostrar que para otros sistemas de un grado de libertad,
E/ω no es un invariante adiabático, aunque para tales sistemas habrá otros invariantes
adiabáticos.
10.2.
Los toroides invariantes
En la sección 9.6 analizamos en detalle la solución de las ecuaciones de movimiento
de un sistema conservativo generalizado por el método de Hamilton-Jacobi. Esto nos
condujo a la ecuación de Hamilton-Jacobi independiente del tiempo, ecuaciones (9.305)
y siguientes del capı́tulo anterior. El resultado es que para tales sistemas es posible hallar
una transformación canónica generada por Σ, que permite expresar a (~q, p~) en función de
(~q, ~p), dados por pν = αν (ν = 1, 2, ...l − 1), pl = −t + αl , q ν = βν (ν = 1, 2, ...l) donde
αν y βν son 2l constantes y se exige que Bl = h. Si no se toma a h coincidiendo con una
~ se obtendrá la solución en términos de
de las βν sino que se deja en general h = H(β)
~ ~q = ~γ t + α
~
~
~p = β,
~ donde α
~ y β son las constantes de integración y ~γ son funciones de β.
El formalismo de las variables acción-ángulo se caracteriza por:
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 421
(a) Es aplicable a sistemas conservativos generalizados.
(b) Se define para sistemas ligados.
(c) Se identifican las l constantes pν con l invariantes adiabáticos del sistema.
(d) Si existen las l constantes de movimiento se dice que el sistema es integrable.
Los sistemas integrables se caracterizan por poseer un número de constantes de
movimiento uniformes igual al número de grados de libertad:2 en un sistema no integrable
el número de constantes de movimiento uniformes es menor que l, y la trayectoria fásica
cubrirá (total o parcialmente) regiones de más de l dimensiones en el espacio fásico.
Veremos que si el sistema posee más constantes de movimiento uniformes que el número
de grados de libertad, entonces la trayectoria fásica cubre regiones de dimensión menor
que l y además la separación de variables es posible en más de un sistema de coordenadas.
Las ecuaciones de movimiento de un sistema hamiltoniano de l grados de libertad
son de la forma:
ẋi = fi (x1 , x2 , ...x2l , t) ;
i = 1, 2, ..,2l
(10.37)
Una integral primera del sistema (10.37) es una función constante que se obtiene
a partir del mismo:
d
Φ(x1 , x2 , ...x2l , t) = 0
(10.38)
dt
La integral primera Φ = C es una superficie 2l dimensional en el espacio de 2l + 1
dimensiones, de coordenadas x1 , x2 , ...x2l , t, que posee la propiedad de que cada curva
integral que tiene un punto común con esta superficie está enteramente contenida en
ella. Si se han hallado k integrales primeras:
Φi (x1 , x2 , ...x2l , t) = Ci ;
i = 1, 2, ...k
(10.39)
Y si todas estas integrales son independientes, o sea, si al menos un determinante:
Φ1 , Φ2 , ...Φk
6= 0
(10.40)
J
xj1 , xj2 , ...xjk
donde xj1 , xj2 , ...xjk son k funciones cualesquiera de las x1 , x2 , ...x2l , entonces a partir
de las ecuaciones (10.39) se pueden expresar k funciones de t desconocidas xj1 , xj2 , ...xjk
en función de las demás y sustituyéndolas en (10.37), reducir el problema a la integración
de un sistema de ecuaciones con menos incógnitas que 2l. Si k = 2l y todas las integrales
son independientes, entonces (10.39) es un sistema de 2l ecuaciones algebraicas con
las 2l incógnitas xi , que puede resolverse en el caso en que todas las funciones Φi sean
uniformes. Sucede a veces que entre las Φi hay algunas que son funciones multiformes del
estado del sistema y entonces las funciones Φ1 , Φ2 , ...Φ2l no determinan unı́vocamente
el estado cuando toman los valores constantes C1 , C2 , ...C2l .
Para que un sistema de ecuaciones diferenciales (10.37) sea integrable es suficiente,
pues, que existan l integrales primeras uniformes. Cuando el sistema permite la separación de variables en la forma:
Z
Fi (xi ) dxi = t; i = 1, 2, ..,2l
(10.41)
2 Es
posible que un sistema sea integrable mas no separable, es decir, que no se puede desacoplar las
ecuaciones de movimiento.
422 / Mecánica clásica avanzada
se dice que el sistema se integra por cuadraturas.
Teorema de Liouville sobre los sistemas integrables. Recordemos que una
función Φ es una integral primera de un sistema de hamiltoniano H si su corchete de
Poisson con H es nulo:
[H, Φ] = 0
(10.42)
Estamos excluyendo la constante t0 , conjugada canónica de H, y funciones de t0 .
Dos funciones F1 y F2 del estado de un sistema hamiltoniano están en involución
si su corchete de Poisson es nulo. Liouville demostró que si en un sistema de l grados
de libertad se conocen l integrales primeras independientes y uniformes en involución
entonces ese sistema se integra por cuadraturas. El enunciado exacto del teorema es:
sean l funciones en involución:
Φ1 , Φ2 , ...Φl ;
[Φµ , Φν ] = 0 ;
µ, ν = 1, 2, ...l
(10.43)
en un espacio fásico de dimensión 2l. Consideremos los subespacios (hipersuperficies
2l − 1 dimensionales):
Sν = {(q, p) : Φν (q, p) = Cν } ;
ν = 1, 2, ...l
(10.44)
y el producto directo de los mismos:
Mc = {(q, p) : Φν = Cν ; ν = 1, 2, ...l}
(10.45)
Suponemos que sobre Mc las l funciones Φν son independientes (esto es, que los
l gradientes de las hipersuperficies Sν son linealmente independientes en cada punto de
Mc ).
Entonces, recordando el teorema sobre simetrı́as y leyes de conservación de la sección 9.8, como los Φν son generadores infinitesimales de las transformaciones canónicas
que dejan invariante a H, se cumple que:
(i) Mc es un subespacio invariante bajo cada una de las transformaciones canónicas
infinitesimales generadas por Φ1 = H, Φ2 , ...Φl .
(ii) Si las funciones Φν son continuas y uniformes y tales que (q) y (p) siempre
toman valores finitos, entonces el subespacio Mc corresponde con un toroide de dimensión
l:
T l = {ϕ1 , ϕ2 , ...ϕl } mod 2π
(10.46)
donde ϕ1 , ϕ2 , ...ϕl son coordenadas angulares sobre el toroide invariante T l .
(iii) El hamiltoniano H genera sobre Mc un movimiento que se denomina cuasiperiódico, definido en términos de las coordenadas angulares ϕ
~ = (ϕ1 , ϕ2 , ...ϕl ) sobre el
toroide invariante T l :
d
ϕ
~=~
ω;
dt
~
ω
~ =ω
~ (C)
(10.47)
(iv) Las ecuaciones canónicas de Hamilton se integran por cuadraturas.3
3 Una
demostración rigurosa del teorema puede verse en el libro de V. Arnold, Les méthodes matématiques de la mecánique classique, Mir, Moscú, 1976.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 423
Ejemplo 10.2.1 Aplicar el teorema de Liouville al estudio del oscilador bidimansional.
Según el teorema de Liouville sobre sistemas integrables, si en un sistema canónico
de dos grados de libertad se conoce una integral primera F que no depende de H,
entonces el sistema se integra por cuadraturas; el subespacio definido por H = h y
F = f siendo f y h dos constantes, es un toro invariante sobre el cual el movimiento
es cuasiperiódico. Para precisar, consideremos un oscilador bidimensional descrito por
el hamiltoniano:
H=
p2y
1
p2x
+
+ m(ωx2 x2 + ωy2 y 2 )
2m 2m 2
(10.48)
El sistema de ecuaciones diferenciales (10.37) para este caso es:
ẋ =
px
;
m
ẏ =
ṗx = −mωx2 x ;
py
m
(10.49)
ṗy = −mωy2 y
Es fácil ver que:
px
py
p˙x + mωx2 x ẋ =
ṗy + mωy2 y ẏ = 0
m
m
(10.50)
Con lo cual se obtiene que las siguientes son integrales primeras:
1
p2x
+ mωx2 x = E1 ;
2m 2
p2y
1
+ mωy2 y 2 = E2
2m 2
(10.51)
La hipersuperficie bidimensional ME1 E2 tiene intersecciones con los planos de fase
(x, px ) y (y, py ) dadas por las elipses (10.51).
Si se quiere, pueden tomarse como integrales primeras a H y una de las dos (10.51);
dado que H = E1 + E2 .
La hipersuperficie H = h es una esfera (o mejor elipsoide) en el espacio fásico; tal
hipersuperficie es de dimensión 3, en tanto que H1 = E1 es unidimensional siendo la
hipersuperficie MEE1 bidimensional.
El producto directo de las elipses definidas por (10.51) es un toroide de dimensión 2,
en tanto que los puntos del producto directo de las regiones H = h y H1 = E1 constituyen
una superficie bidimensional, que se puede hacer corresponder topológicamente con un
toroide bidimensional (véase figura 10.1).
El movimiento cuasiperiódico generado por H sobre ME1 E2 se define en términos
de las coordenadas angulares ϕ
~ = (ϕ1 , ϕ2 ) de los puntos de la superficie de un toro que
se mueven uniformemente sobre las circunferencias ϕ1 = Constante y ϕ2 = Constante,
con frecuencias angulares constantes que dependen de los valores de E1 y E2 :
d~
ϕ
=~
ω(E1 , E2 )
dt
(10.52)
Si ω1 y ω2 son inconmensurables, entonces la trayectoria de fases llena totalmente
el toro cuando t → ∞, en tanto que cuando ω1 y ω2 son conmensurables la trayectoria
de fases es cerrada y por lo tanto ocupa una región de dimensión menor a la del toro, es
424 / Mecánica clásica avanzada
ϕ2
ϕ1
Figura 10.1 Toroide generado por H.
decir, unidimensional. Para que esto ocurra es necesario que exista una nueva constante
de movimiento además de E1 y E2 .
Por ejemplo, cuando ωx = ωy , existe otra constante de movimiento relacionada
con la degeneración, que es el momento angular:
A = xpy − ypx
(10.53)
Cuando ωy = 2ωx la constante es:
A = (m2 ωx2 x2 − p2x ) y + xpx py
(10.54)
y cuando ωx = 2ωy , es constante:
A = (m2 ωy2 y 2 − p2y ) x + ypx py
(10.55)
Para el caso ωx = ωy es fácil ver que hay otra constante dada por:
B = px py + m2 ω 2 xy
(10.56)
y que se cumple:
[E2 , B] = −mω 2 A ;
[E2 , A] =
B
m
(10.57)
o sea que E2 con B1 y E2 con A no están en involución. Tampoco A y B están en
involución puesto que su corchete de Poisson vale E2 − E1 . Pero aún es posible formar
una combinación lineal de A y B que esté en involución con E1 y con E2 :
C = B + mω tan(ϕ10 − ϕ20 ) A
(10.58)
donde ϕ10 − ϕ20 es la diferencia de fase de los dos movimientos oscilatorios.
Resultados análogos se esperan cuando las frecuencias satisfacen la relación nωx =
mωy donde n y m son números enteros.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 425
Vectores tangentes a Mc . Como las l funciones Φν son independientes, también
serán linealmente independientes los l vectores gradientes 2l-dimensionales, perpendicu~ν .
lares a las superficies Φν = Cν , que llamaremos V
∂Φν ∂Φν
∂Φν
V~ν =
(10.59)
,
, ...
∂q1 ∂q2
∂pl
~ν no tiene componentes a lo largo de un vector Ẽ V
~µ , donde la matriz
Un vector V
simplicial Ẽ fue definida en la sección 9.9. En efecto:


∂Φµ
 ∂~q 
∂Φν ∂Φν


(10.60)
V~ν · Ẽ V~µ =
Ẽ 
,
 = [Φµ , Φν ] = 0
∂~q ∂~
p
 ∂Φµ 
∂~p
Entonces concluimos que sobre el subespacio l-dimensional Mc existen l vectores
linealmente independientes, tangentes a Mc en cada punto. En efecto, los V~ν son linealmente independientes, y como los autovalores de Ẽ son todos diferentes se concluye que
los Ẽ V~ν son linealmente independientes.
Se sigue entonces que en cada punto de Mc un vector tangente (por ejemplo la
dirección de la trayectoria de fases en ese punto) puede expresarse como combinación
~ν (ν = 1, 2, ...l).
lineal de los l vectores Ẽ V
Si se realiza en un punto de Mc la transformación canónica infinitesimal generada
por Φν , de acuerdo con la fórmula (9.349), el cambio experimentado por una variable
dinámica f está dado por:
∂f ∂f
~ν
∂ν f = ǫ [f, Φν ] = −ǫ
· Ẽ V
(10.61)
,
∂~q ∂~p
Se sigue entonces que el cambio

1 0 0


 0 1 0
 

~q


∂ν   = −ǫ  . . .
 .. .. ..
p
~



 0 0 0
experimentado por el vector de estado (~q, ~p) es:

. . . 0


. . . 0 


 ~
~
(10.62)
.. .. .. ..  Ẽ V
ν = −ǫẼ Vν
. . . . 



. . . 1 
O sea que los desplazamientos producidos por cada una de las transformaciones
canónicas infinitesimales generadas por Φ1 , Φ2 , ...Φl están contenidos totalmente dentro del subespacio Mc . Con esto queda demostrada la proposición (i) del teorema de
Liouville.
En particular, para cuando Φ1 = H se tiene que:
 


q
~
−∂H/∂~p
∂H
 ⇒ ~q˙ = ∂H ;
∂   = −ǫ 
~p˙ = −
(10.63)
∂~p
∂~q
p~
∂H/∂~q
426 / Mecánica clásica avanzada
como debe ser.
Hemos mostrado que cualquier desplazamiento sobre Mc se puede obtener por
medio de las l transformaciones canónicas asociadas a las integrales primeras Φν en
involución.
Como en cada punto de Mc cada uno de los vectores tiene una dirección bien definida, concluimos que a cada integral primera Φν se le puede asociar una familia de
trayectorias “paralelas” sobre la superficie de Mc y que en consecuencia a las l integrales
primeras en involución Φν se les puede asociar un sistema de coordenadas curvilı́neas
sobre Mc . En efecto, los l desplazamientos finitos asociados a los l grupos de transformaciones correspondientes a las Φν se pueden describir mediante l parámetros reales. Si
fijamos sobre Mc un punto (~q, p~) ≡ x0 , entonces cualquier punto de Mc se puede obtener
de éste por acción de los l grupos de transformaciones asociados a Φ1 , Φ2 , ...Φl :
g(~r)x0 ≡ g1 (r1 ) g2 (r2 ) ...gl (rl )x0 = xr1 , r2 , ...rl ∈ Mc
(10.64)
donde gν (rν ) es la transformación finita asociada a Φν siendo rν el parámetro. Entonces
los vectores ~r ≡ (r1 , r2 , ...rl ) definen unı́vocamente los puntos de Mc .
Correspondencia entre Mc y un toroide de dimensión l. Por hipótesis la
región Mc es acotada, ya que estamos tratando con sistemas ligados. Como consecuencia
de esto, los vectores ~r = (r1 , r2 , ...rl ) que sirven para caracterizar los puntos de Mc tienen
componentes acotadas. Para precisar, llamemos Rl al espacio euclı́deo l-dimensional en
el cual están definidos los vectores ~r; en consecuencia, la región del espacio fásico Mc
está asociada a un subespacio l-dimensional acotado de Rl mediante la fórmula (10.64).
Como la región Mc es acotada, ciertamente existen transformaciones g(~r) que retornan un punto arbitrario x0 de Mc en sı́ mismo:
g(~r)x0 = x0
(10.65)
Podemos, por ejemplo, definir l transformaciones independientes que retornen a x0
en sı́ mismo de la siguiente manera:
g1 (1)x0 = x0 ;
g2 (1)x0 = x0 ;
...gl (1)x0 = x0
(10.66)
Es decir, asociar el intervalo (0, 1) a cada una de las lı́neas cerradas que se obtienen
por desplazar el punto x0 mediante las transformaciones gν (rν ). Es claro entonces que
gν (mν )x0 = x0 donde mν es un número entero.
Por tanto podemos caracterizar el conjunto de todas las transformaciones de la
forma (10.65) mediante los vectores enteros:
~r = (m1 , m2 , ...ml ) ;
mν = ... − 2, −1, 0, 1, ...
(10.67)
A su vez el intervalo (0, 1) corresponde con el intervalo (0, 2π), de modo que podemos hacer corresponder a la región Mc un toroide de dimensión l, T l , definido como el
producto cartesiano de l cı́rculos, siendo definidos los puntos de los l cı́rculos mediante
coordenadas angulares ϕν mod 2π:
T l = {(ϕ1 , ϕ2 , ...ϕl )} ;
ϕ
~ mod 2π
(10.68)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 427
Existe una completa correspondencia entre T l y la región de Rl que representa los
puntos de Mc . Por tanto es posible asociar a los puntos de Mc un toroide de dimensión
l. Toda la argumentación depende de la existencia de transformaciones sobre Mc de la
forma (10.65) para cualquier punto de Mc .
Existencia en Mc de movimientos cuasiperiódicos. La transformación canónica generada por H tiene por parámetro a t. Entonces la correspondencia entre Mc y T l
permite asociar a cada valor de t un punto (ϕ1 , ϕ2 , ...ϕl ) mod 2π sobre T l . El movimiento generado por H en Mc se presenta uniforme sobre T l debido a que una variación ∆t
en el parámetro t se traduce en variaciones ∆ϕ1 , ∆ϕ2 , ...∆ϕl en las coordenadas sobre
T l . Como ciertamente la variación del parámetro t es uniforme, de igual manera serán
uniformes las variaciones en las coordenadas angulares sobre T l . En consecuencia:
ϕ̇ν = ων ;
ων = ων (~c) ;
ϕ
~ (t) = ϕ
~ (0) + ~ω t
(10.69)
Hemos justificado las tres primeras proposiciones del teorema de Liouville.
Las superficies de sección de Poincaré. Asumamos que el espacio de fases es
4-dimensional (sistema autónomo de dos grados de libertad). Escojamos una superficie
bidimensional, que puede o no coincidir con uno de los planos de fase; para precisar
tomemos el plano x − px en un valor de y determinado. Cada vez que la trayectoria
de fases cruza el plano x − px en una dirección dada, un punto en el valor de x y
px es marcado sobre la superficie. Después de muchos ciclos de la trayectoria, en el
plano quedará formada una figura de puntos. Si tomamos como referencia el oscilador
armónico bidimensional (ejemplo 10.2.1), la figura tendrá forma elı́ptica (véase figuras
10.2 y 10.3). Cada elipse corresponde a una trayectoria. Un comportamiento similar
ocurre en las intersecciones con el plano x = 0. Los planos x − px y y − py son ejemplos
de superficies de sección y las figuras de puntos formados permiten obtener conclusiones
acerca de las frecuencias del movimiento. Si las frecuencias son conmensurables, las
intersecciones de la trayectoria con las superficies de sección se repiten debido a que la
trayectoria es cerrada, en caso contrario, las intersecciones cuando t → ∞ forman una
curva continua sobre la superficie de sección, que no es otra cosa que la intersección del
toroide invariante con la superficie de sección.
Que las intersecciones de la trayectoria con una superficie de sección están localizadas sobre una curva única es una consecuencia de la existencia de una constante de
movimiento además de la energı́a. En efecto la conservación de la energı́a,
H(x, y, px , py ) = E
(10.70)
permite expresar una variable en términos de las otras tres, py = py (x, y, px ).
Entonces es suficiente considerar la proyección de la trayectoria sobre el volumen
tridimensional (x, y, px ). Si hay una constante de movimiento además de H,
I(x, y, px , py ) = C
(10.71)
entonces (10.70) y (10.71) se pueden combinar para darnos:
px = px (x, y)
(10.72)
428 / Mecánica clásica avanzada
px
0
0
x
Figura 10.2 Superficies de sección de Poincaré en el plano x − px
py
0
0
y
Figura 10.3 Superficies de sección de Poincaré en el plano y − py
O sea que las intersecciones sucesivas de la trayectoria con la superficie de sección
y = 0 deben estar sobre la curva única px = px (x, 0).
Consideremos ahora el toroide asociado a las constantes de movimiento E y C,
MEC . Las coordenadas angulares sobre MEC son ϕ1 y ϕ2 siendo ω1 y ω2 las frecuencias
correspondientes. Ciertamente la relación de frecuencias es función de E y C:
α(E, C) =
ω1 (E, C)
ω2 (E, C)
(10.73)
Para α = r/S, con r y S enteros, la trayectoria sobre el toro es periódica, cerrándose al completarse r revoluciones en ϕ1 y S revoluciones en ϕ2 . En la superficie de sección
ϕ2 = Constante habrán S puntos fijos sobre una circunferencia de radio R que depende solamente de E y C. Las sucesivas intersecciones están separadas por un tiempo
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 429
∆t = 2π/ω2 . Durante este intervalo, ϕ1 avanza por ω1 ∆t = 2πα.
La aplicación “twist” de Moser. Las ecuaciones que describen el movimiento
de la N -ésima a la (N +1)-ésima intersección de la trayectoria con la superficie de sección
son:
RN +1 = RN ;
ϕN +1 = ϕN + 2πα
(10.74)
La ecuación (10.74) constituye una aplicación (o mapeo discreto) de los puntos de
la superficie de sección en ella misma.
10.3.
Las variables acción-ángulo
~ ϕ
Mostremos que es posible definir una transformación canónica (~q, p~) → (I,
~ ) de
~ que son los
manera tal que hay l integrales primeras Φν dependientes únicamente de I,
momentos canónicamente conjugados de las coordenadas angulares sobre el toroide T l
correspondiente a Mc .
~ son coordenadas de los puntos de Mc en el espacio fásico 2lCiertamente (~
ϕ, Φ)
dimensional y satisfacen las ecuaciones direrenciales ordinarias siguientes:
~
dΦ
d~
ϕ
~
= 0;
=ω
~ (Φ)
dt
dt
que se integran inmediatamente para darnos:
~
~
~
t
Φ(t)
= Φ(0)
; ϕ
~ (t) = ϕ
~ (0) + ~ω Φ(0)
(10.75)
(10.76)
~ no son necesariamente canónicas, es posible construir l
Aunque las variables (~
ϕ, Φ)
~ tales que (I,
~ ϕ
funciones de las Φν , que llamaremos Iν = Iν (Φ),
~ ) sean variables canónicas.
Las Iν , son llamadas las variables de acción y junto con las variables angulares ϕν forman
en la vecindad de Mc un sistema de variables canónicas acción-ángulo. Las cantidades Iν
son integrales primeras del sistema de hamiltoniano H = Φ1 puesto que son funciones de
integrales primeras. A su vez, las Φν pueden expresarse en función de las Iν . Entonces en
las variables acción-ángulo las ecuaciones canónicas con hamiltoniano que sólo depende
de los “momentos” canónicos, son:
∂H
dI~
=−
= 0;
dt
∂ϕ
~
d~
ϕ
∂H
~
= ~ω (I)
(10.77)
=
dt
∂ I~
Las funciones ων están restringidas por la condición que resulta de la continuidad
~
de la función H(I):
∂2H
∂2H
∂ων
∂ωµ
=
⇒
=
∂Iν ∂Iµ
∂Iµ ∂Iν
∂Iµ
∂Iν
(10.78)
Variables acción ángulo para l = 1. Debemos encontrar una transformación
canónica (q, p) → (I, ϕ) que satisfaga las dos condiciones siguientes:
I
dϕ = 2π
(10.79)
I = I(h) y
Mh
430 / Mecánica clásica avanzada
En este caso el “toro” es una lı́nea cerrada. Es claro que la función generatriz del
tipo F2 para esta transformación es Σ(I, q), que satisface:
p=
H
∂Σ
;
∂q
∂Σ
,q
∂q
ϕ=
∂Σ
∂I
= h(I)
(10.80)
(10.81)
siendo H(p, q) = h(I) el hamiltoniano del sistema. Como la relación h(I) es biunı́voca
se sigue que cada curva Mh está definida por un valor de I. Sobre una curva definida h
por un valor de I, se sigue de (10.80) que:
dΣ|I=Constante = p dq
En la vecindad de un punto q0 la acción vale:4
Z q
p dq = Area
Σ(I, q) =
(10.82)
(10.83)
q0
La segunda condición en (10.79) depende del comportamiento global de Σ(I, q).
La función Σ no es uniforme pues al dar un ciclo completo sobre la curva Mh
cambia su valor por una constante igual al área encerrada por la curva. Esto no afecta
el valor de ∂Σ/∂q pero sı́ el de ϕ = ∂Σ/∂I puesto que el área depende de I. Si llamamos
∆Σ(I) al área,
I
p dq
(10.84)
∆Σ(I) =
Mh
Entonces (10.80) define a ϕ con la indeterminación de un múltiplo entero de
d∆Σ/dI.
Para que se satisfaga la segunda condición de (10.79) es necesario entonces que:
d∆Σ(I)
∆Σ
A
= 2π ⇒ I =
=
dI
2π
2π
o sea que I debe valer:
I
1
I=
p dq
2π Mh
(10.85)
(10.86)
Si el área A depende de h, entonces existe la función h(I) inversa de I(h).
El perı́odo del movimiento sobre la curva cerrada Mh en el plano de fases (q, p)
está dado por:
T =
dA(h)
dh
(10.87)
Hemos demostrado además que la variable de acción es un invariante adiabático,
de acuerdo con la definición dada por (10.18).
4 Esta
integral de lı́nea ciertamente está sobre la trayectoria del sistema, pero no está evaluada
siguiendo el movimiento del sistema: es una propiedad intrı́nseca de los puntos q y q0 del “toro”.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 431
Ejemplo 10.3.1 Resolver las ecuaciones de movimiento para el oscilador armónico unidimensional del ejemplo 10.1.1 usando las variables acción-ángulo.
ω0 ≡
De acuerdo con el ejemplo 10.1.1, para un oscilador armónico de constante k, con
p
k/m el área encerrada por la elipse definida por H = E es:
A=
E
2πE
⇒ I=
ω0
ω0
(10.88)
La frecuencia del movimiento es entonces:
ω=
∂E
= ω0
∂I
(10.89)
que en este caso particular resulta independiente del valor de I.
Las fórmulas (10.80) permiten resolver las ecuaciones de movimiento usando el
formalismo de las variables acción-ángulo. En efecto:
Z qq
Z q
2mE − m2 ω02 q 2 dq
p dq =
Σ(I, q) =
(10.90)
q0
q0
entonces:
ϕ=
∂Σ
=
∂I
Z
q
q0
r
dq
= sen−1
2I
− q2
mω0
r
mω0
q
2I
lo cual nos dice que:
r
r
2I
2I
q=
sen ϕ =
sen (ϕ0 + ω0 t)
mω0
mω0
(10.91)
(10.92)
donde hemos absorbido en ϕ la constante de integración de (10.91). Resulta que la
variable angular ϕ es la fase de las oscilaciones.
Ejemplo 10.3.2 Aplicar el formalismo de las variables acción-ángulo para hallar la solución a las ecuaciones de movimiento del péndulo plano y realizar un estudio del espacio
fásico correspondiente.
Las ecuaciones de movimiento son:
ṗ = −F sen θ ;
θ̇ = Gp
(10.93)
donde F = mgL, G = 1/(mL2 ) siendo mg la fuerza gravitacional, L la longitud del
péndulo, θ el ángulo respecto a la vertical y p el momento angular conjugado a θ. El
hamiltoniano es:
H=
1 2
Gp − F cos θ = E
2
(10.94)
El problema es completamente separable, como ocurre siempre cuando hay un
grado de libertad. Una descripción cualitativa del movimiento se obtiene a partir de un
diagrama de energı́a y otro de las trayectorias de fase (véase figura 10.4). F es el mayor
432 / Mecánica clásica avanzada
valor de la energı́a potencial. Si E > F , entonces p es siempre diferente de cero y el
movimiento es no acotado en θ (rotación).
Para E < F , el movimiento es acotado (libración).
Para E = F , tenemos el movimiento separatriz, en el cual el perı́odo de oscilación se
hace infinito.
Hay dos puntos singulares en p = 0: el origen en θ = 0, que es estable o punto
singular elı́ptico; y la intersección de las dos ramas de la separatriz en θ = ±π, que
es inestable o punto singular hiperbólico. Una trayectoria de fases cerca a un punto
singular elı́ptico permanece en su vencindad, en tanto que una trayectoria cerca a un
punto hiperbólico diverge de él. El perı́odo está dado por:
r
I
dθ
1
√
T =
(10.95)
2G
E + F cos θ
Sobre la separatriz vemos de (10.93) que la fuerza restauradora y la velocidad son
cero en θ = π, de modo que T es infinito.
p
Punto elíptico
Rot.
Sep.
Lib.
E>F
E=F
E<F
–2π
–π
0
π
2π
θ
Punto hiperbólico
Figura 10.4 Curvas de fase para el péndulo
Transformemos ahora el hamiltoniano a variables acción ángulo, usando la definición (10.86):
r
Z
2 θmax
2
(E + F cos θ) dθ
(10.96)
I(E) =
π 0
G
y las expresiones (10.80) y (10.83):
Z
1 dE θ
∂Σ
dα
r
=
φ(θ, E) =
∂I
G dI 0
2
(E + F cos α)
G
(10.97)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 433
donde θmax = π/2 para rotación (E > F ) y cos θmáx = −H/F para libración (E < F ).
El nuevo hamiltoniano se obtiene notando que H = H = E, con lo cual (10.96) permite
en principio expresar a E en función de I.
En (10.79) se supone que Mc representa una lı́nea cerrada. Sin embargo la definición
es posible ampliarla para incluir no sólo libración sino rotación.
Si en (10.96) y (10.97) efectuamos el cambio de variable siguiente:
s 1
E
θ
1+
sen η = sen
(10.98)
2
F
2
obtenemos:
I=
y,
8
π
r

E(k) − (1 − k 2 )K(k) , k < 1


F
G
 1 kE(k −1 ) ,
k>1
2

F (η, k) /K(k) ,
k<1
π 
ϕ=
2 
2F (η/2, k −1) /K(k −1 ) , k > 1
(10.99)
(10.100)
siendo F (η, k) y E(η, k) las integrales elı́pticas incompletas de primera y segunda especie
respectivamente, en tanto que K(k) = F (π/2, k) y E(k) = E(π/2, k) son las integrales
elı́pticas completas de primera y segunda especie (véase sección 8.4).
Z η
dξ
p
= sen−1 (sen η)
F (η, k) =
2
2
1 − k sen ξ
0
(10.101)
Z ηp
E(η, k) =
1 − k 2 sen2 ξ dξ
0
k está dada por:
E
(10.102)
F
y es una medida de la energı́a normalizada del oscilador.
k = 1 cuando E = 1 (la energı́a de la separatriz) y k < 1 para libración y k > 1
para rotación. De (10.95) obtenemos para la frecuencia normalizada:

1/K(k) ,
k<1
ω(k)
π 
=
(10.103)
ω0
2 
2k/K(k −1 ) , k > 1
√
donde ω0 = F G es la frecuencia angular para el movimiento linealizado alrededor del
punto singular elı́ptico. El valor asintótico de K cerca a k = 1 nos da una frecuencia
normalizada cerca a la separatriz:

(π/2)/ln 4(1 − k 2 )−1/2 , k < 1

ω
=
(10.104)
lı́m

k→1 ω0
π/2 ln 4(k 2 − 1)−1/2 ,
k>1
2k 2 = 1 +
que tiende a cero cuando k tiende a 1.
434 / Mecánica clásica avanzada
Ejercicio 10.3.1 Mostrar que para la trayectoria separatriz se cumple:
p=±
2ω0
θ
cos ;
G
2
θ = 4tan−1 (eω0 t ) − π
(10.105)
Variables acción ángulo para l grados de libertad. En el caso unidimensional, donde el toroide invariante se reduce a una lı́nea, la integral de lı́nea en (10.86)
coincide con la trayectoria. En el caso l-dimensional esta coincidencia no es necesaria.
Sean γ1 , γ2 , ...γl , l lı́neas cerradas sobre el toroide Mc , topológicamente equivalentes a circunferencias. Sobre cada lı́nea especificamos un punto mediante una coordenada
ϕν que en un circuito cerrado se aumenta por el valor 2π. Los γν no coinciden necesariamente con trayectorias, que según veremos en general no son cerradas; es decir, en
el caso general ninguna de las lı́neas γν coincide con la proyección de la trayectoria de
fases del sistema sobre el plano qν − pν . Entonces definimos la Iν por:
1
Iν =
2π
Z
l Z
1 X
p~ · d~q =
pν dqµ
2π µ=1 γµ
γν
(10.106)
Consideramos sobre Mc un “tubo de caracterı́sticas” que pasan por los puntos
de γν en un tiempo dado (véase figura 10.5). En un tiempo posterior t′ los puntos del
tubo de caracterı́sticas que en t estaban sobre γν pasarán a formar un contorno cerrado
diferente γν′ . En la sección 9.4 se demostró que la integral de Poincaré I1 no cambia de
valor al ser evaluada sobre contornos que envuelven el mismo tubo de caracterı́sticas y
tales que los puntos de dichos contornos representen estados simultáneos.
γν
γ′ν
Figura 10.5 Tubo de caracterı́sticas sobre el toroide
Se sigue entonces en virtud de la invariancia de la integral de Poincaré que:
Z
Z
p~ · d~q =
~p · d~q
(10.107)
γν
γν′
Se sigue de (10.106) que el valor de la variable de acción Iν no varı́a al deformar la
curva cerrada γν . De la topologı́a de un toroide se sigue que no es posible por deformación
hacer coincidir una curva γµ con otra γν independiente, o sea que la topologı́a del toroide
determina de manera única los l números I1 , I2 , ...Il definidos por (10.106).
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 435
~ ϕ
Como (Φ,
~ ) son las coordenadas de los puntos de la vecindad de Mc , entonces si
las Iν son independientes, o sea si
I1 , I2 , ...Il
J
6= 0
(10.108)
C1 , C2 , ...Cl
entonces en la vecindad del toroide se pueden tomar como coordenadas las variables
~ ϕ).
(I,
De acuerdo con el método de Hamilton-Jacobi, la siguiente es la función generatriz
~ ϕ
de la transformación canónica (~
q, p
~) → (I,
~) 5
~ ~
Σ(I,
q) =
Z
q
~
q
~0
~ ~
p~(I,
q ) · d~q
(10.109)
de acuerdo con las fórmulas:
p~ =
∂Σ
;
∂~q
ϕ
~=
∂Σ
∂ I~
(10.110)
~ ~q), la cual en principio
Como sabemos, (10.109) no permite evaluar la función Σ(I,
se obtiene resolviendo la ecuación de Hamilton-Jacobi independiente del tiempo:
∂Σ
~
,~
q = h(I)
(10.111)
H
∂~q
Queda claro que el sistema es integrable si es posible encontrar l contornos cerrados independientes tales que existen las l cantidades I1 , I2 , ...Il , lo cual es posible
independientemente de poder resolver la ecuación (10.111) por separación de variables.
La función Σ es multivaluada sobre Mc . El cambio experimentado al realizarse un
circuito sobre una lı́nea γν es igual a:
I
dΣ = 2πIν
(10.112)
∆ν Σ =
γν
Sin embargo en la vecindad de un punto ~q0 siempre es posible definir una función
unı́voca que especifica la transformación canónica. Como en el caso unidimensional, la no
uniformidad de Σ se traduce en la no uniformidad de las variables angulares. En efecto
el cambio en la variable angular ϕν al realizarse un circuito sobre la lı́nea γµ está dado
por:
∆µ ϕν = ∆µ
∂Σ
∂
=
∆µ Σ = 2πδµν
∂Iν
∂Iν
(10.113)
Por otra parte, las variables de acción están indeterminadas por una constante que
no depende de las Iν , como se puede ver en (10.85), pero es una constante que no trae
problemas como los provenientes de la no uniformidad de Σ.
5 La
integral (10.109) es una integral de lı́nea que no depende de la trayectoria seguida para llegar
de ~
q0 a q~.
436 / Mecánica clásica avanzada
Sistemas separables. Hay casos en los cuales mediante una adecuada elección
de las coordenadas resulta que la función Σ puede escribirse en la forma:
~ ~
Σ(I,
q) =
l
X
~ qν )
Σν (I,
(10.114)
ν=1
se dice entonces que el sistema es completamente separable. Para un sistema de este tipo
las ecuaciones (10.110) toman la forma:
pν =
∂
~ qν ) ;
Σν (I,
∂qν
ϕν =
l
X
∂
~ qµ )
Σµ (I,
∂I
ν
µ=1
(10.115)
ν = 1, 2, ...l
En este sistema es posible escoger los ciclos de base γ1 , γ2 , ...γl en los planos de
fase (q1 , p1 ), (q2 , p2 ), ...(ql , pl ) de modo que las variables de acción pueden definirse por
las integrales:
I
1
1
Iν =
∆ν Σν =
pν dqν
(10.116)
2π
2π
donde cada integral es tomada sobre un ciclo de la coordenada qν . Ver la sección 9.4.
Sistemas multiplemente periódicos degenerados. Cuando el sistema es separable, las variables angulares describen la proyección del punto representativo del
sistema sobre el plano de fases correspondiente (pν , qν ) y ων es la frecuencia angular
correspondiente al movimiento de tal proyección sobre la trayectoria cerrada. Entonces
tanto qν como pν son funciones periódicas del tiempo. Puede ocurrir que todas las frecuencias sean conmensurables entre sı́; entonces existen nuḿeros enteros m1 , m2 , ...ml
tales que, si T1 , T2 , ...Tl son los perı́odos sobre las proyecciones en los planos de fases se
cumple:
m1 T1 = m2 T2 = ... ml Tl = T
(10.117)
en este caso la trayectoria de fases es cerrada y el sistema como un todo es periódico.
Se dice entonces que el sistema es completamente degenerado.
Si el sistema es no degenerado o parcialmente degenerado, entonces (10.117) no
se cumple y nunca retorna a su estado inicial, pero cuando T es suficientemente grande
entonces pasa arbitrariamente cerca al estado inicial y se dice que el movimiento es cuasiperiódico sobre el toroide invariante. En este caso la trayectoria, independientemente de
las condiciones iniciales, es uniformemente distribuida sobre el toroide. Este enunciado
constituye el teorema ergódico.
Podemos decir que si el sistema es no degenerado es ergódico. Si hay degeneración
esto no se cumple.
En las coordenadas en que el sistema es separable, qν y pν son funciones periódicas
del tiempo con frecuencia angular ων . Entonces cualquier función uniforme F (~q, p~ ) del
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 437
estado del sistema es periódica respecto a las variables angulares y su perı́odo respecto
a cada una de ellas es 2π. Su expansión de Fourier es de la forma:
F (~
q , p~) =
∞
X
∞
X
...
n1 =−∞ n2 =−∞
∂E
∂E
∂E
n1 +
n2 + ...
nl t
An1 , n2 , ...nl exp i
∂I1
∂I2
∂Il
n =−∞
∞
X
(10.118)
l
Cada término de esta suma es periódico respecto al tiempo con frecuencia angular:
∂E
∂E
∂E
n1 +
n2 + ...
nl
∂I1
∂I2
∂Il
(10.119)
pero como estas frecuencias no son conmensurables en general, la suma no es periódica.
En particular, no serán periódicas las coordenadas y momentos (~q, p~) en las cuales el
sistema no sea separable.
En algunos casos particulares, dos o más de las frecuencias ων = ∂E/∂Iν son
conmensurables para todos los valores de las Iµ . La existencia de degeneración conlleva
una reducción del nuḿero de variables de acción independientes de las cuales depende
de la energı́a. En efecto si ω1 y ω2 son tales que:
n1
∂E
∂E
= n2
∂I1
∂I2
(10.120)
donde n1 y n2 son enteros, se deduce entonces que E depende de I1 y I2 sólo en la
combinación n2 I1 + n1 I2 :
E(I~ ) = E(n2 I1 + n1 I2 , I3 , ...Il )
(10.121)
Cuando hay degeneración, el número de integrales de movimiento uniformes es
mayor que l.
En efecto, la siguiente cantidad es constante de movimiento:
A = n1 ϕ1 − n2 ϕ2
(10.122)
la constancia de la cual es evidente de (10.120). Además está constante de movimiento
no depende de las Iν , que son las variables canónicamente conjugadas de las ϕν .
Al realizarse un circuito sobre la lı́nea γν , el cambio en A está dado, en virtud de
(10.113), por:
∆ν A = (n1 δ1ν − n2 δ2ν ) 2π
(10.123)
o sea que A no es uniforme, pero su no uniformidad consiste en la adición de un múltiplo
entero de 2π. Por tanto, tomando una función trigonométrica arbitraria de A se obtiene
una nueva integral de movimiento uniforme.
Ejemplo 10.3.3 Mostrar que las constantes (10.53) y (10.54) en el caso del oscilador
armónico bidimensiohal son funciones respectivamente de ϕ1 − ϕ2 y de 2ϕ1 − ϕ2 .
438 / Mecánica clásica avanzada
Es simple mostrar que A(I1 , I2 , ϕ1 , ϕ2 ) en (10.53) vale:
2p
A=
I1 I2 sen(ϕ1 − ϕ2 )
m
y en (10.54) vale:
p
A = 2I1 mI2 ω1 sen(2ϕ1 − ϕ2 )
(10.124)
(10.125)
De (10.123) se sigue que estas constantes de movimiento son uniformes. En el cálculo hemos usado la fórmula (10.92) para cada uno de los grados libertad, en coordenadas
cartesianas.
Ejemplo 10.3.4 En la sección 5.2 mostramos que el oscilador armónico bidimensional
cuando ω1 = ω2 es separable en coordenadas cartesianas y en coordenadas polares.
Resolver este problema en coordenadas polares usando las variables acción ángulo.
La ecuación de Hamilton-Jacobi para el problema es:
"
2
2 #
1
∂Σ
1 ∂Σ
1
+ mω02 r2 = E
+ 2
2m
∂r
r
∂ϕ
2
(10.126)
Resolviendo a (10.126) por separación de variables obtendremos las dos ecuaciones
diferenciales ordinarias siguientes:
2
l2
dΣr
dΣϕ
+ 2 + m2 ω02 r2 = 2mE
(10.127)
= l;
dϕ
dr
r
donde l2 es la constante de separación. Salvo constantes de integración, las soluciones
son:
Z r
l2
Σϕ = lϕ ; Σr =
(10.128)
2mE − 2 − m2 ω02 r2 dr
r
Entonces las cuatro ecuaciones (10.115) toman la forma:
r
l2
pϕ = l ;
pr = 2mE − 2 − m2 ω02 r2
r
ϕr = ϕ
ϕϕ = ϕ
∂l
+
∂Ir
Z
∂l
+
∂Iϕ
Z
1 ∂l2
∂E
− 2
∂Ir
r ∂Ir
r
dr
2
l
2 2 2
2 2mE − 2 − m ω0 r
r
(10.129)
2m
2m
r
1 ∂l2
∂E
− 2
∂Iϕ r ∂Iϕ
l2
2 2mE − 2 − m2 ω02 r2
r
dr
(10.130)
(10.131)
La variable de acción Iϕ vale:
Iϕ = l
(10.132)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 439
y la variable de acción Ir vale:
Z rmax r
1
l2
Ir =
·2
2mE − 2 − m2 ω02 r2 dr
2π
r
rmı́n
(10.133)
donde rmı́n y rmax están dados por la fórmula (5.76). Mediante la sustitución x = r2 ,
(10.133) toma la forma:
I q
1
1
Ir =
−m2 ω02 x2 + 2mEx − l2 dx
(10.134)
2π
x
La integral se hace fácilmente usando la técnica de los residuos teniendo en cuenta
que en el plano complejo el integrando es una función biforme (positivo en el intervalo
(xmı́n , xmax ) y negativo entre (xmax , xmı́n )), presentándose entonces una lı́nea de ramificación entre xmı́n y xmax . Por otra parte el integrando tiene singularidades en x = 0
y x = ∞, presentándose polos en dichos puntos. El residuo en x = 0 vale −l/(2π) y
el residuo en x = ∞ (que se obtiene con la sustitución y = 1/x) vale E/(2πω0 ). En
consecuencia, usando (10.132):
E = ω0 (Ir + Iϕ )
(10.135)
La técnica para evaluar este tipo de integrales puede verse en el apéndice II del
libro de Born, The mechanics of the atom o en la sección 9-7 del libro de Goldstein. Esto
nos permite escribir entonces (10.130) y (10.131) como:
Z
dr
r
(10.136)
ϕr = mω0
l2
2 2 2
2mE − 2 − m ω0 r
r
Z
mω0 − l/r2
r
ϕϕ = ϕ +
dr
(10.137)
l2
2 2 2
2mE − 2 − m ω0 r
r
Estas integrales coinciden con las evaluadas en el capı́tulo 5, que aparecieron en
las fórmulas (5.67) y (5.75):
El resultado para r en función de ϕr se obtiene directamente de (5.81):
!
r
ω02 l2
E
2
(10.138)
1 + 1 − 2 sen 2ϕr = r02 (1 + e sen 2ϕr )
r =
mω02
E
La ecuación de la órbita r(ϕ) depende de la diferencia ϕϕ − ϕr y de una constante
de integración que se puede absorber por ϕϕ . Como según (10.135) el movimiento es
degenerado (ωr = ωϕ = ω0 ), resulta que ϕϕ − ϕr es una constante.
La integral en (10.131) es idéntica a (5.67). El resultado para ϕ en términos de las
variables acción ángulo es:
e + sen 2ϕr
1
(10.139)
ϕ = ϕϕ − ϕr + sen−1
2
e sen 2ϕr + 1
440 / Mecánica clásica avanzada
La constante (10.122) que aparece cuando hay frecuencias degeneradas es:
A = ϕr − ϕϕ
(10.140)
Los cambios en A al realizarse circuitos sobre las lı́neas γr y γϕ respectivamente
son ∆r A = 2π y ∆ϕ A = −2π. O sea que ϕ no es una función uniforme, lo cual introduce
dificultades para tomar a (r, ϕ, pr , pϕ ) como variables de estado. Cuando Iϕ = 0, ϕ =
π/4 − A y cuando Iϕ = Ir + Iϕ , ϕ = ϕϕ = ϕr − A. Sólo una función que contenga
funciones trigonométricas de A es uniforme.
El toroide invariante en coordenadas polares está definido por las ecuaciones H = E
y pϕ = l. En este caso degenerado queda reducido a una curva cerrada:
p2r +
l2
+ m2 ω02 r2 = 2mE ;
r2
pϕ = l
(10.141)
El potencial efectivo presenta dos puntos de retorno en r, en tanto que en ϕ no hay
puntos de retorno. Las figuras 10.6 y 10.7 muestran las envolventes de las trayectorias
en el plano de la órbita y algunas órbitas, para l = 0 y para l 6= 0.
Las ecuaciones paramétricas de la curva en el plano r − Pr son:
r2 = r02 (1 + e sen 2ϕr ) ;
p2r = m2 ω02 r02 e2
cos2 2ϕr
1 + esen 2ϕr
(10.142)
l≠0
Figura 10.6 Envolventes de las trayectorias en el plano de la órbita para l 6= 0
La figura 10.8 muestra las curvas de fases representadas por (10.142) para diferentes
valores de e. Cuando e → 1, las trayectorias cerca a rmı́n son muy “planas”, de modo
que cuando e = 1, los puntos con pmax y pmı́n están unidos por una lı́nea recta vertical
levantada en rmı́n = 0.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 441
l=0
Figura 10.7 Envolventes de las trayectorias en el plano de la órbita para l = 0
1
pr (mω0r0)
e=1
e = 0,8
e = 0,6
0,5
e = 0,4
e = 0,2
e=0
0
0,5
1
r/r 0
1,5
–0,5
–1
Figura 10.8 Curvas de fases para diferentes valores de e
Como r es positivo, la trayectoria para e = 1 es un arco de elipse con los extremos
unidos por una lı́nea recta vertical, o sea que en r = 0, pr cambia abruptamente de
signo.
e = 1 corresponde a un movimiento pendular. En este caso el “toroide” se convierte
442 / Mecánica clásica avanzada
en un segmento de lı́nea, pues en cualquier movimiento real los puntos de la lı́nea recta
vertical son recorridos a velocidad infinita.
En coordenadas polares son constantes de movimiento E y l. Como consecuencia
de la degeneración hay otra constante que es una función trigonométrica de A. Tal
constante coincide con E1 o con E2 . En efecto, podemos tomarla como E1 .
px puede expresarse en función de pr y pϕ mediante la fórmula:
1
px = pr cos ϕ − pϕ sen ϕ
r
(10.143)
pϕ es una constante igual a l, cuyo valor tiene la siguiente expresión en función de e:
p
l = mω0 r02 1 − e2
(10.144)
remplazando pr de (10.142) en (10.143) obtenemos:
p
mω0 r0
e cos ϕ cos 2ϕr − 1 − e2 sen ϕ
px = √
1 + e sen 2ϕr
(10.145)
con lo cual E1 puede llevarse a la forma:
E1 =
mω02 r02
1
[e (1 + cos 2ϕ)(e + sen 2ϕr )
2 1 + e sen 2ϕr
√
+1 − e2 − e 1 − e2 sen 2ϕ sen 2ϕr ]
De (10.139) obtenemos las siguientes expresiones para cos 2ϕ y sen 2ϕ:
√
(e + sen 2ϕr ) sen 2A + 1 − e2 cos 2ϕr cos 2A
cos 2ϕ =
1 + e sen 2ϕr
√
(e + sen 2ϕr ) cos 2A − 1 − e2 cos 2ϕr sen 2A
sen 2ϕ =
1 + e sen 2ϕr
(10.146)
(10.147)
La sustitución de (10.147) en (10.146) nos conduce finalmente a:
E1 =
1
mω02 r02 (1 + e sen 2A)
2
(10.148)
y en consecuencia:
E2 =
1
mω02 r02 (1 − e sen 2A)
2
(10.149)
Sistemas no separables. Como una consecuencia del teorema de Liouville sobre
los sistemas integrables, todo sistema de l grados de libertad que posea l constantes de
movimiento uniformes admite un sistema de variables acción ángulo, siendo las variables
de acción l constantes de movimiento uniformes y las variables agulares l funciones
lineales del tiempo de la forma ϕν = ων t+ϕν0 siendo las ϕν0 l constantes de movimiento
no uniformes. En un sistema no integrable, el número de constantes de movimiento
uniformes es menor que l y por tanto la trayectoria de fases cubrirá regiones de más de
l dimensiones.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 443
Cuando hay un número de constantes de movimiento uniformes superior a l, se
tiene un sistema integrable degenerado.
Sistemas separables degenerados. En este caso es posible construir más de l
constantes de movimiento uniformes en involución. Entonces hay diferentes maneras de
escoger el conjunto de l variables de acción y por tanto hay diferentes transformaciones
canónicas a variables acción ángulo.
Sean (q, p) → (I, ϕ) y (q, p), (I ′ , ϕ′ ) dos de tales transformaciones, entonces las
variables (q, p) en los dos casos deben ser diferentes. Llegamos a otra propiedad fundamental de los sistemas degenerados consistente en que las ecuaciones de movimiento son
separables en diferentes sistemas de coordenadas.
Ejemplo 10.3.5 Mostrar que en un oscilador armónico bidimensional cuando ωx = 2ωy
(o ωy = 2ωx ) es posible la separación de variables en coordenadas parabólicas.
En el ejemplo 10.2.1 hallamos que cuando ωy = 2ωx existen tres constantes de
movimiento uniformes independientes, E1 , E2 y A (10.54), cuando la separación de
variables se hace en coordenadas cartesianas.
En términos de las coordenadas parabólicas ξ y η las coordenadas cartesianas x, y
están dadas por:
p
(10.150)
x = ξ−η;
y = ±2 ξη ; 0 ≤ (ξ, η) < ∞
En este sistema de coordenadas curvilı́neas, las curvas de ξ constante son parábolas
confocales con ejes a lo largo de x y abiertas hacia la izquierda. Las curvas de η constante
son parábolas confocales con ejes a lo largo del eje x pero abiertas hacia la derecha y
ortogonales a la familia ξ = constante. En ambos casos el foco está en el origen.
Las ecuaciones cartesianas de esas familias de curvas son:
y 2 − 4ηx = 4η 2 (η = Constante)
y
y 2 + 4ξx = 4ξ 2
(ξ = Constante) (10.151)
La sustitución de (10.150) en (10.151) hace triviales a estas últimas identidades,
como debe ser.
El lagrangiano en coordenadas cartesianas es:
m
m 2
L=
ẋ + ẏ 2 − ωy2 (4x2 + y 2 )
(10.152)
2
2
cuando ωx = 2ωy . En coordenadas parabólicas es:
!
1
η̇ 2
ξ˙2
L = m(ξ + η)
− 2mωy2 (ξ 2 + η 2 − ξη)
(10.153)
+
2
ξ
η
Por tanto el hamiltoniano en coordenadas parabólicas es:
H=
1 ξp2ξ + ηp2η
+ 2mωy2 (ξ 2 + η 2 − ξη)
2m ξ + η
La ecuación de Hamilton-Jacobi es:
" 2
2 #
1
1
∂Σ
∂Σ
ξ
+ 2mωy2 (ξ 2 + η 2 − ξη) = E
+η
2m ξ + η
∂ξ
∂η
(10.154)
(10.155)
444 / Mecánica clásica avanzada
Haciendo
Σ = Σξ (ξ) + Ση (η)
(10.156)
obtenemos las ecuaciones:
2
dΣξ
2ξ
+ 8mωy2 ξ 3 − 4mEξ = β
dξ
2η
dΣη
dη
2
(10.157)
+ 2mωy2 η 3 − 4mEη = −β
(10.158)
donde β es la constante de separación. Integrando estas ecuaciones hallamos:
Z s
Z s
β
β
2
2
2
Σ=
− 4m ωy ξ dξ +
− 4m2 ωy2 η 2 dη
(10.159)
2mE +
2mE −
2ξ
2η
La constante β tiene la siguiente expresión en términos de las variables de estado:
β = 2ξη
p2ξ − p2η
+ 8m2 ωy2 ξη(ξ − η)
ξ+η
(10.160)
y cumple un papel análogo al de la constante l cuando ωx = ωy . En efecto, cuando
β 6= 0 los potenciales efectivos en los movimientos unidimensionales equivalentes tienen
las siguientes expresiones:
ξ
Vef
(ξ) =
β
1
4mωy2 ξ 2 −
;
2
4mξ
η
Vef
(η) =
1
β
4mωy2 η 2 +
2
4mη
(10.161)
De las gráficas de energı́a potencial efectiva se deducen los valores de retorno en
ξ y η y por tanto las parábolas que envuelven las trayectorias en el plano x − y. Tales
curvas envolventes se denominan “cáusticas”. La figura 10.9 muestra las cáusticas para
diferentes signos de β y algunas de las trayectorias.
La solución analı́tica en variables acción ángulo requiere evaluar las variables de
acción y por medio de las ecuaciones (10.115) hallar las ecuaciones de la trayectoria. Al
conocer la función E(Iξ , Iη ) se hallan las frecuencias ωξ , ωη que contendrán alguna relación racional de la forma (10.120) y luego se puede obtener una constante de movimiento
adicional, de la forma (10.122).
Es interesante notar que al separar el movimiento en coordenadas cartesianas hay
una constante ligada a la degeneración que es (10.55). Tal constante es precisamente
β. Para mostrar esto, notemos que las fórmulas de la transformación inversa a (10.150)
son:
p
p
x + x2 + y 2
−x + x2 + y 2
ξ=
;
η=
(10.162)
2
2
dado que los momentos están conectados por las fórmulas:

 


pξ
∂x/∂ξ ∂y/∂ξ
px

=


pη
py
∂x/∂η ∂y/∂η
(10.163)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 445
y
y
η2
η1
ξ1
ξ2
ξ2
y
η2
x
x
x
ξ2
η2
β>0
β=0
β<0
Figura 10.9 Curvas envolventes o “cáusticas” para distintos valores de β
se sigue que:
pξ =
pη =
px +
s
−px +
p
−x + x2 + y 2
p
py
x + x2 + y 2
s
p
x + x2 + y 2
p
py
−x + x2 + y 2
(10.164)
Reemplazando a (10.164) y (10.162) en (10.160) se sigue que:
β = 2[ypx py + x(m2 ωy2 y 2 − p2y )]
(10.165)
Similarmente, la constante ligada a la degeneración en coordenadas parabólicas
puede tomarse como E1 :
!
ξp2ξ − ηp2η
1
E1 =
+ 2mωy2 (ξ − η)2
(10.166)
2m
ξ+η
10.4.
Problema de Kepler (coordenadas esféricas)
El hamiltoniano para una partı́cula de masa m sometida al efecto de un centro de
fuerzas inmóvil que crea un potencial −k/r es:
!
p2ϕ
1
p2θ
k
2
H(r, θ, pr , pθ , pϕ ) =
pr + 2 + 2
−
(10.167)
2m
r
r sen2 θ
r
Este problema admite la separación completa de variables en la ecuación de HamiltonJacobi, en la forma:
Σ(r, θ, ϕ) = Σϕ (ϕ) + Σθ (θ) + Σr (r)
(10.168)
446 / Mecánica clásica avanzada
obteniéndose las siguientes ecuaciones diferenciales:
2
dΣϕ
= lz2
dϕ
r
2
dΣr
dr
dΣθ
dθ
2
2
+
(10.169)
− 2mkr − 2mEr2 = −l2
(10.170)
lz2
= l2
sen2 θ
(10.171)
donde l y lz son las constantes de separación.
Los puntos de retorno en θ y r, donde pθ = 0 y pr = 0, están dados por:
!
r
k
2El2
rmax, min = −
1± 1+
;
2E
mk 2
sen θmax, min = ±
(10.172)
lz
l
La variable de acción Iθ está dada por:
Z θmax r
I r
lz2
l2
2
2πIθ = 2
dθ =
l −
l2 − z2 dθ
2
sen θ
sen θ
θmı́n
(10.173)
donde se ha notado que pθ es positivo cuando θ se incrementa de θmı́n = sen−1 (lz /l) a
θmax = π − θmı́n y es negativo cuando θ decrece de θmax a θmı́n , y que el integrando es
una función par de θ.
Con la sustitución η = sen2 θ, Iθ toma la forma:
s
Z l
1 l2 η − lz2
2πIθ = 2
dη
(10.174)
1−η
lz /l2 η
y con la sustitución
r
−lz2 + l2 u
x=
1−u
(10.175)
llegamos a:
2πIθ = 4 l2 − lz2
Z
∞
0
(x2
x2 dx
+ lz2 )(x2 + l2 )
Descomponemos el integrando en fracciones parciales:
Z ∞
Z ∞
dx
dx
2
2
− lz
2πIθ = 4 l
x2 + l2
x2 + lz2
0
0
(10.176)
(10.177)
para llegar finalmente a:
Iθ = l − lz
(10.178)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 447
Por otra parte, de (10.169) se sigue directamente:
Iϕ = lz
(10.179)
Obteniendo las siguientes expresiones para las constantes l y lz en términos de las
variables de acción:
l = Iθ + Iϕ ;
Ir está dado por:
Z
2πIr =
lz = lϕ
rmax
rmı́n
pr dr −
(10.180)
Z
rmı́n
pr dr = 2
Z
rmax
pr dr
(10.181)
rmı́n
rmax
Llamando a y b a:
a=−
k
;
2E
l
b= √
−2mE
(10.182)
Podemos escribir a p2r como:
"
2 2 #
b
a
a
2
pr = −2mE −1 + 2 −
r
a
r
(10.183)
De tablas de integrales estándar como la de Schaum’s hallamos:
Z √ 2
√
Ar + Br + C
Ar2 + Br + C
dr =
r
B
−2Ar − B
+ √
sen−1 √
2 −A
B 2 − 4AC
(10.184)
√
Br + 2C
− −Csen−1 √
r B 2 − 4AC
Por tanto:
Z
√
√
r−a
pr dr =
−2mE
−r2 + 2ar − b2 + a sen−1 √
a2 − b 2
ar − b2
−1 √
−b sen
r a2 − b 2
y teniendo en cuenta que:
p
rmin, max = a ± a2 − b2
llegamos a:
Z rmax
rmı́n
pr dr =
√
−2mE (a − b)π
(10.185)
(10.186)
(10.187)
448 / Mecánica clásica avanzada
De donde se tiene la siguiente expresión para E en función de Ir , Iθ , Iϕ :
E=−
mk 2
2(Ir + Iθ + Iϕ )2
(10.188)
Entonces a y b en términos de las variables de acción toman la forma:
a=
(Ir + Iθ + Iϕ )2
;
mk
b=
(Iθ + Iϕ )(Iθ + Iϕ + Ir )
mk
Σr y Σθ pueden escribirse como:
Z p
1
1
Σr = (Ir + Iθ + Iϕ )
−r2 + 2ar − b2 dr
a
r
Z s
Iϕ2
1
1−
dθ
Σθ = (Iθ + Iϕ )
2
(Iθ + Iϕ ) sen2 θ
(10.189)
(10.190)
(10.191)
Solución para el movimiento radial. Según la ecuación (10.115), la variable
angular ϕr es:
ϕr =
∂Σr
∂Σ
=
∂Ir
∂Ir
(10.192)
Al derivar la integral (10.190) usamos las expresiones auxiliares:
2a
∂a
=
;
I = Ir + Iθ + Iϕ
∂I
I
"
2 #
2(1 − ǫ2 )a2
Iθ + Iϕ
∂
a2 =
∂I
I
I
ǫ2 = 1 −
∂
∂I
Iθ + Iϕ
I
1
I
=−
a
a
Por tanto:
ϕr =
2
(10.193)
(10.194)
(10.195)
Z p
1
1
−r2 + 2ar − (1 − ǫ2 )a2 dr
a
r
Z
dr
+2 p
2
−r + 2ar − (1 − ǫ2 )a2
−
2
−(1 − ǫ )a
Z
r
p
−r2
(10.196)
dr
+ 2ar − (1 − ǫ2 ) a2
Cada una de estas integrales es elemental y puede hallarse en el manual citado.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 449
El resultado, luego de simplificaciones, es:
ϕr = −
1p 2
r−a
−r + 2ar − (1 − ǫ2 )a2 + sen−1
a
ǫa
(10.197)
A este resultado se puede llegar derivando respecto a I la expresión integrada Σr
que se obtiene de (10.185).
Definamos ahora una cantidad auxiliar y ası́:
y=
1 − r/a
⇒ r = a(1 − ǫy)
ǫ
Con lo cual:
p
ϕr = −ǫ 1 − y 2 − sen−1 y
(10.198)
(10.199)
Como Σ es indeterminada bajo la adición de una constante arbitraria, ϕr estará igualmente indeterminada bajo la adición de una constante, que llamaremos a.
Introduciendo una nueva variable ψ, definida como:
y = cos ψ
y usando la circunstancia mencionada, obtenemos:
π
ϕr = −ǫ sen ψ −
−ψ +α
2
(10.200)
(10.201)
Podemos escoger a α igual a π/2 con lo cual:
ϕr = ψ − ǫ sen ψ
(10.202)
r = a(1 − ǫ cos ψ)
(10.203)
La ecuación (10.202) es la ecuación de Kepler, hallada en el capı́tulo 5. Vemos
además que la variable angular ϕr coincide con la anomalı́a media M , en tanto que ψ
es la anomalı́a excéntrica que, como sabemos, sirve para especificar la posición de la
partı́cula en el plano de la órbita.
En el ejemplo 5.3.1 se halló la solución analı́tica de la ecuación de Kepler en serie
de Fourier.
ϕr puede escribirse, de acuerdo con (10.77) en la forma:
ϕr = ωr (t − t0 )
(10.204)
Vemos que cuando ϕr = 0, ψ = 0 y r = rmı́n ; cuando ϕr = π, ψ = π y r = rmax ;
cuando ϕr = 2π, ψ = 2π y r = rmı́n y ası́ sucesivamente. ωr es la frecuencia angular del
movimiento radial que es periódico.
Ejemplo 10.4.1 Expresar a r, x, y en términos de ϕr por medio de series de Fourier,
donde x, y son unos ejes cartesianos en el plano de la órbita, con x a lo largo del eje
mayor de la órbita y el origen es el centro de fuerzas. De la figura 5.14 se sigue que:
x = r cos ϕv y y = r sen ϕv donde ϕv es la anomalı́a verdadera (ángulo entre r y x).
450 / Mecánica clásica avanzada
Por otra parte, la ecuación de la órbita en el plano de la misma cuando se toma a
x en la dirección del perihelio es:
r=
a(1 − ǫ2 )
1 + ǫ cos ϕv
(10.205)
Por tanto, combinando (10.205) y (10.203):
a(1 − ǫ2 ) − r
= a(cos ψ − ǫ)
ǫ
p
p
y = r2 − x2 = a 1 − ǫ2 sen ψ
x=
(10.206)
(10.207)
Vemos que x y r son funciones pares de ψ en tanto que y es una función impar.
Entonces podemos escribir:
∞
X
1
r
= B0 +
Bn cos(nϕr )
a
2
n=1
∞
X
1
x
Cn cos(nϕr )
= C0 +
a
2
n=1
∞
X
y p
= 1 − ǫ2
Dn sen (nϕr )
a
n=1
Los coeficientes de Fourier son:
Z
Z
r
−2 π
2 πr
cos(nϕr ) dϕr =
sen (nϕr ) d
Bn =
π 0 a
nπ 0
a
Z
Z
−2 π
x
2 πx
cos(nϕr ) dϕr =
sen (nϕr ) d
Cn =
π 0 a
nπ 0
a
Z π
2
y
√
Dn =
sen (nϕr ) dϕr
π 0 a 1 − ǫ2
Z π
2
y
√
=
cos nϕr d
nπ 0
a 1 − ǫ2
(10.208)
(10.209)
(10.210)
(10.211)
(10.212)
(10.213)
donde se han realizado integraciones por partes.
Usando (10.206), (10.207) y (10.203) llegamos a las siguientes expresiones con
integrales sobre ψ.
Z
2ǫ π
sen [n(ψ − ǫ sen ψ)] sen ψ dψ
(10.214)
Bn = −
nπ 0
Z π
2
Cn =
sen [n(ψ − ǫ sen ψ)] sen ψ dψ
(10.215)
nπ 0
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 451
Dn =
2
nπ
Z
π
0
cos[n(ψ − ǫ sen ψ)] cos ψ dψ
(10.216)
Procediendo como en el ejemplo 5.3.1, usando la definición integral de las funciones
de Bessel enteras, llegamos a:
Bn =
ǫ
2ǫ
[Jn+1 (ǫn) − Jn−1 (ǫn)] = − Jn′ (ǫn)
n
n
(10.217)
Cn =
1
2
[Jn−1 (ǫn) − Jn+1 (ǫn)] = Jn′ (ǫn)
n
n
(10.218)
Dn =
2
Jn (ǫn)
ǫn
(10.219)
B0 y C0 deben calcularse por separado. El resultado es:
B0 = 2 + ǫ 2 ;
C0 = −3ǫ
(10.220)
Entonces, finalmente:
∞
X
1
ǫ2
r
=1+
+ǫ
[Jn+1 (ǫn) − Jn−1 (ǫn)] cos(nϕr )
a
2
n
n=1
∞
X
1
3
x
=− ǫ+
[Jn−1 (ǫn) − Jn+1 (ǫn)] cos(nϕr )
a
2
n
n=1
∞
X
2p
y
1
1 − ǫ2
=
Jn (ǫn) sen (nϕr )
a
ǫ
n
n=1
(10.221)
(10.222)
(10.223)
Es interesante notar que el sistema formado por dos partı́culas cargadas, ligado,
emite radiación electromagnética. El momento de dipolo del sistema, d~ = Z1 e~r1 + Z2 e~r2 ,
donde Z1 y Z2 tienen signos opuestos, se puede escribir, usando las fórmulas (5.1), como:
Z1
Z2
~
d = µe
~r
(10.224)
−
m1
m2
donde µ es la masa reducida. Las ecuaciones (10.221) a (10.223) muestran que el momento de dipolo se puede expandir en serie de Fourier y la intensidad radiada de frecuencia
nω0 , donde ω0 = ϕ̇r está dada por la fórmula:
In =
ω04 n4 ~
dn
3c3
2
(10.225)
Como d~n es un vector en el plano de la órbita, se han de considerar las contribuciones de x y y a la radiacion de frecuencia nω0 . El resultado es:
2 1 − ǫ2 2
Z2
Z1
64n2 E 4
Jn′2 (ǫn) +
−
J
(ǫn)
(10.226)
In = 3 2 2
n
3c Z1 Z2 m1
m2
ǫ2
452 / Mecánica clásica avanzada
ver Landau, Teorı́a de campos, sección 70.
Solución para el movimiento en θ. La variable angular ϕθ es:
ϕθ =
∂Σ
∂Σr
∂Σθ
=
+
∂Iθ
∂Iθ
∂Iθ
(10.227)
Notando que:
p
2a2 p
∂
1 − ǫ2 1 + 1 − ǫ2
[(1 − ǫ2 ) a2 ] =
∂Iθ
I
(10.228)
r − (1 − ǫ2 )a
∂Σr
= ϕr − sen−1
∂Iθ
ǫr
(10.229)
y mediante un cálculo similar al que conduce a (10.196) obtenemos:
Por otra parte, de (10.191) se sigue:
Z
∂Σθ
sen θ dθ
s
=
2
∂Iθ
Iϕ
2
sen θ −
Iθ + Iϕ
(10.230)
y con el cambio de variable u = sen2 θ:
Z
∂Σθ
1
du
q
=
∂Iθ
2
2
[u − Iϕ /(Iθ + Iϕ )2 ] (1 − u)
(10.231)
La fórmula (14.120) del manual citado nos conduce finalmente a:
∂Σθ
cos θ
= sen−1 q
∂Iθ
1 − Iϕ2 /(Iθ + Iϕ )2
si llamamos γ a:
s
γ=
1−
(10.232)
Iϕ2
(Iθ + Iϕ )2
(10.233)
obtenemos de (10.231), (10.229) y (10.227):
"
r
[r − (1 − ǫ2 ) a ]2
cos
θ
1−
ϕθ − ϕr = sen−1
γ
ǫ2 r 2
2
−
r − (1 − ǫ ) a
ǫr
s
1−
2

(10.234)
cos θ 
γ2
Donde hemos usado la fórmula:
p
p
sen−1 A − sen−1 B = sen−1 A 1 − B 2 − B 1 − A2
(10.235)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 453
Definamos las cantidades auxiliares siguientes:
L=
r − (1 − ǫ2 ) a
;
ǫr
M=
L
;
γ
S = sen (ϕθ − ϕr )
(10.236)
Entonces (10.234) toma la forma:
r
p
1
S = cos θ
− M 2 − M γ 2 − cos2 θ
2
γ
(10.237)
y despejando a cos θ obtenemos:
p
p
cos θ = γS 1 − M 2 γ 2 ± γ 2 M 1 − S 2
(10.238)
Para hallar la dependencia de cos θ, notamos que L tiene la siguiente expresión en
términos de ψ:
L=
ǫ − cos ψ
1 − ǫ cos ψ
(10.239)
Entonces:
√
sen (ϕθ − ϕr ) 1 − ǫ2 sen ψ − cos(ϕθ − ϕr )(ǫ − cos ψ)
cos θ = γ
(1 − ǫ cos ψ)
(10.240)
donde hemos tomado el signo negativo en (10.238) para hacer la expresión compatible
con el caso en que la órbita está colocada completamente en el plano x − z.
Despejando a M en términos de cos θ obtenemos:
M =−
p
Sp 2
1
cos
θ
γ
−
cos
θ
±
1 − S2
γ2
γ2
(10.241)
y usando las definiciones (10.236), llegamos a la siguiente expresión para la ecuación de
la órbita en términos de las variables acción-ángulo:
r
(Iθ + Iϕ )2
(
1−
1
1
I2
I2
1+ s
=
2
r
(Iθ + Iϕ ) a
Iϕ2
1−
(Iθ + Iϕ )2
(10.242)
"
× sen (ϕθ − ϕr )
s
sen2 θ
Iϕ2
−
± cos(ϕθ − ϕr ) cos θ
(Iθ + Iϕ )2
#)
Si la partı́cula se mueve sobre un plano que contiene al eje z, no tendrá componente
del momento angular en ese eje, o sea Iϕ = 0. En ese caso, según (10.172), θmı́n = 0 y
θmax = π, y según (10.233), γ = 1. Entonces (10.242) toma la forma:
(
)
r
Iθ2
I2 1
1
1 ± 1 − 2 cos[θ ∓ (ϕθ − ϕr )]
(10.243)
= 2
r
Iθ a
I
454 / Mecánica clásica avanzada
Si tomamos el signo positivo y definimos a θ0 como:
θ0 = ϕθ − ϕr
(10.244)
llegamos a la fórmula conocida:
1
1 + ǫ cos(θ − θ0 )
=
r
a(1 − ǫ2 )
(10.245)
Entonces θ0 es la dirección del vector absidal del perihelio respecto al eje z, o sea
la orientación de la elipse.
Las frecuencias asociadas a los movimientos en r, ϕ y θ son iguales, pues (10.188)
conduce a:
mK 2
∂E
(10.246)
=
∂I
I3
Según (10.120) y (10.122), habrán dos constantes de movimiento asociadas a la
degeneración:
ωr = ωθ = ωϕ =
ϕr − ϕθ
y
ϕϕ − ϕθ
(10.247)
Cuando Iϕ = 0, la órbita está colocada en el plano z − x′ , donde x′ hace un ángulo
cualquiera con el eje x.
θ0 es el ángulo entre los ejes x y z, como se muestra en la figura 10.10.
x-
z
y-
θ0
x′
θ
Figura 10.10 Órbita en el plano z − x′
Cuando Iϕ = 0 y θ0 = 0, la ecuación (10.240) da la siguiente relación entre θ y ψ:
r
1−ǫ
ψ
θ
cot
(10.248)
cot =
2
1+ǫ
2
En general, para una órbita con orientación arbitraria y con el plano de la órbita
fuera del plano zx′ tenemos:
θ0 = ϕθ − ϕr ;
cos θmin = γ ;
cos θmax = π − θmin
(10.249)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 455
En términos de estos ángulos la ecuación general de la órbita es:
1
ǫ
1
1+
=
r
(1 − ǫ2 ) a
cos θmı́n
√
cos θ0 cos θ + sen θ0 sen2 θ − sen2 θmı́n
(10.250)
Solución para el movimiento en ϕ. ϕϕ está dada por:
ϕϕ =
∂Σ
∂Σr
∂Σθ
∂Σϕ
=
+
+
∂Iϕ
∂Iϕ
∂Iϕ
∂Iϕ
(10.251)
De (10.229) vemos que:
r − (1 − ǫ2 ) a
∂Σr
= ϕr − sen−1
∂Iϕ
ǫr
(10.252)
De (10.191) se sigue:
∂Σθ
=
∂Iϕ
Z
s
1−
Iϕ
1
Iθ + Iϕ sen2 θ
Iϕ2
1
1−
(Iθ + Iϕ )2 sen2 θ
dθ
(10.253)
El cambio de variable:
s
cos2 θ
v=
2
sen θ − (1 − γ 2 )
nos lleva a:
Z
dθ
p
sen4 θ − (1 − γ 2 ) sen2 θ
(10.254)
=−
Z
dv
1 + v 2 (1 − γ 2 )
p
1
−1
1 − γ2]
tan
[v
=−
1 − γ2
(10.255)
Entonces (10.252), (10.253), (10.255) junto con (10.230) nos conducen a:
p
(10.256)
ϕϕ = ϕθ + tan−1 [v 1 − γ 2 ] + ϕ
Resolviendo para v hallamos:
1
v=p
tan(ϕϕ − ϕθ − ϕ)
1 − γ2
(10.257)
que equivale a la siguiente ecuación cuadrática en cos θ:
(1 − γ 2 ) cos2 θ + tan2 (ϕϕ − ϕθ − ϕ) cos2 θ
−γ 2 tan2 (ϕϕ − ϕθ − ϕ) = 0
(10.258)
456 / Mecánica clásica avanzada
por tanto:
cos θmı́n tan(ϕϕ − ϕθ − ϕ)
cos θ = p
sen2 θmı́n + tan2 (ϕϕ − ϕθ − ϕ)
(10.259)
o si se quiere:
sen θmı́n cos θ
tan(ϕϕ − ϕθ − ϕ) = √ 2
cos θmı́n − cos2 θ
(10.260)
Usando (10.238) obtenemos esta expresión para la dependencia temporal de ϕ:
tan(ϕϕ − ϕθ − ϕ) =
sen θmı́n
√
− cos θ0 (ǫ − cos ψ) + sen θ0 1 − ǫ2 sen ψ
√
sen θ0 (ǫ − cos ψ) + cos θ0 1 − ǫ2 sen ψ
(10.261)
Cuando la órbita está en el plano x − y, Iθ = 0, o sea γ = 0. Entonces θmı́n =
θmax = π/2 = θ. En consecuencia, si tomamos θ0 = 0,
−ǫ + cos ψ
tan(ϕϕ − ϕθ − ϕ) = √
1 − ǫ2 sen ψ
(10.262)
de donde:
√
1 − ǫ2 sen ψ
cos(ϕϕ − ϕθ − ϕ) =
=
1 − ǫ cos ψ
r
1 − ǫ2 p 2 2
a ǫ − (a − r)2
ǫr
(10.263)
que nos conduce a una ecuación similar a la (10.245), pero esta vez para la órbita en el
plano x − y. Entonces el ángulo que hace el vector absidal del perihelio respecto al eje
x, cuando θ0 = 0, es:
ϕ0 +
π
2
donde
ϕ0 = ϕϕ − ϕθ
(10.264)
Cuando la órbita está en el plano z − x′ , Iϕ = 0 y sen θmı́n = 0 entonces tan(ϕϕ −
ϕθ − ϕ) = 0. Por tanto en este caso el ángulo ϕ es constante y vale ϕ0 , que es el ángulo
que hace la lı́nea de intersección entre el plano vertical de la órbita y el plano x − y.
En general, para Iϕ y Iθ arbitrarios, el plano de la órbita y el plano x − y se cortan
en la lı́nea Ox′ , llamada lı́nea de nodos. La curva cruza el plano xy cuando θ = π/2 y
cuando θ = 3π/2. En esos puntos, según (10.260), ϕ vale ϕ0 . En conclusión, ϕ0 es el
ángulo de la lı́nea de nodos respecto al eje x. ϕ0 es el acimut de la partı́cula cuando
θ = π/2 y π + ϕ0 es el acimut cuando θ = 3π/2.
Como ϕ es una variable cı́clica, pϕ es constante de movimiento, cuyo valor es igual al
de Iϕ cuya variable canónica conjugada es ϕϕ . Por medio de una transformación canónica
es posible hacer que las variables acción-ángulo sean (Ir + Iθ + Iϕ , ϕr ), (Iθ + Iϕ , ϕθ − ϕr )
y (Iϕ , ϕϕ − ϕθ ), con lo cual vemos que l y θ0 son variables canónicas conjugadas, lo
mismo que lz y ϕ0 .
Como sabemos, θ0 y ϕ0 en tanto que variables angulares son no uniformes pues al
completar un ciclo sobre las lı́neas γθ0 y γϕ0 del toroide no regresan a su valor original
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 457
sino que aumentan en 2π, pero esto no tiene efecto sobre las fórmulas ya que aparecen
en funciones trigonométricas.
Los ejes x, y, z fijos a la órbita, se pueden ubicar respecto a los ejes x, y, z mediante
los ángulos de Euler que denotaremos ϕ′ , θ′ , ψ ′ definidos en la sección 7.6. ϕ′ es el ángulo
entre x′ y x, θ′ el ángulo entre z y z y el ψ ′ ángulo entre x y x′ , donde el eje x′ coincide
con la lı́nea de nodos.
(Véase figura 10.11). ϕ′ , θ′ , ψ ′ están relacionados con θ0 , ϕ0 mediante:
ϕ′ = ϕ0 ;
θ′ =
π
− θmı́n ;
2
ψ′ =
π
− θ0
2
(10.265)
z
z
θ′
θmin
y′
y
α
θ0
x
ψ′
y
ϕ′
x′
Figura 10.11 Los ejes x, y y z están fijos a la órbita y ubicados respecto a x, y y z mediante
los ángulos de Euler. x, y están sobre el plano de la órbita.
El ángulo entre el vector absidal del perihelio, eje x, y el eje z, es α, cuyo coseno
es el elemento 1 − 3 de la matriz que conecta los ejes x, y, z con los ejes x, y, z:
cos α = sen ψ ′ sen θ′ = cos θmin cos θ0
(10.266)
~ = ǫ~ex , por tanto
Puede mostrarse que el vector de Runge-Lenz tiene la expresión A
Az = ǫ cos α.
I determina la longitud del semieje mayor de la órbita a, en tanto que I y Iθ + Iϕ
determinan la excentricidad.
Concluimos que las variables acción-ángulo determinan la forma y tamaño de la
órbita, lo mismo que su orientación en el espacio. I además determina la frecuencia y
ϕr determina la posición de la partı́cula sobre la órbita. ϕ0 , θ0 , ϕr , Iϕ , Iθ + Iϕ , I son
conocidas como los elementos de Delaunay de la órbita en astronomı́a.
Ejemplo 10.4.2 Hallar las expansiones de Fourier para z y x ± iy.
458 / Mecánica clásica avanzada
De la matriz de rotación en términos de los ángulos de Euler se sigue:
z = sen θ′ sen ψ ′ x + sen θ′ cos ψ ′ y
(10.267)
Entonces, usando (10.265):
z = cos θmı́n (cos θ0 x + sen θ0 y)
(10.268)
x y y están dados por (10.222) y (10.223). En consecuencia:
(
∞ −iϕr X
e
3
Jn′ (nǫ) cos nϕr
z = aγ − ǫ−iϕr +
4
n
n=1
√
)
1 − ǫ2
eiϕθ
−i
Jn (nǫ) sen nϕr
ǫ
+aγ
(
∞ iϕr X
e
3
− ǫeiϕr +
4
n
n=1
(10.269)
Jn′ (nǫ) cos nϕr
√
)
1 − ǫ2
e−iϕθ
+i
Jn (nǫ) sen nϕr
ǫ
Igualmente de la matriz de rotación obtenemos:
x + iy = [(cos ψ ′ cos ϕ′ − cos θ′ sen ϕ′ sen ψ ′ )
+i(cos ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ sen ψ ′ )] x
(10.270)
+ [(−sen ψ ′ cos ϕ′ − cos θ′ sen ϕ′ cos ψ ′ )
+i(−sen ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ cos ψ ′ )] y
Usando nuevamente (10.265), (10.206) y (10.209) llegamos a:
h
p
x + iy = a sen θ0 + i 1 − γ 2 cos θ0 (cos ψ − ǫ)
√
i
p
1 − ǫ2 sen ψ ǫiϕ0
+ − cos θ0 + i 1 − γ 2 sen θ0
Finalmente, usando (10.222) y (10.223) llegamos a:
!
"
∞ −iϕr
X
p
e
3ǫ
Jn′ (nǫ) cos nϕr
− e−iϕr +
x + iy = i −1 + 1 − γ 2
4
n
n=1
#
∞ −iϕr
√1 − ǫ2 X
p
e
2
Jn (nǫ) sen nϕr eiϕϕ
− −1 − i 1 − γ
ǫ
n
n=1
"
!
∞ −iϕr
X
p
3ǫ
e
+ i 1 + 1 − γ2
− e−iϕr +
Jn′ (nǫ) cos nϕr
4
n
n=1
(10.271)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 459
p
− 1 + i 1 − γ2
! ∞
#
√
1 − ǫ2 X e−iϕr
Jn (nǫ) sen nϕr ei(ϕϕ −2ϕθ )
ǫ
n
n=1
(10.272)
Vemos que se anulan todos los coeficientes de Fourier para los cuales nϕ y nθ son
diferentes de:
nϕ = 0, 1, −1 ;
nθ = 0, ±2
En cuanto a n no hay ninguna restricción.
Según la fórmula (10.225), para este caso se tiene:
h
i
ω4 4
2
2
In, nθ , nϕ = 03 τn,
An, nθ , nϕ + Bn, nθ , nϕ
nθ , nϕ
3c
(10.273)
(10.274)
donde τn, nθ , nϕ es un número que describe el orden del armónico de ω0 radiado, y A y
B son los coeficientes de Fourier de z y de x + iy respectivamente. Vemos que solamente
es posible la radiación asociada a los nθ y nϕ dados por (10.273).
Las fórmulas (10.269) y (10.272) pudieron también obtenerse directamente de
(10.240) y de (10.256).
Ejemplo 10.4.3 Mostrar que el vector de Runge-Lenz (o de Laplace) es una constante
de movimiento asociada a la degeneración del movimiento en el problema de Kepler.
~ es constante:
Es simple mostrar que el vector A
~ = p~ × ~l − mk ~r
A
r
(10.275)
~ · ~l = 0, se sigue que A
~ es un vector fijo en el plano de la órbita. Tomando
Como A
~ con ~r obtenemos:
el producto escalar de A
Ar cos ϕv = l2 − mkr
(10.276)
Comparando con la ecuación de la órbita vemos que la magnitud de A es esencialmente ǫ:
A = mkǫ
(10.277)
~ es independiente de las
Se sigue entonces que sólo una de las componentes de A
~
~ está en la dirección
constantes de movimiento E y l. De (10.276) se sigue también que A
del perihelio, de donde se concluye que salvo el factor mk:
~ = ǫ~ex ;
A
Az = ǫ cos α
(10.278)
Como cos α tiene la expresión (10.266), se sigue que Az depende esencialmente
de la constante θ0 = ϕθ − ϕr , que sabemos es constante debido a la degeneración del
movimiento y además es independiente de ~l y E. También sabemos que la existencia de
este tipo de constantes está asociada a la posibilidad de separar las variables en otro
sistema de coordenadas. En efecto, según veremos, A es precisamente la constante que
aparece al separar variables en coordenadas parabólicas.
460 / Mecánica clásica avanzada
Ejemplo 10.4.4 Mostrar que las constantes de movimiento lx , ly están asociadas a la
degeneración del movimiento angular en un problema de fuerzas centrales.
De las fórmulas (5.23) en la sección 5.1 sabemos que:
lx = −pθ sen ϕ − pϕ cot θ cos ϕ ;
(10.279)
ly = pθ cos ϕ − pϕ cot θ sen ϕ
Que pθ y pϕ tienen las siguientes expresiones es válido en cualquier problema de
fuerzas centrales:
r
l2
pθ = l2 − z2 ;
pϕ = lz
(10.280)
sen θ
donde l y lz son las constantes de separación en coordenadas esféricas. Para precisar,
adoptemos los resultados en el movimiento kepleriano. Según (10.258) se cumple:
p
1 − γ2
sen θ = p
2
1 − γ cos2 (ϕ − ϕ0 )
(10.281)
−r sen (ϕ − ϕ0 )
cos θ = p
1 − γ 2 cos2 (ϕ − ϕ0 )
lx puede escribirse en la forma siguiente usando (10.260):
p
sen ϕ
− lz cot θ cos ϕ
lx = −l γ 2 − cos2 θ
sen θ
!
p
l 1 − γ 2 sen ϕ
=
− lz cos ϕ cot θ
tan (ϕ − ϕ0 )
(10.282)
Entonces, usando (10.281) llegamos a:
lx = l cos θmı́n sen ϕ0
(10.283)
similarmente,
ly = −l cos θmı́n cos ϕ0
(10.284)
Estos resultados son válidos para fuerzas centrales en general y no sólo en el caso
kepleriano, ya que independientemente de la forma del potencial la energı́a depende de
Iθ y Iϕ en la combinación Iθ + Iϕ , lo cual da lugar a que:
ωθ = ωϕ
(10.285)
en cualquier problema de fuerzas centrales y por tanto ϕ0 = ϕϕ − ϕθ es una constante
de movimiento, lo que a su vez implica que lx y ly sean constantes. l, lz y lx2 + ly2 =
l2 cos2 θmin = l2 −lz2 son constantes de movimiento especiales de las coordenadas esféricas
y por lo tanto sólo dependen de las variables de acción. lx y ly son constantes que
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 461
dependen de las variables angulares 6 ϕθ y ϕϕ a través de ϕ0 y están asociadas a la
posibilidad de separar el movimiento angular del radial en coordenadas esféricas donde
el eje polar es reemplazado por x o por y.
Que lx y ly dependan de las variables angulares es resultado de la propiedad general
del vector momento angular consistente en que no existe una transformación canónica
en que lx , ly , lz sean simultáneamente momentos generalizados. En efecto, en el ejemplo
9.8.4 se muestra que las componentes de ~l no están en involución entre sı́:
[li , lj ] = ǫijk lk ;
i, j, k = x, y, z
(10.286)
Notemos que (10.286) es una propiedad de los li que sabemos son los generadores
infinitesimales del grupo de rotaciones.
Se dice que ~l tiene un álgebra de Lie cuyas constantes de estructura son ǫijk .
Ejemplo 10.4.5 Mostrar la invariancia bajo el grupo O(4).
~ y ~l podemos formar los vectores J~ y K
~ definidos como:
Con los vectores A
1
1 ~
~ ;
~ = 1 ~l − √ 1
l+ √
J~ =
A
K
(10.287)
~
2
2
−2mE
−2mE A
Estos vectores están en involución entre sı́, mas no sus componentes:
[Ji , Jj ] = ǫijk Jk ,
[Ki , Kj ] = ǫijk Kk ,
[Ji , Kj ] = 0
(10.288)
~ tienen cada uno un álgebra de Lie como la del grupo de rotaPor tanto J~ y K
ciones. Concluimos que el hamiltoniano de una partı́cula ligada en un potencial −k/r
es invariante bajo dos grupos de rotaciones independientes. Estos grupos son subgrupos
de un grupo más general, el de las rotaciones ortogonales O(6). La representación O(6)
es reducible siendo una de sus representaciones irreducibles O(4). Como, según vimos
en la sección 7.8, existe un homomorfismo entre O(3) y SU (2), entonces podemos ver
que hay un homomorfismo entre las representaciones O(4) y SU (2) ⊗ SU (2). Vemos
que la degeneración del sistema que consideramos resulta del hecho de ser invariante el
hamiltoniano bajo un grupo de simetrı́a más amplio que el grupo de rotaciones.
~ K
~ y H sólo existen 5 constantes inEntre las siete constantes de movimiento J,
2
2
dependientes, que podemos tomar como J , K , Jz , Kz , H pues existen dos relaciones
entre ellas, provenientes de:
~ · ~l = 0 ;
J~ − K
2
~
J~ − K
= mkaǫ2
(10.289)
De (10.288) puede verse que estas cinco constantes no están en involución. Por tanto
si se halla un sistema de coordenadas en que J 2 y K 2 sean constantes de separación,
necesariamente Jz y Kz dependerán de variables angulares.
6 Puede
verse que los “buenos números cuánticos” están asociados precisamente con las variables
dinámicas que no dependen de variables angulares.
462 / Mecánica clásica avanzada
10.5.
Problema de Kepler (coordenadas parabólicas)
Las coordenadas parabólicas en tres dimensiones son una generalización de las
definidas en el ejemplo 10.3.5.
p
p
x = 2 ξn cos ϕ ;
y = 2 ξn sen ϕ ;
z =ξ−n
(10.290)
donde ϕ es el ángulo acimutal. Las fórmuIas inversas son:
ξ=
1
θ
(z + r) = r cos2
2
2
η=
θ
1
(−z + r) = r sen2
2
2
(10.291)
y
x
Con un procedimiento análogo al del ejemplo 10.3.5 llegamos a:
s
Z
p2ϕ
2mK1
2mE +
− 2 dξ
Σ(ξ, η, ϕ; E, K, pϕ ) =
ξ
4ξ
ϕ = tan−1
+
Z
s
2mE +
2mK2
−
η
p2ϕ
4η 2
dη + ϕpϕ
(10.292)
(10.293)
Las constantes de separación K1 y K2 satisfacen:
K1 + K2 = K ;
0 ≤ K1 ≤ K
Las variables de acción son definidas por:
s
I
p2ϕ
2mK1
dξ
2πIξ =
2mE − 2 +
4ξ
ξ
s
I
p2ϕ
2mK2
2πIη =
2mE − 2 +
dη
4η
η
2πIϕ = 2πpϕ
(10.294)
(10.295)
(10.296)
(10.297)
De la siguiente ecuación, dada en Goldstein, que se deduce similarmente a la integral de (10.134) en el ejemplo 10.3.4,
I r
√
C
2B
B
(10.298)
− 2 dr = 2πi
A+
−C + √
r
r
A
obtenemos:
Iξ , η = i
pϕ
mK1,2
i
+√
2
2mE
(10.299)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 463
que junto con (10.297) nos conduce a la siguiente expresión para la energı́a en términos
de las variables de acción parabólicas:
E=−
mk 2
2(Iξ + Iη + Iϕ )2
(10.300)
Si definimos a I como:
I = Iξ + Iη + Iϕ
(10.301)
llegamos a la siguiente expresión para las constantes K1 y K2 en términos de las variables
de acción:
K1,2 = K
2Iξ,η + Iϕ
2I
(10.302)
Es conveniente definir una sola constante, pues K1 y K2 están relacionadas por
(10.294):
β=
K1 − K2
Iξ − Iη
=
;
K
I
−1 ≤ β ≤ 1
(10.303)
Veremos que β coincide con la componente z del vector de Runge-Lenz (véase en
Mecánica cuántica de Laudau, sección 37).
Entonces K1 y K2 tienen la siguiente expresión en términos de β:
K1 =
1+β
K;
2
K2 =
1−β
K
2
(10.304)
Ejercicio 10.5.1 Expresar a K1 y K2 en coordenadas parabólicas. Luego, usando las
fórmulas de transformación expresar a β en coordenadas cartesianas y mostrar que
coincide con la componente z del vector de Laplace.
Variables angulares ϕξ y ϕη . De (10.293) se sigue que:
ϕξ
=
Z
m
s
∂E
m ∂K1
+
∂Iξ
ξ ∂Iξ
p2ϕ
2mK1
− 2
2mE +
ξ
4ξ
dξ
(10.305)
+
Z
s
∂E
m ∂K2
m
+
∂Iξ
η ∂Iξ
p2ϕ
2mK2
− 2
2mE +
η
4η
dη
De (10.300) y (10.302) se siguen:
ωξ = ωη = ωϕ =
2E
mk 2
∂E
= 3 =−
∂I
I
I
(10.306)
464 / Mecánica clásica avanzada
y,
∂K1,2
K2
=±
;
∂Iξ
I
K1
∂K1,2
=∓
;
∂Iη
I
K1 − K2
∂K1,2
=∓
∂Iϕ
I
(10.307)
Por tanto:
ϕξ
=
+
Z
Z
−
s
2mE
mK1
+
I
ξI
p2ϕ
2mK1
2mE +
− 2
ξ
4ξ
s
dξ
(10.308)
2mE
mK 2
−
−
I
ηI
p2ϕ
2mK2
2mE +
− 2
η
4η
dη
ϕη tiene una expresión análoga, colocando η, en lugar de ξ y K1 en lugar de K2 .
Definimos a y γ ası́:
a=
I2
;
mk
γ=
Iϕ
I
(10.309)
los puntos de retorno en ξ y ϕ están dados por:
s
!
1+β
γ2
1± 1−
;
ξmax,min = a
2
(1 + β)2
ηmax,min = a
1−β
2
1±
s
1−
2
γ
(1 − β)2
!
(10.310)
Las fórmulas 14.281 y 14.280 del Manual de fórmulas y tablas matemáticas de
Spiegel nos dan para ϕξ :
s 2
ξ
ξ
γ2
ϕξ = − −
+ (1 + β) −
a
a
4
r η 2
η
γ2
− −
+ (1 − β) − +
a
a
4
−sen−1
2 ξ
1−
1+β a
s
γ2
1−
(1 + β)2
ϕη tiene una expresión análoga intercambiando ξ con η y 1 + β con 1 − β.
(10.311)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 465
Si definimos a θ1 , Lξ y Lη ası́:
7
2ξ
1−
(1 + β) a
θ1 = ϕξ − ϕn ;
Lξ = s
;
γ2
1−
(1 + β)2
2η
1−
(1
−
β) a
Lη = s
γ2
1−
(1 + β)2
(10.312)
obtenemos:
2ξ 2η
,
=
a a
1−
s
γ2
1−
Lξ , η
(1 ± β)2
!
(1 ± β)
(10.313)
y,
θ1 = −sen−1 Lξ + sen−1 Lη
(10.314)
Además,
q
1p
(1 + β)2 − γ 2 1 − L2ξ
2
q
1p
−
(1 − β)2 − γ 2 1 − L2η − sen2 Lξ,η
2
ϕξ,η = −
(10.315)
Ahora definamos dos nuevas variables (anomalı́as excéntricas):
Lη = sen αη ;
Lξ = sen αξ
(10.316)
Entonces (10.314) y (10.315) se convierten en:
θ1 = −αξ + αη
ϕξ = −
1p
(1 + β)2 − γ 2 cos αξ
2
(10.318)
1p
(1 + β)2 − γ 2 cos(αη − θ1 )
2
(10.319)
1p
−
(1 + β)2 − γ 2 cos(θ1 + αξ ) − αξ
2
ϕη = −
7 Como
(10.317)
1p
−
(1 + β)2 − γ 2 cos αη − αη
2
se cumple (10.306), se sigue que θ1 es una constante de movimiento asociada a la degeneración.
466 / Mecánica clásica avanzada
Las fórmulas (10.318) y (10.319) son ecuaciones trascendentales que permiten en
principio expresar a αξ y αη en función de las variables angulares y en consecuencia de
(10.313) expresar a ξ y η en función del tiempo, en efecto:
ξ=
η=
p
1 a 1 + β − (1 + β)2 − γ 2 sen αξ
2
(10.320)
p
1 a 1 − β − (1 − β)2 − γ 2 sen αη
2
(10.321)
De (10.314) se obtiene una ecuación que relaciona a ξ con η y que constituye la
ecuación de la órbita en coordenadas parabólicas. El resultado es:
s
(
2η
a
(1 + β)2 − γ 2
1+β−
cos θ1
1
−
β
−
ξ=
2
(1 − β)2 − γ 2
a
(10.322)
#)
r
2
4η
4η
+ −γ 2 + (1 − β) − 2 sen θ1
a
a
Relación con la solución en coordenadas esféricas. Empecemos por expresar
a ǫ en términos de γ, β y θ1 . Para ello basta hallar una expresión para r = ξ + η usando
(10.320) y (10.321):
r
1 + β2 − γ2
1p
r
(1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1
=1−
+
a
2
2
(10.323)
(1)
× cos(αξ − αξ )
Donde:
(1)
tan αξ
p
p
(1 + β)2 + γ 2 + (1 − β)2 + γ 2 cos θ1
p
=
(1 − β)2 − γ 2 sen θ1
Comparando (10.323) con (10.203) cuando r = rmax , obtenemos:
r
1 + β2 − γ2
1p
(1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1
ǫ=
+
2
2
(10.324)
8
(10.325)
Por otra parte, z, en coordenadas parabólicas y en esféricas es:
8 Esta
1p
z
1p
(1 + β 2 ) − γ 2 sen αξ +
(1 − β)2 − γ 2 sen αη
=β−
a
2
2
r
i
z
1 − ǫ2 − γ 2 h p
2 sen ψ sen θ − (ǫ − cos ψ) cos θ
−
=
1
−
ǫ
0
0
a
1 − ǫ2
(10.326)
(10.327)
fórmula nos muestra que los valores de β y γ no son arbitrarios: si β > 0, 0 ≤ |γ| ≤ 1 − β y si
β < 0, 0 ≤ |γ| ≤ 1 + β.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 467
Estas expresiones equivalen a:
#
" r
1+β 2 −γ 2 1 p
(2)
2
2
2
2
4
z = a β+
(1−β ) −2γ (1+β )+γ cos θ1 cos(αξ −αξ ) (10.328)
−
2
2
z=a
r
(2)
i
p
1 − ǫ2 − γ 2 h
2 sen2 θ cos(ψ − ψ (1) )
1
−
ǫ
−ǫ
cos
θ
−
0
0
1 − ǫ2
y ψ (1) se definen ası́:
p
p
− (1 + β)2 − γ 2 + (1 − β)2 − γ 2 cos θ1
(2)
p
tan αξ =
(1 − β)2 − γ 2 sen θ1
√
1 − ǫ2 sen θ0
tan ψ (1) =
cos θ0
(10.329)
donde αξ
De (10.328) se sigue que:
máx
2
zmı́n
2
= 1 + β 2 − γ 2 − ǫ2 = β 2 + (1 − ǫ2 ) cos2 θmı́n
−β
a
En tanto que de (10.329):
p
máx
zmı́n
= a cos θmı́n −ǫ cos θ0 ± 1 − ǫ2 sen2 θ0
máx
De (10.332) y (10.333) obtenemos para β en términos de zmı́n
:
2
mı́n
zmáx
/a + (ǫ2 − 1) cos2 θmı́n
β=
mı́n /a
2zmáx
=
(10.330)
(10.331)
(10.332)
(10.333)
(10.334)
−ǫ cos θ0 cos θmı́n
Esto nos muestra que β es esencialmente la componente z del vector de Runge-Lenz:
en coordenadas parabólicas depende sólo de variables de acción, pero en coordenadas
esféricas depende además de variables angulares.
Por otra parte, de (10.325) y (10.334) se tiene la siguiente expresión para cos θ1 en
términos de γ, ǫ y cos θ0 , donde se ha llamado C a cos2 θmin :
−C + ǫ2 (1 + C sen2 θ0 )
p
C 2 − 2ǫ2 C(1 − 2 sen2 θ0 + C sen2 θ0 ) + ǫ4 (1 − C sen2 θ0 )2
(10.335)
Cuando la órbita toca el eje z, sen θmı́n = 0. Entonces:
cos θ1 =
−1 + 2ǫ2 − ǫ2 cos2 θ0
1 − ǫ2 cos2 θ0
(10.336)
esto nos permite llegar de (10.322), cuando γ = 0, al expresar a β, θ1 , ξ, η en función
de las cantidades esféricas, a la fórmula (10.245). (10.322) es, pues, la ecuación de una
elipse en el espacio expresada en coordenadas parabólicas (véase figura 10.12).
468 / Mecánica clásica avanzada
También de (10.334) y (10.325) se llega a una expresión para cos θ0 en términos de
γ, β y cos θ1 .
Las coordenadas ξ y η oscilan entre los lı́mites señalados por la ecuación (10.310).
Cuando γ = 0, ξmı́n = ηmı́n = 0. Cuando β = 0, ξmáx = ηmáx y ξmı́n = ηmı́n . Cuando
β = γ − 1, ξmı́n = ξmáx y cuando β = 1 − γ, ηmı́n = ηmáx . En general, la trayectoria
está confinada a una región en forma de anillo, definida por las paraboloides ξ = ξmı́n ,
ξ = ξmáx , η = ηmı́n , η = ηmáx .
z
η = ηmín
η = ηmáx
ξ = ξmáx
ξ = ξmín
Figura 10.12 Lı́mites del movimiento en coordenadas parabólicas
En el caso β = 0, γ = 1, resulta que ηmı́n = ηmax = ξmı́n = ξmax = a/2 y por tanto
el anillo queda reducido a una circunferencia de radio a colocada en el plano x − y. En
este caso según (10.325) ǫ = 0, como debe ser.
Cuando β = γ − 1 o β = −γ + 1, el movimiento sólo es posible a lo largo de curvas
colocadas sobre la superficie de un casquete lateral.
Las órbitas compatibles con valores dados de E, β, γ se caracterizan por tener un
vector de Runge-Lenz con componente z definida, por tener un momento angular con
componente z definida y por tener un semieje mayor de longitud definida. El ensamble
de órbitas con valores de E, β, γ definidos no tienen una excentricidad definida, aunque
la ecuación (10.325) fija el rango de excentricidades posibles.
Puede mostrarse que Iβ /2 y θ1 son variables canónicamente conjugadas, en tanto
que [Iϕ , θ1 ] = 0.
Como de (10.287) se puede hallar que:
1
1
(Iϕ − Iβ ) = I(γ − β)
(10.337)
2
2
se sigue que esencialmente Jz y θ1 son variables canónicamente conjugadas y que Jz es el
generador infinitesimal de z, las rotaciones que dejan invariante la proyección del vector
Jz =
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 469
de Laplace en el eje z. En una de estas rotaciones el valor de θ1 cambia y por ende el
valor de ǫ. Por tanto las rotaciones generadas por Jz en el espacio de representación de
O(4), no dejan rı́gida la órbita; θ1 no es un ángulo que especifique una orientación de
una órbita rı́gida, pues al variarse cambia necesariamente, o sea cambia el valor de l.
Para precisar, asumamos que γ = 0. Entonces de (10.310) se sigue que ξmı́n =
ηmin = 0, o sea que el anillo se convierte en una región llena, limitada por los paraboloides
ξmax = a(1 + β) y ηmax = a(1 − β). Según la ecuación de la órbita (10.322) cuando
η = ηmı́n , ξ vale:
1
ξ = (1 + β)(1 − cos θ1 )
(10.338)
2
cuando ξ = ξmı́n , η vale:
1
(10.339)
η = (1 − β)(1 − cos θ1 )
2
El punto de la órbita (0, ξ) es x = 0, y = 0, r = z = ξ. El punto de la órbita (η, 0)
es x = 0; y = 0, r = −z = η. En coordenadas esféricas estos puntos corresponden a las
intersecciones de la órbita vertical con el eje z, para los cuales:
a(1 − ǫ2 )
(10.340)
1 ± ǫ cos θ0
expresión que se puede obtener de (10.338) y (10.339). ǫ y θ0 están dados por:
r
1 + β 2 + (1 − β 2 ) cos θ1
ǫ=
(10.341)
2
s
2
(10.342)
cos θ0 = −β
2
1 + β + (1 − β 2 ) cos θ1
r=
Cuando θ1 = 0, ǫ = 1 y cos θ0 = −β. Cuando β = 1, ǫ = 1 y cos θ0 = −1. Son dos
casos de trayectoria rectilı́nea en un plano que pasa por el eje z.
De (10.328) y (10.329) junto con (10.334) y (10.335) se siguen las relaciones entre
las variables angulares y las anomalı́as excéntricas:
(2)
αξ = αξ + ψ − ψ (1) − π
(1)
ϕr = −ϕξ − αξ
(2)
(10.343)
(10.344)
(1)
αξ = αξ + ψ (1) + π
(10.345)
La variable angular ϕϕ , está dada por:
ϕϕ =
∂Σ
= ϕ+
∂Iϕ
Z
∂E
m ∂K1
pϕ ∂pϕ
m
+
− 2
∂Iϕ
ξ ∂Iϕ
4ξ ∂Iϕ
q
dξ
2
2
2mE − pϕ /(4ξ ) + 2mK1 /ξ
∂E
m ∂K2
pϕ ∂pϕ
Z m
+
− 2
∂Iϕ
η ∂Iϕ
4η ∂Iϕ
+ q
dη
2
2
2mE − pϕ /(4η ) + 2mK2 /η
(10.346)
470 / Mecánica clásica avanzada
usando (10.305), (10.306) y (10.307) obtenemos:
ϕϕ =
1
ϕ + (ϕξ + ϕη )
2
Z
dξ
1
q
− pϕ
4
ξ 2mEξ 2 + 2mK1 ξ − p2ϕ /4
1
− pϕ
4
Z
(10.347)
dη
q
2
η 2mEη + 2mK2 η − p2ϕ /4
calculando las integrales con la fórmula 14.283 del manual de Spiegel y expresando todas
las constantes de movimiento en función de a, β y γ, hallamos:
ϕϕ =
1
1
ϕ + (ϕξ + ϕη ) − sen−1
2
2
2ξ
γ2
−
a
1+β
s
2ξ
γ2
1−
a
(1 + β)2
(10.348)
1
− sen−1
2
γ2
2η
−
a
1−β
s
2η
γ2
1−
a
(1 − β)2
debido a la degeneración se cumple que:
1
(ϕξ + ϕη ) = ωt + Constante
2
(10.349)
Por tanto podemos definir una nueva constante de movimiento que depende de las
variables angulares y que debe su carácter de constante a la degeneración:
1
ϕ1 = ϕϕ − (ϕξ + ϕη )
2
(10.350)
Cuando γ = 0, el plano de la órbita se corta perpendicularmente con el plano x − y
en la lı́nea de nodos. En este caso ϕ vale ϕ1 ; luego ϕ1 es el ángulo que hace la lı́nea de
intersección del plano de la órbita con el plano ecuatorial 9 .
Cuando z = 0, ξ = η, y además ξ = ξmax , se cumple que ϕ = ϕ1 . Entonces ϕ1 es
el ángulo de la lı́nea de nodos de aquella elipse que pasa por ξmax en el plano ecuatorial,
para otros valores de ξ esto no se cumple.
Ejemplo 10.5.1 Hallar la expansión de Fourier para z y x + iy, en coordenadas parabólicas. Véase en Max Born The mechanics of the atom, sección 36.
9 Nótese
que (10.347) y (10.348) no son idénticas, pues las integrales indefinidas contienen constantes
que se han omitido en (10.348)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 471
De (10.326) y (10.317) se sigue que z depende de las variables angulares ϕξ y ϕη .
De (10.317) vemos que αξ no es función par ni impar de ϕξ y que αη no es función par
ni impar de ϕη . Por tanto la expansión de fourier de z contiene la forma sen nξ ϕξ y
cos nξ ϕξ y similarmente para la dependencia respecto a ϕη . Por esto es más conveniente
la siguiente expansión:
z=
∞
X
∞
X
Anξ nη ei(nξ ϕξ +nη ϕη )
(10.351)
nξ =−∞ nη =−∞
como z = ξ − η, los coeficientes de Fourier son:
Z 2π Z 2π
1
Anξ nη =
(ξ − η)e−i(nξ ϕξ +nη ϕη ) dϕξ dϕη
4π 2 0
0
(10.352)
De (10.318), (10.319) se sigue que:
p
1h
2 − (1 + β)2 − γ 2 sen αξ
2
i
p
− (1 − β)2 − γ 2 sen αη dαξ dαη
dϕξ dϕη
=
(10.353)
Reemplazando a (10.326) en (10.352), obtenemos:
1
4π 2
A00 =
Z
2π
0
Z
2π
0
h
1p
(1 + β)2 − γ 2 sen αξ
a β−
2
i
1p
(1 − β)2 − γ 2 sen αη
2
p
1h
× 2 − (1 + β)2 − γ 2 sen αξ
2
i
p
3
− (1 − β)2 − γ 2 sen αη dαξ dαη = βa
2
+
(10.354)
En los coeficientes donde nξ y nη no son ambos cero, el término constante β
en z se puede omitir, pues desaparece al efectuar la integral, según se ve en (10.352)
directamente. Entonces, usando una notación obvia y una propiedad de los lı́mites de
integración en (10.352):
Anξ nη =
a
4π 2
Z
3π/2
−π/2
Z
3π/2
(−S sen αξ + R sen αη )
−π/2
(1 − S sen αξ − R sen αη )
(10.355)
×einξ (αξ +S
cos αξ +R cos αη )
e+inη (αη +S
cos αξ +R cos αη )
dαξ dαη
472 / Mecánica clásica avanzada
si llamamos n = nξ +nη , y expresamos las funciones sen αξ y sen αη en forma exponencial,
obtenemos:
−a
16π 2
Anξ nη =
Z
3π/2
−π/2
Z
3π/2
−π/2
(2R2 − 2S 2 − 2iSeiαξ + 2iSe−iαξ
+2iReiαη − 2iRe−iαη + S 2 ei2αξ
(10.356)
−R2 ei2αη + S 2 e−i2αξ − R2 e−i2αη )
×einξ αξ +inS
cos αξ +inη αη +inR cos αη
dαξ dαη
Al sustituir αξ → 3π/2 − αξ y αη → 3π/2 − αη , cada una de las integrales resulta
proporcional a una integral de la forma:
1
2π
Z
3π/2
eikα+ix cos α dα =
−π/2
=
ei3k/2
2π
Z
2π
e−ikα−ix sen α dα
0
eikπ/2 Jk (x)
(10.357)
donde Jk (x) es la función de Bessel entera de orden k.
Expresando a (10.356) en términos de Jk y haciendo uso de las siguientes propiedades de las funciones Bessel:
Jk−1 (x) + Jk+1 (x) =
2k
Jk (x)
x
Jk−1 (x) − Jk+1 (x) = 2Jk′ (x)
(10.358)
(10.359)
obtenemos:
Anξ nη = ei nπ/2
i
ah
RJnξ (nR)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS)
n
(10.360)
Por tanto, la expansión de Fouurier para z es:
z=
3
βa
2
+a
nξ
×e
∞
i
i nπ/2 h
X
′ e
RJnξ (nS)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS)
n
=−∞ n =−∞
∞
X
η
(nξ ϕξ +nη ϕη )
(10.361)
donde la prima en la sumatoria indica que se excluye el término nξ = nη = 0.
Cuando nξ + nη = 0 no hay inconveniente porque Anξ nξ se anula.
Para hacer la expansión de x + iy, notemos que según (10.290):
p
x + iy = 2 ξηeiϕ
(10.362)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 473
Reemplazando a (10.320) y (10.321) en (10.348) obtenemos:
1
ϕϕ = ϕ + (ϕξ + ϕη )
2 p
(1 + β 2 ) − γ 2 − (1 + β) sen αξ
1
p
− sen−1
2
1 + β − (1 + β)2 − γ 2 sen αξ
p
(1 − β)2 − γ 2 − (1 − β) sen αη
1
−1
p
− sen
2
1 − β − (1 − β)2 − γ 2 sen αη
(10.363)
√
Luego usamos la fórmula sen−1 x = i ln(−ix + 1 − x2 ) y notamos que en el
numerador del argumento se puede formar un cuadrado perfecto para llegar a:
1
ϕϕ = ϕ + (ϕξ + ϕη )
2
h
αξ p
α i2
2 ) − γ 2 + iγ cos ξ
(1
+
β)
sen
−
(1
+
β
1
2
2
− i ln
p
2
C 1 + β − (1 + β)2 − γ 2 sen αξ
h
αη i2
αη p
−
(1 − β)2 − γ 2 + iγ cos
(1 − β) sen
2
2
×
p
1 − β − (1 − β)2 − γ 2 sen αη
C es una constante que depende de β y γ.
Notemos que:
p
p
(x + iy)ei(ϕη −ϕϕ ) = 2 ξη ei(ϕ+ϕη −ϕϕ ) = 2 ξηei(ϕη −ϕϕ )/2
h
αξ i
αξ p
(1 + β 2 ) − γ 2 + iγ cos
× (1 + β) sen
−
2
2
h
αη i
αη p
(1 − β)2 − γ 2 + iγ cos
× (1 − β) sen
−
2
2
(10.364)
(10.365)
y según (10.364),
a
(x + iy)ei(ϕη −ϕϕ ) = √ ei(ϕη −ϕξ )/2
C
h
αξ i
αξ p
(1 + β)2 − γ 2 + iγ cos
× (1 + β) sen
−
2
2
h
αη i
αη p
2
2
(1 − β) − γ + iγ cos
× (1 − β) sen
−
2
2
(10.366)
Cuando αξ = αη = 0 entonces r = ξ + η = a. Por tanto, salvo un factor de fase
constante, el valor de C es 1 − β 2 .
Born presenta en lugar de (10.366) una expresión que se origina en sus fórmulas (17) de
la sección 36. 10 Esto da lugar a una expansión de Fourier con valores erróneos para los
coeficientes.
10 Comparar
dichas fórmulas con las fórmulas 15.45 y 14.360 del manual de Spiegel.
474 / Mecánica clásica avanzada
La expansión de Fourier de (10.366) la escribimos como:
(x + iy)ei(ϕη −ϕϕ ) =
∞
X
∞
X
Bnξ nη einξ ϕξ +(nη +1)ϕη
(10.367)
nξ =−∞ nη =−∞
El coeficiente Bnξ nη está dado por:
Bnξ nη =
a
p
4π 2 1 − β 2
Z
3π/2 Z 3π/2
−π/2
−π/2
(1 − S sen αξ − R sen αη )
h
αξ i
αξ
− (2S + iγ) cos
× (1 + β) sen
2
2
h
αη i
αη
− (2R + iγ) cos
(1 − β) sen
2
2
×ei(nξ +1/2)αξ +i(nη +1/2)αη +inS
cos αξ +inR cos αη
(10.368)
dαξ dαη
donde n = nξ + nη + 1. Al expresar las funciones trigonométricas en forma exponencial,
las integrales que aparecen son del tipo de (10.357). En las simplificaciones debe usarse
(10.358).
El resultado para n 6= 0 es:
Bnξ nη = AJnξ +1 (nS) Jnη +1 (nR) + BJnξ (nS) Jnη (nR)
×
ei(n+1)π/2
n
(10.369)
donde A y B están dados por:
a
A= p
(1 + β + γ − 2iS)(1 − β + γ − 2iR)
4 1 − β2
a
B= p
(−1 − β + γ − 2iS)(−1 + β + γ − 2iR)
4 1 − β2
(10.370)
(10.371)
Para n = 0, las integrales en (10.368) son de tipo exponencial y son diferentes de
cero solamente cuando nξ = −1 y nη = 0 o nξ = 0 y nη = −1
ai
(2ixy ′ − Syy ′ + Rxx′ )
B−1,0 = p
8 1 − β2
donde:
ai
(2iyx′ − Ryy ′ + Sxx′ )
B0,−1 = p
8 1 − β2
x = 1 + β + γ − 2iS ;
y = −1 + β + γ − 2iS
y x′ y y ′ se obtienen de éstas reemplazando a β por −β.
(10.372)
(10.373)
(10.374)
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 475
En definitiva:
x + iy = B−1,0 e−iϕξ +iϕϕ + B0,−1 e−iϕη +iϕϕ
+
∞
X
∞
X
′
Bnξ nη einξ ϕξ +inη ϕη +iϕϕ
(10.375)
nξ =−∞nη =−∞
donde la prima en la sumatoria indica que n no es cero.
Este cálculo fue usado en el contexto de la vieja mecánica cuántica para hallar las
intensidades de las lı́neas espectrales del hidrógeno en presencia de un campo eléctrico
(efecto Stark). En presencia de un campo eléctrico el problema del átomo de hidrógeno
clásico es soluble en coordenadas parabólicas, y cuando el campo eléctrico es muy débil
la solución que hemos hallado en este numeral constituye la aproximación cero a este
sistema. Para hallar las intensidades se aplica la fórmula (10.225), del ejemplo 10.4.1.
Notamos que habrán dos contribuciones diferentes; una proveniente de z 2 , fórmula
(10.361) y otra proveniente de x2 +y 2 , fórmula (10.375). Para las componentes de Fourier
de z, nϕ = 0 y nξ + nη = n. Las amplitudes de las componentes z corresponden a la
radiación polarizada paralelamente al campo eléctrico homogéneo. Para las componentes
de Fourier de x ± iy, nϕ = ±1 y nξ + nη + 1 = n. Las amplitudes de las componentes
x + iy corresponden a la radiación polarizada perpendicularmente al campo eléctrico
homogéneo.
Born presenta el análisis que hace Kramers del desdoblamiento de Stark de la
lı́nea Hα del hidrógeno, o sea de las transiciones entre los niveles de números cuánticos
principales 2 y 3.
Ejemplo 10.5.2 Analizar las reglas de selección que se deducen de las expansiones de
Fourier (10.269), (10.272), (10.359) y (10.368).
En la vieja teorı́a cuántica y en el lı́mite clásico de la moderna teorı́a cuántica las
variables de acción están cuantizadas. Ası́, para el átomo de hidrógeno tenemos: 11
1
1
h̄ ; Iθ = l − m +
h̄ ; Iϕ = mh̄
Ir =
nr +
2
2
|m| − m 1
Iξ =
n1 +
(10.376)
+
h̄ ;
2
2
Iη =
|m| − m 1
h̄ ; I = mh̄
+
n2 +
2
2
El número cuántico principal está asociado a I = Ir + Iθ + Iϕ = Iξ + Iη + Iϕ y vale
nr + l + 1 = n1 + n2 + |m| + 1.
Ası́ por ejemplo, los estados esféricos y parabólicos para cuando el número cuántico
principal vale 2 son:
n, l, m = 2, 0, 0; 2, 1, −1; 2, 1, 0; 2, 1, 1
n1 , n2 , m = 0, 0, 1; 0, 1, 0; 1, 0, 0; 0, 0, −1
11 Esta
versión de las reglas de cuantización es consistente con la moderna teorı́a cuántica.
(10.377)
476 / Mecánica clásica avanzada
Los números enteros que aparecen en las expansiones de Fourier (10.361) y (10.375)
del problema anterior corresponden a las transiciones entre estados (véase Mecánica
cuántica de Laudau, sección 48). Ası́, en (10.361), nϕ = ∆m = 0 y en (10.375), nϕ =
∆m = 1 y en la compleja conjugada de (10.375), nϕ = ∆m = −1. En esta forma el
desarrollo de Fourier del momento de dipolo eléctrico da las reglas de selección clásicas:
respecto a n1 y n2 la regla de selección es ∆n1 + ∆n2 + 1 = nξ + nη + 1 6= 0, (∆n1 =
0, ∆n2 = −1), o (∆n1 = −1, ∆n2 = 0).
Respecto a l y m, de (10.269) y (10.271) se sigue que nθ + nϕ = ±1. Por otra parte,
de (10.351) se sigue:
∆l − ∆m = nθ
(10.378)
Entonces vemos que cuando nϕ = ∆m = ±1, nθ = ∆l ∓ 1 y cuando nϕ = ∆m = 0,
nθ = ∆l. Cuando, de acuerdo con (10.273), nθ = ∓2 y nϕ = ±1, nθ + nϕ = ∓1. Se sigue
entonces que ∆l = ±1 cuando nθ = ±2, nϕ = ∓1, y ∆l = 0 cuando nθ = 0, nϕ = 0, o
cuando nθ = ∓1, nϕ = ±1.
En conclusión, del desarrollo de Fourier de ~r en coordenadas esféricas se sigue que:
∆l = 0, ±1
y
∆m = 0, ±1
(10.379)
lo cual es consistente con la mecánica cuántica.
En todas las expansiones de Fourier que hemos hallado, ejemplos 10.4.1, 10.4.2 y
10.5.1, se cumple que los coeficientes de Fourier se corresponden con elementos de matriz
cuánticos en el lı́mite clásico (véase, Landau, Mecánica cuántica, sección 48).
Para detalles acerca de las reglas de cuantización semiclásicas véase el artı́culo de
I.C. Percival y las referencias allı́ contenidas.12 , y la sección 13.4 del capı́tulo 13 del
presente texto.
El toroide invariante. En coordenadas esféricas es tridimensional y consiste en
el lugar geométrico de los puntos del espacio fásico tales que Ir , Iθ , Iϕ tienen valores
bien definidos.
A partir de la figura 10.11 podemos hallar fácilmente algunas proyecciones del
toroide invariante sobre planos del espacio de configuración. La proyección del toroide
sobre el plano de la órbita a lo largo de la lı́nea ϕ0 = Constante y θ0 = Constante es una
elipse. ϕ0 = Constante define sobre el toroide una superficie bidimensional, cuya proyección sobre el plano de la órbita es una región circular que se obtiene rotando la elipse
alrededor del eje z. θ0 = Constante define sobre el toroide una superficie bidimensional
cuya proyección sobre el plano ecuatorial es una región circular que se obtiene rotando
la proyección de la elipse sobre el plano x − y alrededor del eje z; esta proyección es
un cı́rculo de radio rmax . La proyección del toroide sobre el espacio tridimensional es el
volumen obtenido al rotar el cı́rculo del plano x − y, de radio rmax , alrededor del eje z,
y es un elipsoide de revolución con ejes de longitudes rmax y rmax cos θmı́n es claro que
ambas dimensiones de este elipsoide dependen de las constantes de movimiento E, l, lz .
En coordenadas parabólicas el toroide invariante es completamente diferente (véase
figura 10.13).
La excentricidad de la órbita depende de las variables angulares a través de θ1 .
12 Semiclassical
theory of Bound States. I.C. Percival. Adv. Chem. Phys. Vol. 36, 1977.
La ecuación de Hamilton-Jacobi con variables acción-ángulo / 477
Según (10.325), en el toroide en coordenadas parabólicas son posibles elipses de
excentricidades diferentes dentro de un rango definido, que para γ = 0 varı́an entre β y
1. También para γ = 0, cos θ0 varı́a entre −1 y −β. Entonces, para θ1 = 0 la trayectoria
es rectilı́nea que hace un ángulo cos−1 (β) con respecto al eje z y para θ1 = π es una
elipse de excentricidad β cuyo perihelio está en π. Al barrer θ1 entre 0 y π genera un
ensamble de órbitas elı́pticas con perihelio en el tercer cuadrante y envueltas por las
parábolas ξmax y ηmax . La rotación de esta región alrededor de z genera la proyección
del toroide invariante sobre el espacio tridimensional, que es diferente de la proyección
en coordenadas esféricas.
z
η = (1 – β) a
θ1 = π
θ1 = 0
ξ = (1 – β) a
x
Figura 10.13 Toroide invariante en coordenadas parabólicas
478 / Mecánica clásica avanzada
11
Teorı́a de perturbaciones
Son muy pocos los problemas mecánicos que poseen soluciones analı́ticas exactas.
Por eso son necesarios diferentes métodos de aproximación para afrontar la mayor parte
de los problemas realistas.
En astronomı́a, donde se consideran sistemas de muchos cuerpos interactuando
gravitacionalmente, son indispensables los métodos numéricos y los aproximados, para
obtener los cambios en los parámetros de una órbita kepleriana o en los perı́odos, causados por pequeños efectos debidos a la presencia de los otros planetas. En el siglo XIX
hubo gran interés en el problema de la estabilidad del sistema solar, que llevó al estudio
del movimiento de muchos cuerpos interactuando entre sı́ mediante fuerzas gravitacionales, siendo el más simple el famoso problema de los tres cuerpos, tema que aún es
objeto de investigaciones. Los avances han sido notables, en parte como consecuencia
de los trabajos matemáticos de Kolmogorov, Arnold y Moser, quienes han obtenido las
condiciones de estabilidad de un sistema múltiplemente periódico.
Antes del surgimiento de la moderna teorı́a cuántica, la teorı́a clásica de perturbaciones fue muy aplicada a sistemas atómicos, especialmente para el cálculo de efectos
debidos a la interacción con campos electromagnéticos. Es notable el trabajo de Max
Born (noviembre de 1924).1 Esos esfuerzos no fueron estériles ni inútiles, pues dieron
lugar a la teorı́a de perturbaciones de la mecánica cuántica. Hoy esos estudios se aplican
con pocas variaciones a cálculos sobre la estructura vibracional en sistemas moleculares,
y al análisis de los átomos en estados altamente excitados.
La teorı́a clásica de perturbaciones con sus modernos desarrollos se aplica en campos tan disı́miles como la fı́sica de las altas energı́as (estabilidad de haces en un ciclotrón,
estabilidad del plasma en una máquina Tokamak, etc.), y la óptica (estabilidad de una
cavidad láser, propagación de la radiación láser en una fibra óptica, comportamientos
multiestables y caóticos en óptica cuántica, etc.), por ejemplo.
1 Véase
el texto The mechanics of the atom de Max Born.
479
480 / Mecánica clásica avanzada
11.1.
Teorı́a de perturbaciones dependiente del tiempo
En los problemas perturbativos el punto de partida es un sistema para el cual es
conocida la solución analı́tica exacta, que se denomina no perturbado, descrito por un
hamiltoniano H0 (p, q). El sistema de interés difiere del no perturbado por una pequeña
perturbación. Puede asumirse que la magnitud de la perturbación está determinada por
cierto parámetro que cuando vale cero hace que el hamiltoniano sea igual a H0 . Entonces
el hamiltoniano exacto admite la siguiente expansión en serie de potencias de λ:
H(q, p, t; λ) = H0 (q, p, t) + λH1 (q, p, t) + λ2 H2 (q, p, t) + ...
(11.1)
Por simplicidad denotaremos todos los términos de perturbación con H ′ , H =
H0 + H ′ .
La teorı́a dependiente del tiempo se caracteriza por encontrar mediante aproximaciones la función generatriz de la transformación canónica de evolución temporal que
satisface la ecuación de Hamilton-Jacobi dependiente del tiempo. La transformación se
realiza en dos pasos:
F (q, q0 , t) = F0 (q, q ′ , t) + F ′ (q ′ , q0 , t)
(11.2)
donde F0 conecta las variables (q, p) con las (q ′ , p′ ) y es una solución completa de la
ecuación de Hamilton-Jacobi dependiente del tiempo del problema no perturbado, o sea
que en ausencia de perturbación las (q ′ , p′ ) son constantes. Al aplicar la perturbación,
las (q ′ , p′ ) no serán constantes sino funciones que varı́an lentamente con el tiempo, si
λ es pequeña. F ′ conecta las variables (q ′ , p′ ) con las constantes (q0 , p0 ) del problema
perturbado. Al realizar la transformación (q, p) → (q ′ , p′ ), el hamiltoniano será H +
∂F0 /∂t = H0 + H ′ + ∂F0 /∂t = H ′ , pues por hipótesis H0 + ∂F0 /∂t = 0, y las ecuaciones
de movimiento serán:
q̇ν′ =
∂H ′
;
∂p′ν
ṗ′ν = −
∂H ′
∂qν′
(11.3)
Estas ecuaciones son rigurosas pues aún no se ha hecho ninguna aproximación,
pero usando la pequeñez de H ′ podemos adoptar un esquema de aproximaciones sucesivas. Cuando λ = 0, (q ′ , p′ ) son ciertas constantes que llamaremos (q0′ , p′0 ). Entonces al
reemplazar (q ′ , p′ ) en (11.3) al lado derecho por sus valores no perturbados obtenemos:
q̇ν′ 1 =
∂H ′ (q0′ , p′0 )
;
∂p′ν0
ṗ′ν1 = −
∂H ′ (q0′ , p′0 )
∂qν′ 0
(11.4)
donde (q1′ , p′1 ) son las soluciones de (11.3) al primer orden en λ. Las ecuaciones (11.4)
pueden ahora integrarse explı́citamente para darnos a (q1′ , p′1 ) en función del tiempo,
al primer orden en la perturbación. La corrección de segundo orden se halla usando la
solución de primer orden en el lado derecho de (11.3), y ası́ sucesivamente.
Podemos encontrar sistemáticamente las correcciones a cualquier orden de aproximación escribiendo en vez de (11.2) una expansión de F en potencias de λ:
F (q, q, t) = F (0) (q, q, t) + λF (1) (q, q, t) + λ2 F (2) (q, q, t) + ...
(11.5)
Teorı́a de perturbaciones / 481
Las funciones F (n) no pueden considerarse como funciones generatrices de una serie
de transformaciones canónicas, como F0 y F ′ , por la disposición de los argumentos.
Se cumple que H(q, p, t) = H(q, p, t) + ∂F/∂t. Entonces:
H(q, −∂F/∂q, t) = H(q, ∂F/∂q, t) + ∂F/∂t
(11.6)
Ahora expandimos los dos lados de (11.6) en potencias de λ usando (11.5) y,
H = H0 + λH1 + λ2 H2 + ...
(11.7)
La expansión de H0 es:
∂F
∂F (0)
∂H0 ∂F (1)
H0 q,
, t = H0 q,
,t + λ
·
∂q
∂q
∂~p
∂~q
(1)
(2)
2
1 ∂F
∂ H0 ∂F (1)
∂H0 ∂F
2
+ ...
·
+
·
·
+λ
∂~
p
∂~q
2 ∂~q
∂~p∂~q
∂~q
La expansión de H1 es:
∂F (0)
∂F
∂H1 ∂F (1)
, t = λH1 q,
, t + λ2
·
+ ...
λH1 q,
∂q
∂q
∂~p
∂~q
(11.8)
(11.9)
Esto nos conduce a:
H = H0 +
+λ2
h
i
∂F (1)
∂F (0)
+ λ F (1) , H0 + H1 +
∂t
∂t
F (2) , H0 + F (1) , H1
ii
h
1h
∂F (2)
+ F (1) , F (1) , H0 + H2 +
2
∂t
(11.10)
!
+ ...
Si H = 0, entonces F es la solución de la ecuación de Hamilton-Jacobi del problema
exacto. Podemos hallar las aproximaciones sucesivas igualando a cero los coeficientes de
cada λn :
H0 +
h
h
∂F (0)
=0
∂t
i ∂F (1)
= −H1
F (1) , H0 +
∂t
i ∂F (2)
ii
i 1h
h
h
F (2) , H0 +
F (1) , F (1) , H0 − H2
= − F (1) , H1 −
∂t
2
(11.11)
(11.12)
(11.13)
Las ecuaciones (11.11) y (11.12) forman un conjunto de ecuaciones diferenciales
para las F (n) , que se caracteriza porque en cada ecuación el lado derecho depende sólo
de cantidades que se han evaluado en una aproximación anterior.
482 / Mecánica clásica avanzada
11.2.
Teorı́a de perturbaciones independiente del tiempo
Esta teorı́a se aplica fundamentalmente a sistemas conservativos y ligados que
poseen soluciones múltiplemente periódicas. El punto de partida es la descripción del
sistema no perturbado en términos de las variables acción-ángulo. Luego se adopta un
esquema de aproximaciones sucesivas a las variables acción-ángulo del sistema perturbado. Está implı́cita la suposición de convergencia del procedimiento, o sea la existencia de
toroides invariantes del sistema perturbado; en general lo anterior no es cierto. El método se basa en hallar una expansión en potencias de λ para la función generatriz de la
transformación canónica que lleva a las variables acción-ángulo del sistema perturbado.
Se supone conocida la solución para el sistema no perturbado y que éste es no
degenerado. Es decir, que no existen números enteros n1 , n2 , ...nl tales que:
n1 ω10 + n2 ω20 + ...nl ωl0 = 0
(11.14)
donde las ων0 son las frecuencias del sistema no perturbado, y que esta condición se
cumple para cualquier conjunto de valores de las variables acción-ángulo no perturbadas.
Las variables canónicas (I 0 , ϕ0 ) son variables acción-ángulo sólo para el sistema no
perturbado; al aplicar la perturbación siguen siendo canónicas pero dejan de ser variables
acción-ángulo. Esto se sigue de las ecuaciones de movimiento:
∂H
I˙ν0 = − 0 ;
∂ϕν
ϕ̇0ν =
∂H
∂Iν0
(11.15)
Las Iν0 dependen del tiempo y las ϕ0ν no son funciones lineales del tiempo. Para
λ = 0, H = H0 y en ese caso se cumple que H0 sólo es función de las Iν0 . H, sin embargo,
tiene la expresión:
H(I 0 , ϕ0 , t) = H0 (I 0 ) + λH1 (I 0 , ϕ0 , t) + λ2 H2 (I 0 , ϕ0 , t) + ...
(11.16)
Mediante una transformación canónica es posible, si el sistema perturbado es integrable, pasar a unas variables canónicas (I, ϕ) tales que H sea función sólo de las Iν .2
Llamaremos F (ϕ0 , I) a la función generatriz de esa transformación, del tipo F2 . Las
siguientes son las fórmulas de transformación:
Iν0 =
∂F
;
∂ϕ0ν
ϕν =
∂F
∂Iν
(11.17)
Las nuevas variables deben satisfacer las siguientes condiciones: (a) Las coordenadas del sistema (q, p) deben ser funciones periódicas de las ϕν con perı́odo 2π. (b) H
debe transformarse en una función que depende sólo de las Iν . (c) Las variables (ϕ0 , I 0 )
han de ser funciones periódicas de las ϕν con perı́odo 2π.
Las coordenadas (q, p) son funciones periódicas tanto de las ϕ0ν como de las ϕν .
Esto implica que una celdilla fundamental en el espacio ϕ0ν se transforma en otra del
espacio ϕν . Entonces debe cumplirse que ϕν es igual a ϕ0ν más una función periódica de
las ϕ0ν con perı́odo 2π.
2 Esta
teorı́a fue desarrollada por H. Poincaré (1892) y H. von Zeipel (1916).
Teorı́a de perturbaciones / 483
La función F (ϕ0 , I) puede expandirse en una serie de potencias de λ. Cuando
λ = 0, F se convierte en la función generatriz de la transformación canónica identidad,
de ahı́ que deba ser del tipo F2 :
F (ϕ0 , I) =
l
X
ϕ0ν Iν + λF (1) (ϕ0 , I) + λ2 F (2) (ϕ0 , I) + ...
(11.18)
ν=1
Entonces (11.16) y (11.18) nos conducen a:
Iν0 = Iν + λ
(2)
∂F (1)
2 ∂F
+
λ
+ ...
∂ϕ0ν
∂ϕ0ν
ϕν = ϕ0ν + λ
(11.19)
∂F (1)
∂F (2)
+ λ2
+ ...
∂Iν
∂Iν
(11.20)
F (1) , F (2) , ... deben ser funciones periódicas de las ϕ0ν con perı́odo 2π.
La ecuación de Hamilton-Jacobi del problema perturbado es:
∂F
0 ∂F
0 ∂F
2
+ λH1 ϕ ,
+ λ H2 ϕ ,
+ ... = H(I)
H0
∂ϕ0
∂ϕ0
∂ϕ0
(11.21)
Ahora reemplazamos (11.19) en (11.21) y expandimos cada término de (11.21) en
potencias de λ. Llamamos λn H (n) (I) al n-ésimo término de la expansión de H(I). En
seguida igualamos los coeficientes de cada λn y obtenemos una secuencia de ecuaciones
diferenciales, ası́:
H0 (I) = H (0) (I)
(11.22)
X ∂H0
(11.23)
ν
∂Iν
·
∂F (1)
+ H1 (ϕ0 , I) = H (1) (I)
∂ϕ0ν
1 X X ∂ 2 H0 ∂F (1) ∂F (1) X ∂H0 ∂F (2)
·
·
·
+
2 µ ν ∂Iν ∂Iµ ∂ϕ0ν
∂ϕ0µ
∂Iν
∂ϕ0ν
ν
+
X ∂H1 ∂F (1)
·
+ H2 (ϕ0 , I) = H (2) (I)
0
∂I
∂ϕ
ν
ν
ν
(11.24)
....................................
n−1
X n−s
X
l
X
X
s=0 k=1 ν1 ,ν2 ,...νk =1 i1 +i2 +...ik
(i2 )
·
1
∂ k Hs
∂F (i1 )
·
k! ∂Iν1 ∂Iν2 ...∂Iνk ∂ϕ0ν1
=s
(ik )
∂F
∂F
...
+ Hn (ϕ0 , I) = H (n) (I) ;
∂ϕ0ν2
∂ϕ0νk
n = 0, 1, 2, ...
(11.25)
484 / Mecánica clásica avanzada
Todas estas ecuaciones son de la forma:
l
X
∂H0 ∂F (n)
·
+ Φn (ϕ0 , I) = H (n) (I)
0
∂I
∂ϕ
ν
ν
ν=1
(11.26)
donde Φn es una función que depende sólo de F (1) , F (2) , ...F (n−1) .
La ecuación (11.23) permite determinar a la vez a H (1) (I) y a F (1) . Como F (1) es
función periódica de las ϕ0ν , el valor medio de (11.23) sobre una celdilla fundamental en
el espacio de las ϕ0ν , o sea sobre el toroide invariante del movimiento no perturbado, es
cero. Por tanto:
H (1) (I) = hH1 (ϕ0 , I)i
donde h(...)i denota:
1
(2π)l
h(...)i =
Z
2π
0
dϕ01
(11.27)
Z
0
2π
dϕ02 ...
Z
0
2π
dϕ0l (...)
(11.28)
La energı́a del movimiento perturbado es, en la primera aproximación, igual a la
energı́a del movimiento no perturbado más una corrección dada por el promedio de la
función de perturbación sobre el toroide invariante del movimiento no perturbado. Este
promedio, cuando se cumpla la hipótesis ergódica, también es igual al promedio temporal
de H1 sobre el movimiento no perturbado. Para calcular a F (1) , es necesario resolver la
ecuación diferencial:
l
X
∂H0 ∂F (1)
.
= − H1 (ϕ0 , I)
0
∂I
∂ϕ
ν
ν
ν=1
(11.29)
donde el signo {H1 } denota la parte oscilante de H1 , o sea la diferencia H1 − hH1 i, que
puede representarse por una serie de Fourier de la forma:
XX X
0
0
0
′
An1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl )
(11.30)
...
{H} =
n1
n2
nl
donde la tilde en la sumatoria denota la omisión del término con n1 = n2 = ...nl = 0.
F (1) tiene una expansión similar:
XX X
0
0
0
′
F (1) =
...
Bn1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl )
(11.31)
n1
n2
nl
Los coeficientes de Fourier de F (1) se obtienen directamente de los de {H1 } al
reemplazar a (11.30) y (11.31) en (11.29):
B~n (I) =
−A~n (I)
i~n · ~
ω 0 (I)
(11.32)
En la aproximación de primer orden se sigue de (11.20):
ϕν = ϕ0ν + λ
∂F (1) (ϕ0 , I)
∂Iν
(11.33)
Teorı́a de perturbaciones / 485
lo cual nos dice que las variables angulares perturbadas presentan pequeñas oscilaciones
con amplitud del orden de λ.
El cambio en las frecuencias se obtiene de:
ων0 (I) =
∂H(I)
∂H (1) (I)
= ων0 (I) + λ
∂Iν
∂Iν
(11.34)
y resulta ser pequeño.
De (11.19) se obtiene para las Iν0 :
Iν = Iν + λ
∂F (1) (ϕ0 , I)
∂ϕ0ν
(11.35)
lo cual muestra que las Iν0 que en el movimiento no perturbado son constantes, ahora
están sometidas a oscilaciones de amplitud del orden de λ.
Que no haya degeneración es una exigencia necesaria para que (11.32) tenga sentido. Ası́ no haya degeneración pueden presentarse los llamados pequeños divisores, o sea
valores de n1 , n2 , ...nl tales que ~n · ~ω 0 toma valores pequeños.
De (11.24) se sigue que la parte oscilante en el lado izquierdo debe anularse, lo cual
nos da una ecuación diferencial para F (2) :
∂F (1) ∂F (1)
1 X X ∂ 2 H0
·
·
2 µ ν ∂Iν ∂Iµ
∂ϕ0ν
∂ϕµ
(11.36)
X ∂H0 ∂F (2) X ∂H1 ∂F (1) + H2 (ϕ0 , I) = 0
+
·
+
0
0
∂I
∂ϕ
∂I
∂ϕ
ν
ν
ν
ν
ν
ν
En tanto que la corrección de segundo orden a la energı́a viene dada por:
X ∂H1 ∂F (1) 0
H2 (I) = hH2 (ϕ , I)i +
·
∂Iν
∂ϕ0ν
ν
1 X X ∂ 2 H0
+
2 µ ν ∂Iµ ∂Iν
∂F (1) ∂F (1)
·
∂ϕ0µ
∂ϕ0ν
(11.37)
Podemos ahora usar (11.31) y (11.32) en (11.37) para obtener:
H (2) = hH2 i −
l X
X
n nν A−~
n
′ ∂A~
0
∂I
~
n
·
ω
~
ν
ν=1
~
n
+
l
l
1 X X ∂ωµ0 X ′
A~n A−~n
nν nµ
2 µ=1 ν=1 ∂Iν
(~n · ~ω 0 )2
(11.38)
~
n
donde se ha usado la fórmula:
~
hei(~n+m)
· ϕi = δ~n,−m
~
(11.39)
486 / Mecánica clásica avanzada
H (2) puede también escribirse en la forma:
H (2) = hH2 i −
l
|A~n |2
∂
1 X′ X
nν
2
∂Iν ~n · ω
~0
ν=1
(11.40)
~
n
que equivale también a:
H
(2)
= hH2 i −
l
X X
~
n·~
ω 0 >0
∂
nν
∂Iν
ν=1
|A~n |2
~n · ~ω 0
(11.41)
Para la corrección de orden n, se sigue de (11.26) que:
H (n) (I) = hΦn (ϕ0 , I)i
(11.42)
en tanto que F (n) es solución de la ecuación:
l
X
ων0
ν=1
∂F (n)
= − {Φn }
∂ϕ0ν
Podemos expresar a {Φn } como una serie de Fourier:
X (n)
′
im·
~ ϕ
~0
{Φn } =
Am
~ (I) e
(11.43)
(11.44)
m
~
de donde se sigue que los coeficientes de Fourier de F (n) son:
(n)
Bm
~ (n) =
−Am
~
im
~ ·ω
~0
(11.45)
Esto nos dice que a cada orden es necesaria la condición de no degeneración del
movimiento no perturbado. Poincaré mostró que las series de Fourier para las F (n)
son convergentes en sentido asintótico. Por esto pueden truncarse a partir de valores
razonables de los nν y obtenerse resultados precisos, independientemente de la presencia
de los “pequeños divisores” que necesariamente aparecen para nν grandes al tomar la
serie completa.
Ejemplo 11.2.1 Encontrar las correcciones de primero y segundo orden para un oscilador
armónico con perturbación anarmónica.
El oscilador anarmónico con correcciones cúbicas y cuárticas es soluble exactamente
por cuadraturas. Pero es ilustrativa la manera de aplicar la teorı́a de perturbaciones para
obtener las variables acción-ángulo del problema perturbado.
El hamiltoniano no perturbado es:
H0 =
1
p2
+ m(ω 0 )2 q 2
2m 2
(11.46)
y la perturbación:
H1 = aq 3 ;
H2 = bq 4
(11.47)
Teorı́a de perturbaciones / 487
De acuerdo con el ejemplo 9.5.5, las variables acción-ángulo del problema no perturbado se hallan mediante la transformación canónica con función generatriz F1 , dada
por:
F (q, ϕ0 ) =
1
mω02 cot ϕ0
2
(11.48)
que da lugar a la transformación:
0 1/2
2I
sen ϕ0 ;
p = (2mI 0 ω 0 )1/2 cos ϕ0
q=
mω 0
(11.49)
Expresando a H0 , H1 y H2 en términos de I 0 y ϕ0 , obtenemos:
H0 = I 0 ω 0
(11.50)
H1 = a
2I 0
mω 0
3/2
H2 = b
2I 0
mω 0
2
sen3 ϕ0
(11.51)
sen4 ϕ0
(11.52)
De (11.27) obtenemos directamente:
H (1) = hH1 i = 0
(11.53)
Como ∂H0 /∂I 0 = ω 0 , se sigue de (11.29) que F (1) obedece la ecuación:
∂F (1)
a
=− 0
∂ϕ0
ω
2I
mω 0
3/2
sen3 ϕ0
(11.54)
Es decir, el término cúbico en la perturbación no da lugar a cambio en la energı́a
del oscilador. Pero como F (1) es diferente de cero, las expresiones (11.49) para p y q
sı́ resultan modificadas al primer orden. Al introducir la perturbación, I 0 deja de ser
constante, pues de (11.35) y (11.54) se sigue que presenta oscilaciones de frecuencias w0
y 3w0 .
Ahora, usemos (11.24) para hallar a H (2) :
∂H1 ∂F (1)
(2)
0
(11.55)
·
H (I) = hH2 (ϕ , I)i +
∂I
∂ϕ0
El cálculo nos da:
H (2) = −
15a2
I2
I2
3b
+
3
0
4
2
4 m (ω )
2 m (ω 0 )2
(11.56)
De (11.54) se sigue la siguiente expresión para F (1) :
F (1) =
a
3ω 0
2I
mω 0
3/2
sen2 ϕ0 cos ϕ0 + 2 cos ϕ0
(11.57)
488 / Mecánica clásica avanzada
0por tanto:
∂F
λa
ϕ=
= ϕ0 +
∂I
2Iω 0
2I
mω 0
3/2
sen2 ϕ0 cos ϕ0 + 2 cos ϕ0
(11.58)
Ahora resolvemos esta ecuación para ϕ0 en términos de ϕ, al primer orden en λ:
3/2
λa
2I
0
ϕ =ϕ−
sen2 ϕ cos ϕ + 2 cos ϕ
(11.59)
2Iω 0 mω 0
A este mismo orden, I 0 en función de (I, ϕ) es:
3/2
λa
2I
0
I =I− 0
sen3 ϕ
ω
mω 0
(11.60)
Al reemplazar (11.59) y (11.60) en la expresión (11.49) para q, que sigue siendo
válida en el sistema perturbado, obtenemos:
1/2
λaI
2I
sen ϕ − 2 0 3 (3 + cos 4ϕ)
(11.61)
q=
mω 0
m (ω )
Ejercicio 11.2.1 Aplicar la teorı́a de perturbaciones al péndulo simple, tomando como
parámetro pequeño la relación entre la energı́a de libración y la energı́a de la separatriz
(pequeñas oscilaciones). Mostrar que:
H(I) = ω 0 I −
F (1)
λGI
16
2
(11.62)
GI 2
=−
(8 sen ϕ − sen 4ϕ)
192ω 0
ver el ejemplo 10.3.2.
11.3.
Multiplicidad de conjuntos de variables acciónángulo en los sistemas degenerados
Los ejemplos 10.3.5 y 10.4.4 ilustran la propiedad general de los sistemas degenerados consistente en que la separación de variables de la ecuación de Hamilton-Jacobi es
posible en diferentes sistemas de coordenadas, lo que a su vez conlleva a la posibilidad
de definir diferentes conjuntos de variables acción-ángulo.
Entonces un sistema múltiplemente periódico con degeneración se caracteriza por
poseer diferentes conjuntos de perı́odos, correspondientes a los diferentes conjuntos de
variables acción-ángulo. Si f denota alguna coordenada o momento generalizado, cuando el sistema es degenerado existen varios conjuntos de variables acción-ángulo (I,ϕ),
(I ′ ,ϕ′ ), ..., con lo cual f posee la propiedad:
f (I1 , I2 , ...Il ; ϕ1 + 2π, ϕ2 + 2π, ...ϕl + 2π) =
(11.63)
f (I1 , I2 , ...Il ; ϕ1 , ϕ2 , ...ϕl )
Teorı́a de perturbaciones / 489
f (I1′ , I2′ , ...Il′ ; ϕ′1 + 2π, ϕ′2 + π, ...ϕ′l + 2π) =
(11.64)
f (I1′ , I2′ , ...Il′ ; ϕ′1 , ϕ′2 , ...ϕ′l , ), etc.
Es decir, las diferentes expresiones de f en variables acción-ángulo poseen propiedades de periodicidad similares.
Como ilustración, ver las fórmulas (10.269) ejemplo 10.4.2, y (10.361) ejemplo
10.5.1, mediante las cuales se expresa a z en términos de las variables acción-ángulo
esféricas y parabólicas en el caso de una partı́cula en un potencial 1/r. Se ve que la
relación entre los diferentes conjuntos de variables no es trivial y que las variables de
acción esféricas dependen no sólo de las variables de acción parabólicas sino también de
las variables angulares parabólicas.
La ecuación (10.344) nos da la relación entre ϕr y las variables acción-ángulo
parabólicas:
−1 A + B cos(αη − αξ )
ϕr = −ϕξ − tan
(11.65)
B sen (αη − αξ )
que nos muestra que ϕr es igual a una función lineal de las variables angulares parabólicas
más una función periódica de esas variables.
Teorema 11.3.1 Todos los sistemas de variables angulares en que una función f (I, ϕ)
tiene perı́odo fundamental 2π, están conectados entre sı́ por las fórmulas:
ϕν =
l
X
nνµ ϕ′µ + ψν (ϕ′1 , ϕ′2 , ...ϕ′l , I1′ , I2′ , ...Il′ )
(11.66)
µ=1
ν = 1, 2, ...l
donde las nνµ forman una matriz de elementos enteros y determinante ±1 y las ψν
son funciones periódicas de las ϕ′ν con perı́odo 2π. Según el teorema, buscamos una
transformación:
ϕν = fν (ϕ′ , I ′ )
(11.67)
para la cual es preservada la periodicidad de cualquier variable dinámica F (como la z
citada anteriormente):
F (ϕ, I) = F ′ (ϕ′ , I ′ )
(11.68)
Ahora llamemos ϕν a:
ϕν = fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l )
(11.69)
Entonces:
F (I; ϕ1 , ϕ2 , ...ϕl ) = F ′ (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) =
(11.70)
F ′ (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) = F (I; ϕ1 , ϕ2 , ...ϕl )
490 / Mecánica clásica avanzada
Lo cual significa que ϕν y ϕν difieren por un múltiplo de 2π entero que llamaremos
2πnν1 :
fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) = fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnν1
(11.71)
De manera similar se cumple:
fν I ′ ; ϕ′1 , ϕ′2 , ...ϕ′µ + 2π, ...ϕ′l =
fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnνµ ;
ν, µ = 1, 2, ...l
(11.72)
esto sólo es posible si fν es de la forma:
fν (I ′ , ϕ′ ) =
l
X
nνµ ϕ′µ + ψν (ϕ′ , I ′ )
(11.73)
µ=1
donde ψν es función periódica de las ϕ′µ con perı́odo 2π.
Claramente vemos que (11.65) es una realización de la fórmula (11.66). Evidentemente la expresión para ϕ′ν en términos de (ϕ) es de la forma (11.66). Esto requiere que
la matriz inversa de (nνµ ) tenga igualmente elementos enteros. La condición necesaria
para esto es que det (nνµ ) = ±1.
Función generatriz de la transformación (ϕ, I)→ (ϕ′ , I ′ ). La transformación
(11.66) se puede escribir como:
ϕν =
l
X
nνµ ϕ′µ + ψν (ϕ′ , I) ;
ν = 1, 2, ...l
(11.74)
µ=1
Lo cual indica que la transformación canónica se puede obtener mediante una
función generatriz de la forma G(ϕ′ , I), del tipo F3 :
ϕν = −
∂G
;
∂Iν
Iν′ = −
∂G
;
∂ϕ′ν
ν = 1, 2, ...l
(11.75)
Con lo cual G es de la forma:
G(ϕ′ , I) = −
l
X
nνµ Iν ϕ′µ + ψ (ϕ′ , I)
(11.76)
ν,µ=1
lo cual implica que las ψν deben ser derivadas parciales de ψ y por tanto se debe cumplir:
∂ψµ
∂ψν
=
∂Iµ
∂Iν
(11.77)
Las fórmulas de transformación para las Iν′ son:
Iν′ =
l
X
µ=1
nνµ Iν −
∂ψ
∂ϕ′ν
La función ψ debe ser periódica en las ϕν y en las ϕ′ν . Por tanto:
X
ψ=
C~n (I)ei~n·ϕ~
~
n
(11.78)
(11.79)
Teorı́a de perturbaciones / 491
Entonces (11.74) y (11.78) toman la forma:
ϕν =
l
X
nνµ ϕ′µ −
X ∂C~n (I)
nνµ Iν − i
X
µ=1
Iν′
=
l
X
µ=1
∂Iν
~
n
ei~n·ϕ~
′
C~n (I)nν ei~n·ϕ~
(11.80)
′
(11.81)
~
n
Como tanto las (I, ϕ) como las (I ′ , ϕ′ ) son variables acción-ángulo, las (I, I ′ ) deben
ser constantes y las (ϕ, ϕ′ ) deben ser funciones lineales del tiempo. Esto implica una de
las dos condiciones siguientes:
C~n (I) = 0
para
~n 6= 0
(11.82)
o que en el exponente de la serie de Fourier sólo aparecen combinaciones de las ϕ′ν tales
que:
n1 ϕ′1 + n2 ϕ′2 + ...nl ϕ′l = (n1 ω1′ + n2 ω2′ + ...nl ωl′ ) t
(11.83)
+n1 δ1′ + n2 δ2′ + ... + nl δl′ = constante
Claramente la condición (11.83) requiere que el sistema sea degenerado, ~n · ω
~ ′ = 0.
En conclusión, para un sistema no degenerado, hay varios conjuntos de variables
acción-ángulo, conectados entre sı́ mediante las fórmulas:
ϕν =
l
X
µ=1
nνµ ϕ′µ −
∂ψ
;
∂Iν
Iν′ =
l
X
nνµ Iν
(11.84)
µ=1
con función generatriz:
G(ϕ′ , I) = −
l X
l
X
nνµ Iν ϕ′µ + ψ(I)
(11.85)
ν=1 µ=1
donde nνµ es una matriz de elementos enteros y determinante ±1.
En el caso degenerado, asumimos que entre las ων′′ existen l − s relaciones de conmensurabilidad:
l
X
nν ων′′ = 0
(11.86)
ν=1
Es posible realizar una transformación canónica auxiliar a nuevas variables acciónángulo (I ′ , ϕ′ ) tal que l − s de las frecuencias ων′ sean idénticamente cero y las s restantes
sean no nulas e independientes entre sı́:
ωα′ ;
α = 1, 2, ...s
(Inconmensurables)
(11.87)
ωρ′ = 0 ;
ρ = s + 1, s + 2, ...l
492 / Mecánica clásica avanzada
La función generatriz de tal transformación es de la forma:
F =−
l
X
Cνµ Iν′′ ϕ′µ
(11.88)
ν,µ=1
De donde:
ϕ′′ν =
l
X
Cνµ ϕ′µ ;
Iν′ =
l
X
Cνµ Iµ′′
(11.89)
µ=1
µ=1
donde las ων′′ satisfacen las relaciones (11.86). Claramente:
ϕ′ν =
l
X
Cνµ ϕ′′µ
(11.90)
µ=1
lo cual implica que para satisfacerse (11.87) es necesario:
l
X
Cµρ ϕ′′µ = 0
para
ρ = s + 1, s + 2, ...l
(11.91)
µ=1
Es decir, las Cµρ se obtienen de los nµ que aparecen en las l − s relaciones de
conmensurabilidad (11.86).
Ejemplo 11.3.1 Considerar el movimiento de una partı́cula en un potencial 1/r. Este
problema es degenerado. Realizar una transformación a variables acción-ángulo tales
que las frecuencias satisfagan las condiciones (11.87).
En coordenadas esféricas las dos condiciones de degeneración pueden escribirse
como:
ωr − ωθ = 0 ;
ωϕ − ωθ = 0
(11.92)
De la función generatriz F = (ϕϕ − ϕθ )I1 + (ϕr − ϕθ )I2 + ϕr I3 se sigue que las
variables acción-ángulo buscadas son:
ϕ1 = ϕϕ − ϕθ ;
ϕ2 = ϕr − ϕθ ;
ϕ3 = ϕr
(11.93)
y,
I1 = Iϕ ;
I2 = Iθ + Iϕ ;
I3 = Ir + Iθ + Iϕ
(11.94)
mk 2
I33
(11.95)
Las nuevas frecuencias son:
ω1 = 0 ;
ω2 = 0 ;
ω3 =
En coordenadas parabólicas la transformación buscada puede obtenerse con la
función generatriz:
ϕξ + ϕη
− ϕ I1 + (ϕξ − ϕη )I2 − ϕξ I3
(11.96)
F =
2
Teorı́a de perturbaciones / 493
que da lugar a la transformación:
I1 = Iϕ ;
I2 = Iη +
ϕ1 = ϕϕ −
ϕξ + ϕη
;
2
Iϕ
;
2
I3 = Iξ + Iη + Iϕ
ϕ2 = ϕη − ϕξ ;
ϕ3 = ϕξ
(11.97)
(11.98)
En tanto que ω1 , ω2 y ω3 están dadas por las fórmulas (11.95). Con esta transformación, los resultados del capı́tulo 10 referentes a las constantes de movimiento que
resultan de la degeneración se expresan como:
θ1 = −ϕ2 ;
φ1 = ϕ1
(11.99)
La clasificación dada en (11.87) nos permite llamar a las ϕ′α y Iα′ variables acciónángulo propias, y a las ϕ′ρ , Iρ′ , variables impropias o degeneradas; las ϕ′ρ permanecen
constantes en el curso del movimiento. El número s de frecuencias ωα′ no nulas e independientes se llama el grado de periodicidad del sistema y el número l − s se llama el
grado de degeneración.
Consideraremos ahora las fórmulas de transformación (11.80) y (11.81) en el caso
degenerado. Con el fin de que la división entre variables degeneradas y no degeneradas
persista, requerimos que las ϕρ no dependan de las ϕ′α y que las ϕ′ρ no dependan de
las ϕα . Esto implica que los elementos nρα se anulen. Las fórmulas de transformación
que toman en cuenta lo anterior y además que las ϕα y las ϕ′α son funciones lineales del
tiempo, y que las ϕρ , ϕ′ρ , Iν , Iν′ , son constantes, son:
ϕα =
l
X
nαµ ϕ′µ + ψα (ϕ′σ , I)
(11.100)
µ=1
ϕρ =
l
X
nρσ ϕ′σ + ψρ (ϕ′σ , I)
(11.101)
σ=s+1
Iα′ =
s
X
nβα Iβ
l
X
nνρ Iρ − i
(11.102)
β=1
Iρ′ =
ν=1
X
C~nσ (I)nρ ei~nσ ·ϕ~ σ
(11.103)
~
nσ
donde el subı́ndice σ se coloca a los vectores para indicar que solamente tienen componentes degeneradas. Como los nνµ son enteros y los nρα son nulos, entonces se cumple
que:
det nνµ = ±1
y
det nαβ = ±1
(11.104)
En conclusión, las variables de acción no degeneradas están determinadas unı́vocamente, aparte de una transformación lineal entera homogénea de determinante ±1. Por
494 / Mecánica clásica avanzada
su parte, las variables de acción degeneradas no necesitan transformarse integralmente
y pueden depender de variables angulares degeneradas; los nνρ no necesitan ser enteros.
Esto podemos ilustrarlo con el ejemplo 11.3.1 y las fórmulas de la sección 10.5,
referentes al problema de Kepler. Las variables angulares no degeneradas son ϕ′3 = ϕξ y
ϕ3 = ϕr , las variables angulares degeneradas son ϕ′2 = ϕη − ϕξ , ϕ′1 = ϕϕ − (ϕξ + ϕη )/2,
ϕ2 = ϕr − ϕθ y ϕ1 = ϕϕ − ϕθ . Vemos la correspondencia entre las fórmulas (11.65) y
(11.100). Por otra parte, I3′ = Iξ + Iη + Iϕ y I3 = Ir + Iθ + Iϕ , o sea que I3′ = I3 , que
corresponde a (11.102). Una fórmula del tipo (11.103) es la que expresa a I2 = Iθ + Iϕ
en términos de I3′ , I2′ , I1′ , ϕ′2 , que se obtiene fácilmente de la fórmula (10.325), sección
10.5.
h
i
p
I22 = 12 I3′2 1 − β 2 + γ 2 − (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos ϕ′2
(11.105)
11.4.
Teorı́a de perturbaciones de sistemas degenerados
En la sección 11.2 obtuvimos las fórmulas para las correcciones a la energı́a y a
la función generatriz cuando un sistema no degenerado se somete a una perturbación.
Ya en la fórmula (11.45) encontramos un resultado que no se puede aplicar cuando
hay degeneraciones. En la fórmula (11.42), para las correcciones a la energı́a, aparece
un promedio sobre todas las variables angulares, pero hemos visto que en un sistema
degenerado hay l − s nuevas constantes de movimiento, las l − s variables angulares
que permanecen constantes, con valores dependientes sólo de las condiciones iniciales.
Por esto la trayectoria de fases no ocupa una región l-dimensional sino una de sólo s
dimensiones. Un promedio sobre las variables angulares degeneradas es más bien un
promedio sobre todos los movimientos que resultan de cambiar las condiciones iniciales,
o sea un promedio sobre un ensamble, lo cual es inadmisible cuando se considera un solo
sistema. En conclusión, en (11.42) no tiene sentido promediar sobre las ϕ0ρ , quedando
H (n) dependiente de las variables angulares ϕ0ρ :
(11.106)
H (n) Iα ; ϕ0ρ , Iρ
Esto tiene una razón fı́sica más profunda: las variables (ϕ0 , I 0 ) que se obtienen de
las variables del problema perturbado (ϕ, I) al hacer λ = 0 no están determinadas por
el movimiento no perturbado sino por la perturbación. Es decir, no podemos partir de
cualquier conjunto de variables acción-ángulo del sistema no perturbado sino que antes
debemos encontrar un conjunto de variables acción-ángulo “exactas en la aproximación
cero”.
Este comportamiento se refleja en la teorı́a cuántica de perturbaciones de sistemas
degenerados, donde se deben formar combinaciones lineales de las funciones de onda
degeneradas para obtener las funciones de onda exactas en la aproximación cero, que
son las funciones que se obtienen de las perturbadas al hacer λ = 0. Esto en mecánica
cuántica equivale a buscar una combinación lineal de las funciones degeneradas que
diagonalice la perturbación, en teorı́a de perturbaciones degeneradas de primer orden.3
3 Véase
la sección 12.5, capı́tulo 12.
Teorı́a de perturbaciones / 495
Debido a su carácter degenerado, otras variables de acción degeneradas, conectadas con las Iρ0 por relaciones de la forma (11.103), deben introducirse en lugar de
las Iρ0 mediante una adecuada elección de las coordenadas. Tal elección, obviamente,
está determinada por la perturbación (o más exactamente, por las simetrı́as que tenga
la perturbación).
Debemos realizar una transformación canónica preliminar, escogida de tal manera
que, al primer orden, H1 dependa sólo de variables de acción. La transformación es
(I 0 , ϕ0 ) → (I 0 ′ , ϕ0 ′ ), con función generatriz:
G(ϕ0 , I 0 ′ ) =
l
X
Iν0 ′ ϕ0ν + V (ϕ0ρ , I 0 ′ )
(11.107)
ν=1
La fórmulas de transformación son:
Iα0 =
∂G
= Iα0 ′ ;
∂ϕ0α
ϕ′α =
∂G
∂V
= ϕ0α + 0 ′ ;
∂Iα0 ′
∂Iα
Iρ0 =
∂G
∂V
= Iρ0 ′ +
∂ϕ0ρ
∂ϕ0ρ ′
ϕ0ρ ′ =
∂G
∂V
= ϕ0ρ + 0 ′
∂Iρ0 ′
∂Iρ
(11.108)
(11.109)
G en (11.107) tiene una parte que depende solamente de las variables ϕ0ρ e Iρ0 ′ , la
cual se halla resolviendo la ecuación de Hamilton-Jacobi siguiente:
0
0 ∂G
= H (1) (I 0 ′ )
(11.110)
H1 Iα , ϕρ ,
∂ϕ0ρ
En este punto está garantizando que la perturbación no dependerá de variables
angulares al promediar sobre las variables angulares no degeneradas y que se cumple
siempre la condición m
~ ·~
ω 0 6= 0. Ahora expresamos a H en términos de (I ′ , ϕ′ ):
H = H0 (Iα′ ) + λH1 (ϕ0 ′ , I 0 ′ ) + λ2 H2 (ϕ0 ′ , I 0 ′ ) + ...
(11.111)
y, como en la sección 11.2, buscamos una transformación canónica (I ′ , ϕ′ ) → (I, ϕ), lo
cual dará lugar nuevamente a las fórmulas (11.22), ... (11.25), escribiendo (ϕ0 , I 0 ) en
lugar de (ϕ0 ′ , I 0 ′ ).
Como H no depende de Iρ′ , ahora en lugar de (11.26) se tiene:
s
X
∂H0 ∂F (n)
·
= H (n) (I) − Φn (ϕ0 , I)
0
∂I
∂ϕ
α
α
α=1
(11.112)
Al primer orden, en vez de (11.29) tenemos:
s
X
∂H0 ∂F (1)
·
= − H1 (ϕ0 , I)
0
∂Iα ∂ϕα
α=1
(11.113)
donde {H1 } = H1 − hH1 i y h...i denota un promedio sobre las variables angulares ϕ0α .4
Es claro que la ecuación (11.113) no permite determinar completamente a F (1) , pues
4 La
solución de la forma (11.32) aún existe, siendo bien definida salvo posibles divergencias debidas
0 ≈ 0.
a la presencia de pequeños denominadores en los armónicos altos, ~
nα · ~
ωα
496 / Mecánica clásica avanzada
cualquier solución de (11.113) está indeterminada por la adición de una función de Iν y
ϕ0ρ . Llamaremos G(1) a la parte de F (1) determinada por (11.113), de modo que:
F (1) = G(1) + R(1)
(11.114)
donde R(1) deberá quedar determinada en la siguiente aproximación.
Ahora, la ecuación (11.24) puede escribirse como:
s
s
1 X X ∂ 2 H0 ∂G(1) ∂G(1)
·
2 α=1
∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β
β=1
+
l
X
∂H 0
α=1
∂Iα
(2)
·
l
X
∂H1
(11.115)
(1)
∂F
∂F
+
·
+ H2 (ϕ0 , I) = H (2) (I)
0
∂ϕ0α
∂I
∂ϕ
ν
ν
ν=1
De esta ecuación podemos determinar a H (2) (I), a R(1) y a una parte G(2) de F (2) .
Indicaremos con h...i los promedios sobre las ϕ0α y los promedios sobre las ϕ0ν
completas por hh...ii. Entonces:
H (2) (I) = hhΦ2 ii
(11.116)
donde Φ2 es completamente conocida:
s
Φ2 =
s
1 X X ∂ 2 H0 ∂G(1) ∂G(1)
·
·
2 α=1
∂Iα ∂Iβ ∂ϕ0α
∂ϕ0β
β=1
+
s
X
∂H1
α=1
∂Iα
(11.117)
∂G(1)
·
+ H2 (ϕ0 , I)
∂ϕ0α
R(1) es solución a la ecuación:
l
X
∂H1 ∂R(1)
.
= −{hΦ2 i}
∂Iρ ∂ϕ0ρ
ρ=s+1
(11.118)
donde:
{hΦ2 i} = hΦ2 i − hhΦ2 ii
(11.119)
F (2) es solución a:
s
X
∂H0 ∂F (2)
·
= −{Φ2 }
∂Iα ∂ϕ0α
α=1
(11.120)
pero (11.120) determina sólo una parte G(2) , quedando por determinar una función R(2)
que depende de ϕ0ρ y Iν , en la aproximación siguiente.
La ecuación secular. Consideremos primero el cambio en los coeficientes de
Fourier de una variable dinámica al pasar de un sistema de variables acción-ángulo a
otro, (I, ϕ) → (I, ϕ). Asumamos que la transformación canónica es del tipo G(I, ϕ),
Teorı́a de perturbaciones / 497
de modo que (I, ϕ) pueden tomarse independientes, y con funciones de (I, ϕ). Sean las
expansiones de Fourier de f (I, ϕ) = f (I, ϕ):
X
X
im·
~ ϕ
~
f (I, ϕ) =
f~n (I)ei~n·ϕ~ = f (I, ϕ) =
fm
(11.121)
~ (I)e
~
n
m
~
Entonces, claramente f m
n (I), ası́:
~ (I) pueden expresarse en función de f~
I I
I X
1
~
f~n (I)ei~n·ϕ~ e−i~n·ϕ~ dl ϕ
...
fm
(11.122)
~ (I) =
(2π)l
~
n
Llamaremos
i~
α ·~
a e ϕ:
′
gα~⋆ α~ ′ (I)
a los coeficientes de la expansión de Fourier de ei~α·ϕ~ respecto
~′ ~
ei~αϕ~ = gα~⋆ α~ ′ (I) eiα ·ϕ
(11.123)
donde se supone que ϕ puede expresarse en términos de (I, ϕ). Ahora en (11.122) sea
~n = α
~ −α
~′ y m
~ = β~ − β~ ′ . Entonces (11.122) y (11.123) nos conducen fácilmente a:
XX
f β−
gα~⋆ β~ (I) fα~ −~α′ (I) gα~ ′ β~′ (I)
~ β
~ ′ (I) =
α
~
=
α
~
XX
α
~
α
~′
(11.124)
g+
~ −~
α′ (I) gα
~ ′ (I)
~ (I) fα
~ ′β
β~
α
⋆
donde g +
~ . Si formamos matrices con los coeficientes de Fourier, entonces (11.124)
~ α = gα
~β
β~
nos dice que f~n y fm
~ están conectados por medio de una transformación unitaria.
Ahora examinemos las expansiones de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las variables canónicas (Iρ0 , ϕ0ρ ) y (Iρ0 ′ , ϕ0ρ ′ ) conectadas por las fórmulas (11.108) y (11.109). La
transformación canónica buscada, por definición, conduce a una expresión que no depende de las ϕ′ρ . Si llamamos f (Iρ0 , ϕ0ρ ) a hH1 (Iρ0 , ϕ0ρ , Iα )i y f ′ a la correspondiente expresión
en términos de (Iρ0 ′ , ϕ0ρ ′ ), podemos hacer corresponder la ecuación de Hamilton-Jacobi
(11.110) con la (11.124). La transformación canónica buscada debe dar lugar a coeficientes de Fourier de la forma:
′
0′
(1) 0 ′
fβ−
(I )δβ,
~β
~′
~ β
~ ′ (I ) = H
Por tanto (11.124) para este caso puede escribirse ası́:
i
h
XX
0
0
(1) 0
g+
(I )δα~ α~ ′ gα~ ′ β~ ′ (I 0 ) = 0
~ −~
α′ (I ) − H
~ (I ) fα
β~
α
α
~
(11.125)
(11.126)
α
~′
donde hemos usado la fórmula
X
+
gβ~
~ ′ = δβ,
~β
~′
~ α gα
~β
(11.127)
α
~
En otras palabras, la transformación canónica es tal que diagonaliza la matriz
fα~ −~α′ (I 0 ) formada con los coeficientes de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las variables
angulares degeneradas. H (1) (I 0 ′ ) se obtienen resolviendo la ecuación secular:
i
h
(11.128)
det fα~ −~α′ (I 0 ) − H (1) (I 0 ′ )δα~ α~ ′ = 0
498 / Mecánica clásica avanzada
en tanto que la transformación canónica se obtiene a partir de los vectores propios de la
matriz fα~ −~α′ (I 0 ), suministrando la conexión entre las variables angulares ϕ0ρ y ϕ0ρ ′ . Debe
notarse que las matrices que aparecen en este desarrollo son de dimensión infinita; por
tanto (11.128) debe entenderse como el paso al lı́mite de una secuencia de determinantes.
Vemos que encontrar las variables acción-ángulo exactas en la aproximación cero
equivale a diagonalizar la matriz formada con los coeficientes de Fourier de la perturbación.
También encontramos que resolver la ecuación de Hamilton-Jacobi independiente
del tiempo, equivale, siempre, a diagonalizar la matriz de los coeficientes de Fourier del
respectivo hamiltoniano.
Ejemplo 11.4.1 Encontrar las variables de acción perturbadas en el efecto Stark del
átomo de hidrógeno clásico, en coordenadas esféricas.
El hamiltoniano para este problema es de la forma H = H0 + λH1 , donde:
H0 = −
m(Ze2 )2
2(I30 )2
(11.129)
es la energı́a del movimiento kepleriano en ausencia del campo y:
λH1 = eEz
(11.130)
es la perturbación. z está dada por la fórmula (10.268),
"
0 2 #1/2
I1
z = 1−
(x0 cos ϕ02 − y 0 sen ϕ02 )
I20
(11.131)
x0 y y0 son las coordenadas cartesianas del electrón en el plano de la órbita, y el eje
menor es x.
La única variable angular no degenerada es ϕ03 , de la cual dependen x0 y y 0 , según
las fórmulas (10.222) y (10.223). Por tanto:
3
hx0 i = − ǫ0 a0 ;
2
hy 0 i = 0
(11.132)
En consecuencia, tomando a E como λ:
hH1 (I30 , ϕ02 , I10 , I20 )i =
"
0 2 #1/2 "
0 2 #1/2
I1
I2
3 0
. 1−
cos ϕ02
− ea 1 −
0
2
I2
I30
(11.133)
a0 es igual a:
a0 =
(I30 )2
mZe2
(11.134)
En esta expresión no aparecen ni ϕ01 ni ϕ03 . Por tanto I10 y I30 son constantes
durante el movimiento perturbado y aparecen como parámetros. Las únicas variables
son entonces ϕ02 y I20 , indicando que en el movimiento perturbado la órbita no permanece
Teorı́a de perturbaciones / 499
rı́gida sino que presenta oscilaciones de la excentricidad y del perihelio en el plano de la
órbita, el cual a su vez gira uniformemente alrededor del eje z y oscila alrededor de la
lı́nea de nodos (Véase la figura 10.11).
La ecuación de Hamilton-Jacobi (11.110) que nos determina la variable de acción
I20 exacta en la aproximación cero para este caso es:
"
0 2 0 2 0 2 #1/2
0
3ea
E
I2
I1
I1
− cos ϕ02
1−
= H (1) (I 0 ′ )
(11.135)
−
+
2
I30
I20
I30
la cual nos da explı́citamente a I20 = ∂G/∂ϕ02 y entonces a G. Las integrales resultan
bastante difı́ciles.
Si sólo queremos hallar a H (1) (I 0 ′ ), notemos que (11.108) al ser integrada sobre
un perı́odo de ϕ02 , nos da:
I
I
∂V1
1
1
0′
0
0′
dϕ02
(11.136)
I2 dϕ2 −
I2 =
2π
2π
∂ϕ02
y que según (11.109) V1 es una función periódica de ϕ02 , con lo cual:
I
1
I20 ′ dϕ02
I20 ′ =
2π
(11.137)
lo cual nos suministra la expresión para H (1) que buscamos.
Llamemos (I30 )2 = A, (I10 )2 = B, [2H (1) /(3ea0 E)]2 = C y (I20 )2 = x. Por tanto
0
2I2 dI20 = dx, o sea:
√
2 x dI20 = dx
(11.138)
lo cual nos permite escribir:
I
I
√ dϕ02
1
1
∂ϕ0
x
I20 ′ =
dx
I20 02 dI20 =
2π
dI2
2π
dx
(11.139)
De (11.135) se sigue que:
cos2 ϕ02 =
C
x
B
B
1− − +
A
x
A
Por tanto:
d(sec
2
ϕ02 )
1
=
C
1
B
− + 2 dx
A x
(11.140)
(11.141)
En consecuencia:
√
dϕ02
(x2 − AB) AC
= √
dx
2 x(A − x)(x − B)[(A − x)(x − B) − ACx]1/2
Entonces (11.139) nos da:
√
I
(x2 − AB) dx
AC
I20 ′ =
4π
(A − x)(x − B)[(A − x)(x − B) − ACx]1/2
(11.142)
(11.143)
500 / Mecánica clásica avanzada
La integral se hace usando el método de los residuos, teniendo en cuenta que en
el plano complejo el integrando es una función biforme (positivo entre xmı́n y xmáx y
negativo entre xmáx y xmı́n ), presentando una lı́nea de ramificación. Por otra parte el
integrando posee singularidades en x = A, x = B y x = ∞, con polos en esos puntos. El
residuo en x = A vale −2π/C 1/2 , el residuo en x = B vale 2π[B/(AC)]1/2 y el residuo
en x = ∞ vale 2π (el cual se obtiene con la sustitución y = 1/x). En consecuencia:
√
√
1 √
I20 ′ =
A − B − CA
(11.144)
2
que es lo mismo que:
"
#
(1)
1 0′
0′
0′
0 ′ 22 H
I2 =
I − I3 − (I2 )
(11.145)
2 2
3ea0
Por tanto H (1) vale:
H (1) (I 0 ′ ) = ±
3eEa0 ′ 0 ′
(I1 − I30 ′ − 2I20 ′ )
2I10 ′
(11.146)
Este ejemplo ilustra el método de las perturbaciones seculares, que hacen que las
variables angulares degeneradas, que en el problema no perturbado son constantes, pasen
a ser funciones lineales del tiempo dando lugar a oscilaciones en los parámetros de la
órbita que aumentan con la intensidad de la perturbación.
En efecto, las frecuencias perturbadas son:
ω30 ′ = ω30 + λ
ω20 ′ = λ
∂hH1 i
∂I30 ′
∂hH1 i
;
∂I20 ′
(11.147)
ω10 ′ = λ
∂hH1 i
∂I10 ′
(11.148)
Las frecuencias que en el movimiento no perturbado son nulas, en el perturbado pasan a ser “frecuencias lentas”, en tanto que las frecuencias no degeneradas son
“frecuencias rápidas”.
Ejemplo 11.4.2 Calcular las correcciones de segundo orden en el átomo de Hidrógeno
clásico en un campo eléctrico uniforme (efecto Stark cuadrático).
Si trabajamos con coordenadas parabólicas, H (0) y las frecuencias están dadas por
(10.300) y (10.306). Entonces la ecuación (11.37) para la corrección de segundo orden
de la energı́a toma la forma:
H (2) (I) =
1 ∂ 2 H0
2 ∂I32
*
∂F (1)
∂ϕ03
2 +
+
∂ω ∂F (1)
.
∂I2 ∂ϕ02
+
∂ω ∂F (1)
.
∂I3 ∂ϕ03
(11.149)
y F (1) es solución a la ecuación:
ω0
∂F (1)
+ W (I, ϕ0 ) = 0
∂ϕ03
(11.150)
Teorı́a de perturbaciones / 501
siendo W igual a:
3
W = H1 − hH1 i = eEz − eEaβ
(11.151)
2
Podrı́amos partir de la expresión para W en coordenadas parabólicas para calcular
a F (1) y luego a H (2) . Sin embargo usaremos el siguiente procedimiento equivalente: como
en coordenadas parabólicas el promedio de eEz sobre las variables angulares es igual
al promedio temporal, debido a que heEzit no contendrá variables angulares, podemos
realizar inicialmeste los promedios temporales en coordenadas esféricas. Luego, antes de
promediar sobre la otra variable angular pasamos de coordenadas esféricas a coordenadas
parabólicas usando las ecuaciones (10.326) y (10.327). El resultado será el mismo que si se
calculan los promedios temporales en coordenadas parabólicas. Finalmente, promediando
sobre θ1 obtenemos a H (2) en coordenadas parabólicas.
heEzit y eEz están dados por:
heEzit =
3
eEaǫ cos θmı́n cos θ0
2
(11.152)
eEz = eF a cos θmı́n
−(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ
Por tanto W en coordenadas esféricas es:
W = eF a cos θmı́n
1
× −(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ
2
(11.153)
La ecuación (11.150) toma la forma:
∂F (1)
eF a
=
cos θmı́n
0
∂ϕ3
2ω 0
h
i
× 2(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 + 2 cos θ0 cos ψ
(11.154)
Usando la ecuación de Kepler se cumple:
∂F (1) ∂ψ
∂F (1)
2π
∂F (1)
=
=
·
·
0
0
∂ϕ3
∂ψ
∂ϕ3
∂ψ
1 − ǫ cos ψ
(11.155)
por tanto tenemos que:
∂F (1)
=
∂ψ
h
eF a
cos
θ
2(1 − ǫ2 )1/2 sen θ0 sen ψ
mı́n
4πω 0
+ǫ cos θ0 + 2 cos θ0 cos ψ
−2ǫ(1 − ǫ2 )1/2 sen θ0 sen ψ cos ψ
−ǫ2 cos θ0 cos ψ − 2ǫ cos θ0 cos2 ψ
(11.156)
i
502 / Mecánica clásica avanzada
Integrando respecto a ψ hallamos la siguiente expresión para F (1) , luego de omitir
una constante de integración que no contribuirá a H (2) ya que W tiene media cero:
F (1) =
h
eF a
− 2(1 − ǫ2 )1/2 sen θ0 cos ψ
cos
θ
mı́n
4πω 0
+ cos θ0 sen ψ − ǫ(1 − ǫ2 )1/2 sen θ0 sen2 ψ
−ǫ2 cos θ0 sen ψ − ǫ cos θ0 sen ψ cos ψ
(11.157)
i
Esta función satisface el requisito de la teorı́a canónica de perturbaciones de ser
una función periódica de θ1 y ϕξ , como puede verse fácilmente usando (10.328), (10.329),
(10.341) a (10.345). Si quisiéramos aplicar la fórmula (11.149) directamente en coordenadas esféricas, deberı́amos haber tomado hH1 i = 0 lo cual darı́a lugar a la aparición en
F (1) y ∂F (1) /∂ϕ02 de un término proporcional a ψ, que se incrementa linealmente con
el tiempo (llamado secular); esto evidencia que la fórmula (11.36) sólo puede aplicarse
en coordenadas en las cuales la perturbación sea “diagonal”, es decir, que no contenga
variables angulares.
Usando la propiedad:
∂F (1)
∂F (1)
=
−
∂ϕ02
∂θ0
(11.158)
Llegamos a la siguiente expresión para ∂F (1) /∂20 :
∂F (1)
=
∂ϕ02
h
eF a
cos θmı́n 2(1 − ǫ2 )1/2 cos θ0 cos ψ
0
2ω
+(2 − ǫ2 )sen θ0 sen ψ
2 1/2
+ǫ(1 − ǫ )
(11.159)
2
cos θ0 sen ψ
−ǫ sen θ0 sen ψ cos ψ
i
Por otra parte, usando las siguientes relaciones:
∂ cos θmı́n
=
∂I2
γ2
I3 (1 − ǫ2 )3/2 cos θmı́n
∂ǫ
=
∂I2
−(1 − ǫ2 − γ 2 )
I3 (1 − ǫ2 )1/2 ǫ cos2 θmı́n
∂ψ
=
∂I2
−
I2 sen ψ
I32 ǫ (1 − ǫ cos ψ)
(11.160)
Teorı́a de perturbaciones / 503
donde γ = I1 /I3 , obtenemos al hacer todos los cálculos:
n h
∂W
−eEa
γ 2 ǫ cos θ0
=
2
3/2
∂I2
2I3 (1 − ǫ )
cos θmı́n
+2(1 − ǫ2 )1/2 sen θ0 sen ψ + 2 cos θ0 cos ψ
i
h
+(1 − ǫ2 )(1 − ǫ2 − γ 2 ) − ǫ−1 cos θ0 + 2(1 − ǫ2 )−1/2
×sen θ0 sen ψ −
+
(11.161)
2(1 − ǫ2 )1/2 ǫ−1 sen θ0 cos ψ sen ψ
1 − ǫ cos ψ
2ǫ−1 cos θ0 sen2 ψ io
1 − ǫ cos ψ
Usando la siguiente relación:
Z 2π
1
∂W ∂F (1)
∂W ∂F (1)
·
·
(1 − ǫ cos ψ) dψ
=
0
∂I2 ∂ϕ2 t
2π 0 ∂I2 ∂ϕ02
(11.162)
obtenemos usando (11.159), (11.161) y (11.162) después de un cálculo largo pero directo:
h
(eEa)2
∂W ∂F (1)
(9 − 13ǫ2 − γ 2 + 4ǫ4 + ǫ2 γ 2 )
.
=
−
∂I2 ∂ϕ02 t
16ω 0 I3 (1 − ǫ2 )
(11.163)
i
+(−4 + 3ǫ2 + 4γ 2 + ǫ4 + ǫ2 γ 2 ) cos2 θ0
Por otra parte podemos escribir los otros dos términos de la ecuación (11.149) ası́:
*
2 + 1 ∂ 2 H0
∂W ∂F (1)
∂F (1)
·
2 ∂I32
∂ϕ03
∂I3 ∂ϕ03 t
t
3ω 0
=−
2I3
=−
1
2ω 0
*
W
ω0
2 +
3
∂
+
I3
∂I3
+
t
∂W
·
∂I3
−W
ω0
(11.164)
t
hW 2 it
De (10.268) se sigue que:
1
hW 2 it = (eE)2 a cos2 θmı́n (1 − ǫ2 + 5ǫ2 cos2 θ0 )
2
(11.165)
Con este resultado (11.164) puede escribirse como:
−
(eEa)2 [20(1 − ǫ2 ) + (4 + 10ǫ2 ) cos2 θ0 ] (1 − ǫ2 − γ 2 )
·
16I3 ω 0
1 − ǫ2
(11.166)
504 / Mecánica clásica avanzada
Resumiendo los resultados dados por las ecuaciones (11.163) y (11.166) llegamos
a:
∂W ∂F (1)
·
∂I2 ∂ϕ02
t
+
∂W ∂F (1)
·
∂I3 ∂ϕ03
1 ∂ 2 H0
+
2 ∂I32
t
*
∂F (1)
∂ϕ03
2 +
t
(11.167)
2
=−
(eEa)
[(29 − 24ǫ2 − 21γ 2 ) + 9ǫ2 cos2 θmı́n cos2 θ0 ]
16I3 ω 0
Si ahora pasamos a coordenadas parabólicas mediante las ecuaciones (10.325),
(10.341) a (10.345), llegamos a la siguiente expresión para el lado derecho de (11.167):
(eEa)2 h
−
· 17 − 3β 2 − 9γ 2
16I3 ω 0
i
p
− 12 [(1 + β 2 ) − γ 2 ][(1 − β 2 ) − γ 2 ] cos θ1
(11.168)
El promedio sobre la variable angular ϕ2 (θ1 = −ϕ2 ) nos conduce a la expresión
final para H (2) :
H (2) (I) = −
(eEa)2
(17 − 3β 2 − 9γ 2 )
16I3 ω 0
(11.169)
que expresada en términos de las Iν es:
H (2) (I) = −
(eE)2 I 4
[17I 2 − 3(Iξ − Iη )2 − 9Iϕ2 )]
16m3 (Ze2 )4
(11.170)
Este es el mismo resultado de Epstein en (1916) usando un método de aproximaciones sucesivas, expuesto por Born (Op. cit., p. 591).
El método de aproximaciones descrito en la sección 11.2 puede también fallar
cuando el sistema no perturbado no posee degeneración intrı́nseca pero ocurre que las
frecuencias se tornan conmensurables para ciertas condiciones iniciales. Cuando esto
ocurre se habla de degeneración accidental. En este sentido es incorrecta la distinción
que algunos textos de mecánica cuántica hacen al referirse a la degeneración presente
en los niveles de energı́a del átomo de hidrógeno respecto al número cuántico orbital l
como “accidental”.
En astronomı́a se presenta este tipo de degeneración, como en el caso del movimiento de algunos planetas menores (Aquiles, Patroclo, Héctor y Néstor) que tienen casi el
mismo perı́odo de revolución que Júpiter. En la mayorı́a de los sistemas la degeneración
accidental es más frecuente que la degeneración intrı́nseca.
11.5.
Perturbaciones adiabáticas
Perturbaciones pequeñas y perturbaciones lentas. Veamos la diferencia en
una expansión de perturbaciones para perturbaciones pequeñas y para perturbaciones
adiabáticas. En el primer caso hay un parámetro pequeño en el sistema determinado
por la intensidad de la perturbación. El parámetro pequeño de una perturbación lenta está dado por la relación entre la frecuencia de la perturbación y las frecuencias
Teorı́a de perturbaciones / 505
rápidas del sistema. Cuando el parámetro toma el valor cero, el sistema posee solamente oscilaciones rápidas, y a medida que aumenta el valor del parámetro, aparecen las
contribuciones de las frecuencias lentas.
Asumamos que el sistema posee sólo una frecuencia rápida y que el hamiltoniano
se puede separar en la forma:
H = H0 (I, λ~y , λt) + λH1 (I, ϕ, λ~y , λt)
(11.171)
donde I y ϕ son las variables acción-ángulo del movimiento no perturbado (λ = 0) del
grado de libertad rápido, y ~
y = (q, p) son las variables canónicas de los restantes grados de libertad, no necesariamente expresadas en variables acción-ángulo. Debido a que
cuando λ = 0 el sistema es de un grado de libertad, entonces es integrable.
Construcción de invariantes adiabáticos canónicos. Para calcular el efecto
de la perturbación buscamos una transformación canónica de (I, ϕ, ~y ) a (I, ϕ, ~y) tal que
el nuevo hamiltoniano no dependa de la variable angular rápida ϕ. La función generatriz
es de la forma:
F = Iϕ + ~p~q + λF (1) I, ϕ, ~p, ~q, t + ...
(11.172)
y las fórmulas de transformación de primer orden son:
I =I +λ
∂F (1)
;
∂ϕ
(1)
∂F
p~ = ~p + λ
;
∂~q
ϕ=ϕ−λ
∂F (1)
∂I
(11.173)
(1)
∂F
~q = ~q − λ
∂~p
(11.174)
Ahora reemplazamos a (11.173) y (11.174) en (11.171) y expandimos al primer
orden en λ para obtener:
∂F (1)
H0 (I, λ~y , λt) = H0 I, λ~y, λt + λω
∂ϕ
siendo ω = ∂H0 /∂I la frecuencia rápida.
Con la transformación canónica el nuevo hamiltoniano total será:
∂F (1) I, ϕ, λ~y, λt
H I, ϕ, λ~y, λt = H(I, ϕ, λ~y , λt) + λ
∂(λt)
(11.175)
(11.176)
En esta expresión ahora retenemos sólo los términos de primer orden en λ:
∂F (1)
H I, ϕ, λ~y , λt = H0 (I, λ~y , λt) + λω
+ λH1 I, ϕ, λ~y , λt
∂ϕ
Al orden cero (11.177) nos da:
H 0 I, λ~y , λt = H0 (I, λ~y , λt)
(11.177)
(11.178)
y al primer orden:
∂F (1)
+ H1 I, ϕ, λ~y , λt
H 1 I, ϕ, λ~y , λt = ω
∂ϕ
(11.179)
506 / Mecánica clásica avanzada
Como por definición la transformación canónica elimina en H la dependencia de
ϕ, se debe cumplir que F (1) satisfaga la ecuación diferencial:
ω
∂F (1)
= −{H1 }
∂ϕ
(11.180)
En tanto que la energı́a al primer orden satisface la expresión:
H I, λ~y, λt = H0 I, λ~y, λt + λhH1 i
(11.181)
donde {...} y h...i denotan aquı́ la parte oscilante y el promedio respectivamente, respecto
a la variable angular ϕ.
En (11.180) vemos que no hay complicaciones, como en (11.29) y (11.32), debidas a
posibles resonancias entre ω y armónicos superiores de las frecuencias lentas. La ecuación
(11.173) nos da los invariantes adiabáticos a orden cero en λ e I, y a primer orden en λ
e I:
I (I, ϕ, λ~y , λt) = I − λ
∂F (1)
∂ϕ
(11.182)
o equivalentemente:
I =I+
λ
{H1 }
ω
(11.183)
Realmente cualquier función de I puede escogerse como un invariante adiabático.
Mediante la construcción de un invariante adiabático, si existe, se reduce el sistema
de l grados de libertad a l − 1 grados de libertad. Esto se logra al encontrar la transformación canónica que elimina en H la dependencia respecto a ϕ, con lo cual I queda
como un parámetro constante. Si uno de los restantes l − 1 grados de libertad sufre una
oscilación rápida en comparación a los demás grados de libertad, podemos introducir
un segundo parámetro pequeño, transformar a variables acción-ángulo el grado de libertad rápido y hallar un segundo invariante adiabático. El proceso puede continuarse
para obtener una secuencia de invariantes adiabáticos, hasta que el sistema es reducido
a un grado de libertad, que puede integrarse para obtener el invariante final. Esto significa que todo sistema posee l invariantes adiabáticos aproximados obtenidos mediante
promedios, ası́ no sea integrable (es decir que no posea l constantes de movimiento en
involución).
Ejemplo 11.5.1 Este ejemplo se refiere a un sistema hamiltoniano no autónomo de un
grado de libertad, que por tanto posee un comportamiento análogo al de un sistema de
dos grados de libertad. Se trata de un oscilador lineal sometido a una variación adiabática
de sus parámetros:
Ho.l. =
1
1
G(λt) p2 + F (λt) q 2
2
2
(11.184)
Podemos hallar las variables acción ángulo mediante la función generatriz:
1/2
1 F
q 2 tan ϕ
(11.185)
F1 = −
2 G
Teorı́a de perturbaciones / 507
Entonces el hamiltoniano transformado toma la forma siguiente:
H = ω0 I −
λR′
I sen 2ϕ
2R
(11.186)
p
√
donde R(λt) = F/G, ω0 (λt) = F G y la prima denota derivada respecto a λt.
La ecuación (11.186) tiene ahora la forma (11.171) y podemos aplicar los resultados
de la teorı́a de los adiabáticos canónicos.
Al orden cero el invariante adiabático es:
I=
H0
= constante
ω0
(11.187)
La ecuación (11.183) nos da el invariante de primer orden:
I = I (1 + λP sen 2ϕ)
(11.188)
donde P (λt) = −R′ /(2ω0 R). O sea que al primer orden I tiene una pequeña componente
que oscila con una frecuencia el doble de la frecuencia rápida ω0 .
De (11.188) se sigue:
I˙ = λṖ I sen 2ϕ + 0(λ2 )
(11.189)
Como Ṗ = λP ′ , vemos que efectivamente I˙ es del orden de λ2 , siendo I un invariante al primer orden.
Veamos las posibles resonancias entre ω0 y los armónicos de las frecuencias asociadas a los cambios adiabáticos de los parámetros. Para ello expandamos a Ṗ en una serie
de Fourier:
X
′
Ṗ = λ
an einω1 λt
(11.190)
n
siendo ω1 λ la frecuencia de la oscilación lenta y ω1 /ω2 del orden de la unidad.
Entonces, según (11.189) y (11.190), I˙ tendrá la siguiente expansión de Fourier:
i
I X′ h i(nω1 λt+2ϕ)
I˙ = λ2
an e
− ei(nω1 λt−2ϕ)
2i n
(11.191)
Ahora, integremos a I˙ sobre un perı́odo de la oscilación lenta. Esto nos dará:
"
λ2 X′
∆I
e2i(2πω0 /(λω1 )+ϕ0 ) − e2iϕ0
=
an
2i n
i(nω1 λ + 2ω0 )
I
#
e−2i(2πω0 /(λω1 )+ϕ0 ) − e−2iϕ0
(11.192)
−
i(nω1 λ − 2ω0 )
Vemos que ∆I/I será del orden de λ2 , a no ser que haya una conmensurabilidad
entre las oscilaciones en t y en ϕ:
s
ω0
=
(11.193)
λω1
2
508 / Mecánica clásica avanzada
donde s es un entero del orden de 1/λ. En este caso los términos con n = ±s en (11.192)
serán constantes en t, y ∆I/I será del orden de λ:
2π
∆I
≈ λ|as |
I
ω1
(11.194)
O sea que si la resonancia es mantenida por tiempos del orden de un perı́odo de la
oscilación lenta, 2π/(λω1 ), el invariante de primer orden es destruido.
11.6.
Sistema de osciladores lineales con acoplamiento no lineal
Consideremos l osciladores lineales con frecuencias propias ω10 , ω20 , ...ωl0 acoplados
anarmónicamente. El hamiltoniano es de la forma H = H0 + λH1 + λ2 H2 + ..., donde:
X p2
1
ν
(11.195)
+ m(ων0 )2 qν2
H0 =
2m 2
ν
H1 =
X
aν qν3 +
ν
H2 =
XX
µ
X
bν qν4 +
ν
+
′
XXX
µ
XX
µ
ν
aµν qµ2 qν +
ν
XXX
µ
′
′
ν
′
aµνλ qµ qν qλ
(11.196)
λ
(bµν qµ2 qν2 + b′µν qµ3 qν )
ν
bµνλ qµ2 qν qλ +
XXXX
µ
λ
ν
λ
(11.197)
′
bµνλρ qµ qν qλ qρ
ρ
donde µ, ν, λ y ρ varı́an entre 1 y l. Los coeficientes a y b presentan en sus ı́ndices las
mismas propiedades de simetrı́a que los productos de los qν que multiplican. La prima
en la sumatoria significa que se omiten los términos con ı́ndices iguales.
Caso no degenerado. Cuando las ων0 son inconmensurables se dice que son no
degeneradas. En las variables acción-ángulo (ϕ0 , I 0 ), H0 es:
H0 =
l
X
ων0 Iν0
(11.198)
ν=1
H1 y H2 en función de (ω 0 , I 0 ) se obtienen sustituyendo:
qν = Qν sen ϕν ;
Qν =
2Iν0
mων0
1/2
;
ϕν = ϕ0ν
(11.199)
Como en H1 sólo entran productos de sen ϕν un número impar de veces, se sigue
que:
H (1) = hH1 i = 0
(11.200)
Teorı́a de perturbaciones / 509
Para hallar a H (2) aplicamos la fórmula (11.40), lo cual requiere hallar los coeficientes de Fourier A~n de H1 . Para escribir a H1 como una serie de Fourier usamos la
identidad trigonométrica:
4 sen α sen β sen γ =
−sen (α + β + γ) + sen (−α + β + γ)
(11.201)
+sen (α − β + γ) + sen (α + β − γ)
la cual nos da:
1X
aν Q3ν [−sen (3ϕν ) + 3sen ϕν ]
4 ν
H1 =
+
1X
aµν Q2µ Qν [−sen (2ϕµ + ϕν )
4 µν
+2 sen ϕν + sen (2ϕµ − ϕν )]
+
(11.202)
1X
aµνλ Qµ Qν Qλ [−sen (ϕµ + ϕν + ϕλ )
4
µνλ
+3 sen (ϕµ + ϕν − ϕλ )]
La ecuación (11.202) tiene la forma de una serie de Fourier seno:
X
H1 =
B~n sen (~n · ϕ
~)
(11.203)
~
n
donde todos los coeficientes de Fourier B (ν) (nν ) son cero excepto:
1X
3
aµν Q2µ Qν
B1ν = aν Q3ν +
4
2 µ
(11.204)
1
B3ν = − aν Q3ν
4
(11.205)
1
νµ
B21
= − aνµ Q2ν Qµ
4
(11.206)
µν
B2−1
=
1
aνµ Q2ν Qµ
4
3
νµλ
B111
= − aνµλ Qν Qµ Qλ
2
νµλ
B11−1
=
3
aνµλ Qν Qµ Qλ
2
(11.207)
(11.208)
(11.209)
En (11.40) aparecen |A~n |2 = A~n A−~n , donde A~n están relacionadas con los B~n por:
A~n =
B~n − B−~n
2i
(11.210)
510 / Mecánica clásica avanzada
entonces:
|A~n |2 =
1
(B~n − B−~n )2
4
(11.211)
con lo cual los |A~n |2 diferentes de cero son:
1
|Aν1 |2 = Cν =
64
3aν Q3ν + 2
X
aµν Q2µ Qν
µ
!
(11.212)
1 2 6
a Q
64 ν ν
|Aν3 |2 = Cν′ =
2
|Aνµ
21 | = Cνµ =
(11.213)
1 2 4 2
a Q Q
64 νµ ν µ
(11.214)
9 2
a Q2 Q2 Q2
16 νµλ ν µ λ
2
|Aνµλ
111 | = Cνµλ =
(11.215)
luego (11.40) toma la forma:
1XX
3X
bν Q4ν +
bνµ Q2ν Q2µ
8 ν
4 ν µ
H (2) =
−
X 1 ∂
(Cν + Cν′ )
0 ∂I
ω
ν
ν
ν
−
−
XX
ν
µ
2
0 ∂Cνµ
0 ∂Cνµ
−
ω
4ω
µ
ν
4(ων0 )2 − (ωµ0 )2
∂Iν
∂Iµ
XXX
ν
µ
λ
(11.216)
∂Cνµλ
1
ων0 + ωµ0 + ωλ0 ∂Iν
1
+ 0
ων + ωµ0 − ωλ0
∂Cνµλ
∂Cνµλ
∂Cνµλ
+
−
∂Iµ
∂Iµ
∂Iλ
Según (11.199) y (11.212) a (11.215) las cantidades C son de tercer grado en las
Iν , de modo que todos los términos de H (2) son cuadráticos en las Iν . La energı́a total
tiene entonces la siguiente dependencia de las variables de acción:
X
1 XX 0
ω Iν Iµ
(11.217)
H(I) =
ων0 Iν +
2 ν µ νµ
ν
Es claro que la condición de inconmensurabilidad de las frecuencias queda reducida
a excluir los casos:
2ων0 = ωµ0 ;
ων0 + ωµ0 = ωλ0
para todos los valores de ν, µ, λ.
(11.218)
Teorı́a de perturbaciones / 511
Ejemplo 11.6.1 Aplicar la teorı́a de perturbaciones de estados degenerados al sistema
construido por dos osciladores lineales con frecuencias conmensurables, sometidos a una
perturbación anarmónica del tipo (11.196).
Las trayectorias en el espacio de configuración para el movimiento no perturbado
son las figuras de Lissajous. H0 es:
H0 =
1 2
px + p2y + m(ωx0 )2 x2 + m(ωy0 )2 y 2
2m
(11.219)
donde rωx0 = sωy0 , siendo r y s enteros.
La perturbación es de la forma:
H1 = ax x3 + ay y 3 + axy x2 y + ayx y 2 x
(11.220)
La solución al movimiento no perturbado en variables acción-ángulo está dada por
(11.198) y (11.199).
Para tratar la degeneración es conveniente separar la frecuencia no degenerada
mediante una transformación canónica de la forma (11.89), que para este caso es:
ϕ01 = ϕ′x ;
ϕ02 = −rϕ′x + sϕ′y
Ix′ = I10 − rI20 ;
Iy′ = sI20
(11.221)
(11.222)
donde las primas denotan las variables de acción originales.
H0 en términos de las I 0 es:
H0 (I 0 ) = ω10 I10
(11.223)
donde las frecuencias están dadas por:
ω10 = ωx0 ;
ω20 = 0
(11.224)
La solución al movimiento no perturbado es:
x=
2(I10 − rI20 )
mω10
y=
2s2 I20
rmω10
1/2
1/2
sen ϕ01
(11.225)
(rϕ01 + ϕ02 )
sen
s
El promedio de H1 sobre un ciclo de la variable angular ϕ01 es:
1/2
s
I10 − rI20
2I20
ϕ0
= − axy
sen 2 δr,2s
0
0
2
mω1
rmω1
s
1/2
2s2 I20 I10 − rI20
ϕ0
sen 2 2 δs,2r
0
0
rmω1
mω1
s
hH1 (I10 , I20 , ϕ02 )i
1
+ ayx
2
(11.226)
512 / Mecánica clásica avanzada
Si r 6= 2s o s 6= 2r el procedimiento falla porque hH1 i = 0, pero el resultado
(11.218) es válido en ese caso, mostrando que sólo hay correcciones de orden superior al
primero. Para precisar asumamos que 2ωx0 = ωy0 . Entonces:
q 0
−axy
0
0
I2 sen ϕ02
hH1 (I10 , I20 , ϕ02 )i =
I
−
2I
(11.227)
1
2
2(mω10 )3/2
La ecuación de Hamilton-Jacobi para este problema es:
q
A
x
C=−
x3 − I10 + C = 0 ; x = I20 ;
2
sen ϕ02
Las raı́ces dependen del signo del discriminante:
0 3
0 3 2
I1
I
A2
C
=− 1
D= −
+
+
6
2
6
4 sen2 ϕ02
(11.228)
(11.229)
que depende esencialmente de la magnitud de H (1) , o sea de la energı́a. Si D > 0, una
raı́z es real y dos son complejo conjugadas. Si D = 0, todas las raı́ces son reales, siendo
dos de ellas iguales entre sı́; esto ocurre para valores de H (1) (I) y ϕ02 bien determinados.
Si D < 0, todas las raı́ces son reales y diferentes entre sı́.
Para D > 0, la raı́z real es:
3/2 2/3
I10
C √
C √
0
+
(11.230)
I2 =
+ − + D
+ D
3
2
2
Cuando D = 0 las raı́ces son:
I10
I10
I0
;
I20 = 2 1 ;
3
6
6
Cuando D < 0 las raı́ces son:
I10
2θ
I10
2θ 2π
0
I2 =
1 + cos
;
1 + cos
+
3
3
3
3
3
I10
2θ 4π
1 + cos
+
3
3
3
(11.231)
(11.232)
donde cos θ = (6/I10 )3/2 C/2.
La figura 11.1 muestra el comportamiento de las raı́ces reales en función de C −1 .
CT es el valor de C para el cual D = 0, que ocurre cuando:
0 3/2
0 3/2
I
(1) ′ (mω1 )
=2 1
(11.233)
−C = H (I )
axy sen ϕ02
6
√
Para A muy grande tenemos que D ≈ C/2. En ese caso se cumple que:
I20 ≈ C 2/3 = A2/3 (sen ϕ02 )−2/3 ;
A2 ≫ (I10 )3
(11.234)
De (11.108) vemos que I20 ′ es igual al valor medio de I20 sobre un perı́odo de ϕ02 .
Entonces:
H (1) (I ′ ) =
axy (I20 ′ )3/2
0
3/2
(mω1 ) h(sen ϕ02 )−2/3 i3/2
(11.235)
Teorı́a de perturbaciones / 513
I 20/ 3
2 I 10 / 3
I 10/ 3
1/CT
1/C
Figura 11.1 Raı́ces reales en función de C −1
11.7.
Movimiento cerca de una resonancia aislada
Para precisar, sea un sistema de dos grados de libertad sometido a una perturbación
pequeña. Si se presenta una resonancia entre las frecuencias no perturbadas:
r
ω2
=
ω1
s
(11.236)
entonces debemos usar la teorı́a de perturbaciones de sistemas degenerados.
Primero realizamos una transformación canónica del tipo (11.88) para aislar una
de las frecuencias. Una función generatriz adecuada es:
F2 = (rϕ1 − sϕ2 )I 1 + ϕ2 I 2
(11.237)
que da lugar a las fórmulas de transformación:
I1 = rI 1 ;
I2 = I 2 − sI 1
ϕ1 = rϕ1 − sϕ2 ;
ϕ2 = ϕ2
(11.238)
(11.239)
Cuando se aplica la perturbación, como vimos en el efecto Stark lineal, ϕ̇1 pasa a
ser una frecuencia lenta y ϕ̇2 es una frecuencia rápida. Si en la expansión de Fourier de
H1 en las variables acción-ángulo iniciales, (I, ϕ), efectuamos la transformación (11.238)
y (11.239), obtenemos:
H1 =
XX
l
m
Hl,m (I)ei[lϕ1 +(ls+mr)ϕ2 ]/r
(11.240)
514 / Mecánica clásica avanzada
Ahora, en vez de “diagonalizar” a H1 como en la sección 11.4, podemos usar la
teorı́a de las perturbaciones adiabáticas teniendo en cuenta que en resonancia, ϕ̇2 ≫ ϕ̇1 .
La fórmula (11.181) nos da para este caso:
H = H 0 (I) + λhH 1 i
(11.241)
donde hH 1 i es el promedio sobre ϕ2 . Como el promedio da lugar al factor δm,−sp :
X
(11.242)
hH 1 i =
H−pr,ps (I)e−ipϕ1
p
Como H no depende de ϕ2 , se cumple que I 2 = constante = I 20 . Notemos que
I 2 = I2 + (s/r)I1 ; por tanto la resonancia modifica sustancialmente las constantes de
movimiento. Si s ≫ r, I 2 es simplemente un múltiplo de I1 , o sea que la modificación
más importante ocurre para las resonancias con s pequeños.
Con I 2 constante, el movimiento en el plano I 1 − ϕ1 es el de un sistema de un
grado de libertad, que es integrable. Chirikov5 ha mostrado que para cualquier sistema
ese movimiento es aproximadamente como el de un péndulo o como el de un oscilador
armónico, según la degeneración sea accidental o intrı́nseca.
Como el movimiento no perturbado es degenerado, en la superficie de sección I 1 −ϕ1 , con
ϕ2 = constante, habrán s puntos formando una circunferencia de radio I 1 (ver sección
10.2). Para λ 6= 0 la perturbación altera el toroide y las intersecciones de la trayectoria
con la superficie de sección modificando por tanto las soluciones periódicas. Si existen,
los puntos fijos sobre la superficie de sección, que llamaremos P0 (I 10 , ϕ10 ), son solución
al sistema de ecuaciones:
∂H
∂I 1
= 0;
P0
∂H
∂ϕ1
=0
(11.243)
P0
que representan las soluciones periódicas para el hamiltoniano perturbado. Cuando
λ = 0, todas las soluciones son periódicas, pero para λ 6= 0 sólo quedan las soluciones periódicas dadas por (11.243). Las amplitudes de Fourier en (11.242) generalmente
decaen cuando p aumenta. Entonces podemos describir el movimiento en las variables
integrables (I 1 − ϕ1 ) usando solamente los términos con p = 0, ±1:
H = H 0 (I) + λH00 (I) + 2λHr,−s (I) cos ϕ1
(11.244)
notando que los coeficientes con p = 1 y p = −1 sólo difieren en la fase, de modo que
puede hacerse H−r,s = Hr,−s con la simple adición a ϕ1 de una constante.
Las fórmulas (11.243) y (11.244) nos dan las siguientes ecuaciones para la localización de los puntos fijos:
∂H00 (I)
Hr,−s (I)
∂H 0 (I)
+λ
+ 2λ
cos ϕ10 = 0
∂I 10
∂I 10
∂I 10
2λHr,−s (I) sen ϕ10 = 0
5 Chirikov,
B.V., 1979, en Physics Reports, pp. 265-379.
(11.245)
Teorı́a de perturbaciones / 515
Entonces los puntos fijos están localizados en ϕ10 = 0, nπ. Como ∂I1 /∂I 1 = r y
∂I2 /∂I 1 = −s, vemos que ∂H 0 /∂I 1 = sω1 − rω2 = 0. Por tanto I 10 está determinado
por:
Hr,−s
∂H00
±2
=0
∂I 10
∂I 10
(11.246)
Para puntos de la superficie de sección diferentes a los puntos fijos, se cumple que:
I˙ 1 = −2λHr,−s sen ϕ1
ϕ̇1 =
(11.247)
∂H00
∂Hr,−s
∂H 0
+λ
+ 2λ
cos ϕ1
∂I 1
∂I 1
∂I 1
(11.248)
O sea que los desplazamientos de I 1 respecto a un punto fijo son del orden de
λ. En cuanto a ϕ1 , el comportamiento es diferente según la degeneración sea accidental o intrı́nseca. Si la degeneración es accidental, entonces H 0 = H 0 (I 1 , I 2 ) y por esto
la amplitud de las oscilaciones de ϕ1 es del orden de la unidad. Si la degeneración es
intrı́nseca, entonces H 0 (I 1 , I 2 ) = H0 (sI1 + rI2 ) = H 0 (I 2 ) y, entonces, ∂H 0 /∂I 1 = 0 y
las oscilaciones de ϕ1 son del orden de λ.
Degeneración accidental. En este caso I 1 permanece en las cercanı́as del punto
fijo, pero ϕ1 puede alejarse del mismo. Entonces podemos escribir:
I 1 = I 10 + ∆I 1
(11.249)
Esto nos permite expandir a H(I) en las cercanı́as de I 10 . Para ello usamos en
(11.244) las expresiones:
H 0 (I) = H 0 (I 0 ) +
∂H 0
1 ∂2H 0
∆I 1 +
(∆I 1 )2 + ...
2 ∂I 2
∂I 10
10
(11.250)
H00 (I) = H00 (I 0 ) +
∂H00
1 ∂ 2 H00
∆I 1 +
(∆I 1 )2 + ...
2 ∂I 2
∂I 10
10
(11.251)
Hrs (I) = Hrs (I 0 ) +
∂Hrs
1 ∂ 2 Hrs
(∆I 1 )2 + ...
∆I 1 +
2 ∂I 2
∂I 10
10
(11.252)
Reteniendo los términos de orden más bajo en λ y ∆I 1 obtenemos:
∆H = H − H 0 (I 0 ) − λH00 (I 0 ) =
1 ∂2H 0
(∆I 1 )2 + 2λHr,−s cos ϕ1
2 ∂I 2
10
(11.253)
∆H describe el movimiento en las cercanı́as de la resonancia, y puede escribirse
como:
∆H =
1
G(∆I 1 )2 − F cos ϕ1
2
(11.254)
516 / Mecánica clásica avanzada
donde:
G(I 0 ) =
∂ 2H 0
2
∂I 10
;
F (I 0 ) = −2λHr,−s (I 0 )
(11.255)
Este resultado nos muestra que el movimiento cerca a cualquier resonancia, para
cualquier sistema, es aproximadamente similar al de un péndulo (el diagrama de fases
presenta rotación, separatriz y vibración, ver ejemplo 10.3.2).
Si GF > 0, el punto fijo estable está en ϕ1 = 0 y el punto fijo inestable en ϕ1 = ±π.
La frecuencia del movimiento en I 1 − ϕ1 para la libración cerca al punto estable es baja:
!1/2
2
√
∂
H
0
ω1 = F G = λ1/2 −2Hr,−s ·
(11.256)
2
∂I 10
y, según la fórmula (10.104), se hace cero en la separatriz. El máximo desplazamiento
en ∆I 1 está dado en la mitad de la separatriz y vale:
1/2

r

 −2H
F

r,−s 
(11.257)
= λ1/2  2
máx ∆I 1 = 2

G
 ∂ H0 
2
∂I 10
Degeneración intrı́nseca. En este caso, de (11.247) y (11.248), se sigue que tanto
I 1 como ϕ1 permanecen cerca del punto fijo porque ∂H 0 /∂I 1 = 0.
En las proximidades del punto elı́ptico ϕ10 escribimos ϕ1 = ∆ϕ1 , y por tanto:
1
cos ϕ1 = 1 − (∆ϕ1 )2 + ... ;
ϕ1 ≈ 0
(11.258)
2
En las proximidades del punto hiperbólico ϕ10 = π (o ϕ10 = −π) escribimos
ϕ1 = ±π + ∆ϕ1 y por lo tanto:
1
cos ϕ1 = −1 + (∆ϕ1 )2 + ... ;
2
ϕ1 ≈ ±π
(11.259)
En este caso ∆H en vez de (11.254) toma la forma:
∆H =
1
1
G(∆I 1 )2 + F (∆ϕ1 )2
2
2
(11.260)
donde:
G=
∂2H 0
2
∂I 10
+λ
∂ 2 H00
2
∂I 10
+λ
∂ 2 Hr,−s
(11.261)
2
∂I 10
F = ∓2λHr,−s
(11.262)
2
Como para degeneración intrı́nseca ∂ 2 H 0 /∂I 10 = 0, se sigue que F y G son del
orden de λ. Cerca del punto fijo elı́ptico la frecuencia de oscilación es:
"
!#1/2
√
∂ 2 H00
∂ 2 Hr,−s
ω1 = F G = λ −2Hr,−s
(11.263)
+
2
2
∂I 10
∂I 10
Teorı́a de perturbaciones / 517
y la relación de semiejes de la elipse es:
∆I
=
∆ϕ1
r
1/2



F
−2Hr,−s


= 2

G  ∂ (H00 + Hr,−s ) 
(11.264)
2
∂I 10
Cerca del punto fijo hiperbólico no hay oscilaciones. Las órbitas no son elı́pticas
sino hiperbólicas, siendo el ángulo entre las ası́ntotas:
r
F
(11.265)
tan χ =
G
Vemos que no hay gran diferencia cualitativa entre las trayectorias de fase en los
casos con degeneración intrı́nseca y accidental, sólo que en el segundo caso las oscilaciones en ∆I 1 tienen amplitud muy pequeña en comparación con las de ϕ1 . Lo anterior
suponiendo que G 6= 0.
Ejemplo 11.7.1 Analizar el movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento no lineal del ejemplo 11.6.1.
En este caso la degeneración es intrı́nseca, con r = 2, s = 1. H1 está dado por
(11.227), de modo que, reemplazando sen ϕ02 por cos ϕ02 y haciendo λ = axy :
hH1 i =
−1
(I 0 − 2I20 )(I20 )1/2 cos ϕ02
2(mω10 )3/2 1
(11.266)
Entonces:
2H2,−1 =
−1
(I 0 − 2I20 )(I20 )1/2
2(mω10 )3/2 1
(11.267)
en tanto que H0 (I0 ) = ω10 I10 . Por tanto:
2
∂ 2 H2,−1
2
∂I 20
=
i
h
1
−3/2
−1/2
I
(I
)
+
6(I
)
10
20
20
2(mω10 )3/2
(11.268)
En cercanı́as del punto elı́ptico F y G serán:
F =
λ
(I 10 − 2I 20 )(I 20 )1/2
(mω10 )3/2
(11.269)
G=
h
i
λ
−3/2
−1/2
I
(I
)
+
6(I
)
10
20
20
4(mω10 )3/2
(11.270)
ω1 será:
ω1 =
1/2
λ
(I 10 − 2I 20 )(I 10 + 6I 20 )
2(mω10 )3/2
I 20
(11.271)
518 / Mecánica clásica avanzada
Libración
Rotación
Resonancia:
Separatriz
I20 = I20
ϕ02 = ϕ20
I20
ϕ20
λ=0
Punto
hiperbólico
a
Punto
elíptico
b
Figura 11.2 Movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento
no lineal. Superficie de sección I20 − ϕ02 .
La relación entre las oscilaciones máximas en I20 y ϕ02 está dada por:
1/2
∆I20
= 2I 20 (I 10 − 2I 20 )(I 10 + 6I 20 )
0
∆ϕ2
(11.272)
La figura 11.2 muestra la superficie de sección I20 − ϕ02 , en coordenadas polares,
con y sin perturbación.
Resonancias de orden superior. Si λ no es demasiado pequeña, el hamiltoniano
(11.240) puede dar lugar a contribuciones seculares que modifiquen o destruyan el invariante adiabático I 2 . Tales resonancias son entre armónicos de la oscilación pendular
I 1 − ϕ1 , de frecuencia ω1 , y la frecuencia fundamental ω2 . En el lı́mite adiabático esas
resonancias dan lugar a cadenas de “islas”, o sea, a movimientos pendulares alrededor
de los puntos fijos en el plano J1 − χ1 de las variables acción-ángulo del movimiento pendular I 1 − ϕ1 [ver ecuaciones (10.99) y (10.100)]. Nuevamente se debe efectuar
una transformación canónica que elimine la frecuencia degenerada, o sea, pasar a las
variables angulares χ1 y χ2 dadas por χ1 = pχ1 − qϕ2 ; χ2 = ϕ2 , donde p y q son los
números enteros de la resonancia de segundo orden. El paso siguiente consiste en encontrar los parámetros que describen el movimiento pendular alrededor de los puntos fijos
de J1 − χ1 .
El hamiltoniano que describe la resonancia primaria es de la forma (11.254) o
(11.260), que en las cercanı́as del punto elı́ptico se comportan similarmente, y para
pequeñas libraciones puede expandirse, de acuerdo con la ecuación (10.105), en la forma:
1
λGJ12 + ...
(11.273)
16
donde J1 y χ1 son las variables acción-ángulo del movimiento pendular en el plano
∆I 1 − ϕ1 alrededor de un punto elı́ptico, dadas en el ejemplo 10.3.2. Si el movimiento
K0 (J1 , J2 ) = H 0 (I 10 , J2 ) + ω1 J1 −
Teorı́a de perturbaciones / 519
es “exactamente” pendular, J1 es constante. Cuando hay resonancias secundarias, el
movimiento en el plano ∆I 1 − ϕ1 no es exactamente pendular, sino como el mostrado en
la figura 11.3, que muestra la cadena de islas asociada a la resonancia cuando 5ω1 = ω2 ,
donde ω1 = χ̇1 . A la resonancia secundaria le corresponden cinco puntos fijos elı́pticos,
en cada uno de los cuales es generado un movimiento pendular secundario.
∆I1 cos ϕ1
J1 sen χ1
∆I1 cos ϕ1
a
b
Figura 11.3 Cadena de islas asociada a la resonancia: a. Aparecen las separatrices y las curvas
de libración; b. Cadena de islas formadas en la resonancia secundaria.
En la figura 11.3a, aparecen las separatrices y las curvas de libración. Las lı́neas
punteadas corresponden a la resonancia primaria y las lı́neas continuas corresponden a
las “islas” formadas en la resonancia secundaria. En la figura 11.3b, se han llevado las
“islas” de la resonancia secundaria a variables acción-ángulo. En un paso siguiente, uno
podrı́a transformar las variables (J, χ) a unas nuevas variables (J, χ) donde sea removida
la resonancia 5ω1 = ω2 , dando lugar nuevamente a curvas de tipo pendular como las de
la figura 11.2b.
Para tener en cuenta la forma como una resonancia secundaria modifica la solución,
′
reintroducimos los términos de H 1 ignorados al promediar sobre ϕ2 , al ir de (11.240) a
(11.242):
′
H 1 (I, ϕ) = H 1 (I, ϕ) − hH 1 (I, ϕ1 )i
(11.274)
que tiene la expansión de Fourier:
′
H 1 (I, ϕ) =
XX
l
′
H lm (I)eilϕ1 /r+i(ls+mr)ϕ2 /r
(11.275)
m
donde la prima indica que se suprimen los términos d.c. en ϕ2 , ls + mr = 0. En las
cercanı́as del punto elı́ptico ϕ10 = 0:
′
H1 =
XX
l
m
′
H lm (I 10 + ∆I 1 , I 2 )eil∆ϕ1 /r+i(ls+mr)ϕ2 /r
(11.276)
520 / Mecánica clásica avanzada
Ahora transformemos esta expresión a variables acción-ángulo, mediante la fórmula:
∆ϕ1 =
2J1
R
1/2
sen χ1 ;
R=
F
R
1/2
(11.277)
Si estamos en las cercanı́as de punto elı́ptico, con movimiento de libración, ∆I 1 y
∆ϕ1 son pequeñas, por lo que J1 /R ha de ser pequeño. Entonces (11.276) al orden más
bajo en ∆I 1 y ∆ϕ1 nos da para el nuevo hamiltoniano, tomando χ2 = ϕ2 y J2 = I 2 :
√
XX
i(l/r) 2J1 /R sen χ1 +i(ls/r+m)χ2
′
K1 =
(11.278)
H lm (I 10 , J2 )e
l
m
Usando la fórmula:
eix sen θ =
∞
X
Jn (x) einθ
(11.279)
n=−∞
donde Jn son las funciones Bessel enteras de orden n, podemos escribir a K1 como:
XXX
′
(11.280)
K1 =
Γlmn (I 10 , J2 )einχ1 +i(ls/r+m)χ2
l
donde:
m
n
" 1/2 #
l 2J1
Γlmn (I 10 , J2 ) = H lm (I 10 , J2 )Jn
r
R
(11.281)
En (11.280) resulta claro que pueden existir resonancias entre χ1 y χ2 cuando:
ls
χ̇2
r+m
√
√
o sea, cuando ω 1 = χ̇1 = F G = 0( λ) y ω 2 = 0(1) son conmensurables,
nχ̇1 = −
p
ω2
= ;
ω1
q
p, q : enteros
(11.282)
(11.283)
Resulta ahora que la frecuencia χ̇1 = pχ̇1 − q χ̇2 es mucho menor que χ̇2 . Entonces
χ̇2 puede ser eliminada con una transformación canónica mediante:
F2 = (pχ1 − qχ2 )J 1 + χ2 J 2
lo cual nos da para para K 1 :
XXX
′
K1 =
Γlmn ei[nχ1 +p(nq+p(ls/r+m))χ2 ]/p
l
m
(11.284)
(11.285)
n
Ahora la variable angular χ2 puede ser eliminada mediante una transformación
canónica adecuada, que equivale a promediar sobre χ2 . Introduciendo un nuevo parámetro pequeño λ1 , (11.273) y (11.285) nos conducen a:
K = K 0 (J 1 , J 2 ) + λ1 K 1 (J 1 , J 2 , χ1 )
(11.286)
Teorı́a de perturbaciones / 521
en K 1 sólo aparecen los términos con n dados por:
ls
+m =0
nq + p
r
(11.287)
siendo nq, ls/r y mp enteros. Esto equivale a dejar en (11.280) sólo los términos con:
nχ1 +
ls + mr
χ2 = −jpχ1 + (ks + jq − ks)χ2 = j(qχ2 − pχ1 )
r
(11.288)
o sea, con:
l
= k ; m = jq − ks ;
j, k : enteros
r
Entonces la expansión (11.280) toma la forma:
X
K−jp,jq e−ijχ1
K1 =
n = −jp ;
(11.289)
(11.290)
j
donde:
K−jp,jq =
X
Γkr,jq−ks,−jp
(11.291)
k
Ahora, como K no depende de χ2 , J 2 es constante:
q
J 2 = J2 + J1 = constante
p
(11.292)
que es el invariante adiabático para las oscilaciones que dan lugar a las “islas”. El
movimiento en J 1 − χ1 es integrable, siendo las oscilaciones de ∆J 1 y χ1 alrededor
del punto fijo elı́ptico, como en (11.254), de forma pendular y por tanto aplicables los
resultados para este tipo de movimiento. Como K 1 proviene de la parte oscilante de H 1 ,
el armónico más bajo en (11.290) se obtiene para j = ±1. Asumamos que q = 1, que
corresponde a la resonancia con el fundamental de la oscilación χ2 = ϕ2 . Entonces el
coeficiente de Fourier del término dominante en (11.290) es:
!
r
X
l 2J1
H kr,±1−ks J−p
(11.293)
K−p,±1 =
r
R
k
p
o sea, proporcional a Jp [(l/r) 2J1 /R]. De (11.256) se sigue que ω1 = 0(λ)1/2 y de
(11.283) que ω2 = pω1 . Como ω2 = O(1), se cumple que p espun entero del orden de
λ−1/2 . De (11.257) se sigue que máx ∆I 1 = 2R, por lo tanto 2J1 /R es del orden de
la unidad.
El desarrollo asintótico de Jn (x) para n grande es:
x n
(11.294)
Jn (x) ≈ (2πn)1/2 en
2n
como λ es pequeño, p es grande y podemos escribir:
!
!p
r
r
2J1
l 2J1
l
−1/2 p
Jp
≈ (2πp)
e
r
R
2rp
R
h √
√ i
(11.295)
= O (e λ)1/ λ
522 / Mecánica clásica avanzada
lo cual nos muestra la pequeñez del término dominante en K 1 . F , el término de interacción en el movimiento pendular secundario es, de acuerdo con (11.255), proporcional
a Kp,±1 , o sea a Jp . De (11.256) se sigue que las oscilaciones pendulares en las “islas”
es muy baja, en tanto que de (11.257) se concluye
que la amplitud de las oscilaciones
√ 1/(2√λ) 1/(4√λ)
√
J1
, que son muy pequeñas y además
“islas” es proporcional a λ1 (e λ)
decrecen rápidamente cuando J1 decrece. Para λ pequeño, las oscilaciones “islas” son
despreciables, pero para λ relativamente grande, se sigue de (11.295) que pueden llegar
a ser importantes, incluso comparables a las de la resonancia primaria. La rápida reducción del tamaño de las cadenas de “islas” de orden superior cerca a los puntos fijos
nos indica que dichos puntos son relativamente estables cuando las perturbaciones no
son muy grandes. Pero para perturbaciones grandes aparecerán muchos nuevos puntos
fijos elı́pticos y cadenas de “islas” de orden superior de tamaño apreciable, ası́ como
frecuencias de libración, que alteran drásticamente los invariantes adiabáticos o sea los
toroides invariantes.
11.8.
Movimientos regulares e irregulares
Se denomina irregular, caótico o estocástico al movimiento de un sistema de varios
grados de libertad en que por aumento de una perturbación desaparecen constantes de
movimiento uniformes, alterando la topologı́a de los toroides invariantes. El teorema
de Kolmogorov, Arnold y Moser establece que para perturbaciones suficientemente pequeñas existen aún toroides invariantes (movimientos regulares), si el sistema satisface
ciertas condiciones. La existencia de toroides invariantes usualmente se cuantifica por
medio de la medida de la región del espacio fásico ocupada por toroides invariantes. La
estocasticidad global se presenta cuando la región ocupada por toroides invariantes tiene
una medida suficientemente pequeña, o sea que el movimiento esencialmente es caótico,
y se puede caracterizar por el valor del parámetro de perturbación.
Aplicaciones de una superficie de sección en sı́ misma. Sobre el toroide invariante de un sistema de dos grados de libertad, el movimiento puede ser parametrizado
por las variables angulares ϕ1 , ϕ2 , o por el tiempo, ası́:
ϕ1 = ω1 t + ϕ10 ;
ϕ2 = ω2 t + ϕ20
(11.296)
Como ω1 y ω2 son funciones de las variables de acción I1 , I2 , que para un sistema
integrable son constantes de movimiento uniformes, se sigue entonces que la razón entre
ω1 y ω2 es igualmente una constante:
~ =
α(I)
~
ω1 (I)
~
ω2 (I)
(11.297)
Para α = r/s, con r y s números enteros, ω1 y ω2 son conmensurables y el movimiento degenera en una curva bidimensional, que se repite después de r giros en ϕ1 y s
giros en ϕ2 . Como r y s pueden ser grandes, y entre cualquier par de números racionales
siempre hay muchos racionales, se sigue que las órbitas periódicas son arbitrariamente
próximas entre sı́ en el espacio fásico.
Teorı́a de perturbaciones / 523
El concepto de movimiento sobre un toro puede generalizarse a más de dos grados
de libertad.
Si se toma t = 0 cuando la trayectoria cruza la superficie de sección en el punto x0 ,
en t = 2π/ω2 cruzará en el punto x1 , en t = 4π/ω2 cruzará en x2 y ası́ sucesivamente.
Entre dos intersecciones consecutivas ϕ1 avanza por ω1 ∆t = 2πα, donde α es el número
r/s. Como la energı́a E es función de I1 e I2 , para E fija, α puede asumirse función de
I1 solamente.
Los puntos de las sucesivas intersecciones con la superficie de sección están relacionados entre sı́ mediante cierto mapeo o aplicación discreta, llamada aplicación canónica.
Llamando x al conjunto (I, ϕ):
xn+1 = C(xn )
(11.298)
o explı́citamente:
x1,n+1 = I1,n ;
ϕ1,n+1 = ϕ1,n + 2πα(I1,n+1 )
(11.299)
donde escribimos a α como una función de I1,n+1 . La anterior es la aplicación “twist”,
que aplica cı́rculos en cı́rculos, pero con un número de rotación α que en general depende
del radio. La figura 11.4 muestra la aplicación para α irracional (lı́neas continuas) y para
α racional (lı́neas a trazos) con s = 6.
Trayectoria de fases
Puntos fijos
con r entero y s = 6
I1
x0
x1
ϕ1
I2
x2
ϕ2
ϕ2 = constante
a
α irracional
b
Figura 11.4 Toroide invariante de un sistema de dos grados de libertad ϕ1 y ϕ2 . A la izquierda,
curva bidimensional que se repite después de r giros en ϕ1 y s giros en ϕ2 . Al lado derecho,
mapa de Poincaré formado por puntos xi donde la trayectoria cruza la superficie de sección.
Directamente de (11.299) se sigue que:
I1,n+1 , ϕ1,n+1
=1
J
I1,n , ϕ1,n
(11.300)
o sea que la aplicación transforma una región arbitraria de la superficie de sección en
otra conservando el área.
524 / Mecánica clásica avanzada
Lo anterior es válido para sistemas integrables. Si este sistema es perturbado ligeramente, el hamiltoniano será ahora función de los ángulos:
~ ϕ
~ + λH1 (I,
~ ϕ
H(I,
~ ) = H0 (I)
~)
(11.301)
En la superficie de sección I1 − ϕ1 definida por ϕ2 = constante (módulo 2π),
esperamos que la aplicación “twist” cambie en una aplicación “twist” perturbada:
In+1 = In + λf (In+1 , ϕn )
(11.302)
ϕn+1 = ϕn + 2πα(In+1 ) + λg(In+1 , ϕn )
donde se ha omitido el subı́ndice 1. f y g son funciones periódicas de ϕn . Como la
transformación de n a n + 1 es generada por las ecuaciones de Hamilton, la aplicación
(11.302) debe conservar el área. Esta aplicación puede tomarse como una transformación
canónica con función generatriz:
F2 (In+1 , ϕn ) = In+1 ϕn + 2πA(In+1 ) + λB(In+1 , ϕn )
(11.303)
donde:
α=
∂A
;
∂In+1
f =−
∂B
;
∂ϕn
g=
∂B
∂In+1
(11.304)
La condición de conservación del área (11.300) implica ahora que:
∂f
∂g
+
=0
∂In+1
∂ϕn
(11.305)
Cuando f no depende de I y g = 0, entonces de (11.302) se obtiene la aplicación
“twist” radial perturbada:
In+1 =
In + λf (ϕn )
ϕn+1 =
ϕn + 2πα(In+1 )
(11.306)
Cuando f = sen ϕn esta aplicación se llama la aplicación estándar (o aplicación
de Chirikov). Una involución C = i es una aplicación canónica tal que al repetirse dos
veces reproduce las condiciones iniciales. Entonces:
xn+2 = i(xn−1 ) = i2 (xn ) = xn
(11.307)
La aplicación “twist” radial es un producto de involuciones si f (−ϕ) = −f (ϕ). Las
dos involuciones que dan lugar a la aplicación “twist” radial son:
I = In + f (ϕ)n ;
ϕ = −ϕn
(11.308)
ϕn+1 = −ϕ + 2πα(I)
(11.309)
y,
In+1 = I ;
La factorización en involuciones ayuda a determinar los puntos fijos, pues los puntos
fijos de las involuciones son de perı́odo 1. Por ejemplo, (11.308) tiene los puntos fijos
Teorı́a de perturbaciones / 525
dados por ϕ1 = 0, π para todo I1 , y (11.309) tiene puntos fijos dados por 2ϕ2 = 2πα(I2 )−
2πm con m entero.
A partir de las ecuaciones de Hamilton podemos hallar la correspondiente aplicación sobre una superficie de sección. Las ecuaciones de Hamilton del hamiltoniano
(11.301) son:
dIi
∂H1
;
= −λ
dt
∂ϕi
dϕi
∂H1
∂H0
+λ
=
dt
∂Ii
∂Ii
(11.310)
La ecuación para I1 sobre la superficie de sección ϕ2 = constante = ϕ20 , entre la
n y la n + 1-ésima iteración, es:
∂H1
dI1
(In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t)
= −λ
dt
∂ϕ1
(11.311)
donde I2 , ω1 y ω2 son funciones de In+1 . En la n-ésima iteración en (11.311) t = 0 y en
la n + 1-ésima iteración t = T2 . Luego el salto en la acción I1 en una iteración es:
Z T
∂H1
∆I1 = −λ
dt
(In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t)
(11.312)
∂ϕ1
0
Entonces de (11.302) se sigue que:
λf (In+1 , ϕn ) = ∆I1 (In+1 , ϕn+1 )
(11.313)
La función g que define el cambio en ϕn se obtiene de la condición de conservación
del área, (11.305):
Z ϕ
∂f
g(I, ϕ) = −
dϕ
(11.314)
∂I
El problema inverso consiste en hallar el hamiltoniano asociado a la aplicación
canónica. Para la aplicación (11.306), podemos asumir que el ı́ndice n hace las veces del
parámetro “tiempo”.
La función delta periódica permite seleccionar los tiempos de cruce de la trayectoria
con la superficie de sección:
δ1 (n) =
∞
X
m=−∞
δ(n − m)
(11.315)
Entonces (11.306) toma la forma:
dI
= λf (ϕ)δ1 (n) ;
dn
dϕ
= 2πα(I)
dn
(11.316)
donde In y ϕn son I(n − ǫ) y ϕ(n − ǫ). Estas ecuaciones son de forma hamiltoniana con:
Z I
Z θ
H(I, ϕ, n) = 2π
α(I ′ )dI ′ − λδ1 (n)
f (ϕ′ )dϕ′
(11.317)
que es un hamiltoniano no autónomo de un grado de libertad.
526 / Mecánica clásica avanzada
Ejemplo 11.8.1 Construir un hamiltoniano para la aplicación estándar (11.306).
Dicha aplicación es:
In+1 =
In + K sen ϕn
ϕn+1 =
ϕn + In+1
(11.318)
Las ecuaciones de movimiento según (11.316) son:
dI
= K sen ϕ δ1 (n) ;
dn
dϕ
=I
dn
(11.319)
y el hamiltoniano según (11.317) es:
H=
1 2
I + Kδ1 (n) cos ϕ
2
(11.320)
Es conveniente usar la expansión de Fourier de la función delta periódica, (11.315):
δ1 (n) = 1 + 2
∞
X
cos 2πqn
(11.321)
q=1
entonces:
H=
∞
X
1 2
I + K cos ϕ
ei2πnm
2
m=−∞
(11.322)
donde el número de iteración n es una variable temporal, resultando H no autónomo.
H puede también escribirse en la forma:
H = H 0 + H1
(11.323)
donde:
H0 =
1 2
I + K cos ϕ
2
(11.324)
y,
H1 = 2K cos ϕ
∞
X
cos 2πqm
(11.325)
q=1
Como se ve, H0 es el hamiltoniano de un péndulo y H1 es una perturbación consistente en una serie de impactos periódicos en el tiempo.
Ejemplo 11.8.2 Construir la aplicación correspondiente al movimiento en las cercanı́as
de la separatriz, en una superficie de sección, para un sistema de dos grados de libertad.
Teorı́a de perturbaciones / 527
Por aplicar la teorı́a de las perturbaciones seculares a una resonancia dada en un
sistema cuasi-integrable y promediando sobre las variables angulares rápidas, el hamiltoniano que describe el movimiento cerca a la resonancia toma la forma (11.254):
1
H = H0 (I) + Gp2 − λF cos q
2
(11.326)
Como este hamiltoniano describe un movimiento cuasiperiódico, con una parte
rápida:
I = constante ;
ϕ = ωϕ (I)t + ϕ0
(11.327)
y una parte lenta correspondiente al movimiento integrable de un péndulo, la aplicación
en cualquier superficie de sección, ϕ = constante o q = constante, es la aplicación canónica (11.299). Para hallar la aplicación perturbada, correspondiente a (11.302), debemos
considerar los términos resonantes que fueron despreciados al promediar la resonancia
ω2 /ω1 = r/s sobre la variable angular rápida ϕ como en (11.242). Entonces, de (11.240),
el hamiltoniano completo, que contiene resonancias entre ϕ y el movimiento lento q, y
movimiento caótico en cercanı́as de la separatriz, es:
1
H = H0 (I) + Gp2
2
− λF cos q + λ
X
l>1,m6=0
Hlm cos
lϕ mq
−
+ ∆lm
r
r
(11.328)
donde G, F , Hlm y ∆lm dependen sólo de I.
Ahora podemos aplicar la fórmula (11.312) para hallar a f de la aplicación perturbada en una superficie de sección, que depende sólo de los términos reintroducidos en
(11.328).
La figura 11.5 muestra el movimiento en las superficies de sección p − q y I − ϕ,
donde la parte rayada representa el movimiento en la separatriz junto con la componente estocástica. Ver más adelante. Por conveniencia, buscamos la aplicación sobre la
superficie de sección I − ϕ con q ≈ ±π.
Como los coeficientes de Fourier decaen al aumentar l y m, retendremos sólo el
término dominante con l = m = 1. Entonces (11.328) y (11.312) nos dan:
Z ∞
ϕ q
i
∂ h
f (In+1 , ϕn ) = −
dt
H11 cos
(11.329)
− + ∆11
∂ϕ
r
r
−∞
Según la ecuación (10.105), para la trayectoria separatriz se cumple:
q = 4 tan−1 (eω0 t ) − π
donde ω02 = λF G. f toma la forma:
Z
ωϕ (In+1 )t ϕn
A(In+1 ) +∞
q
dt
−
−
f (In+1 , ϕn ) =
sen
r
r
r
r
−∞
(11.330)
(11.331)
donde A es H11 y ∆11 ha sido incluido en ϕn que mide a ϕ en el n-ésimo cruce por
la superficie de sección colocada en la separatriz, q ≈ ±π. Teniendo en cuenta que
528 / Mecánica clásica avanzada
p
q
ωq
+π
–π
Superficie
de sección ϕ = constante
a
Iy
ϕ
Ix
ωϕ
Superficie
de sección q = constante
b
Figura 11.5 Movimiento en las superficies de sección para un sistema de dos grados de
libertad: a. Sección p − q; b. Sección I − ϕ.
q(−ω0 t) = −q(ω0 t), expandiendo la función seno y notando que sólo la parte simétrica
contribuye a la integral, obtenemos:
f (In+1 , ϕn ) =
A
−ϕn
α2 (Q0 ) sen
ω0 r
r
(11.332)
donde:
mq(s)
αm (Q0 ) =
cos
− Q0 s ds
2r
−∞
Z
∞
(11.333)
es la integral de Arnold-Melnikov, y:
Q0 =
ωϕ
rω0
(11.334)
Teorı́a de perturbaciones / 529
La integral (11.333) es impropia pero consta de una parte oscilante que promedia
a cero durante el movimiento sobre la separatriz y una parte constante que viene de la
región con s ≤ 1/Q0 . Melnikov la evaluó, siendo para Q0 ≫ m:6
αm (Q0 ) =
4π
(2Q0 )m−1 e−πQ0 /2
(m − 1)!
(11.335)
Como ω02 = λF G, entonces Q0 ≈ λ1/2 y vale la expansión asintótica (11.335).
Entonces podemos escribir:
f = f0 sen ϕn ;
f0 =
8πA 2 −πQ0 /2
Q e
ωϕ 0
(11.336)
De acuerdo con el ejemplo 10.3.1, para las oscilaciones de un péndulo en las cercanı́as de la separatriz se cumple que el perı́odo vale:



T = ω0−1 ln 
32 
ωϕ I 
1+
λF
(11.337)
El cambio en ϕ durante este tiempo es ωϕ T , lo cual conduce al número de rotación
de la aplicación “twist”:
2πα =
32
ωϕ
ln
ω0
|W |
(11.338)
donde:
W = −F −
ωϕ I
λF
(11.339)
Si escogemos a ωϕ independiente de I, con lo cual el problema no se altera esencialmente, resulta que f no depende de I, y según (11.314) podemos tomar g ≡ 0.
Es conveniente cambiar de variables de I a W . En las variables W , ϕ, la aplicación
separatriz es:
Wn+1 = Wn − W0 sen ϕn
ϕn+1 = ϕn + Q0 r ln
32
|Wn+1 |
(11.340)
donde:
W0 =
8πA 2 −πQ0 /2
ωϕ I0
=
Q0 e
F
F
(11.341)
No degeneración y no degeneración isoenergética. Tratemos de explorar las
consecuencias debidas a la dependencia lineal de las frecuencias sobre los movimientos
en una superficie de sección.7
6 Véase
7 Véase
1976.
el apéndice A, en Chirikov, Op. cit.
el texto de V. Arnold, Les méthodes mathématiques de la mécanique classique, Mir, Moscú,
530 / Mecánica clásica avanzada
Asumamos que hay una relación entre las frecuencias, para dos grados de libertad,
de la forma:
f (ω1 , ω2 ) = 0
(11.342)
Diferenciando hallamos de df = 0:


∂ω1 ∂ω2
∂f
 ∂I1 ∂I1   ∂ω1


ω̃I f~ω = 

 ∂ω
∂ω2   ∂f
1
∂I2 ∂I2
∂ω2
Si f es de la forma:
f = m1 ω 1 + m2 ω 2 = 0



=0

(11.343)
(11.344)
con m1 y m2 enteros, f~ω es un vector con componentes m1 y m2 . Entonces (11.343) se
satisface solamente si se cumple la condición necesaria:
det ω̃I = 0
(11.345)
det ω˜I 6= 0 es la condición necesaria de no degeneración de las frecuencias (o de no
dependencia lineal de las frecuencias). En el caso no degenerado los movimientos son
cuasiperiódicos con un número de frecuencias igual al número de grados de libertad, con
lo cual existen toroides invariantes l-dimensionales. Las curvas de fase son hélices sobre
los toroides y las frecuencias de revolución cambian de un toroide a otro.
En el caso general no sólo las dos frecuencias sino su relación α varı́a de un toroide a
otro. Si la derivada de α respecto a la variable de acción que numera los toros es diferente
de cero para un valor dado de la energı́a, diremos que el sistema es isoenergéticamente
no degenerado. La condición de no degeneración isoenergética se escribe como:


∂ω1 ∂ω2
ω1

 ∂I1 ∂I1





 ∂ω
∂ω2
1
6= 0
(11.346)
det 
ω2 



 ∂I2 ∂I2


ω1
ω2
0
la cual se deduce fácilmente de las expresiones dα(I1 , I2 ) 6= 0 y dE = ω1 dI1 +ω2 dI2 = 0.
Las condiciones de no degeneración y de no degeneración isoenergética son independientes, es decir, la una no implica la otra.
Consideremos la aplicación “twist” sobre el punto de intersección de una curva de
fases con la superficie de sección. Esa aplicación deja invariantes los cı́rculos meridianos
concéntricos de intersección de los toros invariantes con la superficie de sección. Cada
cı́rculo gira un ángulo igual a 2πα. Si el sistema no es isoenergéticamente degenerado, el
ángulo de rotación de los cı́rculos invariantes sobre la superficie de sección cambiará de
un cı́rculo a otro, es decir, α necesariamente cambia al pasar de un cı́rculo a otro. Como
α es una función continua de I1 , con E constante, al ir variando I1 , α tomará tanto
Teorı́a de perturbaciones / 531
valores racionales como irracionales, de modo que en ciertos cı́rculos habrá puntos fijos
discretos y en otros no. Una y otra clase de cı́rculos forman un conjunto denso, pero
en casi todos los cı́rculos el ángulo de rotación no será un múltiplo racional de 2π. Si
ahora la aplicación es perturbada, como en (11.306), la propiedad de un cı́rculo con α
racional de tener puntos fijos debe desaparecer. La trayectoria sobre un toro resonante
no perturbado es cerrada y no llega sino a muy pocos puntos del mismo, pero al aplicar
una pequeña perturbación llenará todos los puntos del toro. En tanto que si el toro es no
resonante, una perturbación pequeña no ocasiona un cambio grande en las trayectorias
de fase y en la topologı́a misma del toro.
En una resonancia particular, ω1 /ω2 = r/s, la condición de no degeneración isoenergética (11.346) se convierte en:
r2
∂ 2 H0
∂ 2 H0
∂ 2 H0
+ s2
− 2rs
6= 0
2
2
∂I1
∂I2
∂I1 ∂I2
(11.347)
Esta condición a la vez es una condición de no linealidad del movimiento alrededor
de un punto fijo. Al analizar el movimiento cerca a una resonancia aislada encontramos
que es descrito por un hamiltoniano de la forma (11.253):
∆H =
∂2H 0
2
∂I 1
(∆I 1 )2 + 2λHr,s cos ϕ1
(11.348)
2
tomando a Hrs real. Si ∂ 2 H 0 /∂I = 0, entonces la no linealidad aparece solamente al
orden λ2 y el ancho de la separatriz no estará restringido a ser del orden de λ1/2 , según
(11.256). Entonces la condición de no linealidad es, de (11.255):
G=
∂2H 0
2
∂I 1
6= 0
(11.349)
2
Esta condición separa los sistemas con degeneración accidental (∂ 2 H 0 /∂I 6= 0) o
2
fuertemente no lineales, de los sistemas con degeneración intrı́nseca (∂ 2 H 0 /∂I = 0) o
débilmente no lineales. Para ver la equivalencia de (11.349) y (11.347), pasamos de las
variables (I 1 , I 2 ) a las (I1 , I2 ) mediante la transformación canónica (11.238) y (11.239):
∂2H 0
∂
∂H0 ∂I1
∂H0 ∂I2
=
.
.
6= 0
(11.350)
+
∂I12
∂I2 ∂I 1
∂I 1 ∂I1 ∂I 1
y como según (11.238), ∂I1 /∂I 1 = r y ∂I2 /∂I 1 = s, obtenemos inmediatamente a
(11.347). O sea que la condición de no degeneración isoenergética es a la vez una condición de no linealidad del movimiento en proximidades de una resonancia aislada.
El teorema de K. A. M. Si un sistema integrable es perturbado, hemos visto en
(11.45) que las resonancias entre los grados de libertad pueden destruir la convergencia
de las expansiones en series de potencias alrededor del sistema no perturbado. Sin embargo el teorema de K. A. M. dice que “si un sistema hamiltoniano es no degenerado,
entonces la mayor parte de los toroides invariantes no resonantes no desaparecen bajo
una perturbación hamiltoniana lo suficientemente pequeña, sino que se deforman ligeramente de modo que en el espacio de fases del sistema perturbado existen igualmente
532 / Mecánica clásica avanzada
toroides invariantes, o sea adherencias de las curvas de fase que son hélices cuasiperiódicas con un número de frecuencias igual al número de grados de libertad. Tales toroides
son la mayorı́a en el sentido que la medida del complemento de su unión es del orden de
λ”. Las condiciones a ser satisfechas son:
(i) No linealidad suficiente. O sea que en cierto rango de valores de I~ las frecuencias
son independientes:
~ 6= 0
m.~
~ ω(I)
(11.351)
donde ω
~ = ∂H0 /∂ I~ y m
~ es un vector de componentes enteras.
(ii) La perturbación es función de clase C M , o sea que posee derivadas continuas
hasta de orden M .
(iii) El estado del sistema es lo suficientemente alejado de una resonancia para
satisfacer que:
|m
~ ·~
ω| ≥ C|m|
~ −τ
(11.352)
para todo m,
~ donde τ depende de l y M , y C depende de λ, de la magnitud del hamiltoniano de perturbación H1 , y de la no linealidad G del hamiltoniano no perturbado
H0 .
Como (11.352) no puede satisfacerse para C muy grande y C se incrementa con
λ, |H1 | y 1/G, hay una condición de “perturbación suficientemente pequeña” para que
existan toros de K. A. M. (i) y (iii) también implican una condición de no linealidad
moderada.
Este teorema fue probado por Arnold (1961) para H1 analı́tica y por Moser (1962)
para cuando H1 es de clase C M , basados en una conjetura de Kolmogorov (1954). La
dificultad de la prueba del teorema radica en los pequeños denominadores que aparecen en todo el procedimiento de expansión en series de potencias. Las pruebas utilizan
los métodos de convergencia rápida (superconvergentes), análogos al método de Newton para resolver numéricamente una ecuación algebraica, que permite neutralizar el
efecto de los pequeños divisores que aparecen en cada aproximación. Para ilustrar esto, consideremos la aplicación “twist” perturbada con dos grados de libertad, (11.302),
correspondiente a las intersecciones de la trayectoria con la superficie de sección:
I1 (ϕ1 + 2πα) = I1 (ϕ1 ) + λf (ϕ1 )
Usemos expansiones de Fourier respecto a ϕ1 :
X
X
bk eikϕ1
I1 (ϕ1 ) =
ak eikϕ1 ; λf (ϕ1 ) =
(11.353)
(11.354)
Entonces:
I1 (ϕ1 + 2πα) − I1 (ϕ1 ) =
X
ak eik2πα − 1 eikϕ1
(11.355)
con lo cual se obtiene la siguiente relación entre los coeficientes:
ak =
bk
ik2πα
e
−1
(11.356)
Teorı́a de perturbaciones / 533
Los módulos de estos coeficientes se relacionan por:
|bk |
(11.357)
2 sen πkα
Vemos que ak no tiende a cero tan rápido como bk y que son indefinidos cuando α es racional. El anterior es el problema de los denominadores nulos que impide la
convergencia de las series de perturbaciones. Pero como α es función de I1 , el valor de
I1 puede escogerse de modo que el denominador nunca sea resonante. Básicamente el
método de cálculo consiste en variar las condiciones iniciales en cada paso del procedimiento de expansión para asegurarse de estar lo suficientemente lejos de las resonancias
y poder proseguir la expansión al paso siguiente. En una expansión superconvergente la
aproximación n + 1-ésima se realiza alrededor de los valores de las variables obtenidos
de la n-ésima aproximación y no alrededor de los valores no perturbados, como se hace
en una expansión ordinaria.
Como hemos visto, si hay una resonancia entre los dos grados de libertad del
sistema no perturbado, la perturbación induce un cambio en las trayectorias del espacio
de fases, lo mismo que en las frecuencias. Si la acción perturbada I1 es próxima a la
no perturbada I0 , pueden existir curvas invariantes de K. A. M. “cercanas” a las curvas
invariantes no perturbadas. El anterior es el significado de la condición de independencia
lineal m
~ ·~
ω 6= 0, que garantiza que I1 → I0 cuando λ → 0.
Para un valor fijo de λ, la no linealidad necesaria en G puede estimarse de la
condición ∆I1 ≪ I0 , siendo I0 la acción no perturbada y ∆I1 el máximo valor de la
diferencia I1 − I0 . De (11.238) se sigue que:
|ak | =
(11.358)
∆I1 = r∆I 1
Para un sistema con degeneración accidental, (11.257) nos dice que:
1/2
2λHrs
∆I 1 = 4
G
(11.359)
Por tanto ∆I1 ≪ I0 impone la condición:
G≫
32r2 λHrs
I02
(11.360)
La condición de suavidad de la perturbación, (ii), puede asociarse con la propiedad de las curvas de K. A. M. de existir solamente separadas de todas las “islas” de
perturbaciones. Si las “islas” entre dos resonancias de orden bajo llenan todo el espacio
de fases entre ellas, podemos razonablemente esperar que no haya una curva de K. A.
M. ¿Cómo relacionar esto con la condición (ii) del teorema?.
Asumamos que ω1 /ω2 = s y que H0 depende linealmente de I2 , de modo que ω2
es una constante independiente de I1 e I2 . En la siguiente resonancia, ω1 /ω2 = s + 1, de
modo que la diferencia en ω1 entre dos resonancias sucesivas es δω1 = ω2 , como puede
verse en la figura 11.6. Entre dos resonancias primarias hay una serie de resonancias
secundarias en ω1 /ω2 = s+p/q (p, q enteros y p < q). El hamiltoniano tiene la expresión:
X
H = H0 + λ
Hlm ei(lϕ1 −mϕ2 )
(11.361)
l,m
534 / Mecánica clásica avanzada
Tomemos en la sumatoria los valores de l que dan lugar a resonancias secundarias,
l = q, 8
ω 1 /ω 2 = s
ω 1 /ω 2 = s + 1
a
4 2λG′H 1m 4 2λG′H 1m
4 2λG′H 1m
0
1/4 1/3
1/2
2/3 3/4
b
1
G′∆I 1
ω2
Figura 11.6 Intervalos que muestran resonancias.
m(p, q) = p + sq
(11.362)
y analicemos el movimiento en las cercanı́as de una resonancia secundaria. De (11.359)
el ancho de la separatriz en cada resonancia es:
∆I 1 = 4
2λHqm
G
1/2
(11.363)
8 Condiciones de validez del teorema de K. A. M.: (i) Las curvas perturbadas son cercanas a las
curvas no perturbadas no resonantes. (ii) Las resonancias son lo suficientemente separadas, de acuerdo
con la condición de suavidad de la perturbación. (iii) En la figura 11.6b los intervalos rayados muestran
resonancias secundarias. La suavidad de la perturbación exige que las resonancias secundarias sean
aisladas.
Teorı́a de perturbaciones / 535
y de las expresiones ∆I1 = q∆I 1 y g = q 2 ∂ 2 H0 /∂I12 = q 2 G′ , obtenemos para la contribución de todas las resonancias secundarias sobre el valor de ∆I1 :
1/2 X
X
2λ
1/2
Hqm
(11.364)
∆I1 = 4
G′
p,q
y para el ensanchamiento de las frecuencias:
X
X
∂ω1 X
∆I1 = G′
∆I1
∆ω1 =
∂I1
1/2 X
2λ
1/2
= 4
Hqm
G′
p,q
(11.365)
La relación entre la suma de los anchos de las islas secundarias y la separación
entre las resonancias primarias es:
P
X
∆ω1
1/2
= 4(2λG′ )1/2 ω2−1
Hqm
(11.366)
δω1
p,q
Si H1 tiene M derivadas continuas respecto a ϕ1 y ϕ2 , las derivadas altas tienen
la forma:
X
(11.367)
Hqm (iq)k1 (−im)M−k1 ei(qϕ1 −mϕ2 )
p,q
Las cuales serán continuas a condición de que Hqm sean lo suficientemente pequeñas
para q y m grandes.
Para que la serie converja, es necesario que para q y m grandes los términos se
comporten como 1/q 2 por lo menos, ya que m es lineal en q de acuerdo con (11.362).
Entonces las amplitudes de Fourier para q grandes han de comportarse como:
Hqm ≈
A
q M+2
(11.368)
con el fin de que λH1 sea de clase C M . Según (11.362) y la desigualdad p < q, hay q
coeficientes de Hqm con el mismo valor de q y diferentes valores de p. Estos coeficientes
corresponden a resonancias y son todos grandes y de magnitud comparable. Por tanto:
X
1/2
1/2
Hqm
≈ qHqm′
(11.369)
donde m′ es un valor de m convenientemente escogido. De (11.366), (11.368) y (11.369)
se sigue entonces que:
√
P
∞
X
∆ω1
4 2ω1 σ
≈ 4(2λG′ A)1/2 ω2−1
(11.370)
q −M/2 =
δω1
ω2
q=1
donde:
σ=ζ
M
2
,
ω1 = (λAG′ )1/2
(11.371)
536 / Mecánica clásica avanzada
y ζ es la función zeta de Riemann. ζ(1) = ∞, ζ(2) = 1, 64493, ζ(3) = 1, 20205 y ζ(x) → 1
para x → ∞. Entonces (11.370) existe si M > 2. De modo que independientemente
del valor del coeficiente de la sumatoria, obtenemos la importante condición para la
existencia de una superficie de K. A. M.: que el número de derivadas continuas de la
perturbación satisfaga que
M >2
(11.372)
Podemos comparar este resultado con la condición (iii) de K. A. M., (11.352),
escrita para dos dimensiones como:
ω1
r
−
> C ′ sτ −1
ω2
s
(11.373)
El lado izquierdo es el ancho de una resonancia secundaria aislada. Tomando el
ancho total a ser examinado como la distancia entre dos resonancias de orden inferior,
o sea el intervalo unidad, hay a lo sumo s valores de r en tal intervalo que deben
ser excluidos según la condición (i) del teorema. La medida de Lebesgue M de las
resonancias excluidas se obtiene multiplicando a (11.373) por s y sumando sobre s:
M = C′
∞
X
s−τ = C ′ ζ(τ )
(11.374)
s=1
Comparando a (11.374) con (11.370) vemos que:
C′ ≈
ω1
;
ω2
ω1 =
√
λAG′ ;
τ=
M
2
(11.375)
Entonces τ > 1 es suficiente para que exista una superficie de K. A. M.
Chirikov ha determinado la condición necesaria correspondiente a (11.372) para l
grados de libertad:
M ≥ 2l − 2
(11.376)
y Moser la condición suficiente:
M ≥ 2l + 2
(11.377)
suponiendo que C tiende a cero con λ y es tomada suficientemente pequeña.
Asumiendo que la suma en (11.370) converge a σ, vemos que las superficies de K. A.
M. no existen si α = ω1 /ω2 cae dentro de una de las regiones rayadas en la figura 11.6b.
Como el ancho de esas regiones es proporcional a (λG)1/2 y decrece con el incremento
de q, α debe estar lo suficientemente lejos de un número racional p/q. Para λ pequeño
es fácil cumplir esto, pero cuando λ se incrementa, solamente aquellos irracionales que
son más difı́ciles de aproximar por racionales pueden dar lugar a √
superficies de K. A. M.
El número “más irracional” en este sentido es la media dorada ( 5 − 1)/2.
La condición sobre el valor de λ se obtiene de (11.370) haciendo el lado izquierdo
igual a uno:
λG′ ≤
ω22
32Aσ 2
(11.378)
Teorı́a de perturbaciones / 537
Por otra parte (11.360) y (11.378) dan la condición de λ no linealidad moderada:
ω22
32λA
< G′ <
2
I0
32Aσ 2 λ
(11.379)
usando r2 Hrs /q 2 ≈ A.
El teorema de Poincaré-Birkhoff. Cualquier punto del cı́rculo con α(I) = r/s
es un punto fijo de la aplicación “twist” no perturbada (11.299) con perı́odo s. El teorema
dice que para algún múltiplo par de s, 2ks con k = 1, 2, ..., permanecen 2ks puntos fijos
al colocarse una perturbación, siendo ks de ellos elı́pticos y ks hiperbólicos. Asumamos
que α(I) aumenta al aumentar I. Entonces hay una curva de K. A. M. por fuera de la
curva racional, que se mueve en sentido contrario a las agujas del reloj (flechas externas),
α > r/s, y una curva de K. A. M. dentro de la curva racional que se mueve en sentido de
las agujas reloj, para s iteraciones de la aplicación “twist” perturbada (11.302). Por tanto
entre estas dos debe haber una curva cuya coordenada angular ϕ no cambia después de
s iteraciones de la aplicación (curva sólida, que no es una curva de K. A. M).
Iy
Curva estacionaria
Circunferencia
K.A.M.
α > r/s
Circunferencia
α = r/s
Ix
Circunferencia
K.A.M.
α < r/s
s = 3, k = 1
Figura 11.7 La figura muestra una curva de K. A. M. (por fuera de la curva racional) que
se mueve en sentido contrario al del reloj, una curva racional que se mueve en sentido del
reloj y una curva sólida que no es de K. A. M.
Ahora mediante una aplicación que preserve el área llevamos los puntos de la curva
sólida radialmente a alguna curva rayada como lo muestra la figura 11.7. Las curvas continua y rayada deben encerrar la misma área. Esto es posible sólo si las curvas se cruzan
entre sı́ un número par de veces. Cada intersección cuando es iterada s veces retorna a
538 / Mecánica clásica avanzada
su posición inicial, es un punto fijo. De modo que para un número par de intersecciones,
debe haber 2ks de tales puntos, que son los puntos fijos de Poincaré-Birkhoff. El teorema
no da el valor de k, que en la figura se ha tomado k = 1. Los puntos son alternativamente
de naturaleza elı́ptica e hiperbólica. Los puntos con α 6= r/s cercanos a un punto elı́ptico
tienden a girar alrededor de él, en tanto que los puntos cercanos a un punto hiperbólico
mediante repetidas aplicaciones tienden a alejarse indefinidamente del punto fijo.
En la sección 11.7 mediante transformación a un sistema de coordenadas fijo en un
punto elı́ptico estudiamos el comportamiento de los puntos cercanos a él y encontramos
que tienen un movimiento pendular. Luego encontramos que las resonancias de orden
superior dan lugar a la aparición de nuevos puntos fijos en las cercanı́as del punto elı́ptico, alrededor de los cuales nuevamente se presentan oscilaciones pendulares de amplitud
mucho más pequeña, según (11.295) proporcional a (1/s)s+1/2 . Hasta aquı́ vemos un
cuadro lleno de curvas de K. A. M. de gran complejidad. Sin embargo, veremos que el
comportamiento estocástico no resulta de las resonancias de orden superior, sino que
puede ocurrir en resonancias de orden bajo como resultado de la bifurcación de las separatrices. Hablando a grosso modo podemos decir que los punto elı́pticos están asociados
a la estructura de islas del espacio fásico y los puntos hiperbólicos al comportamiento
estocástico de la región entre toroides de K. A. M. En el apéndice 9 del libro de Arnold
hay una serie de proposiciones referentes a los puntos fijos de las aplicaciones canónicas.9
Bifurcación de las separatrices. Sabemos que un péndulo tiene una separatriz
que une suavemente las órbitas hiperbólicas que pasan por los puntos de equilibrio inestable en π y −π. El teorema de Poincaré-Birkhoff nos dice que hay ks puntos hiperbólicos
en un sistema integrable. Hay una separatriz suave que une un punto hiperbólico a sus
vecinos próximos para tales sistemas. En un sistema cuasi-integrable con dos o más grados de libertad la situación es más compleja. Basta recordar que en los hamiltonianos
usados para obtener la estructura de islas, (11.244) o (11.286), hay una serie de términos
que han sido despreciados al construir los correspondientes invariantes. La estructura de
islas corresponde pues a un sistema truncado.
En cualquier singularidad hiperbólica convergen cuatro curvas, correspondientes a
las dos trayectorias separatrices incidentes Γ+ y a las dos trayectorias separatrices salientes Γ− . Un punto x pertenece a Γ+ si la transformación repetida T n x cuando n → ∞
trae a x a la singularidad, y pertenece a Γ− si la transformación inversa T −n x cuando
n → ∞ trae a x a la singularidad. Como el perı́odo sobre la separatriz del sistema
truncado es infinito, lo mismo será sobre la separatriz del sistema verdadero, y el movimiento de x hacia la singularidad resulta más y más lento mientras x esté más cerca del
punto fijo hiperbólico. Ahora consideremos la separatriz Γ− que sale del punto singular
hiperbólico adyacente. En vez de llegar suavemente coincidiendo con Γ+ , como sucede
con el péndulo o con cualquier separatriz de un sistema integrable, la curva Γ− que sale
de un punto hiperbólico se cruza con la curva Γ− que sale de un punto hiperbólico vecino
desplazado 2π/(ks). Esta intersección se llama un punto homoclı́nico. Las intersecciones
entre trayectorias de resonancia vecinas diferentes se llaman puntos heteroclı́nicos. En
esto consiste la bifurcación de las separatrices, en que una curva Γ+ no coincide con
una curva Γ− . Esto establece una diferencia fundamental entre el comportamiento de
9 Véase
V. Arnold, Op. cit.
Teorı́a de perturbaciones / 539
Curva
K.A.M.
x′′′
x′′
x′
Curva K.A.M.
Punto
elíptico
x
Γ+
Γ–
Γ–
Γ+
Curva
K.A.M.
Curva
K.A.M.
Figura 11.8 Bifurcación de las separatrices Γ. Las lı́neas punteadas indican la separatriz del
sistema truncado integrable. Las lı́neas continuas indican la separatriz del sistema completo
no integrable.
las trayectorias del sistema truncado y del sistema completo integrable.
Si hay una intersección, entonces hay un número infinito de intersecciones, todas
puntos homoclı́nicos. La intersección en el punto homoclı́nico x implica el cruce en x′
y luego en x′′ , con x′′ más próximo a x′ que x′ a x. Como las áreas encerradas por las
intersecciones (áreas sombreadas en la figura 11.8) son aplicaciones unas de otras, son
conservadas, de modo que Γ− oscila más y más, siendo las intersecciones sucesivas más
próximas entre sı́ y las oscilaciones de amplitud mayor en virtud de la conservación de
las áreas. En la figura 11.8 se muestran sólo las primeras intersecciones.
Los puntos homoclı́nicos por sı́ solos no describen completamente el comportamiento de la región próxima a las separatrices. Como el número α(I) local en las cercanı́as de
los puntos singulares elı́pticos tiende a infinito en la separatriz debido a que el perı́odo
del movimiento sobre ésta es infinito, entonces en las cercanı́as de la separatriz hay
un número infinito de resonancias secundarias correspondientes a valores grandes de
α. Cada uno tiene su propio conjunto de puntos singulares hiperbólicos y elı́pticos que
alternan, con la correspondiente bifurcación de separatrices y con múltiples puntos he-
540 / Mecánica clásica avanzada
teroclı́nicos. Todas esas trayectorias llenan densamente el espacio accesible a ellas, para
dos grados de libertad limitado por dos superficies de K. A. M. La intersección de las
trayectorias en puntos homoclı́nicos demuestra que un toroide de K. A. M. no puede
existir en tales puntos puesto que hay un drástico cambio de topologı́a. Cuando la perturbación aumenta, según el teorema de K. A. M., la medida de la región de toroides
disminuye y aumenta la de la región estocástica.
La magnitud de la bifurcación de las separatrices para λ pequeño es exponencialmente pequeña, razón por la cual pasa desapercibida en las diferentes formas de la teorı́a
de perturbaciones. Su sola existencia genera las divergencias que ocurren en las series
de perturbaciones. Si esas series fueran convergentes, el sistema no tendrı́a bifurcación
de las separatrices ni estados de movimiento irregular.
Aplicación completa sobre una superficie de sección para un sistema no
integrable de dos grados de libertad. Asumamos que en la superficie de sección
al aumentar I1 disminuye la frecuencia ω1 y que en I1 = 0 el número de rotación es
irracional, por ejemplo α(0) = 1/π. Al aumentar I1 , ω1 decrece hasta alcanzar la primera
resonancia de orden bajo en ω1 = ω2 /4, dando lugar como en la figura 11.3, a una
cadena de islas; es decir hay cuatro puntos fijos que como resultado de la perturbación
y según el teorema de Poincaré-Birkhoff pasan a ser ocho, alternándose los elı́pticos e
hiperbólicos, con una isla alrededor de cada punto elı́ptico. Cerca de los cuatro puntos
fijos hiperbólicos la presencia de puntos homoclı́nicos y heteroclı́nicos está asociada a una
región de movimiento caótico limitada por dos superficies de K. A. M. “rotacionales”.
Al aumentar I1 , la siguiente resonancia de orden bajo aparece en ω1 = ω2 /5, que da
lugar a cinco puntos elı́pticos y a una cadena de cinco islas. Al aumentar I1 aparecen
nuevas resonancias. Hay además infinidad de resonancias intermedias cuya amplitud es
pequeña. Por ejemplo, entre ω1 = ω2 /4 y ω1 = ω2 /5 hay una resonancia en ω1 = 2ω2 /9.
De acuerdo con (11.257) la amplitud de una resonancia es del orden de:

1/2
 λH


r,−s 
∆I1 ≈  2

 ∂ H0 
(11.380)
2
∂I 1
Según (11.293) el coeficiente de Fourier dominante en el hamiltoniano que describe
el movimiento en las islas es aproximadamente:
máx Hr,−s ≈ Js (π)
(11.381)
de modo que la relación de amplitudes en s = 5 y s = 9 es aproximadamente:
J9 (π)
∆I1 (s/r = 9/2)
≈ 0, 1
(11.382)
≈
∆I1 (s/r = 5)
J5 (π)
Además, en cada punto hiperbólico de las resonancias secundarias se genera una
región de movimiento caótico.
La figura 11.9 muestra esquemáticamente la apariencia de la superficie de sección.
Las lı́neas sólidas son superficies de K. A. M. Las que rodean el origen, I1 = 0, son distorsión de los cı́rculos no perturbados y corresponden al nuevo invariante I1 = constante,
Teorı́a de perturbaciones / 541
el cual es calculado aplicando el teorema de la media, descrito en la sección 11.5. Las
lı́neas sólidas que rodean los puntos singulares elı́pticos no se pueden calcular con este
método sino con el de las perturbaciones seculares (sección 11.7).
Para las trayectorias cercanas a las separatrices no hay un invariante y las trayectorias llenan toda el área comprendida entre dos lı́neas de K. A. M. “rotacionales”.
Figura 11.9 Superficie de sección de resonancias secundarias
En cada una de las “islas” alrededor de un punto elı́ptico podemos transformar de
las variables I 1 , ϕ1 a unas variables acción-ángulo J1 , χ1 . Esto transforma la cadena de
islas en un conjunto de cı́rculos concéntricos como en la figura 11.3b. Las resonancias
entre la frecuencia del movimiento alrededor del punto fijo y las frecuencias fundamentales crean cadenas de islas de segundo orden, similares a las de primer orden.
Análisis de la estabilidad. En los sistemas hamiltonianos no integrables la estabilidad lineal parece ser una condición necesaria y suficiente para la estabilidad no
lineal, en el sentido que la estabilidad lineal garantiza la existencia de superficies de K.
A. M. cerca a un punto fijo. El análisis de la estabilidad de un estado de movimiento
en un sistema hamiltoniano se reduce al análisis de la estabilidad de la correspondiente
aplicación canónica en una superficie de sección de Poincaré. Un punto fijo x0 de una
aplicación que preserve el área T se dice que es estable si para cada vecindad U de x0
existe una subvecindad V ⊆ U tal que para todo k siempre se cumple que T k (V ) ⊆ U .
Poniendo el orı́gen de coordenadas en x0 y linealizando T alrededor de ese punto, hallamos que su parte lineal es una matriz 2 × 2 de coeficientes reales, Ã, que es simplicial.
Debido a esto, si λ es un autovalor de Ã, entonces 1/λ también lo es, y por ser real, λ y
λ⋆ son autovalores. De modo que los autovalores λ, λ⋆ , 1/λ, 1/λ⋆ , están determinados
por la ecuación λ2 − λ tr à + 1 = 0 donde tr es la traza de Ã. Si los autovalores son
complejo conjugados, λ1,2 = e±iσ , representan soluciones estables con tr à = 2 cos σ y
|trÃ| < 2. Si son reales y recı́procos, por ejemplo λ1,2 = e±σ , con |tr Ã| = |2 cosh σ| > 2,
se tienen soluciones creciente y decreciente. El caso inestable puede dividirse en dos posibilidades, tr à > 2 (λ1 > 1) y tr à < −2 (λ1 < −1). Las raı́ces pueden ser iguales con
542 / Mecánica clásica avanzada
λ1 = λ2 = ±1, y corresponden a la transición exacta entre los casos estable e inestable.
El movimiento linealizado presenta entonces tres clases de órbitas: elı́pticas, hiperbólicas y rectilı́neas. Un punto fijo hiperbólico es inestable y las órbitas cercanas a él
se separan exponencialmente. Un punto fijo elı́ptico es estable y las órbitas cercanas a él
se separan linealmente. Si en un punto elı́ptico hay resonancias de orden bajo, sabemos,
el análisis de estabilidad lineal no es suficiente pues pueden presentarse nuevos puntos
fijos hiperbólicos, de acuerdo con el teorema de Poincaré-Birkhoff.
Ejemplo 11.8.3 Hacer el análisis de estabilidad de la aplicación separatriz (11.340):
Wn+1 =
Wn − W0 sen ϕn
ϕn+1 =
ϕn + Q0 r ln
32
|Wn+1 |
(11.383)
Los puntos fijos de perı́odo 1, o sea de una sola iteración, están en:
Q0 r ln
o sea:
32
= 2πm
|W1 |
(11.384)
W1 =
±32e−2πm/(Q0r) ,
ϕ1 =
0, π
m : entero
(11.385)
Si llamamos x1 = (W1 , ϕ1 ) y T la aplicación, estos puntos satisfacen x1 = T x1 .
Linealizando alrededor de x1 obtenemos xn = x1 + ∆xn :
∆xn+1 = Ã ∆xn
(11.386)
siendo à la matriz jacobiana de la aplicación:
 ∂W

∂W
n+1
 ∂Wn

à = 
 ∂ϕn+1
∂Wn
n+1
∂ϕn
∂ϕn+1
∂ϕn




(11.387)
Para evaluar la estabilidad se requiere la traza de Ã:
tr à = 2 +
W0
Q0 r cos ϕ
W1
(11.388)
Para estabilidad se requiere que tr à < 2, de modo que para W1 > 0 los puntos
fijos con ϕ1 = 0 son todos inestables. Para ϕ1 = π hay estabilidad cuando:
W1 > Ws = W0
Q0 r
4
(11.389)
o sea:
W1 >
2πrA 3 −πQ0 /2
Q0 e
F
(11.390)
Teorı́a de perturbaciones / 543
Es de esperarse que el valor de Ws que marca el lı́mite entre los puntos con ϕ1 = π
estables e inestables represente un importante parámetro indicativo de estocasticidad
cuando W < Ws . La aplicación separatriz es de importancia para comprender el comportamiento caótico de los sistemas cuasi-integrables, pues las separatrices siempre rodean las resonancias de esos sistemas. La aplicación separatriz, que describe el comportamiento en las cercanı́as de la separatriz, claramente exhibe comportamiento caótico
para W → 0.
Ejercicio 11.8.1 Hallar los puntos fijos de perı́odo 1 y analizar la estabilidad de la aplicación de Fermi:
Un+1 =
|Un + sen ϕn |
ϕn+1 =
ϕn +
2πM
Un+1
(177)
(11.391)
donde M es una constante.
Ejercicio 11.8.2 Hallar los puntos fijos de perı́odo 1 y analizar la estabilidad de la aplicación estándar (11.318).
Ejercicio 11.8.3 Mostrar que la aplicación estándar es una aproximación a la aplicación
de Fermi y a la aplicación separatriz linealizadas.
Irregularidad global. La existencia de regiones caóticas está asociada con las
resonancias y se da aun para valores pequeños del parámetro λ. No hay una transición
brusca entre los regı́menes regular e irregular en algún valor crı́tico de λ. Sin embargo es
útil poder cuantificar el grado de “estocasticidad” y decir cuando el movimiento es dominantemente estocástico. Chirikov (1979) ha observado que al aumentar la perturbación
ocurre en algún valor más o menos definido que las superficies de K. A. M. rotacionales
que encierran una región estocástica de un sistema de dos grados de libertad se “rompen”, permitiendo que las trayectorias estocásticas ocupen una región más grande del
espacio fásico. Con esta idea elaboró el concepto de sobreposición de las separatrices y
definió un parámetro de estocasticidad. Hay muchos otros criterios pero este es de los
más usados, al menos como un indicador del orden de magnitud de la perturbación para
el cual el sistema se comporta de modo esencialmente irregular. Si (∆Imáx )1 y (∆Imáx )2
son los anchos de las separatrices vecinas separadas por una lı́nea de K. A. M. rotacional,
y δI12 es la distancia entre las resonancias correspondientes, o sea entre los puntos fijos
centrales de las “islas”, el criterio de estocasticidad global puede formularse como:
(∆Imáx )1 + (∆Imáx )2
2
≥
δI12
3
(11.392)
Cuando existen las superficies de K. A. M. que limitan las regiones estocásticas se
habla de estocasticidad local o aislada y cuando tales superficies desaparecen se habla
de estocasticidad global o conectada. En el ejemplo 11.8.3 hallamos un parámetro crı́tico
para el cual se pierde la estabilidad lineal de las principales resonancias en la aplicación
separatriz; este parámetro también da una burda estimación de la estocasticidad, pero
por no ser una condición necesaria para la estocasticidad conectada resulta ser un criterio
544 / Mecánica clásica avanzada
demasiado fuerte. Greene (1979)10 halló que aunque la pérdida de estabilidad lineal de
las islas de perı́odo 1 es una condición muy fuerte, tal criterio aplicado a islas de perı́odo
alto cercanas a una superficie de K. A. M. puede dar una mejor descripción. Este es un
criterio alterno al de Chirikov y más exacto en muchos casos.
Ejemplo 11.8.4 Analizar diferentes criterios de irregularidad global para la aplicación
estándar (11.318).
(a) Pérdida de estabilidad de los puntos fijos elı́pticos de perı́odo 1. Tales puntos
están en:
I1 = 2πm ,
m : entero ;
La matriz à es:


1 ±K

à = 
1 1±K
ϕ1 = 0, 1
(11.393)
(11.394)
donde el signo más corresponde a ϕ1 = 0 y el menos a ϕ1 = π. La condición de estabilidad:
|2 ± K| < 2
(11.395)
nos dice que el punto ϕ = 0 es siempre inestable. No hay puntos fijos elı́pticos de perı́odo
1 si:
K>4
(11.396)
(b) Sobreposición de separatrices de resonancias primarias. Es conveniente considerar el hamiltoniano de la aplicación, obtenido en el ejemplo 11.8.1. Si asumimos que ϕ
varı́a lentamente con el tiempo, dϕ/dn ≪ 2π, entonces esperamos que en H1 , ecuación
(11.325), contribuirá sólo el término de variación más lenta, de modo que:
1 2
I + K cos ϕ + 2K cos ϕ cos 2πn
(11.397)
2
La parte correspondiente a H0 , ecuación (11.324), describe un movimiento pendular, siendo la frecuencia de libración alrededor del punto elı́ptico ϕ = π:
√
ω0 = K
(11.398)
H=
El máximo desplazamiento de I es hallado de H0 tomando cos ϕ = 1 en I = 0, o
sea H0 = K. Entonces el valor máximo de I está en cos ϕ = −1:
√
∆Imáx = 2 K
(11.399)
De acuerdo con (11.393), la distancia entre las resonancias primarias δI es igual a
2π, y por tanto la relación entre el ancho total de la separatriz y la distancia entre dos
resonancias consecutivas es:
2∆Imáx
4ω0
=
(11.400)
δI
2π
10 Véase
el texto de Lichtenberg A. J. y M. A. Lieberman, Regular and stochastic motion, SpringerVerlag, Nueva York, 1983.
Teorı́a de perturbaciones / 545
La frecuencia de H1 es 2π, de modo que el número de rotación local cerca al punto
elı́ptico de libración α0 = ω0 /2π. Entonces:
2∆Imáx
= 4α0
(11.401)
δI
La observación numérica dice que la transición a la estocasticidad global ocurre
aproximadamente cuando aparecen las islas de sexto orden, con α ≈ 1/6, entonces
(11.401) nos conduce a la “regla de los dos tercios”, 2∆Imáx /δI ≈ 2/3. Sin embargo, un estimado de K puede obtenerse directamente de (11.400) tomando simplemente
2∆Imáx /δI ≈ 1 como un indicativo de la sobreposición de las separatrices:
√
4 K = 2π ,
K ≈ 2, 47
(11.402)
Con la regla de los dos tercios se obtiene:
K ≈ 1, 46
(11.403)
(c) Sobreposición del primero y del segundo armónicos. Definimos la condición de
sobreposición del primero y del segundo armónicos como:
∆I1 máx + ∆I2 máx = δI12 = π
(11.404)
donde los subı́ndices indican resonancias de perı́odos 1 y 2 respectivamente.
Para calcular el ancho ∆I2 necesitamos el segundo armónico de Fourier en la
expansión de H en potencias de K ya que en (11.397) K cos ϕ contiene sólo el primer
armónico. El hamiltoniano describe un sistema no autónomo de un grado de libertad,
que equivale a uno de dos grados de libertad según la sección 9.2.
Como la región del espacio fásico en que aparece el segundo armónico está alejada
de las resonancias primarias, la teorı́a de perturbaciones ordinaria puede usarse para
hacer la expansión de H hasta el segundo orden en K donde esperamos que aparezca el
segundo armónico.
El hamiltoniano (11.323) puede escribirse como:
H=
+∞
X
1 2
I + λK
cos(ϕ − 2πmn)
2
m=−∞
(11.405)
El término de orden cero I 2 /2, describe un movimiento en I − ϕ cuya solución es
ϕ = In + ϕ0 , I = constante, siendo ϕ0 una constante. Según (11.393) los puntos fijos
de la aplicación estándar están en I = 2pπ para las resonancias primarias. Entonces la
perturbación dará lugar a puntos fijos de las resonancias secundarias en:
I = (1p + 1)π ;
p : entero
(11.406)
que se encuentran entre dos resonancias primarias. La frecuencia del movimiento de orden cero es (2p + 1)π y la frecuencia de la fuerza impulsora externa es 2πm, presentando
resonancias de la forma r/s = (2p + 1)/m. Los punto fijos en 0 y π de (11.393) corresponden a m = 0, o sea al movimiento pendular, con lo cual las resonancias secundarias
vienen de r = 2p + 1 y s = 1 y basta tomar a H como (11.397), escrito en la forma:
1
H = Iχ + Iϕ2 + K cos ϕ + 2K cos ϕ cos χ
2
(11.407)
546 / Mecánica clásica avanzada
Realicemos una transformación canónica para obtener una variable angular rápida
y una lenta:
Iχ =
rI χ ;
Iϕ = I ϕ − sI χ
ϕ = rχ − sϕ ;
(11.408)
χ=χ
Entonces:
2
1
I ϕ − sI χ
2
rχ − ϕ
rχ − ϕ
+ K cos
+ 2K cos
cos χ
s
s
H
+ = rI χ +
(11.409)
Ahora ϕ es una variable angular lenta y podemos aplicar la teorı́a de perturbaciones
adiabáticas, sección 11.5, válida aquı́ por no haber divisores nulos.
Para buscar una expansión en potencias de K, al orden cero aplicamos (11.178):
H 0 = rI χ +
2
1
I ϕ − sI χ
2
(11.410)
Al primer orden promediamos la perturbación sobre la variable angular rápida χ:
H1 = 0
(11.411)
Entonces, según (11.180):
2π
∂F (1)
= − cos(rχ − ϕ) − 2 cos(rχ − ϕ) cos χ
∂χ
(11.412)
y por tanto:
−2πF (1) =
1
1
sen (rχ − ϕ) +
sen [(r − 1)χ − ϕ]
r
r−1
1
sen [(r + 1)χ − ϕ]
+
r+1
(11.413)
y,
2π
∂F (1)
=
∂χ
1
1
cos(rχ − ϕ) +
cos[(r − 1)χ − ϕ]
r
r−1
(11.414)
1
+
cos[(r + 1)χ − ϕ]
r+1
Para hallar a H 2 , aplicamos la fórmula (11.37) con los promedios tomados sobre
χ:
H2 =
(1)
2
2
∂F ∂F (1)
1 X X ∂ 2 H0
2 µ=1 ν=1 ∂I ν ∂I µ
∂ϕν ∂ϕµ
(11.415)
Teorı́a de perturbaciones / 547
Con el resultado, al segundo orden:
2
K
1 2
cos 2ϕ
H= I −
2
4
(11.416)
donde se ha omitido una constante y regresado a la notación inicial. ϕ es la variable
angular lenta, dada por (11.408):
ϕ = −ϕ + (2p + 1)πn
(11.417)
y describe el movimiento alrededor de las islas de resonancias secundarias. Según la
ecuación (11.416) la máxima oscilación de I es ∆I2 máx = K/2, con lo cual y con (11.399)
y (11.404) toma la forma:
√
K
= π K ≈ 1, 46
(11.418)
2 K+
2
que es el resultado obtenido por Chirikov, y que además justifica la regla de los “dos
tercios”.
Experimentalmente, o sea resolviendo numéricamente la aplicación (11.318), se
obtiene que la transición a la estocasticidad global según Chirikov ocurre cuando K ≈
0, 99. Chirikov mejoró el resultado (11.418) tomando el espesor de la capa estocástica
en cercanı́as de la separatriz.
Ejemplo 11.8.5 Calcular el efecto del espesor de la separatriz sobre el valor de K a partir
del cual ocurre la transición a la estocasticidad global. El cálculo se basa en el ejemplo
11.8.2.
La función W en (11.339) proviene de 1 − κ2 del ejemplo 10.3.2, que se puede
escribir como:
E − Es
(11.419)
1 − κ2 = −
2Es
notando que la energı́a de la separatriz es precisamente F . Entonces W es:
W =
E − Es
Es
(11.420)
o sea la desviación de la energı́a respecto a la separatriz dividida por la energı́a de la
separatriz.
Según el ejemplo 11.8.1, la aplicación separatriz (11.340) linealizada toma la forma
de la aplicación estándar si:
In = −
Q0 ∆Wn
W1
y
K=
Q0 W0
W1
(11.421)
siendo según (11.334) Q0 igual a:
2π
Q0 = √
K
(11.422)
Hemos tomado r = 1 (resonancia de orden 1) y √
tomado las frecuencias impulsora
y de la aplicación según (11.398) y (11.393) iguales a K y 2π respectivamente.
548 / Mecánica clásica avanzada
Como en (11.341) A es H11 que para nuestro caso podemos tomar igual a F . De (11.421)
y (11.341) podemos obtener el parámetro de estocasticidad K en función de Q0 y W1 :
K=
8πQ30 −πQ0 /2
e
W1
(11.423)
donde K está asociado al ancho de las separatrices de las “islas” de segundo orden. Tal
ancho, según (11.420), está descrito por W , o sea por W1 en (11.423), que según (11.422)
puede expresarse en función de K:
W1 = 4(2π)4 K −5/2 e−π
2
√
/ K
(11.424)
√
De (11.399) se sigue que el valor de I en la separatriz es I0 = 2 K. La energı́a del
lı́mite exterior de la capa estocástica cercana a la separatriz es igual a la energı́a de la
separatriz, K, más el ancho de la capa, dado según (11.420) por ∆E = W F , o sea que:
K + ∆E = K(1 + W1 )
(11.425)
es la energı́a del lı́mite exterior de la capa estocástica. Como E = I 2 /2 + K cos ϕ para
el péndulo, en ϕ = π es igual a I 2 /2 − K, encontramos que:
1 2
I − K = K(1 + W1 ) ,
2
I 2 = 2K(2 + W1 )
(11.426)
y como W ≪ 1:
√
W1
I =2 K 1+
4
(11.427)
De modo que el ancho de la separatriz respecto a la acción es:
∆Is = I − I0 =
√
1
W1 K
2
(11.428)
Si sumamos este ancho en (11.418) obtenemos un criterio de sobreposición mejorado:
h
√ i √
2
K
1 + (2π)4 K −5/2 e−π / K 2 K +
=π
2
(11.429)
K ≈ 1, 2
(11.430)
del cual se obtiene el valor:
que coincide un poco más con el valor experimental K ≈ 0, 99.
12
Correspondencia con la mecánica cuántica
de Heisenberg
En este capı́tulo presentaremos la mecánica clásica con una notación similar a la
usada en la mecánica cuántica de Heisenberg, conocida también como mecánica matricial. Las fórmulas no tendrán suposiciones cuánticas y serán válidas clásicamente.
Con esto podremos hacer énfasis en las diferencias y correspondencias que existen entre
los formalismos clásico y cuántico, y a la vez retomar las ideas originales de Werner
Heisenberg expuestas en su trabajo famoso de julio de 1925.1
Veremos que la representación de las variables dinámicas por medio de matrices y
la asignación de valores propios a las variables dinámicas son posibles dentro de un formalismo puramente clásico. Veremos también el punto exacto donde la mecánica clásica
admite el reemplazo de los corchetes de Poisson por conmutadores y la no conmutatividad de las matrices. Finalmente señalaremos dónde están las verdaderas diferencias
entre las mecánicas clásica y cuántica.
Para ilustrar la correspondencia entre la mecánica cuántica y la mecánica clásica
mostraremos cómo el procedimiento de diagonalización de la matriz hamiltoniana corresponde con el de resolver la ecuación de Hamilton-Jacobi, y presentaremos las fórmulas
de la teorı́a clásica de perturbaciones con la notación matricial.
Se corrobora ası́ la idea expresada por Dirac en su artı́culo de noviembre de 1925:
“En un reciente artı́culo Heisenberg planteó una nueva teorı́a donde sugiere que no son
erróneas las ecuaciones de la mecánica clásica, sino más bien que son las operaciones
matemáticas mediante las cuales se extraen resultados fı́sicos a partir de ellas las que
requieren modificación. Toda la información sumunistrada por la teorı́a clásica puede
ser usada en la nueva teorı́a”.2
1 Traducido al inglés por B. L. van der Waerden en Sources of quantum mechanics, Dover, Nueva
York, 1968.
2 Reproducido por van der Waerden, Op. cit.
549
550 / Mecánica clásica avanzada
12.1.
Representación matricial de variables dinámicas
Consideraremos un sistema acotado l-dimensional en un estado de movimiento
regular, es decir, integrable y que por tanto se puede describir mediante variables acción-ángulo. Tal sistema es múltiplemente periódico y cualquier variable dinámica puede
expresarse como una serie de Fourier. El formalismo podrı́a extenderse a estados no acotados mediante la sutitución de las series por integrales de Fourier.
Representación de variables dinámicas por matrices hermı́ticas infinitas.
Sea f una variable dinámica y (I, ϕ) un conjunto de variables acción-ángulo del sistema,
entonces:
X
f (I, ϕ) =
f~n (I) ei~n·ϕ~
(12.1)
~
n
donde ~n son vectores l-dimensionales de componentes enteras. Es conveniente escribir a
~n como la diferencia entre dos vectores de componentes enteras, ~n = α
~ −α
~ ′ . El vector
~
α
~ puede escribirse de modo que I = α
~ ∆I, donde ∆I es un número lo suficientemente
pequeño con las dimensiones de acción;3 por tanto las componentes de α
~ son números
enteros muy grandes, si I~ es grande.
Sumar en (12.1) sobre todos los valores de las I~ (que varı́an entre cero e infinito)
equivale a sumar sobre α
~ , o sea:
X
XX
′
fα~ −~α′ (~
α ∆I)ei(~α−~α )·ϕ~
(12.2)
f (~
α ∆I, ϕ
~) =
α
~
α
~
α
~′
Por ser f real, se cumple que fα~⋆−~α′ (I) = fα~ ′ −~α (I). La suma sobre α
~ en (12.2)
puede ser divergente, lo cual ha de tenerse en cuenta en los desarrollos que siguen. Esto
corresponde con las dificultades de normalización de las ondas planas en la mecánica
cuántica.
Si formamos el producto de dos variables dinámicas, sus coeficientes de Fourier
dependen de los coeficientes de Fourier de cada variable, ası́:
X
(f g)β−
fβ−~
(12.3)
~ β
~ ′ (I) =
~ α (I)gα
~ ′ (I)
~ −β
α
~
La convergencia de la expansión (12.1) exige que los coeficientes para ~n altos sean
pequeños, por tanto sólo son de interés los ~n bajos. Por otra parte, si ∆I es pequeño,
siempre los α
~ en I~ = α
~ ∆I serán grandes, es decir que |~n| es del orden de la unidad y:
|~n| ≪ |~
α|
(12.4)
Entonces se cumple para toda función de I~ que:
F (~
α ∆I) = F (~
α′ ∆I) + (~
α−α
~ ′) ·
3 Puede
∂F
∆I
∂ I~
considerarse a ∆I como la resolución en las medidas de las Iν .
(12.5)
Corespondencia con la mecánica cuántica de Heisenberg / 551
Esto nos permite definir matrices clásicas aproximadamente hermı́ticas, ası́:
fα~ ,~α′ ≡ fα~ −~α′ (~
α ∆I)
(12.6)
entonces es claro que:
fα~⋆′ ,~α = fα~⋆′ −~α (~
α′ ∆I) = fα~ ,~α′ + (~
α′ − α
~) ·
∂fα~ −~α′
∆I
∂ I~
(12.7)
es aproximadamente autoadjunta. Como α
~ y α
~ ′ pueden recorrer todos los vectores de
′
componentes enteras resulta que las fα~ ,~α son matrices infinitas.
Correspondencia con las matrices cuánticas. En mecánica cuántica I~ y ϕ
~ son
operadores cuyos vectores propios los denotaremos respectivamente por |~
αi y |~
ϕi. En el
conjunto de estados |~
αi deben incluirse, si existen, los estados del continuo para tener
un conjunto completo. La transformación de la representación I~ a la representación ϕ
~
es:
X
X
′
|~
ϕi =
|~
α′ ih~
α′ |~
ϕi =
|~
α′ i e−i~α ·ϕ~
(12.8)
α
~′
α
~′
El valor esperado de una variable dinámica f en el estado |~
ϕi está dado por:
XX
′
h~
ϕ|f |~
ϕi =
h~
α|f |~
α′ i ei(~α−~α )·ϕ~
(12.9)
α
~
α
~′
Comparando (12.2) con (12.9) resulta clara la correspondencia de los coeficientes
de Fourier fα~ −~α′ y las matrices clásicas fα~ ,~α′ , con las matrices cuánticas h~
α|f |~
α′ i.
e−i~α·ϕ~ son las funciones de onda de la representación ϕ
~ con valores definidos de α
~,
~ i∂/∂ ϕ
o sea funciones propias del operador hermı́tico asociado a I,
~:
−
1 ∂ −i~α·ϕ~
e
=α
~ e−i~α·ϕ~
i ∂ϕ
~
(12.10)
Ciertamente hay algunas dificultades en la definición de las variables acción-ángulo
en mecánica cuántica, analizadas en el artı́culo de Augustı́n y Rabitz (1979).4
En la sección §48 del libro de mecánica cuántica de Landau-Lifshitz (ver bibliografı́a) está demostrada la correspondencia entre los elementos de matriz de un operador
cuántico y los coeficientes de Fourier de la correspondiente variable dinámica clásica.
No tenemos hasta ahora ninguna justificación para relacionar la matriz clásica
fα~ ,~α′ con transiciones entre estados cuantizados descritos por α
~ yα
~ ′ . El ejemplo 10.5.2
sobre radiación dipolar da una evidencia de la asociación entre emisión de radiación y
transiciones en mecánica clásica.
Cambio de representación. Si por medio de una transformación canónica pasamos de un conjunto de variables acción-ángulo (I, ϕ) a otro (I, ϕ), por medio de una
4 Action-angle
variables in quantum mechanics, Journal of Chemical Physics, 71 (12), 4956, (1979).
552 / Mecánica clásica avanzada
función generatriz G3 (I, ~ϕ), las variables angulares y de acción se deben transformar
~ I~ = −∂G3 (I, ϕ)/∂ ϕ,
~ las funciones e−i~α·ϕ~ como:
como ϕ
~ = −∂G3 (I, ϕ)/∂ I,
X
′ ~
(12.11)
gα~ ,~α′ (I)e−i~α ·ϕ
e−i~α·ϕ~ =
α
~′
y las amplitudes de Fourier de las variables dinámicas como:
XX
fβ−
g+
~ β
~ ′ (I) =
~ −~
α′ (I) gα
~ (I)
~ (I) fα
~ ′ ,β
β,~
α
α
~
(12.12)
α
~′
⋆
donde g +
~ (I).
~ α (I) = gα
~ ,β
β,~
Podemos tomar los resultados de la sección 11.3, referentes a los cambios de sistemas de variables acción-ángulo. Para sistemas no degenerados, las fórmulas (11.84) y
(11.85) de tal sección establecen que:
l
X
∂
ψ(I) ;
ϕν =
nνµ ϕµ −
∂I
ν
µ=1
Iν =
l
X
nµν Iµ
(12.13)
µ=1
donde nνµ es una matriz ñ de elementos enteros y determinante ±1 y ψ depende sólo
de las variables de acción. Entonces:
~
~
e−i~α·ϕ~ = e−i~α·(ñϕ)−i~α·δ
(12.14)
siendo α
~ ·~δ una fase que sólo depende de I~ y de α
~ . Por tanto para sistemas no degenerados:
~
gα~ ·~α′ = e−i~α·δ δα~ ′ ,~αñ
(12.15)
Para sistemas degenerados rigen las fórmulas (11.100) a (11.103):
ϕβ =
l
X
nβν ϕν + ψβ (ϕσ , I) ;
ν=1
ϕτ =
l
X
Iβ =
s
X
nγβ Iγ
γ=1
nτ σ ϕσ + ψτ (ϕσ , I)
(12.16)
ν=s+1
Iτ =
l
X
nντ Iτ − i
ν=1
X
σ
σ
C~nσ (I) nτ ei~n ·ϕ~
~
nσ
Las variables no degeneradas tienen subı́ndices β = 1, 2, ...s, y las degeneradas
σ = s + 1, s + 2, ...l. El superı́ndice σ indica vectores de l − s componentes.
Las variables angulares ϕστ son constantes y los números nτ σ no necesitan ser enteros. ψν (ϕσ , I) son funciones periódicas de las variables angulares degeneradas. Entonces,
usando el convenio de la suma:
α
~ ·ϕ
~ = αβ nβν ϕν + ατ nτ σ ϕσ + αν ψν (ϕσ , I)
(12.17)
Corespondencia con la mecánica cuántica de Heisenberg / 553
ei~α·ϕ~ puede escribirse en la forma:
eα~ ·ϕ~ = eiαβ nβτ ϕτ h(ϕσ , I)
(12.18)
donde las ϕτ son no degeneradas y h es una función periódica de las
gα~ ,~α′ = hα~ σ ,~ασ′ δα~ τ ′ ,~ατ ñτ
ϕστ .
En consecuencia:
(12.19)
siendo α
~ = (~
ασ , α
~ τ ).
Notemos que:
X
g+
~β
~ ′ = δβ,
~′
~ gα
~ ,β
(12.20)
β,~
α
α
~
y por tanto:
X
h+
~σ
α
~σ
β ,~
ασ
hα~ σ ,β~ ′ σ = δβ~σ ,β~ ′ σ
(12.21)
o sea que g y h son matrices unitarias de dimensión infinita.
Las matrices unitarias de cambio de representación son no conmutativas. Si se
realizan dos transformaciones sucesivas, descritas por las matrices g̃ y k̃, se cumple:
~
~
~
~
gα~ ,~α′ kα~ ′ ,β~ =
e−i~α·(δg +ñg δk ) δβ,~
~ αñg ñk
kα~ ,~α′ gα~ ′ ,β~ =
e−i~α·(δk +ñk δg ) δβ,~
~ αñk ñg
(12.22)
Como puede verse, las matrices unitarias que describen las transformaciones canónicas satisfacen una álgebra no conmutativa.
Aquı́ estamos considerando solamente transformaciones canónicas entre diferentes
conjuntos de variables acción-ángulo, que cambian expansiones de Fourier en expansiones de Fourier. Es claro que al pasar a variables canónicas que no sean de acción-ángulo
una expansión de Fourier se cambia por una expansión en otro conjunto de funciones
ortogonales igualmente válida; en la formulación de la mecánica cuántica este trabajo
fue hecho por Born, Jordan y Heisenberg entre septiembre y noviembre de 1925.
Valores propios y vectores propios de una variable dinámica. Dada una
variable dinámica f , ¿existe algún conjunto de variables acción-ángulo para el cual la
función dependa sólo de las variables de acción?. Si existe, en tales variables se debe
cumplir:
(12.23)
f I(I, ϕ), ϕ(I, ϕ) = f (I)
Esto significa que en la expansión de Fourier de f sólo aparece la componente
constante o d.c.:
f β−
~ β
~ ′ = f 0 (I) δβ,
~β
~′
(12.24)
o en términos de las matrices clásicas (12.6):
~
f β,
~β
~ ′ = f 0 (β ∆I) δβ,
~β
~′
(12.25)
554 / Mecánica clásica avanzada
Los números f 0 son los valores propios de la matriz f.
De (12.12) y (12.20) se sigue que:
XX
+
gβ,~
~ ,~
α′ gα
~ ′ ,~
α =0
~ ,~
α′ (I) − f 0 (I)δα
~ α fα
α
~
(12.26)
α
~′
Esta expansión se satisface sólo si f 0 (I) son las raı́ces de la ecuación secular:
det fα~ ,~α′ − f 0 (~
α ∆I) δα~ ,~α′ = 0
(12.27)
En conclusión, encontrar las variables acción-ángulo en las cuales una variable
dinámica no dependa de las variables angulares equivale a diagonalizar la matriz clásica
formada con los coeficientes de Fourier. Los vectores propios de la matriz son a su
vez los elementos de la matriz de la transformación unitaria g que conecta las dos
representaciones:
X
(12.28)
fα~ ,~α′ gα~ ′ ,β~ (I) = f 0 (I) gα~ ,β~ (I)
α
~′
De lo anterior resulta que si el hamiltoniano es diagonal, entonces toda constante
de movimiento, cuando no hay degeneración, es igualmente diagonal.
Por ser matemáticamente válida la correspondencia entre matrices infinitas y operadores lineales, concluimos que en mecánica clásica es posible hacer corresponder a cada
variable dinámica un operador lineal.
Ejemplo 12.1.1 Hallar las matrices clásicas para q, p y H de un oscilador armónico
lineal.
Las expresiones de q y p en variables acción-ángulo dadas en el ejemplo 10.3.1,
permiten obtener fácilmente los coeficientes de Fourier:
1/2
I
qα−β (I) = i
(−δα,β+1 + δα,β−1 )
2mω
(12.29)
1/2
Imω
(δα,β+1 + δα,β−1 )
pα−β (I) =
2
Usando la definición (12.6) se sigue que:
1/2
α ∆I
qα,β = i
(−δα,β+1 + δα,β−1 )
2mω
pα,β =
α ∆Imω
2
1/2
(δα,β+1 + δα,β−1 )
Las matrices adjuntas correspondientes son:
1/2
1/2
(α + 1) ∆I
(α − 1) ∆I
⋆
qβ,α = i
δα,β−1 − i
δα,β+1
2mω
2mω
p⋆β,α
1/2
1/2
(α − 1) ∆Imω
(α + 1) ∆Imω
δα,β−1 +
δα,β+1
=
2
2
(12.30)
(12.31)
Corespondencia con la mecánica cuántica de Heisenberg / 555
Vemos claramente que si α ≫ 1 las matrices de q y p son autoadjuntas. La matriz
hamiltoniana es:
Hα,β = α ∆I ωδα,β
(12.32)
Esta matriz es autoadjunta sin aproximaciones. Los valores propios son los diferentes valores de la energı́a del oscilador armónico. Por ser H positivo, resulta que:
Hα,β = 0
para
α<0
(12.33)
Además por ser ∆I pequeño, los valores propios de H son muy próximos entre sı́,
formando un continuo en el lı́mite ∆I → 0.
12.2.
Corchetes de Poisson y conmutadores de matrices clásicas
En contradicción con lo corrientemente aceptado, la mecánica clásica admite la
representación de las variables dinámicas mediante matrices no conmutativas aproximadamente hermı́ticas. Esta representación permite asociar conmutadores de matrices
clásicas con los corchetes de Poisson. Los resultados cuánticos se obtienen formalmente
colocando ∆I = h̄.
Conmutadores clásicos. El conmutador de las matrices de dos variables dinámicas f y g es:
X
(fβ,~
(12.34)
~ α gα
~ α fα
~ ′ − gβ,~
~′ )
~ ,β
~ ,β
α
~
En términos de las amplitudes de Fourier de f y g, (12.34) toma la forma:
i
Xh
~
~ ∆I) f ~ ′ (~
fβ−~
(~
α
∆I)
−
g
(
β
α
∆I)
(12.35)
′
~ α (β ∆I) gα
~
~
~ −β
β−~
α
α
~ −β
α
~
Notemos que la siguiente expresión vale cero:
i
Xh
~
~
~
~
fβ−~
(
β
∆I)
g
(
β
∆I)
−
g
(
β
∆I)
f
(
β
∆I)
=0
~ α
~′
~ α
~′
α
~ −β
β−~
α
~ −β
(12.36)
α
~
En efecto, cada αν toma valores entre −∞ y +∞. Si cambiamos en los términos
~ ′ , entonces cada δν
negativos de (12.36) a α
~ por ~δ mediante la fórmula β~ − α
~ = ~δ − β
′
′
tomará valores entre βν + βν − ∞ y βν + βν + ∞, o sea entre −∞ y +∞. Entonces por
cada término en (12.36) con signo + hay uno con signo −.
Matrices de corchetes de Poisson. El corchete de Poisson de dos variables
dinámicas es:
[f, g] =
∂f ∂g ∂f ∂g
·
−
·
∂ϕ
~ ∂ I~ ∂ I~ ∂ ϕ
~
(12.37)
556 / Mecánica clásica avanzada
La serie de Fourier del corchete de Poisson es:
X X ∂gm
∂fm
~
~
~ ϕ
~
[f, g] = i
~n · f~n
ei(~n+m)·
−
g
~
~ ~n
∂
I
∂
I
m
~
~
n
(12.38)
Las componentes de Fourier de [f, g] pueden escribirse en términos de las de f y g
ası́:
[f, g]~l = i
X
~
n
∂g~l−~n
∂f~l−~n
~n · f~n
−
g~n
∂ I~
∂ I~
~−β
~ ′ y a ~n por β~ − α
Cambiando a ~l por β
~ , se sigue:
X
∂gα~ −β~ ′
∂fα~ −β~ ′
~
[f, g]β−
=
i(
β
−
α
~
)
·
f
−
g
~ β
~ α
~ α
~′
β−~
β−~
∂ I~
∂ I~
α
~
(12.39)
(12.40)
En esta expresión el corchete de Poisson depende de I~ = β~ ∆I; por tanto las
~
componentes de Fourier de f y g serán también funciones de β∆I.
Si se realiza un
~ ∆I, se sigue que:
cambio infinitesimal en I~ dado por (~
α − β)
gα~ −β~ ′
~ ∆I = g ~ ′ (~
~
· (~
α − β)
~ ′ (β ∆I)
α
~ −β α ∆I) − gα
~ −β
∂ I~
(12.41)
~ ≪ |~
~
debido a que |~
α − β|
α|, |β|.
Entonces el corchete de Poisson puede escribirse en la forma:
[f, g]β−
~ β
~′ =
i
−i X h
~
~
fβ−~
α ∆I) − gβ−~
α ∆I)
~ α (β ∆I)gα
~ ′ (~
~ α (β ∆I)fα
~ ′ (~
~
−
β
~
−
β
∆I
(12.42)
α
~
aquı́ hemos usado la identidad (12.36).
~ ∆I, siendo por tanto [f, g] ~ ~ ′
Notemos que en el lado derecho de (12.42) I~ = β
β−β
~ ∆I. Entonces la definición (12.6) nos permite identificar el lado izquierdo
función de β
de (12.42) con [f, g]β,
~β
~ ′ . Comparando a (12.35) con (12.42) obtenemos el resultado:
[f, g]β,
~β
~′ =
−i ˜
(f g̃ − g̃f˜)β−
~ β
~′
∆I
(12.43)
Vemos que la matriz del corchete de Poisson de dos variables dinámicas puede
expresarse como el conmutador de las correspondientes matrices clásicas, multiplicado
por −i/∆I:
gg] =
[f,
−i ˜
(f g̃ − g̃ f˜)
∆I
(12.44)
En conclusión, en la mecánica clásica es posible asociar a las variables dinámicas
un álgebra no conmutativa que coincide con el álgebra de los corchetes de Poisson.
Ejemplo 12.2.1 Evaluar directamente el conmutador de q y p, y el corchete de Poisson,
para un oscilador armónico.
Corespondencia con la mecánica cuántica de Heisenberg / 557
De (12.30) se sigue:
X
i ∆I p
qβ,α pα,β ′ =
β
(12.45)
2
α
i
p
h p
p
p
β ′ + 1 − β ′ − 1 δβ,β ′ + β ′ − 1 δβ,β ′ −2
× − β ′ + 1 δβ,β ′ +2 +
con una expresión análoga al permutar a p con q. El valor del conmutador es:
X
(qβ,α pα,β ′ − pβ,α qα,β ′ ) =
α
i ∆I
p p
p
β
β + 1 − β − 1 δβ,β ′ ≈ i ∆I δβ,β ′
(12.46)
donde la segunda relación resulta de la suposición β ≫ 1.
Según (12.43) y (12.46) la matriz de los corchetes de Poisson debe ser:
(12.47)
[q, p]β,β ′ = δβ,β ′
Si se aplica directamente (12.40) y se usa el siguiente resultado:
1/2
X
X
∂pα−β ′
I
i(β − α) qβα
=
i(β − α) i
∂I
2mω
α
α
1 mω 1/2
×(−δβ,α+1 + δβ,α−1 )
(δα,β ′ +1 + δα,β ′ −1 )
(12.48)
2 2I
y la expresión análoga con q y p intercambiados, se obtiene igualmente (12.47).
Obviamente, la matriz de [q, p] = 1 tiene sólo unos en la diagonal siendo ceros los
demás elementos.
Ejemplo 12.2.2 Evaluar la matriz del corchete de Poisson de H con q para un oscilador
armónico.
y,
La matriz hamiltoniana está dada por (12.32). En consecuencia:
1/2
X
β ∆I
′
(−δβ,β ′ +1 + δβ,β ′ −1 )
Hβ,α qα,β = β ∆I ωi
2mω
α
X
α
qβ,α Hα,β ′ = i
β ∆I
2mω
1/2
β ′ ∆I ω(−δβ,β ′ +1 + δβ,β ′ −1 )
El conmutador es entonces:
1/2
X
βω ∆I
(−δβ,β ′ +1 − δβ,β1′ )
(Hβ,α qα,β ′ − qβ,α Hα,β ′ ) = i ∆I
2m
α
Según (12.43) y (12.51), el corchete de Poisson es:
1/2
Iω
[H, q]β−β ′ = −
(δβ,β ′ +1 + δβ,β ′ −1 )
2m
que, como debe ser, coincide con la matriz de q̇.
(12.49)
(12.50)
(12.51)
(12.52)
558 / Mecánica clásica avanzada
12.3.
Problemas mecánicos a la manera de Heisenberg
En su trabajo de julio de 1925 Heisenberg señala que la dinámica de un problema
en la vieja mecánica cuántica comprende dos aspectos:
(i) La integración de las ecuaciones de movimiento, ÿ + f (y) = 0.
(ii) La determinación
H de las constantes de movimiento a través de la cuantización
de la variable de acción, p dq = 2παh̄ = 2πI.
La condición (ii) se puede expresar en la forma:
I
X
mẋ dx = 2πm
xn (I) x−n (I) n2 ω(I) = 2πI
(12.53)
n
siendo xn los coeficientes de Fourier de x. Como x es real, x−n = x⋆n .
Una forma más compacta de la condición (ii) es entonces:
m
X
n
n
∂ nω(I) |xn (I)|2 = 1
∂I
(12.54)
llamada en la vieja mecánica cuántica regla de suma de Kuhn-Thomas. La generalización
a varios grados de libertad es inmediata:
X
∂ m
(12.55)
~n ·
~n · ~ω (I) |x~n (I)|2 = 1
∂ I~
~
n
La matriz de la forma (12.6) asociada con x es:
xα~ ,~α′ = xα~ −~α′ (~
α ∆I)
(12.56)
Entonces (12.55) se puede escribir como:
i
X
∂ h
(~
α − α~′ ) · ω
~ (I) |xα~ ,~α′ (I)|2 = 1
(~
α−α
~ ′) ·
m
∂ I~
′
(12.57)
Usando una expresión análoga a (12.41) podemos escribir también:
X
2m
(~
α−α
~ ′ ).~ω (~
α ∆I) |xα~ ,~α′ |2 = ∆I
(12.58)
α
~
α
~′
Notemos que la regla de suma de Thomas-Kuhn no es otra cosa que el corchete
de Poisson de x y p. De la relación general (12.43), y del hecho de ser x y p variables
canónicamente conjugadas, se sigue que:
X
(xβ,~
(12.59)
~ α pα
~ ′ − pβ,~
~ α xα
~ ′ ) = i ∆I δβ,
~β
~′
~ ,β
~ ,β
α
~
Teniendo en cuenta que:
~ ·ω
pα~ β~ = mi(~
α − β)
~ α~ xα~ ,β~ ′
Las ecuaciones (12.59) y (12.60) nos dan, para β~ = β~ ′ , la relación (12.58).
(12.60)
Corespondencia con la mecánica cuántica de Heisenberg / 559
Entonces según Heisenberg, la ecuación de movimiento ÿ + f (y) = 0 y la condición
sobre el conmutador de x y p dan lugar a un sistema de ecuaciones que determina
unı́vocamente las componentes de la matriz de x y los valores de energı́a del sistema.
Las fórmulas que hemos obtenido son idénticas a las de Heisenberg, reemplazando a ∆I
por h̄.
¿En dónde están entonces las diferencias de fondo entre las mecánicas cuántica y
clásica?:
(i) En la identificación de las matrices fα~ ,β~ con transiciones entre los estados cuánticos
~
caracterizados por α
~ y β.
(ii) En señalar que ∆I no puede ser arbitrariamente pequeño sino que toma el valor h̄,
o sea que I~ está necesariamente cuantizada.
(iii) En reemplazar a (~
α−α
~ ′) · ~
ω (~
α ∆I) ≈ (~
α−α
~ ′ ) · ~ω (~
α′ ∆I) por la frecuencia de Bohr
ωα~ ,~α′ = (Eα~ − Eα~ ′ )/h̄ asociada a la transición entre los estados cuantizados caracterizados por α
~ yα
~ ′ . Esto equivaldrı́a a asociar al “estado clásico α
~ ” la energı́a Eα~ = ∆I α
~ ·ω
~
de modo que (Eα~ − Eα~ ′ )/∆I = (~
α−α
~ ′ ) · ~ω serı́a un armónico. Esta asociación es acorde
con la regla de combinación de frecuencias de Bohr, pero no predice las energı́as correctas, pues, por ejemplo, para un oscilador armónico deberı́an ser Eα = ∆I (α + 1/2)ω;
por esto Heisenberg propuso no asumir a priori una expresión para las ωα~ ,~α′ , sino más
bien obtenerlas como un resultado.
(iv) En señalar que debe existir un estado base del cual no puede salir el sistema emitiendo radiación; xα0 ,α0 −1 = 0 si α0 caracteriza el estado base. Con sólo estas cuatro
condiciones el formalismo clásico desarrollado en este capı́tulo da lugar al formalismo de
la mecánica cuántica según Heisenberg. Las reflexiones acerca del álgebra de operadores
no conmutativos caben perfectamente dentro del esquema clásico.
Ejemplo 12.3.1 Resolver el oscilador armónico lineal en la mecánica cuántica de Heisenberg.5
La ecuación de movimiento ẍ + ω02 x = 0 conduce a una solución para los elementos
de la matriz de x de la forma:
xα,β cos(ωα,β t)
(12.61)
donde los elementos de la matriz x̃ y las frecuencias ωα,β son cantidades a determinar.
La condición adicional (12.58) nos da:
X
2m
(12.62)
ωα,α′ |xα,α′ |2 = h̄
α′
La ecuación de movimiento nos da:
2
(ωα,β
− ω02 ) xα,β = 0
(12.63)
ωα,β están asociadas a las transiciones α → β:
h̄ωα,β = Eα − Eβ
5 Véase,
van der Waerden, Op. cit.
(12.64)
560 / Mecánica clásica avanzada
siendo Eα y Eβ las energı́as de los estados α y β. Esta ecuación nos dice que para cada
α debe existir al menos un β ′ para el cual xα,β ′ 6=0 . Para este β ′ , (12.63) nos dice que
necesariamente:
(Eα − Eβ ′ )2 = h̄2 ω02
(12.65)
Esta es una ecuación cuadrática en Eβ ′ , con las soluciones:
Eβ ′ = Eα ± h̄ω0
(12.66)
lo cual nos indica que hay dos β ′ para los cuales xα,β ′ 6= 0, que llamaremos β ′ y β ′′ .
Para éstos dos β ′ las frecuencias satisfacen la relación:
(12.67)
ωα,β ′ = −ωα,β ′′
Entonces (12.62) nos dice que:
2mωα,β ′ |xα,β ′ |2 − |xα,β ′′ |2 = h̄
(12.68)
Los elementos de la matriz energı́a son:
Hα,β
=
=
(p2 )α,β
mω02 (x2 )α,β
+
2m
2
X pα,β ′ pβ,β ′
ω02 mxα,β ′ xβ ′ ,β
+
2m
2
′
(12.69)
β
De (12.60) se sigue que:
X
xα,β ′ xβ ′ ,β
Hα,β =
m ω02 − ωα,β ′ ωβ ′ ,β
2
′
(12.70)
En particular para α = β tenemos:
Hα,α = mω02 |xα,β ′ |2 + |xα,β ′′ |2
(12.71)
β
Hay dos posibilidades, que β ′′ exista o que no exista. Si β ′′ no existe y ωβ ′ ,α = ω0 ,
de (12.68) se sigue que:
2mω0 |xα,β ′ |2 = h̄
(12.72)
y de (12.71) se sigue que:
Eα = Hα,α = mω02 |xα,β ′ |2 =
h̄ω0
2
(12.73)
Como Eα 6= Eβ si α 6= β, se sigue que hay a lo sumo un ı́ndice α = α0 para
el cual se cumple (12.73). Si tal α0 existe, podemos formar la secuencia de números
α0 , α1 , α2 , ...αk , αk+1 , ... tales que α′k = αk+1 y α′′k = αk−1 . Estos números describen
los estados para los cuales Ek+1 > Ek . Claramente, α′0 = α1 y α′′0 no existe. De (12.30)
podemos adelantar que αk+1 = αk + 1. Para k > 0, (12.71) y (12.68) nos dan:
(12.74)
Hαk ,αk = mω02 |xαk ,αk+1 |2 + |xαk ,αk−1 |2
Corespondencia con la mecánica cuántica de Heisenberg / 561
h̄ = 2mω0 |xαk ,αk+1 |2 − |xαk ,αk−1 |2
(12.75)
La ecuación (12.75) es una fórmula de recurrencia que permite a partir de |xα0 ,α1 |2
obtener cualquier |xαk ,αk+1 |2 . Ası́ que, al usar |xα0 ,α1 |2 = h̄/(2mω0 ) y |xα0 ,α−1 |2 = 0:
|xαk ,αk+1 |2 =
h̄(k + 1)
2mω0
(12.76)
También esto nos permite identificar la secuencia α0 , α1 , α2 , ... con los números
enteros 0, 1, 2, ... Entonces la relación de recurrencia nos dice que:
|xk,k+1 |2 =
h̄(k + 1)
;
2mω0
|xk,k−1 |2 =
h̄k
2mω0
Por tanto (12.74) nos da, en vez del resultado clásico (12.32):
1
Ek = h̄ω0 k +
2
(12.77)
(12.78)
Como puede verse, lo especı́fico del tratamiento cuántico de este problema estriba
en: (i) Tomar a ∆I como h̄. (ii) Tomar en vez de (α − α′ )ω0 a ωα,α′ = (Eα − Eα′ )/h̄.
(iii) Suponer la existencia de un estado base.
12.4.
Ecuación de Hamilton-Jacobi y diagonalización
de la matriz hamiltoniana
Para un sistema múltiplemente periódico la matriz hamiltoniana clásica puede obtenerse de los coeficientes de Fourier de la función hamiltoniana H(q, p). La ecuación de
Hamilton-Jacobi (sección 9.6), se caracteriza por definir la función de Hamilton caracterı́stica mediante la cual se realiza la transformación canónica que lleva a unas nuevas
veriables, donde todas las coordenadas son cı́clicas, esto es:
α ∆I) δα~ ,β~
H(q, p) = H(I) ⇒ H α~ ,β~ = H(~
(12.79)
como en la ecuación (12.32).
Entonces la transformación canónica buscada diagonaliza la matriz hamiltoniana,
cuyos elementos son Hα~ −β~ (~
α ∆I) = Hα~ ,β~ . Las cantidades H(~
α ∆I), donde α
~ recorre
todos los vectores l-dimensionales de componentes enteras, son los valores propios de la
matriz infinita Hα~ ,β~ , que se obtiene resolviendo la ecuación secular (12.27). Los vectores
propios de la matriz hamiltoniana son las cantidades gα~ ,~α′ , que según (12.11) realizan
la transformación de las variables angulares ϕν a las ϕν . O sea que las gα~ ,~α′ definen la
función de Hamilton caracterı́stica de la transformación canónica, para el tipo F3 , dada
por:
ϕ
~ =−
∂
Σ(I, ϕ) ;
∂ I~
Como gα~ ,~α′ (I) es:
gα~ ,~α′ (I) =
1
(2π)l
I
~I = − ∂ Σ(I, ϕ)
∂ ~ϕ
′
~
~ α ·ϕ l ~
dϕ
e−i~α.ϕ+i~
(12.80)
(12.81)
562 / Mecánica clásica avanzada
de (12.80) se sigue que:
gα~ ,~α′ (I) =
1
(2π)l
I
∂
′
~
ei~α· ∂ I~ Σ(I,ϕ)+i~α ·ϕ dl ~ϕ
Además, la fórmula inversa es:
#
"
X
∂Σ
ϕ
−i~
α′ ·~
i~
α·
= ln
gα~ ,~α′ e
∂ I~
α
~′
(12.82)
(12.83)
Estas fórmulas muestran la conexión entre las transformaciones canónicas y las
matrices unitarias que realizan los cambios de representación de las matrices clásicas,
con clara correspondencia con la mecánica cuántica.
Ejemplo 12.4.1 Estudiar la diagonalización de la matriz hamiltoniana de un oscilador
armónico sometido a una fuerza constante.
Fı́sicamente el problema es muy simple porque el único efecto de la fuerza constante
es cambiar la posición de equilibrio y desplazar el valor de la energı́a sin alterar la
frecuencia de las oscilaciones. Sin embargo es ilustrativo de la conexión entre la solución
de la ecuación de Hamilton-Jacobi y la diagonalización de la matriz hamiltoniana.
Si H0 es el hamiltoniano del oscilador no perturbado, el hamiltoniano de este
problema será:
H = H0 + λx
y en las variables acción-ángulo de H0 toma la forma:
1/2
2I
sen ϕ
H = Iω + λ
mω
(12.84)
(12.85)
Queremos pasar a las variables acción-ángulo I − ϕ del hamiltoniano H mediante
una transformación canónica. La ecuación de Hamilton-Jacobi del problema es, según
las fórmulas (9.286):
1/2
2I
∂Σ
Iω − λ
−E
(12.86)
sen
mω
∂I
Entonces:
ϕ=−
mω 1/2 −1
∂Σ
λ (E − Iω)
= sen−1
∂I
2I
Si llamamos A = λ21/2 /(mω)1/2 , y notamos que:
2
2
A
∂Σ
A
E(I) = Iω −
= −ω
−
2ω
∂ϕ
2ω
entonces la ecuación de Hamilton-Jacobi para Σ es:
2
ωI 1/2
∂Σ
A
∂Σ
=
I −1/2
+ ωI −1/2
+
sen
∂I
A
∂ϕ
2ω
(12.87)
(12.88)
(12.89)
Corespondencia con la mecánica cuántica de Heisenberg / 563
Esta ecuación resulta complicada, razón por la cual desistiremos de la función
generatriz del tipo F3 .
Notemos que la función generatriz del tipo F3 para la transformación inversa se
obtiene cambiando en −F3 las variables I, ϕ por I, ϕ (ver sección 9.5). Entonces las
fórmulas para la transformación inversa son:
ϕ=
∂F3 (I, ϕ)
;
∂I
I=
∂F3
∂ϕ
(12.90)
que coinciden con las fórmulas de la transformación original mediante una función generatriz del tipo F2 .
F2 es solución a la ecuación:
1/2
∂F2
∂F2
ω
sen ϕ − E(I) = 0
(12.91)
+A
∂ϕ
∂ϕ
o sea:
1/2
2
∂F2
Eω
E
A2
A
2
2
I=
sen
ϕ
sen
ϕ
+
4
sen
ϕ
+
(12.92)
=
−
∂ϕ
2ω 2
ω
ω
A2
Notemos que:
sen ϕ
1
1
∂ ∂Σ
·
= −
∂ϕ ∂E
ω ω (1 + 2mEω 2 λ−2 − cos2 ϕ)1/2
(12.93)
y en consecuencia:
"
−1/2 #
2mEω 2
ϕ
1
∂Σ2
−1
cos ϕ 1 +
= + sen
∂E
ω ω
λ2
H
De la expresión para I, 2πI = I dϕ se deduce que:
E = Iω −
λ2
2mω 2
(12.94)
(12.95)
de donde ω −1 dE/dI = 1, y, según (12.82) y (12.94), la matriz asociada a esta transformación, que es la inversa de gα,β , es:
I
′
−1
1
ei(α−α )ϕ−iα sen (cos ϕ/C) dϕ
(12.96)
Γα,α′ =
2π
donde C = (1 + 2mEω 2 /λ2 )1/2 .
Notemos que:
e−iα sen
−1
x
= e−iαπ/2 [−iUα (x) + Tα (x)]
(12.97)
donde T y U son polinomios de Chevishev de primera y segunda clase respectivamente.
En consecuencia:
I
cos ϕ ′
1
Γα,α′ =
ei(α −α) ϕ−i απ/2 Tα
dϕ
2π
C
(12.98)
I
cos ϕ ′
1
dϕ
ei(α −α) ϕ−i(α+1)π/2 Uα
+
2π
C
564 / Mecánica clásica avanzada
No es simple hallar una expresión general para la transformada de Fourier de
Tα (cos ϕ/C) y de Uα (cos ϕ/C). Aun conociendo la forma analı́tica de Γα,β , resulta difı́cil
obtener una expresión cerrada para las sumatorias infinitas en (12.12). Por esto lo más
cómodo es realizar los cálculos en forma numérica. En este caso es necesario truncar
las matrices para hacerlas finitas y proceder a realizar las integraciones mediante un
algoritmo como el de Gauss. Una vez obtenida la matriz Γ el proceso de diagonalización
es simple.
Como puede verse, el método para obtener la matriz gα~ ,β~ a partir de la ecuación de
Hamilton-Jacobi puede ser útil en problemas cuánticos realistas en que sea especialmente
difı́cil diagonalizar directamente la matriz hamiltoniana.
12.5.
Teorı́a de perturbaciones con matrices clásicas
Veremos que las fórmulas de la teorı́a clásica de perturbaciones, de primero y segundo orden, pueden escribirse en forma análoga a las correspondientes fórmulas de la
mecánica cuántica para las correcciones a la energı́a.
Perturbaciones de primer orden. Para el caso no degenerado la corrección de
primer orden a la energı́a está dada por la fórmula (11.27):
H (1) (I) = hH1 (ϕ0 , I)i
(12.99)
Si la función H1 se expresa como una serie de Fourier, la corrección de primer
orden está determinada por los elementos diagonales de la matriz correspondiente:
H (1) (~
α ∆I) = H1 α~ ,~α
(12.100)
que corresponde en mecánica cuántica con h~
α|H1 |~
αi.
Para el caso degenerado, antes de hallar la corrección de primer orden, es necesario
encontrar las variables acción-ángulo “correctas” o “estabilizadas” en la aproximación
cero. Para ello es necesario buscar entre los posibles conjuntos de variables acción-ángulo degeneradas Iσ0 − ϕ0σ de orden cero, aquel con el cual la perturbación no depende de
las variables angulares. A su vez esto se consigue resolviendo la ecuación de HamiltonJacobi (11.110). En términos de matrices esto se logra diagonalizando la matriz formada
con los coeficientes de Fourier de la perturbación respecto a las variables degeneradas.
Simultáneamente se hallan los valores propios perturbados al primer orden y la transformación canónica que lleva a las variables “correctas” de orden cero, mediante la fórmula:
h
i
(1)
det H1 ~σ,σ~′ − H~σ δ~σ ,~σ′ = 0
(12.101)
donde ~σ y ~σ ′ son vectores de l − s componentes enteras, y:
XX
(1)
g~σ+,~σ′ H~σ′ ,~σ′′ g~σ′′ ,~τ = H~σ δ~σ ,~τ
~
σ′
(12.102)
~
σ′′
En mecánica cuántica, la matriz que diagonaliza la perturbación proporciona los
coeficientes con los cuales se forman las funciones de onda exactas de la aproximación
cero como combinaciones lineales de las funciones de onda degeneradas. Ver la sección
Corespondencia con la mecánica cuántica de Heisenberg / 565
§39 del libro de mecánica cuántica de Landau-Lifshitz, Op. cit.
Perturbaciones de segundo orden. Según la fórmula (11.40), la corrección de
segundo orden a la energı́a está dada por:
H (2) (~
α ∆I) = −
|Aα~ ,β~ |2
1X
~ · ∂
(~
α − β)
~ · ~ω
2
∂ I~ (~
α − β)
~
(12.103)
β6=α
~
donde Aα~ ,β~ está dada por el coeficiente de Fourier de la expansión de H1 en las variables
acción-ángulo no perturbadas. Tanto ω
~ como A ~ tienen como argumento a I~ = α
~ ∆I.
α
~ ,β
Como en (12.41), podemos escribir:
|Aα~ ,β~ |2
∆I
~ · ∂
(~
α − β)
=
~ ·ω
2
∂ I~ (~
α − β)
~
|Aα~ ,β~ |2
~ · ~ω
(~
α − β)
α
~ ∆I
−
|Aα~ ,β~ |2
~ · ~ω
(~
α − β)
(12.104)
~ ∆I/2
(~
α+β)
~−α
El primer término de (12.104) cambia de signo al cambiar a α
~ − β~ por β
~ . Por
tanto en la sumatoria (12.103) las contribuciones provenientes del primer término de
(12.104) se cancelan. En el denominador del segundo término de (12.104), ~ω está evaluada
~ ∆I/2. Si reemplazamos al denominador de la siguiente manera:
en (~
α + β)
"
#
~ ∆I
(~
α
+
β)
~ ·~
~ · ~ω (β
~ ∆I)
(~
α − β)
ω
→α
~ · ~ω(~
α ∆I) − β
(12.105)
2
~ ∆I|2 en la expresión para H (2) , con lo cual
cometemos un error del orden de |(~
α − β)
llegamos a la fórmula:
H (2) (~
α ∆I) =
X
~ =α
β6
~
|Aα~ ,β~ |2
~ ∆I)
∆I α
~ ·ω
~ (~
α ∆I) − ∆I β~ · ~ω(β
(12.106)
Si llamamos:
α
~ ∆I · ~
ω (~
α ∆I) = Eα~ ′
(12.107)
~ ∆I|2 como:
La ecuación (12.103) puede escribirse con un error del orden de |(~
α − β)
H (2) (~
α ∆I) =
X |Aα~ ,β~ |2
′
~
β
Eα~ − Eβ~
(12.108)
que coincide formalmente con la fórmula cuántica de la teorı́a de perturbaciones de
segundo orden.
566 / Mecánica clásica avanzada
13
Correspondencia con la mecánica cuántica
de Schrödinger
Este capı́tulo trata de mostrar la conexión de los trabajos de Hamilton y Jacobi
con la formulación de Schrödinger de la mecánica cuántica. Se hará énfasis en la relación
existente entre la acción principal de Hamilton y la fase de la función de onda, y entre
las soluciones de la ecuación de Liouville y la amplitud de la función de onda.
Al pasar de la mecánica clásica a la formulación de Schrödinger son necesarios
cambios conceptuales más drásticos respecto a la formulación de Heisenberg, pues se
requiere postular la existencia de comportamientos ondulatorios.
También presentaremos algunos desarrollos modernos de las ideas de Einstein,
Bohr y Sommerfeld acerca de la cuantización de un sistema clásico, debidos a Brillouin,
Maslov y Keller. Finalmente obtendremos las fórmulas de la aproximación de W.K.B.
13.1.
Ideas de Hamilton acerca de las transformaciones canónicas
Hamilton presentó en 1824 un trabajo a la Academia Irlandesa de Ciencias acerca
de la conexión entre la dinámica y la óptica. Desde el punto de vista moderno, tal
formalismo presenta una conexión entre la dinámica y el lı́mite clásico de la mecánica
ondulatoria, y no es aplicable a la óptica por las dificultades resultantes de ser cero la
masa del fotón.
Según el principio de Fermat las ecuaciones paramétricas de la trayectoria de un
rayo de luz, x(l), y(l), z(l), son tales que la siguiente integral es una extremal:
Z
n(~r(l)) dl
(13.1)
siendo n el ı́ndice de refracción del medio en el punto ~r. El principio de mı́nima acción
aplicado a una partı́cula sometida a un potencial V , ecuación (9.49), expresa que:
Z
[E − V (~r)]1/2 dl
(13.2)
567
568 / Mecánica clásica avanzada
tiene un valor estacionario para la trayectoria real. En los dos casos se deben tomar variaciones “∆”. La trayectoria de una partı́cula y la de un rayo de luz coinciden haciendo:
n(~r) = A [E − V (~r)]1/2
(13.3)
En un medio inhomogéneo y anisotrópico n depende no sólo de la posición sino de
la dirección de los rayos, esto es, de ~r y ~r˙ .
Lo anterior permitirı́a asociar propiedades corpusculares a la luz. Hamilton se propuso elaborar esta conexión dentro de un modelo ondulatorio de la luz teniendo en cuenta
que la relación (13.3) es válida independientemente del modelo usado. Es natural partir
del concepto de “frente de ondas”, introducido por Huygens en 1690. Cada punto ~r de
un frente de ondas en el tiempo t genera una onda secundaria que alcanzará otro punto
~r ′ del frente de ondas en un tiempo posterior t′ . El tiempo empleado por la luz en ir de
~r a ~r ′ dependerá solamente de ~r y ~r ′ . El lugar geométrico de los puntos alcanzados por
la luz en el tiempo t′ es una superficie de ondas secundarias, definida por una función
Σ(~r, ~r ′ ), donde ~r hace de parámetro, mediante la fórmula:
Σ(~r, ~r ′ ) = t − t′
(13.4)
Σ describe el camino óptico entre ~r y ~r ′ y fue llamada por Hamilton función caracterı́stica del medio. Según el principio de Huygens, la envolvente de las ondas secundarias
en el tiempo t′ es el frente S ′ que se ha propagado en el espacio, como se ilustra en la
figura 13.1.
α′′
α′
α
r′
N
r″
T
Σ′
r
Σ
S″
S′
S
Figura 13.1 Propagación en el espacio de la envolvente S
Denotemos por α
~ = (α1 , α2 , α3 ) a los cosenos directores de la normal a S en el
punto ~r y por α
~ ′ a los cosenos directores de la normal a S ′ en el punto ~r ′ . Decimos que
~r ′ corresponde con ~r si la onda secundaria que emerge de ~r toca a la envolvente S ′ en
~r ′ . La lı́nea descrita por los vectores α
~, α
~ ′, α
~ ′′ , ..., que llamamos N , es ortogonal a los
Corespondencia con la mecánica cuántica de Schrödinger / 569
frentes de onda. Como S ′ es la envolvente de las superficies Σ correspondientes a los
puntos de S, las superficies Σ también son ortogonales a la lı́nea N en los puntos ~r, ~r ′ ,
~r ′′ , ...
Si denotamos por d~r ′ a un vector tangente a la superficie S ′ en ~r ′ , se cumple que:
∂Σ(~r, ~r ′ )
· d~r ′ = 0
∂~r ′
(13.5)
Como α
~ ′ son los cosenos directores de N en el punto ~r ′ , también serán ortogonales
a d~r . Se sigue entonces que:
∂Σ(~r, ~r ′ )
′ ′
· d~r ′ = 0
(13.6)
−
λ
α
~
∂~r ′
′
donde λ′ es cierta función de ~r ′ . La ecuación (13.6) implica que:
1 ∂Σ
1 ∂Σ
1 ∂Σ
= ′
= ′
α′1 ∂x′
α2 ∂y ′
α3 ∂z ′
(13.7)
Similarmente, en el punto ~r se debe cumplir:
1 ∂Σ
1 ∂Σ
1 ∂Σ
=
=
α1 ∂x
α2 ∂y
α3 ∂z
(13.8)
Además:
α′1 2 + α′2 2 + α′3 2 = 1
(13.9)
Las ecuaciones (13.4) y (13.7) a (13.9) permiten expresar las seis cantidades (x′ ,
y , z , α′1 , α′2 , α′3 ) en términos de (x, y, z, α1 , α2 , α3 ).
Entonces, dada una función caracterı́stica del medio Σ, las seis ecuaciones (13.4)
y (13.7) a (13.9) describen unı́vocamente la lı́nea de las normales N en el medio óptico
anisotrópico. Es necesario aclarar que la lı́nea N no necesariamente coincide con la lı́nea
T de un rayo luminoso que pasa por ~r; esta coincidencia ocurre solamente en un medio
óptico isotrópico, en el cual los vectores ~r˙ , ~r˙ ′ , ~r˙ ′′ , ... son respectivamente paralelos a los
vectores α
~, α
~ ′, α
~ ′′ , ...
La función Σ determina una transformación en el espacio que cambia cualquier
superficie S en una nueva S ′ . Si dos superficies Σ y S ′ se tocan en un punto ~r ′ , entonces
las correspondientes superficies transformadas Σ′ y S ′′ se tocan en un punto ~r ′′ correspondiente a ~r ′ . Sophus Lie por esta razón llama a las transformaciones (~r, α
~ ) → (~r ′ , α
~ ′)
1
transformaciones de contacto. Entonces cada función Σ define una transformación de
contacto, que transforma un frente de ondas S en el frente de ondas S ′ envolvente de
todas las ondas secundarias emergentes de S, en el intervalo de tiempo t′ − t. De (13.7)
y (13.8) se sigue que:
′
′
∂Σ(~r, ~r ′ )
= λ~
α;
∂~r
1 En
∂Σ(~r, ~r ′ )
= λ′ α
~′
∂~r ′
(13.10)
dinámica hamiltoniana se usa el nombre de transformaciones canónicas para designar a estas
transformaciones.
570 / Mecánica clásica avanzada
Entonces bajo desplazamientos arbitrarios d~r y d~r ′ , Σ cambia de valor en:
dΣ = λ~
α · d~r + λ′ α
~ ′ · d~r ′
(13.11)
De acuerdo con (13.4), dΣ = dt′ − dt. Si tomamos el punto ~r fijo y consideramos
dos frentes de onda próximos, en los puntos ~r ′ y ~r ′ + d~r ′ , entonces dt′ será la diferencia
de tiempo entre esos frentes de onda, dada por:
dt′ =
dl′ ′
n
c
(13.12)
donde c es la velocidad de la luz en el vacı́o, dl′ la distancia normal entre los dos frentes
de onda finales y n′ es el ı́ndice de refracción del medio en el punto ~r ′ en la dirección α′
normal a S ′ .
De (13.11) y (13.12) se sigue entonces:
dl′ ′
n = λ′ α
~ ′ · d~r ′
c
(13.13)
Como para el desplazamiento de ~r ′ que consideramos se cumple que d~r ′ = α
~ ′ dl′ ,
′
′
′
podemos escribir dl = α
~ .d~r . Obtenemos entonces el resultado:
λ′ =
n′
;
c
λ=−
n
c
(13.14)
donde la segunda expresión se sigue de argumentos similares, tomando a ~r ′ fijo y variando
el punto inicial ~r. En conclusión:
dΣ =
n
n′ ′
α
~ · d~r ′ − α
~ · d~r
c
c
(13.15)
donde n′ y n son funciones respectivamente de (~r ′ , α
~ ′ ) y (~r, α
~ ), o equivalentemente de
(~r ′ , ~r˙ ′ ) y (~r, ~r˙ ), porque debe existir una relación definida entre α
~ y ~r˙ , y α
~ ′ y ~r˙ ′ .
También dΣ puede escribirse como:
dΣ = ~
p ′ · d~r ′ − p~ · d~r
(13.16)
los vectores ~
p y p~ ′ tienen dimensiones de T L−1 y su magnitud es menor en los puntos
donde la velocidad de la luz es mayor y viceversa.
Si tomamos ahora los tiempos t y t′ infinitesimalmente próximos, también lo serán
los puntos ~r y ~r ′ , lo mismo que α
~ yα
~ ′ , y n y n′ . Decimos en este caso que la transformación de contacto es infinitesimal:
~r ′ = ~r + ~r˙ ∆t ;
~ ′ = p~ + ~p˙ ∆t
p
(13.17)
Como Σ(~r, ~r) = 0, también se cumple que, al orden más bajo en ∆t:
Σ(~r, ~r ′ ) =
∂Σ(~r, ~r ′ )
∂~r ′
~
r ′ =~
r
· ~r˙ ∆t
(13.18)
Definimos la función M (~r, ~r ′ ) como:
M (~r, ~r˙ ) =
∂Σ(~r, ~r ′ ) ˙
· ~r
∂~r ′
~
r ′ =~
r
= ~p · ~r˙
(13.19)
Corespondencia con la mecánica cuántica de Schrödinger / 571
Entonces se sigue que:
∂M (~r, ~r˙ )
∂Σ(~r, ~r ′ )
=
∂~r ′
∂~r˙
= ~p
(13.20)
~
r ′ =~
r
Según (13.18) y (13.19), cuando ~r y ~r ′ son infinitesimalmente cercanos:
Σ(~r, ~r ′ ) = M (~r, ~r˙ ) ∆t
(13.21)
Por tanto, para una separación finita entre ~r y ~r ′ se cumple:
Z ~r ′
Z t′
′
˙
~p · d~r
M (~r, ~r) dt =
Σ(~r, ~r ) =
(13.22)
~
r
t
La longitud del camino óptico entre ~r y ~r ′ también puede escribirse, usando (13.15)
y (13.16), como:
Z ~r ′
Z ′
n
1 ~r
′
Σ(~r, ~r ) =
α
~ · d~r =
n dl
(13.23)
c
c ~r
~
r
Entonces, el principio de Fermat, (13.1), equivale a la condición de que Σ sea una
extremal. La condición ∆Σ = 0 determina la forma de la lı́nea de los rayos T de la figura
13.1.
Comparando a (13.23) con (13.2) vemos que M es proporcional a la energı́a cinética
del problema mecánico equivalente.
La transformación de contacto (13.10), cuya función generatriz es Σ, puede expresarse como una transformación canónica libre de primera clase:
p~ = −
∂Σ(~r, ~r ′ )
;
∂~r
~′ =
p
∂Σ(~r, ~r ′ )
∂~r ′
(13.24)
donde (~r ′ , p~ ′ ) son las “viejas” variables canónicas y (~r, p~) las “nuevas”.
Comparando con los resultados de la sección 9.3, fórmula (9.44), encontramos que
Σ coincide formalmente con la acción de Lagrange y M con ~p · ~q. Sin embargo hay una
discrepancia dimensional a través de un factor constante B con dimensiones de energı́a.
O sea que BΣ es la acción de Lagrange y B~
p es el momento mecánico.
La acción de Lagrange BΣ obedece la ecuación de Hamilton-Jacobi independiente
del tiempo, que para una partı́cula de masa m en un potencial V es:
2
∂Σ
V
E
1
+ 2 = 2
(13.25)
2m ∂~r
B
B
Usando la conexión dada por (13.3), podemos escribir a (13.25) como:
2
∂Σ
2m
1
= 2 2 n2 = 2 n2
∂~r
A B
c
(13.26)
donde c es una constante con dimensiones de velocidad:
c=
AB
(2m)1/2
(13.27)
572 / Mecánica clásica avanzada
Formalmente (13.26) es la ecuación de la eiconal de la óptica,2 que permite encontrar a Σ si se conocen las propiedades ópticas del medio expresadas a través de n.
Nótese que la relación (13.27) aparentemente no permite el concepto de fotón entendido como una partı́cula de masa cero. Sin embargo el formalismo resulta perfectamente
adaptado a la descripción de propiedades ondulatorias de partı́culas de masa diferente
de cero.
Podemos concluir que a la acción de Lagrange de un sistema mecánico se le puede
asociar la onda secundaria emergente de un punto en cierto movimiento de propagación
de ondas. Este resultado sirvió a Schrödinger para hallar la conexión entre la mecánica
y la óptica clásicas por una parte, y la mecánica ondulatoria (mecánica cuántica) por
otra. Sin embargo, la ecuación de la eiconal (13.26) no coincide con la ecuación de ondas
más que en el lı́mite asintótico de pequeñas longitudes de onda, en el cual la óptica
ondulatoria coincide con la óptica geométrica.
Frecuencia y vector de propagación. Para una onda plana monocromática la
amplitud tiene la forma:
~
C = aei(k·~r−ωt+α)
(13.28)
y para una onda arbitraria:
C = aeiϕ
(13.29)
donde ϕ es la eiconal que obedece la ecuación (13.26) sólo en el lı́mite de ondas cortas.
Desarrollando a ϕ en potencias de ~r y t, para ~r y t pequeños se obtiene:
ϕ=α+t
∂ϕ
∂ϕ
+ ~r ·
∂t
∂~r
(13.30)
Como es de esperarse, el frente de ondas emergente de un punto es en las cercanı́as
del mismo casi plano, con:
~k = ∂ϕ ;
∂~r
ω=−
∂ϕ
∂t
(13.31)
Por otra parte, expandiendo a S cerca a ~r = 0 obtenemos:
S = −Et + BΣ ≈ −Et + B~r ·
∂Σ
= −Et + B~r · p~
∂~r
(13.32)
Si admitimos que S = Dϕ, donde D es otra constante, encontramos que p~ es
proporcional a ~k y E proporcional a ω:
E = Dω ;
p
~=
D~
k
B
(13.33)
La función M , según (13.19) puede escribirse como:
n(~r, α
~)
M (~r, ~r˙ ) =
α
~ · ~r˙
c
2 Eiconal
viene del griego, icono = imagen. La función eiconal permite localizar imágenes.
(13.34)
Corespondencia con la mecánica cuántica de Schrödinger / 573
y se denomina la indicatriz del medio óptico en el punto ~r. La velocidad del frente de
ondas en el punto ~r en la dirección α
~ tiene magnitud v(~r, α
~ ) = c/n(~r, α
~ ). Por tanto:
α
~ · ~r˙
M (~r, ~r˙ ) =
;
v(~r, α
~)
p~ =
α
~
~v (~r, α
~)
=
v(~r, α
~)
v(~r, α
~ )2
(13.35)
Por esto el vector p~, que es proporcional a ~k cuando la onda es plana monocromática, se llama el vector de lentitud normal del frente de ondas en el punto ~r en la dirección
α
~.
~ en un punto
Los vectores ~r˙ y ~p. Exploremos la relación entre los vectores ~r y α
dado ~r. Para ello usamos la noción matemática de homotecia, o sea la transformación de
cambio de escala. Si realizamos a la superficie M (~r, ~r˙ ) una transformación de homotecia
con parámetro ǫ respecto a ~r˙ , en un punto ~r, obtenemos:
M (~r, ǫ~r˙ ) = ǫ~
p · ~r˙
(13.36)
al notar que p~ depende de la dirección de ~r pero no de su magnitud.
Por otra parte, consideremos el desplazamiento del frente de ondas S durante un
tiempo infinitesimal ǫ (véase figura 13.2). La onda secundaria que emerge del punto ~r,
en el tiempo ǫ, será, según (13.18):
Σ(~r, ~r ′ ) = p~ · ~r˙ ǫ
(13.37)
Comparando a (13.36) y (13.37) se sigue que Σ y M son iguales al orden de ǫ2 .
Cuando el tiempo entre S(t) y S(t + ǫ) es infinitesimal, la onda secundaria emergente
de ~r que toca a S(t + ǫ) y la indicatriz del medio óptico en ~r son homotéticas. Si ahora
hacemos tender ǫ a cero, obtenemos que en cada punto ~r los vectores α
~ y ~r tienen una
relación bien definida.
La dirección del plano tangente a la indicatriz en ~r˙ se llama conjugada de la
dirección de ~r˙ . O sea que ~r˙ y ~
p son dos vectores conjugados en cada punto ~r. En general
~r˙ no es perpendicular al plano tangente a la indicatriz en ~r˙ . Si el medio es isotrópico, en
cada punto ~r la indicatriz será una superficie esférica; en el caso contrario n dependerá de
~r y ~r˙ , con lo cual Σ y p~ dependerán igualmente de ~r˙ , dando lugar a que M no sea esférica
(véase figura 13.2).
13.2.
Función de distribución de probabilidades
Para una partı́cula, la contraparte cuántica de la proyección de un toroide invariante sobre el espacio tridimensional es |ψ|2 , siendo ψ una función propia de tres operadores
que conmutan (para un problema de fuerzas centrales, por ejemplo, tales operadores pueden ser H, l2 y lz ). La densidad que describe el ensamble de trayectorias sobre el toroide
invariante es ρ, que satisface la ecuación de Liouville (sección 4.8):
∂ρ
+ [ρ, H] = 0
∂t
(13.38)
574 / Mecánica clásica avanzada
T
Punto
de tangencia
r
r
p
Plano tangente
a la indicatriz en r
Σ(r, r ′)
M(r, r ′)
S(t)
S(t + ε)
Figura 13.2 Desplazamiento del frente de ondas S durante un tiempo infinitesimal ǫ.
Como H no depende de las variables angulares, esta ecuación toma la forma,
∂ρ
∂ρ
∂ρ
∂ρ
+ ω2
+ ω3
=0
+ ω1
∂t
∂ϕ1
∂ϕ2
∂ϕ3
(13.39)
Como las ων son las “velocidades” sobre el toroide, esta ecuación tiene la forma de
una ecuación de continuidad para la densidad ρ:
3
∂ρ X ∂
(ων ρ) = 0
+
∂t ν=1 ∂ϕν
(13.40)
Cuando el sistema es estacionario, t no aparece en ρ explı́citamente y por tanto:
3
X
∂
(ων ρ) = 0
∂ϕ
ν
ν=1
(13.41)
Según esta expresión, el flujo de probabilidad sobre el toroide no tiene divergencia.
Por tanto, al aplicar el teorema de Gauss a un tubo de trayectorias:
Z
(~
ω ρ) · d~σ = 0
(13.42)
Como consecuencia, conociendo a ρ en un punto se puede calcular a ρ en cualquier
otro punto de la misma trayectoria:
ρω = ρ0 ω
dσ0
dσ
(13.43)
donde ω = |~
ω |, y dσ0 es el área de cruce normal al tubo de caracterı́sticas en el punto
(~
p0 , ~r0 ). Realmente (13.43) vale en el lı́mite cuando dσ0 tiende a cero, en cuyo caso
Corespondencia con la mecánica cuántica de Schrödinger / 575
dσ/dσ0 denota el jacobiano de la aplicación de los puntos de una sección de cruce en
otra por medio de las trayectorias:
p~0 , ~r0
ρ(~
p, ~r) = ρ(~
p0 , ~r0 ) J
(13.44)
p~, ~r
Una posible solución de (13.41) es una función arbitraria de las variables de acción.
Sin embargo no es la más interesante.
Función de distribución en el espacio de configuración. Si por algún procedimiento se obtiene una ρ particular, entonces la densidad en el espacio de configuración
x − y − z será:
Z
Q(~r) = ρ(~
p, ~r) d3 p~
(13.45)
En el espacio de configuración hay igualmente un flujo de probabilidad, descrito
por la ecuación de continuidad para Q:
∂
∂Q
+
· (~r˙ Q) = 0
∂t
∂~r
(13.46)
donde ~r˙ = ∂H/∂~
p. Cuando Q no depende explı́citamente del tiempo, obedece ecuaciones
análogas a (13.41) y (13.42). La ecuación análoga a (13.43) es:
Qv = Q0 v0
dA0
dA
(13.47)
siendo dA un elemento de área en el espacio ordinario, y v = |~r˙ |. Si se conoce a Q sobre
una superficie dA0 que corta un tubo de trayectorias caracterı́sticas en el espacio de
configuración, (13.47) permite hallar a Q en cualquier otra superficie que corte el mismo
tubo de trayectorias. El formalismo de las variables acción-ángulo permite encontrar la
densidad de probabilidad Q(~r), en una forma alterna a (13.47) que hace más transparente
la conexión con Σ y con la proyección del ensamble de trayectorias en el espacio de fases
sobre el espacio de configuración.
~ ϕ
Como en ~r(I,
~ ) las I~ son constantes, se sigue que las posibles posiciones de la
partı́cula en el espacio de configuración, ~r, están determinadas por las ϕ
~.
Entonces el promedio de una función de ~r sobre el toroide invariante puede expresarse como un promedio sobre el espacio de configuración. En efecto:
I
1
~ ϕ
f (~r(I,
~ )) d3 ϕ
~
(13.48)
hf (~r)i =
(2π)3
~ ϕ
La función ~r(I,
~ ), con I~ = constante, puede interpretarse como un cambio de
coordenadas de ϕ
~ a ~r. Por tanto (13.48) puede escribirse como:
Z
ϕ
~
1
d3~r
(13.49)
f
(~
r
)
J
hf (~r)i =
3
(2π)
~r
576 / Mecánica clásica avanzada
En términos de Q este mismo promedio es:
Z
hf (~r)i = Q(~r) f (~r) d3~r
(13.50)
de donde concluimos que Q es esencialmente el jacobiano de la transformación de ϕ
~ a ~r
con I~ fijo:
−1
ϕ
~
~r
3
(2π) Q(~r) = J
(13.51)
=J
~r
ϕ
~
Podemos igualmente hallar la función de distribución en el espacio de los momentos:
ϕ
~
(13.52)
(2π)3 Qp (~
p) = J
p~
El lugar geométrico de los puntos para los cuales Q = ∞ se denomina “superficie
cáustica”. Para esos puntos, o bien v = 0, o bien las trayectorias se cruzan haciendo
que dA = 0. Si la sección de cruce se convierte un una lı́nea, diremos que m1 = 1 y si
se convierte en un punto, que m1 = 2. El número de veces que un momento canónico
cambie de signo en alguna cáustica lo notaremos m2 . El número m = m1 +m2 determina
la fase de la función de onda semiclásica construida con Q y Σ. La fórmula (13.51)
permite también interpretar las cáusticas como el lugar geométrico de las singularidades
de la aplicación del espacio de fases sobre el espacio de configuración ϕ
~ → ~r. Tales
singularidades se denominan lagrangianas.
Ejemplo 13.2.1 Hallar la función Q para el problema de Kepler en coordenadas esféricas.
En este caso Ir , Iθ e Iϕ son constantes. De las fórmulas que expresan a r, θ y ϕ en
términos de las variables angulares ϕr , ϕθ y ϕϕ , dadas en la sección 10.4, se sigue que:
(2π)3 Q(~r) =
∂ϕr ∂ϕθ ∂ϕϕ
1
r2 sen θ ∂r ∂θ ∂ϕ
(13.53)
De la ecuación (10.192) se sigue:
∂ϕr
I 1
= 2
∂r
a pr
(13.54)
La separación de variables en la ecuación de Hamilton-Jacobi para el problema
conduce a:
~ r, θ, ϕ) = Σr (Ir , Iθ , Iϕ , r) + Σθ (Iθ , Iϕ , θ) + Σϕ (Iϕ , ϕ)
Σ(I,
(13.55)
de donde se sigue:
∂pθ
∂ϕθ
;
=
∂θ
∂Iθ
∂ϕϕ
∂pϕ
=
∂ϕ
∂Iϕ
(13.56)
Como pθ y pϕ están dados por:
p2θ = l2 −
lz2
;
sen2 θ
pϕ = lz
(13.57)
Corespondencia con la mecánica cuántica de Schrödinger / 577
obtenemos:
l
∂ϕθ
;
=
∂θ
pθ
∂ϕϕ
=1
∂ϕ
(13.58)
De donde obtenemos finalmente:
Q(~r) =
mk
1
(1 − ǫ2 )1/2 2
(2π)3 a
r sen θ pr pθ
(13.59)
Esta es la densidad de probabilidad para un ensamble de sistemas con los mismos
valores de E, l, lz , donde cada sistema posee un valor distinto de las ϕν . La región
descrita por Q(~r) se obtiene también a partir de una órbita individual mediante estas tres
operaciones: primero, dejando la órbita fija se toma el conjunto de todas las posiciones
de la partı́cula sobre la misma; segundo, dejando fijo el plano de la órbita, se toma el
conjunto de puntos del plano obtenido al rotar el anterior conjunto alrededor del foco,
obteniéndose ası́ una corona sobre el plano de la órbita; finalmente, se toma el conjunto de
puntos del espacio obtenido al rotar la corona alrededor del eje z. La región ası́ obtenida
resulta ser un elipsoide de revolución con ejes de longitudes rmáx y rmáx cos θmı́n , colocado
con el eje menor sobre el eje z, y que además posee en el centro un agujero elipsoidal con
ejes de longitudes rmı́n y rmı́n cos θmı́n . Q(~r) vale cero fuera del elipsoide y dentro del
agujero, es infinita sobre las superficies de los elipsoides, y en los demás puntos está dada
por (13.59). Nótese que los elipsoides interior y exterior son las superficies cáusticas. La
región que hemos descrito es, para el caso del átomo de hidrógeno, el lı́mite clásico de la
densidad de probabilidad cuántica |ψnlm |2 . Vemos que no presenta los nodos angulares
2
caracterı́sticos de |Ylm |2 , ni los nodos de la densidad de probabilidad radial Rnl
(r).
Además, la densidad de probabilidad cuántica no es cero para r mayor que rmáx ni para
r menor que rmı́n , aunque decae exponencialmente en estas regiones, y tampoco presenta
superficies cáusticas.
Ejemplo 13.2.2 Estudiar la función de distribución en el caso lz = l = 0. Comparar con
la correspondiente densidad cuántica para el átomo de hidrógeno.
En este caso rmı́n = 0, las órbitas son rectilı́neas y la intersección del toroide
invariante con el espacio de configuración es una esfera. Q(r) es cero para r > 2a,
infinito en r = 0 y r = 2a, y en los demás puntos está dada por:
Q(r) =
1
(2π)2 ar(2ar − r2 )1/2
(13.60)
Esta expresión no se obtiene directamente de (13.59) porque para l = 0, pθ no
está definido. En (13.53), ∂ϕθ /∂θ es indeterminada pero hemos asumido que es una
constante que se halla por normalización.
Q(r) es isotrópica y corresponde a los estados s de la mecánica cuántica. Q(r)
diverge en r = 0 y r = 2a, que son los puntos de retorno, y tiene un mı́nimo en
r = 3a/2. El valor medio de r calculado con esta Q es 3a/2 y coincide exactamente con
el valor medio cuántico. Si bien en este caso no se cumplen las condiciones de validez de la
aproximación clásica,3 el problema ilustra la correspondencia entre las dos descripciones.
3 Véase
la sección 49 del libro de Mecánica cuántica de Landau-Lifshitz, Op. cit.
578 / Mecánica clásica avanzada
2
2πϕ21s
1
2πQr
1
2
2
Figura 13.3 Función de distribución 2πQ(r) en el caso lz = l = 0 y densidad cuántica 2πψ1s
para el átomo de hidrógeno
En la figura 13.3, la curva discontinua corresponde a la distribución en mecánica
cuántica para el estado 1s del átomo de hidrógeno, que es exponencial. Las unidades
son atómicas. Como puede verse, la mayor discrepancia se presenta cerca al punto de
retorno r = 0 y a la superficie cáustica r = 2, donde la partı́cula tiene energı́a cinética
muy pequeña, estando por tanto allı́ más expuesta a los efectos de tipo cuántico.
La distribución clásica tiene la forma de una esfera con densidad que varı́a radialmente, de radio 2a, en tanto que la distribución en mecánica cuántica decae exponencialmente y existe para r entre 0 y 2a, ası́ como entre 2a e ∞.
La densidad en el espacio de momentos se halla fácilmente de la relación Qr r2 dr
= Qp p2 dp. En unidades atómicas el resultado es:
Qp (p) =
1
1
2π 2 p2 (1 + p2 )2
(13.61)
El resultado cuántico es:4
ϕ21s (p) =
8
1
π 2 (1 + p2 )4
(13.62)
Ejemplo 13.2.3 Demostrar que la función de distribución Q(r) definida por (13.51) satisface la ecuación de continuidad (13.46).
En este caso Q no depende explı́citamente del tiempo. El jacobiano está dado por:
∂ϕλ ∂ϕσ ∂ϕρ
ϕ
~
= ǫλσρ
(13.63)
J
~r
∂x ∂y ∂z
4 Véase
la sección 36 del libro de Landau-Lifshitz, Op. cit.
Corespondencia con la mecánica cuántica de Schrödinger / 579
donde ǫλσρ es el tensor de Levi-Civita. Por otra parte la velocidad tiene la expresión:
~r˙ =
X ∂~r
ωµ
∂ϕµ
µ
(13.64)
Entonces (convenio de suma):
∂
∂ϕλ ∂ϕµ ∂ϕρ
∂
∂xi
(ẋi J) =
ωµ ǫλσρ
∂xi
∂xi ∂ϕµ
∂x ∂y ∂z
(13.65)
ésta expresión es nula porque:
∂ ∂xi
∂ 2 xi
=
=0
∂xi ∂ϕµ
∂ϕµ ∂xi
(13.66)
∂xi ∂ 2 ϕρ
∂ ∂ϕρ
∂
=
=
δµρ = 0
∂ϕµ ∂xi ∂xi
∂ϕµ ∂xj
∂xi
(13.67)
y,
Ejemplo 13.2.4 Expresar la función de distribución Q(~r) en términos de la acción de
Lagrange Σ.
Recordando que:
ϕν =
~ ~r)
∂Σ(I,
∂Iν
(13.68)
se sigue de (13.63) que:
(2π)3 Q(~r) = ǫλσρ
∂2Σ ∂2Σ ∂2Σ
∂x∂Iλ ∂y∂Iσ ∂z∂Iρ
(13.69)
~ ~r),
Se sigue entonces que a cada solución de la ecuación de Hamilton-Jacobi, Σ(I,
le corresponde una función de distribución. No es necesario resolver por separado la
ecuación de continuidad en el espacio de configuración. En otras palabras, los campos
~ ~r) y Q(I,
~ ~r) no son independientes. En mecánica cuántica esto implicarı́a que la
Σ(I,
función de onda compleja queda determinada simplemente por una función real.
Relación con la teorı́a ergódica y con el teorema K.A.M. Si el sistema
es no degenerado y asumimos que los efectos cuánticos son una perturbación pequeña,
sabemos que los toroides invariantes han de resultar ligeramente distorsionados. Entonces el problema cuántico no difiere esencialmente del clásico. Como las frecuencias son
inconmensurables la trayectoria clásica, cuando t → ∞, llena completamente el toroide
y se cumple que el promedio temporal de una variable dinámica coincide con el promedio
tomado sobre las coordenadas del toroide:
Z
I
1 T
1
lı́m
f (q, p)dt =
f (q, p) dl ϕ
~
(13.70)
T →∞ T 0
(2π)l
Si el sistema es degenerado, las frecuencias son conmensurables. Entonces las trayectorias son periódicas y cubren una región de dimensión menor a la del toroide. El
580 / Mecánica clásica avanzada
teorema K.A.M. dice que en este caso, aun si la perturbación es muy pequeña, los toroides invariantes pueden cambiar drásticamente en su topologı́a; para la mayor parte de las
condiciones iniciales las trayectorias son estocásticas o sea que no están colocadas sobre
regiones de geometrı́a definida en el espacio fásico. Para el problema de fuerzas centrales
en coordenadas esféricas, además de Ir , Iθ e Iϕ hay una constante de movimiento adicional ϕθ − ϕϕ (y en el problema de Kepler además ϕr − ϕθ es constante). Cuando se aplica
una perturbación las constantes que dependen sólo de variables angulares pasan a ser
veriables angulares de frecuencia lenta dando lugar a que la trayectoria no sea cerrada
sino que ocupe toda la región definida por las variables de acción constantes. Entonces
es de esperarse que a causa de los efectos cuánticos, en un sistema degenerado se cumpla
también la igualdad (13.70).
13.3.
La mecánica ondulatoria
Es posible, en la óptica geométrica, describir la propagación de los rayos por medio
del principio de Fermat, ∆Σ = 0, y la propagación de los frentes de ondas por medio de
la ecuación de la eiconal. En óptica fı́sica la luz es una onda electromagnética, y la óptica geométrica es una primera aproximación que describe correctamente la propagación
cuando la longitud de onda es pequeña en comparación con las dimensiones caracterı́sticas de la geometrı́a del problema. Schrödinger encontró que para un sistema mecánico
hay un comportamiento similar. La trayectoria de las partı́culas está determinada por el
principio de mı́nima acción y las soluciones de la ecuación de Hamilton-Jacobi describen
el movimiento de unas superficies de acción constante. La mecánica clásica resulta ser la
aproximación de ondas cortas de una teorı́a más general, llamada mecánica ondulatoria.
Las ondas de materia están determinadas por dos campos en el espacio ordinario, la
~ ~r), que
distribución de probabilidades Q(~r) y las superficies de acción constante Σ(I,
5
corresponden a la amplitud y la fase de la onda. Según el ejemplo 13.2.4, Σ determina
a Q. Schrödinger encontró la ecuación diferencial que obedecen las ondas de materia.
Propagación de las superficies de acción constante. Las funciones de Hamilton S y Σ están relacionadas por:
~ t) = Σ(~r, C)
~ − Et
S(~r, C,
(13.71)
~ es un conjunto de constantes de movimiento. Las superficies Σ = constante perdonde C
manecen fijas en el espacio de configuración, en tanto que las superficies S = constante
se mueven. Si en t = 0, S = Σ = σ, entonces en un tiempo posterior dt, la superficie
S = σ ya no coincidirá con la superficie Σ = σ sino con la superficie Σ = σ + E dt.
La velocidad del movimiento de un punto fijo sobre S la llamaremos u:
u=
dl
dt
(13.72)
5 Esta correspondencia tiene implicaciones en las teorı́as gauge de la fı́sica de partı́culas elementales. Véase L.A. Sánchez, J. Mahecha, Rev. Mex. Fis. 49(2003)364. También
http://xxx.lanl.gov/abs/hep-th/0308160
Corespondencia con la mecánica cuántica de Schrödinger / 581
donde dl es el desplazamiento del punto durante el tiempo dt. La condición S(0) =
S(dt) = σ nos determina el valor de u. En efecto:
S(dt) − S(0) =
∂S ~ ∂S
· dl +
dt = 0
∂~r
∂t
(13.73)
Como por su definición d~l está en la dirección normal a S, se sigue que:
u=
E
∂Σ
∂~r
(13.74)
Σ obedece la ecuación de Hamilton-Jacobi independiente del tiempo, de donde:
∂Σ
= [2m(E − V )]1/2 = (2mT )1/2
∂~r
(13.75)
Por tanto la velocidad de los puntos del frente S para una partı́cula es:
u=
E
E
=
1/2
p
(2mT )
(13.76)
La relación E = pu, donde p es el momento lineal de la partı́cula y u la velocidad
del frente S, es análoga a E = pc en el caso de los fotones. u = E/mv es pequeña
cuando v es grande y viceversa, y resulta ser proporcional a la magnitud del vector de
lentitud normal análogo al de la óptica geométrica. u es llamada la velocidad de fase y
v = p/m es la velocidad de la partı́cula (llamada en mecánica ondulatoria la velocidad
de grupo). Cuando la velocidad de las partı́culas es pequeña, las superficies S se mueven
rápidamente y cuando las partı́culas se mueven rápidamente, la velocidad de los frentes
~ t) puede considerarse como un campo o fluido, definido en toda
es pequeña. S(~r, C,
la región del espacio de configuración accesible a la partı́cula. Cuando el potencial no
depende de la velocidad, las curvas caracterı́sticas en el espacio de configuración son
ortogonales a las superficies S. Al moverse las partı́culas el campo S se propaga con
velocidad u(~r) en cada punto. A su vez las partı́culas mismas caracterizan otro campo,
~ con un flujo de velocidad en cada punto dado por ~r˙ .
el de las densidades Q(~r, C),
Ejemplo 13.3.1 Hallar las velocidades u y v para un oscilador armónico lineal y analizar
los campos Q y S.
Las velocidades de los frentes S y de las partı́culas son respectivamente:
u=±
1
2
ωA
1 ωA
=
1/2
2 cos(ωt)
x2
1− 2
A
1/2
x2
v = ±Aω 1 − 2
= ωA cos(ωt)
A
(13.77)
(13.78)
Vemos que v varı́a entre −Aω y +Aω, en tanto que u varı́a entre −∞ y −ωA/2 y
entre ωA/2 e ∞.
582 / Mecánica clásica avanzada
y µ
ωA
1 ωA
2
t
0
T/4
T/2
3T/4
T
Figura 13.4 Velocidades u y v para un oscilador armónico lineal
Vemos que en los puntos de retorno x = ±A los frentes S “rebotan” con velocidad
muy grande; además la densidad de los frentes S es mayor donde u es baja y es cero
donde u es infinita. O sea, los frentes son densos donde la densidad de las partı́culas es
pequeña y viceversa (véase figura 13.4).
Para este problema, de (13.51) se sigue que Q vale:
Q=
1
1
ω
=
2 1/2
2πA 2π|v|
x
1− 2
A
O sea que Q tiene un comportamiento similar a |u|.
La expresión para Σ es:
1/2 "
#
2 1/2
1 mE
x
x
Σ=
A sen−1 + x 1 − 2
2
2
A
A
Notemos que Σ determina a Q. En efecto:
"
#
2 1/2
∂ ∂Σ
∂
2x
1/2
2πQ =
1 − mω
(2mIω)
=
∂I ∂x
∂I
2I
(13.79)
(13.80)
(13.81)
Cuando x = 0, Σ es cero y Q = 1/(2πA) y cuando x = A, Σ = πA(mE/2)1/2 en
tanto que Q es infinita.
Es interesante notar que Σ no es una función univaluada de x, pues para x = 0,
Σ = 0 si t = 0 y Σ = 2πI si t = T . Igualmente ∂Σ/∂x = ±(2mE − m2ω 2 x2 )1/2 posee dos
ramas, una para los tiempos anteriores a la llegada a los puntos de retorno y otra para
Corespondencia con la mecánica cuántica de Schrödinger / 583
los tiempos posteriores. En consecuencia, si no se toma valor absoluto, Q es también en
sentido estricto una función multivaluada. Finalmente, como:
∂Σ
x
= sen−1
∂I
A
se sigue que:
I
Q dx = 1
(13.82)
(13.83)
como debe ser.
Ondas materiales. Las partı́culas microscópicas tienen un comportamiento ondulatorio evidenciado por: (i) La densidad en un haz de partı́culas tiene oscilaciones o
variaciones espaciales definidas, es decir, las trayectorias no se pueden distribuir arbitrariamente. (ii) La región accesible a un sistema ligado de partı́culas va más allá de
los puntos de retorno clásicos, aunque la probabilidad de encontrar las partı́culas fuera
de la región clásica decrece exponencialmente. (iii) Hay fenómenos de interferencia y
difracción.
Para hablar de frentes de acción constante no son necesarias las nociones de “ondas”
o “longitud” de onda. Al evaluar la distribución Q se encuentra que no presenta ninguna
oscilación sino variaciones suaves con la posición. Esto es consecuente con la concepción
de la mecánica clásica como el comportamiento lı́mite de un movimiento ondulatorio
cuando la longitud de onda es pequeña.
Vimos cómo de la formulación de la mecánica clásica con matrices conmutativas
emerge de manera natural la mecánica cuántica de Heisenberg al introducir algunas
hipótesis motivadas en la espectroscopı́a atómica. Desafortunadamente no hay una manera suave de obtener la mecánica cuántica de Schrödinger a partir de la ecuación de
Hamilton-Jacobi y la función de distribución clásica, pues estos elementos clásicos son
ajenos a conceptos tales como “función de onda”, “ecuación de onda”, “principio de superposición”. Es necesario un drástico cambio conceptual para introducir en la mecánica
las nociones ondulatorias.
La ecuación de Schrödinger. Schrödinger admitió la descripción de sistemas
microscópicos mediante una amplitud de ondas análoga a la que describe otros fenómenos
ondulatorios:
ψ(~r, t) = A(~r)eiϕ(~r,t)
(13.84)
Quien inició este tipo de teorı́as fue Louis de Broglie, cuando en 1923 estudió la
posible conexión entre las propiedades ondulatorias y corpusculares de la materia. Partió de la idea siguiente. Si tratándose de partı́culas se está describiendo el mismo fenóneno
mediante los principios de Fermat y de mı́nima acción, en el lı́mite de ondas cortas se
cumple la siguiente implicación:
Z 2
Z 2
dl
= 0 (v = constante) y ∆ p(~r, E) dl = 0
∆
r , v)
1
1 u(~
(13.85)
1
(E = constante) → p ∝
u
584 / Mecánica clásica avanzada
que es el mismo resultado (13.76).
Para la velocidad de fase de una partı́cula se cumple:
c
u(~r, ν) =
= λ(~r, ν) ν
n(~r, ν)
(13.86)
siendo n el ı́ndice de refracción, c una constante y ν la frecuencia de las ondas.
Entonces de (13.76) o (13.85) se sigue que:
p=
E
E
h
=
=
u
λ(~r, ν)ν
λ(~r, ν)
(13.87)
siendo h = E/ν una constante. Como en (13.32) y (13.33), puede decirse que la fase de
la onda, ϕ, es proporcional a la acción S:
ϕ(~r, t) =
2π
Σ(~r, E) Et
S(~r, t) =
−
h
h̄
h̄
(13.88)
Entonces:
ψ(~r, t) = A(~r)eiΣ(~r,E)/h̄−iEt/h̄
(13.89)
ha de ser la forma de la función de onda en el lı́mite de ondas cortas.
Schrödinger asumió que en general ϕ satisface una ecuación de ondas ordinaria
donde la velocidad de la onda es la velocidad de fase u, y además exigió que debe ser
consistente con los resultados ya conocidos referentes al lı́mite asintótico de ondas cortas
caracterizado por la ecuación (13.89). Esto es:
∇2 ψ −
1 ∂2ψ
=0
u2 ∂t2
(13.90)
Como para el lı́mite de ondas cortas u está dada por (13.76), para ese caso (13.90)
toma la forma:
2m(E − V ) ∂ 2 ψ
= ∇2 ψ
E2
∂t2
(13.91)
La función de onda de un fenómeno estacionario es de la forma:
Ψ(~r, t) = ψ(~r)e−iEt/h̄
(13.92)
por lo cual ψ debe obedecer la ecuación:
−
h̄2 2
∇ ψ(~r) + V (~r)ψ(~r) = Eψ(~r)
2m
(13.93)
que es la ecuación de Schrödinger independiente del tiempo. El comportamiento ondulatorio aparece sólo al hacer la identificación (13.88), o sea que está ligado directamente
al hecho de no ser cero la constante de Planck (ϕ no es infinita ni λ es cero). Esto de
alguna manera ha de estar relacionado con el hecho de no poderse medir las variables
de acción I con precisión ∆I = 0, del cual surge la mecánica cuántica de Heisenberg. Si
en (13.93) reemplazamos a ψ por:
ψ(~r) = eiΣ(~r,E)/h̄ A(~r)
(13.94)
Corespondencia con la mecánica cuántica de Schrödinger / 585
obtenemos una ecuación diferencial para Σ que en el lı́mite h̄ → 0 es precisamente la
ecuación de Hamilton-Jacobi.
Además Schrödinger postuló que |ψ|2 es la densidad de probabilidad en el espacio
de configuración. Para un estado estacionario se debe cumplir:
Q(~r) = |ψ(~r)|2
(13.95)
Resulta de (13.94) y (13.95) que para el lı́mite asintótico de ondas cortas:
Q(~r) = A(~r)2
(13.96)
Por tanto el lı́mite clásico de la función de onda puede expresarse en términos de
las funciones clásicas Q(~r), (13.69), y Σ:
ψ(~r, t) = [Q(~r)]1/2 eiΣ(~r,E)/h̄−iEt/h̄
o, en términos de Σ:
1/2
∂2Σ ∂2Σ ∂2Σ
ψ(r, t) = ǫλσρ
eiΣ(~r,E)/h̄−iEt/h̄
∂x∂Iλ ∂y∂Iσ ∂z∂Iρ
(13.97)
(13.98)
J.H. van Vleck (1928) mostró que:
hq|ψi = C det
∂ 2S
∂q∂p
1/2
eiS/h̄
(13.99)
obedece a la ecuación de Schrödinger si h̄ → 0. Nótese la similitud entre (13.98) y la
ecuación de van Vleck.6
13.4.
La función de onda semiclásica según Keller y
Maslov
Para un sistema acotado los valores de las variables de acción, y por tanto de
la energı́a y otras constantes de movimiento, están cuantizados. En la sección 12.1, se
señaló que las variables de acción satisfacen las condiciones Iν = αν h̄, donde las αν son
enteras. Al imponer ciertas condiciones sobre las frecuencias vimos en el ejemplo 12.3.1
que para un oscilador armónico la acción está cuantizada según I = (k + 1/2)h̄, siendo k
un entero. Veremos ahora cómo tales reglas de cuantización se pueden obtener a partir
de la función de onda semiclásica.
Bohr y Sommerfeld postularon las reglas de cuantización para un sistema separable
en la forma Iν = αν h̄. Einstein en 1917 las generalizó para sistemas no separables pero
integrables, para los cuales existe un conjunto de variables de acción definidas por los
contornos cerrados independientes que haya sobre un toroide invariante, en la forma:
I
1
Iν =
p~ · d~q = αν h̄
(13.100)
2π γν
6 M.C.
Gutzwiller, Chaos in classical and quantum mechanics, Springer, New York, 1990 deduce la
fórmula de van Vleck a partir de una aproximación de fase estacionaria al propagador de Feynman.
586 / Mecánica clásica avanzada
donde los γν son los diferentes contornos. Brillouin en 1926 esbozó una teorı́a de las funciones de onda semiclásicas que conduce a reglas de cuantización como la del oscilador
armónico, I = (k + 1/2)h̄, basada en consideraciones sobre los puntos de retorno del
movimiento clásico. Keller en 1958 y Maslov en 1972 elaboraron una teorı́a completa
acerca de las funciones de onda semiclásicas y las reglas de cuantización que generaliza los trabajos de Bohr, Sommerfeld, Einstein y Brillouin. En la actualidad muchos
problemas especı́ficos en fı́sica atómica y molecular son adecuadamente estudiados mediante estas teorı́as semiclásicas, denominadas genéricamente “la aproximación W.K.B”.
Acción de Lagrange con dos puntos de retorno. Consideremos una partı́cula
en movimiento unidimensional acotado con dos puntos de retorno. La trayectoria de
fases es cerrada y el toroide invariante es una circunferencia.
La figura 13.5 muestra una trayectoria tı́pica. La solución a la ecuación de HamiltonJacobi para este problema es:
Z
Σ(x) = ± [2m(E − V )]1/2 dx
(13.101)
p
p2
x
x1
x2
p1
Figura 13.5 Trayectoria de fases cerrada
En la trayectoria hay dos puntos en los cuales p se anula y cambia de signo que
son x1 y x2 .
Tanto p como Σ son funciones bivaluadas de x. Los dos valores de p o Σ para cada
valor de x están sobre diferentes “hojas”, análogas a las hojas de Riemann de la teorı́a
de las funciones de variable compleja, definidas por la lı́nea de ramificación x1 x2 . Para
p las dos hojas son x1 p2 x2 y x1 p1 x2 . En x1 y x2 , p es singular por ser dp/dx infinita.
Similarmente, en la representación de momentos p1 p2 definen una lı́nea de ramificación
que separa el plano xp en las hojas p1 x1 p2 y p1 x2 p2 . La correspondiente acción reducida
es Σ(p), conectada con Σ(x) mediante la fórmula (9.217):
Σ(p) = Σ(x) − xp
(13.102)
Corespondencia con la mecánica cuántica de Schrödinger / 587
Para un valor dado de E, Σ(x) define parte de la trayectoria de fases, formada por
los puntos (x, dΣ/dx). Pero Σ puede usarse sólo para la trayectoria sobre una hoja, ya
que la ecuación de Hamilton-Jacobi no determina a Σ en x1 y x2 . Para pasar a la otra
hoja es necesario continuar la función. En efecto, Σ(p) está bien definida en los puntos x1
y x2 sobre dos hojas, p1 x1 p2 y p1 x2 p2 . Esto permite la extensión analı́tica de Σ(x) de una
hoja a la otra usando la ecuación (13.102). La continuación a lo largo de la trayectoria
puede lograrse, pues, por transformaciones sucesivas entre las representaciones x y p.
Podemos definir las funciones multivaluadas Σ y Σ en términos de funciones univaluadas
ası́:

 Σ1 (x) en x1 p2 x2
Σ(x) =

Σ2 (x) en x1 p1 x2
(13.103)

 Σ1 (p) en p1 x1 p2
Σ(p) =

Σ2 (p) en p1 x2 p2
La variable de acción es un número cuya magnitud es igual al cambio experimentado por Σ al completar un circuito, dividido por 2π (sección 10.3):
I=
1
[Σ2 (x2 ) − Σ1 (x2 )]
2π
(13.104)
Efecto de la multiformidad de Σ sobre la función de onda semiclásica.
Podemos concluir de (13.69) que Q no es univaluada por no serlo Σ. Entonces se deduce
de (13.97) que la función de onda semiclásica resulta ser multivaluada a no ser que se
imponga una condición adicional.
Escribamos a ψ en la forma:
Σ Et 1
ψ = exp i
−
− i ln Q
(13.105)
h̄
h̄
2
Al hacer un circuito completo sobre la trayectoria de fases la función de onda debe
tomar el mismo valor. Esto se consigue solamente haciendo que el cambio del argumento
del exponencial en (13.105) al completar un circuito sea un múltiplo entero de 2πi, o
sea:
i
∆Σ
− ∆ ln Q = 2πn
h̄
2
(13.106)
donde n es un número entero. Esto da lugar a la siguiente expresión para la cuantización
de I = ∆Σ/2π:
i
I = h̄ n +
∆ ln Q
(13.107)
4π
Para el caso descrito por (13.101), sobre las dos ramas Q difiere sólo en el signo
[véase por ejemplo la expresión (13.81)].
588 / Mecánica clásica avanzada
Las funciones univaluadas Σ1 y Σ2 , definidas en (13.103), permiten encontrar las
funciones univaluadas correspondientes Q1 y Q2 . En efecto:
m 1/2
1
2πQ1,2 = ±ω
(13.108)
2
[E − V (x)]1/2
implica que:
ln Q2 (x2 ) − ln Q1 (x2 ) = ln Q2 (x1 ) − ln Q1 (x1 ) = −πi
(13.109)
El cambio completo en ln Q, partiendo de un punto sobre la rama superior próximo
a x2 y regresando al mismo punto luego de pasar por dos discontinuidades es:
∆ ln Q = −2πi
(13.110)
En consecuencia, (13.109) es:
1
I = h̄ n +
2
(13.111)
En conclusión, las condiciones de cuantización correctas se obtienen al definir la
función de onda semiclásica en términos de la función Q no tomada como intrı́nsecamente positiva.
La función ı́ndice de Maslov. La función “signo” aplicada a la derivada dp/dx
es útil para contabilizar el número de singularidades de las funciones Σ(x) y Σ(p) al
pasar de una hoja a la otra. Se define como:

dp

+1 si
>0



dx
dp
=
SGN
(13.112)

dx

dp

 −1 si
<0
dx
para todos los valores de dp/dx 6= 0.
Maslov define la función “ı́ndice” para asociar un número entero a todos los puntos
colocados sobre la misma hoja, ası́:
σ(x) = Número entero sobre cada hoja
x1 p2 x2 − x1 p1 x2
σ(p) = Número entero sobre cada hoja
p1 x1 p2 − p1 x2 p2
(13.113)
σ(p) y σ(x) están conectados en cada punto que no sea de retorno en p o en x por la
relación:
dp
(13.114)
σ(p) = σ(x) + SGN
dx
Si se toma en un punto x0 a Σ(x0 ) = 0, entonces se define el valor inicial de
σ(x) por la condición σ(x0 ) = 0. Sea x0 = x2 + ǫ, entonces σ(x) = 0 para toda la
hoja x1 p2 x2 . Para un punto entre p2 y x1 , SGN(dp/dx) = +1; entonces por (13.114),
σ(p) = +1 en toda la hoja p1 x1 p2 . Ahora tomemos un punto entre x1 y p1 ; entonces
Corespondencia con la mecánica cuántica de Schrödinger / 589
SGN(dp/dx) = +1, y por (13.114), σ(x) = 2 en la hoja x1 p1 x2 . Para un punto entre
p1 y x2 , SGN(dp/dx) = +1; entonces por (13.114), σ(p) = 3 para toda la hoja p1 x1 p2 .
Finalmente, sea el punto de partida x0 , donde SGN(dp/dx) = +1; entonces por (13.114)
se cumple que σ(x) = 4. Concluimos que σ(x) es una función multivaluada entera que se
incrementa en 4 al completar un circuito. Denotemos por la letra m el cambio en σ(x)
al completar un circuito dividido por dos:
m=
∆σ
2
(13.115)
Para el caso que estamos considerando, m = 2 que coincide con el número de
singularidades en Σ al completar un circuito. Ver el comentario que sigue a la ecuación
(13.52).
Maslov generaliza el resultado (13.110) en la forma:
∆ ln Q = −imπ
(13.116)
para un sistema con un número cualquiera de puntos de retorno en x y en p.
La función ı́ndice permite incluir en la fase de la función de onda semiclásica los
efectos provenientes de la no uniformidad de Q, en la forma:
ψ(~r) = |Q(~r)|1/2 eiΣ(~r,E)/h̄−iπσ(~r)/4
(13.117)
con esto se está diciendo que la fase es fija sobre cada hoja.
Las condiciones de cuantización resultan de exigir que ψ sea univaluada.
Ası́, para el caso ilustrado en la figura 13.5,
ψ1 (x2 ) = ψ2 (x2 )
(13.118)
Esto exige que, al completar un circuito:
∆Σ π ∆σ
−
= 2πn
h̄
4
Por tanto:
m
I = n+
h̄
4
(13.119)
(13.120)
Para el movimiento de un electrón en el átomo de hidrógeno, las coordenadas esféricas r, θ y las parabólicas ξ, η son del tipo considerado en la figura 13.5, siendo entonces
m = 2. Esto justifica las fórmulas de cuantización semiclásica dadas en el ejemplo 10.5.2.
La coordenada ϕ se comporta de manera diferente por estar asociada a una rotación, o
sea que la trayectoria de fases no tiene puntos de retorno ni en ϕ ni en pϕ (la proyección
de la trayectoria de fases sobre el plano pϕ − ϕ es una lı́nea recta). En consecuencia
∆σ = 0 para el grado de libertad ϕ.
Fórmulas de conexión de W.K.B. Para una dimensión la función de onda de
W.K.B., según se sigue de (13.117) y (13.108) es:
1/2
mω
eiΣ(~r,E)/h̄−iEt/h̄−iπσ(~r)/4
(13.121)
ψ(~r, t) =
π|p|
590 / Mecánica clásica avanzada
A pesar de ser construida a partir de las cantidades clásicas Q, Σ y σ, esta función
es válida para valores de x entre x = −∞ y x = +∞ diferentes a los puntos de retorno.
Fuera de los puntos de retorno Σ es imaginaria, lo cual nos permite afirmar que en
general:
|ψ(r, t)|2 =
mω −2ImΣ(~r,E)/h̄
e
π|p|
(13.122)
y la probabilidad resulta exponencialmente amortiguada en las regiones donde ImΣ > 0
y tiende a cero cuando h̄ → 0, en correspondencia con el hecho de ser tales regiones
clásicamente prohibidas. La cola exponencial que exhibe ψ corresponde al efecto “túnel”
de la mecánica cuántica.
Las fórmulas de conexión permiten pasar a través de los puntos de retorno, para
obtener una función definida entre x = −∞ y x = +∞ (excluyendo a x = x1 y x = x2 y
los alrededores de los mismos donde los efectos cuánticos no permiten la aproximación
semiclásica).
En la región clásicamente inaccesible p y Σ son imaginarios puros, con signos +i o
−i dependiendo de la hoja. Cuando el signo es −i resulta que |ψ|2 no se amortigua sino
que crece exponencialmente en la región clásicamente prohibida, lo cual no es aceptable.
Por tanto a la región clásicamente prohibida sólo puede pasarse desde la hoja con p > 0.
Llamemos 3 a la región −∞ < x < x1 y 4 a la región x2 < x < +∞. Para llegar
a la región 4 la partı́cula necesariamente provino de la región 1 (p > 0), o sea que no
realizó cambio de hoja; entonces, estando en la misma hoja, σ4 = σ1 = 0. Para llegar
a la región 3, la partı́cula necesariamente provino de la región 2 (p < 0), o sea que
debió cambiar de hoja a fin de que ImΣ > 0. Como en cada cambio de hoja σ cambia en
2, se sigue que σ2 = 2 y σ3 = 0. En resumen, σ1 = 0, σ2 = 2, σ3 = 0, σ4 = 0. Por tanto:
mω
2π|p|
1/2
Z
exp i
mω
ψ2 (x) =
2π|p|
1/2
exp −i
mω
2π|p|
1/2
Z
exp −
mω
ψ4 (x) =
2π|p|
1/2
Z
exp −
ψ1 (x) =
ψ3 (x) =
x0
[2m(E − V )]1/2 dx
h̄
x2
Z
x0
x2
x1
x
x
x2
[2m(E − V )]1/2 dx
π
−i
h̄
2
[2m(V − E)]1/2 dx
h̄
[2m(V − E)]1/2 dx
h̄
(13.123)
(13.124)
(13.125)
(13.126)
√
Se han introducido los factores 1/ 2 pues al ampliar el rango de x desde −∞ hasta
+∞ se cambia la normalización.
Cuando la función de onda en un intervalo dado es multiforme, debe tomarse
la suma aritmética de las funciones de onda asociadas a las diferentes hojas. En el
presente caso, la región x1 < x < x2 tiene dos hojas y la función correcta es ψ1 + ψ2 . Si
Corespondencia con la mecánica cuántica de Schrödinger / 591
multiplicamos las cuatro funciones (13.123) a (13.126) por eiπ/4 , las fases relativas no
cambian. Entonces:

1/2
Z x
mω
[2m(E −V )]1/2 dx π



;
x1 < x < x2
cos
+


π|p|
h̄
4

x2





1/2
Z x1

mω
[2m(V −E)]1/2 dx iπ
(13.127)
ψ(x) =
; −∞ < x < x1
exp −
+

2π|p|
h̄
4

x





1/2
Z x


[2m(V −E)]1/2 dx iπ
mω



; x2 < x < ∞
exp −
+
2π|p|
h̄
4
x2
este es el resultado usual de la aproximación W.K.B.
592 / Mecánica clásica avanzada
Bibliografı́a
Textos generales de mecánica clásica
1. Arnold V. I. Méthodes mathématiques de la mécanique classique. Editions Mir, Moscou, 1976.
2. Corben H. C. y Stehle P. Classical mechanics. 2nd ed. J. Wiley, New York, 1960.
3. Gantmacher F. Lectures in analytical mechanics. Mir publishers, Moscow, 1970.
4. Goldstein H. Mecánica clásica. Aguilar, Madrid, 1963.
5. Goldstein H. Classical mechanics. 2nd ed. Addison Wesley, Reading, 1980.
6. Hauser W. Introducción a los principios de la mecánica. Uthea, México, 1969.
7. Landau L. y Lifshitz E. M. Mecánica. Reverté, Barcelona, 1965.
8. Marion J. Classical dynamics of particles and systems. Academic Press, New York,
1970.
9. Pars, L.A. A treatise on analytical dynamics. John Wiley, New York, 1968.
10. Scheck F. Mechanics: from Newton’s laws to deterministics chaos. Springer, Berlin, 1995.
11. Ter Haar D. Elements of hamiltonian mechanics. North-Holland, Amsterdam, 1965.
12. Whittaker E. T. A treatise on the analytical dynamics of particles and rigid bodies. 4th ed. Cambridge University. Press, Cambridge, 1960.
593
594 / Mecánica clásica avanzada
Colecciones de problemas
13. Kotkin G. L. y Serbo V. G. Problemas de mecánica clásica. Editorial Mir, Moscú,
1980.
14. Spiegel M. R. Teorı́a y problemas de mecánica teórica. McGraw-Hill, México, 1976.
Textos especializados de mecánica clásica
15. Abraham R. y Marsden J. E. Foundations of mechanics. Benjamin, New York, 1967.
16. Born M. The mechanics of the atom. 2nd printing. Ungar, New York, 1967.
17. Lichtenberg A. J. y Lieberman M. A. Regular and stochastic motion. Springer-Verlag,
New York, 1983.
18. Percival I. and Richards D. Introduction to dynamics. Cambridge University Press,
Cambridge, 1982.
19. Thirring W. Classical dynamical systems. Springer-Verlag, New York, 1978.
20. Yourgrau W. y Mandelstam S. Variational principles in dynamics and quantum
theory. 3d ed. Saunders, Philadelphia, 1968.
Textos de matemáticas
21. Abramowitz M. y Stegun I. A. Handbook of mathematical functions. Dover, New
York, 1965.
22. Ahlfors L. V. Análisis de variable compleja. Aguilar, Madrid, 1966.
23. Arnold V. I. Equazioni differenziali ordinarie. Edizioni Mir, Mosca, 1979.
24. Arnold V. I. Geometrical methods in the theory of ordinary differential equations.
Springer-Verlag, New York, 1983.
25. Elsgoltz L. Ecuaciones diferenciales y cálculo variacional. Editorial Mir, Moscú,
Bibliografı́a / 595
1969.
26. Korn G. A. y Korn T. M. Mathematical handbook for scientists and engineers.
McGraw-Hill, New York, 1961.
27. Spiegel M. R. Manual de fórmulas y tablas matemáticas. McGraw-Hill, México, 1970.
28. Whittaker E. T. y Watson G. N. A course of modern analysis. 4th ed. Cambridge University Press, Cambridge, 1927.
Textos de otras áreas
29. Galindo A. y Pascual P. Mecánica cuántica. Alhambra, Madrid, 1978.
30. Gutzwiller M.C. Chaos in classical and quantum mechanics. Springer, New York,
1990.
31. Landau L. D. y Lifshitz E. Théorie du champ. Editions Mir, Moscou, 1966.
32. Landau L. D. y Lifshitz E. Mécanique cuantique: théorie non relativiste. Editions
Mir, Moscou, 1967.
33. Van der Waerden B. L. (ed). Sources of quantum mechanics. Dover, New York,
1968.
Monografı́as especializadas
34. Augustin S. D. y Rabitz H. “Action-angle variables in quantum mechanics”. Journal
of chemical physics, vol. 71, No 12, p 4956, 1979.
35. Chirikov B. V. “A universal instability of many-dimensional oscillator systems”.
Physics reports, vol. 52, No 5, p 263, 1979.
36. Keller J. B. “Corrected Bohr-Sommerfeld quantum conditions for nonseparable systems”. Annals of physics, vol. 4, p 180, 1958.
37. Percival I. C. “Semiclassical theory of bound states”. Advances in chemical physics. vol. 36, p 61, 1977.
596 / Mecánica clásica avanzada
597
Índice alfabético
Fermi, de, 543
Moser, de, 429
Poincaré, de, 427
separatriz, 526, 542
Aproximación
clásica, 475, 583, 590
WKB, de, 589, 591
Areolar, velocidad, 130
Arnold, V., 422, 529, 538
integral de, 528
teorema de, 522, 531
Astronomı́a, 149
Augustı́n, S.D., 551
Autónomo, hamiltoniano, 525
Autoadjunta, matriz, 551
Abramowitz, 282, 294, 298
Absidales, distancias, 132, 140
Acción(es)
adiabáticos, invariantes, 415
discontinuidad en la,, 430, 588
Hamilton, de,, 328
Lagrange, de, 328
perturbaciones adiabáticas , 505
principal, 330
reducida, 330
variables de, 429
Adiabáticas, perturbaciones,, 504
Adiabáticos, invariantes,, 415, 430
Ahlfors, L. V., 241
Álgebra de Lie
grupo de rotaciones, del, 244, 395,
461
y corchetes de Poisson, 397
Angulares, variables
degeneradas, 488
lentas, 500, 505, 513
oscilador armónico, en el, 438
problema de Kepler, en el, 445, 462
rápidas, 500, 504, 513
y de acción, 429
Ángulo(s)
órbita Kepleriana, en una, 457
como coordenadas generalizadas, 222
condiciones sobre los, 226
dispersión, de, 159, 162
Euler, de, 222
rotación, de, 227, 245
Antisimétrica matriz, 249
Aplicación
“twist”, 429, 523, 524
estándar, 544
Barrera centrı́fuga, 131, 135
Bernoulli, regla de oro, 19, 35
Bifurcación de las superficies, 538
Bohr, átomo de, 144, 155
Born, M., 153, 470, 473, 479
Boyle, ley de, 81
Brillouin
aproximación de, 589, 591
reglas de cuantización, 586
Brújula de Foucault, 314
Cálculo de variaciones, 59
Cambio de la forma funcional, 379
Campo electromagnético, 65
Canónicas, transformaciones, 104, 107,
319, 343, 400
dependientes del tiempo, 105
ejemplos de, 110, 347, 358
grupo de, 355
infinitesimales, 374
libres, 109, 346
598
Índice alfabético / 599
oscilador armónico, del, 104
Caóticos, movimientos regulares, 522
Caratheodory, lema de, 362
Cascarón esférico, 21
Cáusticas, superficies, 444, 576
Cayley-Klein, parámetros de, 236
para el trompo, 301
Centrı́fuga, aceleración, 94
Centrı́fugo, potencial, 131
Centro
fuerzas, de, 125
masas, de, 125, 161
Chirikov, B. V., 529, 543, 547
criterio de, 543
Clase
integral elı́ptica de primera, 284
transformación canónica libre de primera, 109, 348
Completidad, relación de, 215
Condiciones
ligadura, de, 9
ortogonalidad, de, 174, 180, 208
Cónicas, secciones, 140
Conjunto
coordenadas generalizadas, de, 13
variables de acción-ángulo, de, 434
Conmutador, 397, 555
Conservación, teoremas de, 68, 380
Constante(s)
e integrabilidad de las ecuaciones
de movimiento, 421
generadores de transformaciones canónicas como, 381
integración, de, 70
movimiento, de, 70, 421, 437
Planck, de, 123, 414, 584
propiedades de simetrı́a, y, 381
Construcción de Pionsot, 277
Contacto, transformación de, 569
Coordenadas
cı́clicas, 76
esféricas, 129, 445
generalizadas, 12
independientes, 46
parabólicas, 443, 462
Corben, H., 201, 273
Corchetes
Lagrange, de, 402, 409
Poisson, de, 378, 380, 555
Coriolis, fuerza de, 94, 252
Cosenos directores, 210, 568
Covarianza
de las ecuaciones de Hamilton, 103
de las ecuaciones de Lagrange, 42
Cuerda
masas discretas, con, 195
oscilaciones de la, 202
uniforme, 202
Cuerpo rı́gido, 205
asimétrico, 287
dinámica del, 253
libre, 277
momento angular del, 256
simétrico con un punto fijo, 295
sistema de coordenadas del, 206
Curvas de fase, 100, 121, 323, 423
D’Alambert, principio de, 35
Degeneración
accidental, 504, 515
figura de Lissajous, en una, 443
frecuencias, en las, 181
intrı́nseca, 516
para el problema de Kepler, 492
isoenergética, 530
movimiento bajo fuerzas centrales,
en el, 445
oscilador isotrópico, en el, 442
Delaunay, elementos de, 457
Densidad
función de, 573, 576, 585
probabilidad, de, 573, 576, 585
Derivada
parcial, 41, 94
total respecto al tiempo, 67, 73, 95
Desplazamiento virtual, 16, 18
Determinante
jacobiano, 350, 404, 523
matriz de rotación, de la, 216, 220
secular, 171, 186
Diádicos
Pauli, de, 232
600 / Mecánica clásica avanzada
traza cero, de, 232
Diada, 212
Diagonalización
frecuencias propias y modos con el
método de, 191
matrices de masa y de constantes
de resorte, de las, 191
matriz de rotación, de la, 225
matriz de una perturbación, de la,
497
tensor de inercia, del, 260
Dinámica
hamiltoniana, 88
ecuación general de la, 35, 55
lagrangiana, 42
variable, 69, 378
Dipolar
radiación, 451, 459
reglas de selección para radiación,
475
Dispersión bajo fuerzas centrales, 156
Ecuación(es)
Hamilton-Jacobi, de, 107, 112, 364,
368, 371, 435, 445
canónicas, 88
continuidad, de, 573
dinámica en coordenadas generalizadas, de la, 40
estática en coordenadas generalizadas, de la, 28
estado de un gas real, de, 82
Euler en un sistema de referencia
rotante, de, 271
Euler, de, 270, 281, 287
Euler-Lagrange, de, 97
general de la dinámica, 35
general de la estática, 19
Kepler, de, 148, 449
ligadura, de, 9
movimiento, de, 6, 38, 42, 88
Newton, de, 5
onda, de, 204, 584
secular, 171, 186, 262, 496
transformación canónica, de una, 363
valores propios, de, 179
Whitaker, de, 325
Efecto Stark
cuadrático, 500
lineal, 498
Einstein, reglas de cuantización, 585
Eje(s)
instantáneo de rotación, 279
principales, 261
rotación, de, 244
simetrı́a, de, 79
Elementos de matriz, 223
Elipsoide de inercia, 264, 277
Energı́a
cinética, 42, 72, 255
conservación de la, 70, 89
función de Jacobi, 71, 74
potencial, 42, 296
total, 73
Ensamble, 18
Equilibrio
estático, 19
estable, 30
Espacio
configuración, de, 14
fases, de, 98, 104
momentos, de, 98
no euclidiano, 29, 179
Estática
coordenadas generalizadas, con, 29
ecuación general de la, 19
Estabilidad de los puntos fijos, 541
Estado 
Descargar